David Madore's WebLog: Quelques pensées sur les émoticônes et emojis

[Index of all entries / Index de toutes les entréesLatest entries / Dernières entréesXML (RSS 1.0) • Recent comments / Commentaires récents]

↓Entry #2597 [older| permalink|newer] / ↓Entrée #2597 [précédente| permalien|suivante] ↓

(mercredi)

Quelques pensées sur les émoticônes et emojis

Méta : Encore une entrée qui à force de trop rallonger s'est transformée en foutoir, et dont j'ai fini par avoir marre, alors, comme mentionné dans l'entrée précédente, je la publie telle quelle, après une relecture extrêmement minimale, même si je n'en suis pas content et qu'elle est assez inachevée, mais c'est ça ou bien la laisser moisir dans mes cartons indéfiniment.

Je commence par un point terminologique sur le sens des mots emoji et émoticône et la différence entre les deux :

  • Les emojis (ou les emoji, je ne sais jamais bien si c'est une bonne idée d'attacher un pluriel français en -s à un mot d'une langue qui n'a pas de pluriel ; du japonais ()文字(もじ), signifiant quelque chose comme caractère-dessin), sont des caractères pictographiques ou idéographiques prévus pour être insérés dans, mélangés à, ou utilisés comme, du texte écrit ordinaire.

    L'histoire des emoji est un peu confuse parce qu'ils ont été inventés plusieurs fois, ou disons que cela dépend de ce qu'on appelle exactement un emoji (en étant suffisamment large, on peut dire que les hiéroglyphes égyptiens sont des emojis quand ils ne servent pas à représenter des sons), mais on les attribue généralement à l'opérateur de télécommunications japonais NTT Docomo, qui a introduit en 1995 un symbole de cœur dans son pager, puis un jeu de 176 emojis (en format 12×12 pixels) dans sa plate-forme Internet mobile en 1999.

    Dans Unicode spécifiquement (voir cette entrée récente pour quelques généralités sur Unicode), il s'agit de glyphes bien précis pouvant être représentés par un caractère unique ou par des combinaisons bien précises de caractères définies par le standard. Par exemple, côté caractères uniques, U+1F600 GRINNING FACE représente un emoji de smiley souriant largement ‘😀’, tandis que U+1F4A9 PILE OF POO représente un emoji de tas de merde ‘💩’ ; pour ce qui est des combinaisons de caractères, par exemple U+1F1EA REGIONAL INDICATOR SYMBOL LETTER E + U+1F1FA REGIONAL INDICATOR SYMBOL LETTER U représente un emoji de drapeau européen ‘🇪🇺’, tandis que la combinaison assez complexe U+1F3F3 WAVING WHITE FLAG + U+FE0F VARIATION SELECTOR-16 + U+200D ZERO WIDTH JOINER + U+1F308 RAINBOW représente un emoji de drapeau arc-en-ciel ‘🏳️‍🌈’ (c'est mignon : on fabrique un drapeau arc-en-ciel en « combinant » un drapeau blanc avec un arc-en-ciel…) ; mais on considère dans tous les cas qu'il s'agit d'un emoji.

    Une des particularités de ces caractères est qu'ils ont généralement des couleurs spécifiques. Ce n'est pas imposé par le standard, mais c'est ce qu'on observe typiquement quand il s'agit d'afficher sur un écran couleur. (Les polices informatiques traditionnelles n'étant pas prévues pour stocker des informations de couleur, ça a d'ailleurs causé toutes sortes de difficultés techniques pas complètement — ou pas très proprement — résolues d'obtenir cet effet.)

    Mais comme je le disais dans l'entrée liée ci-dessus, certains caractères ont une double nature, emoji ou non-emoji, ou plus exactement, peuvent coder un glyphe emoji (donc typiquement en couleur) ou un glyphe non-emoji selon qu'on les fait suivre du sélecteur de variation numéro 15 ou 16 : je donnais l'exemple du caractère U+2620 SKULL AND CROSSBONES représentant une tête de mort au-dessus de tibias/fémurs croisés, qui peut servir à coder l'emoji ‘☠️’ quand il est suivi de U+FE0F VARIATION SELECTOR-16, ou bien le caractère explicitement non-emoji ‘☠︎’ quand il est suivi de U+FE0E VARIATION SELECTOR-15.

    La distinction devient là un peu byzantine (en quoi est-ce que ‘☠︎’ n'est pas un caractère idéographique ? si ce n'est pas une question de couleur, qu'est-ce que ça veut dire au juste, d'être un emoji ?), mais au moins, pour ce qui est d'Unicode, il y a une définition précise. En pratique, c'est assez clair, quand même : la forme emoji est un petit dessin qui vient décorer un texte pas très sérieux ou peut-être signaler une émotion tandis que la forme non-emoji est plutôt un symbole qui aurait sa place dans un texte sérieux. Je me suis d'ailleurs plaint que l'interface Web de Twitter « emojifiait » abusivement, et que si je veux écrire une bijection AB dans un texte mathématique, ça m'agace qu'elle apparaisse sous forme d'emoji ‘↔️’ [si vous ne voyez pas d'emoji ici, cliquez sur cette image pour avoir une idée] si je ne prends pas le soin explicite de mettre un U+FE0E VARIATION SELECTOR-15 après.

  • Les émoticônes (emoticons ? emotica ? quidlibet…) sont des façons de représenter des émotions dans du texte, notamment/typiquement des sourires plus ou moins heureux, auquel cas on peut parler de smileys, terme parfois considéré comme interchangeable avec émoticône (bien qu'il existe des émoticônes qui ne sont pas des smileys et peut-être réciproquement).

    Cela peut être fait par l'usage de caractères spécifiquement dédiés à cet effet, comme ‘☻’ (U+263B BLACK SMILING FACE), qui peuvent être ou ne pas être des emojis (cf. ci-dessous), ou bien en détournant des caractères ayant en principe un usage différent, par exemple les caractères de ponctuation servant à construire le smiley ‘:-)’ (U+003A COLON + U+002D HYPHEN-MINUS + U+0029 RIGHT PARENTHESIS).

    Comme l'histoire des emojis, celle des émoticônes est confuse et on peut trouver toutes sortes de précurseurs selon ce qu'on qualifie exactement d'émoticône. Les smileys qui détournent les caractères ASCII (on parle donc de smileys en ASCII-art) comme le dernier exemple que je viens de donner, sont généralement rattachés à un message précis posté le dans un forum informatique de CMU proposant l'usage de ‘:-)’ et ‘:-(’ pour marquer les blagues et les choses qui n'en sont pas. Le jeu de caractères CP437 de l'IBM-PC (qui doit dater de 1981) incluait en toute première position des caractères ‘☺︎’ et ‘☻’ (un visage souriant en vidéo normale et inverse, donc), qui pouvaient servir comme dessins (je m'en suis beaucoup servi pour représenter le héros dans des petits jeux que je programmais en BASIC ou Pascal dans les années 1980), mais n'étaient pas facile à utiliser dans du texte puisqu'ils étaient classés comme caractères de contrôle : on peut débattre s'il s'agissait d'une émoticône ou pas, ou d'un emoji ou pas.

    En tout cas, les termes emoji et émoticône sont sans rapport, et leur similarité est accidentelle (au moins formellement : il est difficile exclure complètement, par exemple, que la similarité avec le mot anglais emotion ait en partie inspiré la composition du mot japonais 絵文字, ou que la confusion ait joué dans la popularité du mot en-dehors du japon).

  • Même s'il y a un certain flou dans la définition des deux termes, les propriétés d'être un emoji et d'être une émoticône sont indépendantes. Par exemple, ‘🌍’ (U+1F30D EARTH GLOBE EUROPE-AFRICA) est indubitablement un emoji, mais ce n'est pas une émoticône puisqu'il ne s'agit pas de représenter une émotion de celui qui écrit. À l'inverse, ‘:-)’ est une émoticône mais n'est pas un emoji, en tout cas pas au sens formel d'Unicode (d'ailleurs, au sens formel d'Unicode, même ‘☻’ et ‘☺︎’ [ce dernier devrait apparaître comme la version noir et blanc inversée du précédent] ne sont pas des emojis, contrairement à ‘😀’).

    Ceci étant, je répète qu'il y a forcément une certaine dose de flou sur ce qui est ou n'est pas quoi. Par exemple, à l'heure de gloire des smileys en ASCII-art, certains s'amusaient à en composer de plus en plus complexes (comme le smiley père Noël*<:-{)#’), juste pour le plaisir de les dessiner et plus pour représenter une émotion : du coup, je ne les classerais ni dans les emojis ni dans les émoticônes, alors que ce sont quand même des smileys… bref, ce n'est pas très important.

Comme je l'ai écrit ci-dessus, l'histoire des emojis et des émoticônes est confuse et se recoupe au moins partiellement. Si les smileys en ASCII-art sont apparus vers le début des années 1980, et si les japonais ont développé leur propre style de smileys (kaomoji, par exemple ‘{^_^}’) dans la seconde moitié des années 1980, c'est surtout avec le développement des webforums dans les années 1990–2000 que les émoticônes ont commencé à prendre le chemin des emojis : remplaçant automatiquement (ainsi que certains logiciels de mail) les séquences ASCII-art (comme ‘:-)’) par des dessins plus représentatifs, ils se sont mis à multiplier les possibilités de smileys insérables depuis une interface ad hoc et ont certainement beaucoup fait pour les rendre populaires auprès des internautes. Je pense à des dessins comme ça (ou plus généralement ce que renvoie une recherche Google Images de phpbb smileys), qui font maintenant très datés début des années 2000 mais qu'on continue à trouver çà et là sur le Web (y compris sur ce blog, cf. ci-dessous).

Rappelons à toutes fins utiles que si Unicode définit des caractères et séquences de caractères censés représenter des emojis, au final, les dessins réellement affichés dépendent des polices installées et typiquement du concepteur du système d'exploitation ou smartphone (ou autre gadget) utilisé pour lire le texte ; certains emojis sont sujets à des différences de représentation (et donc d'interprétation) assez importantes : il ne faut pas compter sur le fait que la personne à qui vous envoyez un message contenant des emojis verra forcément la même chose que vous (outre les problèmes de différences de dessins, il peut y avoir celui des manques, puisque tout le monde n'a pas forcément la panoplie complète).

⭐️

Maintenant, on peut se poser un certain nombre de questions :

  • Est-ce que tout ça est bien utile ? À quoi est-ce que ça sert exactement ?
  • Et plus spécifiquement : est-ce qu'Unicode a eu raison de céder et de commencer à encoder les emojis dans le Standard, au risque de glisser sur la pente d'une ménagerie qui n'en finit plus de dessins en tous genres ?

Sur le premier point, mon avis est qu'indubitablement, oui, au moins les émoticônes ont un intérêt : elles facilitent réellement la communication et évitent notamment des malentendus de ton ou de degré en explicitant par écrit des choses qui, à l'oral, passeraient dans l'intonation de la voix, la gestuelle ou le visage. Elles ne sont évidemment pas indispensables ; mais la ponctuation n'est pas non plus indispensable : et comme la ponctuation, elles servent à donner une sorte de méta-information périphérique à l'interprétation d'un énoncé, en l'occurrence une sorte de contexte émotionnel. Contexte et méta-informations qu'on pourrait bien sûr indiquer explicitement par des mots (comme on pourrait se passer du point d'interrogation et d'exclamation par des adverbes et des tournures de phrase bien choisis) mais au prix de beaucoup plus de lourdeur dans l'expression. Quant à l'argument selon lequel on se passait bien de smileys avant les ordinateurs (ou qu'on n'imagine pas Victor Hugo dessiner une petite tête souriante à la fin d'une phrase pour la rendre plus légère), il fait semblant d'ignorer le fait que la communication écrite ne s'est pas seulement développée, elle s'est aussi diversifiée, et qu'il est normal que des nouveaux usages entraînent des nouveaux besoins. (Pour reprendre mon analogie entre émoticônes et ponctuation, je ne serais d'ailleurs pas surpris que la nécessité ressentie à l'introduction de la ponctuation ait été semblablement liée à une diversification et démocratisation des usages de l'écrit.)

Bref, je ne comprends pas plus ceux qui semblent s'interdire l'usage du moindre smiley que ceux qui s'interdiraient le point d'interrogation ou le point d'exclamation : tout dépend du contexte, bien sûr, peut-être que dans un texte de loi ou dans un contrat il est mal vu de faire usage de points d'interrogation et d'exclamation et je comprends qu'on soit semblablement réticent à l'usage de smileys dans des contextes un peu formels (où de toute façon on n'est pas censé s'interroger sur l'émotion de la personne qui écrit), mais je ne comprends pas un refus catégorique de leur emploi en général.

Évidemment, a contrario, il y a ceux qui en abusent, et qui trouvent utile d'ajouter douze smileys ‘😂’ (U+1F602 FACE WITH TEARS OF JOY) et/ou ‘🤣’ (U+1F923 ROLLING ON THE FLOOR LAUGHING), qui sont sans doute les plus abusés, à la fin de la moindre remarque drôle / moqueuse / sarcastique. Mais il y a aussi des gens qui abusent des points d'interrogation et d'exclamation (five exclamation marks, the sure sign of an insane mind), ce n'est pas une raison pour ne pas s'en servir.

Si vous voulez un bon exemple d'utilisation modérée et raisonnable des smileys, prenez exemple sur moi. 😁

Le dernier paragraphe n'était pas sérieux, bien sûr, mais constitue un exemple de cas où je considère vraiment utile de mettre un smiley — par opposition au fait de ne rien mettre du tout (il y aura toujours quelqu'un pour me prendre au sérieux, aussi évidente que soit la blague, et parfois je veux devancer les malentendus) ou au fait de signaler l'humour par quelque chose de plus explicite (comme le dernier paragraphe n'était pas sérieux…). Et je ne pense vraiment pas qu'on puisse m'accuser de faire un usage immodéré des smileys sur ce blog : un dénombrement rapide suggère que j'en ai utilisé 336 sur 2596 entrées de blog (ou 16 ans).

⭐️

Au niveau technique, pour entrer un smiley sur ce blog, je tape quelque chose comme <d:smiley-smile /> (le source de mon blog est en XML est le d fait référence au namespace http://www.madore.org/~david/NS/daml/ mais peu importe) et mon moteur de blog transforme ça en quelque chose qui a évolué au cours du temps. Quand j'ai commencé, il n'y avait pas de smileys dans Unicode, donc j'utilisais des icônes récupérées de Mozilla (et peut-être ailleurs) avec, pour ceux qui utilisent des navigateurs en mode texte, un attribut alt donnant le smiley en ASCII-art : quelque chose comme <img src="http://www.madore.org/~david/images/smileys/smile.png" class="smiley" alt=":-)" title="Sourire" width="15" height="15" /> ; plus tard, j'ai changé deux choses : j'ai mis l'image directement comme une URL en data: (pour ne pas multiplier les chargements de fichiers externes) et j'ai changé le alt pour utiliser directement les caractères Unicode : maintenant cela ressemble plutôt à : <img src="data:image/png;base64,iVBORw0KGgoAAAANAAAASUVORK5CYII=" class="smiley" alt="&#x263a;" title="Sourire" width="15" height="15" /> (le title est en anglais ou français selon la langue ambiante). À l'heure où j'écris, donc, j'utilise encore des images façon webforum des années 2000 pour les smileys sur ce blog : peut-être que je devrais chercher un jeu d'images plus moderne (et surtout plus complet), mais à terme j'utiliserai sans doute directement les caractères Unicode seuls, c'est-à-dire que je remplacerai par quelque chose comme <span class="smiley" title="Sourire">&#x263a;</span> ; une des choses qui me retient est que, actuellement, sur mon Firefox ou avec les polices que j'ai sur mon PC (je ne sais pas bien ce qui est responsable de quoi dans l'affaire), ‘☺️’ (U+263A WHITE SMILING FACE + U+FE0F VARIATION SELECTOR-16) n'est pas affiché sous forme d'un emoji couleur, et n'est donc pas du tout dans le même style que ‘😀’ (U+1F600 GRINNING FACE) ou la plupart des autres. (A contrario, sur mon Firefox sous Android, c'est ‘☺︎’ (U+263A WHITE SMILING FACE + U+FE0E VARIATION SELECTOR-15) qui apparaît sous la forme d'un emoji alors qu'il ne devrait pas.) C'est agaçant (un jour™ j'essaierai de comprendre ce qui se passe au juste).

⭐️

Ce qui m'intéresse beaucoup dans les émoticônes, c'est le juste choix de la gamme d'émotions à représenter. Trop peu et on manque de finesse : le but n'est pas juste de dire je suis content ou je suis triste, ce qui n'est pas très intéressant, mais aussi des choses comme je suis fier de moi, je n'en reviens pas !, vous avez remarqué la référence ?, je délire complètement, là, bien sûr !, je ne suis pas sérieux mais en fait si…, si j'étais méchant c'est ça que je ferais, je suis quand même sceptique quant à cette histoire, je suis complètement perdu, you might very well think that; I couldn't possibly comment, ceci est de l'humour glacé et sophistiqué du 5824e degré, et ainsi de suite. Trop et on se noie sous les émoticônes qui ne servent pas ou qui finissent par représenter autre chose que des émotions : j'ai noté ci-dessus que les smileys en ASCII-art, dont la combinatoire est essentiellement illimitée, se sont éloignés du terrain de la représentation des émotions pour s'approcher de celui de l'art pour l'art.

Le moteur de ce blog est actuellement limité à un répertoire assez étroit de smileys (essentiellement parce que c'est ce que j'ai trouvé comme paquet d'icônes) :

smileSourire:-)☺️U+263A WHITE SMILING FACE + U+FE0F VARIATION SELECTOR-16
winkClin d'œil;-)😉U+1F609 WINKING FACE
surprisedSurpris:-o😲U+1F632 ASTONISHED FACE
sadTriste:-(☹️U+2639 WHITE FROWNING FACE + U+FE0F VARIATION SELECTOR-16
coolCool8-)😎U+1F60E SMILING FACE WITH SUNGLASSES
biggrinGrand sourire:-D😁U+1F601 GRINNING FACE WITH SMILING EYES
confusedEmbrouillé:-S😕U+1F615 CONFUSED FACE
crazyFou%-)🤪U+1F92A GRINNING FACE WITH ONE LARGE AND ONE SMALL EYE
neutralSans sourire:-|😐U+1F610 NEUTRAL FACE
evilgrinSourire mauvais>:-)😈U+1F608 SMILING FACE WITH HORNS
cryPleure¦-(😢U+1F622 CRYING FACE
evilMauvais>:-(👿U+1F47F IMP

(La première colonne est le nom que je tape, la seconde est la description insérée dans l'attribut title quand le texte ambiant est en français, la troisième est l'icône « façon webforum des années 2000 » utilisée actuellement, la quatrième est la version ASCII-art qui était utilisée autrefois comme alt, la cinquième est l'emoji Unicode que j'utilise maintenant alt, et la dernière est le décodage de ce emoji en caractères Unicode.)

Je ne suis pas complètement satisfait de la correspondance entre icônes, smileys ASCII-art et version Unicode ; par exemple, peut-être que les versions icône et Unicode que je liste dans la ligne confused devraient plutôt être associées au smiley ASCII-art ‘:-\’ et associés à la description perplexe, ce n'est pas clair. Mais la correspondance est au moins approximativement sensée. On fait beaucoup de cas du fait que les différences de représentations d'emojis donnent lieu à des malentendus voire des contresens à cause des différences entre représentations graphiques ou entre conventions culturelles : et même s'il y en a qui sont effectivement problématiques, je ne trouve pas gênant de façon générale qu'il subsiste un léger flou dans l'émotion exacte représentée — si on veut dire quelque chose de très précis, on utilise des mots et des phrases, les émoticônes ne sont pas censés être parfaitement précis. (Pour filer ma comparaison avec la ponctuation, mettre des mots entre guillemets peut également avoir plusieurs significations différentes : citation verbatim, mais aussi sarcasme, euphémisme, etc.)

Le répertoire ci-dessus est minimal, donc, mais je le trouve déjà utile. J'en ajouterais bien quelques uns (et si je passe à un jeu d'icônes plus moderne comme OpenMoji, je le ferai sans doute) : un smiley qui tire la langue, celui qui hausse un sourcil, un smiley en colère, peut-être le smiley renversé, celui qui hausse les yeux au ciel, celui qui fait la grimace, celui qui a peur, et celui qui rougit. Mais je n'en ajouterais pas deux cents non plus. Je veux dire si la gamme des émotions humaines est énorme, la liste de ce j'ai effectivement envie de représenter dans un texte écrit, et avec le niveau de précision où on tient à se placer avec des émoticônes, n'est pas si gigantesque.

La palette d'émoticônes proposée dans les emoji Unicode est beaucoup plus large que la petite sélection d'émotions ci-dessus : je la trouve plutôt bonne, mais il y a à la fois des choses en trop (à mes yeux), et quelques petites choses qui paraissent manquer. Pour ce qui est des choses en trop, je pense à des caractères comme U+1F912 FACE WITH THERMOMETER (‘🤒’) qui semble servir à indiquer qu'on est malade / fébrile : à mes yeux, quelque chose comme ça n'a rien à faire dans les émoticônes : la maladie n'est pas une émotion, et même si elle peut en provoquer, ce n'est pas une émotion en rapport avec le texte qu'on écrit — ce n'est pas une méta-information, un contexte aidant à bien comprendre le texte. Le smiley qui vomit, U+1F92E FACE WITH OPEN MOUTH VOMITING (‘🤮’) a un sens métaphorique assez clair (en signalant le dégoût), mais là, je ne sais pas. Je ne sais pas non plus ce qu'on peut bien faire de U+1F920 FACE WITH COWBOY HAT (‘🤠’). Pour ce qui est des choses qui me manquent, je n'ai pas trouvé de smiley qui soupire (il est vrai que ce n'est sans doute pas évident à dessiner), ni de smiley clairement embarrassé, de smiley faisant les gros yeux, ou bien satisfait ou fier de lui ; cela m'arrive occasionnellement de rentrer bredouille de ma recherche de smiley, je ne note pas forcément précisément ce que je cherchais, mais c'est tout de même assez rare pour que je conclue qu'Unicode est raisonnablement complet à cet égard.

Il y a bien sûr des emojis qui ne sont pas des smileys et qui peuvent quand même être considérés comme des émoticônes parce qu'ils servent à représenter le même genre de choses ; et ils peuvent éventuellement remplacer ce qui manque comme smileys. Je pense par exemple à U+1F926 FACE PALM (‘🤦’ ; si vous ne comprenez pas bien, cherchez dans Google Images), pour signifier la lassitude exaspérée, ou U+270C VICTORY HAND + U+FE0F VARIATION SELECTOR-16 (‘✌️’) pour la satisfaction de la réussite.

⭐️

Maintenant, à côté des smileys et autres emojis qui peuvent éventuellement représenter des émotions, il y a quantité d'emojis dans Unicode qui représentent juste… tout et n'importe quoi. À titre d'exemples, on a notamment :

  • les drapeaux de pays et certaines institutions internationales (par exemple U+1F1FA REGIONAL INDICATOR SYMBOL LETTER U + U+1F1F3 REGIONAL INDICATOR SYMBOL LETTER N pour le drapeau des Nations-Unies ‘🇺🇳’) ou de certaines régions (par exemple, la combinaison fort longue U+1F3F4 WAVING BLACK FLAG + U+E0067 TAG LATIN SMALL LETTER G + U+E0062 TAG LATIN SMALL LETTER B + U+E0073 TAG LATIN SMALL LETTER S + U+E0063 TAG LATIN SMALL LETTER C + U+E0074 TAG LATIN SMALL LETTER T + U+E007F CANCEL TAG pour le drapeau de l'Écosse ‘🏴󠁧󠁢󠁳󠁣󠁴󠁿’ ou encore d'autres drapeaux symboliques (comme U+1F3F4 WAVING BLACK FLAG + U+200D ZERO WIDTH JOINER + U+2620 SKULL AND CROSSBONES + U+FE0F VARIATION SELECTOR-16 pour le drapeau pirate ‘🏴‍☠️’) ;
  • une collection complètement hétéroclite de symboles, incluant toutes sortes de cœurs (par exemple U+1F496 SPARKLING HEART pour un cœur scintillant(?) ‘💖’), un échantillon aléatoire de pictogrammes tels qu'on trouverait sur des panneaux (comme U+1F6B7 NO PEDESTRIANS pour le un panneau d'interdiction aux piétions ‘🚷’), de flèches emoji (par exemple U+2195 UP DOWN ARROW + U+FE0F VARIATION SELECTOR-16 pour une flèche haut-bas en version emoji, ‘↕️’), d'icônes informatiques vaguement standardisées (du genre U+1F50A SPEAKER WITH THREE SOUND WAVES pour ‘🔊’), de symboles représentant des religions ou des signes du zodiaque (y compris U+26CE OPHIUCHUS pour le symbole du serpentaire ‘⛎’), et des dessins géométriques colorés qui se demandent bien ce qu'ils font là (comme U+1F537 LARGE BLUE DIAMOND pour ‘🔷’) ;
  • une collection tout aussi hétéroclite d'objets (par exemple U+1F52D TELESCOPE pour ‘🔭’), qui bien sûr n'est pas bien séparée de la collection de symboles ; d'animaux (U+1F41D HONEYBEE pour ‘🐝’) ; et de plantes (U+1F334 PALM TREE pour ‘🌴’) ;
  • une collection encore plus bizarre et hétéroclite de choses qui se mangent ou se boivent (au pif, U+1F354 HAMBURGER pour ‘🍔’) ;
  • des représentations d'humains en train de faire des activités principalement sportives (comme U+1F6B4 BICYCLIST pour un cycliste ‘🚴’) ou de métiers (du genre U+1F477 CONSTRUCTION WORKER pour un ouvrier du bâtiment ‘👷’), auxquelles on peut rattacher le très bizarre businessman flottant (si, si : U+1F574 MAN IN BUSINESS SUIT LEVITATING + U+FE0F VARIATION SELECTOR-16 pour ‘🕴️’) ;
  • et encore toutes sortes de machins inclassables, comme le fameux tas de merde (U+1F4A9 PILE OF POO pour ‘💩’).

Au sujet de la pente glissante dans laquelle Unicode s'est joyeusement jeté en commençant à encoder ces machins, mais aussi du fait qu'ils n'avaient pas forcément le choix à partir du moment où ils veulent être le One Standard to Rule Them All, je renvoie à cette entrée écrite il y a huit ans quand les emojis ont commencé à faire leur entrée dans Unicode, et qui me semble encore tout à fait d'actualité. Les principales évolutions en ces huit ans, à part que le nombre d'emojis Unicode a augmenté (j'ai la flemme de chercher les valeurs précises), ont été que les dessins en couleur se sont répandus, et que toutes sortes de débats sur la diversité (notamment ethnique et sexuelle) ont débouché sur des solutions un peu bâtardes dont je dois dire un mot, mais qu'un des résultats de tout ça est qu'un emoji Unicode ne correspond plus forcément à un seul codepoint (je l'ai déjà expliqué, et les exemples ci-dessus abondent).

Il y aurait sans doute des thèses entières à écrire sur l'usage que les gens font effectivement des emojis, et notamment de ceux qui ne sont pas des émoticônes. Je dois dire que j'ai un peu du mal à comprendre quel intérêt il peut y avoir à disposer d'un emoji pour, disons, un brocoli (U+1F966 BROCCOLI pour ‘🥦’), et dans quelle(s) condition(s) on pourrait avoir envie de s'en servir plutôt qu'écrire le mot brocoli. (Bon, cela pourra toujours servir dans des textes mathématiques en l'honneur de Jean-Yves Girard.) Idem pour l'intérêt d'un emoji représentant quelqu'un en train de se faire coiffer (U+1F487 HAIRCUT pour ‘💇’) ou d'un télescope. Pour moi, l'intérêt principal des dessins en tous genres est de ponctuer le texte de méta-informations aidant à en comprendre le contexte (comme le contexte émotionnel dans le cas des émoticônes, cf. ce que je disais ci-dessus), et les brocolis, les coiffures et les télescopes ne sont pas furieusement utiles dans ce sens ; mais je ne sais pas quel usage réel est fait de ce genre de choses (je suppose qu'un usage possible est simplement comme abréviation, mais là aussi le choix est assez étrange).

Maintenant, il est certain que beaucoup d'emojis se font détourner de leur usage prévu, les plus notables étant l'aubergine (U+1F346 AUBERGINE pour ‘🍆’) utilisée comme métaphore pour un pénis et la pêche (U+1F351 PEACH pour ‘🍑’) pour une paire de fesses, à tel point que les usages légitimes de ces deux emojis dans leur sens apparent (le légume et le fruit) sont extrêmement minoritaires : mon petit côté loyal-psychorigide me fait dire au lieu de détourner de leur usage ces pauvres aliments qui n'y sont pour rien, il faut créer des emojis pour le pénis et la paire de fesses, et évidemment bien d'autres pouvant représenter toutes sortes de pratiques sexuelles comme on en a créé pour toutes sortes d'aliments : l'intention de les utiliser est évidente, et c'est désolant que notre société soit restée à un niveau de pudibonderie telle qu'on éprouve le besoin de métaphores de ce genre (et quand on voit que, par exemple, des emojis gay ont provoqué une réaction internationale, on se dit qu'on n'est pas rendus).

Au sujet du détournement de caractères, je devrais sans doute lier, quelque part dans cette entrée, une étude — un peu vieille — de Barry Kavanagh intitulée A Contrastive Analysis of American and Japanese Online Communication: A Study of UMC Function and Usage in Popular Personal Weblogs, que j'avais lue il y a longtemps (mais je ne me rappelle plus exactement ce qu'en avais tiré, donc je ne fais que la mentionner au passage).

⭐️

Il faut bien sûr que je dise un mot sur les questions de diversité dans les emojis dans Unicode.

Quand les emojis de personnes sont arrivés notamment sur les téléphones Apple, ils ressemblaient à ça : tous les emojis représentant des humains (non symbolisés façon émoticônes) étaient ostensiblement blancs même si c'est la couleur de peau d'une petite minorité de l'humanité (sauf, bizarrement, U+1F473 MAN WITH TURBAN soit ‘👳’, ainsi que U+1F472 MAN WITH GUA PI MAO soit ‘👲’) ; et ceux qui n'étaient pes explicitement désignés de genre masculin ou féminin étaient genrés selon des clichés courants (même si ce n'était pas totalement clair, le U+1F46E POLICE OFFICER, ‘👮’, apparaissait plus masculin que féminin, en plus d'être blanc).

Des efforts ont ensuite été faits pour remédier à ce problème (qui était d'ailleurs plutôt de la faute des concepteurs des dessins que de celle d'Unicode, les dessins et descriptions duquel sont passablement neutres). Le point positif est qu'on est arrivé à une meilleure diversité (même si le résultat reste assez perfectible) ; et on l'a fait en utilisant des combinants ou autres séquences de caractères pour éviter de consommer des centaines de codepoints Unicode. Le point négatif est qu'on y est arrivé au prix de solutions ad hoc et bancales qui n'obéissent à aucune cohérence.

Résultat, certains emojis peuvent faire varier la couleur de la peau, d'autres non ; certains peuvent faire varier la couleur des cheveux, d'autres non ; certains peuvent faire varier le genre de la personne représentée, d'autres non ; certains admettent une variante de genre non spécifié, d'autres non ; et tout ça essentiellement sans aucune logique. Par exemple, on a le droit dans Unicode à une personne de sexe indéterminé ayant des cheveux blonds (U+1F471 PERSON WITH BLOND HAIR pour ‘👱’), qui peut d'ailleurs avoir la peau noire (U+1F471 PERSON WITH BLOND HAIR + U+1F3FF EMOJI MODIFIER FITZPATRICK TYPE-6 pour ‘👱🏿’), mais si on veut que cette personne ait des cheveux roux, alors on est obligé de décider si c'est un homme (U+1F468 MAN + U+200D ZERO WIDTH JOINER + U+1F9B0 EMOJI COMPONENT RED HAIR pour ‘👨‍🦰’) ou une femme (U+1F469 WOMAN + U+200D ZERO WIDTH JOINER + U+1F9B0 EMOJI COMPONENT RED HAIR pour ‘👩‍🦰’), et là aussi on peut faire varier la couleur de la peau mais ce n'est pas obligatoire. De même, un policier a le droit d'être de genre indéterminé (même si j'ai déjà signalé que U+1F46E POLICE OFFICER, ‘👮’, a tendance à ressembler à un homme), comme il peut être un homme spécifiquement (U+1F46E POLICE OFFICER + U+200D ZERO WIDTH JOINER + U+2642 MALE SIGN + U+FE0F VARIATION SELECTOR-16 pour ‘👮‍♂️’) ou une femme spécifiquement (U+1F46E POLICE OFFICER + U+200D ZERO WIDTH JOINER + U+2640 FEMALE SIGN + U+FE0F VARIATION SELECTOR-16 pour ‘👮‍♀️’) ; mais un juge doit forcément être un homme (U+1F468 MAN + U+200D ZERO WIDTH JOINER + U+2696 SCALES + U+FE0F VARIATION SELECTOR-16 pour ‘👨‍⚖️’) ou une femme (U+1F469 WOMAN + U+200D ZERO WIDTH JOINER + U+2696 SCALES + U+FE0F VARIATION SELECTOR-16 pour ‘👩‍⚖️’) ; et on remarquera que la manière dont on spécifie le genre est complètement différent pour le policier et pour le juge. S'agissant des policiers et juges, on peut faire varier la couleur de la peau mais pas celle des cheveux. Quel chaos !

L'idée de base pour la représentation des couleurs de peau pour les emojis humains me paraît plutôt bonne sur le principe :

  • il y a une version « de base » qui doit correspondre à une personne de couleur de peau indéterminée et être représentée graphiquement par une couleur de peau délibérément irréaliste (du genre, gris, vert ou bleu — malheureusement, c'est plutôt le jaune façon Simpsons qui a été choisi, je vais revenir là-dessus) ;
  • on peut spécifier une couleur de peau particulière à l'aide de modificateurs spéciaux (en l'occurrence U+1F3FB EMOJI MODIFIER FITZPATRICK TYPE-1-2 à U+1F3FF EMOJI MODIFIER FITZPATRICK TYPE-6).

J'apprécie le fait qu'on puisse mais qu'on ne doive pas spécifier la couleur de la peau. Malheureusement, il y a plein de problèmes en pratique :

  • Pour éviter de rentrer dans le débat épineux de ce que doivent être les couleurs de peau représentables (et risquer de finir par normaliser des classifications racistes), Unicode a choisi d'utiliser la classification de Fitzpatrick issue de la dermatologie, qui a sans doute un intérêt scientifique mais ne correspond ni vraiment à l'idée qu'on se fait spontanément ou culturellement de la couleur de la peau, encore moins du type ethnique, ni à ce que les emojis effectivement affichés indiquent ; et notamment, ceux qui cherchent à représenter un type ethnique particulier, par exemple, chinois han, ne vont pas trouver leur bonheur ;
  • ceci est compliqué par le fait que les fournisseurs d'emojis ont utilisé pour version « de base » (et donc censée correspondre à une couleur de peau irréaliste, cf. ci-dessus), plutôt que le vert ou le bleu, un jaune « Simpsons », certes irréaliste, mais qui (a) est utilisé dans les Simpsons pour représenter des blancs, et (b) peut donner l'impression qu'elle est censée représenter un type ethnique asiatique ;
  • concrètement, il semble que quasiment personne n'utilise le modificateur U+1F3FB EMOJI MODIFIER FITZPATRICK TYPE-1-2 (censé représenter les couleurs de peau les plus claires), parce que les blancs s'imaginent systématiquement être la couleur de peau par défaut et/ou parce qu'ils ne tiennent pas à rappeler qu'ils sont blancs — ceci n'est pas un problème d'Unicode, bien sûr, mais cela révèle encore une fois quelque chose sur l'interprétation de la version « de base ».
  • Indépendamment de tout ça, les modificateurs de couleur de peau ne sont pas utilisables sur tous les emojis représentants des humains mais seulemnt sur ceux qui avaient initialement été représentés comme blancs par Apple, et notamment, pas sur les émoticônes : ainsi, une émoticône comme U+1F600 GRINNING FACE, ‘😀’, sera forcément d'une couleur « de base » (typiquement d'un jaune artificiel) et on ne peut pas la changer. Autrement dit, Unicode n'a pas su trancher entre la logique « les emojis représentant des humains sont des abstractions, on doit leur donner une couleur de peau neutre (c'est-à-dire irréaliste) et/ou un dessin complètement stylisé » et la logique « les emojis représentant des humains doivent être des dessins raisonnablement fidèles (par exemple de la personne qui s'exprime) dont il s'agit de pouvoir faire varier librement les caractéristiques visibles », et on se retrouve avec une solution incroyablement illogique où les caractéristiques variables dépendent de façon aléatoire de l'emoji. (À ce sujet, voir ce fil Twitter et les différentes discussions qui en partent, par exemple celle-ci.)

Pour ce qui est du genre, comme je le dis ci-dessus au sujet des policiers et des juges, la même logique (qui aurait voulu que, pour chaque activité ou profession, on ait un emoji de genre indéterminé et la possibilité de le rendre spécifiquement masculin ou spécifiquement féminin) n'a pas été appliquée : dans certains cas il y a bien une version non-genrée, dans d'autres il n'y a pas, et surtout, il n'y a absolument aucune logique (en gros cela dépend de si l'emoji était représenté dès Unicode 6.0 par un caractère spécifique ou si on l'a fabriqué plus tard avec d'une séquence commençant par U+1F468 MAN ou U+1F469 WOMAN ; or il n'y a pas de caractère PERSON).

⭐️

À un certain niveau, on doit forcément se demander si Unicode était bien l'endroit où mettre tout ça. Indubitablement, cela pose d'énormes problèmes. Le répertoire d'objets, de plantes et d'animaux qui figurent dans les emojis d'Unicode laisse inévitablement poser la question de savoir jusqu'où on mettra la limite tant la liste des candidats possibles est essentiellement infinie. La liste actuelle me fait penser à ce passage que j'aime beaucoup de Through the Looking-Glass :

The shop seemed to be full of all manner of curious things—but the oddest part of it all was, that whenever she looked hard at any shelf, to make out exactly what it had on it, that particular shelf was always quite empty: though the others round it were crowded as full as they could hold.

Je veux dire qu'on a toujours l'impression qu'il y a toutes les choses de la Création sauf justement l'emoji qu'on recherchait.

Mais le vrai problème, finalement plus insidieux que la nécessité de faire un choix arbitraire des bestioles qui entreront ou non dans le Standard, c'est qu'Unicode se retrouve dans la position vraiment délicate de devoir faire ce choix (avec toutes les ramifications politiques et culturelles qu'il peut impliquer). Et des spécialistes de langues et de systèmes d'écriture, ni des informaticiens, ne sont pas forcément les mieux placés pour prendre de telles décisions.

Quelqu'un m'avait proposé le point de vue différent suivant (avec lequel je ne suis finalement pas d'accord, mais qui est intéressant et pertinent et mérite d'être signalé) : considérer que les emojis ne sont pas du texte mais du texte formaté. C'est-à-dire que leur place n'est pas avec les lettres de l'alphabet ou les signes de ponctuation, mais avec les marquages comme gras, italiques, souligné, couleur rouge, centré, et ainsi de suite, ce qui se représente typiquement, en informatique, par un langage à balises comme du HTML (donc le système de <d:smiley-smile /> que j'utilise sur ce blog serait dans l'esprit de cette solution).

Il y a essentiellement trois raisons pour lesquelles je ne suis pas d'accord.

La première est sémantique : j'ai essayé d'expliquer plus haut en quoi au moins les émoticônes se rapprochent plus de la ponctuation que de décorations typographiques ; et les emojis peuvent aussi se rattacher à un système d'idéogrammes, ce qu'ils sont partiellement, et si on accepte qu'Unicode encode des dizaines de milliers d'idéogrammes chinois (dont, rappelons-le, une énorme partie doit apparaître une et une seule fois dans tout le corpus disponible), il n'y a pas de raison de ne pas accepter des idéogrammes d'invention plus récente.

La seconde raison pour moi de rejeter l'idée que les emojis seraient du texte formaté et non du texte simple est plutôt syntaxique : la notion de texte formaté, pour moi, a une structure globalement récursive, on le représente comme des balises imbriquées traduisant des modifications de régions d'un texte brut : ceci ne correspond pas à la façon dont on pense les emojis, qui ne sont pas une modification par rapport à un texte de base, et qui ne peuvent pas s'imbriquer (whatever that would mean).

Enfin, ma troisième raison est pragmatique : la représentation informatique du texte formaté est un échec monumental : il n'est toujours pas possible de copier-coller du texte formaté (par exemple avec des mots en gras et en italique) de manière à ce que ça marche partout (du style : SMS, Twitter, les commentaires de tous les sites qu'on peut imaginer, — ce genre de choses), il n'y a guère que dans les mails que Madame Michu peut utiliser du texte formaté, et même là, ça marche mal et la solution adoptée est mauvaise et pose toutes sortes de problèmes de sécurité (parce qu'avec le texte formaté, faute de standard minimal clair, on a inclus tout HTML, donc les images, le JavaScript et tout ce qui va avec) ; alors qu'Unicode a plutôt été une réussite pour ce qui est de permettre, et de permettre de copier-coller, tout ce qu'il contient en n'importe quel endroit où du texte est accepté. Donc, à force, j'ai tendance à dire que la communauté informatique a prouvé qu'elle était incapable de mettre en place un système de texte formaté qui Juste Marche et qu'il ne faut plus miser là-dessus : au contraire, même, j'en viens à espérer qu'Unicode se décide à inclure des caractères du genre début de gras et début d'italiques (on a déjà des caractères qui s'imbriquent, pour la gestion de la directionnalité, et ça ne marche pas si mal, y compris dans les interactions avec le HTML qui peut faire double emploi).

↑Entry #2597 [older| permalink|newer] / ↑Entrée #2597 [précédente| permalien|suivante] ↑

[Index of all entries / Index de toutes les entréesLatest entries / Dernières entréesXML (RSS 1.0) • Recent comments / Commentaires récents]