David Madore's WebLog: Caractères arabes désordonnés

Index of all entries / Index de toutes les entréesXML (RSS 1.0) • Recent comments / Commentaires récents

Entry #2280 [older|newer] / Entrée #2280 [précédente|suivante]:

(lundi)

Caractères arabes désordonnés

[Affiche d'instructions]Pendant le week-end, des panonceaux sont apparus un peu partout dans l'école où je travaille (cf. photo ci-contre, cliquez pour agrandir) avec des instructions de sécurité, en français, anglais, espagnol, chinois, russe et arabe (c'est-à-dire l'ensemble des langues officielles de l'ONU, qui sont un ensemble assez raisonnable de langues à choisir si on veut être largement compris dans le monde : j'approuve donc ce choix, même si je ne suis pas totalement convaincu de son utilité réelle à cet endroit précis, mézenfin).

Je ne vais pas chercher à pointer du doigt les fautes de traduction. Mais regardons un peu les caractères arabes utilisés sur cette affiche. Si j'essaie de reproduire l'effet en HTML, ce sera quelque chose comme ceci :

‭‌ت‌ع‌ل‌ي‌م‌ا‌ت ‌ا‌ل‌س‌ل‌ا‌م‌ة‌‬

(sur un navigateur avec les bonnes polices et bien respectueux des standards, ce qui précède devrait reproduire les caractères arabes en blanc sur bleu juste après Правила Безопансости, qui devrait d'ailleurs être Правила Безопасности). En fait, ce qu'on voulait écrire est plutôt ça :

تعليمات السلامة

Vous ne voyez pas la ressemblance ? Le problème est qu'on a écrit les bonnes lettres arabes, mais (1) de gauche à droite, alors que l'arabe s'écrit de droite à gauche, et (2) sans les lier entre elles, alors que l'arabe a une écriture cursive où les caractères se connectent les uns aux autres (et changent de forme en fonction de cette connexion). Même sans connaître l'alphabet, en comparant les deux versions ci-dessus (du moins, si votre navigateur les a affichées correctement), sachant que les points marquant certaines lettres ne changent pas quand on connecte la lettre à d'autres, vous devriez voir la correspondance.

C'est un bug que j'ai vu assez souvent, quoique jamais encore sur un panneau officiel. J'avais déjà donné un exemple dans une entrée passée (mais là je ne suis même pas sûr que c'était des mots arabes et pas juste des lettres tapées au hasard). J'avais aussi vu passer cette photo prise à l'US Open autour de 2013 (les caractères arabes sont en bas à droite : c'est censé être quelque chose comme القادمين بنر حب, dont je ne suis d'ailleurs pas convaincu que ça veuille dire grand-chose, mais en tout cas c'est mal écrit et ça ressemble à ‌ا‌ل‌ق‌ا‌د‌م‌ي‌ن ‌ب‌ن‌ر ‌ح‌ب‌ — pour le coup, au moins, c'est dans le bon sens). Et je me souviens aussi avoir vu un acteur porno gay avec un tatouage tout aussi mal écrit aux alentours de son nombril, un de mes lecteurs va certainement pouvoir me dire qui c'était exactement [ajout : il s'agit de Topher DiMaggio — images pas complètement SFW].

Mise à jour : L'information a été remontée, et les panneaux dans mon école vont être corrigés ou refaits.

Je suppose que c'est ce qui se produit quand quelqu'un fait du copier-coller de caractères Unicode arabes dans un logiciel qui ne gère pas du tout les écritures de droite à gauche et/ou les complexités typographiques des écritures présentant des ligatures. (Par exemple, dans un terminal texte sous Unix, l'arabe a effectivement tendance à ressembler à ce genre de monstruosités.) Je suppose que la personne qui copie-colle n'a aucune connaissance de l'écriture arabe et reçoit les caractères à copier-coller de quelqu'un qui les a écrits correctement, et il fait confiance, à tort, au logiciel pour ne pas massacrer les choses lors du copier-coller. Maintenant, c'est quand même triste, à la fois que ce genre d'erreurs se produisent (i.e., qu'il existe des logiciels de mise en page incapables de gérer la bidirectionalité, et qui n'affichent pas, au minimum, un énorme avertissement si on essaie de taper de l'arabe), et qu'elles ne soient pas détectées, i.e., qu'il y a des gens à ce point ignorants de ce qui est quand même une langue relativement fréquemment parlée en France, pour ne même pas savoir à quoi son écriture ressemble (et spécifiquement, que les caractères sont liés les uns aux autres). Surtout que là, des gens parlant arabe et qui vont passer devant le panneau, il y en a (et ce n'aurait pas été difficile d'en trouver pour relire l'affiche avant de l'envoyer à l'impression !). Ou pour remarquer que c'est suspect que les caractères s'insèrent de la gauche vers la droite et ne présentent aucun signe de directionalité droite-vers-gauche. (OK, on peut s'imaginer que l'informatique a décidé de gérer l'arabe en stockant les textes à l'envers pour faire semblant qu'il va de gauche à droite, mais on doit quand même vite se rendre compte qu'il y a plein de problèmes avec ça.)

C'est le genre de choses qui me fait trouver qu'il devrait y avoir des cours de culture générale à l'école, où on apprendrait entre autres des généralités sur les langues du monde, et au minimum à savoir reconnaître les grands systèmes d'écriture et un peu à quoi ils ressemblent. Je ne parle pas forcément de savoir distinguer du tamoul et du malayalam, mais au moins d'avoir des grandes idées sur les principes de différents systèmes d'écritures. Pour un fou d'Unicode comme moi, ce sont des connaissances aussi basiques que de savoir que la première guerre mondiale a duré de 1914 à 1918.

↑Entry #2280 [older|newer] / ↑Entrée #2280 [précédente|suivante]

Recent entries / Entrées récentesIndex of all entries / Index de toutes les entrées