David Madore's WebLog: 2023-05

Vous êtes sur le blog de David Madore, qui, comme le reste de ce site web, parle de tout et de n'importe quoi (surtout de n'importe quoi, en fait), des maths à la moto et ma vie quotidienne, en passant par les langues, la politique, la philo de comptoir, la géographie, et beaucoup de râleries sur le fait que les ordinateurs ne marchent pas, ainsi que d'occasionnels rappels du fait que je préfère les garçons, et des petites fictions volontairement fragmentaires que je publie sous le nom collectif de fragments littéraires gratuits. • Ce blog eut été bilingue à ses débuts (certaines entrées étaient en anglais, d'autres en français, et quelques unes traduites dans les deux langues) ; il est maintenant presque exclusivement en français, mais je ne m'interdis pas d'écrire en anglais à l'occasion. • Pour naviguer, sachez que les entrées sont listées par ordre chronologique inverse (i.e., la plus récente est en haut). Cette page-ci rassemble les entrées publiées en mai 2023 : il y a aussi un tableau par mois à la fin de cette page, et un index de toutes les entrées. Certaines de mes entrées sont rangées dans une ou plusieurs « catégories » (indiqués à la fin de l'entrée elle-même), mais ce système de rangement n'est pas très cohérent. Le permalien de chaque entrée est dans la date, et il est aussi rappelé avant et après le texte de l'entrée elle-même.

You are on David Madore's blog which, like the rest of this web site, is about everything and anything (mostly anything, really), from math to motorcycling and my daily life, but also languages, politics, amateur(ish) philosophy, geography, lots of ranting about the fact that computers don't work, occasional reminders of the fact that I prefer men, and some voluntarily fragmentary fictions that I publish under the collective name of gratuitous literary fragments. • This blog used to be bilingual at its beginning (some entries were in English, others in French, and a few translated in both languages); it is now almost exclusively in French, but I'm not ruling out writing English blog entries in the future. • To navigate, note that the entries are listed in reverse chronological order (i.e., the most recent is on top). This page lists the entries published in May 2023: there is also a table of months at the end of this page, and an index of all entries. Some entries are classified into one or more “categories” (indicated at the end of the entry itself), but this organization isn't very coherent. The permalink of each entry is in its date, and it is also reproduced before and after the text of the entry itself.

[Index of all entries / Index de toutes les entréesLatest entries / Dernières entréesXML (RSS 1.0) • Recent comments / Commentaires récents]

Entries published in May 2023 / Entrées publiées en mai 2023:

↓Entry #2751 [older| permalink|newer] / ↓Entrée #2751 [précédente| permalien|suivante] ↓

(jeudi)

Les langues construites ont-elles un intérêt ?

J'avais parlé il y a quelques années de ma fascination pour les constitutions, et de l'intérêt à la fois politique, argumentatif ou illustratif, mais aussi artistique, d'imaginer des constitutions (d'états réels ou fictifs) même si on ne pense pas une seule seconde que ces constitutions aient la moindre chance d'être mise en pratique, et j'avais évoqué, sans la développer, la comparaison avec la création de langues artificielles, qui éveille un peu les mêmes cellules mentales chez moi. Je voudrais reprendre ce fil de pensée et expliquer ici l'intérêt que peuvent avoir les langues construites, et défendre la thèse que la linguistique peut légitimement s'y intéresser. (J'écris peut plutôt que doit dans la phrase précédente, mais ce que je veux surtout dire c'est que je me place en opposition de l'attitude que je crois avoir perçue de temps en temps — je ne l'attribue à personne parce qu'il est possible que je simplifie une position plus nuancée et pas forcément si méprisante — que les langues artificielles sont un joujou pour amateurs qui ne peut en aucun cas informer le travail du linguiste qui consiste à étudier les langues naturelles et leur évolution naturelle ; ou encore — de nouveau, je résume quelque chose que je crois avoir retenu, quitte à risquer de brûler des hommes de paille — que les langues construites ont autant à apprendre aux linguistes que les fleurs en plastique aux botanistes.)

☞ Qu'est-ce qu'une conlang

Pour commencer par définir les termes, j'utiliserai langue artificielle et langue construite de façon interchangeable (on peut certainement vouloir faire une nuance, mais je n'aurai pas besoin d'une terminologie trop pointilleuse), et j'utiliserai l'anglicisme/néologisme conlang de façon également interchangeable pour aller plus vite.

Une conlang, donc, et même si je vais dire tout de suite que la distinction n'est pas toujours parfaitement claire, c'est une langue qui a été créée de toutes pièces plutôt que, comme les langues naturelles, évoluer organiquement, progressivement, par la communication mutuelle. Si on veut, on peut comparer l'évolution des langues naturelles à l'évolution des organismes vivants (il y a un processus de mutation et de sélection, même si les raisons de l'une comme de l'autre ne sont pas aussi bien expliquées que dans le cadre de l'évolution darwinienne de la vie au-dessus des principes de l'écologie, de la génétique, et de la biochimie), alors que les langues construites s'apparenteraient, dans cette analogie, plutôt à des robots ou des mannequins.

☞ Quelques exemples

La conlang la plus connue est évidemment l'espéranto (conlang au moins à l'origine, parce qu'on peut certainement contester que l'espéranto soit encore une conlang à ce stade), connue entre autres pour la manière pénible dont ses aficionados voudront vous expliquer que c'est la solution de plein de problèmes de l'humanité (bref, l'espéranto est un peu aux langues humaines ce que le Python est aux langages informatiques), et inversement dont les détracteurs aiment se moquer. Si vous voulez voir des critiques assez intéressantes de l'espéranto, voyez par exemple cette page ou celle-ci (deux pages qui ont d'ailleurs disparu et c'est heureux que l'Internet Archive en ait préservé l'information), mais en l'occurrence ce qui est surtout pénible avec l'espéranto c'est la manière dont les débats autour de lui font oublier toutes les autres conlangs. (J'ai notamment l'impression que l'article de la Wikipédia en français sur les langues construites est en bonne partie résultat d'une guerre d'édition entre les espérantistes qui ont voulu en profiter pour expliquer à quel point leur langue préférée est géniale et les anti-espérantistes qui ont voulu en profiter pour la critiquer.)

Un autre exemple de conlang que je pourrais mentionner (ne serait-ce que pour souligner que ce n'est pas pareil que l'espéranto) est l'interlingua (j'ai d'ailleurs écrit au moins un billet de ce blog dans cette langue), une sorte de point de rencontre des langues latines (mais dont le vocabulaire vise à trouver une forme systématique de chaque mot, là où Zamenhof semble avoir choisi le vocabulaire de l'espéranto en tirant au hasard au dé s'il allait utiliser une racine romane, germanique ou slave), et qui vise — avec quel succès, c'est discutable, mais vous pouvez lire le billet que je viens de lier pour tester — à être immédiatement compréhensible par n'importe quel locuteur d'une langue latine, sans apprentissage préalable. Il y a des tentatives d'analogues de l'interlingua pour les langues slaves (l'interslave) et, de façon moins aboutie, pour les langues germaniques (le folksprak).

Encore d'autres exemples de conlangs sont la famille des langues elfiques inventées par Tolkien pour le monde de la Terre du Milieu (dans lequel se déroulent le Seigneur des Anneaux), ou le klingon du monde de Star Trek. Encore plus d'autres exemples sont fournis par le lojban, une langue dont la grammaire vise à être aussi parfaitement logique et inambiguë que possible, le toki pona, une langue minimaliste qui n'a que 137 mots essentiels et qui s'apprend en un temps record, ou encore l'ithkuil, une langue plutôt maximaliste et sans doute trop compliquée pour être apprise. Bref, les exemples sont très nombreux, et bien sûr il y a une liste sur Wikipédia.

Et cette page Wikipédia ne mentionne bien sûr que les conlangs les plus connues ou attestées. Énormément de geeks intéressés par la linguistique ont imaginé leur propre conlang, voire des dizaines de conlangs, soit pour s'amuser, soit pour faire du world-building (cosmopoésie ?) dans un monde où ils situent des histoires de fiction, ou pour je ne sais quelle autre raison. Quand j'étais ado, j'ai inventé diverses conlangs, par exemple toutes sortes de variations autour de l'indo-européen réimaginé par Ruxor (où je cherchais à coller à peu près avec les sources que je pouvais trouver sur ce qu'on sait du proto-indo-européen — et qui étaient disponibles à l'ado d'une époque où Wikipédia n'existait pas et qui n'avait pas accès à une bibliothèque de recherche en linguistique — mais en assumant pleinement d'inventer les formes qui me manquaient ou qui me semblaient artistiquement ou logiquement nécessaires). J'ai peur que toutes ces créations de moi aient été irrémédiablement perdues, mais comme exemple plutôt intéressant de langue inventée par un geek dans son grenier, je recommande de regarder cette vidéo qui est assez impressionnante par la quantité de world-building (pas uniquement sur le plan linguistique) que la langue en question nous laisse deviner (et le fait que la langue en question soit une conlang non seulement dans notre monde réel mais aussi d'une certaine manière dans le monde fictionnel où elle se place, peut être considéré comme un magnifique exemple de métafiction) : j'avoue que je suis franchement admiratif.

Mais bon, reprenons.

☞ Trois buts possibles d'une conlang

Quels sont les buts possibles d'une langue construite ? J'en vois principalement trois (et je vois que Wikipédia tombe sur la même typologie que moi, donc elle a sans doute une certaine naturalité), pas forcément exclusifs ni exhaustifs mais permettant de délimiter au moins approximativement le terrain : ① la communication, comme c'est le cas de l'espéranto ou de l'interlingua, ② l'art, comme c'est le cas des langues elfiques de Tolkien, et ③ l'exploration ou l'illustration d'une théorie ou hypothèse linguistique, comme c'est le cas du lojban, du toki pona ou de l'ithkuil.

☞ But ① : la communication

But ① (que tout le monde aura immédiatement en tête) : la communication. Pour ça, il faut bien sûr espérer que des gens apprennent la langue en question et décident de s'en servir (on peut éventuellement espérer, comme le fait l'interlingua, que la langue puisse servir de façon passive — c'est-à-dire pour comprendre un texte déjà écrit ou parlé — à des gens qui ne l'auraient jamais apprise, mais pour se servir d'une langue de façon active — c'est-à-dire pour écrire ou parler — il est assez inévitable qu'il faille apprendre quelque chose). Généralement l'idée est alors de créer une langue simple, soit parce qu'elle est régulière et logique (ce qui permet à peu de concepts d'avoir énormément de portée), soit parce qu'elle est minimaliste (ce qui minimise la quantité d'apprentissage nécessaire), soit parce qu'elle se rapproche de langues naturelles qu'on suppose déjà familières à la personne ciblée (cas des langues romanes avec l'interlingua). L'espéranto, notamment, qui vise clairement à servir de langue véhiculaire, met souvent en avant la puissance de son système d'affixes (ce qui permet de dire beaucoup de choses avec peu d'outils) ou la régularité de sa grammaire.

Il faut être honnête : à part peut-être dans un cadre extrêmement spécifique, ça ne marchera pas. Essentiellement personne n'a envie d'apprendre une langue construite pour communiquer avec les autres, parce qu'essentiellement personne ne parle ces langues construites : c'est peut-être dommage, mais c'est un cercle vicieux qu'il est impossible de briser.

Mais le but d'une conlang n'est pas forcément d'être apprise et parlée !

☞ But ② : l'art

But ② : l'art. Dans le cas des langues elfiques de Tolkien, ou du klingon, ou du dothraki (de Game of Thrones), il s'agit de langues que j'ai qualifiées de world-building, c'est-à-dire destinés à étoffer un monde fictionnel, à lui donner de la crédibilité et de la complexité. Mais l'art peut aussi porter sur l'esthétique de la langue elle-même : on peut décider de créer une langue comme une œuvre d'art en soi, sans aucun lien avec un monde fictionnel, pour ses sonorités, pour son élégance, n'importe quoi d'autre. Le mot français poésie vient du grec ποίησις, création, fabrication (de ποιέω, créer, produire, causer, fabriquer) : la glossopoésie c'est l'art de créer des langues, qui peut être un art pour l'art, sans avoir besoin d'être sous-tendu par la nécessité de peupler un monde imaginaire.

Je pense que la plupart des conlangs de geeks rentrent plutôt dans cette catégorie-là : on crée une langue pour le plaisir de créer une langue, pour savoir ce que ça fait de créer une langue. Et comme beaucoup de formes de création artistique, il faut de l'inspiration, mais il faut aussi du travail, au sens où la première conlang qu'on crée ressemblera beaucoup à l'équivalent linguistique de ce que les dessins de maternelle sont aux arts graphiques. (On peut aimer, bien sûr : la qualité de l'art ne se juge pas à la perfection technique, et si on crée pour soi-même la seule chose qui importe est le plaisir qu'on y prend, mais disons que la perfection technique se sent comme le manque de celle-ci se sent aussi, et en créant des conlangs on progresse dans cette capacité. J'étais tombé sur cette vidéo d'un conlanger qui est assez intéressante, malgré son excès d'autoflagellation, pour mettre en lumière les « erreurs du débutant ». Et puis je me suis bien livré à un exercice du même style sur mes romans d'ados.)

Bon, bien sûr, une conlang développée à des fins artistiques n'a pas besoin d'être complète (au sens où elle permet de dire n'importe quoi, ou même une approximation raisonnable de n'importe quoi). Elle peut être extrêmement fragmentaire (il me semble que certaines des langues de Tolkien le sont) : peut-être qu'il n'existe qu'un tout petit nombre de textes ou de mots. Peut-être que le sens n'est pas complètement clair. Peut-être qu'il n'y en a pas du tout. J'avais moi-même écrit il y a fort longtemps ce poème dans une langue inconnue (je veux dire, même de moi — je ne lui ai pas donné de sens), juste pour le plaisir des sonorités, et dont je reproduis ici la délicieuse traduction qu'un ami m'a proposée bien plus tard :

Ángdire loridâ kelén

Ángdir egúlkrist ajns turinâ solkúrbi damênus,
Nérno kilérg samptúrn, géldronis Ángdir umâ
Zhû lamprúski taréng loridâ Delikô vanudénglaw;
Vérnsi tarígde neták pûbiro wáshli tego.
Ángdir egúlkrist mê. Delikô vu Saríksme taláwdni
Mêgora, sháspi galós, vúnglaro tímpru naléts.
“Ôbera vénsno tilásp durk vénsno beréng ka Saríksmi
Mê mê, sílkparo mê, dáwn tirelô binokû.”
Ángdir egúlkrist sol. Venudár gmirelór psuni mâra.
 Delikô huvinê!  tirelô huvinê!
Ûmironarktadi vink tizhelô vensnû birogés krus?
Jom notilénk darekí pstríngni tarólgru tego:
Ángdir egúlkrist lûr loridâ ge Saríksmi sha tem psi.
 Delikô nanknê!  Delikô ANEGÓN!

D'Angdir et de la princesse

Le jeune Angdir erre dans son palais de marbre,
Comme tourne une girouette, ainsi tourne Angdir
Son âme est accaparée par la princesse Delikô ;
Tel est l'effet des nymphes sur les hommes.
Le jeune Angdir est malheureux. Car Delikô en compagnie de Sariksmi
A été vue, gambadant dans le pré, riant à ses paroles.
« Le venin d'un serpent n'est rien devant le venin de Sariksmi.
Malheur, terrible malheur, que la naïveté des femmes. »
Le jeune Angdir rumine. Il enrage de son impuissance.
Ô, insouciante Delikô ! Ô, insouciante femme !
L'indifférence d'une fille n'est-elle pas le plus cruel des poisons ?
Et les enjeux dépassent le sort d'un seul homme :
Le jeune Angdir ferait un bien meilleur prince que le fourbe Sariksmi.
Ah, innocente Delikô ! Delikô, prends garde !

Maintenant, le but peut être de développer ce poème et sa traduction en une véritable langue. Dans une tout autre direction, je peux aussi mentionner ce fragment où cette fois-ci on a juste un bout de grammaire d'une langue tout aussi imaginaire, et là aussi on pourrait voir ça comme une invitation à compléter l'œuvre.

On se rapproche ici des expérimentations de l'Oulipo, et je suis d'ailleurs un peu surpris que Raymond Queneau n'ait pas inclus, dans ses Exercices de style (même s'il y en a qui s'en rapprochent), une version du récit dans une langue inventée exprès pour l'occasion et où le lecteur aurait ensuite à essayer d'utiliser cette pierre de Rosette pour chercher à devenir le sens de chaque mot.

Quoi qu'il en soit, ce qui est peut-être dommage avec cet aspect artistique des langues construites, c'est que c'est une forme d'art extrêmement peu reconnue (au sens de socialement développée) : il se trouve manifestement beaucoup de geeks pour créer des conlangs personnelles de façon solitaire, mais il ne se trouve pas grand-monde pour admirer le résultat. (Et j'ai pourtant mentionné plus haut un résultat qui me semble mériter une certaine admiration.) Il n'y a pas de critiques de conlangs (à part quand il s'agit de dire du mal de l'espéranto, qui n'a pourtant pas vraiment de visée artistique), pas d'artistes reconnus, à peine quelques œuvres reconnues (essentiellement juste les langues de Tolkien, et peut-être le klingon et le dothraki, et encore, c'est difficile de séparer l'intérêt pour ces langues de l'intérêt pour le monde où elles s'inscrivent). Pas de sémioticien, pas d'Umberto Eco, pour faire le même travail d'analyse littéraire et artistique sur les conlangs que sur d'autres œuvres textuelles.

Bref.

☞ But ③ : l'expérimentation linguistique

But ③ : la linguistique. Le but de la conlang, cette fois, est d'explorer une possibilité linguistique, de tester une hypothèse, de prouver un point, de maximiser un paramètre (simplicité, concision, logique, expressivité…), quelque chose comme ça. Le but peut être de montrer, ou de chercher à savoir, si on peut concevoir une langue ayant telle ou telle caractéristique : parfois la question reçoit une réponse par le simple fait que la langue existe (si le but était de tester si une langue vérifiant telle ou telle contrainte est simplement logiquement possible), parfois il faut que des gens l'apprennent et s'y expriment (si le but était de tester si une telle langue est gérable par le cerveau humain, par exemple).

Je vais revenir sur ce troisième but, mais reculons d'un pas pour reconsidérer les conlangs dans leur ensemble.

☞ La distinction naturelle/construite n'est pas claire

La première raison pour laquelle on ne peut pas simplement décréter que les conlangs n'ont aucun intérêt, c'est une raison un peu triviale mais pas entièrement ignorable pour autant : la limite entre langues construites et langues naturelles n'est pas claire. Oui, dire ça comme ça c'est exactement tomber sur un des sophismes des sorites que je dénonçais récemment (la limite n'est pas parfaitement claire, donc il faut considérer que toutes les conlangs sont des langues naturelles comme les autres), donc je ne vais pas le dire de façon aussi simpliste, mais ça mérite quand même qu'on s'attarde sur quelques unes des raisons de cette ambiguïté.

Toute langue humaine est inventée, puisqu'il n'y a pas de langue qui s'impose naturellement par les lois de la physique ou de la biologie (ni de langue des dieux ou des anges ou je ne sais quoi) : tout mot a bien dû être inventé un jour ou un autre ; mais ce qui distingue les langues construites, c'est la vitesse et la singularité de leur construction (elles ne se développent pas lentement mais par la fulgurance de quelqu'un qui décide que tout un tas de mots se diront de tout un tas de manières). Néanmoins, les langues considérées comme « naturelles » se développent parfois en partie de façon programmée, voire décidée par une personne bien précise : on décide de ressusciter une langue morte, on syncrétise des dialectes (certes mutuellement intelligibles mais néanmoins distincts), on écrit (ou traduit !) une œuvre littéraire tellement influente qu'elle standardise une forme particulière de la langue, on répand une langue administrative, on invente une règle de grammaire de toutes pièces, on fonde une académie prescriptiviste, on rédige un traité influent… De l'hébreu moderne au(x) norvégien(s) en passant par le chinois « mandarin » ou la langue des signes internationale, toutes sortes de langues, sans être des conlangs, possèdent pourtant certains caractères construits. La frontière est également poreuse de l'autre côté, les conlangs important librement des langues naturelles ou possédant des caractères plus ou moins proches d'elles lors de leur conception.

Et bien sûr, non seulement les conlangs d'inspirent des langues naturelles à leur création, mais elles évoluent comme des langues naturelles dès qu'elles ont été créées : l'espéranto est une création artificielle à l'origine, mais dès lors que cette création a été publiée, l'espéranto s'est mis à évoluer comme une langue naturelle, avec des débats sur le bon usage et la logique. (Par exemple, notons un débat intéressant entre l'atisme et l'itisme, c'est-à-dire pour savoir si le participe en -ata, formellement présent passif, ou le participe en -ita, formellement passé passif, doit servir pour marquer le passé passif avec l'auxiliaire estis qui marque déjà un passé : le problème est que l'espéranto possède 3 temps simples à l'actif, mais 3×3=9 combinaisons d'auxiliaire+participe pour marquer le passif, et qu'il n'est pas clair quelle nuance doit être rendue ; cf. cette entrée passée où je mentionne brièvement ce débat concernant l'espéranto. Ce qui est intéressant, ici, c'est la tension entre la logique de la langue créée et l'usage des langues naturelles, surtout que le créateur lui-même a écrit des phrases qui ne suivaient pas la logique qu'il prétendait insuffler.) On peut même se demander si les langues construites n'évoluent pas plus vite que les langues naturelles, parce qu'il n'y a pas le poids du conservatisme imposé par tant de textes déjà écrits pour les freiner. Éventuellement il peut y avoir le poids du conservatisme des Mots du Créateur (du style le Maître a dit, ce qui est un peu la manière dont le débat entre atisme et itisme en espéranto a été tranché) ; mais une conlang peut, plus facilement qu'une langue naturelle, connaître un fork, i.e., une bifurcation (j'emploie à dessin le terme d'un projet informatique qui, en cas de dispute, se scinde en deux projets distincts portés par les deux camps de la dispute) : l'espéranto a forké plusieurs fois, et il y a d'ailleurs un article Wikipédia sur les forks de l'espéranto.

Mais peut-être que le point le plus important à signaler et à souligner est que, même si elles s'expriment différemment (et dans des rapports différents, notamment entre le conservatisme et le désir de changer les choses), les forces qui modèlent les conlangs, aussi bien lors de leurs mutations (ou forks) que leur création initiale, sont les mêmes que celles qui font évoluer les langues naturelles, parce que ce sont de toute façon des humains qui parlent, et qui ont les mêmes préoccupations ou la même variété de préoccupations : recherche d'expressivité, d'efficacité, de concision, de précision, de logique, d'élégance, d'euphonie, etc. Autrement dit, les gens qui créent une nouvelle langue font évidemment un pas bien plus grand, mais pas structuralement différent que les gens qui, fût-ce sans s'en rendre compte, modifient une langue naturelle dans un sens qui leur semble plus expressif, efficace, concis, précis, logique, élégant ou euphonique. Dans les langues naturelles, les néologismes ne sont pas fréquents, et les néogrammatismes (← je ne sais pas comment on dit, donc ceci est justement un néologisme) encore plus rares, surtout les néogrammatismes consciemment choisis et qui ont du succès (peut-être que iel en français en sera un ? c'est trop tôt pour le savoir), par rapport à une conlang qui peut être vue comme des milliers de néologismes et de néogrammatismes ex nihilo et plus cohérents entre eux ; mais fondamentalement, c'est quand même pareil.

☞ Pourquoi étudier les conlangs ?

Bon, dans tout ça j'ai un peu expliqué ce que sont les conlangs et quel est mon regard sur elles, mais je n'ai pas vraiment abordé ma question liminaire (et, pour être honnête, un peu rhétorique, parce que le but est surtout de me donner un prétexte pour raconter des choses) : les conlangs ont-elles un intérêt ? Un intérêt artistique pour la personne qui les construit (ou pour celles qui voudront les admirer), indiscutablement. Un intérêt pour la communication, c'est assez douteux parce que de toute façon, comme disais je ne sais plus qui, vous ne voulez pas de l'espéranto ? tant pis pour vous, vous aurez l'anglais (l'espéranto n'est pas ma langue préférée, mais comme langue de communication internationale, j'ai déjà signalé que l'anglais est pire) : aucune langue construite n'a la moindre chance de devenir une langue de communication internationale sérieuse, c'est peut-être dommage, mais c'est comme ça. Mais ont-elles un intérêt académique ? Méritent-elles d'être étudiées scientifiquement ?

La première chose que je dois signaler, évidemment, c'est qu'on peut les étudier comme des œuvres d'art (puisque j'ai déjà dit qu'un des buts possibles des conlangs est l'intérêt artistique) : sous l'angle de l'analyse textuelle ou littéraire ou ce qu'on voudra. Certainement on ne peut comprendre l'œuvre de Tolkien qu'en s'attachant notamment, comme partie essentielle de sa création, à comprendre le développement de ses langues elfiques, et de même qu'on peut chercher ses influences dans le récit (par exemple la métaphore christique), on peut chercher ses influences dans sa construction linguistique (par exemple son intérêt pour le finnois). Mais bon, comme j'ai dit plus haut que je le regrettais, il y a fort peu de grands artistes créateurs de conlangs « pour l'art », du moins si par grands on entend socialement reconnus (on est obligé de citer tout le temps Tolkien justement parce que c'est quasiment le seul qui soit vraiment connu).

La question est donc plutôt : les conlangs peuvent-elles nous apprendre quelque chose du point de vue linguistique ? À prime abord, la réponse semble devoir être négative : la linguistique s'intéresse au développement naturel des langues, ce qui exclut justement les conlangs. Comme je l'ai dit plus haut, on peut trouver ça aussi saugrenu que de proposer à un botaniste de s'intéresser aux fleurs en plastique.

Mais en fait, déjà cette réponse de rejet porte en elle les éléments d'une répartie : les fleurs en plastique peut-être pas, mais les fleurs dans l'art de façon plus générale peuvent tout à fait intéresser le botaniste (et pas seulement l'historien de l'art) comme témoignages des espèces présentes ou cultivées à un moment donné dans un endroit donné, et aussi faire l'objet d'études à cheval entre l'histoire, la biologie et la sociologie, sur la manière dont les fleurs étaient perçues et utilisées à diverses époques. Il me semble qu'il en va de même des conlangs, ou du moins, qu'il en irait de même des conlangs si on avait des exemples vieux de plusieurs siècles : ça nous apprendrait toutes sortes de choses sur la manière dont les gens percevaient la grammaire ou percevaient les langues autour d'eux. Bon, malheureusement, même si je n'ai pas de doute qu'il y avait autant de geeks qui inventaient des conlangs au Moyen-Âge ou à la Renaissance qu'à l'ère d'Internet, leurs créations ne nous sont pas vraiment parvenues (il y a bien la lingua ignota de Hildegarde de Bingen, et l'énochien de John Dee, mais ce n'est pas grand-chose, et même pour ça, la portée est plus mystique que linguistique).

☞ Un regard sur l'évolution des langues

Tout de même, on peut retenir l'idée générale que la linguistique ne s'intéresse pas seulement à l'évolution des langues naturelles mais de façon générale au rapport des humains avec leurs langues, et il me semble que l'acte de créer des conlangs d'une part fait intégralement partie de ce sujet d'étude (et le fait que la grande majorité des conlangs vienne d'anonymes dans leur grenier plutôt que d'artistes renommés rend peut-être la chose encore plus intéressante, parce que ce sont des gens plus typiques et plus nombreux), et que les processus mentaux qui poussent à la création d'une conlang sont les mêmes que ceux qui poussent à l'évolution d'une langue naturelle. Si le processus de création des conlangs a indiscutablement un intérêt sociologique (qu'est-ce qui pousse ces gens à construire des langues ? comment se structurent les communautés de conlangers et quelles sont leurs valeurs ?) et sociolinguistique (qu'est-ce que ces créations nous apprennent sur la manière dont les gens perçoivent, par exemple, la phonétique et la grammaire ?), je pense qu'il en a aussi un linguistique.

Essayons d'être un peu moins vague.

Pour quelle raison une langue artificielle peut-elle intéresser la linguistique ? D'abord parce que, comme je l'ai souligné plus haut, une langue artificielle ne reste pas artificielle : dès lors qu'il y a des locuteurs, fût-ce le seul créateur de la langue, elle va connaître un processus d'évolution « naturel », qui ne se déroule peut-être pas exactement dans les mêmes conditions que l'évolution des grandes langues naturelles, mais qui peut néanmoins nous renseigner sur lui. Il y a bien sûr des différences (j'ai signalé plus haut le plus faible poids des textes déjà écrits, mais on pourrait aussi mentionner la plus faible pression sociale), mais on peut spéculer sur le fait que ces conditions se rapprochent peut-être finalement des conditions d'évolution des toutes premières langues de l'Humanité (où il n'y avait pas beaucoup de textes déjà écrits !) et puissent nous éclairer sur elles. (Les conlangs seraient alors quelque chose de comparable aux tentatives de reconstruire de façon très limitée les conditions physiques du Big Bang.) En vérité, il me semble qu'on n'a aucune idée précise sur comment ni pourquoi les langues naturelles évoluent pour commencer (par exemple sur la part entre volontarisme et hasard), et regarder une conlang comme un micro-laboratoire de ce phénomène peut être intéressant. Il est vrai que les conlangs souffrent d'un problème grave pour la pertinence scientifique, c'est qu'elles n'ont essentiellement aucun locuteur natif monoglottes (et très peu de locuteurs natifs même polyglottes) : il n'est sans doute pas très éthique d'enseigner une conlang à un enfant pour voir comment ça l'influence ensuite (même si l'expérience a été faite pour le klingon), et encore moins éthique de ne lui apprendre que cette langue ; mais je rejette l'idée qu'une langue n'existe qu'à travers ses locuteurs natifs (et encore moins qu'à travers ses locuteurs natifs monoglottes).

☞ Ce que l'expérimentation peut nous apprendre

À la comparaison avec l'étude des fleurs en plastique par les botanistes on pourrait opposer celle de l'étude de diverses formes de vie artificielle par les biologistes (à toutes sortes de niveau : voir les différentes parties de cet article Wikipédia pour la distinction entre la vie artificielle simulée sur logiciel, simulée par matériel, ou carrément biochimique auquel cas on parle de biologie synthétique). La vie artificielle sert à tester des hypothèses sur les possibilités et l'évolution de la vie réelle, et il me semble que les conlangs peuvent jouer le même rôle vis-à-vis de la linguistique.

Mais je voudrais faire une autre comparaison, que je crois également pertinente ici : avec les langages de programmation informatiques. Les langages informatiques sont tous construits : ils naissent par l'autorité d'un individu ou d'un comité, et même s'ils peuvent évoluer ultérieurement selon les souhaits de la communauté qui les utilise, toute évolution est décidée ou, du moins, autorisée, par l'autorité qui contrôle le langage (soit à travers une norme soit à travers une implémentation dont il n'existe jamais plus qu'une petite poignée). Dans ces conditions, on pourrait se dire qu'il n'y a rien à apprendre de la conception des langages de programmation, qu'ils ne peuvent pas nous renseigner sur ce qui est, in fine, une discipline mathématique (la calculabilité, la complexité, le typage, la sémantique, etc.). Pourtant, dans les faits, c'est tout à fait faux : l'écriture de langages de programmation nous a appris énormément de choses sur les possibilités de l'espace des langages de programmation (qui n'étaient pas évidentes a priori), et aussi sur ce qui était une bonne idée en pratique (c'est-à-dire, notamment, gérable par l'esprit humain).

Je vois deux principaux axes d'« expérimentation linguistique » sur lesquels les conlangs peuvent nous éclairer : d'abord en éclairant l'espace des possibles, ensuite en permettant de tester combien telle ou telle possibilité est facile à manier (c'est-à-dire à apprendre ou à parler).

☞ L'exploration de l'espace des possibles

Qu'est-ce que je veux dire par l'espace des possibles ? Une des questions que peut poser la linguistique concerne l'existence et l'identification d'universaux linguistiques, c'est-à-dire de caractères communs à toutes les langues du monde (universaux éventuellement conditionnels, c'est-à-dire : si une langue a telle propriété alors elle a aussi telle autre) ; voir cette liste pour des exemples (je ne me prononce pas sur le fait qu'ils soient corrects). La question de la nature, ou même de l'existence, de ces universaux, est sans doute un peu polémique. Quoi qu'il en soit, on peut chercher à subdiviser la question par exemple de la façon suivante :

  • des caractères qui sont universaux car ils sont logiquement nécessaires (au sens où c'est tout simplement impossible de concevoir une langue qui ne les satisfait pas, au moins si elle doit permettre de communiquer), du coup évidemment on peut nier qu'il s'agisse de caractères tout court et vouloir les écarter de l'étude,
  • des caractères qui sont universels car ils sont nécessaires à rendre la langue utilisable pour des humains (pour qu'elle puisse être apprise, ou parlée, ou mémorisée, ou que sais-je),
  • des caractères qui sont universels car ils semblent tellement plus agréables, commodes ou « naturels » que toute langue qui ne les possède pas finit par évoluer pour les acquérir, ou se fait supplanter par une autre langue qui les possède,
  • des caractères qui sont universels par accident, simplement parce que chaque fois que le langage a été inventé il avait ces caractères, et il n'a pas évolué pour les perdre,
  • et évidemment, des caractères qui ne sont pas universels, mais qu'on prend pour tels à cause d'une mauvaise analyse ou de l'ignorance d'un ensemble extrêmement petit de langues qui les violent

(comme d'habitude, je ne prétends pas que ces catégories soient parfaitement étanches).

Il n'est pas toujours clair dans quelle catégorie se situe un universal, même si on tient pour acquis que ç'en est un.

Par exemple, j'avais soulevé la question suivante : y a-t-il des langues dans lesquelles l'espace des mots a des régions continues ? (On pourrait imaginer, par exemple, que le mot klik veuille dire bien et que le mot klak veuille dire mal, et qu'en modulant continûment la voyelle dans l'espace des voyelles entre [i] et [ɑ] on obtienne toute une gradation de sens entre bien et mal — et que plein de paires de mots opposés, voire de triplets se comportent de la sorte.) À ma connaissance, il n'y a aucune langue de la sorte (et plus généralement, les langues tendent à fabriquer des catégories discrètes et non continues — qu'ils s'agisse de phonèmes, de lexèmes ou de toutes sortes d'autres choses ; mais ce propos doit quand même être nuancé par le fait que, dans énormément de langues, l'intonation permet d'exprimer un spectre continu de nuances, vous voyez bien qu'il y a moyen de prononcer le mot vraiment d'un million de manières entre l'affirmation, l'interrogation, le doute, etc. ; et ça ne m'étonnerait pas, que, par exemple, en diverses langues des signes on puisse moduler le sens d'un mot par la manière dont on fait les signes ; reste quand même qu'il n'est pas possible, en français, de faire une nuance intermédiaire entre éviter et inviter ou entre plein et plan en utilisant un son intermédiaire entre les deux voyelles), ce qui soulève la question : pourquoi ? Manifestement il n'y pas d'impossibilité logique à ça. Est-ce parce que le cerveau humain aime les petites cases claires ? Que ce n'est pas une idée qui vient naturellement à l'esprit ? Que cela conduirait à trop de confusions dans des environnements où on n'entend pas bien ? (Mais noter que rien n'oblige à ce que le spectre continu se fasse en changeant seulement un son : on peut imaginer jouer sur la nasalisation plus ou moins forte de tout le mot. Et la variation de sens pourrait être une simple nuance, comme je l'ai évoqué : affirmation, interrogation, doute, etc.) C'est ici que la linguistique expérimentale peut prendre son sens : inventer une conlang qui cherche à avoir le plus possible de phénomènes continus, et essayer de l'apprendre, et voir l'impression subjective qu'on ressent en apprenant, parlant et écoutant cette langue, peut nous renseigner sur l'origine de cet universal (dans la mesure où ç'en est bien un).

Une autre question dans le genre : il me semble qu'il n'existe pas de langue mélangeant la parole et la gestuelle (i.e., il y a des langues orales, il y a des langues des signes, il y a peut-être des langues ou les gens ont plus ou moins tendance à accompagner la parole de mouvements de main, mais s'il y a des exemples de langues dans laquelle la parole et la gestuelle participent de façon à peu près égale et complémentaire, je n'en ai pas entendu parler). Ça ressemble à un accident historique, émanant peut-être d'une préférence pour la parole (parce que les langues des signes ne semblent exister que si la parole est impossible ou gênée), mais je trouve qu'il serait intéressant de connaître le ressenti provoqué par une langue où, par exemple, le lexique s'exprime avec des signes mais la grammaire avec des sons, ou bien le contraire.

Parfois même les contours de ce qui est logiquement possible ne sont pas clairs. (Et ça ne devrait pas nous surprendre : dans les langages informatiques, en créant des langages on découvre souvent qu'il est logiquement possible de faire quelque chose d'une certaine manière, par exemple un langage Turing-complet purement fonctionnel dans lequel toute expression s'évalue toujours de la même manière ce qui interdit les effets de bord : ce n'était pas évident que c'était possible, et pourtant le Haskell l'illustre.) Pourrait-on, par exemple, imaginer une langue humaine dans laquelle le concept de mot n'a aucun sens ? (Pas juste parce que la séparation des mots n'est pas claire, je veux dire, mais parce que les énoncés ne se découpent pas du tout selon un cadencement en « mots ».) Ça ne me semble pas évident (sauf à aller chercher des choses vraiment tarabiscotées, parce qu'évidemment on peut dire qu'on s'exprime en anglais, qu'on chiffre le tout par AES-CBC avec une clé qui dépend du jour où on parle, et qu'on le dit en binaire avec les syllabes pi et ka : manifestement cette langue n'a pas de concept de mot, ce qui montre que c'est logiquement possible si on a une conception assez large de ce que c'est qu'une langue, mais je me demande si on peut faire moins tarabiscoté, parce que ce que je viens de dire est plutôt un cryptosystème qu'une langue, et n'est clairement pas utilisable par des humains).

Bref, le fait de créer des conlangs permet de tester l'espace des possibilités linguistiques, et le fait de les apprendre permet de tester les contours de ce qui est humainement gérable, et, si on s'efforce d'utiliser les langues ainsi créées, nous apprend, à l'intérieur de ces contours, un peu sur le ressenti à parler une telle langue (est-ce commode ? se sent-on handicapé ?). Ceci peut donc éclairer le fait que les langues naturelles aient fait tel ou tel ensemble de choix (et peut-être nous apprendre des choses sur le fonctionnement des régions linguistiques du cerveau : il peut être intéressant de créer des conlangs aussi exotiques que possible et voir dans une IRM fonctionnelle si le fait de communiquer dedans stimule toujours les mêmes régions du cerveau).

Pour dire les choses autrement, si on trouve des universaux communs à toutes les langues naturelles mais qu'on arrive facilement à les violer avec des conlangs faciles à apprendre et commodes à manier, cela nous donne une perspective très différente que si on trouve des universaux communs à toutes les conlangs (au moins celles qui ont déjà été créées) en plus des langues naturelles.

(Évidemment, il est tentant de dire que les conlangs créées par des amateurs ne nous apprennent rien car elles ne font que refléter ce que leur auteur connaît des possibilités linguistiques, soit parce qu'elles sont présentes dans les langues qu'il maîtrise déjà, soit parce qu'il a lu Wikipédia. Mais, outre que l'évolution des langues naturelles doit aussi sans doute beaucoup à ce que des locuteurs connaissaient d'autres langues ou de phénomènes linguistiques, la question de quels phénomènes linguistiques les conlangers décident d'inclure dans leurs créations est au moins intéressante statistiquement, en ce qu'elle nous renseigne sur les phénomènes linguistiques qui sont a priori mentalement attirants, et c'est quelque chose qu'il est intéressant de comparer avec les statistiques sur les langues naturelles.)

À part les universaux, il y a aussi la question des valeurs extrêmes des paramètres : à quoi ressemble une langue maximalement concise ? maximalement logique ? maximalement précise ? etc. Bien sûr, ces paramètres portent une large part de subjectivité (mais je vais évoquer plus bas une expérience possible, au moins en théorie, sur la simplicité), mais ce n'est pas pour autant que ce n'est pas intéressant. Le toki pona, par exemple, me semble très intéressant en ce qu'il cherche à minimiser le nombre de mots/concepts tout en permettant quand même une vraie communication (enfin, apparemment — je n'ai pas testé de l'apprendre) : ce n'était pas évident a priori qu'on puisse faire une « vraie » langue avec 137 mots-concepts. (Ça me fait d'ailleurs penser au jeu Concept, très apprécié par certains de mes collègues — ils en ont un dans la salle de repos du département — qui consiste à essayer de faire deviner une expression, un mot ou une œuvre, en posant des pions sur les cases d'un tableau représentant des idées.)

☞ Sapir-Whorf

Une autre chose sur quoi les conlangs peuvent nous éclairer, si on veut bien faire l'effort de les apprendre, c'est tout ce qui tourne autour de l'hypothèse de Sapir-Whorf, qui affirme quelque chose comme le fait que la manière dont nous parlons conditionne la manière dont nous pensons. Bon, le problème avec hypothèse de Sapir-Whorf, c'est qu'elle est tellement floue (faut-il que je fasse de nouveau un lien vers ce billet ?) qu'elle est quelque part entre trivialement vraie et trivialement fausse selon la force de l'affirmation qu'on fait (que le langage influence au moins un petit peu nos pensées est évident, qu'il soit impossible de penser hors des cadres de notre langue est évidemment faux, la vérité est donc… quelque part entre les deux, quelle surprise), et qu'on n'a pas vraiment de moyen de quantifier. (J'ai envie de dire que la manière dont nous parlons de l'hypothèse de Sapir-Whorf conditionne la manière dont nous concevons l'hypothèse de Sapir-Whorf.) Mais même s'il n'est peut-être pas possible de quantifier la réponse, et même si je soupçonne plutôt que la réponse tendra à être négative, je trouve qu'il est intéressant de concevoir puis à apprendre des conlangs cherchant à représenter des types assez extrêmes (toki pona, lojban, ithkuil) et de se faire une idée, fût-ce subjectivement et non scientifiquement, de si cet apprentissage peut influencer notre façon de penser. (En gardant bien sûr à l'esprit qu'il y a une possibilité d'inversion de causalité : si les gens à la tournure d'esprit plus logique trouvent intéressant, amusant ou facile d'apprendre le lojban, cela va influencer sur ce qu'ils rapporteront.)

☞ Conclusion

Pour éviter de finir ce billet avec une conclusion parfaitement banale affirmant que oui les conlangs peuvent être intéressants pour <résumé rapide de tout ce qui a été dit plus haut>, je vais plutôt terminer sur une note plus légère en mentionnant le fait que je trouverais amusant de faire des jeux-concours de création de conlangs. On pourrait avoir des jugements esthétiques purement subjectifs (une sorte d'Eurovision des conlangs ?), mais on peut aussi imaginer des épreuves du style : votre conlang est enseignée (dans un temps limité !) à deux personnes ne parlant aucune langue commune (et vous ne saurez pas à l'avance les langues de ces deux personnes, pour ne pas tricher en rendant votre langue plus proche de ces deux langues-là), et ensuite l'une d'elles doit expliquer quelque chose à l'autre, et on posera des questions à l'autre sur ce qu'elle a compris. Votre but serait, donc, de concevoir une langue qui peut s'apprendre le plus rapidement possible et qui permet de communiquer le mieux possible à deux personnes qui n'ont pas d'autre langue commune que l'apprentissage limité de votre conlang. (L'idée est une sorte de développement du jeu Concept que j'évoque ci-dessus, et qui m'a amené à me demander et si on remplaçait la grille de Concept par l'obligation de faire deviner le concept mystère en parlant en toki pona, et-ce que les mots de cette langue suffiraient ? — ce qui peut effectivement faire un jeu intéressant.) Je peux imaginer toutes sortes de variations pour rendre le jeu soit plus ludique soit plus scientifique (bon, ce n'est pas évident de faire les deux à la fois, mais je ne l'exclus pas complètement). Il pourrait aussi y avoir des contraintes supplémentaires, par exemple votre conlang doit donner à la phrase Ángdir egúlkrist ajns turinâ solkúrbi damênus le sens Le jeune Angdir erre dans son palais de marbre (ou peut-être juste un sens quelconque).

(Bon, en fait, maintenant il faut que je révèle que tout ce billet n'était pas en français mais dans une conlang extrêmement subtilement construite pour que ce texte ayant l'apparence d'être un texte en français sur les conlangs soit en fait un article parlant de balades en forêt en Île-de-France, et d'ailleurs cette phrase-ci, dans la langue en question, vous dit que cette phrase-ci, si on l'interprète comme du français, fait semblant que tout le billet parlait d'autre chose.)

↑Entry #2751 [older| permalink|newer] / ↑Entrée #2751 [précédente| permalien|suivante] ↑

↓Entry #2750 [older| permalink|newer] / ↓Entrée #2750 [précédente| permalien|suivante] ↓

(vendredi)

Sur la préservation de l'information, et l'importance que j'y attache

Je voudrais dans ce billet dire quelque chose au sujet d'une question qui m'est très importante, disons même qu'elle fait partie de mes principes éthiques(?) les plus profonds, et à laquelle j'ai souvent fait allusion dans ce blog (tout récemment ici), mais que je n'ai, bizarrement, jamais vraiment abordée frontalement ici, sauf dans cette très vieille entrée que je trouve particulièrement mal écrite pour quelque chose d'aussi important à mes yeux (et où je ne cherche justement même pas à l'expliquer) : la préservation de l'information.

Sauf qu'à vrai dire je ne sais pas vraiment comment communiquer ce dont il est question, et encore moins pourquoi je trouve que c'est important. Les gens qui partagent mes préoccupations à ce sujet n'ont sans doute pas besoin d'autres explications, et les autres ne comprendront peut-être même pas de quoi je veux parler, encore moins pourquoi j'y accorde tant de poids. Surtout que les contours exacts de ce que je considère comme « information » nécessitant d'être préservée ne sont pas toujours très clairs ni, à vrai dire, très logique.

Et il faut reconnaître que c'est une question qu'on peut considérer comme presque religieuse (pas au sens où elle implique un principe transcendant, mais au sens d'une considération éthique que je ne sais pas vraiment justifier autrement que c'est comme ça) : et de fait, il y a des gens facétieux qui ont fondé l'église missionnaire du kopimisme (officiellement déclarée comme religion en Suède) qui doit plus ou moins correspondre aux principes que j'évoque ici, à ceci près que le kopimisme semble plus mettre l'accent sur la dissémination de l'information (le but étant, en fait, de défendre le peer-to-peer) que sur sa préservation ; mais bon, close enough, la pérennité et la disponibilité de l'information sont toutes les deux importantes à mes yeux : on va donc dire qu'on peut me considérer comme sympathisant de cette religion.

Pour essayer d'expliquer quand même de quoi il est question, je pense qu'il vaut mieux partir d'un terrain d'entente que je crois largement partagé, à travers l'observation suivante : la destruction d'une œuvre d'art comme la Joconde ou l'église Notre-Dame de Paris (cf. mes réflexions passées ici sur cette dernière) serait une perte irremplaçable pour l'Humanité. Pour une œuvre éminemment matérielle comme la Joconde, le fait d'avoir des copies (notamment des photos numériques haute résolution) ne remplacera jamais l'original, néanmoins, je pense que beaucoup de gens conviendront que ce serait déjà un moindre mal, si l'original de la Joconde devait disparaître, que d'en avoir un scan en résolution 100 000 × 100 000 avec informations de relief et 12 canaux de couleur allant de l'infrarouge à l'ultraviolet (je ne sais pas si un tel scan existe, soit dit en passant, mais si des conservateurs du musée du Louvre me lisent, vous êtes invités à créer et partager le fichier de 600Go que je viens de décrire dans cette phrase 😉 [#]).

[#] Malgré le smiley, ma remarque est sérieuse, et fait tout à fait partie du sujet de cette entrée : je pense que cela fait partie des missions d'un musée de préserver non seulement l'original des objets de leurs collections, mais aussi des scans numériques d'extrêmement haute qualité (aussi élevée que la technologie moderne le permet, et le fichier de 600Go que j'évoque pour la Joconde ne me semble pas déraisonnable, même si évidemment des versions plus petites ont un sens aussi), et en 3D quand c'est pertinent, pour qu'en cas d'accident il subsiste au moins quelque chose. Voir notamment ce tweet, avec lequel je suis complètement d'accord, qui appelle précisément à ça à la suite de l'incendie du Musée national du Brésil le où on s'est retrouvé à lancer un appel public à rassembler toutes les photos qui pouvaient exister de ses collections irrémédiablement détruites : le musée aurait pu, et aurait dû, faire de telles photos avant. Et l'intérêt de ces reproductions numériques de très haute qualité, outre la préservation qu'elles permettent, c'est aussi qu'on peut les diffuser (au moins tant que les avanies de la « propriété intellectuelle » ne s'y opposent pas) publiquement, et, par exemple, offrir des visites virtuelles à des gens qui n'ont pas les moyens de venir sur place. Or pour l'instant, tout ça ne semble exister que de façon embryonnaire. (Existe-t-il, par exemple, des données 3D haute résolution de l'intérieur du château de Versailles ?)

Une copie virtuelle de la Joconde est un pauvre remplacement de l'original, donc. Mais s'agissant d'un livre, je pense qu'on comprend déjà mieux qu'on accorde plus d'importance à l'information contenue dans le livre par rapport à l'objet original : il y a quantités d'œuvres de la littérature antique que nous avons complètement perdues, c'est-à-dire qu'il n'en subsiste aucune copie, et je pense qu'il est assez largement admis que c'est une bien plus grande perte que la quantité d'œuvres dont nous avons une copie mais plus l'original. (J'espère que je m'exprime clairement : disons qu'entre redécouvrir une copie d'une œuvre majeure X qu'on a crue complètement perdue et redécouvrir l'original d'une œuvre Y d'importance comparable dont on avait déjà des copies mais pas l'original, je pense qu'il est assez généralement admis que le premier est préférable quand il s'agit de littérature, car l'œuvre est plutôt le texte du livre — i.e., l'information — que l'objet original lui-même.)

Bref, la tragédie dans le fait que la grande bibliothèque d'Alexandrie a brûlé (événement plutôt symbolique : il n'y a pas forcément eu un événement précis, et pas forcément un incendie, mais ce que je veux dire c'est qu'on a perdu l'essentiel de son contenu), c'est la perte de l'information qu'elle contenait, le texte des rouleaux qui s'y trouvaient, pas tellement les rouleaux eux-mêmes.

À partir de l'invention de l'imprimerie à caractère mobile, et au moins pendant les périodes où on utilisait un papier et une encre qui ne se détruisent pas, on a eu un outil pour préserver beaucoup d'information assez efficacement : le livre imprimé. Le fait d'avoir plein de copies de la même chose permettait d'augmenter les chances qu'au moins une copie subsiste pendant longtemps.

Mais avec ce qu'il est convenu d'appeler la société de l'information, nous produisons des quantités énormes d'information sous forme numérique, mais en même temps nous sommes face à une sorte d'amnésie car nous perdons aussi des quantités hallucinante d'information. Ou même si elle n'est pas complètement perdue, elle est parfois rendue inaccessible ou indisponible de diverses manières. Car souvent il n'y en a qu'une seule « vraie » copie (non-transitoire).

On peut légitimement se demander, en supposant que l'humanité existe encore et a encore une technologie raisonnable dans quelques siècles (et, quand même, je l'espère) ce qu'il restera du XXIe siècle dans ses archives. Si la société de l'information est autant la société de l'amnésie, j'ai peur que la réponse soit pas grand-chose.

Il y a toutes sortes de raisons à ça. Des raisons techniques, d'abord : à bas niveau, les supports d'information numériques (disques durs, disques/mémoires SSD, disques optiques) contiennent certes énormément plus de capacité de stockage que les livres, mais ils sont beaucoup moins pérennes dans le temps ; à plus haut niveau, si on veut stocker des informations sur le cloud (c'est-à-dire distribuées chez un hébergeur) ou les rendre disponibles sur le Web, il faut payer, et payer en permanence, d'où il résulte que quand une compagnie fait faillite, quand un individu décède, etc., des quantités énormes d'information ont tendance à disparaître avec.

Des raisons légales, aussi : le régime détestable de la propriété intellectuelle[#2] fait que préserver l'information est juridiquement dangereux. Il y a énormément de livres dits « orphelins », c'est-à-dire qu'ils sont probablement soumis à un droit d'auteur, mais c'est difficile à savoir parce que l'éditeur a peut-être disparu, l'auteur est incontactable ou mort (et les droits continuent néanmoins à valoir pendant une durée parfaitement déraisonnable à partir de sa mort), et du coup il est impossible légalement de numériser l'œuvre pour sa préservation, ou au moins, si on le fait, on ne peut pas la rendre disponible en ligne parce que même si la plupart des auteurs en seraient sans doute heureux, le risque que quelques uns objectent rend l'entreprise trop périlleuse (et/ou économiquement peu rentable). De là résulte un vaste trou noir entre les œuvres suffisamment anciennes pour qu'on soit sûr qu'elles sont dans le Domaine public et les œuvres suffisamment récentes pour que les auteurs se soient occupés de leur disponibilité en ligne. Google a scanné des millions de livres de ce trou noir, mais ils ne peuvent pas les rendre disponibles en ligne pour les raisons légales que je viens de dire (parfois ils montrent quelques brefs passages dans Google Books, et déjà ils prennent un risque). L'Internet Archive a récemment perdu un procès contre des éditeurs rapaces parce qu'ils (l'Archive) proposaient des « prêts » de livres en ligne aux internautes, et cette décision judiciaire est une perte spectaculaire de l'information disponible à l'Humanité (je vais reparler de l'Internet Archive ci-dessous). Pas clair que ces archives de livres qu'on ne peut pas partager pour des raisons juridiques existent encore longtemps : et même dans la mesure où elles existent, elles n'ont qu'un intérêt limité.

[#2] Je déteste le terme de propriété intellectuelle, qui est une forme de propagande : en utilisant ce terme on essaie de faire passer pour évident alors que ce ne l'est pas que la protection des auteurs d'œuvres de l'esprit (que je ne mets pas en doute) doit être assimilée à une forme de propriété, ce qui sous-entend des droits exclusifs forts et inaliénables. Je préfère le terme de paternité créative : pour moi l'auteur a des droits sur son œuvre un peu comme un parent sur ses enfants : indéniablement il a une certaine légitimité à prendre des décisions à son sujet, mais cette légitimité n'est pas un pouvoir absolu, n'est pas illimité dans le temps, et ne devrait pas faire oublier que l'œuvre elle-même (ou le grand public à la voir) a des droits aussi. Notamment, je considère que l'auteur devrait certes avoir un droit d'abandon ou de répudiation de l'œuvre (c'est-à-dire le droit d'en détacher son nom ou de renier tout rapport avec elle), mais pas celui de la faire disparaître une fois qu'elle a été publiée (pas plus qu'un parent n'a le droit d'euthanasier son enfant après la naissance de ce dernier : au mieux il peut l'abandonner).

Et puis il y a une raison sociale (si j'ose dire) toute bête : le peu d'importance que nous accordons aux informations en ligne et à la question de leur préservation. Comme si ce qui n'est pas imprimé sous forme de livre n'était pas important. Comme si le Web n'était qu'un support frivole et sans importance par rapport au vrai Verbe, le Verbe imprimé.

Situation typique : une organisation crée un site web, il y a des informations utiles dessus ; puis quelqu'un décide de « refaire » le site web (avec un outil différent, avec un look différent, avec une structure différente, peu importe) : idéalement, toutes les pages de l'ancien site web devraient être soit préservées à l'identique, soit transformées en redirections vers le même contenu, ou un contenu équivalent, dans le nouveau site web. Évidemment, dans la vraie vie, il n'y a rien de tel. Au mieux, les liens cassent, au pire (et, en fait, le plus souvent), les informations disparaissent vraiment.

Prenez n'importe quel billet un peu ancien de ce blog, et suivez les liens (j'en mets beaucoup) : comptez la proportion qui sont cassés. En-dehors de ceux qui pointent vers Wikipédia, la proportion est alarmante. (Parfois je repasse derrière pour les remplacer par des liens vers The Internet Archive, mais ce n'est pas toujours possible, et de toute façon je n'ai pas l'énergie de revisiter régulièrement tout mon blog à la recherche des liens cassés.) Maintenant je fais l'effort de mettre des attributs title sur beaucoup de mes liens (qui s'affichent quand on passe la souris dessus), au moins si l'URL n'est pas évidente, pour essayer d'enregistrer au moins le titre de la page pointée ; et je demande généralement à The Internet Archive de suivre les liens depuis mes billets de blog.

Souvent quand j'évoque le problème de la préservation de l'information en ligne, on me fait une réponse de ce style : oui, certes, il y a des contenus importants qu'il faut préserver, mais la grande majorité des contenus ne le sont pas, et ce n'est pas grave s'ils disparaissent. En bref, préserver la Joconde, oui, préserver le moindre graffiti, non. Par exemple, si j'évoque la question de la pérennité des messages sur Twitter, les gens haussent les épaules en disant que l'écrasante majorité des tweets n'a aucun intérêt : voyez cette discussion pour un exemple de dialogue de sourds où je n'arrive pas à faire comprendre l'enjeu à la personne avec qui je parle.

Ma réponse à ça est la suivante : oui, sans doute, 99% des informations contenues en ligne n'a aucun intérêt à préserver. Le problème c'est que c'est impossible de faire le tri : on ne sait pas bien à l'avance quelle information aura de l'intérêt ultérieurement, et même si on le savait, on n'a ni l'envie ni les moyens de prendre le temps pour trier les choses entre « à sauvegarder » et « à ne pas sauvegarder » ; or si on ne peut pas faire le tri correctement, il faut choisir l'option la plus conservatrice (c'est-à-dire celle du moindre regret) : sauvegarder tout ce qui raisonnablement peut l'être.

Pour dire les choses autrement : oui, bien sûr, un tweet isolé n'a pas la valeur de la Joconde ; mais les milliards et les milliards de tweets rassemblés, ils forment un témoignage important d'un certain bout de l'existence humaine, et il est important de les préserver, à la fois pour les références internes (regardez le nombre de fois que j'ai référencé Twitter dans ce blog) et pour la mémoire des générations suivantes ou des historiens du futur, qui voudront peut-être savoir ce que ça faisait de vivre à travers la pandémie de 2020 ou comprendre le Zeitgeist de cette époque. Je prends l'exemple de Twitter parce qu'il est menacé par les excentricités erratiques de son nouveau propriétaire, mais la même chose vaut pour n'importe quel autre site, y compris ceux qui ont malheureusement déjà disparu sans laisser beaucoup de traces (Google Plus, par exemple, qui n'existe plus que comme des cicatrices sous forme de liens cassés).

(Et puis bon, par ailleurs, les contenus numériques ne se résument pas au web. On continue d'imprimer des livres papier, heureusement, mais je suppose qu'il y a des choses qui n'existent que sous forme de eBook, et ces choses-là, à cause de la manière dont elles sont « protégées » contre la copie pour des raisons de, surprise, propriété intellectuelle, elles disparaissent quand disparaît la société qui les vendait. Idem pour les films et les séries et les choses comme ça qui fleurissent sur les plateformes de streaming comme Netflix, Amazon truc et Apple bidule : quand ces compagnies feront faillite, les gens qui avaient des abonnements perdront leur accès aux contenus en question et il ne restera plus rien sur leurs ordinateurs : qui assure la sauvegarde pérenne de toutes ces créations ?)

Alors il y a quand même une arme contre l'amnésie, un héros de la préservation de l'information, c'est l'Internet Archive. L'Internet Archive est une bibliothèque numérique (financée par un mélange de dons, de mécénat et de différentes sources d'argent public) ayant pour mission de préserver et de rendre accessible toutes sortes de contenus numériques : livres et magazines numérisés, vidéos, musiques, jeux vidéos… mais aussi des sites web. Leur domaine d'action est malheureusement limité notamment pour des raisons légales (cf. ce que j'ai dit plus haut, notamment le fait qu'ils ont perdu un procès qui nous prive de beaucoup d'informations qu'ils avaient collectées et menace peut-être leur existence), ils ne peuvent par exemple pas sauvegarder les séries en streaming, et j'ai toujours peur qu'une action légale les fasse disparaître pour de bon. Mais pour l'instant ils existent, et ils font ce qu'ils peuvent.

Selon moi, l'internet Archive mérite d'être connue et reconnue comme un musée d'une valeur inestimable pour la mémoire de l'Humanité. (Et j'encourage tous mes lecteurs à penser à eux si vous faites des dons à des organisations caritatives.)

Et notamment, l'Internet Archive essaie de préserver une partie de la mémoire du Web. Ça ne peut être que très partiel, évidemment, mais c'est déjà ça. Le mode d'emploi est très simple : vous allez sur web.archive.org et vous tapez dans le formulaire l'adresse (URL) du site dont vous voulez consulter l'archive, par exemple ici pour ce blog, et ça va vous mener vers un graphique et un calendrier montrant les dates où la page a été sauvegardée dans son état d'alors, et on peut cliquer sur un des jours pour voir la version sauvegardée. Par exemple, voici une copie de la page d'accueil de mon blog il y a dix ans (bon, là il n'a pas changé des masses), et voici une copie de ma page web (home page comme on disait alors) en 1997, peut-être pas très intéressante mais qui représente pour moi personnellement un document historique précieux.

Inversement, pour demander la sauvegarde d'un contenu dans l'Internet Archive, on va sur web.archive.org/save et on tape l'adresse à sauvegarder (pas besoin d'être webmaster du site ou quoi que ce soit, vous pouvez demander de sauver n'importe quelle page web dès lors qu'elle est publiquement accessible). Si on a un compte sur l'Archive (c'est gratuit et ils ne spamment pas) on peut choisir par exemple de sauver aussi les liens sortants (il y a évidemment des limites sur le nombre de pages qu'on peut demander de sauver par jour), de sauver une capture d'écran, et des choses de ce genre.

L'Internet Archive n'est pas parfaite : elle ne peut pas tout sauvegarder (certains sites lui interdisent l'accès par exemple en protégeant l'accès par une forme de login, et même si ce n'est pas le cas, elle n'a pas la bande passante pour sauvegarder, par exemple, tout Twitter), et j'ai toujours peur qu'elle disparaisse (soit pour des raisons légales, cf. ci-dessus, soit par manque de sous, soit à cause d'un problème matériel comme un incendie[#3], ce qui serait une perte irréparable). Mais bon, c'est déjà ça.

[#3] Quis custodiet ipsos custodes? Qui sauvegardera les sauvegardes ? Il existe, si je comprends bien, essentiellement deux autres copies de l'Internet Archive. Malheureusement, comme le faisait remarquer un ami, les emplacements de ces copies n'inspirent pas forcément la plus grande confiance dans la stabilité des données : car la copie d'origine est sur la faille de San Andreas, une autre est en Hollande au-dessous du niveau de la mer, et une troisième est littéralement à la Grande Bibliothèque d'Alexandrie, une institution qui n'a pas le meilleur track record pour la sauvegarde pérenne des informations.

Bien sûr il y a plein d'autres formes de données publiques que les formats papiers (livres, journaux, documents d'archives) et le web. J'étais par exemple tombé sur ce mini-documentaire sur les archives audiovisuelles de l'INA (i.e., de la télé française), à la fois sous l'angle technique (quelle forme matérielle elles prennent) et sous l'angle du contenu (qu'est-ce qui est sauvegardé ? — ben, « tout »), et c'est très intéressant, je le recommande. C'est aussi rassurant à mes yeux que des gens se soient penchés un peu sérieusement sur la question de préserver l'information de la télé, mais cela rend d'autant plus criant le manque d'attention porté au Web (par exemple pourquoi la France ne finance-t-elle pas ses propres efforts pour sauver le Web, au moins le Web francophone ? ne serait-ce qu'en ayant son propre miroir de l'Internet Archive ? que fait-on pour la sauvegarde des eBooks et des films et séries en streaming, au moins les œuvres francophones ?).

Et bien sûr, à côté des données publiques il y a les données privées et tout le spectre entre les deux (pensez, par exemple, à un forum de discussion interne à un groupe de copains, à une école, ou un réseau social dont l'accès se fait par invitation : qui préserve ces données-là ?). Là c'est encore plus compliqué parce qu'il faut concilier l'impératif de protection du secret ou de la privauté avec la recherche de la pérennité (je ne veux pas que mes données disparaissent, mais je ne veux pas non plus les mettre sur l'Internet Archive) ; peut-être en plus avec une volonté de libération publique à une date lointaine dans le futur (il y a des règles de ce genre pour les archives).

Concernant ces données privées je pense aussi que la plupart des gens comprendront un peu mieux mes préoccupations : même ceux qui ne partagent pas mon attachement à sauvegarder des archives du Web ont tendance à vouloir au moins garder leurs propres photos, par exemple, ou l'historique de leurs SMS et MMS ou quelque chose de ce genre. L'existence de services proposant de sauvegarder de vieilles diapos ou films amateurs sous formats numériques semble suggérer que la valeur des souvenirs est quelque chose de quand même assez répandu.

Personnellement, non seulement je tiens un journal depuis 2001 de ce que je fais au jour le jour (ce qui est une façon de sauvegarder les informations de mon quotidien) mais j'enregistre aussi plein d'informations comme des traces GPS de mes principaux déplacements (balades à pied, à moto, en voiture…). Je tiens aussi les comptes de mes sous depuis 2006. Tout ça représente des informations personnelles auxquelles je tiens beaucoup et dont je veux assurer la pérennité au moins de mon vivant. À mes yeux cela relève de la même logique, dans la sphère privée, que mon attachement à la préservation des informations publiques.

(Certains trouvent que je suis un peu cinglé de conserver tout ça. Une trace GPS de toutes mes balades, par exemple, quel intérêt ? Ben ça me permet de faire le point sur tous les endroits où je suis allé, et de chercher des endroits que je n'ai pas encore vus, par exemple. Et j'ai déjà évoqué ici l'intérêt de tout photographier[#4] — conseil que je ne suis d'ailleurs moi-même pas autant que je devrais. Mais en fait le point important est surtout celui-ci : pour les données personnelles comme pour les données publiques, le tri entre ce qui est intéressant et ce qui ne l'est pas est difficile, surtout a priori, et c'est pour ça qu'il vaut mieux, dans le doute, tout sauvegarder, surtout que ça représente des volumes peu importants dès qu'il ne s'agit pas de vidéos.)

[#4] J'y mentionne les jeunes parents qui prennent des quantités invraisemblables de photos de leur bébé (qu'ils ne regarderont évidemment jamais ensuite, ou qu'ils montreront à des amis que ça emmerdera profondément). Je pense que le phénomène psychologique sous-jacent a un rapport avec mon obsession pour la préservation de l'information, à ceci près que la mienne ne s'attache pas à un objet particulier (le bébé) mais à toute une catégorie de choses qu'on peut mémoriser.

Malheureusement, sauvegarder tout ça à la fois est devenu terriblement difficile, pas tant pour des questions de volume que de diversité. Je ne veux pas trop me laisser entraîner à digresser sur les questions des formats de données et des backups et de la merde que sont les smartphones, mais disons qu'alors qu'autrefois faire un backup consistait simplement à faire une copie de tous les fichiers de son ordinateur sur un support externe, maintenant on génère des données qui sont hébergées chez plein de trucs externes, et c'est devenu très compliqué de les rassembler pour les sauvegarder. Le smartphone, par exemple, est une calamité : Android est une sale merde qui n'est même pas capable de faire un bête backup correct au sens qui devrait être simple copier toutes les données du téléphone (de toutes les applications[#5]) dans une archive sur l'ordinateur que je puisse restaurer ensuite à ma convenance, partiellement ou totalement, et c'est complètement scandaleux. Et il en va de même des données qu'on a chez plein d'hébergeurs (les courriers chez Gmail, les messages qu'on a écrits sur les réseaux sociaux, etc.) : bien sûr on peut se dire ah ben c'est Google qui assure la sauvegarde de Gmail, c'est rassurant et certainement Google est meilleur que l'individu lambda pour faire des sauvegardes, mais Google pourrait décider un jour de fermer l'accès à Gmail (au moins dans certains pays, par exemple en représailles contre une loi qui les emmerderait), et il me semble qu'on peut vouloir avoir une copie de ses données chez soi contre une telle éventualité. Heureusement, le RGPD européen est censé garantir qu'on peut récupérer les données nous concernant auprès de Google, Facebook, Twitter, etc. (certains ont fait des efforts honnêtes pour fournir une archive vraiment utilisable, d'autres… moins), mais bon, ça reste un boulot fou de récupérer tout ça périodiquement et le sauvegarder. (Pour Twitter, j'ai un processus compliqué pour récupérer mes tweets[#6], je me vois mal multiplier ça à l'infini.)

[#5] J'y pense parce que mon poussinet a récemment changé de téléphone (Android) et que ça a été une galère pour récupérer les données de l'ancien téléphone. WhatsApp, notamment, ne vous rend vraiment pas la vie facile pour extraire les conversations qu'on a tenues dans l'application. (Une raison de plus pour moi de ne jamais utiliser WhatsApp, mais il y a quantité d'applications Android qui ont des données qui m'intéressent et qui ne sont pas évidentes à extraire de leurs griffes.)

[#6] Mis en place pour pouvoir continuer à maintenir cette archive de mes tweets même quand Elon Musk me coupera l'accès à API qu'il a annoncé qu'il couperait… et qu'il est même censé m'avoir déjà coupé, mais inexplicablement, pour l'instant mon script Perl utilisant l'API auquel je suis censé ne pas avoir accès continue à fonctionner.

(Bon, la situation pénible des smartphones actuels est toujours mieux, je suppose, que les vieux téléphones à clapet qui emportaient tous les SMS stockés dessus quand ils mouraient. J'aimerais bien pouvoir remettre la main sur tous les messages que j'ai échangés entre 2001 et 2009, par exemple, mais même si les téléphones en question ne sont pas perdus ou morts, il est probablement impossible d'en extraire une archive de données.)

Et puis il y a la question de savoir sauvegarder. Le stockage dans le cloud est compliqué à mettre en œuvre et il est très cher (il faut payer tout le temps, dès qu'on cesse de payer les données disparaissent : autant dire que ce n'est pas très pérenne) et pas forcément chiffré de bout en bout (c'est-à-dire illisible par l'hébergeur). Le stockage sur disques optiques est devenu ridiculement petit par rapport aux quantités de données qu'on a à sauvegarder. Le stockage sur disques durs n'est pas très robuste. Je ne suis vraiment pas content des options. Mais bon, là aussi, je ne veux pas trop élargir le sujet de ce billet, qui est déjà assez vaste.

Pour finir plutôt sur des considérations plus philosophiques (pour ne pas dire complètement oiseuses), j'ai tendance à dire que l'importance donnée à l'information est une forme moderne, un peu scientifique (ou au moins parée d'atours scientifiques) du bon vieux dualisme cartésien : je ne crois pas à l'existence d'une âme, mais je crois que ça a un sens de distinguer les atomes composant mon corps et l'information sur la manière dont ces atomes sont arrangés (ou les neurones composant mon cerveau versus l'information encodant l'arrangement de ces neurones), et que c'est plutôt cette dernière qui contient l'essence de ce qu'est David Madore. L'information est encodée sous forme matérielle parce qu'il n'y a pas d'autre façon de stocker de l'information dans cet univers que sous forme matérielle, mais c'est l'information qui est vraiment importante, pas son support.

Je ne vais pas ressortir mon rant habituel concernant la vie et la mort et le fait que nous pourrions être immortels sans magie technologique, mais disons simplement que ce qui me désole quand je perds un être cher (comme mon papa il y a quelques années), c'est la perte du référent de tous ces souvenirs communs, ces informations partagées qui formaient notre lien social, et qui semblent tout d'un coup comme des pointeurs sans référence, des informations encore présentes mais qui rappellent surtout un grand vide, un peu comme un lien cassé sur le web ; garder des photos des gens qui peuvent disparaître, des traces de leurs paroles, des souvenirs de leurs actions, c'est une façon (peut-être futile mais le mieux qu'on puisse faire) de combler un peu ce vide.

La préservation de l'information est une petite victoire contre la mort, qui est l'autre nom de l'oubli.

Voilà : je crois que l'information est grande et que Claude Shannon est son prophète.

↑Entry #2750 [older| permalink|newer] / ↑Entrée #2750 [précédente| permalien|suivante] ↑

↓Entry #2749 [older| permalink|newer] / ↓Entrée #2749 [précédente| permalien|suivante] ↓

(mardi)

Nouvelle clé PGP (0xBE8D3426C06FFAE6)

Cette entrée est de nature essentiellement technique, pour annoncer que je me suis généré une nouvelle clé PGP. Mais j'en profite quand même pour expliquer au grand public de quoi il s'agit sous forme de vulgarisation rapide concernant la cryptographie à clé publique :

Explications sommaires pour les gens ne connaissant rien à la crypto :

PGP (Pretty Good Privacy) est son implémentation GPG (GNU Privacy Guard) est un standard de cryptographie à clé publique (ou asymétrique).

De quoi s'agit-il ? La forme la plus simple de la cryptographie est la cryptographie symétrique (=à clé secrète partagée). En cryptographie symétrique, si Alice veut envoyer un message secret à Bob, Alice et Bob doivent partager une clé secrète et connue d'eux seuls, servant à la fois au chiffrement et au déchiffrement.

(Cette clé prend la forme d'une assez longue chaîne binaire, typiquement quelque chose comme 256 bits, ou, ce qui revient au même, 64 chiffres hexadécimaux, c'est-à-dire quelque chose comme e3b0c44298fc1c149afbf4c8996fb92427ae41e4649b934ca495991b7852b855, qui doit impérativement avoir été tirée aléatoirement (ou pseudo-aléatoirement de façon cryptographiquement correcte) pour que la sécurité soit correcte — ce n'est pas du tout le cas de celle que je viens de donner —, et c'est elle qui est fournie aux algorithmes de chiffrement et de déchiffrement qui font le travail proprement dit. En fait, normalement l'utilisateur ne la voit jamais vraiment, Alice et Bob vont typiquement avoir uniquement affaire à une passphrase servant à générer ou à déverrouiller la clé selon les circonstances, et qui, elle, est quelque chose de mémorisable par un humain, comme un mot de passe assez long ou une suite de mots formant une phrase suffisamment longue pour assurer le niveau de sécurité voulu. Peu importent ces détails, ce que je cherche avant tout à dire est qu'en cryptographie symétrique, le secret — passphrase ou clé — doit être partagé à l'avance par les personnes qui souhaitent communiquer.)

Au contraire, en cryptographe à clé publique, Bob a deux clés, une clé publique connue de « tout le monde » et une clé privée ou secrète connue de lui seul. Si Alice veut envoyer un message chiffré à Bob, elle le chiffre avec la clé publique de Bob, ce qui produit un message que Bob seul est capable de déchiffrer avec sa clé privée. Et inversement, la cryptographie à clé publique permet aussi de faire de la signature, c'est-à-dire qu'Alice peut, en utilisant sa clé privée, produire un message n'ayant rien de secret dont tout le monde pourra vérifier, au moyen de la clé publique d'Alice, qu'elle en est bien l'émettrice. (Et bien sûr on peut combiner les deux : Alice peut envoyer à Bob un message chiffré par la clé publique de Bob et signé par la clé privée d'Alice, dont Bob pourra, avec sa clé privée à lui et la clé publique d'Alice, lire le contenu et vérifier que c'est bien Alice l'expéditrice.)

(Bon, tout ça est immensément simplifié et outre qu'il existe toutes sortes d'algorithmes différents, je passe énormément de subtilités sous silence. Je n'ai notamment pas expliqué que, pour des raisons essentiellement d'efficacité, la cryptographie à clé publique est utilisée pour chiffrer non pas le message lui-même mais une clé de session qui est elle-même utilisée pour chiffrer le message avec un algorithme de cryptographie symétrique ; et pareil, en signature, on ne signe pas le message lui-même mais une empreinte calculée par une fonction de hachage. J'aurais aussi peut-être dû mentionner le petit miracle de la cryptographe à clé publique qu'est le protocole de Diffie-Hellman qui permet à Alice et Bob de communiquer de façon sécurisée même sans partager de clé à l'avance et même si toutes leurs communications sont espionnées par une tierce personne malveillante ! et ce, sous la seule hypothèse que cette personne (Ève) ne peut qu'écouter et pas modifier les communications au passage, et pas, notamment, se faire passer pour Alice auprès de Bob et pour Bob auprès d'Alice. Je devrais peut-être au moins dire que la cryptographie à clé publique sert absolument partout : dès que vous vous connectez à un site web en https, c'est-à-dire l'immense majorité des sites web de nos jours, celui-ci faisant de la résistance, la connexion est sécurisée par de la cryptographie à clé publique — mais sous un standard qui diffère de PGP dont je parle dans ce billet — essentiellement au moyen d'une clé publique du site web contacté, et qui est elle-même signée par des autorités censément de confiance sous forme d'un certificat ; mais là non plus, je ne veux certainement pas entrer dans les détails.)

L'avantage immense de la cryptographie à clé publique par rapport à la cryptographe symétrique est qu'on simplifie immensément le problème de la distribution des clés : on n'a pas besoin de créer, et de trouver comment partager de façon sûre, une clé secrète différente pour chaque paire de participants qui peut avoir envie de communiquer (une pour Alice et Bob, une pour Alice et Charlie, une pour Alice et David, une pour Bob et Charlie, une pour, etc.), mais seulement deux clés par participants, dont l'une n'a pas besoin d'être communiquée du tout (elle est privée et reste secrète) et l'autre n'a pas besoin d'être communiquée de façon secrète puisqu'elle est, justement, publique. Évidemment, il y a un prix à payer, notamment en termes de longueur des clés, de coût computationnel des opérations, mais je ne rentre pas là-dedans ; par contre il y a une question cruciale qui reste en suspens, c'est la question de l'identité (ou plutôt, de la confiance en l'identité) :

Si Alice veut envoyer un message secret à Bob (ou reçoit un message signé par Bob), elle va utiliser la clé publique de Bob, mais comment est-elle sûre que la clé publique qu'elle croit être celle de Bob est vraiment celle de Bob ?

Par exemple, si Bob est l'auteur d'un logiciel très célèbre (pensez, par exemple, au noyau Linux), et qu'Alice veut utiliser ce logiciel et être sûre qu'il s'agit bien du bon logiciel et pas d'une version malicieuse écrite par une personne malveillante se faisant passer pour Bob, il est utile que Bob signe le logiciel au moment de le mettre en ligne, et Alice pourra vérifier la signature et avoir confiance dans ce qu'elle utilise. Mais qu'est-ce qui assure que la signature vient bien de Bob et pas d'une personne malicieuse ? Il faut avoir confiance en la clé servant à la signature. Or ceci ne fait que repousser le problème (à ceci près qu'une clé est quelque chose de plus léger à contrôler, et change moins souvent, qu'un logiciel énorme dont il y a une nouvelle version tous les quelques jours).

Évidemment, si Alice a rencontré Bob en personne et que Bob lui a donné cette clé en main propre, Alice peut être sûre que c'est la bonne clé. Mais si Alice reçoit un mail de Bob, ou voit passer un billet sur le blog de Bob qui dit coucou, je suis Bob et ceci est ma clé publique, comment peut-elle avoir confiance dans le fait que ce message est bien de Bob et pas de quelqu'un qui cherche à se faire passer pour Bob (dans le but de signer des documents en son nom ou de recevoir des messages chiffrés à son intention) ? La signature électronique est justement l'outil qui permet d'authentifier ce genre de messages, mais pour identifier un message censé émaner de Bob qui dit ceci est ma clé publique, il faut la clé publique de Bob, donc le problème est circulaire.

Une façon de résoudre ce problème de l'identité est que Bob accompagne sa clé publique d'une ou plusieurs signatures, réalisées avec des clés publiques de personnes tierces, qui, elles, ont vérifié soigneusement l'identité de Bob et de sa clé, et qui affirment cette clé précise est bien celle de la personne appelée Bob (bon, ceci soulève ensuite la question sociale de savoir ce que cela signifie de vérifier soigneusement l'identité de quelqu'un, et d'ailleurs ce qu'est l'identité, mais évitons d'entrer dans des questions philosophiques à ce stade). Par exemple, si Alice a confiance dans l'identité de la clé publique de Charlie et en l'honnêteté de Charlie, et que Charlie a vérifié soigneusement la clé publique de Bob et publié une signature l'associant à l'identité de Bob, Alice peut faire confiance à cette signature de Charlie pour savoir que Bob est vraiment Bob. Mais évidemment il faut des hypothèses fausses, car après tout un faux Bob aurait pu faire signer sa fausse clé par un faux Charlie, donc la signature n'a de valeur que si Alice a confiance en l'identité et l'honnêteté de Charlie. Il existe ensuite différents modèles (la toile de confiance proposée par PGP ou, au contraire, la chaîne depuis une racine de confiance utilisée dans le HTTPS sur le web) pour essayer d'établir la confiance en l'identité à partir de telles signatures.

En pratique, le logiciel (libre) GPG, dont je vais dire du mal plus bas mais qui reste utile, permet à tout un chacun de se créer une paire de clés (publique+privée), de chiffrer un document avec la clé privée d'un autre, de vérifier des signatures y compris des signatures attestant l'identité du propriétaire d'une clé, et ce genre de choses. Le maniement en est néanmoins malcommode et, pour ce qui est de la confiance en l'identité, on doit en pratique de toute façon faire à un moment ou un autre un acte de foi plus ou moins large selon le compromis qu'on considère acceptable entre la sécurité et la commodité.

Le but de cette entrée est, donc, d'annoncer une nouvelle clé publique me concernant (signée, inter alia, par l'ancienne), de donner quelques raisons de penser qu'elle est bien de moi, et accessoirement de râler parce que montrer que je sais râler si bien est certainement une façon d'assurer mon identité.

Ma clé précédente (0x0D9364260B2790DE) avait été créée le , et sa taille (clé DSA de 1024 bits + clé ElGamal de 1536 bits) ne permet plus de la considérer comme vraiment sûre, et ça fait longtemps que je me disais qu'il fallait en générer une nouvelle ; ce qui me bloquait surtout était l'aspect pénible de ré-apprendre comment on génère une clé PGP et donc relire la documentation de GnuPG qui est, disons-le franchement, une abomination, et enfin, de convaincre des gens de signer la nouvelle clé. Bref, je me suis sorti les doigts du c●l, et j'ai généré une nouvelle clé (RSA de 3584 bits, cette fois, parce que j'aime bien faire mon original). La nouvelle clé a pour empreinte 6AD5 2959 519B FFC6 FCDE A8A5 BE8D 3426 C06F FAE6 (rappelons qu'on désigne une clé par la fin de son empreinte, donc 0xBE8D3426C06FFAE6 ou même 0xC06FFAE6, quand il n'y a pas de risque d'attaque par confusion de l'ID, mais l'empreinte complète l'identifie de façon sûre), mais évidemment il ne faut pas faire confiance à un simple post de blog pour croire que cette empreinte est bien celle d'une clé appartenant à David Madore, sauf si vous ne me connaissez que par ce blog. J'ai mis ici une version de la nouvelle clé signée à la fois par l'ancienne clé et par deux amis qui me connaissent personnellement (mais bon, si vous n'avez pas de raison de faire confiance en leurs clés, ça vous fait une belle jambe aussi) ; et le fait que j'aie annoncé l'empreinte sur Twitter peut aussi aider très légèrement à augmenter la confiance dans le fait qu'il s'agit bien de la bonne personne. Mais si vous me connaissez personnellement, n'hésitez pas à me demander, soit en personne, soit par un canal de communication séparé (par exemple par SMS, en accompagnant votre SMS d'une question dont vous pensez que je serais seul à avoir la réponse) de confirmer l'exactitude de cette empreinte, j'apprécierais d'avoir des versions signées de ma clé en retour.

Mon ancienne clé n'est pas révoquée, je n'ai pas de raison de penser qu'elle aurait été compromise et j'ai toujours la clé privée associée, donc je n'ai pas l'intention de la révoquer dans l'immédiat, elle demeure valable.

Maintenant que j'ai fait l'annonce principale, quelques râleries.

La première concerne la taille des clés. J'ai beau avoir des contacts avec la communauté crypto, je n'ai pas une bonne mémoire pour le niveau de sécurité estimé, et certainement pas le niveau estimé en 2023, des tailles de clé pour différents algorithmes, et la correspondance entre elles. Je ne sais donc pas bien évaluer, par exemple, à quel point une clé DSA de 1024 bits (ma vieille) est déjà cassée, juste menacée ou vaguement considérée comme insuffisante. Je m'attendais à trouver un article Wikipédia, ou une autre page quelque part en ligne, récapitulant les records déjà réalisés et les estimations de complexité future, pour attaquer différentes longueurs de clé pour des algorithmes standards (RSA, DSA [sur groupe multiplicatif], ECDSA [=DSA sur courbe elliptique], ElGamal, tout ça comparé à des longueurs de clés symétriques) : or je ne trouve rien de tel. Donc, première râlerie, quelqu'un voudrait-il bien faire l'effort d'écrire une page synthétique claire à ce sujet ?

La seconde concerne l'utilisation de GPG. L'interface de ce programme est juste épouvantable. La syntaxe en ligne de commande est baroque et incohérente. Il mélange des fonctions de haut niveau (souvent interactives, demandant confirmation à l'utilisateur) et des fonctions de bas niveau sans séparation claire, même sans indiquer clairement ce qu'il faut considérer comme quoi : certaines fonctions demanderont confirmation, d'autres non, certaines demanderont une précision de façon interactive, d'autres non, et on ne sait vraiment pas à l'avance ce qui va faire quoi. (Par exemple, quand on édite une clé avec la fonction --edit-key, on ne sait pas trop si la commande delsig pour effacer des signatures prend un paramètre ou si elle le demandera après, on ne sait pas s'il y aura confirmation avant l'effacement, on ne sait pas trop si on pourra quitter sans sauver si on a fait une erreur, etc.) Le sens des primitives est mal expliqué aux utilisateurs : par exemple, les signatures de confiance produites avec tsign prennent des paramètres très importants dont le sens n'est absolument pas expliqué dans le manuel alors même qu'il n'est pas évident du tout, ni d'ailleurs la différence entre tsign et sign (il est juste dit de lire la RFC 4880, ce qui est un peu se moquer du monde, surtout qu'elle-même n'explique pas vraiment les choses).

Ma troisième râlerie concerne la toile de confiance (web of trust). La dernière fois que j'avais regardé PGP un peu de près, c'est-à-dire il y a presque un quart de siècle (ouch) quand j'ai généré ma clé précédente, la manière standard de diffuser les signatures sur une clé (i.e., les gens qui ont signé ma clé pour attester que c'est bien celle de David Madore) était de les mettre sur un serveur de clés : le principe étant donc, si je récupère la clé 0x0D9364260B2790DE auprès d'un serveur de clé, je récupère aussi les signatures des gens qui attestent que c'est bien celle de David Madore (et si par hasard je connais une de ces personnes, au sens où j'ai déjà vérifié sa clé, ça me permet d'avoir confiance en celle que je viens de récupérer ; sinon, je peux aller chercher un cran plus loin en récupérant sur le serveur les clés des gens les plus susceptibles d'être proches de mon cercle d'amis). Mais il semble que des attaquants (spammeurs ? je ne suis pas sûr de leur motivation) se soient amusés à envoyer sur le serveur des millions de signatures bidon (enfin, les signatures sont bonnes sinon elles ne seraient pas acceptées, mais elles proviennent de clés qui ne sont pas vraiment celles d'humains bien identifiés, ou quelque chose du genre), et pour éviter ce problème, les serveurs de clé n'ont pas trouvé mieux que de… cesser de distribuer les signatures des clés. (Il y avait pourtant plein d'autres façons de faire, par exemple demander de contresigner les signatures — c'est-à-dire attester que la signature est pertinente et souhaitée par la clé qui a été signée — ou bien proposer une forme de login associé à la clé et n'accepter que les signatures uploadées par la personne qui a uploadé la clé.) Toujours est-il que, du coup, il n'y a essentiellement plus aucun moyen de chercher à retrouver une chaîne de confiance de longueur non-triviale menant à une clé : je peux certes publier moi-même ma clé avec les signatures qu'on aura bien voulu m'en faire, mais la personne qui voudrait vérifier l'identité des signataires n'a essentiellement aucune façon de s'y prendre. C'est rare en informatique qu'il y ait une régression aussi forte de fonctionnalité en quelques décennies, et apparemment rien pour compenser.

Bref, c'est un peu triste : on a des outils théoriques qui sont très bien, la cryptographie à clé publique est un concept extraordinaire, mais dans la pratique il n'est essentiellement pas mis en œuvre dans le monde réel d'une manière qui pourrait servir aux vrais gens : d'un côté on a l'espèce de merde supposée « sécuriser » le Web, c'est-à-dire le HTTPS, qui en vrai n'apporte aucune sorte de garantie de confiance parce que les autorités censées être à la racine de la confiance sont de purs parrains mafieux qui ne vérifient rien et se contentent de prendre du fric aux gens pour afficher https dans les navigateurs (les détails de mes récriminations sont ici), et de l'autre on a un truc qui était basé sur des principes un peu plus sains, PGP, dont le fonctionnement est arcane et qui a été privé du moyen pratique de permettre de vérifier cette confiance.

↑Entry #2749 [older| permalink|newer] / ↑Entrée #2749 [précédente| permalien|suivante] ↑

↓Entry #2748 [older| permalink|newer] / ↓Entrée #2748 [précédente| permalien|suivante] ↓

(lundi)

Ce blog a 20 ans

Aujourd'hui est le 20e anniversaire de ce blog, puisque son premier billet a été publié le (j'avais pris exprès une date facile à retenir). Ça veut dire que mon blog a en gros l'âge de certains de mes élèves, et je ne sais pas très bien quoi faire de cette affirmation. Comme par ailleurs c'est aussi, à un jour près, le 30e anniversaire du World Wide Web, ça signifie que mon blog a aussi les deux tiers de l'âge du Web, autre information que je ne sais pas bien comment prendre. Et j'ai aussi passé environ 42% de ma vie à tenir un blog, ce qui me laisse tout aussi perplexe.

[Graphe de la taille de mon blog en fonction du temps]Le cours psychologique du temps est décidément non-linéaire : l'image mentale que j'ai de la décennie 2003–2013, disons (à la fois pour ce qui est des événements de ma vie et de ce que j'ai raconté dans ce blog), est beaucoup plus longue que celle de la décennie 2013–2023. Déjà la seule période 2003–2006, jusqu'à ce que je rencontre le poussinet, période où j'ai écrit je ne sais combien de billets sur mes blues de pédé frustré, me paraît incroyablement plus longue que les trois ans qu'elle a durée en vrai. C'est peut-être parce que mon image mentale du temps sur ce blog est plutôt en nombre d'entrées qu'en nombre de jours.

J'avais écrit un billet décenniversaire en 2013, que je trouve d'ailleurs intéressant de relire, dans lequel j'avais produit des graphes que je refais ci-contre à droite (cliquez pour agrandir) sur 20 ans au lieu de 10. (D'ailleurs, je n'avais stupidement pas pris notes des lignes GnuPlot pour générer un truc à double échelle, comme ça, et j'ai galéré pour les retrouver : à toutes fins utiles, les voici.) La courbe violette (à lire contre l'échelle de gauche) montre le nombre de billets que j'ai écrit en fonction du temps (en abscisse), tandis que la courbe turquoise (contre l'échelle de droite, sans rapport sauf que j'ai synchronisé les deux à l'entrée précédant celle-ci) montre la taille totale cumulée que j'ai écrite (exprimée en unités de 1kic = 1024 caractères[#], mais peu importe). C'est frappant quand on regarde la première courbe que mes billets de blog deviennent de plus en plus rares (j'étais parti sur l'idée d'écrire un billet par jour, au point de produire des excuses quand je n'en écrivais pas, alors que maintenant c'est plutôt un billet par mois), mais, de façon assez étonnante, quand on regarde la seconde courbe on voit que la quantité de texte que j'écris par unité de temps n'a pas tellement changé en vingt ans (2922 caractères par jour en moyenne sur 20 ans), elle a même plutôt accéléré malgré des fluctuations un peu aléatoires (si je compte mes années à partir du premier mai, mon nombre de caractères écrits par jour en moyenne est le suivant : 2003: 4936 ; 2004: 2538 ; 2005: 2718 ; 2006: 1540 ; 2007: 1523 ; 2008: 1416 ; 2009: 2141 ; 2010: 2338 ; 2011: 3938 ; 2012: 2492 ; 2013: 2103 ; 2014: 2864 ; 2015: 4151 ; 2016: 2790 ; 2017: 3345 ; 2018: 5718 ; 2019: 3963 ; 2020: 2619 ; 2021: 2468 ; 2022: 2828).

Bref, j'écris des entrées de plus en plus rares, mais comme elles deviennent aussi plutôt de plus en plus longues, ça compense grosso modo. Ceci traduit aussi le phénomène que je raconte de moins en moins ma vie et de plus en plus mes idées (ou, à défaut d'idées à moi, des idées que j'ai comprises et que je veux réexpliquer).

Ce n'est peut-être pas une bonne façon de blogguer que de pondre des romans entiers une fois tous les jamais, mais je n'ai toujours pas trouvé de façon correcte de « microblogguer » : Twitter (que je mentionnais déjà dans l'entrée écrite il y a dix ans) est tombé dans les mains d'un égocentrique capricieux et erratique[#2], je n'ai pas trouvé de serveur (ni de temps pour monter le mien) permettant de passer à Mastodon, et ce serait compliqué de publier des micro-entrées dans ce blog-ci.

La partie technique comme l'apparence finale de ce blog ont finalement assez peu changé en vingt ans, et ce malgré un déplacement depuis les machines des élèves de l'ENS vers un serveur que je loue moi-même. (Voyez cette capture par The Internet Archive, la première réalisée, en juin 2003.) J'ai commencé en éditant à la main un simple fichier HTML, puis j'ai mis en place un premier système à base de XSLT que j'ai rapidement remplacé par un moteur en C et finalement, en 2010, en Java dont le principal changement depuis 2010 a été la l'interface avec un serveur Tomcat pour donner à chaque entrée une page individuelle au lieu de les collecter mois par mois (mais bon, si j'écris une entrée par mois, ça ne fait guère de différence !) ; j'ai aussi passé l'historique de CVS à Git en 2010 ; mais le format source (un HTML à peine enrichi) que j'édite à la main n'a (malgré un passage au HTML5) quasiment pas changé depuis 2003, et le système de commentaires est un script Perl ignoble conservé dans du formol que je me promets depuis au moins dix ans de fusionner avec le moteur Java.

La manière dont j'écris un billet a tendance à se dérouler selon le scénario suivant : quand j'ai une idée sur laquelle je pourrais écrire, je la note rapidement dans un fichier de brouillon ; plus cette idée me revient à l'esprit et mûrit dans ma tête, plus je suis tenté de m'y mettre jusqu'à ce que, souvent, elle me titille jusque dans mes insomnies. À ce moment-là je me rends compte que la seule façon de me débarrasser de cette idée est de l'expulser par écrit.

J'écris souvent la première moitié du billet en un rien de temps, et ça suffit à peu près à calmer ma volonté de ranter sur ce sujet : l'ennui, c'est qu'il faut conclure. À partir de ce moment-là, je traîne des pieds, j'écris un paragraphe de temps en temps, et de plus en plus lentement, parce que le sujet m'intéresse de moins en moins, mais aussi parce qu'à chaque fois que je veux m'y mettre il faut que je relise ce que j'ai déjà écrit, je ne suis pas content parce que c'est mal organisé, bref, je tourne autour du pot. Parfois l'entrée finit par m'énerver tellement que je ne peux plus la voir et elle va rejoindre le cimetière des billets jamais finis (d'où il est cependant possible qu'elle soit réanimée comme une sorte de zombie, ou qu'elle se réincarne en un autre billet dans laquelle j'injecterai des grands bouts de celui qui semblait ne jamais finir).

Mais parfois je trouve le courage d'aller jusqu'au bout, ou du moins de décider bon, ça suffit, je publie ça comme c'est, et tant pis si je n'en suis pas content (l'entrée précédente est assez typique de ce point de vue-là).

Toujours est-il qu'une fois le billet publié, je n'ai plus trop envie de penser au sujet (c'est une des raisons pour lesquelles je réagis assez peu aux commentaires) : d'une certaine manière, j'écris pour évacuer une idée de mes pensées, pour la conserver d'une manière qu'elle ne me dérange plus. Bien plus tard je la relirai peut-être, en tout cas je serai content de savoir que j'ai réfléchi à X, que si je veux reprendre mes idées sur X ou simplement recomprendre ce que j'avais compris sur X je peux relire ce que j'ai écrit, mais que je peux aussi ne plus y penser sans craindre d'oublier puisque c'est noté par écrit.

Pour prendre une métaphore informatique (que j'ai déjà dû utiliser plusieurs fois), ce blog est un peu l'espace de swap de mon cerveau. J'écris avant tout pour moi-même, pour me débarrasser de pensées en sachant que ça me permettra de les retrouver plus tard.

Je ne manque absolument pas de sujets sur lesquels ranter. Ma liste de sujets « à traiter » (j'en ai publié de petits bouts à divers moments, et d'ailleurs je trouve intéressant de voir que, finalement, j'ai tordu le cou à une proportion non ridicule des sujets que je m'étais dit que je devrais traiter) a, comme ma boîte mail, un débit « entrant » (i.e., de nouveaux sujets sur lesquels je me dis que je devrais écrire quelque chose) clairement supérieur au débit « sortant » (i.e., de sujets que je peux rayer parce que j'ai dumpé mes idées dans mon blog).

(Bon, bien sûr, j'éprouve aussi un certain besoin de radoter en redisant différemment — soit parce que je pense pouvoir le dire mieux, soit simplement parce que j'ai oublié l'existence de la première fois — quelque chose que j'ai déjà dit. Au rayon du radotage, il y a notamment ce que je viens d'expliquer aux quelques paragraphes précédents, qui recoupe pas mal ce billet ou même celui-ci écrit en 2003, à l'époque où je tenais encore ce blog largement en anglais et où on pouvait utiliser le mot mème sur Internet dans son sens original et pas dans le sens d'une image drôle : et en les relisant je me dis que mes motivations n'ont pas tellement changé.)

Mais dire que j'écris uniquement pour moi-même ne serait pas tout à fait exact non plus. Je tiens un journal de ma vie qui, pour sa part, est vraiment privé et écrit spécifiquement pour moi-même, qui me sert à retrouver quel jour j'ai fait quoi ou comment je me suis sorti de telle ou telle difficulté ; les textes que je publie ici, si je les rends publics, c'est quand même que j'ai un peu l'idée d'être lu par d'autres gens que moi-même.

Il y a certainement une volonté de ma part, comme je l'écrivais dans le vieux billet lié ci-dessus, de propager et reproduire mes mèmes(-au-sens-original-du-mot), c'est-à-dire d'amener mes lecteurs à partager pas tellement mes idées que ma façon de me représenter mentalement le monde. Peut-être même que je devrais parler de spores mentales pour les 2747 (and counting) billets de ce blog qui germeront peut-être dans des esprits fertiles et aideront les idées qu'ils portent à se reproduire de nouveau ailleurs.

Le corps de David Madore ne vivra pas éternellement ; et indépendamment du fait que je suis homo, je n'ai même pas spécialement envie de propager mes gènes, qui ne me semblent pas « me » définir de façon très profonde ou très intéressante. L'immortalité n'est pas impossible, comme je l'ai déjà expliqué, mais je ne vis pas dans une société qui pratique la réincarnation concrète et socialement organisée des Qriqrx dont je parle dans ce billet (lisez-le ! c'est sans doute ce que j'ai écrit de plus important). Malgré toutes mes tentatives pour organiser la préservation de l'information[#3][#4], le système stupide du Web où il faut payer en permanence pour qu'une information reste disponible en ligne fait que mon blog n'a sans doute pas non plus une grande pérennité. Toutes ces choses seront perdues comme des larmes dans la pluie. Donc peut-être ce que je peux faire de mieux pour préserver l'information importante qui « me » définit, c'est-à-dire mes idées, mes mèmes-au-sens-original-du-mot, ma façon de voir le monde, c'est de faire lire autant de rants que possible à autant de gens que possible. Dont acte. 😉

Bon, allez, souhaitez-moi de blogguer encore vingt ans de plus !

[#] Surtout, c'est assez compliqué de définir ce qu'on compte exactement comme longueur d'un billet : octets ou caractères Unicode ? En tenant compte des balises HTML et de leurs attributs, ou pas ? Je ne sais plus ce que j'avais fait il y a dix ans (les indications sur le graphe sont légèrement contradictoires). Cette fois, j'ai sommé les champs length(content::text) de ma base de données PostgreSQL, donc c'est, il me semble, le décompte des caractères Unicode du source du billet, balises HTML (en fait, une variante maison du HTML avec quelques namespaces en plus) comprises. Certains billets doivent être plus riches que d'autres en balises par rapport au texte, notamment les billets de maths où je dois taper <var>x</var> à chaque fois que je veux parler de x, ou les billets qui ont des illustrations en SVG non contenues dans un fichier séparé. Mais au final la disproportion n'est sans doute pas gigantesque.

[#2] Maintenant j'y reste surtout pour l'ambiance de fin du monde, un peu comme Néron regardant Rome brûler (oui, bon, ma métaphore est pourrie parce que ce n'est pas vraiment moi Néron dans l'histoire). Je ne sais pas si ce qui finira par me faire partir est que je n'arriverai plus techniquement à maintenir l'archive publique de mes tweets ou parce qu'il n'y aura plus que des trolls et des néonazis ou parce que la compagnie aura fini par faire banqueroute.

[#3] Je m'assure au minimum que la Wayback Machine de l'Internet Archive est passé sur chaque billet de blog peu après que je l'ai publié (je fais d'ailleurs de même de mes tweets), ou si je fais un changement non-négligeable. Mais je devrais peut-être publier aussi l'historique Git sur GitHub (ou au moins en maintenir une copie chez quelques amis ; je suis juste gêné par le fait que le début de l'historique ne sépare pas bien mes brouillons écrits pour moi-même des choses que j'ai effectivement publiées).

[#4] Je note avec une certaine perplexité que, bien que j'en parle un peu tout le temps (au moins par allusions), à part cette vieille entrée pas bien écrite, je n'ai pas vraiment publié de billet spécifiquement sur la préservation de l'information et l'importance que j'y attache. Allez hop, encore un sujet dans le TORANT.

↑Entry #2748 [older| permalink|newer] / ↑Entrée #2748 [précédente| permalien|suivante] ↑

Continue to older entries. / Continuer à lire les entrées plus anciennes.


Entries by month / Entrées par mois:

2023 Jan 2023 Feb 2023 Mar 2023 Apr 2023 May 2023
2022 Jan 2022 Feb 2022 Mar 2022 Apr 2022 May 2022 Jun 2022 Jul 2022 Aug 2022 Sep 2022 Oct 2022 Nov 2022 Dec 2022
2021 Jan 2021 Feb 2021 Mar 2021 Apr 2021 May 2021 Jun 2021 Jul 2021 Aug 2021 Sep 2021 Oct 2021 Nov 2021 Dec 2021
2020 Jan 2020 Feb 2020 Mar 2020 Apr 2020 May 2020 Jun 2020 Jul 2020 Aug 2020 Sep 2020 Oct 2020 Nov 2020 Dec 2020
2019 Jan 2019 Feb 2019 Mar 2019 Apr 2019 May 2019 Jun 2019 Jul 2019 Aug 2019 Sep 2019 Oct 2019 Nov 2019 Dec 2019
2018 Jan 2018 Feb 2018 Mar 2018 Apr 2018 May 2018 Jun 2018 Jul 2018 Aug 2018 Sep 2018 Oct 2018 Nov 2018 Dec 2018
2017 Jan 2017 Feb 2017 Mar 2017 Apr 2017 May 2017 Jun 2017 Jul 2017 Aug 2017 Sep 2017 Oct 2017 Nov 2017 Dec 2017
2016 Jan 2016 Feb 2016 Mar 2016 Apr 2016 May 2016 Jun 2016 Jul 2016 Aug 2016 Sep 2016 Oct 2016 Nov 2016 Dec 2016
2015 Jan 2015 Feb 2015 Mar 2015 Apr 2015 May 2015 Jun 2015 Jul 2015 Aug 2015 Sep 2015 Oct 2015 Nov 2015 Dec 2015
2014 Jan 2014 Feb 2014 Mar 2014 Apr 2014 May 2014 Jun 2014 Jul 2014 Aug 2014 Sep 2014 Oct 2014 Nov 2014 Dec 2014
2013 Jan 2013 Feb 2013 Mar 2013 Apr 2013 May 2013 Jun 2013 Jul 2013 Aug 2013 Sep 2013 Oct 2013 Nov 2013 Dec 2013
2012 Jan 2012 Feb 2012 Mar 2012 Apr 2012 May 2012 Jun 2012 Jul 2012 Aug 2012 Sep 2012 Oct 2012 Nov 2012 Dec 2012
2011 Jan 2011 Feb 2011 Mar 2011 Apr 2011 May 2011 Jun 2011 Jul 2011 Aug 2011 Sep 2011 Oct 2011 Nov 2011 Dec 2011
2010 Jan 2010 Feb 2010 Mar 2010 Apr 2010 May 2010 Jun 2010 Jul 2010 Aug 2010 Sep 2010 Oct 2010 Nov 2010 Dec 2010
2009 Jan 2009 Feb 2009 Mar 2009 Apr 2009 May 2009 Jun 2009 Jul 2009 Aug 2009 Sep 2009 Oct 2009 Nov 2009 Dec 2009
2008 Jan 2008 Feb 2008 Mar 2008 Apr 2008 May 2008 Jun 2008 Jul 2008 Aug 2008 Sep 2008 Oct 2008 Nov 2008 Dec 2008
2007 Jan 2007 Feb 2007 Mar 2007 Apr 2007 May 2007 Jun 2007 Jul 2007 Aug 2007 Sep 2007 Oct 2007 Nov 2007 Dec 2007
2006 Jan 2006 Feb 2006 Mar 2006 Apr 2006 May 2006 Jun 2006 Jul 2006 Aug 2006 Sep 2006 Oct 2006 Nov 2006 Dec 2006
2005 Jan 2005 Feb 2005 Mar 2005 Apr 2005 May 2005 Jun 2005 Jul 2005 Aug 2005 Sep 2005 Oct 2005 Nov 2005 Dec 2005
2004 Jan 2004 Feb 2004 Mar 2004 Apr 2004 May 2004 Jun 2004 Jul 2004 Aug 2004 Sep 2004 Oct 2004 Nov 2004 Dec 2004
2003 May 2003 Jun 2003 Jul 2003 Aug 2003 Sep 2003 Oct 2003 Nov 2003 Dec 2003

[Index of all entries / Index de toutes les entréesLatest entries / Dernières entréesXML (RSS 1.0) • Recent comments / Commentaires récents]