David Madore's WebLog: La conservation de l'information

Index of all entries / Index de toutes les entréesXML (RSS 1.0) • Recent comments / Commentaires récents

Entry #1118 [older|newer] / Entrée #1118 [précédente|suivante]:

(mardi)

La conservation de l'information

Un des traits typiques des geeks, c'est l'importance donnée à la conservation de l'information. Il est difficile d'expliquer ce qu'on entend exactement par là. Peut-être une comparaison serait-elle appropriée : l'idée, après tout, peut être remontée aux traditions religieuses qui tiennent à reproduire leurs textes sacrés (les védas, la torah, le coran…[#]) au symbole près, la perte ou la modification de la moindre virgule étant impensable ; ou peut-être devrait-on parler du traumatisme causé dans notre culture par l'incendie de la grande bibliothèque d'Alexandrie (et autres idées de ce genre). Toujours est-il que l'idée de la conservation de l'information est quelque chose comme : une fois qu'une information a atteint un certain stade de maturité ou d'importance ou de publicité (j'insiste bien sur le fait que j'ai écrit ou et pas et ; cependant, les critères ne sont pas complètement clairs), elle devrait être inaltérable : on ne peut plus rien y changer, et il est criminel de la détruire. En un certain sens, c'est même le crime : tuer quelqu'un, par exemple, ne serait condamnable que parce qu'on détruit les millions de milliards de logons d'information que son cerveau contenait (et qui constituent sa mémoire, sa personnalité, bref, son identité).

Quelques exemples de cette manie de conservation sont les suivantes. J'écris un journal quotidien de ce qui m'arrive dans la journée : ce n'est pas un journal intime mais simplement une trace (un log, si on veut) de ce qui m'arrive, pour que je puisse dire, a posteriori, par exemple, avec qui j'ai dîné le 19 août 2004 : l'idée qu'une information de ce genre soit perdue me semble absolument terrifiante. Les webmasters du serveur Web des élèves de l'ENS conservent depuis des années les logs complets des connexions au serveur, en les gravant sur CD à partir du moment où ils deviennent trop volumineux : ces informations sont rigoureusement dénuées d'intérêt, mais à partir du moment où elles sont générées (et vérifient les critères obscurs qui dictent qu'elles deviennent préservables) elles doivent être conservées indéfiniment. Une page Web qui disparaît, c'est le drame. La Wikipédia, heureusement, garde toutes les versions antérieures de toutes ses pages, de sorte qu'aucune information n'est détruite. Et ainsi de suite. En ce moment, un contributeur du forum de discussion interne de l'ENS est en train de rechercher tous ses messages et de les effacer : pour moi, indépendamment de considérations accessoires (c'est malvenu parce que cela casse des discussions, il le fait sans même avoir eu la politesse d'en discuter un peu avant, et cela donne l'impression qu'il renie tout ce qu'il a jamais dit, ce qui projette une image assez peu plaisante du personnage), c'est un acte de vandalisme aussi inadmissible que si un héritier quelconque de Victor Hugo faisait détruire toutes les copies existantes de tous les livres de cet auteur.

À ce propos, un des premiers grands héros de la conservation de l'information est César Auguste qui ordonna qu'on ne tienne pas compte des instructions de Virgile voulant qu'on brûle l'Énéide (qu'il considérait comme inachevée). L'Énéide peut être classée comme un des plus grands chefs d'œuvre de la littérature mondiale (et accessoirement a été parfois considérée, sous la basse Antiquité et au Moyen-Âge, comme un texte quasiment religieux), mais de nos jours on peut se permettre de conserver également des informations qui n'ont pas une valeur aussi élevée — d'où l'extension considérable du domaine de cette préservation.

À part un héros comme Auguste, on peut également chanter les armes : une des armes les plus précieuses pour la conservation de l'information, ce sont les fonctions de hachage, dont j'ai déjà parlé : à partir du moment où un document a été estampillé par sa fonction de hachage (par exemple, mais pas uniquement, s'il a été signé cryptographiquement), celle-ci garantit l'intégrité de l'information, car changer un seul bit du document, aussi long soit-il, changerait totalement la valeur du haché.

En revanche, il y aussi des problèmes : le plus embêtant, c'est que les législateurs n'ont pas le même sens moral que ceux qui accordent une si haute valeur à la conservation de l'information. Par exemple, il est admis qu'un artiste fasse usage d'un droit de repentir qui lui permet de détruire une œuvre dont il est auteur (il semble donc que, selon le droit français actuel, Auguste n'aurait pas pu protéger l'Énéide), et la loi Informatique et Libertés impose toutes sortes de conditions qui vont à l'encontre des impératifs de la préservation de l'information. Par exemple, l'annuaire des élèves de l'ENS devrait (selon les termes de son engagement vis-à-vis de la CNIL) détruire les versions électroniques de ses fichiers au bout d'un peu plus d'un an (c'est-à-dire, ne garder aucune archive, seulement la version courante) : cela signifie que quand la législation aura évolué il faudra reprendre les versions papier dans des bibliothèques, les scanner complètement, et les passer à la reconnaissance de caractères — c'est assez ridicule. Un jour peut-être les gens comprendront-ils que la protection de l'individu doit être faite non pas vis-à-vis de l'information mais vis-à-vis de l'usage qui en est fait !

Hélas, pour l'instant, parler de préservation de l'information à un profane est un peu comme parler de mathématiques à un homme des cavernes : on pourra faire comprendre l'idée dans un cas aussi extrême que celui de la bibliothèque d'Alexandrie ou de l'Énéide, mais de façon plus large le concept reste opaque.

[#] …ou le standard Unicode : par exemple, il y a des fautes de frappe connues dans le standard (le caractère U+FE18 PRESENTATION FORM FOR VERTICAL RIGHT WHITE LENTICULAR BRAKCET devrait manifestement s'appeler BRACKET et pas BRAKCET, et de même U+1D0C5 BYZANTINE MUSICAL SYMBOL FHTORA SKLIRON CHROMA VASIS devrait être FTHORA et non FHTORA) mais on ne peut pas changer le nom d'un caractère une fois qu'il est publié.

↑Entry #1118 [older|newer] / ↑Entrée #1118 [précédente|suivante]

Recent entries / Entrées récentesIndex of all entries / Index de toutes les entrées