Un des traits typiques des geeks, c'est l'importance donnée à la
conservation de l'information. Il est difficile d'expliquer ce qu'on
entend exactement par là. Peut-être une comparaison serait-elle
appropriée : l'idée, après tout, peut être remontée aux traditions
religieuses qui tiennent à reproduire leurs textes sacrés (les védas,
la torah, le coran…[#]) au
symbole près, la perte ou la modification de la moindre virgule étant
impensable ; ou peut-être devrait-on parler du traumatisme causé dans
notre culture par l'incendie de la grande bibliothèque d'Alexandrie
(et autres idées de ce genre).
Toujours est-il que l'idée de la conservation de l'information est
quelque chose comme : une fois qu'une information a atteint un certain
stade de maturité ou d'importance ou de publicité
(j'insiste bien sur le fait que j'ai écrit ou
et pas
et
; cependant, les critères ne sont pas complètement clairs),
elle devrait être inaltérable : on ne peut plus rien y
changer, et il est criminel de la détruire. En un certain sens, c'est
même le crime : tuer quelqu'un, par exemple, ne serait
condamnable que parce qu'on détruit les millions de milliards de
logons d'information que son cerveau contenait (et qui constituent sa
mémoire, sa personnalité, bref, son identité).
Quelques exemples de cette manie de conservation sont les suivantes. J'écris un journal quotidien de ce qui m'arrive dans la journée : ce n'est pas un journal intime mais simplement une trace (un log, si on veut) de ce qui m'arrive, pour que je puisse dire, a posteriori, par exemple, avec qui j'ai dîné le 19 août 2004 : l'idée qu'une information de ce genre soit perdue me semble absolument terrifiante. [Ajout : voir cette entrée ultérieure où je parle plus longuement de ce journal.] Les webmasters du serveur Web des élèves de l'ENS conservent depuis des années les logs complets des connexions au serveur, en les gravant sur CD à partir du moment où ils deviennent trop volumineux : ces informations sont rigoureusement dénuées d'intérêt, mais à partir du moment où elles sont générées (et vérifient les critères obscurs qui dictent qu'elles deviennent préservables) elles doivent être conservées indéfiniment. Une page Web qui disparaît, c'est le drame. La Wikipédia, heureusement, garde toutes les versions antérieures de toutes ses pages, de sorte qu'aucune information n'est détruite. Et ainsi de suite. En ce moment, un contributeur du forum de discussion interne de l'ENS est en train de rechercher tous ses messages et de les effacer : pour moi, indépendamment de considérations accessoires (c'est malvenu parce que cela casse des discussions, il le fait sans même avoir eu la politesse d'en discuter un peu avant, et cela donne l'impression qu'il renie tout ce qu'il a jamais dit, ce qui projette une image assez peu plaisante du personnage), c'est un acte de vandalisme aussi inadmissible que si un héritier quelconque de Victor Hugo faisait détruire toutes les copies existantes de tous les livres de cet auteur.
À ce propos, un des premiers grands héros de la conservation de l'information est César Auguste qui ordonna qu'on ne tienne pas compte des instructions de Virgile voulant qu'on brûle l'Énéide (qu'il considérait comme inachevée). [Ajout : voir aussi cette entrée ultérieure à propos de l'œuvre de Grothendieck.] L'Énéide peut être classée comme un des plus grands chefs d'œuvre de la littérature mondiale (et accessoirement a été parfois considérée, sous la basse Antiquité et au Moyen-Âge, comme un texte quasiment religieux), mais de nos jours on peut se permettre de conserver également des informations qui n'ont pas une valeur aussi élevée — d'où l'extension considérable du domaine de cette préservation.
À part un héros comme Auguste, on peut également chanter les armes : une des armes les plus précieuses pour la conservation de l'information, ce sont les fonctions de hachage, dont j'ai déjà parlé : à partir du moment où un document a été estampillé par sa fonction de hachage (par exemple, mais pas uniquement, s'il a été signé cryptographiquement), celle-ci garantit l'intégrité de l'information, car changer un seul bit du document, aussi long soit-il, changerait totalement la valeur du haché.
En revanche, il y aussi des problèmes : le plus embêtant, c'est que
les législateurs n'ont pas le même sens moral que ceux qui accordent
une si haute valeur à la conservation de l'information. Par exemple,
il est admis qu'un artiste fasse usage d'un droit de repentir
qui lui permet de détruire une œuvre dont il est auteur (il
semble donc que, selon le droit français actuel, Auguste n'aurait pas
pu protéger l'Énéide), et la loi
Informatique et Libertés impose toutes sortes de
conditions qui vont à l'encontre des impératifs de la préservation de
l'information. Par exemple, l'annuaire des élèves de
l'ENS devrait (selon les termes de son engagement
vis-à-vis de la CNIL)
détruire les versions électroniques de ses fichiers au bout d'un peu
plus d'un an (c'est-à-dire, ne garder aucune archive, seulement la
version courante) : cela signifie que quand la législation aura évolué
il faudra reprendre les versions papier dans des bibliothèques, les
scanner complètement, et les passer à la reconnaissance de caractères
— c'est assez ridicule. Un jour peut-être les gens
comprendront-ils que la protection de l'individu doit être faite non
pas vis-à-vis de l'information mais vis-à-vis de l'usage qui
en est fait !
Hélas, pour l'instant, parler de préservation de l'information à un profane est un peu comme parler de mathématiques à un homme des cavernes : on pourra faire comprendre l'idée dans un cas aussi extrême que celui de la bibliothèque d'Alexandrie ou de l'Énéide, mais de façon plus large le concept reste opaque.
[Ajout () : entrée ultérieure et peut-être mieux écrite sur le même sujet.]
[#] …ou le
standard Unicode : par exemple,
il y a des fautes de frappe connues dans le standard (le caractère
U+FE18 PRESENTATION FORM FOR VERTICAL RIGHT WHITE LENTICULAR BRAKCET
devrait manifestement s'appeler BRACKET
et pas
BRAKCET
, et de même U+1D0C5 BYZANTINE MUSICAL SYMBOL FHTORA
SKLIRON CHROMA VASIS devrait être FTHORA
et non FHTORA
)
mais on ne peut pas changer le nom d'un caractère une fois
qu'il est publié.