David Madore's WebLog: Sur la préservation de l'information, et l'importance que j'y attache

[Index of all entries / Index de toutes les entréesLatest entries / Dernières entréesXML (RSS 1.0) • Recent comments / Commentaires récents]

↓Entry #2750 [older| permalink|newer] / ↓Entrée #2750 [précédente| permalien|suivante] ↓

(vendredi)

Sur la préservation de l'information, et l'importance que j'y attache

Je voudrais dans ce billet dire quelque chose au sujet d'une question qui m'est très importante, disons même qu'elle fait partie de mes principes éthiques(?) les plus profonds, et à laquelle j'ai souvent fait allusion dans ce blog (tout récemment ici), mais que je n'ai, bizarrement, jamais vraiment abordée frontalement ici, sauf dans cette très vieille entrée que je trouve particulièrement mal écrite pour quelque chose d'aussi important à mes yeux (et où je ne cherche justement même pas à l'expliquer) : la préservation de l'information.

Sauf qu'à vrai dire je ne sais pas vraiment comment communiquer ce dont il est question, et encore moins pourquoi je trouve que c'est important. Les gens qui partagent mes préoccupations à ce sujet n'ont sans doute pas besoin d'autres explications, et les autres ne comprendront peut-être même pas de quoi je veux parler, encore moins pourquoi j'y accorde tant de poids. Surtout que les contours exacts de ce que je considère comme « information » nécessitant d'être préservée ne sont pas toujours très clairs ni, à vrai dire, très logique.

Et il faut reconnaître que c'est une question qu'on peut considérer comme presque religieuse (pas au sens où elle implique un principe transcendant, mais au sens d'une considération éthique que je ne sais pas vraiment justifier autrement que c'est comme ça) : et de fait, il y a des gens facétieux qui ont fondé l'église missionnaire du kopimisme (officiellement déclarée comme religion en Suède) qui doit plus ou moins correspondre aux principes que j'évoque ici, à ceci près que le kopimisme semble plus mettre l'accent sur la dissémination de l'information (le but étant, en fait, de défendre le peer-to-peer) que sur sa préservation ; mais bon, close enough, la pérennité et la disponibilité de l'information sont toutes les deux importantes à mes yeux : on va donc dire qu'on peut me considérer comme sympathisant de cette religion.

Pour essayer d'expliquer quand même de quoi il est question, je pense qu'il vaut mieux partir d'un terrain d'entente que je crois largement partagé, à travers l'observation suivante : la destruction d'une œuvre d'art comme la Joconde ou l'église Notre-Dame de Paris (cf. mes réflexions passées ici sur cette dernière) serait une perte irremplaçable pour l'Humanité. Pour une œuvre éminemment matérielle comme la Joconde, le fait d'avoir des copies (notamment des photos numériques haute résolution) ne remplacera jamais l'original, néanmoins, je pense que beaucoup de gens conviendront que ce serait déjà un moindre mal, si l'original de la Joconde devait disparaître, que d'en avoir un scan en résolution 100 000 × 100 000 avec informations de relief et 12 canaux de couleur allant de l'infrarouge à l'ultraviolet (je ne sais pas si un tel scan existe, soit dit en passant, mais si des conservateurs du musée du Louvre me lisent, vous êtes invités à créer et partager le fichier de 600Go que je viens de décrire dans cette phrase 😉 [#]).

[#] Malgré le smiley, ma remarque est sérieuse, et fait tout à fait partie du sujet de cette entrée : je pense que cela fait partie des missions d'un musée de préserver non seulement l'original des objets de leurs collections, mais aussi des scans numériques d'extrêmement haute qualité (aussi élevée que la technologie moderne le permet, et le fichier de 600Go que j'évoque pour la Joconde ne me semble pas déraisonnable, même si évidemment des versions plus petites ont un sens aussi), et en 3D quand c'est pertinent, pour qu'en cas d'accident il subsiste au moins quelque chose. Voir notamment ce tweet, avec lequel je suis complètement d'accord, qui appelle précisément à ça à la suite de l'incendie du Musée national du Brésil le où on s'est retrouvé à lancer un appel public à rassembler toutes les photos qui pouvaient exister de ses collections irrémédiablement détruites : le musée aurait pu, et aurait dû, faire de telles photos avant. Et l'intérêt de ces reproductions numériques de très haute qualité, outre la préservation qu'elles permettent, c'est aussi qu'on peut les diffuser (au moins tant que les avanies de la « propriété intellectuelle » ne s'y opposent pas) publiquement, et, par exemple, offrir des visites virtuelles à des gens qui n'ont pas les moyens de venir sur place. Or pour l'instant, tout ça ne semble exister que de façon embryonnaire. (Existe-t-il, par exemple, des données 3D haute résolution de l'intérieur du château de Versailles ?)

Une copie virtuelle de la Joconde est un pauvre remplacement de l'original, donc. Mais s'agissant d'un livre, je pense qu'on comprend déjà mieux qu'on accorde plus d'importance à l'information contenue dans le livre par rapport à l'objet original : il y a quantités d'œuvres de la littérature antique que nous avons complètement perdues, c'est-à-dire qu'il n'en subsiste aucune copie, et je pense qu'il est assez largement admis que c'est une bien plus grande perte que la quantité d'œuvres dont nous avons une copie mais plus l'original. (J'espère que je m'exprime clairement : disons qu'entre redécouvrir une copie d'une œuvre majeure X qu'on a crue complètement perdue et redécouvrir l'original d'une œuvre Y d'importance comparable dont on avait déjà des copies mais pas l'original, je pense qu'il est assez généralement admis que le premier est préférable quand il s'agit de littérature, car l'œuvre est plutôt le texte du livre — i.e., l'information — que l'objet original lui-même.)

Bref, la tragédie dans le fait que la grande bibliothèque d'Alexandrie a brûlé (événement plutôt symbolique : il n'y a pas forcément eu un événement précis, et pas forcément un incendie, mais ce que je veux dire c'est qu'on a perdu l'essentiel de son contenu), c'est la perte de l'information qu'elle contenait, le texte des rouleaux qui s'y trouvaient, pas tellement les rouleaux eux-mêmes.

À partir de l'invention de l'imprimerie à caractère mobile, et au moins pendant les périodes où on utilisait un papier et une encre qui ne se détruisent pas, on a eu un outil pour préserver beaucoup d'information assez efficacement : le livre imprimé. Le fait d'avoir plein de copies de la même chose permettait d'augmenter les chances qu'au moins une copie subsiste pendant longtemps.

Mais avec ce qu'il est convenu d'appeler la société de l'information, nous produisons des quantités énormes d'information sous forme numérique, mais en même temps nous sommes face à une sorte d'amnésie car nous perdons aussi des quantités hallucinante d'information. Ou même si elle n'est pas complètement perdue, elle est parfois rendue inaccessible ou indisponible de diverses manières. Car souvent il n'y en a qu'une seule « vraie » copie (non-transitoire).

On peut légitimement se demander, en supposant que l'humanité existe encore et a encore une technologie raisonnable dans quelques siècles (et, quand même, je l'espère) ce qu'il restera du XXIe siècle dans ses archives. Si la société de l'information est autant la société de l'amnésie, j'ai peur que la réponse soit pas grand-chose.

Il y a toutes sortes de raisons à ça. Des raisons techniques, d'abord : à bas niveau, les supports d'information numériques (disques durs, disques/mémoires SSD, disques optiques) contiennent certes énormément plus de capacité de stockage que les livres, mais ils sont beaucoup moins pérennes dans le temps ; à plus haut niveau, si on veut stocker des informations sur le cloud (c'est-à-dire distribuées chez un hébergeur) ou les rendre disponibles sur le Web, il faut payer, et payer en permanence, d'où il résulte que quand une compagnie fait faillite, quand un individu décède, etc., des quantités énormes d'information ont tendance à disparaître avec.

Des raisons légales, aussi : le régime détestable de la propriété intellectuelle[#2] fait que préserver l'information est juridiquement dangereux. Il y a énormément de livres dits « orphelins », c'est-à-dire qu'ils sont probablement soumis à un droit d'auteur, mais c'est difficile à savoir parce que l'éditeur a peut-être disparu, l'auteur est incontactable ou mort (et les droits continuent néanmoins à valoir pendant une durée parfaitement déraisonnable à partir de sa mort), et du coup il est impossible légalement de numériser l'œuvre pour sa préservation, ou au moins, si on le fait, on ne peut pas la rendre disponible en ligne parce que même si la plupart des auteurs en seraient sans doute heureux, le risque que quelques uns objectent rend l'entreprise trop périlleuse (et/ou économiquement peu rentable). De là résulte un vaste trou noir entre les œuvres suffisamment anciennes pour qu'on soit sûr qu'elles sont dans le Domaine public et les œuvres suffisamment récentes pour que les auteurs se soient occupés de leur disponibilité en ligne. Google a scanné des millions de livres de ce trou noir, mais ils ne peuvent pas les rendre disponibles en ligne pour les raisons légales que je viens de dire (parfois ils montrent quelques brefs passages dans Google Books, et déjà ils prennent un risque). L'Internet Archive a récemment perdu un procès contre des éditeurs rapaces parce qu'ils (l'Archive) proposaient des « prêts » de livres en ligne aux internautes, et cette décision judiciaire est une perte spectaculaire de l'information disponible à l'Humanité (je vais reparler de l'Internet Archive ci-dessous). Pas clair que ces archives de livres qu'on ne peut pas partager pour des raisons juridiques existent encore longtemps : et même dans la mesure où elles existent, elles n'ont qu'un intérêt limité.

[#2] Je déteste le terme de propriété intellectuelle, qui est une forme de propagande : en utilisant ce terme on essaie de faire passer pour évident alors que ce ne l'est pas que la protection des auteurs d'œuvres de l'esprit (que je ne mets pas en doute) doit être assimilée à une forme de propriété, ce qui sous-entend des droits exclusifs forts et inaliénables. Je préfère le terme de paternité créative : pour moi l'auteur a des droits sur son œuvre un peu comme un parent sur ses enfants : indéniablement il a une certaine légitimité à prendre des décisions à son sujet, mais cette légitimité n'est pas un pouvoir absolu, n'est pas illimité dans le temps, et ne devrait pas faire oublier que l'œuvre elle-même (ou le grand public à la voir) a des droits aussi. Notamment, je considère que l'auteur devrait certes avoir un droit d'abandon ou de répudiation de l'œuvre (c'est-à-dire le droit d'en détacher son nom ou de renier tout rapport avec elle), mais pas celui de la faire disparaître une fois qu'elle a été publiée (pas plus qu'un parent n'a le droit d'euthanasier son enfant après la naissance de ce dernier : au mieux il peut l'abandonner).

Et puis il y a une raison sociale (si j'ose dire) toute bête : le peu d'importance que nous accordons aux informations en ligne et à la question de leur préservation. Comme si ce qui n'est pas imprimé sous forme de livre n'était pas important. Comme si le Web n'était qu'un support frivole et sans importance par rapport au vrai Verbe, le Verbe imprimé.

Situation typique : une organisation crée un site web, il y a des informations utiles dessus ; puis quelqu'un décide de « refaire » le site web (avec un outil différent, avec un look différent, avec une structure différente, peu importe) : idéalement, toutes les pages de l'ancien site web devraient être soit préservées à l'identique, soit transformées en redirections vers le même contenu, ou un contenu équivalent, dans le nouveau site web. Évidemment, dans la vraie vie, il n'y a rien de tel. Au mieux, les liens cassent, au pire (et, en fait, le plus souvent), les informations disparaissent vraiment.

Prenez n'importe quel billet un peu ancien de ce blog, et suivez les liens (j'en mets beaucoup) : comptez la proportion qui sont cassés. En-dehors de ceux qui pointent vers Wikipédia, la proportion est alarmante. (Parfois je repasse derrière pour les remplacer par des liens vers The Internet Archive, mais ce n'est pas toujours possible, et de toute façon je n'ai pas l'énergie de revisiter régulièrement tout mon blog à la recherche des liens cassés.) Maintenant je fais l'effort de mettre des attributs title sur beaucoup de mes liens (qui s'affichent quand on passe la souris dessus), au moins si l'URL n'est pas évidente, pour essayer d'enregistrer au moins le titre de la page pointée ; et je demande généralement à The Internet Archive de suivre les liens depuis mes billets de blog.

Souvent quand j'évoque le problème de la préservation de l'information en ligne, on me fait une réponse de ce style : oui, certes, il y a des contenus importants qu'il faut préserver, mais la grande majorité des contenus ne le sont pas, et ce n'est pas grave s'ils disparaissent. En bref, préserver la Joconde, oui, préserver le moindre graffiti, non. Par exemple, si j'évoque la question de la pérennité des messages sur Twitter, les gens haussent les épaules en disant que l'écrasante majorité des tweets n'a aucun intérêt : voyez cette discussion pour un exemple de dialogue de sourds où je n'arrive pas à faire comprendre l'enjeu à la personne avec qui je parle.

Ma réponse à ça est la suivante : oui, sans doute, 99% des informations contenues en ligne n'a aucun intérêt à préserver. Le problème c'est que c'est impossible de faire le tri : on ne sait pas bien à l'avance quelle information aura de l'intérêt ultérieurement, et même si on le savait, on n'a ni l'envie ni les moyens de prendre le temps pour trier les choses entre « à sauvegarder » et « à ne pas sauvegarder » ; or si on ne peut pas faire le tri correctement, il faut choisir l'option la plus conservatrice (c'est-à-dire celle du moindre regret) : sauvegarder tout ce qui raisonnablement peut l'être.

Pour dire les choses autrement : oui, bien sûr, un tweet isolé n'a pas la valeur de la Joconde ; mais les milliards et les milliards de tweets rassemblés, ils forment un témoignage important d'un certain bout de l'existence humaine, et il est important de les préserver, à la fois pour les références internes (regardez le nombre de fois que j'ai référencé Twitter dans ce blog) et pour la mémoire des générations suivantes ou des historiens du futur, qui voudront peut-être savoir ce que ça faisait de vivre à travers la pandémie de 2020 ou comprendre le Zeitgeist de cette époque. Je prends l'exemple de Twitter parce qu'il est menacé par les excentricités erratiques de son nouveau propriétaire, mais la même chose vaut pour n'importe quel autre site, y compris ceux qui ont malheureusement déjà disparu sans laisser beaucoup de traces (Google Plus, par exemple, qui n'existe plus que comme des cicatrices sous forme de liens cassés).

(Et puis bon, par ailleurs, les contenus numériques ne se résument pas au web. On continue d'imprimer des livres papier, heureusement, mais je suppose qu'il y a des choses qui n'existent que sous forme de eBook, et ces choses-là, à cause de la manière dont elles sont « protégées » contre la copie pour des raisons de, surprise, propriété intellectuelle, elles disparaissent quand disparaît la société qui les vendait. Idem pour les films et les séries et les choses comme ça qui fleurissent sur les plateformes de streaming comme Netflix, Amazon truc et Apple bidule : quand ces compagnies feront faillite, les gens qui avaient des abonnements perdront leur accès aux contenus en question et il ne restera plus rien sur leurs ordinateurs : qui assure la sauvegarde pérenne de toutes ces créations ?)

Alors il y a quand même une arme contre l'amnésie, un héros de la préservation de l'information, c'est l'Internet Archive. L'Internet Archive est une bibliothèque numérique (financée par un mélange de dons, de mécénat et de différentes sources d'argent public) ayant pour mission de préserver et de rendre accessible toutes sortes de contenus numériques : livres et magazines numérisés, vidéos, musiques, jeux vidéos… mais aussi des sites web. Leur domaine d'action est malheureusement limité notamment pour des raisons légales (cf. ce que j'ai dit plus haut, notamment le fait qu'ils ont perdu un procès qui nous prive de beaucoup d'informations qu'ils avaient collectées et menace peut-être leur existence), ils ne peuvent par exemple pas sauvegarder les séries en streaming, et j'ai toujours peur qu'une action légale les fasse disparaître pour de bon. Mais pour l'instant ils existent, et ils font ce qu'ils peuvent.

Selon moi, l'internet Archive mérite d'être connue et reconnue comme un musée d'une valeur inestimable pour la mémoire de l'Humanité. (Et j'encourage tous mes lecteurs à penser à eux si vous faites des dons à des organisations caritatives.)

Et notamment, l'Internet Archive essaie de préserver une partie de la mémoire du Web. Ça ne peut être que très partiel, évidemment, mais c'est déjà ça. Le mode d'emploi est très simple : vous allez sur web.archive.org et vous tapez dans le formulaire l'adresse (URL) du site dont vous voulez consulter l'archive, par exemple ici pour ce blog, et ça va vous mener vers un graphique et un calendrier montrant les dates où la page a été sauvegardée dans son état d'alors, et on peut cliquer sur un des jours pour voir la version sauvegardée. Par exemple, voici une copie de la page d'accueil de mon blog il y a dix ans (bon, là il n'a pas changé des masses), et voici une copie de ma page web (home page comme on disait alors) en 1997, peut-être pas très intéressante mais qui représente pour moi personnellement un document historique précieux.

Inversement, pour demander la sauvegarde d'un contenu dans l'Internet Archive, on va sur web.archive.org/save et on tape l'adresse à sauvegarder (pas besoin d'être webmaster du site ou quoi que ce soit, vous pouvez demander de sauver n'importe quelle page web dès lors qu'elle est publiquement accessible). Si on a un compte sur l'Archive (c'est gratuit et ils ne spamment pas) on peut choisir par exemple de sauver aussi les liens sortants (il y a évidemment des limites sur le nombre de pages qu'on peut demander de sauver par jour), de sauver une capture d'écran, et des choses de ce genre.

L'Internet Archive n'est pas parfaite : elle ne peut pas tout sauvegarder (certains sites lui interdisent l'accès par exemple en protégeant l'accès par une forme de login, et même si ce n'est pas le cas, elle n'a pas la bande passante pour sauvegarder, par exemple, tout Twitter), et j'ai toujours peur qu'elle disparaisse (soit pour des raisons légales, cf. ci-dessus, soit par manque de sous, soit à cause d'un problème matériel comme un incendie[#3], ce qui serait une perte irréparable). Mais bon, c'est déjà ça.

[#3] Quis custodiet ipsos custodes? Qui sauvegardera les sauvegardes ? Il existe, si je comprends bien, essentiellement deux autres copies de l'Internet Archive. Malheureusement, comme le faisait remarquer un ami, les emplacements de ces copies n'inspirent pas forcément la plus grande confiance dans la stabilité des données : car la copie d'origine est sur la faille de San Andreas, une autre est en Hollande au-dessous du niveau de la mer, et une troisième est littéralement à la Grande Bibliothèque d'Alexandrie, une institution qui n'a pas le meilleur track record pour la sauvegarde pérenne des informations.

Bien sûr il y a plein d'autres formes de données publiques que les formats papiers (livres, journaux, documents d'archives) et le web. J'étais par exemple tombé sur ce mini-documentaire sur les archives audiovisuelles de l'INA (i.e., de la télé française), à la fois sous l'angle technique (quelle forme matérielle elles prennent) et sous l'angle du contenu (qu'est-ce qui est sauvegardé ? — ben, « tout »), et c'est très intéressant, je le recommande. C'est aussi rassurant à mes yeux que des gens se soient penchés un peu sérieusement sur la question de préserver l'information de la télé, mais cela rend d'autant plus criant le manque d'attention porté au Web (par exemple pourquoi la France ne finance-t-elle pas ses propres efforts pour sauver le Web, au moins le Web francophone ? ne serait-ce qu'en ayant son propre miroir de l'Internet Archive ? que fait-on pour la sauvegarde des eBooks et des films et séries en streaming, au moins les œuvres francophones ?).

Et bien sûr, à côté des données publiques il y a les données privées et tout le spectre entre les deux (pensez, par exemple, à un forum de discussion interne à un groupe de copains, à une école, ou un réseau social dont l'accès se fait par invitation : qui préserve ces données-là ?). Là c'est encore plus compliqué parce qu'il faut concilier l'impératif de protection du secret ou de la privauté avec la recherche de la pérennité (je ne veux pas que mes données disparaissent, mais je ne veux pas non plus les mettre sur l'Internet Archive) ; peut-être en plus avec une volonté de libération publique à une date lointaine dans le futur (il y a des règles de ce genre pour les archives).

Concernant ces données privées je pense aussi que la plupart des gens comprendront un peu mieux mes préoccupations : même ceux qui ne partagent pas mon attachement à sauvegarder des archives du Web ont tendance à vouloir au moins garder leurs propres photos, par exemple, ou l'historique de leurs SMS et MMS ou quelque chose de ce genre. L'existence de services proposant de sauvegarder de vieilles diapos ou films amateurs sous formats numériques semble suggérer que la valeur des souvenirs est quelque chose de quand même assez répandu.

Personnellement, non seulement je tiens un journal depuis 2001 de ce que je fais au jour le jour (ce qui est une façon de sauvegarder les informations de mon quotidien) mais j'enregistre aussi plein d'informations comme des traces GPS de mes principaux déplacements (balades à pied, à moto, en voiture…). Je tiens aussi les comptes de mes sous depuis 2006. Tout ça représente des informations personnelles auxquelles je tiens beaucoup et dont je veux assurer la pérennité au moins de mon vivant. À mes yeux cela relève de la même logique, dans la sphère privée, que mon attachement à la préservation des informations publiques.

(Certains trouvent que je suis un peu cinglé de conserver tout ça. Une trace GPS de toutes mes balades, par exemple, quel intérêt ? Ben ça me permet de faire le point sur tous les endroits où je suis allé, et de chercher des endroits que je n'ai pas encore vus, par exemple. Et j'ai déjà évoqué ici l'intérêt de tout photographier[#4] — conseil que je ne suis d'ailleurs moi-même pas autant que je devrais. Mais en fait le point important est surtout celui-ci : pour les données personnelles comme pour les données publiques, le tri entre ce qui est intéressant et ce qui ne l'est pas est difficile, surtout a priori, et c'est pour ça qu'il vaut mieux, dans le doute, tout sauvegarder, surtout que ça représente des volumes peu importants dès qu'il ne s'agit pas de vidéos.)

[#4] J'y mentionne les jeunes parents qui prennent des quantités invraisemblables de photos de leur bébé (qu'ils ne regarderont évidemment jamais ensuite, ou qu'ils montreront à des amis que ça emmerdera profondément). Je pense que le phénomène psychologique sous-jacent a un rapport avec mon obsession pour la préservation de l'information, à ceci près que la mienne ne s'attache pas à un objet particulier (le bébé) mais à toute une catégorie de choses qu'on peut mémoriser.

Malheureusement, sauvegarder tout ça à la fois est devenu terriblement difficile, pas tant pour des questions de volume que de diversité. Je ne veux pas trop me laisser entraîner à digresser sur les questions des formats de données et des backups et de la merde que sont les smartphones, mais disons qu'alors qu'autrefois faire un backup consistait simplement à faire une copie de tous les fichiers de son ordinateur sur un support externe, maintenant on génère des données qui sont hébergées chez plein de trucs externes, et c'est devenu très compliqué de les rassembler pour les sauvegarder. Le smartphone, par exemple, est une calamité : Android est une sale merde qui n'est même pas capable de faire un bête backup correct au sens qui devrait être simple copier toutes les données du téléphone (de toutes les applications[#5]) dans une archive sur l'ordinateur que je puisse restaurer ensuite à ma convenance, partiellement ou totalement, et c'est complètement scandaleux. Et il en va de même des données qu'on a chez plein d'hébergeurs (les courriers chez Gmail, les messages qu'on a écrits sur les réseaux sociaux, etc.) : bien sûr on peut se dire ah ben c'est Google qui assure la sauvegarde de Gmail, c'est rassurant et certainement Google est meilleur que l'individu lambda pour faire des sauvegardes, mais Google pourrait décider un jour de fermer l'accès à Gmail (au moins dans certains pays, par exemple en représailles contre une loi qui les emmerderait), et il me semble qu'on peut vouloir avoir une copie de ses données chez soi contre une telle éventualité. Heureusement, le RGPD européen est censé garantir qu'on peut récupérer les données nous concernant auprès de Google, Facebook, Twitter, etc. (certains ont fait des efforts honnêtes pour fournir une archive vraiment utilisable, d'autres… moins), mais bon, ça reste un boulot fou de récupérer tout ça périodiquement et le sauvegarder. (Pour Twitter, j'ai un processus compliqué pour récupérer mes tweets[#6], je me vois mal multiplier ça à l'infini.)

[#5] J'y pense parce que mon poussinet a récemment changé de téléphone (Android) et que ça a été une galère pour récupérer les données de l'ancien téléphone. WhatsApp, notamment, ne vous rend vraiment pas la vie facile pour extraire les conversations qu'on a tenues dans l'application. (Une raison de plus pour moi de ne jamais utiliser WhatsApp, mais il y a quantité d'applications Android qui ont des données qui m'intéressent et qui ne sont pas évidentes à extraire de leurs griffes.)

[#6] Mis en place pour pouvoir continuer à maintenir cette archive de mes tweets même quand Elon Musk me coupera l'accès à API qu'il a annoncé qu'il couperait… et qu'il est même censé m'avoir déjà coupé, mais inexplicablement, pour l'instant mon script Perl utilisant l'API auquel je suis censé ne pas avoir accès continue à fonctionner.

(Bon, la situation pénible des smartphones actuels est toujours mieux, je suppose, que les vieux téléphones à clapet qui emportaient tous les SMS stockés dessus quand ils mouraient. J'aimerais bien pouvoir remettre la main sur tous les messages que j'ai échangés entre 2001 et 2009, par exemple, mais même si les téléphones en question ne sont pas perdus ou morts, il est probablement impossible d'en extraire une archive de données.)

Et puis il y a la question de savoir sauvegarder. Le stockage dans le cloud est compliqué à mettre en œuvre et il est très cher (il faut payer tout le temps, dès qu'on cesse de payer les données disparaissent : autant dire que ce n'est pas très pérenne) et pas forcément chiffré de bout en bout (c'est-à-dire illisible par l'hébergeur). Le stockage sur disques optiques est devenu ridiculement petit par rapport aux quantités de données qu'on a à sauvegarder. Le stockage sur disques durs n'est pas très robuste. Je ne suis vraiment pas content des options. Mais bon, là aussi, je ne veux pas trop élargir le sujet de ce billet, qui est déjà assez vaste.

Pour finir plutôt sur des considérations plus philosophiques (pour ne pas dire complètement oiseuses), j'ai tendance à dire que l'importance donnée à l'information est une forme moderne, un peu scientifique (ou au moins parée d'atours scientifiques) du bon vieux dualisme cartésien : je ne crois pas à l'existence d'une âme, mais je crois que ça a un sens de distinguer les atomes composant mon corps et l'information sur la manière dont ces atomes sont arrangés (ou les neurones composant mon cerveau versus l'information encodant l'arrangement de ces neurones), et que c'est plutôt cette dernière qui contient l'essence de ce qu'est David Madore. L'information est encodée sous forme matérielle parce qu'il n'y a pas d'autre façon de stocker de l'information dans cet univers que sous forme matérielle, mais c'est l'information qui est vraiment importante, pas son support.

Je ne vais pas ressortir mon rant habituel concernant la vie et la mort et le fait que nous pourrions être immortels sans magie technologique, mais disons simplement que ce qui me désole quand je perds un être cher (comme mon papa il y a quelques années), c'est la perte du référent de tous ces souvenirs communs, ces informations partagées qui formaient notre lien social, et qui semblent tout d'un coup comme des pointeurs sans référence, des informations encore présentes mais qui rappellent surtout un grand vide, un peu comme un lien cassé sur le web ; garder des photos des gens qui peuvent disparaître, des traces de leurs paroles, des souvenirs de leurs actions, c'est une façon (peut-être futile mais le mieux qu'on puisse faire) de combler un peu ce vide.

La préservation de l'information est une petite victoire contre la mort, qui est l'autre nom de l'oubli.

Voilà : je crois que l'information est grande et que Claude Shannon est son prophète.

↑Entry #2750 [older| permalink|newer] / ↑Entrée #2750 [précédente| permalien|suivante] ↑

[Index of all entries / Index de toutes les entréesLatest entries / Dernières entréesXML (RSS 1.0) • Recent comments / Commentaires récents]