Comments on La conservation de l'information

jonas (2018-09-09T10:10:21Z)

Ah yes. That is a legal dispute that the Wikimedia Foundation has with lots of people in more than one country, but the WMF acts very confident that they win. They have a policy <URL: > that a faithful photographic reproduction of 2D art (old paintings without a frame or stained glass windows) doesn't create a new copyright, so they will distribute such photographs if the original work of art is out of copyright despite any claims the distributor of the photograph makes about new copyright. They are so confident that this is legal that they say “This is a rare *exception* to the usual Commons rule that all images must be free both in the US and in the source country”. The background being that some court has ruled on their favor in the US, but some other countries do have or had a law that declares that such photographs get a new copyright with a shorter term, and they allow photographs from those countries too. This applies to paintings without frame, stained glass windows, and tapestries if they are laid out flat, but not to sculptures or reliefs or coins.

To date I do not have a clear answer on whether it applies to photos of the Coronation pall of Hungary <URL: >. Although Commons now stores some photos of it without the permission of the photographer, this does not indicate that those photos are definitely thought legal, only that ever since Szilas uploaded those photos in 2013, I wasn't honest enough to try to ask again if such photos are in line with the policy, so they remained under the radar of anyone who'd want to get them deleted.

Cigaes (2018-09-09T09:34:41Z)

Last year I asked to a guard in Musée d'Orsay why it was forbidden to take photos of some works but not all. The answer was: they were lent by other collections and the museum felt it had to apply the policy imposed by the lender.

Ruxor (2018-09-09T09:24:26Z)

@jonas: Many French museums have adopted similar policies, and I understand that they are of questionable legality. For example, many try to bar visitors from taking pictures, even though it seems that they legally can't do that (see <URL: >, and the study <URL: > it refers to; they can, however, forbid visitors from using a flash). Also, I understand that the Réunion des Musées Nationaux (RMN) got into a legal spat with the Wikimedia Foundation by trying to assert some form of copyright over high-resolution photographs they took of their works (as in: we are providing this high resolution photo of the Mona Lisa, but you can only use it for blah blah blah non commercial blah blah blah) and Wikimedia replying, no, that they can't get any form of copyright by merely reproducing a work of art that is in the public domain; but I didn't follow the details and I don't know if this dispute is settled or ongoing (or exactly what form it took).

jonas (2018-09-09T02:24:06Z)

@Ruxor: Thank you.

And that's why I hate the big museums in Hungary themselves, and not only the politicians who don't give them enough money. I can understand when a museum or library doesn't spend the money they don't have on digitizing their collection. But at least the Nemzeti Múzeum and the Természettudományi Múzeum have this policy where they forbid visitors to take photographs of the objects exhibited by default, but sell a double price ticket that gives you the right to take photographs for personal use only, overriding that default. I can't explain this as just a benevolent policy with rational goals such as trying to protect other visitors of petty inconveniences from people taking photographs, or trying to increase their income a little. (One person argued that once a museum allows you to take photographs, restricting you from later distributing them to the world is illegal and unenforcable, but I'm not convinced.)

Ruxor (2018-09-08T22:41:10Z)

jonas (2018-09-08T14:09:54Z)

Can you offer any thoughts on the 2018-09-02 fire that destroyed most of a huge collection in the National Museum of Brazil?

That one sounds larger scale than all the museum collections that I heared were damaged or destroyed by or war or civil war or negligent politics and lack of money in Hungary. We are yet far from that golden age when we can cheaply digitize and losslessly back up forever all the significant information that we currently store in museum and library collections in various forms of hard to access media, such as paintings, printed books, negative and paper photographs, analog sound and video recordings, sculptures and reliefs, clockwork automata, archaeological artifacts, conserved dead biological specimens. Conserving people so they never have to die is the ultimate goal of course, but in the meantime, we can work on all the easier tasks, racing with time to save as much of the information as we can before some sad event destroys it.

Apokrif (2018-06-22T02:57:24Z)

Il ne reste plus qu'à exploiter toutes ces informations:

jonas (2016-07-18T23:41:18Z)

@Ruxor: Is Bitcoin actually designed in a way that the old information has to be stored forever? Or are people merely storing the old information only for convenience, because it would be hard to modify the Bitcoin libraries to deal with some of the information missing, similarly to how people are copying the contents of every file stored in a git database they clone just because the software doesn't conveniently allow you to not download some of that information?

Ruxor (2016-07-18T22:34:44Z)

@jonas: Funny, I had completely forgotten about this entry… which is ironic when it's about conservation of information, and I guess it's also a reminder that "information is worthless without meta-information", as a friend of mine used to say. Also, I was planning on writing an entry on this topic, so you've saved me the trouble of re-writing what I already had, together with the embarrassment of finding out once more how much I repeat myself.

Maybe I should add a reference to the (semi-humorous) religion of "copyism" ("kopimism"), and also to the "blockchain" element of BitCoin (i.e., a Merkle tree/chain + consensus) which is used to store information permanently and which seems to have gained some attention lately.


My interpretation of Eco's character is that, indeed, he could not resolve himself to destroy the information, or perhaps the book itself (at that time the difference would not have been very clear anyway), and the use as a trap is only secondary; in fact, I think he regrets at least one other character falling into the trap, whereas he is clearly committed to preserving information: I remember him saying at a point, that the whole goal of knowledge is to recapitulate what was previously known (I think the exact quote, in the French translation, is: "il n'y a pas de progrès dans les vicissitudes du savoir, mais seulement une continue — et sublime — récapitulation").

jonas (2016-07-18T21:47:34Z)

In Umberto Eco's novel ''The Name of the Rose'', a character does not want others to read a certain old book, for moral reasons. That old book is very rare, he probably has the only copy. This character restricts access to the book so that nobody can read it, but doesn't destroy the book, even though the latter would probably be much easier.

Do you think this character has a similar motivation for not destroying the book as you talk about here, as in, he thinks that destroying the last copy of the information would be a great crime? Or is what he doing actually against the spirit of this, because keeping the book but not letting anyone access it isn't really how you're supposed to conserve important ancient books? I'm not sure which one of this is true, because the character has another possible motivation for keeping the book, namely, he's using it as a lure to find out which people are interested in the book, for he believes that even being interested in that sort of immoral information is a sin.

Rigolissimo (2005-11-22T02:12:27Z)

Si les noms de characters Unicode ont des fautes d'orthographe, les noms de l'ISO 10646 en français en ont nettement moins et peuvent être corrigées :

Natura non facit saltum (2005-10-12T20:50:59Z)

Dis, Ruxonet, si ce blog ne te sert qu'a stocker de l'information pour usage personnel, pourquoi ne pas plutot faire un fichier non public? Fini la tache ardue d'accepter les debordements de tes lecteurs! ;-)

Nick (2005-10-12T19:15:31Z)

Tiens on est au moins deux motards a lire ce blog…

Sinon, il parrait que les gens ne savent plus discuter sur forum, ils plonkent des qu'ils se font insulter. Je me demande si je ne vais pas en retirer ma prose pour laisser les gens intelligents et distingues entre eux. T'es toujours root sur

Chopinhauer (2005-10-12T17:37:08Z)

Ouf, je me suis aperçu qu'à cause de ces lois il faut ajouter au blog en plus de la politique de privacy (comme pour les e-mails), une politique de effacement des commentaires.

Je crois que Wordpress permet de effacer un commentaire posté toute la durée du cookie de session. C'est quoi ta politique de repentiment?

f3etoiles (2005-10-12T17:31:59Z)

J'ai trouvé ça il y a longtemps quelque part sur le Web :
"Jadis, il y avait un homme. Je lui ressemble un peu, je porte son nom, je possède encore beaucoup de ses affaires et la plupart de ses souvenirs. Mais ce n'était pas moi, et je ne me sens plus responsable, ni de ses opinions, ni de ses actes"

Autre réflexion sur les erreurs du passé : la plupart des grandes figures intellectuelles (Sartre, par exemple) se sont beaucoup trompé, et c'est normal. Peu ont reconnu leurs erreurs, et c'est bien normal aussi. Mais ce qui me déçoit un peu, de la part de ceux qui les ont reconnues, c'est que jamais personne ne remet en doute ses opinions présentes, sous une forme du genre : jadis, j'ai pensé A, pour telles et telles raisons, je me suis trompé (ce que je sais à présent pour telles autres raisons) et je suis désormais convaincu de B *mais je pourrais éventuellement me tromper encore* (et cette hypothétique autocritique pourrait continuer , mais ne révons pas, en ajoutant la liste des raisons qui pourraient à présent induire une nouvelle erreur).

Charly (2005-10-12T16:23:45Z)

Je pense qu'il faut parfois séparer l'information contenue dans le message et son auteur. Effectivement, telle idée aurait pu tout aussi bien germer dans l'esprit d'un autre et il est fort probable qu'une information soit donnée par deux personnes différentes complètement indépendament. En ce sens, l'auteur d'un message n'est pas propriétaire de l'information, tout comme un haut-parleur n'est pas propriétaire du son qu'il donne (on aurait pu utiliser un autre haut-parleur).

Donc selon moi, une personne qui retire toutes ses contributions de la Wikipedia ou efface tous ses échanges de mails ne veut tout simplement plus être associée à ces informations. Je ne crois pas que l'information elle-même soit en cause car je ne la crois ni morale ni immorale, ni vraie, ni fausse mais amorale.

Etre associé ou pas à la diffusion d'une information est un problème personnel de l'auteur qu'il doit régler avec sa conscience. S'il était possible d'effacer complètement l'identité de l'auteur des messages, peut-être que l'auteur lui-même ne souhaiterait plus aussi ardemment qu'ils soient détruits…

De toutes manière, on n'a bien sûr pas encore accès aux informations stockées dans le cerveau des autres, mais on peut faire en sorte que le souvenir se perde petit à petit et je suis convaincu que le pardon et l'oubli ne sont pas forcément complètement dissociables.

Chopinhauer (2005-10-12T16:12:11Z)

Après un démenagement dur et fatiguant à cause de dizaine, voir centaine de kg de papiers, j'ai diminué énormement la quantité d'information qui je conserve.

Quand j'ai du faire le choix de quoi jeter et quoi conserver, je me suis posé la question « Est-ce que cela peut servir à moi (ratachement sentimental) ? Aux autres ? ».

Une chose qui tu n'a pas remarqué dans ton long post est que beaucoup d'informations personnelles ne servent qu'à toi. Beaucoup d'informations qu'on conserve ne peuvent pas être transformés en information utile, guide, manuels, qu'après un travail très chiant. Avec tous les dépliant qui j'ai à la maison je pourrais travailler pour des mois pour en obtenir un médiocre guide turistique. Mes cours du MMFAI sont dans un état si entropique que je dois les jeter, car les informations contenues sont certainement dans des livres.

Ça fait très longtemps qui je n'écris pas dans un cahier mon emploie du temps, car les informations dedans auraient un rapport signal/bruit trop haut. En plus je vais désigner prochainement un Porn Erase Buddy (<URL: >) pour effacer toute trace de moi qui sont inutiles.

Si on conserve trop d'informations on finit comme Paul Valerie : récemment les chercheurs sont arriver à prendre ses cahiers personnels et ils les étudient comme des oeuvres sacrées. Ledits cahiers contient des formules mathématiques, des listes pour les achats, les dépenses pour la femme et toute sorte de trucs qui n'ont même pas une valeur statistique.

Àprès avoir râlé contre la conservation de trop d'information j'avoue que j'ai une base de données avec toute mes dépense pour en faire des statistiques …

Eric Cabrol (2005-10-12T15:59:49Z)

Wikipedia est un projet collaboratif, donc en y contribuant chacun accepte implicitement de voir son effort personnel "ignoré" au profit de la collectivité.
Un écrit individuel, par contre, sur un newsgroup ou une mailing-list, n'a pas cette vocation là. Son contenu est dès lors, pour moi (j'insiste, c'est juste mon point de vue), complètement lié à son auteur.
L'importance de la conservation de l'information est-elle prépondérante sur le respect de la volonté que peut avoir l'auteur d'un propos de modifier/supprimer ce dernier ?

Ruxor (2005-10-12T15:07:08Z)

Je ne crois pas qu'on puisse jamais être “propriétaire” d'une information. (Le terme de “propriété intellectuelle” qu'on trouve souvent est selon moi, au mieux un racourci commode, au pire une fraude intellectuelle pour faire passer comme inaliénables des droits qui sont concédés pour des raisons pratiques. Mais j'ai déjà discuté de ça souvent et je ne veux pas y revenir.)

Le fait est que dans une discussion à plusieurs, quelqu'un fait une remarque, un autre rebondit dessus et un troisième, peut-être, s'abstient d'intervenir parce que le premier a dit ce qu'il comptait dire. Retirer les contributions du premier, dans ce cadre, est une fraude intellectuelle car cela déforme les contributions de tous les autres participants et cela brise la discussion sur laquelle, peut-être, ils comptaient.

Le même problème se poserait sur la Wikipédia. Par exemple, si quelqu'un décide qu'il veut que toutes ses contributions à la Wikipédia soient effacées (y compris si ce ne sont pas les dernières sur l'article, à charge pour l'administrateur de s'arranger pour qu'il ne reste plus un mot de lui ni dans l'historique ni dans l'article final), je considère que c'est inadmissible car le document a été une base de travail pour d'autres, que certains n'ont pas écrit un texte puisque ce texte avait déjà été écrit, bref, ce n'est pas parce que Paul a contribué à un article qu'il doit se sentir “propriétaire” de ces mots. La Wikipédia, concrètement, se protège en écrivant en petits caractères que toutes les contributions sont placées sous je ne sais quelle licence irrévocable (la GFDL probablement, ou peut-être la LGPL, je ne sais plus bien), mais je ne suis pas sûr que cela tiendrait vraiment devant une cour de justice. La faute en est clairement aux lois qui ne tiennent rigoureusement aucun compte de cet impératif important qu'est celui de la conservation de l'information.

Eric Cabrol (2005-10-12T14:10:40Z)

Le fait que je me reconnaisse parfaitement dans ta premiere phase m'intrigue, moi qui suis en train de me demander si je n'ai pas bien plus de traits de geekness que je ne l'imagine … Mais je voulais surtout rebondir sur le reproche à peine voilé que tu fais au contributeur qui efface ses anciens messages. Lui est le "propriétaire" de ses écrits, à la différence d'un héritier d'Hugo qui n'en serait, il me semble, que l'usufruitier.
Pour en avoir discuté avec certains qui pratiquent le X-No-Archive sur Usenet, leur vision est qu'un message ne représente que ce que pense son auteur à un moment donné, dans un contexte donné. Les conserver, c'est prendre le risque de les voir détournés de leur signification originelle.
Ca n'est pas forcément mon point de vue (dans la mesure ou j'essaie de ne dire sur le net -et ailleurs- que ce qu'il ne me sera pas trop difficile d'assumer plus tard), mais ca peut se comprendre …

Ruxor (2005-10-12T12:42:18Z)

Le pardon, c'est quelque chose qui s'apprend, ce n'est certes pas facile, mais ce n'est pas en refusant de faire sa paix avec le passé qu'on va pouvoir y arriver. Il faut apprendre à considérer que le Pierre d'aujourd'hui n'est pas forcément le Pierre d'il y a cinq ans, et peut-être a aussi peu de rapport avec lui qu'il en a avec le Paul d'aujourd'hui, il est juste l'héritier involontaire de ses souvenirs et de ses actions ; et dans ce sens, effacer les traces qu'on a du Pierre d'il y a cinq ans n'est certainement pas la meilleure façon de prendre conscience de la différence, car cela empêche aussi qu'on compare pour voir la différence.

De toute façon, les gens ont généralement la mémoire de mauvaise foi, car ils ont la rancune plus tenace que la reconnaissance.

Anonymous Coward (2005-10-12T12:31:32Z)

> En ce moment, un contributeur du forum de discussion
> interne de l'ENS est en train de rechercher tous ses
> messages et de les effacer […] et cela donne
> l'impression qu'il renie tout ce qu'il a jamais dit

David, tu demandes une chose on ne peut plus difficile : accepter les erreurs du passé (ou du moins ce qui semble aujourd'hui avoir été des erreurs).

Non seulement faut-il que chacun porte sa propre croix, il faut de plus que les autres ne lui jettent pas des pierres.

Toi David, je puis en témoigner, tu es né avec le pardon en toi. En est-il de même pour les autres ? J'ai effacé tous les courriers électroniques que nous avons échangé : je ne veux plus savoir ce que toi ou moins avons dit. Ma mémoire certes fugace est déjà pleine de souvenirs, images, mots qui altèrent imperceptiblement mon jugement à ton sujet. Je ne juge pas les arguments que j'ai sous les yeux et qui accessoirement proviennent d'un certain David Madore. Je juge le souvenir de celui que tu étais et tes arguments comme signes de l'évolution de l'image que je me suis faite de toi pendant toutes ces années.

Et cette idée me semble absolument terrifiante.

Et je détruis avec zèle tout ce qui pourrait éloigner mon jugement de la perception la plus brute.

Car moi, je ne suis pas né avec le pardon en moi.

Joël (2005-10-12T10:49:30Z)

> En revanche, il y aussi des problèmes : le plus embêtant, c'est que les législateurs n'ont pas le même sens moral que ceux qui accordent une si haute valeur à la conservation de l'information.

Oui, c'est assez incroyable. Dans les annexes du formulaire de déclaration normale de la CNIL, à la rubrique « durée de conservation sur support informatique », il y a une note indiquant « Cette durée ne peut être illimitée ; elle est définie en fonction de la finalité du traitement ». Il serait amusant de savoir pendant combien de temps la CNIL conserve les déclarations qui lui sont remises (puisqu'elles font elles-mêmes objet d'un traitement informatisé…).

Peut-être que l'annuaire des élèves de l'ENS devrait essayer de faire valoir que sa finalité est une œuvre artistique collective multi-supports à laquelle participe chaque personne remplissant une fiche, la législation serait peut être encore plus abracadabrante, mais au moins la loi n'organiserait pas la <hum hum> destruction des données…

Sam (2005-10-12T10:46:01Z)

Un autre domaine ou l'on souhaite vraiment conserver l'information, c'est celui du logiciel. Les machines naissent et meurent, et malheureusement, les logiciels meurent souvent avec elles. Ici, la conservation est double: conserver le source (et les binaires) des programme, mais aussi conserver la possibilité de les executer dans un environnement aussi proche que possible de l'environnement originel. C'est heureusement aujourd'hui souvent possible par émulation du hardware. C'est peut-être encore plus difficile à expliquer aux autres (et même aux informaticiens), mais pouvoir faire tourner ITS ou TOPS-20 aujourd'hui, avec les logiciels d'époque tout à fait utilisables, c'est véritablement fabuleux. Avec la particularité que ces logiciels n'ont pas à rester figés; du moment que les anciennes versions sont conservées, ce n'est certainement pas sacrilège de rajouter une couche IPv6 à ITS! ;-)

fred (2005-10-12T10:05:11Z)

C'est certain que la protection de l'individu doit être faite non pas vis-à-vis de l'information mais vis-à-vis de l'usage qui en est fait.

Néanmoins, l'être humain étant ce qu'il est, et devant la difficulté de recenser tous les usages possibles de données personnelles (et également la difficulté encore plus grande de mettre tout le monde d'accord sur ce qui est acceptable en la matière ou pas), il est souvent nécessaire en pratique de s'intéresser tout simplement à la question "qui a accès à cette information ?".

On peut le regretter, parcequ'en effet dans un monde idéal tous les pays du monde auraient une loi unique acceptée d'un point de vue moral par tous qui régule ce qu'il est légal de faire avec les données personnelles. Mais même là, ce serait insuffisant parceque quand on a connaissance d'un fait, on ne peut l'oublier volontairement.

Un exemple tout simple : un entreprise a accès à des données sur les opinions politiques ou sur les moeurs d'un candidat à l'embauche. Ces opinions ou ces moeurs sont extrêmement choquantes pour le dirigeant de l'entreprise qui a le dossier sous les yeux. Il est discriminatoire de sa part de rejeter le dossier sur cette base, cependant ce qu'il sait il ne peut l'oublier, et là on est devant un problème insoluble, car il est impossible de déterminer si les motifs qui l'ont conduits à choisir un autre candidat sont de nature discriminatoire ou dictés par un choix "normal". Si ça se trouve lui même est dans l'incapacité de connaitre la réponse à cette question.
De plus si il embauche la personne, les rapports professionnels qu'il aura seront nécessairement faussés et le problème se reposera tous les jours.

Enfin bref, je suis moi aussi attaché à la conservation des données, mais je ne pense pas que les objectifs "officiels" de la CNIL soient ridicules, même si en pratique la plupart de leurs décisions le sont.

Pascal (2005-10-12T08:31:26Z)

Le plus gros problème ne me paraît pas juridique, mais technique : les tablettes gravées sont inaltérables, les parchemins quasiment, le papier supporte assez bien quelques siècles, mais les système modernes (CD, DVD, DAT, etc) deviennent illisibles au bout de quelques décennies seulement. Soit par altération du support, soit par disparition de la machine capable de les lire. J'en sais quelque chose, moi qui ait dû travailler sur des données satellites datant de 1973 et sauvegardées sur… cartes perforée !

Popsi-Cola (2005-10-12T05:24:32Z)

Tiens? Il n'y a rien de prévu pour les erreurs dans les noms de caractères Unicode? Même pas une possibilité de donner un deuxième nom à un caractère (en marquant le mauvais comme obsolète)? Un peu surprenant.

