David Madore's WebLog

Vous êtes sur le blog de David Madore, qui, comme le reste de ce site web, parle de tout et de n'importe quoi (surtout de n'importe quoi, en fait), des maths à la moto et ma vie quotidienne, en passant par les langues, la politique, la philo de comptoir, la géographie, et beaucoup de râleries sur le fait que les ordinateurs ne marchent pas, ainsi que d'occasionnels rappels du fait que je préfère les garçons, et des petites fictions volontairement fragmentaires que je publie sous le nom collectif de fragments littéraires gratuits. • Ce blog eut été bilingue à ses débuts (certaines entrées étaient en anglais, d'autres en français, et quelques unes traduites dans les deux langues) ; il est maintenant presque exclusivement en français, mais je ne m'interdis pas d'écrire en anglais à l'occasion. • Pour naviguer, sachez que les entrées sont listées par ordre chronologique inverse (i.e., celle écrite en dernier est en haut). Cette page-ci rassemble les dernières 20 entrées (avec un lien, à la fin, pour les plus anciennes) : il y a aussi un tableau par mois à la fin de cette page, et un index de toutes les entrées. Certaines de mes entrées sont rangées dans une ou plusieurs « catégories » (indiqués à la fin de l'entrée elle-même), mais ce système de rangement n'est pas très cohérent. Le permalien de chaque entrée est dans la date, et il est aussi rappelé avant et après le texte de l'entrée elle-même.

You are on David Madore's blog which, like the rest of this web site, is about everything and anything (mostly anything, really), from math to motorcycling and my daily life, but also languages, politics, amateur(ish) philosophy, geography, lots of ranting about the fact that computers don't work, occasional reminders of the fact that I prefer men, and some voluntarily fragmentary fictions that I publish under the collective name of gratuitous literary fragments. • This blog used to be bilingual at its beginning (some entries were in English, others in French, and a few translated in both languages); it is now almost exclusively in French, but I'm not ruling out writing English blog entries in the future. • To navigate, note that the entries are listed in reverse chronological order (i.e., the latest written is on top). This page lists the 20 latest (with a link, at the end, to older entries): there is also a table of months at the end of this page, and an index of all entries. Some entries are classified into one or more “categories” (indicated at the end of the entry itself), but this organization isn't very coherent. The permalink of each entry is in its date, and it is also reproduced before and after the text of the entry itself.

[Index of all entries / Index de toutes les entréesLatest entries / Dernières entréesXML (RSS 1.0) • Recent comments / Commentaires récents]

Latest entries / Dernières entrées publiées:

↓Entry #2794 [older| permalink|newer] / ↓Entrée #2794 [précédente| permalien|suivante] ↓

(vendredi)

Le déclin des libertés fondamentales

Il y a des élections européennes après-demain, et je pense que je vais voter pour le Parti pirate.

Ils n'ont absolument aucune chance d'atteindre les 5% nécessaires en France pour entrer au parlement, donc cela revient fonctionnellement presque pareil que de voter blanc (à la différence importante près que comme les 5% sont calculés sur les suffrages exprimés[#][#2], voter pour une liste qui n'aura finalement pas de siège est aussi, par rapport à voter blanc, une façon de pénaliser les listes proches de 5% : il est possible que ceci soit dans mes intentions, mais ce n'est pas ce dont je veux parler ici). Il est heureusement plausible que d'autres pays envoient des députés du Parti pirate au Parlement européen (il y en a actuellement quatre, trois venus de République tchèque et un d'Allemagne ; par le passé, la Suède en a aussi envoyé) ; cela traduit d'ailleurs peut-être quelque chose sur la France[#3] qu'ils n'aient aucune chance ici alors que dans d'autres pays c'est au moins imaginable.

[#] Comme d'habitude, la loi électorale française à ce sujet est tellement mal écrite que c'est criminel. (Déjà, je me demande ce qu'elle fait à ne pas être dans le Code électoral : incompétence habituelle du législateur qui pond ses merdes sur le bas-côté sans prendre la peine de nettoyer après.) Le chiffre est en l'occurrence dans l'article 3 : cet article explique quoi faire en cas d'égalité parfaite dans les calculs, situation qui a essentiellement zéro chances d'arriver, mais n'explique pas ce qu'on doit faire si aucune liste ne dépasse les 5%, chose qui n'est pas forcément si invraisemblable que ça (même si ça n'arrivera pas ce dimanche). D'ailleurs, s'il y a une seule liste qui dépasse les 5%, veut-on vraiment attribuer tous les sièges à celle qui aurait fait 5.01% alors que toutes les autres font 4.99% ? Est-ce que les gens qui ont écrit ce texte ont un peu réfléchi à ce qu'ils écrivaient ? (Dans d'autres élections avec un seuil, par exemple pour passer au second tour, on qualifie d'office les deux candidats arrivés en tête, donc le texte pourrait prévoir une répartition entre les listes dépassant 5% ainsi que les deux [ou trois] listes ayant obtenu le plus de voix.)

[#2] Notons au sujet de ce seuil d'entrée au parlement européen qu'en Allemagne, la loi électorale prévoyait un seuil à 3% mais que la Cour constitutionnelle fédérale a invalidé cette clause en 2014 comme contraire au principe constitutionnel d'égalité électorale (elle avait déjà invalidé une clause à 5% en 2011 pour la même raison). Le raisonnement de la Cour, pour autant que je comprends, est que s'il est acceptable de mettre un seuil sur les élections à la proportionnelle pour entrer à la diète fédérale allemande (Bundestag) car il est essentiel de pouvoir former une coalition gouvernementale et que les seuils d'entrée évitent le morcellement des partis, ce raisonnement ne s'applique pas au parlement européen en l'état actuel. Je mentionne ça parce que c'est pertinent pour ce que je raconte dans ce billet : on peut trouver bizarre qu'en Allemagne il soit jugé contraire au droit fondamental d'égalité devant les élections de mettre un seuil de 5%, ou même de 3%, pour les élections au parlement européen, alors qu'en France, pour les mêmes élections au même parlement, ça ne pose apparemment pas de problème. La situation est encore compliquée par le fait que certains cherchent (ou ont cherché ? je n'ai pas compris où en est cette affaire) à faire entrer la mention d'un seuil minimal à 2% dans l'acte européen à ce sujet (lequel primerait sur le droit national, fût-il constitutionnel) : voyez ici pour un résumé de tout ce bordel.

[#3] Bon, deux des choses que ça dit c'est d'une part qu'en France il y a un bulletin par liste, à imprimer aux frais de la liste (donc le Parti pirate n'en a pas parce qu'il n'a pas les sous, donc personne ne vote pour lui parce qu'il faut imprimer son propre bulletin à l'avance), plutôt qu'un bulletin unique sur lequel on coche une case comme dans beaucoup d'autres pays ; et, d'autre part, qu'il y a ce fameux seuil de 5% sur l'élection à la proportionnelle, au sujet duquel je renvoie aux deux notes précédentes. Mais il y a sans doute d'autres facteurs qui jouent, parce que même sans seuil à 5% il est peu vraisemblable que le Parti pirate puisse élire un député européen en France. Le nom ridicule y est peut-être pour quelque chose, mais il est le même ailleurs en Europe. Il y a peut-être le fait que la France a toujours eu une attitude extraordinairement traditionaliste sur les questions de propriété intellectuelle (au motif, notamment, de la fameuse « exception culturelle française » qui fait du ministère de la culture une sorte de ministère du lobbying pour le copyright), mais je ne sais pas si cette attitude déteint vraiment sur le grand public qui, après tout, doit partager des mèmes et des vidéos sur Internet autant que dans d'autres pays. L'éléphant au milieu de la pièce, c'est surtout l'accès aux médias et, à travers eux, au discours public.

Ce n'est pas que je sois parfaitement aligné avec la totalité du programme du Parti pirate (leur idée de démocratie directe, par exemple, me semble être un mirage, et j'ai déjà raconté sur ce blog ce que je pensais du referendum ; et surtout je n'apprécie vraiment pas leur positionnement en faveur des cryptoscams), programme qui part d'ailleurs parfois un peu dans tous les sens (enfin, ce n'est pas comme si tous les programmes de toutes les listes ne partaient pas dans tous les sens[#4] !). Mais j'ai quand même été très favorablement impressionné par le travail mené par le député pirate européen (envoyé par l'Allemagne) Felix Reda[#5] entre 2014 et 2019, notamment la recherche de compromis qu'il a menée sur la directive européenne sur le copyright. Vous n'avez jamais entendu parler ni de lui ni de cette directive ? Ça fait justement partie du problème que je veux évoquer ici. (Ça et l'idée répandue chez le grand public que le copyright est quelque chose d'extrêmement technique et qui ne les concerne pas du tout : ce qui montre que le grand public, qui passe quand même beaucoup de temps à créer, modifier et partager des contenus sur Internet, ne se rend pas compte de combien les lois sur le copyright le concernent, sinon directement par les contenus qu'il échange, du moins indirectement par les actions, par exemple de modération, qu'elles imposent aux plateformes sur lesquelles il partage ces contenus ou en consomme.)

[#4] Et puis quand on compte le nombre de notes et de digressions de ce billet, je suis mal placé pour critiquer ça part dans tous les sens.

[#5] Il était connu à l'époque sous un autre genre et un autre prénom (Julia — je le mentionne parce que ça peut aider à chercher).

Disons que j'ai aussi l'impression que le Parti pirate est le seul qui soit véritablement attaché aux libertés fondamentales pour elles-mêmes (et pas comme un outil commode quand elles vont dans le sens politique qu'on veut et qu'on va ensuite laisser tomber quand elles nous embêtent). C'est peut-être parce que je n'ai pas un positionnement politique très clair et que je suis plus attaché aux principes généraux que j'apprécie de voir quelque chose de ce style chez eux. C'est peut-être aussi, bien sûr, parce qu'ils n'ont jamais été au pouvoir et ne le seront sans doute jamais : il est indéniable que la réalité puante du pouvoir corrompt même des gens initialement bien intentionnés ; car quand on est au gouvernement, on découvre soudainement que les libertés fondamentales sont des protections contre vous[#6] et votre pouvoir de police. Les libertés fondamentales peuvent être un idéal quand on n'est pas au pouvoir et devenir bizarrement une nuisance quand on y est.

[#6] Point de grammaire sans rapport avec le fond : je n'ai jamais su quel est censé être la forme objet/oblique du pronom indéfini on en français. Si je prends la phrase quand nous sommes au pouvoir, nous nous rendons compte que les libertés fondamentales du citoyen les protègent contre nous, donc nous ciblent directement et que j'essaie de la formuler avec on (je parle du on indéfini, pas du on mis pour dire nous, justement), je dois dire quoi ? quand on est au pouvoir, on se rend compte que les libertés fondamentales du citoyen les protègent contre [???], donc [???] ciblent directement — c'est vraiment moche dans tous les cas, mais vous semble le moins horrible ici. (La question est évoquée par Grevisse dans Le Bon usage, §754(e), mais, comme d'habitude, sans vraie réponse.)

Prenons à titre d'exemple un point précis concernant les droits fondamentaux qu'il me semble pertinent à évoquer à l'approche des élections européennes : la proposition de chat control (= règlement CSAR) par la Commission européenne, qui consisterait à rendre obligatoire un contrôle du contenu des conversations privées par mail ou messagerie instantanée sur smartphone des Européens (je parle de Signal, Whatsapp, Telegram, ce genre de choses, et bien sûr aussi les messageries privées intégrées dans Facebook, Twitter, etc.). L'objectif affiché est de lutter contre les contenus pédopornographiques, et le moyen proposé est essentiellement de mettre en place un scan obligatoire de toutes les communications électroniques de tous les Européens pour vérifier qu'ils ne s'échangent pas de contenus illégaux. Les détails sont flous parce que, au moment où j'écris, la proposition est en cours de négociation entre la Commission, le Conseil et le Parlement européens, donc le contenu exact de la proposition change (et il est très très difficile de suivre l'avancement de ce genre de négociations), donc je vous renvoie à cette page du député européen (pirate[#7], justement) Patrick Breyer pour plus de détails, ou encore ces explications par La Quadrature du Net. Certaines versions de la proposition sont un petit peu moins dystopiques que d'autres (le Parlement européen dans sa composition actuelle ne semble pas prêt à voter les pires versions du texte), mais dans tous les cas il est question, sous prétexte de protéger les petits enfants, d'aller à l'encontre du droit du secret de la correspondance en imposant des logiciels mouchards sur tous les smartphones qui vont chercher à savoir[#8] si les images que vous échangez ne ressemblent pas[#9] à des photos d'enfants nus.

[#7] Dont j'espère qu'il sera réélu au moins pour que je puisse continuer à être informé sur ce dossier.

[#8] Le discours des partisans d'un tel contrôle est, bien sûr, que si vous n'êtes pas un pédophile vous n'avez aucune raison de vous émouvoir d'un tel contrôle (ce qui suggère d'ailleurs insidieusement la contraposée : si vous vous en émouvez, c'est suspect !). Mais rappelons que même si on n'est pas attaché au principe général du secret de la correspondance (qui, fatalement, doit s'appliquer à tous, même les criminels), de tels filtres automatisés viennent forcément avec des chances de faux positifs. Je pourrais par exemple renvoyer à cette histoire, aux États-Unis, d'un père qui a pris sur son smartphone des photos de son bambin nu pour les montrer à son médecin (parce que l'enfant avait une inflammation du pénis) : quand il a fait des sauvegardes dans le cloud, les filtres automatisés de Google on signalé ces images à la police, et même s'il n'a finalement pas fait l'objet de poursuites légales, il a subi une enquête policière et, surtout, son compte Google a été fermé définitivement (y compris son courrier GMail) : il était évidemment impossible de se faire entendre de qui que ce soit chez Google, et par ricochet il a perdu l'accès à énormément de données (comme plein d'autres photos personnelles et parfaitement innocentes), à d'autres comptes, etc. (J'ai évoqué ces problèmes de ricochet dans ce billet passé.) Bref, le discours si vous n'avez rien à cacher, vous n'avez rien à craindre, en plus d'être insidieux, est tout simplement faux, surtout si la police est faite, dans la pratique, par des outils automatisés dont personne ne comprend bien le fonctionnement, et contre lesquels il est impossible de faire appel sans tomber dans un monde parfaitement kafkaïen. Même si vous n'avez pas d'images pédophiles sur votre smartphone, vous avez peut-être des images que des IA stupides vont prendre pour des images pédophiles !

[#9] Pour une certaine définition de ressembler. Je suis sûr qu'il est techniquement possible de faire des images de chats qui sont délibérément modifiées juste comme il faut pour qu'elles apparaissent comme des images pédophiles à tel ou tel filtre qui les détecte (i.e., des faux positifs adversariaux). Et ensuite s'arranger pour faire parvenir anonymement ces images à des gens dont on veut faire fermer le compte Google. C'est une sorte de forme de swatting, si on veut.

↑Entry #2794 [older| permalink|newer] / ↑Entrée #2794 [précédente| permalien|suivante] ↑

↓Entry #2793 [older| permalink|newer] / ↓Entrée #2793 [précédente| permalien|suivante] ↓

(dimanche)

De la beauté et symétrie de la configuration de Desargues

Le théorème de Desargues, que je veux présenter ici, est à la fois un des plus simples et selon moi un des plus jolis et des plus importants de la géométrie plane. Simple, parce qu'il n'est question que de points et de droites (pas de distances, d'angles, de cercles ni de quoi que ce soit du genre, même pas de parallélisme ou de perpendicularité : on dit que c'est un théorème de « géométrie projective »), et parce qu'il n'y a qu'un petit nombre de points impliqués (c'est quasiment le plus simple possible). Joli pour les raisons que je vais essayer d'expliquer, qui tiennent largement à sa symétrie. Et important parce qu'il est un des axiomes de certaines présentations de la géométrie projective. Pourtant, il ne fait pas du tout partie de l'enseignement de la géométrie en France (certainement pas à l'école primaire, mais pas non plus au collège, ni au lycée, ni même dans les classes préparatoires aux grandes écoles). Je vais essayer de parler un peu[#] de ce théorème, et de la « configuration » de points et de droites qu'il définit, en faisant plus d'efforts que d'habitude pour rester compréhensible par le grand public, au moins au début de ce billet, quitte à reléguer des considérations plus techniques en appendice. (Vais-je pour autant arriver à être compréhensible ? à vous de me dire.) En plus, pour changer des billets de ce blog qui sont généralement du pur texte, vous aurez droit à des illustrations, qui, j'espère, rendent les choses plus compréhensibles ! (Que demande le peuple ?) Notez que vous pouvez cliquer sur n'importe laquelle de ces images pour l'agrandir (et comme elles sont quasiment toutes vectorielles, vous pouvez utiliser quelque chose comme control-+/control-− dans votre navigateur pour zoomer ou dézoomer).

[#] Enfin, un peu est une façon de parler, parce que j'ai passé un temps totalement déraisonnable à écrire ce billet (ce qui explique, comme souvent, que la fin soit sans doute un peu bâclée parce que j'en ai eu vraiment marre).

Table des matières

Théorème de Desargues et configuration de Desargues

☞ L'énoncé du théorème de Desargues

[Schéma illustrant le théorème de Desargues]Bon, alors que dit le théorème de Desargues ? Si on aime l'exercice de formuler les maths avec des phrases en français en évitant d'introduire des notations, on peut le dire ainsi :

Deux triangles ont un centre de perspective si et seulement si ils ont un axe de perspective.

Qu'est-ce que ça signifie ?

La figure ci-contre illustre la situation : les deux triangles ABC₁ (en rose sur la figure) et ABC₂ (en orange sur la figure) sont dits avoir un centre de perspective lorsque les trois droites reliant les sommets de même nom, c'est-à-dire les droites AA₂, BB₂ et CC₂ (en vert sur la figure), concourent[#2], leur point de concours, que j'ai appelé O, étant alors appelé le « centre de perspective » des deux triangles. (Je vais tenter de justifier ce terme, mais on peut s'imaginer que les deux triangles sont dans l'espace et que si on place son œil en O les deux triangles coïncident visuellement.) Pour ce qui est de l'autre notion, il faut considérer les intersections des côtés de même nom des triangles, c'est-à-dire l'intersection des droites BC₁ et BC₂ (appelons-la U), l'intersection des droites CA₁ et CA₂ (appelons-la V) et l'intersection des droites AB₁ et AB₂ (appelons-la W), que j'ai représentées en bleu sur la figure. Lorsque ces trois points (U,V,W) sont alignés[#3], les deux triangles sont dits avoir un axe de perspective, et l'axe en question est la droite qui les relie (la droite bleue sur ma figure).

[#2] On dit que des droites concourent en un point lorsqu'elles passent par ce point (on dit aussi qu'elles sont incidentes à ce point, ou que ce point est incident aux droites, mais le verbe concourir peut s'utiliser pour les droites seules, pourvu qu'il y en ait au moins trois : un tas de droites concourent, ou sont concourantes lorsqu'elles passent toutes par un même point, qu'on appelle fort logiquement leur point de concours).

[#3] On dit que des points sont alignés lorsqu'il y a une droite qui passe par tous ces points.

Le théorème de Desargues, donc, dit que ces deux situations sont équivalentes : si les deux triangles ont un un centre de perspective, alors ils ont un axe de perspective, et réciproquement, si les deux triangles ont un un axe de perspective, alors ils ont un centre de perspective. Une fois le théorème acquis, on peut dire que les triangles sont en perspective pour désigner cette situation.

☞ La configuration de Desargues

[Schéma illustrant la configuration de Desargues]Et lorsque c'est le cas, les 10 points de la figure, c'est-à-dire les sommets A₁,B₁,C₁ et A₂,B₂,C₂ des deux triangles, le centre de perspective O et les trois points U,V,W dont l'alignement définit l'axe de perspective, forment ce qu'on appelle une configuration de Desargues. Notons qu'il y a aussi 10 droites dans l'histoire, et il faut considérer qu'elles font elles aussi partie de la configuration : les côtés des deux triangles (i.e., les droites qui les portent), l'axe de perspective, et les trois droites dont le concours définit le centre de perspective. Donc 10 points et 10 droites, et on remarquera que chacun des 10 points de la configuration est sur 3 droites, et chacune des 10 droites de la configuration passe par 3 points. J'ai représenté la configuration (enfin, une configuration) de Desargues ci-contre à gauche, en retirant toutes les étiquettes et couleurs de la figure illustrant le théorème plus haut (et en prolongeant les droites indéfiniment), mais c'est vraiment la même que celle de la figure précédente, je vais en reparler. Ma façon de présenter la configuration à partir du théorème laisse penser que certains points ou droites jouent un rôle différent des autres (le centre de perspective a l'air très spécial), mais en fait non, et je vais tenter de l'expliquer plus bas — tous les points et toutes les droites jouent en fait le « même rôle » dans cette configuration.

☞ Histoire de la perspective et géométrie « projective »

Mais revenons d'abord un peu au théorème lui-même.

Il est nommé d'après le géomètre et architecte lyonnais Girard Desargues (1591–1661), dont on ne sait pas grand-chose, mais l'énoncé apparaît semble-t-il[#4] dans un livre sur la perspective publié en 1647 par le graveur Abraham Bosse.

[#4] Je dis semble-t-il parce que je n'ai pas moi-même trouvé quelque chose ressemblant à l'énoncé dans le texte que je viens de lier sur Gallica, mais il est vrai que c'est très difficile de s'y retrouver, surtout que le texte n'est pas cherchable, que le livre n'a pas d'index, que j'ignore quelle terminologie serait utilisée, que je ne sais pas si ce serait énoncé comme un fait général ou à travers des exemples, etc. Donc je ne peux pas donner de référence plus précise. Mais ce qui est certain, c'est que Desargues semble avoir bien compris les principes de la perspective d'une manière qui permettrait le développement ultérieur de la géométrie projective — et aussi de la géométrie descriptive. Et on trouve essentiellement la figure ci-dessus à la planche 155 entre les pages 340 et 341, ici sur Gallica, à ceci près qu'il y a deux triangles à la fois : les triangles OAB et oab, ou bien ABD et abd, de cette planche sont en perspective au sens que j'ai défini ci-dessus, le point K de la planche étant ce que j'ai appelé le centre de perspective, et la droite par les points 2,3,4,7,5,8 étant ce que j'ai appelé l'axe de perspective.

↑Entry #2793 [older| permalink|newer] / ↑Entrée #2793 [précédente| permalien|suivante] ↑

↓Entry #2792 [older| permalink|newer] / ↓Entrée #2792 [précédente| permalien|suivante] ↓

(dimanche)

Star Wars, Nathan le Sage et autres ambigrammes sémantiques

✱ Avertissement : ce billet contient, dès le début, des divulgâchis majeurs sur les deux œuvres mentionnées dans le titre.

Si je vous raconte une histoire comme ça :

Un jeune chevalier orphelin qui combat un puissant seigneur rencontre un vieil homme sage qui lui servira de mentor, et sauve une jeune femme qui a elle aussi été adoptée : il commence à tomber amoureux de cette dernière, mais plus tard ils découvrent qu'ils sont, en fait, frère et sœur, et qu'ils sont aussi les héritiers du puissant seigneur qui n'est, après tout, pas si méchant que ça.

Vous pensez à quoi ?

Bon, évidemment, avec le titre que j'ai donné à ce billet et avec l'avertissement en tête, ma question n'en est pas vraiment une. Mais le fait est que j'ai posté la question (certes le 4 mai et pas par hasard) sur Twitter et BlueSky, et qu'on m'a répondu, comme je l'attendais, Star Wars.

En fait, c'est un résumé de la pièce de 1779 de G. E. Lessing, Nathan le Sage (Nathan der Weise puisqu'il n'y a pas de raison que je cite une œuvre dans son titre original et pas l'autre). Je recommande très vivement cette pièce, d'ailleurs, qui est à la fois très belle et très amusante et qui vaut la peine d'être lue (ou vue au théâtre) même maintenant que je vous l'ai copieusement divulgâchée. Thomas Mann la considérait apparemment comme un des sommets de la littérature et culture allemandes. C'est une pièce qui se passe à Jérusalem pendant la troisième croisade, et c'est une touchante[#] invitation à la tolérance religieuse (le puissant seigneur est le sultan Saladin, le vieux sage est le Juif Nathan qui donne son nom à la pièce, et la jeune héroïne et le jeune héros sont la fille adoptée de Nathan, Recha, et un chevalier templier), et à la réconciliation en temps de guerre : raison pour laquelle la pièce est, d'ailleurs, de temps en temps donnée au moyen-orient avec des troupes formées de représentants des trois grandes religions abrahamiques. (La pièce est parfois comparée au Marchand de Venise pour contraster les représentations du Juif Nathan de Lessing et Shylock de Shakespeare, ou au contraire pour les rapprocher.) Et si on aime les coups de théâtre, l'intrigue est pleine de rebondissements (j'en ai listé quelques uns ci-dessus mais ce ne sont pas les seuls).

[#] Je suis peut-être facilement ému, mais il y y a vraiment des passages qui me donnent les larmes aux yeux.

Alors certes le résumé ci-dessus est un peu fragmentaire : non seulement je n'ai pas donné le contexte (que je viens de rappeler au paragraphe précédent), mais j'ai sauté à la fin sans raconter certaines des péripéties de l'intrigue (comment on essaie d'enlever Recha, même si là aussi j'aurais peut-être pu faire des efforts pour raconter ça de manière à ressembler à l'histoire de Star Wars), et je n'ai pas parlé de ce qui est sans doute le passage le plus célèbre de la pièce (mais à mon avis pas le meilleur), la parabole de l'anneau[#2]. Et puis bon, voilà, je suis obligé de dire héritiers (en anglais, next of kin je trouve que ça passe mieux) parce que dans Nathan le Sage ce n'est pas je suis ton père, c'est je suis ton oncle, sans doute parce que Lessing ne voulait pas trop déformer l'histoire (le Saladin historique a eu des enfants, ils n'apparaissent pas du tout dans la pièce).

[#2] Oui, il y a aussi une histoire d'anneau, mais pour le coup ça ne ressemble pas du tout au Seigneur des anneaux — même si vous pouvez essayer de faire un ambigramme sémantique là-dessus si ça vous chante.

Néanmoins, il me semble que la ressemblance est un peu plus que vague et anecdotique (je vais revenir sur la question de comment juger ça). Ne serait-ce que le fait que je me sois senti obligé de commencer ce billet en disant que j'allais divulgâcher Star Wars et Nathan le Sage le suggère quand même assez fortement.

Des gens m'ont répondu que oui, c'est normal, Star Wars suit le schéma du monomythe, il n'a rien d'original, ce sont des thèmes qu'on retrouve partout, mais il me semble que cette réponse est vraiment à côté de la plaque : si je raconte une histoire comme ceci (je recopie la description du monomythe de Wikipédia) :

Un héros s'aventure à quitter le monde du quotidien pour un territoire aux prodiges surnaturels : il y rencontre des forces fabuleuses et y remporte une victoire décisive. Le héros revient de cette mystérieuse aventure avec la faculté de conférer des pouvoirs à ses proches.

— je pense que personne n'y reconnaîtra Star Wars, ni Nathan le Sage (auquel ça ne colle d'ailleurs pas vraiment), ni quoi que ce soit de précis tellement tout ceci est désespérément vague. En tout cas, personne ne trouvera que j'ai divulgâché quoi que ce soit. Je trouve qu'il faut une sacrée dose de mauvaise foi pour prétendre que le résumé que je fais plus haut dans ce billet est aussi abstrait et vaseux que ça. L'histoire du monomythe s'applique à tout et n'importe quoi. Mon résumé de Nathan le Sage s'applique aussi à Star Wars mais pas à un million de choses (certes, on m'a suggéré que ça ressemblait un peu à La Flûte enchantée ou encore à la pièce de Voltaire L'Orphelin de la Chine, mais dans les deux cas c'est beaucoup plus lointain et notamment l'histoire de frère et de sœur séparés à leur naissance est absente).

Maintenant, il reste quand même trois possibilités, évidemment pas nettement séparées, entre lesquelles trancher (j'ai posé la question sur le StackExchange de science-fiction dont je n'attends cependant pas grand-chose) :

  1. George Lucas a lu Nathan le Sage (ou du moins on lui en a raconté l'histoire, ou on lui a raconté une histoire elle-même inspirée de la pièce de Lessing) et il s'en est inspiré (pas forcément consciemment).
  2. C'est une coïncidence.
  3. Ce n'est même pas une coïncidence, on peut trouver des ressemblances de ce genre entre deux œuvres à peu près quelconques.

Tous les gens avec qui j'en ai parlé semblent convaincus de (3), à tel point que j'ai l'impression que l'Univers essaie de me gaslighter[#3], et c'est fort désagréable. Comme n'importe quel sujet est bon pour justifier un billet de blog, je me positionne fièrement prêt à mourir sur cette colline : non, je ne crois vraiment pas que ce soit (3).

[#3] Il me semble que quelqu'un avait proposé un équivalent français pour le verbe to gaslight, mais je ne retrouve pas.

L'argument principal contre (1) tourne autour de l'idée que Nathan le Sage serait une pièce obscure et qu'il est peu vraisemblable que George Lucas, qui n'est pas germaniste (je ne trouve pas de renseignement sur les langues qu'il maîtrise, mais je suppose que c'est juste l'anglais), en ait entendu parler.

Il me semble que cet argument est une projection de la relativité de la culture générale : quelque chose comme je n'ai pas lu cette pièce, donc je suppose par défaut qu'elle est obscure. Évidemment je suis susceptible de tomber dans le piège opposé (j'ai lu — et beaucoup aimé — cette pièce, donc je suppose par défaut que tout le monde la connaît), donc si je veux y répondre il faut que j'essaie de trouver des métriques un peu objectives de célébrité, ce qui est éminemment difficile. Je peux noter que l'article Wikipédia à son sujet existe en 21 langues, ce qui n'est quand même pas rien (en tout cas ça suggère qu'il n'y a pas que les germanophones qui en ont entendu parler) ; je peux noter que Google me la liste dans les 3 premières quand je fais une recherche de list of famous german plays (ceci n'est probablement pas très reproductible, cependant), que j'ai demandé à ChatGPT (en tant que perroquet-représentant de la sagesse diluée d'Internet) où il la placerait dans la liste des pièces allemandes les plus célèbres, et il m'a dit dans les 10 premières ; je peux noter que j'ai moi-même vu la pièce à la Comédie française (ce qui veut dire qu'elle est considérée comme faisant partie d'une certaine définition du répertoire classique dans un pays non-germanophone) et, plus tard, à la télé en France, et il y en a toutes sortes de versions sur YouTube ; je peux noter que, comme je le mentionne ci-dessus, elle a une certaine résonance au moyen-orient (et je suppose qu'elle en avait déjà quand George Lucas était étudiant). Ce ne sont pas des signes de la célébrité la plus incontestable (rien qu'au rayon des pièces allemandes, je suppose quand même que Faust est plus connue), mais on peut difficilement la qualifier d'obscure (alors que pour L'Orphelin de la Chine de Voltaire, par exemple, je n'hésiterais pas à utiliser cet adjectif).

(Évidemment, dans la culture actuelle, surtout auprès des geeks avec qui je suis susceptible d'échanger via Internet, Star Wars est bien plus connu que Nathan le Sage — 145 langues sur Wikipédia, par exemple, si on convient que cette métrique est pertinente. Néanmoins, il y a un certain effet de perspective dû aux qualificatifs sur Internet et actuel. En tout cas, quand George Lucas était étudiant, bizarrement, Star Wars n'était pas connu du tout, alors que Nathan le Sage l'était sans doute autant. Et j'imagine que si on attend quelques décennies, la trilogie d'origine de Star Wars sera perdue dans les zillions de spinoffs, séquelles et autres histoires dérivées que Disney aura produites entre temps, et peut-être qu'il y aura aussi peu de gens capables de la décrire que pour ce qui est de la pièce de Lessing.)

Je suppose, en tout cas, que George Lucas n'est pas un Américain moyen de sa génération en ce qui concerne ses chances d'être familier avec la pièce de Lessing (s'il l'était, je conviendrais volontiers que ses chances de l'avoir lu — ou même d'en connaître simplement l'histoire — seraient proches de zéro). Il a été étudiant[#4] à USC, il a suivi des cours de littérature et de cinéma, où je suppose que ses profs ont dû mentionner certaines des grandes œuvres de la littérature mondiale ou occidentale, et notamment celles qui sont pertinentes dans l'histoire du théâtre ou illustratives pour le bon usage du coup de théâtre (chose que Lucas semble certainement beaucoup aimer), après tout ce n'est pas comme si le théâtre et le cinéma étaient si étrangers[#5] l'un à l'autre. Donc même si ça n'a rien de certain, je ne trouve absolument pas farfelu d'imaginer que Lucas, même s'il n'est pas germaniste ou germanophone, ait lu ou vu le Nathan de Lessing (ou qu'on lui en ait raconté l'histoire), qu'il s'en soit consciemment inspiré ou que certaines idées lui soient restées dans la tête.

[#4] Rien à voir avec Lessing, mais à propos de George Lucas étudiant et de ses sources d'inspiration, je rappelle une fois de plus l'existence de ce court-métrage (8 minutes !) absolument extraordinaire qu'est George Lucas in Love de Joe Nussbaum (1999) (on le trouve par-ci ou par-là sur YouTube, et certainement en plein d'autres copies qui disparaîtront occasionnellement au hasard de l'application du copyright). J'en ai parlé dès le tout début de ce blog, et 21 ans après je le revois toujours avec autant de plaisir. C'est une exploration hypothétique et humoristique de l'histoire possible de la genèse de Star Wars alors que George Lucas est étudiant sur le campus de l'USC en 1967, et c'est une accumulation de clins d'œil, un hommage beaucoup plus touchant et intéressant, à mon avis, que tous les fan films qui ont été faits in universe. Même la musique est extraordinaire. (Il semble d'ailleurs que Lucas lui-même ait vu ce film et a reconnu qu'il était excellent, même si pas tout à fait conforme à la réalité.)

[#5] Alec Guinness, qui incarne Obi-Wan Kenobi dans Star Wars, était (et est sans doute encore) surtout connu comme un grand acteur de théâtre. Il avait notamment joué Le Marchand de Venise quand il était jeune, et il l'a de nouveau joué (en incarnant Shylock) après Star Wars : compte tenu de la comparaison souvent faite entre ces deux pièces, je n'ai aucun doute qu'il aurait lu ou vu Nathan. Je peux parfaitement imaginer une discussion sur le tournage de l'épisode 4 de Star Wars où Guinness dirait à Lucas tu sais, les personnages de ton film ils me rappellent un peu ceux de cette pièce allemande… tu devrais peut-être y jeter un coup d'œil.

Ce qui est certainement plus discutable, c'est la question de savoir dans quelle mesure les éléments communs que je vois entre Star Wars et Nathan le Sage sont vraiment significatifs.

↑Entry #2792 [older| permalink|newer] / ↑Entrée #2792 [précédente| permalien|suivante] ↑

↓Entry #2791 [older| permalink|newer] / ↓Entrée #2791 [précédente| permalien|suivante] ↓

(mardi)

Débriefing de mon cours Logique et Fondements de l'Informatique

J'avais expliqué il y a quelques mois que je m'étais engagé à monter un nouveau cours d'informatique théorique (ou faut-il dire de maths de l'informatique ?) pour certains élèves de première année à Télécom PlusÀParis, intitulé Logique et Fondements de l'Informatique (nom de code interne : INF110). (J'avais d'ailleurs publié un premier jeu de transparents dans de billet.) L'occurrence 2023–2024 de ce cours a eu lieu de à , le contrôle le , et maintenant (enfin, quelques mois après) que j'ai à la fois rendu les notes finales et reçu les retours (anonymes) des étudiants je suis en mesure d'en faire un premier bilan. L'idée de ce billet n'est pas tellement d'entrer dans le fond du sujet (même si je ne peux pas ne pas en parler du tout), à ce sujet voir plutôt les deux paragraphes ci-dessous, mais de parler au niveau méta : pourquoi ce cours, pourquoi ce sujet, comment je l'ai organisé et préparé, ce qui a bien marché et ce qui n'a pas bien marché. Le but est de me permettre à moi-même de faire le point, et donc de réfléchir à ce que je veux changer l'an prochain, et aussi de préparer un exposé où je dois raconter tout ça (cf. la fin du présent billet).

☞ Pour le fond du sujet, je renvoie notamment à ce billet sur la correspondance de Curry-Howard et à celui-ci sur la réalisabilité propositionnelle, qui sont largement adaptés de certains bouts de mon cours, même si la présentation est différente et qu'ils vont plus loin (surtout le second). Je peux aussi renvoyer à ce billet sur des sujets variés en vrac sur lesquels j'ai appris des choses en préparant ce cours. Enfin, je fais un lien vers ce billet sur les degrés de Turing et leur généralisation parce qu'il touche à des questions adjacentes, même si je n'ai pas fait plus qu'évoquer la définition de degré de Turing (ordinaire) dans mon cours.

☞ Pour ce qui est des documents pédagogiques accompagnant le cours, voici quelques liens (dont, malgré ma passion pour la stabilité des URL, je ne garantis pas qu'ils seront pérennes, parce que je ne sais pas comment je vais les réorganiser à l'avenir). D'abord le PDF des transparents (qui est la concaténation idiote de trois parties inégales : ① calculabilité, ② typage simple et calcul propositionnel et ③ introduction aux quantificateurs ; j'ai aussi fait une version « imprimable » des transparents : , et ). Les exercices d'entraînement sont : ici sans corrigé et ici avec corrigé. Et le sujet du contrôle est ici sans corrigé et ici avec corrigé. Et si des gens sont intéressés par le source de tout ça, le dépôt Git est ici.

Avertissement usuel : même si j'évoque ici mon travail d'enseignant-chercheur à Télécom, je dois rappeler que, dans ce billet comme ailleurs sur ce blog, je m'exprime à titre purement personnel et que les avis et opinions que je peux exprimer ici (ou ailleurs) sont juste les miens et n'engagent en aucun cas mon employeur (ni qui que ce soit d'autre que moi, et d'ailleurs ils ne m'engagent même pas moi vu que que je me réserve le droit d'en changer à tout moment et sans prévenir). J'ajoute que si vous faites partie des personnes qui ont besoin d'un tel avertissement, il vous est interdit de lire la suite de ce billet.

Plan du billet

Le contexte

Comme je l'ai expliqué dans les billets déjà liés ci-dessus (celui-ci et celui-là), la France a récemment créé une filière MPI (maths, physique et informatique) dans ses classes préparatoires scientifiques[#]. En particulier, les élèves entrant à Télécom par le concours commun peuvent arriver avec trois niveaux de formation en informatique : le socle commun MP/PC (où il n'y a pas grand-chose en info), l'option informatique en MP (qui existait déjà), et la nouvelle filière MPI (qui va encore plus loin). Les programmes de toutes ces filières sont trouvables par exemple sur ce site). Ceci nous a imposé une réforme de nos enseignements en première année : jusqu'à l'été 2023 notre première année était complètement uniforme (en gros, tout le monde avait les mêmes cours, le choix d'une filière de spécialisation se faisant en seconde année), mais ce mode de fonctionnement devenait intenable, au moins pour ce qui est de l'informatique, avec de telles différences de formation à l'entrée (si on s'adapte à ceux qui en ont fait le moins, ceux qui en ont fait plus s'ennuient, et si on s'adapte à ceux qui en ont fait le plus, ceux qui en ont fait le moins sont largués).

[#] Au niveau de la reconnaissance de l'informatique comme une science à part entière, il y a aussi eu création d'une agrégation d'informatique pour le recrutement des enseignants alors que l'informatique était jusqu'alors considérée comme une option de l'agrégation de mathématiques. Et, un peu avant, des changements au niveau lycée avec la création d'une spécialité NSI, c'est-à-dire numérique et sciences informatiques, mais ça ne me concerne que beaucoup plus indirectement : de ce que je comprends, à cause de la limitation à deux spécialités en terminale, la (grande ?) majorité des élèves de prépa, y compris MPI, n'ont pas suivi cette spécialité NSI en terminale, mais bien maths et physique-chimie.

Mais ce n'est pas, en fait, qu'une question de niveau en entrée : les élèves ayant choisi la filière MPI semblent avoir des attentes et des intérêts différents de ceux de la filière MP (même « option info »), au sens où ils semblent généralement plus intéressés par l'informatique pour elle-même et pas juste comme un outil dans un travail d'ingénieur (parce qu'évidemment tout le monde utilise l'informatique de nos jours). Et un des buts de la réforme que nous avons mise en place est de rentre Télécom plus attirante pour les préparationnaires vraiment intéressés par l'informatique, avec notamment l'idée qu'il ne faut pas qu'ils s'ennuient en cours.

La première année à Télécom est (maintenant) divisée en quatre périodes. Pour ce qui est de l'enseignement d'informatique, voici comment nous avons organisé l'année. La période P1 (septembre–octobre) a été dédiée à une introduction générale à la programmation, du matériel au haut niveau, tandis que les élèves venus de la filière MPI (et uniquement eux) ont un cours spécifique sur la compilation. La période P2 (novembre–janvier) est consacrée à la théorie de l'informatique, et c'est celle qui me concerne et dont je vais reparler. La période P3 (février–avril) propose le choix entre différents paradigmes de programmation. Et la période P4 (avril–juin) est consacrée aux réseaux. Sur chacune de ces périodes, les élèves ont environ 40h d'informatique (sauf en P3, moitié moins), c'est-à-dire environ 4h½ par semaine pendant les 9 semaines que dure la période. (Pendant le même temps, les élèves ont bien sûr aussi des cours dans les autres domaines : maths, physique+électronique, sciences économiques et sociales, langues et humanités ; plus des projets et stages variés, notamment entre les périodes. Je dis ça pour situer un peu l'enseignement dans son volume global.)

Pour ce qui est de l'enseignement d'informatique de la période P2 de première année, donc, nous avons divisé la population d'élèves en deux sous-populations inégales : ceux qui sont entrés par les filières MPI ou MP option info du concours commun ainsi que les admis sur titres après une licence d'informatique, soit au total ~90 élèves, et tous les autres, qui doivent représenter à peu près ~120 élèves. Les premiers ont eu le cours INF110 dont je me suis chargé et dont je parle ici, tandis que les seconds ont eu un cours (INF109) plus général sur l'algorithmique fondamentale et quelques rudiments de la calculabilité (recouvrant notamment une partie de ce que les autres élèves avaient déjà vu en prépa).

Bref, s'agissant de INF110, j'avais à m'occuper de 39 heures d'enseignement (contrôle de connaissances non compris), étalées sur 9 semaines, pour ~90 élèves. Nous avons décidé de séparer ces 39h en 21h de cours magistraux, et 18h de TD+TP lesquels ont été pris en charge par mon collègue Théo Z. Pour des raisons d'organisation de l'emploi du temps global de la première année, il n'était pas possible de regrouper les élèves tous ensemble pendant les cours magistraux, donc j'ai donné deux fois chaque séance (on arrive donc à 42h pour moi, si vous suivez).

De l'opportunité d'enseigner des sujets théoriques

Il faut que je dise ici un mot pour évoquer la question qui revient de façon récurrente dès qu'on parle de dispenser des cours assez « théoriques » (whatever that means) à des élèves majoritairement[#2] futurs ingénieurs. J'avais déjà droit à ce genre de remarques quand j'enseignais l'analyse de Fourier (cf. par exemple ce billet) : à quoi ça sert d'expliquer à des futurs ingénieurs la différence entre la transformée de Fourier dans L¹ et dans L² ? ce n'est pas ça qui va leur servir : de toute façon leur signal sera un ensemble fini de valeurs. Donc inévitablement on peut se demander pourquoi enseigner la calculabilité ou la logique intuitionniste quand ce même temps pourrait être employé à faire des cours de JavaScript et de Python, parce que c'est ça qui va leur servir — ou bien d'IA puisque maintenant tout le monde se rue sur l'IA comme des lemmings sur la falaise.

[#2] Je précise que majoritairement ne signifie pas exclusivement. Même sans parler des cas vraiment exotiques, et il y en a toujours (après tout, j'ai dans ma promo à Normale Sup un camarade qui a décidé que la passion de sa vie c'était le cirque, et qui a donc fait carrière dans les arts du spectacle après une thèse de physique quantique), il y a quand même une proportion, faible mais non complètement négligeable, d'élèves à Télécom qui décident de faire de la recherche plus ou moins théorique, c'est-à-dire de faire une thèse et éventuellement d'en faire carrière. Néanmoins, j'entends bien l'argument selon lequel l'enseignement ne doit pas se construire en fonction des intérêts d'une minorité. Donc ce n'est pas l'argument que j'invoque ici pour justifier l'intérêt de mon cours.

J'avais déjà répondu à cette objection, mais je ne sais pas si ma réponse me satisfait beaucoup. Disons que si un ingénieur n'est pas un chercheur (dont le métier consiste à proposer de nouvelles théories), il n'est pas non plus un technicien (dont le métier consiste à appliquer des techniques existantes) : l'ingénieur est justement là pour faire le pont entre les deux, pour appliquer la théorie à la création de nouvelles techniques ou au perfectionnement de celles qui existent, ce qui implique de bien maîtriser la théorie de son domaine, avec un certain recul sur celle-ci, pas juste comme des recettes de cuisine apprises par cœur. (Je devrais, ici, faire référence à la nouvelle Profession d'Asimov, mais c'est un peu difficile à faire sans divulgâcher ; donc je vais me contenter de dire : lisez-la.)

On se trompe gravement, je pense, en voulant centrer l'enseignement sur ce qui sert (ou plutôt, on se trompe gravement en ne mesurant pas toutes les manières dont quelque chose peut servir) : le but de l'enseignement, quel que soit son niveau, n'est pas principalement, ou en tout cas pas exclusivement, de fournir des outils qui serviront mais aussi des clés de compréhension de phénomènes, des cadres dans lesquels analyser ce à quoi on est confronté. Les outils, ce n'est pas qu'il ne faut pas les apprendre, mais ils ont tendance à être hautement spécifiques à une tâche précise, les outils nécessaires à tel ou tel métier s'apprennent normalement en entrant dans ce métier, ce n'est tout simplement pas le rôle de l'enseignement de former à s'en servir (sauf dans la mesure où ces outils sont extrêmement transverses). S'agissant de l'informatique, donc, on se trompe par exemple en pensant qu'il faut enseigner les langages de programmation qui seront utilisés ensuite : un langage de programmation, ça s'apprend rapidement, l'intérêt de les enseigner n'est pas d'enseigner ce qui servira mais d'enseigner ce qui permet de comprendre les différentes approches[#3] de la programmation et les différentes façon de concevoir une tâche.

[#3] Sur les langages de programmation, ce que je dis c'est que ça n'a, selon moi, aucun intérêt de se dire je vais apprendre/enseigner JavaScript et Python parce que c'est ce qui me/leur servira après ; il faut plutôt se dire je vais viser un échantillon représentatif des différents styles de langages de programmation pour comprendre les différentes approches : un langage bas niveau pour comprendre comment fonctionne la gestion de la mémoire, un langage purement fonctionnel et paresseux pour comprendre comment conceptualiser les tâches par une programmation d'ordre supérieur, un langage orienté objet pour comprendre le concept d'héritage, un langage distribué pour comprendre les difficultés de la programmation asynchrone et la manière dont on les résout, etc.

Donc l'intérêt d'enseigner la calculabilité, ce n'est certainement pas parce que ça va servir (même s'il est certainement utile qu'un ingénieur sache que certaines tâches ne sont pas réalisables algorithmiquement — et qu'en gros toute tentative d'analyser le comportement d'un programme devra reposer sur des heuristiques qui seront fatalement imparfaites), mais aussi parce que cela amène à prendre du recul sur les concepts fondamentaux de l'informatique (la récursion, l'auto-référence, la nature de l'évaluation dans les langages de programmation, la raison pour laquelle on se retrouve si facilement à être Turing-complet par accident — et peut-être aussi le fait que ce n'est pas très pertinent de chercher à l'éviter). À titre d'exemple, s'agissant de l'auto-référence, je dirais que quelqu'un qui a du recul sur la calculabilité et le théorème de récursion de Kleene ne sera absolument pas surpris par le fameux hack de Ken Thompson[#4] (d'ailleurs, Thompson lui-même explique le lien entre les quines et son hack), et c'est pertinent pour pouvoir prétendre maîtriser la sécurité informatique. Je peux dire quelque chose d'analogue pour le typage : ce n'est pas juste que c'est utile de comprendre les bases du typage et du polymorphisme parce que certains langages réellement utilisés en ont, mais c'est aussi nécessaire pour comprendre ce qui se passe (par exemple quand on cache des valeur dans une clôture, quand on passe des valeurs par continuation — ce qui sont des paradigmes de programmation qui servent vraiment).

[#4] Dans Reflections on Trusting Trust, Thompson explique qu'il avait introduit une backdoor dans le programme login, puis modifié le compilateur C pour introduire lui-même cette backdoor si elle ne s'y trouvait pas, puis pour introduire cette backdoor dans le compilateur C lui-même, si bien qu'au final il pouvait recompiler le compilateur avec les sources d'origine et la backdoor persistait dans le binaire. Voilà quelque chose qui, au minimum, ne doit pas surprendre un ingénieur en sécurité informatique.

↑Entry #2791 [older| permalink|newer] / ↑Entrée #2791 [précédente| permalien|suivante] ↑

↓Entry #2790 [older| permalink|newer] / ↓Entrée #2790 [précédente| permalien|suivante] ↓

(samedi)

Le pluriel de fait divers n'est pas statistiques

Je viens de[#] voir passer sur Twitter⌫𝕏 encore je ne sais quel fait divers retweeté par quelqu'un qui cherchait sans doute à en tirer une conclusion sur notre société. (Je ne sais plus de quoi il était question, mais typiquement le fait divers prend la forme d'une violence commise par ou contre tel ou tel groupe dont on voudrait laisser penser qu'il est sujet ou objet de violences, et la conclusion plus large est quelque chose comme tout va mal.) Ou plutôt, à provoquer une émotion dans laquelle une conclusion éclora sans passer par l'étape de raisonnement.

[#] Enfin, je venais de quand j'ai écrit ce paragraphe. Mais ce billet, parmi beaucoup d'autres à moitié écrits, traînait dans mes cartons virtuels depuis un moment, donc je ne sais même plus à quel moment je fais référence. Peu importe : entre temps j'ai vu passer plein d'autres faits divers tout aussi peu dignes qu'on s'intéresse à eux.

Puisqu'il est question d'émotion, justement, je voudrais dire la mienne contre tout ce qui ressemble aux faits divers : à ceux qui les rapportent, à ceux qui les reproduisent, et à ceux qui, consciemment ou inconsciemment, cherchent à manipuler l'opinion publique avec. (Et je précise que je ne suis pas exempt de ces reproches : c'est justement parce que, sans doute comme tout le monde, je suis moi-même parfois tenté de m'émouvoir d'un fait divers, voire de le « partager » sur les réseaux sociaux, et d'autant plus que le fait divers s'aligne avec mes préconceptions politiques, que je dois travailler pour lutter contre ce poison du cerveau humain, et ce billet est là pour ça.)

Mon reproche contre le concept de fait divers peut être résumé dans l'explication suivante, dont la concision provocatrice retire un peu à la précision, mais qui résume néanmoins de façon assez percutante le cœur du problème :

Si on en parle aux infos, c'est que c'est très atypique.
Si c'est très atypique, c'est que ça n'a aucune importance.

(Il va de soi que je parle là des faits divers — expression française forte utile et que je ne sais d'ailleurs pas traduire en anglais. Un événement de portée géopolitique, par exemple, n'est pas sujet à ce reproche : il est significatif en lui-même, pas en ce qu'il prétend représenter un phénomène plus large.)

Je résume ce résumé par le titre de ce billet (inspiré d'une citation qui, comme toutes les meilleures citations, est apocryphe voire complètement inversée, le pluriel d'anecdote n'est pas données) : le pluriel de fait divers n'est pas statistiques.

Tout fait divers, donc, est un mensonge. Pas parce qu'il est faux (il y en a plein qui sont des légendes urbaines, mais ce n'est pas ça mon propos : admettons pour les besoins de l'argument que les faits soient exacts et fidèlement rapportés), mais en ce qu'il suggère qu'il est représentatif alors qu'il ne l'est pas : s'il était représentatif, il serait banal et on n'en parlerait pas. Donc il ment même s'il dit la vérité. Ce qui est sans doute la meilleure façon de mentir. Pour invoquer une autre citation (qui, pour une fois, n'est pas apocryphe, c'est d'Asimov dans Forward the Foundation) : The closer to the truth, the better the lie, and the truth itself, when it can be used, is the best lie.

Le fait divers, donc, vise à manipuler notre émotion. C'est un défaut du cerveau humain que les statistiques n'arrivent pas facilement à susciter notre émotion. (Ou alors il faut pour ça les tourner sous une forme trompeuse : les phrases du style toutes les X minutes, en France, <telle chose se produit> sont une manipulation pour donner aux statistiques la même coloration émotionnelle que les faits divers[#2].) Et aussi que les émotions sont si puissantes pour provoquer une réaction de notre part. Nous avons besoin de faits concrets, pas de chiffres.

[#2] Bien garder ça à l'esprit : si quelqu'un vous dit qu'il y a <tant> de <tel fait> par an en France, c'est peut-être vrai et honnête ; mais si on vous dit que <tel fait> se produit toutes les <tant> de minutes en France, c'est toujours un mensonge même si le chiffre est vrai : c'est un mensonge en ce que c'est une manipulation pour que le chiffre paraisse plus important qu'il l'est. Parce qu'il n'y a tout simplement aucune raison légitime de tourner une fréquence sous cette forme.

Je ne dis pas que les statistiques ne peuvent pas mentir, bien sûr, et d'ailleurs je viens à l'instant de donner une manière de les manipuler. (Là aussi vous vous doutez bien qu'il y a une fameuse citation apocryphe pour nous le rappeler.) Mais les statistiques ont au moins en principe le pouvoir de dire quelque chose de vrai et de représentatif, ce que le fait divers n'a pas. Les statistiques traduisent parfois une vérité collective intéressante : le fait divers ne le font jamais.

L'exemple le plus flagrant de la manipulation de nos émotions par ce qui n'est pas statistiquement représentatif est celui des actes terroristes et de l'importance qu'on leur accorde. (Je renvoie à cette vidéo plutôt bien faite pour un développement plus poussé de ce point.) La réalité statistique du terrorisme, dans le monde occidental, est qu'il est insignifiant : si vous vivez en France, vous avez moins de 0.01% de chances[#3] de mourir dans un attentat terroriste. Or les médias traitent chaque acte terroriste comme un sujet majeur, ce qui est exactement ce que recherchent les terroristes, et ce qui donne à ces derniers une victoire retentissante à chaque fois, en ce qu'ils réussissent effectivement, avec cette complicité des médias, à terroriser des gens qui, regardant ces infos anxiogènes, sont souvent convaincus qu'ils sont eux-mêmes menacés[#4] par le phénomène alors qu'ils ont grosso modo autant de chances de mourir, disons, tués par une vache. J'ajoute, puisque c'est aussi le propos de ce billet, que les politiques préconisant une réponse forte[#5] au terrorisme sont les alliés objectifs[#6] des terroristes : les premiers fournissent aux seconds l'attention et la terreur qu'ils recherchent, et les seconds fournissent aux premiers leur agenda politique (donc le pouvoir qui va avec).

[#3] Estimation passablement conservatrice : en France, il semble qu'il y ait eu moins de 600 morts de terrorisme au cours des 50 dernières années, sur environ 30 millions de morts au total pendant ce demi-siècle, donc les chances de mourir du terrorisme, en France, seraient plutôt autour de 0.002%. Mais pour d'autres pays européens, 0.01% est plus représentatif, et si on prend la pire année pour la France, on monte à presque… 0.03% (pour être bien clair, ça veut dire en gros que si chaque année répétait celle des attentats de 2015, la probabilité d'un Français générique de mourir du terrorisme sur toute votre vie serait autour de 0.03% ; je ne parle pas de 0.03% par an, ce qui serait beaucoup plus, mais plutôt de 0.0003% par an, soit 0.03% sur toute une vie, en prenant le pire chiffre des 50 dernières années).

[#4] De même qu'on a des règles qui imposent que toute pub pour de la bouffe soit accompagnée d'une injonction un chouïa paternaliste, je me dis parfois qu'il ne serait pas mal d'obliger tout reportage ou sujet d'actualité mentionnant le terrorisme d'être accompagné d'un message disant substantiellement : ce sujet ne vous concerne pas : vous n'allez pas mourir du terrorisme, vous allez très probablement mourir du cancer ou d'un accident cardiaque ou vasculaire.

[#5] Réponse forte, en fait, généralement constituée d'un théâtre de mesures absolument dénuées d'effets réels contre le terrorisme : il s'agit d'une comédie sécuritaire dont le but est simplement de rappeler au grand public que le sujet est censé être Important et que des gens prennent des Mesures.

[#6] J'aime bien rappeler que quand deux groupes se font publiquement et ostensiblement la guerre, souvent ces deux groupes sont des alliés objectifs, en ce que les deux ont en fait un but commun, qui est de faire croire que le sujet sur lequel ils se font la guerre est un sujet grave, important et central, que l'attention de l'opinion doit se focaliser dessus (ou bien il peut s'agir de cimenter chacun des deux groupes dans l'essentialisme qui les définit). Cette analyse est parfois simpliste (dans une vraie guerre, ce sont surtout les fractions les plus radicales des deux belligérants qui sont alliées, ça ne veut pas dire que toute la guerre est factice), mais il est au moins bon de l'avoir à l'esprit quand on nous présente un débat entre des positions prétendument « opposées ». En l'occurrence, l'alliance objective entre terroristes et adeptes de la manière forte contre le terrorisme me paraît assez évidente.

Certains sont sans doute tentés de répondre sur l'importance des symboles, ou quelque chose comme ça. (En mode avocat du diable : quelle sordide façon de décerner l'importance des sujets que de compter le nombre total de morts et de ne regarder que ça ! ce sont les symboles qui comptent.) Or c'est un peu le problème, justement : les terroristes essayent de nous manipuler par la portée symbolique de leur acte, et accepter de la reconnaître, accepter de s'en émouvoir plus que ce que sa réalité statistique extrêmement mineure le justifie, c'est justement entrer dans leur jeu. J'ai parlé ici du terrorisme, mais c'est globalement le problème des faits divers : la naissance d'une émotion collective qui, même si elle n'est pas provoquée délibérément, sera exploitée par les politiques. C'est le principe du un fait divers, une loi (la loi n'est généralement même pas la finalité de la manœuvre — parfois elle l'est si c'est une loi liberticide, mais en général le but de la gesticulation est simplement de récupérer du capital de sympathie politique sur l'air de voyez, moi je m'occupe de ce problème dont personne ne s'occupait jusqu'ici).

Et cette émotion collective vient avec une injonction de la ressentir : qui oserait répondre à l'émotion suscitée par le viol du petit Machin (7 ans) par le cousin de sa belle-tante en disant mais on s'en fout, de ce fait-divers sordide ! ? Si vous dites ça, on vous traite de monstre, d'insensible, de scientifique déshumanisé qui ne sait lire le monde que derrière de froides statistiques, etc. (et si on tient un discours de ce genre face à un acte terroriste, la réaction est encore pire[#7]). Les gens qui disent ça confondent le fait de ressentir une émotion (oui, généralement, je suis désolé d'apprendre ce qui est arrivé au petit Machin) et le fait d'en faire un spectacle public d'importance nationale.

[#7] Essayez un peu de défendre la position selon laquelle la réponse à faire au terrorisme c'est l'ignorer complètement, et pourrez mesurer, aux réactions indignées que cela provoque, l'étendue de la victoire psychologique des terroristes dans leur bataille pour l'attention. (Notons que je ne défends pas cette position : je pense qu'il y a des choses qu'on peut faire contre le terrorisme, mais elles sont plutôt de l'ordre de l'infiltration. Mais ce n'est ni le propos de ce billet ni quelque chose sur quoi je pense être compétent, donc je ne développe pas.)

Je le sais parce que je tiens de feu mon papa cette attitude de rejet du fait divers et d'attachement aux statistiques, et je voyais bien les réactions irritées voire véritablement courroucées que cette attitude pouvait provoquer. Il est vrai qu'il ne cachait pas son mépris pour tout ce qui est anecdotique, et qu'il demandait bien ostensiblement, et avec un mépris parfois un peu provocateur, la fréquence de n'importe quel fait qu'on lui rapportait. (Et il est aussi vrai qu'il n'était pas toujours parfaitement cohérent avec ses propres principes.)

Encore une fois, je ne prétends certainement pas être moi-même exempt de reproches : il m'est certainement arrivé de rapporter, propager ou amplifier des faits divers (voire de les déformer) : moi aussi j'ai des émotions et moi aussi on peut me manipuler avec elles, et le terrorisme y parvient dans une certaine mesure. Ce que je décris ici est surtout une discipline que j'essaie de m'imposer (et si je cherche à me l'imposer, c'est bien parce qu'elle ne m'est pas naturelle, et j'échoue souvent à obéir à mes règles). Il ne s'agit pas de ne jamais évoquer de fait divers, mais au moins de faire la démarche de me demander, à chaque fois que j'en rencontre un, quelque chose comme ceci :

  • Est-ce que ce fait est représentatif en plus d'être matériellement exact ? De quoi est-il représentatif exactement ?
  • Est-ce que je dispose des éléments de contexte suffisants pour interpréter le fait rapporté ? Quelle sélection des faits a été apportée par la narration que j'ai reçue ? Quels sont les biais de la source dont je le tiens ?
  • Qui a sélectionné le fait rapporté parmi d'autres qui sont semblables ? Qui a choisi de parler précisément de celui-là et pas d'un autre ? Quelle est l'intention derrière ce choix, qui n'est pas neutre ?
  • Est-ce que je peux trouver des statistiques sur le phénomène qui semble impliqué par le fait rapporté ? Que me disent ces statistiques sur l'importance du phénomène ? Que me disent-elles sur la typicité du fait rapporté ?
  • Quelle émotion fait naître en moi le fait rapporté ? Dans quelle mesure cette émotion est-elle provoquée ou amplifiée par la narration que j'ai reçue ? Cette émotion sert-elle des intérêts autres que ceux de l'information pure ? Lesquels ?

La liste n'est pas exhaustive, évidemment (et je mélange là des questions qui visent à stimuler différentes sortes de scepticisme, dont certains s'appliquent bien plus largement qu'aux faits divers[#8]). Mais il me semble que le débat public serait beaucoup plus sain si chacun faisait au moins un effort honnête de pratiquer cette petite gymnastique à chaque fois qu'il s'agit de cliquer sur le bouton reposter d'un message qui nous émeut.

[#8] Et bien sûr tout ceci s'ajoute au scepticisme dont il est pertinent de faire preuve sur les faits eux-mêmes (viennent-ils d'une source fiable ? les images ne sont-elles pas générées par IA ? etc.).

Tout propos catégorique mérite bien sûr d'être nuancé (y compris cette phrase-ci). Il y a quand même des cas où un fait divers peut nous apprendre quelque chose.

D'abord, quand le fait divers est représentatif et typique d'un phénomène qui est effectivement statistiquement pertinent : il n'est tout de même pas vrai que tout ce qui est relaté aux infos (ou propagé sur les réseaux sociaux) est atypique, et même s'il est atypique il peut l'être pour des raisons orthogonales à ce qui le rend significatif (par exemple si une célébrité est victime d'un phénomène banal, ça rend le fait divers newsworthy tout en restant représentatif du phénomène banal). On peut admettre qu'un fait divers serve, dans un discours, à illustrer un phénomène statistique, à rendre plus « parlantes » les statistiques. Mais ceci n'excuse en rien de ne pas chercher les statistiques.

Ensuite, quand un fait divers montre que quelque chose est possible alors qu'on pensait que c'était simplement impossible (ou que quelque chose existe alors qu'on n'y avait jamais pensé) : les statistiques sont alors par définition impossibles à faire puisqu'on a affaire à un hapax. La réaction saine, alors, est de se dire tiens, il est peut-être pertinent de s'intéresser à ce phénomène à l'avenir, par exemple pour chercher à savoir s'il est en train d'apparaître ou si c'est un événement qui se produit une fois tous les millions d'années.

Et bien sûr, une morale à tirer de tout ça c'est l'importance de l'enseignement scientifique (et notamment des stats de base et des ordres de grandeur). Il me semble indispensable que tout citoyen sache calculer un ordre de grandeur pour répondre à un problème du style : si ce problème, qui touche un groupe de personnes dont je fais partie et représentant environ 1% de la population, se produit environ une fois par mois en France et affecte une vingtaine de personnes à chaque fois, au bout de combien de temps dois-je moi-même m'attendre à en être victime ? (réponse en supposant une uniforme distribution[#9] : 70 millions × 1% / 20 × 1 mois ≈ 3000 ans) ou, en plus simple, si une personne par minute est victime de tel phénomène en France, au bout de combien de temps dois-je moi-même m'attendre à en être victime ? (réponse en supposant une uniforme distribution : 70 millions de minutes ≈ 130 ans). Je pourrais raconter des anecdotes de gens qui sont incapables de convertir de tête 70 millions de minutes en 130 ans (au moins approximativement !) ou échoueraient à répondre à ce genre de questions pour telle ou telle autre raison, mais ce serait, justement, des anecdotes destinées à provoquer votre émotion indignée : pour rester dans le sujet, je voudrais plutôt voir des statistiques sérieuses à cet égard.

[#9] Bien sûr, l'hypothèse d'égale distribution est critiquable et doit être critiquée, à l'aune du phénomène particulier. C'est justement ce qu'un enseignement scientifique correct doit fournir : des clés pour utiliser, formuler et critiquer ce genre d'hypothèse.

L'autre chose importante à mettre dans les mains de tous les citoyens, outre une culture scientifique de base, c'est l'accès à des statistiques claires et de qualité contre lesquelles comparer leurs impressions tirées des anecdotes sur le monde.

J'aime donner l'exemple suivant : beaucoup de gens sont persuadés (et pour le coup ce n'est pas anecdotique, j'avais trouvé des statistiques sérieuses à l'appui de cette affirmation, même si je ne les retrouve plus) que le monde est beaucoup plus violent qu'autrefois. Cette impression résulte largement de l'information immédiate et « brute » à laquelle nous avons accès. Or selon à peu près n'importe quelle métrique raisonnable, nous vivons à une époque tout à fait paisible, et selon certaines, même, possiblement la plus paisible que l'Humanité ait jamais connue. Voyez par exemple ce graphe pour ce qui est de la mortalité par guerre, et cette estimation ainsi que celle-ci des homicides, pour des perspectives historiques plus larges. Ça ne veut certainement pas dire que le monde n'est pas bourré de problèmes, ni que la violence n'en est pas un sérieux, ni qu'elle n'est pas en train de ressurgir (et on peut certainement trouver des statistiques bien plus nuancées que celles que je viens de lier), mais l'impression émotionnelle qui résulte de la consommation de l'actualité n'en est pas moins profondément trompeuse.

Donc j'aime bien faire la pub, et j'en profite pour le faire ici, pour le site Web Our World in Data, qui avec Wikipédia (et malgré toutes les imperfections de l'un ou de l'autre) est un de ceux qu'il est le plus urgent de mettre entre toutes les mains et d'encourager tout le monde à consulter comme source d'information raisonnablement honnête, généralement fiable et typiquement facile à comprendre.

Je conclus par la remarque suivante tendant à justifier le titre de ce billet sous un angle légèrement différent : non seulement l'accumulation d'anecdotes ne va pas conduire à une représentation mentale fidèle du monde parce que chacune de ces anecdotes est atypique, mais aussi, et même en l'absence de volonté de manipulation émotionnelle, même leur agrégation n'est toujours pas représentative. Ceci résulte notamment d'une asymétrie fondamentale de l'information : les mauvaises nouvelles ont tendance à venir de façon soudaine (ceci ne vaut pas que pour les faits divers : guerres et catastrophes arrivent de façon soudaine), et l'actualité est dominée par ce qui est soudain et nouveau ; tandis que les bonnes nouvelles sont presque toujours lentes et incrémentales (les informations du style cette année l'espérance de vie à la naissance a de nouveau augmenté d'un mois ou le nombre de morts par homicide continue sa baisse progressive ne font pas les actualités).

↑Entry #2790 [older| permalink|newer] / ↑Entrée #2790 [précédente| permalien|suivante] ↑

↓Entry #2789 [older| permalink|newer] / ↓Entrée #2789 [précédente| permalien|suivante] ↓

(dimanche)

Quatre ans après, quelles sont les leçons retrospectives de la pandémie de covid ?

Cela fait quatre ans (un peu plus ou un peu moins selon l'endroit où on se trouve) que nous est tombée dessus une pandémie qui allait durer, et bouleverser nos vies, pendant environ deux ans. Deux ans de covid suivis par deux ans d'après-covid, peut-être que ce confinementversaire est un bon moment pour regarder en arrière.

J'ai déjà raconté sur ce blog comment j'avais vécu ces journées si particulières de février-mars 2020 menant jusqu'au confinement total en France. J'y repense chaque année en cette saison parce que j'aime relire régulièrement mon journal pour me remémorer ce que je faisais il y a 1 an, 2 ans, 3 ans, 4 ans et 5 ans (en général je m'arrête là), donc forcément, en mars, je me retrouve à repenser à la covid[#] et aux confinements. Peut-être que ce n'est pas une bonne idée : je n'ai toujours pas trouvé comment dépasser[#2] le traumatisme de la sensation d'être emprisonné chez moi et d'avoir dû m'échapper comme un voleur pour aller me promener, et il n'est pas sûr que l'exercice mémoriel annuel m'aide. J'y pense aussi à propos de chaque fournée de nouveaux élèves que je vois passer : quelle année de leur scolarité a été bousillée, et quelles lacunes en conséquence ?

[#] Le fait que j'aie en ce moment un méga-rhume, qui, si j'en crois les autotests que j'ai faits, est sans doute le premier rhume que j'ai depuis la pandémie et qui ne soit pas dû à la covid, et que je ne constate franchement aucune différence de symptômes entre rhume covid et rhume non-covid (j'ai de nouveau une toux pénible), m'aide aussi à me remettre dans l'ambiance.

[#2] On peut dire que j'ai le « confinement long » comme certains ont le covid long : notamment, le fait de rester toute la journée chez moi, comme cela m'arrivait souvent avant 2019, ou même simplement de ne pas quitter mon quartier, provoque maintenant en moi rapidement une sensation de malaise et d'angoisse. C'est un comble vu que je n'aime pas non plus voyager loin de chez moi ! En tout cas, si c'est déjà modérément handicapant, cela risque de devenir bien pire avec le temps si je n'arrive pas à dépasser ce phénomène.

☞ Comment écrire l'histoire de la pandémie ?

Mais ce que me fait très justement remarquer un collègue, c'est que, collectivement, nous ne semblons à ce stade pas (encore ?) très enclins à nous replonger dans cet épisode pour en tirer les leçons ou en écrire l'histoire. La pandémie est finie[#3], mais reste encore à en écrire le récit, ainsi que celui de notre réaction à celle-ci — en tout cas, l'histoire collective, plus que la compilation de témoignages individuels.

[#3] On peut discuter de quand, bien sûr. J'aime bien dire que c'était le , parce que l'attention du monde s'est portée sur un autre problème, mais en vrai je considère que c'était plutôt quelques mois après (printemps-été 2022). Selon l'OMS c'était le , mais hors du cas très spécial de la Chine on ne peut pas vraiment dire que la pandémie ait beaucoup marqué l'année 2022–2023. Quoi qu'il en soit, la fin de la pandémie ne signifie évidemment pas la fin de la maladie : la covid elle-même ne disparaîtra jamais (enfin, pas avant l'extinction des mammifères ou quelque chose de très lointain comme ça). Ce qui a disparu, ce certains n'arrivent pas à enregistrer ce fait, c'est son statut spécial ; ce qui a cessé, c'est qu'on ne regarde plus les graphes de nombre de cas, de nombre d'hospitalisations, de nombre de morts, etc., que nous étions nombreux à scruter presque quotidiennement (ou à compter les vagues).

Certains aspects ont été proprement documentés, c'est vrai. Le déroulement des faits statistiques et strictement médicaux — quand le premier cas a été détecté dans tel ou tel pays, par exemple — est abondamment consigné (cf. par exemple cette chronologie sur Wikipédia et celle-ci par la CDC). On a des statistiques et des graphes de nombre de cas, de nombre de morts, de vaccinations, ce genre de choses, pays par pays, région par région. Je me souviens avoir vu un documentaire intéressant sur la course au développement des différents vaccins : là aussi, la chronologie factuelle est clairement établie.

Cependant, tout ça est à l'histoire de la pandémie ce qu'une succession de récits de batailles serait à l'histoire de la première guerre mondiale : ça en fait partie, mais ce sont des arbres qui cachent la forêt.

Certains éléments historiques font déjà l'objet de polémiques. La question de l'origine du virus SARS-CoV-2, en particulier, a attiré énormément d'attention, à cause de la théorie selon laquelle il résulterait d'un accident de laboratoire (théorie que je qualifierais d'improbable mais pas de déraisonnable — à ne pas confondre avec les théories selon lesquelles il s'agirait d'un événement délibéré et qui relèvent, elles, du complotisme le plus farfelu). À vrai dire je ne trouve pas très intéressante cette question de l'origine du virus, et je ne trouve pas que ça change grand-chose de toute façon ; en revanche la méta-question de pourquoi cet aspect précis de l'histoire de la pandémie semble fasciner tant de gens, et polariser leur opinion, est, pour sa part, beaucoup plus intéressante à mes yeux (et je vais revenir plus bas sur la question de la polarisation de l'opinion).

Une autre chose qui a été étudiée rétrospectivement, notamment à cause de toute la sociologie complotiste qui s'est cristallisée autour, c'est l'« effet gourou » et les médicaments miracles. En France le gourou a été incarné par un certain chercheur médiatique marseillais qui s'est pointé dès le début de la pandémie avec son traitement-miracle dont on a ensuite pu constater que le traitement ne faisait rien du tout ou pire que rien, mais c'était trop tard, le mal était fait, des gens avaient décidé de n'écouter que lui ; puis il y a eu un autre remède censément miracle, tout aussi inefficace. La question de pourquoi les gens croient et veulent croire à ces remèdes miracles, de l'interaction avec les théories du complot, et les mécanismes psychologiques qui font que certains sont plus prêts à accepter un remède qui ne fait rien qu'un vaccin qui fait vraiment quelque chose, sont assez fascinants, mais là aussi, ce n'est qu'une facette de cette pandémie (et finalement rien de vraiment spécifique à elle : le complotisme antivax a une histoire bien plus longue).

Et puis il y a la question des modes de transmission : savoir pourquoi on a cru au début (ou cru qu'on croyait ? ou feint de croire ?) que le virus se transmettait par manuportage, si bien qu'on nous a donné comme consigne abondamment répétée de nous laver soigneusement les mains et qu'on s'est focalisés sur le gel hydro-alcoolique qui ne servait finalement à rien dans une pandémie respiratoire. (Je crois que j'avais vu passer un texte qui expliquait l'origine de cette erreur, mais je ne le retrouve plus.)

C'est d'ailleurs fascinant comme nous aimons regarder les pandémies du passé avec une sorte de condescendance sur les gens d'alors qui faisaient toutes sortes de rituels complètement inefficaces pour se protéger de (disons) la peste, alors que nous avons passé des mois à nous laver très soigneusement les mains, voire à désinfecter ce que nous achetions au supermarché, pour absolument rien. Mais passons.

D'autres aspects de la pandémie, en revanche, ne semblent guère avoir fait l'objet d'une analyse sérieuse.

☞ La dilapidation de la crédibilité des scientifiques

Notamment, il y a la question des prédictions des épidémiologistes-modélisateurs. Celle-là m'a beaucoup intéressé pendant la pandémie (j'avais par exemple écrit ce billet au sujet des biais systématiques dont ils étaient victimes), mais je trouve qu'on n'en a pas vraiment parlé après. Évidemment, ce qui est bien avec le recul du temps, c'est qu'on peut confronter les prédictions à la réalité : cette analyse rétrospective des modèles épidémiologiques est ce que fait cette page pour ce qui est de la France, c'est très intéressant (et assez frappant pour confirmer le fait que les biais de ces modèles sont systématiques et que les scénarios ne représentent pas du tout une fourchette autour de la réalité). Mais on aimerait voir une étude approfondie de la question : qu'est-ce qui a fait que des modèles largement dépourvus de fondement empirique ont été utilisés pour faire des études présentés au public et aux pouvoir politique comme des prédictions scientifiques[#4] ? (Ces modèles sont certes mathématiquement intéressants, j'ai moi-même joué avec, mais je suis bien placé pour savoir que mathématiquement intéressant ne dit pas grand-chose sur la capacité de prédire le réel, même si on ajoute assez de paramètres pour faire agiter la trompe au proverbial éléphant.)

[#4] Encore maintenant, on continue à voir passer (et reprendre par la presse) des études selon lesquelles les mesures prises en France auraient sauvé tel ou tel nombre de vies. Je résume en quoi consiste cette escroquerie scientifique, qui est substantiellement la même que dans l'article de l'équipe de Ferguson au début de la pandémie. On part d'un modèle profondément inadapté à décrire une pandémie humaine, à savoir le modèle SEIR, auquel on ajoute plus de compartiments pour donner l'impression que c'est plus sérieux, mais sans rien faire pour corriger les hypothèses délirantes intrinsèques au modèle SEIR (que les contacts entre personnes sont aléatoires et équiprobables, que tout le monde est également susceptible à l'épidémie, que les gens ne modifient pas leurs comportements à l'épidémie elle-même, seulement aux mesures prises par en haut, etc. — toutes sortes de choses qui sont démontrablement et évidemment complètement fausses). Ensuite, on postule que la seule chose qui peut réduire la transmission de l'épidémie est une mesure prise parmi un ensemble qu'on a choisi d'identifier (confinements, fermetures d'écoles, etc.), on fait une régression sur la dynamique du modèle pour inférer à partir de ce postulat quelle est la réduction de transmission correspondant à chacune des mesures, et on rédige ça en cachant le postulat et en faisant comme si on avait démontré que telle mesure produit telle réduction de la transmission. Débarrassé de sa sophistication modélisatrice, l'article dit juste j'ai postulé que la cause de ceci était cela, et j'observe l'étendue de son effet. Outre que ces articles ne définissent pas un confinement autrement que comme le paquet de mesures pris par la France entre telle et telle date et dont j'ai postulé qu'il était la cause de l'effet que j'observe, l'escroquerie devient généralement apparente quand on applique exactement le même modèle à la Suède : soit on doit ajouter un paramètre d'ajustement ad hoc qui prend une valeur mystérieusement énorme pour la Suède, soit on décide que la Suède a eu l'équivalent d'un confinement (les Suédois se sont autoconfinés), auquel cas le modèle ne démontre en rien l'utilité des mesures prises en France. (Si on veut, l'ensemble des études épidémiologiques sur l'efficacité des confinements semble surtout démontrer que le terme de confinement est performatif par une sorte de consensus social, mais n'explique en rien ce qui constitue ce terme — à part d'avoir décidé de l'appeler comme ça — ou ce qui crée ce consensus.) Pour ma part, j'aimerais vraiment savoir si les auteurs de ce genre de papiers croient vraiment les conneries qu'ils racontent ou s'ils veulent juste allonger leur liste de publication (ou, plus vraisemblablement, sont de malheureux doctorants à qui on fait faire un vil boulot auquel ils ne croient pas du tout).

Cette question est importante parce que, j'ai déjà exprimé cet avis à diverses reprises, ces prédictions par les épidémiologistes-modélisateurs dont le grand public a pu mesurer combien elles étaient imbues d'une confiance excessive, ont endommagé la réputation de la science dans son ensemble. Et à une époque où, dans toutes sortes de domaines, nous avons cruellement besoin qu'on écoute ce que la science et les scientifiques ont à dire, ces gens ont fait un mal fou en mettant en avant des prédictions dont tout le monde pouvait mesurer immédiatement combien elles étaient fausses.

↑Entry #2789 [older| permalink|newer] / ↑Entrée #2789 [précédente| permalien|suivante] ↑

↓Entry #2788 [older| permalink|newer] / ↓Entrée #2788 [précédente| permalien|suivante] ↓

(samedi)

La dystopie des applications sur smartphone

La cause immédiate de l'écriture de ce billet est que la chaîne de salles de sports où je pratique la musculation (Neoness) a décidé de changer le contrôle à l'entrée de ses clubs et semble[#] maintenant exiger qu'on bippe au portique avec son smartphone sur lequel on aura installé une app qu'ils proposent, plutôt que de simplement présenter une carte de membre comme c'était le cas avant. L'app en question est notée 1.6 étoiles sur 5 en moyenne sur le Play Store d'Android (et je rappelle que le minimum est 1 étoile, pas 0, donc 1.6 étoiles sur 5 doit en fait se comprendre comme 0.6/4, ou 3/20 si on veut), ce qui donne une idée de combien les gens l'aiment, mais à la limite ce n'est pas mon problème : ce qui me préoccupe est plutôt la question de savoir dans quelle mesure il est acceptable d'une part, et légal d'autre part, d'exiger aux clients d'un club de sport, et plus généralement aux gens voulant pratiquer telle ou telle activité ou bénéficier de tel ou tel service, d'installer une app sur leur smartphone (et donc, pour commencer, d'avoir un smartphone permettant d'installer ladite app). Et de façon plus large, je veux réfléchir (réfléchir voulant dire : ranter de façon incohérente[#2]) sur la manière dont les apps pour smartphone nous enchaînent dans ce qui ressemble de plus en plus à une dystopie.

[#] J'écris semble ici, parce que tout est extrêmement confus à ce stade : peut-être que des nouvelles cartes (compatibles avec leur nouveau système) seront censées être disponibles pour les gens qui ne veulent pas utiliser leur smartphone, peut-être qu'elles sont « juste » en retard, peut-être qu'elles seront payantes, rien n'est clair. (Si elles sont payantes, je trouve complètement anormal qu'on me demande de payer un nouveau badge pour accéder à un club de sports dont j'ai déjà payé — comptant — l'inscription annuelle. Mais bon, ça m'emmerde beaucoup moins que de devoir installer une app sur mon téléphone, donc si le choix est entre payer ~15€ pour une nouvelle carte ou installer une app, je préfère payer ; et si le choix est entre payer ~15€ pour une nouvelle carte ou me faire rembourser le temps restant sur mon abonnement, je préfère aussi payer.) ❧ La raison pour laquelle tout ça n'est pas clair est que la première fois que j'ai voulu entrer et qu'on m'a dit que l'ancienne carte ne marchait plus et qu'il fallait installer une app j'ai dit je n'ai pas de smartphone avec moi et on m'a laissé passer ; et la seconde fois je voulais quand même savoir si ça marchait, donc j'ai badgé avec leur app de m●rde. Je ne voulais pas m'engueuler avec le préposé à l'entrée, qui n'y est pour rien et dont ce n'est pas le boulot : j'attendrai de voir si je peux parler au responsable du club. Mais comme le cas précis de Neoness n'est qu'un prétexte pour parler du problème de façon plus large, peu importent ces détails.

[#2] Et avec quantité de digressions présentées sous la forme de notes. D'ailleurs, tant que j'y suis à digresser, il faudrait un jour que je trouve un terme en bon français bien de chez nous pour remplacer le franglicisme ranter. Peut-être déblatérer ?

☞ À qui les apps mobile rendent-elles service ?

Il y a une app pour ça nous promettait le slogan qui nous a fait passer dans la seconde phase de la téléphonie mobile, celle où on est passé du téléphone mobile de base qui servait juste[#3] à échanger des appels et des SMS et peut-être à prendre des photos, à un appareil à tout faire, indispensable accessoire pour tant de nos activités quotidiennes. Notez bien que je ne me plains pas en soi de l'avènement du smartphone : avoir Internet tout le temps dans la poche me rend vraiment service (pour consulter Wikipédia ou quelques autres sites Web, utiliser des cartes, accéder à distance à des fichiers sur mes propres ordinateurs), et je ne regrette pas le bon vieux temps. Et même s'agissant des apps, il y en a quelques unes qui me sont vraiment utiles[#4].

[#3] Bon, en fait il y a eu très tôt des sortes d'applications sur les téléphones pré-smartphone : certains jeux étaient préinstallés sur le téléphone, et sur certains on pouvait installer d'autres choses. Mais comme ces téléphones n'avaient qu'un accès limité à Internet (et qu'Internet sur mobile coûtait la peau du c●l), peu de gens installaient quoi que ce soit ; et comme en plus les téléphones étaient peu compatibles entre eux, il n'y avait pas de vrai écosystème d'apps comme il y a maintenant sous Android et iOS. Il aurait été impensable à plus d'un titre, à cette époque, d'exiger une app sur téléphone pour quoi que ce soit.

[#4] Notamment, comme je le disais dans ce billet, OsmAnd pour avoir des cartes hors ligne, QuickDic pour des dictionnaires hors ligne, Signal comme application de messagerie, PlanetDroid pour connaître l'heure de lever et coucher du soleil et de la lune, et quelques autres de ce genre.

Mais quand même, on est en droit de se demander : à qui les téléphones cherchent-ils à rendre service ?

Une amie m'avait fait la remarque (ça devait être à l'ère pré-smartphone) que les téléphones mobiles rendaient surtout service aux gens qui cherchent à vous joindre — et pas forcément à vous si vous êtes de ces personnes qu'on cherche à joindre plus souvent qu'elle ne cherche à joindre les autres : on présente ça comme un outil fabuleux, et parfois il l'est, mais ça peut aussi être un mécanisme d'asservissement, notamment à l'obligation sociale d'être tout le temps joignable[#5].

[#5] On peut dire la même chose des mails, qui ont créé la norme sociale qu'on est « censé » les lire en moins de 24h, ce qui représente aussi un sacré asservissement.

Il en va de même des apps sur mobile : parfois elles sont effectivement là pour vous rendre service, mais souvent elles rendent surtout service à la personne qui a créé l'app : il y a du vrai[#6] dans l'adage que si c'est gratuit c'est que c'est vous qui êtes le produit.

[#6] Ce n'est pas toujours vrai, heureusement, il y a des gens qui ne sont pas des connards et qui développent bénévolement des logiciels libres ; mais comme je l'ai déjà signalé l'écosystème des smartphones est extrêmement pourri et tourné vers la recherche du profit, et il n'y y a que très peu de logiciels libres : quasiment toutes les apps (même des choses qui ont dû demander cinq minutes à écrire) sont soit payantes soit infestées de pubs soit destinées à rendre plus service à l'entité qui les a développées qu'à la personne qui les installe. Et c'est vraiment une question de culture, parce que dans le monde des ordinateurs ce n'est pas ça qui manque, les programmes, mêmes complexes, qui sont libres, gratuits, sans pubs et développés sans arrière-pensée malsaine.

Globalement parlant, si on essaie de vous inciter à installer une app, c'est probablement que vous ne devriez pas installer cette app ; et la note incroyablement basse de l'application Neoness que j'évoque plus haut en est une bonne illustration. C'est un petit peu exagérément simplifié, mais il y a de ça. Les apps vraiment utiles pour moi (exception faite de celles de Google, qui sont un peu à part parce que ce sont de toute façon eux qui développent Android donc ils ont un intérêt plus subtil dans l'affaire), j'ai dû découvrir leur existence par moi-même, on n'a pas essayé de me convaincre de les utiliser (bon, peut-être quelques amis dans le cas de Signal, mais en tout cas pas les gens à l'origine de l'app).

☞ Apps mobiles vs. webapplications

Il y a un dessin de xkcd qui résume très bien les choses : il montre un popup sur un site Web pour mobile qui affiche Want to visit an incomplete version of our website where you can't zoom? Download our app! et les deux choix sont OK ou No, but ask me again every time. Ceci mérite quelques commentaires. Pourquoi au juste tient-on à nous faire installer une app mobile plutôt que passer par un site Web ? Je n'ai pas forcément la réponse complète, mais j'ai des éléments de réponse qui doivent couvrir l'essentiel des cas. (Je renvoie à mon long billet de vulgarisation pour les généralités sur le Web et son fonctionnement technique qui sont plus ou moins pertinentes ici.)

D'abord, il est vrai qu'il y a des choses qu'on peut faire dans une app et pas dans un site Web. Mais la différence n'est pas aussi prononcée qu'on pourrait le croire : comme je l'explique dans le billet que je viens de lier, le Web moderne permet à tout site de se comporter comme une véritable application ; en gros, un site Web est une app qui tourne sur votre navigateur comme n'importe quelle app mobile en est une qui tourne sur Android/iOS : il y a des différences techniques comme le fait que l'app Web est normalement écrite en JavaScript alors que l'app mobile est écrite en Java pour Android ou Objective-C pour iOS, mais peu importe. Et de fait, on trouve des exemples d'applications assez complexes sous forme de sites Web, de la suite bureautique (Google Docs) à des jeux en passant par toutes sortes de réseaux sociaux. (Comme il est beaucoup plus pénible de diffuser des apps pour ordinateurs fixes que pour mobiles, beaucoup de services qui veulent pouvoir être accessibles sur fixe et sur mobile, comme les réseaux sociaux, ont une app mobile en plus d'un site Web, ce qui interroge forcément sur l'utilité de la première.) Et on aurait tort, aussi, de croire que le JavaScript tournant dans un site Web est forcément significativement plus lent qu'une app mobile : bon, peut-être que pour des choses extrêmement critiques la différence est pertinente mais certainement pas pour 99% des apps qu'on utilise normalement sur smartphone.

Alors il est vrai que certains éléments du smartphone ne sont pas forcément utilisables depuis un site Web. Mais même sur ce plan la différence n'est si claire : après tout un site Web peut demander, par exemple, à consulter la position relevée par le GPS (évidemment, votre navigateur vous demandera votre permission avant de permettre à l'application Web de l'obtenir ; et d'ailleurs, le système d'exploitation mobile vous demandera aussi votre permission avant de permettre au navigateur de l'obtenir). Un site Web doit aussi pouvoir demander la permission d'accéder à la caméra du téléphone, ou à son microphone. Je ne sais pas s'il y a des mécanismes (API) d'accès aux accéléromètres ou autres capteurs de ce goût, et il n'y a probablement pas moyen de faire du NFC ou du Bluetooth un peu fin, mais on voit quand même qu'il y a une certaine flexibilité dans ce qu'on peut faire en JavaScript depuis une page Web (et donc en utilisant, en quelque sorte, le navigateur comme un système d'exploitation mobile).

D'ailleurs, c'était l'idée derrière Firefox OS, un système d'exploitation pour mobile que Mozilla avait commencé à développer (j'ai brièvement eu un téléphone sous ce système, mais malheureusement il est mort — le système d'exploitation, je veux dire, pas le mobile) : le téléphone faisait tourner essentiellement une seule chose, à savoir Firefox, et la frontière était totalement abolie entre un site Web et une application Firefox (OS). Notamment, on pouvait tester une application sans l'installer, puisque de toute façon la procédure d'installation ne faisait que rendre l'application disponible en local, mais sans changement fondamental par rapport à utiliser directement le site Web. Le système de permissions était très bien fait (il était très en avance sur Android, et il a été partiellement repris par ce dernier), et donnait un bon contrôle à l'utilisateur. Bref, ce système d'exploitation mobile aurait été (du point de vue de l'utilisateur) tellement meilleur qu'Android et iOS — si seulement le succès n'était pas une question d'argent — et c'est une tragédie[#7] que Mozilla n'ait pas eu les moyens suffisants pour lui tailler une place dans l'écosystème mobile. Mais on sait déjà que le monde informatique favorise les oligopoles de la médiocrité.

[#7] On pourrait quand même espérer une forme de retournement de la chance sous la forme suivante : que les navigateurs Web finissent par adopter les interfaces permettant de faire depuis une page Web tout ce que Firefox OS aurait permis (y compris une forme de copie locale du site), si bien que Firefox sur Android puisse servir de facto de Firefox OS (la couche Android n'étant là que pour prendre de la place) ; et que progressivement les gens prennent l'habitude de refuser d'installer des apps sur mobile et exigent des sites Web. Malheureusement, on ne semble pas trop en prendre la voie. Et comme Google a la main à la fois derrière Android et derrière le navigateur Chrome, il ne se prive pas pour abuser de sa position dominante ; côté iOS, c'est encore pire puisque, jusqu'à ce que l'Union européenne n'oblige Apple à rendre un peu de liberté à ses utilisateurs (et encore, Apple n'y a consenti, sous la menace légale, que dans l'Union européenne), le seul navigateur possible sur iOS était celui d'Apple, Firefox pour iOS n'étant qu'une couche de vernis autour.

☞ Pourquoi on veut nous faire installer une app

Mais je digresse. Ce que je veux dire, en tout cas, est que dans la grande majorité des cas, ce que je cherche à faire est faisable uniquement dans une app et pas dans un site Web n'est pas la vraie raison pour laquelle on cherche à vous faire installer une app — si tant est que ce soit mis en avant, c'est plutôt un prétexte. (Il y a bien quelques cas où il me semble légitime qu'une app sur smartphone soit nécessaire pour accéder à un service : par exemple un système de location de voitures, mais je vais y revenir.)

La vraie raison est pour laquelle on cherche à nous pousser à utiliser une app surtout à chercher dans deux choses. D'abord, une app il faut l'installer, alors qu'un site Web on se contente de le visiter (comme je le dis ci-dessus, Firefox OS prévoyait un mécanisme par lequel des webapplications auraient permis une copie locale, ce qui serait d'ailleurs souhaitable pour plein de raisons, mais en l'état, un site Web il n'est consultable qu'en ligne). Du point de vue de l'utilisateur ça peut effectivement être une raison légitime, si l'application est destinée à pouvoir servir même là où on n'a pas forcément de couverture réseau — mais la plupart des apps mobiles ne marchent de toute façon pas sans accès au réseau, donc ce n'est pas vraiment ça. Du point de vue du concepteur de l'app, le fait d'obliger l'utilisateur à l'installer lui donne une métrique, le nombre de téléchargements de l'app, et les commerciaux aiment bien les métriques à maximiser et à mettre en avant sur leurs présentations PowerPoint : téléchargements égale visibilité égale pouvoir, ou quelque chose comme ça.

L'autre chose, c'est surtout qu'une app donne plus de pouvoir qu'un site Web, et je parle là de pouvoir de s'opposer à l'utilisateur ou de le contrôler. Par exemple, mais ce n'est qu'un exemple d'un phénomène plus large, il est beaucoup plus difficile de bloquer les pubs dans une app mobile que de bloquer les pubs dans un site Web.

↑Entry #2788 [older| permalink|newer] / ↑Entrée #2788 [précédente| permalien|suivante] ↑

↓Entry #2787 [older| permalink|newer] / ↓Entrée #2787 [précédente| permalien|suivante] ↓

(dimanche)

Sur le dangereux mythe du « génie »

Quand l'an dernier j'ai écrit un billet sur l'intelligence artificielle je me suis dit que je devrais en faire un aussi sur l'intelligence naturelle — pour expliquer, en gros, que je trouve que, sans nier que des gens différents réfléchissent de façon différente, l'intelligence est un terme tellement vague et fourre-tout qu'il ne veut plus rien dire du tout, et qu'en gros à chaque fois que quelqu'un essaie de s'en servir c'est une tentative d'escroquerie. Je n'exclus pas de faire ce billet un jour ultérieur, mais je voudrais commencer par un sujet proche quoique légèrement différent : le mythe du génie. Je ne veux pas parler ici des djinns des Mille et Une Nuits, mais des gens supposés avoir des capacités exceptionnelles dans un domaine intellectuel, artistique, militaire, politique, commercial, ou quelque chose de ce genre.

Le mythe du génie existe sous différentes variantes. Il y a par exemple le mythe du petit génie, c'est-à-dire du génie précoce : je me sens particulièrement enclin à démystifier celui-là parce qu'on a plus ou moins essayé de me faire passer comme tel quand j'étais ado, ce qui a certainement nui à mon développement émotionnel et à mes chances de construire des relations humaines saines[#] (heureusement j'avais des amis solides qui n'étaient pas victimes de ce mirage) ; donc maintenant, à chaque fois que j'entends parler d'un « petit génie » je pense surtout qu'on est en train de casser les chances d'un gosse d'avoir une enfance normale en le traitant comme une bête de foire[#2].

[#] Je veux dire que non seulement cette illusion du petit génie tendait à me mettre à l'écart des autres comme « le mec bizarre », mais ça m'encourageait à me justifier à moi-même ma mise à l'écart parce que je vaudrais mieux qu'eux, — et donc à faire de moi un petit con prétentieux. Les choses sont évidemment plus complexes et plus nuancées que cette présentation simpliste (je n'ai certainement pas été ostracisé pendant ma scolarité, même si j'ai largement été considéré comme bizarre ; et si on est en droit de penser que je suis resté un petit con prétentieux j'espère avoir changé au cours des 30 dernières années), mais il me semble que laisser des enfants croire qu'ils sont des petits génies, ou laisser leurs pairs le croire d'eux, ne peut que nuire à leur épanouissement.

[#2] Il y aurait aussi tout plein d'autres choses à dire sur le concept de haut potentiel intellectuel, qui semble plus en vogue parce que petit génie ne fait pas très scientifique, et parce que c'est superficiellement plus modeste (et plus difficilement falsifiable puisque c'est juste du potentiel). À mes yeux, c'est un concept tout aussi nuisible, mais sans doute plus une escroquerie orientée vers les parents tout prêts à croire que Chérubin a un grand potentiel c'est-à-dire qu'il est très spécial. Comme je ne suis pas parent, et que ce terme ne semblait pas trop utilisé quand j'étais gosse, je ne m'étends pas là-dessus.

Mais il y a aussi le mythe du grand génie, c'est-à-dire quelqu'un qui fait quelque chose d'inaccessible à tout autre, qui a des éclairs de fulgurance (coups de génie) pouvant aller jusqu'à transformer l'Humanité (ou tout un domaine scientifique, artistique, etc.) : celui qui laisse vraiment une marque dans l'Histoire.

Quand je dis que c'est un mythe, ce n'est évidemment pas une affirmation scientifique précise : la notion étant mal définie pour commencer, il est difficile de prendre une position qu'on puisse assujettir à un test statistique : les génies existent-ils ?. Mais disons que je ne vois rien sous cette notion qui ne puisse s'expliquer par une combinaison de motivation et d'efforts ordinaires, de chance, et surtout d'un énorme effet de sélection et mirage de la célébrité dans la manière dont nous aimons repenser le passé pour en faire de jolies histoires — ainsi que d'un effet « boule de neige » dont je dois reparler.

L'Histoire avec une grande ‘H’ est une aventure collective : mais une aventure collective, c'est difficile à raconter, donc quand notre culture la digère pour en recracher un narratif, elle tend volontiers à chercher des héros (et des anti-héros) autour desquels centrer le récit. Dans certains domaines ces figures qui servent à cristalliser l'Histoire peuvent être celles qui ont beaucoup de pouvoir, beaucoup de courage, ou que sais-je encore : quand il s'agit d'écrire l'histoire des sciences ou des arts, ce sont les « génies ». C'est tellement plus commode de raconter les choses en les coalesçant autour d'une poignée de noms emblématiques (auxquels on peut dédier ensuite une rue ou ériger une statue[#3]) que de regarder la réalité forcément brouillonne et irrégulière du progrès, que nous succombons à ce mythe avec enthousiasme.

[#3] Quelque part il faut aussi que j'écrive un billet pour protester contre cette manie de nommer les choses d'après des gens et de leur ériger des statues. Au mieux c'est planter des arbres pour cacher la forêt. Au pire, on découvre que ces gens qu'on a érigés en icônes ont des côtés moralement pas très reluisants (et nous en avons certainement tous, quoique certains plus que d'autres évidemment) : et tout d'un coup on est embarrassé d'avoir cette rue ou cette statue qui font tache.

Pour être clair, je ne cherche pas à nier que, disons, Léonard de Vinci (pour prendre un exemple un exemple archétypal du « génie ») était un très grand peintre et un très grand ingénieur. Mais il est à l'image de sa Joconde qui focalise les regards de millions de touristes venus au Louvre pour voir ce tableau et nul autre : une sorte de délire collectif qui voudrait nous faire oublier la forêt pour ne voir que cet arbre.

J'ai souvent défendu, ici et ailleurs (par exemple dans ce vieux billet — que je devrais peut-être réécrire —, ou en passant dans celui-ci), la thèse selon laquelle c'est un mythe que le succès (sous toutes ses formes : popularité, reconnaissance, réussite en affaires, etc.) serait mérité plutôt qu'être essentiellement dû au hasard. Un mythe qui, à mes yeux, découle de notre volonté de croire à l'inévitabilité et une forme de morale dans l'Histoire (sophisme du monde juste). S'agissant spécifiquement de la Joconde, on sait très bien que sa popularité est le fruit de divers accidents largement indépendants de sa qualité : un texte écrit en 1869 par Walter Pater, et son vol en 1911 (voir par exemple cette vidéo et cet article de Britannica pour l'histoire de la célébrité de cette œuvre précise). On peut assurément penser que la Joconde est un très beau tableau, mais il n'est pas tenable une seule seconde de prétendre qu'il est tellement exceptionnel qu'il éclipse à lui seul quasiment tout le reste du contenu du Louvre : les gens veulent le voir parce qu'il est célèbre, et il est célèbre parce que tant de gens le voient et en parlent et réutilisent son image — c'est un effet « boule de neige ».

Les réseaux sociaux modernes favorisent grandement cet effet « boule de neige » de la célébrité et du succès en général : une histoire devient « virale », comme on dit, en petite partie à cause de son intérêt intrinsèque, mais énormément à cause du fait que plus elle est reproduite plus elle a de chances d'être reproduite de nouveau. Il en va de même de toutes les métriques de ce genre : le nombre d'abonnés d'un compte YouTube, par exemple. Et on sait très bien que ce n'est pas reproductible (donc pas intrinsèque) parce qu'on a quantité d'exemples de situations où plusieurs personnes ont tweeté exactement la même chose, mais l'une des copies a eu un succès planétaire et pas l'autre : il n'y a pas plus de logique à ça qu'au fait que de deux boules de neige, l'une peut déclencher une avalanche et l'autre pas. La qualité peut aider à rencontrer la popularité, il y a sans doute une corrélation, mais elle n'est ni vraiment nécessaire, ni certainement suffisante. (Il y a d'ailleurs des gens qui dont la raison d'être célèbre est justement d'être célèbres, du genre Kim Kardashian.)

Mais ce n'est pas tellement ce caractère aléatoire du succès qui m'intéresse ici. C'est déjà un peu plus le mythe du mérite, que nous construisons autour parce que nous n'aimons pas croire au hasard, parce que nous avons le cerveau tellement câblé à chercher des causes et des corrélations que nos ancêtres ont inventé des dieux qui régissent l'Univers en cherchant des motifs dans la météo ou d'autres phénomènes naturels.

Le mythe du mérite n'est nulle part aussi frappant que dans le fantasme autour du supposé génie des milliardaires en affaires, et notamment des milliardaires de la tech.

Il y a plein de gens qui sont persuadés que puisque Bill Gates, Steve Jobs, Jeff Bezos, Mark Zuckerberg et maintenant souvent Elon Musk, sont aussi riches, c'est forcément que ce sont des génies visionnaires. C'est fascinant à quel point ce mythe est fort : on ne devient pas l'homme le plus riche du monde par chance m'a-t-on dit régulièrement. Ben si, évidemment que c'est possible : même si tout le monde passait sa vie à jouer au casino, il faudrait bien qu'il y ait une personne la plus riche du monde, et ça ne signifierait pas qu'elle ait la moindre capacité à prédire le mouvement de la boule de la roulette.

Le mirage des milliardaires s'explique parfaitement par l'effet de sélection : des tas de gens ont parié leur argent sur des tas de projets d'entreprises qui avaient une certaine chance de réussir et une certaine chance de se planter, et c'était essentiellement imprévisible parce que le succès est imprévisible et essentiellement aléatoire : l'essentiel de ces gens ont juste perdu leur argent, et on ne s'intéresse qu'à ceux qui ont réussi, donc par définition ils ont réussi, et il n'y a rien à expliquer à part qu'on s'intéresse à eux parce qu'ils ont réussi. Si on veut expliquer le pourquoi eux, on peut dire qu'ils étaient en général riches pour commencer (pas forcément multi-milliardaires, mais au moins passablement riches), ce qui leur a permis d'emprunter assez pour investir beaucoup, voire investir de façon répétée dans des projets risqués sans risquer de se retrouver sur la paille alors que des gens moins riches avaient une seule chance dans la vie. (Encore une fois, évidemment, il y a plein de gens riches qui ont investi beaucoup et se sont plantés — et pas retrouvés sur la paille mais juste un peu moins riches qu'ils ne l'étaient — mais on n'en parle pas trop, parce qu'on ne fait pas une étude statistique sérieuse.)

↑Entry #2787 [older| permalink|newer] / ↑Entrée #2787 [précédente| permalien|suivante] ↑

↓Entry #2786 [older| permalink|newer] / ↓Entrée #2786 [précédente| permalien|suivante] ↓

(vendredi)

Guide du tourisme en Île-de-France : partie 2 (le sud et sud-ouest)

Je continue ma tentative d'écrire une sorte de guide touristique de l'Île-de-France commencée dans la première partie qui concernait des généralités et la petite couronne, et auquel je renvoie pour l'introduction. Je vais suivre approximativement le sens des aiguilles d'une montre autour de Paris (mais en commençant par le sud) : initialement, mon idée était de regrouper par département, mais c'est un peu artificiel alors je vais faire mon propre regroupement, sans doute pas moins artificiel, qui correspond à ma propre façon de penser la géographie de la région. Comme pour l'entrée précédente, ceci est une sélection complètement personnelle et pas du tout représentative d'autre chose que mes propres goûts (et possibilités de déplacement), et en plus je ne parle ici que des activités « en extérieur » — et même comme ça j'aurai forcément oublié plein de choses (que je vais peut-être ajouter ultérieurement en éditant ce billet).

Concernant les liens vers OpenStreetMap : je les ai faits vers des cartes à toute petite échelle pour qu'on voie bien la situation d'ensemble, mais le marqueur est positionné aussi précisément que j'ai pu (ou que ça avait un sens !) : donc pensez à zoomer.

Table des matières

Forêt de Fontainebleau et alentours

[Escalier montant entre les arbres et les rochers]

Image : Paysage typique de la forêt de Fontainebleau (photo prise ici le )

Je vais commencer par Fontainebleau et sa forêt (donc par ici). Fontainebleau (comme Rambouillet et Compiègne, ou dans une certaine mesure Versailles, mais c'est encore plus clair à Fontainebleau) est organisée en oignon : un château, les « jardins » du château, le « parc » (un peu moins manucuré que les jardins mais néanmoins enclos) qui prend place contre la ville, et la forêt autour de la ville. Comme par le principe de ce billet je ne parle pas du château lui-même. Les jardins du château de Fontainebleau sont jolis (et labellisés « jardin remarquable ») quoique pas très grands : il y a un jardin à la française et un jardin à l'anglaise façon arboretum ; le parc n'est pas mal, mais c'est surtout la forêt à laquelle on pense quand on parle de Fontainebleau. Non seulement la forêt de Fontainebleau est grande (enfin, à l'échelle de l'Île-de-France), mais elle n'est pas trop morcelée (il y a bien un golf, des stades et un ou deux hippodromes, mais la forêt est assez grande pour que ça ne la coupe pas en morceaux). Donc c'est la forêt de référence pour les sorties dominicales des Parisiens par jour de beau temps (et de fait, certains dimanches de beau temps les parkings tendent à être bien pleins).

Comme je le disais dans les remarques générales (du billet précédent), c'est un peu difficile de parler d'une forêt de façon générale, et celle de Fontainebleau est assez variée. Elle est connue pour ses « rochers », et beaucoup de gens viennent y faire de l'escalade, et même si on n'aime pas l'escalade il y a du relief avec de jolis points de vue (souvent marqués comme tels dans OpenStreetMap), mais on trouve aussi plein d'endroits tout plats. Le sol est généralement sablonneux, mais il y a plein de variations. Il y a beaucoup de pins mais ça n'empêche pas de trouver des endroits avec uniquement des feuillus. Bref, c'est difficile de faire des généralités. Je peux quand même mentionner les platières, qui sont plutôt une spécificité bellifontaine : des endroits où le grès affleure le sol en formant une sorte de terrasse, de grands arbres mais où la bruyère se plaît (cherchez sur Google Images si vous ne connaissez pas).

Je peux quand même évoquer quelques curiosités dans la forêt de Fontainebleau. La plaine de Chanfroy (ici) est un grand espace dégagé d'arbres où se trouve un monument aux morts ; juste à côté de là, la tour de la Vierge (ici) est une bondieuserie (un petit autel à la vierge Marie décoré de façon extrêmement kitch) qui a l'intérêt d'être situé sur un point culminant d'où on a une vue superbe (sans intérêt particulier — juste sur de la forêt — mais qui porte vraiment loin). La mare aux Évées (ici) est une mare (artificielle) entourée d'un système de rigoles assez curieux (cherchez dans Google Images). La table du Grand-Maître (ici) et la table du Roi (ici) sont d'énormes tables de pierre datant du XVIIe siècle. La tour Denecourt (ici), juchée sur une colline, est un point d'observation datant du XIXe siècle. Le chêne du Rocher Canon (ici) est un chêne qui pousse directement sur un rocher. La forêt est par ailleurs traversée par les aqueducs de la Vanne et du Loing (alimentant en eau une bonne partie de Paris), et ils prennent ici et là la forme de ponts-siphons assez intéressants à voir, par exemple ici (visible ici sur Google Street View) ; il y a d'ailleurs une importante station technique ici dans la forêt. (J'aime bien jouer au petit jeu de dénicher les endroits où on voit dans le paysage les traces du passage, souterrain ou aérien, de l'eau de Paris.)

La ville de Fontainebleau est évidemment accessible en transports en commun (gare de Fontainebleau–Avon, sur la ligne R du Transilien) ; mais la forêt à sa propre halte un peu secrète (ici), même pas mentionnée sur les plans de la ligne : elle est desservie uniquement dans le sens Paris→Fontainebleau, par seulement deux trains de la ligne R, le matin des week-ends et jours fériés. (Enfin, elle eut été un peu secrète avant l'époque d'Internet : maintenant elle a sa page Wikipédia donc c'est un peu mort pour le secret.)

À côté de la forêt de Fontainebleau (ou peut-être à considérer comme en faisant partie), il ne faut pas oublier le massif des Trois Pignons (à l'ouest, vers Arbonne-la-Forêt, par ici mais je ne sais pas où est la limite), qui a à peu près le même caractère quoique peut-être avec plus de relief et plus de pins, mais aussi la forêt de la Commanderie (au sud, vers Villiers-sous-Grez et Larchant, par ici), qui a un caractère assez différent entre sa frange nord-ouest où il y a du relief, des pins et des rochers, et sa grosse moitié sud-est que je n'ai pas trouvée agréable du tout (soit c'est des alignements réguliers d'arbres pas très intéressants, soit c'est un taillis impénétrable, et en tout cas les sentiers sont mal marqués), peut-être même un peu oppressante. Je ne peux pas parler du marais de Larchant (ici), parce que je ne l'ai pas visité, mais je parlerai plus bas d'autres marais analogues.

Si on se promène à moto dans le coin, les routes dans la forêt sont généralement agréables, mais la plus intéressante, à la fois pour le paysage et les virages, est sans doute la D64 entre Arbonne-la-Forêt et Achères-la-Forêt (par ici, cf. ici sur Google Street View). Celle entre Courances et Arbonne-la-Forêt (par ici) est aussi très jolie, mais attention aux nids de poule parfois énormes. Je suppose que ces remarques s'appliquent aussi à vélo.

Mais Fontainebleau n'est pas seulement pittoresque pour sa forêt : il y a aussi un certain nombre de villages en bordure de forêt qui ont leur charme particulier : le plus connu est certainement Barbizon (ici), qui est un peu un piège à touristes (comme Giverny, de l'autre côté de Paris), et noir de monde un week-end de beau temps, mais qui reste quand même intéressant à voir pour ses maisons remarquables. Dans un autre genre, il y a Moret-sur-Loing (au confluent du Loing et de la Seine, ici) qui a gardé un reste de centre-ville médiéval (voyez ici sur Google Street View). Dans un genre encore différent, il y a Samois, entre la forêt et la Seine (ici) où ce qui est le plus intéressant est sans doute la partie qui longe la Seine avec ses demeures de la belle époque. Je peux aussi mentionner Montigny-sur-Loing (ici, cf. par exemple ici sur Google Street View) comme village de caractère, et peut-être Bourron-Marlotte à côté. Et si on passe par Larchant, on pourra jeter un œil à la basilique Saint-Mathurin (ici), qui est bizarrement à moitié, mais seulement à moitié, en ruine (quelques photos ici sur Twitter). Enfin, à Milly-la-Forêt il y a une jolie halle en bois (ici) qui date du XVe siècle, et un conservatoire national des plantes (que je n'ai pas encore eu l'occasion de visiter) ; mais peut-être que j'ai tort de ranger Milly-la-Forêt dans les environs de Fontainebleau, parce qu'elle est en Essonne.

Je n'ai pas eu l'occasion de bien visiter la partie de l'Île-de-France située au sud de Moret-sur-Loing (en gros la rive droite du Loing et gauche de la Seine/Yonne), mais au moins en la traversant à moto (de Sens à Moret-sur-Loing par Chéroy) j'ai trouvé ça très joli. J'ai un peu plus vu, en revanche, la vallée et les coteaux du Loing : il y a des villages très mignons comme Château-Landon (d'où on a une vue magnifique sur les alentours, notamment ici), mais surtout un très intéressant système de canaux, d'étangs et de marais (ainsi que de réserves ornithologiques). Le marais d'Épisy (ici), par exemple, mérite vraiment un tour (quelques photos ici sur Twitter). Globalement, la D40 est vraiment très pittoresque (j'avais par exemple trouvé très mignonne l'église Saint-Martin de la Genevraye, visible ici sur Google Street View et qui a un peu l'air de surgir comme une île au milieu des champs).

L'Essonne et ses vallées

[Wagonnet de carrière abandonné devant un paysage verdoyant]

Image : Paysage typique de l'Essonne (photo prise ici le )

Je me déplace maintenant vers l'ouest pour parler de l'Essonne (le département, mais aussi la rivière éponyme). La partie de la région parisienne dont je veux parler maintenant a des limites un peu floues qui ne sont ni vraiment celles du département de l'Essonne (limites ici sur OpenStreetMap) ni celles de la région historique du Gâtinais (limites approximatives ici sur OpenStreetMap) ni non plus celles du parc naturel régional du Gâtinais français (limites ici sur OpenStreetMap) mais un peu un mélange de tout ça. Disons grosso modo que je parle du bassin des rivières de l'École (ici), l'Essonne (ici), la Juine (ici) et peut-être aussi l'Orge (ici) au moins jusqu'à Arpajon, et la Rémarde (ici) comme terminus ad quem, qui sont divers affluents ou sous-affluents de la Seine.

Si je mentionne ces rivières (et il y en a d'autres, plus petites), c'est que ce sont elles qui sont responsables du caractère spécifique des paysages essonniens : alors que la Beauce et la Brie sont très plates, le Gâtinais (que je prolonge un peu abusivement vers l'ouest), lui, est vallonné par les cours d'eau que je viens de mentionner. Cela donne un terrain assez différent de ce qu'on trouve ailleurs en Île-de-France : pas de grande forêt comme Fontainebleau, mais plutôt plein de petits bois souvent situés sur les coteaux des rivières qui séparent des étendues agricoles. Leur végétation se compose plus d'arbustes variés que les fagacées des grandes forêts. En certain endroits les rivières s'étalent en formant des marais un peu à la manière de ceux du Loing dont j'ai parlé plus haut. La géologie n'est pas en reste et plusieurs endroits de la vallée de la Juine (parfois d'anciennes carrières) sont regroupées en réserve naturelle nationale des sites géologiques de l'Essonne. Quant à l'habitat, il prend notamment la forme de villages souvent pittoresques dans les petites rivières (mais bien sûr aussi beaucoup de maisons franciliennes interchangeables dans des quartiers résidentiels interchangeables — je ne prétends pas que tout est forcément pittoresque).

Bref, les paysages de l'Essonne ont un caractère singulier, auquel je trouve beaucoup de charme. Pour autant, c'est difficile de recommander un endroit précis : ce qui est intéressant, c'est justement le contraste entre les plateaux agricoles et les vallées boisées, parfois à la manière d'un bocage. Alors je peux par exemple recommander de prendre à moto la D837 entre Milly-la-Forêt et Étampes pour avoir un aperçu des paysages relativement typiques de l'Essonne (tels que celui-ci sur Google Street View), ou peut-être la D105 jusqu'à Boutigny-sur-Essonne (ici sur Google Street View), ou peut-être encore la D191 vers Boissy-le-Cutté (ici sur Google Street View), mais il n'y a pas un endroit particulier dont je puisse dire qu'il soit spécialement remarquable, c'est juste une impression d'ensemble. (J'avoue aussi que je mélange un certain nombre d'endroits où je suis passé : j'ai des souvenirs de coins particulièrement jolis vus à moto ou en voiture, mais je ne sais pas forcément les replacer sur la carte à partir d'images un peu confuses dans ma mémoire.)

L'Essonne n'a pas vraiment de grande forêt comme celles de Fontainebleau et de Rambouillet : il y a bien des bois ouverts au public (je vais en signaler deux-trois ci-dessous), mais ce n'est pas toujours évident à savoir. Je renvoie de nouveau à cette carte des espaces verts d'Île-de-France que j'ai déjà liée dans les généralités, mais il me semble qu'elle n'est pas bien complète : par exemple, je me suis déjà baladé dans la forêt à côté de Ballancourt-sur-Essonne (par ici) et je suis sûr qu'elle était ouverte au public (il y a même des panneaux explicatifs sur les roches du Père la Musique), mais elle n'est pas marquée sur cette carte. Malheureusement, il ne semble pas y avoir de vrai bon moyen sûr de savoir si une forêt est accessible au public à part d'aller voir (et d'être préparé à l'idée de tomber à n'importe quel endroit sur une clôture infranchissable).

Signalons maintenant quand même aussi quelques endroits d'intérêt particulier.

↑Entry #2786 [older| permalink|newer] / ↑Entrée #2786 [précédente| permalien|suivante] ↑

↓Entry #2785 [older| permalink|newer] / ↓Entrée #2785 [précédente| permalien|suivante] ↓

(vendredi)

Guide du tourisme en Île-de-France : partie 1 (généralités et petite couronne)

Introduction

[Carte de l'Île-de-France montrant des points où des photos ont été prises][Carte de l'Île-de-France montrant des traces GPS]Comme je l'ai déjà raconté dans un certain nombre de billets de ce blog (par exemple celui-ci et celui-là), le poussinet et moi aimons faire du tourisme en Île-de-France. (Par Île-de-France je n'entends pas forcément l'Île-de-France au sens administratif strict mais, disons, les endroits où on peut facilement se rendre sur la journée, en gros parce que je n'aime pas dormir ailleurs que chez moi. Donc ça va peut-être en gros jusqu'à Compiègne, Château-Thierry, les Andelys, Chartres, mais pas jusque Tours.) Même si j'aimais déjà me balader avant (et j'ai beaucoup marché dans Paris dans les années 2000–2010), c'est surtout après que j'ai passé le permis (et que le poussinet a acheté une voiture) que j'ai eu la possibilité d'explorer différents coins de la région.

Nous avons fait, et continuons de faire, différentes sortes de visites : découverte de parcs et jardins remarquables, recherche de points de vue, marches urbaines, randonnées en forêt ; et je fais aussi de mon côté des virées à moto, même si j'en fais beaucoup moins qu'à l'été 2020.

Les deux cartes ci-contre (cliquer pour les ouvrir en grand format) montrent, à la même échelle : pour celle d'en haut, les géolocalisations de toutes les photos que j'ai prises depuis mi-2016, et, pour celle du bas, les traces GPS des balades à pied que j'ai enregistrées depuis fin 2019 (que j'ai étiquetées — parfois un peu arbitrairement ou abusivement — comme des balades en forêt), et donnent une idée des endroits que nous avons tendance à visiter, parfois de façon régulière.

Il y a une attirance évidente vers le sud-ouest de Paris parce que nous habitons au sud de Paris avec un accès facile à l'autoroute A6, et aussi parce que je travaille à Palaiseau et que ma mère habite Orsay (où j'ai, du coup, grandi au sein de la vallée de Chevreuse), mais aussi simplement parce que c'est l'endroit où on a le plus facilement un accès à des endroits jolis sans aller trop loin (et ce n'est pas un hasard que ce soit corrélé aux coins les plus riches de la région — et en fait du pays). Mais ça ne nous a pas empêchés de quand même visiter régulièrement pas mal d'autres bouts de l'Île-de-France et au-delà.

On m'a souvent suggéré d'écrire une sorte de guide touristique. Le problème (outre que ça prend du temps, mais à la limite, je tape vite) c'est que je ne sais pas comment organiser ça : par direction/département ? par style de chose à visiter (jolis villages, forêts…) ? et d'ailleurs, dans les deux cas, il y a des gros biais presonnels : c'est compliqué de faire un guide pour tout le monde, ce qui va plaire à quelqu'un qui se déplace en transports en commun et quelqu'un qui cherche à faire une balade à moto sont très différents.

Néanmoins, voici une tentative, pas très cohérente et plutôt bordélique, pour dumper certaines des choses que je peux conseiller à voir ou faire en Île-de-France. Entendons-nous biens : non seulement c'est un choix personnel et pas du tout représentatif d'autre chose que mes propres goûts (et possibilités de déplacement), mais en plus je ne parle ici que des activités « en extérieur », donc je ne vais pas parler des musées, châteaux (sauf pour ce qui est de leurs jardins éventuels), etc. Et même comme ça j'aurai forcément oublié plein de choses (que je vais peut-être ajouter ultérieurement en éditant ce billet).

En fait, j'avais commencé ce billet avec l'idée d'écrire des généralités puis de traiter les départements de l'Île-de-France successivement (en réunissant la petite couronne en un seul, donc : 75+92+93+94, puis 91, 78, 95 et 77). Sauf que les sections sur les généralités et la petite couronne m'ont semblé suffisamment longues pour que je préfère publier tout ça comme « première partie » et remettre la suite à plus tard. (Contrairement à mes billets interminables sur des sujets techniques où c'est quand même bien d'essayer de tout garder ensemble pour la cohérence d'ensemble quand je relis, ici je pense que je peux couper en morceaux sans dommage. Donc pour l'instant il n'y a que des généralités et une liste de choses à voir en petite couronne.) ❧ Mise à jour : la deuxième partie est publiée.

Table des matières

Sources d'information

✱ Cartes : La première chose avant de se balader où que ce soit, c'est de savoir où trouver des cartes.

Évidemment je vais citer OpenStreetMap en premier, donc voici le lien général (centré, d'ailleurs, sur le barycentre de l'Île-de-France que j'ai calculé avec PostGIS), mais je vais en faire plein d'autres dans la suite pour montrer les emplacements des endroits d'où je parle (il faudra éventuellement dézoomer pour voir le marqueur ou zoomer pour le situer plus précisément). Quand on se balade, il est bien d'avoir une carte utilisable même si le téléphone ne capte pas le réseau : pour ça je recommande l'application OsmAnd pour Android, et plus précisément la variante OsmAnd~ qu'on trouve sur F-Droid (c'est un logiciel libre) : on peut télécharger une carte de chaque région française, et même si l'application est un peu compliquée à prendre en main initialement, ça vaut vraiment la peine.

S'agissant de la France, et de l'Île-de-France en particulier, on peut aussi trouver des cartes sur Géoportail : voici le lien pour l'Île-de-France, l'avantage de Géoportail par rapport à OpenStreetMap étant qu'ils ont des cartes variées, notamment la carte topographique « Top25 » (c'est vraiment une image de la version papier au 1 : 25 000, donc il faut zoomer mon lien pour y voir quoi que ce soit) qui, bien qu'elle ne soit pas toujours aussi à jour que les autres, est souvent très utile. Pour Géoportail aussi il y a une application Android : elle n'est pas terrible (je ne sais pas pourquoi elle a moins de cartes et de possibilités que le site Web, ce qui est quand même con, et elle ne fonctionne pas hors ligne), mais elle est quand même utile à avoir en complément de OsmAnd.

✱ L'Institut Paris-Région : Anciennement nommé Institut d'aménagement et d'urbanisme de la région Île-de-France, l'Institut Paris-Région est une association à but non lucratif, dont sont membres et financeurs différentes collectivités territoriales, pouvoirs publics et organismes essentiellement publics de la région (la Région elle-même, l'État, les départements et intercommunalités, mais aussi l'IGN, la RATP, l'INSEE, etc.), et qui agit comme agence régionale d'urbanisme pour l'Île-de-France. Ce qui m'intéresse ici est qu'ils publient un certain nombre de cartes thématiques ou autres sources d'informations sur les territoires de la région. Ce n'est pas forcément évident de retrouver des choses dans leurs publications, mais voici par exemple une carte des bois et forêts (et une des espaces verts ouverts au public), une carte des villes et campagnes, une carte des randonnées pédestres et une carte de l'occupation des sols (avec une version interactivement zoomable), sans oublier cette carte des « unités paysagères » (intéressante pour savoir où on verra quel type de paysages). C'est également une carte de l'Institut Paris-Région qui m'avait inspiré ce parcours à la recherche des belvédères. Ils ont aussi par exemple publié un livre Pays & paysages d'Île-de-France (qui a l'air extrêmement difficile à trouver au format papier, mais qui est téléchargeable en PDF au lien que je viens de donner).

✱ Le label « jardin remarquable » : Décerné par le Ministère de la Culture depuis 2004, le label « jardin remarquable » est un moyen de trouver des jardins dignes d'un intérêt particulier. J'ai visité presque tous ceux de l'Île-de-France et un certain nombre au-delà (j'utilise cette section de ce vieux billet pour tenir la liste de ceux que j'ai vus et à quelle date, parfois avec un lien vers un billet de blog ou un fil Twitter ; mais comme il y a eu des ajouts au label, il n'est pas certain que ma liste soit à jour). Si on préfère avoir cette liste sous forme papier, le Centre des Monuments Nationaux édite un Guide des jardins remarquables en Île-de-France (il y en a un par région) — bon, la valeur ajoutée de l'ouvrage n'est pas considérable par rapport à ce qu'on trouvera par quelques recherches en ligne, mais comme mes beaux-parents l'avaient acheté, je leur ai piqué.

✱ L'Office National des Forêts : L'ONF (et spécifiquement pour l'Île-de-France ses agences interdépartementales de Fontainebleau et de Versailles) gère les forêts domaniales (c'est-à-dire : appartenant à l'État). Elle avait une page Web appelée En forêt, un peu vieillot mais néanmoins intéressant (qui eut été à l'adresse http://www1.onf.fr/enforet/@@index.html — maintenant cassée, et pas complètement archivée par l'Internet Archive vers lequel je fais néanmoins pointer mon lien) avec des petites pages descriptives pour chaque forêt domaniale qui donnait quelques photos et, par exemple, la répartition des essences d'arbres dans le massif. Leur site Web semble avoir été refondu et ce truc a disparu (insérer ici mon rant habituel contre les gens qui cassent les liens).

Je peux aussi mentionner Île-de-France Nature, qui est en quelque sorte l'équivalent pour la Région Île-de-France (i.e., pour les forêts régionales) de ce qu'est l'ONF pour l'État.

Remarques générales sur les balades en forêt

Si je prends l'approche de lister les choses à voir géographiquement, il est difficile de savoir quoi faire des forêts. Il y a rarement un endroit précis dont je puisse dire cet endroit-là mérite qu'on y aille (même s'il y a des promenades qui m'ont beaucoup plu, cf. par exemple ici, c'est plus un sentiment qui se dégage de l'ensemble de l'itinéraire, voire de mon humeur du jour ; d'ailleurs, l'impression de charme que produit un endroit en forêt dépend fortement de la saison, et nous cherchons plutôt à éviter de repasser par les endroits où nous sommes déjà allés), tandis que les remarques générales sur tout un massif sont forcément un peu vagues.

Je veux dire, certes, toutes les forêts d'Île-de-France ne se ressemblent pas, mais les différences ne sont pas entre « la forêt de Rambouillet » et « la forêt de Fontainebleau » dans leur masse mais plutôt entre tel type d'endroits et tel autre type d'endroits (forêt de feuillus vs. forêt de conifères, plateaux vs. vallées, lande de bruyère, rochers, grandes routes forestières toutes droites vs. petits chemins tortueux, ce genre de choses). Je ne connais malheureusement pas de carte détaillée des forêts qui montrerait le type de paysage (par exemple les essences d'arbre, et leur âge) qu'on trouve endroit par endroit : on peut parfois deviner par les photos aériennes disponibles sur Google Maps ou Géoportail, mais c'est très imparfait. J'aimerais que l'ONF rende publiques ses informations sur la composition des parcelles (j'imagine qu'ils ont ça en interne).

À défaut de pouvoir faire des remarques par endroit, je peux faire quelques remarques générales sur la typologie.

✱ Les types administratifs de forêts : Quand une forêt est marquée sur la carte (disons OpenStreetMap), même s'il y a des sentiers tracés dedans, ça ne signifie pas pour autant qu'on puisse y accéder, ou que ce soit une bonne idée de le faire. Déjà, on peut distinguer diverses sortes de forêt en fonction du propriétaire. Essentiellement, il y a des forêts domaniales (appartenant à l'État), régionales (appartenant à la Région), départementales et communales (vous aurez deviné) et privées. Cette typologie n'est pas parfaite, par exemple, de ce que je comprends, la forêt de Chantilly (dans l'Oise) appartient à l'Institut de France sous le régime du droit privé (c'est un legs du duc d'Aumale), mais elle est quand même gérée par l'ONF comme une forêt domaniale. Ça reste un bon point de départ.

En règle générale, les forêts domaniales, régionales, départementales et communales sont ouvertes au public, même si certaines parties comme les réserves biologiques, peuvent en être fermées (parfois c'est juste par des pancartes qui vous demandent de ne pas y aller, parfois il y a des grillages). La principale raison de s'intéresser à la distinction entre forêts domaniales, régionales, départementales et communales, est juste que la source d'information les concernant va être différente. La liste des forêts domaniales est raisonnablement facile à trouver ; celle des forêts régionales doit se trouver quelque part aussi ; mais quand on commence à entrer dans les forêts départementales ou communales, ça devient vraiment difficile de connaître le statut, les limites, et de savoir si on va avoir le droit d'aller se balader ici ou là. C'est un peu malheureux que la France ne soit pas capable de coordonner ses collectivités territoriales pour créer une base de donnée claire et lisible des status des forêts publiques. Faute de quoi je ne trouve pas mieux que la carte des espaces verts ouverts au public créée par l'Institut Paris-Région que j'ai déjà liée plus haut.

Les forêts privées peuvent être de toutes sortes ; le plus souvent ce sont des réserves de chasse (je ne crois pas avoir rencontré de forêt d'exploitation du bois privée en Île-de-France, mais il y en a probablement aussi, d'ailleurs c'est sans doute combiné avec une réserve de chasse). Une forêt privée ne signifie pas qu'on n'ait pas le droit d'y accéder : beaucoup de chemins bénéficient, je pense, d'une forme de droit de passage ou de servitude, en tout cas, dans la pratique, on peut souvent y passer. Mais on ne pourra faire que passer : généralement ce sera en suivant un chemin mal entretenu, parfois évanescent, entre deux parties grillagées ou gardées tous les quelques mètres par un panneau annonçant propriété privée : défense d'entrée ; et le risque de tomber sur un cul-de-sac (car souvent ces passages servent simplement à permettre l'accès à une autre propriété, tout aussi grillagée) est élevé, donc je ne recommande pas.

La chasse : Comme je mentionne les réserves de chasse, il faudrait sans doute que je dise un mot sur les chasseurs. Mais en fait je n'ai rien à en dire. Je n'aime pas la chasse et les chasseurs, mais je ne peux pas honnêtement dire qu'ils nous gênent des masses lors de nos balades en forêt. Je suppose que c'est parce que nous nous tenons essentiellement aux forêts publiques (domaniales, régionales, etc.) et que la chasse dans ces forêts est strictement encadrée, et n'a normalement pas lieu le week-end. Toujours est-il que nous n'avons entendu que des bruits au loin.

Les golfs : En se baladant en forêt en Île-de-France, on acquiert rapidement l'impression qu'il y a des golfs partout, et c'est extrêmement agaçant, parce qu'ils sont fermés, ils coupent complètement le terrain en vous obligeant à les contourner, et parfois morcellent véritablement la forêt (par exemple celle de Marly qui, entre les golfs de Noisy-le-Roi Fourqueux et Joyenval, l'autoroute A13 et le tram T13 est un peu réduite à des confettis mal reliés).

Le morcellement de certaines forêts est un vrai problème, et il n'y a pas que les golfs qui en sont responsables : souvent elles sont coupées en deux par des routes qui peuvent être difficiles à traverser (voire quasi impossible comme dans le cas d'une autoroute ou de la N118). Pour le coup c'est très clair sur la carte, mais il faut penser à vérifier à l'avance, parce qu'on peut avoir la fausse impression qu'une forêt est très grande quand, en fait, elle est la réunion de petits bouts presque déconnectés les uns des autres.

↑Entry #2785 [older| permalink|newer] / ↑Entrée #2785 [précédente| permalien|suivante] ↑

↓Entry #2784 [older| permalink|newer] / ↓Entrée #2784 [précédente| permalien|suivante] ↓

(dimanche)

La réalisabilité propositionnelle, et ce qu'elle nous apprend sur les algorithmes

Je veux ici de nouveau parler d'informatique théorique, dans son intersection avec les maths (logique, calculabilité, typage), et plus précisément d'un sujet appelé la réalisabilité propositionnelle. Je reconnais qu'il a un petit côté « opération de pub » de ma part : il s'agit d'un sujet qu'on peut qualifier d'obscur, voire ésotérique (largement confiné à une poignée de publications soviétiques des années 1960–1990, dont certaines n'ont même pas été traduites du russe en quoi que ce soit d'autre[#], ce qui le dessert cruellement), et pourtant il me semble que d'une part il a des choses à nous apprendre sur l'informatique, sur ce que peut ou ne peut pas faire un algorithme, et sur le rapport entre ça et le typage, et d'autre part il n'est techniquement pas très compliqué à exposer (j'en ai dit un mot — bien moins que ce qui va suivre, certes — dans mon cours à Télécom qui s'est récemment fini, et je ne crois pas avoir largué tout le monde). Donc je trouve qu'il mérite plus d'attention.

[#] Bon, le fait que ce soit en russe ne devrait pas être un obstacle sérieux, surtout maintenant qu'on a des OCR et des traducteurs automatiques, il n'y a vraiment plus de raison. Le problème, c'est que souvent, et en plus d'être en russe, l'article a le défaut d'être super mal écrit : extrêmement concis et pas toujours super rigoureux comme les mathématiciens soviétiques avaient tendance à l'être, références vagues, et fautes de frappe à foison. (Voyez par exemple cette question que j'ai posée sur MathOverflow en essayant de comprendre l'argument de Ânkov sur la non-réalisabilité de l'axiome de Scott que j'expose plus bas ici de façon, j'espère, nettement plus clair que le texte original : mon russe est enfoui au fond des oubliettes, mais ce n'est vraiment ce qui était le plus problématique en l'occurrence par rapport aux fautes de frappe et au style de rédaction vraiment minimaliste.)

Je ne sais pas si l'entrée de blog qui va suivre peut aider à convaincre qui que ce soit de s'y réintéresser, mais en tout cas, si on lit ce qui suit on pourra se dire qu'on sait une proportion significative de tout le savoir de l'Humanité sur la réalisabilité propositionnelle (i.e., pas grand-chose !), et il n'y a pas beaucoup de sujets techniques pour lesquels on puisse en dire autant.

Ajout () : Pour les gens qui veulent savoir de quoi ce billet cause mais qui n'ont pas la patience de lire ce pavé (ni même l'introduction), j'ai écrit un résumé en seulement 13 tweets, ici sur Twitter et ici sur BlueSky [on peut lire le fil BlueSky sans avoir de compte dessus].

Table des matières

Résumé et publicité préalable

Avant de rentrer dans le cœur du sujet, j'essaie d'expliquer informellement[#2] (et de manière — j'espère — assez peu technique) de quoi il s'agit, et pourquoi je pense que c'est assez intéressant pour prendre le temps de déchiffrer des articles à moitié oubliés dans des journaux soviétiques et de pondre un pavé de 1729 pages dans ce blog pour réexpliquer le tout aux enfants. (Si on veut passer directement à la définition, c'est possible, mais je pense que c'est intéressant de donner d'abord une idée grossière de ce dont je vais parler, au risque de prendre un peu un ton introduction de manuscrit de thèse. Je remercie d'ailleurs mes peluches pour leur soutien et leur patience tout au long de l'écriture de cette entrée.)

[#2] Autrement dit, comme le corps de cette entrée est très long, je commence par une introduction très longue pour essayer de motiver cette longueur. Je n'ai fait celle-ci plus longue que parce que je n'ai pas eu le loisir de la faire plus courte. (Blaise Pascal)

Introduction : de quoi s'agit-il ? Cadre et motivations

La calculabilité s'intéresse à décrire de façon générale ce que peut ou ne peut pas faire un algorithme informatique. La réalisabilité propositionnelle s'intéresse (du moins selon le point de vue que j'adopte ici) spécifiquement à certaines sortes de manipulations que je pourrais être qualifier de manipulations de données génériques (ou abusivement, fonctions polymorphes). On va décrire ces manipulations génériques par des formules logiques, du style ABBA (logiquement, celle-ci se lit : si A et B alors B et A). La formule représente une sorte de « contrat » qui stipule la manipulation censément effectuée : par exemple, la formule ABBA représente le contrat je prends une donnée de type A et une donnée de type B et je renvoie une donnée de type B et une donnée de type A (et on peut faire ça algorithmiquement, de façon à peu près évidente, en échangeant les deux données qu'on a reçues). Lorsqu'il y a un algorithme qui remplit le contrat, on dira qu'il réalise la formule, ou que celle-ci est réalisable.

Je donnerai une définition précise plus bas de comment lire la formule comme un contrat et ce que ça signifie de la réaliser, mais je peux tout de suite donner un aperçu informel : on s'intéresse à des formules écrites avec les connecteurs binaires ‘∧’, ‘∨’ et ‘⇒’, ainsi que les constantes ‘⊤’ et ‘⊥’ (et ‘¬’ qui est juste une abréviation de X⇒⊥). Les variables (A,B dans l'exemple que je viens de donner) représentent des types de données quelconques et non spécifiés, et les connecteurs logiques représentent des façons de mettre ces données ensemble : grosso modo,

  • AB (le « et » logique) représente la donnée d'une donnée de type A et d'une de type B,
  • AB (le « ou » logique) représente la donnée d'une donnée de type A ou d'une de type B (mais avec l'information de laquelle on a),
  • AB (l'implication) représente une fonction (au sens informatique) qui prend une donnée de type A et en renvoie une de type B,
  • ⊤ (le « vrai ») représente une donnée triviale, et ⊥ (le « faux ») représente une donnée impossible (inexistante ou inobtenable),
  • ¬A (la négation) représente une promesse qu'il n'y a pas de A.

Ainsi, par exemple, pour faire une manipulation représentée par la formule (« contrat ») ABBA, on prend une donnée de type A et une donnée de type B et on les renvoie dans l'ordre contraire, c'est-à-dire la donnée de type B et la donnée de type A, et on pourra dire que la formule ABBA est réalisable (et que ce programme la réalise, i.e., il « remplit le contrat »).

J'ai utilisé le terme type ci-dessus, mais il n'est peut-être pas vraiment approprié, parce que justement, la réalisabilité ce n'est pas pareil que le typage, même si ça y ressemble beaucoup (et c'est la différence qui est très intéressante). Je m'explique un peu plus.

Il y a un formalisme appelé correspondance de Curry-Howard (j'en ai parlé dans un billet précédent, dont il est peut être intéressant de lire au moins l'introduction même si ce n'est pas strictement nécessaire pour la suite) qui transforme une démonstration d'une formule dans un certain système logique (le calcul propositionnel intuitionniste) en un programme qui fait la manipulation décrite par cette formule. Et le fait que ce programme fasse bien cette manipulation est attesté par ce qu'on appelle un système de typage, en l'occurrence le λ-calcul simplement typé enrichi de types produits et sommes, 1 et 0 mais peu importe : si on se limite aux programmes conformes à ce système de typage, alors la correspondance est exacte — je veux dire, bijective : on peut vraiment identifier les preuves de tel système logique avec les programmes conformes à tel système de typage. D'ailleurs, la correspondance n'est pas bien compliquée et fait vraiment correspondre de façon assez simple les différentes règles de la logique avec les différentes constructions admises par le système de typage.

Le système de typage (disons ce fameux λ-calcul simplement typé enrichi de types produits et sommes, 1 et 0), il contraint les programmes a priori : il les contraint dans toutes les étapes de leur construction, il exige que toutes les opérations qu'ils font soient conformes au typage. Et au bout du compte, les formules obtenues décrivant les manipulations qu'on peut faire, ce sont justement leurs types (à la notation près), et ce sont exactement les formules démontrables dans le système logique (c'est ça que dit la correspondance de Curry-Howard).

Mais ce n'est pas de ça que je veux parler. Ça c'est ce dont j'ai déjà parlé (dans la première partie du billet sur Curry-Howard).

La réalisabilité[#3], elle ne contraint pas les programmes a priori comme le fait le typage. Elle correspond à la philosophie suivante : le programme a le droit de faire ce qu'il veut comme manips (il faut juste que ce soit un algorithme au sens usuel de la calculabilité, celle de Church-Turing, l'idéalisation standard de ce que c'est qu'un ordinateur) et réaliser une formule ça signifie qu'il remplit un certain contrat. Peut-être qu'entre temps, au sein de leurs manips, les programmes violent toutes les règles du typage, mais au final, on demande juste qu'ils remplissent le contrat représenté par la formule : c'est le résultat qui compte, et seul le résultat qui compte. (Peut-être aussi qu'il est impossible de prouver que le programme remplit bien son contrat, mais ce qui importe c'est que mathématiquement il le fait : là aussi, c'est juste le résultat qui compte.)

[#3] Enfin, la réalisabilité propositionnelle que j'évoque ici, et qu'on peut qualifier de réalisabilité propositionnelle non typée pour insister, parce qu'il y a 1001 variantes de la notion (ce qui a causé un certain dialogue de sourds entre Andrej Bauer et moi dans cette question MathOverflow — sa réponse est très intéressante mais elle ne répond pas vraiment à la question que je voulais poser, quoiqu'elle réponde peut-être à la question que j'ai posée).

Par exemple, ABBA c'est le contrat tu vas recevoir deux données, la première de type A et la seconde de type B (et, précision importante, tu n'auras ni accès ni information sur ce que sont A et B), tu dois terminer en temps fini et renvoyer une donnée de type B et une donnée de type A, et effectivement on peut se convaincre que la seule façon de faire ça c'est d'échanger l'ordre des coordonnées.

Quand la formule est démontrable (en calcul propositionnel intuitionniste) ou, ce qui revient au même par Curry-Howard, quand on peut faire un programme typé correspondant à la formule, alors certainement ce programme remplit le contrat représenté par la formule, donc elle est réalisable.

Mais la grande surprise (en tout cas pour moi quand j'ai appris ça, mais aussi, de ce que je comprends, pour Kleene qui contrairement à moi n'était pas un idiot), c'est que la réciproque n'est pas vraie : il y a des contrats qu'on peut remplir — des formules qu'on peut réaliser — sans que la formule soit prouvable, ou, ce qui revient au même, sans qu'on puisse le faire dans le système de typage naturel dans cette situation (le λ-calcul simplement typé enrichi gnagnagna). Un des buts de ce billet est de donner des exemples de telles formules (jetez un coup d'œil plus bas si vous voulez voir à quoi ça ressemble).

Ces formules réalisables mais non démontrables illustrent donc, si on veut, des choses que peut faire un algorithme, remplissant un contrat de manipulation qui ressemble à du typage, mais qui ne sont pas faisables dans le cadre du typage — en tout cas du typage le plus naturel dans cette situation — ou, si on veut, ces choses sont faisables, mais la vérification que le contrat est bien rempli est plus compliquée qu'une vérification locale telle que fournie par le typage.

Bien sûr, il n'y avait aucun doute que les algorithmes généraux sont plus généraux que les algorithmes typés : notamment, les systèmes de typage que j'évoque dans cette introduction ne permettent pas de faire de boucle infinie, donc il est évident qu'ils limitent structuralement les algorithmes. Mais ce qui est surprenant dans l'histoire, c'est que l'algorithme va quand même remplir un contrat qui se lit exactement comme un type, i.e., ils font des manipulations de données génériques potentiellement utiles, pas quelque chose comme une boucle infinie ni même une fonction sur un type spécifique comme les entiers.

Je précise pour dissiper un possible malentendu que ce que je dis là n'est pas destiné à être une attaque contre le typage ou son utilité, juste un signe que les choses sont plus délicates que ce qu'on pourrait imaginer naïvement : certes Curry-Howard nous dit que les formules logiques qui correspondent à des programmes typés sont exactement les formules démontrables, mais il y a des contrats qu'on peut remplir de façon plus subtile que le typage.

Et du coup, il me semble que c'est un problème très naturel pour l'informatique et la calculabilité que d'étudier cette réalisabilité propositionnelle, parce que ça a directement trait à ce qu'un algorithme peut ou ne peut pas faire. (Notons que c'est là l'approche que je donne à la question dans ce billet, tout le monde ne sera pas forcément d'accord que c'est la bonne motivation.)

Organisation de ce billet

Dans la suite, je commence par définir de façon précise ce que c'est que la réalisabilité propositionnelle, et je donne des exemples très simples d'une formule réalisable (AB ⇒ BA) et d'une formule qui ne l'est pas (A ∨ ¬A) pour montrer comment on manie la notion. Ensuite je dois faire un certain nombre de remarques générales (plusieurs desquelles sont en petits caractères pour montrer qu'on peut les ignorer et passer à la suite).

Puis je me tourne vers des exemples de formules réalisables mais non démontrables, parce que c'est quand même ça la grosse surprise, que de telles formules existent : pour chacune, j'ai essayé de donner non seulement un algorithme qui la réalise (et comment il fonctionne) mais aussi des explications informelles à son sujet. En revanche, je ne détaille pas l'argument expliquant que la formule n'est pas démontrable (en calcul propositionnel intuitionniste) : il n'y a que la première pour laquelle j'ai fait cet effort, et encore succinctement et en petits caractères, parce que ce n'est pas vraiment mon sujet.

Je commence par la formule qui me semble la plus simple à comprendre intuitivement, celle de Ceitin, puis j'en passe en revue un certain nombre d'autres. On peut traiter ça comme autant d'énigmes : une fois qu'on a compris le principe, c'est un petit jeu de regarder chaque formule comme un contrat à remplir et de se demander comment je vais faire une telle chose avec un algorithme ? (en tout cas, c'est comme ça que j'ai approché le problème : je n'ai pas lu les preuves de réalisabilité qu'on trouve dans la littérature, c'était bien plus instructif de les retrouver moi-même).

Ensuite, je passe à des exemples de formules non réalisables mais intéressantes et notamment « presque » réalisables, à travers deux exemples importants : la formule de Kreisel-Putnam et celle de Scott. Donc cette fois il faut à la fois montrer qu'elles ne sont pas réalisables et que, pourtant, on ne passe pas loin de l'être (et j'explique en quoi elles sont « presque » réalisables, même si je n'ai pas réussi à avoir le recul pour comprendre si on peut définir cette notion proprement).

Enfin je finis par des généralités et spéculations peut-être vaseuses et certainement mal écrites, qui font un peu le pendant de l'introduction ci-dessus.

Pourquoi j'estime que c'est intéressant et important

Bien sûr, comme je l'explique ci-dessus, on peut traiter chacune des formules que je vais lister ci-dessous (aussi bien celles qui sont réalisables que celles qui ne le sont pas) comme un exercice de calculabilité : voici une formule représentant un certain contrat, trouver une façon de le remplir [= réaliser la formule] ou montrer que ce n'est pas possible ; ou même comme une sorte d'énigme (à la manière dont je l'ai fait ici et ). Les outils de base utilisés par ces algorithmes sont toujours un peu les mêmes, et ce sont les techniques fondamentales de la calculabilité : lancer deux tâches en parallèle (sachant qu'au moins une des deux terminera), exécuter un programme pour un certain nombre d'étapes pour voir s'il termine, parcourir tous les entiers naturels en sachant qu'on finira par en trouver un qui remplit une certaine condition — ce genre de choses qui sont les bases de la calculabilité de Church-Turing. Donc déjà c'est au moins intéressant parce que c'est instructif à ce niveau-là.

Mais je pense que ça va plus loin que ça. Comme je le dis plus haut, la réalisabilité propositionnelle est une façon d'aborder le problème, qui me semble central en informatique, de ce qu'un algorithme peut ou ne peut pas faire, et en l'occurrence il est important de comprendre ce que le typage laisse ou ne laisse pas passer, et comme le typage est un outil lui aussi central, comprendre ce qu'il ne laisse pas passer est justement une question cruciale, et même si on peut trouver que la réalisabilité propositionnelle est un prisme un peu étroit pour étudier cette question (j'en conviens), je pense qu'elle a des choses à dire, et je n'ai pas l'impression qu'on les comprenne bien dans l'état actuel de l'art (d'où le fait que les exemples de formules réalisables soient un peu… hétéroclites), mais ça vaut certainement la peine de méditer un peu sur chacune de ces formules certes disparates et de ce qu'elle signifie et ce qu'elle représente. En tout cas, ce n'est certainement pas un hasard si la réalisabilité de ces différentes formules fait appel à ce que je viens d'appeler les techniques fondamentales de la calculabilité.

En outre, ça nous apprend aussi — il me semble — des choses sur la richesse de la logique intuitionniste, même au niveau simplement propositionnel (en nous forçant à nous demander ce que disent logiquement certaines de ces formules qu'on n'aurait sans doute pas pensé à considérer sinon). Ma motivation à moi était justement de me familiariser mieux à la fois avec la calculabilité en général et avec les techniques à l'interface entre logique, calculabilité et typage : en réexpliquant chacune de ces preuves, je m'assure que je les ai bien comprises. (Et il y a plein de choses que j'ai été obligé de revoir en écrivant ce billet.)

↑Entry #2784 [older| permalink|newer] / ↑Entrée #2784 [précédente| permalien|suivante] ↑

↓Entry #2783 [older| permalink|newer] / ↓Entrée #2783 [précédente| permalien|suivante] ↓

(dimanche)

Pourquoi trois personnes dans les conjugaisons et pas plus ?

Je précise d'emblée que ce billet n'est pas à prendre très au sérieux. C'est juste une idée qui me revient en repensant à ce que j'ai écrit récemment sur les conjugaisons.

En français et dans un certain nombre d'autres langues qui conjuguent les verbes, l'un des traits grammaticaux qui déterminent l'inflexion du verbe est la personne du sujet, et elle distingue trois possibilités, à savoir si la personne qui accomplit est :

  1. la personne (ou plus rarement, chose) qui s'exprime, ou un groupe qui la contient,
  2. la personne (ou plus rarement, chose) à qui on s'adresse, ou un groupe qui la contient, ou enfin
  3. n'importe quelle autre personne ou chose ou groupe de telles.

Ces cas de figures s'appellent respectivement la première personne, la deuxième personne et la troisième personne (la numérotation, bien sûr, est une pure convention et il y a des langues où on fait plutôt l'ordre inverse, mais ça ce n'est pas une caractéristique intrinsèque de la langue, juste un choix des grammairiens qui l'étudient ; par contre le fait qu'il y ait ces trois cas est assez nettement une caractéristique de la langue).

La grande majorité des langues indo-européennes qui font varier le verbe selon le sujet utilisent cette typologie en trois personnes (j'écris la grande majorité parce que je ne veux pas me mouiller trop et si j'écrivais toutes il y aurait certainement quelqu'un qui viendrait m'expliquer que dans le dialecte bordurien du vieux syldave il n'y a que deux personnes au singulier et quatre au pluriel, mais disons que je ne connais pas de contre-exemple[#], même s'il y a des exemples de langues indo-européennes qui ne font pas du tout varier le verbe selon la personne, ou seulement selon le genre et nombre du sujet comme le passé en russe qui est visiblement une sorte de participe accordé avec le sujet).

[#] Bon, on peut ergoter que les formes de politesse cassent un peu ce modèle. Par exemple, le pronom Sie de l'allemand se présente inflexionnellement comme un pronom de la troisième personne du pluriel mais fonctionne sémantiquement comme un pronom de la deuxième personne (singulier ou pluriel) en forme de politesse. De même, la multiplicité des pronoms de la deuxième personne en néerlandais (du, gij, jij et u) ne se laisse pas si facilement analyser. Il me semble que ce ne sont pas des objections très sérieuses même si ça doit nous rappeler que les choses en linguistiques sont toujours un peu floues.

Par ailleurs, ces langues indo-européennes font aussi varier le verbe selon le nombre du sujet en même temps que la personne ; et à ce propos, pour autant que je sache, la « clusivité » au pluriel est très majoritairement définie par les règles suivantes : dès que la personne qui s'exprime fait partie du groupe, c'est la première personne du pluriel (indépendamment du fait que telle ou telle autre personne soit dedans : i.e., nous peut vouloir dire moi et toi (= « nous inclusif ») comme moi et lui (= « nous exclusif »)) ; sinon, dès que la personne à qui on s'adresse fait partie du groupe, c'est la deuxième personne du pluriel ; sinon c'est la troisième personne du pluriel.

J'ai l'impression que ces règles sont extrêmement spécifiques.

Ce que je trouve assez fascinant, c'est qu'il y a des langues non indo-européennes qui semblent les suivre aussi au moins partiellement : disons que sur une description superficielle de leur grammaire (je n'ai pas une connaissance assez correcte de ces langues pour vraiment juger), les conjugaisons de l'arabe, du turc, du hongrois et du finnois, qui représentent au moins deux-trois familles de langues indépendantes et indépendantes des langues indo-européennes, ont l'air de se conformer à peu près à cette distinction tripartite sur la personne (à laquelle on peut ajouter la distinction singulier/pluriel sur le nombre). C'est moins clair de ce que je lis des grammaires du swahili et du basque, pour prendre des exemples au pif de langues encore indépendantes de tout ça, mais j'y vois quand même des références à la première et la deuxième personne.

Évidemment, il y a aussi des langues où ça ne veut pas dire grand-chose : par exemple si les verbes sont complètement invariables et qu'on a plein de pronoms pour plein de situations différentes, on peut toujours décider d'en appeler certains pronoms de la première, deuxième et troisième personne, mais ce sera juste plaquer une typologie artificielle sur une langue qui s'en fout. (Bien sûr aussi, toute langue a forcément une façon de dire je mange, tu manges et il mange, mais cette distinction n'a aucune raison d'être obligatoire, et inversement elle peut être plus précise, peut-être que je mange se dit différemment selon qu'on est un homme jeune, une femme âgée, une personne qui a les cheveux longs, l'Empereur, ou je ne sais quoi encore.)

Pour y voir plus clair, il faudrait une grande base de données ouvertes des langues avec une description unifiée de leurs caractéristiques, sur laquelle on puisse rechercher ce genre de choses. Il y a un livre, depuis devenu un site Web, le World Atlas of Language Structures, qui est censé répondre précisément à ce type d'interrogation (et devrait éviter de consulter des grammaires de qualité douteuse du turc et du basque pour essayer de deviner s'il y a un concept de première / deuxième / troisième personne dans ces langues), mais à chaque fois que j'ai essayé de trouver quelque chose dedans, j'ai été épaté par la pauvreté des caractéristiques répertoriées, et ce cas ne fait pas exception : je ne trouve rien dans leur inventaire qui essaie de répertorier si une langue a des notions[#2] de première, deuxième et troisième personne.

[#2] Bien sûr on peut objecter que cette question n'a pas de sens, parce que ce n'est pas clair ce que ça veut dire qu'une langue ait la notion : mais c'est le cas de quasiment toutes les caractéristiques évoquées dans le WALS (je ne vais quand même pas refaire encore un lien vers mon billet sur les frontières floues, si ?). En tout cas je ne trouve rien qui ressemble même à mon interrogation.

Le fait qu'on retrouve quand même une typologie étonnamment semblable (à mes yeux) dans des familles langues qui sont censées être indépendantes m'amène à me demander quelle en est l'explication : je peux imaginer plusieurs hypothèses, ni exclusives ni exhaustives (et certainement pas forcément la même d'un cas à l'autre) :

  • c'est un hasard ;
  • c'est « naturel », ça fait partie du fonctionnement du cerveau humain de penser en trois personnes (moi, toi et lui) ;
  • c'est le signe d'une parenté entre les langues en question (pas forcément un signe de l'existence d'une langue ancestrale universelle, mais au moins la trace d'une super-famille) ;
  • c'est le résultat d'une évolution grammaticale convergente par échanges horizontaux entre familles distinctes (Sprachbund) ;
  • c'est le résultat d'une fausse perspective apportée par la manière dont les grammairiens (majoritairement natifs de langues indo-européennes) analysent les langues en question, en plaquant des concepts venus, disons, de la grammaire latin, sur des langues pour lesquelles ces concepts sont inadaptés.

(J'avais déjà évoqué des possibilités analogues dans mon billet sur les conlangs.)

Je ne sais pas bien quoi croire entre tout ça (et, je répète, rien ne dit que la ou les explications concernant l'arabe soient les mêmes que concernant le turc).

Néanmoins, je voudrais expliquer un peu, en réponse à l'hypothèse que ce serait « naturel » de distinguer la personne qui s'exprime et la personne à qui elle s'adresse de toutes les autres personnes, quel serait l'intérêt possible d'avoir une langue distinguant quatre personnes (au moins une des langues construites que j'avais imaginées quand j'étais ado fonctionnait comme ça).

Quelles seraient ces quatre personnes ? Je pense principalement à la distinction quadruple suivante :

↑Entry #2783 [older| permalink|newer] / ↑Entrée #2783 [précédente| permalien|suivante] ↑

↓Entry #2782 [older| permalink|newer] / ↓Entrée #2782 [précédente| permalien|suivante] ↓

(vendredi)

Mélanges probabilistes et superpositions quantiques

Précisions d'emblée que le but de ce billet, qui évoque le rapport entre (pour prendre un exemple célèbre) un chat vivant avec probabilité ½ et mort avec probabilité ½ (« mélange probabiliste ») et un chat dans un état quantique qui combine vivant et mort (« superposition quantique ») n'est pas vraiment de faire de la vulgarisation, encore moins de la physique. Je m'en sers, comme je fais parfois, surtout pour gribouiller rapidement ce que j'ai (moi matheux) réussi à comprendre de textes que je trouve souvent obscurs, et pour noter des questions que je (me) pose si je veux y réfléchir plus attentivement Un Jour™, mais ça ne signifie pas que d'autres trouveront mes explications plus claires que ce qu'on peut trouver ailleurs. Il s'agit essentiellement de choses très classiques, mais que je trouve généralement très mal expliquées (notamment par le fait qu'on prend rarement le soin d'essayer de décrire le parallèle entre mélanges probabilistes et superpositions quantiques séparément avant de dire comment ces deux choses se combinent), quoique certaines des questions que je soulève au passage n'ont pas l'air d'être beaucoup discutées, et c'est dommage.

Quoi qu'il en soit, ce qui suit s'adresse à des lecteurs qui savent au moins un peu d'algèbre linéaire (en gros, pour qui les mots espace de Hilbert ont un sens — je ne parlerai que de la dimension finie donc on peut préférer espace hermitien), et sont globalement familiers avec le fait qu'une matrice hermitienne est diagonalisable. Et encore une fois, mon point de vue va être celui d'un matheux, pas d'un physicien (témoin le fait que je vais à peine évoquer de lois de la physique) : la question est celle de la représentation mathématique d'états d'un système physique. (Et j'en profite pour pointer du doigts certains faits géométriques sur cette représentation.) Mais au passage, ça soulève des questions, qui me semblent intéressantes, sur la philosophie de la physique (notamment que signifient les probabilités, et dans quelle mesure elles font partie de la réalité du monde).

Je dois aussi préciser que j'ai changé plein de fois d'avis sur ce que je voulais raconter ici, que j'ai fait mon plan a posteriori et que j'ai réécrit plein de fois des passages sans vérifier la cohérence avec ce qui était déjà ailleurs, ce qui explique sans doute des virages un peu bizarres, des redites ou incohérences de propos et des digressions inutiles (comme d'habitude, j'essaie de rédiger de manière à ce qu'on puisse les sauter, mais je ne sais pas dans quelle mesure j'y arrive). Par ailleurs, comme ça m'arrive souvent, j'ai écrit ce texte jusqu'au point où j'en ai eu marre de l'écrire, ce qui explique qu'après être parti dans toutes les directions il s'arrête un peu brutalement et sans vraie conclusion — mais je pense que mes lecteurs (enfin, ceux qui sont assez patients pour lire mes billets jusqu'au bout) ont l'habitude de ça.

Plan

Mélanges probabilistes et superpositions quantiques séparément

Comme promis, je commence comme un matheux. Supposons que A soit un ensemble, que je vais prendre fini pour simplifier et que j'imagine comme les états basiques que peut prendre un système physique.

Mon but est dans un premier temps de définir deux types de constructions[#] qu'on peut faire sur cet ensemble A, que je vais ensuite comparer et contraster, et que je vais appeler mélanges probabilistes et superpositions quantiques ; puis, dans la suite, je discuterai comment on peut les combiner.

[#] Techniquement, j'imagine qu'on doit pouvoir faire de chacune de ces constructions une monade, mais je ne veux pas tomber dans ce trou de lapin-là.

Mélanges probabilistes

Si je ne sais pas exactement dans quel état se trouve mon système, je peux représenter mon ignorance sous la forme d'une distribution de probabilités sur A : concrètement, ça va prendre la forme d'une fonction de A vers les réels positifs (donnant la probabilité de chaque état) dont la somme totale est 1. De façon équivalente, si je note [a], lorsque aA la fonction qui vaut 1 en a et 0 ailleurs (i.e., la distribution de probabilités concentrée en a), une distribution de probabilités p quelconque sur A s'écrit comme une combinaison convexe des [a], c'est-à-dire une combinaison linéaire à coefficients positifs de somme 1 (les coefficients étant justement la probabilité p(a) de chaque a, i.e., on a p = ∑aA p(a) · [a], avec, je répète, p(a)≥0 pour chaque a, et ∑aA p(a) = 1). Je parlerai aussi de mélange probabiliste des éléments de a pour une telle combinaison convexe.

À titre d'exemple, si A = {vivant, mort} désigne les deux états possibles de vie d'un chat, le mélange probabiliste ½([vivant] + [mort]) désigne un chat qui a 50% de chances d'etre vivant et 50% de chances d'être mort.

Géométriquement, il faut penser à cet ensemble de distributions de probabilités / combinaisons convexes / mélanges probabilistes (selon le terme qu'on préfère) comme un simplexe dont les sommets sont les éléments de A (i.e., lorsque A a 2 éléments, c'est un segment les reliant, quand il en a 3 c'est un triangle ayant ces sommets, quand il en a 4 c'est un tétraèdre, etc.) ; et les coordonnées barycentriques dans le simplexe sont les valeurs p(a) de la distribution de probabilités p considérée.

Je n'ai rien dit d'intelligent, ou même d'intéressant dans tout ça : c'est complètement standard, c'est juste différents points de vue un tout petit peu différents sur la même chose.

Superpositions quantiques

Maintenant, quand on fait de la mécanique quantique, il y a autre chose qui intervient, et qu'il faut bien distinguer de ce qui précède : ce sont les superpositions quantiques. Cette fois, je vais considérer un espace vectoriel complexe[#2], et même hilbertien (= hermitien), dont une base orthonormée est formée de vecteurs notés |a⟩ où aA, et je m'intéresse aux vecteurs de norme 1 dans cet espace (éventuellement : modulo la phase, c'est-à-dire modulo multiplication par les complexes de module 1, ce qui en fait un « espace projectif » complexe, cf. ici). Autrement dit, les éléments de l'espace sont les ∑aA u(a) · |a⟩ avec u(a) des nombres complexes et ∑aA |u(a)|² = 1 ; le produit scalaire hermitien de deux tels éléments |u⟩ := ∑aA u(a) · |a⟩ et |v⟩ := ∑aA v(a) · |a⟩ est donné par ⟨u|v⟩ := ∑aA u(a)* · v(a) où z* désigne ici le conjugué d'un nombre complexe (normalement noté avec une barre au-dessus, mais c'est pénible à faire en HTML) (j'ai pris ici la convention des physiciens selon laquelle le produit scalaire hermitien est antilinéaire dans sa première variable et linéaire dans la seconde). La notation suggère de définir ⟨a| comme la forme linéaire valant 1 en |a⟩ et 0 sur tous les autres |b⟩, si bien que le produit scalaire par ∑aA u(a) · |a⟩ à gauche s'écrit comme la forme linéaire ∑aA u(a)* · ⟨a|. Bon, là je n'ai rien dit d'intelligent.

[#2] Le fait qu'on ait apparemment nécessairement affaire à des coefficients complexes, quel que soit le système physique décrit, me laisse un peu perplexe, et apparemment je ne suis pas le seul.

Pour reprendre l'exemple précédent, si A = {vivant, mort} désigne les deux états possibles de vie d'un chat, alors (|vivant⟩ + |mort⟩)/√2 désigne un chat dans un état quantique qui superpose ces deux états. Mais on notera que (|vivant⟩ − |mort⟩)/√2 est aussi un tel état, qui semble très analogue, mais qui est orthogonal au précédent comme on le voit en calculant le produit hermitien (et on peut légitimement se demander ce que tout ça veut dire). Et de même, (|vivant⟩ + i·|mort⟩)/√2 et (|vivant⟩ − i·|mort⟩)/√2 devraient avoir un sens et être orthogonaux l'un à l'autre (quoique pas aux précédents). Ceci étant dit, autant c'est rigolo de donner mes exemples avec des chats vivants ou morts ou en superposition quantique entre les deux, ce n'est peut-être pas un très bon exemple[#3][#3b], en fait, justement à cause de la difficulté de donner un sens à ces états que je viens d'écrire, donc dans la suite je vais passer à un exemple plus abstrait du genre A = {0,1}, c'est-à-dire les états basiques de ce qu'on appelle un qubit : vous pouvez imaginer ‘0’ et ‘1’ comme signifiant qu'un chat est vivant et mort si vous voulez, mais si vous voulez des exemples physiquement plus plausibles, l'article Wikipédia que je viens de lier a divers exemples, et je vais juste dire un mot de deux d'entre eux dans les paragraphes suivants.

[#3] Je ne sais plus qui me faisait le reproche je ne sais où d'utiliser le chat de Schrödinger comme exemple de superposition quantique, alors que c'est justement un exemple censé illustrer le doute qu'on peut avoir sur l'existence ou le sens de superpositions quantiques sur des objets macroscopiques. Si on croit la mécanique quantique jusqu'au bout, et notamment si on croit sa linéarité exacte, alors oui, on peut faire des superpositions quantiques macroscopiques, et même c'est ce qui arrive à l'Univers tout entier dès qu'on fait une « mesure », et il y a toutes sortes de tentatives d'explications, ou de bouts d'explications (décohérence, interprétation « multi-mondes » d'Everett-DeWitt) sur pourquoi on ces superpositions ne se manifestent pas de façon visible dans notre expérience quotidienne. Mais mon but ici n'est pas vraiment de parler de ces choses-là (même si je ne peux pas faire l'économie d'au moins une mention au passage — dont acte ; cf. aussi la note #8 plus bas).

[#3b] Ajout () : Bien sûr, le problème avec le chat, ce n'est pas juste qu'il est macroscropique, c'est qu'il a bien plus d'états que {vivant, mort} : il y a peut-être quelque chose comme 101027 états qualifiables de vivant et de mort. En quoi ceci est vraiment pertinent pour toute la discussion n'est pas clair pour moi, ni si on choisit de les regrouper en deux paquets (i.e., de fabriquer deux sous-espaces de grande dimension) ni si on décide d'en choisir un très particulier dans chaque paquet (mais je note quand même que, par un phénomène de concentration de la mesure, si on choisit un état vivant au hasard et un état mort au hasard, ils seront essentiellement orthogonaux — donc au moins ça justifie de travailler avec comme des états basiques).

À titre d'exemple de qubit, il y a la polarisation d'un photon : si |↺⟩ représente un photon polarisé circulairement d'hélicité droite[#4] et |↻⟩ un photon polarisé circulairement d'hélicité gauche, alors (|↺⟩ + |↻⟩)/√2 et (|↺⟩ − |↻⟩)/√2 peuvent représenter des photons respectivement polarisés horizontalement et verticalement[#5][#6], tandis que (|↺⟩ + i·|↻⟩)/√2 et (|↺⟩ − i·|↻⟩)/√2 peuvent en représenter de polarisations diagonales.

[#4] Comme bien expliqué sur Wikipédia, il y a deux conventions opposées sur ce qu'une polarisation circulaire horaire ou anti-horaire signifie, selon qu'on prend le point de vue de la source qui voit l'onde partir ou de la cible qui voit l'onde arriver. Par contre, l'hélicité, il me semble que ça devrait être inambigu : on met le pouce (droit ou gauche, selon qu'on parle d'hélicité droite ou gauche) dans le sens de propagation de l'onde et en courbant les autres doigts ils indiquent dans quel sens l'onde tourne autour de son sens de propagation. Donc pour moi, hélicité droite = sens anti-horaire (= trigonométrique) vu par la cible = sens horaire (= rétrograde) vu par la source, tandis que hélicité gauche = sens horaire (= rétrograde) vu par la cible = sens anti-horaire (= trigonométrique) vu par la source. (Et les petits dessins ‘↺’ et ‘↻’ que j'utilise évoquent ce que voit la cible.) Mais apparemment, toujours si j'en crois Wikipédia, des gens ont aussi réussi à mélanger les conventions gauche/droite, et là je ne comprends pas comment ils ont pu faire un truc pareil. Enfin bon, tout ça n'a aucune importance pour ce que je veux raconter ici.

[#5] Là aussi, on trouve des conventions contradictoires, bien sûr, mais la convention moderne semble être de dire qu'une onde se propageant horizontalement a une polarisation horizontale par référence à la direction du champ électrique oscillant : le champ magnétique, lui, oscille dans une direction perpendiculaire au champ électrique et au vecteur de propagation de l'onde, donc verticalement pour une onde de polarisation horizontale.

[#6] Mathématiquement, imaginez que |↺⟩ est la fonction exp(2iπν·t) où ν est la fréquence du photon et t est le temps retardé par la distance depuis la source, et le composantes réelle et complexe sont, disons, les composantes horizontale et verticale du champ électrique ou quelque chose comme ça, tandis que |↻⟩ est exp(−2iπν·t) ; alors (|↺⟩ + |↻⟩)/√2 et (|↺⟩ − |↻⟩)/√2 décrivent les fonctions cos(2πν·t) et i·sin(2πν·t) respectivement.

La raison pour laquelle je précise l'exemple du paragraphe précédent est pour souligner que ces états en superposition quantique sont parfaitement valables (je vais dire ci-dessous que, contrairement à la situation probabiliste, il n'y a rien d'objectif qui distingue les états basiques que j'ai choisis des autres états fabriqués par combinaisons linéaires de ceux-ci : le fait qu'un état soit « superposé » n'a pas de sens en soi), et ça se voit bien sur cet exemple-là : les polarisations circulaires n'ont rien de plus naturel que les polarisations horizontales/verticales ou diagonales. Par ailleurs, on se dit que ce sont des choses qui ont un vrai sens physique, pas des expressions de notre ignorance.

J'ai évoqué les photons ci-dessus pas juste pour le plaisir d'utiliser les caractères ‘↺’ et ‘↻’, mais aussi parce que je pense que c'est raisonnablement simple à comprendre — modulo les prises de tête sur les conventions contradictoires quant au sens de la polarisation — mais on peut aussi dire un mot du qubit décrivant le spin de l'électron au repos. Là les deux états basiques pourraient être |↑⟩ et |↓⟩ représentant un électron avec un spin dirigé vers le haut ou vers le bas respectivement : alors (|↑⟩ + |↓⟩)/√2 et (|↑⟩ − |↓⟩)/√2 peuvent représenter un électron avec un spin dirigé vers la droite et la gauche respectivement, tandis que (|↑⟩ + i·|↓⟩)/√2 et (|↑⟩ − i·|↓⟩)/√2 peuvent en représenter un avec un spin dirigé vers l'avant et l'arrière respectivement[#7].

[#7] Le lecteur astucieux me demandera mais ça dépend très hautement du fait que l'espace est de dimension 3, ça : que se passe-t-il en d'autres dimensions ? — et, en effet, c'est une particularité de la dimension 3 que l'état de spin d'une particule de spin ½ soit représenté par un qubit. En général, en dimension d le spin d'une telle particule devrait avoir 2d/2⌋ états basiques (c'est la dimension de la représentation spinorielle du groupe Spind ; je ne sais d'ailleurs pas comment Wikipédia réussit à cacher cette information aussi efficacement dans la page que je viens de lier), c'est-à-dire l'équivalent de ⌊d/2⌋ qubits. Donc, oui, c'est particulier à la dimension 3 qu'on puisse décrire ça aussi simplement que vers le haut et vers le bas. Pour la polarisation du photon, il me semble que c'est d−1 états basiques (donc, en grande dimension, il y a beaucoup moins d'information dans le spin d'un photon que d'un électron, vous interprétez ça comme vous voulez).

Ressemblances et différences entre les deux

Il y a des ressemblances entre mélange probabiliste et superposition quantique, et j'ai fait exprès de choisir une description analogue avec des combinaisons linéaires pour faire ressortir ces ressemblances (et je regrette que toute description de la mécanique quantique ne commence pas par une telle discussion). Il y a aussi des différences cruciales, à la fois physiques et mathématiques.

↑Entry #2782 [older| permalink|newer] / ↑Entrée #2782 [précédente| permalien|suivante] ↑

↓Entry #2781 [older| permalink|newer] / ↓Entrée #2781 [précédente| permalien|suivante] ↓

(dimanche)

Combien y a-t-il de continents ? — et l'apprentissage du recul face aux conventions

Si on demande à une personne ayant grandi en France combien il y a de continents, et de les lister, je pense que la réponse sera généralement cinq, avec comme liste l'Europe, l'Asie, l'Amérique, l'Afrique et l'Océanie (dans un certain ordre). Il me semble que ceci est la liste « traditionnelle » des continents vus par la France, ou par la culture française, et probablement enseignée dans le système éducatif français. En tout cas c'est la liste retenue par (le Français) Pierre de Coubertin quand il s'est agi de fixer la symbolique du drapeau d'une certaine compétition sportive[#]. Je n'ai pas de souvenir très précis de ce que j'ai pu moi-même apprendre à l'école comme liste des continents, mais je suis certain que l'Europe était considérée comme distincte de l'Asie (la limite étant placée au niveau de l'Oural) et je crois bien que l'Amérique était considérée comme un seul continent et que j'étais moi-même un peu scandalisé par l'arbitraire de cette différence de traitement. Je crois aussi que l'Antarctique était mentionné comme devant logiquement être un continent mais on l'a oublié mais comme personne n'y habite ce n'est pas grave.

[#] Dont je n'ai probablement pas le droit d'écrire le nom ici, surtout si je le mets à proximité du nom de la ville où j'habite et de l'année en cours, sans payer les organisateurs de la dite compétition sportive, sous peine de voir débarquer chez moi la police de la propriété intellectuelle, parce que cette compétition défend sa marque avec une vigueur qui démontre à elle seule que leur but n'est pas de faire du sport mais de faire du fric. Oups, pardon, j'ai digressé.

Ajout () : On me fait remarquer qu'il y a sur le parvis du musée d'Orsay, créées pour le palais du Trocadéro de l'Exposition universelle de 1878, des sculptures représentant six continents (l'Amérique du Nord étant distincte de l'Amérique du Sud), ce qui vient mettre en doute le fait qu'il y ait une liste française traditionnelle unique.

Je n'ai pas réussi à trouver s'il y a actuellement une liste officielle à enseigner dans les écoles françaises (un document qui dirait que, pour les besoins de l'enseignement en France, l'Amérique du Nord et l'Amérique du Sud ne sont pas deux continents distincts, par exemple : je suis tombé sur cette page sur le socle commun de connaissances, de compétences et de culture qui a l'air pertinent, mais aucune des pages liées ne semble plus précise que nommer et localiser les grands repères géographiques du monde (continents, [etc.])). Si quelqu'un a des enfants qui sont récemment passés dans les écoles françaises (ou est un enfant récemment passé dans les écoles françaises, après tout ne faisons pas d'hypothèse hasardeuse, on a le droit de lire mon blog à 12 ans), je veux bien qu'on me dise ce qu'on y apprend.

La France n'est évidemment pas la seule à enseigner cette liste précise de cinq continents, mais d'autres pays font des choix différents (et bien sûr, ce n'est pas comme si tout le monde était forcément d'accord au sein d'un même pays). Les points de désaccord principaux semblent être : ① si l'Amérique est un contient ou deux, ② si l'Europe et l'Asie sont un continent ou deux, ③ si l'Océanie est un continent (c'est un peu un oxymore, le continent d'Océanie !) et, si ce n'est pas le cas, comment on classe l'Australie, et ④ ce qu'on doit faire de l'Antarctique. (Après ça, bien sûr, il y a des désaccords plus secondaires sur le tracé précis des frontières intercontinentales, ou sur le statut des îles.) Le seul vrai point de consensus a l'air d'être que l'Afrique est un continent (mais même là, je n'oserai pas demander si le Sinaï est en Afrique ou en Asie). Cette vidéo de la chaîne YouTube Map Men, en plus d'être assez hilarante comme tout ce qu'ils font, résume très bien la difficulté de définir ce qu'est un continent, certaines approches possibles choisies par telle ou telle culture. Cette page Wikipédia est plus précise (quoique moins rigolote), mais finalement ne nous apprend pas grand-chose de plus.

Je dis telle ou telle culture, mais j'imagine qu'il y a un certain nombre d'endroits où une définition officielle d'un continent est nécessaire. Je pense à des organisations internationales qui ont une convention officielle ou semi-officielle que leur chef, ou le lieu des réunions, effectue une rotation entre les continents (divulgâchis : ces organisations ne considèrent sans doute pas l'Antarctique comme un continent !).

Je suis sûr qu'il y aurait moyen d'écrire un livre fort intéressant sur l'histoire des cinq continents, depuis les anciennes cartes en TO montrant l'Asie en haut, l'Europe en bas à gauche et l'Afrique en bas à droite, d'un œcoumène ayant la forme symbolique d'un T inscrit dans un O, jusqu'à la découverte de la tectonique des plaques[#2] et après. Comment l'Éducation nationale française (si c'est bien le cas) s'est-elle retrouvée[#3] à enseigner que l'Oural précisément[#4] marque la distinction entre l'Europe et l'Asie (quelle est la genèse de cette idée ?) et que l'Amérique du Nord et l'Amérique du Sud sont un seul et même continent (qui a décidé ça et quand et pourquoi ?), voilà toutes sortes de questions fascinantes, auxquelles je n'ai pas la réponse. Si un tel livre existait, je le lirais volontiers[#5].

[#2] En passant par le fait que Martin Waldseemüller ait été apparemment le premier, vers 1507, à publier une carte donnant un nom au Nouveau-Monde, choisi en l'honneur d'Amerigo Vespucci, l'adoubant de fait en nouveau continent.

[#3] Apparemment un des responsables dans l'histoire est Philip Johan von Strahlenberg vers 1730, et sa ligne de séparation Europe-Asie aurait été adoptée officiellement par la tsarine Anne. Voilà des bribes d'information que je trouve un peu au hasard d'Internet, mais qu'un tel livre pourrait expliquer de façon précise avec des sources fiables.

[#4] Au moins au nord. Parce que je me rappelle parfaitement qu'on m'a dit à l'école primaire que la plus haute montagne d'Europe était en France parce que c'est le Mont Blanc, cocorico🇫🇷, mais c'est un double mensonge parce que d'abord la France a volé le sommet du Mont Blanc en rectifiant unilatéralement des cartes pour que ce ne soit plus le point de passage de la frontière avec l'Italie, mais c'est une autre histoire, et d'autre part parce qu'il semble quand même (maintenant ?) assez universellement admis que le mont Elbrouz (en Russie, dans le Caucase) est en Europe.

[#5] Comme lecture connexe, mais qui existe vraiment, je peux mentionner le livre La Terre plate : Généalogie d'une idée fausse de Sylvie Nony et Violaine Giacomotto-Charra, que j'ai lu il n'y a pas longtemps, et qui raconte l'histoire du mythe non pas que la Terre est plate (pour ça je recommande les documentaires Behind the Curve et In Search of a Flat Earth) mais celui que que au Moyen-Âge, les gens croyaient que la terre était plate (ce qui est tout aussi faux, pour autant qu'on interprète les gens comme l'essentiel des lettrés et pas une poignée d'illuminés). Ce livre mentionne au passage des questions sur la forme de l'œcoumène (et le fait que la forme de l'œcoumène n'est pas forcément la même chose que la forme de la Terre, d'où la confusion !) et la possibilité de l'existence d'autres régions habitées de la Terre. Mais je digresse.

Mais mon but ici n'est pas seulement de parler des cinq continents ou de l'histoire de cette idée, parce que je n'ai pas de lumière particulière à apporter là-dessus. Je pense que tous les lecteurs de mon blog (qui ont notamment lu ce billet que je référence maintenant quasiment à chaque nouvelle entrée) ont le recul nécessaire pour bien comprendre (ce que la vidéo de Map Men explique très bien) que :

Les frontières entre les continents sont largement arbitraires et conventionnelles. Il peut y avoir des raisons géographiques (géophysiques, démographiques, géopolitiques, culturelles, que sais-je) ou historiques pour penser qu'il est préférable de séparer ou réunir tel ou tel bouts de terre, de placer la limite à tel ou tel endroit, mais in fine il n'y a pas plus d'autorité qu'une sorte de tradition arbitraire et même pas bien définie pour décider que la bonne liste des continents est ceci plutôt que cela.

Maintenant voici une question qui me semble plus intéressante : quand et comment doit-on enseigner ça à l'école ? (par ça je veux dire, le paragraphe que je viens de mettre en exergue).

Et je ne parle évidemment pas que du cas des cinq continents qui n'est là que pour servir d'illustration à une idée plus générale.

On apprend plein de choses à l'école. Certaines sont des vérités objectives[#6] sur le monde (qui peuvent elles-mêmes être établies avec plus ou moins de certitude). D'autres sont des conventions. Parmi ces conventions, certaines sont simplement là pour des raisons historiques, culturelles ou traditionnelles. D'autres sont plus ou moins justifiées, par exemple pour la commodité, pour le besoin d'avoir une typologie utile dans tel ou tel but (auquel cas elles sont discutables dans leur adéquation à ce but ; mais il peut y avoir toutes sortes de compromis qui président au choix de la convention ; et bien sûr le fait de se mettre d'accord sur un terme commun, même s'il est imparfait, peut avoir une valeur supérieure à trouver la typologie idéale dans chaque situation).

↑Entry #2781 [older| permalink|newer] / ↑Entrée #2781 [précédente| permalien|suivante] ↑

↓Entry #2780 [older| permalink|newer] / ↓Entrée #2780 [précédente| permalien|suivante] ↓

(jeudi)

Sur la notion d'« étendue » en optique et en géométrie

Je voudrais essayer de parler ici d'un concept de géométrie (euclidienne), notamment important pour son application en optique, que je trouve à la fois joli pourtant trop peu connu[#] : celui d'« étendue ». En gros, l'étendue est une façon de mesurer la taille d'un ensemble de droites (disons, dans l'espace) de la même manière que le volume est une façon de mesurer la taille d'un ensemble de points. Mais pour commencer, et pour expliquer une façon dont cette notion apparaît, je veux parler des unités et grandeurs lumineuses que sont le lumen, le lux, la candela et la candela par mètre carré, et le lien entre ces unités, et ce qu'elles nous disent. Parce que même le grand public commence à avoir entendu parler des lumens (c'est écrit sur toutes les boîtes d'ampoules, de nos jours), et peut-être de lux (pour le niveau d'éclairement d'une pièce), mais ne sait pas forcément la différence entre les deux (divulgâchis : un lux, c'est un lumen par mètre carré).

[#] À titre d'exemple, je n'en vois pas de trace dans les programmes de classes préparatoires scientifiques françaises, ce que je trouve un peu surprenant. Et ce n'est pas une évolution récente parce que je ne crois pas qu'on m'en ait parlé quand j'étais moi-même en prépa.

La difficulté de l'exercice, c'est que comme je veux parler de divers concepts (l'étendue en géométrie euclidienne, l'étendue en optique géométrique, les unités de mesure photométriques, et quelques conséquences de tout ça) et ce à différents niveaux de vulgarisation, je mais certainement faire de la bouillie. En plus de ça, je suis infoutu de faire le moindre dessin, ce qui n'aide pas pour expliquer un concept éminemment géométrique.

Mais voilà, essayons quand même (bear with me), parce cette histoire de conservation de l'étendue est quelque chose qui me semble important pour comprendre les bases de l'optique, et c'est aussi un concept mathématique pas compliqué mais néanmoins digne d'être noté. Et j'en ai marre de toujours oublier ces choses, alors ce billet de blog est surtout un aide-mémoire pour moi-même.

*

☞ La « luminosité » décroît-elle avec la distance ? (Oui et non.)

Pour commencer, une observation toute simple qui me fascine depuis que je suis petit, qui n'est pas difficile à comprendre, et qui renferme l'essence de cette notion de conservation de l'étendue.

Considérez le Soleil, vu depuis la Terre, en plein jour (et par beau temps). Ne le regardez surtout pas directement, c'est très dangereux pour vos yeux (Newton a failli se rendre aveugle comme ça). Oui mais pourquoi est-ce si dangereux, au juste ? Parce que le Soleil est très brillant, bien sûr. Certes, mais il est aussi très loin : est-ce que la luminosité ne s'atténue pas avec la distance ? Après tout, l'étoile Sirius (enfin, Sirius A), qui est 23 fois plus lumineux que le Soleil mais 540 000 fois plus loin de nous, ne nous aveugle pas quand nous la regardons directement. Alors, oui et non : ça dépend surtout de ce qu'on appelle luminosité.

D'abord, il y a une absorption de la lumière par l'atmosphère terrestre, qui atténue surtout le bleu et l'ultra-violet. C'est important pour rendre le Soleil moins dangereux pour nous, mais ce n'est pas de ça que je veux parler, donc faisons comme si elle n'existait pas. Ensuite, il y a effectivement une décroissance de la luminosité avec la distance (quadratique : si on est 2 fois plus loin d'une étoile, elle apparaît 4 fois moins lumineuse), mais cette décroissance correspond précisément à une décroissance de la taille apparente (ou « angle solide ») de l'étoile : si on va 2 fois plus loin du Soleil, il apparaîtra 2 fois plus petit dans chaque direction, donc 4 fois plus petit en surface apparente (« angle solide »), et sa luminosité sera 4 fois plus faible juste pour cette raison, c'est-à-dire que la luminosité par unité d'angle solide (ou luminance) sera la même.

Quand l'objet qu'on regarde est suffisamment petit pour qu'il n'en reste qu'un seul point (on dit qu'il n'est pas « résolu optiquement »), on ne voit plus l'angle solide, et tout ce qui compte est la luminosité totale qu'on en reçoit[#2] (dont je vais dire qu'elle s'appelle correctement éclairement et se mesure en lux) ; mais si l'objet est de taille visible, ce qui est le cas du Soleil, alors ce qui compte est cette luminosité par angle solide (appelée luminance, et mesurée en lux par stéradian, ou ce qui revient au même, en candelas par mètre carré), et elle ne change pas avec la distance.

[#2] Je ne sais pas si je l'ai déjà raconté ici, mais depuis que je suis petit, quand je suis passager dans une voiture la nuit, j'aime parfois jouer à retirer mes lunettes. Comme je suis très très myope, chaque feu de véhicule devient alors une grosse tache (en gros l'image de mon cristallin qui, vu que c'est la nuit, est bien ouvert) : c'est très joli et assez poétique, ça fait une sorte de ballet hypnotisant de taches de couleurs rouges, orange et blanches. Ce qui est perturbant, c'est que la taille de ces taches ne change pas quand le véhicule s'éloigne, puisqu'elle est avant tout due à l'imperfection optique de mon œil : l'éloignement se manifeste non pas par une diminution de la taille mais par une diminution de la luminosité de la tache. C'est ce que j'appelle une situation non résolue optiquement. C'est pareil pour n'importe qui quand on regarde une étoile, mais dans mon cas les taches sont vraiment très grosses (d'ailleurs, du coup, sans mes lunettes, je ne peux absolument pas voir la moindre étoile).

En bref, si vous étiez deux fois plus loin du Soleil, ce serait tout aussi dangereux pour vos yeux de le regarder directement et fixement : la surface de la rétine qui se ferait endommager serait plus petite, mais la surface qui serait endommagée le serait tout autant. (Bon, il y a plein de petits caractères à ajouter là : par exemple pour rappeler que je parle de regarder fixement pendant une certaine durée, parce que les yeux bougent toujours un peu tout le temps, ce qui aide justement à nous protéger contre le soleil.)

Inversement, en principe, même si vous étiez à cent mètres de la surface du Soleil, cette surface vous apparaîtrait aussi brillante (absorption atmosphérique mise à part) que ce que vous en voyez depuis la Terre — c'est juste que ça occuperait la moitié de votre champ visuel au lieu d'être un tout petit truc (de 68 microstéradians) dans le ciel. (Bon, bien sûr, à 100m du Soleil vous auriez plein de problèmes, et je déconseille très fortement d'y aller.)

Et ça, quand j'étais petit, ça me fascinait profondément, de me dire que nous voyons le Soleil vraiment lumineux comme il est, juste plus petit.

*

☞ Flux lumineux, éclairement, intensité lumineuse, et luminance

Bon, mais dans tout ça j'ai utilisé le terme de luminosité de façon très vague. Essayons d'être plus clair, en distinguant quatre notions, et en expliquant comment elles se relient et quelles sont les unités qui les mesurent (si vous trouvez ça trop verbeux, j'ai mis un résumé à la fin) :

  • La première, c'est la notion de flux lumineux, qui est mesuré en lumens (symbole : lm) dans le Système International. C'est analogue à la puissance lumineuse, c'est-à-dire la quantité d'énergie par unité de temps : donc c'est analogue à des watts (symbole : W).

    Je dis analogue, parce qu'un lumen n'est pas un watt : le lumen reflète le fait que notre œil est plus ou moins sensible à différentes parties du spectre électromagnétique, donc qu'on ne voit pas 1W dans le vert autant que 1W dans le rouge ou le bleu, et si c'est 1W dans l'ultraviolet ou l'infrarouge on ne le voit pas du tout : donc le lumen tient compte de cette différence de sensibilité en pondérant la puissance des différentes longueurs d'onde en fonction de la sensibilité de l'œil humain (mais à cette pondération près, c'est comme des watts).

↑Entry #2780 [older| permalink|newer] / ↑Entrée #2780 [précédente| permalien|suivante] ↑

↓Entry #2779 [older| permalink|newer] / ↓Entrée #2779 [précédente| permalien|suivante] ↓

(lundi)

Méditation la complexité des conjugaisons françaises et inflexions linguistiques en général

Avertissement préliminaire : je vais faire référence dans ce billet à plein de langues (français, latin, grec, mais aussi allemand, russe, sanskrit, arabe). Ces langues ne servent qu'à illustrer mon propos général sur la complexité des inflexions, et il va de soi que je ne suppose pas qu'on les connaît (moi-même, je n'y connais pas grand-chose), et je ne vais généralement même pas m'embêter à donner le sens des mots que j'utilise comme exemples parce que ça n'a aucune pertinence pour ce que je raconte. De même, il faut considérer les noms des traits grammaticaux comme des mots dénués de sens : peu importe ce qu'est que l'aoriste à part que c'est un temps de la conjugaison des verbes grecs. (Prenez ça comme un mot à la fois technique et poétique : cf. d'ailleurs ce vieux fragment littéraire que je ne peux pas ne pas référencer ici.) J'ai aussi fait quantité de digressions marquées par des notes en petits caractères : on peut les sauter, ou au contraire ne lire que ça, de toute façon tout ceci est un rant un peu décousu, ce n'est pas comme s'il y avait un plan ou des dépendances entre les parties.

Comme le terme linguistique de paradigme inflexionnel n'est pas forcément clair pour tout le monde (je ne suis même pas sûr que ce soit le bon), ce dont je parle est l'ensemble des formes que peut prendre un même mot (ou plus exactement un même lexème) à travers l'application de différents traits grammaticaux. Comme cette définition n'est elle-même pas forcément claire pour tout le monde, un exemple familier pour tous les francophones est celui des tableaux de conjugaison, par lesquels un même verbe (lexème verbal), représenté par sa forme de dictionnaire qui, s'agissant du français, est l'infinitif, prend des formes (inflexions) diverses selon des traits grammaticaux appelés mode, temps et personne (ou nombre+personne). Les conjugaisons latines et grecques sont aussi des paradigmes inflexionnels, avec à peu près les mêmes traits que pour le français (la liste des modes et temps change, et le grec classique a un nombre duel, mais l'idée est la même ; une autre différence est que pour ces langues la forme du dictionnaire, c'est-à-dire la manière dont on va ranger le verbe dans un dictionnaire, est la première personne du singulier de l'indicatif présent au lieu d'être l'infinitif, mais c'est un détail). Un autre exemple est celui des tableaux de déclinaisons latines ou grecques[#], qui pour un même nom (lexème nominal, dont la forme de dictionnaire est le nominatif singulier) donnent des formes variées en fonction de deux traits appelés nombre et cas, ou, s'agissant des adjectifs, trois traits appelés genre, nombre et cas.

[#] Ou bien sûr de plein d'autres langues. Mais attention, une langue peut avoir des cas sans pour autant avoir vraiment de déclinaisons. En allemand, par exemple, les déclinaisons portées par les noms sont quasiment vestigiales (à part la marque du pluriel, pour la plupart des mots il ne subsiste qu'un -n au datif pluriel et, s'agissant des féminins et neutres, un -s au génitif singulier ; ou pour les noms dits faibles, la déclinaison est essentiellement juste marquée par un -n partout). La marque des cas en allemand est essentiellement sur les articles ou adjectifs (avec des règles un peu tordues sur ces derniers), et comme je ne crois pas qu'il existe d'adjectif irrégulier, ce n'est pas vraiment le genre d'inflexion dont je parle dans ce billet.

Conjugaison des verbes et déclinaison des noms et adjectifs sont les paradigmes inflexionnels les plus familiers aux personnes qui auront appris des langues comme le français, le latin, le grec classique, le sanskrit ou l'arabe. Mais il peut évidemment y avoir plein d'autres choses : on peut tout à fait imaginer une langue où les adverbes varient (par exemple qu'ils s'« accordent » avec le verbe comme les adjectifs s'accordent avec les noms dans les langues que je viens de lister) ; en japonais, on peut dire que les adjectifs (enfin, certaines sortes de mots qu'on pourrait qualifier d'adjectifs) varient avec le temps ; et la division des mots en verbes, noms, adjectifs, etc., est valable pour les langues indo-européennes et sémitiques mais pas forcément transportable partout. Bref, j'utilise le terme paradigme inflexionnel pour être plus large que tableaux de conjugaison et de déclinaison, mais comme je n'ai pas de bon exemple à proposer au-delà de la conjugaison et de la déclinaison, imaginez les conjugaisons et les déclinaisons si vous êtes familiers avec ça (ou d'ailleurs, juste les conjugaisons parce que je vais surtout parler de ça).

Toutes les langues n'ont pas de mécanisme inflexionnel. Si le grec classique, le russe et l'arabe en ont de fort complexes, le chinois n'en a aucun[#2] (tous les mots chinois sont invariables), et ceux de l'anglais sont considérablement plus simples que ceux du français. Les langues scandinaves font varier le verbe avec le temps/mode mais pas avec la personne, ce qui fait déjà moins de traits que le français ou l'allemand.

[#2] Bon, quand on parle de linguistique, il faut toujours ajouter des on peut considérer que ou des en première approximation partout. Je suis sûr que si je ne mettais pas cette note il y aurait un gros malin pour me dire que well, actually, on peut considérer que <…> est un mécanisme inflexionnel en chinois : donc je mets cette note pour cette fois-ci, mais n'hésitez pas à l'insérer dans la suite à chaque fois que quelqu'un risque de dire well, actually.

Bien sûr, ce n'est pas toujours parfaitement clair ce qui constitue exactement les inflexions d'un même lexème (pourquoi dirait-on que le passage du singulier possible au pluriel possibles est une inflexion alors que le passage de possible à impossible est une dérivation lexicale ? c'est un chouïa arbitraire[#3][#4]), mais comme d'hab' je vais rappeler que ce n'est pas parce que ce n'est pas totalement clair que ça n'a pas de sens.

[#3] Un exemple d'arbitraire est celui des aspects du verbe russe : un verbe russe (comme dans l'essentiel des autres langues slaves, mais le russe est le seul que je connais un petit peu) vient par paires avec une forme, ou aspect, appelée perfectif et une autre appelée imperfectif. Certains temps peuvent être utilisés sur l'un ou l'autre aspect, avec une différence de sens (le perfectif envisage l'action accomplie, ou son résultat, tandis que l'imperfectif envisage l'action en train d'être accomplie, c'est-à-dire son déroulement) ; certains temps sont formellement le même aux deux aspects mais donnent des temps différents (la forme qui donne le présent de l'aspect imperfectif devient un futur pour l'aspect perfectif) ; certains temps n'existent que pour un des deux aspects. Doit-on considérer que le perfectif et l'imperfectif sont deux formes d'un même verbe, comme le singulier et le futur d'un nom ? Ou doit-on au contraire considérer que ce sont deux verbes différents, qui se complètent ? Je suppose que des grammairiens du russe ont passé des pages et des pages à expliquer que l'un ou l'autre de ces points de vue est meilleur que l'autre, et je ne suis pas compétent pour trancher, comme pour le sexe des anges. Pour que je veux raconter ici, il vaut sans doute mieux considérer pragmatiquement que le perfectif et l'imperfectif sont deux verbes distincts, parce qu'essayer de deviner le perfectif à partir de l'imperfectif ou vice versa semble essentiellement impossible (d'ailleurs, pour les verbes « simples » c'est plutôt le perfectif qui dérive de l'imperfectif alors que pour les verbes à préfixe c'est plutôt le contraire). Mais en tout cas, ça montre une difficulté à définir exactement ce qu'on appelle un paradigme inflexionnel.

[#4] Un autre exemple d'incertitude sur ce que c'est qu'un « lexème » et un « paradigme » est celui des formes dérivées des verbes arabes. Un verbe arabe est normalement une racine à trois consonnes, et cette racine, connue sous le nom de forme I, peut directement donner un tableau de conjugaison, qui est d'une taille relativement raisonnable (il y a moins de temps et modes qu'en français ou en latin, pour ne rien dire du grec, mais en contrepartie il y a plus de personnes parce que la distinction masculin/féminin est faite en plus de celle de nombre à la 2e et 3e personnes). La complication, c'est que chaque racine peut donner une douzaine ou une quinzaine de formes dérivées (formes II à XV, parfois on en ajoute encore d'autres, même si en vrai les formes I–X et peut-être XII sont les seules vaguement courantes) : le sens de ces formes dérivés est variable et elles n'existent pas toutes, mais leur fabrication à partir de la racine est assez systématique, et ensuite chacune d'entre elles est un verbe qui a son propre tableau de conjugaison. Faut-il considérer qu'un paradigme flexionnel de verbe arabe est l'ensemble de toutes les conjugaisons de toutes les formes dérivées (auquel cas ils sont très volumineux) ? Ou seulement d'une seule d'entre elles (auquel cas ils sont plus raisonnables, mais il y a une multiplication des types de conjugaisons) ? C'est un peu le problème dual du russe évoqué à la note précédente : le perfectif/imperfectif des verbes russes ont un sens fixe mais une formation qui dépend de chaque verbe, alors que les formes dérivées des verbes arabes ont une formation claire mais un sens qui varie.

Quand je parle de complexité, ce qui compte n'est pas tellement le nombre de traits grammaticaux qu'on peut ajouter. Une langue qui aurait des déclinaisons avec 50 cas bien réguliers serait toujours plus simple à apprendre qu'une langue qui a seulement 3 cas mais avec des centaines de paradigmes différents pour les former, des exceptions de partout, etc. C'est essentiellement de cette complexité que je veux parler ici. (Je proposerai à la fin une piste pour essayer de la définir de façon un peu objective et pas juste par l'impression subjective de la difficulté à apprendre la langue ou à mémoriser ces tableaux, mais je commence par des remarques un peu éparses.)

Je ne m'intéresse pas du tout au sens des traits grammaticaux. Comme je l'ai écrit dans l'avertissement liminaire, pour ce que je raconte ici, peu importe ce que c'est qu'un cas, ou ce que signifient le nominatif, l'accusatif, le génitif ou le trucbidulatif, peu importent que les temps du verbe s'appellent présent, passé et futur ou des choses plus bizarres comme aoriste ou prétérit, peu importe que parfait et inchoatif soient des temps ou des aspects, tout ça est hors de propos ici : ce sont juste des étiquettes arbitraires que la grammaire utilise pour décrire des façons de modifier un lexème. Je parle juste de la complexité de répondre à des questions du genre[#5] :

  • En français, quelle est la 3e personne du singulier de l'indicatif présent des verbes coudre et résoudre ? (Réponses : il coud et il résout.)
  • En latin, quel est l'ablatif singulier du nom animal ? (Réponse : animali.)
  • En grec classique, quelle est la 1re personne du pluriel de l'optatif futur moyen du verbe βάλλω ? (Réponse : βαλοίμεθα.)
  • En russe, quel est l'instrumental du nombre со́рок [sórok] ? (Réponse : сорока́ [soroká].)
  • En irlandais, quel est le génitif singulier du nom féminin an talamh ? (Réponse : na talún.)
  • En sanskrit classique, quelle est la 2e personne du singulier de l'impératif (présent) actif du verbe द्विष् [dviṣ] ? (Réponse : द्विड्ढि [dviḍḍhi].)
  • En arabe classique, quelle est la 3e personne du singulier masculin de l'inaccompli actif du verbe وَفَى [wafá] ? (Réponse : يَفِي [yafī].)

[#5] À part l'arabe, toutes mes langues sont indo-européennes : c'est essentiellement juste un biais de ma part, même s'il semble quand meme plausible que les langues indo-européennes aient tendance à avoir une complexité inflexionnelle plutôt plus importante que la moyenne (si tant est que « la moyenne » ait un sens). Encore une fois, ça ne veut pas forcément dire qu'elles aient beaucoup de formes, plutôt beaucoup d'irrégularités : les inflexions du turc, de ce que je comprends, sont globalement très régulières, donc plutôt plus simples que celles des langues indo-européennes typiques. Bien sûr, quand je dis plutôt plus complexes que la moyenne, ça ne veut pas dire que ce soit le maximum, loin de là : les gens ayant tenté d'apprendre le géorgien doivent certainement rigoler que je décrive les conjugaisons du grec ancien comme compliquées.

Pas sûr que mes réponses ci-dessus soient correctes, mais ça fait justement partie de ce dont je veux parler : quelles sources consulter pour trouver les bonnes réponses ?

↑Entry #2779 [older| permalink|newer] / ↑Entrée #2779 [précédente| permalien|suivante] ↑

↓Entry #2778 [older| permalink|newer] / ↓Entrée #2778 [précédente| permalien|suivante] ↓

(dimanche)

Réflexions à 2 femtozorkmids sur l'informatique en tant que science

Les quelques derniers billets de ce blog qui avaient un contenu scientifique (notamment celui-ci et celui-ci) tournaient autour de l'informatique théorique. (Et je compte en écrire encore plusieurs.) Je ne sais pas si le lecteur non spécialiste aura vu la différence avec des maths. Je ne sais pas si je vois une différence avec des maths. Après tout, j'ai rangé ces billets dans la catégorique « maths » (pas que le mécanisme de catégories sur ce blog serve à quoi que ce soit, et c'est peut-être surtout que j'avais la flemme de créer une nouvelle catégorie, mais quand même, c'est une info) ; alors que par le passé, j'ai écrit des entrées sur la physique théorique (comme celle-ci ou celle-là) et je les ai rangées dans une catégorie différente. Peut-être même qu'avec assez de mauvaise foi on pourrait prétendre que la correspondance de Curry-Howard affirme qu'il n'y a pas de différence entre maths et info (mais soyons clairs, ça demande une bonne dose de mauvaise foi, justement).

Ce n'est pas la première fois que je médite sur cette question à laquelle je n'ai pas vraiment de réponse : qu'est-ce que c'est que l'informatique ? — et secondairement, quelle position a-t-elle par rapport aux maths ? et cette position est-elle analogue à celle de la physique ?

(Je précise que ce billet, qui est une méditation décousue et sans véritable point d'arrivée, se veut non-technique, i.e., lisible par tout le monde, mais que fatalement je vais être amené à faire des remarques techniques çà et là : si on ne sait pas de quoi je parle, on peut juste ignorer ces passages, ils ne sont là que pour appuyer ou illustrer mes propos, ils n'en sont pas le cœur. Si vous n'avez vraiment pas le temps de lire, regardez au moins le dernier paragraphe pour un résumé de ce que j'essaie de dire.)

☞ Science informatique et génie informatique

Mettons-nous d'accord sur le fait que je parle de l'informatique en tant que science : computer science en anglais, par opposition à computer engineering, ce dernier étant le génie informatique (lui-même au sens d'ingénierie, pas au sens du fait d'être génial…), comme on peut parler de la physique comme science par opposition au génie mécanique / électrique / électronique / etc. Mais la frontière entre la science et le génie n'est pas super claire non plus, et peut-être que ça fait aussi partie de la question : en première approximation, une science est une discipline qui cherche à élargir nos connaissances tandis que le génie cherche à appliquer des connaissances pour résoudre des problèmes, mais évidemment ce n'est pas toujours net, et il y a des sciences appliquées (que je range quand même parmi les sciences) qui montrent que la limite est assez floue.

Néanmoins, j'aime bien souligner que ce n'est pas parce qu'une limite est floue qu'elle n'existe pas : entre l'étude des modèles du λ-calcul et l'optimisation d'un jeu vidéo il y a bien une différence d'approche, ce qui se mesure ne serait-ce qu'empiriquement au modèle économique qui paye les gens qui font l'une et l'autre activité, et il me semble que cette différence est assez analogue à celle entre, pour ce qui est de la physique, l'étude de la théorie des solutions exactes de l'équation d'Einstein et l'optimisation d'un moteur de moto. (Et je devance l'accusation qu'il y aurait là un jugement de valeur de ma part : d'une part je mets ma vie entre les mains des gens de chez Yamaha qui conçoivent des moteurs de moto, d'autre part j'avoue platement que programmer un jeu vidéo ou concevoir un moteur de moto est quelque chose qui me semble complètement hors de mes capacités à la différence de l'étude des solutions exactes des équations d'Einstein ou des modèles du λ-calcul, que j'ai au moins pratiquées de loin.)

Alors maintenant, si la physique est l'étude du monde matériel, ou quelque chose qui y ressemble, l'informatique, c'est quoi ?

☞ L'informatique n'est pas la science des ordinateurs

La réponse la plus évidente serait que c'est la science des ordinateurs. À ça il faut répondre par une citation souvent attribuée à Dijkstra, mais comme toutes les meilleures citations sont apocryphes, elle n'est probablement pas de lui :

Computer science is no more about computers than astronomy is about telescopes.

Les ordinateurs ne sont que le moyen d'étude de l'informatique, en même temps que son application : ils ne sont pas son objet.

Le grand public a peut-être dans l'idée qu'un chercheur en informatique cherche à rendre les ordinateurs plus rapides. (Bon, à vrai dire, le grand public a peut-être dans l'idée qu'un chercheur en informatique est un pro en Excel ou sait réparer une imprimante qui dysfonctionne, et ce sont des idées à ranger avec celle du mathématicien comme quelqu'un qui passe ses journées à faire des calculs immensément compliqués : juste naïves, mais révélatrices d'un triste manque d'information sur le fonctionnement de la science.) Ce n'est pas complètement faux, bien sûr, il y a des informaticiens qui cherchent effectivement à rendre les ordinateurs plus rapides. D'autres qui cherchent à les rendre plus sûrs. Mais ce sont un peu les arbres qui cachent la forêt.

Bon, mais alors c'est quoi, l'objet de l'informatique, si ce n'est pas les ordinateurs ?

À vrai dire je ne sais pas bien quoi répondre. Ma première approximation de la réponse (peut-être désespérément vague) serait : l'informatique est la science de l'information, des données, de la communication, de l'automatisation et du calcul.

☞ La physique et l'informatique vis-à-vis des maths

L'ennui, si on dit ça, c'est que ça ressemble beaucoup à des maths. Bon, à ce stade, il faut peut-être aussi que je tente de définir les maths, et je suis tout autant embarrassé : c'est essentiellement aussi naïf de s'imaginer que les maths sont la science des nombres que que l'informatique est celle des ordinateurs, mais là aussi, on est en droit de se demander de quoi elles sont l'étude, alors. Je dirais bien l'étude des structures abstraites, mais on m'objectera que ça ressemble trop à la philosophie, ça. En tout cas, l'information, les données, la communication, l'automatisation et le calcul, ça ressemble beaucoup à des notions abstraites que les maths pourraient étudier. Et de fait, il y a une intersection énorme entre les maths et l'informatique théorique ; mais intersection ne signifie pas inclusion c'est un peu le cœur de mon propos.

Peut-être parce qu'elle est née plus récemment que la physique, l'informatique semble avoir une crise identitaire vis-à-vis des mathématiques un peu plus compliquée que celle de la physique. Crise identitaire qui peut signifier qu'elle tarde à prendre son indépendance, ou au contraire prendre la forme d'une volonté excessive de « tuer le père ».

Je pense qu'informatique et physique occupent une place relativement analogue (voire, symétrique) par rapport aux mathématiques. Les deux sont à la fois une inspiration pour les mathématiques et un domaine d'application de celles-ci, et, dans leur partie la plus théorique, elles intersectent largement les maths. (Elles ont aussi, dans leur incarnation moderne, émergé des mathématiques : Turing était mathématicien au moins autant qu'informaticien, comme Newton était mathématicien au moins autant que physicien.) Les maths qui intéressent l'informatique (par exemple la logique et l'algèbre discrète) et les maths qui intéressent la physique (par exemple la géométrie différentielle et la théorie des groupes continus) sont généralement distinctes, mais il y a de grands domaines qui intéressent les deux (comme l'analyse de Fourier ou les probabilités).

☞ Une digression sur mon papa physicien

Je devrais peut-être faire une digression à ce sujet pour parler de mon papa, qui était physicien théoricien, et faisait de la physique qui pourrait franchement être considérée comme des maths (genre, ça), mais qui avait une relation difficile avec les maths et les mathématiciens (il aimait bien citer Feynman qui comparait la rigueur mathématique à la rigor mortis ; il faudrait que je vérifie si elle n'est pas apocryphe aussi celle-là, mais en tout cas ça montre que si son sujet d'étude était très mathématique, son approche n'était pas vraiment celle d'un mathématicien).

Mon papa était en outre persuadé que la physique était la source d'inspiration des maths, et que toutes les idées mathématiques naissaient soient de la recherche d'applications à la physique soit de généralisations assez évidentes de ça. J'aurais dû lui rétorquer plein de choses quand il me disait ça (par exemple, parmi les choses qu'il aurait dû bien savoir en tant que relativiste, que la géométrie riemannienne était là bien avant qu'Einstein n'en ait besoin pour décrire un espace-temps courbe), mais je pense qu'il reflétait là surtout son propre biais d'intérêt dans les domaines qu'il connaissait des mathématiques (à chaque fois que je lui ai parlé de corps de caractéristique p>0, par exemple, il haussait les yeux au ciel comme si c'était vraiment une lubie saugrenue d'étudier des choses aussi déconnectées du monde réel dans lesquelles en ajoutant p fois le nombre 1 on retombe sur 0). C'est intéressant, donc, parce que mon père ne semblait pas du tout avoir considéré cette possibilité que l'informatique soit, de façon analogue à la physique, elle aussi une source féconde d'inspiration en même temps que de débouchés pour les maths. Mais c'est aussi intéressant parce que sa relation compliquée avec les maths, qui dans son cas était plutôt idiosyncratique, est quelque chose que je crois retrouver de façon collective dans des tentatives de trouver un démarquage entre les maths et l'info pour des disciplines qui sont à cheval entre les deux.

☞ L'enseignement de l'informatique comme science

Il me faut sans doute d'abord dire un mot de l'enseignement. Ne sachant pas comment ça se passe ailleurs, je vais évoquer le cas de la France.

Malgré N timides tentatives par le passé, n'ayant jamais vraiment abouti, ce n'est que tout récemment (~2018, peut-être ?) que l'enseignement secondaire français s'est doté, sous le nom de numérique et sciences informatiques (NSI), d'un véritable enseignement (optionnel…) de l'informatique. (Cela me semble impossiblement tardif, mais je crois qu'il vaut mieux que je ne regarde pas à quel moment historique on a commencé à enseigner la physique dans les lycées français, parce que j'ai peur de faire une attaque.) N'ayant pas de contact direct avec le monde de l'enseignement secondaire, je ne peux juger que par les programmes, qui sont un peu bizarres (p.ex., l'enseignement du SQL me semble vraiment bizarrement précis à côté de généralités très vagues sur d'autres plans) mais néanmoins intéressants par certains côtés. Donc je ne vais pas en dire plus.

☞ La génération Z et l'informatique

Même si ce n'est que tangentiel à mon propos, comme c'est quelque chose qui revient régulièrement si on évoque la nécessité de l'enseignement de l'informatique au lycée, il faut que je dénonce un lieu commun, qui dit quelque chose comme ceci :

❝Les jeunes, de nos jours, ils n'ont pas besoin qu'on leur enseigne l'informatique, parce qu'ils ont grandi avec les ordinateurs. D'ailleurs, ils en savent certainement plus que leurs profs de lycée.❞

Il y a tellement de choses fausses là-dedans que je ne sais pas bien par où commencer. Par le fait que l'informatique n'est pas la science des ordinateurs ? Je l'ai déjà signalé. Mais je pourrais aussi remarquer le ridicule de l'idée analogue que parce qu'on a tous grandi avec les voitures thermiques on saurait expliquer comment fonctionne un moteur à explosion[#].

[#] Je serais d'ailleurs sincèrement curieux de savoir quelle proportion de la population prise au hasard dans la rue serait capable d'expliquer approximativement le principe d'un moteur à explosion (disons par exemple, de nommer les quatre phases du cycle d'un moteur à quatre temps). Mais j'ai déjà souligné l'incongruité du fait que ce genre de connaissances ne soient pas considérées comme faisant partie de la culture générale.

Un autre problème avec ce cliché est que, en fait, la génération qui a grandi avec les ordinateurs, c'est plutôt la mienne et la suivante ; la génération de ceux nés au XXIe siècle, ils ont grandi avec des smartphones (et autres interfaces graphiques complètes), et c'est bien différent. Or les interfaces graphiques comme celles des smartphones, comme leur but était de mettre l'outil entre les mains de tout le monde en évitant que Monsieur Toutlemonde ait à connaître quoi que ce soit du fonctionnement interne de la machine, elles ont tout fait pour cacher (dans des skeuomorphes plus ou moins heureux) la moindre chose qui ressemble à de la programmation. En même temps que le monde informatique derrière est devenu de plus en plus compliqué par l'empilement de couches séparant l'utilisateur du matériel (et ceci vaut aussi pour les vrais PC, pas seulement pour les smartphones), l'accès de l'utilisateur à ces couches et devenu de plus en plus compliqué.

Donc je ne pense pas du tout qu'un jeune né en 2000–2010 soit automatiquement doué pour la programmation, encore moins pour comprendre la notion abstraite de machine de Turing, pas plus que quelqu'un qui a grandi avec les voitures modernes — par opposition à la Ford modèle T — est automatiquement doué pour la mécanique auto, encore moins pour expliquer la thermodynamique du cycle d'Otto.

(Loin de moi l'idée de faire mon vieux con en mode c'était mieux âââvant, hein ! Je n'ai rien contre les interfaces graphiques pas plus que je n'en ai contre les voitures modernes. Si on n'est pas obligé de taper mkdir pour créer un répertoire, c'est très bien. Le problème c'est plutôt quand on ne peut même pas taper mkdir pour créer un répertoire. Je ne suis pas non plus en train de reprocher à la génération Z de ne rien savoir faire en-dehors de se servir de leur smartphone — autre cliché à la con que je déteste : je dis juste qu'il ne faut pas automatiquement supposer que grandir avec un smartphone rend ipso facto compétent pour se servir d'un ordinateur, encore moins pour comprendre le fonctionnement d'un ordinateur ou la théorie derrière.)

☞ L'informatique en prépa et à l'agreg

S'agissant de la formation des futurs ingénieurs (i.e., post-baccalauréat), les classes préparatoires scientifiques françaises ont tout récemment (à la rentrée 2022) vu la création d'une filière MPI (pour maths, physique, informatique), qui ouvre un véritablement enseignement de l'informatique en tant que science en classes prépa, à côté des filières MP (maths-physique) et PC (physique-chimie). Un de mes collègues a d'ailleurs participé à l'écriture des programmes de cette filière (du coup, la partie sur les automates finis est fortement inspirée d'un cours que je donnais sur ce sujet à Télécom[#2] et dans lequel ce collègue intervenait). Je suis certainement favorable à cette évolution, et au fait que l'informatique soit traitée comme une vraie manière autonome et pas une sorte d'excroissance des maths ni une distraction proposée en marge des cours et visant uniquement les applications dans d'autres domaines. Pour autant, je pense qu'il faut aussi se méfier de la fausse impression que cela pourrait causer dans l'esprit des préparationnaires qui risquent de croire faussement que parce que c'est de l'informatique ce n'est pas des maths (cf. ce que je dis plus bas sur la grande intersection entre ces domaines) : ils risquent du coup de se construire une image mentale trop exiguë des mathématiques (limitée en gros à l'algèbre linéaire et à l'analyse classique, ce qu'on leur enseigner en cours de maths), alors qu'en fait de grands pans de ce programme informatique auraient très bien pu être enseignés dans un cours de maths.

[#2] Cours dont voici les notes et ici une vidéo des séances de 2020–2021. À ce sujet, en avril 2021 on m'a demandé d'assurer un cours sur le sujet destiné aux profs de prépa (et qui va donc un peu au-delà du programme). Mes slides sont ici, et les vidéos de l'exposé lui-même sont ici pour les 2h du matin et ici pour les 2h de l'après-midi.

Cette création d'une filière MPI en prépa scientifique fait suite de peu à la création d'une agrégation d'informatique (premier concours à l'été 2022). Auparavant, il y avait eu une option informatique à l'agreg de maths (option proposée à l'écrit entre ~1990 et ~1997 je crois, puis à l'oral entre ~2006 et 2022 ; entre les deux il n'y avait rien). Il y a certainement lieu de s'interroger sur la question de savoir s'il était idéal d'avoir une agreg complètement différente plutôt qu'une option, ou une solution intermédiaire (une question analogue se pose certainement aussi sur le rapport entre physique et chimie, ou entre biologie et géologie), ou d'ailleurs s'il était évident que la création d'une agreg d'informatique dût entraîner la suppression de l'option informatique de l'agreg de maths. (Bizarrement, en prépa, il continue à exister une option info en filière MP, qui est distincte de la filière MPI : c'est confusant, pas forcément super cohérent, et un peu compliqué à gérer en aval dans l'enseignement, mais je suis tenté de croire que cette multiplicité des choix a des vertus.)

Sans vouloir suggérer que c'est un mauvais choix scientifique ou pédagogique (au contraire), je pense que ces décisions relèvent largement d'une décision d'affirmer l'indépendance de l'informatique comme discipline scientifique à part entière, et de ne pas laisser l'idée que c'est une sorte d'appendice des mathématiques.

☞ Le problème des limites entre sciences

Au-delà de l'enseignement, parlons un peu de la science pour la science.

Les frontières entre disciplines sont, évidemment, un peu arbitraires. D'abord, je crois fermement à l'unité fondamentale de tous les domaines du savoir humain, c'est-à-dire au moins que je suis sûr qu'on peut passer de proche en proche de la théorie des cordes à la philologie grecque, ou de la biochimie à la musicologie, sans jamais rencontrer de barrière nette. Si cela peut paraître farfelue, je rappelle au passage qu'un concept très important de l'informatique théorique (à l'intersection avec les maths), la notion de grammaire hors contexte a été inventé par un linguiste[#3] (d'ailleurs peut-être plus connu pour son activisme politique), Noam Chomsky.

[#3] Je sais que l'importance de cette notion en linguistique (ou de façon générale toute la linguistique chomskienne, et la notion de grammaire universelle) est assez controversée. Je m'abstiens explicitement de me prononcer sur ces questions sur lesquelles je suis incompétent. Mais quoi qu'on en pense dans le cadre de la linguistique, en informatique théorique c'est une notion fondamentale.

Mais je ne veux pas tomber dans le sophisme des sorites que je ne cesse de dénoncer : ce n'est pas parce que la frontière est floue et/ou largement arbitraire qu'elle n'existe pas, ou qu'on n'a pas le droit de discuter le meilleur endroit où la faire passer.

Les limites administratives entre sciences causent toutes sortes de maux de tête, par exemple pour les candidats à un poste académique dont la spécialité est proche d'une de ces frontières arbitraires : a priori on pourrait imaginer que cela tourne à leur avantage (par exemple, quelqu'un qui fait quelque chose à cheval entre les maths et l'info pourrait candidater aussi bien en maths qu'en info), mais dans la réalité c'est presque toujours un handicap (il y aura toujours quelqu'un pour vous reprocher de faire des choses trop informatiques quand vous candidatez en maths et de faire des choses trop mathématiques quand vous candidatez en info, avec le prétexte que vous auriez dû candidater dans l'autre domaine ; je pense que ceci vaut à chaque fois qu'il y a une interface de ce genre : sur le papier tout le monde dit du bien de la transdisciplinarité, mais dans la réalité ça a tendance à nuire aux candidats de ne pas rentrer dans les bonnes petites cases). Mais ce n'est pas tellement de ça que je veux parler.

Donc, l'informatique fait-elle partie des mathématiques ? Une partie de l'informatique fait-elle partie des mathématiques ? Où est le meilleur endroit pour tracer la limite ?

↑Entry #2778 [older| permalink|newer] / ↑Entrée #2778 [précédente| permalien|suivante] ↑

↓Entry #2777 [older| permalink|newer] / ↓Entrée #2777 [précédente| permalien|suivante] ↓

(lundi)

J'essaie d'ajouter la possibilité de régler la taille du texte sur ce site

Un des principes complètement stupides et insupportables du Web (j'en parlais notamment dans ce billet il y a quelques mois) est que c'est l'auteur d'une page (ou site) Web qui choisit tous les détails de l'apparence de celle-ci. L'habitude qu'on a de ce principe peut faire oublier son absurdité, mais je ne sais vraiment pas quel sens ça peut avoir que ce soit moi, auteur de ce blog, qui décide la couleur de fond de la page, ou la police de caractère avec laquelle vous lisez ces mots : ces choix stylistiques m'ont surtout valu des critiques pour mes goûts de merde, mais c'est tout le principe qui est idiot — si on va critiquer ces choix, autant que ce soit le lecteur lui-même qui les fasse. Ce n'est pas à moi de décider quelle police vous semble la plus agréable pour lire du texte, ni la couleur qui offre le meilleur contraste, ni la taille qui convient le mieux à vos yeux peut-être myopes ou presbytes ou que sais-je encore : indépendamment du fait que j'ai (paraît-il) mauvais goût, je n'ai tout simplement pas les informations nécessaires pour prendre ces décisions.

Alors certes il y a des éléments d'apparence qu'il est normal que l'auteur du site choisisse. Par exemple si j'écris un texte sur les foobars et que j'avertis pour aider le lecteur à s'y retrouver, je vais indiquer les noms des foobars en les soulignant deux fois, en bleu pour les foobars bleutés et en rouge pour les foobars orangés, il faut que je puisse souligner deux fois et choisir la couleur. On comprend que ça puisse poser des problèmes d'interaction si le lecteur peut faire des choix d'apparence et que l'auteur peut en faire d'autres, et qu'il faut donc gérer des conflits éventuels ou des dépendances (du style : si le lecteur a choisi un thème sombre je vais plutôt utiliser un bleu et un rouge sombres, tandis que si le lecteur a choisi un thème clair je vais prendre des couleurs vives).

Reste que la situation actuelle, malgré de bonnes intentions de divers bouts des standards Web (comme CSS) laisse fort peu de pouvoirs entre les mains de l'utilisateur. (Enfin, en principe il a tous les pouvoirs : il peut ouvrir l'outil « inspecteur » de son navigateur et s'en servir pour modifier comme il veut la page qu'il consulte, ajouter des éléments de style, changer les tailles, les polices, etc., et d'ailleurs même le texte lui-même si ça lui chante. Mais en pratique, l'utilisateur moyen ne sait pas se servir de l'inspecteur de son navigateur, et même l'utilisateur expérimenté trouvera pénible de refaire ça à chaque visite, ou de devoir écrire un script Greasemonkey pour le faire automatiquement.)

La seule chose que les navigateurs Web ont fini par se décider à proposer de façon vraiment accessible, c'est un moyen de changer la taille en zoomant (ça se fait typiquement avec les touches contrôle-plus et contrôle-moins) ; Firefox propose même deux types de zoom : un zoom qui change texte et images, et un zoom qui ne change que le texte (mais comme le second — qui me semble préférable a priori — est peu utilisé donc mal testé, il souffre de divers problèmes et bugs, par exemple ça casse les capture d'écran). Pour une raison que je ne comprends pas du tout[#], cette fonction de zoom n'est pas proposée sous Firefox mobile (on peut certes zoomer par gestures sur l'écran, mais c'est un zoom qui ne réajuste pas la longueur des lignes à la taille de l'écran/fenêtre comme sur fixe ; tout est compliqué parce qu'il y a au moins trois types de zoom différents qu'on peut vouloir : cf. ce commentaire pour une explication plutôt correcte). Quoi qu'il en soit, ces mécanismes de zoom sont complètement spéciaux, c'est-à-dire qu'ils ne passent pas par le contrôle normal des déclarations de style CSS (ou alors ils interagissent bizarrement avec elles).

[#] Il faut dire aussi que je ne comprends pas grand-chose à la manière dont interagissent les différentes tailles dans un navigateur mobile : voir ce billet passé à ce sujet, à propos de l'ajout de la déclaration <meta content="width=device-width, initial-scale=1" name="viewport" /> à mon HTML dont j'avoue que je ne comprends pas vraiment ce qu'elle fait.

Il commence aussi à y avoir des mécanismes de sélection de thèmes sombre/clair, parce que beaucoup de gens veulent ça pour leur webapplications. Mais ça passe par un mécanisme ad hoc qui ne permet que de choisir un « thème » (voire un thème parmi deux) et certainement pas plein de propriétés orthogonales (police, taille du texte, longueur des lignes, couleurs). Donc un deuxième mécanisme de personnalisation différent, extrêmement limité dans sa portée.

Pour n'importe quoi d'autre que le zoom spécial proposé par le navigateur et la sélection d'un thème sombre/clair, le site Web doit proposer son propre mécanisme de personnalisation, et évidemment rien n'est standardisé pour aider à ce que l'utilisateur s'y retrouve facilement entre les sites ou puisse facilement faire les mêmes choix partout (ou au moins, soit sûr de ce que ces choix recouvrent). Il n'y a même pas de « pratiques recommandées » sur la manière de nommer les préférences, de les présenter à l'utilisateur, de les ordonner, ce genre de choses.

Bref, c'est le bordel.

Ces râleries générales étant dites, on m'a demandé (dans un commentaire posté sur le tout premier billet de ce blog, ce qui est raisonnable vu que je n'offre pas de moyen de faire un commentaire sur l'ensemble du site) de proposer un moyen de régler la taille du texte.

J'ai donc essayé (en m'inspirant du code qu'on m'a proposé, et en l'empirant à ma sauce) de faire quelque chose de ce genre. Forcément, ça passe par du JavaScript, mais comme ça ne rend pas le site inutilisable sans JavaScript (on ne verra juste pas cette fonction et tout marchera comme avant) ça me semble un usage parfaitement légitime de JavaScript. Pour les >99.9% d'utilisateurs qui ont JavaScript activé dans leur navigateur, vous devriez donc voir en bas de la page, juste au-dessus de la signature finale, des boutons permettant choisir la taille du texte que vous préférez. [Modification () : Pour éviter de trop encombrer l'espace, il faut d'abord cliquer sur le bouton ‘⚙’ pour faire apparaître les autres boutons.] Ce réglage est censé être persistant et s'appliquer à l'ensemble des pages de ce site (enfin, sauf quelques pages antédiluviennes qui sont dans un style complètement différent).

Reste que je ne suis pas très content de ce que j'ai fait, pour diverses raisons. Certaines raisons de mon mécontentement sont de la faute de mon incompétence, d'autres sont de la faute de choix (possiblement malheureux) que j'ai faits par le passé, d'autres sont la faute des technologies du Web, et encore d'autres je ne sais pas bien.

Les technologies Web c'est toujours le même truc : tous les chemins sont jonchés de petites crottes de ragondin, et à chaque fois qu'on veut faire un truc on n'arrête pas de marcher dessus. Il y a toujours plein de choses qui font presque ou à peu près ce qu'on veut, mais à chaque fois on découvre des limitations à la con qui empêchent de s'en servir comme on voudrait.

D'abord, il y a une question toute bête d'interface utilisateur ; sous quelle forme proposer à l'utilisateur de changer la taille du texte ? J'ai choisi de mettre ça en bas de la page, avec des boutons à cliquer pour choisir diverses tailles entre 8 pixels et 20 pixels (enfin, j'écris pixels mais il faut considérer que c'est une unité un peu arbitraire, notamment sur mobile, donc je montre un échantillon de chaque taille après le bouton). Je ne sais pas si cette interface est terrible : peut-être qu'un menu déroulant aurait été mieux ? Peut-être vaudrait-il mieux mettre ça en tête de page ? (Je n'aime pas trop l'idée de mettre en tête de page quelque chose qu'on ne va pas toucher souvent, mais d'un autre côté si on veut essayer plusieurs tailles et que c'est en fin de page, on risque de devoir rescroller jusqu'à la fin.) Bref, concevoir des interfaces utilisateurs est un métier, ce n'est pas le mien, je suis profondément incompétent là-dessus, et ça devrait faire partie des standards du Web, pas quelque chose qu'on me demande d'improviser.

D'ailleurs est-ce que j'aurais dû proposer une liste de tailles espacées logarithmiquement plutôt que linéairement ? Je n'en sais rien. Mais bon, ça je pense que ça n'a vraiment pas d'importance.

Question interface, il y a aussi le choix de la langue : j'ai mis le texte invitant à changer la taille (change site font size) en anglais, par simplicité, mais si j'avais été motivé au point de l'écrire en plusieurs langues, je ne sais pas très bien comment j'aurais dû choisir la langue (en fonction de la langue préférée du navigateur ? en fonction de la langue de la page où le choix s'insère ?).

Ensuite, il y a un problème de ce que signifie la taille par défaut : parce que avant de rajouter ce réglage, j'avais déjà fait un choix par défaut, à savoir une taille de 12px si la largeur de fenêtre est ≤640px, 14px si elle est ≤720px, et 16px au-delà (cf. ce billet passé). En fait, je ne sais même pas bien ce que la taille de fenêtre signifie exactement ici, mais ce choix par défaut est le résultat d'un compromis laborieux. (Si on met une seule taille, il est juste impossible d'avoir un truc utilisable à la fois sur un navigateur mobile et sur un fixe.) Du coup, si la taille par défaut dépend de la largeur, ce n'est pas clair comment je dois présenter à l'utilisateur le choix de revenir à la taille par défaut ! Ce n'est même pas très clair pour moi comment je peux, en JavaScript, lire la taille par défaut[#2]. Bon, bref, j'ai mis un bouton pour revenir au défaut (c'est-à-dire à la taille choisie en fonction de fenêtre), mais ça peut sembler confus d'avoir un bouton reset en plus du bouton de la même taille.

[#2] Oui, rien que lire la taille par défaut n'est pas évident : si j'ai du CSS qui dit quelque chose comme @media (max-width: 640px) { body { font-size: 12px; } } @media (min-width: 641px) and (max-width: 780px) { body { font-size: 14px; } } @media (min-width: 781px) { body { font-size: 16px; } et que je veux récupérer la valeur de font-size de l'élément body, ben… ça n'a pas l'air facile. L'idée naturelle serait d'appeler getComputedStyle(), mais il s'avère que quand Firefox est en mode zoom où il ne zoome que le texte (et pas les images), la valeur de font-size renvoyée par getComputedStyle() tient compte de ce zoom (alors que si on cherche à modifier la propriété, ben le zoom s'applique dessus, donc si on lit et qu'on réécrit ce n'est pas idempotent !). C'est vraiment l'exemple de petite crotte de ragondin qui parsème n'importe quelle tentative de faire n'importe quoi avec CSS et JavaScript.

Encore un autre problème est de savoir comment stocker la préférence de l'utilisateur. Il y a la possibilité de positionner un cookie pour ça : je n'aime pas trop les cookies, parce que d'abord c'est plein de bizarreries incompréhensibles (notamment qu'on reçoit la chaîne de tous les cookies positionnés et qu'il faut ensuite analyser soi-même), et puis il n'y a pas de raison que la préférence soit communiquée à mon serveur dans la requête HTTP (je n'ai pas à savoir quelles tailles mes utilisateurs ont choisies), ce qui serait le cas avec un cookie. Donc j'ai plutôt opté pour une variable en local storage, ce qui est plus propre et plus moderne, mais je ne sais pas si j'ai bien fait (ça peut passer pour un cookie « sous le radar », et des gens n'aiment pas).

Il y a un point sur lequel je me suis moi-même un peu tiré une balle dans le pied, c'est que le JavaScript de ce site (comme le CSS) n'est pas inclus par référence, depuis un fichier JavaScript qui serait chargé en plus du HTML, il est incorporé directement dans le HTML. (Ma motivation était que j'aime que les fichiers HTML soient autonomes : on peut prendre le HTML d'un billet de mon blog et, tant qu'il n'y a pas d'images dedans, le sauvegarder dans un fichier et le lire tel quel sans avoir à ajouter un machin point js et un bidule point css à côté[#3].) J'ai une infrastructure Java sur le serveur qui inclut un fichier JavaScript commun dans chaque HTML du site (soit généré statiquement pour la plupart des pages, soit généré dynamiquement par Tomcat pour les entrées individuelles du blog). Comme je viens de le dire, ça peut présenter un intérêt ; mais pour tester du JavaScript et le modifier, ça devient vite un calvaire, parce que ça demande de régénérer la page pour chaque essai.

[#3] Raison principale pour laquelle je refuse d'utiliser des trucs comme jQuery ou analogue : ça me semble indispensable qu'on puisse sauvegarder un fichier HTML comme un simple fichier et le lire ensuite n'importe où avec une adresse en file:/// si besoin. Ce qui interdit l'appel à n'importe quel truc JavaScript externe, et notamment jQuery (lequel est beaucoup trop gros pour qu'il soit sérieusement envisageable de l'incorporer directement). C'est là encore une des crottes de ragondin — enfin, plutôt une merde de mammouth pour le coup — qui pollue le Web, qu'il n'y a aucun moyen simple, fiable et robuste de sauvegarder une page Web, avec toutes ses dépendances, et pouvoir la relire ensuite localement.

Mais il y a surtout une chose qui m'est insupportable, c'est si le changement de taille de texte n'est pas transparent mais apparaît après que la page a chargé ; autrement dit, si on voit d'abord la page s'afficher à la taille par défaut, pour ensuite changer et prendre celle qui a été choisie comme préférence. Non seulement c'est visuellement horripilant et très déstabilisant à la lecture, mais en plus ça risque de casser complètement les liens internes (si le navigateur positionne la vue d'après l'ancre qu'on lui a donnée puis change la taille du texte, on risque de voir un autre bout du texte que celui que pointait le lien qu'on a suivi).

J'ai cherché à éviter ce problème en réglant la taille de la police par une fonction JavaScript exécutée dès que l'élément <body> est créé (en gros j'appelle une fonction JavaScript onEarly() depuis le HTML immédiatement après avoir ouvert l'élément <body> de manière à pouvoir régler document.body.style.fontSize dedans, et cette fonction ne fait quasiment que ça pour ne pas retarder le chargement de la page). Cette solution semble marcher sous Firefox mais pas sous Chrome (enfin, sous le Chromium que j'ai pour tester). Je ne sais pas pourquoi : sous Firefox tout marche comme je voudrais, mais sous Chrome je vois d'abord la page s'afficher à la taille par défaut et ensuite changer de taille sous mes yeux — précisément ce que je voulais éviter. À vrai dire je ne comprends pas vraiment (← ceci est un euphémisme pour pas du tout) le synchronisme du JavaScript : à quel moment le code est exécuté, à quel moment on a accès au DOM, à quel moment on peut ajouter du CSS, etc. Donc je ne sais pas à quel moment il faut se positionner pour pouvoir exécuter du JavaScript qui puisse modifier le style de l'élément <body> en ayant la garantie que rien n'a encore été affiché à l'écran : si quelqu'un comprend ce qui se passe avec Chrome et pourquoi il ne se comporte pas comme Firefox à cet égard, qu'il me le dise. Correction : Juste après avoir écrit ça, je reteste et je m'aperçois que ça semble marcher comme je veux, aussi bien sous Chrome que sous Firefox ; je ne sais pas ce qui s'est passé, j'ai dû brièvement passer dans un univers parallèle, ou peut-être que je me suis fait avoir par un mécanisme de cache quelconque.

Toujours est-il que j'ai fait un truc. Je ne suis pas très content de ce truc, mais il marchouille. Si vous avez des suggestions pour le rendre plus élégant, plus robuste, plus intuitif, je suis preneur, mais comme je commence à en avoir sacrément marre à ce stade, toute modification qui requiert des efforts de ma part au-delà du simple copier-coller d'un code qu'on me donnerait va sans doute juste être ignorée.

Ajout : Puisque la longueur des lignes est aussi une râlerie fréquente concernant le style de ce site, j'ai aussi ajouté un jeu de boutons permettant de le régler (entre 50 et 150 caractères par ligne).

Nouvel ajout () : Pour éviter de trop encombrer l'espace visuel, j'ai caché les boutons de réglage de la taille du texte et de la longueur des lignes derrière un bouton ‘⚙’ qui fait apparaître les autres réglages. J'ai aussi ajouté des scrollIntoView() pour que les boutons restent en vue quand on les utilise.

Néanmoins, si mon truc donne grosso modo satisfaction, je verrai si je peux le mettre aussi sur les pages de commentaires du blog (qui sont gérées de façon complètement différentes, par un script Perl antédiluvien auquel je préfère toucher le moins possible, donc j'attends d'être sûr d'avoir le bon JavaScript avant de le recopier).

↑Entry #2777 [older| permalink|newer] / ↑Entrée #2777 [précédente| permalien|suivante] ↑

↓Entry #2776 [older| permalink|newer] / ↓Entrée #2776 [précédente| permalien|suivante] ↓

(dimanche)

Une autre énigme de calculabilité

Méta : J'ai proposé une petite énigme la semaine dernière, qui m'était venue en réfléchissant à des questions autour de la logique et de la calculabilité (j'ai ajouté successivement un indice et la réponse, donc si vous aviez lu l'énigme et l'aviez trouvée intéressante mais sans aller jusqu'à la réponse, vous pouvez y jeter un nouveau coup d'œil). Avec toutes mes excuses aux >99.9% de mes lecteurs qui ne sont pas amusés par ce genre de choses, je vais finir l'année en en proposant une autre, un peu dans le même esprit mais néanmoins bien différente, qui m'est aussi venue en réfléchissant à des questions adjacentes. Je ne sais vraiment pas si elle est difficile (plus que la première ? moins ?), parce que pendant que j'y réfléchissais, je n'arrêtais pas de me tromper sur l'énoncé, de m'embrouiller sur ce que je voulais demander, et finalement de ne plus savoir du tout où j'en étais ; j'ai régulièrement cru me persuader que « non, ce n'est pas possible du tout, ce truc », et finalement la réponse m'a semblé étonnamment bête, du genre « mais comment je n'ai pas vu ça ? », peut-être parce qu'il faut penser out of the box comme on dit, ou peut-être que je m'obstinais un peu trop à réfléchir dans les mêmes lignes que l'énigme précédente. Bon, cette fois je ne vais pas trop essayer de faire semblant de m'adresser au grand public, donc même si je vais écrire un scénario tarabiscoté pour rendre l'énigme formellement indépendante, je suppose en fait qu'on connaît les bases de calculabilité et qu'on sait ce qu'est un ensemble décidable, un algorithme, ce genre de choses. (La version formulée mathématiquement, que je donne à la fin, est beaucoup plus simple que l'énigme précédente, et certainement plus simple que mon scénario tarabiscoté.)

L'énigme

Le cruel Docteur No (connu pour ses méfaits précédemment racontés ici, , , et encore — et j'en ai peut-être oublié au passage) est à la recherche d'inspiration pour une nouvelle torture pour mathématiciens. Ayant construit un Ordinateur Infini[#], il s'apprête à choisir une question, pour chaque entier n, dont la réponse est soit oui, soit non, de manière à ce qu'il soit impossible de calculer algorithmiquement la réponse en fonction de n : ces pauvres mathématiciens, qui ne disposent que de vulgaires ordinateurs (i.e., machines de Turing) seront donc incapables de répondre à la question, et le Docteur No jubile de l'impossibilité devant laquelle il va les placer.

Mais voilà que son code de l'honneur de grand méchant se rappelle à lui : ses énigmes doivent avoir une solution ! Il doit toujours y avoir un moyen de s'en sortir. Demander de calculer une fonction non-calculable n'est pas du jeu.

Le mathématicien capturé aura donc le droit de faire calculer par l'Ordinateur Infini une indication pour chaque question, sous forme d'un entier naturel h(n), qui lui sera donnée avec la question. Bon, mais comme ça ce serait vraiment trop facile. Donc en fait le Docteur No va mettre deux limitations sur cette indication : d'abord, il n'y aura une indication choisie par le mathématicien que quand la réponse à la question est oui ; quand la réponse est non, le mathématicien se verra donnée une fausse indication, choisie par le Docteur No (et évidemment, aucune façon de savoir si on a affaire à une vraie ou fausse indication). Ensuite, l'indication sera donnée non pas comme l'entier h(n) mais comme un programme q (ne prenant pas d'entrée, et choisi par Docteur No en même temps que n) qui calcule h(n) : en cas de fausse indication (i.e., si la réponse attendue est non), le programme pourrait ne jamais terminer du tout, ou pourrait terminer et renvoyer n'importe quoi (ou même ne pas être un programme du tout, mais ça ce n'est pas intéressant parce que c'est trop facile à tester) ; en revanche, en cas de vraie indication (i.e., si la réponse attendue est oui), le programme fourni terminera en temps fini et renverra h(n) (mais sans aucune autre garantie que ça). Avec ces données n (la question) et q (le programme calculant — peut-être — l'indication), le mathématicien doit (algorithmiquement !) calculer la réponse attendue, sachant que l'énigme doit faire que ce ne soit pas possible sans q.

Comment le Docteur No va-t-il choisir son énigme pour que le problème soit faisable, et comment le mathématicien capturé va-t-il choisir les indications ?

[#] Ce peut calculer l'Ordinateur Infini n'est pas très pertinent ici. Disons par exemple qu'il peut calculer n'importe quoi dont on peut démontrer l'existence. Mais si on veut par exemple imaginer que c'est une machine hyperarithmétique, on peut.

Comme mon scénario est assez tarabiscoté (franchement, si vous trouvez une meilleure façon de raconter l'histoire, dites-le moi !), voici une version mathématiquement précise de ce que je demande de prouver :

Montrer qu'il existe une fonction d:ℕ→{0,1} non calculable (ce sont les réponses attendues, avec ‘0’ pour non et ‘1’ pour oui) et une fonction h:ℕ→ℕ (nécessairement non calculable ; ce sont les indications ; la valeur de h(n) n'aura d'importance que si d(n)=1 donc on peut se limiter définir h sur d−1({1})) telles qu'il existe un algorithme p qui, donné un n∈ℕ et un q comme on va le dire, termine toujours en temps fini et calcule d(n). La garantie sur q est que si d(n)=1 alors q est un programme sans entrée[#2] qui termine en temps fini et renvoie h(n) (en revanche, si d(n)=0 alors il n'y a aucune sorte de garantie sur q, c'est une donnée finie arbitraire).

[#2] Pour qu'il n'y ait pas de confusion possible : q ne prend pas n en entrée : il (q) est donné en même temps que n, et la garantie est que si d(n)=1 alors pour ce n-là, le programme q (qui ne prend pas d'entrée du tout) termine et renvoie h(n).

Je ne sais pas si j'ai vraiment d'indication à donner, cette fois-ci : je vois mal comment en donner une sans donner directement la solution : je sais juste qu'on peut partir dans la mauvaise direction et avoir l'impression que cette énigme est complètement insoluble, ou bien se dire qu'en fait c'est juste idiot. Sans que ce soit une indication (et je ne me prononce pas sur le fait que ça aide au problème général), on peut éventuellement commencer par réfléchir à la version plus simple où q est directement la valeur de h(n) dans le cas où d(n)=1, au lieu d'être un programme qui la calcule.

Une fois de plus, j'écrirai la réponse dans quelques jours en éditant ce billet. En attendant, à défaut de trouver la solution, vous pouvez aussi proposer une façon plus claire que moi de présenter l'énigme ! (Vous pouvez aussi vous plaindre si les termes de l'énigme ne sont pas clairs.)

La réponse

[Section ajoutée .]

Voici la solution que je propose (j'ai peur qu'elle soit complètement incompréhensible si on n'a pas un minimum d'habitude de la calculabilité, mais j'ai quand même fait des efforts minimaux pour rappeler quelques conventions du domaine).

↑Entry #2776 [older| permalink|newer] / ↑Entrée #2776 [précédente| permalien|suivante] ↑

↓Entry #2775 [older| permalink|newer] / ↓Entrée #2775 [précédente| permalien|suivante] ↓

(mardi)

Il faut qu'on parle des pubs en ligne et du financement du Web

Ce qui motive ce billet (qui traîne depuis un moment dans mes cartons) est que j'entends de plus en plus de gens dire que YouTube s'est mis à bloquer leur bloqueur de pub. Le mien (Adblock Plus, à ne pas confondre avec AdBlock, ils n'ont pas plus de rapport qu'un lointain ancêtre commun, oui, c'est très confusant) continue à marcher, ou peut-être que YouTube a décidé de ne pas me servir de pub ou peut-être que je ne fais pas (encore ?) partie de la population sur laquelle il teste le bloqueur de bloqueur de pub, mais j'imagine que je vais tomber sur le problème tôt ou tard, et devoir soit me passer de YouTube soit perdre du temps pour trouver comment bloquer le bloqueur de bloqueur de pub, temps qui aurait été bien plus agréablement perdu à regarder YouTube. En tout cas je n'imagine pas du tout de regarder leurs pubs, et leur abonnement Premium coûte un prix complètement déraisonnable (eu égard à une estimation raisonnable à la fois du coût marginal que je leur fais subir et de ce que je pourrais leur rapporter en pubs) donc je ne l'envisage pas non plus.

Mais laissant de côté le cas particulier de YouTube, il faut dire clairement que le financement d'Internet est un problème fondamental auquel personne n'a de réponse satisfaisante. Je n'ai pas de lumière particulière à apporter, mais je peux au moins décortiquer le problème par le menu comme c'est la spécialité de ce blog.

☞ Le modèle de financement du Web est pourri

Je faisais remarquer il y a quelques mois dans cette entrée sur la préservation de l'information que pour rendre une information disponible sur le Web, il faut payer, et payer en permanence (si bien que quand un individu décède ou une compagnie fait faillite, les informations disparaissent) : c'est une conséquence structurale de la manière dont le Web fonctionne (voir cette autre entrée pour de la vulgarisation à ce sujet), à savoir que des serveurs doivent tourner en permanence pour être prêts à répondre aux requêtes des navigateurs. Par exemple, s'agissant de ce blog, il est hébergé sur un serveur que je loue avec de l'argent qui sort de ma poche : j'ai des raisons diverses de vouloir faire ça (allant de la vanité de disséminer mes idées à la commodité de pouvoir moi-même relire à tout endroit sur mon téléphone un truc qui me sert largement de bloc-notes) ; mais même si je voulais demander à mes lecteurs de participer au financement de son hébergement, ce ne serait pas du tout évident.

C'est complètement différent du modèle d'un livre où non seulement l'objet ne disparaît pas quand son auteur décède (je parle ici des vrais livres sur papier, pas les e-books qui disparaissent quand la compagnie qui vous l'a loué en faisant semblant de vous le vendre décide de vous retirer son bon vouloir), mais aussi, même si quelqu'un doit payer des frais d'édition initiaux, le lecteur contribue assez naturellement à les rembourser, même pour un livre pour lequel aucune propriété intellectuelle ne s'applique (i.e., le prix concerne le processus d'édition et pas la rémunération de l'auteur).

Il me semble que c'est un problème fondamental, dont les conséquences expliquent beaucoup des problèmes du Web à travers les moyens tous pourris qu'on a de contourner de problème. Hélas, je n'ai pas de meilleur système à proposer (les choses comme IPFS ont peut-être du potentiel, mais il faut reconnaître que ça ne marche pas pour l'équivalent d'un site Web, et en plus ce type de modèle est maintenant teinté par la culture toxique des cryptomonnaies).

☞ Les quatre modes de financement principaux

Les modes de financement du Web qu'on a trouvés pour contourner ce problème fondamental du il faut payer pour héberger et pas pour lire semblent se limiter aux suivants :

  • Baisser les bras, i.e., accepter la réalité du fait qu'il faut payer pour héberger. Cela peut s'expliquer si, par exemple, l'hébergeur est une institution qui a dans ses missions de communiquer (on comprend par exemple ainsi le fait que la Bibliothèque Nationale de France paye pour mettre en ligne énormément de livres qu'elle a scannés) ou si cette communication sert à sa mission ou lui est autrement profitable (le plus évident étant une entreprise commerciale qui a besoin d'exister en ligne pour que ses clients la trouvent). De tels sites Web sont donc gratuits et sans pub ni abonnement (ou éventuellement ils sont intégralement de la pub pour leur auteur ; je suppose qu'on peut aussi ranger dans cette catégorie tous les sites marchands où le site est gratuit parce que les produits qu'on y achète sont payants).

  • Faire appel à la bonne volonté des visiteurs, i.e, leur demander de contribuer au financement du site sans pour autant en faire une condition sine quā non de son utilisation, soit en payant directement, soit en achetant des goodies (genre tee-shirts ou autocollants) dont on comprend bien qu'ils n'ont pas d'autre intérêt que de matérialiser une contribution financière. Wikipédia utilise ce modèle, ce qui prouve qu'il peut fonctionner à grande échelle ; mais il reste qu'il est très compliqué en pratique de payer une petite somme d'argent à plein de sites qu'on trouve un petit peu utiles (on ne sait pas faire fonctionner de système pratique de micropaiements), et c'est aussi assez horripilant d'être constamment bombardé de messages du type ce site est payé par vos contributions : s'il vous plaît, pensez à visiter la page de dons.

  • Fonctionner sur un système d'abonnements, i.e., le site n'est accessible qu'aux gens qui payent.

  • Ou enfin, bien sûr, mettre des pubs.

Toutes sortes de compromis sont possibles entre ces systèmes : par exemple, il est fréquent que le site soit payant mais que quelques parties soient quand même gratuites histoire d'allécher le client potentiel (les journaux en ligne payant mettent souvent une poignée d'articles en accès libre ainsi que le début de tous leurs articles, ou quelque chose come ça) ; ou inversement, le site est gratuit, mais pour inciter à donner on réserve quelques fonctionnalités supplémentaires aux donateurs/abonnés ; ou encore, le site est gratuit mais chargé de pubs et on peut payer pour avoir une version sans pubs.

☞ Ce qui ne va pas avec eux

Soyons bien clairs : tous ces systèmes sont pourris. Si je dois absolument choisir mon poison, le système le site est gratuit mais quelques fonctionnalités supplémentaires sont payantes ou le site est gratuit, mais les abonnés ont accès aux informations en avance me semble le moins mauvais, mais aucun des quatre grands systèmes que j'ai décrits ne fait plus que répartir la merde d'un problème fondamental. Il n'est pas normal qu'un site utile soit payé par ses auteurs, mais il n'est pas non plus normal qu'on ait à supplier les lecteurs (et donc les emmerder) ou les culpabiliser pour obtenir une petite obole ; les sites fonctionnant sur abonnement sont coupés du Web et cassent son modèle de partage de l'information ; et les pubs sont une calamité parce qu'elles transforment le lecteur en ennemi qu'il s'agit de duper, ce qui ne peut qu'aboutir à une guerre. Bref, ces quatre modèles sont complètement pourris : différemment pourris, mais complètement pourris quand même.

Pour détailler un petit peu, le premier problème avec les sites fonctionnant sur abonnement, c'est qu'ils empêchent de partager les informations par un lien. Si je m'abonne à un journal en ligne, je vais avoir accès aux articles de ce journal, mais ce qui m'intéresse n'est pas juste de pouvoir les lire mais aussi de les montrer à mes amis, de pouvoir les citer sur mon blog, ce genre de choses : le partage de l'information est le principe même du Web, et si je ne peux pas faire toutes ces choses, je préfère ne pas avoir accès à l'information du tout. Et symétriquement, de temps en temps je vois passer des liens sur les réseaux sociaux pointant vers des articles auxquels je n'ai pas accès : qu'est-ce que vous voulez que je fasse de choses comme ça ? Je ne vais pas m'abonner pour lire un unique article (encore une fois : les micropaiements ne marchent pas et c'est un drame), donc ce genre de liens ne font que m'irriter à la fois contre la personne qui me nargue avec un lien auquel je n'ai pas le droit d'accéder comme si elle me montrait une photo de l'intérieur de son club exclusif, et contre l'auteur du contenu.

Un système un peu plus malin est celui où chaque abonné, en plus du droit d'accéder à l'ensemble des contenus couverts par son abonnement, a le droit d'en partager un certain nombre, c'est-à-dire de créer des liens qui seront accessibles aussi par les non-abonnés. Mais ces systèmes ont forcément des limites, parce que les auteurs du site ont peur qu'un petit nombre de lecteurs se regroupent pour partager tous les articles et créent ainsi une version gratuite du site : probablement, chaque lien de partage ne marchera qu'un nombre donné de fois ou autre limitation à la con.

Plus fondamentalement, le problème avec les sites sur abonnement, c'est qu'ils ne font pas vraiment partie du Web, c'est-à-dire du Web ouvert, public, recherchable et (certes imparfaitement mais néanmoins un peu) archivé. Les problèmes déjà pénibles d'accès et de préservation de l'information sur le Web sont donc encore empirés sur ce non-Web. Si je m'abonne à un site payant, je vais devoir mettre en place un mécanisme pour sauvegarder tout ce que je consulte dessus, parce que je risque de perdre l'accès si mon abonnement expire et parce que l'Internet Archive ne l'archivera pas pour moi : ça va me prendre plus de temps et d'efforts que l'abonnement n'en vaut, donc je préfère laisser tomber.

Reste la solution des pubs.

↑Entry #2775 [older| permalink|newer] / ↑Entrée #2775 [précédente| permalien|suivante] ↑

Only the 20 most recent entries were included above. Continue to older entries.

Seules les 20 plus récentes entrées ont été incluses ici. Continuer à lire les entrées plus anciennes.


Entries by month / Entrées par mois:

2024 Jan 2024 Feb 2024 Mar 2024 Apr 2024 May 2024 Jun 2024
2023 Jan 2023 Feb 2023 Mar 2023 Apr 2023 May 2023 Jun 2023 Jul 2023 Aug 2023 Sep 2023 Oct 2023 Nov 2023 Dec 2023
2022 Jan 2022 Feb 2022 Mar 2022 Apr 2022 May 2022 Jun 2022 Jul 2022 Aug 2022 Sep 2022 Oct 2022 Nov 2022 Dec 2022
2021 Jan 2021 Feb 2021 Mar 2021 Apr 2021 May 2021 Jun 2021 Jul 2021 Aug 2021 Sep 2021 Oct 2021 Nov 2021 Dec 2021
2020 Jan 2020 Feb 2020 Mar 2020 Apr 2020 May 2020 Jun 2020 Jul 2020 Aug 2020 Sep 2020 Oct 2020 Nov 2020 Dec 2020
2019 Jan 2019 Feb 2019 Mar 2019 Apr 2019 May 2019 Jun 2019 Jul 2019 Aug 2019 Sep 2019 Oct 2019 Nov 2019 Dec 2019
2018 Jan 2018 Feb 2018 Mar 2018 Apr 2018 May 2018 Jun 2018 Jul 2018 Aug 2018 Sep 2018 Oct 2018 Nov 2018 Dec 2018
2017 Jan 2017 Feb 2017 Mar 2017 Apr 2017 May 2017 Jun 2017 Jul 2017 Aug 2017 Sep 2017 Oct 2017 Nov 2017 Dec 2017
2016 Jan 2016 Feb 2016 Mar 2016 Apr 2016 May 2016 Jun 2016 Jul 2016 Aug 2016 Sep 2016 Oct 2016 Nov 2016 Dec 2016
2015 Jan 2015 Feb 2015 Mar 2015 Apr 2015 May 2015 Jun 2015 Jul 2015 Aug 2015 Sep 2015 Oct 2015 Nov 2015 Dec 2015
2014 Jan 2014 Feb 2014 Mar 2014 Apr 2014 May 2014 Jun 2014 Jul 2014 Aug 2014 Sep 2014 Oct 2014 Nov 2014 Dec 2014
2013 Jan 2013 Feb 2013 Mar 2013 Apr 2013 May 2013 Jun 2013 Jul 2013 Aug 2013 Sep 2013 Oct 2013 Nov 2013 Dec 2013
2012 Jan 2012 Feb 2012 Mar 2012 Apr 2012 May 2012 Jun 2012 Jul 2012 Aug 2012 Sep 2012 Oct 2012 Nov 2012 Dec 2012
2011 Jan 2011 Feb 2011 Mar 2011 Apr 2011 May 2011 Jun 2011 Jul 2011 Aug 2011 Sep 2011 Oct 2011 Nov 2011 Dec 2011
2010 Jan 2010 Feb 2010 Mar 2010 Apr 2010 May 2010 Jun 2010 Jul 2010 Aug 2010 Sep 2010 Oct 2010 Nov 2010 Dec 2010
2009 Jan 2009 Feb 2009 Mar 2009 Apr 2009 May 2009 Jun 2009 Jul 2009 Aug 2009 Sep 2009 Oct 2009 Nov 2009 Dec 2009
2008 Jan 2008 Feb 2008 Mar 2008 Apr 2008 May 2008 Jun 2008 Jul 2008 Aug 2008 Sep 2008 Oct 2008 Nov 2008 Dec 2008
2007 Jan 2007 Feb 2007 Mar 2007 Apr 2007 May 2007 Jun 2007 Jul 2007 Aug 2007 Sep 2007 Oct 2007 Nov 2007 Dec 2007
2006 Jan 2006 Feb 2006 Mar 2006 Apr 2006 May 2006 Jun 2006 Jul 2006 Aug 2006 Sep 2006 Oct 2006 Nov 2006 Dec 2006
2005 Jan 2005 Feb 2005 Mar 2005 Apr 2005 May 2005 Jun 2005 Jul 2005 Aug 2005 Sep 2005 Oct 2005 Nov 2005 Dec 2005
2004 Jan 2004 Feb 2004 Mar 2004 Apr 2004 May 2004 Jun 2004 Jul 2004 Aug 2004 Sep 2004 Oct 2004 Nov 2004 Dec 2004
2003 May 2003 Jun 2003 Jul 2003 Aug 2003 Sep 2003 Oct 2003 Nov 2003 Dec 2003

[Index of all entries / Index de toutes les entréesLatest entries / Dernières entréesXML (RSS 1.0) • Recent comments / Commentaires récents]