David Madore's WebLog: 2024-04

J'avais expliqué il y a quelques mois que je m'étais engagé à monter un nouveau cours d'informatique théorique (ou faut-il dire de maths de l'informatique ?) pour certains élèves de première année à Télécom PlusÀParis, intitulé Logique et Fondements de l'Informatique (nom de code interne : INF110). (J'avais d'ailleurs publié un premier jeu de transparents dans de billet.) L'occurrence 2023–2024 de ce cours a eu lieu de mi-novembre (2023) à mi-janvier (2024), le contrôle le 26 janvier, et maintenant (enfin, quelques mois après) que j'ai à la fois rendu les notes finales et reçu les retours (anonymes) des étudiants je suis en mesure d'en faire un premier bilan. L'idée de ce billet n'est pas tellement d'entrer dans le fond du sujet (même si je ne peux pas ne pas en parler du tout), à ce sujet voir plutôt les deux paragraphes ci-dessous, mais de parler au niveau méta : pourquoi ce cours, pourquoi ce sujet, comment je l'ai organisé et préparé, ce qui a bien marché et ce qui n'a pas bien marché. Le but est de me permettre à moi-même de faire le point, et donc de réfléchir à ce que je veux changer l'an prochain, et aussi de préparer un exposé où je dois raconter tout ça (cf. la fin du présent billet).

☞ Pour le fond du sujet, je renvoie notamment à ce billet sur la correspondance de Curry-Howard et à celui-ci sur la réalisabilité propositionnelle, qui sont largement adaptés de certains bouts de mon cours, même si la présentation est différente et qu'ils vont plus loin (surtout le second). Je peux aussi renvoyer à ce billet sur des sujets variés en vrac sur lesquels j'ai appris des choses en préparant ce cours. Enfin, je fais un lien vers ce billet sur les degrés de Turing et leur généralisation parce qu'il touche à des questions adjacentes, même si je n'ai pas fait plus qu'évoquer la définition de degré de Turing (ordinaire) dans mon cours.

☞ Pour ce qui est des documents pédagogiques accompagnant le cours, voici quelques liens (dont, malgré ma passion pour la stabilité des URL, je ne garantis pas qu'ils seront pérennes, parce que je ne sais pas comment je vais les réorganiser à l'avenir). D'abord le PDF des transparents (qui est la concaténation idiote de trois parties inégales : ① calculabilité, ② typage simple et calcul propositionnel et ③ introduction aux quantificateurs ; j'ai aussi fait une version « imprimable » des transparents : ①, ② et ③). Les exercices d'entraînement sont : ici sans corrigé et ici avec corrigé. Et le sujet du contrôle est ici sans corrigé et ici avec corrigé. Et si des gens sont intéressés par le source de tout ça, le dépôt Git est ici.

Avertissement usuel : même si j'évoque ici mon travail d'enseignant-chercheur à Télécom, je dois rappeler que, dans ce billet comme ailleurs sur ce blog, je m'exprime à titre purement personnel et que les avis et opinions que je peux exprimer ici (ou ailleurs) sont juste les miens et n'engagent en aucun cas mon employeur (ni qui que ce soit d'autre que moi, et d'ailleurs ils ne m'engagent même pas moi vu que que je me réserve le droit d'en changer à tout moment et sans prévenir). J'ajoute que si vous faites partie des personnes qui ont besoin d'un tel avertissement, il vous est interdit de lire la suite de ce billet.

Plan du billet

Le contexte

Comme je l'ai expliqué dans les billets déjà liés ci-dessus (celui-ci et celui-là), la France a récemment créé une filière MPI (maths, physique et informatique) dans ses classes préparatoires scientifiques[#]. En particulier, les élèves entrant à Télécom par le concours commun peuvent arriver avec trois niveaux de formation en informatique : le socle commun MP/PC (où il n'y a pas grand-chose en info), l'option informatique en MP (qui existait déjà), et la nouvelle filière MPI (qui va encore plus loin). Les programmes de toutes ces filières sont trouvables par exemple sur ce site). Ceci nous a imposé une réforme de nos enseignements en première année : jusqu'à l'été 2023 notre première année était complètement uniforme (en gros, tout le monde avait les mêmes cours, le choix d'une filière de spécialisation se faisant en seconde année), mais ce mode de fonctionnement devenait intenable, au moins pour ce qui est de l'informatique, avec de telles différences de formation à l'entrée (si on s'adapte à ceux qui en ont fait le moins, ceux qui en ont fait plus s'ennuient, et si on s'adapte à ceux qui en ont fait le plus, ceux qui en ont fait le moins sont largués).

[#] Au niveau de la reconnaissance de l'informatique comme une science à part entière, il y a aussi eu création d'une agrégation d'informatique pour le recrutement des enseignants alors que l'informatique était jusqu'alors considérée comme une option de l'agrégation de mathématiques. Et, un peu avant, des changements au niveau lycée avec la création d'une spécialité NSI, c'est-à-dire numérique et sciences informatiques, mais ça ne me concerne que beaucoup plus indirectement : de ce que je comprends, à cause de la limitation à deux spécialités en terminale, la (grande ?) majorité des élèves de prépa, y compris MPI, n'ont pas suivi cette spécialité NSI en terminale, mais bien maths et physique-chimie.

Mais ce n'est pas, en fait, qu'une question de niveau en entrée : les élèves ayant choisi la filière MPI semblent avoir des attentes et des intérêts différents de ceux de la filière MP (même « option info »), au sens où ils semblent généralement plus intéressés par l'informatique pour elle-même et pas juste comme un outil dans un travail d'ingénieur (parce qu'évidemment tout le monde utilise l'informatique de nos jours). Et un des buts de la réforme que nous avons mise en place est de rentre Télécom plus attirante pour les préparationnaires vraiment intéressés par l'informatique, avec notamment l'idée qu'il ne faut pas qu'ils s'ennuient en cours.

La première année à Télécom est (maintenant) divisée en quatre périodes. Pour ce qui est de l'enseignement d'informatique, voici comment nous avons organisé l'année. La période P1 (septembre–octobre) a été dédiée à une introduction générale à la programmation, du matériel au haut niveau, tandis que les élèves venus de la filière MPI (et uniquement eux) ont un cours spécifique sur la compilation. La période P2 (novembre–janvier) est consacrée à la théorie de l'informatique, et c'est celle qui me concerne et dont je vais reparler. La période P3 (février–avril) propose le choix entre différents paradigmes de programmation. Et la période P4 (avril–juin) est consacrée aux réseaux. Sur chacune de ces périodes, les élèves ont environ 40h d'informatique (sauf en P3, moitié moins), c'est-à-dire environ 4h½ par semaine pendant les 9 semaines que dure la période. (Pendant le même temps, les élèves ont bien sûr aussi des cours dans les autres domaines : maths, physique+électronique, sciences économiques et sociales, langues et humanités ; plus des projets et stages variés, notamment entre les périodes. Je dis ça pour situer un peu l'enseignement dans son volume global.)

Pour ce qui est de l'enseignement d'informatique de la période P2 de première année, donc, nous avons divisé la population d'élèves en deux sous-populations inégales : ceux qui sont entrés par les filières MPI ou MP option info du concours commun ainsi que les admis sur titres après une licence d'informatique, soit au total ~90 élèves, et tous les autres, qui doivent représenter à peu près ~120 élèves. Les premiers ont eu le cours INF110 dont je me suis chargé et dont je parle ici, tandis que les seconds ont eu un cours (INF109) plus général sur l'algorithmique fondamentale et quelques rudiments de la calculabilité (recouvrant notamment une partie de ce que les autres élèves avaient déjà vu en prépa).

Bref, s'agissant de INF110, j'avais à m'occuper de 39 heures d'enseignement (contrôle de connaissances non compris), étalées sur 9 semaines, pour ~90 élèves. Nous avons décidé de séparer ces 39h en 21h de cours magistraux, et 18h de TD+TP lesquels ont été pris en charge par mon collègue Théo Z. Pour des raisons d'organisation de l'emploi du temps global de la première année, il n'était pas possible de regrouper les élèves tous ensemble pendant les cours magistraux, donc j'ai donné deux fois chaque séance (on arrive donc à 42h pour moi, si vous suivez).

De l'opportunité d'enseigner des sujets théoriques

Il faut que je dise ici un mot pour évoquer la question qui revient de façon récurrente dès qu'on parle de dispenser des cours assez « théoriques » (whatever that means) à des élèves majoritairement[#2] futurs ingénieurs. J'avais déjà droit à ce genre de remarques quand j'enseignais l'analyse de Fourier (cf. par exemple ce billet) : à quoi ça sert d'expliquer à des futurs ingénieurs la différence entre la transformée de Fourier dans L¹ et dans L² ? ce n'est pas ça qui va leur servir : de toute façon leur signal sera un ensemble fini de valeurs. Donc inévitablement on peut se demander pourquoi enseigner la calculabilité ou la logique intuitionniste quand ce même temps pourrait être employé à faire des cours de JavaScript et de Python, parce que c'est ça qui va leur servir — ou bien d'IA puisque maintenant tout le monde se rue sur l'IA comme des lemmings sur la falaise.

[#2] Je précise que majoritairement ne signifie pas exclusivement. Même sans parler des cas vraiment exotiques, et il y en a toujours (après tout, j'ai dans ma promo à Normale Sup un camarade qui a décidé que la passion de sa vie c'était le cirque, et qui a donc fait carrière dans les arts du spectacle après une thèse de physique quantique), il y a quand même une proportion, faible mais non complètement négligeable, d'élèves à Télécom qui décident de faire de la recherche plus ou moins théorique, c'est-à-dire de faire une thèse et éventuellement d'en faire carrière. Néanmoins, j'entends bien l'argument selon lequel l'enseignement ne doit pas se construire en fonction des intérêts d'une minorité. Donc ce n'est pas l'argument que j'invoque ici pour justifier l'intérêt de mon cours.

J'avais déjà répondu à cette objection, mais je ne sais pas si ma réponse me satisfait beaucoup. Disons que si un ingénieur n'est pas un chercheur (dont le métier consiste à proposer de nouvelles théories), il n'est pas non plus un technicien (dont le métier consiste à appliquer des techniques existantes) : l'ingénieur est justement là pour faire le pont entre les deux, pour appliquer la théorie à la création de nouvelles techniques ou au perfectionnement de celles qui existent, ce qui implique de bien maîtriser la théorie de son domaine, avec un certain recul sur celle-ci, pas juste comme des recettes de cuisine apprises par cœur. (Je devrais, ici, faire référence à la nouvelle Profession d'Asimov, mais c'est un peu difficile à faire sans divulgâcher ; donc je vais me contenter de dire : lisez-la.)

On se trompe gravement, je pense, en voulant centrer l'enseignement sur ce qui sert (ou plutôt, on se trompe gravement en ne mesurant pas toutes les manières dont quelque chose peut servir) : le but de l'enseignement, quel que soit son niveau, n'est pas principalement, ou en tout cas pas exclusivement, de fournir des outils qui serviront mais aussi des clés de compréhension de phénomènes, des cadres dans lesquels analyser ce à quoi on est confronté. Les outils, ce n'est pas qu'il ne faut pas les apprendre, mais ils ont tendance à être hautement spécifiques à une tâche précise, les outils nécessaires à tel ou tel métier s'apprennent normalement en entrant dans ce métier, ce n'est tout simplement pas le rôle de l'enseignement de former à s'en servir (sauf dans la mesure où ces outils sont extrêmement transverses). S'agissant de l'informatique, donc, on se trompe par exemple en pensant qu'il faut enseigner les langages de programmation qui seront utilisés ensuite : un langage de programmation, ça s'apprend rapidement, l'intérêt de les enseigner n'est pas d'enseigner ce qui servira mais d'enseigner ce qui permet de comprendre les différentes approches[#3] de la programmation et les différentes façon de concevoir une tâche.

[#3] Sur les langages de programmation, ce que je dis c'est que ça n'a, selon moi, aucun intérêt de se dire je vais apprendre/enseigner JavaScript et Python parce que c'est ce qui me/leur servira après ; il faut plutôt se dire je vais viser un échantillon représentatif des différents styles de langages de programmation pour comprendre les différentes approches : un langage bas niveau pour comprendre comment fonctionne la gestion de la mémoire, un langage purement fonctionnel et paresseux pour comprendre comment conceptualiser les tâches par une programmation d'ordre supérieur, un langage orienté objet pour comprendre le concept d'héritage, un langage distribué pour comprendre les difficultés de la programmation asynchrone et la manière dont on les résout, etc.

Donc l'intérêt d'enseigner la calculabilité, ce n'est certainement pas parce que ça va servir (même s'il est certainement utile qu'un ingénieur sache que certaines tâches ne sont pas réalisables algorithmiquement — et qu'en gros toute tentative d'analyser le comportement d'un programme devra reposer sur des heuristiques qui seront fatalement imparfaites), mais aussi parce que cela amène à prendre du recul sur les concepts fondamentaux de l'informatique (la récursion, l'auto-référence, la nature de l'évaluation dans les langages de programmation, la raison pour laquelle on se retrouve si facilement à être Turing-complet par accident — et peut-être aussi le fait que ce n'est pas très pertinent de chercher à l'éviter). À titre d'exemple, s'agissant de l'auto-référence, je dirais que quelqu'un qui a du recul sur la calculabilité et le théorème de récursion de Kleene ne sera absolument pas surpris par le fameux hack de Ken Thompson[#4] (d'ailleurs, Thompson lui-même explique le lien entre les quines et son hack), et c'est pertinent pour pouvoir prétendre maîtriser la sécurité informatique. Je peux dire quelque chose d'analogue pour le typage : ce n'est pas juste que c'est utile de comprendre les bases du typage et du polymorphisme parce que certains langages réellement utilisés en ont, mais c'est aussi nécessaire pour comprendre ce qui se passe (par exemple quand on cache des valeur dans une clôture, quand on passe des valeurs par continuation — ce qui sont des paradigmes de programmation qui servent vraiment).

[#4] Dans Reflections on Trusting Trust, Thompson explique qu'il avait introduit une backdoor dans le programme login, puis modifié le compilateur C pour introduire lui-même cette backdoor si elle ne s'y trouvait pas, puis pour introduire cette backdoor dans le compilateur C lui-même, si bien qu'au final il pouvait recompiler le compilateur avec les sources d'origine et la backdoor persistait dans le binaire. Voilà quelque chose qui, au minimum, ne doit pas surprendre un ingénieur en sécurité informatique.

[Lire la suite…]

Je viens de[#] voir passer sur Twitter⌫𝕏 encore je ne sais quel fait divers retweeté par quelqu'un qui cherchait sans doute à en tirer une conclusion sur notre société. (Je ne sais plus de quoi il était question, mais typiquement le fait divers prend la forme d'une violence commise par ou contre tel ou tel groupe dont on voudrait laisser penser qu'il est sujet ou objet de violences, et la conclusion plus large est quelque chose comme tout va mal.) Ou plutôt, à provoquer une émotion dans laquelle une conclusion éclora sans passer par l'étape de raisonnement.

[#] Enfin, je venais de quand j'ai écrit ce paragraphe. Mais ce billet, parmi beaucoup d'autres à moitié écrits, traînait dans mes cartons virtuels depuis un moment, donc je ne sais même plus à quel moment je fais référence. Peu importe : entre temps j'ai vu passer plein d'autres faits divers tout aussi peu dignes qu'on s'intéresse à eux.

Puisqu'il est question d'émotion, justement, je voudrais dire la mienne contre tout ce qui ressemble aux faits divers : à ceux qui les rapportent, à ceux qui les reproduisent, et à ceux qui, consciemment ou inconsciemment, cherchent à manipuler l'opinion publique avec. (Et je précise que je ne suis pas exempt de ces reproches : c'est justement parce que, sans doute comme tout le monde, je suis moi-même parfois tenté de m'émouvoir d'un fait divers, voire de le « partager » sur les réseaux sociaux, et d'autant plus que le fait divers s'aligne avec mes préconceptions politiques, que je dois travailler pour lutter contre ce poison du cerveau humain, et ce billet est là pour ça.)

Mon reproche contre le concept de fait divers peut être résumé dans l'explication suivante, dont la concision provocatrice retire un peu à la précision, mais qui résume néanmoins de façon assez percutante le cœur du problème :

Si on en parle aux infos, c'est que c'est très atypique.
Si c'est très atypique, c'est que ça n'a aucune importance.

(Il va de soi que je parle là des faits divers — expression française forte utile et que je ne sais d'ailleurs pas traduire en anglais. Un événement de portée géopolitique, par exemple, n'est pas sujet à ce reproche : il est significatif en lui-même, pas en ce qu'il prétend représenter un phénomène plus large.)

Je résume ce résumé par le titre de ce billet (inspiré d'une citation qui, comme toutes les meilleures citations, est apocryphe voire complètement inversée, le pluriel d'anecdote n'est pas données) : le pluriel de fait divers n'est pas statistiques.

Tout fait divers, donc, est un mensonge. Pas parce qu'il est faux (il y en a plein qui sont des légendes urbaines, mais ce n'est pas ça mon propos : admettons pour les besoins de l'argument que les faits soient exacts et fidèlement rapportés), mais en ce qu'il suggère qu'il est représentatif alors qu'il ne l'est pas : s'il était représentatif, il serait banal et on n'en parlerait pas. Donc il ment même s'il dit la vérité. Ce qui est sans doute la meilleure façon de mentir. Pour invoquer une autre citation (qui, pour une fois, n'est pas apocryphe, c'est d'Asimov dans Forward the Foundation) : The closer to the truth, the better the lie, and the truth itself, when it can be used, is the best lie.

Le fait divers, donc, vise à manipuler notre émotion. C'est un défaut du cerveau humain que les statistiques n'arrivent pas facilement à susciter notre émotion. (Ou alors il faut pour ça les tourner sous une forme trompeuse : les phrases du style toutes les X minutes, en France, <telle chose se produit> sont une manipulation pour donner aux statistiques la même coloration émotionnelle que les faits divers[#2].) Et aussi que les émotions sont si puissantes pour provoquer une réaction de notre part. Nous avons besoin de faits concrets, pas de chiffres.

[#2] Bien garder ça à l'esprit : si quelqu'un vous dit qu'il y a <tant> de <tel fait> par an en France, c'est peut-être vrai et honnête ; mais si on vous dit que <tel fait> se produit toutes les <tant> de minutes en France, c'est toujours un mensonge même si le chiffre est vrai : c'est un mensonge en ce que c'est une manipulation pour que le chiffre paraisse plus important qu'il l'est. Parce qu'il n'y a tout simplement aucune raison légitime de tourner une fréquence sous cette forme.

Je ne dis pas que les statistiques ne peuvent pas mentir, bien sûr, et d'ailleurs je viens à l'instant de donner une manière de les manipuler. (Là aussi vous vous doutez bien qu'il y a une fameuse citation apocryphe pour nous le rappeler.) Mais les statistiques ont au moins en principe le pouvoir de dire quelque chose de vrai et de représentatif, ce que le fait divers n'a pas. Les statistiques traduisent parfois une vérité collective intéressante : le fait divers ne le font jamais.

L'exemple le plus flagrant de la manipulation de nos émotions par ce qui n'est pas statistiquement représentatif est celui des actes terroristes et de l'importance qu'on leur accorde. (Je renvoie à cette vidéo plutôt bien faite pour un développement plus poussé de ce point.) La réalité statistique du terrorisme, dans le monde occidental, est qu'il est insignifiant : si vous vivez en France, vous avez moins de 0.01% de chances[#3] de mourir dans un attentat terroriste. Or les médias traitent chaque acte terroriste comme un sujet majeur, ce qui est exactement ce que recherchent les terroristes, et ce qui donne à ces derniers une victoire retentissante à chaque fois, en ce qu'ils réussissent effectivement, avec cette complicité des médias, à terroriser des gens qui, regardant ces infos anxiogènes, sont souvent convaincus qu'ils sont eux-mêmes menacés[#4] par le phénomène alors qu'ils ont grosso modo autant de chances de mourir, disons, tués par une vache. J'ajoute, puisque c'est aussi le propos de ce billet, que les politiques préconisant une réponse forte[#5] au terrorisme sont les alliés objectifs[#6] des terroristes : les premiers fournissent aux seconds l'attention et la terreur qu'ils recherchent, et les seconds fournissent aux premiers leur agenda politique (donc le pouvoir qui va avec).

[#3] Estimation passablement conservatrice : en France, il semble qu'il y ait eu moins de 600 morts de terrorisme au cours des 50 dernières années, sur environ 30 millions de morts au total pendant ce demi-siècle, donc les chances de mourir du terrorisme, en France, seraient plutôt autour de 0.002%. Mais pour d'autres pays européens, 0.01% est plus représentatif, et si on prend la pire année pour la France, on monte à presque… 0.03% (pour être bien clair, ça veut dire en gros que si chaque année répétait celle des attentats de 2015, la probabilité d'un Français générique de mourir du terrorisme sur toute votre vie serait autour de 0.03% ; je ne parle pas de 0.03% par an, ce qui serait beaucoup plus, mais plutôt de 0.0003% par an, soit 0.03% sur toute une vie, en prenant le pire chiffre des 50 dernières années).

[#4] De même qu'on a des règles qui imposent que toute pub pour de la bouffe soit accompagnée d'une injonction un chouïa paternaliste, je me dis parfois qu'il ne serait pas mal d'obliger tout reportage ou sujet d'actualité mentionnant le terrorisme d'être accompagné d'un message disant substantiellement : ce sujet ne vous concerne pas : vous n'allez pas mourir du terrorisme, vous allez très probablement mourir du cancer ou d'un accident cardiaque ou vasculaire.

[#5] Réponse forte, en fait, généralement constituée d'un théâtre de mesures absolument dénuées d'effets réels contre le terrorisme : il s'agit d'une comédie sécuritaire dont le but est simplement de rappeler au grand public que le sujet est censé être Important et que des gens prennent des Mesures.

[#6] J'aime bien rappeler que quand deux groupes se font publiquement et ostensiblement la guerre, souvent ces deux groupes sont des alliés objectifs, en ce que les deux ont en fait un but commun, qui est de faire croire que le sujet sur lequel ils se font la guerre est un sujet grave, important et central, que l'attention de l'opinion doit se focaliser dessus (ou bien il peut s'agir de cimenter chacun des deux groupes dans l'essentialisme qui les définit). Cette analyse est parfois simpliste (dans une vraie guerre, ce sont surtout les fractions les plus radicales des deux belligérants qui sont alliées, ça ne veut pas dire que toute la guerre est factice), mais il est au moins bon de l'avoir à l'esprit quand on nous présente un débat entre des positions prétendument « opposées ». En l'occurrence, l'alliance objective entre terroristes et adeptes de la manière forte contre le terrorisme me paraît assez évidente.

Certains sont sans doute tentés de répondre sur l'importance des symboles, ou quelque chose comme ça. (En mode avocat du diable : quelle sordide façon de décerner l'importance des sujets que de compter le nombre total de morts et de ne regarder que ça ! ce sont les symboles qui comptent.) Or c'est un peu le problème, justement : les terroristes essayent de nous manipuler par la portée symbolique de leur acte, et accepter de la reconnaître, accepter de s'en émouvoir plus que ce que sa réalité statistique extrêmement mineure le justifie, c'est justement entrer dans leur jeu. J'ai parlé ici du terrorisme, mais c'est globalement le problème des faits divers : la naissance d'une émotion collective qui, même si elle n'est pas provoquée délibérément, sera exploitée par les politiques. C'est le principe du un fait divers, une loi (la loi n'est généralement même pas la finalité de la manœuvre — parfois elle l'est si c'est une loi liberticide, mais en général le but de la gesticulation est simplement de récupérer du capital de sympathie politique sur l'air de voyez, moi je m'occupe de ce problème dont personne ne s'occupait jusqu'ici).

Et cette émotion collective vient avec une injonction de la ressentir : qui oserait répondre à l'émotion suscitée par le viol du petit Machin (7 ans) par le cousin de sa belle-tante en disant mais on s'en fout, de ce fait-divers sordide ! ? Si vous dites ça, on vous traite de monstre, d'insensible, de scientifique déshumanisé qui ne sait lire le monde que derrière de froides statistiques, etc. (et si on tient un discours de ce genre face à un acte terroriste, la réaction est encore pire[#7]). Les gens qui disent ça confondent le fait de ressentir une émotion (oui, généralement, je suis désolé d'apprendre ce qui est arrivé au petit Machin) et le fait d'en faire un spectacle public d'importance nationale.

[#7] Essayez un peu de défendre la position selon laquelle la réponse à faire au terrorisme c'est l'ignorer complètement, et pourrez mesurer, aux réactions indignées que cela provoque, l'étendue de la victoire psychologique des terroristes dans leur bataille pour l'attention. (Notons que je ne défends pas cette position : je pense qu'il y a des choses qu'on peut faire contre le terrorisme, mais elles sont plutôt de l'ordre de l'infiltration. Mais ce n'est ni le propos de ce billet ni quelque chose sur quoi je pense être compétent, donc je ne développe pas.)

Je le sais parce que je tiens de feu mon papa cette attitude de rejet du fait divers et d'attachement aux statistiques, et je voyais bien les réactions irritées voire véritablement courroucées que cette attitude pouvait provoquer. Il est vrai qu'il ne cachait pas son mépris pour tout ce qui est anecdotique, et qu'il demandait bien ostensiblement, et avec un mépris parfois un peu provocateur, la fréquence de n'importe quel fait qu'on lui rapportait. (Et il est aussi vrai qu'il n'était pas toujours parfaitement cohérent avec ses propres principes.)

Encore une fois, je ne prétends certainement pas être moi-même exempt de reproches : il m'est certainement arrivé de rapporter, propager ou amplifier des faits divers (voire de les déformer) : moi aussi j'ai des émotions et moi aussi on peut me manipuler avec elles, et le terrorisme y parvient dans une certaine mesure. Ce que je décris ici est surtout une discipline que j'essaie de m'imposer (et si je cherche à me l'imposer, c'est bien parce qu'elle ne m'est pas naturelle, et j'échoue souvent à obéir à mes règles). Il ne s'agit pas de ne jamais évoquer de fait divers, mais au moins de faire la démarche de me demander, à chaque fois que j'en rencontre un, quelque chose comme ceci :

Est-ce que ce fait est représentatif en plus d'être matériellement exact ? De quoi est-il représentatif exactement ?
Est-ce que je dispose des éléments de contexte suffisants pour interpréter le fait rapporté ? Quelle sélection des faits a été apportée par la narration que j'ai reçue ? Quels sont les biais de la source dont je le tiens ?
Qui a sélectionné le fait rapporté parmi d'autres qui sont semblables ? Qui a choisi de parler précisément de celui-là et pas d'un autre ? Quelle est l'intention derrière ce choix, qui n'est pas neutre ?
Est-ce que je peux trouver des statistiques sur le phénomène qui semble impliqué par le fait rapporté ? Que me disent ces statistiques sur l'importance du phénomène ? Que me disent-elles sur la typicité du fait rapporté ?
Quelle émotion fait naître en moi le fait rapporté ? Dans quelle mesure cette émotion est-elle provoquée ou amplifiée par la narration que j'ai reçue ? Cette émotion sert-elle des intérêts autres que ceux de l'information pure ? Lesquels ?

La liste n'est pas exhaustive, évidemment (et je mélange là des questions qui visent à stimuler différentes sortes de scepticisme, dont certains s'appliquent bien plus largement qu'aux faits divers[#8]). Mais il me semble que le débat public serait beaucoup plus sain si chacun faisait au moins un effort honnête de pratiquer cette petite gymnastique à chaque fois qu'il s'agit de cliquer sur le bouton reposter d'un message qui nous émeut.

[#8] Et bien sûr tout ceci s'ajoute au scepticisme dont il est pertinent de faire preuve sur les faits eux-mêmes (viennent-ils d'une source fiable ? les images ne sont-elles pas générées par IA ? etc.).

Tout propos catégorique mérite bien sûr d'être nuancé (y compris cette phrase-ci). Il y a quand même des cas où un fait divers peut nous apprendre quelque chose.

D'abord, quand le fait divers est représentatif et typique d'un phénomène qui est effectivement statistiquement pertinent : il n'est tout de même pas vrai que tout ce qui est relaté aux infos (ou propagé sur les réseaux sociaux) est atypique, et même s'il est atypique il peut l'être pour des raisons orthogonales à ce qui le rend significatif (par exemple si une célébrité est victime d'un phénomène banal, ça rend le fait divers newsworthy tout en restant représentatif du phénomène banal). On peut admettre qu'un fait divers serve, dans un discours, à illustrer un phénomène statistique, à rendre plus « parlantes » les statistiques. Mais ceci n'excuse en rien de ne pas chercher les statistiques.

Ensuite, quand un fait divers montre que quelque chose est possible alors qu'on pensait que c'était simplement impossible (ou que quelque chose existe alors qu'on n'y avait jamais pensé) : les statistiques sont alors par définition impossibles à faire puisqu'on a affaire à un hapax. La réaction saine, alors, est de se dire tiens, il est peut-être pertinent de s'intéresser à ce phénomène à l'avenir, par exemple pour chercher à savoir s'il est en train d'apparaître ou si c'est un événement qui se produit une fois tous les millions d'années.

Et bien sûr, une morale à tirer de tout ça c'est l'importance de l'enseignement scientifique (et notamment des stats de base et des ordres de grandeur). Il me semble indispensable que tout citoyen sache calculer un ordre de grandeur pour répondre à un problème du style : si ce problème, qui touche un groupe de personnes dont je fais partie et représentant environ 1% de la population, se produit environ une fois par mois en France et affecte une vingtaine de personnes à chaque fois, au bout de combien de temps dois-je moi-même m'attendre à en être victime ? (réponse en supposant une uniforme distribution[#9] : 70 millions × 1% / 20 × 1 mois ≈ 3000 ans) ou, en plus simple, si une personne par minute est victime de tel phénomène en France, au bout de combien de temps dois-je moi-même m'attendre à en être victime ? (réponse en supposant une uniforme distribution : 70 millions de minutes ≈ 130 ans). Je pourrais raconter des anecdotes de gens qui sont incapables de convertir de tête 70 millions de minutes en 130 ans (au moins approximativement !) ou échoueraient à répondre à ce genre de questions pour telle ou telle autre raison, mais ce serait, justement, des anecdotes destinées à provoquer votre émotion indignée : pour rester dans le sujet, je voudrais plutôt voir des statistiques sérieuses à cet égard.

[#9] Bien sûr, l'hypothèse d'égale distribution est critiquable et doit être critiquée, à l'aune du phénomène particulier. C'est justement ce qu'un enseignement scientifique correct doit fournir : des clés pour utiliser, formuler et critiquer ce genre d'hypothèse.

L'autre chose importante à mettre dans les mains de tous les citoyens, outre une culture scientifique de base, c'est l'accès à des statistiques claires et de qualité contre lesquelles comparer leurs impressions tirées des anecdotes sur le monde.

J'aime donner l'exemple suivant : beaucoup de gens sont persuadés (et pour le coup ce n'est pas anecdotique, j'avais trouvé des statistiques sérieuses à l'appui de cette affirmation, même si je ne les retrouve plus) que le monde est beaucoup plus violent qu'autrefois. Cette impression résulte largement de l'information immédiate et « brute » à laquelle nous avons accès. Or selon à peu près n'importe quelle métrique raisonnable, nous vivons à une époque tout à fait paisible, et selon certaines, même, possiblement la plus paisible que l'Humanité ait jamais connue. Voyez par exemple ce graphe pour ce qui est de la mortalité par guerre, et cette estimation ainsi que celle-ci des homicides, pour des perspectives historiques plus larges. Ça ne veut certainement pas dire que le monde n'est pas bourré de problèmes, ni que la violence n'en est pas un sérieux, ni qu'elle n'est pas en train de ressurgir (et on peut certainement trouver des statistiques bien plus nuancées que celles que je viens de lier), mais l'impression émotionnelle qui résulte de la consommation de l'actualité n'en est pas moins profondément trompeuse.

Donc j'aime bien faire la pub, et j'en profite pour le faire ici, pour le site Web Our World in Data, qui avec Wikipédia (et malgré toutes les imperfections de l'un ou de l'autre) est un de ceux qu'il est le plus urgent de mettre entre toutes les mains et d'encourager tout le monde à consulter comme source d'information raisonnablement honnête, généralement fiable et typiquement facile à comprendre.

Je conclus par la remarque suivante tendant à justifier le titre de ce billet sous un angle légèrement différent : non seulement l'accumulation d'anecdotes ne va pas conduire à une représentation mentale fidèle du monde parce que chacune de ces anecdotes est atypique, mais aussi, et même en l'absence de volonté de manipulation émotionnelle, même leur agrégation n'est toujours pas représentative. Ceci résulte notamment d'une asymétrie fondamentale de l'information : les mauvaises nouvelles ont tendance à venir de façon soudaine (ceci ne vaut pas que pour les faits divers : guerres et catastrophes arrivent de façon soudaine), et l'actualité est dominée par ce qui est soudain et nouveau ; tandis que les bonnes nouvelles sont presque toujours lentes et incrémentales (les informations du style cette année l'espérance de vie à la naissance a de nouveau augmenté d'un mois ou le nombre de morts par homicide continue sa baisse progressive ne font pas les actualités).

2026	Jan 2026
2025	Jan 2025	Feb 2025	Mar 2025	Apr 2025	May 2025	Jun 2025	Jul 2025	Aug 2025	Sep 2025	Oct 2025	Nov 2025	Dec 2025
2024	Jan 2024	Feb 2024	Mar 2024	Apr 2024	May 2024	Jun 2024	Jul 2024	Aug 2024	Sep 2024	Oct 2024	Nov 2024	Dec 2024
2023	Jan 2023	Feb 2023	Mar 2023	Apr 2023	May 2023	Jun 2023	Jul 2023	Aug 2023	Sep 2023	Oct 2023	Nov 2023	Dec 2023
2022	Jan 2022	Feb 2022	Mar 2022	Apr 2022	May 2022	Jun 2022	Jul 2022	Aug 2022	Sep 2022	Oct 2022	Nov 2022	Dec 2022
2021	Jan 2021	Feb 2021	Mar 2021	Apr 2021	May 2021	Jun 2021	Jul 2021	Aug 2021	Sep 2021	Oct 2021	Nov 2021	Dec 2021
2020	Jan 2020	Feb 2020	Mar 2020	Apr 2020	May 2020	Jun 2020	Jul 2020	Aug 2020	Sep 2020	Oct 2020	Nov 2020	Dec 2020
2019	Jan 2019	Feb 2019	Mar 2019	Apr 2019	May 2019	Jun 2019	Jul 2019	Aug 2019	Sep 2019	Oct 2019	Nov 2019	Dec 2019
2018	Jan 2018	Feb 2018	Mar 2018	Apr 2018	May 2018	Jun 2018	Jul 2018	Aug 2018	Sep 2018	Oct 2018	Nov 2018	Dec 2018
2017	Jan 2017	Feb 2017	Mar 2017	Apr 2017	May 2017	Jun 2017	Jul 2017	Aug 2017	Sep 2017	Oct 2017	Nov 2017	Dec 2017
2016	Jan 2016	Feb 2016	Mar 2016	Apr 2016	May 2016	Jun 2016	Jul 2016	Aug 2016	Sep 2016	Oct 2016	Nov 2016	Dec 2016
2015	Jan 2015	Feb 2015	Mar 2015	Apr 2015	May 2015	Jun 2015	Jul 2015	Aug 2015	Sep 2015	Oct 2015	Nov 2015	Dec 2015
2014	Jan 2014	Feb 2014	Mar 2014	Apr 2014	May 2014	Jun 2014	Jul 2014	Aug 2014	Sep 2014	Oct 2014	Nov 2014	Dec 2014
2013	Jan 2013	Feb 2013	Mar 2013	Apr 2013	May 2013	Jun 2013	Jul 2013	Aug 2013	Sep 2013	Oct 2013	Nov 2013	Dec 2013
2012	Jan 2012	Feb 2012	Mar 2012	Apr 2012	May 2012	Jun 2012	Jul 2012	Aug 2012	Sep 2012	Oct 2012	Nov 2012	Dec 2012
2011	Jan 2011	Feb 2011	Mar 2011	Apr 2011	May 2011	Jun 2011	Jul 2011	Aug 2011	Sep 2011	Oct 2011	Nov 2011	Dec 2011
2010	Jan 2010	Feb 2010	Mar 2010	Apr 2010	May 2010	Jun 2010	Jul 2010	Aug 2010	Sep 2010	Oct 2010	Nov 2010	Dec 2010
2009	Jan 2009	Feb 2009	Mar 2009	Apr 2009	May 2009	Jun 2009	Jul 2009	Aug 2009	Sep 2009	Oct 2009	Nov 2009	Dec 2009
2008	Jan 2008	Feb 2008	Mar 2008	Apr 2008	May 2008	Jun 2008	Jul 2008	Aug 2008	Sep 2008	Oct 2008	Nov 2008	Dec 2008
2007	Jan 2007	Feb 2007	Mar 2007	Apr 2007	May 2007	Jun 2007	Jul 2007	Aug 2007	Sep 2007	Oct 2007	Nov 2007	Dec 2007
2006	Jan 2006	Feb 2006	Mar 2006	Apr 2006	May 2006	Jun 2006	Jul 2006	Aug 2006	Sep 2006	Oct 2006	Nov 2006	Dec 2006
2005	Jan 2005	Feb 2005	Mar 2005	Apr 2005	May 2005	Jun 2005	Jul 2005	Aug 2005	Sep 2005	Oct 2005	Nov 2005	Dec 2005
2004	Jan 2004	Feb 2004	Mar 2004	Apr 2004	May 2004	Jun 2004	Jul 2004	Aug 2004	Sep 2004	Oct 2004	Nov 2004	Dec 2004
2003					May 2003	Jun 2003	Jul 2003	Aug 2003	Sep 2003	Oct 2003	Nov 2003	Dec 2003