David Madore's WebLog: 2024-04

Vous êtes sur le blog de David Madore, qui, comme le reste de ce site web, parle de tout et de n'importe quoi (surtout de n'importe quoi, en fait), des maths à la moto et ma vie quotidienne, en passant par les langues, la politique, la philo de comptoir, la géographie, et beaucoup de râleries sur le fait que les ordinateurs ne marchent pas, ainsi que d'occasionnels rappels du fait que je préfère les garçons, et des petites fictions volontairement fragmentaires que je publie sous le nom collectif de fragments littéraires gratuits. • Ce blog eut été bilingue à ses débuts (certaines entrées étaient en anglais, d'autres en français, et quelques unes traduites dans les deux langues) ; il est maintenant presque exclusivement en français, mais je ne m'interdis pas d'écrire en anglais à l'occasion. • Pour naviguer, sachez que les entrées sont listées par ordre chronologique inverse (i.e., la plus récente est en haut). Cette page-ci rassemble les entrées publiées en avril 2024 : il y a aussi un tableau par mois à la fin de cette page, et un index de toutes les entrées. Certaines de mes entrées sont rangées dans une ou plusieurs « catégories » (indiqués à la fin de l'entrée elle-même), mais ce système de rangement n'est pas très cohérent. Le permalien de chaque entrée est dans la date, et il est aussi rappelé avant et après le texte de l'entrée elle-même.

You are on David Madore's blog which, like the rest of this web site, is about everything and anything (mostly anything, really), from math to motorcycling and my daily life, but also languages, politics, amateur(ish) philosophy, geography, lots of ranting about the fact that computers don't work, occasional reminders of the fact that I prefer men, and some voluntarily fragmentary fictions that I publish under the collective name of gratuitous literary fragments. • This blog used to be bilingual at its beginning (some entries were in English, others in French, and a few translated in both languages); it is now almost exclusively in French, but I'm not ruling out writing English blog entries in the future. • To navigate, note that the entries are listed in reverse chronological order (i.e., the most recent is on top). This page lists the entries published in April 2024: there is also a table of months at the end of this page, and an index of all entries. Some entries are classified into one or more “categories” (indicated at the end of the entry itself), but this organization isn't very coherent. The permalink of each entry is in its date, and it is also reproduced before and after the text of the entry itself.

[Index of all entries / Index de toutes les entréesLatest entries / Dernières entréesXML (RSS 1.0) • Recent comments / Commentaires récents]

Entries published in April 2024 / Entrées publiées en avril 2024:

↓Entry #2791 [older| permalink|newer] / ↓Entrée #2791 [précédente| permalien|suivante] ↓

(mardi)

Débriefing de mon cours Logique et Fondements de l'Informatique

J'avais expliqué il y a quelques mois que je m'étais engagé à monter un nouveau cours d'informatique théorique (ou faut-il dire de maths de l'informatique ?) pour certains élèves de première année à Télécom PlusÀParis, intitulé Logique et Fondements de l'Informatique (nom de code interne : INF110). (J'avais d'ailleurs publié un premier jeu de transparents dans de billet.) L'occurrence 2023–2024 de ce cours a eu lieu de à , le contrôle le , et maintenant (enfin, quelques mois après) que j'ai à la fois rendu les notes finales et reçu les retours (anonymes) des étudiants je suis en mesure d'en faire un premier bilan. L'idée de ce billet n'est pas tellement d'entrer dans le fond du sujet (même si je ne peux pas ne pas en parler du tout), à ce sujet voir plutôt les deux paragraphes ci-dessous, mais de parler au niveau méta : pourquoi ce cours, pourquoi ce sujet, comment je l'ai organisé et préparé, ce qui a bien marché et ce qui n'a pas bien marché. Le but est de me permettre à moi-même de faire le point, et donc de réfléchir à ce que je veux changer l'an prochain, et aussi de préparer un exposé où je dois raconter tout ça (cf. la fin du présent billet).

☞ Pour le fond du sujet, je renvoie notamment à ce billet sur la correspondance de Curry-Howard et à celui-ci sur la réalisabilité propositionnelle, qui sont largement adaptés de certains bouts de mon cours, même si la présentation est différente et qu'ils vont plus loin (surtout le second). Je peux aussi renvoyer à ce billet sur des sujets variés en vrac sur lesquels j'ai appris des choses en préparant ce cours. Enfin, je fais un lien vers ce billet sur les degrés de Turing et leur généralisation parce qu'il touche à des questions adjacentes, même si je n'ai pas fait plus qu'évoquer la définition de degré de Turing (ordinaire) dans mon cours.

☞ Pour ce qui est des documents pédagogiques accompagnant le cours, voici quelques liens (dont, malgré ma passion pour la stabilité des URL, je ne garantis pas qu'ils seront pérennes, parce que je ne sais pas comment je vais les réorganiser à l'avenir). D'abord le PDF des transparents (qui est la concaténation idiote de trois parties inégales : ① calculabilité, ② typage simple et calcul propositionnel et ③ introduction aux quantificateurs ; j'ai aussi fait une version « imprimable » des transparents : , et ). Les exercices d'entraînement sont : ici sans corrigé et ici avec corrigé. Et le sujet du contrôle est ici sans corrigé et ici avec corrigé. Et si des gens sont intéressés par le source de tout ça, le dépôt Git est ici.

Avertissement usuel : même si j'évoque ici mon travail d'enseignant-chercheur à Télécom, je dois rappeler que, dans ce billet comme ailleurs sur ce blog, je m'exprime à titre purement personnel et que les avis et opinions que je peux exprimer ici (ou ailleurs) sont juste les miens et n'engagent en aucun cas mon employeur (ni qui que ce soit d'autre que moi, et d'ailleurs ils ne m'engagent même pas moi vu que que je me réserve le droit d'en changer à tout moment et sans prévenir). J'ajoute que si vous faites partie des personnes qui ont besoin d'un tel avertissement, il vous est interdit de lire la suite de ce billet.

Plan du billet

Le contexte

Comme je l'ai expliqué dans les billets déjà liés ci-dessus (celui-ci et celui-là), la France a récemment créé une filière MPI (maths, physique et informatique) dans ses classes préparatoires scientifiques[#]. En particulier, les élèves entrant à Télécom par le concours commun peuvent arriver avec trois niveaux de formation en informatique : le socle commun MP/PC (où il n'y a pas grand-chose en info), l'option informatique en MP (qui existait déjà), et la nouvelle filière MPI (qui va encore plus loin). Les programmes de toutes ces filières sont trouvables par exemple sur ce site). Ceci nous a imposé une réforme de nos enseignements en première année : jusqu'à l'été 2023 notre première année était complètement uniforme (en gros, tout le monde avait les mêmes cours, le choix d'une filière de spécialisation se faisant en seconde année), mais ce mode de fonctionnement devenait intenable, au moins pour ce qui est de l'informatique, avec de telles différences de formation à l'entrée (si on s'adapte à ceux qui en ont fait le moins, ceux qui en ont fait plus s'ennuient, et si on s'adapte à ceux qui en ont fait le plus, ceux qui en ont fait le moins sont largués).

[#] Au niveau de la reconnaissance de l'informatique comme une science à part entière, il y a aussi eu création d'une agrégation d'informatique pour le recrutement des enseignants alors que l'informatique était jusqu'alors considérée comme une option de l'agrégation de mathématiques. Et, un peu avant, des changements au niveau lycée avec la création d'une spécialité NSI, c'est-à-dire numérique et sciences informatiques, mais ça ne me concerne que beaucoup plus indirectement : de ce que je comprends, à cause de la limitation à deux spécialités en terminale, la (grande ?) majorité des élèves de prépa, y compris MPI, n'ont pas suivi cette spécialité NSI en terminale, mais bien maths et physique-chimie.

Mais ce n'est pas, en fait, qu'une question de niveau en entrée : les élèves ayant choisi la filière MPI semblent avoir des attentes et des intérêts différents de ceux de la filière MP (même « option info »), au sens où ils semblent généralement plus intéressés par l'informatique pour elle-même et pas juste comme un outil dans un travail d'ingénieur (parce qu'évidemment tout le monde utilise l'informatique de nos jours). Et un des buts de la réforme que nous avons mise en place est de rentre Télécom plus attirante pour les préparationnaires vraiment intéressés par l'informatique, avec notamment l'idée qu'il ne faut pas qu'ils s'ennuient en cours.

La première année à Télécom est (maintenant) divisée en quatre périodes. Pour ce qui est de l'enseignement d'informatique, voici comment nous avons organisé l'année. La période P1 (septembre–octobre) a été dédiée à une introduction générale à la programmation, du matériel au haut niveau, tandis que les élèves venus de la filière MPI (et uniquement eux) ont un cours spécifique sur la compilation. La période P2 (novembre–janvier) est consacrée à la théorie de l'informatique, et c'est celle qui me concerne et dont je vais reparler. La période P3 (février–avril) propose le choix entre différents paradigmes de programmation. Et la période P4 (avril–juin) est consacrée aux réseaux. Sur chacune de ces périodes, les élèves ont environ 40h d'informatique (sauf en P3, moitié moins), c'est-à-dire environ 4h½ par semaine pendant les 9 semaines que dure la période. (Pendant le même temps, les élèves ont bien sûr aussi des cours dans les autres domaines : maths, physique+électronique, sciences économiques et sociales, langues et humanités ; plus des projets et stages variés, notamment entre les périodes. Je dis ça pour situer un peu l'enseignement dans son volume global.)

Pour ce qui est de l'enseignement d'informatique de la période P2 de première année, donc, nous avons divisé la population d'élèves en deux sous-populations inégales : ceux qui sont entrés par les filières MPI ou MP option info du concours commun ainsi que les admis sur titres après une licence d'informatique, soit au total ~90 élèves, et tous les autres, qui doivent représenter à peu près ~120 élèves. Les premiers ont eu le cours INF110 dont je me suis chargé et dont je parle ici, tandis que les seconds ont eu un cours (INF109) plus général sur l'algorithmique fondamentale et quelques rudiments de la calculabilité (recouvrant notamment une partie de ce que les autres élèves avaient déjà vu en prépa).

Bref, s'agissant de INF110, j'avais à m'occuper de 39 heures d'enseignement (contrôle de connaissances non compris), étalées sur 9 semaines, pour ~90 élèves. Nous avons décidé de séparer ces 39h en 21h de cours magistraux, et 18h de TD+TP lesquels ont été pris en charge par mon collègue Théo Z. Pour des raisons d'organisation de l'emploi du temps global de la première année, il n'était pas possible de regrouper les élèves tous ensemble pendant les cours magistraux, donc j'ai donné deux fois chaque séance (on arrive donc à 42h pour moi, si vous suivez).

De l'opportunité d'enseigner des sujets théoriques

Il faut que je dise ici un mot pour évoquer la question qui revient de façon récurrente dès qu'on parle de dispenser des cours assez « théoriques » (whatever that means) à des élèves majoritairement[#2] futurs ingénieurs. J'avais déjà droit à ce genre de remarques quand j'enseignais l'analyse de Fourier (cf. par exemple ce billet) : à quoi ça sert d'expliquer à des futurs ingénieurs la différence entre la transformée de Fourier dans L¹ et dans L² ? ce n'est pas ça qui va leur servir : de toute façon leur signal sera un ensemble fini de valeurs. Donc inévitablement on peut se demander pourquoi enseigner la calculabilité ou la logique intuitionniste quand ce même temps pourrait être employé à faire des cours de JavaScript et de Python, parce que c'est ça qui va leur servir — ou bien d'IA puisque maintenant tout le monde se rue sur l'IA comme des lemmings sur la falaise.

[#2] Je précise que majoritairement ne signifie pas exclusivement. Même sans parler des cas vraiment exotiques, et il y en a toujours (après tout, j'ai dans ma promo à Normale Sup un camarade qui a décidé que la passion de sa vie c'était le cirque, et qui a donc fait carrière dans les arts du spectacle après une thèse de physique quantique), il y a quand même une proportion, faible mais non complètement négligeable, d'élèves à Télécom qui décident de faire de la recherche plus ou moins théorique, c'est-à-dire de faire une thèse et éventuellement d'en faire carrière. Néanmoins, j'entends bien l'argument selon lequel l'enseignement ne doit pas se construire en fonction des intérêts d'une minorité. Donc ce n'est pas l'argument que j'invoque ici pour justifier l'intérêt de mon cours.

J'avais déjà répondu à cette objection, mais je ne sais pas si ma réponse me satisfait beaucoup. Disons que si un ingénieur n'est pas un chercheur (dont le métier consiste à proposer de nouvelles théories), il n'est pas non plus un technicien (dont le métier consiste à appliquer des techniques existantes) : l'ingénieur est justement là pour faire le pont entre les deux, pour appliquer la théorie à la création de nouvelles techniques ou au perfectionnement de celles qui existent, ce qui implique de bien maîtriser la théorie de son domaine, avec un certain recul sur celle-ci, pas juste comme des recettes de cuisine apprises par cœur. (Je devrais, ici, faire référence à la nouvelle Profession d'Asimov, mais c'est un peu difficile à faire sans divulgâcher ; donc je vais me contenter de dire : lisez-la.)

On se trompe gravement, je pense, en voulant centrer l'enseignement sur ce qui sert (ou plutôt, on se trompe gravement en ne mesurant pas toutes les manières dont quelque chose peut servir) : le but de l'enseignement, quel que soit son niveau, n'est pas principalement, ou en tout cas pas exclusivement, de fournir des outils qui serviront mais aussi des clés de compréhension de phénomènes, des cadres dans lesquels analyser ce à quoi on est confronté. Les outils, ce n'est pas qu'il ne faut pas les apprendre, mais ils ont tendance à être hautement spécifiques à une tâche précise, les outils nécessaires à tel ou tel métier s'apprennent normalement en entrant dans ce métier, ce n'est tout simplement pas le rôle de l'enseignement de former à s'en servir (sauf dans la mesure où ces outils sont extrêmement transverses). S'agissant de l'informatique, donc, on se trompe par exemple en pensant qu'il faut enseigner les langages de programmation qui seront utilisés ensuite : un langage de programmation, ça s'apprend rapidement, l'intérêt de les enseigner n'est pas d'enseigner ce qui servira mais d'enseigner ce qui permet de comprendre les différentes approches[#3] de la programmation et les différentes façon de concevoir une tâche.

[#3] Sur les langages de programmation, ce que je dis c'est que ça n'a, selon moi, aucun intérêt de se dire je vais apprendre/enseigner JavaScript et Python parce que c'est ce qui me/leur servira après ; il faut plutôt se dire je vais viser un échantillon représentatif des différents styles de langages de programmation pour comprendre les différentes approches : un langage bas niveau pour comprendre comment fonctionne la gestion de la mémoire, un langage purement fonctionnel et paresseux pour comprendre comment conceptualiser les tâches par une programmation d'ordre supérieur, un langage orienté objet pour comprendre le concept d'héritage, un langage distribué pour comprendre les difficultés de la programmation asynchrone et la manière dont on les résout, etc.

Donc l'intérêt d'enseigner la calculabilité, ce n'est certainement pas parce que ça va servir (même s'il est certainement utile qu'un ingénieur sache que certaines tâches ne sont pas réalisables algorithmiquement — et qu'en gros toute tentative d'analyser le comportement d'un programme devra reposer sur des heuristiques qui seront fatalement imparfaites), mais aussi parce que cela amène à prendre du recul sur les concepts fondamentaux de l'informatique (la récursion, l'auto-référence, la nature de l'évaluation dans les langages de programmation, la raison pour laquelle on se retrouve si facilement à être Turing-complet par accident — et peut-être aussi le fait que ce n'est pas très pertinent de chercher à l'éviter). À titre d'exemple, s'agissant de l'auto-référence, je dirais que quelqu'un qui a du recul sur la calculabilité et le théorème de récursion de Kleene ne sera absolument pas surpris par le fameux hack de Ken Thompson[#4] (d'ailleurs, Thompson lui-même explique le lien entre les quines et son hack), et c'est pertinent pour pouvoir prétendre maîtriser la sécurité informatique. Je peux dire quelque chose d'analogue pour le typage : ce n'est pas juste que c'est utile de comprendre les bases du typage et du polymorphisme parce que certains langages réellement utilisés en ont, mais c'est aussi nécessaire pour comprendre ce qui se passe (par exemple quand on cache des valeur dans une clôture, quand on passe des valeurs par continuation — ce qui sont des paradigmes de programmation qui servent vraiment).

[#4] Dans Reflections on Trusting Trust, Thompson explique qu'il avait introduit une backdoor dans le programme login, puis modifié le compilateur C pour introduire lui-même cette backdoor si elle ne s'y trouvait pas, puis pour introduire cette backdoor dans le compilateur C lui-même, si bien qu'au final il pouvait recompiler le compilateur avec les sources d'origine et la backdoor persistait dans le binaire. Voilà quelque chose qui, au minimum, ne doit pas surprendre un ingénieur en sécurité informatique.

↑Entry #2791 [older| permalink|newer] / ↑Entrée #2791 [précédente| permalien|suivante] ↑

↓Entry #2790 [older| permalink|newer] / ↓Entrée #2790 [précédente| permalien|suivante] ↓

(samedi)

Le pluriel de fait divers n'est pas statistiques

Je viens de[#] voir passer sur Twitter⌫𝕏 encore je ne sais quel fait divers retweeté par quelqu'un qui cherchait sans doute à en tirer une conclusion sur notre société. (Je ne sais plus de quoi il était question, mais typiquement le fait divers prend la forme d'une violence commise par ou contre tel ou tel groupe dont on voudrait laisser penser qu'il est sujet ou objet de violences, et la conclusion plus large est quelque chose comme tout va mal.) Ou plutôt, à provoquer une émotion dans laquelle une conclusion éclora sans passer par l'étape de raisonnement.

[#] Enfin, je venais de quand j'ai écrit ce paragraphe. Mais ce billet, parmi beaucoup d'autres à moitié écrits, traînait dans mes cartons virtuels depuis un moment, donc je ne sais même plus à quel moment je fais référence. Peu importe : entre temps j'ai vu passer plein d'autres faits divers tout aussi peu dignes qu'on s'intéresse à eux.

Puisqu'il est question d'émotion, justement, je voudrais dire la mienne contre tout ce qui ressemble aux faits divers : à ceux qui les rapportent, à ceux qui les reproduisent, et à ceux qui, consciemment ou inconsciemment, cherchent à manipuler l'opinion publique avec. (Et je précise que je ne suis pas exempt de ces reproches : c'est justement parce que, sans doute comme tout le monde, je suis moi-même parfois tenté de m'émouvoir d'un fait divers, voire de le « partager » sur les réseaux sociaux, et d'autant plus que le fait divers s'aligne avec mes préconceptions politiques, que je dois travailler pour lutter contre ce poison du cerveau humain, et ce billet est là pour ça.)

Mon reproche contre le concept de fait divers peut être résumé dans l'explication suivante, dont la concision provocatrice retire un peu à la précision, mais qui résume néanmoins de façon assez percutante le cœur du problème :

Si on en parle aux infos, c'est que c'est très atypique.
Si c'est très atypique, c'est que ça n'a aucune importance.

(Il va de soi que je parle là des faits divers — expression française forte utile et que je ne sais d'ailleurs pas traduire en anglais. Un événement de portée géopolitique, par exemple, n'est pas sujet à ce reproche : il est significatif en lui-même, pas en ce qu'il prétend représenter un phénomène plus large.)

Je résume ce résumé par le titre de ce billet (inspiré d'une citation qui, comme toutes les meilleures citations, est apocryphe voire complètement inversée, le pluriel d'anecdote n'est pas données) : le pluriel de fait divers n'est pas statistiques.

Tout fait divers, donc, est un mensonge. Pas parce qu'il est faux (il y en a plein qui sont des légendes urbaines, mais ce n'est pas ça mon propos : admettons pour les besoins de l'argument que les faits soient exacts et fidèlement rapportés), mais en ce qu'il suggère qu'il est représentatif alors qu'il ne l'est pas : s'il était représentatif, il serait banal et on n'en parlerait pas. Donc il ment même s'il dit la vérité. Ce qui est sans doute la meilleure façon de mentir. Pour invoquer une autre citation (qui, pour une fois, n'est pas apocryphe, c'est d'Asimov dans Forward the Foundation) : The closer to the truth, the better the lie, and the truth itself, when it can be used, is the best lie.

Le fait divers, donc, vise à manipuler notre émotion. C'est un défaut du cerveau humain que les statistiques n'arrivent pas facilement à susciter notre émotion. (Ou alors il faut pour ça les tourner sous une forme trompeuse : les phrases du style toutes les X minutes, en France, <telle chose se produit> sont une manipulation pour donner aux statistiques la même coloration émotionnelle que les faits divers[#2].) Et aussi que les émotions sont si puissantes pour provoquer une réaction de notre part. Nous avons besoin de faits concrets, pas de chiffres.

[#2] Bien garder ça à l'esprit : si quelqu'un vous dit qu'il y a <tant> de <tel fait> par an en France, c'est peut-être vrai et honnête ; mais si on vous dit que <tel fait> se produit toutes les <tant> de minutes en France, c'est toujours un mensonge même si le chiffre est vrai : c'est un mensonge en ce que c'est une manipulation pour que le chiffre paraisse plus important qu'il l'est. Parce qu'il n'y a tout simplement aucune raison légitime de tourner une fréquence sous cette forme.

Je ne dis pas que les statistiques ne peuvent pas mentir, bien sûr, et d'ailleurs je viens à l'instant de donner une manière de les manipuler. (Là aussi vous vous doutez bien qu'il y a une fameuse citation apocryphe pour nous le rappeler.) Mais les statistiques ont au moins en principe le pouvoir de dire quelque chose de vrai et de représentatif, ce que le fait divers n'a pas. Les statistiques traduisent parfois une vérité collective intéressante : le fait divers ne le font jamais.

L'exemple le plus flagrant de la manipulation de nos émotions par ce qui n'est pas statistiquement représentatif est celui des actes terroristes et de l'importance qu'on leur accorde. (Je renvoie à cette vidéo plutôt bien faite pour un développement plus poussé de ce point.) La réalité statistique du terrorisme, dans le monde occidental, est qu'il est insignifiant : si vous vivez en France, vous avez moins de 0.01% de chances[#3] de mourir dans un attentat terroriste. Or les médias traitent chaque acte terroriste comme un sujet majeur, ce qui est exactement ce que recherchent les terroristes, et ce qui donne à ces derniers une victoire retentissante à chaque fois, en ce qu'ils réussissent effectivement, avec cette complicité des médias, à terroriser des gens qui, regardant ces infos anxiogènes, sont souvent convaincus qu'ils sont eux-mêmes menacés[#4] par le phénomène alors qu'ils ont grosso modo autant de chances de mourir, disons, tués par une vache. J'ajoute, puisque c'est aussi le propos de ce billet, que les politiques préconisant une réponse forte[#5] au terrorisme sont les alliés objectifs[#6] des terroristes : les premiers fournissent aux seconds l'attention et la terreur qu'ils recherchent, et les seconds fournissent aux premiers leur agenda politique (donc le pouvoir qui va avec).

[#3] Estimation passablement conservatrice : en France, il semble qu'il y ait eu moins de 600 morts de terrorisme au cours des 50 dernières années, sur environ 30 millions de morts au total pendant ce demi-siècle, donc les chances de mourir du terrorisme, en France, seraient plutôt autour de 0.002%. Mais pour d'autres pays européens, 0.01% est plus représentatif, et si on prend la pire année pour la France, on monte à presque… 0.03% (pour être bien clair, ça veut dire en gros que si chaque année répétait celle des attentats de 2015, la probabilité d'un Français générique de mourir du terrorisme sur toute votre vie serait autour de 0.03% ; je ne parle pas de 0.03% par an, ce qui serait beaucoup plus, mais plutôt de 0.0003% par an, soit 0.03% sur toute une vie, en prenant le pire chiffre des 50 dernières années).

[#4] De même qu'on a des règles qui imposent que toute pub pour de la bouffe soit accompagnée d'une injonction un chouïa paternaliste, je me dis parfois qu'il ne serait pas mal d'obliger tout reportage ou sujet d'actualité mentionnant le terrorisme d'être accompagné d'un message disant substantiellement : ce sujet ne vous concerne pas : vous n'allez pas mourir du terrorisme, vous allez très probablement mourir du cancer ou d'un accident cardiaque ou vasculaire.

[#5] Réponse forte, en fait, généralement constituée d'un théâtre de mesures absolument dénuées d'effets réels contre le terrorisme : il s'agit d'une comédie sécuritaire dont le but est simplement de rappeler au grand public que le sujet est censé être Important et que des gens prennent des Mesures.

[#6] J'aime bien rappeler que quand deux groupes se font publiquement et ostensiblement la guerre, souvent ces deux groupes sont des alliés objectifs, en ce que les deux ont en fait un but commun, qui est de faire croire que le sujet sur lequel ils se font la guerre est un sujet grave, important et central, que l'attention de l'opinion doit se focaliser dessus (ou bien il peut s'agir de cimenter chacun des deux groupes dans l'essentialisme qui les définit). Cette analyse est parfois simpliste (dans une vraie guerre, ce sont surtout les fractions les plus radicales des deux belligérants qui sont alliées, ça ne veut pas dire que toute la guerre est factice), mais il est au moins bon de l'avoir à l'esprit quand on nous présente un débat entre des positions prétendument « opposées ». En l'occurrence, l'alliance objective entre terroristes et adeptes de la manière forte contre le terrorisme me paraît assez évidente.

Certains sont sans doute tentés de répondre sur l'importance des symboles, ou quelque chose comme ça. (En mode avocat du diable : quelle sordide façon de décerner l'importance des sujets que de compter le nombre total de morts et de ne regarder que ça ! ce sont les symboles qui comptent.) Or c'est un peu le problème, justement : les terroristes essayent de nous manipuler par la portée symbolique de leur acte, et accepter de la reconnaître, accepter de s'en émouvoir plus que ce que sa réalité statistique extrêmement mineure le justifie, c'est justement entrer dans leur jeu. J'ai parlé ici du terrorisme, mais c'est globalement le problème des faits divers : la naissance d'une émotion collective qui, même si elle n'est pas provoquée délibérément, sera exploitée par les politiques. C'est le principe du un fait divers, une loi (la loi n'est généralement même pas la finalité de la manœuvre — parfois elle l'est si c'est une loi liberticide, mais en général le but de la gesticulation est simplement de récupérer du capital de sympathie politique sur l'air de voyez, moi je m'occupe de ce problème dont personne ne s'occupait jusqu'ici).

Et cette émotion collective vient avec une injonction de la ressentir : qui oserait répondre à l'émotion suscitée par le viol du petit Machin (7 ans) par le cousin de sa belle-tante en disant mais on s'en fout, de ce fait-divers sordide ! ? Si vous dites ça, on vous traite de monstre, d'insensible, de scientifique déshumanisé qui ne sait lire le monde que derrière de froides statistiques, etc. (et si on tient un discours de ce genre face à un acte terroriste, la réaction est encore pire[#7]). Les gens qui disent ça confondent le fait de ressentir une émotion (oui, généralement, je suis désolé d'apprendre ce qui est arrivé au petit Machin) et le fait d'en faire un spectacle public d'importance nationale.

[#7] Essayez un peu de défendre la position selon laquelle la réponse à faire au terrorisme c'est l'ignorer complètement, et pourrez mesurer, aux réactions indignées que cela provoque, l'étendue de la victoire psychologique des terroristes dans leur bataille pour l'attention. (Notons que je ne défends pas cette position : je pense qu'il y a des choses qu'on peut faire contre le terrorisme, mais elles sont plutôt de l'ordre de l'infiltration. Mais ce n'est ni le propos de ce billet ni quelque chose sur quoi je pense être compétent, donc je ne développe pas.)

Je le sais parce que je tiens de feu mon papa cette attitude de rejet du fait divers et d'attachement aux statistiques, et je voyais bien les réactions irritées voire véritablement courroucées que cette attitude pouvait provoquer. Il est vrai qu'il ne cachait pas son mépris pour tout ce qui est anecdotique, et qu'il demandait bien ostensiblement, et avec un mépris parfois un peu provocateur, la fréquence de n'importe quel fait qu'on lui rapportait. (Et il est aussi vrai qu'il n'était pas toujours parfaitement cohérent avec ses propres principes.)

Encore une fois, je ne prétends certainement pas être moi-même exempt de reproches : il m'est certainement arrivé de rapporter, propager ou amplifier des faits divers (voire de les déformer) : moi aussi j'ai des émotions et moi aussi on peut me manipuler avec elles, et le terrorisme y parvient dans une certaine mesure. Ce que je décris ici est surtout une discipline que j'essaie de m'imposer (et si je cherche à me l'imposer, c'est bien parce qu'elle ne m'est pas naturelle, et j'échoue souvent à obéir à mes règles). Il ne s'agit pas de ne jamais évoquer de fait divers, mais au moins de faire la démarche de me demander, à chaque fois que j'en rencontre un, quelque chose comme ceci :

  • Est-ce que ce fait est représentatif en plus d'être matériellement exact ? De quoi est-il représentatif exactement ?
  • Est-ce que je dispose des éléments de contexte suffisants pour interpréter le fait rapporté ? Quelle sélection des faits a été apportée par la narration que j'ai reçue ? Quels sont les biais de la source dont je le tiens ?
  • Qui a sélectionné le fait rapporté parmi d'autres qui sont semblables ? Qui a choisi de parler précisément de celui-là et pas d'un autre ? Quelle est l'intention derrière ce choix, qui n'est pas neutre ?
  • Est-ce que je peux trouver des statistiques sur le phénomène qui semble impliqué par le fait rapporté ? Que me disent ces statistiques sur l'importance du phénomène ? Que me disent-elles sur la typicité du fait rapporté ?
  • Quelle émotion fait naître en moi le fait rapporté ? Dans quelle mesure cette émotion est-elle provoquée ou amplifiée par la narration que j'ai reçue ? Cette émotion sert-elle des intérêts autres que ceux de l'information pure ? Lesquels ?

La liste n'est pas exhaustive, évidemment (et je mélange là des questions qui visent à stimuler différentes sortes de scepticisme, dont certains s'appliquent bien plus largement qu'aux faits divers[#8]). Mais il me semble que le débat public serait beaucoup plus sain si chacun faisait au moins un effort honnête de pratiquer cette petite gymnastique à chaque fois qu'il s'agit de cliquer sur le bouton reposter d'un message qui nous émeut.

[#8] Et bien sûr tout ceci s'ajoute au scepticisme dont il est pertinent de faire preuve sur les faits eux-mêmes (viennent-ils d'une source fiable ? les images ne sont-elles pas générées par IA ? etc.).

Tout propos catégorique mérite bien sûr d'être nuancé (y compris cette phrase-ci). Il y a quand même des cas où un fait divers peut nous apprendre quelque chose.

D'abord, quand le fait divers est représentatif et typique d'un phénomène qui est effectivement statistiquement pertinent : il n'est tout de même pas vrai que tout ce qui est relaté aux infos (ou propagé sur les réseaux sociaux) est atypique, et même s'il est atypique il peut l'être pour des raisons orthogonales à ce qui le rend significatif (par exemple si une célébrité est victime d'un phénomène banal, ça rend le fait divers newsworthy tout en restant représentatif du phénomène banal). On peut admettre qu'un fait divers serve, dans un discours, à illustrer un phénomène statistique, à rendre plus « parlantes » les statistiques. Mais ceci n'excuse en rien de ne pas chercher les statistiques.

Ensuite, quand un fait divers montre que quelque chose est possible alors qu'on pensait que c'était simplement impossible (ou que quelque chose existe alors qu'on n'y avait jamais pensé) : les statistiques sont alors par définition impossibles à faire puisqu'on a affaire à un hapax. La réaction saine, alors, est de se dire tiens, il est peut-être pertinent de s'intéresser à ce phénomène à l'avenir, par exemple pour chercher à savoir s'il est en train d'apparaître ou si c'est un événement qui se produit une fois tous les millions d'années.

Et bien sûr, une morale à tirer de tout ça c'est l'importance de l'enseignement scientifique (et notamment des stats de base et des ordres de grandeur). Il me semble indispensable que tout citoyen sache calculer un ordre de grandeur pour répondre à un problème du style : si ce problème, qui touche un groupe de personnes dont je fais partie et représentant environ 1% de la population, se produit environ une fois par mois en France et affecte une vingtaine de personnes à chaque fois, au bout de combien de temps dois-je moi-même m'attendre à en être victime ? (réponse en supposant une uniforme distribution[#9] : 70 millions × 1% / 20 × 1 mois ≈ 3000 ans) ou, en plus simple, si une personne par minute est victime de tel phénomène en France, au bout de combien de temps dois-je moi-même m'attendre à en être victime ? (réponse en supposant une uniforme distribution : 70 millions de minutes ≈ 130 ans). Je pourrais raconter des anecdotes de gens qui sont incapables de convertir de tête 70 millions de minutes en 130 ans (au moins approximativement !) ou échoueraient à répondre à ce genre de questions pour telle ou telle autre raison, mais ce serait, justement, des anecdotes destinées à provoquer votre émotion indignée : pour rester dans le sujet, je voudrais plutôt voir des statistiques sérieuses à cet égard.

[#9] Bien sûr, l'hypothèse d'égale distribution est critiquable et doit être critiquée, à l'aune du phénomène particulier. C'est justement ce qu'un enseignement scientifique correct doit fournir : des clés pour utiliser, formuler et critiquer ce genre d'hypothèse.

L'autre chose importante à mettre dans les mains de tous les citoyens, outre une culture scientifique de base, c'est l'accès à des statistiques claires et de qualité contre lesquelles comparer leurs impressions tirées des anecdotes sur le monde.

J'aime donner l'exemple suivant : beaucoup de gens sont persuadés (et pour le coup ce n'est pas anecdotique, j'avais trouvé des statistiques sérieuses à l'appui de cette affirmation, même si je ne les retrouve plus) que le monde est beaucoup plus violent qu'autrefois. Cette impression résulte largement de l'information immédiate et « brute » à laquelle nous avons accès. Or selon à peu près n'importe quelle métrique raisonnable, nous vivons à une époque tout à fait paisible, et selon certaines, même, possiblement la plus paisible que l'Humanité ait jamais connue. Voyez par exemple ce graphe pour ce qui est de la mortalité par guerre, et cette estimation ainsi que celle-ci des homicides, pour des perspectives historiques plus larges. Ça ne veut certainement pas dire que le monde n'est pas bourré de problèmes, ni que la violence n'en est pas un sérieux, ni qu'elle n'est pas en train de ressurgir (et on peut certainement trouver des statistiques bien plus nuancées que celles que je viens de lier), mais l'impression émotionnelle qui résulte de la consommation de l'actualité n'en est pas moins profondément trompeuse.

Donc j'aime bien faire la pub, et j'en profite pour le faire ici, pour le site Web Our World in Data, qui avec Wikipédia (et malgré toutes les imperfections de l'un ou de l'autre) est un de ceux qu'il est le plus urgent de mettre entre toutes les mains et d'encourager tout le monde à consulter comme source d'information raisonnablement honnête, généralement fiable et typiquement facile à comprendre.

Je conclus par la remarque suivante tendant à justifier le titre de ce billet sous un angle légèrement différent : non seulement l'accumulation d'anecdotes ne va pas conduire à une représentation mentale fidèle du monde parce que chacune de ces anecdotes est atypique, mais aussi, et même en l'absence de volonté de manipulation émotionnelle, même leur agrégation n'est toujours pas représentative. Ceci résulte notamment d'une asymétrie fondamentale de l'information : les mauvaises nouvelles ont tendance à venir de façon soudaine (ceci ne vaut pas que pour les faits divers : guerres et catastrophes arrivent de façon soudaine), et l'actualité est dominée par ce qui est soudain et nouveau ; tandis que les bonnes nouvelles sont presque toujours lentes et incrémentales (les informations du style cette année l'espérance de vie à la naissance a de nouveau augmenté d'un mois ou le nombre de morts par homicide continue sa baisse progressive ne font pas les actualités).

↑Entry #2790 [older| permalink|newer] / ↑Entrée #2790 [précédente| permalien|suivante] ↑

Continue to older entries. / Continuer à lire les entrées plus anciennes.


Entries by month / Entrées par mois:

2024 Jan 2024 Feb 2024 Mar 2024 Apr 2024 May 2024 Jun 2024 Jul 2024 Aug 2024 Sep 2024 Oct 2024
2023 Jan 2023 Feb 2023 Mar 2023 Apr 2023 May 2023 Jun 2023 Jul 2023 Aug 2023 Sep 2023 Oct 2023 Nov 2023 Dec 2023
2022 Jan 2022 Feb 2022 Mar 2022 Apr 2022 May 2022 Jun 2022 Jul 2022 Aug 2022 Sep 2022 Oct 2022 Nov 2022 Dec 2022
2021 Jan 2021 Feb 2021 Mar 2021 Apr 2021 May 2021 Jun 2021 Jul 2021 Aug 2021 Sep 2021 Oct 2021 Nov 2021 Dec 2021
2020 Jan 2020 Feb 2020 Mar 2020 Apr 2020 May 2020 Jun 2020 Jul 2020 Aug 2020 Sep 2020 Oct 2020 Nov 2020 Dec 2020
2019 Jan 2019 Feb 2019 Mar 2019 Apr 2019 May 2019 Jun 2019 Jul 2019 Aug 2019 Sep 2019 Oct 2019 Nov 2019 Dec 2019
2018 Jan 2018 Feb 2018 Mar 2018 Apr 2018 May 2018 Jun 2018 Jul 2018 Aug 2018 Sep 2018 Oct 2018 Nov 2018 Dec 2018
2017 Jan 2017 Feb 2017 Mar 2017 Apr 2017 May 2017 Jun 2017 Jul 2017 Aug 2017 Sep 2017 Oct 2017 Nov 2017 Dec 2017
2016 Jan 2016 Feb 2016 Mar 2016 Apr 2016 May 2016 Jun 2016 Jul 2016 Aug 2016 Sep 2016 Oct 2016 Nov 2016 Dec 2016
2015 Jan 2015 Feb 2015 Mar 2015 Apr 2015 May 2015 Jun 2015 Jul 2015 Aug 2015 Sep 2015 Oct 2015 Nov 2015 Dec 2015
2014 Jan 2014 Feb 2014 Mar 2014 Apr 2014 May 2014 Jun 2014 Jul 2014 Aug 2014 Sep 2014 Oct 2014 Nov 2014 Dec 2014
2013 Jan 2013 Feb 2013 Mar 2013 Apr 2013 May 2013 Jun 2013 Jul 2013 Aug 2013 Sep 2013 Oct 2013 Nov 2013 Dec 2013
2012 Jan 2012 Feb 2012 Mar 2012 Apr 2012 May 2012 Jun 2012 Jul 2012 Aug 2012 Sep 2012 Oct 2012 Nov 2012 Dec 2012
2011 Jan 2011 Feb 2011 Mar 2011 Apr 2011 May 2011 Jun 2011 Jul 2011 Aug 2011 Sep 2011 Oct 2011 Nov 2011 Dec 2011
2010 Jan 2010 Feb 2010 Mar 2010 Apr 2010 May 2010 Jun 2010 Jul 2010 Aug 2010 Sep 2010 Oct 2010 Nov 2010 Dec 2010
2009 Jan 2009 Feb 2009 Mar 2009 Apr 2009 May 2009 Jun 2009 Jul 2009 Aug 2009 Sep 2009 Oct 2009 Nov 2009 Dec 2009
2008 Jan 2008 Feb 2008 Mar 2008 Apr 2008 May 2008 Jun 2008 Jul 2008 Aug 2008 Sep 2008 Oct 2008 Nov 2008 Dec 2008
2007 Jan 2007 Feb 2007 Mar 2007 Apr 2007 May 2007 Jun 2007 Jul 2007 Aug 2007 Sep 2007 Oct 2007 Nov 2007 Dec 2007
2006 Jan 2006 Feb 2006 Mar 2006 Apr 2006 May 2006 Jun 2006 Jul 2006 Aug 2006 Sep 2006 Oct 2006 Nov 2006 Dec 2006
2005 Jan 2005 Feb 2005 Mar 2005 Apr 2005 May 2005 Jun 2005 Jul 2005 Aug 2005 Sep 2005 Oct 2005 Nov 2005 Dec 2005
2004 Jan 2004 Feb 2004 Mar 2004 Apr 2004 May 2004 Jun 2004 Jul 2004 Aug 2004 Sep 2004 Oct 2004 Nov 2004 Dec 2004
2003 May 2003 Jun 2003 Jul 2003 Aug 2003 Sep 2003 Oct 2003 Nov 2003 Dec 2003

[Index of all entries / Index de toutes les entréesLatest entries / Dernières entréesXML (RSS 1.0) • Recent comments / Commentaires récents]