David Madore's WebLog

Vous êtes sur le blog de David Madore, qui, comme le reste de ce site web, parle de tout et de n'importe quoi (surtout de n'importe quoi, en fait), des maths à la moto et ma vie quotidienne, en passant par les langues, la politique, la philo de comptoir, la géographie, et beaucoup de râleries sur le fait que les ordinateurs ne marchent pas, ainsi que d'occasionnels rappels du fait que je préfère les garçons, et des petites fictions volontairement fragmentaires que je publie sous le nom collectif de fragments littéraires gratuits. • Ce blog eut été bilingue à ses débuts (certaines entrées étaient en anglais, d'autres en français, et quelques unes traduites dans les deux langues) ; il est maintenant presque exclusivement en français, mais je ne m'interdis pas d'écrire en anglais à l'occasion. • Pour naviguer, sachez que les entrées sont listées par ordre chronologique inverse (i.e., celle écrite en dernier est en haut). Cette page-ci rassemble les dernières 20 entrées (avec un lien, à la fin, pour les plus anciennes) : il y a aussi un tableau par mois à la fin de cette page, et un index de toutes les entrées. Certaines de mes entrées sont rangées dans une ou plusieurs « catégories » (indiqués à la fin de l'entrée elle-même), mais ce système de rangement n'est pas très cohérent. Le permalien de chaque entrée est dans la date, et il est aussi rappelé avant et après le texte de l'entrée elle-même.

You are on David Madore's blog which, like the rest of this web site, is about everything and anything (mostly anything, really), from math to motorcycling and my daily life, but also languages, politics, amateur(ish) philosophy, geography, lots of ranting about the fact that computers don't work, occasional reminders of the fact that I prefer men, and some voluntarily fragmentary fictions that I publish under the collective name of gratuitous literary fragments. • This blog used to be bilingual at its beginning (some entries were in English, others in French, and a few translated in both languages); it is now almost exclusively in French, but I'm not ruling out writing English blog entries in the future. • To navigate, note that the entries are listed in reverse chronological order (i.e., the latest written is on top). This page lists the 20 latest (with a link, at the end, to older entries): there is also a table of months at the end of this page, and an index of all entries. Some entries are classified into one or more “categories” (indicated at the end of the entry itself), but this organization isn't very coherent. The permalink of each entry is in its date, and it is also reproduced before and after the text of the entry itself.

[Index of all entries / Index de toutes les entrées • Latest entries / Dernières entrées • (RSS 1.0) • Recent comments / Commentaires récents]

Latest entries / Dernières entrées publiées:

↓Entry #2798 [older|※ permalink|~~newer~~] / ↓Entrée #2798 [précédente|※ permalien|~~suivante~~] ↓

2024-07-12 (vendredi)

Introduction aux mathématiques constructives : 2. entiers naturels et principes d'omniscience

Je continue ma série d'introduction aux mathématiques constructives en parlant d'entiers naturels, de suites et de « principes d'omniscience ». Ce billet est la continuation de celui-ci, qu'il n'est pas forcément nécessaire d'avoir intégralement lu mais auquel je renvoie au moins pour l'avant-propos expliquant de quoi il est question (je renvoie aussi à ce billet plus ancien pour une explication générale et historique à ce que sont les maths constructives).

Table des matières

Partie 1 (un peu de théorie des ensembles) :

Partie 2 (entiers naturels et principes d'omniscience) :

L'ensemble ℕ des entiers naturels, et diverses formes de récurrence

Comme en maths classiques, il y a plusieurs approches fondationnelles pour faire apparaître l'ensemble des entiers naturels, mais il faut forcément postuler quelque chose (au moins l'existence d'une sorte d'ensemble infini) ; si on aime le point de vue ensembliste, pourra identifier, comme proposé par von Neumann, 0 avec ∅, 1 avec {0}={∅}, 2 avec {0,1}={∅,{∅}}, 3 avec {0,1,2}, etc., mais il est sans doute préférable de traiter les entiers naturels comme « atomiques » : je n'ai pas envie de rentrer dans ces considérations-là. Toujours est-il que, d'une manière ou d'une autre, on va vouloir postuler ou démontrer que :

Il existe un ensemble noté ℕ et appelé ensemble des entiers naturels, muni d'un élément 0∈ℕ (appelé zéro) et d'une fonction S:ℕ→ℕ (la fonction successeur), vérifiant le principe de récurrence :

‣ Si E est un ensemble quelconque, e∈E un élément et f:E→E une fonction, alors il existe une unique u:ℕ→E telle que u(0) = e et u∘S = f∘u (c'est-à-dire u(S(n)) = f(u(n)) pour tout n∈ℕ).

On dit alors que u est construite par récurrence par itération de f à partir de la valeur initiale e. (Concrètement, u(0)=e, u(1)=f(e), u(2)=f(f(e)) et ainsi de suite.)

Comme en maths classiques, il existe toutes sortes de variations autour de ce principe de récurrence. Celui que je viens d'énoncer est un principe de récurrence « catégorique » ou « universel » (parce qu'on peut le décrire de façon savante en théorie des catégories) ; mais on peut en déduire d'autres principes peut-être plus familiers, comme les suivants (ce que je raconte ci-dessous n'est pas spécialement liée aux maths constructives, mais comme je me suis un peu gratté la tête pour retrouver comment les obtenir, autant prendre la peine d'écrire ces preuves explicitement) :

Récurrence avec paramètre : si E est un ensemble quelconque, e∈E un élément et g:ℕ×E→E une fonction, alors il existe une unique u:ℕ→E telle que u(0) = e et u(S(n)) = g(n,u(n)) pour tout n∈ℕ.

Autrement dit, dans une définition par récurrence, on a le droit d'utiliser l'indice n du terme défini et pas juste la valeur du terme précédent.

(Pour le démontrer à partir du principe de récurrence tel que je l'ai énoncé plus haut, il suffit d'appliquer ce dernier à l'ensemble ℕ×E avec la valeur initiale (0,e) et f(n,v) = (S(n),g(n,v)) : la première coordonnée du U:ℕ→ℕ×E ainsi obtenu est forcément l'identité d'après l'unicité dans le principe de récurrence sans paramètres, et la condition sur la seconde coordonnée est exactement la condition de la récurrence avec paramètre. ∎)
Récurrence sur les propriétés : si P⊆ℕ est une partie de ℕ telle que 0∈P et ∀n∈ℕ.(n∈P ⇒ S(n)∈P), alors en fait P=ℕ.

Autrement dit, si une propriété est vraie en 0 et est vraie en S(n) à chaque fois qu'elle est vraie en n, alors elle est vraie en tout n∈ℕ.

Démonstration à partir des points précédents : Déjà, on peut déjà remplacer P⊆ℕ par sa fonction indicatrice p:ℕ→Ω, qui vérifie du coup p(0)=⊤ et ∀n∈ℕ.(p(n) ⇒ p(S(n))), et le but est de montrer que p vaut constamment ⊤.

Si à la place de ∀n∈ℕ.(p(n) ⇒ p(S(n))) on avait fait l'hypothèse ∀n∈ℕ.(p(n) ⇔ p(S(n))), c'est-à-dire ∀n∈ℕ.(p(S(n))=p(n)) ce serait facile puisque c'est une relation de récurrence sur la fonction p qui est aussi vérifiée par la fonction constamment égale à ⊤, donc l'unicité dans le principe de récurrence, appliqué à E=Ω, e=⊤ et f=id_Ω montre que p(n)=⊤ pour tout n.

Mais comme on a seulement fait l'hypothèse ∀n∈ℕ.(p(n) ⇒ p(S(n))), il faut s'y ramener. Voici une possibilité (il y a peut-être plus simple, je ne sais pas) : on définit q:ℕ→Ω par récurrence par q(0)=⊤ et q(S(n)) = p(n)∧q(n) (ceci utilise la récurrence avec paramètre : E=Ω, e=⊤ et g(n,v) = p(n)∧v dans la notation du point précédent), et on définit aussi r(n) = p(n)∧q(n). Alors r(n) = p(n)∧q(n) = q(S(n)) par définition, et comme p(n) implique p(S(n)) (c'est notre hypothèse), on voit que r(n) implique p(S(n))∧q(S(n)), c'est-à-dire précisément r(S(n)) ; or réciproquement, r(S(n)) signifie p(S(n))∧q(S(n)), ce qui implique notamment q(S(n)), qui est égal à r(n) ; bref, on a montré ∀n∈ℕ.(r(n) ⇔ r(S(n))). Par ce qui vient d'être dit (paragraphe précédent), on voit que r(n) est vrai pour tout n, c'est-à-dire que p(n)∧q(n) l'est, et notamment p(n) est vrai pour tout n. ∎

On peut alors démontrer la proposition fondamentale suivante :

Proposition : tout entier naturel n est soit égal à 0 soit est le successeur d'un entier naturel m (c'est-à-dire n=S(m)) ; de plus, ces deux cas sont exclusifs (c'est-à-dire que zéro n'est pas le successeur d'un entier naturel) et le m dans le deuxième cas est unique (c'est-à-dire que la fonction S est injective).

Démonstration : On va observer successivement les points suivants :

‣ ① Tout entier naturel est soit 0 soit de la forme S(m) (autrement dit, ∀n∈ℕ.(n=0 ∨ ∃m∈ℕ.(n=S(m)))).

Ce point ① se démontre par une récurrence triviale sur n : la propriété que je viens de dire est trivialement vraie en 0 et trivialement vraie en S(m) si elle l'est en m (on n'a même pas besoin d'utiliser l'hypothèse de récurrence !).

Il reste à expliquer que la disjonction est exclusive et que le m est unique.

À cet effet, notons ℕ⊎{⬥} la réunion disjointe de ℕ et d'un singleton dont l'élément sera noté ‘⬥’.

Alors il existe une (unique) fonction D : ℕ → ℕ⊎{⬥} telle que D(0)=⬥ et D(S(n))=n pour tout n∈ℕ. En effet, je viens d'en donner une définition par récurrence avec paramètres (et j'ai expliqué plus haut pourquoi une telle définition est légitime).

Considérons dans l'autre sens la fonction S′ : ℕ⊎{⬥} → ℕ définie par S′(⬥)=0 et S′(n)=S(n) si n∈ℕ : cette définition est légitime par les propriétés générales des unions disjointes (définir une fonction sur X⊎Y revient à la définir sur X et sur Y séparément).

‣ ② Les fonctions D : ℕ → ℕ⊎{⬥} et S′ : ℕ⊎{⬥} → ℕ qui viennent d'être définies sont des bijections réciproques entre ℕ et ℕ⊎{⬥}.

En effet le fait que D∘S′=id_ℕ⊎{⬥} est immédiat sur les définitions, et le fait que S′∘D=id_ℕ se vérifie séparément pour 0 et pour S(m), ce qui, d'après le point ①, suffit à conclure.

‣ ③ La fonction S est injective : ∀m₁∈ℕ.∀m₂∈ℕ.((S(m₁)=S(m₂))⇒(m₁=m₂)).

Ceci découle du point ② : si S(m₁)=S(m₂) alors D(S(m₁))=D(S(m₂)), c'est-à-dire m₁=m₂. (On, si on préfère : S est la restriction à ℕ de la fonction S′ qui est bijective donc injective, donc S elle-même est injective.)

‣ ④ L'élément 0 de ℕ n'est pas de la forme S(m) (i.e., ¬∃m∈ℕ.(0=S(m)), donc la disjonction au point ① est exclusive).

En effet, si S(m)=0 alors D(S(m))=D(0), c'est-à-dire m=⬥, contredisant le fait que la réunion ℕ⊎{⬥} a été prise disjointe.

Ceci conclut tout ce qui devait être démontré. ∎

Je répète que tout ceci n'a pas vraiment de rapport avec les maths constructives : il s'agissait ici de démontrer les axiomes de Peano (qui sont, en gros, les points ③ et ④ de la démonstration ci-dessus, ainsi que la récurrence sur les propriétés telles qu'énoncée plus haut) à partir du principe de récurrence « catégorique » que j'ai postulé. En arithmétique du premier ordre, ce sont ces axiomes de Peano qu'on va postuler, mais ici je travaille librement avec des ensembles, et c'est quand même important de savoir qu'on peut — et de façon complètement constructive — démontrer les axiomes de Peano dans le contexte où je me suis placé. Mais tout ce qui vient d'être écrit n'est quand même pas complètement hors sujet pour un billet sur les maths constructives, parce que j'ai notamment prouvé que pour tout entier naturel n on a n=0 ∨ ¬(n=0) (vu que j'ai prouvé n=0 ∨ ∃m∈ℕ.(n=S(m)) et que ¬(S(m) = 0)), ce qui est l'ingrédient essentiel pour pouvoir dire que ℕ est discret, cf. ci-dessous.

On peut ensuite dérouler les définitions et sorites habituels sur les entiers naturels. L'addition ℕ×ℕ→ℕ, (m,n)↦m+n est définie par récurrence sur n par m+0=m et m+S(n)=S(m+n) ; la multiplication ℕ×ℕ→ℕ, (m,n)↦m×n est définie par récurrence sur n par m×0=0 et m×(S(n))=(m×n)+m (et on pose 1:=S(0), ce qui ne doit pas causer de confusion avec la notation pour un singleton, avec lequel on peut d'ailleurs choisir d'identifier 1 si on travaille sur des fondements ensemblistes) ; l'exponentiation ℕ×ℕ→ℕ, (m,n)↦m↑n est définie par récurrence sur n par m↑0=1 et m↑(S(n))=(m↑n)×m ; et l'ordre large (≤) ⊆ ℕ×ℕ (qu'on peut préférer voir comme sa fonction indicatrice ℕ×ℕ→Ω) par m≤n ssi il existe k tel que n=m+k (et on définit n≥m comme synonyme de m≤n, et m<n ou n>m comme synonyme de S(m)≤n disons).

Comme je l'avais évoqué dans un bout d'une entrée précédente sur le sujet, « la plupart » des résultats arithmétiques du premier ordre (i.e., ne parlant que d'entiers naturels, pas de fonctions ou de parties des entiers naturels) valables en maths classiques restent valables en maths constructives. Par exemple :

l'addition est associative et commutative et 0 est neutre pour elle, la multiplication est associative et commutative et 1 est neutre pour elle, la multiplication est distributive sur l'addition, l'exponentiation vérifie les règles de calcul dont on a l'habitude ;
l'ordre est total et se comporte comme on s'y attend venant des maths classiques : si m,n∈ℕ alors m≤n ou m≥n, et en fait on a exactement une des trois affirmations m<n ou m=n ou m>n, on a m≤n si et seulement si m<n ou m=n, on a m≤n si et seulement si ¬(m<n), on a m<n si et seulement si ¬(m≤n) ;
l'ordre est compatible avec les opérations au sens où par exemple m≤n et m′≤n′ impliquent m+m′≤n+n′ et m×m′≤n×n′ ;
la division euclidienne, la définition des nombres premiers, l'existence et l'unicité de la décomposition en facteurs premiers, tout ça fonctionne essentiellement comme en maths classiques (je ne rentre pas dans les détails).

J'insiste notamment sur le fait que pour m,n entiers naturels, on a (m=n)∨¬(m=n) : c'est-à-dire que ℕ est discret comme défini précédemment. Il est donc légitime d'écrire m≠n pour ¬(m=n).

Il n'est donc pas abusé de dire que l'arithmétique du premier ordre voit « très peu de différences » entre les maths constructives et les maths classiques. Il y a la même ressemblance pour toute la théorie des structures finies (groupes finis, graphes finis, ce genre de choses), quand on définit fini comme en bijection avec {1,…,n} pour un certain n∈ℕ, ce que j'expliquerai après ; c'est-à-dire dès lors que la structure peut se « coder » comme entiers naturels et donc se représenter en arithmétique du premier ordre : intuitivement, l'explication est que les énoncés décidables par énumération de tous les cas ne peuvent pas se comporter différemment en maths constructives des maths classiques.

J'écris la plupart des résultats et très peu de différences entre guillemet, parce que même en arithmétique du premier ordre, il n'est pas correct que tout énoncé démontrable classiquement est démontrable constructivement. Le résultat technique précis, que j'avais déjà évoqué en passant dans un billet précédent, est que tout énoncé arithmétique Π₂ démontrable dans l'arithmétique de Heyting [la théorie donnée en logique intuitionniste par les axiomes de Peano du premier ordre usuels] est démontrable dans l'arithmétique de Peano : ici, Π₂ signifie qu'il est quantifié de la forme ∀∃, c'est-à-dire une succession de quantificateurs universels devant une succession de quantificateurs existentiels, tous portant sur des entiers naturels, devant un énoncé à quantificateurs bornés (donc, en pratique, finiment testable). Pour trouver des affirmations du premier ordre sur les entiers naturels intéressantes qui sont démontrables classiquement mais pas constructivement, il faut se gratter un peu la tête, mais c'est possible. Je pense que la plus simple est toute machine de Turing soit termine soit ne termine pas (ce qui est classiquement trivial mais pas démontrable en arithmétique de Heyting) ; bien sûr, formaliser ceci exige de définir au préalable (arithmétiquement au premier ordre) la notion de machine de Turing. J'avais plus ou moins expliqué ce fait dans ce billet passé. (On peut même donner des machines de Turing précises et explicites dont on ne peut pas montrer constructivement qu'elles terminent ou ne terminent pas, mais ceci exigerait d'être plus précis que je ne l'ai été sur les fondements que j'ai utilisés, parce qu'en gros il s'agira de la machine de Turing qui recherche une contradiction dans les fondements en question.)

Néanmoins, cette ressemblance entre maths classiques et maths constructives vaut pour l'arithmétique du premier ordre, i.e., tant qu'on ne parle (et surtout, ne quantifie sur) que des entiers naturels. Dès qu'il est question de suites (cf. plus bas) ou surtout d'ensembles d'entiers naturels, les différences entre maths classiques et constructives apparaissent clairement.

[Lire la suite…]

↑Entry #2798 [older|※ permalink|~~newer~~] / ↑Entrée #2798 [précédente|※ permalien|~~suivante~~] ↑

↓Entry #2797 [older|※ permalink|newer] / ↓Entrée #2797 [précédente|※ permalien|suivante] ↓

2024-07-08 (lundi)

Quelques remarques sur les modes de scrutin

Les élections en France[#] font l'objet d'une forme de ritualisation qui me fait penser à la consultation de l'Oracle de Delphes : après des incantations propitiatoires d'usage, on interroge le Peuple Souverain, qui s'exprime, comme la Pythie, de façon totalement absconse, et ensuite chacun interprète la réponse de la manière qui l'arrange, c'est-à-dire en expliquant que le Peuple Souverain l'a adoubé pour exercer le pouvoir, ou bien que les adversaires sont Trop Méchants et ont faussé le jeu par leurs viles manœuvres politiciennes. (Cela ne se fait pas, en revanche, de dire que les électeurs sont des cons, ce que pourtant bon nombre de politiciens doivent penser en leur for intérieur.)

[#] Pas seulement en France, bien sûr : je suppose que c'est le cas dans n'importe quelle démocratie où aucun parti n'est hégémonique et où une alternance est effectivement possible au sens où l'issue d'un scrutin fait peser une incertitude significative sur comment et par qui le pays sera dirigé.

Et au milieu de ça, il y a occasionnellement une petite musique qui se fait entendre selon laquelle on devrait changer de mode de scrutin, parce que le mode actuel est injuste ou souffre de tel ou tel défaut. Ceci m'amène à faire les remarques et réflexions (pas très profondes) suivantes sur les modes de scrutin et l'opportunité de réformer ceux qui sont utilisés en France.

Oui, les modes de scrutin utilisés en France, au moins dans les élections présidentielle et législatives, sont assez pourris. Ce ne sont pas le pire (le pire est sans doute celui utilisé aux États-Unis, au Canada, au Royaume-Uni ou ailleurs, dans lequel on fait un seul tour de scrutin et on donne le poste à la personne arrivée en tête : c'est le plus simple, et c'est aussi le plus épouvantable qui soit formellement démocratique), mais peut-être que justement parce que ce ne sont pas le pire il est plus facile de ne pas faire attention à leurs défauts.

Notamment, le fait de voter par circonscriptions indépendantes lors des législatives fait que la composition de l'assemblée élue s'écarte typiquement beaucoup d'une représentation proportionnelle (i.e., le nombre de sièges reçus au parlement par les différents partis n'est pas dans les proportions où on a voté pour eux) ; et le mode de scrutin uninominal à deux tours ne permet pas d'exprimer des préférences ordinales et ne vérifie généralement pas le critère de Condorcet (qui demande que si un candidat est préféré par une majorité des électeurs à tout autre candidat alors ce candidat sera forcément élu).
Néanmoins, il faut immédiatement préciser qu'aucun mode de scrutin n'est idéal.

Il y a des théorèmes mathématiques précis à ce sujet (celui d'Arrow, celui de Gibbard-Satterthwaite, celui de Duggan-Schwartz, celui de Chichilnisky-Heal, et sans doute plein dont je n'ai jamais entendu parler).

Mais en fait, ce n'est pas clair que ces théorèmes soient vraiment pertinents ici : ils reposent généralement sur une variante ou une autre du paradoxe de Condorcet (à savoir : même si les préférences de chaque électeur sont cohérentes, il est possible qu'une majorité d'électeurs préfère A à B, qu'une majorité d'électeurs préfère B à C et qu'une majorité d'électeurs préfère C à A, ce qui posera manifestement un problème sérieux à tout mode de scrutin), or je ne suis pas sûr qu'il existe beaucoup de situations réelles du monde réel où le paradoxe de Condorcet apparaisse dans les préférences de l'électorat (en tout cas, je n'en vois pas dans le fond du débat politique français actuel ; mais n'hésitez pas à me détromper en commentaire).
Le problème dans le monde réel et non mathématique est plutôt qu'on ne sait pas très bien ce qu'on attend d'un mécanisme de vote, et les choses qu'on attend (par exemple, la lisibilité des résultats) sont assez difficilement réductibles à une formalisation mathématique, voire carrément mal définies, ou bien ne dépendent pas tant du mode de scrutin que de tout le contexte politique, la pratique des institutions, etc., et à un niveau encore plus large, de la psychologie des votants, de la sociologie de l'électorat, du système médiatique, etc.

Notamment, attendre d'un mode de scrutin qu'il rende le résultat de l'élection facile à comprendre et à interpréter est certainement naïf.

Après tout, même s'agissant du type de scrutin le plus simple possible, c'est-à-dire un referendum dont les seules réponses possibles sont oui et non, les commentateurs arriveront à se disputer sur ce que le Peuple Souverain a voulu dire en choisissant l'un ou l'autre, parce que, justement, une seule réponse binaire n'apporte pas les éléments d'information nécessaire pour comprendre et interpréter la réponse. Les électeurs votent pour mille et une raisons, veulent exprimer mille et une choses différentes, utilisent leur droit de vote comme ils le peuvent et parfois sans aucun rapport avec la question posée (p.ex., pour exprimer leur mécontentement), et si le mode de scrutin fournit un résultat, il ne fournit pas une réponse oraculaire utilisable sur les souhaits ou intentions du Peuple Souverain.

À titre d'exemple, je suis persuadé que si dans une élection entre deux candidats A et B les électeurs avaient le choix non pas entre deux bulletins (pour A et pour B), ils en avaient quatre, pour A, pour B, contre A et contre B, même si pour le mode de scrutin au sens strict voter contre A était traité exactement identique à voter pour B et symétriquement, au moins pour peu que la différence soit reflétée dans la présentation des résultats (par exemple, on compare les totaux pour_A − contre_A et pour_B − contre_B, ce qui revient mathématiquement au même que de comparer pour_A + contre_B et pour_B + contre_A, mais symboliquement c'est très différent, surtout si quelqu'un se retrouve élu avec un nombre de voix négatif), les électeurs se comporteraient différemment face à ces quatre bulletins que face à deux. Ceci montre que l'abstraction d'un mode de scrutin par une formalisation mathématique de la chose ne dit certainement pas tout.

À l'appui de cette affirmation, je peux par exemple évoquer le fait que lors du second tour de la dernière élection présidentielle française, j'ai rencontré un certain nombre d'électeurs — de gauche — qui m'ont expliqué qu'ils ne pensaient voter pour Emmanuel Macron que s'il avait des chances sérieuses d'être battu par Marine Le Pen. Or mathématiquement, et pour ce qui est du seul résultat du scrutin, dans une élection portant sur un choix binaire, le vote tactique n'a pas d'intérêt (un électeur rationnel vote pour son choix préféré, et c'est tout) : c'est la preuve que ces électeurs se préoccupaient d'autre chose que de l'issue du mode de scrutin stricto sensu, par exemple de l'interprétation qui en serait faite, du symbole, ou, bien entendu, de l'effort nécessaire pour aller jusqu'au bureau de vote.
En tout état de cause, c'est impossible de savoir ce qu'on veut comme mode de scrutin sans considérer l'ensemble de du fonctionnement des institutions et de la pratique du pouvoir (chose qui m'intéresse aussi, bien sûr). Ces questions sont profondément inséparables.

Par exemple, si le parlement est élu par un mode de scrutin donnant un résultat largement proportionnel, il faut au minimum soit que la culture politique soit capable de former des coalitions (parce que probablement aucune majorité absolue ne se dégagera au parlement) soit que l'exécutif puisse fonctionner sans majorité au parlement (soit que le régime soit présidentiel avec un exécutif indépendant, soit que différents mécanismes, par exemple une élection du chef du gouvernement par le parlement avec un mode de scrutin qui garantit un gagnant, et ensuite l'exigence que les motions de censure soient constructives, assurent une stabilité même d'un exécutif minoritaire). De façon contraposée, si la constitution exige une majorité stable au parlement, le mode de scrutin doit favoriser son dégagement, même si cela présente d'autres inconvénients : prime à la majorité, ou scrutin par circonscriptions (ce qui ne suffit pas forcément, comme on vient de le constater en France !).

Inversement, le mode de scrutin influe forcément sur la pratique du pouvoir, et pose forcément toutes sortes de questions sur le type de démocratie qu'on souhaite avoir. Certains modes de scrutin favorisent un petit nombre de grands partis (voire le bipartisme, comme aux États-Unis), auquel cas il faudra être d'autant plus sourcilleux sur la démocratie interne de chacun de ces partis. D'autres, au contraire, favorisent l'émiettement entre petits partis, ce qui est peut-être préférable si le but est d'obtenir un parlement représentatif de la diversité des opinions de l'électorat, mais forcément plus compliqué quand il s'agit de favoriser un exécutif stable (et la France risque de le constater malgré un mode de scrutin plutôt favorable aux grands partis).
D'autre part, on peut certainement souhaiter qu'un mode de scrutin soit compréhensible par les électeurs (ou au moins que ses principales caractéristiques le soient). Or ceci place une contrainte énorme sur ce qu'on peut imaginer mettre en place : car visiblement beaucoup de gens ont déjà du mal à comprendre la différence entre tel parti a remporté le plus grand nombre de voix dans le plus grand nombre de circonscriptions et tel parti a remporté le plus grand nombre de voix au niveau national, et si quelque chose d'aussi basique n'est déjà pas évident, c'est un peu difficile de concevoir un mode de scrutin qui le soit.

Ceci m'amène d'ailleurs à la remarque suivante : on aime bien dire aux mathématiciens que les mathématiques ne servent à rien hors des métiers spécialisés et hors du fait de savoir ajouter, soustraire, multiplier et diviser et peut-être calculer un pourcentage. Pourtant, comprendre des choses comme la différence entre tel parti a remporté le plus grand nombre de voix dans le plus grand nombre de circonscriptions et tel parti a remporté le plus grand nombre de voix au niveau national ou l'équivalence entre comparer pour_A − contre_A avec pour_B − contre_B, et comparer pour_A + contre_B avec pour_B + contre_A, c'est justement ce que le raisonnement mathématique et logique permet de saisir. Bref, c'est un peu contradictoire d'affirmer (et ce sont bien parfois les mêmes personnes qui le disent) que les mathématiques ne servent à rien et que des modes de scrutin un tant soit peu sophistiqués sont inacceptables car le grand public n'a pas le bagage mathématique pour les comprendre.

(Au demeurant, il y a déjà des modes de scrutin assez sophistiqués utilisés en France : celui des régionales, qui fonctionne avec une répartition proportionnelle des sièges entre les listes, puis une répartition proportionnelle des sections départementales au sein de chaque liste, est un exemple.)

[Lire la suite…]

↑Entry #2797 [older|※ permalink|newer] / ↑Entrée #2797 [précédente|※ permalien|suivante] ↑

↓Entry #2796 [older|※ permalink|newer] / ↓Entrée #2796 [précédente|※ permalien|suivante] ↓

2024-07-04 (jeudi)

Introduction aux mathématiques constructives : 1. un peu de théorie des ensembles

Avant-propos

Il y a quelques années j'avais publié sur ce blog une petite introduction générale aux mathématiques constructives (ou mathématiques sans le tiers exclu). Dans ce billet passé, j'avais cherché à en présenter très rapidement l'histoire (de façon j'espère compréhensible par le grand public), puis les motivations possibles (à quoi ça sert de faire des maths « constructives », et pourquoi ce terme ?) et les principes généraux (qu'est-ce que la logique intuitionniste, et comment fonctionne-t-elle ?). Cette introduction (dont je vais d'ailleurs répéter certains des points dans le présent billet) était, je pense, plus réussie que ma précédente tentative sur le même sujet. Mais on ne peut pas vraiment dire que j'avais parlé du fond du sujet : je n'avais pas vraiment donné d'exemples maths constructives (ni vraiment de raisonnement ni même de définitions) permettant de comprendre un peu comment « ça se passe ».

Le présent billet, et quelques uns qui doivent suivre, ont pour but de remédier un peu à ce manque : cette fois je ne veux pas m'attarder démesurément sur les aspects logiques ou « légalistes » (et surtout pas me placer dans un système formel très précis), je veux plutôt montrer « ce qui se passe » quand on retire la loi du tiers exclu de la logique et qu'on cherche à faire des maths comme ça : ce qui reste globalement inchangé, ce où il faut faire un peu attention, ce qu'il faut faire différemment, et ce qui ne marche plus du tout.

Il va de soi que je ne vais pas parler de choses très sophistiquées, surtout dans ce premier volet : théorie élémentaire des ensembles, suites d'entiers naturels, nombres réels, ce genre de choses. Les quelques théorèmes que je vais donner à titre d'illustration sont faciles : parfois complètement triviaux quand on les traite en maths classiques, et généralement pas bien difficiles non plus même en maths constructives, puisque mon but n'est pas de faire des choses compliquées (ni très systématiques même pour les choses que je vais évoquer) mais de montrer un peu « à quoi ça ressemble » et comment on tient des raisonnements simples en logique intuitionniste.

La logique intuitionniste étant plus faible que la logique classique (je vais un peu rappeler les choses ci-dessous), tout ce qu'on démontre en maths constructives est a fortiori valable en maths classiques. Donc en principe je pourrais écrire les choses en m'adressant à des gens qui ne connaissent rien à la théorie élémentaire des ensembles même en maths classiques : mais je pense que personne ne voudrait sérieusement lire ça, donc je vais plutôt supposer de la part du lecteur une familiarité modérée avec les concepts correspondants en maths classiques. Disons que je suppose que vous savez ce qu'est un ensemble (je ne veux pas forcément dire manier les axiomes de ZFC mais au moins les concepts d'union, d'intersection, de produit cartésien, de sous-ensemble, d'ensemble des parties, de singleton — ce genre de choses, et ce dans un cadre informel), et, pour les billets à venir après celui-ci, ce qu'est un entier naturel, un rationnel et un nombre réel. Je suppose aussi qu'on est familier avec la notion de fonction entre ensembles, l'identification d'une fonction à son graphe, avec la notion de relation d'équivalence et de classe d'équivalence, quelques choses de ce genre-là. Ceci me permettra, par exemple, de ne pas trop perdre mon temps à expliquer comment fonctionne un produit cartésien d'ensembles en maths constructives vu qu'il s'agit essentiellement de dire sur cet aspect-là il n'y a rien de surprenant, de nouveau ni de substantiellement différent par rapport aux maths classiques, et donc de me concentrer sur les questions où les maths constructives demandent plus de soin. Je suppose aussi mon lecteur familier avec les notations logiques telles que ‘∧’ (conjonction, ou « et » logique), ‘∨’ (disjonction, ou « ou » logique), ‘⇒’ (implication), ‘⊤’ (affirmation tautologiquement vraie), ‘⊥’ (affirmation tautologiquement fausse), ‘∀’ (quantification universelle) et ‘∃’ (quantification existentielle).

Certaines autres présentations des maths constructives essaient de faire en sorte de gommer la différence avec les maths classiques. (Bishop, par exemple, dans son livre d'analyse constructive, présente les choses d'une manière qu'on pourrait très bien lire comme un cours d'analyse classique : il présenter les maths constructives comme on pourrait présenter les maths classiques, de mettre l'accent sur là où « tout marche bien ». Car Bishop était un constructiviste dans l'âme, donc son but est de faire des maths, et il s'avère qu'il pense que le cadre constructif est le meilleur. Il ne s'agit pas pour lui de montrer les difficultés ou bizarreries de ce cadre, mais juste de faire des maths.) Moi, au contraire, je trouve intellectuellement plus intéressant de savoir ce qui change, ce qu'on perd, ce qui « marche mal », ou, finalement, ce qu'on gagne en phénomènes intéressants et « pathologiques », ou en distinctions fines qui deviennent classiquement triviales. Dans le présent billet, comme je ne suppose pas que le lecteur ait quelque connaissance que ce soit sur les topos (ni même ce que le mot signifie, même si je rappelle que j'ai écrit un billet sur le topos effectif), je ne peux pas vraiment donner de vrais contre-exemples montrant que telle ou telle pathologie peut se produire en maths constructives ; néanmoins, je peux (et je vais) essayer de donner un certain nombre de « contre-exemples brouwériens », un concept que je vais expliquer ci-dessous.

Méta : Pour finir cet avant-propos, je dois préciser que quasiment tout ce qui suit a été écrit par petits bouts entre 2022 et maintenant (suivant une idée que j'avais posée en 2021), et remanié plusieurs fois depuis, de manière très aléatoire. Il y a donc certainement des incohérences au moins stylistiques, si ce n'est notationnelles, présentationnelles, etc. Mais je pense rien de grave. Bref, j'avais progressivement écrit un long texte divisé en trois parties, avec une première sur la théorie élémentaire des ensembles, une seconde sur les naturels et les suites de naturels, et une troisième (inachevée) sur les nombres réels. C'est cette première partie que je publie aujourd'hui, je publierai la deuxième prochainement, quant à la troisième je dois encore décider si je m'efforce de la finir de façon plus ou moins satisfaisante ou si je la publie de façon inachevée. Toujours est-il que j'ai moi-même besoin de me référer de temps en temps à certaines des notions que j'introduis dans ce texte (surtout les notions de LPO, WLPO, LLPO, etc., qui seront discutées dans la partie 2) et c'est pour ça que je me décide à mettre tout ça en ligne même si ce n'est pas forcément hyper propre.

Partie 1 (un peu de théorie des ensembles) :

Partie 2 (entiers naturels et principes d'omniscience) :

Rappel du contexte et quelques notations

Redisons rapidement ici quelques unes des choses que j'ai évoquées dans ma précédente introduction aux maths constructives.

Très sommairement, donc, les maths constructives sont des maths faites en logique intuitionniste, c'est-à-dire dans laquelle on abandonne le principe de tiers exclu selon lequel toute affirmation P est soit vraie soit fausse (P∨¬P), ou, ce qui revient au même, que si une affirmation P n'est pas fausse alors elle est vraie (¬¬P⇒P ; en revanche, P n'est pas vrai est la même chose que P est faux, c'est la définition). (Les termes de maths constructives et de logique intuitionniste ne sont pas tout à fait interchangeables, mais je vais les traiter un peu comme tels : voir la partie historique de l'entrée précédente pour plus de précisions sur l'histoire des termes.) La logique intuitionniste étant plus faible que la logique classique, tout résultat obtenu dans ce cadre restera valable dans le cadre de la logique classique : on aura moins de théorèmes (et ceux qui restent peuvent devenir plus durs à démontrer), mais du coup, on peut considérer qu'une preuve constructive est plus forte (plus rare, donc plus difficile) qu'une preuve classique. Parmi les raisons de vouloir s'imposer la discipline de chercher à faire des preuves constructives, on peut notamment mentionner :

certains pensent (mais ce n'est pas mon cas) que les mathématiques constructives sont plus correctes, parce qu'elles sont plus en accord avec leur conception philosophique de l'univers mathématique (cf. ce que je racontais sur Brouwer) ; on peut aussi simplement penser que la logique intuitionniste, à défaut d'être plus correcte, est plus économique que la logique classique, et qu'on doit donc essayer de travailler avec ;
les preuves constructives (donc les théorèmes qu'elles produisent) sont valables plus largement que les preuves classiques (notamment, un énoncé constructivement valable est valable dans n'importe quel topos muni d'un objet d'entiers naturels) ;
les preuves constructives apportent plus d'information que les preuves classiques (notamment, dans certaines conditions, on peut extraire un algorithme d'une preuve constructive qui calcule l'objet dont le théorème affirme l'existence — d'où le terme de constructif) ;
la question de savoir ce qui est prouvable constructivement apporte un nouveau regard sur des théorèmes connus, qui peut être intéressant du point de vue logique, ou du point de vue pédagogique, en permettant de mieux comprendre les liens logiques entre les théorèmes et les difficultés à passer de l'un à un autre ;
le fait de s'assurer que les définitions ou les lemmes utilisées fonctionnent bien dans un contexte constructif peut être un critère pour choisir la « bonne » définition ou la « bonne » preuve entre des possibilités classiquement indifférentes (et on peut espérer que la « bonne » se généralisera mieux) : par exemple, classiquement, en topologie, on peut définir les fermés à partir des ouverts ou les ouverts à partir des fermés, mais constructivement, seule la première approche fonctionne, ce qui suggère qu'il vaut mieux définir une topologie par ses ouverts ;
certains outils informatiques assistants de preuve, provenant de systèmes de typage, fonctionnent naturellement en logique intuitionniste : même si on peut les faire travailler en logique classique en postulant le principe du tiers exclu, on peut penser qu'une preuve valable constructivement sera plus facile à produire, à analyser ou à utiliser dans de tels outils ;
et enfin, bien sûr, la question de savoir si un résultat est valable constructivement est une question mathématique (classique !) tout à fait légitime, qu'on peut considérer pour son intérét intellectuel intrinsèque.

Mais avant de commencer vraiment, il faut que je dise un mot sur les règles du jeu. J'ai (plus ou moins) décrit les règles de la logique dans une partie de mon entrée précédente, et mon but est de les illustrer par l'exemple, donc je ne vais pas les réexpliquer ici, mais il faut que je parle un peu du cadre dans lequel je me place (parce qu'il n'y a pas un cadre unique pour faire des maths constructives) :

Dans ce qui suit, je vais me placer dans un cadre informel utilisant des conventions fondationnelles choisies pour dérouter le moins possible le mathématicien classique. Techniquement, les choses que je vais dire (correctement formalisées) seront vraies dans n'importe quel topos muni d'un objet d'entiers naturels, ou seront des théorèmes de la théorie IZF (un analogue assez standard de ZF en logique intuitionniste), mais je n'ai pas envie de définir ni ce qu'est un topos ni ce que sont les axiomes d'IZF parce que ce serait contraire à mon objectif pédagogique. Je vais essayer de rester agnostique ou vague quant à la question de savoir si je considère que « tout est un ensemble » (comme c'est le cas si on se place dans IZF) ou si les objets ont des types (ça n'a pas vraiment de rapport avec l'intuitionnisme, disons qu'il est peut-être plus tentant en maths constructives de travailler dans des théories des types que dans des fondements ensemblistes, mais comme mon but est de faire des choses élémentaires je n'ai pas envie de faire de choix ni même d'expliquer la différence). Pour ceux qui ont besoin de détails (les autres, sautez la fin de ce paragraphe), je précise cependant certaines des choses que je prends dans mes fondations, ou qui en résulte. D'abord, l'égalité fonctionne comme on l'attend classiquement, c'est-à-dire que c'est la plus fine relation d'équivalence et elle est extensionnelle (c'est-à-dire que d'une part si x=y alors f(x)=f(y) pour n'importe quelle fonction f, prédicat ou expression faisant intervenir une variable libre ; et d'autre part si deux ensembles X,Y ont les mêmes éléments, ∀t.(t∈X⇔t∈Y), alors ils sont égaux, et si deux fonctions f,g ayant mêmes source et but prennent les mêmes valeurs ∀t.(f(t)=g(t)), alors elles sont égales). Je suppose aussi que les ensembles de parties peuvent être formés librement, et je noterai 𝒫(X) l'ensemble des parties de X (par ailleurs l'ensemble des parties d'un singleton jouera notamment un rôle crucial comme l'ensemble des « valeurs de vérité », je vais y venir). En revanche, je ne peux pas supposer l'axiome du choix (on va voir qu'il implique le tiers exclu), et je ne veux pas le faire, même pas l'axiome du choix dénombrable, parce que même classiquement il y a un intérêt à étudier ce qui se passe sans lui, mais je vais revenir sur ce sujet ; je vais quand même postuler l'« axiome du choix unique » (ou axiome du non-choix) que j'expliquerai plus loin.

☞ Je rappelle à toutes fins utiles que dire P (où P est une formule logique) signifie exactement la même chose que de dire P est vraie (cf. le début de cette entrée, qui concerne les maths classiques mais ce n'est pas pertinent ici) ; et dire P est fausse ou P n'est pas vraie signifie exactement la même chose que ¬P (la négation de P, qui est un raccourci de langage pour P⇒⊥, c'est-à-dire si P est vraie, alors les poules ont des dents). Là où la logique intuitionniste diffère de la logique classique c'est qu'elle ne permet pas de passer de P n'est pas fausse (i.e., ¬¬P) à P est vraie. (En revanche, trois négations équivalent à une seule, quatre à deux, etc. : il est faux que P n'est pas fausse est pareil que P est fausse, et il n'est pas faux que P n'est pas fausse est pareil que P n'est pas fausse.)

Ça n'a rien à voir avec la logique intuitionniste, mais je signale aussi, s'il y avait un doute, que P⇒Q⇒R doit se lire comme P⇒(Q⇒R), et qu'il est équivalent à P∧Q⇒R (lequel doit se lire, lui, comme (P∧Q)⇒R). Sauf dans le contexte où je signale informellement un tas d'implications en série : on a les implications successives P ⇒ Q ⇒ R ⇒ S doit bien sûr se comprendre comme on a P⇒Q et aussi Q⇒R et aussi R⇒S. J'espère que cela ne causera pas de confusion.

Pour attirer l'attention sur les principales surprises des maths constructives par rapport aux maths classiques, j'utiliserai le souligné comme ceci (pour dire quelque chose comme on ne peut pas affirmer que pati-pata) ou le rouge comme ceci (pour un bout de raisonnement qui n'est pas valable constructivement ; mais de toute façon je le dirai toujours explicitement).

❦

Ensembles vides et habités, singletons, sous-terminaux, valeurs de vérité

Commençons par la notion la plus simple qui soit, celle d'ensembles vide et habités.

On dit que E (un ensemble « dans l'univers » ou bien une partie d'un autre ensemble X, j'ai dit que je ne voulais pas rentrer dans ce genre de questions) est vide lorsqu'il n'a pas d'élément, c'est-à-dire, en symboles, ¬∃x.(x∈E) (il n'existe pas de x qui appartienne à E) ou, ce qui revient logiquement au même ∀x.¬(x∈E) (quel que soit x, il est faux que x appartienne à E), ou si on préfère l'écrire comme ça, ∀x∈E.(⊥) (tout x appartenant à E conduit à une absurdité, le symbole ‘⊥’ désigne l'énoncé tautologiquement faux, et l'ensemble vide est donc l'ensemble des x qui vérifient ⊥), avec la convention habituelle que ∀x∈E.(P(x)) signifie ∀x.(x∈E⇒P(x)) (de même que ∃x∈E.P(x) signifie ∃x.(x∈E∧P(x)) ; et je rappelle par ailleurs que ¬P signifie P⇒⊥).

Tout ce que je viens de dire est exactement pareil qu'en mathématiques classiques, et on note ∅ l'ensemble vide (unique par extensionnalité, au moins en tant que partie d'un X fixé).

Mais la notion d'ensemble non-vide, i.e., d'ensemble vérifiant ¬(E=∅), elle, n'a que très peu d'intérêt constructif : un ensemble E est non-vide s'il vérifie ¬¬∃x.(x∈E) ou, ce qui revient au même ¬∀x.¬(x∈E), mais on ne peut pas faire grand-chose avec un ensemble non-vide : notamment, on ne peut pas affirmer qu'un ensemble non-vide a un élément (je vais revenir là-dessus ci-dessous).

Ce qui est beaucoup plus utile, donc, est la notion d'ensemble habité, c'est-à-dire d'ensemble vérifiant ∃x.(x∈E), ou, si on préfère l'écrire comme ça, ∃x∈E.(⊤) (le symbole ‘⊤’ désigne l'énoncé tautologiquement vrai) : un ensemble habité est un ensemble ayant un élément. Du coup, un ensemble vide est simplement un ensemble non-habité (ou inhabité, mais attention à la confusion entre français et anglais ici !).

Il s'agit là d'un exemple extrêmement simple d'un phénomène assez courant en mathématiques constructives : quand on a deux notions qui classiquement sont simplement la négation l'une de l'autre (parfois les deux ont un nom, parfois seulement l'une des deux), constructivement on va généralement attacher plus d'importance à celle qui permet de définir l'autre comme sa négation (ici, habité permet de définir vide comme non-habité, mais vide ne permet pas de définir habité, qui est plus fort que non-vide) : généralement parlant, en mathématiques constructives, les négations ont d'assez mauvaises propriétés, donc on s'attache autant que possible à définir des notions positives. (Bien sûr, la situation n'est pas toujours aussi simple que ce que je viens de décrire : parfois une même notion classique donne naissance à plusieurs notions constructives entre lesquelles il n'est pas évident de choisir, voir par exemple ici/là sur Twitter concernant la notion de « corps ».)

[Lire la suite…]

↑Entry #2796 [older|※ permalink|newer] / ↑Entrée #2796 [précédente|※ permalien|suivante] ↑

↓Entry #2795 [older|※ permalink|newer] / ↓Entrée #2795 [précédente|※ permalien|suivante] ↓

2024-06-28 (vendredi)

L'extrême-droite a d'ores et déjà gagné

J'écris ce billet à reculons. À quoi cela sert-il ? Tant de gens ont écrit tellement de choses sur le cloaque nauséabond qu'est devenue la scène politique française, et s'il y a beaucoup d'inanités parmi ces commentaires, je ne me crois pas spécialement capable de faire mieux : je n'ai pas de lumière particulière, ni de compétence spéciale en politologie ou telmatologie (étude des marais) à apporter. Pas plus ne crois-je à la vertu cathartique d'exposer publiquement mes angoisses : je l'avais fait pendant la pandémie, et je n'ai pas l'impression que l'exercice de style m'ait aidé à supporter la suite.

Néanmoins, le précédent billet sur les élections européennes appelle naturellement à une suite sur les législatives françaises, et j'aurais du mal à écrire à un autre sujet comme si ne rien était. Mais je ne veux pas, et je n'ai ni le temps ni la force mentale, d'essayer de construire un billet rigoureusement structuré en 4 parties et 12 sous-parties. Je vais donc essayer l'exercice d'écrire en mode « courant de conscience » en écrivant comme je le sens et en me donnant une heure limite pour publier, et tant pis si ce que je publie ne ressemble à rien (et va probablement se contredire). Personne, après tout, ne vous oblige à lire ma logorrhée.

Commençons par résumer l'histoire et la situation factuelle politique françaises pour le bénéfice d'éventuels lecteurs non français, ou d'ailleurs à des lecteurs qui retomberaient sur ce billet depuis une époque future tellement plus merdique encore que 2024 ressemblera au bon vieux temps comme je suis actuellement en train de me dire que la pandémie de 2020 c'était le bon vieux temps : je prends une couleur différente pour ce résumé que j'espère à peu près objectif, et je reviens à ma propre voix après.

Sur les institutions françaises : La France a un système politique bâtard, ni vraiment parlementaire ni vraiment présidentiel : le gouvernement est responsable devant la chambre basse du parlement (Assemblée nationale, élue pour 5 ans), c'est-à-dire qu'il peut en être renversé comme dans un régime parlementaire ; mais en même temps, ce gouvernement est nommé de façon plus ou moins discrétionnaire par un président élu directement au suffrage universel (c'est le seul à être élu directement par tous les Français, aussi pour 5 ans), et la pratique des institutions donne, de plus en plus, l'essentiel des pouvoirs (exécutif, mais aussi prééminence politique de fait) au président, au moins dans la mesure où celui-ci dispose d'une majorité au parlement, devant lequel il n'est pas responsable (comme dans un régime présidentiel), mais qu'il a le droit de dissoudre en convoquant de nouvelles élections (pas deux fois à moins d'un an d'intervalle, cependant) ; en revanche, s'il y a au parlement une majorité hostile au président, il peut en pratique lui imposer un Premier ministre qui disposera alors de l'essentiel du pouvoir exécutif, et on parle de cohabitation pour cette situation (qui s'est produite pour la dernière fois de 1997 à 2002, et qu'on pensait disparue depuis que les calendriers des élections présidentielle et législatives ont été synchronisés).

Sur le paysage politique français : Pendant longtemps (en gros de la fin des années 1970 jusqu'à 2017), le paysage politique français a été dominé par deux blocs, avec à gauche un parti essentiellement social-démocrate malgré son nom de Parti socialiste, et à droite un bloc vaguement libéral-conservateur, « gaulliste » comme on dit en référence à Charles De Gaulle, dont le nom a changé plusieurs fois, son dernier avatar étant appelé les Républicains ; entre les deux, un centre presque inexistant, qui se ralliait presque toujours avec la droite, et des écologistes à l'importance et aux positions variables ; plus loin à gauche, un parti communiste d'importance déclinante et quelques petits partis ; et plus loin à droite, le Front national, ultérieurement renommé en Rassemblement national, parti national-populiste fondé en 1972 par un rassemblement hétéroclite de jeunes néofascistes, d'anciens fascistes (dont plusieurs anciens SS), de sympathisants de l'OAS (un groupuscule terroriste opposé à l'indépendance de l'Algérie) et d'autres mouvances de l'extrême-droite : ce parti a été pris en main par Jean-Marie Le Pen, puis par sa fille Marine Le Pen en 2011 qui a changé son nom en Rassemblement national en 2018 dans le cadre d'une opération de dédiabolisation du parti.

En 2017, l'élection du président Macron a fait exploser ce paysage politique : ancien ministre du président sortant (François Hollande), du Parti socialiste, Macron s'est présenté comme centriste et a attiré à lui à la fois une bonne partie des cadres mais aussi des électeurs de ce Parti socialiste, mais aussi une partie de ceux des partis de la droite libérale. Le Parti socialiste étant ainsi réduit à presque rien, la force dominante de gauche s'est constituée autour du parti de la France insoumise (LFI) de Jean-Luc Mélenchon (ancien du Parti socialiste mais qui l'a quitté en 2008), qui relève idéologiquement de la gauche anticapitaliste. Le président Macron disposait d'une importante majorité à l'Assemblée nationale lors de son premier mandat (2017–2022), mais n'a recueilli qu'une majorité relative suite à sa réélection en 2022 : sociologiquement, sinon idéologiquement, si les électeurs de Macron et de son parti en 2017 étaient à la fois de centre-gauche et de centre-droit, en 2022 ils étaient essentiellement de centre-droit. L'Assemblée nationale de 2022 comportait un bloc de gauche, surtout dominé par la France insoumise de Jean-Luc Mélenchon, beaucoup plus important qu'en 2017 (la France insoumise et le Parti socialiste avaient réussi à s'allier pour les élections, mais leur alliance n'a pas tenu longtemps), et un groupe d'extrême-droite Rassemblement national plus important que jamais auparavant à l'Assemblée nationale ; le groupe du camp présidentiel (centre-droit, donc) disposait d'une majorité relative, mais il devait s'allier à la droite gaulliste (ou, occasionnellement, à un autre groupe) pour pouvoir faire passer les textes de loi.

Le Rassemblement national (et surtout le Front national qui est son nom antérieur) avait toujours largement été bloqué, lors des élections qui se déroulent à deux tours, par la pratique du front républicain : un accord informel aux contours flous selon lequel, si le Front national est en passe de remporter une élection, les électeurs de tous les autres camps s'unissent contre lui lors du second tour (c'est-à-dire votent pour le candidat qui lui fait face, quel qu'il soit). Mais depuis la montée en puissance de la gauche anticapitaliste de la France insoumise, les partis de droite ont largement dénoncé cet accord en qualifiant la France insoumise de parti d'extrême-gauche donc hors du champ de l'arc républicain, si bien qu'ils proposent plutôt le ni-ni au second tour (on ne vote ni pour la France insoumise ni pour le Rassemblement national, ce qui veut dire qu'on vote blanc ou qu'on s'abstient).

Sur le coup de tonnerre de la dissolution : Les élections européennes du 9 juin ont donné, comme les sondages l'avaient prévu, un score très élevé de la liste d'extrême-droite du Rassemblement national (31%), suivie d'assez loin par celle de centre-droit du camp présidentiel (15%), deux listes de gauche (celle soutenue par le Parti socialiste à 14%, celle de la France insoumise à 10%), et ensuite la droite gaulliste à 7%, les écologistes à 6%, et une autre liste d'extrême-droite (d'orientation plutôt nationaliste réactionnaire) à 5%.

Ceci n'était une surprise pour personne. Ce qui l'a été, cependant, est qu'Emmanuel Macron a annoncé sa décision de dissoudre l'Assemblée nationale, et d'annoncer des élections législatives dans un délai extrêmement court. On peut dire que tout le monde, jusqu'à son propre camp et son propre Premier ministre, a été choqué par cette décision. La raison affichée en était de laisser les électeurs s'exprimer. L'analyse la plus plausible des intentions du président est qu'il comptait sur les désaccords au sein de la gauche (qui était partie en ordre dispersé aux élections européennes) pour espérer récupérer des sièges à ses dépens, un peu comme il l'avait déjà fait en 2017 lorsqu'il avait fait exploser le Parti socialiste, et faire pareil à sa droite, pour finalement reconstituer sa majorité seule contre le Rassemblement national.

Il s'en est suivi la semaine politique sans doute la plus folle que la France ait jamais connue. Contre toute attente, la gauche a réussi à trouver un accord, entre la France insoumise, le Parti socialiste, les écologistes et le parti communiste, sous le nom de Nouveau Front Populaire (une référence au Front populaire de 1936), au moins pour ce qui est des candidats et un programme commun qui laisse cependant de grosses zones d'ombres car les composantes du Nouveau Front Populaire sont en désaccord sur de nombreux points. La droite gaulliste des Républicains, au contraire, a explosé autour de la question de l'alliance avec le Rassemblement national (le président du parti a été exclu par son propre parti pour avoir proposé cette alliance, puis un tribunal a annulé cette explosion, et toute la séquence était complètement folle avec ce président qui s'était enfermé à clé dans son bureau). Quant au camp présidentiel, il s'est largement affaissé dans les sondages, notamment à la défaveur de l'impopularité grandissante d'Emmanuel Macron (à qui ses alliés ont demandé de rester en-dehors de la campagne pour ne pas trop les handicaper).

Les élections (qui se déroulent séparément dans 577 circonscriptions, en deux tours) ont lieu les 30 juin et 7 juillet prochains. À l'heure où j'écris, même si tous les scénarios restent imaginables, le plus probable est soit que l'extrême-droite du Rassemblement national obtienne la majorité absolue, soit qu'il ne lui manque que peu de sièges pour ça, en tout cas il est presque certain qu'il sera le groupe le plus important à l'Assemblée, probablement suivi du groupe de gauche du Nouveau Front Populaire, du groupe de centre-droit du parti de Macron, et d'une droite gaulliste presque laminée (mais possiblement en position de « faiseurs de rois » en apportant les sièges manquants au Rassemblement national).

Ce qui est sûr, en tout cas, est qu'il y a actuellement trois grands camps en compétition dans cette élection : le Rassemblement national (extrême-droite nationale-populiste, donc), le camp du président (qui s'appelle techniquement Renaissance mais personne ne connaît ce nom ; centre-droit libéral), et l'alliance des gauches du Nouveau Front Populaire (qui va de la gauche anticapitaliste, voire révolutionnaire, à la sociale-démocratie en passant par les écologistes). Les trois se détestent mutuellement.

La situation est doublement inédite en France, parce que d'abord l'extrême-droite n'a jamais été aussi haute dans les sondages ni a fortiori en position d'exercer le pouvoir (ceci n'est pas arrivé depuis le régime collaborationniste du Maréchal Pétain en 1940–1944), et d'autre part qu'il existe un risque sérieux qu'aucune majorité ne puisse être trouvée à l'Assemblée car aucun deux des trois camps qu'on vient de dire ne pourraient surmonter leurs divergences pour soutenir un gouvernement, ce qui rendrait la question de qui gouverne la France extrêmement confuse (même si juridiquement le président peut nommer n'importe qui comme Premier ministre tant que l'Assemblée ne le renverse pas, la question politique est pleine d'incertitude).

❦

Bon, ce qui précède est écrit de façon qui se veut factuelle, mais sans encore connaître les résultats des élections qui viennent, je pense déjà pouvoir dire ceci :

Le match est plié. L'extrême-droite a d'ores et déjà gagné.

Si elle n'emporte pas une majorité suffisante pour prétendre gouverner, le pays sera gouverné par une coalition hétéroclite entre un centre-droit complètement discrédité et associé à un président profondément impopulaire, et une gauche tactiquement unie mais dont les divergences émergeront dès le lendemain des élections (et qui a écrit un programme auquel personne ne croit sérieusement parce qu'elle ne croit pas sérieusement gouverner). Ceci discréditera les forces de cette « grande coalition » et renforcera d'autant plus l'extrême-droite qui sera alors quasi-certaine de remporter les élections présidentielle et législative en 2027. Ou peut-être que le pays sera gouverné par un gouvernement « technocratique », supposément apolitique, en réalité centriste, et le résultat sera le même. Même si la coalition de gauche remportait à elle seule une majorité absolue (et ça n'arrivera pas), ses marges de manœuvre seraient tellement faibles qu'elle décevrait forcément, et là aussi, l'extrême-droite serait hégémonique en 2027.

Si, au contraire, l'extrême-droite remporte une majorité, elle ne deviendra pas pour autant impopulaire en exerçant le pouvoir. Car contrairement à la gauche qui promet des mesures économiques qu'elle n'aurait pas la latitude de prendre, l'extrême-droite promet des mesures symboliques qui sont tout à fait possibles : l'autoritarisme, la répression policière et la destruction de l'état de droit sont des choses qu'on peut beaucoup plus facilement appliquer avec succès[#] que la justice sociale. Et même pour les mesures que l'extrême-droite n'arrivera pas à prendre, ils auront beau jeu de prétendre qu'on les aura empêchés d'exercer la plénitude du pouvoir, par exemple parce que le président se sera réservé quelques prérogatives ou leur aura mis des bâtons dans les roues (ce sera peut-être un mensonge, mais peu importe), ou que le Conseil constitutionnel aura censuré une loi trop outrancière.

[#] Pour le dire de façon encore plus simple : ce que promet l'extrême-droite, c'est de faire souffrir les gens (comme les immigrés, divers groupes ethniques ou religieux, mais aussi des professions comme le monde de la culture ou les profs) qu'elle désigne comme coupables et responsables de toutes sortes de maux. Or faire souffrir les autres est une promesse qu'il n'est pas difficile de tenir, à la différence de celles de la gauche.

Autrement dit : si le Rassemblement national perd maintenant, il gagnera en popularité et sera quasi-certain de gagner en 2027, et s'il gagne maintenant, il gagnera en popularité et sera quasi-certain de gagner en 2027. Il peut perdre (ou du moins ne pas gagner autant que prévu) dans une semaine, mais il ne peut pas perdre à moyen terme. (Il finira peut-être par perdre, un jour, à long terme, si la France a encore des élections libres à ce moment-là, comme la droite polonaise a fini par céder à une coalition centriste en 2023, mais il est possible que ça n'arrive pas avant une génération — voire jamais si la France tombe véritablement dans l'autoritarisme —, et même si ça se produit, ce ne sera pas une défaite définitive.)

Je vois ça comme aussi inévitable que la pandémie de covid à partir du moment où il y a eu des cas en-dehors de la Chine (je vais revenir sur cette comparaison).

[Lire la suite…]

↑Entry #2795 [older|※ permalink|newer] / ↑Entrée #2795 [précédente|※ permalien|suivante] ↑

↓Entry #2794 [older|※ permalink|newer] / ↓Entrée #2794 [précédente|※ permalien|suivante] ↓

2024-06-07 (vendredi)

Le déclin des libertés fondamentales

Il y a des élections européennes après-demain, et je pense que je vais voter pour le Parti pirate.

Ils n'ont absolument aucune chance d'atteindre les 5% nécessaires en France pour entrer au parlement, donc cela revient fonctionnellement presque pareil que de voter blanc (à la différence importante près que comme les 5% sont calculés sur les suffrages exprimés[#][#2], voter pour une liste qui n'aura finalement pas de siège est aussi, par rapport à voter blanc, une façon de pénaliser les listes proches de 5% : il est possible que ceci soit dans mes intentions, mais ce n'est pas ce dont je veux parler ici). Il est heureusement plausible que d'autres pays envoient des députés du Parti pirate au Parlement européen (il y en a actuellement quatre, trois venus de République tchèque et un d'Allemagne ; par le passé, la Suède en a aussi envoyé) ; cela traduit d'ailleurs peut-être quelque chose sur la France[#3] qu'ils n'aient aucune chance ici alors que dans d'autres pays c'est au moins imaginable.

[#] Comme d'habitude, la loi électorale française à ce sujet est tellement mal écrite que c'est criminel. (Déjà, je me demande ce qu'elle fait à ne pas être dans le Code électoral : incompétence habituelle du législateur qui pond ses merdes sur le bas-côté sans prendre la peine de nettoyer après.) Le chiffre est en l'occurrence dans l'article 3 : cet article explique quoi faire en cas d'égalité parfaite dans les calculs, situation qui a essentiellement zéro chances d'arriver, mais n'explique pas ce qu'on doit faire si aucune liste ne dépasse les 5%, chose qui n'est pas forcément si invraisemblable que ça (même si ça n'arrivera pas ce dimanche). D'ailleurs, s'il y a une seule liste qui dépasse les 5%, veut-on vraiment attribuer tous les sièges à celle qui aurait fait 5.01% alors que toutes les autres font 4.99% ? Est-ce que les gens qui ont écrit ce texte ont un peu réfléchi à ce qu'ils écrivaient ? (Dans d'autres élections avec un seuil, par exemple pour passer au second tour, on qualifie d'office les deux candidats arrivés en tête, donc le texte pourrait prévoir une répartition entre les listes dépassant 5% ainsi que les deux [ou trois] listes ayant obtenu le plus de voix.)

[#2] Notons au sujet de ce seuil d'entrée au parlement européen qu'en Allemagne, la loi électorale prévoyait un seuil à 3% mais que la Cour constitutionnelle fédérale a invalidé cette clause en 2014 comme contraire au principe constitutionnel d'égalité électorale (elle avait déjà invalidé une clause à 5% en 2011 pour la même raison). Le raisonnement de la Cour, pour autant que je comprends, est que s'il est acceptable de mettre un seuil sur les élections à la proportionnelle pour entrer à la diète fédérale allemande (Bundestag) car il est essentiel de pouvoir former une coalition gouvernementale et que les seuils d'entrée évitent le morcellement des partis, ce raisonnement ne s'applique pas au parlement européen en l'état actuel. Je mentionne ça parce que c'est pertinent pour ce que je raconte dans ce billet : on peut trouver bizarre qu'en Allemagne il soit jugé contraire au droit fondamental d'égalité devant les élections de mettre un seuil de 5%, ou même de 3%, pour les élections au parlement européen, alors qu'en France, pour les mêmes élections au même parlement, ça ne pose apparemment pas de problème. La situation est encore compliquée par le fait que certains cherchent (ou ont cherché ? je n'ai pas compris où en est cette affaire) à faire entrer la mention d'un seuil minimal à 2% dans l'acte européen à ce sujet (lequel primerait sur le droit national, fût-il constitutionnel) : voyez ici pour un résumé de tout ce bordel.

[#3] Bon, deux des choses que ça dit c'est d'une part qu'en France il y a un bulletin par liste, à imprimer aux frais de la liste (donc le Parti pirate n'en a pas parce qu'il n'a pas les sous, donc personne ne vote pour lui parce qu'il faut imprimer son propre bulletin à l'avance), plutôt qu'un bulletin unique sur lequel on coche une case comme dans beaucoup d'autres pays ; et, d'autre part, qu'il y a ce fameux seuil de 5% sur l'élection à la proportionnelle, au sujet duquel je renvoie aux deux notes précédentes. Mais il y a sans doute d'autres facteurs qui jouent, parce que même sans seuil à 5% il est peu vraisemblable que le Parti pirate puisse élire un député européen en France. Le nom ridicule y est peut-être pour quelque chose, mais il est le même ailleurs en Europe. Il y a peut-être le fait que la France a toujours eu une attitude extraordinairement traditionaliste sur les questions de propriété intellectuelle (au motif, notamment, de la fameuse « exception culturelle française » qui fait du ministère de la culture une sorte de ministère du lobbying pour le copyright), mais je ne sais pas si cette attitude déteint vraiment sur le grand public qui, après tout, doit partager des mèmes et des vidéos sur Internet autant que dans d'autres pays. L'éléphant au milieu de la pièce, c'est surtout l'accès aux médias et, à travers eux, au discours public.

Ce n'est pas que je sois parfaitement aligné avec la totalité du programme du Parti pirate (leur idée de démocratie directe, par exemple, me semble être un mirage, et j'ai déjà raconté sur ce blog ce que je pensais du referendum ; et surtout je n'apprécie vraiment pas leur positionnement en faveur des cryptoscams), programme qui part d'ailleurs parfois un peu dans tous les sens (enfin, ce n'est pas comme si tous les programmes de toutes les listes ne partaient pas dans tous les sens[#4] !). Mais j'ai quand même été très favorablement impressionné par le travail mené par le député pirate européen (envoyé par l'Allemagne) Felix Reda[#5] entre 2014 et 2019, notamment la recherche de compromis qu'il a menée sur la directive européenne sur le copyright. Vous n'avez jamais entendu parler ni de lui ni de cette directive ? Ça fait justement partie du problème que je veux évoquer ici. (Ça et l'idée répandue chez le grand public que le copyright est quelque chose d'extrêmement technique et qui ne les concerne pas du tout : ce qui montre que le grand public, qui passe quand même beaucoup de temps à créer, modifier et partager des contenus sur Internet, ne se rend pas compte de combien les lois sur le copyright le concernent, sinon directement par les contenus qu'il échange, du moins indirectement par les actions, par exemple de modération, qu'elles imposent aux plateformes sur lesquelles il partage ces contenus ou en consomme.)

[#4] Et puis quand on compte le nombre de notes et de digressions de ce billet, je suis mal placé pour critiquer ça part dans tous les sens.

[#5] Il était connu à l'époque sous un autre genre et un autre prénom (Julia — je le mentionne parce que ça peut aider à chercher).

Disons que j'ai aussi l'impression que le Parti pirate est le seul qui soit véritablement attaché aux libertés fondamentales pour elles-mêmes (et pas comme un outil commode quand elles vont dans le sens politique qu'on veut et qu'on va ensuite laisser tomber quand elles nous embêtent). C'est peut-être parce que je n'ai pas un positionnement politique très clair et que je suis plus attaché aux principes généraux que j'apprécie de voir quelque chose de ce style chez eux. C'est peut-être aussi, bien sûr, parce qu'ils n'ont jamais été au pouvoir et ne le seront sans doute jamais : il est indéniable que la réalité puante du pouvoir corrompt même des gens initialement bien intentionnés ; car quand on est au gouvernement, on découvre soudainement que les libertés fondamentales sont des protections contre vous[#6] et votre pouvoir de police. Les libertés fondamentales peuvent être un idéal quand on n'est pas au pouvoir et devenir bizarrement une nuisance quand on y est.

[#6] Point de grammaire sans rapport avec le fond : je n'ai jamais su quel est censé être la forme objet/oblique du pronom indéfini on en français. Si je prends la phrase quand nous sommes au pouvoir, nous nous rendons compte que les libertés fondamentales du citoyen les protègent contre nous, donc nous ciblent directement et que j'essaie de la formuler avec on (je parle du on indéfini, pas du on mis pour dire nous, justement), je dois dire quoi ? quand on est au pouvoir, on se rend compte que les libertés fondamentales du citoyen les protègent contre [???], donc [???] ciblent directement — c'est vraiment moche dans tous les cas, mais vous semble le moins horrible ici. (La question est évoquée par Grevisse dans Le Bon usage, §754(e), mais, comme d'habitude, sans vraie réponse.)

Prenons à titre d'exemple un point précis concernant les droits fondamentaux qu'il me semble pertinent à évoquer à l'approche des élections européennes : la proposition de chat control (= règlement CSAR) par la Commission européenne, qui consisterait à rendre obligatoire un contrôle du contenu des conversations privées par mail ou messagerie instantanée sur smartphone des Européens (je parle de Signal, Whatsapp, Telegram, ce genre de choses, et bien sûr aussi les messageries privées intégrées dans Facebook, Twitter, etc.). L'objectif affiché est de lutter contre les contenus pédopornographiques, et le moyen proposé est essentiellement de mettre en place un scan obligatoire de toutes les communications électroniques de tous les Européens pour vérifier qu'ils ne s'échangent pas de contenus illégaux. Les détails sont flous parce que, au moment où j'écris, la proposition est en cours de négociation entre la Commission, le Conseil et le Parlement européens, donc le contenu exact de la proposition change (et il est très très difficile de suivre l'avancement de ce genre de négociations), donc je vous renvoie à cette page du député européen (pirate[#7], justement) Patrick Breyer pour plus de détails, ou encore ces explications par La Quadrature du Net. Certaines versions de la proposition sont un petit peu moins dystopiques que d'autres (le Parlement européen dans sa composition actuelle ne semble pas prêt à voter les pires versions du texte), mais dans tous les cas il est question, sous prétexte de protéger les petits enfants, d'aller à l'encontre du droit du secret de la correspondance en imposant des logiciels mouchards sur tous les smartphones qui vont chercher à savoir[#8] si les images que vous échangez ne ressemblent pas[#9] à des photos d'enfants nus.

[#7] Dont j'espère qu'il sera réélu au moins pour que je puisse continuer à être informé sur ce dossier.

[#8] Le discours des partisans d'un tel contrôle est, bien sûr, que si vous n'êtes pas un pédophile vous n'avez aucune raison de vous émouvoir d'un tel contrôle (ce qui suggère d'ailleurs insidieusement la contraposée : si vous vous en émouvez, c'est suspect !). Mais rappelons que même si on n'est pas attaché au principe général du secret de la correspondance (qui, fatalement, doit s'appliquer à tous, même les criminels), de tels filtres automatisés viennent forcément avec des chances de faux positifs. Je pourrais par exemple renvoyer à cette histoire, aux États-Unis, d'un père qui a pris sur son smartphone des photos de son bambin nu pour les montrer à son médecin (parce que l'enfant avait une inflammation du pénis) : quand il a fait des sauvegardes dans le cloud, les filtres automatisés de Google on signalé ces images à la police, et même s'il n'a finalement pas fait l'objet de poursuites légales, il a subi une enquête policière et, surtout, son compte Google a été fermé définitivement (y compris son courrier GMail) : il était évidemment impossible de se faire entendre de qui que ce soit chez Google, et par ricochet il a perdu l'accès à énormément de données (comme plein d'autres photos personnelles et parfaitement innocentes), à d'autres comptes, etc. (J'ai évoqué ces problèmes de ricochet dans ce billet passé.) Bref, le discours si vous n'avez rien à cacher, vous n'avez rien à craindre, en plus d'être insidieux, est tout simplement faux, surtout si la police est faite, dans la pratique, par des outils automatisés dont personne ne comprend bien le fonctionnement, et contre lesquels il est impossible de faire appel sans tomber dans un monde parfaitement kafkaïen. Même si vous n'avez pas d'images pédophiles sur votre smartphone, vous avez peut-être des images que des IA stupides vont prendre pour des images pédophiles !

[#9] Pour une certaine définition de ressembler. Je suis sûr qu'il est techniquement possible de faire des images de chats qui sont délibérément modifiées juste comme il faut pour qu'elles apparaissent comme des images pédophiles à tel ou tel filtre qui les détecte (i.e., des faux positifs adversariaux). Et ensuite s'arranger pour faire parvenir anonymement ces images à des gens dont on veut faire fermer le compte Google. C'est une sorte de forme de swatting, si on veut.

[Lire la suite…]

↑Entry #2794 [older|※ permalink|newer] / ↑Entrée #2794 [précédente|※ permalien|suivante] ↑

↓Entry #2793 [older|※ permalink|newer] / ↓Entrée #2793 [précédente|※ permalien|suivante] ↓

2024-05-26 (dimanche)

De la beauté et symétrie de la configuration de Desargues

Le théorème de Desargues, que je veux présenter ici, est à la fois un des plus simples et selon moi un des plus jolis et des plus importants de la géométrie plane. Simple, parce qu'il n'est question que de points et de droites (pas de distances, d'angles, de cercles ni de quoi que ce soit du genre, même pas de parallélisme ou de perpendicularité : on dit que c'est un théorème de « géométrie projective »), et parce qu'il n'y a qu'un petit nombre de points impliqués (c'est quasiment le plus simple possible). Joli pour les raisons que je vais essayer d'expliquer, qui tiennent largement à sa symétrie. Et important parce qu'il est un des axiomes de certaines présentations de la géométrie projective. Pourtant, il ne fait pas du tout partie de l'enseignement de la géométrie en France (certainement pas à l'école primaire, mais pas non plus au collège, ni au lycée, ni même dans les classes préparatoires aux grandes écoles). Je vais essayer de parler un peu[#] de ce théorème, et de la « configuration » de points et de droites qu'il définit, en faisant plus d'efforts que d'habitude pour rester compréhensible par le grand public, au moins au début de ce billet, quitte à reléguer des considérations plus techniques en appendice. (Vais-je pour autant arriver à être compréhensible ? à vous de me dire.) En plus, pour changer des billets de ce blog qui sont généralement du pur texte, vous aurez droit à des illustrations, qui, j'espère, rendent les choses plus compréhensibles ! (Que demande le peuple ?) Notez que vous pouvez cliquer sur n'importe laquelle de ces images pour l'agrandir (et comme elles sont quasiment toutes vectorielles, vous pouvez utiliser quelque chose comme control-+/control-− dans votre navigateur pour zoomer ou dézoomer).

[#] Enfin, un peu est une façon de parler, parce que j'ai passé un temps totalement déraisonnable à écrire ce billet (ce qui explique, comme souvent, que la fin soit sans doute un peu bâclée parce que j'en ai eu vraiment marre).

Table des matières

Théorème de Desargues et configuration de Desargues

☞ L'énoncé du théorème de Desargues

Bon, alors que dit le théorème de Desargues ? Si on aime l'exercice de formuler les maths avec des phrases en français en évitant d'introduire des notations, on peut le dire ainsi :

Deux triangles ont un centre de perspective si et seulement si ils ont un axe de perspective.

Qu'est-ce que ça signifie ?

La figure ci-contre illustre la situation : les deux triangles A₁B₁C₁ (en rose sur la figure) et A₂B₂C₂ (en orange sur la figure) sont dits avoir un centre de perspective lorsque les trois droites reliant les sommets de même nom, c'est-à-dire les droites A₁A₂, B₁B₂ et C₁C₂ (en vert sur la figure), concourent[#2], leur point de concours, que j'ai appelé O, étant alors appelé le « centre de perspective » des deux triangles. (Je vais tenter de justifier ce terme, mais on peut s'imaginer que les deux triangles sont dans l'espace et que si on place son œil en O les deux triangles coïncident visuellement.) Pour ce qui est de l'autre notion, il faut considérer les intersections des côtés de même nom des triangles, c'est-à-dire l'intersection des droites B₁C₁ et B₂C₂ (appelons-la U), l'intersection des droites C₁A₁ et C₂A₂ (appelons-la V) et l'intersection des droites A₁B₁ et A₂B₂ (appelons-la W), que j'ai représentées en bleu sur la figure. Lorsque ces trois points (U,V,W) sont alignés[#3], les deux triangles sont dits avoir un axe de perspective, et l'axe en question est la droite qui les relie (la droite bleue sur ma figure).

[#2] On dit que des droites concourent en un point lorsqu'elles passent par ce point (on dit aussi qu'elles sont incidentes à ce point, ou que ce point est incident aux droites, mais le verbe concourir peut s'utiliser pour les droites seules, pourvu qu'il y en ait au moins trois : un tas de droites concourent, ou sont concourantes lorsqu'elles passent toutes par un même point, qu'on appelle fort logiquement leur point de concours).

[#3] On dit que des points sont alignés lorsqu'il y a une droite qui passe par tous ces points.

Le théorème de Desargues, donc, dit que ces deux situations sont équivalentes : si les deux triangles ont un un centre de perspective, alors ils ont un axe de perspective, et réciproquement, si les deux triangles ont un un axe de perspective, alors ils ont un centre de perspective. Une fois le théorème acquis, on peut dire que les triangles sont en perspective pour désigner cette situation.

☞ La configuration de Desargues

Et lorsque c'est le cas, les 10 points de la figure, c'est-à-dire les sommets A₁,B₁,C₁ et A₂,B₂,C₂ des deux triangles, le centre de perspective O et les trois points U,V,W dont l'alignement définit l'axe de perspective, forment ce qu'on appelle une configuration de Desargues. Notons qu'il y a aussi 10 droites dans l'histoire, et il faut considérer qu'elles font elles aussi partie de la configuration : les côtés des deux triangles (i.e., les droites qui les portent), l'axe de perspective, et les trois droites dont le concours définit le centre de perspective. Donc 10 points et 10 droites, et on remarquera que chacun des 10 points de la configuration est sur 3 droites, et chacune des 10 droites de la configuration passe par 3 points. J'ai représenté la configuration (enfin, une configuration) de Desargues ci-contre à gauche, en retirant toutes les étiquettes et couleurs de la figure illustrant le théorème plus haut (et en prolongeant les droites indéfiniment), mais c'est vraiment la même que celle de la figure précédente, je vais en reparler. Ma façon de présenter la configuration à partir du théorème laisse penser que certains points ou droites jouent un rôle différent des autres (le centre de perspective a l'air très spécial), mais en fait non, et je vais tenter de l'expliquer plus bas — tous les points et toutes les droites jouent en fait le « même rôle » dans cette configuration.

☞ Histoire de la perspective et géométrie « projective »

Mais revenons d'abord un peu au théorème lui-même.

Il est nommé d'après le géomètre et architecte lyonnais Girard Desargues (1591–1661), dont on ne sait pas grand-chose, mais l'énoncé apparaît semble-t-il[#4] dans un livre sur la perspective publié en 1647 par le graveur Abraham Bosse.

[#4] Je dis semble-t-il parce que je n'ai pas moi-même trouvé quelque chose ressemblant à l'énoncé dans le texte que je viens de lier sur Gallica, mais il est vrai que c'est très difficile de s'y retrouver, surtout que le texte n'est pas cherchable, que le livre n'a pas d'index, que j'ignore quelle terminologie serait utilisée, que je ne sais pas si ce serait énoncé comme un fait général ou à travers des exemples, etc. Donc je ne peux pas donner de référence plus précise. Mais ce qui est certain, c'est que Desargues semble avoir bien compris les principes de la perspective d'une manière qui permettrait le développement ultérieur de la géométrie projective — et aussi de la géométrie descriptive. Et on trouve essentiellement la figure ci-dessus à la planche 155 entre les pages 340 et 341, ici sur Gallica, à ceci près qu'il y a deux triangles à la fois : les triangles OAB et oab, ou bien ABD et abd, de cette planche sont en perspective au sens que j'ai défini ci-dessus, le point K de la planche étant ce que j'ai appelé le centre de perspective, et la droite par les points 2,3,4,7,5,8 étant ce que j'ai appelé l'axe de perspective.

[Lire la suite…]

↑Entry #2793 [older|※ permalink|newer] / ↑Entrée #2793 [précédente|※ permalien|suivante] ↑

↓Entry #2792 [older|※ permalink|newer] / ↓Entrée #2792 [précédente|※ permalien|suivante] ↓

2024-05-05 (dimanche)

Star Wars, Nathan le Sage et autres ambigrammes sémantiques

✱ Avertissement : ce billet contient, dès le début, des divulgâchis majeurs sur les deux œuvres mentionnées dans le titre.

Si je vous raconte une histoire comme ça :

Un jeune chevalier orphelin qui combat un puissant seigneur rencontre un vieil homme sage qui lui servira de mentor, et sauve une jeune femme qui a elle aussi été adoptée : il commence à tomber amoureux de cette dernière, mais plus tard ils découvrent qu'ils sont, en fait, frère et sœur, et qu'ils sont aussi les héritiers du puissant seigneur qui n'est, après tout, pas si méchant que ça.

Vous pensez à quoi ?

Bon, évidemment, avec le titre que j'ai donné à ce billet et avec l'avertissement en tête, ma question n'en est pas vraiment une. Mais le fait est que j'ai posté la question (certes le 4 mai et pas par hasard) sur Twitter et BlueSky, et qu'on m'a répondu, comme je l'attendais, Star Wars.

En fait, c'est un résumé de la pièce de 1779 de G. E. Lessing, Nathan le Sage (Nathan der Weise puisqu'il n'y a pas de raison que je cite une œuvre dans son titre original et pas l'autre). Je recommande très vivement cette pièce, d'ailleurs, qui est à la fois très belle et très amusante et qui vaut la peine d'être lue (ou vue au théâtre) même maintenant que je vous l'ai copieusement divulgâchée. Thomas Mann la considérait apparemment comme un des sommets de la littérature et culture allemandes. C'est une pièce qui se passe à Jérusalem pendant la troisième croisade, et c'est une touchante[#] invitation à la tolérance religieuse (le puissant seigneur est le sultan Saladin, le vieux sage est le Juif Nathan qui donne son nom à la pièce, et la jeune héroïne et le jeune héros sont la fille adoptée de Nathan, Recha, et un chevalier templier), et à la réconciliation en temps de guerre : raison pour laquelle la pièce est, d'ailleurs, de temps en temps donnée au moyen-orient avec des troupes formées de représentants des trois grandes religions abrahamiques. (La pièce est parfois comparée au Marchand de Venise pour contraster les représentations du Juif Nathan de Lessing et Shylock de Shakespeare, ou au contraire pour les rapprocher.) Et si on aime les coups de théâtre, l'intrigue est pleine de rebondissements (j'en ai listé quelques uns ci-dessus mais ce ne sont pas les seuls).

[#] Je suis peut-être facilement ému, mais il y y a vraiment des passages qui me donnent les larmes aux yeux.

Alors certes le résumé ci-dessus est un peu fragmentaire : non seulement je n'ai pas donné le contexte (que je viens de rappeler au paragraphe précédent), mais j'ai sauté à la fin sans raconter certaines des péripéties de l'intrigue (comment on essaie d'enlever Recha, même si là aussi j'aurais peut-être pu faire des efforts pour raconter ça de manière à ressembler à l'histoire de Star Wars), et je n'ai pas parlé de ce qui est sans doute le passage le plus célèbre de la pièce (mais à mon avis pas le meilleur), la parabole de l'anneau[#2]. Et puis bon, voilà, je suis obligé de dire héritiers (en anglais, next of kin je trouve que ça passe mieux) parce que dans Nathan le Sage ce n'est pas je suis ton père, c'est je suis ton oncle, sans doute parce que Lessing ne voulait pas trop déformer l'histoire (le Saladin historique a eu des enfants, ils n'apparaissent pas du tout dans la pièce).

[#2] Oui, il y a aussi une histoire d'anneau, mais pour le coup ça ne ressemble pas du tout au Seigneur des anneaux — même si vous pouvez essayer de faire un ambigramme sémantique là-dessus si ça vous chante.

Néanmoins, il me semble que la ressemblance est un peu plus que vague et anecdotique (je vais revenir sur la question de comment juger ça). Ne serait-ce que le fait que je me sois senti obligé de commencer ce billet en disant que j'allais divulgâcher Star Wars et Nathan le Sage le suggère quand même assez fortement.

Des gens m'ont répondu que oui, c'est normal, Star Wars suit le schéma du monomythe, il n'a rien d'original, ce sont des thèmes qu'on retrouve partout, mais il me semble que cette réponse est vraiment à côté de la plaque : si je raconte une histoire comme ceci (je recopie la description du monomythe de Wikipédia) :

Un héros s'aventure à quitter le monde du quotidien pour un territoire aux prodiges surnaturels : il y rencontre des forces fabuleuses et y remporte une victoire décisive. Le héros revient de cette mystérieuse aventure avec la faculté de conférer des pouvoirs à ses proches.

— je pense que personne n'y reconnaîtra Star Wars, ni Nathan le Sage (auquel ça ne colle d'ailleurs pas vraiment), ni quoi que ce soit de précis tellement tout ceci est désespérément vague. En tout cas, personne ne trouvera que j'ai divulgâché quoi que ce soit. Je trouve qu'il faut une sacrée dose de mauvaise foi pour prétendre que le résumé que je fais plus haut dans ce billet est aussi abstrait et vaseux que ça. L'histoire du monomythe s'applique à tout et n'importe quoi. Mon résumé de Nathan le Sage s'applique aussi à Star Wars mais pas à un million de choses (certes, on m'a suggéré que ça ressemblait un peu à La Flûte enchantée ou encore à la pièce de Voltaire L'Orphelin de la Chine, mais dans les deux cas c'est beaucoup plus lointain et notamment l'histoire de frère et de sœur séparés à leur naissance est absente).

Maintenant, il reste quand même trois possibilités, évidemment pas nettement séparées, entre lesquelles trancher (j'ai posé la question sur le StackExchange de science-fiction dont je n'attends cependant pas grand-chose) :

George Lucas a lu Nathan le Sage (ou du moins on lui en a raconté l'histoire, ou on lui a raconté une histoire elle-même inspirée de la pièce de Lessing) et il s'en est inspiré (pas forcément consciemment).
C'est une coïncidence.
Ce n'est même pas une coïncidence, on peut trouver des ressemblances de ce genre entre deux œuvres à peu près quelconques.

Tous les gens avec qui j'en ai parlé semblent convaincus de (3), à tel point que j'ai l'impression que l'Univers essaie de me gaslighter[#3], et c'est fort désagréable. Comme n'importe quel sujet est bon pour justifier un billet de blog, je me positionne fièrement prêt à mourir sur cette colline : non, je ne crois vraiment pas que ce soit (3).

[#3] Il me semble que quelqu'un avait proposé un équivalent français pour le verbe to gaslight, mais je ne retrouve pas.

L'argument principal contre (1) tourne autour de l'idée que Nathan le Sage serait une pièce obscure et qu'il est peu vraisemblable que George Lucas, qui n'est pas germaniste (je ne trouve pas de renseignement sur les langues qu'il maîtrise, mais je suppose que c'est juste l'anglais), en ait entendu parler.

Il me semble que cet argument est une projection de la relativité de la culture générale : quelque chose comme je n'ai pas lu cette pièce, donc je suppose par défaut qu'elle est obscure. Évidemment je suis susceptible de tomber dans le piège opposé (j'ai lu — et beaucoup aimé — cette pièce, donc je suppose par défaut que tout le monde la connaît), donc si je veux y répondre il faut que j'essaie de trouver des métriques un peu objectives de célébrité, ce qui est éminemment difficile. Je peux noter que l'article Wikipédia à son sujet existe en 21 langues, ce qui n'est quand même pas rien (en tout cas ça suggère qu'il n'y a pas que les germanophones qui en ont entendu parler) ; je peux noter que Google me la liste dans les 3 premières quand je fais une recherche de list of famous german plays (ceci n'est probablement pas très reproductible, cependant), que j'ai demandé à ChatGPT (en tant que perroquet-représentant de la sagesse diluée d'Internet) où il la placerait dans la liste des pièces allemandes les plus célèbres, et il m'a dit dans les 10 premières ; je peux noter que j'ai moi-même vu la pièce à la Comédie française (ce qui veut dire qu'elle est considérée comme faisant partie d'une certaine définition du répertoire classique dans un pays non-germanophone) et, plus tard, à la télé en France, et il y en a toutes sortes de versions sur YouTube ; je peux noter que, comme je le mentionne ci-dessus, elle a une certaine résonance au moyen-orient (et je suppose qu'elle en avait déjà quand George Lucas était étudiant). Ce ne sont pas des signes de la célébrité la plus incontestable (rien qu'au rayon des pièces allemandes, je suppose quand même que Faust est plus connue), mais on peut difficilement la qualifier d'obscure (alors que pour L'Orphelin de la Chine de Voltaire, par exemple, je n'hésiterais pas à utiliser cet adjectif).

(Évidemment, dans la culture actuelle, surtout auprès des geeks avec qui je suis susceptible d'échanger via Internet, Star Wars est bien plus connu que Nathan le Sage — 145 langues sur Wikipédia, par exemple, si on convient que cette métrique est pertinente. Néanmoins, il y a un certain effet de perspective dû aux qualificatifs sur Internet et actuel. En tout cas, quand George Lucas était étudiant, bizarrement, Star Wars n'était pas connu du tout, alors que Nathan le Sage l'était sans doute autant. Et j'imagine que si on attend quelques décennies, la trilogie d'origine de Star Wars sera perdue dans les zillions de spinoffs, séquelles et autres histoires dérivées que Disney aura produites entre temps, et peut-être qu'il y aura aussi peu de gens capables de la décrire que pour ce qui est de la pièce de Lessing.)

Je suppose, en tout cas, que George Lucas n'est pas un Américain moyen de sa génération en ce qui concerne ses chances d'être familier avec la pièce de Lessing (s'il l'était, je conviendrais volontiers que ses chances de l'avoir lu — ou même d'en connaître simplement l'histoire — seraient proches de zéro). Il a été étudiant[#4] à USC, il a suivi des cours de littérature et de cinéma, où je suppose que ses profs ont dû mentionner certaines des grandes œuvres de la littérature mondiale ou occidentale, et notamment celles qui sont pertinentes dans l'histoire du théâtre ou illustratives pour le bon usage du coup de théâtre (chose que Lucas semble certainement beaucoup aimer), après tout ce n'est pas comme si le théâtre et le cinéma étaient si étrangers[#5] l'un à l'autre. Donc même si ça n'a rien de certain, je ne trouve absolument pas farfelu d'imaginer que Lucas, même s'il n'est pas germaniste ou germanophone, ait lu ou vu le Nathan de Lessing (ou qu'on lui en ait raconté l'histoire), qu'il s'en soit consciemment inspiré ou que certaines idées lui soient restées dans la tête.

[#4] Rien à voir avec Lessing, mais à propos de George Lucas étudiant et de ses sources d'inspiration, je rappelle une fois de plus l'existence de ce court-métrage (8 minutes !) absolument extraordinaire qu'est George Lucas in Love de Joe Nussbaum (1999) (on le trouve par-ci ou par-là sur YouTube, et certainement en plein d'autres copies qui disparaîtront occasionnellement au hasard de l'application du copyright). J'en ai parlé dès le tout début de ce blog, et 21 ans après je le revois toujours avec autant de plaisir. C'est une exploration hypothétique et humoristique de l'histoire possible de la genèse de Star Wars alors que George Lucas est étudiant sur le campus de l'USC en 1967, et c'est une accumulation de clins d'œil, un hommage beaucoup plus touchant et intéressant, à mon avis, que tous les fan films qui ont été faits in universe. Même la musique est extraordinaire. (Il semble d'ailleurs que Lucas lui-même ait vu ce film et a reconnu qu'il était excellent, même si pas tout à fait conforme à la réalité.)

[#5] Alec Guinness, qui incarne Obi-Wan Kenobi dans Star Wars, était (et est sans doute encore) surtout connu comme un grand acteur de théâtre. Il avait notamment joué Le Marchand de Venise quand il était jeune, et il l'a de nouveau joué (en incarnant Shylock) après Star Wars : compte tenu de la comparaison souvent faite entre ces deux pièces, je n'ai aucun doute qu'il aurait lu ou vu Nathan. Je peux parfaitement imaginer une discussion sur le tournage de l'épisode 4 de Star Wars où Guinness dirait à Lucas tu sais, les personnages de ton film ils me rappellent un peu ceux de cette pièce allemande… tu devrais peut-être y jeter un coup d'œil.

Ce qui est certainement plus discutable, c'est la question de savoir dans quelle mesure les éléments communs que je vois entre Star Wars et Nathan le Sage sont vraiment significatifs.

[Lire la suite…]

↑Entry #2792 [older|※ permalink|newer] / ↑Entrée #2792 [précédente|※ permalien|suivante] ↑

↓Entry #2791 [older|※ permalink|newer] / ↓Entrée #2791 [précédente|※ permalien|suivante] ↓

2024-04-30 (mardi)

Débriefing de mon cours Logique et Fondements de l'Informatique

J'avais expliqué il y a quelques mois que je m'étais engagé à monter un nouveau cours d'informatique théorique (ou faut-il dire de maths de l'informatique ?) pour certains élèves de première année à Télécom PlusÀParis, intitulé Logique et Fondements de l'Informatique (nom de code interne : INF110). (J'avais d'ailleurs publié un premier jeu de transparents dans de billet.) L'occurrence 2023–2024 de ce cours a eu lieu de mi-novembre (2023) à mi-janvier (2024), le contrôle le 26 janvier, et maintenant (enfin, quelques mois après) que j'ai à la fois rendu les notes finales et reçu les retours (anonymes) des étudiants je suis en mesure d'en faire un premier bilan. L'idée de ce billet n'est pas tellement d'entrer dans le fond du sujet (même si je ne peux pas ne pas en parler du tout), à ce sujet voir plutôt les deux paragraphes ci-dessous, mais de parler au niveau méta : pourquoi ce cours, pourquoi ce sujet, comment je l'ai organisé et préparé, ce qui a bien marché et ce qui n'a pas bien marché. Le but est de me permettre à moi-même de faire le point, et donc de réfléchir à ce que je veux changer l'an prochain, et aussi de préparer un exposé où je dois raconter tout ça (cf. la fin du présent billet).

☞ Pour le fond du sujet, je renvoie notamment à ce billet sur la correspondance de Curry-Howard et à celui-ci sur la réalisabilité propositionnelle, qui sont largement adaptés de certains bouts de mon cours, même si la présentation est différente et qu'ils vont plus loin (surtout le second). Je peux aussi renvoyer à ce billet sur des sujets variés en vrac sur lesquels j'ai appris des choses en préparant ce cours. Enfin, je fais un lien vers ce billet sur les degrés de Turing et leur généralisation parce qu'il touche à des questions adjacentes, même si je n'ai pas fait plus qu'évoquer la définition de degré de Turing (ordinaire) dans mon cours.

☞ Pour ce qui est des documents pédagogiques accompagnant le cours, voici quelques liens (dont, malgré ma passion pour la stabilité des URL, je ne garantis pas qu'ils seront pérennes, parce que je ne sais pas comment je vais les réorganiser à l'avenir). D'abord le PDF des transparents (qui est la concaténation idiote de trois parties inégales : ① calculabilité, ② typage simple et calcul propositionnel et ③ introduction aux quantificateurs ; j'ai aussi fait une version « imprimable » des transparents : ①, ② et ③). Les exercices d'entraînement sont : ici sans corrigé et ici avec corrigé. Et le sujet du contrôle est ici sans corrigé et ici avec corrigé. Et si des gens sont intéressés par le source de tout ça, le dépôt Git est ici.

Avertissement usuel : même si j'évoque ici mon travail d'enseignant-chercheur à Télécom, je dois rappeler que, dans ce billet comme ailleurs sur ce blog, je m'exprime à titre purement personnel et que les avis et opinions que je peux exprimer ici (ou ailleurs) sont juste les miens et n'engagent en aucun cas mon employeur (ni qui que ce soit d'autre que moi, et d'ailleurs ils ne m'engagent même pas moi vu que que je me réserve le droit d'en changer à tout moment et sans prévenir). J'ajoute que si vous faites partie des personnes qui ont besoin d'un tel avertissement, il vous est interdit de lire la suite de ce billet.

Plan du billet

Le contexte

Comme je l'ai expliqué dans les billets déjà liés ci-dessus (celui-ci et celui-là), la France a récemment créé une filière MPI (maths, physique et informatique) dans ses classes préparatoires scientifiques[#]. En particulier, les élèves entrant à Télécom par le concours commun peuvent arriver avec trois niveaux de formation en informatique : le socle commun MP/PC (où il n'y a pas grand-chose en info), l'option informatique en MP (qui existait déjà), et la nouvelle filière MPI (qui va encore plus loin). Les programmes de toutes ces filières sont trouvables par exemple sur ce site). Ceci nous a imposé une réforme de nos enseignements en première année : jusqu'à l'été 2023 notre première année était complètement uniforme (en gros, tout le monde avait les mêmes cours, le choix d'une filière de spécialisation se faisant en seconde année), mais ce mode de fonctionnement devenait intenable, au moins pour ce qui est de l'informatique, avec de telles différences de formation à l'entrée (si on s'adapte à ceux qui en ont fait le moins, ceux qui en ont fait plus s'ennuient, et si on s'adapte à ceux qui en ont fait le plus, ceux qui en ont fait le moins sont largués).

[#] Au niveau de la reconnaissance de l'informatique comme une science à part entière, il y a aussi eu création d'une agrégation d'informatique pour le recrutement des enseignants alors que l'informatique était jusqu'alors considérée comme une option de l'agrégation de mathématiques. Et, un peu avant, des changements au niveau lycée avec la création d'une spécialité NSI, c'est-à-dire numérique et sciences informatiques, mais ça ne me concerne que beaucoup plus indirectement : de ce que je comprends, à cause de la limitation à deux spécialités en terminale, la (grande ?) majorité des élèves de prépa, y compris MPI, n'ont pas suivi cette spécialité NSI en terminale, mais bien maths et physique-chimie.

Mais ce n'est pas, en fait, qu'une question de niveau en entrée : les élèves ayant choisi la filière MPI semblent avoir des attentes et des intérêts différents de ceux de la filière MP (même « option info »), au sens où ils semblent généralement plus intéressés par l'informatique pour elle-même et pas juste comme un outil dans un travail d'ingénieur (parce qu'évidemment tout le monde utilise l'informatique de nos jours). Et un des buts de la réforme que nous avons mise en place est de rentre Télécom plus attirante pour les préparationnaires vraiment intéressés par l'informatique, avec notamment l'idée qu'il ne faut pas qu'ils s'ennuient en cours.

La première année à Télécom est (maintenant) divisée en quatre périodes. Pour ce qui est de l'enseignement d'informatique, voici comment nous avons organisé l'année. La période P1 (septembre–octobre) a été dédiée à une introduction générale à la programmation, du matériel au haut niveau, tandis que les élèves venus de la filière MPI (et uniquement eux) ont un cours spécifique sur la compilation. La période P2 (novembre–janvier) est consacrée à la théorie de l'informatique, et c'est celle qui me concerne et dont je vais reparler. La période P3 (février–avril) propose le choix entre différents paradigmes de programmation. Et la période P4 (avril–juin) est consacrée aux réseaux. Sur chacune de ces périodes, les élèves ont environ 40h d'informatique (sauf en P3, moitié moins), c'est-à-dire environ 4h½ par semaine pendant les 9 semaines que dure la période. (Pendant le même temps, les élèves ont bien sûr aussi des cours dans les autres domaines : maths, physique+électronique, sciences économiques et sociales, langues et humanités ; plus des projets et stages variés, notamment entre les périodes. Je dis ça pour situer un peu l'enseignement dans son volume global.)

Pour ce qui est de l'enseignement d'informatique de la période P2 de première année, donc, nous avons divisé la population d'élèves en deux sous-populations inégales : ceux qui sont entrés par les filières MPI ou MP option info du concours commun ainsi que les admis sur titres après une licence d'informatique, soit au total ~90 élèves, et tous les autres, qui doivent représenter à peu près ~120 élèves. Les premiers ont eu le cours INF110 dont je me suis chargé et dont je parle ici, tandis que les seconds ont eu un cours (INF109) plus général sur l'algorithmique fondamentale et quelques rudiments de la calculabilité (recouvrant notamment une partie de ce que les autres élèves avaient déjà vu en prépa).

Bref, s'agissant de INF110, j'avais à m'occuper de 39 heures d'enseignement (contrôle de connaissances non compris), étalées sur 9 semaines, pour ~90 élèves. Nous avons décidé de séparer ces 39h en 21h de cours magistraux, et 18h de TD+TP lesquels ont été pris en charge par mon collègue Théo Z. Pour des raisons d'organisation de l'emploi du temps global de la première année, il n'était pas possible de regrouper les élèves tous ensemble pendant les cours magistraux, donc j'ai donné deux fois chaque séance (on arrive donc à 42h pour moi, si vous suivez).

De l'opportunité d'enseigner des sujets théoriques

Il faut que je dise ici un mot pour évoquer la question qui revient de façon récurrente dès qu'on parle de dispenser des cours assez « théoriques » (whatever that means) à des élèves majoritairement[#2] futurs ingénieurs. J'avais déjà droit à ce genre de remarques quand j'enseignais l'analyse de Fourier (cf. par exemple ce billet) : à quoi ça sert d'expliquer à des futurs ingénieurs la différence entre la transformée de Fourier dans L¹ et dans L² ? ce n'est pas ça qui va leur servir : de toute façon leur signal sera un ensemble fini de valeurs. Donc inévitablement on peut se demander pourquoi enseigner la calculabilité ou la logique intuitionniste quand ce même temps pourrait être employé à faire des cours de JavaScript et de Python, parce que c'est ça qui va leur servir — ou bien d'IA puisque maintenant tout le monde se rue sur l'IA comme des lemmings sur la falaise.

[#2] Je précise que majoritairement ne signifie pas exclusivement. Même sans parler des cas vraiment exotiques, et il y en a toujours (après tout, j'ai dans ma promo à Normale Sup un camarade qui a décidé que la passion de sa vie c'était le cirque, et qui a donc fait carrière dans les arts du spectacle après une thèse de physique quantique), il y a quand même une proportion, faible mais non complètement négligeable, d'élèves à Télécom qui décident de faire de la recherche plus ou moins théorique, c'est-à-dire de faire une thèse et éventuellement d'en faire carrière. Néanmoins, j'entends bien l'argument selon lequel l'enseignement ne doit pas se construire en fonction des intérêts d'une minorité. Donc ce n'est pas l'argument que j'invoque ici pour justifier l'intérêt de mon cours.

J'avais déjà répondu à cette objection, mais je ne sais pas si ma réponse me satisfait beaucoup. Disons que si un ingénieur n'est pas un chercheur (dont le métier consiste à proposer de nouvelles théories), il n'est pas non plus un technicien (dont le métier consiste à appliquer des techniques existantes) : l'ingénieur est justement là pour faire le pont entre les deux, pour appliquer la théorie à la création de nouvelles techniques ou au perfectionnement de celles qui existent, ce qui implique de bien maîtriser la théorie de son domaine, avec un certain recul sur celle-ci, pas juste comme des recettes de cuisine apprises par cœur. (Je devrais, ici, faire référence à la nouvelle Profession d'Asimov, mais c'est un peu difficile à faire sans divulgâcher ; donc je vais me contenter de dire : lisez-la.)

On se trompe gravement, je pense, en voulant centrer l'enseignement sur ce qui sert (ou plutôt, on se trompe gravement en ne mesurant pas toutes les manières dont quelque chose peut servir) : le but de l'enseignement, quel que soit son niveau, n'est pas principalement, ou en tout cas pas exclusivement, de fournir des outils qui serviront mais aussi des clés de compréhension de phénomènes, des cadres dans lesquels analyser ce à quoi on est confronté. Les outils, ce n'est pas qu'il ne faut pas les apprendre, mais ils ont tendance à être hautement spécifiques à une tâche précise, les outils nécessaires à tel ou tel métier s'apprennent normalement en entrant dans ce métier, ce n'est tout simplement pas le rôle de l'enseignement de former à s'en servir (sauf dans la mesure où ces outils sont extrêmement transverses). S'agissant de l'informatique, donc, on se trompe par exemple en pensant qu'il faut enseigner les langages de programmation qui seront utilisés ensuite : un langage de programmation, ça s'apprend rapidement, l'intérêt de les enseigner n'est pas d'enseigner ce qui servira mais d'enseigner ce qui permet de comprendre les différentes approches[#3] de la programmation et les différentes façon de concevoir une tâche.

[#3] Sur les langages de programmation, ce que je dis c'est que ça n'a, selon moi, aucun intérêt de se dire je vais apprendre/enseigner JavaScript et Python parce que c'est ce qui me/leur servira après ; il faut plutôt se dire je vais viser un échantillon représentatif des différents styles de langages de programmation pour comprendre les différentes approches : un langage bas niveau pour comprendre comment fonctionne la gestion de la mémoire, un langage purement fonctionnel et paresseux pour comprendre comment conceptualiser les tâches par une programmation d'ordre supérieur, un langage orienté objet pour comprendre le concept d'héritage, un langage distribué pour comprendre les difficultés de la programmation asynchrone et la manière dont on les résout, etc.

Donc l'intérêt d'enseigner la calculabilité, ce n'est certainement pas parce que ça va servir (même s'il est certainement utile qu'un ingénieur sache que certaines tâches ne sont pas réalisables algorithmiquement — et qu'en gros toute tentative d'analyser le comportement d'un programme devra reposer sur des heuristiques qui seront fatalement imparfaites), mais aussi parce que cela amène à prendre du recul sur les concepts fondamentaux de l'informatique (la récursion, l'auto-référence, la nature de l'évaluation dans les langages de programmation, la raison pour laquelle on se retrouve si facilement à être Turing-complet par accident — et peut-être aussi le fait que ce n'est pas très pertinent de chercher à l'éviter). À titre d'exemple, s'agissant de l'auto-référence, je dirais que quelqu'un qui a du recul sur la calculabilité et le théorème de récursion de Kleene ne sera absolument pas surpris par le fameux hack de Ken Thompson[#4] (d'ailleurs, Thompson lui-même explique le lien entre les quines et son hack), et c'est pertinent pour pouvoir prétendre maîtriser la sécurité informatique. Je peux dire quelque chose d'analogue pour le typage : ce n'est pas juste que c'est utile de comprendre les bases du typage et du polymorphisme parce que certains langages réellement utilisés en ont, mais c'est aussi nécessaire pour comprendre ce qui se passe (par exemple quand on cache des valeur dans une clôture, quand on passe des valeurs par continuation — ce qui sont des paradigmes de programmation qui servent vraiment).

[#4] Dans Reflections on Trusting Trust, Thompson explique qu'il avait introduit une backdoor dans le programme login, puis modifié le compilateur C pour introduire lui-même cette backdoor si elle ne s'y trouvait pas, puis pour introduire cette backdoor dans le compilateur C lui-même, si bien qu'au final il pouvait recompiler le compilateur avec les sources d'origine et la backdoor persistait dans le binaire. Voilà quelque chose qui, au minimum, ne doit pas surprendre un ingénieur en sécurité informatique.

[Lire la suite…]

↑Entry #2791 [older|※ permalink|newer] / ↑Entrée #2791 [précédente|※ permalien|suivante] ↑

↓Entry #2790 [older|※ permalink|newer] / ↓Entrée #2790 [précédente|※ permalien|suivante] ↓

2024-04-20 (samedi)

Le pluriel de fait divers n'est pas statistiques

Je viens de[#] voir passer sur Twitter⌫𝕏 encore je ne sais quel fait divers retweeté par quelqu'un qui cherchait sans doute à en tirer une conclusion sur notre société. (Je ne sais plus de quoi il était question, mais typiquement le fait divers prend la forme d'une violence commise par ou contre tel ou tel groupe dont on voudrait laisser penser qu'il est sujet ou objet de violences, et la conclusion plus large est quelque chose comme tout va mal.) Ou plutôt, à provoquer une émotion dans laquelle une conclusion éclora sans passer par l'étape de raisonnement.

[#] Enfin, je venais de quand j'ai écrit ce paragraphe. Mais ce billet, parmi beaucoup d'autres à moitié écrits, traînait dans mes cartons virtuels depuis un moment, donc je ne sais même plus à quel moment je fais référence. Peu importe : entre temps j'ai vu passer plein d'autres faits divers tout aussi peu dignes qu'on s'intéresse à eux.

Puisqu'il est question d'émotion, justement, je voudrais dire la mienne contre tout ce qui ressemble aux faits divers : à ceux qui les rapportent, à ceux qui les reproduisent, et à ceux qui, consciemment ou inconsciemment, cherchent à manipuler l'opinion publique avec. (Et je précise que je ne suis pas exempt de ces reproches : c'est justement parce que, sans doute comme tout le monde, je suis moi-même parfois tenté de m'émouvoir d'un fait divers, voire de le « partager » sur les réseaux sociaux, et d'autant plus que le fait divers s'aligne avec mes préconceptions politiques, que je dois travailler pour lutter contre ce poison du cerveau humain, et ce billet est là pour ça.)

Mon reproche contre le concept de fait divers peut être résumé dans l'explication suivante, dont la concision provocatrice retire un peu à la précision, mais qui résume néanmoins de façon assez percutante le cœur du problème :

Si on en parle aux infos, c'est que c'est très atypique.
Si c'est très atypique, c'est que ça n'a aucune importance.

(Il va de soi que je parle là des faits divers — expression française forte utile et que je ne sais d'ailleurs pas traduire en anglais. Un événement de portée géopolitique, par exemple, n'est pas sujet à ce reproche : il est significatif en lui-même, pas en ce qu'il prétend représenter un phénomène plus large.)

Je résume ce résumé par le titre de ce billet (inspiré d'une citation qui, comme toutes les meilleures citations, est apocryphe voire complètement inversée, le pluriel d'anecdote n'est pas données) : le pluriel de fait divers n'est pas statistiques.

Tout fait divers, donc, est un mensonge. Pas parce qu'il est faux (il y en a plein qui sont des légendes urbaines, mais ce n'est pas ça mon propos : admettons pour les besoins de l'argument que les faits soient exacts et fidèlement rapportés), mais en ce qu'il suggère qu'il est représentatif alors qu'il ne l'est pas : s'il était représentatif, il serait banal et on n'en parlerait pas. Donc il ment même s'il dit la vérité. Ce qui est sans doute la meilleure façon de mentir. Pour invoquer une autre citation (qui, pour une fois, n'est pas apocryphe, c'est d'Asimov dans Forward the Foundation) : The closer to the truth, the better the lie, and the truth itself, when it can be used, is the best lie.

Le fait divers, donc, vise à manipuler notre émotion. C'est un défaut du cerveau humain que les statistiques n'arrivent pas facilement à susciter notre émotion. (Ou alors il faut pour ça les tourner sous une forme trompeuse : les phrases du style toutes les X minutes, en France, <telle chose se produit> sont une manipulation pour donner aux statistiques la même coloration émotionnelle que les faits divers[#2].) Et aussi que les émotions sont si puissantes pour provoquer une réaction de notre part. Nous avons besoin de faits concrets, pas de chiffres.

[#2] Bien garder ça à l'esprit : si quelqu'un vous dit qu'il y a <tant> de <tel fait> par an en France, c'est peut-être vrai et honnête ; mais si on vous dit que <tel fait> se produit toutes les <tant> de minutes en France, c'est toujours un mensonge même si le chiffre est vrai : c'est un mensonge en ce que c'est une manipulation pour que le chiffre paraisse plus important qu'il l'est. Parce qu'il n'y a tout simplement aucune raison légitime de tourner une fréquence sous cette forme.

Je ne dis pas que les statistiques ne peuvent pas mentir, bien sûr, et d'ailleurs je viens à l'instant de donner une manière de les manipuler. (Là aussi vous vous doutez bien qu'il y a une fameuse citation apocryphe pour nous le rappeler.) Mais les statistiques ont au moins en principe le pouvoir de dire quelque chose de vrai et de représentatif, ce que le fait divers n'a pas. Les statistiques traduisent parfois une vérité collective intéressante : le fait divers ne le font jamais.

L'exemple le plus flagrant de la manipulation de nos émotions par ce qui n'est pas statistiquement représentatif est celui des actes terroristes et de l'importance qu'on leur accorde. (Je renvoie à cette vidéo plutôt bien faite pour un développement plus poussé de ce point.) La réalité statistique du terrorisme, dans le monde occidental, est qu'il est insignifiant : si vous vivez en France, vous avez moins de 0.01% de chances[#3] de mourir dans un attentat terroriste. Or les médias traitent chaque acte terroriste comme un sujet majeur, ce qui est exactement ce que recherchent les terroristes, et ce qui donne à ces derniers une victoire retentissante à chaque fois, en ce qu'ils réussissent effectivement, avec cette complicité des médias, à terroriser des gens qui, regardant ces infos anxiogènes, sont souvent convaincus qu'ils sont eux-mêmes menacés[#4] par le phénomène alors qu'ils ont grosso modo autant de chances de mourir, disons, tués par une vache. J'ajoute, puisque c'est aussi le propos de ce billet, que les politiques préconisant une réponse forte[#5] au terrorisme sont les alliés objectifs[#6] des terroristes : les premiers fournissent aux seconds l'attention et la terreur qu'ils recherchent, et les seconds fournissent aux premiers leur agenda politique (donc le pouvoir qui va avec).

[#3] Estimation passablement conservatrice : en France, il semble qu'il y ait eu moins de 600 morts de terrorisme au cours des 50 dernières années, sur environ 30 millions de morts au total pendant ce demi-siècle, donc les chances de mourir du terrorisme, en France, seraient plutôt autour de 0.002%. Mais pour d'autres pays européens, 0.01% est plus représentatif, et si on prend la pire année pour la France, on monte à presque… 0.03% (pour être bien clair, ça veut dire en gros que si chaque année répétait celle des attentats de 2015, la probabilité d'un Français générique de mourir du terrorisme sur toute votre vie serait autour de 0.03% ; je ne parle pas de 0.03% par an, ce qui serait beaucoup plus, mais plutôt de 0.0003% par an, soit 0.03% sur toute une vie, en prenant le pire chiffre des 50 dernières années).

[#4] De même qu'on a des règles qui imposent que toute pub pour de la bouffe soit accompagnée d'une injonction un chouïa paternaliste, je me dis parfois qu'il ne serait pas mal d'obliger tout reportage ou sujet d'actualité mentionnant le terrorisme d'être accompagné d'un message disant substantiellement : ce sujet ne vous concerne pas : vous n'allez pas mourir du terrorisme, vous allez très probablement mourir du cancer ou d'un accident cardiaque ou vasculaire.

[#5] Réponse forte, en fait, généralement constituée d'un théâtre de mesures absolument dénuées d'effets réels contre le terrorisme : il s'agit d'une comédie sécuritaire dont le but est simplement de rappeler au grand public que le sujet est censé être Important et que des gens prennent des Mesures.

[#6] J'aime bien rappeler que quand deux groupes se font publiquement et ostensiblement la guerre, souvent ces deux groupes sont des alliés objectifs, en ce que les deux ont en fait un but commun, qui est de faire croire que le sujet sur lequel ils se font la guerre est un sujet grave, important et central, que l'attention de l'opinion doit se focaliser dessus (ou bien il peut s'agir de cimenter chacun des deux groupes dans l'essentialisme qui les définit). Cette analyse est parfois simpliste (dans une vraie guerre, ce sont surtout les fractions les plus radicales des deux belligérants qui sont alliées, ça ne veut pas dire que toute la guerre est factice), mais il est au moins bon de l'avoir à l'esprit quand on nous présente un débat entre des positions prétendument « opposées ». En l'occurrence, l'alliance objective entre terroristes et adeptes de la manière forte contre le terrorisme me paraît assez évidente.

Certains sont sans doute tentés de répondre sur l'importance des symboles, ou quelque chose comme ça. (En mode avocat du diable : quelle sordide façon de décerner l'importance des sujets que de compter le nombre total de morts et de ne regarder que ça ! ce sont les symboles qui comptent.) Or c'est un peu le problème, justement : les terroristes essayent de nous manipuler par la portée symbolique de leur acte, et accepter de la reconnaître, accepter de s'en émouvoir plus que ce que sa réalité statistique extrêmement mineure le justifie, c'est justement entrer dans leur jeu. J'ai parlé ici du terrorisme, mais c'est globalement le problème des faits divers : la naissance d'une émotion collective qui, même si elle n'est pas provoquée délibérément, sera exploitée par les politiques. C'est le principe du un fait divers, une loi (la loi n'est généralement même pas la finalité de la manœuvre — parfois elle l'est si c'est une loi liberticide, mais en général le but de la gesticulation est simplement de récupérer du capital de sympathie politique sur l'air de voyez, moi je m'occupe de ce problème dont personne ne s'occupait jusqu'ici).

Et cette émotion collective vient avec une injonction de la ressentir : qui oserait répondre à l'émotion suscitée par le viol du petit Machin (7 ans) par le cousin de sa belle-tante en disant mais on s'en fout, de ce fait-divers sordide ! ? Si vous dites ça, on vous traite de monstre, d'insensible, de scientifique déshumanisé qui ne sait lire le monde que derrière de froides statistiques, etc. (et si on tient un discours de ce genre face à un acte terroriste, la réaction est encore pire[#7]). Les gens qui disent ça confondent le fait de ressentir une émotion (oui, généralement, je suis désolé d'apprendre ce qui est arrivé au petit Machin) et le fait d'en faire un spectacle public d'importance nationale.

[#7] Essayez un peu de défendre la position selon laquelle la réponse à faire au terrorisme c'est l'ignorer complètement, et pourrez mesurer, aux réactions indignées que cela provoque, l'étendue de la victoire psychologique des terroristes dans leur bataille pour l'attention. (Notons que je ne défends pas cette position : je pense qu'il y a des choses qu'on peut faire contre le terrorisme, mais elles sont plutôt de l'ordre de l'infiltration. Mais ce n'est ni le propos de ce billet ni quelque chose sur quoi je pense être compétent, donc je ne développe pas.)

Je le sais parce que je tiens de feu mon papa cette attitude de rejet du fait divers et d'attachement aux statistiques, et je voyais bien les réactions irritées voire véritablement courroucées que cette attitude pouvait provoquer. Il est vrai qu'il ne cachait pas son mépris pour tout ce qui est anecdotique, et qu'il demandait bien ostensiblement, et avec un mépris parfois un peu provocateur, la fréquence de n'importe quel fait qu'on lui rapportait. (Et il est aussi vrai qu'il n'était pas toujours parfaitement cohérent avec ses propres principes.)

Encore une fois, je ne prétends certainement pas être moi-même exempt de reproches : il m'est certainement arrivé de rapporter, propager ou amplifier des faits divers (voire de les déformer) : moi aussi j'ai des émotions et moi aussi on peut me manipuler avec elles, et le terrorisme y parvient dans une certaine mesure. Ce que je décris ici est surtout une discipline que j'essaie de m'imposer (et si je cherche à me l'imposer, c'est bien parce qu'elle ne m'est pas naturelle, et j'échoue souvent à obéir à mes règles). Il ne s'agit pas de ne jamais évoquer de fait divers, mais au moins de faire la démarche de me demander, à chaque fois que j'en rencontre un, quelque chose comme ceci :

Est-ce que ce fait est représentatif en plus d'être matériellement exact ? De quoi est-il représentatif exactement ?
Est-ce que je dispose des éléments de contexte suffisants pour interpréter le fait rapporté ? Quelle sélection des faits a été apportée par la narration que j'ai reçue ? Quels sont les biais de la source dont je le tiens ?
Qui a sélectionné le fait rapporté parmi d'autres qui sont semblables ? Qui a choisi de parler précisément de celui-là et pas d'un autre ? Quelle est l'intention derrière ce choix, qui n'est pas neutre ?
Est-ce que je peux trouver des statistiques sur le phénomène qui semble impliqué par le fait rapporté ? Que me disent ces statistiques sur l'importance du phénomène ? Que me disent-elles sur la typicité du fait rapporté ?
Quelle émotion fait naître en moi le fait rapporté ? Dans quelle mesure cette émotion est-elle provoquée ou amplifiée par la narration que j'ai reçue ? Cette émotion sert-elle des intérêts autres que ceux de l'information pure ? Lesquels ?

La liste n'est pas exhaustive, évidemment (et je mélange là des questions qui visent à stimuler différentes sortes de scepticisme, dont certains s'appliquent bien plus largement qu'aux faits divers[#8]). Mais il me semble que le débat public serait beaucoup plus sain si chacun faisait au moins un effort honnête de pratiquer cette petite gymnastique à chaque fois qu'il s'agit de cliquer sur le bouton reposter d'un message qui nous émeut.

[#8] Et bien sûr tout ceci s'ajoute au scepticisme dont il est pertinent de faire preuve sur les faits eux-mêmes (viennent-ils d'une source fiable ? les images ne sont-elles pas générées par IA ? etc.).

Tout propos catégorique mérite bien sûr d'être nuancé (y compris cette phrase-ci). Il y a quand même des cas où un fait divers peut nous apprendre quelque chose.

D'abord, quand le fait divers est représentatif et typique d'un phénomène qui est effectivement statistiquement pertinent : il n'est tout de même pas vrai que tout ce qui est relaté aux infos (ou propagé sur les réseaux sociaux) est atypique, et même s'il est atypique il peut l'être pour des raisons orthogonales à ce qui le rend significatif (par exemple si une célébrité est victime d'un phénomène banal, ça rend le fait divers newsworthy tout en restant représentatif du phénomène banal). On peut admettre qu'un fait divers serve, dans un discours, à illustrer un phénomène statistique, à rendre plus « parlantes » les statistiques. Mais ceci n'excuse en rien de ne pas chercher les statistiques.

Ensuite, quand un fait divers montre que quelque chose est possible alors qu'on pensait que c'était simplement impossible (ou que quelque chose existe alors qu'on n'y avait jamais pensé) : les statistiques sont alors par définition impossibles à faire puisqu'on a affaire à un hapax. La réaction saine, alors, est de se dire tiens, il est peut-être pertinent de s'intéresser à ce phénomène à l'avenir, par exemple pour chercher à savoir s'il est en train d'apparaître ou si c'est un événement qui se produit une fois tous les millions d'années.

Et bien sûr, une morale à tirer de tout ça c'est l'importance de l'enseignement scientifique (et notamment des stats de base et des ordres de grandeur). Il me semble indispensable que tout citoyen sache calculer un ordre de grandeur pour répondre à un problème du style : si ce problème, qui touche un groupe de personnes dont je fais partie et représentant environ 1% de la population, se produit environ une fois par mois en France et affecte une vingtaine de personnes à chaque fois, au bout de combien de temps dois-je moi-même m'attendre à en être victime ? (réponse en supposant une uniforme distribution[#9] : 70 millions × 1% / 20 × 1 mois ≈ 3000 ans) ou, en plus simple, si une personne par minute est victime de tel phénomène en France, au bout de combien de temps dois-je moi-même m'attendre à en être victime ? (réponse en supposant une uniforme distribution : 70 millions de minutes ≈ 130 ans). Je pourrais raconter des anecdotes de gens qui sont incapables de convertir de tête 70 millions de minutes en 130 ans (au moins approximativement !) ou échoueraient à répondre à ce genre de questions pour telle ou telle autre raison, mais ce serait, justement, des anecdotes destinées à provoquer votre émotion indignée : pour rester dans le sujet, je voudrais plutôt voir des statistiques sérieuses à cet égard.

[#9] Bien sûr, l'hypothèse d'égale distribution est critiquable et doit être critiquée, à l'aune du phénomène particulier. C'est justement ce qu'un enseignement scientifique correct doit fournir : des clés pour utiliser, formuler et critiquer ce genre d'hypothèse.

L'autre chose importante à mettre dans les mains de tous les citoyens, outre une culture scientifique de base, c'est l'accès à des statistiques claires et de qualité contre lesquelles comparer leurs impressions tirées des anecdotes sur le monde.

J'aime donner l'exemple suivant : beaucoup de gens sont persuadés (et pour le coup ce n'est pas anecdotique, j'avais trouvé des statistiques sérieuses à l'appui de cette affirmation, même si je ne les retrouve plus) que le monde est beaucoup plus violent qu'autrefois. Cette impression résulte largement de l'information immédiate et « brute » à laquelle nous avons accès. Or selon à peu près n'importe quelle métrique raisonnable, nous vivons à une époque tout à fait paisible, et selon certaines, même, possiblement la plus paisible que l'Humanité ait jamais connue. Voyez par exemple ce graphe pour ce qui est de la mortalité par guerre, et cette estimation ainsi que celle-ci des homicides, pour des perspectives historiques plus larges. Ça ne veut certainement pas dire que le monde n'est pas bourré de problèmes, ni que la violence n'en est pas un sérieux, ni qu'elle n'est pas en train de ressurgir (et on peut certainement trouver des statistiques bien plus nuancées que celles que je viens de lier), mais l'impression émotionnelle qui résulte de la consommation de l'actualité n'en est pas moins profondément trompeuse.

Donc j'aime bien faire la pub, et j'en profite pour le faire ici, pour le site Web Our World in Data, qui avec Wikipédia (et malgré toutes les imperfections de l'un ou de l'autre) est un de ceux qu'il est le plus urgent de mettre entre toutes les mains et d'encourager tout le monde à consulter comme source d'information raisonnablement honnête, généralement fiable et typiquement facile à comprendre.

Je conclus par la remarque suivante tendant à justifier le titre de ce billet sous un angle légèrement différent : non seulement l'accumulation d'anecdotes ne va pas conduire à une représentation mentale fidèle du monde parce que chacune de ces anecdotes est atypique, mais aussi, et même en l'absence de volonté de manipulation émotionnelle, même leur agrégation n'est toujours pas représentative. Ceci résulte notamment d'une asymétrie fondamentale de l'information : les mauvaises nouvelles ont tendance à venir de façon soudaine (ceci ne vaut pas que pour les faits divers : guerres et catastrophes arrivent de façon soudaine), et l'actualité est dominée par ce qui est soudain et nouveau ; tandis que les bonnes nouvelles sont presque toujours lentes et incrémentales (les informations du style cette année l'espérance de vie à la naissance a de nouveau augmenté d'un mois ou le nombre de morts par homicide continue sa baisse progressive ne font pas les actualités).

↑Entry #2790 [older|※ permalink|newer] / ↑Entrée #2790 [précédente|※ permalien|suivante] ↑

↓Entry #2789 [older|※ permalink|newer] / ↓Entrée #2789 [précédente|※ permalien|suivante] ↓

2024-03-17 (dimanche)

Quatre ans après, quelles sont les leçons retrospectives de la pandémie de covid ?

Cela fait quatre ans (un peu plus ou un peu moins selon l'endroit où on se trouve) que nous est tombée dessus une pandémie qui allait durer, et bouleverser nos vies, pendant environ deux ans. Deux ans de covid suivis par deux ans d'après-covid, peut-être que ce confinementversaire est un bon moment pour regarder en arrière.

J'ai déjà raconté sur ce blog comment j'avais vécu ces journées si particulières de février-mars 2020 menant jusqu'au confinement total en France. J'y repense chaque année en cette saison parce que j'aime relire régulièrement mon journal pour me remémorer ce que je faisais il y a 1 an, 2 ans, 3 ans, 4 ans et 5 ans (en général je m'arrête là), donc forcément, en mars, je me retrouve à repenser à la covid[#] et aux confinements. Peut-être que ce n'est pas une bonne idée : je n'ai toujours pas trouvé comment dépasser[#2] le traumatisme de la sensation d'être emprisonné chez moi et d'avoir dû m'échapper comme un voleur pour aller me promener, et il n'est pas sûr que l'exercice mémoriel annuel m'aide. J'y pense aussi à propos de chaque fournée de nouveaux élèves que je vois passer : quelle année de leur scolarité a été bousillée, et quelles lacunes en conséquence ?

[#] Le fait que j'aie en ce moment un méga-rhume, qui, si j'en crois les autotests que j'ai faits, est sans doute le premier rhume que j'ai depuis la pandémie et qui ne soit pas dû à la covid, et que je ne constate franchement aucune différence de symptômes entre rhume covid et rhume non-covid (j'ai de nouveau une toux pénible), m'aide aussi à me remettre dans l'ambiance.

[#2] On peut dire que j'ai le « confinement long » comme certains ont le covid long : notamment, le fait de rester toute la journée chez moi, comme cela m'arrivait souvent avant 2019, ou même simplement de ne pas quitter mon quartier, provoque maintenant en moi rapidement une sensation de malaise et d'angoisse. C'est un comble vu que je n'aime pas non plus voyager loin de chez moi ! En tout cas, si c'est déjà modérément handicapant, cela risque de devenir bien pire avec le temps si je n'arrive pas à dépasser ce phénomène.

☞ Comment écrire l'histoire de la pandémie ?

Mais ce que me fait très justement remarquer un collègue, c'est que, collectivement, nous ne semblons à ce stade pas (encore ?) très enclins à nous replonger dans cet épisode pour en tirer les leçons ou en écrire l'histoire. La pandémie est finie[#3], mais reste encore à en écrire le récit, ainsi que celui de notre réaction à celle-ci — en tout cas, l'histoire collective, plus que la compilation de témoignages individuels.

[#3] On peut discuter de quand, bien sûr. J'aime bien dire que c'était le 24 février 2022 à 3 heures temps universel, parce que l'attention du monde s'est portée sur un autre problème, mais en vrai je considère que c'était plutôt quelques mois après (printemps-été 2022). Selon l'OMS c'était le 5 mai de l'année suivante, mais hors du cas très spécial de la Chine on ne peut pas vraiment dire que la pandémie ait beaucoup marqué l'année 2022–2023. Quoi qu'il en soit, la fin de la pandémie ne signifie évidemment pas la fin de la maladie : la covid elle-même ne disparaîtra jamais (enfin, pas avant l'extinction des mammifères ou quelque chose de très lointain comme ça). Ce qui a disparu, ce certains n'arrivent pas à enregistrer ce fait, c'est son statut spécial ; ce qui a cessé, c'est qu'on ne regarde plus les graphes de nombre de cas, de nombre d'hospitalisations, de nombre de morts, etc., que nous étions nombreux à scruter presque quotidiennement (ou à compter les vagues).

Certains aspects ont été proprement documentés, c'est vrai. Le déroulement des faits statistiques et strictement médicaux — quand le premier cas a été détecté dans tel ou tel pays, par exemple — est abondamment consigné (cf. par exemple cette chronologie sur Wikipédia et celle-ci par la CDC). On a des statistiques et des graphes de nombre de cas, de nombre de morts, de vaccinations, ce genre de choses, pays par pays, région par région. Je me souviens avoir vu un documentaire intéressant sur la course au développement des différents vaccins : là aussi, la chronologie factuelle est clairement établie.

Cependant, tout ça est à l'histoire de la pandémie ce qu'une succession de récits de batailles serait à l'histoire de la première guerre mondiale : ça en fait partie, mais ce sont des arbres qui cachent la forêt.

Certains éléments historiques font déjà l'objet de polémiques. La question de l'origine du virus SARS-CoV-2, en particulier, a attiré énormément d'attention, à cause de la théorie selon laquelle il résulterait d'un accident de laboratoire (théorie que je qualifierais d'improbable mais pas de déraisonnable — à ne pas confondre avec les théories selon lesquelles il s'agirait d'un événement délibéré et qui relèvent, elles, du complotisme le plus farfelu). À vrai dire je ne trouve pas très intéressante cette question de l'origine du virus, et je ne trouve pas que ça change grand-chose de toute façon ; en revanche la méta-question de pourquoi cet aspect précis de l'histoire de la pandémie semble fasciner tant de gens, et polariser leur opinion, est, pour sa part, beaucoup plus intéressante à mes yeux (et je vais revenir plus bas sur la question de la polarisation de l'opinion).

Une autre chose qui a été étudiée rétrospectivement, notamment à cause de toute la sociologie complotiste qui s'est cristallisée autour, c'est l'« effet gourou » et les médicaments miracles. En France le gourou a été incarné par un certain chercheur médiatique marseillais qui s'est pointé dès le début de la pandémie avec son traitement-miracle dont on a ensuite pu constater que le traitement ne faisait rien du tout ou pire que rien, mais c'était trop tard, le mal était fait, des gens avaient décidé de n'écouter que lui ; puis il y a eu un autre remède censément miracle, tout aussi inefficace. La question de pourquoi les gens croient et veulent croire à ces remèdes miracles, de l'interaction avec les théories du complot, et les mécanismes psychologiques qui font que certains sont plus prêts à accepter un remède qui ne fait rien qu'un vaccin qui fait vraiment quelque chose, sont assez fascinants, mais là aussi, ce n'est qu'une facette de cette pandémie (et finalement rien de vraiment spécifique à elle : le complotisme antivax a une histoire bien plus longue).

Et puis il y a la question des modes de transmission : savoir pourquoi on a cru au début (ou cru qu'on croyait ? ou feint de croire ?) que le virus se transmettait par manuportage, si bien qu'on nous a donné comme consigne abondamment répétée de nous laver soigneusement les mains et qu'on s'est focalisés sur le gel hydro-alcoolique qui ne servait finalement à rien dans une pandémie respiratoire. (Je crois que j'avais vu passer un texte qui expliquait l'origine de cette erreur, mais je ne le retrouve plus.)

C'est d'ailleurs fascinant comme nous aimons regarder les pandémies du passé avec une sorte de condescendance sur les gens d'alors qui faisaient toutes sortes de rituels complètement inefficaces pour se protéger de (disons) la peste, alors que nous avons passé des mois à nous laver très soigneusement les mains, voire à désinfecter ce que nous achetions au supermarché, pour absolument rien. Mais passons.

D'autres aspects de la pandémie, en revanche, ne semblent guère avoir fait l'objet d'une analyse sérieuse.

☞ La dilapidation de la crédibilité des scientifiques

Notamment, il y a la question des prédictions des épidémiologistes-modélisateurs. Celle-là m'a beaucoup intéressé pendant la pandémie (j'avais par exemple écrit ce billet au sujet des biais systématiques dont ils étaient victimes), mais je trouve qu'on n'en a pas vraiment parlé après. Évidemment, ce qui est bien avec le recul du temps, c'est qu'on peut confronter les prédictions à la réalité : cette analyse rétrospective des modèles épidémiologiques est ce que fait cette page pour ce qui est de la France, c'est très intéressant (et assez frappant pour confirmer le fait que les biais de ces modèles sont systématiques et que les scénarios ne représentent pas du tout une fourchette autour de la réalité). Mais on aimerait voir une étude approfondie de la question : qu'est-ce qui a fait que des modèles largement dépourvus de fondement empirique ont été utilisés pour faire des études présentés au public et aux pouvoir politique comme des prédictions scientifiques[#4] ? (Ces modèles sont certes mathématiquement intéressants, j'ai moi-même joué avec, mais je suis bien placé pour savoir que mathématiquement intéressant ne dit pas grand-chose sur la capacité de prédire le réel, même si on ajoute assez de paramètres pour faire agiter la trompe au proverbial éléphant.)

[#4] Encore maintenant, on continue à voir passer (et reprendre par la presse) des études selon lesquelles les mesures prises en France auraient sauvé tel ou tel nombre de vies. Je résume en quoi consiste cette escroquerie scientifique, qui est substantiellement la même que dans l'article de l'équipe de Ferguson au début de la pandémie. On part d'un modèle profondément inadapté à décrire une pandémie humaine, à savoir le modèle SEIR, auquel on ajoute plus de compartiments pour donner l'impression que c'est plus sérieux, mais sans rien faire pour corriger les hypothèses délirantes intrinsèques au modèle SEIR (que les contacts entre personnes sont aléatoires et équiprobables, que tout le monde est également susceptible à l'épidémie, que les gens ne modifient pas leurs comportements à l'épidémie elle-même, seulement aux mesures prises par en haut, etc. — toutes sortes de choses qui sont démontrablement et évidemment complètement fausses). Ensuite, on postule que la seule chose qui peut réduire la transmission de l'épidémie est une mesure prise parmi un ensemble qu'on a choisi d'identifier (confinements, fermetures d'écoles, etc.), on fait une régression sur la dynamique du modèle pour inférer à partir de ce postulat quelle est la réduction de transmission correspondant à chacune des mesures, et on rédige ça en cachant le postulat et en faisant comme si on avait démontré que telle mesure produit telle réduction de la transmission. Débarrassé de sa sophistication modélisatrice, l'article dit juste j'ai postulé que la cause de ceci était cela, et j'observe l'étendue de son effet. Outre que ces articles ne définissent pas un confinement autrement que comme le paquet de mesures pris par la France entre telle et telle date et dont j'ai postulé qu'il était la cause de l'effet que j'observe, l'escroquerie devient généralement apparente quand on applique exactement le même modèle à la Suède : soit on doit ajouter un paramètre d'ajustement ad hoc qui prend une valeur mystérieusement énorme pour la Suède, soit on décide que la Suède a eu l'équivalent d'un confinement (les Suédois se sont autoconfinés), auquel cas le modèle ne démontre en rien l'utilité des mesures prises en France. (Si on veut, l'ensemble des études épidémiologiques sur l'efficacité des confinements semble surtout démontrer que le terme de confinement est performatif par une sorte de consensus social, mais n'explique en rien ce qui constitue ce terme — à part d'avoir décidé de l'appeler comme ça — ou ce qui crée ce consensus.) Pour ma part, j'aimerais vraiment savoir si les auteurs de ce genre de papiers croient vraiment les conneries qu'ils racontent ou s'ils veulent juste allonger leur liste de publication (ou, plus vraisemblablement, sont de malheureux doctorants à qui on fait faire un vil boulot auquel ils ne croient pas du tout).

Cette question est importante parce que, j'ai déjà exprimé cet avis à diverses reprises, ces prédictions par les épidémiologistes-modélisateurs dont le grand public a pu mesurer combien elles étaient imbues d'une confiance excessive, ont endommagé la réputation de la science dans son ensemble. Et à une époque où, dans toutes sortes de domaines, nous avons cruellement besoin qu'on écoute ce que la science et les scientifiques ont à dire, ces gens ont fait un mal fou en mettant en avant des prédictions dont tout le monde pouvait mesurer immédiatement combien elles étaient fausses.

[Lire la suite…]

↑Entry #2789 [older|※ permalink|newer] / ↑Entrée #2789 [précédente|※ permalien|suivante] ↑

↓Entry #2788 [older|※ permalink|newer] / ↓Entrée #2788 [précédente|※ permalien|suivante] ↓

2024-03-09 (samedi)

La dystopie des applications sur smartphone

La cause immédiate de l'écriture de ce billet est que la chaîne de salles de sports où je pratique la musculation (Neoness) a décidé de changer le contrôle à l'entrée de ses clubs et semble[#] maintenant exiger qu'on bippe au portique avec son smartphone sur lequel on aura installé une app qu'ils proposent, plutôt que de simplement présenter une carte de membre comme c'était le cas avant. L'app en question est notée 1.6 étoiles sur 5 en moyenne sur le Play Store d'Android (et je rappelle que le minimum est 1 étoile, pas 0, donc 1.6 étoiles sur 5 doit en fait se comprendre comme 0.6/4, ou 3/20 si on veut), ce qui donne une idée de combien les gens l'aiment, mais à la limite ce n'est pas mon problème : ce qui me préoccupe est plutôt la question de savoir dans quelle mesure il est acceptable d'une part, et légal d'autre part, d'exiger aux clients d'un club de sport, et plus généralement aux gens voulant pratiquer telle ou telle activité ou bénéficier de tel ou tel service, d'installer une app sur leur smartphone (et donc, pour commencer, d'avoir un smartphone permettant d'installer ladite app). Et de façon plus large, je veux réfléchir (réfléchir voulant dire : ranter de façon incohérente[#2]) sur la manière dont les apps pour smartphone nous enchaînent dans ce qui ressemble de plus en plus à une dystopie.

[#] J'écris semble ici, parce que tout est extrêmement confus à ce stade : peut-être que des nouvelles cartes (compatibles avec leur nouveau système) seront censées être disponibles pour les gens qui ne veulent pas utiliser leur smartphone, peut-être qu'elles sont « juste » en retard, peut-être qu'elles seront payantes, rien n'est clair. (Si elles sont payantes, je trouve complètement anormal qu'on me demande de payer un nouveau badge pour accéder à un club de sports dont j'ai déjà payé — comptant — l'inscription annuelle. Mais bon, ça m'emmerde beaucoup moins que de devoir installer une app sur mon téléphone, donc si le choix est entre payer ~15€ pour une nouvelle carte ou installer une app, je préfère payer ; et si le choix est entre payer ~15€ pour une nouvelle carte ou me faire rembourser le temps restant sur mon abonnement, je préfère aussi payer.) ❧ La raison pour laquelle tout ça n'est pas clair est que la première fois que j'ai voulu entrer et qu'on m'a dit que l'ancienne carte ne marchait plus et qu'il fallait installer une app j'ai dit je n'ai pas de smartphone avec moi et on m'a laissé passer ; et la seconde fois je voulais quand même savoir si ça marchait, donc j'ai badgé avec leur app de m●rde. Je ne voulais pas m'engueuler avec le préposé à l'entrée, qui n'y est pour rien et dont ce n'est pas le boulot : j'attendrai de voir si je peux parler au responsable du club. Mais comme le cas précis de Neoness n'est qu'un prétexte pour parler du problème de façon plus large, peu importent ces détails.

[#2] Et avec quantité de digressions présentées sous la forme de notes. D'ailleurs, tant que j'y suis à digresser, il faudrait un jour que je trouve un terme en bon français bien de chez nous pour remplacer le franglicisme ranter. Peut-être déblatérer ?

☞ À qui les apps mobile rendent-elles service ?

Il y a une app pour ça nous promettait le slogan qui nous a fait passer dans la seconde phase de la téléphonie mobile, celle où on est passé du téléphone mobile de base qui servait juste[#3] à échanger des appels et des SMS et peut-être à prendre des photos, à un appareil à tout faire, indispensable accessoire pour tant de nos activités quotidiennes. Notez bien que je ne me plains pas en soi de l'avènement du smartphone : avoir Internet tout le temps dans la poche me rend vraiment service (pour consulter Wikipédia ou quelques autres sites Web, utiliser des cartes, accéder à distance à des fichiers sur mes propres ordinateurs), et je ne regrette pas le bon vieux temps. Et même s'agissant des apps, il y en a quelques unes qui me sont vraiment utiles[#4].

[#3] Bon, en fait il y a eu très tôt des sortes d'applications sur les téléphones pré-smartphone : certains jeux étaient préinstallés sur le téléphone, et sur certains on pouvait installer d'autres choses. Mais comme ces téléphones n'avaient qu'un accès limité à Internet (et qu'Internet sur mobile coûtait la peau du c●l), peu de gens installaient quoi que ce soit ; et comme en plus les téléphones étaient peu compatibles entre eux, il n'y avait pas de vrai écosystème d'apps comme il y a maintenant sous Android et iOS. Il aurait été impensable à plus d'un titre, à cette époque, d'exiger une app sur téléphone pour quoi que ce soit.

[#4] Notamment, comme je le disais dans ce billet, OsmAnd pour avoir des cartes hors ligne, QuickDic pour des dictionnaires hors ligne, Signal comme application de messagerie, PlanetDroid pour connaître l'heure de lever et coucher du soleil et de la lune, et quelques autres de ce genre.

Mais quand même, on est en droit de se demander : à qui les téléphones cherchent-ils à rendre service ?

Une amie m'avait fait la remarque (ça devait être à l'ère pré-smartphone) que les téléphones mobiles rendaient surtout service aux gens qui cherchent à vous joindre — et pas forcément à vous si vous êtes de ces personnes qu'on cherche à joindre plus souvent qu'elle ne cherche à joindre les autres : on présente ça comme un outil fabuleux, et parfois il l'est, mais ça peut aussi être un mécanisme d'asservissement, notamment à l'obligation sociale d'être tout le temps joignable[#5].

[#5] On peut dire la même chose des mails, qui ont créé la norme sociale qu'on est « censé » les lire en moins de 24h, ce qui représente aussi un sacré asservissement.

Il en va de même des apps sur mobile : parfois elles sont effectivement là pour vous rendre service, mais souvent elles rendent surtout service à la personne qui a créé l'app : il y a du vrai[#6] dans l'adage que si c'est gratuit c'est que c'est vous qui êtes le produit.

[#6] Ce n'est pas toujours vrai, heureusement, il y a des gens qui ne sont pas des connards et qui développent bénévolement des logiciels libres ; mais comme je l'ai déjà signalé l'écosystème des smartphones est extrêmement pourri et tourné vers la recherche du profit, et il n'y y a que très peu de logiciels libres : quasiment toutes les apps (même des choses qui ont dû demander cinq minutes à écrire) sont soit payantes soit infestées de pubs soit destinées à rendre plus service à l'entité qui les a développées qu'à la personne qui les installe. Et c'est vraiment une question de culture, parce que dans le monde des ordinateurs ce n'est pas ça qui manque, les programmes, mêmes complexes, qui sont libres, gratuits, sans pubs et développés sans arrière-pensée malsaine.

Globalement parlant, si on essaie de vous inciter à installer une app, c'est probablement que vous ne devriez pas installer cette app ; et la note incroyablement basse de l'application Neoness que j'évoque plus haut en est une bonne illustration. C'est un petit peu exagérément simplifié, mais il y a de ça. Les apps vraiment utiles pour moi (exception faite de celles de Google, qui sont un peu à part parce que ce sont de toute façon eux qui développent Android donc ils ont un intérêt plus subtil dans l'affaire), j'ai dû découvrir leur existence par moi-même, on n'a pas essayé de me convaincre de les utiliser (bon, peut-être quelques amis dans le cas de Signal, mais en tout cas pas les gens à l'origine de l'app).

☞ Apps mobiles vs. webapplications

Il y a un dessin de xkcd qui résume très bien les choses : il montre un popup sur un site Web pour mobile qui affiche Want to visit an incomplete version of our website where you can't zoom? Download our app! et les deux choix sont OK ou No, but ask me again every time. Ceci mérite quelques commentaires. Pourquoi au juste tient-on à nous faire installer une app mobile plutôt que passer par un site Web ? Je n'ai pas forcément la réponse complète, mais j'ai des éléments de réponse qui doivent couvrir l'essentiel des cas. (Je renvoie à mon long billet de vulgarisation pour les généralités sur le Web et son fonctionnement technique qui sont plus ou moins pertinentes ici.)

D'abord, il est vrai qu'il y a des choses qu'on peut faire dans une app et pas dans un site Web. Mais la différence n'est pas aussi prononcée qu'on pourrait le croire : comme je l'explique dans le billet que je viens de lier, le Web moderne permet à tout site de se comporter comme une véritable application ; en gros, un site Web est une app qui tourne sur votre navigateur comme n'importe quelle app mobile en est une qui tourne sur Android/iOS : il y a des différences techniques comme le fait que l'app Web est normalement écrite en JavaScript alors que l'app mobile est écrite en Java pour Android ou Objective-C pour iOS, mais peu importe. Et de fait, on trouve des exemples d'applications assez complexes sous forme de sites Web, de la suite bureautique (Google Docs) à des jeux en passant par toutes sortes de réseaux sociaux. (Comme il est beaucoup plus pénible de diffuser des apps pour ordinateurs fixes que pour mobiles, beaucoup de services qui veulent pouvoir être accessibles sur fixe et sur mobile, comme les réseaux sociaux, ont une app mobile en plus d'un site Web, ce qui interroge forcément sur l'utilité de la première.) Et on aurait tort, aussi, de croire que le JavaScript tournant dans un site Web est forcément significativement plus lent qu'une app mobile : bon, peut-être que pour des choses extrêmement critiques la différence est pertinente mais certainement pas pour 99% des apps qu'on utilise normalement sur smartphone.

Alors il est vrai que certains éléments du smartphone ne sont pas forcément utilisables depuis un site Web. Mais même sur ce plan la différence n'est si claire : après tout un site Web peut demander, par exemple, à consulter la position relevée par le GPS (évidemment, votre navigateur vous demandera votre permission avant de permettre à l'application Web de l'obtenir ; et d'ailleurs, le système d'exploitation mobile vous demandera aussi votre permission avant de permettre au navigateur de l'obtenir). Un site Web doit aussi pouvoir demander la permission d'accéder à la caméra du téléphone, ou à son microphone. Je ne sais pas s'il y a des mécanismes (API) d'accès aux accéléromètres ou autres capteurs de ce goût, et il n'y a probablement pas moyen de faire du NFC ou du Bluetooth un peu fin, mais on voit quand même qu'il y a une certaine flexibilité dans ce qu'on peut faire en JavaScript depuis une page Web (et donc en utilisant, en quelque sorte, le navigateur comme un système d'exploitation mobile).

D'ailleurs, c'était l'idée derrière Firefox OS, un système d'exploitation pour mobile que Mozilla avait commencé à développer (j'ai brièvement eu un téléphone sous ce système, mais malheureusement il est mort — le système d'exploitation, je veux dire, pas le mobile) : le téléphone faisait tourner essentiellement une seule chose, à savoir Firefox, et la frontière était totalement abolie entre un site Web et une application Firefox (OS). Notamment, on pouvait tester une application sans l'installer, puisque de toute façon la procédure d'installation ne faisait que rendre l'application disponible en local, mais sans changement fondamental par rapport à utiliser directement le site Web. Le système de permissions était très bien fait (il était très en avance sur Android, et il a été partiellement repris par ce dernier), et donnait un bon contrôle à l'utilisateur. Bref, ce système d'exploitation mobile aurait été (du point de vue de l'utilisateur) tellement meilleur qu'Android et iOS — si seulement le succès n'était pas une question d'argent — et c'est une tragédie[#7] que Mozilla n'ait pas eu les moyens suffisants pour lui tailler une place dans l'écosystème mobile. Mais on sait déjà que le monde informatique favorise les oligopoles de la médiocrité.

[#7] On pourrait quand même espérer une forme de retournement de la chance sous la forme suivante : que les navigateurs Web finissent par adopter les interfaces permettant de faire depuis une page Web tout ce que Firefox OS aurait permis (y compris une forme de copie locale du site), si bien que Firefox sur Android puisse servir de facto de Firefox OS (la couche Android n'étant là que pour prendre de la place) ; et que progressivement les gens prennent l'habitude de refuser d'installer des apps sur mobile et exigent des sites Web. Malheureusement, on ne semble pas trop en prendre la voie. Et comme Google a la main à la fois derrière Android et derrière le navigateur Chrome, il ne se prive pas pour abuser de sa position dominante ; côté iOS, c'est encore pire puisque, jusqu'à ce que l'Union européenne n'oblige Apple à rendre un peu de liberté à ses utilisateurs (et encore, Apple n'y a consenti, sous la menace légale, que dans l'Union européenne), le seul navigateur possible sur iOS était celui d'Apple, Firefox pour iOS n'étant qu'une couche de vernis autour.

☞ Pourquoi on veut nous faire installer une app

Mais je digresse. Ce que je veux dire, en tout cas, est que dans la grande majorité des cas, ce que je cherche à faire est faisable uniquement dans une app et pas dans un site Web n'est pas la vraie raison pour laquelle on cherche à vous faire installer une app — si tant est que ce soit mis en avant, c'est plutôt un prétexte. (Il y a bien quelques cas où il me semble légitime qu'une app sur smartphone soit nécessaire pour accéder à un service : par exemple un système de location de voitures, mais je vais y revenir.)

La vraie raison est pour laquelle on cherche à nous pousser à utiliser une app surtout à chercher dans deux choses. D'abord, une app il faut l'installer, alors qu'un site Web on se contente de le visiter (comme je le dis ci-dessus, Firefox OS prévoyait un mécanisme par lequel des webapplications auraient permis une copie locale, ce qui serait d'ailleurs souhaitable pour plein de raisons, mais en l'état, un site Web il n'est consultable qu'en ligne). Du point de vue de l'utilisateur ça peut effectivement être une raison légitime, si l'application est destinée à pouvoir servir même là où on n'a pas forcément de couverture réseau — mais la plupart des apps mobiles ne marchent de toute façon pas sans accès au réseau, donc ce n'est pas vraiment ça. Du point de vue du concepteur de l'app, le fait d'obliger l'utilisateur à l'installer lui donne une métrique, le nombre de téléchargements de l'app, et les commerciaux aiment bien les métriques à maximiser et à mettre en avant sur leurs présentations PowerPoint : téléchargements égale visibilité égale pouvoir, ou quelque chose comme ça.

L'autre chose, c'est surtout qu'une app donne plus de pouvoir qu'un site Web, et je parle là de pouvoir de s'opposer à l'utilisateur ou de le contrôler. Par exemple, mais ce n'est qu'un exemple d'un phénomène plus large, il est beaucoup plus difficile de bloquer les pubs dans une app mobile que de bloquer les pubs dans un site Web.

[Lire la suite…]

↑Entry #2788 [older|※ permalink|newer] / ↑Entrée #2788 [précédente|※ permalien|suivante] ↑

↓Entry #2787 [older|※ permalink|newer] / ↓Entrée #2787 [précédente|※ permalien|suivante] ↓

2024-03-03 (dimanche)

Sur le dangereux mythe du « génie »

Quand l'an dernier j'ai écrit un billet sur l'intelligence artificielle je me suis dit que je devrais en faire un aussi sur l'intelligence naturelle — pour expliquer, en gros, que je trouve que, sans nier que des gens différents réfléchissent de façon différente, l'intelligence est un terme tellement vague et fourre-tout qu'il ne veut plus rien dire du tout, et qu'en gros à chaque fois que quelqu'un essaie de s'en servir c'est une tentative d'escroquerie. Je n'exclus pas de faire ce billet un jour ultérieur, mais je voudrais commencer par un sujet proche quoique légèrement différent : le mythe du génie. Je ne veux pas parler ici des djinns des Mille et Une Nuits, mais des gens supposés avoir des capacités exceptionnelles dans un domaine intellectuel, artistique, militaire, politique, commercial, ou quelque chose de ce genre.

Le mythe du génie existe sous différentes variantes. Il y a par exemple le mythe du petit génie, c'est-à-dire du génie précoce : je me sens particulièrement enclin à démystifier celui-là parce qu'on a plus ou moins essayé de me faire passer comme tel quand j'étais ado, ce qui a certainement nui à mon développement émotionnel et à mes chances de construire des relations humaines saines[#] (heureusement j'avais des amis solides qui n'étaient pas victimes de ce mirage) ; donc maintenant, à chaque fois que j'entends parler d'un « petit génie » je pense surtout qu'on est en train de casser les chances d'un gosse d'avoir une enfance normale en le traitant comme une bête de foire[#2].

[#] Je veux dire que non seulement cette illusion du petit génie tendait à me mettre à l'écart des autres comme « le mec bizarre », mais ça m'encourageait à me justifier à moi-même ma mise à l'écart parce que je vaudrais mieux qu'eux, — et donc à faire de moi un petit con prétentieux. Les choses sont évidemment plus complexes et plus nuancées que cette présentation simpliste (je n'ai certainement pas été ostracisé pendant ma scolarité, même si j'ai largement été considéré comme bizarre ; et si on est en droit de penser que je suis resté un petit con prétentieux j'espère avoir changé au cours des 30 dernières années), mais il me semble que laisser des enfants croire qu'ils sont des petits génies, ou laisser leurs pairs le croire d'eux, ne peut que nuire à leur épanouissement.

[#2] Il y aurait aussi tout plein d'autres choses à dire sur le concept de haut potentiel intellectuel, qui semble plus en vogue parce que petit génie ne fait pas très scientifique, et parce que c'est superficiellement plus modeste (et plus difficilement falsifiable puisque c'est juste du potentiel). À mes yeux, c'est un concept tout aussi nuisible, mais sans doute plus une escroquerie orientée vers les parents tout prêts à croire que Chérubin a un grand potentiel c'est-à-dire qu'il est très spécial. Comme je ne suis pas parent, et que ce terme ne semblait pas trop utilisé quand j'étais gosse, je ne m'étends pas là-dessus.

Mais il y a aussi le mythe du grand génie, c'est-à-dire quelqu'un qui fait quelque chose d'inaccessible à tout autre, qui a des éclairs de fulgurance (coups de génie) pouvant aller jusqu'à transformer l'Humanité (ou tout un domaine scientifique, artistique, etc.) : celui qui laisse vraiment une marque dans l'Histoire.

Quand je dis que c'est un mythe, ce n'est évidemment pas une affirmation scientifique précise : la notion étant mal définie pour commencer, il est difficile de prendre une position qu'on puisse assujettir à un test statistique : les génies existent-ils ?. Mais disons que je ne vois rien sous cette notion qui ne puisse s'expliquer par une combinaison de motivation et d'efforts ordinaires, de chance, et surtout d'un énorme effet de sélection et mirage de la célébrité dans la manière dont nous aimons repenser le passé pour en faire de jolies histoires — ainsi que d'un effet « boule de neige » dont je dois reparler.

L'Histoire avec une grande ‘H’ est une aventure collective : mais une aventure collective, c'est difficile à raconter, donc quand notre culture la digère pour en recracher un narratif, elle tend volontiers à chercher des héros (et des anti-héros) autour desquels centrer le récit. Dans certains domaines ces figures qui servent à cristalliser l'Histoire peuvent être celles qui ont beaucoup de pouvoir, beaucoup de courage, ou que sais-je encore : quand il s'agit d'écrire l'histoire des sciences ou des arts, ce sont les « génies ». C'est tellement plus commode de raconter les choses en les coalesçant autour d'une poignée de noms emblématiques (auxquels on peut dédier ensuite une rue ou ériger une statue[#3]) que de regarder la réalité forcément brouillonne et irrégulière du progrès, que nous succombons à ce mythe avec enthousiasme.

[#3] Quelque part il faut aussi que j'écrive un billet pour protester contre cette manie de nommer les choses d'après des gens et de leur ériger des statues. Au mieux c'est planter des arbres pour cacher la forêt. Au pire, on découvre que ces gens qu'on a érigés en icônes ont des côtés moralement pas très reluisants (et nous en avons certainement tous, quoique certains plus que d'autres évidemment) : et tout d'un coup on est embarrassé d'avoir cette rue ou cette statue qui font tache.

Pour être clair, je ne cherche pas à nier que, disons, Léonard de Vinci (pour prendre un exemple un exemple archétypal du « génie ») était un très grand peintre et un très grand ingénieur. Mais il est à l'image de sa Joconde qui focalise les regards de millions de touristes venus au Louvre pour voir ce tableau et nul autre : une sorte de délire collectif qui voudrait nous faire oublier la forêt pour ne voir que cet arbre.

J'ai souvent défendu, ici et ailleurs (par exemple dans ce vieux billet — que je devrais peut-être réécrire —, ou en passant dans celui-ci), la thèse selon laquelle c'est un mythe que le succès (sous toutes ses formes : popularité, reconnaissance, réussite en affaires, etc.) serait mérité plutôt qu'être essentiellement dû au hasard. Un mythe qui, à mes yeux, découle de notre volonté de croire à l'inévitabilité et une forme de morale dans l'Histoire (sophisme du monde juste). S'agissant spécifiquement de la Joconde, on sait très bien que sa popularité est le fruit de divers accidents largement indépendants de sa qualité : un texte écrit en 1869 par Walter Pater, et son vol en 1911 (voir par exemple cette vidéo et cet article de Britannica pour l'histoire de la célébrité de cette œuvre précise). On peut assurément penser que la Joconde est un très beau tableau, mais il n'est pas tenable une seule seconde de prétendre qu'il est tellement exceptionnel qu'il éclipse à lui seul quasiment tout le reste du contenu du Louvre : les gens veulent le voir parce qu'il est célèbre, et il est célèbre parce que tant de gens le voient et en parlent et réutilisent son image — c'est un effet « boule de neige ».

Les réseaux sociaux modernes favorisent grandement cet effet « boule de neige » de la célébrité et du succès en général : une histoire devient « virale », comme on dit, en petite partie à cause de son intérêt intrinsèque, mais énormément à cause du fait que plus elle est reproduite plus elle a de chances d'être reproduite de nouveau. Il en va de même de toutes les métriques de ce genre : le nombre d'abonnés d'un compte YouTube, par exemple. Et on sait très bien que ce n'est pas reproductible (donc pas intrinsèque) parce qu'on a quantité d'exemples de situations où plusieurs personnes ont tweeté exactement la même chose, mais l'une des copies a eu un succès planétaire et pas l'autre : il n'y a pas plus de logique à ça qu'au fait que de deux boules de neige, l'une peut déclencher une avalanche et l'autre pas. La qualité peut aider à rencontrer la popularité, il y a sans doute une corrélation, mais elle n'est ni vraiment nécessaire, ni certainement suffisante. (Il y a d'ailleurs des gens qui dont la raison d'être célèbre est justement d'être célèbres, du genre Kim Kardashian.)

Mais ce n'est pas tellement ce caractère aléatoire du succès qui m'intéresse ici. C'est déjà un peu plus le mythe du mérite, que nous construisons autour parce que nous n'aimons pas croire au hasard, parce que nous avons le cerveau tellement câblé à chercher des causes et des corrélations que nos ancêtres ont inventé des dieux qui régissent l'Univers en cherchant des motifs dans la météo ou d'autres phénomènes naturels.

Le mythe du mérite n'est nulle part aussi frappant que dans le fantasme autour du supposé génie des milliardaires en affaires, et notamment des milliardaires de la tech.

Il y a plein de gens qui sont persuadés que puisque Bill Gates, Steve Jobs, Jeff Bezos, Mark Zuckerberg et maintenant souvent Elon Musk, sont aussi riches, c'est forcément que ce sont des génies visionnaires. C'est fascinant à quel point ce mythe est fort : on ne devient pas l'homme le plus riche du monde par chance m'a-t-on dit régulièrement. Ben si, évidemment que c'est possible : même si tout le monde passait sa vie à jouer au casino, il faudrait bien qu'il y ait une personne la plus riche du monde, et ça ne signifierait pas qu'elle ait la moindre capacité à prédire le mouvement de la boule de la roulette.

Le mirage des milliardaires s'explique parfaitement par l'effet de sélection : des tas de gens ont parié leur argent sur des tas de projets d'entreprises qui avaient une certaine chance de réussir et une certaine chance de se planter, et c'était essentiellement imprévisible parce que le succès est imprévisible et essentiellement aléatoire : l'essentiel de ces gens ont juste perdu leur argent, et on ne s'intéresse qu'à ceux qui ont réussi, donc par définition ils ont réussi, et il n'y a rien à expliquer à part qu'on s'intéresse à eux parce qu'ils ont réussi. Si on veut expliquer le pourquoi eux, on peut dire qu'ils étaient en général riches pour commencer (pas forcément multi-milliardaires, mais au moins passablement riches), ce qui leur a permis d'emprunter assez pour investir beaucoup, voire investir de façon répétée dans des projets risqués sans risquer de se retrouver sur la paille alors que des gens moins riches avaient une seule chance dans la vie. (Encore une fois, évidemment, il y a plein de gens riches qui ont investi beaucoup et se sont plantés — et pas retrouvés sur la paille mais juste un peu moins riches qu'ils ne l'étaient — mais on n'en parle pas trop, parce qu'on ne fait pas une étude statistique sérieuse.)

[Lire la suite…]

↑Entry #2787 [older|※ permalink|newer] / ↑Entrée #2787 [précédente|※ permalien|suivante] ↑

↓Entry #2786 [older|※ permalink|newer] / ↓Entrée #2786 [précédente|※ permalien|suivante] ↓

2024-02-23 (vendredi)

Guide du tourisme en Île-de-France : partie 2 (le sud et sud-ouest)

Je continue ma tentative d'écrire une sorte de guide touristique de l'Île-de-France commencée dans la première partie qui concernait des généralités et la petite couronne, et auquel je renvoie pour l'introduction. Je vais suivre approximativement le sens des aiguilles d'une montre autour de Paris (mais en commençant par le sud) : initialement, mon idée était de regrouper par département, mais c'est un peu artificiel alors je vais faire mon propre regroupement, sans doute pas moins artificiel, qui correspond à ma propre façon de penser la géographie de la région. Comme pour l'entrée précédente, ceci est une sélection complètement personnelle et pas du tout représentative d'autre chose que mes propres goûts (et possibilités de déplacement), et en plus je ne parle ici que des activités « en extérieur » — et même comme ça j'aurai forcément oublié plein de choses (que je vais peut-être ajouter ultérieurement en éditant ce billet).

Concernant les liens vers OpenStreetMap : je les ai faits vers des cartes à toute petite échelle pour qu'on voie bien la situation d'ensemble, mais le marqueur est positionné aussi précisément que j'ai pu (ou que ça avait un sens !) : donc pensez à zoomer.

Table des matières

Première partie (généralités et petite couronne) :

Deuxième partie (le sud et sud-ouest) :

Forêt de Fontainebleau et alentours

Image : Paysage typique de la forêt de Fontainebleau (photo prise ici le 2022-08-21)

Je vais commencer par Fontainebleau et sa forêt (donc par ici). Fontainebleau (comme Rambouillet et Compiègne, ou dans une certaine mesure Versailles, mais c'est encore plus clair à Fontainebleau) est organisée en oignon : un château, les « jardins » du château, le « parc » (un peu moins manucuré que les jardins mais néanmoins enclos) qui prend place contre la ville, et la forêt autour de la ville. Comme par le principe de ce billet je ne parle pas du château lui-même. Les jardins du château de Fontainebleau sont jolis (et labellisés « jardin remarquable ») quoique pas très grands : il y a un jardin à la française et un jardin à l'anglaise façon arboretum ; le parc n'est pas mal, mais c'est surtout la forêt à laquelle on pense quand on parle de Fontainebleau. Non seulement la forêt de Fontainebleau est grande (enfin, à l'échelle de l'Île-de-France), mais elle n'est pas trop morcelée (il y a bien un golf, des stades et un ou deux hippodromes, mais la forêt est assez grande pour que ça ne la coupe pas en morceaux). Donc c'est la forêt de référence pour les sorties dominicales des Parisiens par jour de beau temps (et de fait, certains dimanches de beau temps les parkings tendent à être bien pleins).

Comme je le disais dans les remarques générales (du billet précédent), c'est un peu difficile de parler d'une forêt de façon générale, et celle de Fontainebleau est assez variée. Elle est connue pour ses « rochers », et beaucoup de gens viennent y faire de l'escalade, et même si on n'aime pas l'escalade il y a du relief avec de jolis points de vue (souvent marqués comme tels dans OpenStreetMap), mais on trouve aussi plein d'endroits tout plats. Le sol est généralement sablonneux, mais il y a plein de variations. Il y a beaucoup de pins mais ça n'empêche pas de trouver des endroits avec uniquement des feuillus. Bref, c'est difficile de faire des généralités. Je peux quand même mentionner les platières, qui sont plutôt une spécificité bellifontaine : des endroits où le grès affleure le sol en formant une sorte de terrasse, de grands arbres mais où la bruyère se plaît (cherchez sur Google Images si vous ne connaissez pas).

Je peux quand même évoquer quelques curiosités dans la forêt de Fontainebleau. La plaine de Chanfroy (ici) est un grand espace dégagé d'arbres où se trouve un monument aux morts ; juste à côté de là, la tour de la Vierge (ici) est une bondieuserie (un petit autel à la vierge Marie décoré de façon extrêmement kitch) qui a l'intérêt d'être situé sur un point culminant d'où on a une vue superbe (sans intérêt particulier — juste sur de la forêt — mais qui porte vraiment loin). La mare aux Évées (ici) est une mare (artificielle) entourée d'un système de rigoles assez curieux (cherchez dans Google Images). La table du Grand-Maître (ici) et la table du Roi (ici) sont d'énormes tables de pierre datant du XVIIe siècle. La tour Denecourt (ici), juchée sur une colline, est un point d'observation datant du XIXe siècle. Le chêne du Rocher Canon (ici) est un chêne qui pousse directement sur un rocher. La forêt est par ailleurs traversée par les aqueducs de la Vanne et du Loing (alimentant en eau une bonne partie de Paris), et ils prennent ici et là la forme de ponts-siphons assez intéressants à voir, par exemple ici (visible ici sur Google Street View) ; il y a d'ailleurs une importante station technique ici dans la forêt. (J'aime bien jouer au petit jeu de dénicher les endroits où on voit dans le paysage les traces du passage, souterrain ou aérien, de l'eau de Paris.)

La ville de Fontainebleau est évidemment accessible en transports en commun (gare de Fontainebleau–Avon, sur la ligne R du Transilien) ; mais la forêt à sa propre halte un peu secrète (ici), même pas mentionnée sur les plans de la ligne : elle est desservie uniquement dans le sens Paris→Fontainebleau, par seulement deux trains de la ligne R, le matin des week-ends et jours fériés. (Enfin, elle eut été un peu secrète avant l'époque d'Internet : maintenant elle a sa page Wikipédia donc c'est un peu mort pour le secret.)

À côté de la forêt de Fontainebleau (ou peut-être à considérer comme en faisant partie), il ne faut pas oublier le massif des Trois Pignons (à l'ouest, vers Arbonne-la-Forêt, par ici mais je ne sais pas où est la limite), qui a à peu près le même caractère quoique peut-être avec plus de relief et plus de pins, mais aussi la forêt de la Commanderie (au sud, vers Villiers-sous-Grez et Larchant, par ici), qui a un caractère assez différent entre sa frange nord-ouest où il y a du relief, des pins et des rochers, et sa grosse moitié sud-est que je n'ai pas trouvée agréable du tout (soit c'est des alignements réguliers d'arbres pas très intéressants, soit c'est un taillis impénétrable, et en tout cas les sentiers sont mal marqués), peut-être même un peu oppressante. Je ne peux pas parler du marais de Larchant (ici), parce que je ne l'ai pas visité, mais je parlerai plus bas d'autres marais analogues.

Si on se promène à moto dans le coin, les routes dans la forêt sont généralement agréables, mais la plus intéressante, à la fois pour le paysage et les virages, est sans doute la D64 entre Arbonne-la-Forêt et Achères-la-Forêt (par ici, cf. ici sur Google Street View). Celle entre Courances et Arbonne-la-Forêt (par ici) est aussi très jolie, mais attention aux nids de poule parfois énormes. Je suppose que ces remarques s'appliquent aussi à vélo.

Mais Fontainebleau n'est pas seulement pittoresque pour sa forêt : il y a aussi un certain nombre de villages en bordure de forêt qui ont leur charme particulier : le plus connu est certainement Barbizon (ici), qui est un peu un piège à touristes (comme Giverny, de l'autre côté de Paris), et noir de monde un week-end de beau temps, mais qui reste quand même intéressant à voir pour ses maisons remarquables. Dans un autre genre, il y a Moret-sur-Loing (au confluent du Loing et de la Seine, ici) qui a gardé un reste de centre-ville médiéval (voyez ici sur Google Street View). Dans un genre encore différent, il y a Samois, entre la forêt et la Seine (ici) où ce qui est le plus intéressant est sans doute la partie qui longe la Seine avec ses demeures de la belle époque. Je peux aussi mentionner Montigny-sur-Loing (ici, cf. par exemple ici sur Google Street View) comme village de caractère, et peut-être Bourron-Marlotte à côté. Et si on passe par Larchant, on pourra jeter un œil à la basilique Saint-Mathurin (ici), qui est bizarrement à moitié, mais seulement à moitié, en ruine (quelques photos ici sur Twitter). Enfin, à Milly-la-Forêt il y a une jolie halle en bois (ici) qui date du XVe siècle, et un conservatoire national des plantes (que je n'ai pas encore eu l'occasion de visiter) ; mais peut-être que j'ai tort de ranger Milly-la-Forêt dans les environs de Fontainebleau, parce qu'elle est en Essonne.

Je n'ai pas eu l'occasion de bien visiter la partie de l'Île-de-France située au sud de Moret-sur-Loing (en gros la rive droite du Loing et gauche de la Seine/Yonne), mais au moins en la traversant à moto (de Sens à Moret-sur-Loing par Chéroy) j'ai trouvé ça très joli. J'ai un peu plus vu, en revanche, la vallée et les coteaux du Loing : il y a des villages très mignons comme Château-Landon (d'où on a une vue magnifique sur les alentours, notamment ici), mais surtout un très intéressant système de canaux, d'étangs et de marais (ainsi que de réserves ornithologiques). Le marais d'Épisy (ici), par exemple, mérite vraiment un tour (quelques photos ici sur Twitter). Globalement, la D40 est vraiment très pittoresque (j'avais par exemple trouvé très mignonne l'église Saint-Martin de la Genevraye, visible ici sur Google Street View et qui a un peu l'air de surgir comme une île au milieu des champs).

L'Essonne et ses vallées

Image : Paysage typique de l'Essonne (photo prise ici le 2023-06-10)

Je me déplace maintenant vers l'ouest pour parler de l'Essonne (le département, mais aussi la rivière éponyme). La partie de la région parisienne dont je veux parler maintenant a des limites un peu floues qui ne sont ni vraiment celles du département de l'Essonne (limites ici sur OpenStreetMap) ni celles de la région historique du Gâtinais (limites approximatives ici sur OpenStreetMap) ni non plus celles du parc naturel régional du Gâtinais français (limites ici sur OpenStreetMap) mais un peu un mélange de tout ça. Disons grosso modo que je parle du bassin des rivières de l'École (ici), l'Essonne (ici), la Juine (ici) et peut-être aussi l'Orge (ici) au moins jusqu'à Arpajon, et la Rémarde (ici) comme terminus ad quem, qui sont divers affluents ou sous-affluents de la Seine.

Si je mentionne ces rivières (et il y en a d'autres, plus petites), c'est que ce sont elles qui sont responsables du caractère spécifique des paysages essonniens : alors que la Beauce et la Brie sont très plates, le Gâtinais (que je prolonge un peu abusivement vers l'ouest), lui, est vallonné par les cours d'eau que je viens de mentionner. Cela donne un terrain assez différent de ce qu'on trouve ailleurs en Île-de-France : pas de grande forêt comme Fontainebleau, mais plutôt plein de petits bois souvent situés sur les coteaux des rivières qui séparent des étendues agricoles. Leur végétation se compose plus d'arbustes variés que les fagacées des grandes forêts. En certain endroits les rivières s'étalent en formant des marais un peu à la manière de ceux du Loing dont j'ai parlé plus haut. La géologie n'est pas en reste et plusieurs endroits de la vallée de la Juine (parfois d'anciennes carrières) sont regroupées en réserve naturelle nationale des sites géologiques de l'Essonne. Quant à l'habitat, il prend notamment la forme de villages souvent pittoresques dans les petites rivières (mais bien sûr aussi beaucoup de maisons franciliennes interchangeables dans des quartiers résidentiels interchangeables — je ne prétends pas que tout est forcément pittoresque).

Bref, les paysages de l'Essonne ont un caractère singulier, auquel je trouve beaucoup de charme. Pour autant, c'est difficile de recommander un endroit précis : ce qui est intéressant, c'est justement le contraste entre les plateaux agricoles et les vallées boisées, parfois à la manière d'un bocage. Alors je peux par exemple recommander de prendre à moto la D837 entre Milly-la-Forêt et Étampes pour avoir un aperçu des paysages relativement typiques de l'Essonne (tels que celui-ci sur Google Street View), ou peut-être la D105 jusqu'à Boutigny-sur-Essonne (ici sur Google Street View), ou peut-être encore la D191 vers Boissy-le-Cutté (ici sur Google Street View), mais il n'y a pas un endroit particulier dont je puisse dire qu'il soit spécialement remarquable, c'est juste une impression d'ensemble. (J'avoue aussi que je mélange un certain nombre d'endroits où je suis passé : j'ai des souvenirs de coins particulièrement jolis vus à moto ou en voiture, mais je ne sais pas forcément les replacer sur la carte à partir d'images un peu confuses dans ma mémoire.)

L'Essonne n'a pas vraiment de grande forêt comme celles de Fontainebleau et de Rambouillet : il y a bien des bois ouverts au public (je vais en signaler deux-trois ci-dessous), mais ce n'est pas toujours évident à savoir. Je renvoie de nouveau à cette carte des espaces verts d'Île-de-France que j'ai déjà liée dans les généralités, mais il me semble qu'elle n'est pas bien complète : par exemple, je me suis déjà baladé dans la forêt à côté de Ballancourt-sur-Essonne (par ici) et je suis sûr qu'elle était ouverte au public (il y a même des panneaux explicatifs sur les roches du Père la Musique), mais elle n'est pas marquée sur cette carte. Malheureusement, il ne semble pas y avoir de vrai bon moyen sûr de savoir si une forêt est accessible au public à part d'aller voir (et d'être préparé à l'idée de tomber à n'importe quel endroit sur une clôture infranchissable).

Signalons maintenant quand même aussi quelques endroits d'intérêt particulier.

[Lire la suite…]

↑Entry #2786 [older|※ permalink|newer] / ↑Entrée #2786 [précédente|※ permalien|suivante] ↑

↓Entry #2785 [older|※ permalink|newer] / ↓Entrée #2785 [précédente|※ permalien|suivante] ↓

2024-02-16 (vendredi)

Guide du tourisme en Île-de-France : partie 1 (généralités et petite couronne)

Introduction

Comme je l'ai déjà raconté dans un certain nombre de billets de ce blog (par exemple celui-ci et celui-là), le poussinet et moi aimons faire du tourisme en Île-de-France. (Par Île-de-France je n'entends pas forcément l'Île-de-France au sens administratif strict mais, disons, les endroits où on peut facilement se rendre sur la journée, en gros parce que je n'aime pas dormir ailleurs que chez moi. Donc ça va peut-être en gros jusqu'à Compiègne, Château-Thierry, les Andelys, Chartres, mais pas jusque Tours.) Même si j'aimais déjà me balader avant (et j'ai beaucoup marché dans Paris dans les années 2000–2010), c'est surtout après que j'ai passé le permis (et que le poussinet a acheté une voiture) que j'ai eu la possibilité d'explorer différents coins de la région.

Nous avons fait, et continuons de faire, différentes sortes de visites : découverte de parcs et jardins remarquables, recherche de points de vue, marches urbaines, randonnées en forêt ; et je fais aussi de mon côté des virées à moto, même si j'en fais beaucoup moins qu'à l'été 2020.

Les deux cartes ci-contre (cliquer pour les ouvrir en grand format) montrent, à la même échelle : pour celle d'en haut, les géolocalisations de toutes les photos que j'ai prises depuis mi-2016, et, pour celle du bas, les traces GPS des balades à pied que j'ai enregistrées depuis fin 2019 (que j'ai étiquetées — parfois un peu arbitrairement ou abusivement — comme des balades en forêt), et donnent une idée des endroits que nous avons tendance à visiter, parfois de façon régulière.

Il y a une attirance évidente vers le sud-ouest de Paris parce que nous habitons au sud de Paris avec un accès facile à l'autoroute A6, et aussi parce que je travaille à Palaiseau et que ma mère habite Orsay (où j'ai, du coup, grandi au sein de la vallée de Chevreuse), mais aussi simplement parce que c'est l'endroit où on a le plus facilement un accès à des endroits jolis sans aller trop loin (et ce n'est pas un hasard que ce soit corrélé aux coins les plus riches de la région — et en fait du pays). Mais ça ne nous a pas empêchés de quand même visiter régulièrement pas mal d'autres bouts de l'Île-de-France et au-delà.

On m'a souvent suggéré d'écrire une sorte de guide touristique. Le problème (outre que ça prend du temps, mais à la limite, je tape vite) c'est que je ne sais pas comment organiser ça : par direction/département ? par style de chose à visiter (jolis villages, forêts…) ? et d'ailleurs, dans les deux cas, il y a des gros biais presonnels : c'est compliqué de faire un guide pour tout le monde, ce qui va plaire à quelqu'un qui se déplace en transports en commun et quelqu'un qui cherche à faire une balade à moto sont très différents.

Néanmoins, voici une tentative, pas très cohérente et plutôt bordélique, pour dumper certaines des choses que je peux conseiller à voir ou faire en Île-de-France. Entendons-nous biens : non seulement c'est un choix personnel et pas du tout représentatif d'autre chose que mes propres goûts (et possibilités de déplacement), mais en plus je ne parle ici que des activités « en extérieur », donc je ne vais pas parler des musées, châteaux (sauf pour ce qui est de leurs jardins éventuels), etc. Et même comme ça j'aurai forcément oublié plein de choses (que je vais peut-être ajouter ultérieurement en éditant ce billet).

En fait, j'avais commencé ce billet avec l'idée d'écrire des généralités puis de traiter les départements de l'Île-de-France successivement (en réunissant la petite couronne en un seul, donc : 75+92+93+94, puis 91, 78, 95 et 77). Sauf que les sections sur les généralités et la petite couronne m'ont semblé suffisamment longues pour que je préfère publier tout ça comme « première partie » et remettre la suite à plus tard. (Contrairement à mes billets interminables sur des sujets techniques où c'est quand même bien d'essayer de tout garder ensemble pour la cohérence d'ensemble quand je relis, ici je pense que je peux couper en morceaux sans dommage. Donc pour l'instant il n'y a que des généralités et une liste de choses à voir en petite couronne.) ❧ Mise à jour : la deuxième partie est publiée.

Table des matières

Première partie (généralités et petite couronne) :

Deuxième partie (le sud et sud-ouest) :

Sources d'information

✱ Cartes : La première chose avant de se balader où que ce soit, c'est de savoir où trouver des cartes.

Évidemment je vais citer OpenStreetMap en premier, donc voici le lien général (centré, d'ailleurs, sur le barycentre de l'Île-de-France que j'ai calculé avec PostGIS), mais je vais en faire plein d'autres dans la suite pour montrer les emplacements des endroits d'où je parle (il faudra éventuellement dézoomer pour voir le marqueur ou zoomer pour le situer plus précisément). Quand on se balade, il est bien d'avoir une carte utilisable même si le téléphone ne capte pas le réseau : pour ça je recommande l'application OsmAnd pour Android, et plus précisément la variante OsmAnd~ qu'on trouve sur F-Droid (c'est un logiciel libre) : on peut télécharger une carte de chaque région française, et même si l'application est un peu compliquée à prendre en main initialement, ça vaut vraiment la peine.

S'agissant de la France, et de l'Île-de-France en particulier, on peut aussi trouver des cartes sur Géoportail : voici le lien pour l'Île-de-France, l'avantage de Géoportail par rapport à OpenStreetMap étant qu'ils ont des cartes variées, notamment la carte topographique « Top25 » (c'est vraiment une image de la version papier au 1 : 25 000, donc il faut zoomer mon lien pour y voir quoi que ce soit) qui, bien qu'elle ne soit pas toujours aussi à jour que les autres, est souvent très utile. Pour Géoportail aussi il y a une application Android : elle n'est pas terrible (je ne sais pas pourquoi elle a moins de cartes et de possibilités que le site Web, ce qui est quand même con, et elle ne fonctionne pas hors ligne), mais elle est quand même utile à avoir en complément de OsmAnd.

✱ L'Institut Paris-Région : Anciennement nommé Institut d'aménagement et d'urbanisme de la région Île-de-France, l'Institut Paris-Région est une association à but non lucratif, dont sont membres et financeurs différentes collectivités territoriales, pouvoirs publics et organismes essentiellement publics de la région (la Région elle-même, l'État, les départements et intercommunalités, mais aussi l'IGN, la RATP, l'INSEE, etc.), et qui agit comme agence régionale d'urbanisme pour l'Île-de-France. Ce qui m'intéresse ici est qu'ils publient un certain nombre de cartes thématiques ou autres sources d'informations sur les territoires de la région. Ce n'est pas forcément évident de retrouver des choses dans leurs publications, mais voici par exemple une carte des bois et forêts (et une des espaces verts ouverts au public), une carte des villes et campagnes, une carte des randonnées pédestres et une carte de l'occupation des sols (avec une version interactivement zoomable), sans oublier cette carte des « unités paysagères » (intéressante pour savoir où on verra quel type de paysages). C'est également une carte de l'Institut Paris-Région qui m'avait inspiré ce parcours à la recherche des belvédères. Ils ont aussi par exemple publié un livre Pays & paysages d'Île-de-France (qui a l'air extrêmement difficile à trouver au format papier, mais qui est téléchargeable en PDF au lien que je viens de donner).

✱ Le label « jardin remarquable » : Décerné par le Ministère de la Culture depuis 2004, le label « jardin remarquable » est un moyen de trouver des jardins dignes d'un intérêt particulier. J'ai visité presque tous ceux de l'Île-de-France et un certain nombre au-delà (j'utilise cette section de ce vieux billet pour tenir la liste de ceux que j'ai vus et à quelle date, parfois avec un lien vers un billet de blog ou un fil Twitter ; mais comme il y a eu des ajouts au label, il n'est pas certain que ma liste soit à jour). Si on préfère avoir cette liste sous forme papier, le Centre des Monuments Nationaux édite un Guide des jardins remarquables en Île-de-France (il y en a un par région) — bon, la valeur ajoutée de l'ouvrage n'est pas considérable par rapport à ce qu'on trouvera par quelques recherches en ligne, mais comme mes beaux-parents l'avaient acheté, je leur ai piqué.

✱ L'Office National des Forêts : L'ONF (et spécifiquement pour l'Île-de-France ses agences interdépartementales de Fontainebleau et de Versailles) gère les forêts domaniales (c'est-à-dire : appartenant à l'État). Elle avait une page Web appelée En forêt, un peu vieillot mais néanmoins intéressant (qui eut été à l'adresse http://www1.onf.fr/enforet/@@index.html — maintenant cassée, et pas complètement archivée par l'Internet Archive vers lequel je fais néanmoins pointer mon lien) avec des petites pages descriptives pour chaque forêt domaniale qui donnait quelques photos et, par exemple, la répartition des essences d'arbres dans le massif. Leur site Web semble avoir été refondu et ce truc a disparu (insérer ici mon rant habituel contre les gens qui cassent les liens).

Je peux aussi mentionner Île-de-France Nature, qui est en quelque sorte l'équivalent pour la Région Île-de-France (i.e., pour les forêts régionales) de ce qu'est l'ONF pour l'État.

Remarques générales sur les balades en forêt

Si je prends l'approche de lister les choses à voir géographiquement, il est difficile de savoir quoi faire des forêts. Il y a rarement un endroit précis dont je puisse dire cet endroit-là mérite qu'on y aille (même s'il y a des promenades qui m'ont beaucoup plu, cf. par exemple ici, c'est plus un sentiment qui se dégage de l'ensemble de l'itinéraire, voire de mon humeur du jour ; d'ailleurs, l'impression de charme que produit un endroit en forêt dépend fortement de la saison, et nous cherchons plutôt à éviter de repasser par les endroits où nous sommes déjà allés), tandis que les remarques générales sur tout un massif sont forcément un peu vagues.

Je veux dire, certes, toutes les forêts d'Île-de-France ne se ressemblent pas, mais les différences ne sont pas entre « la forêt de Rambouillet » et « la forêt de Fontainebleau » dans leur masse mais plutôt entre tel type d'endroits et tel autre type d'endroits (forêt de feuillus vs. forêt de conifères, plateaux vs. vallées, lande de bruyère, rochers, grandes routes forestières toutes droites vs. petits chemins tortueux, ce genre de choses). Je ne connais malheureusement pas de carte détaillée des forêts qui montrerait le type de paysage (par exemple les essences d'arbre, et leur âge) qu'on trouve endroit par endroit : on peut parfois deviner par les photos aériennes disponibles sur Google Maps ou Géoportail, mais c'est très imparfait. J'aimerais que l'ONF rende publiques ses informations sur la composition des parcelles (j'imagine qu'ils ont ça en interne).

À défaut de pouvoir faire des remarques par endroit, je peux faire quelques remarques générales sur la typologie.

✱ Les types administratifs de forêts : Quand une forêt est marquée sur la carte (disons OpenStreetMap), même s'il y a des sentiers tracés dedans, ça ne signifie pas pour autant qu'on puisse y accéder, ou que ce soit une bonne idée de le faire. Déjà, on peut distinguer diverses sortes de forêt en fonction du propriétaire. Essentiellement, il y a des forêts domaniales (appartenant à l'État), régionales (appartenant à la Région), départementales et communales (vous aurez deviné) et privées. Cette typologie n'est pas parfaite, par exemple, de ce que je comprends, la forêt de Chantilly (dans l'Oise) appartient à l'Institut de France sous le régime du droit privé (c'est un legs du duc d'Aumale), mais elle est quand même gérée par l'ONF comme une forêt domaniale. Ça reste un bon point de départ.

En règle générale, les forêts domaniales, régionales, départementales et communales sont ouvertes au public, même si certaines parties comme les réserves biologiques, peuvent en être fermées (parfois c'est juste par des pancartes qui vous demandent de ne pas y aller, parfois il y a des grillages). La principale raison de s'intéresser à la distinction entre forêts domaniales, régionales, départementales et communales, est juste que la source d'information les concernant va être différente. La liste des forêts domaniales est raisonnablement facile à trouver ; celle des forêts régionales doit se trouver quelque part aussi ; mais quand on commence à entrer dans les forêts départementales ou communales, ça devient vraiment difficile de connaître le statut, les limites, et de savoir si on va avoir le droit d'aller se balader ici ou là. C'est un peu malheureux que la France ne soit pas capable de coordonner ses collectivités territoriales pour créer une base de donnée claire et lisible des status des forêts publiques. Faute de quoi je ne trouve pas mieux que la carte des espaces verts ouverts au public créée par l'Institut Paris-Région que j'ai déjà liée plus haut.

Les forêts privées peuvent être de toutes sortes ; le plus souvent ce sont des réserves de chasse (je ne crois pas avoir rencontré de forêt d'exploitation du bois privée en Île-de-France, mais il y en a probablement aussi, d'ailleurs c'est sans doute combiné avec une réserve de chasse). Une forêt privée ne signifie pas qu'on n'ait pas le droit d'y accéder : beaucoup de chemins bénéficient, je pense, d'une forme de droit de passage ou de servitude, en tout cas, dans la pratique, on peut souvent y passer. Mais on ne pourra faire que passer : généralement ce sera en suivant un chemin mal entretenu, parfois évanescent, entre deux parties grillagées ou gardées tous les quelques mètres par un panneau annonçant propriété privée : défense d'entrée ; et le risque de tomber sur un cul-de-sac (car souvent ces passages servent simplement à permettre l'accès à une autre propriété, tout aussi grillagée) est élevé, donc je ne recommande pas.

La chasse : Comme je mentionne les réserves de chasse, il faudrait sans doute que je dise un mot sur les chasseurs. Mais en fait je n'ai rien à en dire. Je n'aime pas la chasse et les chasseurs, mais je ne peux pas honnêtement dire qu'ils nous gênent des masses lors de nos balades en forêt. Je suppose que c'est parce que nous nous tenons essentiellement aux forêts publiques (domaniales, régionales, etc.) et que la chasse dans ces forêts est strictement encadrée, et n'a normalement pas lieu le week-end. Toujours est-il que nous n'avons entendu que des bruits au loin.

Les golfs : En se baladant en forêt en Île-de-France, on acquiert rapidement l'impression qu'il y a des golfs partout, et c'est extrêmement agaçant, parce qu'ils sont fermés, ils coupent complètement le terrain en vous obligeant à les contourner, et parfois morcellent véritablement la forêt (par exemple celle de Marly qui, entre les golfs de Noisy-le-Roi Fourqueux et Joyenval, l'autoroute A13 et le tram T13 est un peu réduite à des confettis mal reliés).

Le morcellement de certaines forêts est un vrai problème, et il n'y a pas que les golfs qui en sont responsables : souvent elles sont coupées en deux par des routes qui peuvent être difficiles à traverser (voire quasi impossible comme dans le cas d'une autoroute ou de la N118). Pour le coup c'est très clair sur la carte, mais il faut penser à vérifier à l'avance, parce qu'on peut avoir la fausse impression qu'une forêt est très grande quand, en fait, elle est la réunion de petits bouts presque déconnectés les uns des autres.

[Lire la suite…]

↑Entry #2785 [older|※ permalink|newer] / ↑Entrée #2785 [précédente|※ permalien|suivante] ↑

↓Entry #2784 [older|※ permalink|newer] / ↓Entrée #2784 [précédente|※ permalien|suivante] ↓

2024-02-11 (dimanche)

La réalisabilité propositionnelle, et ce qu'elle nous apprend sur les algorithmes

Je veux ici de nouveau parler d'informatique théorique, dans son intersection avec les maths (logique, calculabilité, typage), et plus précisément d'un sujet appelé la réalisabilité propositionnelle. Je reconnais qu'il a un petit côté « opération de pub » de ma part : il s'agit d'un sujet qu'on peut qualifier d'obscur, voire ésotérique (largement confiné à une poignée de publications soviétiques des années 1960–1990, dont certaines n'ont même pas été traduites du russe en quoi que ce soit d'autre[#], ce qui le dessert cruellement), et pourtant il me semble que d'une part il a des choses à nous apprendre sur l'informatique, sur ce que peut ou ne peut pas faire un algorithme, et sur le rapport entre ça et le typage, et d'autre part il n'est techniquement pas très compliqué à exposer (j'en ai dit un mot — bien moins que ce qui va suivre, certes — dans mon cours à Télécom qui s'est récemment fini, et je ne crois pas avoir largué tout le monde). Donc je trouve qu'il mérite plus d'attention.

[#] Bon, le fait que ce soit en russe ne devrait pas être un obstacle sérieux, surtout maintenant qu'on a des OCR et des traducteurs automatiques, il n'y a vraiment plus de raison. Le problème, c'est que souvent, et en plus d'être en russe, l'article a le défaut d'être super mal écrit : extrêmement concis et pas toujours super rigoureux comme les mathématiciens soviétiques avaient tendance à l'être, références vagues, et fautes de frappe à foison. (Voyez par exemple cette question que j'ai posée sur MathOverflow en essayant de comprendre l'argument de Ânkov sur la non-réalisabilité de l'axiome de Scott que j'expose plus bas ici de façon, j'espère, nettement plus clair que le texte original : mon russe est enfoui au fond des oubliettes, mais ce n'est vraiment ce qui était le plus problématique en l'occurrence par rapport aux fautes de frappe et au style de rédaction vraiment minimaliste.)

Je ne sais pas si l'entrée de blog qui va suivre peut aider à convaincre qui que ce soit de s'y réintéresser, mais en tout cas, si on lit ce qui suit on pourra se dire qu'on sait une proportion significative de tout le savoir de l'Humanité sur la réalisabilité propositionnelle (i.e., pas grand-chose !), et il n'y a pas beaucoup de sujets techniques pour lesquels on puisse en dire autant.

Ajout (2024-02-14) : Pour les gens qui veulent savoir de quoi ce billet cause mais qui n'ont pas la patience de lire ce pavé (ni même l'introduction), j'ai écrit un résumé en seulement 13 tweets, ici sur Twitter et ici sur BlueSky [on peut lire le fil BlueSky sans avoir de compte dessus].

Table des matières

Résumé et publicité préalable

Avant de rentrer dans le cœur du sujet, j'essaie d'expliquer informellement[#2] (et de manière — j'espère — assez peu technique) de quoi il s'agit, et pourquoi je pense que c'est assez intéressant pour prendre le temps de déchiffrer des articles à moitié oubliés dans des journaux soviétiques et de pondre un pavé de 1729 pages dans ce blog pour réexpliquer le tout aux enfants. (Si on veut passer directement à la définition, c'est possible, mais je pense que c'est intéressant de donner d'abord une idée grossière de ce dont je vais parler, au risque de prendre un peu un ton introduction de manuscrit de thèse. Je remercie d'ailleurs mes peluches pour leur soutien et leur patience tout au long de l'écriture de cette entrée.)

[#2] Autrement dit, comme le corps de cette entrée est très long, je commence par une introduction très longue pour essayer de motiver cette longueur. Je n'ai fait celle-ci plus longue que parce que je n'ai pas eu le loisir de la faire plus courte. (Blaise Pascal)

Introduction : de quoi s'agit-il ? Cadre et motivations

La calculabilité s'intéresse à décrire de façon générale ce que peut ou ne peut pas faire un algorithme informatique. La réalisabilité propositionnelle s'intéresse (du moins selon le point de vue que j'adopte ici) spécifiquement à certaines sortes de manipulations que je pourrais être qualifier de manipulations de données génériques (ou abusivement, fonctions polymorphes). On va décrire ces manipulations génériques par des formules logiques, du style A∧B ⇒ B∧A (logiquement, celle-ci se lit : si A et B alors B et A). La formule représente une sorte de « contrat » qui stipule la manipulation censément effectuée : par exemple, la formule A∧B ⇒ B∧A représente le contrat je prends une donnée de type A et une donnée de type B et je renvoie une donnée de type B et une donnée de type A (et on peut faire ça algorithmiquement, de façon à peu près évidente, en échangeant les deux données qu'on a reçues). Lorsqu'il y a un algorithme qui remplit le contrat, on dira qu'il réalise la formule, ou que celle-ci est réalisable.

Je donnerai une définition précise plus bas de comment lire la formule comme un contrat et ce que ça signifie de la réaliser, mais je peux tout de suite donner un aperçu informel : on s'intéresse à des formules écrites avec les connecteurs binaires ‘∧’, ‘∨’ et ‘⇒’, ainsi que les constantes ‘⊤’ et ‘⊥’ (et ‘¬’ qui est juste une abréviation de X⇒⊥). Les variables (A,B dans l'exemple que je viens de donner) représentent des types de données quelconques et non spécifiés, et les connecteurs logiques représentent des façons de mettre ces données ensemble : grosso modo,

A∧B (le « et » logique) représente la donnée d'une donnée de type A et d'une de type B,
A∨B (le « ou » logique) représente la donnée d'une donnée de type A ou d'une de type B (mais avec l'information de laquelle on a),
A⇒B (l'implication) représente une fonction (au sens informatique) qui prend une donnée de type A et en renvoie une de type B,
⊤ (le « vrai ») représente une donnée triviale, et ⊥ (le « faux ») représente une donnée impossible (inexistante ou inobtenable),
¬A (la négation) représente une promesse qu'il n'y a pas de A.

Ainsi, par exemple, pour faire une manipulation représentée par la formule (« contrat ») A∧B ⇒ B∧A, on prend une donnée de type A et une donnée de type B et on les renvoie dans l'ordre contraire, c'est-à-dire la donnée de type B et la donnée de type A, et on pourra dire que la formule A∧B ⇒ B∧A est réalisable (et que ce programme la réalise, i.e., il « remplit le contrat »).

J'ai utilisé le terme type ci-dessus, mais il n'est peut-être pas vraiment approprié, parce que justement, la réalisabilité ce n'est pas pareil que le typage, même si ça y ressemble beaucoup (et c'est la différence qui est très intéressante). Je m'explique un peu plus.

Il y a un formalisme appelé correspondance de Curry-Howard (j'en ai parlé dans un billet précédent, dont il est peut être intéressant de lire au moins l'introduction même si ce n'est pas strictement nécessaire pour la suite) qui transforme une démonstration d'une formule dans un certain système logique (le calcul propositionnel intuitionniste) en un programme qui fait la manipulation décrite par cette formule. Et le fait que ce programme fasse bien cette manipulation est attesté par ce qu'on appelle un système de typage, en l'occurrence le λ-calcul simplement typé enrichi de types produits et sommes, 1 et 0 mais peu importe : si on se limite aux programmes conformes à ce système de typage, alors la correspondance est exacte — je veux dire, bijective : on peut vraiment identifier les preuves de tel système logique avec les programmes conformes à tel système de typage. D'ailleurs, la correspondance n'est pas bien compliquée et fait vraiment correspondre de façon assez simple les différentes règles de la logique avec les différentes constructions admises par le système de typage.

Le système de typage (disons ce fameux λ-calcul simplement typé enrichi de types produits et sommes, 1 et 0), il contraint les programmes a priori : il les contraint dans toutes les étapes de leur construction, il exige que toutes les opérations qu'ils font soient conformes au typage. Et au bout du compte, les formules obtenues décrivant les manipulations qu'on peut faire, ce sont justement leurs types (à la notation près), et ce sont exactement les formules démontrables dans le système logique (c'est ça que dit la correspondance de Curry-Howard).

Mais ce n'est pas de ça que je veux parler. Ça c'est ce dont j'ai déjà parlé (dans la première partie du billet sur Curry-Howard).

La réalisabilité[#3], elle ne contraint pas les programmes a priori comme le fait le typage. Elle correspond à la philosophie suivante : le programme a le droit de faire ce qu'il veut comme manips (il faut juste que ce soit un algorithme au sens usuel de la calculabilité, celle de Church-Turing, l'idéalisation standard de ce que c'est qu'un ordinateur) et réaliser une formule ça signifie qu'il remplit un certain contrat. Peut-être qu'entre temps, au sein de leurs manips, les programmes violent toutes les règles du typage, mais au final, on demande juste qu'ils remplissent le contrat représenté par la formule : c'est le résultat qui compte, et seul le résultat qui compte. (Peut-être aussi qu'il est impossible de prouver que le programme remplit bien son contrat, mais ce qui importe c'est que mathématiquement il le fait : là aussi, c'est juste le résultat qui compte.)

[#3] Enfin, la réalisabilité propositionnelle que j'évoque ici, et qu'on peut qualifier de réalisabilité propositionnelle non typée pour insister, parce qu'il y a 1001 variantes de la notion (ce qui a causé un certain dialogue de sourds entre Andrej Bauer et moi dans cette question MathOverflow — sa réponse est très intéressante mais elle ne répond pas vraiment à la question que je voulais poser, quoiqu'elle réponde peut-être à la question que j'ai posée).

Par exemple, A∧B ⇒ B∧A c'est le contrat tu vas recevoir deux données, la première de type A et la seconde de type B (et, précision importante, tu n'auras ni accès ni information sur ce que sont A et B), tu dois terminer en temps fini et renvoyer une donnée de type B et une donnée de type A, et effectivement on peut se convaincre que la seule façon de faire ça c'est d'échanger l'ordre des coordonnées.

Quand la formule est démontrable (en calcul propositionnel intuitionniste) ou, ce qui revient au même par Curry-Howard, quand on peut faire un programme typé correspondant à la formule, alors certainement ce programme remplit le contrat représenté par la formule, donc elle est réalisable.

Mais la grande surprise (en tout cas pour moi quand j'ai appris ça, mais aussi, de ce que je comprends, pour Kleene qui contrairement à moi n'était pas un idiot), c'est que la réciproque n'est pas vraie : il y a des contrats qu'on peut remplir — des formules qu'on peut réaliser — sans que la formule soit prouvable, ou, ce qui revient au même, sans qu'on puisse le faire dans le système de typage naturel dans cette situation (le λ-calcul simplement typé enrichi gnagnagna). Un des buts de ce billet est de donner des exemples de telles formules (jetez un coup d'œil plus bas si vous voulez voir à quoi ça ressemble).

Ces formules réalisables mais non démontrables illustrent donc, si on veut, des choses que peut faire un algorithme, remplissant un contrat de manipulation qui ressemble à du typage, mais qui ne sont pas faisables dans le cadre du typage — en tout cas du typage le plus naturel dans cette situation — ou, si on veut, ces choses sont faisables, mais la vérification que le contrat est bien rempli est plus compliquée qu'une vérification locale telle que fournie par le typage.

Bien sûr, il n'y avait aucun doute que les algorithmes généraux sont plus généraux que les algorithmes typés : notamment, les systèmes de typage que j'évoque dans cette introduction ne permettent pas de faire de boucle infinie, donc il est évident qu'ils limitent structuralement les algorithmes. Mais ce qui est surprenant dans l'histoire, c'est que l'algorithme va quand même remplir un contrat qui se lit exactement comme un type, i.e., ils font des manipulations de données génériques potentiellement utiles, pas quelque chose comme une boucle infinie ni même une fonction sur un type spécifique comme les entiers.

Je précise pour dissiper un possible malentendu que ce que je dis là n'est pas destiné à être une attaque contre le typage ou son utilité, juste un signe que les choses sont plus délicates que ce qu'on pourrait imaginer naïvement : certes Curry-Howard nous dit que les formules logiques qui correspondent à des programmes typés sont exactement les formules démontrables, mais il y a des contrats qu'on peut remplir de façon plus subtile que le typage.

Et du coup, il me semble que c'est un problème très naturel pour l'informatique et la calculabilité que d'étudier cette réalisabilité propositionnelle, parce que ça a directement trait à ce qu'un algorithme peut ou ne peut pas faire. (Notons que c'est là l'approche que je donne à la question dans ce billet, tout le monde ne sera pas forcément d'accord que c'est la bonne motivation.)

Organisation de ce billet

Dans la suite, je commence par définir de façon précise ce que c'est que la réalisabilité propositionnelle, et je donne des exemples très simples d'une formule réalisable (A∧B ⇒ B∧A) et d'une formule qui ne l'est pas (A ∨ ¬A) pour montrer comment on manie la notion. Ensuite je dois faire un certain nombre de remarques générales (plusieurs desquelles sont en petits caractères pour montrer qu'on peut les ignorer et passer à la suite).

Puis je me tourne vers des exemples de formules réalisables mais non démontrables, parce que c'est quand même ça la grosse surprise, que de telles formules existent : pour chacune, j'ai essayé de donner non seulement un algorithme qui la réalise (et comment il fonctionne) mais aussi des explications informelles à son sujet. En revanche, je ne détaille pas l'argument expliquant que la formule n'est pas démontrable (en calcul propositionnel intuitionniste) : il n'y a que la première pour laquelle j'ai fait cet effort, et encore succinctement et en petits caractères, parce que ce n'est pas vraiment mon sujet.

Je commence par la formule qui me semble la plus simple à comprendre intuitivement, celle de Ceitin, puis j'en passe en revue un certain nombre d'autres. On peut traiter ça comme autant d'énigmes : une fois qu'on a compris le principe, c'est un petit jeu de regarder chaque formule comme un contrat à remplir et de se demander comment je vais faire une telle chose avec un algorithme ? (en tout cas, c'est comme ça que j'ai approché le problème : je n'ai pas lu les preuves de réalisabilité qu'on trouve dans la littérature, c'était bien plus instructif de les retrouver moi-même).

Ensuite, je passe à des exemples de formules non réalisables mais intéressantes et notamment « presque » réalisables, à travers deux exemples importants : la formule de Kreisel-Putnam et celle de Scott. Donc cette fois il faut à la fois montrer qu'elles ne sont pas réalisables et que, pourtant, on ne passe pas loin de l'être (et j'explique en quoi elles sont « presque » réalisables, même si je n'ai pas réussi à avoir le recul pour comprendre si on peut définir cette notion proprement).

Enfin je finis par des généralités et spéculations peut-être vaseuses et certainement mal écrites, qui font un peu le pendant de l'introduction ci-dessus.

Pourquoi j'estime que c'est intéressant et important

Bien sûr, comme je l'explique ci-dessus, on peut traiter chacune des formules que je vais lister ci-dessous (aussi bien celles qui sont réalisables que celles qui ne le sont pas) comme un exercice de calculabilité : voici une formule représentant un certain contrat, trouver une façon de le remplir [= réaliser la formule] ou montrer que ce n'est pas possible ; ou même comme une sorte d'énigme (à la manière dont je l'ai fait ici et là). Les outils de base utilisés par ces algorithmes sont toujours un peu les mêmes, et ce sont les techniques fondamentales de la calculabilité : lancer deux tâches en parallèle (sachant qu'au moins une des deux terminera), exécuter un programme pour un certain nombre d'étapes pour voir s'il termine, parcourir tous les entiers naturels en sachant qu'on finira par en trouver un qui remplit une certaine condition — ce genre de choses qui sont les bases de la calculabilité de Church-Turing. Donc déjà c'est au moins intéressant parce que c'est instructif à ce niveau-là.

Mais je pense que ça va plus loin que ça. Comme je le dis plus haut, la réalisabilité propositionnelle est une façon d'aborder le problème, qui me semble central en informatique, de ce qu'un algorithme peut ou ne peut pas faire, et en l'occurrence il est important de comprendre ce que le typage laisse ou ne laisse pas passer, et comme le typage est un outil lui aussi central, comprendre ce qu'il ne laisse pas passer est justement une question cruciale, et même si on peut trouver que la réalisabilité propositionnelle est un prisme un peu étroit pour étudier cette question (j'en conviens), je pense qu'elle a des choses à dire, et je n'ai pas l'impression qu'on les comprenne bien dans l'état actuel de l'art (d'où le fait que les exemples de formules réalisables soient un peu… hétéroclites), mais ça vaut certainement la peine de méditer un peu sur chacune de ces formules certes disparates et de ce qu'elle signifie et ce qu'elle représente. En tout cas, ce n'est certainement pas un hasard si la réalisabilité de ces différentes formules fait appel à ce que je viens d'appeler les techniques fondamentales de la calculabilité.

En outre, ça nous apprend aussi — il me semble — des choses sur la richesse de la logique intuitionniste, même au niveau simplement propositionnel (en nous forçant à nous demander ce que disent logiquement certaines de ces formules qu'on n'aurait sans doute pas pensé à considérer sinon). Ma motivation à moi était justement de me familiariser mieux à la fois avec la calculabilité en général et avec les techniques à l'interface entre logique, calculabilité et typage : en réexpliquant chacune de ces preuves, je m'assure que je les ai bien comprises. (Et il y a plein de choses que j'ai été obligé de revoir en écrivant ce billet.)

[Lire la suite…]

↑Entry #2784 [older|※ permalink|newer] / ↑Entrée #2784 [précédente|※ permalien|suivante] ↑

↓Entry #2783 [older|※ permalink|newer] / ↓Entrée #2783 [précédente|※ permalien|suivante] ↓

2024-02-04 (dimanche)

Pourquoi trois personnes dans les conjugaisons et pas plus ?

Je précise d'emblée que ce billet n'est pas à prendre très au sérieux. C'est juste une idée qui me revient en repensant à ce que j'ai écrit récemment sur les conjugaisons.

En français et dans un certain nombre d'autres langues qui conjuguent les verbes, l'un des traits grammaticaux qui déterminent l'inflexion du verbe est la personne du sujet, et elle distingue trois possibilités, à savoir si la personne qui accomplit est :

la personne (ou plus rarement, chose) qui s'exprime, ou un groupe qui la contient,
la personne (ou plus rarement, chose) à qui on s'adresse, ou un groupe qui la contient, ou enfin
n'importe quelle autre personne ou chose ou groupe de telles.

Ces cas de figures s'appellent respectivement la première personne, la deuxième personne et la troisième personne (la numérotation, bien sûr, est une pure convention et il y a des langues où on fait plutôt l'ordre inverse, mais ça ce n'est pas une caractéristique intrinsèque de la langue, juste un choix des grammairiens qui l'étudient ; par contre le fait qu'il y ait ces trois cas est assez nettement une caractéristique de la langue).

La grande majorité des langues indo-européennes qui font varier le verbe selon le sujet utilisent cette typologie en trois personnes (j'écris la grande majorité parce que je ne veux pas me mouiller trop et si j'écrivais toutes il y aurait certainement quelqu'un qui viendrait m'expliquer que dans le dialecte bordurien du vieux syldave il n'y a que deux personnes au singulier et quatre au pluriel, mais disons que je ne connais pas de contre-exemple[#], même s'il y a des exemples de langues indo-européennes qui ne font pas du tout varier le verbe selon la personne, ou seulement selon le genre et nombre du sujet comme le passé en russe qui est visiblement une sorte de participe accordé avec le sujet).

[#] Bon, on peut ergoter que les formes de politesse cassent un peu ce modèle. Par exemple, le pronom Sie de l'allemand se présente inflexionnellement comme un pronom de la troisième personne du pluriel mais fonctionne sémantiquement comme un pronom de la deuxième personne (singulier ou pluriel) en forme de politesse. De même, la multiplicité des pronoms de la deuxième personne en néerlandais (du, gij, jij et u) ne se laisse pas si facilement analyser. Il me semble que ce ne sont pas des objections très sérieuses même si ça doit nous rappeler que les choses en linguistiques sont toujours un peu floues.

Par ailleurs, ces langues indo-européennes font aussi varier le verbe selon le nombre du sujet en même temps que la personne ; et à ce propos, pour autant que je sache, la « clusivité » au pluriel est très majoritairement définie par les règles suivantes : dès que la personne qui s'exprime fait partie du groupe, c'est la première personne du pluriel (indépendamment du fait que telle ou telle autre personne soit dedans : i.e., nous peut vouloir dire moi et toi (= « nous inclusif ») comme moi et lui (= « nous exclusif »)) ; sinon, dès que la personne à qui on s'adresse fait partie du groupe, c'est la deuxième personne du pluriel ; sinon c'est la troisième personne du pluriel.

J'ai l'impression que ces règles sont extrêmement spécifiques.

Ce que je trouve assez fascinant, c'est qu'il y a des langues non indo-européennes qui semblent les suivre aussi au moins partiellement : disons que sur une description superficielle de leur grammaire (je n'ai pas une connaissance assez correcte de ces langues pour vraiment juger), les conjugaisons de l'arabe, du turc, du hongrois et du finnois, qui représentent au moins deux-trois familles de langues indépendantes et indépendantes des langues indo-européennes, ont l'air de se conformer à peu près à cette distinction tripartite sur la personne (à laquelle on peut ajouter la distinction singulier/pluriel sur le nombre). C'est moins clair de ce que je lis des grammaires du swahili et du basque, pour prendre des exemples au pif de langues encore indépendantes de tout ça, mais j'y vois quand même des références à la première et la deuxième personne.

Évidemment, il y a aussi des langues où ça ne veut pas dire grand-chose : par exemple si les verbes sont complètement invariables et qu'on a plein de pronoms pour plein de situations différentes, on peut toujours décider d'en appeler certains pronoms de la première, deuxième et troisième personne, mais ce sera juste plaquer une typologie artificielle sur une langue qui s'en fout. (Bien sûr aussi, toute langue a forcément une façon de dire je mange, tu manges et il mange, mais cette distinction n'a aucune raison d'être obligatoire, et inversement elle peut être plus précise, peut-être que je mange se dit différemment selon qu'on est un homme jeune, une femme âgée, une personne qui a les cheveux longs, l'Empereur, ou je ne sais quoi encore.)

Pour y voir plus clair, il faudrait une grande base de données ouvertes des langues avec une description unifiée de leurs caractéristiques, sur laquelle on puisse rechercher ce genre de choses. Il y a un livre, depuis devenu un site Web, le World Atlas of Language Structures, qui est censé répondre précisément à ce type d'interrogation (et devrait éviter de consulter des grammaires de qualité douteuse du turc et du basque pour essayer de deviner s'il y a un concept de première / deuxième / troisième personne dans ces langues), mais à chaque fois que j'ai essayé de trouver quelque chose dedans, j'ai été épaté par la pauvreté des caractéristiques répertoriées, et ce cas ne fait pas exception : je ne trouve rien dans leur inventaire qui essaie de répertorier si une langue a des notions[#2] de première, deuxième et troisième personne.

[#2] Bien sûr on peut objecter que cette question n'a pas de sens, parce que ce n'est pas clair ce que ça veut dire qu'une langue ait la notion : mais c'est le cas de quasiment toutes les caractéristiques évoquées dans le WALS (je ne vais quand même pas refaire encore un lien vers mon billet sur les frontières floues, si ?). En tout cas je ne trouve rien qui ressemble même à mon interrogation.

Le fait qu'on retrouve quand même une typologie étonnamment semblable (à mes yeux) dans des familles langues qui sont censées être indépendantes m'amène à me demander quelle en est l'explication : je peux imaginer plusieurs hypothèses, ni exclusives ni exhaustives (et certainement pas forcément la même d'un cas à l'autre) :

c'est un hasard ;
c'est « naturel », ça fait partie du fonctionnement du cerveau humain de penser en trois personnes (moi, toi et lui) ;
c'est le signe d'une parenté entre les langues en question (pas forcément un signe de l'existence d'une langue ancestrale universelle, mais au moins la trace d'une super-famille) ;
c'est le résultat d'une évolution grammaticale convergente par échanges horizontaux entre familles distinctes (Sprachbund) ;
c'est le résultat d'une fausse perspective apportée par la manière dont les grammairiens (majoritairement natifs de langues indo-européennes) analysent les langues en question, en plaquant des concepts venus, disons, de la grammaire latin, sur des langues pour lesquelles ces concepts sont inadaptés.

(J'avais déjà évoqué des possibilités analogues dans mon billet sur les conlangs.)

Je ne sais pas bien quoi croire entre tout ça (et, je répète, rien ne dit que la ou les explications concernant l'arabe soient les mêmes que concernant le turc).

✧

Néanmoins, je voudrais expliquer un peu, en réponse à l'hypothèse que ce serait « naturel » de distinguer la personne qui s'exprime et la personne à qui elle s'adresse de toutes les autres personnes, quel serait l'intérêt possible d'avoir une langue distinguant quatre personnes (au moins une des langues construites que j'avais imaginées quand j'étais ado fonctionnait comme ça).

Quelles seraient ces quatre personnes ? Je pense principalement à la distinction quadruple suivante :

[Lire la suite…]

↑Entry #2783 [older|※ permalink|newer] / ↑Entrée #2783 [précédente|※ permalien|suivante] ↑

↓Entry #2782 [older|※ permalink|newer] / ↓Entrée #2782 [précédente|※ permalien|suivante] ↓

2024-02-02 (vendredi)

Mélanges probabilistes et superpositions quantiques

Précisions d'emblée que le but de ce billet, qui évoque le rapport entre (pour prendre un exemple célèbre) un chat vivant avec probabilité ½ et mort avec probabilité ½ (« mélange probabiliste ») et un chat dans un état quantique qui combine vivant et mort (« superposition quantique ») n'est pas vraiment de faire de la vulgarisation, encore moins de la physique. Je m'en sers, comme je fais parfois, surtout pour gribouiller rapidement ce que j'ai (moi matheux) réussi à comprendre de textes que je trouve souvent obscurs, et pour noter des questions que je (me) pose si je veux y réfléchir plus attentivement Un Jour™, mais ça ne signifie pas que d'autres trouveront mes explications plus claires que ce qu'on peut trouver ailleurs. Il s'agit essentiellement de choses très classiques, mais que je trouve généralement très mal expliquées (notamment par le fait qu'on prend rarement le soin d'essayer de décrire le parallèle entre mélanges probabilistes et superpositions quantiques séparément avant de dire comment ces deux choses se combinent), quoique certaines des questions que je soulève au passage n'ont pas l'air d'être beaucoup discutées, et c'est dommage.

Quoi qu'il en soit, ce qui suit s'adresse à des lecteurs qui savent au moins un peu d'algèbre linéaire (en gros, pour qui les mots espace de Hilbert ont un sens — je ne parlerai que de la dimension finie donc on peut préférer espace hermitien), et sont globalement familiers avec le fait qu'une matrice hermitienne est diagonalisable. Et encore une fois, mon point de vue va être celui d'un matheux, pas d'un physicien (témoin le fait que je vais à peine évoquer de lois de la physique) : la question est celle de la représentation mathématique d'états d'un système physique. (Et j'en profite pour pointer du doigts certains faits géométriques sur cette représentation.) Mais au passage, ça soulève des questions, qui me semblent intéressantes, sur la philosophie de la physique (notamment que signifient les probabilités, et dans quelle mesure elles font partie de la réalité du monde).

Je dois aussi préciser que j'ai changé plein de fois d'avis sur ce que je voulais raconter ici, que j'ai fait mon plan a posteriori et que j'ai réécrit plein de fois des passages sans vérifier la cohérence avec ce qui était déjà ailleurs, ce qui explique sans doute des virages un peu bizarres, des redites ou incohérences de propos et des digressions inutiles (comme d'habitude, j'essaie de rédiger de manière à ce qu'on puisse les sauter, mais je ne sais pas dans quelle mesure j'y arrive). Par ailleurs, comme ça m'arrive souvent, j'ai écrit ce texte jusqu'au point où j'en ai eu marre de l'écrire, ce qui explique qu'après être parti dans toutes les directions il s'arrête un peu brutalement et sans vraie conclusion — mais je pense que mes lecteurs (enfin, ceux qui sont assez patients pour lire mes billets jusqu'au bout) ont l'habitude de ça.

Plan

Mélanges probabilistes et superpositions quantiques séparément

Comme promis, je commence comme un matheux. Supposons que A soit un ensemble, que je vais prendre fini pour simplifier et que j'imagine comme les états basiques que peut prendre un système physique.

Mon but est dans un premier temps de définir deux types de constructions[#] qu'on peut faire sur cet ensemble A, que je vais ensuite comparer et contraster, et que je vais appeler mélanges probabilistes et superpositions quantiques ; puis, dans la suite, je discuterai comment on peut les combiner.

[#] Techniquement, j'imagine qu'on doit pouvoir faire de chacune de ces constructions une monade, mais je ne veux pas tomber dans ce trou de lapin-là.

Mélanges probabilistes

Si je ne sais pas exactement dans quel état se trouve mon système, je peux représenter mon ignorance sous la forme d'une distribution de probabilités sur A : concrètement, ça va prendre la forme d'une fonction de A vers les réels positifs (donnant la probabilité de chaque état) dont la somme totale est 1. De façon équivalente, si je note [a], lorsque a∈A la fonction qui vaut 1 en a et 0 ailleurs (i.e., la distribution de probabilités concentrée en a), une distribution de probabilités p quelconque sur A s'écrit comme une combinaison convexe des [a], c'est-à-dire une combinaison linéaire à coefficients positifs de somme 1 (les coefficients étant justement la probabilité p(a) de chaque a, i.e., on a p = ∑_a∈A p(a) · [a], avec, je répète, p(a)≥0 pour chaque a, et ∑_a∈A p(a) = 1). Je parlerai aussi de mélange probabiliste des éléments de a pour une telle combinaison convexe.

À titre d'exemple, si A = {vivant, mort} désigne les deux états possibles de vie d'un chat, le mélange probabiliste ½([vivant] + [mort]) désigne un chat qui a 50% de chances d'etre vivant et 50% de chances d'être mort.

Géométriquement, il faut penser à cet ensemble de distributions de probabilités / combinaisons convexes / mélanges probabilistes (selon le terme qu'on préfère) comme un simplexe dont les sommets sont les éléments de A (i.e., lorsque A a 2 éléments, c'est un segment les reliant, quand il en a 3 c'est un triangle ayant ces sommets, quand il en a 4 c'est un tétraèdre, etc.) ; et les coordonnées barycentriques dans le simplexe sont les valeurs p(a) de la distribution de probabilités p considérée.

Je n'ai rien dit d'intelligent, ou même d'intéressant dans tout ça : c'est complètement standard, c'est juste différents points de vue un tout petit peu différents sur la même chose.

Superpositions quantiques

Maintenant, quand on fait de la mécanique quantique, il y a autre chose qui intervient, et qu'il faut bien distinguer de ce qui précède : ce sont les superpositions quantiques. Cette fois, je vais considérer un espace vectoriel complexe[#2], et même hilbertien (= hermitien), dont une base orthonormée est formée de vecteurs notés |a⟩ où a∈A, et je m'intéresse aux vecteurs de norme 1 dans cet espace (éventuellement : modulo la phase, c'est-à-dire modulo multiplication par les complexes de module 1, ce qui en fait un « espace projectif » complexe, cf. ici). Autrement dit, les éléments de l'espace sont les ∑_a∈A u(a) · |a⟩ avec u(a) des nombres complexes et ∑_a∈A |u(a)|² = 1 ; le produit scalaire hermitien de deux tels éléments |u⟩ := ∑_a∈A u(a) · |a⟩ et |v⟩ := ∑_a∈A v(a) · |a⟩ est donné par ⟨u|v⟩ := ∑_a∈A u(a)^* · v(a) où z^* désigne ici le conjugué d'un nombre complexe (normalement noté avec une barre au-dessus, mais c'est pénible à faire en HTML) (j'ai pris ici la convention des physiciens selon laquelle le produit scalaire hermitien est antilinéaire dans sa première variable et linéaire dans la seconde). La notation suggère de définir ⟨a| comme la forme linéaire valant 1 en |a⟩ et 0 sur tous les autres |b⟩, si bien que le produit scalaire par ∑_a∈A u(a) · |a⟩ à gauche s'écrit comme la forme linéaire ∑_a∈A u(a)^* · ⟨a|. Bon, là je n'ai rien dit d'intelligent.

[#2] Le fait qu'on ait apparemment nécessairement affaire à des coefficients complexes, quel que soit le système physique décrit, me laisse un peu perplexe, et apparemment je ne suis pas le seul.

Pour reprendre l'exemple précédent, si A = {vivant, mort} désigne les deux états possibles de vie d'un chat, alors (|vivant⟩ + |mort⟩)/√2 désigne un chat dans un état quantique qui superpose ces deux états. Mais on notera que (|vivant⟩ − |mort⟩)/√2 est aussi un tel état, qui semble très analogue, mais qui est orthogonal au précédent comme on le voit en calculant le produit hermitien (et on peut légitimement se demander ce que tout ça veut dire). Et de même, (|vivant⟩ + i·|mort⟩)/√2 et (|vivant⟩ − i·|mort⟩)/√2 devraient avoir un sens et être orthogonaux l'un à l'autre (quoique pas aux précédents). Ceci étant dit, autant c'est rigolo de donner mes exemples avec des chats vivants ou morts ou en superposition quantique entre les deux, ce n'est peut-être pas un très bon exemple[#3][#3b], en fait, justement à cause de la difficulté de donner un sens à ces états que je viens d'écrire, donc dans la suite je vais passer à un exemple plus abstrait du genre A = {0,1}, c'est-à-dire les états basiques de ce qu'on appelle un qubit : vous pouvez imaginer ‘0’ et ‘1’ comme signifiant qu'un chat est vivant et mort si vous voulez, mais si vous voulez des exemples physiquement plus plausibles, l'article Wikipédia que je viens de lier a divers exemples, et je vais juste dire un mot de deux d'entre eux dans les paragraphes suivants.

[#3] Je ne sais plus qui me faisait le reproche je ne sais où d'utiliser le chat de Schrödinger comme exemple de superposition quantique, alors que c'est justement un exemple censé illustrer le doute qu'on peut avoir sur l'existence ou le sens de superpositions quantiques sur des objets macroscopiques. Si on croit la mécanique quantique jusqu'au bout, et notamment si on croit sa linéarité exacte, alors oui, on peut faire des superpositions quantiques macroscopiques, et même c'est ce qui arrive à l'Univers tout entier dès qu'on fait une « mesure », et il y a toutes sortes de tentatives d'explications, ou de bouts d'explications (décohérence, interprétation « multi-mondes » d'Everett-DeWitt) sur pourquoi on ces superpositions ne se manifestent pas de façon visible dans notre expérience quotidienne. Mais mon but ici n'est pas vraiment de parler de ces choses-là (même si je ne peux pas faire l'économie d'au moins une mention au passage — dont acte ; cf. aussi la note #8 plus bas).

[#3b] Ajout (2024-02-03) : Bien sûr, le problème avec le chat, ce n'est pas juste qu'il est macroscropique, c'est qu'il a bien plus d'états que {vivant, mort} : il y a peut-être quelque chose comme 10^10²⁷ états qualifiables de vivant et de mort. En quoi ceci est vraiment pertinent pour toute la discussion n'est pas clair pour moi, ni si on choisit de les regrouper en deux paquets (i.e., de fabriquer deux sous-espaces de grande dimension) ni si on décide d'en choisir un très particulier dans chaque paquet (mais je note quand même que, par un phénomène de concentration de la mesure, si on choisit un état vivant au hasard et un état mort au hasard, ils seront essentiellement orthogonaux — donc au moins ça justifie de travailler avec comme des états basiques).

À titre d'exemple de qubit, il y a la polarisation d'un photon : si |↺⟩ représente un photon polarisé circulairement d'hélicité droite[#4] et |↻⟩ un photon polarisé circulairement d'hélicité gauche, alors (|↺⟩ + |↻⟩)/√2 et (|↺⟩ − |↻⟩)/√2 peuvent représenter des photons respectivement polarisés horizontalement et verticalement[#5][#6], tandis que (|↺⟩ + i·|↻⟩)/√2 et (|↺⟩ − i·|↻⟩)/√2 peuvent en représenter de polarisations diagonales.

[#4] Comme bien expliqué sur Wikipédia, il y a deux conventions opposées sur ce qu'une polarisation circulaire horaire ou anti-horaire signifie, selon qu'on prend le point de vue de la source qui voit l'onde partir ou de la cible qui voit l'onde arriver. Par contre, l'hélicité, il me semble que ça devrait être inambigu : on met le pouce (droit ou gauche, selon qu'on parle d'hélicité droite ou gauche) dans le sens de propagation de l'onde et en courbant les autres doigts ils indiquent dans quel sens l'onde tourne autour de son sens de propagation. Donc pour moi, hélicité droite = sens anti-horaire (= trigonométrique) vu par la cible = sens horaire (= rétrograde) vu par la source, tandis que hélicité gauche = sens horaire (= rétrograde) vu par la cible = sens anti-horaire (= trigonométrique) vu par la source. (Et les petits dessins ‘↺’ et ‘↻’ que j'utilise évoquent ce que voit la cible.) Mais apparemment, toujours si j'en crois Wikipédia, des gens ont aussi réussi à mélanger les conventions gauche/droite, et là je ne comprends pas comment ils ont pu faire un truc pareil. Enfin bon, tout ça n'a aucune importance pour ce que je veux raconter ici.

[#5] Là aussi, on trouve des conventions contradictoires, bien sûr, mais la convention moderne semble être de dire qu'une onde se propageant horizontalement a une polarisation horizontale par référence à la direction du champ électrique oscillant : le champ magnétique, lui, oscille dans une direction perpendiculaire au champ électrique et au vecteur de propagation de l'onde, donc verticalement pour une onde de polarisation horizontale.

[#6] Mathématiquement, imaginez que |↺⟩ est la fonction exp(2iπν·t) où ν est la fréquence du photon et t est le temps retardé par la distance depuis la source, et le composantes réelle et complexe sont, disons, les composantes horizontale et verticale du champ électrique ou quelque chose comme ça, tandis que |↻⟩ est exp(−2iπν·t) ; alors (|↺⟩ + |↻⟩)/√2 et (|↺⟩ − |↻⟩)/√2 décrivent les fonctions cos(2πν·t) et i·sin(2πν·t) respectivement.

La raison pour laquelle je précise l'exemple du paragraphe précédent est pour souligner que ces états en superposition quantique sont parfaitement valables (je vais dire ci-dessous que, contrairement à la situation probabiliste, il n'y a rien d'objectif qui distingue les états basiques que j'ai choisis des autres états fabriqués par combinaisons linéaires de ceux-ci : le fait qu'un état soit « superposé » n'a pas de sens en soi), et ça se voit bien sur cet exemple-là : les polarisations circulaires n'ont rien de plus naturel que les polarisations horizontales/verticales ou diagonales. Par ailleurs, on se dit que ce sont des choses qui ont un vrai sens physique, pas des expressions de notre ignorance.

J'ai évoqué les photons ci-dessus pas juste pour le plaisir d'utiliser les caractères ‘↺’ et ‘↻’, mais aussi parce que je pense que c'est raisonnablement simple à comprendre — modulo les prises de tête sur les conventions contradictoires quant au sens de la polarisation — mais on peut aussi dire un mot du qubit décrivant le spin de l'électron au repos. Là les deux états basiques pourraient être |↑⟩ et |↓⟩ représentant un électron avec un spin dirigé vers le haut ou vers le bas respectivement : alors (|↑⟩ + |↓⟩)/√2 et (|↑⟩ − |↓⟩)/√2 peuvent représenter un électron avec un spin dirigé vers la droite et la gauche respectivement, tandis que (|↑⟩ + i·|↓⟩)/√2 et (|↑⟩ − i·|↓⟩)/√2 peuvent en représenter un avec un spin dirigé vers l'avant et l'arrière respectivement[#7].

[#7] Le lecteur astucieux me demandera mais ça dépend très hautement du fait que l'espace est de dimension 3, ça : que se passe-t-il en d'autres dimensions ? — et, en effet, c'est une particularité de la dimension 3 que l'état de spin d'une particule de spin ½ soit représenté par un qubit. En général, en dimension d le spin d'une telle particule devrait avoir 2^⌊d/2⌋ états basiques (c'est la dimension de la représentation spinorielle du groupe Spin_d ; je ne sais d'ailleurs pas comment Wikipédia réussit à cacher cette information aussi efficacement dans la page que je viens de lier), c'est-à-dire l'équivalent de ⌊d/2⌋ qubits. Donc, oui, c'est particulier à la dimension 3 qu'on puisse décrire ça aussi simplement que vers le haut et vers le bas. Pour la polarisation du photon, il me semble que c'est d−1 états basiques (donc, en grande dimension, il y a beaucoup moins d'information dans le spin d'un photon que d'un électron, vous interprétez ça comme vous voulez).

Ressemblances et différences entre les deux

Il y a des ressemblances entre mélange probabiliste et superposition quantique, et j'ai fait exprès de choisir une description analogue avec des combinaisons linéaires pour faire ressortir ces ressemblances (et je regrette que toute description de la mécanique quantique ne commence pas par une telle discussion). Il y a aussi des différences cruciales, à la fois physiques et mathématiques.

[Lire la suite…]

↑Entry #2782 [older|※ permalink|newer] / ↑Entrée #2782 [précédente|※ permalien|suivante] ↑

↓Entry #2781 [older|※ permalink|newer] / ↓Entrée #2781 [précédente|※ permalien|suivante] ↓

2024-01-28 (dimanche)

Combien y a-t-il de continents ? — et l'apprentissage du recul face aux conventions

Si on demande à une personne ayant grandi en France combien il y a de continents, et de les lister, je pense que la réponse sera généralement cinq, avec comme liste l'Europe, l'Asie, l'Amérique, l'Afrique et l'Océanie (dans un certain ordre). Il me semble que ceci est la liste « traditionnelle » des continents vus par la France, ou par la culture française, et probablement enseignée dans le système éducatif français. En tout cas c'est la liste retenue par (le Français) Pierre de Coubertin quand il s'est agi de fixer la symbolique du drapeau d'une certaine compétition sportive[#]. Je n'ai pas de souvenir très précis de ce que j'ai pu moi-même apprendre à l'école comme liste des continents, mais je suis certain que l'Europe était considérée comme distincte de l'Asie (la limite étant placée au niveau de l'Oural) et je crois bien que l'Amérique était considérée comme un seul continent et que j'étais moi-même un peu scandalisé par l'arbitraire de cette différence de traitement. Je crois aussi que l'Antarctique était mentionné comme devant logiquement être un continent mais on l'a oublié mais comme personne n'y habite ce n'est pas grave.

[#] Dont je n'ai probablement pas le droit d'écrire le nom ici, surtout si je le mets à proximité du nom de la ville où j'habite et de l'année en cours, sans payer les organisateurs de la dite compétition sportive, sous peine de voir débarquer chez moi la police de la propriété intellectuelle, parce que cette compétition défend sa marque avec une vigueur qui démontre à elle seule que leur but n'est pas de faire du sport mais de faire du fric. Oups, pardon, j'ai digressé.

Ajout (2024-02-21) : On me fait remarquer qu'il y a sur le parvis du musée d'Orsay, créées pour le palais du Trocadéro de l'Exposition universelle de 1878, des sculptures représentant six continents (l'Amérique du Nord étant distincte de l'Amérique du Sud), ce qui vient mettre en doute le fait qu'il y ait une liste française traditionnelle unique.

Je n'ai pas réussi à trouver s'il y a actuellement une liste officielle à enseigner dans les écoles françaises (un document qui dirait que, pour les besoins de l'enseignement en France, l'Amérique du Nord et l'Amérique du Sud ne sont pas deux continents distincts, par exemple : je suis tombé sur cette page sur le socle commun de connaissances, de compétences et de culture qui a l'air pertinent, mais aucune des pages liées ne semble plus précise que nommer et localiser les grands repères géographiques du monde (continents, [etc.])). Si quelqu'un a des enfants qui sont récemment passés dans les écoles françaises (ou est un enfant récemment passé dans les écoles françaises, après tout ne faisons pas d'hypothèse hasardeuse, on a le droit de lire mon blog à 12 ans), je veux bien qu'on me dise ce qu'on y apprend.

La France n'est évidemment pas la seule à enseigner cette liste précise de cinq continents, mais d'autres pays font des choix différents (et bien sûr, ce n'est pas comme si tout le monde était forcément d'accord au sein d'un même pays). Les points de désaccord principaux semblent être : ① si l'Amérique est un contient ou deux, ② si l'Europe et l'Asie sont un continent ou deux, ③ si l'Océanie est un continent (c'est un peu un oxymore, le continent d'Océanie !) et, si ce n'est pas le cas, comment on classe l'Australie, et ④ ce qu'on doit faire de l'Antarctique. (Après ça, bien sûr, il y a des désaccords plus secondaires sur le tracé précis des frontières intercontinentales, ou sur le statut des îles.) Le seul vrai point de consensus a l'air d'être que l'Afrique est un continent (mais même là, je n'oserai pas demander si le Sinaï est en Afrique ou en Asie). Cette vidéo de la chaîne YouTube Map Men, en plus d'être assez hilarante comme tout ce qu'ils font, résume très bien la difficulté de définir ce qu'est un continent, certaines approches possibles choisies par telle ou telle culture. Cette page Wikipédia est plus précise (quoique moins rigolote), mais finalement ne nous apprend pas grand-chose de plus.

Je dis telle ou telle culture, mais j'imagine qu'il y a un certain nombre d'endroits où une définition officielle d'un continent est nécessaire. Je pense à des organisations internationales qui ont une convention officielle ou semi-officielle que leur chef, ou le lieu des réunions, effectue une rotation entre les continents (divulgâchis : ces organisations ne considèrent sans doute pas l'Antarctique comme un continent !).

Je suis sûr qu'il y aurait moyen d'écrire un livre fort intéressant sur l'histoire des cinq continents, depuis les anciennes cartes en TO montrant l'Asie en haut, l'Europe en bas à gauche et l'Afrique en bas à droite, d'un œcoumène ayant la forme symbolique d'un T inscrit dans un O, jusqu'à la découverte de la tectonique des plaques[#2] et après. Comment l'Éducation nationale française (si c'est bien le cas) s'est-elle retrouvée[#3] à enseigner que l'Oural précisément[#4] marque la distinction entre l'Europe et l'Asie (quelle est la genèse de cette idée ?) et que l'Amérique du Nord et l'Amérique du Sud sont un seul et même continent (qui a décidé ça et quand et pourquoi ?), voilà toutes sortes de questions fascinantes, auxquelles je n'ai pas la réponse. Si un tel livre existait, je le lirais volontiers[#5].

[#2] En passant par le fait que Martin Waldseemüller ait été apparemment le premier, vers 1507, à publier une carte donnant un nom au Nouveau-Monde, choisi en l'honneur d'Amerigo Vespucci, l'adoubant de fait en nouveau continent.

[#3] Apparemment un des responsables dans l'histoire est Philip Johan von Strahlenberg vers 1730, et sa ligne de séparation Europe-Asie aurait été adoptée officiellement par la tsarine Anne. Voilà des bribes d'information que je trouve un peu au hasard d'Internet, mais qu'un tel livre pourrait expliquer de façon précise avec des sources fiables.

[#4] Au moins au nord. Parce que je me rappelle parfaitement qu'on m'a dit à l'école primaire que la plus haute montagne d'Europe était en France parce que c'est le Mont Blanc, cocorico🇫🇷, mais c'est un double mensonge parce que d'abord la France a volé le sommet du Mont Blanc en rectifiant unilatéralement des cartes pour que ce ne soit plus le point de passage de la frontière avec l'Italie, mais c'est une autre histoire, et d'autre part parce qu'il semble quand même (maintenant ?) assez universellement admis que le mont Elbrouz (en Russie, dans le Caucase) est en Europe.

[#5] Comme lecture connexe, mais qui existe vraiment, je peux mentionner le livre La Terre plate : Généalogie d'une idée fausse de Sylvie Nony et Violaine Giacomotto-Charra, que j'ai lu il n'y a pas longtemps, et qui raconte l'histoire du mythe non pas que la Terre est plate (pour ça je recommande les documentaires Behind the Curve et In Search of a Flat Earth) mais celui que que au Moyen-Âge, les gens croyaient que la terre était plate (ce qui est tout aussi faux, pour autant qu'on interprète les gens comme l'essentiel des lettrés et pas une poignée d'illuminés). Ce livre mentionne au passage des questions sur la forme de l'œcoumène (et le fait que la forme de l'œcoumène n'est pas forcément la même chose que la forme de la Terre, d'où la confusion !) et la possibilité de l'existence d'autres régions habitées de la Terre. Mais je digresse.

❦

Mais mon but ici n'est pas seulement de parler des cinq continents ou de l'histoire de cette idée, parce que je n'ai pas de lumière particulière à apporter là-dessus. Je pense que tous les lecteurs de mon blog (qui ont notamment lu ce billet que je référence maintenant quasiment à chaque nouvelle entrée) ont le recul nécessaire pour bien comprendre (ce que la vidéo de Map Men explique très bien) que :

Les frontières entre les continents sont largement arbitraires et conventionnelles. Il peut y avoir des raisons géographiques (géophysiques, démographiques, géopolitiques, culturelles, que sais-je) ou historiques pour penser qu'il est préférable de séparer ou réunir tel ou tel bouts de terre, de placer la limite à tel ou tel endroit, mais in fine il n'y a pas plus d'autorité qu'une sorte de tradition arbitraire et même pas bien définie pour décider que la bonne liste des continents est ceci plutôt que cela.

Maintenant voici une question qui me semble plus intéressante : quand et comment doit-on enseigner ça à l'école ? (par ça je veux dire, le paragraphe que je viens de mettre en exergue).

Et je ne parle évidemment pas que du cas des cinq continents qui n'est là que pour servir d'illustration à une idée plus générale.

On apprend plein de choses à l'école. Certaines sont des vérités objectives[#6] sur le monde (qui peuvent elles-mêmes être établies avec plus ou moins de certitude). D'autres sont des conventions. Parmi ces conventions, certaines sont simplement là pour des raisons historiques, culturelles ou traditionnelles. D'autres sont plus ou moins justifiées, par exemple pour la commodité, pour le besoin d'avoir une typologie utile dans tel ou tel but (auquel cas elles sont discutables dans leur adéquation à ce but ; mais il peut y avoir toutes sortes de compromis qui président au choix de la convention ; et bien sûr le fait de se mettre d'accord sur un terme commun, même s'il est imparfait, peut avoir une valeur supérieure à trouver la typologie idéale dans chaque situation).

[Lire la suite…]

↑Entry #2781 [older|※ permalink|newer] / ↑Entrée #2781 [précédente|※ permalien|suivante] ↑

↓Entry #2780 [older|※ permalink|newer] / ↓Entrée #2780 [précédente|※ permalien|suivante] ↓

2024-01-25 (jeudi)

Sur la notion d'« étendue » en optique et en géométrie

Je voudrais essayer de parler ici d'un concept de géométrie (euclidienne), notamment important pour son application en optique, que je trouve à la fois joli pourtant trop peu connu[#] : celui d'« étendue ». En gros, l'étendue est une façon de mesurer la taille d'un ensemble de droites (disons, dans l'espace) de la même manière que le volume est une façon de mesurer la taille d'un ensemble de points. Mais pour commencer, et pour expliquer une façon dont cette notion apparaît, je veux parler des unités et grandeurs lumineuses que sont le lumen, le lux, la candela et la candela par mètre carré, et le lien entre ces unités, et ce qu'elles nous disent. Parce que même le grand public commence à avoir entendu parler des lumens (c'est écrit sur toutes les boîtes d'ampoules, de nos jours), et peut-être de lux (pour le niveau d'éclairement d'une pièce), mais ne sait pas forcément la différence entre les deux (divulgâchis : un lux, c'est un lumen par mètre carré).

[#] À titre d'exemple, je n'en vois pas de trace dans les programmes de classes préparatoires scientifiques françaises, ce que je trouve un peu surprenant. Et ce n'est pas une évolution récente parce que je ne crois pas qu'on m'en ait parlé quand j'étais moi-même en prépa.

La difficulté de l'exercice, c'est que comme je veux parler de divers concepts (l'étendue en géométrie euclidienne, l'étendue en optique géométrique, les unités de mesure photométriques, et quelques conséquences de tout ça) et ce à différents niveaux de vulgarisation, je mais certainement faire de la bouillie. En plus de ça, je suis infoutu de faire le moindre dessin, ce qui n'aide pas pour expliquer un concept éminemment géométrique.

Mais voilà, essayons quand même (bear with me), parce cette histoire de conservation de l'étendue est quelque chose qui me semble important pour comprendre les bases de l'optique, et c'est aussi un concept mathématique pas compliqué mais néanmoins digne d'être noté. Et j'en ai marre de toujours oublier ces choses, alors ce billet de blog est surtout un aide-mémoire pour moi-même.

☞ La « luminosité » décroît-elle avec la distance ? (Oui et non.)

Pour commencer, une observation toute simple qui me fascine depuis que je suis petit, qui n'est pas difficile à comprendre, et qui renferme l'essence de cette notion de conservation de l'étendue.

Considérez le Soleil, vu depuis la Terre, en plein jour (et par beau temps). Ne le regardez surtout pas directement, c'est très dangereux pour vos yeux (Newton a failli se rendre aveugle comme ça). Oui mais pourquoi est-ce si dangereux, au juste ? Parce que le Soleil est très brillant, bien sûr. Certes, mais il est aussi très loin : est-ce que la luminosité ne s'atténue pas avec la distance ? Après tout, l'étoile Sirius (enfin, Sirius A), qui est 23 fois plus lumineux que le Soleil mais 540 000 fois plus loin de nous, ne nous aveugle pas quand nous la regardons directement. Alors, oui et non : ça dépend surtout de ce qu'on appelle luminosité.

D'abord, il y a une absorption de la lumière par l'atmosphère terrestre, qui atténue surtout le bleu et l'ultra-violet. C'est important pour rendre le Soleil moins dangereux pour nous, mais ce n'est pas de ça que je veux parler, donc faisons comme si elle n'existait pas. Ensuite, il y a effectivement une décroissance de la luminosité avec la distance (quadratique : si on est 2 fois plus loin d'une étoile, elle apparaît 4 fois moins lumineuse), mais cette décroissance correspond précisément à une décroissance de la taille apparente (ou « angle solide ») de l'étoile : si on va 2 fois plus loin du Soleil, il apparaîtra 2 fois plus petit dans chaque direction, donc 4 fois plus petit en surface apparente (« angle solide »), et sa luminosité sera 4 fois plus faible juste pour cette raison, c'est-à-dire que la luminosité par unité d'angle solide (ou luminance) sera la même.

Quand l'objet qu'on regarde est suffisamment petit pour qu'il n'en reste qu'un seul point (on dit qu'il n'est pas « résolu optiquement »), on ne voit plus l'angle solide, et tout ce qui compte est la luminosité totale qu'on en reçoit[#2] (dont je vais dire qu'elle s'appelle correctement éclairement et se mesure en lux) ; mais si l'objet est de taille visible, ce qui est le cas du Soleil, alors ce qui compte est cette luminosité par angle solide (appelée luminance, et mesurée en lux par stéradian, ou ce qui revient au même, en candelas par mètre carré), et elle ne change pas avec la distance.

[#2] Je ne sais pas si je l'ai déjà raconté ici, mais depuis que je suis petit, quand je suis passager dans une voiture la nuit, j'aime parfois jouer à retirer mes lunettes. Comme je suis très très myope, chaque feu de véhicule devient alors une grosse tache (en gros l'image de mon cristallin qui, vu que c'est la nuit, est bien ouvert) : c'est très joli et assez poétique, ça fait une sorte de ballet hypnotisant de taches de couleurs rouges, orange et blanches. Ce qui est perturbant, c'est que la taille de ces taches ne change pas quand le véhicule s'éloigne, puisqu'elle est avant tout due à l'imperfection optique de mon œil : l'éloignement se manifeste non pas par une diminution de la taille mais par une diminution de la luminosité de la tache. C'est ce que j'appelle une situation non résolue optiquement. C'est pareil pour n'importe qui quand on regarde une étoile, mais dans mon cas les taches sont vraiment très grosses (d'ailleurs, du coup, sans mes lunettes, je ne peux absolument pas voir la moindre étoile).

En bref, si vous étiez deux fois plus loin du Soleil, ce serait tout aussi dangereux pour vos yeux de le regarder directement et fixement : la surface de la rétine qui se ferait endommager serait plus petite, mais la surface qui serait endommagée le serait tout autant. (Bon, il y a plein de petits caractères à ajouter là : par exemple pour rappeler que je parle de regarder fixement pendant une certaine durée, parce que les yeux bougent toujours un peu tout le temps, ce qui aide justement à nous protéger contre le soleil.)

Inversement, en principe, même si vous étiez à cent mètres de la surface du Soleil, cette surface vous apparaîtrait aussi brillante (absorption atmosphérique mise à part) que ce que vous en voyez depuis la Terre — c'est juste que ça occuperait la moitié de votre champ visuel au lieu d'être un tout petit truc (de 68 microstéradians) dans le ciel. (Bon, bien sûr, à 100m du Soleil vous auriez plein de problèmes, et je déconseille très fortement d'y aller.)

Et ça, quand j'étais petit, ça me fascinait profondément, de me dire que nous voyons le Soleil vraiment lumineux comme il est, juste plus petit.

☞ Flux lumineux, éclairement, intensité lumineuse, et luminance

Bon, mais dans tout ça j'ai utilisé le terme de luminosité de façon très vague. Essayons d'être plus clair, en distinguant quatre notions, et en expliquant comment elles se relient et quelles sont les unités qui les mesurent (si vous trouvez ça trop verbeux, j'ai mis un résumé à la fin) :

La première, c'est la notion de flux lumineux, qui est mesuré en lumens (symbole : lm) dans le Système International. C'est analogue à la puissance lumineuse, c'est-à-dire la quantité d'énergie par unité de temps : donc c'est analogue à des watts (symbole : W).

Je dis analogue, parce qu'un lumen n'est pas un watt : le lumen reflète le fait que notre œil est plus ou moins sensible à différentes parties du spectre électromagnétique, donc qu'on ne voit pas 1W dans le vert autant que 1W dans le rouge ou le bleu, et si c'est 1W dans l'ultraviolet ou l'infrarouge on ne le voit pas du tout : donc le lumen tient compte de cette différence de sensibilité en pondérant la puissance des différentes longueurs d'onde en fonction de la sensibilité de l'œil humain (mais à cette pondération près, c'est comme des watts).

[Lire la suite…]

↑Entry #2780 [older|※ permalink|newer] / ↑Entrée #2780 [précédente|※ permalien|suivante] ↑

↓Entry #2779 [older|※ permalink|newer] / ↓Entrée #2779 [précédente|※ permalien|suivante] ↓

2024-01-15 (lundi)

Méditation la complexité des conjugaisons françaises et inflexions linguistiques en général

Avertissement préliminaire : je vais faire référence dans ce billet à plein de langues (français, latin, grec, mais aussi allemand, russe, sanskrit, arabe). Ces langues ne servent qu'à illustrer mon propos général sur la complexité des inflexions, et il va de soi que je ne suppose pas qu'on les connaît (moi-même, je n'y connais pas grand-chose), et je ne vais généralement même pas m'embêter à donner le sens des mots que j'utilise comme exemples parce que ça n'a aucune pertinence pour ce que je raconte. De même, il faut considérer les noms des traits grammaticaux comme des mots dénués de sens : peu importe ce qu'est que l'aoriste à part que c'est un temps de la conjugaison des verbes grecs. (Prenez ça comme un mot à la fois technique et poétique : cf. d'ailleurs ce vieux fragment littéraire que je ne peux pas ne pas référencer ici.) J'ai aussi fait quantité de digressions marquées par des notes en petits caractères : on peut les sauter, ou au contraire ne lire que ça, de toute façon tout ceci est un rant un peu décousu, ce n'est pas comme s'il y avait un plan ou des dépendances entre les parties.

Comme le terme linguistique de paradigme inflexionnel n'est pas forcément clair pour tout le monde (je ne suis même pas sûr que ce soit le bon), ce dont je parle est l'ensemble des formes que peut prendre un même mot (ou plus exactement un même lexème) à travers l'application de différents traits grammaticaux. Comme cette définition n'est elle-même pas forcément claire pour tout le monde, un exemple familier pour tous les francophones est celui des tableaux de conjugaison, par lesquels un même verbe (lexème verbal), représenté par sa forme de dictionnaire qui, s'agissant du français, est l'infinitif, prend des formes (inflexions) diverses selon des traits grammaticaux appelés mode, temps et personne (ou nombre+personne). Les conjugaisons latines et grecques sont aussi des paradigmes inflexionnels, avec à peu près les mêmes traits que pour le français (la liste des modes et temps change, et le grec classique a un nombre duel, mais l'idée est la même ; une autre différence est que pour ces langues la forme du dictionnaire, c'est-à-dire la manière dont on va ranger le verbe dans un dictionnaire, est la première personne du singulier de l'indicatif présent au lieu d'être l'infinitif, mais c'est un détail). Un autre exemple est celui des tableaux de déclinaisons latines ou grecques[#], qui pour un même nom (lexème nominal, dont la forme de dictionnaire est le nominatif singulier) donnent des formes variées en fonction de deux traits appelés nombre et cas, ou, s'agissant des adjectifs, trois traits appelés genre, nombre et cas.

[#] Ou bien sûr de plein d'autres langues. Mais attention, une langue peut avoir des cas sans pour autant avoir vraiment de déclinaisons. En allemand, par exemple, les déclinaisons portées par les noms sont quasiment vestigiales (à part la marque du pluriel, pour la plupart des mots il ne subsiste qu'un -n au datif pluriel et, s'agissant des féminins et neutres, un -s au génitif singulier ; ou pour les noms dits faibles, la déclinaison est essentiellement juste marquée par un -n partout). La marque des cas en allemand est essentiellement sur les articles ou adjectifs (avec des règles un peu tordues sur ces derniers), et comme je ne crois pas qu'il existe d'adjectif irrégulier, ce n'est pas vraiment le genre d'inflexion dont je parle dans ce billet.

Conjugaison des verbes et déclinaison des noms et adjectifs sont les paradigmes inflexionnels les plus familiers aux personnes qui auront appris des langues comme le français, le latin, le grec classique, le sanskrit ou l'arabe. Mais il peut évidemment y avoir plein d'autres choses : on peut tout à fait imaginer une langue où les adverbes varient (par exemple qu'ils s'« accordent » avec le verbe comme les adjectifs s'accordent avec les noms dans les langues que je viens de lister) ; en japonais, on peut dire que les adjectifs (enfin, certaines sortes de mots qu'on pourrait qualifier d'adjectifs) varient avec le temps ; et la division des mots en verbes, noms, adjectifs, etc., est valable pour les langues indo-européennes et sémitiques mais pas forcément transportable partout. Bref, j'utilise le terme paradigme inflexionnel pour être plus large que tableaux de conjugaison et de déclinaison, mais comme je n'ai pas de bon exemple à proposer au-delà de la conjugaison et de la déclinaison, imaginez les conjugaisons et les déclinaisons si vous êtes familiers avec ça (ou d'ailleurs, juste les conjugaisons parce que je vais surtout parler de ça).

Toutes les langues n'ont pas de mécanisme inflexionnel. Si le grec classique, le russe et l'arabe en ont de fort complexes, le chinois n'en a aucun[#2] (tous les mots chinois sont invariables), et ceux de l'anglais sont considérablement plus simples que ceux du français. Les langues scandinaves font varier le verbe avec le temps/mode mais pas avec la personne, ce qui fait déjà moins de traits que le français ou l'allemand.

[#2] Bon, quand on parle de linguistique, il faut toujours ajouter des on peut considérer que ou des en première approximation partout. Je suis sûr que si je ne mettais pas cette note il y aurait un gros malin pour me dire que well, actually, on peut considérer que <…> est un mécanisme inflexionnel en chinois : donc je mets cette note pour cette fois-ci, mais n'hésitez pas à l'insérer dans la suite à chaque fois que quelqu'un risque de dire well, actually.

Bien sûr, ce n'est pas toujours parfaitement clair ce qui constitue exactement les inflexions d'un même lexème (pourquoi dirait-on que le passage du singulier possible au pluriel possibles est une inflexion alors que le passage de possible à impossible est une dérivation lexicale ? c'est un chouïa arbitraire[#3][#4]), mais comme d'hab' je vais rappeler que ce n'est pas parce que ce n'est pas totalement clair que ça n'a pas de sens.

[#3] Un exemple d'arbitraire est celui des aspects du verbe russe : un verbe russe (comme dans l'essentiel des autres langues slaves, mais le russe est le seul que je connais un petit peu) vient par paires avec une forme, ou aspect, appelée perfectif et une autre appelée imperfectif. Certains temps peuvent être utilisés sur l'un ou l'autre aspect, avec une différence de sens (le perfectif envisage l'action accomplie, ou son résultat, tandis que l'imperfectif envisage l'action en train d'être accomplie, c'est-à-dire son déroulement) ; certains temps sont formellement le même aux deux aspects mais donnent des temps différents (la forme qui donne le présent de l'aspect imperfectif devient un futur pour l'aspect perfectif) ; certains temps n'existent que pour un des deux aspects. Doit-on considérer que le perfectif et l'imperfectif sont deux formes d'un même verbe, comme le singulier et le futur d'un nom ? Ou doit-on au contraire considérer que ce sont deux verbes différents, qui se complètent ? Je suppose que des grammairiens du russe ont passé des pages et des pages à expliquer que l'un ou l'autre de ces points de vue est meilleur que l'autre, et je ne suis pas compétent pour trancher, comme pour le sexe des anges. Pour que je veux raconter ici, il vaut sans doute mieux considérer pragmatiquement que le perfectif et l'imperfectif sont deux verbes distincts, parce qu'essayer de deviner le perfectif à partir de l'imperfectif ou vice versa semble essentiellement impossible (d'ailleurs, pour les verbes « simples » c'est plutôt le perfectif qui dérive de l'imperfectif alors que pour les verbes à préfixe c'est plutôt le contraire). Mais en tout cas, ça montre une difficulté à définir exactement ce qu'on appelle un paradigme inflexionnel.

[#4] Un autre exemple d'incertitude sur ce que c'est qu'un « lexème » et un « paradigme » est celui des formes dérivées des verbes arabes. Un verbe arabe est normalement une racine à trois consonnes, et cette racine, connue sous le nom de forme I, peut directement donner un tableau de conjugaison, qui est d'une taille relativement raisonnable (il y a moins de temps et modes qu'en français ou en latin, pour ne rien dire du grec, mais en contrepartie il y a plus de personnes parce que la distinction masculin/féminin est faite en plus de celle de nombre à la 2e et 3e personnes). La complication, c'est que chaque racine peut donner une douzaine ou une quinzaine de formes dérivées (formes II à XV, parfois on en ajoute encore d'autres, même si en vrai les formes I–X et peut-être XII sont les seules vaguement courantes) : le sens de ces formes dérivés est variable et elles n'existent pas toutes, mais leur fabrication à partir de la racine est assez systématique, et ensuite chacune d'entre elles est un verbe qui a son propre tableau de conjugaison. Faut-il considérer qu'un paradigme flexionnel de verbe arabe est l'ensemble de toutes les conjugaisons de toutes les formes dérivées (auquel cas ils sont très volumineux) ? Ou seulement d'une seule d'entre elles (auquel cas ils sont plus raisonnables, mais il y a une multiplication des types de conjugaisons) ? C'est un peu le problème dual du russe évoqué à la note précédente : le perfectif/imperfectif des verbes russes ont un sens fixe mais une formation qui dépend de chaque verbe, alors que les formes dérivées des verbes arabes ont une formation claire mais un sens qui varie.

Quand je parle de complexité, ce qui compte n'est pas tellement le nombre de traits grammaticaux qu'on peut ajouter. Une langue qui aurait des déclinaisons avec 50 cas bien réguliers serait toujours plus simple à apprendre qu'une langue qui a seulement 3 cas mais avec des centaines de paradigmes différents pour les former, des exceptions de partout, etc. C'est essentiellement de cette complexité que je veux parler ici. (Je proposerai à la fin une piste pour essayer de la définir de façon un peu objective et pas juste par l'impression subjective de la difficulté à apprendre la langue ou à mémoriser ces tableaux, mais je commence par des remarques un peu éparses.)

Je ne m'intéresse pas du tout au sens des traits grammaticaux. Comme je l'ai écrit dans l'avertissement liminaire, pour ce que je raconte ici, peu importe ce que c'est qu'un cas, ou ce que signifient le nominatif, l'accusatif, le génitif ou le trucbidulatif, peu importent que les temps du verbe s'appellent présent, passé et futur ou des choses plus bizarres comme aoriste ou prétérit, peu importe que parfait et inchoatif soient des temps ou des aspects, tout ça est hors de propos ici : ce sont juste des étiquettes arbitraires que la grammaire utilise pour décrire des façons de modifier un lexème. Je parle juste de la complexité de répondre à des questions du genre[#5] :

En français, quelle est la 3e personne du singulier de l'indicatif présent des verbes coudre et résoudre ? (Réponses : il coud et il résout.)
En latin, quel est l'ablatif singulier du nom animal ? (Réponse : animali.)
En grec classique, quelle est la 1re personne du pluriel de l'optatif futur moyen du verbe βάλλω ? (Réponse : βαλοίμεθα.)
En russe, quel est l'instrumental du nombre со́рок [sórok] ? (Réponse : сорока́ [soroká].)
En irlandais, quel est le génitif singulier du nom féminin an talamh ? (Réponse : na talún.)
En sanskrit classique, quelle est la 2e personne du singulier de l'impératif (présent) actif du verbe द्विष् [dviṣ] ? (Réponse : द्विड्ढि [dviḍḍhi].)
En arabe classique, quelle est la 3e personne du singulier masculin de l'inaccompli actif du verbe وَفَى [wafá] ? (Réponse : يَفِي [yafī].)

[#5] À part l'arabe, toutes mes langues sont indo-européennes : c'est essentiellement juste un biais de ma part, même s'il semble quand meme plausible que les langues indo-européennes aient tendance à avoir une complexité inflexionnelle plutôt plus importante que la moyenne (si tant est que « la moyenne » ait un sens). Encore une fois, ça ne veut pas forcément dire qu'elles aient beaucoup de formes, plutôt beaucoup d'irrégularités : les inflexions du turc, de ce que je comprends, sont globalement très régulières, donc plutôt plus simples que celles des langues indo-européennes typiques. Bien sûr, quand je dis plutôt plus complexes que la moyenne, ça ne veut pas dire que ce soit le maximum, loin de là : les gens ayant tenté d'apprendre le géorgien doivent certainement rigoler que je décrive les conjugaisons du grec ancien comme compliquées.

Pas sûr que mes réponses ci-dessus soient correctes, mais ça fait justement partie de ce dont je veux parler : quelles sources consulter pour trouver les bonnes réponses ?

[Lire la suite…]

↑Entry #2779 [older|※ permalink|newer] / ↑Entrée #2779 [précédente|※ permalien|suivante] ↑

Only the 20 most recent entries were included above. Continue to older entries.

Seules les 20 plus récentes entrées ont été incluses ici. Continuer à lire les entrées plus anciennes.

Entries by month / Entrées par mois:

2024	Jan 2024	Feb 2024	Mar 2024	Apr 2024	May 2024	Jun 2024	Jul 2024
2023	Jan 2023	Feb 2023	Mar 2023	Apr 2023	May 2023	Jun 2023	Jul 2023	Aug 2023	Sep 2023	Oct 2023	Nov 2023	Dec 2023
2022	Jan 2022	Feb 2022	Mar 2022	Apr 2022	May 2022	Jun 2022	Jul 2022	Aug 2022	Sep 2022	Oct 2022	Nov 2022	Dec 2022
2021	Jan 2021	Feb 2021	Mar 2021	Apr 2021	May 2021	Jun 2021	Jul 2021	Aug 2021	Sep 2021	Oct 2021	Nov 2021	Dec 2021
2020	Jan 2020	Feb 2020	Mar 2020	Apr 2020	May 2020	Jun 2020	Jul 2020	Aug 2020	Sep 2020	Oct 2020	Nov 2020	Dec 2020
2019	Jan 2019	Feb 2019	Mar 2019	Apr 2019	May 2019	Jun 2019	Jul 2019	Aug 2019	Sep 2019	Oct 2019	Nov 2019	Dec 2019
2018	Jan 2018	Feb 2018	Mar 2018	Apr 2018	May 2018	Jun 2018	Jul 2018	Aug 2018	Sep 2018	Oct 2018	Nov 2018	Dec 2018
2017	Jan 2017	Feb 2017	Mar 2017	Apr 2017	May 2017	Jun 2017	Jul 2017	Aug 2017	Sep 2017	Oct 2017	Nov 2017	Dec 2017
2016	Jan 2016	Feb 2016	Mar 2016	Apr 2016	May 2016	Jun 2016	Jul 2016	Aug 2016	Sep 2016	Oct 2016	Nov 2016	Dec 2016
2015	Jan 2015	Feb 2015	Mar 2015	Apr 2015	May 2015	Jun 2015	Jul 2015	Aug 2015	Sep 2015	Oct 2015	Nov 2015	Dec 2015
2014	Jan 2014	Feb 2014	Mar 2014	Apr 2014	May 2014	Jun 2014	Jul 2014	Aug 2014	Sep 2014	Oct 2014	Nov 2014	Dec 2014
2013	Jan 2013	Feb 2013	Mar 2013	Apr 2013	May 2013	Jun 2013	Jul 2013	Aug 2013	Sep 2013	Oct 2013	Nov 2013	Dec 2013
2012	Jan 2012	Feb 2012	Mar 2012	Apr 2012	May 2012	Jun 2012	Jul 2012	Aug 2012	Sep 2012	Oct 2012	Nov 2012	Dec 2012
2011	Jan 2011	Feb 2011	Mar 2011	Apr 2011	May 2011	Jun 2011	Jul 2011	Aug 2011	Sep 2011	Oct 2011	Nov 2011	Dec 2011
2010	Jan 2010	Feb 2010	Mar 2010	Apr 2010	May 2010	Jun 2010	Jul 2010	Aug 2010	Sep 2010	Oct 2010	Nov 2010	Dec 2010
2009	Jan 2009	Feb 2009	Mar 2009	Apr 2009	May 2009	Jun 2009	Jul 2009	Aug 2009	Sep 2009	Oct 2009	Nov 2009	Dec 2009
2008	Jan 2008	Feb 2008	Mar 2008	Apr 2008	May 2008	Jun 2008	Jul 2008	Aug 2008	Sep 2008	Oct 2008	Nov 2008	Dec 2008
2007	Jan 2007	Feb 2007	Mar 2007	Apr 2007	May 2007	Jun 2007	Jul 2007	Aug 2007	Sep 2007	Oct 2007	Nov 2007	Dec 2007
2006	Jan 2006	Feb 2006	Mar 2006	Apr 2006	May 2006	Jun 2006	Jul 2006	Aug 2006	Sep 2006	Oct 2006	Nov 2006	Dec 2006
2005	Jan 2005	Feb 2005	Mar 2005	Apr 2005	May 2005	Jun 2005	Jul 2005	Aug 2005	Sep 2005	Oct 2005	Nov 2005	Dec 2005
2004	Jan 2004	Feb 2004	Mar 2004	Apr 2004	May 2004	Jun 2004	Jul 2004	Aug 2004	Sep 2004	Oct 2004	Nov 2004	Dec 2004
2003					May 2003	Jun 2003	Jul 2003	Aug 2003	Sep 2003	Oct 2003	Nov 2003	Dec 2003

[Index of all entries / Index de toutes les entrées • Latest entries / Dernières entrées • (RSS 1.0) • Recent comments / Commentaires récents]