David Madore's WebLog

This WebLog is bilingual, some entries are in English and others are in French. A few of them have a version in either language. Other than that, the French entries are not translations of the English ones or vice versa. Of course, if you understand only English, the English entries ought to be quite understandable without reading the French ones.

Ce WebLog est bilingue, certaines entrées sont en anglais et d'autres sont en français. Quelques-unes ont une version dans chaque langue. À part ça, les entrées en français ne sont pas des traductions de celles en anglais ou vice versa. Bien sûr, si vous ne comprenez que le français, les entrées en français devraient être assez compréhensibles sans lire celles en anglais.

Note that the first entry comes last! Notez que la première entrée vient en dernier !

Index of all entries / Index de toutes les entréesXML (RSS 1.0) • Recent comments / Commentaires récents

(mercredi)

Je continue à apprendre à conduire (et me découvre des super-pouvoirs)

Je continue à prendre des leçons de conduite, et, franchement, ça ne se passe pas bien.

Par rapport à mon précédent post (et 10 heures de conduite plus tard, c'est-à-dire 20h au total, le minimum légalement exigible mais ça ne signifie rien), la difficulté a un peu changé, mais je ne suis pas pour autant persuadé qu'elle soit franchement moindre. Je me sens moins débordé par l'aspect purement mécanique, c'est-à-dire quand il s'agit de démarrer (y compris en côte), passer les vitesses (dans les deux sens) et m'arrêter ; ce qui ne veut pas dire que je ne fasse pas parfois très mal les choses (comme trop freiner ou pas assez), mais enfin, quelque chose est assurément rentré. Cependant, le fait que ces difficultés se lèvent révèle, par contraste, que d'autres sont plus profondes. (Et suggère aussi que la stratégie consistant à dire finalement, tant pis pour cet art foncièrement idiot d'apprendre à passer les vitesses : je vais passer le permis sur une automatique n'est peut-être pas opportune, même si je garde cette possibilité dans un coin de l'esprit.) Par exemple, mon moniteur observe toujours régulièrement que je me place mal ou que je me dévie, notamment parce que j'ai le regard trop court, parce que je fixe des choses que je veux éviter au lieu de fixer l'endroit où je veux aller. Mais bon, ça c'est sans doute corrigeable, et s'agissant du placement, vu le nombre d'autres usagers mal placés qu'il me signale (et qui ont, il faut croire, réussi à obtenir leur permis…), je ne suis pas le seul à avoir du mal : il faut dire que le marquage est particulièrement merdique autour de Paris, avec un nombre de voies parfois tout à fait incertain ou qui n'arrête pas de changer.

En revanche, d'autres difficultés sont probablement plus particulières à moi, et semblent consterner mon moniteur. (Il me sert des remarques du genre un gamin de huit ans sur son vélo arrive à faire ça : si tu ne t'en sors pas, je ne peux vraiment rien pour toi — et même si je comprends l'idée d'engueuler lors des erreurs pour qu'elles « rentrent » bien, je ne suis pas complètement convaincu de la pertinence pédagogique de ce genre de formulation.) À cette occasion, je me découvre trois super-pouvoirs fort nuisibles quand il s'agit de conduire :

  1. L'inobservation : j'avais déjà mentionné mon talent pour ne pas voir les choses qui sont juste sous mon nez (ou plutôt, comme le souligne la citation de Sherlock Holmes que je ne reproduis pas, pour ne pas observer les choses que je vois). De façon générale, je comprends très bien le mécanisme : je me concentre sur une aspect de ce que je vois (sur une difficulté présente, à venir, ou même passée), et je ne perçois plus le reste. C'est l'astuce la plus utilisée par les magiciens de spectacle, c'est le sujet d'une célèbre expérience de psychologie ; c'est aussi une des raisons pour lesquelles je suis épouvantablement nul aux échecs (du genre : je me concentre tellement fort sur la pièce adverse qui menace ma dame que je ne vois pas le pion qui menace mon cavalier). Mais quand j'arrive à ne plus voir un feu rouge alors qu'il n'y a rien d'autre à voir dans le coin, on peut vraiment se poser des questions. En tout état de cause, je me demande comment on peut s'affranchir d'un super-pouvoir aussi puissant en un petit nombre de dizaine d'heures de leçons.
  2. L'indécision : c'est une surréaction à l'auto-analyse du point précédent : je sais que je suis capable de rater les choses les plus « évidentes », donc j'ai toujours peur de ne pas avoir vu quelque chose. D'où une tendance à rouler trop lentement, que mon moniteur décrit comme carrément dangereuse parce qu'elle donne des signaux contradictoires (il veut se garer ?) ou parce qu'il faut vraiment y aller (pour dépasser un obstacle bloquant une voie d'une rue à deux voies, par exemple, il ne s'agit pas de ralentir).
  3. La panique inopportune : conséquence des deux points précédents, et déclenchée par la moindre petite erreur (par exemple, de manipulation mécanique), avec pour conséquence que je perds tous mes moyens et que je ne sais plus du tout ce que je fais.

Mon moniteur se plaint surtout de mon incohérence, qui est une conséquence de ce qui précède : rouler lentement quand il n'y a pas de raison à cause du point (2), ou trop vite parce que je n'ai pas remarqué quelque chose à cause du point (1), ou faire n'importe quoi à cause du (3).

(Je peux sans doute ajouter la suranalyse dans mes super-pouvoirs.)

Je ne sais pas non plus où j'en suis dans la formation. Mon livret d'apprentissage, édité par les Éditions Nationales du Permis de Conduire, est divisé en quatre grands chapitres (1 Maîtriser le maniement du véhicule dans un trafic faible ou nul, 2 Appréhender la route et circuler dans des conditions normales, 3 Circuler dans des conditions difficiles et partager la route avec les autres usagers, et 4 Pratiquer une conduite autonome, sûre et économique), eux-mêmes divisés en 9+7+9+7 compétences respectivement (1A à 1I, 2A à 2G, 3A à 3I et 4A à 4G ; par exemple : 1E = je sais doser l'accélération et le freinage à diverses allures et 2F = je sais franchir les carrefours à sens giratoire et les ronds-points et 3E = je sais m'insérer sur une vioie rapide, y circuler et en sortir). Certaines compétences sont à leur tour divisées en sous-compétences : il y a 14+10+10+7 items au total, présentés sous forme de cases à cocher. Mon moniteur fait un trait dans une case quand la (sous-)compétence a été abordée, une croix quand elle a été enseignée, mais il a aussi parlé de noircir la case si la notion a été assimilée (ou quelque chose comme ça), et alors il n'a pas l'air de considérer que j'aie assimilé quoi que ce soit : pour l'instant, il a fait des croix dans 12 des 14 cases du chapitre 1 (et des traits dans les deux autres), rien de plus. Selon la manière dont on extrapole, ça laisse prévoir un nombre d'heures de formation élevé ou carrément délirant. Mais bon, tous les items ne se valent pas : le chapitre 4 a l'air complètement pipo ou vraiment facile (lire une carte routière, je pense que ça ne me pose pas trop de problème), mon moniteur semble suggérer que les chapitres 2 et 3 seront difficiles, mais je ne sais pas vraiment comment il compte les enseigner (2D = je sais tourner à droite et à gauche en agglomération, par exemple : on devinera aisément que j'ai déjà tourné à doite et à gauche !). Et évidemment, l'auto-école a intérêt à vendre le plus d'heures de formation possible (à la fois pour empocher l'argent et pour pouvoir déclarer un bon taux de réussite en première présentation).

Personnellement, ce qui me pose problème, ce n'est pas tant le prix des leçons que la difficulté à les placer dans la semaine (pour l'instant ça va, je n'ai pas de cours à donner, mais à partir de novembre ça deviendra beaucoup plus compliqué), et le stress engendré (que ce soit à me demander comment je peux avoir fait telle ou telle connerie, ou à me faire engueuler, ce n'est pas franchement plaisant, sans même parler du risque d'accident).

(vendredi)

Miranda and Caliban de Jacqueline Carey

Comme le titre le laisse comprendre, Miranda and Caliban imagine l'histoire des deux personnages ainsi nommés dans La Tempête de Shakespeare. Le roman de Jacqueline Carey imagine les événements se déroulant à partir d'environ neuf ans avant la pièce et jusqu'à la fin de cette dernière : mais ce qui intéresse l'auteure, ce sont les relations entre les quatre personnages qui se trouvent sur l'île : Miranda et Caliban, bien sûr, mais aussi Prospero et Ariel. (Pour ceux qui n'ont pas lu ou vu la pièce — ce n'est pas nécessaire pour lire le roman — mais pour que ce je raconte soit compréhensible : Prospero est un puissant magicien échoué sur une île déserte avec sa fille Miranda ; Caliban est le fils d'une sorcière précédemment exilée au même endroit et maintenant morte, nommée Sycorax, que Prospero recueille et dont il fait son servant ; et Ariel est un esprit que Prospero libère d'un sortilège de Sycorax, et qui devient aussi son serviteur.)

Il s'agit donc du récit de la manière dont Miranda et Caliban grandissent et se construisent l'un par rapport à l'autre dans ces conditions assez particulières, sous l'égide d'un magicien autoritaire et obsédé par son plan de vengeance, et en compagnie d'un esprit volatil et facétieux. J'ai trouvé l'idée très intéressante, et le résultat est réussi, du moins en ce qui concerne les deux personnages éponymes. Précisons que des changements ont été faits par rapport à l'œuvre de Shakespeare (ou, lorsqu'elle n'est pas claire, elle a été interprétée, parfois de la façon qui n'est pas la plus évidente) : notamment, Caliban est tout à fait humain, au sens propre comme au sens figuré, ce qui n'est pas le cas, ou en tout cas pas clairement le cas, dans la pièce. Il n'est ni grossier ni brutal ni stupide. Mais le personnage de Caliban a toute une histoire d'interprétations et de réinterprétations (classiquement comme un esclave révolté, et jusqu'à un monstre invisible et destructeur dans le classique de la SF hollywoodienne, La Planète interdite, que je recommande de nouveau au passage) : la vision de Jacqueline Carey m'en a en tout cas semblé à la fois fructueuse et attachante. Miranda comme Caliban sont à la fois intelligents et imparfaits, et on les voit évoluer avec l'âge : tout ça est très bien mené.

Ce que j'ai trouvé beaucoup moins réussi, c'est le personnage de Prospero. Autant Miranda et Caliban gagnent en profondeur par rapport à ce qu'on voit dans la pièce (du moins dans le souvenir que j'en ai, qui est plutôt lointain), autant Prospero en perd. Même si ce n'est pas le personnage le plus important du roman, je le regrette parce que, chez Shakespeare, il a une grande complexité. Jacqueline Carey lui donne une morale étroite qui m'évoque plutôt celle d'un lord anglais de l'ère victorienne que d'un magicien italien de la Renaissance. En plus de ça, elle diminue la portée de ses choix finaux que sont le pardon (il ne pardonne pas à Caliban, alors que dans la pièce je comprends que si) et son renoncement aux arts occultes (il en croit la promesse nécessaire à l'acte de magie lui-même, donc ce n'est pas un acte pleinement volontaire) : comme ces choix donnent vraiment sa dimension au personnage chez Shakespeare, il s'en trouve d'autant amoindri dans le roman. Je trouve ça vraiment dommage. D'autant plus que ce n'était pas vraiment nécessaire : Prospero aurait pu jouer essentiellement le même rôle avec des motivations un peu différentes (Carey a très bien compris combien le malentendu ou le manque de communication peuvent se transformer en adversaires).

Pour ce qui est d'Ariel, on sent bien qu'il est assez complexe et changeant (après, le mot mercurial est répété jusqu'à l'user, ce qui est un chouïa maladroit, mais bon, ce n'est pas grave), et qu'il ne se comprend pas toujours lui-même, ce qui est en effet subtil. On peut juste regretter un peu qu'on ne nous en parle pas plus, mais c'est un choix qui se défend.

Dans l'ensemble, je recommande tout à fait, avec pour seuls bémols le traitement de Prospero comme je l'ai expliqué ci-dessus, et le déroulement de la fin qui m'a semblé un peu bâclée.

(jeudi)

Petit guide bordélique de quelques ordinaux intéressants

Méta / avant-propos

L'écriture de cette entrée aura été assez chaotique, et un peu un échec : j'ai changé plusieurs fois d'avis sur ce que je voulais y mettre, et du coup le résultat est parti un peu dans tous les sens. Cela faisait longtemps que je me disais que je devrais écrire quelque chose sur des ordinaux remarquables (comme une suite de l'entrée d'introduction à leur sujet), j'y ai repensé en écrivant l'entrée sur la programmation transfinie, je m'y suis remis en reprenant (et en copiant-collant) des bouts de choses que j'avais écrites antérieurement et laissées de côté, mais ça s'est enlisé. Je commence par expliquer pourquoi — et dans une certaine mesure, comment lire cette entrée.

Mon idée initiale était d'aider le lecteur à situer un certain nombre d'ordinaux intéressants (dont j'ai pu parler par le passé ou dont je pourrais parler ultérieurement) en les classant dans l'ordre (ce qui est bien avec les ordinaux, c'est qu'ils sont, justement, bien ordonnés) : j'ai déjà écrit cet autre texte à ce sujet (lié depuis l'entrée précédente), mais il est un plutôt technique, son but étant surtout de rassembler des pointeurs vers la littérature mathématique publiée, alors qu'ici je voulais donner un aperçu plus intuitif de (certains de) ces ordinaux intéressants.

Je me suis dit que j'allais faire un plan en trois parties, que j'appellerai domaines : (1) les ordinaux calculables (et a fortiori dénombrables), c'est-à-dire les ordinaux strictement inférieurs à l'ordinal de Church-Kleene ω₁CK, (2) les ordinaux non calculables mais néanmoins dénombrables, c'est-à-dire ≥ω₁CK mais néanmoins <ω₁ (qui, en gros, ne sont intéressants que s'ils sont « admissibles »), et (3) les ordinaux non dénombrables (qui, en gros, ne sont intéressants que s'ils sont des cardinaux). Ce plan a le bon goût de permettre d'insister sur le fait que, par exemple, certains ordinaux, bien que monstrueusement grands et complexes à définir, sont néanmoins encore calculables (domaine (1), c'est-à-dire <ω₁CK), ce qui donne une petite idée de combien ω₁CK est gigantesque.

Mais ce plan a aussi l'inconvénient que l'ordre naturel sur les ordinaux (la taille, quoi) n'est pas du tout la même chose que l'ordre d'importance, d'intérêt, ou de difficulté à les définir (je peux définir ω₁ en disant que c'est le plus petit ordinal indénombrable, ou que c'est l'ensemble des ordinaux dénombrables triés par ordre de taille : ça ne laisse peut-être pas comprendre à quel point il est riche et complexe, mais au moins, c'est une définition nette et précise, alors que certains ordinaux beaucoup plus petits, quoique structuralement moins riches, sont beaucoup plus subtils à définir, puisqu'on veut les définir, justement, de façon beaucoup plus précise et complète). Plus subtilement, d'ailleurs, mon plan par taille des ordinaux a aussi l'inconvénient que l'ordre de taille n'est même pas l'ordre de dépendance logique des ordinaux : c'est ce phénomène qu'on appelle imprédicativité qui veut qu'on fasse appel, pour construire certains ordinaux, à des ordinaux encore plus grands ; ainsi, la construction de l'ordinal de Bachmann-Howard (qui est <ω₁CK, donc dans le domaine (1) de mon plan) fait appel à une « fonction d'écrasement », qui présuppose de savoir ce que c'est que ω₁CK ou peut-être ω₁ (l'un ou l'autre peut servir, et on lui donne le nom de Ω dans les notations), et c'est encore pire dans la construction d'ordinaux calculables encore plus grands, qui nécessitent d'invoquer des ordinaux récursivement grands ou de grands cardinaux.

Je le savais, bien sûr, mais je pensais pouvoir contourner ces difficultés en fournissant au fur et à mesure des informations minimales sur les grands ordinaux des domaines (2) et (3) alors que je décrivais le domaine (1), quitte à y revenir plus tard. Finalement, c'est une très mauvaise idée, et cette partie (1) a beaucoup trop gonflé et est devenue, du même coup, assez illisible. (Un autre problème est que ce qui rend les ordinaux calculables vraiment intéressants est leur lien avec certaines théories logiques, et il faudrait vraiment beaucoup de place pour expliquer ce que sont exactement des théories telles que la « théorie des ensembles de Kripke-Platek », l'« arithmétique du second ordre limitée à la Δ¹₂-compréhension », la « théorie des définitions inductives ».) En même temps que ça, j'ai commencé à en avoir vraiment marre d'écrire sur des ordinaux de plus en plus techniques à expliquer. Du coup, j'ai calé sur la partie (1), ce qui casse vraiment l'intention initiale, puisque j'avais surtout envie (pour rester sur la lancée de la programmation transfinie) d'essayer de dire des choses sur les ordinaux nonprojectibles, stables et compagnie, qui sont résolument dans la partie (2).

Au final, c'est un peu n'importe quoi : cette entrée me fait l'effet d'une moussaka géante où on ne comprend plus rien. Mais je pense qu'il y a quand même un certain intérêt à ce que je publie ce « n'importe quoi » plutôt que de le ranger dans mes cartons, c'est-à-dire dans le vaste cimetière des entrées que j'ai commencées et jamais publiées. Car après tout, ce que j'écris est correct (enfin, je crois), et même si vers la fin je lance dans l'air de plus en plus de termes non définis faute de patience pour les définir, ou que je pars complètement dans l'agitage de mains, certains en tireront quand même quelque chose.

Finalement, les différentes sous-parties de cette entrée sont, je l'espère, assez indépendantes les unes des autres, donc comme d'habitude, et même plus encore que d'habitude, j'encourage à sauter les passages qu'on trouve incompréhensibles ou trop techniques (beaucoup d'entre eux ne servent, finalement, à rien).

Comme expliqué ci-dessus, je vais d'abord faire quelques remarques générales sur les ordinaux intéressants, expliquer plus précisément le plan que j'avais en tête, puis parler d'ordinaux calculables (i.e., <ω₁CK, le domaine (1)), et m'arrêter en queue de poisson.

Introduction

Remarques générales (sur ce qui rend les ordinaux intéressants)

Les ordinaux « intéressants » vont généralement de pair avec les propriétés qu'on peut définir sur les ordinaux. En effet, de façon générale, les ordinaux qui sont intéressants sont de la forme le plus petit ordinal qui a la propriété <machin>, et c'est ça qui les rend intéressants. (Par exemple, ω est le plus petit ordinal infini ou le plus petit ordinal limite ; ω₁CK est le plus petit ordinal non calculable ; et ω₁ est le plus petit ordinal indénombrable.) La propriété <machin> peut être de diverses sortes : parfois elle vaut pour tous les ordinaux à partir d'un certain point (par exemple, tous les ordinaux ≥ω sont infinis) ; parfois seulement pour certains (seulement certains ordinaux — ω, ω·2, ω·3…, ω², etc. — à partir de ω sont limites), auquel cas, le deuxième ordinal la vérifiant peut être aussi intéressant, surtout si le premier était ω, qui est souvent un cas un peu spécial. Souvent, une limite d'ordinaux ayant tous la propriété <machin> a encore cette propriété (on dit alors que la propriété est fermée), parfois non ; dans les deux cas, être limite d'ordinaux <machin> (plus petits) définit une nouvelle propriété. (Par exemple, les ordinaux limites sont les multiples ω·α non nuls de ω et le plus petit est ω, les limites d'ordinaux limites sont les multiples ω²·α de ω² et ω² peut être considéré comme intéressant car il est le premier ordinal limite d'ordinaux limites.) Mais bon, l'intérêt de ces propriétés « dérivées » décroît quand même bien vite.

Il est souvent, mais pas systématiquement, le cas que chaque ordinal intéressant est « incomparablement plus grand » que tous les précédents. Pour commencer, si on a un ordinal intéressant, α, qui est le premier ayant la propriété <machin>, « souvent », tous les ordinaux intéressants plus grands vont aussi avoir la propriété <machin> (même si ce n'est pas le cas de tous les ordinaux). Par exemple, on peut considérer que tous les ordinaux infinis intéressants sont des ordinaux limites : on s'intéresse peut-être à l'entier 1729 mais personne ne s'intéresse à l'ordinal ω+1729, désolé pour lui, dès lors qu'on commence à regarder des ordinaux limites, on ne regarde plus que des ordinaux limites, et ceci vaut pour beaucoup des propriétés qui suivent. En fait, c'est encore pire que ça : « souvent », à partir du moment où on s'est intéressé à α qui est le premier ayant la propriété <machin>, non seulement tous les ordinaux β suivants auront la propriété <machin>, mais ils seront même le β-ième ordinal ayant la propriété <machin> (c'est-à-dire qu'il y a autant d'ordinaux machin jusqu'à β que d'ordinaux tout court — donc si on veut, la propriété <machin> ne rend pas du tout β plus petit).

Le genre de propriétés qui rend un ordinal intéressant, c'est souvent d'être « stable » ou « inatteignable » par certaines constructions ou opérations, ce qui veut dire que l'ordinal en question ne pourra pas être atteint en appliquant ces constructions ou opérations à des ordinaux plus petits. Le cas le plus simple est celui de la fonction successeur (qui à un ordinal γ associe γ+1) : un ordinal α pourrait être appelé « successeur-clos » lorsque le successeur d'un ordinal <α est encore <α, c'est-à-dire, lorsque α ne peut pas être atteint en prenant un successeur d'un ordinal plus petit ; en fait, cela revient exactement à être (zéro ou bien) un ordinal limite, c'est-à-dire un multiple ω·α de ω. Un peu moins trivial : les ordinaux α « clos par addition » sont ceux tels que si γ<α et γ′<α alors γ+γ′<α, autrement dit, on ne peut pas atteindre α en ajoutant des ordinaux plus petits que lui (en nombre fini) ; il n'est pas difficile de se convaincre que les ordinaux clos par addition sont exactement les puissances ωα de ω. De même, les ordinaux clos par addition et multiplication sont exactement les doubles puissances de ω, autrement dit les ωωα. Quant à ceux qui sont clos par addition, multiplication et exponentiation, ce sont les εα (ceci peut servir de définition, si on veut). Et généralement parlant, tout ordinal intéressant ≥ε₀ va être clos par tout ça, donc va être un εα, et même va être le α-ième tel ordinal, c'est-à-dire vérifier αα.

Trois ou quatre grands domaines

J'ai déjà dit ça plusieurs fois : il est raisonnable, pour s'y retrouver, de diviser mes ordinaux en quatre régions, par ordre de taille :

  1. les entiers naturels (i.e., les ordinaux <ω),
  2. les (autres) ordinaux calculables (=constructifs, =récursifs) (i.e., les ordinaux <ω₁CK),
  3. les (autres) ordinaux dénombrables [peut-être : dans l'univers constructible] (i.e., les ordinaux <ω₁ [ou peut-être <ω₁L, ignorons ça pour l'instant]),
  4. les ordinaux indénombrables (qui ne sont intéressants que s'ils sont des cardinaux).

Autrement dit, je découpe en trois points : ω, puis ω₁CK, et enfin ω₁ [ou peut-être plutôt ω₁L mais les non experts peuvent ignorer cette subtilité]. Selon la manière dont un ordinal se situe par rapport à ces trois points, je le classe dans une de ces quatre régions. On peut donc coniserer que ω, ω₁CK et ω₁ sont particulièrement intéressants ; mais c'est surtout parce qu'ils marquent la limite entre des régions différentes des mathématiques :

  1. les entiers naturels intéressent les mathématiciens non logiciens/ensemblistes,
  2. les ordinaux calculables (=constructifs, =récursifs) infinis intéressent essentiellement les logiciens qui font de la théorie de la démonstration, parce qu'ils servent surtout à mesurer/calibrer la force de certaines théories logiques (par exemple, ε₀ mesure en un certain sens la force de l'arithmétique de Peano),
  3. les grands ordinaux dénombrables intéressent la calculabilité supérieure (ou la structure fine de l'univers constructible), le genre de choses que j'ai évoquées dans l'entrée précédente,
  4. les grands cardinaux intéressent les théoriciens des ensembles.

Même si ce n'est pas nécessaire pour comprendre un peu mieux comment ces domaines s'agencent, il est utile que je rappelle ce que j'ai déjà évoqué à plusieurs reprises : le fait que des ordinaux de chacun de ces quatre domaines puisse servir à en fabriquer des domaines plus petits :

  • (1→0) Donné un ordinal calculable (plus des machins appelées « séquences fondamentales » qui viennent généralement avec sa construction), il existe des machins appelées « fonctions de la hiérarchie à croissance rapide » et « fonctions de la hiérarchie à croissance lente » (qui coïncident essentiellement si on va assez loin), c'est-à-dire des fonctions ℕ→ℕ qui croissent très vite, et qui peuvent servir à fabriquer des entiers naturels phénoménalement grands, et qui sont, en fait, la seule manière (connue ?) de fabriquer des entiers phénoménalement grands « explicites ».
  • (2→1 ou 3→1) La manière dont on sait fabriquer de très grands ordinaux calculables consiste à utiliser (2) des ordinaux dénombrables « récursivement très grands », ou, en pratique, (3) des grands cardinaux qui sont plus faciles à manier (mais dont on sait qu'en principe ils sont seulement des faire-valoir pour des ordinaux dénombrables récursivement très grands), par un mécanisme qu'on appelle « écrasement ». Très grossièrement parlant, le but est généralement d'analyser une théorie logique, dont l'ordinal dans le domaine (1) va mesurer la force arithmétique tandis que l'ordinal dans le domaine (2) va mesurer la force ensembliste.
  • (2→0 ou 3→0) Si le but est juste de faire de la gogologie, on peut aussi directement définir de grands entiers naturels par des constructions de type « castor affairé généralisé » en passant directement d'un ordinal « récursivement très grands » à un entier naturel. Ces entiers seront encore (beaucoup beaucoup !) plus grands que ceux obtenus en passant par l'étape intermédiaire (1), mais ils sont moins explicites et mathématiquement moins intéressants.
  • (3→2) Beaucoup de propriétés d'ordinaux « récursivement très grands » sont fabriquées selon l'analogue de propriétés de grands cardinaux qui vivent dans le domaine (3).

(Aucune de ces flèches n'est rigoureusement définie : la flèche 3→2 est, que je sache, une simple analogie, la flèche 2→1 est bien définie mais seulement au cas par cas, c'est-à-dire jusqu'à un ordinal <truc> et devient techniquement de plus en plus difficile à définir à mesure qu'on monte, et la flèche 1→0 est définie rigoureusement seulement à condition d'avoir des données supplémentaires accompagnant l'ordinal calculable, à savoir des séquences fondamentales, qui viennent normalement avec la flèche 2→1, et bien sûr elle ne donne pas un entier naturel mais une fonction ℕ→ℕ qu'on peut ensuite évaluer, disons, en 1 000 000 000 si on veut, mais c'est complètement arbitraire.)

Le but de ces remarques est surtout d'expliquer pourquoi on retrouve des mots comme « Mahlo » à plusieurs niveaux, ce qui peut être source de confusion (le plus petit cardinal Mahlo — s'il existe ! — vit dans le domaine (3) et est gigantesquement plus grand que le plus petit ordinal récursivement Mahlo qui vit dans le domaine (2), qui est lui-même gigantesquement plus grand que l'écrasement qu'on peut définir et qui vit dans le domaine (1), et qui peut encore, si on trouve ça amusant, servir à définir des entiers naturels monstrueusement grands, c'est-à-dire des habitants du domaine (0)).

Je peux diviser encore un petit peu chaque domaine (1)–(3), mais les points de coupure deviennent moins évidents : voici un plan possible (où il y a plein de termes qu'il faudrait que je définisse, mais c'est juste pour donner une petite idée de la situation) :

  1. dans le domaine des ordinaux calculables j'ai tendance à trouver que l'ordinal de Bachmann-Howard fournit un point de coupure naturel, i.e. :
    • les ordinaux calculables définissables « par le bas » (par les fonctions de Veblen, qui sont encore vaguement « prédicatives ») : ω, ε₀, φ(ω,0), l'ordinal de Feferman-Schütte, le petit ordinal de Veblen, le grand ordinal de Veblen ;
    • les ordinaux calculables définissables « par le haut » (par des fonctions d'écrasement 2→1, c'est-à-dire des méthodes « imprédicatives ») : l'ordinal de Bachmann-Howard et les écrasements de toutes sortes de grands cardinaux ;
    • et je pourrais ajouter : tout ce qu'il y a à partir de l'ordinal de preuve de l'arithmétique du second ordre (ou peut-être seulement la Π¹₂-compréhension), parce qu'on ne sait pas du tout les rendre explicites à l'heure actuelle (les ordinaux de ce genre sont juste définis par la théorie qu'ils calibrent, par exemple l'ordinal de preuve de ZFC, s'il existe) ;
  2. dans le domaine des grands ordinaux dénombrables, c'est un peu plus confus, je vais avoir tendance à faire plusieurs coupures :
    • les grands ordinaux récursifs jusqu'au premier nonprojectible exclu, qui sont en gros ceux qu'on sait écraser pour l'instant (c'est-à-dire fabriquer une fonction 2→1) : par exemple, l'ordinal de Church-Kleene, le premier récursivement inaccessible, le premier récursivement Mahlo, le premier récursivement faiblement compact (= Π₃-réfléchissant) ;
    • les grands ordinaux récursifs jusqu'à l'ordinal de l'analyse ramifiée exclu, qui sont ceux qu'on peut définir au niveau de l'arithmétique du second ordre (bon, il n'y a pas grand-chose d'intéressant ici) ;
    • les grands ordinaux récursifs jusqu'au premier ordinal stable exclu, qui restent nommables en théorie des ensembles (par exemple, le plus petit ordinal ρ tel que Lρ définisse un modèle de ZFC) ;
    • et le reste, qui est plus ou moins terra incognita ;
  3. enfin, pour ce qui est des grands cardinaux, il y a une séparation naturelle très forte donnée par la compatibilité avec l'univers constructible de Gödel :
    • les cardinaux qui ne sont pas grands (dont ZFC démontre l'existence), comme ω₁=ℵ₁ ;
    • les « petits » grands cardinaux, compatibles avec la constructibilité : cardinaux inaccessibles, Mahlo, faiblement compacts, totalement indescriptibles, ineffables, ω-Erdős, etc. ;
    • les « grands » grands cardinaux : mesurables, supercompacts, gigantesques (voire : incompatibles avec l'axiome du choix : cardinaux Reinhardt) — mais là, de plus en plus, ça devient problématique de les comparer parce que ce qui importe n'est pas leur « taille » mais leur « force » (logique).

(1) Ordinaux calculables (=constructifs, =récursifs)

Qu'est-ce qu'un ordinal calculable ?

Je laisse de côté les entiers naturels sur lesquels je n'ai rien d'intéressant à dire : disons juste que 0 est un ordinal remarquable parce que c'est le seul qui ne soit ni limite ni successeur, et que 1, en tant que premier ordinal successeur, est aussi remarquable, et du point de vue des ordinaux on peut considérer que ce sont les seuls entiers naturels intéressants (d'où il découle que 2 est un ordinal intéressant puisque c'est le premier ordinal inintéressant, ha, ha, ha).

Un ordinal calculable, dit aussi indifféremment constructif ou récursif, est un ordinal α qu'on peut réaliser informatiquement : c'est-à-dire qu'on peut écrire un programme (pour un ordinateur ordinaire idéalisé, i.e., une machine de Turing) qui est capable de « manipuler » les ordinaux <α (ce qui importe est de pouvoir les comparer, mais sans changer la notion d'ordinal calculable on peut aussi demander que le programme soit capable de calculer les opérations, disons, d'addition, multiplication et puissance). Autrement dit, on peut représenter les ordinaux <α par une donnée informatique (forcément finie, et qu'on peut coder par un entier naturel si on veut) de manière qu'il soit algorithmiquement faisable de tester les représentations valables et de comparer les ordinaux représentés (et, si on veut, faire des opérations diverses dessus). Ce système informatique s'appelle un système de notations ordinales (sous-entendu : calculable) de taille α, et un ordinal calculable est donc un ordinal admettant un système de notations ordinales.

Pour être tout à fait précis, un ordinal α — forcément dénombrable — est dit calculable lorsqu'il existe une partie de ℕ (qu'on appellera les représentations d'ordinaux) qui soit calculable (i.e., le programme est capable de décider, à coup sûr en temps fini, si un élément proposé appartient à cette partie, i.e., est une représentation valable) et une relation d'ordre sur cette partie qui soit également calculable et qui soit une relation de bon ordre d'ordinal α. C'est la donnée de cette partie et de cette relation d'ordre (toutes deux calculables) qui s'appelle un système de notations ordinales.

Par exemple, ω est calculable parce que les entiers naturels sont manipulables informatiquement. De façon moins triviale, ω² est calculable parce qu'on peut utiliser informatiquement un couple (m,n) d'entiers naturels pour représenter ω·m+n, et que la comparaison se fait par l'ordre lexicographique (ω·m+n < ω·m′+n′ si et seulement si m<m′ ou bien [m=m′ et n<n′]). En fait, ε₀ est calculable parce qu'on peut utiliser la forme normale de Cantor itérée (= écriture en « base ω » dont les exposants sont eux-mêmes notés en « base ω » et ainsi de suite) pour représenter et manipuler les ordinaux <ε₀.

Il est à peu près trivial qu'un ordinal plus petit qu'un ordinal calculable est lui-même calculable, et comme il n'est certainement pas possible que tous les ordinaux soient calculables, ni même tous les ordinaux dénombrables (parce qu'il y a ℵ₁ ordinaux dénombrables, presque par définition de ℵ₁, et ℵ₀ programmes possibles pouvant représenter un ordinal calculable), il existe un plus petit ordinal non calculable, tout ordinal strictement plus petit est calculable et tout ordinal à partir de lui ne l'est pas. Ce plus petit ordinal non calculable s'appelle l'ordinal de Church-Kleene et est noté ω₁CK.

L'idée générale est que, si tout ordinal <ω₁CK est calculable, plus il est grand plus la représentation est difficile à trouver, et surtout, plus il est difficile de se convaincre qu'elle est « correcte ». En fait, il existe un système « universel » qui représente tous les ordinaux <ω₁CK, appelé le 𝓞 de Kleene, mais (forcément !) il lui manque quelque chose pour être un système de notations ordinales : en fait, c'est que, si on peut comparer deux éléments du système universel en question, en revanche, on ne peut savoir ce qui est un élément valable ou un « faux », et on ne peut pas le savoir dans un sens très fort (même une machine hyperarithmétique ne peut pas — alors qu'elles sont beaucoup plus puissantes que les machines de Turing). Le problème est donc de déterminer, au sein de ce système universel, quels sont les « vrais » ordinaux.

Le lien avec la force logique de théories

Considérons d'une part une théorie mathématique T permettant de démontrer certains énoncés arithmétiques (je renvoie au tout début de cette entrée pour un rappel de ce que signifie arithmétique ici, mais disons juste que c'est un énoncé portant sur les entiers naturels — par opposition, disons, aux ensembles), et d'autre part un système de notations ordinales représentant [les ordinaux plus petits qu']un certain ordinal calculable α, c'est-à-dire, codant les ordinaux <α comme des entiers naturels. Je rappelle qu'une propriété importante des ordinaux est l'induction transfinie : si dès que tous les ordinaux <β ont une certaine propriété P alors β l'a aussi, alors tous les ordinaux ont cette propriété P ; cela revient essentiellement à dire que tout ensemble non vide d'ordinaux a un plus petit élément, ou que toute suite strictement décroissante d'ordinaux est finie (i.e., termine en temps fini). A priori, l'induction transfinie est une propriété ensembliste, mais dès lors qu'on a un système de notations ordinales représentant [les ordinaux plus petits que] α, cela devient quelque chose de plus arithmétique : il s'agit de dire que dès toutes les notations plus petites [au sens de l'ordinal dénoté] que β ont une certaine propriété P alors β l'a aussi, alors toutes les notations ont cette propriété P. Dans ces conditions, on peut se demander si la théorie T démontre ou non cette affirmation (de récurrence transfinie sur le système de notations), i.e., si elle est assez puissante pour cela.

Bon, il y a toutes sortes de subtilités que je veux passer sous silence : par exemple, la notion de propriété P fait que l'affirmation n'est pas tout à fait arithmétique (elle est analytique Π¹₁, c'est-à-dire qu'elle a une unique quantification universelle sur les propriétés P des entiers naturels devant un énoncé arithmétique), mais il y a toutes sortes de moyens de faire comme si (par exemple, se limiter à des propriétés P d'une certaine complexité arithmétique). Qu'on me permette donc un peu d'imprécision et de dire que, grosso modo, l'ordinal de preuve (proof-theoretic ordinal, je ne sais pas dire ça en français alors j'improvise) de la théorie T est la borne supérieure des ordinaux α tels que la théorie T prouve l'induction transfinie pour un certain système de notations pour α.

De façon plus imagée, l'ordinal de preuve de T est le plus petit ordinal α tel que T ne soit pas assez forte pour « comprendre » α au sens de démontrer qu'un certain système de notations ordinales pour α se comporte bien (vérifie l'induction transfinie, i.e., définit bien un ordinal).

(Comme je disais, il y a en fait toutes sortes de subtilités, donc toutes sortes d'ordinaux qu'on peut associer à une théorie. Il se trouve que, dans la pratique, pour les théories T auxquelles on s'intéresse, ces ordinaux coïncident.)

L'exemple le plus célèbre est l'arithmétique de Peano [du premier ordre], PA, dont l'ordinal de preuve est ε₀ : on peut définir, dans l'arithmétique de Peano, la notation pour les ordinaux <ε₀ par forme normale de Cantor itérée, on peut y prouver qu'elle constitue un ordre total, mais montrer que c'est un bon ordre, c'est-à-dire montrer l'induction transfinie, n'est pas possible dans ce système. En fait, ce n'est pas possible parce que l'induction transfinie sur ε₀ permet de démontrer la consistance de PA, et Gödel interdit que PA puisse faire ça : c'est ce résultat, dû à Gentzen en 1936, qui a lancé la théorie de la démonstration et de l'analyse ordinale (c'est-à-dire de l'utilisation d'ordinaux pour mesurer la force de systèmes logiques). Intuitivement, si on veut bien croire que ε₀ est un ordinal, alors on croit que PA est consistant.

(Le résultat de Gentzen a été mis sous forme un peu ludique sous la forme du jeu de l'hydre de Kirby-Paris : croire que ε₀ existe signifie en gros croire que le jeu termine toujours en temps fini.)

L'analyse ordinale d'une théorie T consiste essentiellement à :

  • trouver un ordinal (calculable !) α et un système (calculable !) de notations ordinales « explicite » représentant [les ordinaux plus petits que] α,
  • tel que T prouve l'induction transfinie jusqu'à n'importe quelle notation (β<α) dans le système, mais pas pour α lui-même,
  • et si possible de sorte que (au-dessus d'une théorie T₀ très faible) les conséquences arithmétiques de T soient les mêmes que les conséquences arithmétiques de pour tout β<α [dans le système de notations ordinales décrit], l'induction transfinie vaut jusqu'à β.

Cette troisième partie nous dit que l'ordinal α mesure précisément la force arithmétique de la théorie T : non seulement cette dernière prouve l'induction transfinie jusqu'à tout β<α mais pas α, mais en plus, a contrario, si on suppose l'induction transfinie jusqu'à tout β<α alors on obtient tout ce que T démontre comme énoncés arithmétiques. C'est assez remarquable, mais il s'avère que c'est possible en pratique : on ne sait pas vraiment pourquoi, mais les théories mathématiques s'ordonnent bien par leurs conséquences arithmétiques.

(Enfin, de nouveau, j'ai glissé de la poussière sous le tapis. Si vous voulez un survey écrit par quelqu'un qui s'y connaît vraiment et pas quelqu'un comme moi qui fait mal semblant, voyez le papier The Realm of Ordinal Analysis de Michael Rathjen.)

Les théories T concernées peuvent être de plusieurs sortes : cela peut être des théories des ensembles faibles (c'est-à-dire des choses plus faibles que ZFC, dont un exemple typique est la théorie des ensembles de Kripke-Platek) ou des sous-ensembles de l'arithmétique de Peano du second ordre PA² (qui permet, en gros, de parler d'entiers naturels et de propriétés/ensembles d'entiers naturels, y compris de quantifier sur ces derniers) ; cela peut aussi être, quitte à être plus précis dans la définition de l'ordinal de preuve, des choses plus constructives, comme des extensions de la théorie des types de Martin-Löf ou des théories des ensembles en logiquie intuitionniste (voyez par exemple ici pour un survol).

Mais mon but n'est pas de parler de la théorie de la démonstration, juste d'expliquer comment elle se retrouve liée avec les grands ordinaux calculables : l'idée à retenir est donc que

  • la théorie de la démonstration est à la fois demandeuse et productrice de grands ordinaux calculables, comme ordinaux de preuves de théories naturelles,
  • pour des théories « suffisamment faibles » (comme l'arithmétique de Peano du premier ordre ou la théorie des ensembles de Kripke-Platek enrichie de divers axiomes d'infinis), on a une analyse ordinale, c'est-à-dire qu'on dispose d'une description vraiment explicite de l'ordinal de preuve en question (comme « écrasement » d'un grand cardinal / grand ordinal dénombrable) et cette description éclaire la théorie analysée en même temps que l'ordinal lui-même,
  • tandis que pour des théories trop fortes (comme l'arithmétique de Peano du second ordre ou a fortiori ZFC), l'ordinal de preuve reste quelque chose de complètement abstrait.

Petits ordinaux calculables et fonctions de Veblen

Pour les ordinaux jusqu'à ε₀, on a une notation tout à fait explicite par la forme normale de Cantor itérée (je rappelle que la forme normale de Cantor est juste l'écriture en base ω de l'ordinal, et itérée signifie qu'on recommence avec les exposants de l'écriture, et ainsi de suite, et sur les ordinaux <ε₀ le processus termine, c'est quasiment la définition de ε₀ qui est le plus petit ordinal ε tel que εε ; voir ici pour des explications plus détaillées). Si on veut voir ça comme un type informatique, on va dire qu'une « notation <ε₀ » est quelque chose de la forme ωγr·nr + ⋯ + ωγ1·n1, où γr>⋯>γ1 sont des « notations <ε₀ » (préalablement définies) et n1,…,nr des entiers naturels non nuls (et la somme vide est autorisée et supposée désigner l'ordinal 0) ; la comparaison des notations se définit alors, de façon récursive assez simple (commencer par comparer le plus grand exposant, puis son coefficient, et continuer ainsi lexicographiquement) : c'est assez simple à programmer, c'est d'ailleurs un bon exercice pour voir si on a compris le schmilblick, en tout cas, ε₀ est bien un ordinal calculable. Cet ordinal ε₀ mesure précisément la force de l'arithmétique de Peano du premier ordre.

Si on veut noter les ordinaux jusqu'à ε₁ (la solution suivante de εε), on peut utiliser l'écriture en forme normale de Cantor itérée à la seule exception du fait que ε₀ se note par un symbole spécial (i.e., une « notation <ε₁ » est soit le symbole spécial ε₀ soit quelque chose défini par forme normale de Cantor dont les exposants sont des notations <ε₁ et différentes du seul symbole spécial ε₀) : ça reste facile de programmer les comparaisons (on applique le même algorithme que pour les notations <ε₀, à ceci près que si on doit comparer ε₀ à une notation écrite sous forme normale de Cantor, on remplace ε₀ par ωε₀ et on recommence). Le même procédé fonctionne encore pour les ordinaux jusqu'à ε₂ (on ajoute un symbole spécial ε₁, et la règle spéciale que ε₀<ε₁) ou un nombre fini quelconque de ε, c'est-à-dire jusqu'à εω.

Mais du coup, il n'y a pas de raison de s'arrêter là. Définissons un type informatique « notation <ζ₀ » comme suit : une « notation <ζ₀ » est soit une forme normale de Cantor ωγr·nr + ⋯ + ωγ1·n1, où γr>⋯>γ1 sont des notations <ζ₀ (préalablement définies) et qui ne sont pas un ει et n1,…,nr des entiers naturels non nuls (et la somme vide est autorisée et supposée désigner l'ordinal 0), soit un symbole ειι est une notation <ζ₀ (préalablement définie) ; et la comparaison entre deux notations <ζ₀ se fait (récursivement) soit en comparant les indices ι si elles sont toutes deux de la forme ει, soit en les comparant selon la règle lexicographique sur les formes normales de Cantor (quitte à réécrire ει comme ωει pour transformer un ει en forme normale de Cantor). C'est un tout petit peu fastidieux à cause de cette double écriture ει et ωει (il faut choisir la première pour normaliser et éventuellement convertir à l'autre pour comparer), mais il n'y a vraiment aucune difficulté informatique. Si vous voulez voir du vrai code, voyez ce que j'avais fait ici et regardez le source JavaScript, qui est censé être vaguement lisible, il suit exactement ce que je viens de décrire.

La notation ζ₀ est pourrie, bien sûr, et personne ne l'utilise. Écrivons plutôt : φ(0,γ) pour ωγ, puis φ(1,γ) pour εγ, et φ(2,0) pour l'ordinal ζ₀ décrit par le système de notations du paragraphe précédent, qui est le plus petit ordinal ζ vérifiant εζ=ζ. Vous devinez bien sûr comment ça continue : je peux introduire une notation spéciale pour l'ordinal φ(2,0)=ζ₀ (sachant qu'on n'a pas le droit d'écrire εζ₀ puisque c'est ζ₀, ni ωζ₀ puisque c'est aussi ζ₀), ce qui me permet de monter jusqu'au point fixe suivant φ(2,1)=ζ₁ de la fonction ε ; en étendant ça à un mécanisme systématique pour les φ(2,ι)=ζι comme j'ai fait pour les ε, cela permet de monter jusqu'à un ordinal qu'on a envie de noter φ(3,0) pour ne pas avoir à chercher la lettre de l'alphabet grec suivant ζ. En suivant ce procédé de nouveau, on construit des notations pour les ordinaux φ(k,0), où φ(k+1,ι) est le ι-ième point fixe de la fonction γ↦φ(k,γ). Si vous avez compris le principe, félicitations, vous avez compris l'ordinal φ(ω,0) obtenu en mettant ensemble toutes ces notations : cet ordinal est assez important puisque c'est le plus petit après ω qui soit « primitivement récursivement clos ». (Il y a certainement des théories logiques assez naturelles ayant φ(ω,0) comme ordinal de preuve, mais je n'y connais pas assez pour essayer d'en décrire.)

La fonction φ que je définis au fur et à mesure s'appelle la fonction de Veblen. Définir φ(ω,ι) est un tout petit peu plus compliqué, parce qu'il n'y a pas un niveau précédent dont on peut simplement reprendre les points fixes : ce qu'on va dire est que φ(ω,ι) est le ι-ième point fixe commun à toutes les fonctions γ↦φ(k,γ) pour k<ω, et plus généralement, on définit φ(μ,ι) comme le ι-ième point fixe commun à toutes les fonctions γ↦φ(ν,γ) pour ν<μ. L'ensemble de tous les ordinaux qu'on peut écrire avec cette fonction (de deux variables !) s'appelle l'ordinal de Feferman-Schütte Γ₀ ; il est tout à fait possible d'utiliser φ(μ,ι) pour donner un système de notations ordinales explicite pour les ordinaux <Γ₀, mais cela devient un petit peu plus compliqué : si on se rappelle que précédemment on devait choisir des écritures normalisées (interdire d'écrire ωει parce que c'est ει, ou interdire d'écrire φ(,φ(k,γ)) si <k parce que c'est φ(k,γ)), ici on veut interdire d'écrire φ(ν,φ(μ,γ)) si ν<μ parce que c'est φ(μ,γ), mais le fait de pouvoir tester ν<μ demande déjà de disposer des notations, bref, on a une définition encore plus récursive à faire, dont je crois que la clé est l'affirmation suivante :

φ(μ,γ)<φ(μ′,γ′) a lieu si et seulement si l'une des affirmations suivantes vaut :

  • μ=μ′ et γ<γ′,
  • ou bien μ<μ′ et γ<φ(μ′,γ′),
  • ou bien μ>μ′ et φ(μ,γ)<γ′.

(Ou, ce qui revient au même, pour comparer φ(μ,γ) et φ(μ′,γ′), on commence par trouver le minimum μ₀ de μ et μ′, puis on réécrit chacun des deux comme φ(μ₀,qqch) en se rappelant que φ(μ,γ)=φ(μ₀,φ(μ,γ)) lorsque μ₀<μ, et il n'y a alors qu'à appliquer le premier cas, qui est trivial.)

Certains ont émis l'opinion que l'ordinal Γ₀ est extrêmement important parce qu'il définit la limite de la prédicativité (très très très grossièrement, la prédicativité est la capacité à définir quelque chose à partir de choses plus petites). C'est quelque chose qui ne me convainc pas du tout. Mais il est indéniable que Γ₀ est l'ordinal de preuve d'une théorie relativement importante.

La notation Γ₀ est pourrie, bien sûr, et malheureusement des gens l'utilisent quand même. Écrivons plutôt φ(1,0,0) pour Γ₀ et plus généralement φ(1,0,ι) (ou Γι) pour le ι-ième point fixe de toutes les fonctions γ↦φ(γ,0). Attention !, car si on a φ(Γ₀,0)=Γ₀, en revanche, φ(Γ₀,1) est strictement supérieur car la fonction φ(Γ₀,—) est strictement croissante (mais φ(Γ₀,1) est quand même inférieur à Γ₁ puisque Γ₁=φ(Γ₁,0)=φ(Γ₀,φ(Γ₁,0))>φ(Γ₀,1)). Plus généralement, convenons que φ(0,…,0,truc)=φ(truc) et que pour tout μ>0 on définit φ(machin,μ,0,…,0,ι) comme le ι-ième point fixe commun à toutes les fonctions γ↦φ(machin,ν,γ,0,…,0) pour ν<μ (ici, truc et machin sont des suites finies quelconques d'ordinaux, et dans la deuxième partie, la suite 0,…,0 a la même longueur des deux côtés). Ainsi, φ(1,1,ι) est le ι-ième point fixe de γ↦φ(1,0,γ) et φ(2,0,ι) est le ι-ième point fixe de γ↦φ(1,γ,0). (L'ordinal φ(1,0,0,0) s'appelle parfois ordinal d'Ackermann, mais il n'a aucun intérêt particulier, c'est juste une sorte d'erreur historique.)

Il s'agit là des fonctions de Veblen d'un nombre fini de variables. Le plus petit ordinal δ stable par toutes ces fonctions (au sens où : si tous les arguments — en nombre fini — d'une fonction φ sont tous strictement inférieurs à δ, alors le résultat est encore strictement inférieur à δ), qui est la limite de φ(1,0), φ(1,0,0), φ(1,0,0,0), etc., s'appelle petit ordinal de Veblen. Il présente un intérêt, notamment en lien avec le théorème de Kruskal sur les arbres (grosso modo, et modulo plein d'erreurs et approximations possibles de ma part, le petit ordinal de Veblen mesure la force d'une théorie pouvant prouver le théorème en question ; pour une affirmation moins vague, voir les références données ici). On peut utiliser les fonctions de Veblen d'un nombre fini de variables pour définir un système de notations ordinales pour le petit ordinal de Veblen un peu comme je l'ai esquissé pour l'ordinal de Feferman-Schütte : je ne crois pas qu'il y ait de difficulté majeure, même s'il y a sans doute des petits trucs pénibles (regarder la manière dont j'ai comparé φ(Γ₀,1) à Γ₀ et Γ₁ ci-dessus pour se faire une idée).

On se doute bien que je ne vais pas en rester là. La définition des fonctions de Veblen s'étend à un nombre transfini de variables : plus exactement, c'est-à-dire qu'on peut définir φ sur n'importe quelle fonction des ordinaux vers les ordinaux dont seulement un nombre fini de valeurs sont non nulles (la fonction correspondant à l'association d'une valeur à un emplacement). Par exemple, φ(k↦1), ce qui signifie φ appliqué à un 1 au k-ième emplacement et des 0 partout ailleurs vaut ce qu'on a appelé précédemment φ(1,0,…,0) où le 1 est à l'emplacement k compté à partir de la fin (le dernier emplacement étant numéroté 0), tandis que φ(1,1,0) s'écrirait φ(2↦1, 1↦1). L'ordinal φ(ω↦1) sera le petit ordinal de Veblen. La définition est que φ(machin, τμ, 0↦ι), où τ est au premier emplacement >0 à porter une valeur non nulle, est le ι-ième point fixe commun à toutes les fonctions γ ↦ φ(machin, τν, ργ) pour ν<μ et ρ<τ : c'est un peu compliqué à dire, mais c'est assez naturel, et je crois que ça ne change essentiellement rien à la difficulté d'écrire un système de notations ordinales. Pour comparer ξ:=φ(τγτ) à ξ′:=φ(τγτ), on commence par trouver le plus grand τ₀ tel que γτ et γτ diffèrent : si γτ est le plus grand, on réécrit φ(τγτ) en remplaçant la valeur à l'emplacement τ₀ par γτ, et en mettant ξ′ lui-même à l'emplacement τ₀ suivant où γτ n'est pas nul. Je ne rentre pas dans les détails, mais il n'y a pas de difficulté majeure.

L'ordinal qu'on peut atteindre avec ce système, c'est-à-dire le plus petit ordinal δ stable par toutes ces fonctions (au sens où : si toutes les valeurs non nulles — en nombre fini —, et tous les emplacements où elles se trouvent, d'une fonction φ sont tous strictement inférieurs à δ, alors le résultat est encore strictement inférieur à δ), qui est la limite de φ(ω↦1), φ(φ(ω↦1)↦1), φ(φ(φ(ω↦1)↦1)↦1), etc., s'appelle grand ordinal de Veblen.

Pour construire des ordinaux substantiellement plus grands que ça, il faut changer d'approche (et selon mon avis, c'est là qu'on perd la « prédicativité »).

L'idée générale des fonctions d'écrasement

Je commence par présenter un peu les choses de façon très informelle, par expliquer ce qu'on cherche à faire en introduisant une fonction d'écrasement ψ, et comment elle peut aider à noter de grands ordinaux.

Il faut que j'avertisse qu'il y a toutes sortes de variantes possibles sur les fonctions d'écrasement : celle que j'évoque ici diffère de façon peu importante de celle que j'ai introduite dans l'article Wikipédia que j'ai écrit sur le sujet, mais il y a des différences plus importantes dans la manière dont les choses sont faites dans les vraies fonctions d'écrasement servant dans la littérature mathématique (en gros, il y a le choix entre rendre la fonction croissante ou ce que j'ai tendance à appeler « décoincée », et si je trouve la version monotone plus facile à comprendre en première approche, la version décoincée marche mieux quand on veut aller loin).

On a vu que les points fixes, les énumérations et les itérations de points fixes jouent un rôle important dans la fabrication d'ordinaux (moralement, parce qu'un point fixe signifie qu'un procédé qu'on croit avoir trouvé pour fabriquer des ordinaux plus grands cesse d'en produire, il n'arrive pas à dépasser un certain point). On part typiquement de la fonction (qu'on pourra noter φ(α), ou ψ(α) au moins pour les petits α) valant α↦ωα, et on considère ses points fixes, les solutions de l'équation ωδ=δ : on a vu qu'on pouvait les noter εα, mais ce n'est pas du tout systématique ; on a aussi vu avec les fonctions de Veblen qu'on pouvait les noter φ(1,α), mais même cette notation-là atteint ses limites. Imaginons une notation de la forme ψ(Ω) pour ε₀, où Ω est pour l'instant un symbole magique voulant dire « point fixe » ; on pourra noter ψ(Ω+1) pour la puissance de ω suivante (c'est-à-dire ε₀·ω = ωε₀+1), et plus généralement ψ(Ω+α) = ε₀·ωα = ωε₀+α (au moins pour les petits α), puis, quand on arrive à ε₁, qui est un nouveau point fixe de α↦ωα, sortir la notation ψ(Ω·2) (« deuxième point fixe » : pour l'instant, Ω est toujours un symbole magique). De façon générale, on notera ψ(Ω·(1+α))=εα (au moins pour des petits α) ; le petit décalage de 1 n'est pas bien grave. Quand cette fonction arrive elle-même à un point fixe, on peut écrire ψ(Ω²), c'est ce qui a précédemment été noté φ(2,0) ou ζ₀. De même, ψω) correspondra à φ(ω,0), et plus généralement ψα) à φ(α,0) (pour des petits α), le α-ième niveau de point fixe, ou la α-ième lettre de l'alphabet grec transfini après ε₀ et ζ₀. L'ordinal de Feferman-Schütte, lui, que ci-dessus j'ai noté Γ₀, ou φ(1,0,0) avec les fonctions de Veblen de plusieurs variables, sera ψΩ), où cette fois le Ω en exposant signifie qu'on cherche un point fixe de la fonction ψα).

Bref, le type de notation que je cherche à introduire est le suivant : on introduit une certaine fonction ψ dont l'argument peut faire intervenir un symbole magique Ω, et ce symbole veut dire quelque chose comme faire un point fixe de la fonction ψ où le dernier symbole Ω est remplacé par une variable ; bref, Ω est une sorte d'« opérateur de point fixe » qui généralise de façon systématique ce qu'on essayait de faire dans les fonctions de Veblen. (Je rappelle que pour l'instant je ne décris les choses que de façon très informelle.) L'avantage est que si on autorise une notation semblable à la forme normale de Cantor itérée mais en base Ω au lieu de ω, on fabrique vite des points fixes très compliqués : le petit ordinal de Veblen est ψΩω) (de façon générale, φ(α↦1) s'écrira ψΩα), au moins pour des petits α) et le grand est ψΩΩ), mais il n'y a cette fois-ci aucun obstacle qui interdise d'empiler les Ω (chacun correspondant à tout un niveau de complexité dans le jeu d'itérations de points fixes !) et de fabriquer ψΩΩΩ) et ainsi de suite jusqu'à une limite qui s'appelle l'ordinal de Bachmann-Howard, ψΩ+1).

Pour essayer de rendre ce système un peu rigoureux, il faut commencer par donner un sens à Ω : on pourrait se contenter de dire que c'est un symbole, mais manifestement on veut pouvoir faire des opérations dessus, donc pour éviter de tout faire de façon ad hoc, il faut bien que ce soit un ordinal. Quel ordinal ? Ce qui importe essentiellement est qu'il soit beaucoup plus grand (et, en fait, beaucoup plus stable) que tous les ordinaux qu'on va fabriquer avec le procédé qu'on est en train de construire : par exemple, ψ(Ω+ψ(Ω)) désigne (ε₀)² et est beaucoup plus petit que ψ(Ω·2), ce qui suggère que Ω doit être largement plus gros que ψ(Ω), i.e., notre fonction ψ a plutôt tendance à « écraser » les ordinaux.

Bref, l'idée de notre approche est la suivante : on commence à définir une fonction modeste (dans l'exemple que j'ai choisi, ψ(α) vaut ωα au début), et dès que cette fonction commence à ne plus rien produire d'intéressant parce qu'elle bute contre un point fixe, on fait appel à un ordinal Ω supposé largement plus grand que tout ce qu'on risque de fabriquer. Il y a, bien sûr, plein d'ordinaux qu'on a raté entre temps, mais ce n'est pas grave, on ne cherche pas à étudier Ω, on l'introduit juste pour décoincer les notations quand elles sont coincées : la valeur ψ(Ω) est donc « l'ordinal sur lequel les notations ψ(α) sont restées coincées » (et la fonction ψ sera non définie entre ψ(Ω) inclus et exclu Ω — c'est-à-dire sur toutes les valeurs qu'on a omises — ou bien constante de valeur ψ(Ω) si on préfère).

C'est cette idée bizarre de faire appel à des ordinaux encore plus grands pour définir des ordinaux plus modestes qui explique le nom général de fonction d'écrasement (ordinal collapsing function).

Une définition de l'ordinal de Bachmann-Howard

Pour définir les choses rigoureusement, on considère normalement que Ω désigne le premier ordinal indénombrable ω₁=ℵ₁ (parce qu'il est garanti qu'on ne fabriquera que des choses dénombrables, donc il est forcément supérieur à toute valeur de la fonction ψ). En fait, on peut se contenter de bien moins, à savoir le premier ordinal non-calculable ω₁CK. La définition avec le premier indénombrable est moins technique, mais celle avec le premier ordinal non-récursif est plus économique du point de vue logique. Au niveau où je me place, de toute façon, ces subtilités sont sans importance : ce qui importe est que Ω est très très grand, et qu'entre autres ωΩ=Ω et encore bien plus (notamment Ω est stable par toutes les fonctions de Veblen).

Comment définir ψ rigoureusement ? Il y a toutes sortes de variations, mais voici une définition qui produit les valeurs que j'ai annoncées :

Pour définir ψ(α) en supposant (par induction) ψ(β) connu pour tout β<α : on définit ψ(α) comme le plus petit ordinal qui ne peut pas être atteint à partir de 0 au moyen des opérations d'addition, d'application de ψ|α (c'est-à-dire ψ limité aux valeurs <α) et de la fonction (γ,ξ)↦Ωγ·ξ pour γ>0.

Essayons d'expliquer ce que ça signifie.

D'abord je veux calculer ψ(0) : ma définition me dit que c'est le plus petit ordinal qui ne peut pas être atteint à partir de 0 par des additions, la fonction ψ restreinte à l'ensemble vide et la fonction (γ,ξ)↦Ωγ·ξ restreinte aux couples (γ,ξ) avec γ>0 : il n'y a pas à chercher beaucoup pour se rendre compte qu'on ne peut pas quitter 0 avec ces opérations, donc le plus petit ordinal qui n'est pas atteignable est 1, si bien que ψ(0)=1. Ensuite on cherche à calculer ψ(1) : cette fois-ci, on a le droit d'appliquer ψ(0)=1 et les additions, donc on peut produire tous les entiers naturels ; on peut aussi appliquer la fonction (γ,ξ)↦Ωγ·ξ aux entiers naturels, donc produire Ω, Ω², Ω³, et aussi les sommes de ces choses-là, donc par exemple Ω²+Ω·42, ou encore plusieurs exponentiations de base Ω, donc par exemple ΩΩ, etc. — mais tout ceci ne nous concerne pas vraiment, ce qui importe est le plus petit ordinal qu'on n'atteint pas, et c'est ω, donc ψ(1)=ω. Pour calculer ψ(2), de même, on a le droit à 1 et ω, aux additions, et à la fonction (γ,ξ)↦Ωγ·ξ, donc et on se convainc rapidement qu'on peut essentiellement produire les ω·p+q avec p et q entiers, plus plein de choses impliquant Ω mais qui ne nous concernent pas pour l'instant, et le minimum inatteignable est ω². Le même type de raisonnement montre que ψ(α)=ωα pour toutes les petites valeurs de α. Jusqu'à quand continue-t-il à être valable ? Il l'est, essentiellement, tant qu'on peut approcher α par des valeurs plus petites en appliquant α↦ωα un nombre fini de fois, autrement dit, tant que α<ε₀.

En revanche, à partir de ε₀, la valeur de ψ cesse de grandir (au moins pour la fonction telle que je l'ai définie ci-dessus : d'autres variantes donneraient une fonction qui n'est plus définie, ou encore des choses différentes) : en effet, ε₀ n'est pas atteignable à partir de 0 au moyen des opérations d'addition, d'application de ψ|ε₀:α↦ωα (et de la fonction (γ,ξ)↦Ωγ·ξ qui, à ce stade-là, continue à ne servir à rien). La fonction est « coincée ». Ceci est vrai jusqu'à ψ(Ω)=ε₀. Mais là, il se produit quelque chose d'un peu miraculeux, qui justifie l'intérêt de notre construction, c'est que ψ(Ω+1) se « débloque » : en effet, parmi les ordinaux qu'on peut fabriquer à partir de 0 en appliquant les opérations d'addition, d'application de ψ|Ω et de la fonction (γ,ξ)↦Ωγ·ξ, il y a, cette fois, ε₀, puisque c'est, justement, ψ(Ω) (et que Ω lui-même s'obtient comme Ω1·1, et 1 comme ψ(0)), et du coup tous les multiples entiers de ε₀, et le premier ordinal qu'on ne peut pas atteindre est, maintenant, ε₀·ω=ωε₀+1. Plus généralement, on a ψ(Ω+α) = ε₀·ωα = ωε₀+α tant que α<ε₁, où la fonction ψ se retrouve de nouveau coincée : on a ψ(Ω·2)=ε₁, mais pour la même raison que précédemment, la valeur suivante la « débloque » et ψ(Ω·2+1)=ε₁·ω. On a ainsi ψ(Ω·(1+α))=εα pour tout α<ζ₀, après quoi la fonction est de nouveau bloquée, et on a ψ(Ω²)=ζ₀=φ(2,0).

Je ne vais pas refaire l'explication pour chaque valeur que j'ai déjà annoncée plus haut, mais l'idée générale est qu'à chaque fois que la fonction ψ se retrouve coincée parce qu'elle bute contre un point fixe, cette valeur peut être écrite comme l'image d'une expression faisant intervenir Ω, et ce fait permet de « débloquer » la fonction ψ. C'est ce qui explique que Ω se comporte comme un symbole signifiant point fixe. À titre d'exemple :

  • ψ(Ω) est la limite de 0, ψ(0), ψ(ψ(0)), ψ(ψ(ψ(0))), etc.
  • ψ(Ω·2) est la limite de ψ(Ω), ψ(Ω+ψ(Ω)), ψ(Ω+ψ(Ω+ψ(Ω))), etc.
  • ψ(Ω²) est la limite de ψ(Ω), ψ(Ω·ψ(Ω)), ψ(Ω·ψ(Ω·ψ(Ω))), etc.
  • ψΩ) est la limite de ψ(Ω), ψψ(Ω)), ψψψ(Ω))), etc.

Il est aussi important de souligner que Ω devient en quelque sort « de plus en plus grand » à chaque fois qu'on fait appel à lui, puisqu'il tient lieu de « quelque chose de bien plus grand que tout ce qu'on a construit jusqu'ici » : par exemple, ψ(Ω) se contente d'être supérieur à tous les ψ(α) seulement pour les α qu'on peut fabriquer à partir de 0 en itérant l'addition et la fonction ψ, donc pour α<ψ(Ω)=ε₀ ; en revanche, déjà ψ(Ω·2) doit dépasser ψ(Ω+α) à la fois pour ces α-là, mais aussi pour les α comme ψ(Ω) qui ont été fabriqués à l'étape précédente. Donc chaque appel à Ω est plus riche et plus complexe que le précédent !

Jusqu'où peut-on aller comme ça ? On voit aisément que ce qui nous limite est l'empilement des puissances de Ω : si on considère la limite de 1, Ω, ΩΩ, ΩΩΩ, ΩΩΩΩ, etc. — qui vaut εΩ+1 (puisque εΩ=Ω et que ΩΩαΩα dès que α est infini), la fonction ψ se retrouve bloquée à la limite de ψ(1), ψ(Ω), ψΩ), ψΩΩ), etc., et il n'y a plus rien pour la débloquer : cette limite, comme je l'ai dit, s'appelle l'ordinal de Bachmann-Howard, ψΩ+1), et c'est la puissance de la fonction d'écrasement que j'ai définie.

Mais la fonction d'écrasement ψ ne fait pas que définir l'ordinal de Bachmann-Howard, elle permet de le comprendre, c'est-à-dire, de le construire : elle définit un système de notations pour les ordinaux plus petits que lui, qui permet de les désigner et de les comparer. À la limite, on pourra oublier complètement la définition de la fonction ψ et traiter les notations ordinales qu'elle définit comme la définition de l'ordinal de Bachmann-Howard.

Pour définir ce système de notations, on commence par définir les arguments « non bloqués » de la fonction ψ, qui sont les arguments α pour lesquels ψ(α+1)>ψ(α), ou, de façon équivalente, tels que α soit le plus grand argument possible pour lequel ψ prenne la valeur en question. Par exemple, Ω est un argument non bloquée de ψ, alors que ε₀, ou n'importe quel ordinal entre ε₀ inclus et Ω exclu, est un argument bloqué, puisque la fonction ψ n'augmente pas entre ε₀ et Ω comme je l'ai expliqué. Ainsi, toute valeur prise par ψ est prise en un et un seul argument non bloqué (à savoir le plus grand pour lequel ψ prend cette valeur).

On définit alors la forme normale (pour ψ) d'un ordinal : c'est essentiellement la façon de l'écrire — si c'est possible — au moyen de la fonction ψ (ainsi que des additions et la fonction ξ↦Ωξ) de sorte que tous les arguments de toutes les fonctions ψ soient non-bloqués ; de façon un peu plus précise, pour obtenir la forme normale d'un ordinal, on l'écrit en base Ω itérée, et chacun des morceaux (qui sont alors <Ω, c'est-à-dire dénombrables) comme somme de valeurs de ψ en des arguments non bloqués, qui sont eux-mêmes écrits sous forme normale. Cette forme normale est unique quand elle existe, et elle existe pour tout ordinal inférieur à l'ordinal de Bachmann-Howard, ainsi que pour certains ordinaux indénombrables (à savoir ceux dont les morceaux de l'écriture en base Ω itérée sont plus petits que l'ordinal de Bachmann-Howard : c'est ce qui sert comme arguments dans les fonctions φ). Concrètement, la manière dont on teste si une expression est une forme normale est de vérifier qu'il s'agit d'une écriture en base Ω itérée dont les morceaux sont des sommes décroissantes de valeurs de ψ appliquées à des formes normales (récursivement) et que chaque argument de ψ est supérieur à tous les arguments de toutes les fonctions ψ qui apparaissent à l'intérieur : par exemple, ψ(ψ(Ω)) ou ψ(ψ(Ω)+1) ou ou ψ(ψ(Ω)·2) ne sont pas des formes normales parce que l'argument (Ω) de la fonction ψ intérieure est supérieur à l'argument (que ce soit ψ(Ω) ou ψ(Ω)+1 ou ψ(Ω)·2). En revanche, les expressions suivantes sont des formes normales d'ordinaux plus petits que l'ordinal de Bachmann-Howard, et écrits dans l'ordre : 1 (que techniquement il faudrait écrire ψ(0), mais admettons que « 1 » est un racourci de langage), 42 (que techniquement il faudrait écrire 1+1+1+⋯+1), ψ(1) (qui n'est autre que ω), ψ(1)+ψ(0), ψ(1)·18 (que techniquement il faudrait écrire ψ(1)+⋯+ψ(1)), ψ(2) (qui vaut ω²), ψ(ψ(1)) (qui vaut ωω), ψ(ψ(ψ(1))) (qui vaut ωωω), ψ(Ω) (qui vaut ε₀), ψ(Ω+1) (qui vaut ε₀·ω), ψ(Ω+ψ(Ω)) (qui vaut ε₀²), ψ(Ω·2) (qui vaut ε₁), ψ(Ω·ψ(Ω)) (soit εε₀), ψ(Ω²) (qui vaut ζ₀), ψψ(Ω)) (qui vaut φ(φ(1,0),0)), ψΩ) (qui vaut Γ₀), ou encore ψΩψΩ)) ou ψΩΩ·ψΩ)Ω²ψ(Ω³)).

Comment comparer deux ordinaux écrits sous forme normale ? C'est trivial : ils sont écrits en base Ω itérée, donc il suffit de comparer lexicographiquement celles-ci, ce qui nous ramène à comparer des sommes décroissantes de valeurs de fonctions ψ, qui sont elles-mêmes comparées lexicographiquement, et enfin on est ramené à comparer des valeurs de fonctions ψ, ce qui se fait en comparant leurs arguments (puisque la fonction ψ est croissante, et même strictement croissante sur les arguments non bloqués). C'est-à-dire concrètement que la seule règle à retenir est que Ω est supérieur à toute valeur de la fonction ψ. À titre d'exemple, ψΩ) est supérieur à ψψψ(Ω))) — en effet, pour les comparer, il s'agit de comparer ΩΩ et Ωψψ(Ω)), ce qui revient à comparer Ω et ψψ(Ω)), et bien sûr Ω est le plus grand. On notera que la vérification de la forme normale utilise elle-même la comparaison (pour vérifier que les arguments des ψ « extérieurs » sont supérieurs à ceux des ψ « intérieurs »).

Quelques idées sur des écrasements plus sophistiqués

L'ordinal de Bachmann-Howard (ψΩ+1) ci-dessus) mesure la puissance d'une certaine théorie appelée théorie des ensembles de Kripke-Platek (avec axiome de l'infini). Je ne vais pas définir exactement cette théorie, mais disons qu'elle a un rapport avec les ordinaux admissibles (une notion que je définis dans mon entrée sur la programmation transfinie), dont le plus petit (après ω) est l'ordinal de Church-Kleene ω₁CK à partir duquel les ordinaux cessent d'être calculables (pour que les choses soient bien claires : ω₁CK est donc beaucoup plus grand que l'ordinal de Bachmann-Howard ou que tous les ordinaux définis dans cette partie !). Il existe un rapport entre l'ordinal de Bachmann-Howard et celui de Church-Kleene, qui peut se présenter de deux manières :

  • L'ordinal de Church-Kleene permet de définir une fonction d'écrasement grâce à laquelle on définit celui (plus petit !) de Bachmann-Howard : en effet, dans la définition que j'ai donnée, j'utilisais pour Ω le premier ordinal indénombrable ω₁, mais en fait, ω₁CK suffit si on est beaucoup plus soigneux dans les définitions (il suffit car ce qui importe de Ω est qu'il soit toujours beaucoup plus grand que tout ce qu'on peut construire, et c'est le cas de ω₁CK car on ne construit que des ordinaux calculables).
  • L'ordinal de Church-Kleene est l'ordinal de Bachmann-Howard sont tous les deux « le plus petit ordinal qui soit hors de portée de la théorie des ensembles de Kripke-Platek », mais dans un sens différent : l'ordinal de Church-Kleene est le plus petit dont KP ne prouve pas l'existence en tant qu'ordinal ensembliste (l'affirmation ω₁CK existe, i.e., il existe un ordinal admissible >ω, n'est pas démontrable dans KP un peu de la manière dont l'existence d'un cardinal inaccessible est indémontrable dans ZFC : en gros, la raison est que cet ordinal « suffit » pour constituer la classe de tous les ordinaux d'un modèle de KP), tandis que l'ordinal de Bachmann-Howard est le plus petit sur lequel KP ne prouve pas l'induction transfinie lorsqu'il est réalisé comme un ordinal calculable (par un système de notations ordinales explicites, à savoir celui que j'ai esquissé plus haut ; accessoirement, on peut aussi en déduire un petit jeu d'hydre comme on pouvait le faire pour ε₀, qui est une sorte de traduction ludique du système de notations).

Ce phénomène est général : très grossièrement parlant (vraiment très très très grossièrement), et dans les cas usuels (pas fait exprès pour le contraire) l'ordinal de preuve d'une théorie des ensembles « façon Kripke-Platek » est décrit par un système de notations construit autour d'une fonction d'écrasement basée sur le plus petit ordinal dont cette théorie des ensembles ne prouve pas l'existence. Seulement, plus cet ordinal est gros (et du coup, son écrasé aussi), plus la fonction d'écrasement est complexe à définir et à décrire et le système de notations ordinales aussi (ce qui est inévitable vu qu'aucun système de notations ordinales ne peut les englober toutes, plus on veut aller loin plus il faut le payer).

Dans tous les cas (en tout cas ceux qu'on sait décrire à l'heure actuelle !), les ordinaux écrasés sont des ordinaux dénombrables « récursivement grands », ceux que j'ai appelés du domaine (2) dans mon introduction, mais, en fait, la description est beaucoup plus simple avec des cardinaux du domaine (3) (comme ω₁ à la place de ω₁CK) ; c'est un peu gênant parce que ça veut dire qu'on fait appel à des théories dépassant ZFC (par exemple, l'existence d'un cardinal inaccessible, ou Mahlo, ou faiblement compact voire plus, choses dont ZFC ne prouve pas l'existence, à la place d'un ordinal récursivement inaccessible, ou récursivement Mahlo, ou récursivement faiblement compact, choses dont ZFC prouve l'existence) pour décrire des théories plus faibles que ZFC ; mais cela diminue considérablement la technicité de la description du système de notations (qui reste assez colossale quand on va au-delà du faiblement compact).

Regardons un peu à quoi ressemblent des écrasements divers et variés qui ont été décrits. Je ne peux évidemment que faire une description extrêmement grossière de l'idée générale de ce qui se passe, je ne compte pas rentrer dans le moindre détail, juste faire entendre la musique (du coup, j'utilise certains termes techniques sans les définir, tant mieux pour les lecteurs qui savent ce qu'ils veulent dire, mais si ce n'est pas le cas, c'est que ce n'est pas terriblement important pour se faire une idée) : mais mon propos n'est pas tellement de définir les ordinaux en question que de donner un minuscule aperçu de la manière dont la complication s'accumule.

✱ La première étape évidente pour aller au-delà de l'ordinal de Bachmann-Howard consiste à ajouter un nouveau Ω₂ qui soit encore plus grand que tout ce qu'on peut fabriquer avec Ω, et qui va donc permettre de dépasser εΩ+1ΩΩ. Pour ça, on peut utiliser ω₂ (le plus petit cardinal >ω₁) ou, si on est plus courageux, ω₂CK (notation peu standard mais logique pour le plus petit ordinal admissible >ω₁CK). Je ne vais pas décrire exactement la fonction d'écrasement ou le système de notations qui en résulte, mais l'idée est qu'on a deux fonctions d'écrasement, l'une qui utilise Ω₂ pour donner des noms à certains ordinaux à partir de Ω₁=Ω un peu comme la manière dont on a utilisé Ω pour donner des noms à certains ordinaux dénombrables, et l'autre qui utilise ces noms à son tour pour donner des noms à certains ordinaux dénombrables. Pour dire les choses autrement : Ω a servi comme une sorte d'opérateur de point fixe pour construire toutes sortes de notations de points fixes imbriqués, généralisant monstrueusement les fonctions de Veblen, qui permet, par des puissances de Ω, de monter jusqu'à l'ordinal de Bachmann-Howard ; maintenant, Ω₂ sert à son tour comme une sorte d'opérateur de point fixe pour fabriquer des constructions en Ω beaucoup plus grandes que ce qu'on peut atteindre avec des puissances, et du coup démultiplie le pouvoir de Ω de fabriquer des ordinaux dénombrables (on a deux fonctions d'écrasement définies ensemble : l'une, disons ψ ou ψΩ, qui fabrique des ordinaux <Ω et l'autre, disons ψ₁ ou ψΩ₁, qui fabrique des ordinaux ≥Ω mais <Ω₂). On obtient un ordinal qui sera noté quelque chose comme ψΩ₂+1) et qui est grosso modo à l'ordinal de Bachmann-Howard ψΩ+1) (qui dans ce contexte devient ψ(Ω₂)) ce que ce dernier est à ε₀. Cet ordinal ψΩ₂+1) mesure la force de la théorie des ensembles de Kripke-Platek enrichie de l'axiome ω₁CK existe.

Pour mieux comprendre le rapport entre ε₀, l'ordinal de Bachmann-Howard ψΩ+1) et le nouvel ordinal ψΩ₂+1) dont je parle ci-dessus, il est peut-être intéressant que je digresse pour dire quelques mots des hiérarchies de fonctions à croissance lente et à croissance rapide. Je préfère réserver leur description précise à une (éventuelle) prochaine entrée, mais disons grosso modo la chose suivante : donné un ordinal α calculable (muni de données supplémentaires appelées « séquences fondamentales » que je vais abusivement ignorer), on peut fabriquer deux fonctions ℕ→ℕ (pouvant servir à construire de grands entiers naturels), l'une appelée la fonction f=fα de la hiérarchie à croissance rapide, l'autre g=gα de la hiérarchie à croissance lente (il y en a encore d'autres, et il y a des variations dans la construction, mais c'est en gros ce qui est important). La hiérarchie à croissance lente correspond intuitivement et très grossièrement à substituer l'argument de la fonction à la place de ω dans l'ordinal α (par exemple, si αω, alors g(n) va être quelque chose comme nn = nn, et si α=ε₀ alors g(n) va être quelque chose comme une tour de n empilement de puissances, parfois notée n↑↑n) ; la hiérarchie à croissance rapide, elle, correspond à itérer à chaque fois la fonction du niveau précédent : donc déjà fk est en gros la k-ième tranche de la fonction d'Ackermann (le niveau 3 de la hiérarchie à croissance rapide est déjà en gros le même que le niveau ε₀ de la hiérarchie à croissance lente), et aux ordinaux limites on diagonalise, donc par exemple fω est en gros la diagonale de la fonction d'Ackermann (qui n'est déjà plus primitive récursive), fω+1(n) correspond à itérer n fois fω, et ainsi de suite. La hiérarchie à croissance rapide est donc beaucoup plus efficace que celle à croissance lente. Pourtant, « les ordinaux gagnent toujours » : le niveau ε₀ de la hiérarchie à croissance rapide est comparable au niveau de la hiérarchie à croissance lente donné par l'ordinal de Bachmann-Howard, et ce niveau- de la hiérarchie à croissance rapide est comparable au niveau de la hiérarchie à croissance lente donné par l'ordinal ψΩ₂+1) dont il est question au paragraphe précédent, « et ainsi de suite » : chaque nouveau Ω ajouté va donner à la hiérarchie à croissante lente une vitesse de croissance comparable au niveau précédent de celle à croissance rapide.

✱ Il est tentant (comme je le suggère au paragraphe précédent) d'ajouter Ω₃ après Ω₂, puis Ω₄ après Ω₃, « et ainsi de suite » : chaque nouveau Ω ajouté fabrique un ordinal qui est, grossièrement parlant, au précédent comme l'ordinal de Bachmann-Howard est à ε₀. Ou en fait beaucoup plus : chaque nouveau Ω ajouté démultiplie le pouvoir du précédent de fabriquer des points fixes, qui servent eux-mêmes à démultiplier, et ainsi de suite. Pour construire la fonction ψ, il faut interpréter ces Ωi comme des cardinaux ωi=ℵi, ou, si on veut être plus économique au prix de plus de complexité technique, comme des ordinaux « admissibles » ωiCK. La limite ψω) des ordinaux écrasés ψΩi+1) est, si on a lu le paragraphe précédent, le premier ordinal où les hiérachies à croissance lente et rapide se rattrapent (c'est-à-dire que les fonctions f et g associées à cet ordinal sont comparables l'une à l'autre) ; cet ordinal mesure la force d'un système logique appelé Π¹₁-compréhension (le sous-système de l'arithmétique du second ordre où on a le droit de définir un ensemble d'entiers naturels par une propriété qui porte uniquement, en tête, des quantificateurs universels, sur les parties d'entiers naturels). L'ordinal obtenu en ajoutant juste un niveau de Ω après, ψΩω+1), est lui aussi important (c'est la force logique de la Π¹₁-compréhension plus « bar-induction », si j'ai bien retenu — je ne retrouve plus mes références à ce sujet).

✱ Bien sûr, au stade où j'en suis, on se doute bien que je ne vais pas m'arrêter là ! Pour disposer de plein de Ω, on va mettre la fonction γ↦Ωγ elle-même dans le système de notations. Mais pour rendre ce système vraiment puissant, on veut aussi pouvoir créer des points fixes là-dessus : c'est-à-dire pouvoir disposer d'un ordinal tel que γγ (un point fixe de la fonction Ω), et un ordinal γ qui est le γ-ième point fixe de la fonction Ω, et ainsi de suite, un peu comme on a construit l'ordinal de Bachmann-Howard en créant plein de points fixes à partir de γ↦ωγ sauf que cette fois-ci ce sont des niveaux de Ω tout entiers qu'on est en train de créer. La façon de s'en sortir est de faire appel à quelque chose de beaucoup plus grand que tout ce qu'on pourra fabriquer avec Ω, et ce « quelque chose » est, par exemple (si on a interprété Ωγ comme le γ-ième cardinal ωγ=ℵγ), un cardinal inaccessible I (de mon domaine (3) des ordinaux). Peu importe ce qu'est exactement un cardinal inaccessible : ce qui importe est qu'il soit plus grand que tout ce qu'on peut fabriquer en empilant les Ω, et c'est exactement ce qu'est un cardinal inaccessible ; mais si on a été soigneux et qu'on a interprété les Ωγ comme des « ordinaux admissibles » (ωγCK de mon domaine (2) des ordinaux), alors I a « simplement » besoin d'être ce qu'on appelle « récursivement inaccessible ».

Toujours est-il qu'on fabrique ainsi un ordinal (calculable ! on est toujours dans le domaine (1) !) qu'on peut noter ψI+1) (peu importent les détails de la fonction d'écrasement ψ, je cherche juste à donner une idée), qui bien que construit à partir d'un cardinal inaccessible I (ou au moins un ordinal récursivement inaccessible) est, pour sa part, tout à fait dénombrable, calculable et explicite ; mais pour vérifier que cet ordinal « a bien un sens », c'est-à-dire qu'il vérifie l'induction transfinie, il commence à falloir utiliser des théories un peu puissantes pour donner un sens à toutes les définitions : en l'occurrence, ψI+1) mesure la force de la théorie des ensembles de Kripke-Platek enrichie d'un axiome qui dit « la classe des ordinaux est récursivement inaccessible » (ce qui signifie : tout ordinal est majoré par un ordinal admissible).

✱ On peut bien sûr ensuite ajouter un deuxième inaccessible, puis un troisième, et ainsi de suite. Mais pour faire les choses de façon plus systématique, ce qu'on va faire est faire appel à un cardinal « Mahlo » (ou, comme précédemment, un ordinal récursivement Mahlo, quitte à plonger dans beaucoup plus de technicité) M, qui sert à fabriquer des cardinaux inaccessibles/réguliers ou des ordinaux admissibles ad lib. avec une nouvelle fonction d'écrasement : en gros, on aura peut-être une fonction θ « d'écrasement à valeurs dans les cardinaux réguliers (ou ordinaux admissibles) » où θ(1)=Ω et θ(2)=Ω₂ et ainsi de suite, mais ensuite θ(M) est le premier inaccessible (le premier cardinal régulier / ordinal admissible tel que γγ) et θ(M2) est le suivant, et ainsi de suite, et θ(M²) est le premier hyperinaccessible (le premier γ qui soit le γ-ième cardinal inaccessible), et θ(M³) est le premier hyperhyperinaccessible, et θ(MM) est le premier γ dont le degré d'inaccessibilité soit égal à γ lui-même, et ainsi de suite. Et pour chacun des cardinaux (ou ordinaux admissibles) π produits par cette fonction θ on a une fonction d'écrasement ψπ vers les ordinaux <π : je passe plein plein plein de détails, mais l'idée générale est que ce cardinal Mahlo permet de fabriquer toutes sortes d'inaccessibles (qui eux-mêmes fonctionnent comme je l'ai esquissé ci-dessus). On obtient ainsi un ordinal (calculable !) ψΩM+1) qui mesure la force de la théorie des ensembles de Kripke-Platek enrichie d'un axiome qui dit « la classe des ordinaux est récursivement Mahlo ».

✱ Pour aller encore plus loin, on fait appel à un cardinal « faiblement compact » K, une notion de grand cardinal (domaine (3)) dont l'analogue récursif (domaine (2)) s'appelle « Π₃-réfléchissant », quelque chose que je ne compte pas définir, mais à ce niveau-là, le système de fonctions d'écrasement devient encore plus complexe. Au niveau de l'écrasement d'un cardinal récursivement Mahlo (:= Π₂-réfléchissant sur les admissibles, c'est-à-dire Π₂-réfléchissant sur les Π₂-réfléchissants), que j'avais évoqué ci-dessus, il y avait deux « niveaux » de fonctions d'écrasement : θ qui sert à fabriquer des cardinaux réguliers / ordinaux admissibles π<M, et toutes sortes de fonctions ψπ qui fabriquent des ordinaux <π. Maintenant qu'on veut jouer avec K, les choses se compliquent encore : on a une hiérarchie par niveau de « Mahloïtude », avec au niveau 0 tous les ordinaux <K, au niveau 1 les cardinaux réguliers ou ordinaux admissibles, au niveau 2 les cardinaux Mahlo ou ordinaux récursivement Mahlo, et au niveau γ+1 les cardinaux réguliers dans lesquels ceux du niveau γ sont clos-cofinaux (ou quelque chose d'analogue côté récursif : les ordinaux Π₂-réfléchissant sur ceux de niveau γ) ; on a une fonction d'écrasement qui produit le plus petit élément de chaque niveau de Mahloïtude, mais surtout, on a en a une autre ψξπ de trois variables qui prend un niveau de Mahloïtude ξ, un π dans lequel écraser (qui est lui-même d'un certain niveau de Mahloïtude >ξ), et un ordinal à écraser, et qui produit un écrasement <π de niveau de Mahloïtude ξ (qui peut donc servir pour de nouveaux écrasements si ξ>0). Bref, là où au paragraphe précédent on avait juste le niveau 0 (la fonction ψ) et une ébauche de niveau 1 (la fonction θ), on a maintenant toute une hiérarchie de niveaux, et K peut servir à diagonaliser sur la hiérarchie elle-même (produire le plus petit cardinal dont le niveau de Mahloïtude est égal à lui-même, etc.).

L'ordinal ψ0ΩK+1) décrit par tout ce fatras mesure la force d'une théorie qui est la théorie des ensembles de Kripke-Platek enrichie d'un axiome de Π₃-réflexion.

Tout ça est déjà bien compliqué. Chronologiquement, cette analyse date de 1994 (Michael Rathjen, Proof theory of reflection, Ann. Pure Appl. Logic 68 (1994), 181–224 ; disponible ici mais avec malheureusement plein de fautes typographiques pénibles). C'est l'ordinal calculable le plus grand que j'ai l'impression de bien comprendre, au sens où je crois pouvoir coder sur un ordinateur un système de notations ordinales jusqu'à ce ψ0ΩK+1) (ce n'est pas un exploit : l'article de Rathjen donne en gros tous les algorithmes nécessaires).

Mais au-delà de ça, il arrive des complications bien plus importantes : pour écraser un ordinal « Π₄-réfléchissant », on doit commencer à gérer des ordinaux dont la description est vraiment plus complexe que l'écrasement de quelque chose (par exemple des ordinaux Π₂-réfléchissant sur les Π₃-réfléchissants) : les fonctions d'écrasement prennent en argument non pas juste un ordinal vers lequel écraser et un simple niveau de Mahloïtude, mais des données beaucoup plus riches que sont des « configurations de réflexion » ou des « instances de réflexion » (on n'écrase pas juste vers un ordinal de niveau de Mahloïtude ξ et inférieur à π mais vers un ordinal ayant certaines propriétés de réflexion qui conduisent elles-mêmes à d'autres fonctions d'écrasement), et le système de notation devient incroyablement plus subtil et défini par un nombre assez impressionnant de récursions imbriquées. Au moins les ordinaux « Π₅-réfléchissants » ou plus n'apportent-ils pas plus de complexité substantielle par rapport aux Π₄-réfléchissants, mais il y a encore quelques subtilités si on veut inclure tous les niveaux d'un coup, voire, des niveaux indicés par le système d'ordinaux qu'on est en train de définir. C'est en gros à ce point-là que travaille la thèse de Jan-Carl Stegert (Ordinal proof theory of Kripke-Platek set theory augmented by strong reflection principles (2010), disponible ici en PDF), qui introduit des systèmes de notations ordinales dont la seule définition s'étend sur un bon nombre de pages (notamment p. 13–30 pour le système principal, p. 68–70 pour une version simplifiée, p. 66–67 pour une version encore plus simplifiée équivalente à l'écrasement d'un cardinal Mahlo / ordinal Π₃-réfléchissant, et p. 100–113 pour un système encore plus riche). De ce que je sais, c'est le système de notations ordinales explicite le plus grand qui ait été introduit et rigoureusement analysé dans la littérature mathématique.

Il est cependant possible qu'on connaisse des systèmes de notations ordinales encore plus grands. Un certain Dmytro Taranovsky prétend avoir développé des systèmes de notations qui dépassent l'ordinal de preuve de l'arithmétique du second ordre et monte peut-être jusqu'à l'ordinal de preuve de ZFC. Il ne prétend pas avoir de preuve de ces affirmations, mais, même comme ça, j'avoue que je suis assez sceptique : pas tellement parce que l'auteur n'a ni fait de thèse de maths ni jamais rien publié formellement (je n'aime vraiment pas invoquer ce genre de critères, et en l'occurrence il ne vaut vraiment pas grand-chose parce qu'il est clair que l'auteur est au même passablement compétent dans ce qu'il écrit), mais surtout parce que je trouve très suspect de ne pas voir apparaître dans son système la complexité des hiérarchies d'écrasement qu'on voit dans celui de Stegert, et la facilité avec laquelle il prétend monter dans la hiérarchie preuve-théorique est quand même un peu incroyable. Mais je ne suis pas non plus complètement convaincu qu'il ait tort (au pif, je dirais que son système est bien-fondé, mais n'a pas la puissance qu'il croit qu'il a). De façon plus sérieuse, Toshiyasu Arai (新井(あらい)敏康(としやす)) a écrit tout un tas d'articles, dont beaucoup sont publiés, sur l'analyse ordinale de théories assez fortes : celui-ci, par exemple, construit un système de notations équivalent à un de ceux de Stegert et qui se prétend plus simple (je ne suis pas complètement convaincu par cette dernière partie, mais bon, je n'ai fait que survoler) ; je crois avoir vu de sa part quelque chose qui se prétendait encore plus fort, mais je ne retrouve plus de quoi il peut s'agir. Il y a aussi les patterns of resemblance de Timothy Carlson qui peuvent servir à définir des systèmes de notations ordinales, je crois comprendre que leur portée pourrait être très grande, mais je ne comprends pas ce qu'on sait exactement à leur sujet.

Comment on peut tricher pour décrire de grands ordinaux de preuve

J'ai essayé de faire passer ci-dessus l'idée qu'on essaye de définir de grands ordinaux calculables pour mesurer la force de théories (qui se situent typiquement quelque part entre l'arithmétique de Peano du premier ordre PA et la théorie des ensembles ZFC) et qu'on ne sait pas monter trop haut dans cette hiérarchie (on n'atteint pas l'arithmétique de Peano du second ordre, et on est très loin de ZFC). Ces analyses ordinales permettent de mieux comprendre les théories, de réduire la question de leur correction arithmétique ou de leur consistance à la croyance en l'existence de certains ordinaux (grossièrement parlant, croire que ε₀ existe « revient au même » que croire que PA est consistante, et la même chose vaut pour ces analyses ordinales plus grandes).

Néanmoins, tout ceci présuppose que le système de notations soit raisonnablement « explicite », quelque chose qu'il n'est pas possible de formaliser. Si on ne fait pas une hypothèse de ce genre, il est tout à fait possible de décrire l'ordinal de preuve de ZFC (ou d'essentiellement ce qu'on voudra) de façon essentiellement triviale et qui n'apporte en gros aucune information sur ZFC :

Une notation ordinale est un triplet (p,e,x) où p est une preuve dans ZFC qu'une certaine machine de Turing e calcule un bon-ordre sur ℕ, et x est un entier naturel. On compare (p,e,x) à (p′,e′,x′) par l'ordre lexicographique sur les deux premières coordonnées (enfin, la première suffit, la seconde est déterminée par elle), ou, si elles sont égales, en comparant x et x′ par l'ordre défini par e.

Ce qui précède est bien une relation calculable : on peut tout à fait programmer une machine de Turing pour comparer des triplets (p,e,x) à (p′,e′,x′) dans l'ordre que je viens de dire, ce n'est pas spécialement difficile (il faut juste programmer un vérificateur de preuves dans ZFC). Sous des hypothèses plus fortes que ZFC, c'est un bon ordre sur les entiers naturels, et c'est alors presque tautologiquement un ordinal de preuve de ZFC. Comme il y a des variations sur la définition d'un ordinal de preuve, je dis un ordinal de preuve, et il peut y avoir des variations sur la construction, par exemple on peut mettre des bornes de complexité sur e ou diagonaliser autrement, ou imposer des contraintes sur la preuve de bon-ordre, mais en tout état de cause, il est clair que ZFC ne prouve pas que la relation ci-dessus est un bon-ordre alors qu'il prouve que c'est un bon ordre jusqu'à n'importe quel (p,e,x) donné, et l'extension de ZFC par l'ajout d'un cardinal inaccessible va prouver que ce qui précède est bien un bon ordre. (Voir ce vieux fil sur sci.math.research ou celui-ci sur MathOverflow pour des constructions essentiellement équivalentes.)

La construction ci-dessus n'a aucun intérêt (c'est essentiellement la même idée que ce que j'avais raconté ici pour calculer un grand entier naturel), mais elle illustre le fait qu'on ne peut pas vraiment formaliser ce qu'on fait en théorie de la démonstration (on veut décrire explicitement des ordinaux de preuve, mais ce que décrire explicitement signifie n'est pas si clair que ça), et il est délicat d'expliquer qu'on ne connaît pas l'ordinal de preuve de ZFC. Néanmoins, il est clair que cet ordinal est très difficile à « comprendre » parce que cela signifierait, d'une certaine manière, être capable de décrire tous les ordinaux que ZFC peut fabriquer (et de façon, on l'espère, plus explicite que ce qui précède).

Tout ce dont je n'ai pas parlé

Comme je le disais dans l'avant-propos, je n'ai finalement parlé ici que des ordinaux calculables (=constructifs, =récursifs), c'est-à-dire strictement inférieurs à l'ordinal de Church-Kleene ω₁CK (y compris les ordinaux incompréhensibles comme l'ordinal de preuve de ZFC s'il existe), même s'il a fallu faire appel à des ordinaux plus grands (que ω₁CK) pour les construire. Ceci devrait donner une petite idée de combien ω₁CK est grand : finalement, selon l'idée générale que décrire un ordinal c'est décrire les ordinaux plus petits et comment ils se comparent, tout ce que j'ai fait ci-dessus est de tenter de décrire ω₁CK sans évidemment y arriver. Maintenant, il faut garder à l'esprit que ω₁CK n'est que le premier ordinal admissible >ω : tout le domaine (2) concerne les ordinaux qui vérifient des propriétés beaucoup plus fortes que l'admissibilité, et qui sont néanmoins dénombrables : il y a beaucoup de propriétés qu'on peut définir ici en lien avec la programmation transfinie ; et tout ça, à son tour, n'est qu'une tentative de décrire ω₁ (le plus petit ordinal indénombrable) qui, elle-même, ne peut pas aboutir.

Ceci soulève une question philosophique un peu épineuse, qui est de se demander dans quelle mesure tous ces objets « existent » ou « ont un sens » ou « fonctionnent correctement ». Si on est finitiste, on ne croit pas que ω existe (et si on est ultrafinitiste, on ne croit déjà pas que quelque chose comme 10↑↑1000 existe, voire pas que 10↑1000 existe, mais j'ai déjà expliqué pourquoi je trouvais cette position problématique en ce qu'elle n'explique pas, par exemple, que nous ne trouvions pas de contradiction dans ZFC autrement que parce que c'est comme ça). Si on n'est pas finitiste, on commence à se dire que les puissances de ω existent, mais jusqu'où est-on prêt à aller ? Les grands ordinaux calculables que j'ai évoqués sont des objets qu'on peut réaliser informatiquement par de vrais programmes (qu'on peut même transformer en jeux assez explicites, il est un peu bizarre de prétendre que le fait que le jeu termine toujours soit une affirmation dénuée de sens) ; mais plus on monte haut vers ω₁CK plus les justifications nécessitent de faire appel à des ordinaux encore plus grands, et, pire encore, il y a des ordinaux <ω₁CK qui n'existent que si certaines théories monstrueusement puissantes sont consistantes (l'ordinal de preuve de ZFC, ou celui de ZFC plus l'existence de tel ou tel grand cardinal), ce qui donne l'impression que ω₁CK est quelque chose qui ne finit jamais de « se remplir ». Et les choses sont encore bien pires avec ω₁, tant il existe, avant ω₁, quantité d'ordinaux qui « font semblant » d'être ω₁ (ou même, d'être beaucoup plus grands que ω₁) avec des niveaux de précision de plus en plus grands, jusqu'à tromper la logique du premier ordre, et au final on se demande vraiment si ω₁ a un sens. Même pour un « platoniste » comme moi, la question de l'existence de ω₁CK et, a fortiori de ω₁, est vraiment épineuse.

(vendredi)

Ruxor apprend (péniblement) à conduire

Ayant obtenu le code le mois dernier, je profite du fait que je n'ai pas de cours à donner pour quelque temps pour prendre des cours de conduite. Je ne peux pas dire, après 10 heures de leçons (plus 3 heures sur simulateur) que je sois franchement enthousiasmé par l'expérience. Ni le moniteur par mes progrès : La formation sera longue…

Il trouve notamment que je suis trop crispé sur le volant, ce qu'il interprète comme une forme de peur. Je ne dis pas qu'il ait tout à fait tort (la voiture individuelle est certainement un moyen de transport passablement dangereux, mais enfin, je suis déjà monté dans les voitures de gens conduisant plutôt dangereusement, je n'étais pas recroquevillé de terreur, il n'y a pas de raison que je n'arrive pas, à terme, à être plus prudent qu'eux, et en tout cas, pour l'instant, je suis avec quelqu'un qui est bon pour rattraper les erreurs[#]) ; mais ce que je ressens surtout, c'est l'impression d'être débordé par les choses qui demandent mon attention en même temps, ne serait-ce que le nombre d'étapes pour faire des choses aussi débiles que démarrer ou s'arrêter (sans caler[#2]…) sur une voiture à conduite manuelle.

Ce n'est pas que ce soit difficile, mais j'ai un peu l'impression de jouer à un jeu comme Jacques a dit : du genre avant de prononcer une phrase qui commence par une consonne, vous devez lever le bras droit, à chaque fois que vous utilisez le mot le vous devez claquer des doigts, et tous les sept mots exactement vous devez taper du pied : ceci étant, racontez-moi vos vacances (mais pourquoi allez-vous si lentement ?) — oui, merci, je crois que j'ai compris et retenu les règles (celles auxquelles j'ai eu droit pour l'instant, du moins), mais avant d'en faire un automatisme, avant de me les approprier[#3], comme dit mon moniteur, il me faudra effectivement du temps. Je comprends pourquoi ce n'est pas une bonne idée d'attendre 40+ ans pour ça. Et je comprends aussi pourquoi les Américains n'aiment pas les boîtes de vitesse manuelles et les embrayages. Sans même parler des règles de la circulation à respecter en même temps, et de tous les gens à surveiller autour : je suis très mauvais pour le multitâche, et si je perds le fil, j'ai tendance à ne plus du tout savoir où j'en suis et à faire vraiment n'importe quoi, ce qui est une très mauvaise idée en voiture.

Le simulateur devrait permettre d'acquérir ces automatismes par la répétition d'exercices faciles. Mais le simulateur ne sanctionne pas certaines mauvaises pratiques (il ne vérifie pas qu'on tient le volant correctement, qu'on garde le pied sur le frein à l'arrêt, ce genre de choses), et mon moniteur n'a pas l'air convaincu par son utilité.

Bon, après, mon moniteur a aussi l'air de penser que le seul vrai permis de conduire est celui qu'on obtient à Paris (où la route n'arrête pas de changer de direction et de largeur, où les gens arrivent dans tous les sens, où il y a tellement d'inspecteurs à l'examen qu'on ne peut pas bachoter selon les habitudes de chacun, etc.) ; en tout cas, il n'a pas l'air de penser grand bien de celui qu'on obtient en des plus petites villes en France ni dans certains autres pays.

(Je n'attends pas non plus avec impatience la voiture qui se conduit toute seule : vu le niveau désastreux de la sécurité informatique en général, elle sera certainement moins dangereuse qu'une voiture conduite par un humain… jusqu'au jour où un pirate russe prendra le contrôle de 100000 voitures simultanément dans le monde et les enverra toutes foncer n'importe où, et en comparaison les guignols de terroristes qui font peur à faire ça un par un ils paraîtront bien anodins. L'avenir ne m'enthousiasme donc pas trop.)

En attendant, ce qui est sûr, c'est que je connais maintenant très bien le parking du cimetière de Chevilly-Larue pour en avoir fait plein de fois le tour (et il a l'air très populaire auprès des auto-écoles, vu que nous n'étions pas les seuls).

[#] Ce qui m'amène d'ailleurs à me demander comment on forme les moniteurs d'auto-école : est-ce qu'ils ont des leçons pratiques où un méta-moniteur s'asseoit à la place de l'élève (i.e., du conducteur) et fait volontairement des erreurs de débutant pour vérifier que le moniteur arrive à les rattraper à temps ? Et du coup, comment forme-t-on les méta-moniteurs (et ainsi de suite, comme le fameux problème de la construction des grues de chantier) ? Que de questions sans réponse !

[#2] Mon problème à ce stade, ce n'est pas tellement que je cale, c'est plutôt que je suis tellement précautionneux lorsque je relâche l'embrayage pour ne pas caler en démarrant que le chauffeur derrière moi s'énerve et me double dangereusement.

[#3] Déjà, juste la façon dont on me dit que je dois manier le volant dans les tournants importants (genre, à angle droit) ne me semble pas du tout naturelle : à part qu'il ne faut pas que je sois crispé, on m'apprend qu'il faut chevaucher les mains, moi je trouverais beaucoup naturel de les faire glisser — rien que ça, ça me mobilise de l'espace mental pour rien.

(vendredi)

Un peu de programmation transfinie

Ça fait très longtemps que j'ai envie d'écrire cette entrée, parce que je trouve le sujet extrêmement rigolo : en gros, ce dont je veux parler, c'est comment définir et programmer un ordinateur transfini ? (comment concevoir un langage de programmation considérablement plus puissant qu'une machine de Turing parce qu'il est capable de manipuler directement des — certains — ordinaux ?). Techniquement, ce dont je veux parler ici, c'est de la théorie de la α-récursion (une branche de la calculabilité supérieure qui a fleuri dans les années '70 et qui semble un peu moribonde depuis) ; sauf que la α-récursion n'est jamais présentée comme je le fais ici, c'est-à-dire en décrivant vraiment un langage assez précis dans lequel on peut écrire des programmes pour certains ordinateurs transfinis. Ces ordinateurs ont le malheur de ne pas pouvoir exister dans notre Univers (encore que, si on croit certaines théories complètement fumeuses que j'avais imaginées… ?) ; mais même s'ils n'existent pas, je pense que le fait d'écrire les choses dans un style « informatique » aide à rendre la théorie mathématique plus palpable et plus compréhensible (en tout cas, c'est comme ça que, personnellement, j'aime m'en faire une intuition).

Bref, ce que je voudrais, c'est que cette entrée puisse plaire à la fois à ceux qui aiment la programmation et à ceux qui aiment les ordinaux ; ce que je crains, c'est qu'en fait elle déplaise à la fois à ceux qui n'aiment pas la programmation et à ceux qui n'aiment pas les ordinaux — ce qui est logiquement différent. On verra bien.

Il faut que je précise que tout ce que je raconte est un territoire relativement mal couvert par la littérature mathématique (il y a certainement des gens qui trouveraient tout ça complètement évident, mais je n'en fais pas partie, et comme je le disais, je soupçonne que la plupart étaient surtout actifs vers '70 et sont maintenant un peu âgés ou sont passés à autre chose), et jamais de la manière dont je le fais (comme un vrai langage de programmation : il y a des gens qui ont « redécouvert » des domaines proches comme avec les machines de Turing infinies ou les machines ordinales de Koepke, mais c'est un peu différent). Du coup, il faut prendre tout ce que je raconte avec un grain de sel : je n'ai pas vérifié chaque affirmation avec le soin que j'aurais fait si j'étais en train d'écrire un article à publier dans un journal de recherche.

Une autre remarque : cette entrée contient un certain nombre de digressions, notamment parce que je pars dans plusieurs directions un peu orthogonales. Je n'ai pas voulu les mettre en petits caractères comme je le fais souvent, pour ne pas préjuger de ce qui est important et ce qui ne l'est pas, et je n'ai pas eu le courage de tracer un leitfaden, mais tout ne dépend pas de tout : donc, si on trouve un passage particulièrement obscur ou inintéressant, on peut raisonnablement espérer(!) qu'il ne soit pas vraiment important pour la suite.

*

Pour faire une sorte de plan ce dont je veux parler, je vais décrire un langage de programmation assez simple (dont la syntaxe sera imitée de celle du C/JavaScript) et différentes variantes autour de ce langage. Plus exactement, je vais définir quatre langages : un langage (0) « de base » et deux extensions qu'on peut appliquer à ce langage (les extensions « forward » et « uloop », qui seront définies après), de sorte qu'à côté du langage (0) de base, il y aura le langage (1) avec extension « forward », le langage (2) avec extension « uloop », et le langage (3) avec les deux extensions à la fois ; tout ça peut encore être multiplié par deux si j'autorise les tableaux dans le langage, ce qui, finalement, ne changera rien à son pouvoir d'expression, et c'est peut-être surprenant.

Chacun de ces langages pourra servir dans le « cas fini » (le langage manipule des entiers naturels, et chacun des langages (0)–(3) peut être implémenté sur un vrai ordinateur et servir de vrai langage de programmation) ou dans le « cas transfini » (le langage manipule des ordinaux). J'expliquerai plus précisément en quoi consiste ce cas transfini, mais je veux insister dès à présent sur le fait que les langages de programmation (0)–(3) seront exactement les mêmes dans ce cas transfini que dans le cas fini (plus exactement, leur syntaxe sera exactement la même ; la sémantique pour les langages (0)&(1) sera prolongée, tandis que pour les langages (2)&(3) elle sera raffinée et dépendra d'un « ordinal de boucle » λ).

(mardi)

Titus n'aimait pas Bérénice (et une digression sur Bérénice)

Titus n'aimait pas Bérénice, de Nathalie Azoulai (prix Médicis 2015) :

Ce livre m'a assez plu, mais n'était pas ce que je pensais.

La pièce de Racine, Bérénice, est une de mes œuvres littéraires préférées[#], dont j'admire à la fois la pureté de la langue, le dénuement de l'action et la force des sentiments.

Je pensais que Titus n'aimait pas Bérénice serait une sorte de fantaisie autour de cette pièce : une réadaptation moderne, une enquête autour d'elle, une analyse, une mise en abyme, quelque chose comme ça. En fait, ce n'est rien de tout ça : c'est essentiellement une biographie de Racine. Certes, cette biographie est romancée (combien, je ne sais pas : je ne suis pas historien) et l'auteure tente d'expliquer ou d'imaginer l'état d'esprit de Racine quand il écrit ses différentes pièces (dont Bérénice, donc, mais pas plus que les autres) ; finalement, je ne peux pas dire que j'aie appris grand-chose sur la pièce ou sur son sens, alors que j'en ai appris sur Racine.

La biographie de Racine est bien insérée dans une histoire-cadre en rapport avec la pièce : dans cette histoire (contemporaine), un dénommé Titus rompt avec sa maîtresse dénommée Bérénice pour rester auprès de sa femme dénommée Roma. C'est ce qui censément pousse la Bérénice en question à se renseigner sur la vie de Racine. Mais cette histoire-cadre est très mince en nombre de pages, je ne la trouve pas terriblement intéressante, sa morale, si elle en a une, est confuse ; et honnêtement, elle ne sert pas à grand-chose, car le lien qu'elle établit avec la partie biographique est ténu et artificiel. Si le but était de faire comprendre au lecteur quelque chose sur Bérénice ou sur les séparations amoureuses ou les peines de cœur, il aurait fallu s'arranger pour que cette leçon, et le lien avec la vie de Racine, soient présentés de façon moins cryptique. Là on a juste l'impression que deux histoires différentes — la véritable histoire, et un prétexte pour la dérouler — se sont mélangées, impression d'autant plus agaçante qu'il n'y a quasiment aucun élément les reliant, et aucune convention typographique les séparant (beaucoup d'auteurs, dans un cas semblable, changent de police de caractères ou font quelque chose du genre : c'est vraiment idiot de s'en être privé, cela ne fait qu'embrouiller le lecteur).

Mais prise isolément, la biographie est intéressante et bien écrite. Le personnage de Racine est rendu vraiment vivant et attachant. On est sensible à la manière dont il est tiraillé par des forces contradictoires — essentiellement la fascination pour le roi Louis XIV et l'influence de ses maîtres et de sa tante à Port-Royal — entre sa fascination pour ses héroïnes et pour les actrices qui les jouent et la condamnation du théâtre impie par les jansénistes. Peut-être que j'ai ressenti cela d'autant plus fortement que j'ai plusieurs fois fait la promenade de Chevreuse aux ruines de Port-Royal-des-Champs (a.k.a., « chemin de Racine », voir aussi ici)[#3]. Mais indépendamment de ça, je pense que cette biographie — peut-être partiellement romancée, je répète que je n'en sais rien — est plus captivante, et nous fait mieux comprendre la personnalité de l'écrivain, qu'un traité plus académique et plus long sur la vie de Racine.

Bref, je recommande ce petit livre où on ne s'ennuie pas, mais je recommande d'ignorer les intrusions de l'histoire-cadre.

*

[#] Digression (relativement à propos quand même) : Une de mes œuvres préférées, mais j'ai toujours regretté que le triangle amoureux Titus-Bérénice-Antiochus ne soit pas fermé de la façon qui en fasse vraiment un triangle, c'est-à-dire : que la raison pour laquelle Titus se sépare de Bérénice serait qu'il se rende compte qu'il aime en secret Antiochus (lequel aime Bérénice, laquelle aime Titus). • Je l'ai déjà dit mais je le répète[#2] : saloperie que l'homophobie qui nous a privé de toutes sortes de possibilités intéressantes dans la culture classique ! Saloperie d'homophobie tellement profondément ancrée dans les esprits qu'on pouvait montrer sur scène toutes sortes de crimes et de vices, mais deux hommes, ou deux femmes, qui s'aiment ouvertement, non. Et maintenant, le XVIIe siècle est passé, plus personne ne sait écrire le français comme Racine, et même si quelqu'un savait, ça ne se vendrait pas, et même si ça se vendait, ça mettrait encore des siècles à devenir un « classique » et à imprégner notre culture. • J'avais moi-même commencé à essayer de débuter d'entreprendre d'écrire une pièce de ce genre, mais il faut reconnaître que respecter toutes les règles du théâtre classique, des « trois unités » aux contraintes prosodiques de l'alexandrin et de l'alternance des rimes, c'est un exercice vraiment difficile pour lequel je n'ai qu'un talent très limité et certainement pas le temps pour mener la tâche à bien. • De façon amusante, d'ailleurs, dans l'excellente adaptation de la pièce (je parle du Bérénice de Racine) faite pour la télévision par Jean-Claude Carrière et Jean-Daniel Verhaeghe, avec Carole Bouquet dans le rôle éponyme, Gérard Depardieu en Titus et Jacques Weber en Antiochus, les artistes se sont amusés à écrire, jouer et tourner, une scène « bonus », une fin alternative, qui part à peu près exactement du postulat que j'ai décrit ci-dessus (Titus était pédé — ça fait un demi-alexandrin) : elle n'a été diffusée, je crois, qu'une seule fois, sur Arte (dans le cadre de l'émission Metropolis), quatre jours après la pièce elle-même, le 16 septembre 2000. Si quelqu'un arrive à retrouver une vidéo, ou le texte utilisé, ça m'intéresse…

[#2] D'ailleurs, je pensais que toute la digression qui précède était un radotage de ma part et que j'avais déjà raconté tout ça, mais je n'en trouve plus aucune trace. Comme quoi, parfois, il vaut mieux prendre le risque de radoter que de se taire en se disant je l'ai déjà écrit quelque part.

[L'âne et une chèvre de Port-Royal-des-Champs][#3] La dernière fois que j'ai fait cette promenade (fin octobre 2016), il y avait un âne et deux chèvres, tous les trois très amicaux, sur le terrain de l'abbaye, et mon poussinet a fait copain-copain avec eux (preuve ci-contre, cliquez pour agrandir). Ils vendaient aussi du miel des ruches de Port-Royal. Tout ça va très bien avec les vers de Racine niaisement bucoliques qui sont reproduits tout du long du chemin.

(mardi)

Kalpa impérial

J'ai rarement trouvé un livre dont je me dise autant qu'il avait été écrit pour moi que Kalpa impérial d'Angélica Gorodischer. J'avais parlé ici de ma fascination pour les empires et les empereurs dans la science-fiction, et j'avais illustré ça ici de façon plus ou moins auto-caricaturale (voir aussi ici, ici, ici, ici et plein d'autres du genre) : Kalpa impérial est l'histoire de l'Empire le plus vaste qui ait jamais existé et de certains ses monarques. On ne sait pas très bien si on doit classer ça comme de la science-fiction, de la fantasy ou autre chose : il n'y a pas de magie (ou en tout cas, ce n'est pas clair), pas de technologie avancée ni de voyage dans l'espace, les éléments des histoires sont plutôt intemporels et se déroulent à un endroit non spécifié[#], cela ressemble plutôt au style des fables, ce qui est aussi quelque chose qui peut me plaire (et que, là aussi, j'essaie moi-même parfois de reproduire : voir ici, ici, ici, ici ou encore dans ce conte de fées ou cet autre conte). C'est un recueil de nouvelles (un genre que j'affectionne), avec tout au plus une référence de l'une à l'autre par un nom répété, lien suffisamment ténu pour qu'on ne sache même pas dans quel ordre ces histoires se déroulent. Histoires qui d'ailleurs semblent être de simples fragments épars de chroniques beaucoup plus vastes, et dont la fin est souvent une invitation au lecteur à deviner le sens de ce qu'il vient de lire. On ne peut pas ne pas comparer avec les Villes invisibles d'Italo Calvino, un livre que j'admire beaucoup (j'ai tenté de produire ma propre « ville invisible » ici, et j'ai cité mon passage préféré du livre ici) ; précisons cependant que les nouvelles de Gorodischer sont plus des récrits que celles de Calvino (disons qu'elle raconte alors que Calvino décrit). Mais un autre de mes écrivains préférés auxquels elle me fait aussi penser, c'est son compatriote Jorge Luis Borges : la ressemblance, là, n'est pas tellement dans ce qui est raconté mais plutôt dans le mode narratif… je n'arrive pas à mettre le doigt dessus exactement, mais il y a quelque chose à la fois dans le style et dans la façon de tourner les nouvelles un peu comme des énigmes, qui me rappelle Borges.

Tout ceci étant dit, il n'est pas surprenant que j'aie énormément aimé. (Comment se fait-il, d'ailleurs, avec le nombre de copains que j'ai qui lisent volume sur volume de SF, que personne ne m'ait jamais recommandé Kalpa impérial ? Je suis tombé dessus vraiment par hasard, en errant dans la librairie de la rue des Écoles qui est à peu près en face de la Sorbonne, Compagnie.) Maintenant, je ne sais pas vraiment dans quelle mesure je dois le recommander à d'autres : le fait que ce livre soit à ce point « écrit pour moi » me rend plus ou moins incapable de le juger objectivement (enfin, objectivement ne veut rien dire, mais disons, d'une manière qui se prête à des recommandations utiles) ; c'est aussi la raison pour laquelle j'ai fait ci-dessus pas mal de liens vers des fragments que j'ai moi-même écrits : s'ils sont de ceux qui vous plaisent, il y a des chances que vous aimiez Kalpa impérial (la réciproque n'étant, évidemment, pas vraie, mais ce sera au moins un indice). Mais simplement si vous en avez marre de la fantasy qui ressemble à ceci (généralement écrits en anglais par un américain barbu, typiquement en douze volumes avec un nom du genre Cycle de la Nuit de Glace de la Porte du Temps de l'Épée de Feu) et si vous voulez quelque chose d'un peu différent[#2], essayez ce petit recueil de nouvelles d'une femme argentine, ce sera au moins… rafraîchissant.

[#] À peu près la seule chose qu'on apprend de la géographie de ce très vaste empire est que le sud est plus sauvage et plus chaud que le nord (ce qui suggère qu'on est plutôt dans l'hémisphère nord, c'était d'autant moins évident que l'auteure est notohémisphérienne). Pour ce qui est de la chronologie, on en sait encore moins : il y a un indice ponctuel selon lequel cet empire existerait dans notre futur lointain, mais cela pourrait aussi bien être une blague.

[#2] Sauf pour ce qui est des noms, où manifestement Gorodischer s'amuse à en fabriquer d'aussi saugrenus les uns que les autres, par exemple Senoeb'Diaül.

(mardi)

It's raining men

Je ne suis pas trop du genre à regarder le sport à la télé, mais il faut dire que quand je tombe sur l'épreuve de saut à la perche aux championnats du monde d'athlétisme (plim, plam, ploum)… ben ça se laisse regarder.

Ajout : blim, bloum.

(dimanche)

La petite place qui réapparaît dans mes rêves

J'ai déjà plusieurs fois parlé sur ce blog des thèmes qui reviennent régulièrement dans mes rêves — par exemple ici, ici, ici, ici, ici, ici, ici et ici — je ne pensais pas en avoir écrit autant, d'ailleurs, et je devrais peut-être créer une catégorie juste pour ça ; mais quand les gens se mettent à raconter leurs rêves, c'est en général signe qu'il vaut mieux s'enfuir, donc si vous voulez fuir, cliquez ici. Mais autant les thèmes récurrents existent sans l'ombre d'un doute, autant c'est un mystère pour moi de savoir si les éléments récurrents existent.

Pour être plus précis, ça m'arrive souvent de faire un rêve dont je pense (pendant que je suis en train de rêver) que c'est la suite d'un autre rêve, dont j'ai un souvenir relativement précis, ou simplement qu'un élément particulier est déjà apparu ; mais plus d'une fois, une fois réveillé et une fois sorti de cette phase où tout ce que j'ai pensé en rêve continue à me sembler vrai ou intéressant, j'ai eu des raisons de mettre ce souvenir en doute : l'« autre rêve » n'avait jamais existé, ou bien était inventé en même temps que le rêve qui croyait lui faire référence, ou peut-être en était une autre partie, bref, le souvenir lui-même me semblait falsifié. Ou en tout cas, je le soupçonnait de l'être ; a contrario, je n'ai jamais eu de certitude ni même de très forte présomption qu'un souvenir du genre « j'ai déjà rêvé ça » était correct (ceci étant, je n'ai de preuve ni dans un sens ni dans un autre : forcément, c'est très difficile d'avoir une preuve qu'on n'a pas rêvé quelque chose, à part peut-être en s'appuyant sur un principe de causalité, et ce n'est pas non plus très fréquent, à moins de tout noter, qu'on puisse avoir une preuve d'avoir déjà rêvé quelque chose). Bien sûr, ça m'est arrivé de refaire plusieurs fois un rêve d'une chose réelle, ou de faire plusieurs rêves qui se ressemblent, mais retrouver dans un rêve un élément extrait d'un rêve passé, je ne suis pas sûr que ça arrive vraiment, et surtout, même si ça devait arriver, le fait de m'en souvenir dans le rêve ne fait que rendre la chose plus suspecte.

Mais voici quelque chose qui est à la frontière ténue entre le thème récurrent et l'élément récurrent : il y a, dans plusieurs de mes rêves, une petite place à Paris, une place d'aménagement récent et d'architecture moderne, où j'aime bien aller me poser, une place très tranquille, presque cachée, un peu encaissée, en bas de plusieurs rues dont elle fait des sortes d'impasses ; cette place est située non loin d'un quartier d'immeubles modernes ; j'ai parfois du mal à la retrouver. Les thèmes généraux dans tout ça sont des thèmes fréquents de mes rêves (voir notamment les thèmes que je qualifie de promenade à moitié oubliée et de ville art nouveau dans cette entrée) ; et il y a des éléments assez évidents de la vie réelle : je pense par exemple à cette place réelle pas loin de chez moi (qui fait tellement « petit village » qu'on a du mal à croire qu'elle soit en plein Paris), je pense au nouveau quartier Clichy-Batignolles et à celui autour de Tolbiac (et un de ses squares), je pense au genre de parcs que j'aime visiter, peut-être même à ceux que j'aime imaginer, je pense à toutes sortes de promenades que j'ai faites dans Paris et où j'ai pu prendre plaisir à découvrir des nouveaux endroits surtout quand ils semblent un peu cachés.

Néanmoins, cette petite place à laquelle j'ai rêvé trois ou quatre fois (si j'en crois mes souvenirs qui sont peut-être faux !) ne combine pas que des thèmes oniriques généraux et des éléments de la réalité : elle a aussi des caractéristiques assez bien définies comme un mur de pierre qui la ferme sur une bonne partie de son périmètre, un tout petit jardin en son centre, et une atmosphère que j'ai du mal à décrire parce qu'on ne décrit pas facilement un rêve, mais qui est néanmoins plutôt précise dans ma tête.

Et c'est assez désolant, parce que maintenant que cette petite place existe dans ma tête, je suis tout triste qu'elle n'existe pas dans la réalité et que je ne puisse pas aller m'y asseoir pour lire un jour de beau temps.

(samedi)

Le Golem de Pierre Assouline

Je m'étais dit que je tâcherais de faire plus régulièrement des comptes-rendus des livres que je lis, et je ne tiens décidément pas mes résolutions puisque ça fait un moment que j'ai fini de lire Golem de Pierre Assouline [correction : le titre est bien Golem et non pas Le Golem, comme je l'avais écrit, merci à Marc en commentaire]. Il est vrai que je n'ai pas aimé et que les critiques négatives ne sont pas d'un grand intérêt (à moins de les rassembler sur un site comme Amazon où sont susceptibles de les lire les gens qui s'apprêtent à acheter le livre). Néanmoins, les raisons pour lesquelles je n'ai pas aimé ne sont pas totalement dénuées d'intéret, donc je peux en dire quelque chose.

Spoilons allègrement : Golem est l'histoire d'un champion d'échecs, Gustave Meyer, qui est soupçonné du meurtre de son ex-femme, et qui fuit la police. (La victime a été tuée alors qu'elle conduisait : quelqu'un a pris le contrôle de sa voiture à distance ; Meyer est soupçonné essentiellement parce qu'il est doué en informatique.) Parallèlement à ça, Meyer découvre que son ami, le neurologue Robert Klapman, qui a opéré son cerveau (pour des problèmes d'épilepsie), en a profité pour l'utiliser comme cobaye dans une technique destinée à améliorer considérablement la mémoire et le rendre encore meilleur aux échecs. Meyer voyage à travers Paris puis à travers l'Europe, est obsédé par la kabbale et le thème du golem, finit par découvrir que c'est Klapman qui a aussi tué l'ex de Meyer (parce qu'elle tenait un blog dénonçant les pratiques douteuses de grands labos pharmaceutiques et l'éthique douteuse des médecins) et le démasque, renonce à un tournoi d'échecs, et le roman se termine en queue de poisson.

J'avais acheté parce que j'aime bien l'ésotérisme en fiction, surtout quand il joue un rôle soit de contrainte oulipienne, soit de fil directeur à une enquête, soit de cadre d'une falsification (des thèmes à la Calvino, Borges, Eco et d'autres de mes auteurs préférés). J'ai pensé qu'il s'agirait de quelque chose du genre. C'est un peu le cas, mais c'est plutôt raté.

Assouline aime manifestement étaler sa culture. Pour ça, je ne peux pas lui en vouloir : j'en fais autant. Il a lu, donc, le Golem de Meyrink, la nouvelle Funes et la Mémoire de Borges et le Joueur d'échecs de Zweig ; il connaît bien Primo Levi et Paul Celan ; il a vu le film La Nuit du chasseur ; il aime beaucoup le tableau Black on Maroon de Rothko ; il s'est documenté sur les échecs et sur la culture juive ; il a beaucoup voyagé ; et tout ça, il tient à le faire savoir. OK, comme je disais, je fais le même genre de choses, et sans doute moins bien que lui. Pour ma défense, quand je sème des références savantes dans les petits textes que j'écrits, j'y pense généralement comme des sortes d'œufs de pâques qui amuseront (j'espère) le lecteur qui les repère ; il y a peut-être de ça chez Assouline, mais en fait, le plus souvent, il révèle lui-même la clé de la devinette : par exemple quand son héros échange son chapeau avec un autre dans une synagogue à Prague, on pourrait être tout content d'y reconnaître une allusion au Golem de Meyrink — dont le vrai nom est justement Gustave Meyer —, sauf que l'auteur vous vend la mèche un paragraphe plus loin. Passons.

Outre sa culture, Assouline aime étaler ses préjugés. Le livre tout entier est une sorte de plaidoyer contre le transhumanisme, ou contre les ordinateurs, on ne sait pas très bien au juste, peut-être même un pamphlet sur la supériorité des Arts et de la Culture sur les sciences et les techniques. C'est surtout un bel incendie d'hommes de paille. Quand le héros se rend à une réunion de transhumanistes, par exemple, ç'aurait pu être l'occasion d'un débat intéressant, d'un échange d'idées où l'auteur aurait pu montrer sa propre position de manière indirecte et circonstanciée : mais non, les transhumanistes en question sont tellement caricaturaux, leurs arguments tellement ridicules, leur façon de rejeter toute inquiétude tellement agressive, que cela fait penser à la vision que peut avoir un puritain américain d'une réunion d'athées complotant pour faire venir l'Antéchrist. Les échecs semblent être le prétexte pour essayer de suggérer que les humains y jouent avec art, poésie, sentiment, je ne sais quoi, tandis que les ordinateurs y jouent de façon, forcément, « mécanique ». Toutes sortes d'opinions ou de jugements sont insérés dans la narration avec un semblable manque de subtilité. Qu'il s'agisse du courage des blogueurs qui osent défier les pouvoirs établis (je suppose qu'il se voit comme tel). Ou d'une attaque au passage contre Wikipédia (on sait qu'Assouline ne l'aime pas) : il n'y a pas de mesquinerie qui ne mérite d'être saisie.

Le style n'est globalement pas mauvais. Quelques passages sont agréablement écrits ; le livre commence par la très jolie question quand fond la neige où va le blanc ? [précision : comme on me le fait remarquer en commentaire, cette question est classique — je ne le savais pas ça — même si son origine semble fort confuse ; je pense que ça ne change pas grand-chose] ; il est clair que l'auteur sait manier le français. Néanmoins, il y a des changements de rythme assez déplaisants pour le lecteur, et plusieurs fois des révélations importantes noyées dans un paragraphe de banalités, c'est un peu déstabilisant.

Mais au final, mon principal reproche contre ce livre est surtout qu'il ne va nulle part. L'intrigue policière est absolument nulle : la détective de la police (Nina Rocher) qui tâche de retrouver le héros ne fait rien d'un bout à l'autre du livre, que le suivre toujours avec un temps de retard, et son personnage ne sert finalement à rien (c'est dommage, parce qu'elle semblait pouvoir avoir une certaine profondeur) ; le héros ne fait rien que lire et discuter, mais on ne le voit pas vraiment évoluer ; il traque le mythe du golem partout (jusqu'à se faire tatouer les lettres אמת‏‎ sur le bras — comme le golem de l'histoire), et se plaint lui-même de le retrouver partout ; ni le héros, ni son ami qui s'avère être en fait son ennemi, ni quiconque dans le livre (à part la policière), n'ont la moindre personnalité : les raisons du crime sont complètement futiles (c'est moi qui ai supprimé Marie, elle n'aurait pas dû se mêler de nos affaires […], et puis quoi, elle ne voulait pas comprendre que l'avenir de l'humanité est en jeu, qu'on a déjà changé de système de pensée, on a tourné la page et de tels obstacles pour mineurs qu'ils soient doivent être éliminés), et le méchant s'attend, après les avoir révélées, que le héros va jouer tranquillement aux échecs. Et toute cette non-action finit sur une non-fin où il ne se passe essentiellement rien (le héros joue une partie d'échecs où il abandonne dès le premier coup — je suppose qu'on est censé trouver ça admirable — et il part pour aller vivre).

Bref, même si ce livre est très loin d'être le plus mauvais que j'aie jamais lu, et que je puisse assez bien concevoir qu'on l'apprécie, je ne le recommande pas.

(vendredi)

Épreuve théorique de code de la route : suite et fin

J'avais raconté il y a presque un an que j'avais entrepris de passer le permis de conduire — à commencer par l'épreuve théorique générale (a.k.a., « code »). J'ai passée cette épreuve seulement mardi (spoiler : avec succès) : j'avais choisi pour m'inscrire une période où j'avais le temps de m'en occuper, mais mon dossier a été administrativement bloqué pendant si longtemps que cette période faste s'était finie quand les problèmes ont été résolus, et ce n'est donc tout récemment que j'ai pu m'y remettre, d'où énormément de temps perdu. (Ce n'était pas que passer l'épreuve de code elle-même soit long ou compliqué, mais c'est inutile et sans doute une mauvaise idée de le faire avant d'avoir le temps de pouvoir commencer à prendre des leçons de conduite.)

Entre temps, j'ai pu apprendre un certain nombre de bizarreries du code de la route français (j'en ai signalé ici au passage et ici). J'ai aussi pu expérimenter avec plusieurs jeux de question d'entraînement.

Pour le contexte, je rappelle les modalités de l'épreuve : 40 questions à choix multiples, accompagnées d'images fixes ou, pour 4 questions parmi les 40, d'une courte vidéo ; la réponse est un sous-ensemble de {A,B,C,D} qui n'est ni l'ensemble vide ni l'ensemble de tous les choix listés ; on dispose pour répondre de 20 secondes par question, et il faut obtenir au moins 35/40 pour valider.

Mon auto-école proposait des tests d'entraînement sur place avec des questions Codes Rousseau, j'ai aussi acheté un des livres de cet éditeur qui me donnaît accès à un site Web de test (très mal fait, en Flash, et pas mis à jour des dernières réformes), mais l'auto-école me fournissait par ailleurs un accès à un site appelé Prép@code qui avait déjà il y a un an une vieille version (appelons-la v0 dans la suite) et une nouvelle (disons v1), et depuis qui en a créé une troisième (v2). La moralité, c'est que tous ces systèmes d'entraînement sont assez mauvais. Je ne veux pas juste dire que les questions sont mauvaises — j'avais donné quelques exemples tirés du Prép@code v1 l'an dernier — mais aussi qu'ils ne sont pas non plus très représentatifs des questions du vrai examen. Pour preuve, ils sont assez mal corrélés les uns avec les autres : j'ai commencé à me préparer sur Prép@code v1, il ne m'a pas fallu longtemps pour dépasser régulièrement 35/40, puis quand j'ai été confronté aux questions des Codes Rousseau, je les ai trouvées beaucoup plus dures ; puis la version v2 de Prép@code est sortie, mon score a chuté de façon vertigineuse, parce qu'ils avaient remplacé plein de questions auxquelles je commençais à être habitué (Prép@code v1, par exemple, était bourré de questions sur les catégories de sièges pour petits enfants) par d'autres questions encore plus mal rédigées, byzantines et parfois contradictoires. (Il y avait d'ailleurs des questions tellement bizarres que ça ne peut être qu'une erreur technique : par exemple quand le petit texte censé expliquer la réponse dit exactement le contraire de ce que le système accepte comme réponse correcte, ou quand ils échangent une image censée illustrer la question avec celle censée illustrer la réponse. Je pense qu'ils ont voulu sortir leur site v2 tellement à la hâte qu'ils l'ont bâclé. Ceci dit, pour ce qui est de la forme, l'interface des versions v1 et v2 était plutôt bien faite.)

Ce n'est pas tellement la faute des éditeurs de questions d'entraînement. Le problème vient de l'opacité de l'examen, que j'ai dénoncée et que je continue à dénoncer : au lieu d'avoir une banque de questions vraiment importantes (disons de l'ordre de 30 000 questions), et qui pourrait donc être complètement publique, sur laquelle tout le monde pourrait s'entraîner (et qui pourraient faire l'objet de retours publics), il n'y a qu'un nombre relativement restreint de questions possibles à l'examen officiel (1000, peut-être même moins si certaines ont été écartées), donc elles doivent être secrètes, et je suppose que les éditeurs de sites de préparation travaillent sur la base de fuites ou de leur propre intuition. (Ceci pose aussi la question de l'avantage qu'obtient l'éditeur qui a remporté le marché — je vais dire plus bas qui c'est — car même s'il n'a pas le droit d'utiliser telles quelles les questions officielles dans ses préparations, et même s'il n'a pas le droit de faire de publicité autour de ce fait, il dispose d'un savoir-faire qui le met en position préférentielle.)

(mardi)

Pourquoi je continue à penser du mal de HTTPS

Je dois régulièrement expliquer à plein de gens pourquoi mon site n'est pas accessible en HTTPS et pourquoi je continue à ne pas aimer HTTPS : j'avais déjà écrit une entrée à ce sujet, mais d'une part je la trouve mal écrite, et d'autre part il y a beaucoup de choses à y changer maintenant, surtout du fait de l'existence de Let's Encrypt — car à chaque fois que je dis du mal de HTTPS on me répond oui mais Let's Encrypt. Alors oui, l'existence de ce machin est un énorme progrès dans le système mafieux du HTTPS, suffisant pour que j'envisage de m'en servir. Mais il reste que c'est un progrès sur un système aux principes plutôt pourris, au fonctionnement mafieux, aux buts mal définis, à l'architecture mal conçue, et auquel on attribue des vertus qu'il n'a pas. Je veux donc récapituler mes principales objections, qui ne sont pas forcément rédhibitoires (même mises toutes ensembles), mais suffisantes pour me faire juger que ça n'en vaut peut-être pas la peine en tout cas pour un site comme le mien (qui ne suis pas une banque).

J'insiste sur le fait que tout ceci n'est qu'une récapitulation (voire un brain dump), pas un argumentaire bien-formé. Chacun des points ci-dessous mériterait d'être examiné ou documenté soigneusement et, franchement, je n'ai pas le temps de m'en occuper. Il y a donc sans doute beaucoup de préjugés et de choses dont je ne suis pas du tout sûr (du coup, sans doute pas mal d'erreurs), je ne me suis renseigné que minimalement, mais je n'ai vraiment pas le temps d'essayer de me plonger dans ce merdier : normalement je n'aurais pas publié tout ça parce que je n'aime pas publier des choses où je n'ai pris que très peu de temps de vérifier mes renseignements, mais je commence à en avoir marre d'entendre les gens me chanter des variations sur le thème de maintenant que Let's Encrypt existe, il est temps que tu rendes ton blog accessible en HTTPS, souvent avec un ton de reproche.

Je ne vais pas chercher à ordonner les catégories le HTTPS est mal conçu, le HTTPS pose des problèmes, le HTTPS a des limitations et le HTTPS est relié à d'autres choses qui posent elles-mêmes des problèmes (catégories pas forcément exclusives), je fais confiance au lecteur pour retrouver dans quelle boîte ranger chacune des sections qui suit. Je vais sans doute me répéter, aussi, ou séparer des reproches en plusieurs morceaux : ça fait partie du puzzle à rassembler.

Les autorités de certification sont toujours un système mafieux

Par système mafieux je veux dire un système où un site Web doit se mettre sous l'autorité d'un parrain (autorité racine) pour bénéficier de sa protection, le parrain vous faisant payer selon le niveau de sécurité dont vous voulez bénéficier. Tout est absurde dans ce système : il n'est pas possible de se mettre sous la protection de plusieurs parrains (l'allégeance est exclusive) ni pour l'utilisateur d'accorder une valeur différente (si ce n'est tout ou rien) à différents parrains, ni de cumuler plusieurs sources de confiance (comme le fait d'avoir déjà visité le site) ; tous les parrains ne font pas les mêmes efforts de vérification, et par conséquent la protection réellement assurée est, en fait, le minimum de toutes — il suffit qu'un des parrains soit un traître ou un incompétent et tout le système s'effondre jusqu'à ce qu'on trouve moyen de le contenir.

Le nouveau venu Let's Encrypt est un parrain moins rapace que les autres, il distribue sa protection de façon pas trop regardante, mais évidemment, cette protection est minimale : il accorde le certificat à celui qui semble contrôler le domaine de différents points de vérification, ce qui est une vérification faible contre les attaques du type man-in-the-middle. C'est mieux que rien, mais ce n'est pas beaucoup. Tout le HTTPS (ou en tout cas, tout ce qui ne bénéficie pas d'un certificat à « validation étendue », mais ça sert à tout autre chose) est donc aligné sur ce minimum.

Reste qu'en participant à la manie de tout passer en HTTPS, on aide au développement de ce système mafieux qui, même si un des parrains est moins mauvais que les autres, reste un système mafieux. (Comparer avec DANE.)

(lundi)

Aires piétonnes et zones de rencontre

Les règles routières françaises (je dis règles pour être un peu plus large que Code de la route) connaissent trois types de zones de circulation « apaisée » : l'aire piétonne, la zone de rencontre et la zone 30.

[Panneau B54 (aire piétonne)]L'aire piétonne (signalée par le panneau B54, reproduit ci-contre à gauche) est interdite aux véhicules à moteur, mais il peut y avoir des exceptions (riverains, transports en commun, taxis pour desserte locale, livraisons, etc.) ; elle peut être interdite même aux vélos, mais ce n'est normalement pas le cas. Les piétons sont prioritaires sur tous les véhicules (tramways exceptés), et tous les véhicules doivent circuler au pas, même les vélos. Les piétons ne sont évidemment pas tenus de circuler sur les trottoirs (qui, d'ailleurs, n'existent généralement pas).

[Panneau B52 (zone de rencontre)]La zone de rencontre (signalée par le panneau B52 ci-contre et généralement renforcée par un marquage semblable au panneau sur la chaussée) est une apparition plus récente (juillet 2008) : contrairement à l'aire piétonne, les véhicules ont le droit d'y pénétrer normalement ; mais les piétons sont tout de même prioritaires sur tous (tramways exceptés) et la vitesse est limitée à 20km/h, même pour les vélos. Comme dans l'aire piétonne, les piétons ne sont pas tenus de circuler sur les trottoirs, ils peuvent emprunter la chaussée, que ce soit pour la traverser (y compris hors des passages prévus à cet effet) ou pour y circuler. (En revanche, les piétons, comme les voitures, ne doivent pas stationner sur la chaussée, c'est-à-dire rester immobiles au milieu de la route, ce qui se comprend bien par la nécessité de ne pas bloquer la circulation.) Par ailleurs, il y a normalement des doubles-sens cyclables.

[Panneau B30 (zone 30)]La zone 30 est simplement une zone dans laquelle la vitesse est limitée à 30km/h (comme c'est une limitation par zone, elle s'applique jusqu'à un panneau de fin de zone plutôt que jusqu'à la prochaine intersection). Il y a normalement des doubles-sens cyclables.

Les détails sur ces différentes zones, ainsi que leurs intentions, sont précisés dans ce document de la Sécurité routière (Certu Zones de circulation apaisée fiche nº2, août 2009 ; pas mal fait, à part que les images sont pixellisées à une résolution ridiculement basse). On y apprend par exemple les principales raisons pouvant amener à définir une zone de rencontre : rues résidentielles de desserte locale à rendre plus conviviales, quartiers historiques à protéger sans les piétonniser complètement, espaces publics et lieux de correspondances où doivent cohabiter piétons et véhicules, interruption d'une zone piétonne pour laisser passer les véhicules, rues commerçantes où on cherche à concilier fréquentation piétonne et circulation possible, rues trop étroites pour disposer d'un trottoir, zones conflictuelles au sein d'une zone 30 où on souhaite donner la priorité aux piétons.

Je me plains souvent de toutes sortes de choses, mais là, globalement, je trouve que ces trois catégories sont plutôt bien pensées, et que la zone de rencontre est un compromis plutôt raisonnable sur le principe : laisser les voitures circuler, mais à vitesse très réduite, et surtout, en rendant aux piétons l'accès à l'ensemble de la chaussée. (Je dis rendre, parce que les voitures ont conquis cet espace au détriment des piétons : à ce sujet, cet article ou celui-ci, qui racontent l'histoire de la chose aux États-Unis et du concept de jaywalking, sont assez intéressants.)

Le concept de zone de rencontre est apparu, si je comprends bien, aux Pays-Bas comme zone résidentielle (actuellement signalée par ce panneau), puis véritablement en Suisse en 2002 (où les zones de rencontre sont figurées par ce panneau), et en Belgique l'année suivante. D'autres pays ont adopté le concept depuis (l'Autriche semble avoir des Begegnungszonen à 20km/h et d'autres à 30km/h ; voici un article sur des essais dans ce sens aux États-Unis).

Sinon, en France, à côté des aires piétonnes et zones de rencontre, il existe aussi un machin appelé les voies vertes (signalées par le panneau C115), datant aussi de 2008. Les voies vertes sont réservées aux piétons et véhicules non motorisés. La différence avec l'aire piétonne est un peu byzantine, mais un point de différence est que les cyclistes ne sont pas tenus de rouler au pas sur une voie verte, alors que dans une aire piétonne, en principe, si (enfin, si les cyclistes respectaient quoi que ce soit du Code de la route…) ; je pense qu'il y a aussi une différence dans la logique d'affectation en ce que la voie verte est une voie de circulation, tandis que l'aire piétonne est une zone, m'enfin, tout ça est un peu confus. Je ne sais pas si c'était vraiment indispensable d'inventer un nouveau truc pour ça.

Mon propre quartier (la Butte-aux-Cailles) est classé zone de rencontre en temps normal, et le dimanche dans la journée il est maintenant même transformé en aire piétonne (il y a des barrages). La logique est une combinaison de certaines raisons évoquées plus haut pour définir une zone de rencontre : c'est un quartier historiquement intéressant (et d'ailleurs touristiquement intéressant : il y a de plus en plus de gens qui y viennent pour photographier les œuvres de street art qu'on y trouve, il y a maintenant même des visites guidées des rues) formé de rues pavées avec un caractère de petit village à la fois résidentiel et commerçant, il y a beaucoup de flâneurs dans les rues, surtout aux heures d'ouverture des nombreux restaurants et bars, il y a aussi des enfants qui peuvent déboucher à n'importe quel endroit, et certaines rues sont trop étroites pour avoir un vrai trottoir. La classification en zone de rencontre est donc éminemment logique.

Sauf que vous vous devinez bien de ce qui se passe : comme le feu orange, tout ça n'est absolument pas respecté.

La limitation de vitesse à 20km/h est une vaste blague : déjà, si les gens consentent à descendre à 30km/h, c'est un peu miraculeux, mais 20km/h, on ne voit jamais. (Il y a beaucoup d'automobilistes qui traversent pour éviter des encombrements sur des axes voisins, généralement ils sont de mauvaise humeur, ça s'entend très bien à leur manière de rentrer dans le quartier en accélérant, tout contents de quitter la rue du Moulin des Prés embouteillée.)

Quant au fait que les piétons ont le droit de circuler sur la chaussée, vous imaginez bien ce qui se passe si quelqu'un commence à faire ça (ce qui n'est pas forcément pour emmerder les voitures : il y a des trottoirs qui n'en sont vraiment pas) : on se fait klaxonner dessus, crier de se pousser, par des gens sûrs d'être dans leur droit. (Les trottoirs c'est pas pour les chiens !) Les surveillants des écoles primaires ou maternelles du quartier, que je croise parfois accompagnant des groupes d'enfants allant d'un endroit à un autre, ne s'y trompent d'ailleurs pas : ils font marcher les écoliers bien sur le trottoir et traverser aux passages piétons — alors qu'en principe une zone de rencontre n'a besoin ni de l'un ni de l'autre.

Pour défendre un peu les automobilistes, il faut reconnaître deux choses :

D'abord, l'indication de zone de rencontre est facile à rater. Les panneaux à l'entrée ne sont pas très visibles, certains sont mal orientés (j'ai essayé de les remettre à la main, mais c'est trop difficile). Il n'y a aucun panneau de rappel. (Moi j'en mettrais à chaque intersection, mais je me demande s'il n'y a pas une règle de droit interne complètement stupide qui dit qu'on ne peut pas rappeler un panneau de zone : en tout cas, je n'ai jamais vu ça.) Le marquage au sol est rare, lui aussi peu visible, souvent effacé. Et la zone n'a pas vraiment les caractéristiques qu'on pourrait attendre d'une zone de rencontre, comme justement l'absence de trottoirs bien délimités et de passages piétons. À ce sujet, je tire de cet autre document de la Sécurité routière (Certu, fiche technique La zone de rencontre, novembre 2008) la remarque suivante : La signalisation ne suffit souvent pas pour la lisibilité et à la crédibilité d'une zone réglementée. C'est pourquoi il est prévu que des aménagements complètent la signalisation, cette notion est incluse dans la notion d'aménagement cohérent.

Ensuite, personne ne sait ce que c'est qu'une zone de rencontre. Ceux qui ont passé le permis il y a plus de 10 ans n'ont jamais été interrogés sur ces nouveautés, et la Sécurité routière n'a pas fait de publicité sur les médias quand les panneaux ont été introduits (je sais que nul n'est censé ignorer la loi, mézenfin, on a le droit de les aider…). Certes, le panneau est assez clair et bien pensé, on peut deviner ce qu'il veut dire, en tout cas il est évident que la vitesse est limitée à 20km/h, mais je pense que ça ne suffit pas.

Il y a aussi le fait que le terme zone de rencontre n'est pas terrible. Une aire piétonne, on comprend tout de suite. Une zone 30, ça se comprend aussi. Mais une zone de rencontre, kézako ? On pense que c'est un synonyme de point de rendez-vous ou quelque chose de ce genre. Peut-être que zone semi-piétonne ou zone piétonne mixte aurait été moins obscur.

J'ai commencé une fois à vouloir expliquer le concept à un livreur qui m'avait engueulé parce que je marchais sur la route (je voulais éviter des échafaudages d'où tombent régulièrement des choses pas très propres) : je lui ai parlé de zone de rencontre, il n'avait visiblement jamais entendu le terme, je lui ai dit que la vitesse était limitée à 20km/h, il m'a prétendu que je ne pouvais pas savoir s'il faisait plus (comme j'ai l'esprit de l'escalier, je n'ai pas pensé à lui expliquer que s'il avait fait toute la longueur de la rue dans le temps où moi, marchant normalement, j'en avais parcouru le quart, il ne pouvait certainement pas avoir circulé à moins que 20km/h), je lui ai dit que les piétons avaient priorité et pouvaient circuler partout, il m'a demandé comment il était censé passer, je lui aurais répondu qu'il pouvait demander gentiment ou bien patienter quelques mètres que je tourne et que par rapport à 20km/h de toute façon je ne le ralentissais pas tant que ça, mais globalement il était évident qu'il me prenait pour un affabulateur complet qui avait sorti de mon chapeau des règles inexistantes (ce qui est faux) ou du moins inappliquées (ce qui, malheureusement, est juste). Que faire ? Je n'allais pas passer la journée à le retenir par plaisir pervers de lui faire la leçon et au risque de me faire écraser, il est passé en me maudissant.

J'ai peur, aussi, que la piétonnisation du quartier le dimanche n'augmente encore la confusion : que les automobilistes se disent, puisqu'on n'est pas dimanche, aucune règle particulière ne s'applique — et pensent que les panneaux « zone de rencontre » concernent cette piétonnisation.

Bref, je trouve tout ça très bien en théorie, mais en pratique, je ne sais pas ce qu'on peut faire. Peut-être qu'une première étape serait d'informer les riverains, leur rappeler ce qu'est une zone de rencontre et quelles sont les règles (et signaler clairement la différence avec la piétonnisation du dimanche), à la fois pour ceux qui circulent en voiture, et aussi pour les piétons (si plus de gens ont conscience qu'ils peuvent marcher sur la chaussée et y sont prioritaires, cela changera certainement la dynamique).

(À une certaine époque au moins, un adjoint d'un maire d'arrondissement de Paris lisait ce blog. Je ne sais pas si c'est toujours le cas, mais je peux lancer des gros hint, hint à tout hasard.)

(dimanche)

Petite visite au parc du Sausset

J'avais écrit le mois dernier à quel point j'avais apprécié une visite au parc Georges Valbon de La Courneuve. Aujourd'hui, mon poussinet et moi sommes allés visiter le parc du Sausset (à Villepinte ; voyez ici sur OSM), notamment pour comparer. L'accès depuis Paris en est très simple : il suffit de prendre le RER B et de descendre à la station Villepinte, qui est en plein milieu.

Il y a des ressemblances stylistiques manifestes entre le parc de La Courneuve et celui du Sausset : peut-être les historiens du futur catalogueront-ils ce style comme le style des jardins paysagers français (franciliens ? séquanodionysiens ?) du tout début du 21e siècle. Peut-être pourrait-on dire, dans une comparaison très hofstadterienne, que ce style est au jardin classique à la française ce que l'architecture de Jean Nouvel est à celle de Jules Hardouin-Mansart. Je ne sais pas au juste ce que ça veut dire, mais en tout cas j'aime bien.

Entre autres ressemblances, les deux parcs ont été construits sur l'emplacement d'anciens marais, pas entièrement supprimés mais domestiqués : des lacs aménagés et des rivières conservent le souvenir de l'eau qui devait régner partout. Les deux parcs présentent, sous une unité de style que je n'arrive pas à définir précisément, une certaine variété de paysages, entre les grandes pelouses ouvertes coupées d'allées rectilignes, et les sous-bois à l'apparence plus sauvage. De façon plus anecdotique, les deux parcs sont coupés par une ligne de chemin de fer (s'agissant du parc du Sausset, c'est le RER B). Les deux sont assez populaires, mais suffisamment vastes pour qu'on ne se sente vraiment pas à l'étroit : de toute façon, ce qui est populaire, ce sont tous les endroits où pique-niquer ou pour faire bronzette sur une serviette posée sur l'herbe, éventuellement les jeux pour enfants, et dès qu'on s'en écarte, il n'y a plus grand monde.

Le parc du Sausset est environ deux fois plus petit (2.03km²) que celui de La Courneuve, ce qui me fait prendre conscience, retrospectivement, à quel point ce dernier est immense. Il est divisé en quatre zones : dans le sens des aiguilles d'une montre, la Forêt (plutôt les sous-bois en vérité) au nord-ouest, les Prés carrés (grandes pelouses, marais, lacs) au sud-ouest, le Bocage (aménagé de façon à imiter un peu la campagne française traditionnelle) au sud-est, et le Puits d'Enfer (dont je ne comprends ni le nom ni, si j'ose dire, la logique sous-jacente) au nord-est.

Si je dois résumer les principales différences que j'ai trouvées entre ces deux parcs, je dirais en faveur du parc du Sausset que ce dernier est un peu plus sauvage (ou d'apparence sauvage, disons, parce que tout ça est évidemment très artificiel) et peut-être plus varié, ou différemment varié, que celui de La Courneuve (disons qu'il y a vraiment des différences frappantes entre les quatre zones, alors qu'au parc Georges Valbon les variations sont plus locales, plus graduelles) ; la partie Bocage est vraiment réussie et très tranquille, et le labyrinthe (dans les Prés carrés) est mignon ; en contrepartie, il fait moins usage de relief que le parc de La Courneuve (où il y a des points de vue vraiment magnifiques), et le système de lacs du Sausset est moins intéressant.

Mais en fait, il y a surtout une chose qui m'a déplu, c'est le nombre d'endroits qui sont essentiellement des culs-de-sac : j'ai dit que le parc était divisé en quatre zones, ce qui est plutôt sympa, mais ce qui est moins sympa, c'est qu'il n'y a apparemment que très peu de points de passage entre ces zones, un seul entre les Prés carrés et le Bocage (ça peut se comprendre, il y a une ligne de RER à franchir), un seul entre le Bocage et le Puits d'Enfer (plus difficile à comprendre, il n'y a qu'une route pas si passante entre les deux), et aucun entre le Puits d'Enfer et la Forêt (d'accord, il y a de nouveau le RER, mais enfin, c'est vraiment pénible, là). Du coup, la partie Puits d'Enfer tout entière est une sorte de culs-de-sac pas très intéressant (c'est peut-être la raison de son nom ?), on ne peut même pas commodément rejoindre la gare de Villepinte, et tout l'est du Bocage est aussi un peu enclavé parce qu'il n'y a pas de sortie par là : c'est dommage. (Après, l'aspect positif de la chose, c'est que les régions peu accessibles depuis les parkings sont peu fréquentées : donc si on aime le calme, c'est finalement bien.)

Photos ici (pas très intéressantes, il faut bien le dire)

PS : Si quelqu'un sait éditer OpenStreetMap, il faudrait effacer ce pont, qui a été retiré (vraiment retiré, pas juste fermé : un panneau précise que c'est à cause de risques d'effondrement, et promet qu'il reviendra au printemps 2016 [sic], donc je suppose que c'est tout à fait définitif) ; comme nous avions planifié notre promenade en comptant sur l'existence de ce pont, ça nous a assez contrarié. Mise à jour : Merci à Tayou974 qui a été très réactif. Mise à jour 2 () : En fait, non, le pont apparaît toujours là, je ne sais pas pourquoi (je ne comprends rien à l'historique d'OpenStreetMap).

(vendredi)

14 juillet 2017

C'est gentil de la part de Macron et Trump de faire un grand défilé et des feux d'artifices pour célébrer 1.5Gs (1 500 000 000 secondes) d'Unix, mais dans cette culture, il est plutôt d'usage d'attendre 1.5Gis (1 610 612 736 secondes) pour célébrer. Rendez-vous 2021-01-14T09:25:36+01:00 pour fêter l'écoulement des ¾ du temps avant la fin du monde, donc.

(mercredi)

Quelques lectures récentes

Je ne parle pas souvent sur ce blog des livres que je lis. Encore moins que des films que je vois : une raison évidente est que regarder un film est une expérience plus concentrée dans le temps, donc j'ai un moment clair où en parler, alors qu'un livre, souvent, quand je ne l'ai pas fini je ne veux pas en parler parce que je ne l'ai pas fini, et quand je l'ai fini je ne veux pas en parler non plus parce que je suis passé à autre chose, ou parce que j'en ai eu marre. Ceci est d'autant plus vrai que je lis lentement. Et de toute façon je ne lis pas beaucoup. Entre autres parce que je ne lis quasiment qu'aux toilettes[#], et je n'y passe pas ma vie.

Néanmoins, j'ai lu un peu plus que d'habitude le mois dernier, et il y a quelques livres dont je pourrais dire du bien, alors en voici une liste, en en profitant pour inaugurer une nouvelle « catégorie » sur ce blog :

Les salauds de l'Europe de Jean Quatremer

Sous-titré guide à l'usage des eurosceptiques et écrit par un chroniqueur qui connaît parfaitement les rouages de l'Union européenne, ce livre commence par tracer un tableau extrêmement noir de l'UE, essentiellement une compilation de tous les reproches les plus courants sur ce registre, avant d'entreprendre, dans les chapitres qui suivent, de les décortiquer et de nuancer le tableau. Ce qui est intéressant est qu'il irritera sans doute à la fois les eurosceptiques (auxquels il prétend s'adresser) et les europhiles, mais les deux auront beaucoup à y apprendre s'ils acceptent d'aller au-delà de cette irritation.

Si on imagine que l'auteur, généralement classé comme défenseur de l'UE, va retenir ses coups, on se trompe : il ne ménage pas, par exemple, le monstre bureaucratique qu'est la Commission, et notamment la Commission Barroso. On pouvait s'imaginer qu'après un premier chapitre recensant tous les poncifs europhobes, il allait les réfuter : ce n'est pas le cas, il ne dit pas c'est faux, mais c'est plus compliqué, car son propos est que pour défendre l'Europe et pourquoi elle est nécessaire, les réponses rapident ne conviennent pas, il faut prendre son temps, et c'est ce qu'il fait dans ce livre tout en nuances. Bref, je recommande vivement (si on est prêt à ne pas camper sur ses positions).

Le petit livre des couleurs de Michel Pastoureau et Dominique Simonnet

J'aime bien les livres pas trop épais et, là, je suis servi (120 pages). Mais pour être bref, il n'en est pas moins fascinant. Comme son nom l'indique, il s'agit d'un livre sur les couleurs : plus exactement, sur l'histoire des couleurs, c'est-à-dire de la symbolique de celles-ci et de leur place dans notre culture et notre société (c'est la spécialité du premier auteur). Écrit sous forme d'interview (du premier auteur par la seconde), il reprend une par une les couleurs que Michel Pastoureau considère comme « vraies », à savoir le bleu, le rouge, le blanc, le vert, le jaune et le noir, puis un dernier chapitre pour évoquer brièvement ce qu'il considère comme des « demi-couleurs » (violet, orange, rose, marron et gris), en retraçant à chaque fois l'importance de la couleur, les rôles qu'on lui donne et les images qu'on lui associe. Il ne s'intéresse pas du tout à la physique ou à la physiologie des couleurs, ni à peine à leur linguistique (cf. ce que je racontais ici), au moins dans ce très bref ouvrage, mais il a le temps de dire beaucoup de choses intéressantes, dont certaines qui m'ont surpris (par exemple : qu'au Moyen-Âge les mariées étaient généralement en rouge, que personne avant le 17e siècle n'imaginait le vert comme mélange de bleu et de jaune, que l'association du vert avec la nature est relativement récente, que l'opposition du noir au blanc ne s'est vraiment imposée qu'avec la photographie, etc.).

L'étiquette à la cour de Versailles de Daria Galateria (traduit de l'italien)

Ce livre-là ne m'a pas franchement emballé. Le sujet est intéressant, mais l'exposition est brouillonne (sans doute parce qu'elle ne se veut pas très sérieuse, et l'auteure prétend au moins autant amuser qu'instruire). Il s'agit d'un recueil d'anecdotes tirées essentiellement de chroniqueurs tels que Saint-Simon, Dangeau, Breteuil…, et présentées sous forme alphabétique de sujet. On a du mal à s'y retrouver, d'abord parce que l'ordre alphabétique n'est pas franchement terrible pour un livre qu'on va typiquement lire linéairement, et ensuite parce que l'auteure n'arrête pas de changer d'époque, ou de faire des coqs-à-l'âne sans les annoncer.

Le thème général est que les règles d'étiquette concernant la préséance ou les privilèges étaient invraisemblablement compliquées, pleines d'exceptions historiques apparues parce que tel jour le roi a permis à Untel de faire ceci-cela et depuis c'est devenu un privilège hériditaire, et peut-être que d'autres réclament d'avoir aussi ce privilège, et ces règles finissent par s'accumuler (Machin a le droit d'entrer dans la chambre du roi par telle porte uniquement, Machin par telle autre porte, ce genre de choses), et comme les règles sont arcanes, les disputes sont aussi incessantes, en particulier en matière de préséance. (La personne qui « a la main », c'est-à-dire la préséance, passe devant et passe à droite, notamment au moment de franchir les portes. Globalement parlant, les plus hauts placés après le roi et la reine sont les fils et filles de France, c'est-à-dire les enfants du roi, d'un roi passé ou du Dauphin, puis les petits-fils et petites-filles de France, puis les princes de sang c'est-à-dire les descendants de Hugues Capet, puis les ducs et pairs ; mais là où ça se complique est qu'il faut insérer quelque part les cardinaux, les membres des familles régnantes étrangères, etc., et que de toute façon la préséance ne sera pas la même selon qu'on est à Versailles ou au Louvre, ou au parlement, ou à la messe, ou que sais-je encore.)

Bon, peut-être que l'exposition brouillonne convient bien, finalement, à un sujet qui est lui-même plein de bizarreries inexplicables. Et j'ai appris des choses qui m'ont amusé ; par exemple qu'un des privilèges recherchés à Versailles était le « privilège du pour », qui signifiait simplement que l'accès au logement qu'on occupait à Versailles était marqué (à la craie) pour le duc de X. (par exemple) plutôt que simplement le duc de X. : ce privilège n'apportait rien de plus que ce seul mot (et pas, par exemple, un logement plus décent), mais comme la formulation pour était, au départ, celle utilisée pour les princes de sang, d'autres ont voulu l'avoir à leur tour.

(Cela me fait penser que, sur un sujet proche et dans une exposition nettement moins brouillonne, j'avais bien aimé le livre Le Roi-Soleil se lève aussi de Philippe Beaussant.)

L'ordinateur du paradis de Benoît Duteurtre

J'avais déjà lu quelque chose de Benoît Duteurtre, je ne me rappelle plus bien quoi, mais je me rappelle que j'avais passé beaucoup de temps à me demander si c'était « du lard ou du cochon », et c'est un peu pareil ici. L'auteur a un talent certain pour présenter des personnages gentiment ridicules, qui ont des opinions ou des actions finalement raisonnables et dont on ne sait pas bien si on doit rire d'eux ou avec eux, ni ce que lui (l'auteur) essaie de nous dire, si tant est qu'il essaie de nous dire quelque chose. Il aborde des questions graves sur un mode léger, et finalement ne répond pas à la question, ou bien semble proposer des réponses contradictoires et qui vont mettre mal à l'aise ceux qui croient une chose et ceux qui croient son contraire, en se moquant autant des uns que des autres.

Ici s'entremêlent l'histoire de quelqu'un qui se présente aux portes du paradis pour y être admis (ou pas) et qui se retrouve en fait face à un cauchemar bureaucratique, et une autre, sur Terre, où le président d'une Commission des Libertés publiques se retrouve au cœur d'un scandale parce qu'il a prononcé une phrase politiquement très incorrecte qui a été enregistrée à son insu ; puis surviennent des dérèglements informatiques qui font que tout le monde commence à recevoir des messages électroniques (emails, SMS, historiques de navigateurs) d'autres gens, y compris des données censées avoir été effacées. Les idées sont intéressantes, les sujets évoqués le sont avec une certaine subtilité : le respect de la vie privée à l'heure d'Internet, la confidentialité en ligne, le droit à l'oubli, le pouvoir des ordinateurs dans notre vie, les limites du politiquement correct, et le monde parfois absurde ou inhumain auquel peut conduire une rationalisation excessive ; l'auteur fait preuve d'un humour assez efficace, mais au final, comme je le dis plus haut, on ne sait pas très bien où il veut en arriver ni de qui il se moque (de ceux qui applaudissent le progrès ou de ceux qui regrettent toujours comme c'était âvant ? les deux, sans doute) : ce n'est pas forcément grave, s'il veut juste nous encourager à réfléchir, mais on peut trouver irritante cette façon qu'a Benoît Duteurtre de se moquer sans vraiment se mouiller.

Openly Straight de Bill Konigsberg

C'est un roman classé young adult (jeunes adultes, quoi, mais on ne dit pas trop ça en français pour parler d'une catégorie littéraire), gay&lesbien (enfin, en l'occurrence, gay). J'apprécie souvent les livres young adult pour leur fraîcheur (même si je ne suis vraiment plus dans le public visé), et j'apprécie les livres LGBT parce que, oui, je ressens un manque à combler à ce sujet. Mais souvent on se retrouve avec des histoires toutes calquées sur le même modèle, celui du lycéen qui fait face à l'homophobie de sa famille et/ou de ses professeurs et camarades de classe, a pour seule alliée sa meilleure amie, et finit par s'épanouir en représentant Roméo et Juliette ou le Songe d'une nuit d'été le dernier jour de classe, sous la direction d'un prof d'anglais sage et tolérant. Je ne dis pas que cette histoire n'est pas intéressante, et il est utile qu'elle soit racontée, mais j'ai maintenant l'impression de l'avoir lue douze fois sans compter les fois où je l'ai vue à la télé ou au cinéma.

Openly Straight présente une variation intéressante sur ce thème : la famille du héros, Rafe, n'est pas du tout homophobe, au contraire, ses parents fêtent son coming out au restaurant comme on fêterait un anniversaire, et en fait, il n'y a essentiellement aucun personnage homophobe dans toute l'histoire (en tout cas pas ouvertement, en tout cas pas en position centrale à l'intrigue) ; il y a bien un prof d'anglais sage et tolérant, mais pas de pièce de Shakespeare. Le point de départ est que Rafe, qui quitte sa ville native de Boulder (Colorado) pour continuer sa scolarité dans un lycée pour garçons en Nouvelle-Angleterre, en a simplement assez d'être l'« homo de service » et décide de rentrer dans le proverbial placard. Je ne vais pas résumer les péripéties qui s'ensuivent : elles ne sont ni très complexes ni incroyablement originales, mais elles paraissent vraiment naturelles et pas du tout forcées — ni happy end parachuté ni fin tragique tout aussi factice.

La plupart des personnages ont une vraie épaisseur psychologique, et les rapports humains sont assez touchants. Mais surtout, en évitant toute caricature, l'auteur réussit à toucher à des questions assez délicates : sur la sincérité vis-à-vis de ses amis (est-ce un mensonge d'essayer de se faire passer pour hétéro si on ne l'est pas ? est-ce opportun si on ne risque pas d'être victime d'homophobie ?), sur le rapport entre masculinité et homosexualité (cf. ici), sur les étiquettes qu'on se colle ou que les autres vous collent, y compris des gens bien intentionnés. Et, ce qui est agréable, l'auteur n'essaie pas de forcer une réponse à ces questions : il suggère au lecteur d'y réfléchir, comme son héros y réfléchit, mais n'impose pas vraiment une conclusion.

Bon, on pourra me dire que je suis injuste parce que je reproche à Duteurtre de poser des bonnes questions sans y répondre et que je félicite Konigsberg pour exactement la même chose. Pour éclaircir mon point de vue, donc : le problème est que Duteurtre donne l'impression d'avoir un avis et de le cacher derrière le fait qu'il se moque de tout le monde — alors que Konigsberg donne l'impression de ne pas avoir lui-même de position vraiment tranchée.

Certains points soulevés (je ne parle pas du tout d'une ressemblance de l'intrigue !) m'ont un peu fait penser au film Get Out, que je recommande très vivement au passage : Get Out fait réfléchir à la manière dont le racisme peut être entretenu par autre chose que la haine, y compris par des gens animés des meilleures intentions (enfin, dans le film c'est un peu plus compliqué, mais je ne vais pas spoiler) : dans une certaine mesure, Openly Straight évoque des thèmes analogues s'agissant de l'homophobie (ou disons, du fait de coller des étiquettes sur les gens, dont ils n'ont pas forcément envie, en fonction de leur orientation sexuelle).

Ma liste de livres à lire prochainement : Golem de Pierre Assouline (déjà bien entamé), Kalpa impérial d'Angélica Gorodischer (décrit comme une sorte de version des Villes Invisibles de Calvino — un de mes livres préférés — dans un empire galactique : je suis bien obligé d'essayer de lire ça !), Titus n'aimait pas Bérénice de Nathalie Azoulai, et Miranda and Caliban de Jacqueline Carey.

[#] À l'exception des livres et articles de maths, que je lis notamment pendant que je fais de la musculation. Oui, c'est bizarre, mais en fait le rythme marche très bien : je lis pendant trois minutes en me reposant après un exercice, puis je laisse reposer le temps de faire l'exercice suivant. Ça m'évite de lire en diagonale, et le fait de faire travailler alternativement cerveau et muscules pendant que l'autre se repose fonctionne gobalement bien : je recommande.

(dimanche)

Quel est le diagramme d'Euler de la législation française sur les médicaments ?

La question que je pose dans le titre de cette entrée, et à laquelle je ne compte d'ailleurs pas répondre, n'a fondamentalement aucun intérêt, mais elle est assez représentative, je pense, de la manière dont les matheux — ainsi que toutes sortes de geeks — pensent le monde et recherchent la clarté, et, in fine, de la raison pour laquelle ils ont du mal à comprendre les juristes — par exemple — et réciproquement.

Il existe en France des substances qui ne peuvent être vendues qu'en pharmacie : parmi elles, il en existe qui ne peuvent être délivrées que sur ordonnance ; parmi celles-ci, il existe des catégories différentes (selon l'AMM — Autorisation de Mise sur le Marché) appelées liste I et liste II ; la différence essentielle réside dans le fait que les ordonnances pour la liste II sont renouvelables sauf mention expresse du contraire. Mais c'est loin d'être tout : il y a des médicaments à prescription restreinte : réservés à usage hospitalier, à prescription hospitalière, à prescription initiale hospitalière, réservés à certaines spécialités médicales, nécessitant une surveillance particulière — et il n'est pas clair comment ces catégories peuvent se combiner. Il y a les stupéfiants ou psychotropes disponibles sur ordonnance sécurisée, qui sont encore autre chose (mais peut-être que ça se combine d'une certaine manière avec ce que je viens de dire). Il y a la possibilité de prescrire hors AMM. Même parmi les médicaments en vente libre (ou prescription facultative, je ne sais pas si c'est complètement synonyme), il semble qu'il y ait des catégories différentes : certains sont en « accès direct », par exemple, d'autres pas (et il semble qu'il y ait eu des évolutions relativement récentes à ce sujet, mais je trouve des informations assez contradictoires en ligne). Certains médicaments en vente libre ont le droit de faire de la publicité, mais je ne sais pas si c'est la même chose que ceux qui sont en accès direct. Il y a des médicaments qui sont (sous certaines conditions) remboursés par la Sécurité sociale, et il y a sans doute plein de catégories pour ça aussi, et ça doit intersecter les catégories précédentes de façon compliquée. Il y a les grandes catégories que sont l'allopathie et l'homéopathie (a.k.a., placébo vendu cher) et sans doute d'autres encore : je ne sais pas s'il y a, par exemple, des médicaments homéopathiques listés (soumis à prescription obligatoire). Et puis, il y a des choses qui ne sont pas des médicaments, mais qui en sont proches : les compléments alimentaires, par exemple — je ne sais pas dans quelle mesure on peut les vendre ailleurs qu'en pharmacie ; il y a la parapharmacie, dont je ne comprends pas du tout la réglementation. Accessoirement, il est possible que certaines des catégories que j'évoque s'appliquent aux médicaments et d'autres aux substances contenues dans ces médicaments (la même substance peut faire l'objet de catégories différentes selon la posologie, la forme galénique ou peut-être la phase de la Lune ; mais si des catégories classifient la substance, elles s'« héritent » probablement à tout médicament les contenant).

Bref, il y a un nombre énorme de catégories dans lesquelles un plus-ou-moins-médicament peut tomber. Et il n'y a aucun endroit (que je sache) où toutes ces catégories sont rassemblées de façon lisible : dans le Code de la Santé publique, par exemple, tout ça est éparpillé en plein d'endroits et il est complètement impossible de s'y retrouver.

Ce qu'on voudrait voir, donc, pour comprendre un peu tout ce bordel, c'est un diagramme de Venn ou (plutôt) un diagramme d'Euler (voyez sur Wikipédia si vous ne savez pas ce que c'est, ils donnent plein de jolis exemples) montrant toutes les combinaisons de catégories possibles, avec des exemples dans chaque combinaison possible ; mieux, pour les combinaisons qui ne sont pas réalisées, on aimerait savoir s'il y a un empêchement légal à ce que la combinaison existe (peut-être qu'il n'est pas légalement possible de classifier un stupéfiant en liste II ou, je suppose, de le mettre en vente libre), ou s'il s'avère simplement qu'il n'en existe pas (peut-être qu'il est légalement possible qu'un médicament homéopathique soit à prescription restreinte mais que ça ne se produit pas dans la pratique).

Enfin, quand j'écris que c'est ce qu'on voudrait, je veux dire que c'est ce que je voudrais : quand on commence à me parler de toutes ces catégories, j'ai naturellement envie de poser cette question-là, et je pense que c'est assez typique de la manière dont un matheux/geek a envie d'éclaircir une situation embrouillée. Ça s'applique à plein de contextes où il existe toutes sortes de catégories qui peuvent s'appliquer à une ontologie, mais ça revient particulièrement souvent quand il s'agit de la réglementation (notamment parce que le droit a vraiment tendance à faire des catégories transverses les unes aux autres — au sens où toutes, ou au moins beaucoup, des combinaisons booléennes possibles sont représentées[#], tandis que, par exemple, les biologistes aiment bien classifier les êtres vivants en clades, et les clades ne sont justement pas transverses, ils sont forcément soit imbriqués soit disjoints, c'est-à-dire que leurs diagrammes d'Euler sont, de fait, des arbres, à savoir les arbres phylogénétiques).

Je ne sais pas à quel point cette façon de penser est répandue. Combien de gens, quand on commence à leur parler de différentes catégories interagissant de façon un peu complexe, vous arrêtent et vous disent, une minute, est-ce que tu pourrais clarifier tous les cas de figure possibles ? Manifestement, je ne suis pas le seul, et ça ne doit pas être uniquement un truc de matheux ou de geek, parce que, par exemple, ce diagramme d'Euler des pays européens (par ailleurs excessivement utile !) existe, et je l'ai vu à différents endroits, y compris (pas exactement celui-là mais une variante moins compliquée) page 7 du Livre Blanc sur l'avenir de l'Europe publié en mars dernier par la Commission Juncker (j'en avais récupéré une copie à Bruxelles en mai) ; voir aussi celui-ci, qui répond à des « questions fréquemment posées » sur la différence entre la Grande-Bretagne, le Royaume-Uni et les Îles britanniques. Mais a contrario j'ai feuilleté un certain nombre de livres de droit sur plein de sujets, et je n'ai jamais vu de diagrammes d'Euler même dans des cas où ils seraient bien utiles ; ceci dit, en fait, je n'ai pas vu des masses de diagrammes tout court, même dans des cas où ils seraient bien utiles : je soupçonne qu'il y a une mentalité auprès des juristes qui veut que ce soit mal vu de se salir les mains à faire des diagrammes, ça ne fait pas sérieux ou quelque chose comme ça, et on ne va quand même pas en mettre dans un texte de droit (après, je peux comprendre l'argument que ça rendrait la Loi plus difficile à diffuser), au grand maximum on met un tableau en annexe. Bref, tout ça n'est pas forcément révélateur de grand-chose (enfin, si, mais pas forcément d'une façon de penser les combinaisons booléennes de catégories).

Mais ce n'est pas qu'une question de représentation. En essayant de comprendre les circonstances dans lesquelles les différents feux d'une voiture doivent être allumées (il faudrait que je redise des choses sur le permis de conduire, mais pour faire court, je ne l'ai toujours pas passé), et en essayant du coup de comprendre les articles du Code de la route sur le sujet, je me suis surtout rendu compte que le rédacteur de ces articles n'avait lui-même rien compris : les articles R416-5 et R416-6, notamment, sont tellement mal écrits qu'ils en arrivent à vouloir dire qu'une voiture doit avoir ses feux de route (« phares ») allumés essentiellement en permanence, y compris de jour, sauf quand la visibilité est réduite en raison des circonstances atmosphériques (mais hors d'une agglomération bien éclairée, où il faudrait de nouveau allumer les feux de route) ; ce qui n'est visiblement pas ce qui était voulu. Le problème et qu'il y a un mélange complet entre les circonstances où on doit remplacer les feux de route par les feux de croisement (« codes ») et les circonstances où des feux doivent être allumés. Du coup, tel que le texte est écrit, il est tout simplement interdit de circuler en voiture sans une forme ou une autre de feux : le cas normal serait les feux de route (article R416-5, qui ne précise pas la nuit ni quoi que ce soit du genre [ajout : et l'article R416-4 ne précise pas s'il est une condition d'application des suivants]), et il y a des circonstances où on les remplace par les feux de croisement (circonstances énumérées par l'article R416-6), mais aucune circonstance où on circule sans feux ou en simples feux de position. Disons qu'il manque un article qui indiquerait dans quelles circonstances on a le droit d'éteindre tous les feux (au hasard, en plein jour par beau temps). Le rédacteur aurait évité cette erreur embarrassante s'il avait commencé par faire un diagramme d'Euler des différentes combinaisons de feux qu'il souhaitait autoriser, et des différentes circonstances où elles le seraient (ou s'il avait simplement envisagé mentalement tous les cas). Au lieu de ça, il a réfléchi en termes de règles, et a produit un texte qui ne veut rien dire. Du coup, d'ailleurs, je n'ai toujours pas une idée très claire de comment il est interprété dans chaque cas (là aussi, je voudrais bien voir le diagramme d'Euler — celui que n'ont fait ni le gratte-papier du gouvernement ni celui du Conseil d'État qui aurait dû lui dire « votre décret ne veut rien dire »).

En googlant pour essayer de comprendre comment les gens comprenaient vraiment ces articles qui ne veulent rien dire, je suis tombé sur ce fil de discussion d'un quelconque forum en ligne, dans lequel il est assez impressionnant de voir la confusion mentale qui règne, mais plus spécifiquement, plusieurs intervenants citent ou commentent les articles que je viens d'évoquer, sans se rendre compte du problème. C'est fascinant.

Ajout/éclaircissement : Je résume les articles du Code de la route pour bien montrer à quel point c'est confus et incohérent : R416-4 : La nuit ou quand on ne voit pas bien, on doit allumer des feux. R416-5 : Sauf précision du contraire, dès qu'on circule, on doit allumer les feux de route ; à l'arrêt ou en stationnement, c'est interdit. R416-6(II) : On doit circuler avec les feux de croisement et sans les feux de route : 1º quand on risque de gêner quelqu'un, 2º en agglomération bien éclairée et hors agglomération sur route éclairée en continue, 3º quand on ne voit pas bien à cause des précipitations sauf toutefois en agglomération bien éclairée si on circule en feux de position. QUOI ?!? Qu'est-ce que c'est que ce charabia ? L'article R416-5 rend l'article R416-4 inutile. Même si on comprend l'article R416-4 comme signifiant que les suivants ne s'appliquent que dans les conditions qu'il définit, le reste est tout aussi obscur : les 1º et 2º de l'article R416-6 donnent visiblement des circonstances où on remplace les feux de route par les feux de croisement, mais le 3º est visiblement différent, et je ne comprends plus rien (s'il fait nuit et qu'il pleut beaucoup, est-ce que visibilité est réduite en raison des circonstances atmosphériques ?), et le toutefois est encore plus obscur (tel quel, je comprends qu'il dit que s'il pleut en ville, il faut circuler avec les feux de route, ce qui n'est visiblement pas l'intention). En tout cas, je en trouve rien dans ces articles qui autorise à circuler la nuit en feux de position seuls, alors que tout le monde semble considérer que c'est autorisé en agglomération bien éclairée.

Pour en revenir aux médicaments, ce serait intéressant de voir le dessin non seulement pour lui-même, mais aussi pour comparer avec d'autres pays (ou d'autres époques) : les changements intéressants ne sont pas tant dans le fait qu'un médicament passe de telle à telle case du diagramme, mais surtout dans l'apparition ou la disparition des cases elles-mêmes.

[#] D'ailleurs, voici une question de maths : en fonction de n et r, à partir de quel N sera-t-on sûr que pour tout ensemble de cardinal # ≥ N de parties de {1,…,n} il y a forcément r éléments de qui soient « en position générale » ? (Ici, dire que r parties de {1,…,n} sont en position générale signifie que chacune des 2↑r combinaisons booléennes possibles de ces r parties est réalisée par au moins un élément de {1,…,n}, i.e., que toutes ces combinaisons booléennes sont non-vides : pour r=2, par exemple, cela signifie qu'il existe un élément qui n'est ni dans l'une ni dans l'autre partie, un élément qui est dans l'une et pas dans l'autre, un qui est dans l'autre et pas dans l'une, et un qui est dans les deux.) • Et en réponse à cette question, voici une borne fournie il y a longtemps par un collègue combinatoricien : si N est strictement supérieur à la somme des coefficients binomiaux C(n,i) pour i allant de 0 à (2↑r)−1 inclus, le lemme de Sauer-Shelah montre qu'il existe une partie C de {1,…,n} à k = 2r éléments qui soit « fracassée » par la famille initialement donnée, fracassée au sens où toute partie de C est l'intersection de C et d'un élément de  ; en particulier, en appliquant ça à r parties à ½k = 2↑(r−1) éléments de C qui soient en position générale (par exemple numéroter les éléments de C de 0 à (2r)−1, et considérer la partie formée des éléments dont le i-ième bit vaut 1, pour i allant de 0 à r−1), on obtient le même nombre de parties de {1,…,n}, appartenant à , et qui sont toujours en position générale (puisqu'elles le sont déjà dans leur intersection à C). • A contrario, on peut demander par quel procédé on peut construire « beaucoup » de parties de {1,…,n} telles que r parmi elles ne soient jamais en position générale. (Pour r=2, on peut par exemple prendre les intervalles {1,…,i} et les singletons {i} et les compléments de tout ça. Pour r général, on peut essayer de voir {1,…,n} comme une partie d'un espace projectif de dimension pas trop grande, et prendre les sous-espaces linéaires projectifs, ou quelque chose comme ça.)

(lundi)

Sons et graphes de caractères de groupes de Lie

Il y a quelque temps, je me désolais de ne jamais avoir réussi à trouver un objet mathématique dont je pourrais faire une représentation sous forme auditive — plutôt que visuelle — et qui serait mélodieux à entendre.

Or ces derniers temps, je réfléchissais à des problèmes — et globalement, à essayer de comprendre plus précisément des choses — autour de caractères de groupes de Lie, et j'ai été amené à tracer des fonctions qui ressemblent à ceci (cliquez pour agrandir) :

[Caractères fondamentaux du groupe de Lie F₄ restreintes au tore du SU₂ principal de Kostant]

Là, je devrais essayer de dire de quoi il s'agit. L'ennui, c'est que ce n'est pas facile. Je peux donner une explication pour les experts, mais elle n'éclairera pas du tout le grand public (ni même le public moyennement averti) ; je l'écris surtout pour m'en souvenir moi-même :

(Pour les experts, donc.)

Il s'agit des caractères fondamentaux d'un groupe de Lie (réel compact) simple (dans la figure ci-dessus, il s'agit de F₄), restreints au tore du SU₂ principal de Kostant, c'est-à-dire, plus concrètement, le groupe à un paramètre engendré par la demi-somme des coracines positives. Autrement dit, si ρ# est la demi-somme des coracines positives (ou somme des copoids fondamentaux), donnée une représentation définie par son système de poids, on applique ρ# aux poids en question, ce qui donne des demi-entiers (les multiplicités étant sommées), à interpréter comme les poids d'une représentation de SU₂, ou comme définissant un polynôme trigonométrique. Une façon de calculer en pratique consiste à appliquer la formule de caractère de Weyl avec une petite astuce (cf. §3.1 de cet article) : si ρ est la demi-somme des racines positives et λ un poids dominant, on calcule le produit des tλ+ρ,α#⟩−1 où t est une indéterminée et α# parcourt les coracines positives, et on divise ce polynôme par le produit des tρ,α#⟩−1 ; ceci donne un polynôme en t (dont la valeur en 1 est précisément la dimension de la représentation de poids dominant λ, c'est la formule de dimension de Weyl ; quant au degré, il vaut 2⟨λ,ρ#⟩, c'est-à-dire la somme des coefficients de λ sur la base des racines simples) : les coefficients de ce polynôme sont ceux recherchés : si on les décale (i.e. on divise encore par tλ,ρ#⟩) et qu'on lit comme un polynôme trigonométrique, c'est la fonction recherchée. Voici par exemple le calcul en Sage dans le cas de F₄ :

sage: WCR = WeylCharacterRing("F4", style="coroots")
sage: weylvec = sum([rt for rt in WCR.positive_roots()])/2
sage: R.<t> = PolynomialRing(QQ,1)
sage: weyldenom = prod([t^weylvec.scalar(rt.associated_coroot())-1 for rt in WCR.positive_roots()])
sage: weylnumer1 = prod([t^(weylvec+WCR.fundamental_weights()[1]).scalar(rt.associated_coroot())-1 for rt in WCR.positive_roots()])
sage: weylnumer2 = prod([t^(weylvec+WCR.fundamental_weights()[2]).scalar(rt.associated_coroot())-1 for rt in WCR.positive_roots()])
sage: weylnumer3 = prod([t^(weylvec+WCR.fundamental_weights()[3]).scalar(rt.associated_coroot())-1 for rt in WCR.positive_roots()])
sage: weylnumer4 = prod([t^(weylvec+WCR.fundamental_weights()[4]).scalar(rt.associated_coroot())-1 for rt in WCR.positive_roots()])
sage: weylnumer1/weyldenom
t^22 + t^21 + t^20 + t^19 + 2*t^18 + 2*t^17 + 3*t^16 + 3*t^15 + 3*t^14 + 3*t^13 + 4*t^12 + 4*t^11 + 4*t^10 + 3*t^9 + 3*t^8 + 3*t^7 + 3*t^6 + 2*t^5 + 2*t^4 + t^3 + t^2 + t + 1
sage: weylnumer2/weyldenom
t^42 + t^41 + 2*t^40 + 3*t^39 + 5*t^38 + 7*t^37 + 10*t^36 + 12*t^35 + 16*t^34 + 20*t^33 + 25*t^32 + 29*t^31 + 35*t^30 + 39*t^29 + 45*t^28 + 50*t^27 + 55*t^26 + 58*t^25 + 62*t^24 + 63*t^23 + 66*t^22 + 66*t^21 + 66*t^20 + 63*t^19 + 62*t^18 + 58*t^17 + 55*t^16 + 50*t^15 + 45*t^14 + 39*t^13 + 35*t^12 + 29*t^11 + 25*t^10 + 20*t^9 + 16*t^8 + 12*t^7 + 10*t^6 + 7*t^5 + 5*t^4 + 3*t^3 + 2*t^2 + t + 1
sage: weylnumer3/weyldenom
t^30 + t^29 + 2*t^28 + 3*t^27 + 4*t^26 + 5*t^25 + 7*t^24 + 8*t^23 + 10*t^22 + 11*t^21 + 13*t^20 + 14*t^19 + 16*t^18 + 16*t^17 + 17*t^16 + 17*t^15 + 17*t^14 + 16*t^13 + 16*t^12 + 14*t^11 + 13*t^10 + 11*t^9 + 10*t^8 + 8*t^7 + 7*t^6 + 5*t^5 + 4*t^4 + 3*t^3 + 2*t^2 + t + 1
sage: weylnumer4/weyldenom
t^16 + t^15 + t^14 + t^13 + 2*t^12 + 2*t^11 + 2*t^10 + 2*t^9 + 2*t^8 + 2*t^7 + 2*t^6 + 2*t^5 + 2*t^4 + t^3 + t^2 + t + 1

Le polynôme en question doit d'ailleurs avoir un rapport très fort avec les crystal graphs de Kashiwara et Littelmann (les coefficients énumèrent le nombre de nœuds à chaque hauteur du graphe) ; et sans doute avec les groupes quantiques : je n'y connais rien, mais dans le cas de Ar, on obtient exactement le coefficient binomial gaussien (r+1,i) pour la i-ième représentation fondamentale. • Par ailleurs, il y a une grande similarité avec un autre polynôme important, à savoir le produit des tα,ρ#⟩+1−1 où t est une indéterminée et α parcourt les racines positives, divisé par le produit des tα,ρ#⟩−1 : ce polynôme-là énumère les éléments du groupe de Weyl par leur longueur (Carter, Simple Groups of Lie Type (1972/1989), théorème 10.2.2 page 153), par exemple pour F₄ on trouve t^24 + 4*t^23 + 9*t^22 + 16*t^21 + 25*t^20 + 36*t^19 + 48*t^18 + 60*t^17 + 71*t^16 + 80*t^15 + 87*t^14 + 92*t^13 + 94*t^12 + 92*t^11 + 87*t^10 + 80*t^9 + 71*t^8 + 60*t^7 + 48*t^6 + 36*t^5 + 25*t^4 + 16*t^3 + 9*t^2 + 4*t + 1, il est en lien avec les exposants du groupe de Weyl (id, théorème 10.2.3 page 155), et à très peu de choses près donne la fonction zêta du groupe algébrique, c'est-à-dire compte ses points sur les corps fini (id, proposition 8.6.1 page 122), ou de façon sans doute plus pertinente, les points de la variété de drapeau associée. Je ne comprends pas bien le rapport précis entre tous ces polynômes (notons que j'ai écrit le dernier pour coller avec ce que je trouve dans Carter, mais si je ne m'abuse, c'est aussi le produit des tρ,α#⟩+1−1 où t est une indéterminée et α parcourt les racines positives, divisé par le produit des tρ,α#⟩−1, ce qui le fait ressembler encore plus à ce que j'ai écrit ci-dessus). [Ajout : ce dernier polynôme est appelé q-polynomial ici. Je devrais ajouter, pour reproduire ce qui est mentionné sur cette page, que pour obtenir le polynôme donnant nombre de points de la variété de drapeau partielle définie par un ensemble S de nœuds du diagramme de Dynkin, on fait le produit des tα,ρ#⟩+1−1 divisé par le produit des tα,ρ#⟩−1, où cette fois α parcourt seulement les racines ayant au moins un coefficient strictement positif devant une racine simple omise de S.]

Il faudrait essayer de vulgariser tout ça, mais ce n'est pas évident : pas tellement parce que les objets en question sont compliqués (fondamentalement, le calcul final est un petit calcul combinatoire, assez facile, même si évidemment le présenter comme tel ne fournit aucune motivation), mais surtout parce que, comme c'est souvent le cas dans ce domaine entre la théorie des groupes algébriques, la théorie de la représentation, et la combinatoire algébrique, chaque objet peut se voir d'une multitude de manières différentes (ce qui est d'ailleurs la source d'incompréhensions diverses et variées). J'avais commencé à essayer d'écrire quelque chose, non pas vraiment pour expliquer mais juste pour donner une idée de ce dont il est question (en agitant énormément les mains), mais même comme ça, ça partait tellement dans tous les sens que c'est incompréhensible : je le recopie quand même ici (comme un gros bloc de texte), mais je ne recommande de le lire que pour rigoler :

(dimanche)

Réflexions politiques sur les nouveaux dirigeants français

J'avais commencé à écrire une longue entrée à l'occasion des élections législatives françaises (des 11 et 18 juin derniers) pour dire tout le mal que je pense d'un régime constitutionnel, d'un calendrier électoral, et surtout de l'attitude des électeurs français, qui concourent à ce que l'Assemblée nationale soit presque perpétuellement réduitee à l'état de chambre d'enregistrement des décisions du président : chose qui ne semble pas devoir s'améliorer avec le président et l'Assemblée nouvellement élus, avec d'un côté un ego et une soif de pouvoir démesurés et de l'autre l'inexpérience (déguisée sous le nom de code société civile) et la trahison servile. Je cherchais à évoquer au passage le gouvernement de la Rome antique (notamment la magistrature qu'était la dictature, mot qui a pris un sens assez différent de nos jours), ainsi que le système politique (intellectuellement fascinant) inventé en France par l'abbé Sieyès (le Consulat de 1799–1804).

Cette entrée est venue mourir dans le cimetière où j'enterre les textes que je commence, que j'ai marre d'écrire avant d'arriver à la moitié et dont je sais très bien que je ne les finirai jamais ; et cela m'a rappelé pourquoi je n'aime pas parler de politique : les idées ne sont jamais claires, je n'arrive pas à savoir ce que je pense moi-même, et au final j'en ressors plus confus que jamais. Cette entrée-ci a bien failli connaître le même sort.

Ce n'est pas moi qui décoderai la raison pour laquelle les Français sont si fascinés par l'idée du chef, par une espèce de mysticisme autour du président de la République, auquel ils veulent confier tous les pouvoirs pour pouvoir ensuite l'accuser de tous les maux. Ce n'est pas moi qui comprendrai cette envie de toujours se trouver un leader, ce besoin si fort que, même chez un parti d'opposition dont un des thèmes centraux est l'insoumission et le rejet du régime présidentiel, on retrouve le même culte du chef (en l'occurrence, du parti : je parle bien sûr de Jean-Luc Mélenchon) et de sa personnalité, — ou du moins, du maître à penser et de ses idées.

Mes idées politiques sont floues et peu marquées, voire fluctuantes ; mais il y des constantes, comme la crainte du pouvoir personnel, de ceux qui l'exercent et de ceux qui le recherchent (voire du pouvoir tout court, même celui du peuple tout entier), — et une profonde méfiance envers ceux qui mettent en avant des thèses simples et tranchées, qui promettent d'aller vite ou qui gueulent fort. Je préfère entendre c'est compliqué, parce que la réalité, au niveau du gouvernement d'un pays, n'est jamais simple. Je préfère les compromis laborieux qui finalement ne satisfont personne (car c'est le signe d'un compromis réussi que tout le monde en soit mécontant). C'est peut-être pour ça que je me sens plus Européen que Français. Et au niveau institutionnel, je crois en ce qu'on appelle en anglais checks and balances, le principe que les différents pouvoirs doivent se limiter et s'équilibrer les uns les autres ; voir aussi ici et . (J'ai aussi conscience, bien sûr, que la recherche de la modération doit s'appliquer aussi au niveau méta : un pouvoir trop morcelé et qui finit en paralysie permanente, notamment si les différents camps politiques refusent de coopérer, n'est pas idéal non plus ; il faut rechercher l'équilibre jusque dans la recherche d'équilibre, ce qui est un art — que je ne prétends certainement pas maîtriser.)

Je n'arriverai sans doute jamais à dire quelque chose de cohérent sur le sujet. Je n'arrête pas de me corriger, de nuancer ce que j'ai écrit, voire de me contredire complètement, j'en suis conscient et ça m'agace.

Mais j'ai quand même envie d'écrire quelque chose sur ces élections, même si c'est assez incohérent, ne serait-ce que pour essayer de me comprendre moi-même. Je vais donc me forcer à publier cette entrée, même si au final elle me semble incomplète, mal écrite et globalement insatisfaisante, et même si je ne suis pas d'accord avec moi-même au moment où j'écris.

On m'a demandé dans les commentaires de cette entrée d'essayer d'expliquer ce qui me dégoûte chez Emmanuel Macron (notamment en comparaison à ses deux ou trois prédécesseurs ou à d'autres gens divers et variés pour qui j'ai réussi à voter sans vomir). Et je dois avouer que je trouve la question très embêtante : au fond, je ne sais pas, et ça me tracasse beaucoup. J'en dors mal, mais je ne sais pas pourquoi. J'ai des pistes possibles, mais qu'on ne s'attende pas à trouver une vraie réponse ci-dessous. Je vais sans doute me irriter à la fois chez ceux qui admirent le président et chez ceux qui le détestent, mais tant pis, je veux tenter d'être honnête.

(mercredi)

Math Has No God Particle

Je suis tombé sur cet article du site FiveThirtyEight (que je consulte normalement plutôt pour ses analyses sur la politique et les élections américaines) consacré à la manière dont les mathématiciens communiquent (ou plutôt : ne communiquent pas…) auprès du grand public. Bon, j'avoue, j'ai surtout été attiré par l'article en reconnaissant dans l'illustration le système de racines de E₈ : Oliver Roeder, écrivant pour FiveThirtyEight, revient sur l'annonce un peu sensationnelle qui a été faite dans la presse quand le projet d'Atlas des groupes de Lie de Jeffrey Adams et (feu) Fokko du Cloux a fini en 2007 un calcul considérable, celui des « polynômes de Kazhdan-Lusztig-Vogan de la forme réelle déployée de E₈ »[#] : cette publicité, sans doute combinée avec toutes sortes d'annonces au sujet de E₈, comme tout le ramdam médiatique fait autour de cette Theory of Everything, était extrêmement inhabituel en mathématiques.

Même étant moi-même fasciné par E₈[#2] (comme le savent bien les lecteurs de ce blog : le dernier épisode est ici), je ne suis pas sûr d'apprécier ce genre de publicité ; certes, des vidéos que j'ai mises sur YouTube obtiennent quelques dizaines de milliers de vues (ce n'est pas comme si ça me rapportait quoi que ce soit…), mais les gens vont voir ça parce que c'est un joli machin qui tourne dans tous les sens (de fait, c'est un joli machin qui tourne dans tous les sens), pas pour y comprendre quoi que ce soit. Ça n'aide pas, d'ailleurs, que le label E₈ désigne tout un tas d'objets mathématiques reliés les uns aux autres — et tous exceptionnels — mais néanmoins distincts : le système de racines, le polytope dont les racines sont les sommets, le réseau engendré par ces racines, l'ordre octonionique entier ayant la forme de ce réseau, l'empilement de sphères défini par le réseau, le groupe algébrique construit par le système de racine, le groupe de Lie complexe que réalise ce groupe algébrique, sa forme réelle compacte, sa forme réelle déployée, les groupes de Chevalley finis que réalise le groupe algébrique sur les corps finis, etc. ; donc même si on n'explique pas au grand public ce que ces différentes choses sont exactement, la moindre des choses serait de préciser qu'il y en a plusieurs qui s'appellent toutes E₈ (et ma vidéo liée ci-dessus, par exemple, montre le système de racines ou le polytope ayant ces sommets, pas le groupe de Lie, même si le groupe de Lie est fortement relié ; tandis que cette autre vidéo montre quelque chose de lié au réseau). J'ai d'ailleurs dans mes cartons d'écrire des entrées sur ce blog expliquant par quelles recettes assez élémentaires on peut fabriquer le groupe de Lie (ou les groupes finis) à partir du système de racines, et le système de racines à partir de son diagramme de Dynkin.

Bref, le matheux qui veut communiquer au grand public, et qui veut partager le sentiment de beauté devant les objets qu'il contemple, est toujours tiraillé entre le fait de vouloir impressionner, par exemple en montrant un joli machin qui tourne dans tous les sens, et le fait de vouloir dire des choses précises, parce que le matheux a horreur des approximations. Tous les vulgarisateurs sont devant ce dilemme, bien sûr, mais le matheux a peut-être plus de mal que le chercheurs des autres sciences à trouver un équilibre. Et c'est ainsi que nous n'avons pas en mathématiques de God Particle (le nom sous lequel la découverte du boson de Higgs — en physique des particules — a été sensationnalisée).

[#] J'avoue que je ne sais pas de quoi il s'agit (je sais ce que c'est que la forme réelle déployée de E₈, voir ici pour quelques explications, je trouve sur Wikipédia la définition des polynômes de Kazhdan-Lusztig, je la comprends mais ça ne me dit pas pourquoi ces objets sont intéressants : j'ai idée que ça doit nous apprendre des choses sur le représentations unitaires de ce groupe de Lie, mais c'est à peu près tout ce que je sais).

[#2] Et aussi très intéressé par le projet d'Atlas ; il se trouve qu'en ce moment je m'intéresse pour des raisons variées aux valeurs du caractère de la représentation adjointe de E₆, E₇ et E₈, et Jeffrey Adams vient justement de poser récemment cette question sur MathOverFlow dont je suis l'activité (pour l'instant, rigoureusement nulle : disons que j'attends l'activité) avec un grand intérêt.

Only the 20 most recent entries were included above. Continue to older entries.

Seules les 20 plus récentes entrées ont été incluses ici. Continuer à lire les entrées plus anciennes.


Entries by month / Entrées par mois:

2017 Jan 2017 Feb 2017 Mar 2017 Apr 2017 May 2017 Jun 2017 Jul 2017 Aug 2017 Sep 2017
2016 Jan 2016 Feb 2016 Mar 2016 Apr 2016 May 2016 Jun 2016 Jul 2016 Aug 2016 Sep 2016 Oct 2016 Nov 2016 Dec 2016
2015 Jan 2015 Feb 2015 Mar 2015 Apr 2015 May 2015 Jun 2015 Jul 2015 Aug 2015 Sep 2015 Oct 2015 Nov 2015 Dec 2015
2014 Jan 2014 Feb 2014 Mar 2014 Apr 2014 May 2014 Jun 2014 Jul 2014 Aug 2014 Sep 2014 Oct 2014 Nov 2014 Dec 2014
2013 Jan 2013 Feb 2013 Mar 2013 Apr 2013 May 2013 Jun 2013 Jul 2013 Aug 2013 Sep 2013 Oct 2013 Nov 2013 Dec 2013
2012 Jan 2012 Feb 2012 Mar 2012 Apr 2012 May 2012 Jun 2012 Jul 2012 Aug 2012 Sep 2012 Oct 2012 Nov 2012 Dec 2012
2011 Jan 2011 Feb 2011 Mar 2011 Apr 2011 May 2011 Jun 2011 Jul 2011 Aug 2011 Sep 2011 Oct 2011 Nov 2011 Dec 2011
2010 Jan 2010 Feb 2010 Mar 2010 Apr 2010 May 2010 Jun 2010 Jul 2010 Aug 2010 Sep 2010 Oct 2010 Nov 2010 Dec 2010
2009 Jan 2009 Feb 2009 Mar 2009 Apr 2009 May 2009 Jun 2009 Jul 2009 Aug 2009 Sep 2009 Oct 2009 Nov 2009 Dec 2009
2008 Jan 2008 Feb 2008 Mar 2008 Apr 2008 May 2008 Jun 2008 Jul 2008 Aug 2008 Sep 2008 Oct 2008 Nov 2008 Dec 2008
2007 Jan 2007 Feb 2007 Mar 2007 Apr 2007 May 2007 Jun 2007 Jul 2007 Aug 2007 Sep 2007 Oct 2007 Nov 2007 Dec 2007
2006 Jan 2006 Feb 2006 Mar 2006 Apr 2006 May 2006 Jun 2006 Jul 2006 Aug 2006 Sep 2006 Oct 2006 Nov 2006 Dec 2006
2005 Jan 2005 Feb 2005 Mar 2005 Apr 2005 May 2005 Jun 2005 Jul 2005 Aug 2005 Sep 2005 Oct 2005 Nov 2005 Dec 2005
2004 Jan 2004 Feb 2004 Mar 2004 Apr 2004 May 2004 Jun 2004 Jul 2004 Aug 2004 Sep 2004 Oct 2004 Nov 2004 Dec 2004
2003 May 2003 Jun 2003 Jul 2003 Aug 2003 Sep 2003 Oct 2003 Nov 2003 Dec 2003