David Madore's WebLog: Pourquoi les ordinaux me fascinent (une introspection psychologico-mathématique)

J'ai déjà récemment écrit une entrée sur mon obsession pour la symétrie, qui est certainement responsable d'une bonne partie de l'attrait que les mathématiques ont pour moi, et qui déborde sur ma fascination pour certaines formes de mysticisme assez visible notamment dans les œuvres littéraires que j'ai tenté d'écrire quand j'étais plus jeune. Mais il y un autre aspect des mathématiques qui me hante et sur lequel je n'arrive pas vraiment à placer un nom : disons, faute de mieux, la grandeur. Je ne sais pas non plus expliquer exactement en quoi cela consiste (pour être clair, je ne parle pas d'un concept mathématique, mais du ressenti commun que j'ai de certaines parties des mathématiques) ; j'ai tendance à penser que c'est le contrepoids de la symétrie, donc peut-être que hiérarchie serait un meilleur terme. Si je devais écrire sérieusement une œuvre dont j'ai déjà publié certains fragments aléatoires, et imaginer un monde allant avec, où les mathématiques donneraient des pouvoirs arcanes, il y aurait sans doute deux types de pouvoirs et d'utilisateurs de ceux-ci : les magiciens, qui utiliseraient la symétrie, et les clercs (pour reprendre la terminologie rôliste) qui utiliseraient la hiérarchie. Maintenant, c'est peut-être mon obsession pour la symétrie qui me fait proposer cette classification : néanmoins, il est certain que, si je dois faire le chemin des mathématiques au mysticisme, la symétrie m'évoque clairement une forme de magie pour les raisons que j'ai déjà expliquées dans l'entrée que je lui ai consacrée, tandis que ce dont je veux parler ici a une saveur, disons, plus religieuse, et cela transparaît notamment dans la Théorie de la Totalité Transfinie de Turing que je décrivais dans cette entrée.

Je ne sais pas quel est le phénomène mathématique sous-jacent à cette impression mentale de « grandeur » ou « hiérarchie », donc, mais je sais quel est le concept qui la réalise le plus parfaitement : il s'agit des ordinaux. J'ai déjà écrit ici une vulgarisation de ce concept (et j'ai même fait un visualisateur permettant de naviguer parmi les plus petits d'entre eux, quoiqu'il faille admettre qu'on n'y voit rien), donc mon but ici n'est pas de parler de mathématiques (même s'il est à prévoir que je n'y résisterai pas : j'invite alors le lecteur non intéressé par les questions techniques à ignorer ces passages, ou de lire en diagonale). [Ajout : pour des descriptions de quelques grands ordinaux et comment on peut les manipuler, je renvoie à ce billet ultérieur.] Ce que je veux présenter aujourd'hui est l'effet psychologique qu'ont sur moi les ordinaux — une sorte de psychanalyse de l'infini, si on veut, si ce n'est que je ne prétends pas vraiment être sérieux.

C'est une réalisation fascinante pour beaucoup d'enfants, lorsqu'ils apprennent à compter, qu'il n'y a pas de plus grand nombre : j'ai déjà écrit des choses à ce sujet, je ne vais pas revenir sur cette fascination du fait que dans le jeu qui peut dire le nombre le plus grand, quand quelqu'un dit N, quelqu'un d'autre peut dire N+1 (ou N×2, ou N², ce qui en langage d'enfants signifie transformer un zilliard en un zilliard de zilliards ; je note qu'une compréhension des opérations les plus importantes des fonctions arithmétiques « élémentaires » vient assez tôt). La grande-cousine de mon poussinet nous racontait récemment, en parlant de son petit-fils, que ce dernier était passionné par savoir qui compte le plus loin. Et j'ai le souvenir assez net d'avoir joué à ces jeux (qui peut dire le nombre le plus grand, et qui peut compter le plus loin) quand j'étais petit. Je pense que c'est un signe que les mathématiques peuvent exercer un véritable attrait sur les enfants — avant qu'on les rende chiantes pour eux en leur faisant faire des calculs pénibles et mécaniques à en dégoûter n'importe qui. Et je me souviens aussi d'avoir eu des discussions, quand je jouais à ces jeux, pour savoir si quelqu'un avait le droit de dire l'infini, et si l'infini plus un (ou l'infini plus l'infini ou l'infini d'infinis) était alors une réponse légitime, entre ceux qui pensaient que ça n'existait pas, ceux qui pensaient que c'était de toute façon pareil que l'infini, et ceux qui pensaient que c'était encore plus grand. (Et en un certain sens, tous ont raison : il y a différentes sortes d'infinis mathématiques selon l'usage qu'on veut en faire ; mais les ordinaux vont plutôt donner raison aux derniers, et pousser la logique.)

Mais il n'y a pas que cette fascination pour les nombres à laquelle je pense chez les petits enfants. Il y en a une autre, que je pourrais traduire comme l'idée que beaucoup de choses doivent être totalement ordonnées : l'autre jour, dans une brasserie où je déjeunais, j'entendis un enfant demander à son père qui était le plus fort entre Darth Vader (enfin, Dark Vador, vu qu'il parlait français) et je n'ai pas entendu le deuxième terme mais j'imagine volontiers que c'était un super-héros quelconque. Par coïncidence (coïncidence certes un peu limitée vue la sortie prochaine d'un film très attendu), j'ai entendu, le même jour dans la rue, un autre gamin poser exactement la même question entre Darth Vader et un camion lancé à toute allure contre lui (question bizarre, mais je crois bien que c'est ça). Je ne sais pas si cette croyance que la puissance des super-héros ou des choses est totalement ordonnée (par la relation gagne un combat contre ?) est enracinée dans le développement de notre cerveau ou si c'est culturel[#] (par exemple, à force de se faire entrendre dire que Foo est plus Zippyesque que Bar dans la publicité, dans la fiction, etc.), mais il est certain que, petits, nous avons un certain goût pour les relations d'ordre total et que ce goût ne disparaît pas totalement, en tout cas pas chez moi, quand nous découvrons qu'en fait le monde n'est pas si simple, et que deux choses ne sont pas toujours comparables.

[#] Spontanément, j'aurais plutôt tendance à imaginer que c'est culturel ; mais d'un autre côté, beaucoup du Mahābhārata, de ce que j'en ai retenu, est consacré à comparaison de personnages guerriers chaque fois plus puissants et moralement plus droits que tous ceux qui ont précédé, et à la vérification de ces comparaisons au cours de combats. Donc même si les auteurs épiques prennent ensuite plaisir à trahir les attentes qu'on peut avoir sur les résultats de ces comparaisons, et à introduire des ordres cycliques ou autrement paradoxaux, je soupçonne que la présupposition de l'ordre total se trouve bien dans la culture qui a engendré cette épopée.

Les ordinaux sont en quelque sorte la sublimation de ces jeux d'enfants : de deux ordinaux, il y a toujours un plus grand (plus fort, plus puissant, plus infini), d'ailleurs dans quasiment tous les cas qu'on rencontre, le plus grand est tellement monstrueusement plus grand que le plus petit, que le plus petit pourrait essentiellement être le nombre 1 ; et à chaque fois qu'on a un ensemble d'ordinaux, il y en a un qui est le plus petit de l'ensemble, et il y a un ordinal qui est plus grand que tous ceux qu'on s'est donné. Si on appelle ω la réponse que fait l'enfant qui dit l'infini en réponse aux milliards et milliards de milliards que les autres ont proposés (techniquement, donc, le plus petit ordinal supérieur à tous les ordinaux finis), alors il y aura des ordinaux ω+1 (l'infini plus un), ω·2 (l'infini plus l'infini) et ω² (l'infini d'infinis) et encore d'autres choses plus grandes.

Mais je ne vais pas expliquer mon obsession pour les ordinaux uniquement à partir de ces jeux d'enfants. Il y a aussi une élégance intellectuelle dans la manière dont les ordinaux sont construits qui ne peut pas ne pas susciter l'admiration : le même genre d'élégance qui fait qu'on comprend que compter à partir de zéro est la bonne façon de faire (et d'ailleurs les ordinaux commencent à zéro). J'ai tenté d'expliquer ça dans l'entrée de vulgarisation que je leur ai consacrée, mais je pourrais résumer la construction des ordinaux en :

À chaque fois qu'on a construit les ordinaux jusqu'à un certain point, on crée un nouvel ordinal qui vient juste après tous ceux-là.

Cette idée est tellement génialement simple qu'on a du mal à se rendre compte de sa puissance. Initialement, je ne sais pas du tout ce que c'est qu'un ordinal, donc je n'en ai aucun : selon le principe que je viens d'énoncer, je crée donc un premier ordinal qui vient après rien du tout (i.e., c'est le plus petit de tous les ordinaux), et que j'appelle 0. Je connais maintenant donc un seul ordinal, qui s'appelle 0, et selon le principe de construction que j'ai énoncé, j'en crée donc un autre qui vient juste après 0, et je l'appelle 1. À ce stade-là, je connais donc 0 et 1, et je crée donc un nouvel ordinal qui vient juste après eux, et je l'appelle 2. En procédant de la sorte, je crée des ordinaux correspondant aux entiers naturels (0, 1, 2, 3, 4, 5… 42, 43, 44… 1000… 10↑42…), qui n'ont déjà pas de fin. Mais contrairement à la fabrication des entiers naturels (en gros, je fabrique 0, puis si je fabrique n, alors je fabrique aussi n+1), le principe que j'ai énoncé ci-dessus continue de s'appliquer : maintenant que je connais les entiers naturels, je crée un nouvel ordinal qui vient juste après tous ceux-là et je l'appelle ω, ce qui donne à son tour naissance à ω+1 et ainsi de suite.

Ce principe de construction est merveilleux parce que c'est exactement le même qui s'applique à chaque fois, et qui ne cesse jamais de s'appliquer, et malgré cela il donne naissance à une richesse et une diversité extraordinaires, mais je vais y revenir. Et les choses se déroulent ex nihilo, à partir du rien (comme je viens de le dire, le principe marche dès le début : on n'a pas d'ordinaux pour commencer, donc on crée un ordinal 0, il n'y a pas de règle spéciale pour 0 comme il y a pour les entiers naturels). On comprend que Cantor, quand il a découvert le concept, ait été ébloui par ce sur quoi il venait de mettre le doigt. (Et on comprend aussi que cette idée ait suscité la réticence, pour ne pas dire l'hostilité, de la communauté mathématique de l'époque, selon un modèle assez bien résumé par ce webcomic ; David Hilbert a bien eu raison en parlant — au sujet de la théorie des ensembles, mais certainement des ordinaux et cardinaux en particulier — d'un paradis que Cantor a créé et dont il ne faut pas que les mathématiciens nous chassions nous-mêmes.) Mais la construction a été rendue encore plus éblouissante par von Neumann, qui a proposé (Zur Einführung der transfiniten Zahlen, Acta Litt. ac Scient. Univ. Hung. 1, 199–208, en 1923 — l'auteur était âgé de même pas vingt ans !) la réalisation suivante des ordinaux, maintenant complètement standard :

Un ordinal est l'ensemble des ordinaux plus petits que lui.

Ainsi 0 est l'ensemble vide (∅) puisqu'il n'y a pas d'ordinaux plus petits, tandis que 1 est l'ensemble {0} = {∅} ayant pour seul élément 0=∅ puisque ce dernier est le seul ordinal plus petit, et 2 est l'ensemble {0,1} = {∅,{∅}} ayant les éléments 0 et 1, et ainsi de suite ; et ω = {0,1,2,3,…} est l'ensemble des entiers naturels. Ce n'est pas terriblement important pour la nature des ordinaux qu'ils soient « réalisés » comme par la définition de von Neumann, mais cela ajoute encore énormément à l'élégance fascinante de la construction, et au sentiment qu'elle se fabrique toute seule à partir de rien.

Il est certain que cette idée ne pouvait que susciter lors de son introduction des réactions assez vives, centrées sur le caractère légitime ou non d'admettre l'infini (l'infini actuel, c'est-à-dire réalisé, et non seulement potentiel) comme objet mathématique légitime, et le fait que la construction soit littéralement ex nihilo n'améliorait certainement pas les choses. J'ai mentionné ci-dessus qu'elle a suscité une très vive opposition, y compris de la part de certains des esprits les plus brillants du monde mathématique, comme Poincaré ou Weyl (et pas seulement des mathématiciens : Wittgenstein était profondément hostile à la théorie des ensembles), tandis que d'autres, non moins brillants, comme Hilbert ou von Neumann, l'ont accueillie avec enthousiasme. Pour la défense des sceptiques et détracteurs de la théorie des ensembles en général, et des ordinaux en particulier, il faut dire que toutes sortes de paradoxes (celui de Burali-Forti qui invite à considérer l'ensemble de tous les ordinaux, je vais y revenir, et celui de Russell qui invite à considérer l'ensemble de tous les ensembles qui n'appartiennent pas à eux-mêmes) ont été découverts dans la première formulation, pré-axiomatique, de la théorie des ensembles, et ces paradoxes pouvaient s'interpréter comme une impossibilité absolue de traiter directement des quantités infinies sans arriver à des contradictions. De nos jours, tout le monde ou presque admet que la difficulté était simplement de codifier rigoureusement les règles par lesquelles on a le droit de manipuler des ensembles et des infinis, et qu'une fois ces règles bien fixées (comme elles l'ont été par Ernst Zermelo et Abraham Fraenkel), la contradiction disparaît sûrement. (« Sûrement », même si on sait depuis Gödel qu'on ne peut jamais être totalement certain que la contradiction n'existe pas, et à chaque fois qu'on ajoute un infini plus grand, on ne peut qu'en être moins certain.) Ce qui est certain, c'est que la théorie des ensembles, et notamment la notion d'ordinal, fait partie des mathématiques maintenant considérées comme standard, même si cela n'empêche pas les crackpots de se concentrer dessus et de chercher à contredire différents passages de ce qu'ils ne comprennent pas, et spécifiquement les résultats de Cantor (typiquement, l'argument diagonal, même si celui-ci ne parle pas vraiment d'ordinaux). Et s'il y a une contradiction dans la théorie des ensembles, elle ne doit pas être si évidente que ça, vu le plaisir avec lequel des raisonnements d'une sophistication incroyable sont menés dedans et ne sont jamais encore tombés dans une contradiction[#2].

[#2] Digression technique : Des gens savants peuvent ici me rétorquer : mais si, on est tombé dans une contradiction !, en postulant l'existence d'un cardinal Reinhardt. Je ne sais pas si ça mérite vraiment une réponse autre que oui, à force de chercher vraiment très fort à introduire des axiomes aussi forts que possible et aussi proches que possible d'une contradiction, on a fini par en trouver une (repassez quand vous aurez une contradiction dans ZFC), i.e., je ne sais pas si l'existence d'un cardinal Reinhardt a sérieusement été avancée comme « vraie ». Cela n'a pas empêché de très grands théoriciens des ensembles (je pense à Hugh Woodin) de se livrer à une analyse mathématique et philosophique approfondie de pourquoi cette contradiction et ce qu'elle signifie sur la taille de l'infini — voir par exemple l'article de Woodin intitulé The Realm of the Infinite — et voir d'ailleurs aussi les commentaires et explications de Peter Koellner sur ce texte. En tout état de cause, cette histoire va plutôt dans le sens que quand on trouve une contradiction dans la théorie des ensembles, elle n'est pas spécialement difficile à exhiber (la preuve de la contradiction de ZFC + « il existe un cardinal Reinhardt » a été trouvée rapidement, et elle n'est ni longue ni très subtile), donc j'ai tendance à croire que savoir jusqu'où on a pu aller trop loin donne plutôt confiance en la solidité de l'édifice. (Alternativement, on peut défendre la thèse que la contradiction ne vient pas du grand cardinal supposé mais de l'axiome du choix qui limiterait la taille possible de l'infini, comme l'axiome de constructibilité place la limite beaucoup plus bas — en-dessous d'un cardinal mesurable.)

Mais il est vrai que tous ces concepts fleurent bon la contradiction tant ils semblent jouer avec elle et tourner autour d'elle en l'évitant tout juste. C'est le cas de façon générale de la logique mathématique (le théorème de Gödel s'approche dangereusement du paradoxe de la phrase qui dit cette phrase est fausse, et nous invite à contempler attentivement la différence entre vérité et démontrabilité — j'ai écrit de la vulgarisation à ce sujet ici), mais quand on ajoute les infinis dans l'histoire et la difficulté à se les imaginer intuitivement, on comprend que certains ne se sentent pas du tout à l'aise. Pour en revenir à mon propos initial, je pense que c'est justement pour cela que, une fois admis que le sujet n'est pas contradictoire, on le trouve d'autant plus stimulant. Arriver à suivre certains raisonnements en logique ou théorie des ensembles, bien plus que dans d'autres branches des mathématiques, peut être comparable à un roman policier où tout le monde réussit à tromper le détective tout en disant la plus stricte vérité.

Une conséquence de la construction des ordinaux (que ce soit celle de Cantor ou celle, plus précise, de von Neumann), est qu'on ne peut jamais en contempler la totalité : parler de la totalité des ordinaux contredit immédiatement le principe même de construction des ordinaux, puisque cette totalité devrait s'exposer immédiatement à définir un nouvel ordinal plus grand qu'eux (dans la construction de von Neumann : l'ensemble de tous les ordinaux), ce qui définit un nouvel ordinal, contredisant la totalité de la totalité supposée ! C'est là essentiellement le paradoxe de Burali-Forti. La résolution moderne technique est que les ordinaux ne forment en effet pas un ensemble, ils ne sont pas regroupables en ensemble — si on veut donner un nom à tous les ordinaux, ce sera une classe — et la construction des ordinaux ne s'applique qu'aux ensembles. Mais le contenu intuitif de cette explication technique est le suivant : on ne peut en effet jamais contempler la totalité des ordinaux, il faut donc décider d'arrêter de les construire à un certain moment (mais il vaut mieux choisir un moment raisonnablement « robuste », et c'est essentiellement cela que permettent les axiomes de la théorie des ensembles), après quoi l'ordinal qui vient immédiatement après s'appelle la classe des ordinaux et on fait semblant que ce n'est pas un ordinal, pas plus que ceux qui viendraient après ; des propriétés plus ou moins compliquées, ajoutées sous forme d'axiomes, permettent de décider jusqu'où on impose d'aller dans la construction des ordinaux. Bref, on a effectivement affaire à quelque chose qui n'est jamais achevé, qui ne peut jamais l'être par sa définition même, il faut juste décider à quel moment on a quelque chose de « suffisamment achevé », i.e., robuste, pour ce qu'on veut en faire. Là aussi, il s'agit d'une perspective extrêmement dérangeante, et donc d'autant plus fascinante quand on arrive à l'accepter mentalement : quand on dit les ordinaux, il y a toujours quelque chose d'inachevé dans l'histoire. Et en fait, quand on examine de plus près la logique, on se rend compte, et je vais essayer d'en dire un mot plus bas même si c'est un peu complexe, que cet « inachèvement » ne concerne pas que la notion de tous les ordinaux mais même des ordinaux bien précis, disons ω₁ ou même ω₁^CK (voire ω ?), ce qui rend tout le panorama encore plus mystérieux.

Dans ces conditions, il ne me surprend pas que Cantor soit devenu mystique. Une rumeur persistante veut qu'il ait été fou, ce qui va certainement dans le sens de démolir ad hominem ses théories : la vérité est surtout qu'il a souffert de dépression, notamment à cause du rejet de ses idées. Mais il est vrai qu'il a été habité d'idées tout à fait mystiques, comme l'affirmation que c'était Dieu qui lui avait inspiré l'idée des nombres transfinis, et que leur existence (actuelle et non simplement potentielle) apportait une lumière sur l'existence ou sur la pensée de Dieu. Et il a écrit plusieurs lettres à des prêtres catholiques, dont le pape Léon XIII, au sujet de théologie et de rapports entre théologie et mathématiques. Même Hilbert utilise le terme de paradis (Paradies) pour décrire le monde de la théorie des ensembles ouvert par Cantor, avec ses infinis et ses raisonnements non-constructifs, et ce n'est certainement pas un hasard. Moi-même je ne peux que plaider coupable en ce qui concerne le mysticisme (même si, je l'ai déjà expliqué, pour moi le mysticisme est avant tout intéressant artistiquement, par exemple comme prémisse pour une œuvre littéraire) : ma fascination pour les ordinaux a indiscutablement une origine à peu près mystique, et quand je propose une interprétation eschatologique du paradis cantorien (encore une fois, la Théorie de la Totalité Transfinie de Turing), c'est du mysticisme à 0.02¤ (voire à (1/ω)¤).

Mais c'est là que je veux, pour expliquer le mécanisme psychologique qui joue, rejoindre le mot que j'ai utilisé plus haut : grandeur. J'ai déjà dit que je fais souvent des rêves de vastes labyrinthes à explorer et j'ai déjà comparé les mathématiques à un palais magnifique et extraordinairement beau en même temps que labyrinthique : si la symétrie est ce qui fait la beauté du palais, la grandeur joue beaucoup pour qu'on ait envie de l'explorer. Les ordinaux sont le terrain de jeu ultime pour ce qui est de la grandeur, et comme un gosse qui découvre un nouveau terrain d'aventure, j'ai envie de m'y lancer.

Or ce terrain est déroutant. Un peu à la façon de l'ensemble de Mandelbrot (autre vaste terrain de jeu à explorer, dont j'ai fait une petite démonstration artistique à travers plusieurs vidéos parmi tant d'autres trouvables sur le sujet sur YouTube), les ordinaux ont une structure que j'ai envie de qualifier de fractale, même si je ne saurais pas justifier précisément le sens mathématique de ce mot. Grosso modo, je veux dire que si on comprend comment sont fabriqués les entiers naturels (i.e., ω), on recommence tout ceci pour passer de ω à ω+ω = ω·2, puis de nouveau pour passer à ω·3, et toutes ces répétitions sont elles-mêmes répétées ω fois pour fabriquer ω², et tout ça est encore fait ω fois pour fabriquer ω³, et ainsi de suite : non seulement chaque ordinal est l'ensemble des ordinaux qui précèdent mais aussi chaque construction permettant de fabriquer des ordinaux est répétée de façon de plus en plus complexe, de plus en plus imbriquée et de plus en plus délicate pour fabriquer des ordinaux plus grands. Les images présentées par mon petit navigateur d'ordinaux ne sont qu'un pâle reflet de cette structure fractale qui m'évoque la façon dont l'ensemble de Mandelbrot se retrouve partout dans l'ensemble de Mandelbrot (je répète que ceci n'est pas censé être une affirmation mathématique mais une impression psychologique). J'ai le souvenir d'avoir fait un rêve, évidemment impossible à raconter dans lequel on me montre ω₁ (dans le rêve, on me disait ℵ₁, mais c'est la même chose), qui prend en l'occurrence la forme d'une sorte de sculpture moitié gothique, moitié sarrasine et semble l'œuvre fantastique des Sylphes, des Fées, des Génies et des Gnomes réunis (avec mes excuses à E. A. Poe).

Les ordinaux, aussi, sont liés de façon profonde à l'univers constructible de Gödel : la vulgarisation que j'ai tenté d'en faire dans cette entrée passée est assez mauvaise, je trouve, et je ne vais pas tenter de l'améliorer maintenant, mais disons juste ceci. De façon orthodoxe, les mathématiques sont fondées sur la théorie des ensembles, c'est-à-dire que tout objet mathématique « est » un ensemble (un peu de la manière dont les objets informatiques « sont » des suites de 0 et de 1 : pour passer de la sémantique qu'on veut donner à l'objet à cette représentation « de bas niveau », il y a une étape de codage qu'on s'empresse d'oublier quand on a développé les outils pour travailler « à haut niveau » sur l'objet). Mais si on croit à l'« axiome de constructibilité », alors en fait on pourrait tout coder sous forme d'ordinaux (et axiomatiser les mathématiques pour parler uniquement d'ordinaux, sans passer par les ensembles : je ne crois pas que quiconque l'ait fait explicitement). Cet axiome de constructibilité a des conséquences mathématiques tangibles (j'en ai cité quelques unes dans l'entrée évoquée ci-dessus), mais généralement parlant on peut quand même l'ignorer : si on est prêt à l'admettre, on peut dire que tout le monde mathématique est formé d'ordinaux plutôt que d'ensembles. Mais l'axiome de constructibilité est aussi intimement lié à la notion de calculs sur les ordinaux. (Il faut toujours que j'écrive une entrée pour expliquer comment on peut définir la calculabilité sur des ordinaux et programmer des ordinateurs transfinis qui les manipulent, mais j'ai au moins donné une formulation équivalente à la première étape intéressante de cette hiérarchie en parlant de machines hyperarithmétiques.) Si on croit à cet axiome[#3], donc, non seulement le monde mathématique devient peuplé d'ordinaux, mais il devient « opérationnel », comme formé de programmes tournant sur des ordinateurs inimaginablement puissants, ou plutôt sur des séquences transfinis d'ordinateurs de plus en plus puissants. La description que je viens de faire est plus métaphorique que scientifique, bien sûr, mais elle est destinée à expliquer pourquoi l'univers constructible me fascine, et comment cela se relie aux ordinaux : je ne peux pas rester insensible à cette vision du monde mathématique comme une gigantesque machine de calcul.

[#3] En fait, on ne croit pas à cet axiome V=L, ou du moins, les théoriciens des ensembles assez « platoniciens » pour avoir un avis sur la question (de savoir si un énoncé indécidable dans ZFC peut avoir une valeur de vérité) croient essentiellement tous qu'il est faux, parce qu'il limite la taille de l'infini. (Ceci dit, je ne sais pas pourquoi on n'applique pas la même logique pour conclure que l'axiome du choix est faux, cf. ma note précédente.) À la place, on cherche à trouver un remplacement de L qui assure aussi une structure forte et ordonnée de l'univers des ensembles et qui soit compatible avec les plus grands cardinaux : c'est ce qu'on appelle le core model program (ou inner model program, je ne sais pas dans quelle mesure c'est synonyme) ; de ce que je comprends, on sait définir des analogues de L pour certains grands cardinaux, mais la question cruciale est de savoir si on peut atteindre un cardinal supercompact, parce que si on y arrive, le modèle en question peut rendre compte de tous les grands cardinaux (même ceux qui sont beaucoup plus grands/forts qu'un cardinal supercompact) et Woodin appelle ça le L ultime. Maintenant, je ne sais pas dans quelle mesure ce « modèle-cœur » peut être considéré sous l'angle de la calculabilité (il est vrai que 0^♯ est une sorte de super-giga-saut-de-Turing, donc ça pourrait le laisser croire) ; j'ai plusieurs fois fait des timides tentatives pour essayer d'apprendre ce sujet, mais il est invraisemblablement technique (il y a des souris, des présouris, des protosouris, des phalanges, des belettes, et même des belettes stablement universelles ! — je ne plaisante pas, regardez cet article). Pour un survey sur la question, on pourra par exemple se tourner vers le texte de Woodin, Strong Axioms of Infinity and the search for V.

Mais revenons aux ordinaux eux-mêmes. Ce qui est décevant, c'est que ce monde est tellement vaste qu'on ne peut en explorer qu'une infinitésimale partie. J'aime bien donner l'image de ω₁ comme un escalier littéralement interminable : même si vous avez le pouvoir de vous déplacer en un temps aussi court que vous voulez à n'importe quel échelon de l'escalier, et même si vous avez un temps infiniment long pour monter, il y aura toujours un échelon que vous n'atteindrez pas. (Alors que pour les entiers naturels, on peut passer une seconde sur le premier échelon, ½ seconde sur le suivant, ¼ sur le suivant et ainsi de suite, et donc franchir tous les entiers naturels en deux secondes.)

Le premier endroit où j'ai appris un peu sérieusement ce que sont les ordinaux, c'est dans le joli petit livre Naïve Set Theory de Halmos, que mon papa m'avait prêté. Comme la plupart des gens qui entendent parler des ordinaux pour la première fois, mon intuition a buté contre ε₀ (la limite de ω, ω^ω, ω^{ω^ω}, etc.), mais comme le sujet me titillait, j'ai insisté jusqu'à comprendre correctement cet ordinal, c'est-à-dire, redécouvrir par moi-même ce qui est essentiellement la forme normale de Cantor ; puis j'ai poussé jusqu'à comprendre ε₁ (la principale difficulté est de réussir à se désembrouiller des différentes expressions comme ε₀^ε₀ = ω^{ω^ε₀·2}), et j'ai extrapolé en me disant que du coup je comprenais ε_γ en général. Je me suis ensuite dit que sûrement la limite de ε₀, ε_ε₀, ε_{ε_ε₀}, etc., devait être ω₁ (Halmos note d'ailleurs ce dernier, de façon un peu vieillote, Ω), et que du coup j'avais compris les ordinaux dénombrables, ouf ! Ce n'est que plus tard que je me suis aperçu de mon erreur : la limite de ε₀, ε_ε₀, ε_{ε_ε₀}, etc. ne peut pas être ω₁, parce que ω₁ ne peut pas être obtenu comme limite d'une suite d'ordinaux plus petits (c'est ce que j'essaie de dire dans le paragraphe précédent) : toute suite à valeurs dans ω₁ est bornée ! J'ai alors eu un vertige en comprenant à quel point ω₁ est impossible à appréhender — et ce n'est que le premier cardinal après ω !

Mais ce qui est surtout décevant, c'est que les mathématiques elles-mêmes sous-utilisent les ordinaux. De façon basique, si on regarde les ordinaux (dénombrables, pour éviter des discussions oiseuses) utilisés dans des constructions ou démonstrations mathématiques en-dehors de la théorie des ensembles elle-même, on s'aperçoit qu'ils ont tendance à ne pas être très grands. Pour être plus précis : il existe une branche des mathématiques appelée théorie de la démonstration, dont une sous-branche appelée analyse ordinale s'attache à attribuer à une théorie mathématique (comme les axiomes de Peano) un certain ordinal (dénombrable et même « récursif ») qui mesure sa force (je vais rester insupportablement vague, mais la force de l'arithmétique de Peano est essentiellement mesurée par l'ordinal ε₀) ; en quelque sorte, cela signifie que la théorie n'est pas capable d'« utiliser » un ordinal plus grand, ou de façon un tout petit peu moins vague, de formaliser une induction transfinie (sorte de généralisation de la récurrence) sur cet ordinal ou un ordinal plus grand quelconque. Dans le cas de la théorie des ensembles, cet ordinal est extrêmement grand (quoique plus petit que ω₁^CK) et on ne sait pas le décrire autrement que l'ordinal qui mesure la force de ZFC. Mais un consensus des logiciens est qu'essentiellement toutes les mathématiques usuelles peuvent se faire dans des théories logiques dont la force (mesurée par un ordinal comme je viens de le dire) est finalement très petite : ε₀ ou même peut-être ω^ω voire moins (voir par exemple le papier Number Theory and Elementary Arithmetic de Jeremy Avigad pour un énoncé précis). Ce que cela signifie concrètement est que : les mathématiques ne savent pas vraiment utiliser les ordinaux très puissants qu'elles définissent (ni toute la force de la théorie des ensembles, loin de là). Ceci m'amène évidemment à me demander ce que seraient les mathématiques si nous pouvions/savions réellement faire usage des ordinaux plus grands (que nous pouvons décrire et discuter mais sans les « comprendre » ou les « utiliser » en profondeur) ; le petit indice que nous pouvons tirer des quelques théorèmes (comme celui-ci) dont la force logique qui dépassent la « force usuelle » des mathématiques, suggère que ce serait certainement intéressant.

J'ai commencé cette entrée en rappelant ma fascination pour la symétrie. Les ordinaux sont tout le contraire de symétriques : ils sont rigides (il n'y aucune façon de changer l'ordre des éléments — c'est-à-dire des ordinaux plus petits — d'un ordinal, parce que le plus petit est identifié comme le plus petit, le suivant est identifié comme le suivant après lui, et ainsi de suite ; pour ceux qui veulent un théorème précis : tout ensemble bien-ordonné est isomorphe à un unique ordinal, et l'isomorphisme est lui-même unique). Il faut un jour que j'écrive une entrée sur la question semi-mathématique et semi-philosophique de savoir quand deux objets mathématiques sont le même et de pourquoi les symétries posent problème dans ce contexte[#4], toujours est-il que pour les ordinaux, cette question ne doit pas se poser : l'ordinal ω, par exemple, qui est le plus petit infini, est le même pour tout le monde, et l'ordinal ω₁, qui est le plus petit indénombrable, devrait aussi l'être (devrait, parce qu'il y a des mentions légales auxquelles je viens dans un instant). En un certain sens, c'est mentalement rassurant : si nous devions parler d'ordinaux avec des extra-terrestres, la question de savoir si nous parlons du même ordinal a un sens parfaitement bien défini, pas comme si nous parlions de gauche et de droite où se posent toutes sortes de questions, à cause de l'existence de symétries (les réflexions de l'espace) sur l'orientation de l'espace et comment savoir si gauche et droite ont le même sens pour nous et pour eux.

[#4] Digression (technique) à ce sujet : il y a des gens qui insistent (et ils ont sans doute raison…) sur le fait qu'on doit écrire une clôture algébrique du corps k et non la clôture algébrique du corps k, parce que la clôture algébrique n'est définie qu'à isomorphisme non-unique près. (Un cas frappant est celui de ℚ : on en fabrique une clôture algébrique en le plongeant dans ℂ, c'est-à-dire en considérant les nombres complexes qui sont racine d'un polynôme à coefficients rationnels ; mais on en fabrique une autre clôture algébrique en le plongeant dans ℂ_p pour chaque nombre premier p, c'est-à-dire en utilisant une construction du même style sur les p-adiques — on peut la rendre tout à fait explicite, je ne rentre pas dans les détails : mon point est qu'on obtient des présentations très différentes de clôtures algébriques de ℚ, et bien qu'il existe un isomorphisme entre les deux même en l'absence de l'axiome du choix, cet isomorphisme n'est pas du tout explicite.) D'un autre côté, on parle bien du corps des nombres complexes, alors qu'il n'est défini, même sur les réels, qu'à un isomorphisme près qui peut prendre deux valeurs possibles (conjuguées complexes l'une de l'autre), et j'ai tendance à trouver que pour ce qui est de la clôture algébrique d'un corps fini il est également légitime de dire la. Tout ceci est donc un peu délicat, parce qu'est délicate, à la base, la question de savoir de quelles structures on dote un objet mathématique. (Je sais que V. Voevodsky est censé résoudre toutes ces difficultés grâce aux merveilles de la théorie homotopique des types, mais moi je ne suis qu'un vulgaire algébriste aux sympathies pour la logique classique et qui continue à croire bêtement que ZFC est consistant et à travailler dedans, du coup ces merveilles m'échappent.)

Mais en fait il y a une subtilité, c'est que s'il n'y a pas de symétries dans le monde des ordinaux, il y a des « fausses symétries », ce que j'avais appelé dans mon entrée consacrée à la constructibilité, un « jeu de miroir » : il y a des ordinaux qui « font semblant » d'être d'autres ordinaux ou d'être la classe de tous les ordinaux ! Il est difficile d'expliquer ce que cela veut dire au juste. (Pour ceux qui connaissent la théorie des ensembles, je fais référence à des choses dans le style de Löwenheim-Skolem : notamment, au fait que L_α peut être un sous-modèle élémentaire ou un sous-k-modèle élémentaire d'un autre, voire un sous-k-modèle élémentaire de L tout entier, ou encore, peut vérifier un bon bout des axiomes de la théorie des ensembles ; ou éventuellement les mêmes choses avec V à la place de L, même si j'ai plutôt L que V à l'esprit.) Mais disons en gros qu'il y a toutes sortes de manières dont l'ensemble des ordinaux inférieurs à un certain α (c'est-à-dire, selon la définition des ordinaux à la von Neumann, α lui-même…) peut ressembler à l'ensemble des ordinaux inférieurs à un certain β>α quand on ne regarde pas de trop près (et « pas de trop près » a tendance à être lui-même quantifié par un autre ordinal). Par exemple, il y a toutes sortes d'ordinaux qui vont donner temporairement l'impression (plus ou moins fortement convaincante) d'être ω₁, puis, quand on va un peu plus loin, on va se rendre compte qu'en fait, non, ce n'est pas ω₁. (Il est difficile de donner ne serait-ce qu'une idée de ce qui se passe au juste, mais pour proposer un début de commencement d'embryon d'idée, on peut penser au fait que ε₀ et ε₁, ou tous les ε en général, sont essentiellement impossibles à distinguer quand on regarde les ordinaux plus petits et qu'on se permet seulement de faire des additions, multiplications et exponentiations — parce que l'ordinal qui est au-dessus est inatteignable par ces opérations ; je peux aussi évoquer le fait que ω₁^CK fait un peu semblant[#5] d'être ω₁, d'où le nom, en ce que toute suite d'ordinaux à valeurs dans ω₁ est bornée, tandis que la même chose est vraie pour une suite récursive dans ω₁^CK.) Tout ce phénomène est assez subtil et assez labyrinthique, et assez déstabilisant, mais en même temps intellectuellement fascinant : le monde des ordinaux, que je qualifiais de fractal ci-dessus, contient en effet des copies de lui-même en miniature, des copies de qualité arbitrairement précise, dans un « jeu de miroir » vertigineux.

Et cela pose des questions à mes yeux profondes de philosophie des mathématiques : vu qu'il y a toutes sortes d'ordinaux qui se succèdent pour « faire semblant » d'être ω₁, on se demande si le vrai ω₁ existe « vraiment », et ce que cette question veut dire. Ou peut-être que ω₁ est quelque chose comme la classe de tous les ordinaux : quelque chose de perpétuellement inachevé, qu'on n'en finit pas de compléter. (Pour ceux qui en savent plus, voici le genre de phénomènes auxquels je pense : s'il existe un modèle bien-fondé de ZFC, il existe un plus petit modèle transitif dénombrable M de ZFC, et l'ordinal ω₁^M qui joue le rôle de ω₁ dans ce modèle est un « faux » ω₁ puisqu'il est dénombrable ; formellement, on passe de ω₁^M à ω₁ en ajoutant ω₁ échelons à la fin, mais il est sans doute plus juste de s'imaginer qu'on les ajoute à toutes sortes d'endroits au milieu parce qu'on a mieux regardé ω₁^M et qu'on s'est dit il y a un trou là, là et là. Une extension de forcing sur M peut écraser ω₁^M, et, selon le point de vue qu'on adopte, le rendre dénombrable, ou exhiber le fait qu'il l'était dès le début, sans que l'ordinal lui-même change.) Et le problème philosophique devient encore plus épineux quand on commence à se demander quel est le plus petit ordinal qui peut se permettre d'être inachevé (ce n'est certainement pas 42 : je crois quand même que s'il manquait un nombre entre 0 et 41, quelqu'un s'en serait aperçu ! ), et ce que cette question veut dire. Malheureusement, les philosophes se sont assez peu penchés sur ces problèmes, ni les mathématiciens, ni même ceux qui ont la double casquette (comme Hugh Woodin dont je parlais plus haut, ou Hilary Putnam, qui a pourtant étudié des problèmes remarquablement proches ; il y a bien Joel D. Hamkins — un ancien étudiant de Woodin — qui a beaucoup dit des choses sur la conception « multivers » de la vérité ensembliste, mais son point de vue est un peu différent, je ne rentre pas dans les détails).

[#5] Il y aussi le phénomène suivant : j'ai déjà évoqué, par exemple dans cette entrée (même s'il faudra un jour que j'y revienne plus précisément) qu'il y a des phénomènes de « reflet » pas totalement bien compris entre (0) les grands entiers naturels (i.e., les ordinaux <ω), (1) les grands ordinaux constructifs (i.e., les ordinaux <ω₁^CK), (2) les grands ordinaux dénombrables [dans l'univers constructible] (i.e., les ordinaux <ω₁^L), et (3) les grands cardinaux [qui ont le droit d'exister dans l'univers constructible]. Par exemple, un cardinal inaccessible (dans la catégorie (3)) permet de définir par analogie la notion d'ordinal récursivement inaccessible (dans la catégorie (2)), qui permet à son tour de définir par « écrasement » de très grands ordinaux récursifs (i.e., dans la catégorie (1)) mesurant la force ordinale d'un système formel KPI garantissant l'existence d'ordinaux récursivement inaccessibles, et ceux-ci permettent à leur tour de définir de très grands entiers (essentiellement des valeurs de fonctions calculables dont KPI démontre la terminaison, même si on peut les décrire de façon beaucoup plus explicite grâce à (1)). Le lien entre ces quatre objets est subtil, mais des questions philosophiques qui se posent sont : sachant qu'on n'a pas besoin formellement que (3) existe (l'existence de cardinaux inaccessibles n'est pas démontrable par ZFC) pour que (2) existe, ni (2) pour (1), ni (1) pour (0), mais qu'on en a besoin pour motiver la construction, qu'est-ce que ceci nous apprend sur la plausibilité de l'existence de (3) ? et d'autre part, est-ce que le fait de « trouver » de « nouveaux » ordinaux, voire de nouveaux ordinaux récursifs, voire de nouveaux entiers naturels, par ce procédé, signifie que ω₁, voire ω₁^CK, voire ω, étaient inachevés ?

Comme je m'en doutais, je me suis perdu dans un certain nombre de digressions techniques, mais si je dois synthétiser tout ça en une raison supplémentaire pour laquelle les ordinaux me fascinent, c'est que leur construction a la beauté des fractales (même si cette fractale ne peut se voir qu'avec l'esprit), où des imitations de plus ou moins bonne qualité des ordinaux se retrouvent sans arrêt dans d'autres ordinaux comme des copies de l'ensemble de Mandelbrot dans l'ensemble de Mandelbrot ; mais avec les ordinaux, ces phénomènes deviennent sans cesse plus riches, plus complexes et plus subtils, jusqu'à l'infini et au-delà, de sorte que non seulement l'ensemble est d'une très grande beauté, mais aussi qu'il soulève des problèmes philosophiques profondément troublants si on prend la peine d'y réfléchir soigneusement.