J'ai déjà récemment écrit une
entrée sur mon obsession pour la symétrie, qui est
certainement responsable d'une bonne partie de l'attrait que les
mathématiques ont pour moi, et qui déborde sur ma fascination pour
certaines formes de mysticisme assez visible notamment dans les œuvres
littéraires que j'ai tenté d'écrire quand j'étais plus jeune. Mais il
y un autre aspect des mathématiques qui me hante et sur lequel je
n'arrive pas vraiment à placer un nom : disons, faute de mieux,
la grandeur. Je ne sais pas non plus expliquer exactement en
quoi cela consiste (pour être clair, je ne parle pas d'un concept
mathématique, mais du ressenti commun que j'ai de certaines parties
des mathématiques) ; j'ai tendance à penser que c'est le contrepoids
de la symétrie, donc peut-être que hiérarchie
serait un
meilleur terme. Si je devais écrire sérieusement une œuvre dont j'ai
déjà publié certains fragments aléatoires, et imaginer un monde allant
avec, où les mathématiques donneraient des pouvoirs arcanes, il y
aurait sans doute deux types de pouvoirs et d'utilisateurs de
ceux-ci : les magiciens, qui utiliseraient
la symétrie, et les clercs (pour reprendre
la terminologie
rôliste) qui utiliseraient la hiérarchie. Maintenant,
c'est peut-être mon obsession pour la symétrie qui me fait
proposer cette classification : néanmoins, il est certain
que, si je dois faire le chemin des mathématiques au mysticisme, la
symétrie m'évoque clairement une forme de magie pour les raisons que
j'ai déjà expliquées dans l'entrée que je lui ai consacrée, tandis que
ce dont je veux parler ici a une saveur, disons, plus religieuse, et
cela transparaît notamment dans la Théorie de la Totalité
Transfinie de Turing
que je décrivais
dans cette entrée.
Je ne sais pas quel est le phénomène mathématique sous-jacent à cette impression mentale de « grandeur » ou « hiérarchie », donc, mais je sais quel est le concept qui la réalise le plus parfaitement : il s'agit des ordinaux. J'ai déjà écrit ici une vulgarisation de ce concept (et j'ai même fait un visualisateur permettant de naviguer parmi les plus petits d'entre eux, quoiqu'il faille admettre qu'on n'y voit rien), donc mon but ici n'est pas de parler de mathématiques (même s'il est à prévoir que je n'y résisterai pas : j'invite alors le lecteur non intéressé par les questions techniques à ignorer ces passages, ou de lire en diagonale). [Ajout : pour des descriptions de quelques grands ordinaux et comment on peut les manipuler, je renvoie à ce billet ultérieur.] Ce que je veux présenter aujourd'hui est l'effet psychologique qu'ont sur moi les ordinaux — une sorte de psychanalyse de l'infini, si on veut, si ce n'est que je ne prétends pas vraiment être sérieux.
C'est une réalisation fascinante pour beaucoup d'enfants,
lorsqu'ils apprennent à compter, qu'il n'y a pas de plus grand
nombre : j'ai déjà écrit des
choses à ce sujet, je ne vais pas revenir sur cette fascination du
fait que dans le jeu qui peut dire le nombre le plus grand
,
quand quelqu'un dit N, quelqu'un d'autre peut
dire N+1 (ou N×2, ou N², ce qui en
langage d'enfants signifie transformer un zilliard
en un
zilliard de zilliards
; je note qu'une compréhension des
opérations les plus importantes des fonctions arithmétiques
« élémentaires » vient assez tôt). La grande-cousine de mon poussinet
nous racontait récemment, en parlant de son petit-fils, que ce dernier
était passionné par savoir qui compte le plus loin. Et j'ai le
souvenir assez net d'avoir joué à ces jeux (qui peut dire le nombre
le plus grand, et qui peut compter le plus loin) quand
j'étais petit. Je pense que c'est un signe que les mathématiques
peuvent exercer un véritable attrait sur les enfants — avant qu'on les
rende chiantes pour eux en leur faisant faire des calculs pénibles et
mécaniques à en dégoûter n'importe qui. Et je me souviens aussi
d'avoir eu des discussions, quand je jouais à ces jeux, pour savoir si
quelqu'un avait le droit de dire l'infini
, et si l'infini
plus un
(ou l'infini plus l'infini
ou l'infini
d'infinis
) était alors une réponse légitime, entre ceux qui
pensaient que ça n'existait pas, ceux qui pensaient que c'était de
toute façon pareil que l'infini, et ceux qui pensaient que c'était
encore plus grand. (Et en un certain sens, tous ont raison : il y a
différentes sortes d'infinis mathématiques selon l'usage qu'on veut en
faire ; mais les ordinaux vont plutôt donner raison aux derniers, et
pousser la logique.)
Mais il n'y a pas que cette fascination pour les nombres à laquelle
je pense chez les petits enfants. Il y en a une autre, que je
pourrais traduire comme l'idée que beaucoup de choses doivent
être totalement ordonnées : l'autre jour, dans une brasserie
où je déjeunais, j'entendis un enfant demander à son père qui était
le plus fort entre Darth Vader (enfin, Dark Vador, vu qu'il
parlait français) et je n'ai pas entendu le deuxième terme mais
j'imagine volontiers que c'était un super-héros quelconque. Par
coïncidence (coïncidence certes un peu limitée vue la sortie prochaine
d'un film très attendu), j'ai entendu, le même jour dans la rue, un
autre gamin poser exactement la même question entre Darth Vader et un
camion lancé à toute allure contre lui (question bizarre, mais je
crois bien que c'est ça). Je ne sais pas si cette croyance que la
puissance des super-héros ou des choses est totalement ordonnée (par
la relation gagne un combat contre
?) est enracinée dans le
développement de notre cerveau ou si c'est
culturel[#] (par exemple, à
force de se faire entrendre dire que Foo est plus Zippyesque que Bar
dans la publicité, dans la fiction, etc.), mais il est certain que,
petits, nous avons un certain goût pour les relations d'ordre total et
que ce goût ne disparaît pas totalement, en tout cas pas chez moi,
quand nous découvrons qu'en fait le monde n'est pas si simple, et que
deux choses ne sont pas toujours comparables.
[#] Spontanément, j'aurais plutôt tendance à imaginer que c'est culturel ; mais d'un autre côté, beaucoup du Mahābhārata, de ce que j'en ai retenu, est consacré à comparaison de personnages guerriers chaque fois plus puissants et moralement plus droits que tous ceux qui ont précédé, et à la vérification de ces comparaisons au cours de combats. Donc même si les auteurs épiques prennent ensuite plaisir à trahir les attentes qu'on peut avoir sur les résultats de ces comparaisons, et à introduire des ordres cycliques ou autrement paradoxaux, je soupçonne que la présupposition de l'ordre total se trouve bien dans la culture qui a engendré cette épopée.
Les ordinaux sont en quelque sorte la sublimation de ces jeux
d'enfants : de deux ordinaux, il y a toujours un plus grand (plus
fort, plus puissant, plus infini), d'ailleurs dans quasiment tous les
cas qu'on rencontre, le plus grand est tellement monstrueusement plus
grand que le plus petit, que le plus petit pourrait essentiellement
être le nombre 1 ; et à chaque fois qu'on a un ensemble d'ordinaux, il
y en a un qui est le plus petit de l'ensemble, et il y a un ordinal
qui est plus grand que tous ceux qu'on s'est donné. Si on
appelle ω la réponse que fait l'enfant qui
dit l'infini
en réponse aux milliards et milliards de milliards
que les autres ont proposés (techniquement, donc, le plus petit
ordinal supérieur à tous les ordinaux finis), alors il y aura
des ordinaux ω+1 (l'infini plus un
), ω·2
(l'infini plus l'infini
) et ω² (l'infini
d'infinis
) et encore d'autres choses plus grandes.
Mais je ne vais pas expliquer mon obsession pour les ordinaux uniquement à partir de ces jeux d'enfants. Il y a aussi une élégance intellectuelle dans la manière dont les ordinaux sont construits qui ne peut pas ne pas susciter l'admiration : le même genre d'élégance qui fait qu'on comprend que compter à partir de zéro est la bonne façon de faire (et d'ailleurs les ordinaux commencent à zéro). J'ai tenté d'expliquer ça dans l'entrée de vulgarisation que je leur ai consacrée, mais je pourrais résumer la construction des ordinaux en :
À chaque fois qu'on a construit les ordinaux jusqu'à un certain point, on crée un nouvel ordinal qui vient juste après tous ceux-là.
Cette idée est tellement génialement simple qu'on a du mal à se
rendre compte de sa puissance. Initialement, je ne sais pas du tout
ce que c'est qu'un ordinal, donc je n'en ai aucun : selon le principe
que je viens d'énoncer, je crée donc un premier ordinal qui vient
après rien du tout (i.e., c'est le plus petit de tous les ordinaux),
et que j'appelle 0. Je connais maintenant donc un seul ordinal, qui
s'appelle 0, et selon le principe de construction que j'ai énoncé,
j'en crée donc un autre qui vient juste après 0, et je l'appelle 1. À
ce stade-là, je connais donc 0 et 1, et je crée donc un nouvel ordinal
qui vient juste après eux, et je l'appelle 2. En procédant de la
sorte, je crée des ordinaux correspondant aux entiers naturels (0, 1,
2, 3, 4, 5… 42, 43, 44… 1000… 10↑42…), qui n'ont déjà pas de fin.
Mais contrairement à la fabrication des entiers naturels (en
gros, je fabrique 0, puis si je fabrique n, alors je
fabrique aussi n+1
), le principe que j'ai énoncé
ci-dessus continue de s'appliquer : maintenant que je connais
les entiers naturels, je crée un nouvel ordinal qui vient juste
après tous ceux-là et je l'appelle ω, ce qui donne
à son tour naissance à ω+1 et ainsi de suite.
Ce principe de construction est merveilleux parce que c'est
exactement le même qui s'applique à chaque fois, et qui ne cesse
jamais de s'appliquer, et malgré cela il donne naissance à une
richesse et une diversité extraordinaires, mais je vais y revenir. Et
les choses se déroulent ex nihilo, à partir du
rien (comme je viens de le dire, le principe marche dès le début : on
n'a pas d'ordinaux pour commencer, donc on crée un ordinal 0, il n'y a
pas de règle spéciale pour 0 comme il y a pour les entiers naturels).
On comprend
que Cantor,
quand il a découvert le concept, ait été ébloui par ce sur quoi il
venait de mettre le doigt. (Et on comprend aussi que cette idée ait
suscité la réticence, pour ne pas dire l'hostilité, de la communauté
mathématique de l'époque, selon un modèle assez bien résumé
par ce
webcomic ; David Hilbert a bien eu raison en parlant — au sujet de
la théorie des ensembles, mais certainement des ordinaux et cardinaux
en particulier — d'un paradis
que Cantor a créé et dont il ne
faut pas que les mathématiciens nous chassions nous-mêmes.) Mais la
construction a été rendue encore plus éblouissante
par von Neumann,
qui a proposé
(Zur
Einführung der transfiniten Zahlen
, Acta Litt. ac
Scient. Univ. Hung. 1, 199–208, en 1923 — l'auteur était
âgé de même pas vingt ans !) la réalisation suivante des ordinaux,
maintenant complètement standard :
Un ordinal est l'ensemble des ordinaux plus petits que lui.
Ainsi 0 est l'ensemble vide (∅) puisqu'il n'y a pas d'ordinaux plus petits, tandis que 1 est l'ensemble {0} = {∅} ayant pour seul élément 0=∅ puisque ce dernier est le seul ordinal plus petit, et 2 est l'ensemble {0,1} = {∅,{∅}} ayant les éléments 0 et 1, et ainsi de suite ; et ω = {0,1,2,3,…} est l'ensemble des entiers naturels. Ce n'est pas terriblement important pour la nature des ordinaux qu'ils soient « réalisés » comme par la définition de von Neumann, mais cela ajoute encore énormément à l'élégance fascinante de la construction, et au sentiment qu'elle se fabrique toute seule à partir de rien.
Il est certain que cette idée ne pouvait que susciter lors de son introduction des réactions assez vives, centrées sur le caractère légitime ou non d'admettre l'infini (l'infini actuel, c'est-à-dire réalisé, et non seulement potentiel) comme objet mathématique légitime, et le fait que la construction soit littéralement ex nihilo n'améliorait certainement pas les choses. J'ai mentionné ci-dessus qu'elle a suscité une très vive opposition, y compris de la part de certains des esprits les plus brillants du monde mathématique, comme Poincaré ou Weyl (et pas seulement des mathématiciens : Wittgenstein était profondément hostile à la théorie des ensembles), tandis que d'autres, non moins brillants, comme Hilbert ou von Neumann, l'ont accueillie avec enthousiasme. Pour la défense des sceptiques et détracteurs de la théorie des ensembles en général, et des ordinaux en particulier, il faut dire que toutes sortes de paradoxes (celui de Burali-Forti qui invite à considérer l'ensemble de tous les ordinaux, je vais y revenir, et celui de Russell qui invite à considérer l'ensemble de tous les ensembles qui n'appartiennent pas à eux-mêmes) ont été découverts dans la première formulation, pré-axiomatique, de la théorie des ensembles, et ces paradoxes pouvaient s'interpréter comme une impossibilité absolue de traiter directement des quantités infinies sans arriver à des contradictions. De nos jours, tout le monde ou presque admet que la difficulté était simplement de codifier rigoureusement les règles par lesquelles on a le droit de manipuler des ensembles et des infinis, et qu'une fois ces règles bien fixées (comme elles l'ont été par Ernst Zermelo et Abraham Fraenkel), la contradiction disparaît sûrement. (« Sûrement », même si on sait depuis Gödel qu'on ne peut jamais être totalement certain que la contradiction n'existe pas, et à chaque fois qu'on ajoute un infini plus grand, on ne peut qu'en être moins certain.) Ce qui est certain, c'est que la théorie des ensembles, et notamment la notion d'ordinal, fait partie des mathématiques maintenant considérées comme standard, même si cela n'empêche pas les crackpots de se concentrer dessus et de chercher à contredire différents passages de ce qu'ils ne comprennent pas, et spécifiquement les résultats de Cantor (typiquement, l'argument diagonal, même si celui-ci ne parle pas vraiment d'ordinaux). Et s'il y a une contradiction dans la théorie des ensembles, elle ne doit pas être si évidente que ça, vu le plaisir avec lequel des raisonnements d'une sophistication incroyable sont menés dedans et ne sont jamais encore tombés dans une contradiction[#2].
[#2] Digression
technique : Des gens savants peuvent ici me
rétorquer : mais si, on est tombé dans une contradiction !, en
postulant l'existence
d'un cardinal
Reinhardt
. Je ne sais pas si ça mérite vraiment une réponse
autre que oui, à force de chercher vraiment très fort à introduire
des axiomes aussi forts que possible et aussi proches que possible
d'une contradiction, on a fini par en trouver une (repassez quand vous
aurez une contradiction dans ZFC)
, i.e., je ne sais
pas si l'existence d'un cardinal Reinhardt a sérieusement été avancée
comme « vraie ». Cela n'a pas empêché de très grands théoriciens des
ensembles (je pense à Hugh Woodin) de se livrer à une analyse
mathématique et philosophique approfondie de pourquoi cette
contradiction et ce qu'elle signifie sur la taille de l'infini — voir
par
exemple l'article
de Woodin intitulé The Realm of the Infinite
— et voir d'ailleurs
aussi les
commentaires et explications de Peter Koellner sur ce texte. En
tout état de cause, cette histoire va plutôt dans le sens que quand on
trouve une contradiction dans la théorie des ensembles, elle n'est pas
spécialement difficile à exhiber (la preuve de la contradiction
de ZFC + « il existe un cardinal Reinhardt » a été
trouvée rapidement, et elle n'est ni longue ni très subtile), donc
j'ai tendance à croire que savoir jusqu'où on a pu aller trop loin
donne plutôt confiance en la solidité de l'édifice. (Alternativement,
on peut défendre la thèse que la contradiction ne vient pas du grand
cardinal supposé mais de l'axiome du choix qui limiterait la taille
possible de l'infini, comme l'axiome de
constructibilité place la limite beaucoup plus bas — en-dessous
d'un cardinal mesurable.)
Mais il est vrai que tous ces concepts fleurent bon la
contradiction tant ils semblent jouer avec elle et tourner autour
d'elle en l'évitant tout juste. C'est le cas de façon générale de la
logique mathématique (le théorème de Gödel s'approche dangereusement
du paradoxe de la phrase qui dit cette phrase est fausse
, et
nous invite à contempler attentivement la différence entre vérité et
démontrabilité — j'ai écrit de la
vulgarisation à ce sujet ici), mais
quand on ajoute les infinis dans l'histoire et la difficulté à se les
imaginer intuitivement, on comprend que certains ne se sentent pas du
tout à l'aise. Pour en revenir à mon propos initial, je pense que
c'est justement pour cela que, une fois admis que le sujet n'est pas
contradictoire, on le trouve d'autant plus stimulant. Arriver à
suivre certains raisonnements en logique ou théorie des ensembles,
bien plus que dans d'autres branches des mathématiques, peut être
comparable à un roman policier où tout le monde réussit à tromper le
détective tout en disant la plus stricte vérité.
Une conséquence de la construction des ordinaux (que ce soit celle
de Cantor ou celle, plus précise, de von Neumann), est qu'on ne peut
jamais en contempler la totalité : parler de la totalité des ordinaux
contredit immédiatement le principe même de construction des ordinaux,
puisque cette totalité devrait s'exposer immédiatement à définir un
nouvel ordinal plus grand qu'eux (dans la construction de
von Neumann : l'ensemble de tous les ordinaux), ce qui définit un
nouvel ordinal, contredisant la totalité de la totalité supposée !
C'est là essentiellement
le paradoxe
de Burali-Forti. La résolution moderne technique est que les
ordinaux ne forment en effet pas un ensemble, ils ne sont pas
regroupables en ensemble — si on veut donner un nom à tous les
ordinaux, ce sera une classe
— et la construction des ordinaux
ne s'applique qu'aux ensembles. Mais le contenu intuitif de cette
explication technique est le suivant : on ne peut en effet jamais
contempler la totalité des ordinaux, il faut donc décider d'arrêter de
les construire à un certain moment (mais il vaut mieux choisir un
moment raisonnablement « robuste », et c'est essentiellement cela que
permettent les axiomes de la théorie des ensembles), après quoi
l'ordinal qui vient immédiatement après s'appelle la classe des
ordinaux
et on fait semblant que ce n'est pas un ordinal, pas plus
que ceux qui viendraient après ; des
propriétés plus
ou moins compliquées, ajoutées sous forme d'axiomes, permettent de
décider jusqu'où on impose d'aller dans la construction des ordinaux.
Bref, on a effectivement affaire à quelque chose qui n'est jamais
achevé, qui ne peut jamais l'être par sa définition même, il faut
juste décider à quel moment on a quelque chose de « suffisamment
achevé », i.e., robuste, pour ce qu'on veut en faire. Là aussi, il
s'agit d'une perspective extrêmement dérangeante, et donc d'autant
plus fascinante quand on arrive à l'accepter mentalement : quand on
dit les ordinaux
, il y a toujours quelque chose d'inachevé dans
l'histoire. Et en fait, quand on examine de plus près la logique, on
se rend compte, et je vais essayer d'en dire un mot plus bas même si
c'est un peu complexe, que cet « inachèvement » ne concerne pas que la
notion de tous les ordinaux mais même des ordinaux bien précis,
disons ω₁ ou même ω₁CK
(voire ω ?), ce qui rend tout le panorama encore plus
mystérieux.
Dans ces conditions, il ne me surprend pas que Cantor soit devenu
mystique. Une rumeur persistante veut qu'il ait été fou, ce qui va
certainement dans le sens de démolir ad hominem
ses théories : la vérité est surtout qu'il a souffert de dépression,
notamment à cause du rejet de ses idées. Mais il est vrai qu'il a été
habité d'idées tout à fait mystiques, comme l'affirmation que c'était
Dieu qui lui avait inspiré l'idée des nombres transfinis, et que leur
existence (actuelle et non simplement potentielle) apportait une
lumière sur l'existence ou sur la pensée de Dieu. Et il a écrit
plusieurs lettres à des prêtres catholiques, dont le pape Léon XIII,
au sujet de théologie et de rapports entre théologie et mathématiques.
Même Hilbert utilise le terme de paradis
(Paradies) pour décrire le monde de la théorie
des ensembles ouvert par Cantor, avec ses infinis et ses raisonnements
non-constructifs, et ce n'est certainement pas un hasard. Moi-même je
ne peux que plaider coupable en ce qui concerne le mysticisme (même
si, je l'ai déjà expliqué, pour moi le mysticisme est avant tout
intéressant artistiquement, par exemple comme prémisse pour une œuvre
littéraire) : ma fascination pour les ordinaux a indiscutablement une
origine à peu près mystique, et quand je propose une interprétation
eschatologique du paradis cantorien (encore une fois,
la Théorie de la
Totalité Transfinie de Turing
), c'est du mysticisme à 0.02¤
(voire à (1/ω)¤).
Mais c'est là que je veux, pour expliquer le mécanisme
psychologique qui joue, rejoindre le mot que j'ai utilisé plus
haut : grandeur
. J'ai déjà dit que
je fais souvent des rêves de vastes
labyrinthes à explorer et j'ai déjà
comparé les mathématiques à un palais magnifique et
extraordinairement beau en même temps que labyrinthique : si
la symétrie est ce qui fait la beauté du palais,
la grandeur joue beaucoup pour qu'on ait envie de l'explorer.
Les ordinaux sont le terrain de jeu ultime pour ce qui est de
la grandeur, et comme un gosse qui découvre un nouveau
terrain d'aventure, j'ai envie de m'y lancer.
Or ce terrain est déroutant. Un peu à la façon de l'ensemble de
Mandelbrot (autre vaste terrain de jeu à explorer, dont j'ai fait une
petite démonstration
artistique à travers plusieurs vidéos parmi tant d'autres
trouvables sur le sujet sur YouTube), les ordinaux ont une structure
que j'ai envie de qualifier de fractale
, même si je ne saurais
pas justifier précisément le sens mathématique de ce mot. Grosso
modo, je veux dire que si on comprend comment sont fabriqués les
entiers naturels (i.e., ω), on recommence tout ceci pour
passer de ω à ω+ω = ω·2,
puis de nouveau pour passer à ω·3, et toutes ces
répétitions sont elles-mêmes répétées ω fois pour
fabriquer ω², et tout ça est encore fait ω fois
pour fabriquer ω³, et ainsi de suite : non seulement chaque
ordinal est l'ensemble des ordinaux qui précèdent mais aussi chaque
construction permettant de fabriquer des ordinaux est répétée de façon
de plus en plus complexe, de plus en plus imbriquée et de plus en plus
délicate pour fabriquer des ordinaux plus grands.
Les images
présentées par mon petit navigateur d'ordinaux ne sont qu'un pâle
reflet de cette structure fractale qui m'évoque la façon dont
l'ensemble de Mandelbrot se retrouve partout dans l'ensemble de
Mandelbrot (je répète que ceci n'est pas censé être une affirmation
mathématique mais une impression psychologique). J'ai le souvenir
d'avoir fait un rêve, évidemment
impossible à raconter dans lequel on me montre ω₁ (dans
le rêve, on me disait ℵ₁, mais c'est la même chose), qui prend en
l'occurrence la forme d'une sorte de sculpture moitié gothique, moitié
sarrasine et semble l'œuvre fantastique des Sylphes, des Fées, des
Génies et des Gnomes réunis (avec mes excuses à E. A. Poe).
Les ordinaux, aussi, sont liés de façon profonde à l'univers constructible de Gödel : la vulgarisation que j'ai tenté d'en faire dans cette entrée passée est assez mauvaise, je trouve, et je ne vais pas tenter de l'améliorer maintenant, mais disons juste ceci. De façon orthodoxe, les mathématiques sont fondées sur la théorie des ensembles, c'est-à-dire que tout objet mathématique « est » un ensemble (un peu de la manière dont les objets informatiques « sont » des suites de 0 et de 1 : pour passer de la sémantique qu'on veut donner à l'objet à cette représentation « de bas niveau », il y a une étape de codage qu'on s'empresse d'oublier quand on a développé les outils pour travailler « à haut niveau » sur l'objet). Mais si on croit à l'« axiome de constructibilité », alors en fait on pourrait tout coder sous forme d'ordinaux (et axiomatiser les mathématiques pour parler uniquement d'ordinaux, sans passer par les ensembles : je ne crois pas que quiconque l'ait fait explicitement). Cet axiome de constructibilité a des conséquences mathématiques tangibles (j'en ai cité quelques unes dans l'entrée évoquée ci-dessus), mais généralement parlant on peut quand même l'ignorer : si on est prêt à l'admettre, on peut dire que tout le monde mathématique est formé d'ordinaux plutôt que d'ensembles. Mais l'axiome de constructibilité est aussi intimement lié à la notion de calculs sur les ordinaux. (Il faut toujours que j'écrive une entrée pour expliquer comment on peut définir la calculabilité sur des ordinaux et programmer des ordinateurs transfinis qui les manipulent, mais j'ai au moins donné une formulation équivalente à la première étape intéressante de cette hiérarchie en parlant de machines hyperarithmétiques.) Si on croit à cet axiome[#3], donc, non seulement le monde mathématique devient peuplé d'ordinaux, mais il devient « opérationnel », comme formé de programmes tournant sur des ordinateurs inimaginablement puissants, ou plutôt sur des séquences transfinis d'ordinateurs de plus en plus puissants. La description que je viens de faire est plus métaphorique que scientifique, bien sûr, mais elle est destinée à expliquer pourquoi l'univers constructible me fascine, et comment cela se relie aux ordinaux : je ne peux pas rester insensible à cette vision du monde mathématique comme une gigantesque machine de calcul.
[#3] En fait, on ne
croit pas à cet axiome V=L, ou du moins, les
théoriciens des ensembles assez « platoniciens » pour avoir un avis
sur la question (de savoir si un énoncé indécidable
dans ZFC peut avoir une valeur de vérité) croient
essentiellement tous qu'il est faux, parce qu'il limite la taille de
l'infini. (Ceci dit, je ne sais pas pourquoi on n'applique pas la
même logique pour conclure que l'axiome du choix est faux,
cf. ma note précédente.) À la
place, on cherche à trouver un remplacement de L qui assure
aussi une structure forte et ordonnée de l'univers des ensembles et
qui soit compatible avec les plus grands cardinaux : c'est ce qu'on
appelle le core model program
(ou inner model program, je ne sais pas dans
quelle mesure c'est synonyme) ; de ce que je comprends, on sait
définir des analogues de L pour certains grands cardinaux,
mais la question cruciale est de savoir si on peut atteindre
un cardinal
supercompact, parce que si on y arrive, le modèle en question peut
rendre compte de tous les grands cardinaux (même ceux qui
sont beaucoup plus grands/forts qu'un cardinal supercompact) et Woodin
appelle ça le L ultime
. Maintenant, je ne sais pas
dans quelle mesure ce « modèle-cœur » peut être considéré sous l'angle
de la calculabilité (il est vrai que 0♯ est une sorte de
super-giga-saut-de-Turing, donc ça pourrait le laisser croire) ; j'ai
plusieurs fois fait des timides tentatives pour essayer d'apprendre ce
sujet, mais il est invraisemblablement technique (il y a des souris,
des présouris, des protosouris, des phalanges, des belettes, et même
des belettes stablement universelles ! — je ne plaisante
pas, regardez
cet article). Pour un survey sur la question, on pourra par
exemple se tourner vers le texte de
Woodin, Strong
Axioms of Infinity and the search for V.
Mais revenons aux ordinaux eux-mêmes. Ce qui est décevant, c'est que ce monde est tellement vaste qu'on ne peut en explorer qu'une infinitésimale partie. J'aime bien donner l'image de ω₁ comme un escalier littéralement interminable : même si vous avez le pouvoir de vous déplacer en un temps aussi court que vous voulez à n'importe quel échelon de l'escalier, et même si vous avez un temps infiniment long pour monter, il y aura toujours un échelon que vous n'atteindrez pas. (Alors que pour les entiers naturels, on peut passer une seconde sur le premier échelon, ½ seconde sur le suivant, ¼ sur le suivant et ainsi de suite, et donc franchir tous les entiers naturels en deux secondes.)
Le premier endroit où j'ai appris un peu sérieusement ce que sont les ordinaux, c'est dans le joli petit livre Naïve Set Theory de Halmos, que mon papa m'avait prêté. Comme la plupart des gens qui entendent parler des ordinaux pour la première fois, mon intuition a buté contre ε₀ (la limite de ω, ωω, ωωω, etc.), mais comme le sujet me titillait, j'ai insisté jusqu'à comprendre correctement cet ordinal, c'est-à-dire, redécouvrir par moi-même ce qui est essentiellement la forme normale de Cantor ; puis j'ai poussé jusqu'à comprendre ε₁ (la principale difficulté est de réussir à se désembrouiller des différentes expressions comme ε₀ε₀ = ωωε₀·2), et j'ai extrapolé en me disant que du coup je comprenais εγ en général. Je me suis ensuite dit que sûrement la limite de ε₀, εε₀, εεε₀, etc., devait être ω₁ (Halmos note d'ailleurs ce dernier, de façon un peu vieillote, Ω), et que du coup j'avais compris les ordinaux dénombrables, ouf ! Ce n'est que plus tard que je me suis aperçu de mon erreur : la limite de ε₀, εε₀, εεε₀, etc. ne peut pas être ω₁, parce que ω₁ ne peut pas être obtenu comme limite d'une suite d'ordinaux plus petits (c'est ce que j'essaie de dire dans le paragraphe précédent) : toute suite à valeurs dans ω₁ est bornée ! J'ai alors eu un vertige en comprenant à quel point ω₁ est impossible à appréhender — et ce n'est que le premier cardinal après ω !
Mais ce qui est surtout décevant, c'est que les mathématiques
elles-mêmes sous-utilisent les ordinaux. De façon basique, si on
regarde les ordinaux (dénombrables, pour éviter des discussions
oiseuses) utilisés dans des constructions ou démonstrations
mathématiques en-dehors de la théorie des ensembles elle-même, on
s'aperçoit qu'ils ont tendance à ne pas être très grands. Pour être
plus précis : il existe une branche des mathématiques appelée théorie
de la démonstration, dont une sous-branche
appelée analyse
ordinale s'attache à attribuer à une théorie mathématique (comme
les axiomes de Peano) un certain ordinal (dénombrable et même
« récursif ») qui mesure sa force (je vais rester insupportablement
vague, mais la force de l'arithmétique de Peano est essentiellement
mesurée par l'ordinal ε₀) ; en quelque sorte, cela signifie
que la théorie n'est pas capable d'« utiliser » un ordinal plus grand,
ou de façon un tout petit peu moins vague, de formaliser une induction
transfinie (sorte de généralisation de la récurrence) sur cet ordinal
ou un ordinal plus grand quelconque. Dans le cas de la théorie des
ensembles, cet ordinal est extrêmement grand (quoique plus petit
que ω₁CK) et on ne sait pas le décrire autrement
que l'ordinal qui mesure la force de ZFC
. Mais un
consensus des logiciens est qu'essentiellement toutes les
mathématiques usuelles peuvent se faire dans des théories logiques
dont la force (mesurée par un ordinal comme je viens de le dire) est
finalement très petite : ε₀ ou même
peut-être ωω voire moins (voir par
exemple le
papier Number
Theory and Elementary Arithmetic de Jeremy Avigad pour un
énoncé précis). Ce que cela signifie concrètement est que : les
mathématiques ne savent pas vraiment utiliser les ordinaux très
puissants qu'elles définissent (ni toute la force de la théorie
des ensembles, loin de là). Ceci m'amène évidemment à me demander ce
que seraient les mathématiques si nous pouvions/savions réellement
faire usage des ordinaux plus grands (que nous pouvons décrire et
discuter mais sans les « comprendre » ou les « utiliser » en
profondeur) ; le petit indice que nous pouvons tirer des quelques
théorèmes
(comme celui-ci)
dont la force logique qui dépassent la « force usuelle » des
mathématiques, suggère que ce serait certainement intéressant.
J'ai commencé cette entrée en rappelant ma fascination pour la
symétrie. Les ordinaux sont tout le contraire de symétriques : ils
sont rigides (il n'y aucune façon de changer l'ordre des
éléments — c'est-à-dire des ordinaux plus petits — d'un ordinal, parce
que le plus petit est identifié comme le plus petit, le suivant est
identifié comme le suivant après lui, et ainsi de suite ; pour ceux
qui veulent un théorème précis : tout ensemble bien-ordonné est
isomorphe à un unique ordinal, et l'isomorphisme est lui-même unique).
Il faut un jour que j'écrive une entrée sur la question
semi-mathématique et semi-philosophique de savoir quand deux objets
mathématiques sont le même et de pourquoi les symétries posent
problème dans ce contexte[#4],
toujours est-il que pour les ordinaux, cette question ne doit pas se
poser : l'ordinal ω, par exemple, qui est le plus petit
infini, est le même pour tout le monde, et l'ordinal ω₁,
qui est le plus petit indénombrable, devrait aussi l'être
(devrait
, parce qu'il y a des mentions légales auxquelles je
viens dans un instant). En un certain sens, c'est mentalement
rassurant : si nous devions parler d'ordinaux avec des
extra-terrestres, la question de savoir si nous parlons du même
ordinal a un sens parfaitement bien défini, pas comme si nous parlions
de gauche et de droite où se posent toutes sortes de questions, à
cause de l'existence de symétries (les réflexions de l'espace) sur
l'orientation de l'espace et comment savoir si gauche
et droite
ont le même sens pour nous et pour eux.
[#4] Digression
(technique) à ce sujet : il y a des gens qui insistent (et ils ont
sans doute raison…) sur le fait qu'on doit écrire une
clôture algébrique du corps k
et non la
clôture algébrique du corps k
, parce que la clôture
algébrique n'est définie qu'à isomorphisme non-unique près. (Un cas
frappant est celui de ℚ : on en fabrique une clôture algébrique en le
plongeant dans ℂ, c'est-à-dire en considérant les nombres complexes
qui sont racine d'un polynôme à coefficients rationnels ; mais on en
fabrique une autre clôture algébrique en le plongeant dans
ℂp pour chaque nombre premier p,
c'est-à-dire en utilisant une construction du même style sur
les p-adiques — on peut la rendre tout à fait explicite, je
ne rentre pas dans les détails : mon point est qu'on obtient des
présentations très différentes de clôtures algébriques de ℚ, et bien
qu'il existe un isomorphisme entre les deux même en l'absence
de l'axiome du choix, cet isomorphisme n'est pas du tout explicite.)
D'un autre côté, on parle bien du corps des nombres
complexes, alors qu'il n'est défini, même sur les réels, qu'à un
isomorphisme près qui peut prendre deux valeurs possibles (conjuguées
complexes l'une de l'autre), et j'ai tendance à trouver que pour ce
qui est de la clôture algébrique d'un corps fini il est également
légitime de dire la
. Tout ceci est donc un peu délicat, parce
qu'est délicate, à la base, la question de savoir de quelles
structures on dote un objet mathématique. (Je sais que V. Voevodsky
est censé résoudre toutes ces difficultés grâce aux merveilles de la
théorie homotopique des types, mais moi je ne suis qu'un vulgaire
algébriste aux sympathies pour la logique classique et qui continue à
croire bêtement que ZFC est consistant et à travailler
dedans, du coup ces merveilles m'échappent.)
Mais en fait il y a une subtilité, c'est que s'il n'y a pas de symétries dans le monde des ordinaux, il y a des « fausses symétries », ce que j'avais appelé dans mon entrée consacrée à la constructibilité, un « jeu de miroir » : il y a des ordinaux qui « font semblant » d'être d'autres ordinaux ou d'être la classe de tous les ordinaux ! Il est difficile d'expliquer ce que cela veut dire au juste. (Pour ceux qui connaissent la théorie des ensembles, je fais référence à des choses dans le style de Löwenheim-Skolem : notamment, au fait que Lα peut être un sous-modèle élémentaire ou un sous-k-modèle élémentaire d'un autre, voire un sous-k-modèle élémentaire de L tout entier, ou encore, peut vérifier un bon bout des axiomes de la théorie des ensembles ; ou éventuellement les mêmes choses avec V à la place de L, même si j'ai plutôt L que V à l'esprit.) Mais disons en gros qu'il y a toutes sortes de manières dont l'ensemble des ordinaux inférieurs à un certain α (c'est-à-dire, selon la définition des ordinaux à la von Neumann, α lui-même…) peut ressembler à l'ensemble des ordinaux inférieurs à un certain β>α quand on ne regarde pas de trop près (et « pas de trop près » a tendance à être lui-même quantifié par un autre ordinal). Par exemple, il y a toutes sortes d'ordinaux qui vont donner temporairement l'impression (plus ou moins fortement convaincante) d'être ω₁, puis, quand on va un peu plus loin, on va se rendre compte qu'en fait, non, ce n'est pas ω₁. (Il est difficile de donner ne serait-ce qu'une idée de ce qui se passe au juste, mais pour proposer un début de commencement d'embryon d'idée, on peut penser au fait que ε₀ et ε₁, ou tous les ε en général, sont essentiellement impossibles à distinguer quand on regarde les ordinaux plus petits et qu'on se permet seulement de faire des additions, multiplications et exponentiations — parce que l'ordinal qui est au-dessus est inatteignable par ces opérations ; je peux aussi évoquer le fait que ω₁CK fait un peu semblant[#5] d'être ω₁, d'où le nom, en ce que toute suite d'ordinaux à valeurs dans ω₁ est bornée, tandis que la même chose est vraie pour une suite récursive dans ω₁CK.) Tout ce phénomène est assez subtil et assez labyrinthique, et assez déstabilisant, mais en même temps intellectuellement fascinant : le monde des ordinaux, que je qualifiais de fractal ci-dessus, contient en effet des copies de lui-même en miniature, des copies de qualité arbitrairement précise, dans un « jeu de miroir » vertigineux.
Et cela pose des questions à mes yeux profondes de philosophie des
mathématiques : vu qu'il y a toutes sortes d'ordinaux qui se succèdent
pour « faire semblant » d'être ω₁, on se demande si le
vrai ω₁ existe « vraiment », et ce que cette question veut
dire. Ou peut-être que ω₁ est quelque chose comme la
classe de tous les ordinaux : quelque chose de perpétuellement
inachevé, qu'on n'en finit pas de compléter. (Pour ceux qui en savent
plus, voici le genre de phénomènes auxquels je pense : s'il existe un
modèle bien-fondé de ZFC, il existe un plus petit modèle
transitif dénombrable M de ZFC, et
l'ordinal ω₁M qui joue le rôle
de ω₁ dans ce modèle est un « faux » ω₁
puisqu'il est dénombrable ; formellement, on passe
de ω₁M à ω₁ en
ajoutant ω₁ échelons à la fin, mais il est sans doute plus
juste de s'imaginer qu'on les ajoute à toutes sortes d'endroits au
milieu parce qu'on a mieux
regardé ω₁M et qu'on s'est dit il
y a un trou là, là et là
. Une extension de forcing
sur M peut écraser ω₁M,
et, selon le point de vue qu'on adopte, le rendre
dénombrable, ou exhiber le fait qu'il l'était dès le début,
sans que l'ordinal lui-même change.) Et le problème philosophique
devient encore plus épineux quand on commence à se demander quel est
le plus petit ordinal qui peut se permettre d'être inachevé (ce n'est
certainement pas 42 : je crois quand même que s'il manquait un nombre
entre 0 et 41, quelqu'un s'en serait aperçu ! ), et
ce que cette question veut dire. Malheureusement, les philosophes se
sont assez peu penchés sur ces problèmes, ni les mathématiciens, ni
même ceux qui ont la double casquette (comme Hugh Woodin dont je
parlais plus haut, ou Hilary Putnam, qui a pourtant étudié des
problèmes remarquablement proches ; il y a bien Joel D. Hamkins — un
ancien étudiant de Woodin — qui a beaucoup dit des choses sur la
conception « multivers » de la vérité ensembliste, mais son point de
vue est un peu différent, je ne rentre pas dans les détails).
[#5] Il y aussi le phénomène suivant : j'ai déjà évoqué, par exemple dans cette entrée (même s'il faudra un jour que j'y revienne plus précisément) qu'il y a des phénomènes de « reflet » pas totalement bien compris entre (0) les grands entiers naturels (i.e., les ordinaux <ω), (1) les grands ordinaux constructifs (i.e., les ordinaux <ω₁CK), (2) les grands ordinaux dénombrables [dans l'univers constructible] (i.e., les ordinaux <ω₁L), et (3) les grands cardinaux [qui ont le droit d'exister dans l'univers constructible]. Par exemple, un cardinal inaccessible (dans la catégorie (3)) permet de définir par analogie la notion d'ordinal récursivement inaccessible (dans la catégorie (2)), qui permet à son tour de définir par « écrasement » de très grands ordinaux récursifs (i.e., dans la catégorie (1)) mesurant la force ordinale d'un système formel KPI garantissant l'existence d'ordinaux récursivement inaccessibles, et ceux-ci permettent à leur tour de définir de très grands entiers (essentiellement des valeurs de fonctions calculables dont KPI démontre la terminaison, même si on peut les décrire de façon beaucoup plus explicite grâce à (1)). Le lien entre ces quatre objets est subtil, mais des questions philosophiques qui se posent sont : sachant qu'on n'a pas besoin formellement que (3) existe (l'existence de cardinaux inaccessibles n'est pas démontrable par ZFC) pour que (2) existe, ni (2) pour (1), ni (1) pour (0), mais qu'on en a besoin pour motiver la construction, qu'est-ce que ceci nous apprend sur la plausibilité de l'existence de (3) ? et d'autre part, est-ce que le fait de « trouver » de « nouveaux » ordinaux, voire de nouveaux ordinaux récursifs, voire de nouveaux entiers naturels, par ce procédé, signifie que ω₁, voire ω₁CK, voire ω, étaient inachevés ?
Comme je m'en doutais, je me suis perdu dans un certain nombre de digressions techniques, mais si je dois synthétiser tout ça en une raison supplémentaire pour laquelle les ordinaux me fascinent, c'est que leur construction a la beauté des fractales (même si cette fractale ne peut se voir qu'avec l'esprit), où des imitations de plus ou moins bonne qualité des ordinaux se retrouvent sans arrêt dans d'autres ordinaux comme des copies de l'ensemble de Mandelbrot dans l'ensemble de Mandelbrot ; mais avec les ordinaux, ces phénomènes deviennent sans cesse plus riches, plus complexes et plus subtils, jusqu'à l'infini et au-delà, de sorte que non seulement l'ensemble est d'une très grande beauté, mais aussi qu'il soulève des problèmes philosophiques profondément troublants si on prend la peine d'y réfléchir soigneusement.