Les chasseurs-prouveurs se rassemblaient comme chaque soir autour de l'équation de la chaleur et se racontaient les histoires de leurs aventures. Joueur-Atlas, qui était célèbre pour avoir autrefois attrapé un groupe parfait à 8 315 553 613 086 720 000 éléments évoqua le fils de « son » groupe, dont il avait aperçu la silhouette monstrueuse, à la lumière de la lune, en train de remuer près du nombre 196 883, et qu'il espérait voir un jour capturé. Mais ce soir, c'était au tour du vieux Bâtisseur-Alternatif de prendre la parole.
— Un jour, j'ai vu un corps comme je n'en avais jamais vu auparavant.
Il désigna une figure rupestre qu'il avait exécutée il y a longtemps, à la craie sur le tableau noir du Hilbertraum : un F pas tout à fait gras finissant par un 1 plutôt bas. Et il conclut théâtralement :
— Figurez-vous que ce corps n'avait qu'un seul élément.
Certains soupiraient d'entendre Bâtisseur-Atlernatif raconter toujours la même histoire à dormir debout, mais les jeunes chasseurs-prouveurs étaient fascinés :
— Un corps à un seul élément ? Mais ce n'est pas possible, grand-père !
— Pourtant je l'ai bien vu. Et attendez, ce n'est pas le plus incroyable… il était… sous l'anneau des entiers !
Cette révélation fit place à un silence choqué de la part de ceux qui n'avaient pas encore entendu cette légende. Un corps caché sous l'anneau des entiers ! Cela semblait si impossible — et en même temps si prometteur !
⁂
Bon, trêve d'humour à 1/1728 zorkmids.
Ce que j'appelle licorne mathématique
,
c'est un objet mathématique dont on aimerait croire à l'existence, un
objet dont on a une certaine intuition et même des indices suggérant
sa présence, qui, naïvement envisagé tel quel, n'existe pas, n'est pas
possible, conduit à des paradoxes et des contradictions. On peut
démontrer qu'il n'existe pas, que les propriétés qu'on lui attribue
sont impossibles, et pourtant, on cherche quand même un moyen de le
faire exister.
Ce qui fait que les licornes sont des licornes, c'est qu'on n'a pas trouvé la bonne définition ou la bonne théorie-cadre. Chasser la licorne, c'est donc chasser la définition ou la théorie qui lui permettra d'exister et de faire disparaître les paradoxes. Cela peut sembler bizarre : si on s'imagine qu'on donne naissance à un objet mathématique en le définissant, comment peut-il y avoir des objets qu'on poursuive sans parvenir à les définir ? Pourtant, cela se produit assez souvent (et je prends même ça pour un indice — certes pas terriblement concluant — dans le sens que les mathématiques existent indépendamment de l'homme).
*
L'exemple le plus simple est sans doute celui des nombres complexes. La manière dont je vais l'évoquer prend des libertés avec l'Histoire, qu'on m'en pardonne, mais mon but n'est past de raconter l'histoire des maths mais d'expliquer le concept d'une licorne. La racine carrée de −1, donc, était une licorne : un nombre qui, multiplié par lui-même, donne −1, c'est impossible a priori. Et on a une preuve de cette impossibilité : à savoir, que x soit positif ou négatif, son carré x² = x·x est forcément positif, donc ne peut jamais valoir −1. Bref, √(−1) est une licorne. Pourtant, quelqu'un prétend avoir vu des traces de la licorne : si on fait comme si elle existait, si on oublie cette impossibilité, si on mène les calculs comme si la racine carrée des nombres négatifs avait un sens, on arrive à résoudre des équations du troisième degré qu'on ne savait pas résoudre autrement (celles qui ont trois racines). Comment expliquer que quelque chose d'impossible conduise à une conclusion heureuse ? C'est cela qui fait soupçonner que la licorne existe vraiment, et qui donne envie de la capturer.
Maintenant on ne voit plus du tout que cette histoire a été une licorne : maintenant, √(−1) est un nombre complexe, quelque chose de tellement banal qu'on en oublie trop facilement que cela a pu représenter un paradoxe, une licorne. Pourtant, pour capturer cette licorne, il a fallu faire un saut conceptuel : abandonner l'idée que les nombres soient ordonnés, c'est un saut conceptuel gigantesque (les nombres ont été faits pour être ordonnés, pourrait-on dire ; les opérations algébriques sont une sophistication ajoutée sur le concept de comparaison). Mais une fois fait le saut conceptuel, une fois définie la notion de nombre complexe, la licorne est capturée, elle perd tout son mystère, on s'aperçoit que la définition antérieure de nombre était restrictive (ce qui ne signifie pas qu'elle n'ait pas de valeur !, il n'est pas question de remplacer systématiquement les nombres réels par des nombres complexes en mathématiques ou ailleurs).
Ce qui m'intéresse dans cette histoire, c'est la démarche où d'abord on aperçoit des traces de pas qui semblent paradoxales (cette bestiole marche comme un cheval, pourtant elle semble avoir une corne !), on traque le concept, et on finit par capturer la licorne, c'est-à-dire résoudre le paradoxe, rendre possible ce qu'on avait démontré impossible, en contournant l'impossibilité par une définition élargie. La licorne se capture par la définition. C'est inhabituel par rapport à la pratique générale des mathématiques qui consiste à chasser les preuves, pas les définitions (ni les licornes).
Méta : Dans la suite, je vais évoquer quelques autres licornes. Ne sachant pas à quel niveau de vulgarisation me placer, je n'ai pas vraiment pris de décision cohérente à ce sujet, et je suppose donc de la part de mon lecteur des connaissances variables de paragraphe en paragraphe : j'espère néanmoins avoir fait en sorte qu'on puisse comprendre un petit peu l'idée générale même si on ne comprend pas tel ou tel passage. D'autre part, comme mon but était de raconter une histoire plus que d'exposer des maths, il se peut que je dise des choses un peu abusées ici ou là (j'espère quand même avoir toujours été assez vague pour qu'on ne puisse pas m'accuser d'avoir écrit un énoncé indiscutablement faux, mais si c'est le cas, je mettrai la faute sur les licornes qui m'ont poussé).
*
Un autre exemple que je trouve assez convainquant de licorne qui a été capturée (beaucoup plus récemment que √(−1)) est la « fonction δ » de Dirac. Naïvement, c'est une fonction qui vaut zéro partout sauf en zéro, où elle prend une valeur infinie, et même tellement infinie que l'intégrale de la fonction vaut 1. Sauf que, dit comme ça, ça n'a pas de sens : l'intégrale de Lebesgue ne permet pas une telle chose. Ça n'a pas empêché Dirac d'introduire cette « fonction », et de se rendre compte que c'était bien utile de s'en servir (dans son cas, en mécanique quantique ; mais elle sert aussi en traitement du signal ou dans toutes sortes d'autres contextes). Le sens intuitif est clair : on concentre une fonction positive sur une région infinitésimale autour de 0 en gardant l'intégrale constante ; mais la difficulté est de formaliser la chose. Il y a toutes sortes de propriétés « impossibles » qui viennent naturellement avec : par exemple, sa transformée de Fourier est la fonction constante égale à 1 (contredisant notamment le théorème de Riemann-Lebesgue qui assure que la transformée de Fourier d'une fonction intégrable doit tendre vers zéro à l'infini) ; on peut aussi écrire cette licornesque fonction δ comme une limite de densités de probabilités gaussiennes centrées en 0 et dont l'écart-type tend vers 0 (et vérifier que cette limite, en fait, n'existe pas en tant que fonction). Et si on commence à considérer δ² les choses ne tiennent vraiment plus guère debout. Par contre, si on introduit la dérivée δ′ de δ, les choses se passent nettement moins mal, mais c'est encore plus difficile à justifier formellement.
Bref, une licorne : un objet dont on voudrait bien qu'il existât, mais qu'on n'arrive pas à faire entrer dans le formalisme de la théorie dont on dispose. Ce n'est pas que la théorie est « fausse », bien sûr : c'est que les définitions sont trop étroites pour encadrer l'objet qu'on voudrait. C'est le signe qu'il doit y avoir une théorie plus générale à découvrir.
Dans le cas de la « fonction δ », la théorie en question est celle des distributions, développée en 1945 par Laurent Schwartz. et on peut presque dire qu'il a obtenu la médaille Fields (en 1950) non pas pour un théorème mais pour une définition. L'idée qui permet de formaliser la fonction « fonction δ », donc, c'est de la considérer non pas comme une fonction numérique (de ℝ vers ℝ), mais à travers son intégrale : une distribution f n'est pas quelque chose qui à un réel x associe un autre réel f(x) mais qui à une « fonction-test » φ associe un réel ⟨f,φ⟩ qui correspond intuitivement à ∫(f·φ) = ∫f(x)·φ(x)·dx (et généralise cette construction pour une fonction) ; en choisissant correctement quel espace de fonctions-test on prend et quelle condition de continuité on exige sur φ ↦ ⟨f,φ⟩, on arrive à définir une notion de distribution qui se comporte de façon agréable. (La distribution δ est alors simplement définie par le fait que ⟨δ,φ⟩ = φ(0), et sa dérivée δ′ par le fait que ⟨δ′,φ⟩ = −φ′(0).)
La théorie des distributions ne vient évidemment pas contredire les théorèmes d'impossibilité selon lesquels la « fonction δ » ne pouvait pas être une fonction : elle passe à côté, définit une nouvelle sorte d'objets pour attraper la licorne. Il n'y a pas forcément qu'une seule possibilité. Heaviside en 1893 (donc bien avant Dirac) avait inventé une forme de « calcul symbolique » qui donnait un sens à la fonction δ (pas encore nommée ainsi), même si ce sens était très peu satisfaisant : on ne peut pas considérer qu'il ait attrapé la licorne, simplement qu'il l'avait aperçue ; Bochner en 1932 avait introduit un notion de « fonctions formelles » (dérivables à volonté) qui, en fait, recouvrait partiellement la théorie des distributions et aurait permis de définir la fonction δ, mais personne ne s'en est rendu compte : il a frôlé la licorne sans le savoir. En 1958, Mikio Satō a introduit les hyperfonctions, généralisant encore plus les distributions — il aurait été parfaitement possible qu'elles fussent définies en premier. La théorie des distributions ouvrait elle-même des quêtes de nouvelles licornes : on ne peut pas multiplier les distributions (par exemple définir δ²), il y a un théorème d'impossibilité de Schwartz à ce sujet ; mais dans les années '80, on a attrapé cette licorne-là, quand Colombeau a défini les algèbres qui portent son nom.
*
Évidemment, la chasse aux licornes a un coût : les licornes ne sont pas des animaux comme les autres, donc ne se comportent pas comme les autres : même une fois qu'on les a attrapées par une définition, il faut les apprivoiser, et ce n'est pas forcément facile. Les nombres complexes n'ont pas toutes les propriétés des nombres réels (avoir dû abandonner la possibilité de les ordonner est un gros sacrifice). Les distributions de Schwartz ne se comportent pas comme des fonctions, elles ont des propriétés qui peuvent être déplaisantes, voire vraiment pénibles, et ne sont pas adaptées à tout et n'importe quoi ; les éléments des algèbres de Colombeau sont encore plus désagréables, et on ne s'en sert pas tant que ça. Mais il est quand même utile d'avoir attrapé la licorne pour comprendre comment elle fonctionne, pour savoir comment on peut formaliser une notion qu'on avait envisagée intuitivement.
Distinguons la chasse aux licornes de celle de l'éléphant blanc. La licorne a ceci de particulier qu'on « sait » qu'elle ne peut pas exister : toute la difficulté est de trouver la définition qui lui permet quand même d'exister. L'éléphant blanc, lui, on ne sait pas s'il existe ou on ne sait pas le construire, mais c'est un animal normal. Celui qui réussit à le capturer a droit à la gloire, mais il n'a pas accompli quelque chose qui semblait carrément impossible. Un exemple d'éléphant blanc, c'est le groupe Monstre (ou le groupe J₄ de Janko) : on a vu les traces du Monstre avant de l'attraper, c'est-à-dire qu'on soupçonnait sa présence, on savait plein de choses sur lui[#], sans avoir de construction ou de preuve de son existence — mais il n'y avait pas de doute que c'était un groupe, qu'on n'avait aucun besoin d'étendre la définition de « groupe » pour lui faire plaisir. Une licorne, c'est autre chose.
[#] En l'occurrence, la « table de caractères », qu'on peut comparer à une empreinte extrêmement précise que l'éléphant a laissé sur le monde mathématique. Un squelette, peut-être ? Une fois qu'on a vu le squelette, l'existence de l'animal ne fait vraiment plus guère de doute, même s'il reste à attraper.
Je ne prétends pas que ma classification des objets hypothétiques en licornes et éléphants blancs soit toujours parfaitement claire, cependant. La définition mathématiquement précise d'une théorie quantique des champs est quelque part entre les deux (ou peut-être que c'était une licorne jusqu'à ce que les axiomes de Wightman la transforment en éléphant blanc ; mais les intégrales de chemin sont probablement encore plutôt du côté des licornes).
En matière d'analyse, il y a une autre licorne (ou en tout cas une bestiole apparentée) que je pourrais mentionner, et qui a été au moins partiellement domestiquée, c'est la sommation des séries divergentes. La somme (0+1+2+3+4+⋯), par exemple, vaut classiquement l'infini, mais si on chevauche la bonne licorne, elle peut valoir −1/12 (tandis que (1+1+1+1+1+⋯) vaut −1/2). Quand on manipule les séries divergentes, on aboutit facilement à toutes sortes de paradoxes (du genre, (1+1+1+1+1+⋯) = (1+(1+1+1+1+⋯)) donc (−1/2) devrait valoir 1+(−1/2), ce qui manifestement n'est pas le cas), mais il y a quand même toutes sortes de manipulations qui favorisent la valeur −1/12 pour (0+1+2+3+4+⋯) (disons) : une théorie de la sommation des séries divergentes doit rendre rigoureuse l'explication de quelles séries elle permet de sommer, avec quelles valeurs et pourquoi, et quelles manipulations sont légitimes ou non ; par exemple, la sommation de (0+1+2+3+4+⋯) en −1/12 est justifiée par la régularisation par fonction zêta. On est un peu à la limite de ce que j'appelle une licorne, parce que le problème n'est pas tellement de définir un objet, mais comme il s'agit de justifier rigoureusement des calculs qu'Euler faisait sans s'embarrasser, cela rentre au moins dans le même coin du bestiaire.
⁂
Une licorne particulièrement célèbre auprès des algébristes est
le corps à un élément (parfois noté 𝔽₁). Je
ne vais pas définir ce que c'est que le corps à un élément puisque,
justement, c'est une licorne — il n'existe pas. Un corps a forcément
au moins deux éléments (0 et 1, qui doivent être distincts ; il y a
bien un anneau appelé l'anneau nul, qui a un seul élément et où 0=1,
mais cet anneau est prodigieusement inintéressant, et ce n'est
pas le mythique corps à un élément). Il s'agirait donc de
définir une notion plus générale de corps, dans laquelle le « corps à
un élément » existerait ; mais en fait, il est à peu près acquis que
ce n'est pas tellement la notion de corps elle-même qu'il faut
généraliser (on ne va pas arriver à capturer la licorne en
recherchant un ensemble muni d'une structure algébrique quelconque, et
surtout pas un singleton muni d'une structure algébrique quelconque,
forcément inintéressante), c'est plutôt la notion de « variété
algébrique sur un corps » ou quelque chose comme ça. Certains ont
l'intuition que le corps à un élément a l'élément 1 mais pas
l'élément 0, d'autres ont l'intuition qu'il a l'élément 0 et seulement
une « trace infinitésimale » d'élément 1, mais tout ça n'a pas de sens
précis : il ne faut pas prendre l'idée que ce corps a « un élément »
trop au sérieux, et peut-être qu'il vaudrait mieux l'appeler
le corps fondamental
ou le corps absolu
ou
le corps-base ultime
; la seule raison pour laquelle on dit
qu'il a « un élément », c'est que certaines formules le concernant
s'obtiennent en substituant q=1 (parfois après quelques
modifications préalables) dans une formule concernant les corps finis
à q éléments.
Bref, je ne peux pas expliquer ce que c'est que le corps à un élément puisque personne ne sait, mais je peux au moins donner quelques indications sur les endroits où on a observé les traces de cette licorne.
*
Le premier à avoir aperçu la licorne « corps à un élément », c'est Jacques Tits, dans le cadre de l'étude de la théorie des groupes algébriques réductifs.
Comme je ne veux pas trop entrer dans les explications techniques, juste raconter un peu l'histoire, je ne vais pas vraiment tenter de dire ce que c'est que les groupes algébriques réductifs, mais disons qu'on peut faire comme si c'était pareil que les groupes de Lie réductifs complexes dont j'ai parlé ici, et en tout cas il y a par exemple le groupe général linéaire GLn, le groupe spécial linéaire SLn, le groupe spécial orthogonal SOn, le groupe symplectique Spn, les groupes exceptionnels G₂, F₄, E₆, E₇, E₈… chacun de ces groupes peut être considéré sur un corps k particulier (ou même sur un anneau commutatif, mais c'est un petit peu plus délicat) : si G est un groupe algébrique et k un corps ou simplement un anneau commutatif, G(k) est un groupe au sens ordinaire appelé ensemble des points de G à valeurs dans k. Par exemple, GLn(k) est le groupe des matrices n×n inversibles à coefficients dans k, comme on s'y attend, le groupe SLn(k) est formé de celles de déterminant 1, et Spn(k) est formé des matrices 2n×2n qui sont symplectiques (préservent une forme bilinéaire alternée non-dégénérée)[#2]. La fonction qui à k associe G(k) est un foncteur, et est même un schéma au sens où je le définis dans cette entrée.
[#2] Par contre, SOn(k) n'est pas ce qu'on imagine naïvement, d'une part parce que la forme quadratique standard (x1² + ⋯ + xn²) utilisée pour définir SOn sur les réels n'est pas celle qui va me fournir un groupe algébrique réductif déployé comme ce que j'ai envie de considérer ici, et d'autre part parce qu'il y a toujours des épines en caractéristique 2 ; voir ici. Enfin, si k est un corps de caractéristique ≠2 et dans lequel −1 est un carré, alors SOn(k) est bien ce que tout le monde entendra par là (mais sur les réels, par exemple, ce que je veux noter SOn(ℝ) est ce qu'on note classiquement SO(⌊n/2⌋,⌈n/2⌉)).
Mais par ailleurs, à tout groupe algébrique réductif G
la théorie associe aussi un autre groupe W(G)
appelé son groupe de Weyl : ceux qui ont
lu ce rant-ci
ou celui-là ont au moins une petite
idée de quoi il s'agit ; mais sinon, par exemple, le groupe de Weyl de
GLn ou SLn est le groupe
symétrique sur n objets, et celui de
SO2n+1 ou Spn est le
groupe des permutations signées sur n objets (= produit
d'une matrice de permutation de taille n×n par
une matrice diagonale à valeurs diagonales dans {±1}) ; les groupes de
Weyl de F₄, E₆, E₇ et E₈ ne sont pas si faciles à décrire mais j'en ai
dit un mot ici
et là (celui de G₂ est juste le
groupe diédral du triangle de l'hexagone).
Quel est le rapport entre ces groupes G(k) des points de G à valeurs dans k et ce groupe de Weyl W(G) ? A priori, pas grand-chose. Mais c'est là que Tits fait une observation intéressante : si k est un corps fini 𝔽q à q éléments, il y a une formule permettant de calculer l'ordre (= le nombre d'éléments) de G(𝔽q), et c'est un polynôme en q. Par exemple, pour E₈, c'est q120·(q30−1)·(q24−1)·(q20−1)·(q18−1)·(q14−1)·(q12−1)·(q8−1)·(q2−1) ; or on peut calculer l'ordre de W(G) en prenant ce polynôme, en jetant tous les facteurs q−1 dedans, et en substituant ensuite q=1 (par exemple, pour E₈, cela donne 30×24×20×18×14×12×8×2 = 696 729 600). Les choses se passent donc un peu comme si W(G) était le groupe des points de G à valeurs dans un corps à q=1 élément ! (Enfin, pas tout à fait, puisqu'on jette le facteur q−1 avec lequel on obtient simplement zéro.)
Mais Tits ne s'arrête pas là. Il a défini une structure combinatoiro-géométrique appelée les immeubles, je ne vais pas essayer d'expliquer de quoi il s'agit, mais cette structure admet une variante dégénérée (les immeubles minces ou complexes de Coxeter) qui se comporte comme s'il s'agissait d'immeubles sur le corps à un élément. D'autre part, les groupes algébriques ont des sous-groupes particulièrement importants appelés les paraboliques, et leurs groupes de Weyl ont aussi des paraboliques qui se comportent de façon tout à fait analogue. Et le nombre d'éléments du quotient d'un groupe algébrique par un sous-groupe parabolique, sur un corps fini à q éléments, devient, quand on fait q=1, le nombre d'éléments du quotient du groupe de Weyl par son sous-groupe parabolique correspondant ; et ceci fournit tout un jeu d'analogies entre des données d'algèbre linéaire et des données combinatoires (on appelle ça les q-analogies).
Je peux au moins donner un tout petit exemple de ce genre de ressemblance combinatoire. Si k est un corps et 0≤r≤n deux entiers naturels, la grassmannienne Gr(r,n,k) est l'ensemble des sous-k-espaces vectoriels de dimension r de kn. On peut aussi la voir comme le quotient (ensemble des classes à gauche) du groupe général linéaire G := GLn(k) des matrices n×n inversibles sur k par son sous-groupe « parabolique » H formé des matrices triangulaires supérieures par blocs de forme (r+(n−r))×(r+(n−r)) (je veux dire, n'ayant que des 0 à l'intersection des n−r dernières lignes et des r premières colonnes) ; l'identification envoie une classe à gauche g·H sur le sous-espace vectoriel g·U de kn où U est le sous-espace vectoriel engendré par les r premiers vecteurs de la base canonique de kn de sorte que H est justement le stabilisateur {g∈G : g·U=U} de U dans G = GLn(k). Si k est le corps fini 𝔽q à q éléments, alors le cardinal de cette grassmannienne Gr(r,n,𝔽q) = G/H est donné par le coefficient binomial gaussien Binom(n,r,q) := [n]q!/([r]q!·[n−r]q!) où [s]q! est défini comme le produit [1]q · [2]q · [3]q ⋯ [s−1]q · [s]q et où [s]q désigne le polynôme (qs−1)/(q−1) = qs−1 + ⋯ + q² + q + 1. Ces dernières formules et notations suggèrent une analogie évidente : quand q=1, le polynôme [s]q vaut simplement s, donc le polynôme [s]q! vaut s! et le polynôme Binom(n,r,q) vaut le coefficient binomial usuel Binom(n,r) = n!/(r!·(n−r)!). Mais ce Binom(n,r) dénombre bien quelque chose : c'est l'ensemble, notons-le Gr₁(r,n) des parties à r éléments d'un ensemble à n éléments, disons {1,…,n}, et ce Gr₁(r,n) peut se voir comme le quotient (ensemble des classes à gauche) du groupe symétrique G₁ := 𝔖n par son sous-groupe « parabolique » H₁ formé des permutations qui stabilisent l'ensemble U={1,…,r}. Et justement, le groupe symétrique G₁ = 𝔖n est le groupe de Weyl de GLn. Tout ceci suggère que :
Un espace vectoriel de dimension n sur le « corps à un élément » est simplement un ensemble fini de cardinal n. Un sous-espace vectoriel de dimension r est simplement un sous-ensemble de cardinal r. Une matrice inversible n×n sur le « corps à un élément » est simplement une permutation de n objets.
Cette analogie est donc appuyée à la fois sur le groupe de Weyl et sur l'observation combinatoire que le nombre Binom(n,r,q) = #Gr(r,n,𝔽q) de sous-espaces vectoriels de dimension r d'un espace vectoriel de dimension n sur le corps à q éléments est un polynôme en q qui devient, quand on fait q=1 (cette fois il n'y a rien à changer) le nombre Binom(n,r) de parties à r éléments d'un ensemble de cardinal n. Mais c'est encore plus intéressant quand on permet à r de varier ou quand on considère des « drapeaux » de plusieurs sous-espaces vectoriels imbriqués : c'est essentiellement cette combinatoire-là l'« immeuble » associé à GLn sur un corps k, et l'« immeuble mince » est la combinatoire des parties à r éléments de {1,…,n} et de leurs drapeaux (qui sont juste des suites finies de parties incluses les unes dans les autres).
Et le même genre de choses est possible pour tous les autres groupes algébriques réductifs. Ceci permet de « définir » d'autres structures d'algèbre linéaire sur le corps à un élément. Par exemple, étant acquis qu'un espace vectoriel de dimension n sur le « corps à un élément » est simplement un ensemble fini à n éléments, une forme bilinéaire alternée non-dégénérée dessus est un appariement de ces éléments en n/2 paires (ce qui exige évidemment que n soit pair…) ; un sous-espace lagrangien[#3] (= totalement isotrope maximal) est un choix d'un élément de chaque paire ; et une matrice n×n symplectique est une permutation qui stabilise l'appariement (ce qui peut s'identifier à une permutation signée des n/2 paires, et c'est cohérent avec le fait que le groupe de Weyl de Spn est l'ensemble des permutations signées).
[#3] Le nombre de sous-espaces vectoriels lagrangiens d'un espace vectoriel symplectique (= muni d'une forme bilinéaire alternée non-dégénérée) de dimension n=2m sur le corps fini à q éléments vaut ∏1≤r≤m ([2r]q/[r]q) (où toujours [s]q = (qs−1)/(q−1) = qs−1 + ⋯ + q² + q + 1) ; pour q=1, ceci donne bien 2m, le nombre de façons de choisir un élément dans chacune des m paires.
Bref, il y a tout un ensemble d'indices quant à l'existence de la
licorne « corps à un élément » qui viennent de la théorie des groupes
algébriques et des analogies (q-analogies
) entre des
structures d'algèbre linéaire et des structures combinatoires.
*
Mais il y a d'autres traces de la licorne, ou en tout cas, d'une licorne, qui viennent, cette fois, de la théorie des nombres. Beaucoup de résultats de théorie des nombres (les fondements de la théorie des anneaux d'entiers, la théorie du corps de classes, les lois de réciprocité, les propriétés basiques des fonctions zêta, ce genre de choses) peuvent se formuler dans deux contextes, les « corps de nombres » (c'est-à-dire les extensions finies de ℚ) et les « corps de fonctions » (c'est-à-dire les corps de fonctions rationnelles de courbes algébriques sur les corps finis), et il y a une grande analogie entre ces deux contextes, le cas des « corps de fonctions » étant, généralement parlant, plus simple à traiter. (Je vais donner un tout petit bout d'exemple plus loin, mais pour une introduction générale à la théorie des nombres dans le contexte des « corps de fonctions », on pourra consulter le livre de Michael Rosen, Number Theory in Function Fields, Springer GTM 210 (2002), qui est assez pédagogique.) Ceci suggère qu'on doive visualiser un anneau comme ℤ comme l'anneau des fonctions régulières (≈ polynomiales) sur un objet géométrique qui serait une sorte de courbe, et le corps ℚ comme le corps des fonctions rationnelles sur cette courbe ; cet objet géométrique n'est pas spécialement une licorne, la théorie des schémas de Grothendieck le définit correctement (il s'agit de Spec(ℤ), et en gros on peut imaginer que c'est l'ensemble des nombres premiers), mais on a l'impression qu'il manque quand même quelque chose à l'analogie. Notamment, alors que côté « corps de fonctions » les anneaux et corps de fonctions sont des algèbres sur un corps fini, côté « corps de nombres », il manque un corps de base, un corps sur lequel ℤ serait une algèbre. (Il manque aussi un « point à l'infini » à Spec(ℤ) pour être une bonne courbe, et je vais revenir là-dessus plus bas en essayant d'expliquer un petit peu de quoi il s'agit.)
À ce niveau-là, donc, le « corps à un élément » serait quelque chose qui rendrait plus satisfaisante l'analogie entre « corps de fonctions » et « corps de nombres » en théorie des nombres. Arriver à le définir correctement semble devoir promettre des retombées spectaculaires. Notamment, comme l'hypothèse de Riemann est démontrée côté « corps de fonctions », si ℤ peut être vu comme l'anneau des fonctions d'une courbe sur ce corps licornesque, on devrait pouvoir prendre le produit de deux copies de cette courbe pour définir une sorte de surface, et former quelque chose qu'on doit pouvoir noter ℤ ⊗𝔽₁ ℤ (l'anneau des fonctions sur la surface en question, anneau tout aussi licornesque que le corps à un élément 𝔽₁ lui-même) qui serait une des clés pour une éventuelle démonstration de l'hypothèse de Riemann. On pourrait aussi imaginer des retombées algorithmiques comme une méthode efficace de factorisation des entiers. (Tout cela, évidemment, est totalement spéculatif, et il n'y a rien d'obligatoire à ce qu'une théorie même parfaitement satisfaisante du corps à un élément ait de telles conséquences.)
Il faut garder une possibilité à l'esprit, cependant, c'est que non seulement il n'est pas du tout certain que le « corps à un élément » qu'on soupçonne pour des raisons de groupes algébriques (évoquées plus haut) et le « corps à un élément » qu'on soupçonne à cause d'analogies en théorie des nombres (que je viens d'esquisser) existent l'un ou l'autre, mais même s'ils existent, rien ne dit qu'ils soient nécessairement identiques. Peut-être qu'une théorie permettra de définir l'un et pas l'autre, ou l'autre et pas l'un, peut-être que deux théories différentes et incompatibles permettront de définir chacun d'ente eux, ou qu'une théorie permettra de définir les deux sans qu'ils soient le même objet. Il ne faut pas trop présupposer au sujet des licornes.
*
Néanmoins, il y a un certain nombre de choses qu'on pense savoir sur le corps à un élément et qui semblent assez cohérentes entre les différentes traces de pas laissées par la licorne.
Par exemple, il semble que le corps à un élément ait une unique extension de degré d pour chaque entier naturel d, et qu'on appelle… le corps à 1d éléments. Oui, c'est un peu ridicule, dit comme ça. Peut-être qu'il vaut mieux imaginer, en fait, que le corps à 1 élément a en fait (1+ε) éléments avec ε infinitésimal, si bien que son extension de degré d serait le corps à (1+ε)d≈(1+dε) éléments. Ce corps à 1d (ou (1+ε)d) éléments est, bien sûr, tout autant une licorne que celui à 1 élément, mais on sait quelques choses sur lui : le groupe de Galois de l'extension est le groupe cyclique à d éléments ; au moins pour d impair, un corps est une algèbre sur le corps à 1d éléments si et seulement si il contient les racines d-ièmes de l'unité ; un espace vectoriel de dimension finie sur le corps à 1d éléments est un ensemble fini muni d'une permutation qui soit un produit de d-cycles disjoints et recouvrant l'ensemble (et la restriction des scalaires au corps à 1 élément consiste à oublier cette permutation, tandis que l'extension des scalaires d'un ensemble X du corps à 1 élément à celui à 1d éléments consiste à prendre le produit X×(ℤ/dℤ) avec la translation de 1 sur la seconde composante) ; le groupe des matrices n×n inversibles à valeurs dans le corps à 1d éléments a l'air d'être le groupe des permutations de {1,…,n}×(ℤ/dℤ) commutant à la translation de 1 sur la seconde composante (c'est le « produit en couronne » (ℤ/dℤ) ≀ 𝔖n ou de façon équivalente, le groupe des matrices complexes qui sont produit d'une matrice de permutation par une matrice diagonale ayant des racines d-ièmes de l'unité sur la diagonale).
Tout n'est pas toujours très cohérent (par exemple, le corps à q éléments, qui pour sa part n'est pas du tout une licorne, semble être une extension de degré 1 (???) du corps à 1(q−1) éléments, et ils ont le même groupe multiplicatif, mais ils sont quand même censés être différents — c'est louche et perturbant). Mais il y a suffisamment de cohérence et de choses qui se rejoignent pour qu'on soupçonne qu'il y ait quelque chose à trouver.
*
Il y a toutes sortes de gens qui ont développé des théories censées définir le corps à un élément. En fait, il y a beaucoup plus de théories du corps à un élément qu'il n'y a d'éléments dans le corps à un élément : Soulé, Toën & Vaquie, Connes & Consani (cf. aussi ici), Deitmar (cf. ici), Durov, Borger, Lorscheid, etc. Il y a même une étude comparative des approches possibles du corps à un élément. Et voir aussi ce texte de Manin. (Pour ma part, je n'ai que très peu lu de tout ça, donc je ne peux rien en dire d'intelligent.) Si on est un chouïa peu charitable, on peut penser que tous ces gens ont pris un cheval, leur ont mis une corne sur le front et appellent ça une licorne, mais en fait, si ça ne chie pas des arcs-en-ciel, ce n'est pas une licorne. Plus sérieusement, il y a certainement des idées intéressantes dans chacune de ces approches, on peut dire qu'on a des signes plus précis de l'existence de la licorne et de comment on pourrait peut-être imaginer l'attraper, mais on ne peut pas encore dire qu'elle est au zoo.
⁂
Je veux évoquer encore une autre licorne que j'affectionne assez, et qui a l'air de vivre assez près de la licorne « corps à un élément », c'est le corps résiduel des réels. Cette licorne-là est basée sur l'idée que si on considère Spec(ℤ), que le lecteur non familier avec le sujet peut imaginer comme l'ensemble des nombres premiers, comme un objet géométrique, on a l'impression qu'il lui manque un point. Un nombre premier manquant, un nombre premier « à l'infini » (qui est aux nombres réels ce que les nombres premiers ordinaires sont aux nombres p-adiques). Je voudrais essayer d'expliquer un peu ça : pour ça, je dois d'abord expliquer rapidement ce que sont les valeurs absolues p-adiques et les nombres p-adiques.
Si p est un nombre premier (usuel) et n un entier non nul, on appelle valuation p-adique et on note vp(n) l'exposant de la plus grande puissance de p qui divise n, c'est-à-dire l'exposant qui apparaît sur p dans la décomposition de n en facteurs premiers (ou 0 si p n'apparaît pas du tout, i.e., ne divise pas n). Par exemple, comme 1400 = 2³×5²×7, on a v₂(1400)=3, v₃(1400)=0, v₅(1400)=2, v₇(1400)=1 et vp(1400)=0 pour tout nombre premier p∉{2,5,7}. Si on préfère, vp(n) compte le nombre de 0 à la fin (= en « poids faible ») du nombre n quand on écrit ce dernier en base p (par exemple, v₂(n) compte le nombre de 0 à la fin de l'écriture binaire de n). Par convention, on pose vp(0) = +∞ pour tout p premier. Cette valuation p-adique s'étend aux rationnels en définissant vp(a/b) = vp(a) − vp(b). Enfin, on définit la valeur absolue p-adique |x|p d'un rationnel x∈ℚ comme p−vp(x) (où vp(x) est la valuation p-adique que je viens de définir) : essentiellement, c'est l'inverse de la puissance de p qui apparaît dans la décomposition en facteurs premiers de x (étendue de façon évidente aux rationnels). Par exemple |2/45|₂ = 1/2 et |2/45|₃ = 9 et |2/45|₅ = 5 (et |2/45|p = 1 si p∉{2,3,5}). Intuitivement, plus la valeur absolue p-adique est petite, plus le nombre est divisible par p. On convient aussi que |0|p = 0 pour tout p premier.
Ces valeurs absolues p-adiques, de même que la valeur absolue usuelle que je vais noter |x|∞ (c'est-à-dire x si x≥0 et −x si x≤0), vérifient les propriétés suivantes :
- |x|≥0 quel que soit x,
- |x|=0 si et seulement si x=0,
- |x+y| ≤ |x| + |y| (en fait, pour une valeur absolue p-adique, on a même |x+y| ≤ max(|x|,|y|)),
- |1| = 1 [ceci découle du point suivant, mais je trouve que ce serait idiot de ne pas l'inclure],
- |x·y| = |x|·|y|,
- il existe des x tels que |x| ne soit ni 0 ni 1.
À ces valeurs absolues est associée une notion de distance : la distance p-adique entre deux rationnels x et y est la valeur absolue p-adique |x−y|p de la différence, de même que la distance usuelle entre x et y est la valeur absolue usuelle |x−y|∞ de leur différence. Intuitivement, la distance p-adique mesure à quel point les nombres diffèrent par (quelque chose divisible par) une grande puissance de p, de façon que les grandes puissances de p soient très proches de zéro (p-adiquement « petites »). Pour des entiers naturels au moins, dire que deux entiers sont p-adiquement très proches signifie que leurs derniers chiffres (= chiffres de poids faibles) coïncident quand on écrit ces entiers en base p.
Maintenant, le même procédé qui permet de construire les nombres réels ℝ comme « complétion » des rationnels pour la distance usuelle (intuitivement, ℚ a des « trous » parce qu'il y a des suites qui « visiblement » devraient converger et qui n'admettent pas de limite rationnelle, et on fabrique ℝ en bouchant tous ces trous) fonctionne aussi pour toutes ces autres distances que j'ai définies : les corps qu'on obtient s'appellent les corps des nombres p-adiques (un pour chaque nombre premier p) et se notent ℚp. Une définition plus terre-à-terre des nombres p-adiques consiste à définir d'abord les entiers p-adiques ℤp comme les écritures en base p infinies à gauche (par exemple pour p=2, l'écriture binaire …1010101010101011 définit un entier 2-adique, qui s'avèrera être 1/3), l'addition et la multiplication se calculant exactement comme on le fait pour les entiers naturels écrits en base p (mêmes tables d'addition et de multplication, même système de reports ; l'opération est infinie, mais chaque chiffre donné se calcule en un nombre fini d'étapes : par exemple, un petit exercice consiste à vérifier que si on ajoute le 2-adique …1010101010101011 à lui-même deux fois, ou qu'on le multiplie par trois (11), on obtient bien 1) ; la valuation p-adique sur ℤp consiste simplement à compter le nombre de 0 à la fin de l'écriture, et la valeur absolue p-adique se définit comme on l'a fait plus haut. Quant à l'ensemble ℚp des nombres p-adiques, c'est pareil mais cette fois on autorise aussi un nombre fini de chiffres à droite de la virgule/point, ce qui revient à autoriser à diviser par p (0.1 représente le rationnel 1/p, de valuation p-adique −1, et 0.01 le rationnel 1/p², de valuation p-adique −2, et ainsi de suite). On peut montrer que le ℚp que je viens de définir est un corps, complet pour la distance p-adique, et dans lequel ℚ est dense (il est donc le complété de ce dernier pour la distance p-adique).
*
Avec les définitions que j'ai faites, il est logique de noter ℚ∞ = ℝ. Mais pour que ce soit plus qu'une vague notation, il est pertinent que je signale le fait suivant : on peut montrer que les valeurs absolues (usuelle et p-adiques) que j'ai définies sont toutes les valeurs absolues possibles sur les rationnels (essentiellement toutes celles qui vérifient les propriétés que j'ai listées, en convenant d'identifier une valeur absolue avec sa puissance par n'importe quel exposant strictement positif) ; et il y a des résultats du même genre qui disent que les complétés ℝ et ℚp qu'on a construits sont toutes les façons de compléter ℚ (je n'ai pas envie de donner un résultat précis, mais disons qu'il y a des résultats de ce genre). Il est donc raisonnable de tous les mettre ensemble. Comme indication du fait que tous ces objets vivent harmonieusement ensemble, on peut aussi signaler la formule du produit, qui dit que si x est un rationnel non nul, le produit des |x|w où w parcourt tous les nombres premiers ainsi que le symbole spécial ∞, vaut toujours 1.
On utilise généralement le terme de place de ℚ
pour désigner un nombre premier p ou le symbole spécial ∞,
cette dernière s'appelant la place archimédienne
. (On peut
aussi définir tout ça pour d'autres corps de nombres, ce qui renforce
la cohérence de l'histoire.)
Cela m'emporterait trop loin d'essayer d'expliquer pourquoi on a envie de ranger la place archimédienne ∞ avec les autres : mais disons au moins que toutes sortes de résultats de théorie des nombres s'énoncent plus commodément de la sorte. Donnons juste un petit exemple d'indice :
J'ai évoqué plus haut l'analogie entre « corps de fonctions » et « corps de nombres » (servant à expliquer qu'on veuille chasser la licorne 𝔽₁) : un des aspects les plus simples de cette analogie est que le corps 𝔽p(t) des fractions rationnelles en une indéterminée t sur le corps fini 𝔽p = ℤ/pℤ a lui aussi des « places », en l'occurrence une pour chaque polynôme f∈𝔽p[t] unitaire irréductible (la valeur absolue f-adique |x|f de x∈𝔽p(t) est définie comme p puissance −deg(f)·vf(x) où vf(x) est l'exposant de f dans la décomposition de x en facteurs irréductibles, exactement comme pour les rationnels) plus une « à l'infini » (la valeur absolue |x|∞ de x∈𝔽p(t) étant égale à p puissance le degré de x, c'est-à-dire le degré du polynôme au numérateur moins le degré du polynôme au dénominateur). Dans le cas de 𝔽p(t), cette place « à l'infini » se comporte tout à fait comme les autres, géométriquement on la comprend très bien (les places de 𝔽p(t) sont essentiellement la droite projective sur 𝔽p quotientée par l'action de Galois, i.e., du Frobenius), la formule du produit marche sans problème (∏w |x|w = 1 pour tout x≠0 dans 𝔽p(t) où w parcourt toutes les places, aussi bien celles données par f unitaire irréductible que celle « à l'infini »). Donc on a envie que pour le cas de ℚ il y ait aussi une place « à l'infini ».
Je devrais aussi glisser quelque part les mots théorie
d'Arakelov
, parce que, de façon très très simplifiée et abusée,
c'est toute une théorie autour de comment faire que la place ∞ de ℚ
joue avec ses petites copines.
Maintenant, cette place archimédienne ∞ de ℚ se comporte quand même différemment des autres, et c'est franchement désagréable. Par exemple, la boule unité fermée {x∈ℚw : |x|w ≤ 1} est stable par addition et multiplication pour toute place w=p non-archimédienne (c'est ℤp), mais pour w=∞ (c'est l'intervalle [−1;1] de ℝ) elle n'est stable que par multiplication. En fait, si la boule unité fermée {x∈ℚp : |x|p ≤ 1} de ℚp est l'anneau ℤp des entiers p-adiques (fermeture/complétion de ℤ pour la distance p-adique), la boule unité ouverte {x∈ℚp : |x|p < 1} est pℤp, l'idéal des multiples de p. Le quotient des deux ℤp/pℤp est simplement le corps ℤ/pℤ des entiers modulo p (on garde juste le dernier chiffre de l'écriture en base p) : on l'appelle corps résiduel 𝔽p de ℚp, ou bien de ℚ à la place p.
La licorne, maintenant, c'est le corps résiduel de ℚ à la place ∞ : ce 𝔽∞ est quelque chose comme le quotient de l'intervalle fermé [−1;1] par l'intervalle ouvert ]−1;1[ (qui serait sensé être un idéal du précédent, ça n'a pas de sens parce que [−1;1] n'est pas un anneau, il n'est clos par addition, mais on remarque quand même que le produit d'un élément de l'intervalle ouvert par un élément quelconque de l'intervalle fermé est bien dans l'intervalle ouvert comme on l'attend d'un idéal). Tout ça est dénué de sens comme je l'ai écrit, mais on aimerait bien que ça en ait un.
L'intuition que je me fais de ce « corps résiduel de ℝ », que je dois logiquement noter 𝔽∞, est que c'est un corps ayant un élément, mais ce n'est pas « le » corps à un élément (l'autre licorne dont j'ai parlé avant), parce que « le » corps à un élément (𝔽₁) a un seul élément non nul (cela découle de ce que j'ai dit sur les matrices n×n inversibles, dans le cas n=1), tandis que 𝔽∞ a deux éléments non nuls, qu'on peut appeler « strictement positif » et « strictement négatif » (avec la table de multiplication qu'on pense). Donc 𝔽∞ a « un élément parmi lequel deux sont non nuls », c'est très licornesque, comme comportement. (Ça évoque aussi vaguement le genre de choses que je racontais ici !) Plus généralement, je pense qu'il y a toujours exactement deux matrices n×n inversibles sur 𝔽∞, à savoir celle qui a le déterminant strictement positif et celle qui a le déterminant strictement négatif, c'est différent de 𝔽₁ qui a n! matrices n×n inversibles. (Encore plus généralement, j'ai tendance à dire que si V est une variété algébrique réelle, son nombre de points sur 𝔽∞ est son nombre de composantes connexes[#4] pour la topologie réelle : l'affirmation de la phrase précédente en découle.)
[#4] Ou peut-être la caractéristique d'Euler-Poincaré ? À voir.
Mais le reste est tout à fait obscur. Le lien entre les deux licornes l'est tout autant. Faut-il considérer que 𝔽∞ est la réelle-clôture de 𝔽₁ ? Dans ce cas, y a-t-il un « corps résiduel de ℂ » (quotient du disque unité fermé par le disque unité ouvert ?), 𝔽∞², qui serait à la fois la clôture algébrique de 𝔽∞ et celle de 𝔽₁ (peut-être avec une complétion dans l'histoire ?), et qui aurait un seul élément mais un groupe d'éléments non-nul égal au groupe des complexes de module 1 ? (cela colle vaguement avec le fait que 𝔽1n a apparemment le groupe des racines n-ièmes de l'unité comme groupe des éléments non nuls). Plus on pousse les raisonnements, bien sûr, plus on se heurte à des apories dans tous les sens, et c'est normal, mais on arrive quand même à avancer assez pour se dire qu'il y a peut-être bien quelque chose à attraper.
(La chasse à la licorne « corps résiduel de ℝ » a l'air moins développée que la chasse à la licorne « corps à un élément », mais au moins le texte de Durov que j'ai lié plus haut part un peu dans cette direction en définissant quelque chose qu'il appelle ℤ∞ et qui est apparenté à l'intervalle [−1;1].)
Ajout () : le corps résiduel de ℝ, 𝔽∞, devrait certainement être une algèbre sur le corps à un élément, 𝔽1, mais même aussi sur le corps à 1² éléments, 𝔽1² (puisque +1 et −1 sont les racines de l'unité définies dans ℝ) ; le morphisme correspondant GLn(𝔽1²)→GLn(𝔽∞) semble être celui qui envoie une permutation signée de n objets sur le produit des signes.
⁂
Terminons par une petite anecdote. Quand j'étais
agrégé-préparateur à l'ENS, il y avait quelqu'un (je ne
le dénoncerai pas) qui préparait l'agrégation en même temps qu'il
passait le concours de recrutement du CNRS. Ayant été
pris au CNRS, il n'était plus intéressé par l'agrégation
(qu'il présentait comme une sécurité éventuelle). Plutôt que de
démissionner ou d'être simplement absent aux oraux de l'agreg, il
avait préparé des leçons humoristiques (mais scientifiquement
sérieuses) corps à un élément : exemple et applications
pour
l'algèbre et corps résiduel de ℝ : exemple et contre-exemple
pour l'analyse (ces titres sont des parodies des titres typiques des
leçons d'agreg) et a proposé au jury de présenter une de ces leçons
pour passer le temps (étant bien entendu qu'il aurait de toute façon
zéro à l'épreuve). Le jury a froidement refusé (et les gens du
département de maths de l'ENS, quand ils ont entendu
l'histoire, ont été partagés entre ceux qui trouvaient que c'était une
idée rigolote et ceux qui estimaient que c'était un peu insulter le
jury de l'agreg et manquer de respect envers les autres candidats que
de proposer cette blague).