David Madore's WebLog: Séries de Hahn, théorèmes de Kedlaya et algébricité

La série annuelle des exposés de maîtrise (d'initiation à la recherche) des normaliens de première année vient de commencer, donc cette année encore je vais assister à un grand nombre d'exposés mathématiques (pour la plupart très intéressants) sur des sujets très variés. Aujourd'hui il y en a un qui a particulièrement retenu mon attention puisqu'il était question d'une de ces constructions mathématiques que je trouve particulièrement remarquables. Et qui m'est très chère puisque je l'avais redécouverte il y a quelques années sans savoir que c'était un objet classique (j'étais allé, tout excité, en parler à mon directeur de thèse qui m'avait aussitôt sorti un préprint qui expliquait ça et qui répondait à certains des problèmes que je m'étais posés à ce sujet) : il s'agit des séries de Hahn, ou de Mal'cev-Neumann (les deux noms se trouvent, et je ne sais pas si l'un est plus correct). Même si j'ai pour habitude de ne pas parler de maths sur ce blog[#] je vais tout de même essayer de décrire de quoi il s'agit et pourquoi je trouve ça remarquable. En supposant que le lecteur est un peu familier avec des notions de base d'algèbre (disons, séries formelles et extensions de corps).

Pour introduire cette notion je pourrais commencer par partir de l'anneau F[t] des polynômes en une indéterminée t à coefficients dans un corps F (qui sera, pour l'essentiel, un corps fini). Il s'agit de généraliser cette notion : une première généralisation, puisque les polynômes s'écrivent comme des sommes formelles de termes c_i·tⁱ pour i parcourant un nombre fini d'entiers naturels, serait d'autoriser les sommes infinies de cette forme, c'est-à-dire que i parcourt tous les entiers naturels ; on obtient ainsi l'anneau F[[t]] des séries formelles en l'indéterminée t. Par exemple, 1+t+t²+t³+⋯ (somme de tous les tⁱ avec tous les coefficients c_i égaux à 1) est une série formelle, qui est l'inverse de 1−t [#2]. Une nouvelle intéressante, c'est que F[[t]] est un anneau de valuation discrète : sans chercher à définir cette notion, disons qu'il n'y a en gros qu'une seule série formelle qui n'est pas inversible, c'est t elle-même, au sens où si on lui donne un inverse alors toute série formelle (non nulle) en aura un.

On introduit donc l'anneau F((t)) des séries de Laurent : il s'agit toujours des sommes formelles de termes de la forme c_i·tⁱ, sauf que cette fois-ci on permet à l'exposant i de prendre des valeurs négatives (puisqu'on veut inverser t, il faut bien introduire un t à la puissance −1). Bien sûr, toute somme de cette forme n'est pas légitime : par exemple, il n'y a pas de sens à donner[#3] à la somme des tⁱ sur tous les entiers relatifs i. La bonne condition est de demander que les i qui supportent la somme (c'est-à-dire ceux pour lesquels le coefficient c_i est non nul) soient bornés inférieurement, ou de façon équivalente qu'il n'y ait qu'un nombre fini de termes à exposants négatifs. Il se trouve qu'on obtient ainsi un corps (toute série de Laurent non nulle est inversible), qui est le corps des fractions de l'anneau des séries formelles.

Pour aller plus loin, on cherche à résoudre certaines équations algébriques. Par exemple, dans le corps des séries de Laurent, la série 1+t a une racine carrée (si F est de caractéristique différente de 2), solution de l'équation algébrique f²−(1+t)=0, à savoir f = 1 + (1/2)t − (1/8)t² + (1/16)t³ − (5/128)t⁴ + ⋯ (bref, le développement asymptotique connu). Une autre nouvelle intéressante, c'est que F[[t]] est un anneau (local) hensélien : sans chercher à définir cette notion, disons qu'il n'y a en gros qu'une série de Laurent qui n'a pas de racine carrée, cubique ou je ne sais quoi, c'est t elle-même.

On introduit donc l'anneau F((t^1/∞)) des séries de Puiseux : il s'agit toujours des sommes formelles de termes de la forme c_i·tⁱ, sauf que cette fois-ci on permet à l'exposant i de prendre des valeurs rationnelles (puisqu'on donner des racines à t, il faut bien introduire un t à la puissance ½ ou autres). Bien sûr, toute somme de cette forme n'est pas légitime : de même que pour définir les séries de Laurent on avait imposé aux exposants supportant la série (c'est-à-dire intervenant effectivement dedans) d'être bornés inférieurement, de même, cette fois, on demandera qu'ils aient un dénominateur borné (ou, de façon équivalente, qu'il y ait un même dénominateur qui convienne pour tous les exposants) — on continue bien sûr d'imposer que les exposants soient eux-mêmes minorés. C'est-à-dire, si on préfère, qu'une série de Puiseux est une série de Laurent en t^1/k pour un certain k (qui dépend de la série, mais qui doit convenir pour tous les coefficients de celle-ci). Il est trivial que la somme de deux séries de Puiseux est encore une série de Puiseux, et il est facile de vérifier que cela vaut aussi pour le produit (qui s'écrit formellement comme on le devine), et que les séries de Puiseux forment un corps.

Doit-on continuer ? Si F est de caractéristique zéro, c'est inutile (du moins du point de vue de l'algèbre) : on a obtenu ce qu'on appelle une extension maximale totalement ramifiée de F((t)), et si F est algébriquement clos (de caractéristique zéro, j'insiste) alors le corps F((t^1/∞)) des séries de Puiseux est lui-même algébriquement clos. Sans chercher à démontrer ce résultat, il n'est pas extrêmement difficile à comprendre : quand on a à résoudre une équation algébrique en une série de Puiseux f, on commence par trouver sa valuation (le plus petit exposant en t d'un terme intervenant dans la série) et le coefficient devant ce premier terme, et on soustrait ce terme pour trouver le terme suivant.

Je fais une digression à ce stade-là : en particulier, le corps C((t^1/∞)) des séries de Puiseux complexes est algébriquement clos, donc il contient une clôture algébrique de C(t) — dont je ne sais pas si on sait en fournir une description complètement explicite mais disons en gros qu'il s'agit des séries de Puiseux dont les coefficients sont déterminés par des formules de récurrence uniformes. À ce stade-là on pourrait sauter de joie en se disant c'est merveilleux, on a une description explicite de la clôture algébrique de C(t) (ce qui est un objet fondamental pour comprendre, par exemple, les revêtements de courbes en géométrie algébrique). C'est vrai, mais il y a une arnaque : on a tendance à dire la clôture algébrique de C(t) parce qu'elles sont toutes isomorphes, mais elles le sont de façon non canonique et en fait on n'a décrit qu'une clôture algébrique, sur laquelle le point t=0 est distingué, notamment par le fait que le progénérateur du groupe de Galois absolu de C(t) associé à ce point opère de façon compréhensible sur C((t^1/∞)) alors que tous les progénérateurs associés aux autres points de la sphère de Riemann sont, si j'ose dire, illisibles sur cette description (ils n'agissent pas continûment).

Bon, même en caractéristique zéro ce n'est pas forcément la fin de l'histoire : on pourrait vouloir comprendre, par exemple, la complétion topologique de F((t^1/∞)), où la topologie est donnée par la valuation — c'est-à-dire que la distance entre deux séries de Puiseux f et g est l'exponentielle (de base e, disons) de l'opposé de la valuation de f−g. Pour l'instant je ne décris pas cette complétion, mais elle se dégagera naturellement avec les séries de Hahn.

Maintenant, si F est de caractéristique p>0, le corps des séries de Puiseux F((t^1/∞)) sur F n'a pas les solutions de toutes les équations algébriques (même si F est algébriquement clos…) : il n'y a essentiellement que ce qu'on appelle les équations modérément ramifiées (en fait, techniquement, F((t^1/∞)) est la clôture parfaite d'une extension maximale modérément ramifiée de F((t))). Il y manque les solutions des équations dites sauvagement ramifiées, et je ne définirai pas ce terme mais je donne l'exemple de l'équation d'Artin-Schreier, f^p−f=t⁻¹ (qui définit une extension cyclique de degré p).

Que se passe-t-il si on cherche à résoudre f^p−f=t⁻¹ ? Manifestement, la valuation de f doit être strictement négative dans l'histoire (sinon f^p−f aurait une valuation ≥0, ce qui n'est pas le cas de t⁻¹ puisque c'est −1) : du coup, la valuation de f^p est strictement inférieure à celle de f, donc la valuation de f^p−f est égale à p fois la valuation de f, et comme c'est censé être −1, la valuation de f est −1/p. Plus précisément, le premier terme de f est t^−1/p. Mais si on écrit f = t^−1/p + f₁, on voit que f^p = t⁻¹ + f₁^p (rappelons qu'on est en caractéristique p donc (x+y)^p = x^p + y^p) donc f₁^p−f₁=t^−1/p et le même raisonnement montre que f₁ commence par le terme t^−1/p². En continuant de la sorte on voit qu'on a trouvé la solution f = t^−1/p + t^−1/p² + t^−1/p³ + ⋯, qui n'est pas une série de Puiseux puisque les dénominateurs des exposants de t ne sont pas bornés. Ce n'est même pas une série de Cauchy dans le corps des séries de Puiseux (j'ai expliqué ci-dessus qu'on mettait sur ce dernier la valeur absolue donnée par l'exponentielle de moins la valuation ; en caractéristique p on prend généralement l'exponentielle de base p mais cela donne la même topologie et structure uniforme) : la suite des p^1/pⁱ ne tend pas vers zéro quand i tend vers l'infini, en fait elle tend vers 1 ; donc f n'existe même pas en tant qu'élément du complété topologique des séries de Puiseux. Alors quoi ?

Si on veut autoriser les sommes formelles avec des dénominateurs non bornés, il faut trouver une condition qui permette de donner un sens aux séries (par exemple on veut certainement écarter la somme des tⁱ pour i parcourant tous les rationnels !). Un indice qui met sur la bonne voie est de se dire qu'on veut au moins que l'ensemble des exposants supportant la série (c'est-à-dire des i correspondant à un coefficient c_i non nul) non seulement soit borné inférieurement mais admette un plus petit élément, pour pouvoir définir la valuation de la série comme ce plus petit élément. Ceci fait penser aux parties bien ordonnées de Q, c'est-à-dire les ensembles de rationnels tels que toute partie non vide de l'ensemble ait un plus petit élément — ou, de façon équivalente, les parties de Q ne contenant aucune suite strictement décroissante.

On introduit donc l'anneau F((t^Q)) des séries de Hahn(-Mal'cev-Neumann) à coefficients dans F : il s'agit des sommes formelles de termes de la forme c_i·tⁱ, où, cette fois, i parcourt un ensemble bien ordonné de rationnels. Il n'est pas difficile de se convaincre que F((t^Q)) est un corps (contenant manifestement F((t^1/∞))), et cette fois-ci il est algébriquement clos dès que F l'est, quelle que soit la caractéristique de celui-ci. Par exemple, 1 + t^0.9 + t^0.99 + t^0.999 + t^0.9999 + ⋯ + 2t est une série de Hahn (remarquez que j'ai trié les termes par exposant croissant de t, ce qui me fait mettre le terme en t après une infinité de termes ayant des exposants entre 0 et 1). Le corps des séries de Hahn est un corps topologique (de nouveau, avec la distance donnée par la valuation qui se définit sans problème), et il est complet (et même ultracomplet ou sphériquement complet, ce qui signifie en gros que toute intersection décroissante de boules fermées est non vide) : il faut cependant prendre garde au fait que, contrairement au cas des séries de Laurent, pour une série de Hahn, les points de suspension qui interviennent dans son écriture sont la participation à une somme formelle et ne sont pas topologiques, c'est-à-dire que la série de Hahn 1+t^0.9+t^0.99+t^0.999+⋯ n'est pas la limite de ses sommes partielles (comme je l'ai fait remarquer, celles-ci ne sont pas de Cauchy) ; en revanche, une série de Hahn est la limite des séries obtenant en tronquant les exposants à des rationnels tendant vers +∞ (mais cela peut faire apparaître une infinité de termes d'un seul coup).

Par ailleurs, toute partie bien ordonnée de Q est (uniquement) isomorphe, en tant qu'ensemble ordonné, à un unique ordinal, qu'on peut appeler complexité de la série : tous les ordinaux dénombrables peuvent s'obtenir de la sorte, et c'est déjà quelque chose d'assez terrifiant (par exemple, la série de Hahn somme des t^{0.77⋯733⋯3}, où on permet n'importe quel nombre fini de 7 suivi par n'importe quel nombre fini de 3 dans l'exposant, a pour complexité ω², ce qui la rend déjà difficile à écrire ; remarquez au passage que si j'avais voulu prendre la somme des t^{0.33⋯377⋯7} ça ne définirait pas une série de Hahn parce qu'il y a une suite strictement décroissante 0.7>0.37>0.337>⋯ qui fait que l'ensemble des exposants n'est pas bien ordonné). Si on considère l'ensemble des séries de Hahn de complexité strictement inférieure à une certaine borne ordinale α, cela peut encore donner des choses intéressantes : par exemple, il existe beaucoup de α (il en existe un club sous ω₁, pour ceux qui savent ce que ça veut dire) tel que l'ensemble des séries de Hahn de complexité strictement moins que α soit un corps algébriquement clos ; et dans l'esprit de Conway on peut même calculer explicitement les plus petits (il s'agit en gros d'arriver à borner les complexités qui peuvent apparaître en résolvant une équation algébrique par approximation successive) : je ne me rappelle plus combien est le premier c'est mais c'est probablement ω^ω ou ω^{ω^ω} ou quelque chose de ce goût-là (je suis presque sûr que c'est inférieur à ε₀ ; d'ailleurs, il est plausible que ε₀ donne lui aussi une borne convenable). Mais laissons les ordinaux de côté.

Maintenant qu'on a ce gros — et magnifique — corps F((t^Q)), on peut chercher à lui trouver des sous-corps intéressants : puisqu'il est algébriquement clos (si F l'est) et complet, on peut chercher à y identifier, par exemple, la clôture algérique de F(t), celle de F((t)) (ce sera la même pour F((t^1/∞)) bien sûr) ou encore les complétés de ces clôtures algébriques ainsi que de F((t^1/∞)). C'est plus ou moins possible (ou, disons, c'est plus ou moins explicite). Par exemple, pour le complété (topologique) de F((t^1/∞)), c'est facile : ce sont les séries de Hahn telles que pour tout rationnel r l'ensemble des exposants supportant la série et inférieurs à r soient de dénominateur borné ; autrement dit, les dénominateurs des exposants ont le droit de tendre vers l'infini à condition qu'en même temps les exposants eux-mêmes tendent vers l'infini.

Maintenant, on a un théorème magnifique et stupéfiant de Christol, Kamae, Mendès France et Rauzy qui caractérise précisément la fermeture algébrique de F(t) à l'intérieur de F((t)), si F est un corps fini à q éléments : ce sont les séries de Laurent dont le coefficient c_i est q-automatique, c'est-à-dire que sa valeur peut être calculée à partir de l'écriture en base q de i par un automate fini (j'omets les détails, mais l'idée est qu'on a un automate ayant un nombre fini d'états et des fonctions de transition qui déterminent le nouvel état en fonction d'un symbole d'entrée et de l'état antérieur, et une fonction de sortie qui détermine le résultat en fonction du dernier état, et on lui passe en entrée successivement le signe de i puis les chiffres de i en base q, disons en commençant plus significatif, et il produit la valeur de c_i). Un exemple est donné par la série de Morse-Thue, f = t + t² + t⁴ + t⁷ + t⁸ + t¹¹ + ⋯, somme des puissances de t dont l'exposant a une écriture binaire comportant un nombre pair de chiffres 1 : cette série formelle est 2-automatique (on la calcule avec un automate à deux états, pair et impair, le chiffre 1 faisant passer de l'un à l'autre tandis que le chiffre 0 maintient l'état antérieur), donc comme série de Laurent sur un corps de caractéristique 2 elle est algébrique, d'ailleurs en l'occurrence elle vérifie précisément l'équation algébrique (1+t+t²+t³)f² + (1+t²)f + t = 0, comme il est facile de vérifier. Accessoirement, si on la regarde comme élément de C((t)), elle n'est pas algébrique cette fois : elle est non seulement transcendante mais même hypertranscendante (= elle ne vérifie aucune équation différentielle non triviale), cela a fait l'objet d'un problème d'agreg je ne sais plus quelle année, mais ce n'est pas vraiment mon sujet ici.

Bon, c'est bien d'avoir la fermeture algébrique de F(t) dans F((t)), mais on voudrait plutôt dans F((t^Q)). Pour ça aussi il y a un résultat, dû à Kedlaya : il caractérise la fermeture algébique de F(t) dans F((t^Q)) (toujours pour F un corps fini à q=p^d éléments) comme l'ensemble des séries quasi-q-automatiques, c'est-à-dire que quitte à effectuer une affinité rationnelle sur les exposants leurs dénominateurs deviennent tous des puissances de p et les coefficients sont calculés par un automate fini à partir de l'écriture en base p de ces exposants (écriture finie après la virgule puisque, justement, le dénominateur est une puissance de p). Il y a aussi un autre résultat, aussi dû à Kedlaya, sur la fermeture algébrique de F((t)) dans F((t^Q)) : pour le citer en agitant un peu les mains, la condition d'algébricité est que, quitte à faire une affinité rationnelle les exposants admettent des dénominateurs qui sont des puissances de p, c'est-à-dire une écriture finie en base p, et de plus que le nombre de chiffres autres de p−1 dans cette écriture soit borné, et que toute suite de coefficients obtenue en insérant des chiffres p−1 à un endroit fixé après la virgule dans l'écriture de l'exposant en base p soit prépériodique (par exemple, si p=7 et qu'on écrit en base 7, cette condition demande entre autres que la suite c_0.413, c_0.4613, c_0.46613, c_0.466613, etc., soit périodique à partir d'un certain point). Mais bon, ma façon de citer ces deux théorèmes laisse à désirer ne serait-ce que parce qu'il n'est pas trivial que la première condition implique la deuxième (il faut jouer avec les affinités, ça m'a laissé perplexe au début). Pour plus de précisions sur ces différents résultats, voir S. Kedlaya, Finite automata and algebraic extensions of function fields, J. Théor. Nombres Bordeaux 18 (2006), 379–420, dont un préprint est sur l'arXiv : ce papier est d'ailleurs d'une clarté remarquable et prend le soin d'expliquer tous les concepts qu'il utilise.

Il est intéressant de contraster le résultat de Christol (et celui de Kedlaya) qui va dans le sens automatique ⇒ algébrique avec un théorème de Loxton et van der Poorten (Arithmetic properties of automata: regular sequences, J. Reine Angew. Math. 392 (1988), 57–69) qui affirme qu'au contraire, si x est un nombre réel tel que (pour une certaine base b≥2) l'écriture b-adique de x soit b-automatique et non périodique, alors x est transcendant. [Rectification : Malheureusement, cet article comporte une erreur majeure. Le résultat annoncé est correct, cependant, comme le montre un article plus récent par Adamczewski & Bugeaud, On the complexity of algebraic numbers I. Expansions in integer bases, Ann. of Math. 165 (2007), 547–565.] Par exemple, le nombre de Morse-Thue, dont l'écriture binaire 0.110100110010110… comporte un 1 exactement aux emplacements dont le rang a un nombre impair de 1 en binaire, est un nombre transcendant. Ou, dans l'autre sens, il n'existe pas d'automate fini qui calcule les décimales de la racine carrée de 2. (Il y a aussi un théorème du même acabit qui affirme que si on forme un nombre réel en concaténant les écritures en base b des valeurs d'un polynôme non constant prenant des valeurs entières sur les entiers, ce nombre est transcendant.) Pour plus de précisions sur ces résultats, ce survey n'est pas mal. Je crois qu'il y a aussi des analogues p-adiques assez directs de ces théorèmes mais je ne sais pas très précisément.

Revenons enfin aux séries de Hahn : une autre chose intéressante et qu'on peut construire sur ce modèle non seulement des séries formelles en une indéterminée t mais aussi des écritures p-adiques : un entier p-adique (élément de Z_p) est une sorte de série formelle en p, une somme de c_i·pⁱ où les c_i sont des chiffres en base p, c'est-à-dire des éléments de {0,…,p−1}, l'addition et la multiplication se faisant de façon analogue aux séries formelles sauf qu'il y a des retenues (qui suivent exactement le mécanisme qu'on apprend à l'école primaire) ; un nombre p-adique (élément de Q_p) est alors l'analogue d'une série de Laurent en p, toujours une somme de c_i·pⁱ avec les c_i des chiffres p-adiques, mais cette fois i peut prendre des valeurs négatives tant qu'il n'y en a qu'un nombre fini (c'est-à-dire qu'un nombre p-adique est une écriture en base p infinie à gauche de la virgule mais finie à droite, contrairement aux réels où c'est exactement l'opposé, mais les règles d'addition et de multiplication sont les mêmes). Mais rien n'interdit de faire aussi l'analogue des séries de Hahn : il faut vérifier que la présence des retenues ne perturbe pas les supports bien ordonnés, mais ce n'est pas très difficile (la retenue se fait toujours de pⁱ vers pⁱ⁺¹, même s'il y a d'autres chiffres entre les deux !). Il ne faut pas espérer avoir une description explicite utilisable des éléments algébriques sur Q (par contre, algébriques sur Q_p c'est peut-être possible, de façon analogue à la caractérisation par Kedlaya de la fermeture algébrique de F((t)) dans F((t^Q)), mais je ne sais pas précisément). Tout de même, dans l'esprit, on peut obtenir ainsi un corps algébriquement clos et complet contenant Q_p : il faut mélanger les séries de Hahn avec les vecteurs de Witt, c'est-à-dire en gros prendre les sommes de c_i·pⁱ où les c_i sont des racines de l'unité (premières-à-p), les formules d'addition et de multiplication (l'analogue des « retenues ») étant alors données par les polynômes de Witt ; l'intérêt de ça est de permettre de concevoir un peu mieux le corps C_p (qui est le complété de la clôture algébrique de Q_p), très important en analyse p-adique (il joue un rôle analogue à C, le corps des complexes, pour l'analyse p-adique), d'ailleurs le corps des séries de Hahn-Witt est encore mieux, c'est un complété sphérique de la clôture algébrique de Q_p.

[#] Notamment pour l'éternel problème qu'écrire des formules mathématiques en HTML est insupportablement pénible. Ayant écrit cette entrée et tapé je ne sais combien de <var>t</var><sup>−1/<var>p</var></sup> et autres horreurs, je me rappelle douloureusement pourquoi il ne faut pas parler de maths sur une page Web !

[#2] J'espère que tout le monde voit bien le signe moins dans −1 : le HTML (enfin, Unicode, plus précisément) prévoit un signe moins spécifique, différent du trait d'union (-), qu'on écrit comme −, mais je m'inquiète qu'il ne s'affiche pas bien partout. Le cas échéant, je vous laisse en exercice de retrouver tous les signes manquants !

[#3] En tout cas, ce n'est pas une série de Laurent… Les petits malins peuvent essayer d'écrire cette série comme l'inverse de 1−t, plus l'inverse de 1−t⁻¹, moins 1, mais on vérifie facilement que cela fait… 0.