David Madore's WebLog: Une méditation sur le nombre 24 et la causalité en mathématiques

Index of all entries / Index de toutes les entréesXML (RSS 1.0) • Recent comments / Commentaires récents

↓Entry #2557 [older| permalink|newer] / ↓Entrée #2557 [précédente| permalien|suivante] ↓

(dimanche)

Une méditation sur le nombre 24 et la causalité en mathématiques

Dans cette entrée, je vais commencer par parler de maths, mais ensuite je veux me servir de ce que j'aurai raconté pour soulever une question de philosophie (ou peut-être, de psychologie) des maths. Ces deux parties n'ont pas vraiment de rapport sauf que la première sert d'illustration pour la seconde : on doit pouvoir sauter la première partie (ou la lire en diagonale) et quand même comprendre quelque chose à la seconde, enfin, j'espère. (Mais bon, je ne suis pas content de ce que j'ai écrit dans la seconde partie, donc ça n'a peut-être pas d'intérêt.)

*

Je racontais récemment que le nombre 24 était particulièrement magique à cause de l'existence de certains objets exceptionnels, notamment le réseau de Leech en dimension 24 (défini dans l'entrée en question). Maintenant, considérons le fait suivant (problème des boulets de canon, conjecturé par Édouard Lucas autour de 1875 et démontré par George Watson en 1918) :

L'équation 0² + 1² + ⋯ + n² = m² a exactement trois solutions, à savoir quand (n,m) vaut (0,0), (1,1) ou (24,70). Autrement dit, à part les deux cas triviaux (0²=0² et 0²+1²=1²), la seule situation où la somme des carrés des premiers entiers naturels est encore un carré est donnée par 0² + 1² + ⋯ + 24² = 70².

(La somme 0²+1²+⋯+n² vaut encore n·(n+1)·(2n+1)/6, mais si on écrit l'équation comme n·(n+1)·(2n+1) = 6m², on ne voit pas vraiment pourquoi elle est intéressante.)

Ce n'est pas très facile à montrer, mais ce n'est pas ça qui m'intéresse.

On pourrait dire que le fait que la somme des carrés des entiers naturels jusqu'à 24 est un carré (et qu'à part les cas triviaux c'est le seul) est une propriété remarquable du nombre 24. Pas franchement passionnante, mais bon. Mais a priori, on se dit que cette propriété n'a aucun rapport particulier avec les propriétés magiques du nombre 24 que j'ai évoquées dans mon autre entrée.

Sauf qu'en fait, si.

Pour expliquer ce rapport, considérons d'abord l'espace minkowskien de dimension 25+1, défini comme l'ensemble des 26-uplets de nombres réels (x0,…,x24,t), que je vais plutôt noter (x0,…,x24|t) pour bien séparer la dernière coordonnée que j'appelle t (bref, c'est juste ℝ26 mais noté un peu spécialement). Je définis la norme-carrée lorentzienne[#] d'un tel vecteur comme x0² + ⋯ + x24² − t² (avec un signe moins sur la coordonnée spéciale), et le produit scalaire lorentzien de (x0,…,x24|t) et (x0′,…,x24′|t′) comme x0x0′ + ⋯ + x24x24′ − tt′. C'est le genre de produit scalaire qu'on utilise en relativité restreinte (avec, ici, une dimension de temps et 25 dimensions d'espace). Je définis le vecteur w := (0,1,2,…,24|70), qui est de norme-carrée nulle — on peut aussi appeler ça un vecteur isotrope — à cause du fait énoncé ci-dessus. On dira qu'un vecteur est orthogonal à w lorsque son produit scalaire lorentzien avec w est nul, c'est-à-dire x1 + 2x2 + ⋯ + 24x24 − 70t = 0 ; c'est le cas de w lui-même, comme je viens de le dire, ou, bien sûr, de n'importe quel multiple de w. Maintenant, considérons l'ensemble U = ⟨w/⟨w⟩ des vecteurs orthogonaux à w modulo les multiples de w, c'est-à-dire les vecteurs vérifiant x1 + 2x2 + ⋯ + 24x24 − 70t = 0 mais où on identifie deux tels vecteurs (x0,…,x24|t) et (x0′,…,x24′|t′) lorsque leur différence est un multiple (réel) de w (c'est-à-dire, si on veut, que xi′−xi = i·(x1′−x1) pour 0≤i≤24, et t′−t = 70·(x1′−x1)). La norme-carrée d'un élément de U est simplement donnée par sa norme-carrée lorentzienne x0² + ⋯ + x24² − t². Ce U est simplement un espace euclidien de dimension 24 (pour la norme que je viens de définir : ce n'est pas difficile de voir qu'elle est positive définie), et on peut se demander pourquoi j'ai fait tout ce boulot juste pour définir un espace euclidien qu'on pourrait identifier à ℝ24 pour sa norme euclidienne usuelle (il n'y a qu'un espace euclidien de chaque dimension).

Voici la raison : considérons maintenant l'ensemble (généralement noté II25,1, une notation indiciblement pourrie) des (x0,…,x24|t) tels que (A) toutes les coordonnées (xi et t) sont entières ou bien toutes sont entières-et-demi (c'est-à-dire un entier plus ½), et (B) la somme x0+⋯+x24+t de toutes les coordonnées est paire. C'est notamment le cas du vecteur w := (0,1,2,…,24|70) que j'ai introduit. Faisons exactement comme ci-dessus avec les contraintes (A)&(B) d'intégralité que je viens d'introduire : appelons Λ l'ensemble des vecteurs vérifiant (A)&(B) (i.e., appartenant à II25,1) orthogonaux à w modulo les multiples (forcément entiers) de w.

[#] Re terminologie : il y a toujours un doute, quand on parle de la norme, dans un contexte quadratique, comme ça, pour savoir si c'est la forme quadratique elle-même ou sa racine carrée ; c'est vraiment pénible, parce que les deux valeurs sont plus ou moins naturelles selon le contexte. Quelqu'un devrait inventer deux termes qui lèvent totalement l'ambiguïté. Faute de mieux, j'écris norme-carrée, mais je ne suis pas content de ce terme, parce que dans ce contexte, la norme-carrée peut évidemment être négative (c'est plutôt la norme-sans-carré qui est la/une racine carrée de la norme-carrée que la norme-carrée qui le carré de la norme-sans-carré…).

Je répète, donc : Λ est l'ensemble des 26-uplets (x0,…,x24|t) de réels qui (A) sont tous entiers ou tous entiers-et-demi, (B) dont la somme est paire, et qui de plus sont orthogonaux à w au sens où x1 + 2x2 + ⋯ + 24x24 − 70t = 0, et où on identifie ceux qui diffèrent par un multiple (forcément entier) de w ; et la norme-carrée d'un tel élément est donnée par x0² + ⋯ + x24² − t² (et elle est forcément positive, et n'est nulle que si le vecteur est nul [c'est-à-dire représenté par un multiple de w]). À titre d'exemple, (2,0,0,…,0|0) est un vecteur de Λ (de norme-carrée 4) puisqu'il vérifie (A)&(B) et que son produit scalaire lorentzien avec w est nul ; c'est le même élément de Λ que (2,1,2,3,4,…,24|70) ou que (2,2,4,6,8,…,48|140) (puisque ceux-ci diffèrent par des multiples de w).

Eh bien ce Λ est le réseau de Leech.

Ce que je veux dire par est, c'est qu'on peut identifier les points du Λ que je viens de définir avec ceux du réseau de Leech que j'ai défini dans cette entrée de façon compatible à l'addition et à la norme (à un facteur multiplicatif près, qui doit être √8) : la disposition des points de Λ dans l'espace euclidien U défini ci-dessus est celle du réseau de Leech (et réalise, par exemple, l'empilement optimal des sphères d'une certaine taille).

(J'avoue que je n'ai pas d'isomorphisme explicite sous la main entre les deux réseaux. Je ne suis même pas sûr de savoir lister les 196 560 points de norme-carrée 4.)

Bon, tout ça peut toujours ressembler à une sorte de coïncidence superficielle. Mais ce n'est pas que ça : cette description du réseau de Leech via le réseau minkowskien II25,1 et le vecteur w particulier donné par la solution du problème des boulets de canon 0² + 1² + ⋯ + 24² = 70² est au cœur de l'explication uniforme par Borcherds des 23 constructions du réseau de Leech trouvées par Conway et Sloane (cf. ce que je racontais dans l'entrée sur Leech au sujet des « réseaux de Niemeier »).

*

Bon, alors, pour résumer ce que j'ai dit dans la première partie, il y a « un rapport » entre :

  • l'identité numérique 0² + 1² + ⋯ + 24² = 70², qui est en gros la seule de son type, et
  • l'existence d'un réseau remarquable en 24 dimensions appelé le réseau de Leech (et qui réalise, notamment, la façon optimale d'empiler les sphères en cette dimension).

« Un rapport » étant au moins compris dans le sens que l'existence de cette identité permet commodément de construire le réseau. (Si vous n'avez pas été convaincus par le côté naturel de la construction que j'ai donnée, essayez de me croire : c'est vraiment quelque chose d'assez naturel à faire que de considérer ⟨w/⟨w⟩, et l'autre ingrédient de la construction, le réseau minkowskien II25,1 qui, lui, n'a rien d'« exceptionnel » parce qu'il fait partie de la famille tout à fait évidente IIk, lorsque k est multiple de 8, est aussi un objet vraiment standard.)

Maintenant, la question que je veux illustrer avec ça, c'est : y a-t-il une notion de causalité en mathématiques ? et si oui, comment peut-on l'approcher, au moins informellement ? Peut-on dire que c'est « à cause » de l'égalité 0² + 1² + ⋯ + 24² = 70² que le réseau de Leech existe ? Ou au contraire, que c'est « à cause » du réseau de Leech que cette égalité est vraie ?

C'est quelque chose de très bizarre. La causalité (A cause B) normalement s'imagine en faisant l'expérience de pensée si A ne se produisait pas, alors B ne se produirait pas non plus (i.e., dans un monde parallèle où A n'a pas lieu, B n'a pas lieu non plus), et ça, en mathématiques, ce n'est pas possible : les mathématiques sont comme elles sont, il est vraiment difficile d'imaginer des mathématiques différentes (enfin, on peut toujours jouer à essayer, mais à part jouer avec les axiomes ce qui n'est pas du tout le point ici, ou à part trouver des analogies et des situations parallèles, ça ne marche pas vraiment). Pourtant, il y a des situations où on a vraiment l'impression qu'un phénomène mathématique en « explique » un autre, ou même qu'on a envie de dire qu'il le « cause ».

Pour prendre un exemple simple, prenez une calculatrice et calculez (1+√2)n pour des n de plus en plus grands : on obtient des nombres de plus en plus proches d'un entier (et qui sont alternativement juste un peu en-dessous d'un entier et juste un peu au-dessus) : l'« explication » est que (1+√2)n + (1−√2)n, lui, est exactement un entier (comme on le voit en développant), si bien que (1+√2)n est égal à un entier moins (1−√2)n, et que 1−√2 vaut approximativement −0.4, donc il est négatif et surtout, plus petit que 1 en valeur absolue (donc (1−√2)n est alternativement positif et négatif, et tend vers 0). En disant ça, j'ai démontré le phénomène observé, mais on est tenté de dire que je ne l'ai pas seulement démontré, je l'ai aussi expliqué ; et on a tendance à dire que c'est à cause du fait que |1−√2|<1 que (1+√2)n devient proche d'un entier pour n grand.

Un autre exemple classique (que j'ai peine à croire que je n'ai jamais mentionné sur ce blog !) est le fait que exp(π·√163) est presque un entier (il vaut 262 537 412 640 768 743.999 999 999 999 25…, très proche de 640 320³ + 744), ce qui s'« explique » par le fait que la valeur de l'invariant modulaire j (peu importe ce que c'est exactement) en τ = (1+√−163)/2 vaut exactement −640 320³, ce qui s'« explique » à son tour par des raisons de théorie des nombres, et que j(τ) admet un développement qui commence par 1/q + 744 + 196 884·q + ⋯ (dont les coefficients ne croissent pas trop vite) où q = exp(2iπ·τ), si bien que pour τ = (1+√−163)/2, la quantité 1/q = −exp(π·√163) vaut −640 320³ − 744 − 196 884·q − ⋯ est très proche de la somme des deux premiers termes. Ce qui est intéressant, là, c'est qu'un logiciel de calcul numérique quelconque, si on fait attention aux précisions des développements, peut démontrer que exp(π·√163) est proche d'un entier, simplement en calculant sa valeur ; mais on a cette démonstration n'est pas « explicative » : on constate que c'est le cas, mais on n'a pas de « raison », alors qu'en faisant intervenir l'invariant modulaire, on a une explication de pourquoi 163 a cette propriété.

Et cette notion de causalité en mathématiques, bien que problématique à cerner, est non seulement utile mais même prédictive : c'est en observant des traces de pas qu'on peut parfois dire qu'une licorne ou un éléphant blanc est passé par là et a causé les traces de pas. Un des signes qui a permis de détecter le groupe Monstre (que je range dans la catégorie « éléphant blanc ») était le calcul de sa table de caractères (peu importe ce que c'est exactement) : une table des caractères doit vérifier énormément de relations, et le fait que ces relations « marchent » était le signe qu'il y avait quelque chose qui les « causait », l'explication la plus naturelle étant, justement, l'existence d'un tel groupe.

Mais en même temps, ça semble complètement impossible, et futile d'essayer, de distinguer clairement une notion de « démonstration explicative » d'une notion de « démonstration non-explicative ». (Conway et Sloane ont montré par des calculs explicites que chacun des 23 réseaux de Niemeier permettait de construire le réseau de Leech, Borcherds a fourni une démonstration uniforme à base de (0,1,2,…,24|70), on considère cette dernière comme plus explicative, mais ce n'est vraiment pas clair ce que ça veut dire au juste.)

Bon, mes méditations tournent un peu en rond donc je vais mettre un terme à cette entrée, mais pour moi, c'est un des mystères des mathématiques : il y a toute une série d'objets exceptionnels qui sont reliés les uns aux autres parfois de façon très surprenante, on a envie de croire qu'ils se « causent » les uns les autres, qu'ils sont là pour une raison, d'autant que la manière dont ils apparaissent fait l'effet psychologique d'une mécanique bien huilée, mais on est obligé de se rappeler que tout ça ne veut pas dire grand-chose, les mathématiques sont comme elles sont, c'est tout.

↑Entry #2557 [older| permalink|newer] / ↑Entrée #2557 [précédente| permalien|suivante] ↑

Recent entries / Entrées récentesIndex of all entries / Index de toutes les entrées