David Madore's WebLog: Les octonions sont-ils intéressants ? (première partie)

Index of all entries / Index de toutes les entréesXML (RSS 1.0) • Recent comments / Commentaires récents

Entry #2276 [older|newer] / Entrée #2276 [précédente|suivante]:

(mardi)

Les octonions sont-ils intéressants ? (première partie)

J'ai promis depuis une éternité de parler d'octonions, et cette entrée a été commencée à ce moment-là, puis laissée de côté, puis remaniée complètement suite à une réflexion que j'ai entreprise sur la notion de géométrie, puis laissée de nouveau de côté, puis reprise, etc. Le résultat, écrit par bribes, manque donc certainement de cohérence globale, j'espère qu'on ne m'en voudra pas. Je reprends la formulation du titre d'une entrée passée pour m'interroger de nouveau sur l'intérêt d'un concept mathématique parmi ceux qui fascinent beaucoup, notamment les mathématiciens amateurs, et ceux qui aiment se demander voyons jusqu'où on peut généraliser les choses : en l'occurrence, les octonions, dont je vais tâcher d'expliquer de quoi il s'agit. Mais, quitte à spoiler la suite, je peux d'ores et déjà révéler que ma conclusion générale sera plus positive que pour les nombres surréels : je prétends que les octonions sont un objet naturel, même si les raisons de leur existence ont quelque chose d'un peu étonnant et mystérieux ; en revanche, les tentatives pour les généraliser encore sont idiotes parce qu'elles passent complètement à côté de la raison profonde pour laquelle les octonions sont intéressants (en se concentrant sur des phénomènes superficiels).

Introduction

Dans cette première partie d'une série d'entrées consacrées aux octonions (mais qui, comme tout ce que j'entreprends, présente un risque sérieux de ne jamais être finie), je n'arriverai pas encore à répondre à la question du titre, puisque je ne ferai essentiellement que définir et présenter les objets en question. Après une présentation et un petit historique censés être lisibles par absolument tout le monde, je veux commencer par rappeler ce que sont les nombres complexes et les quaternions, pour ensuite aborder les octonions. J'expliquerai pourquoi les quaternions sont intéressants et utiles notamment pour calculer avec les rotations dans l'espace, et j'essaierai de présenter ensuite de façon analogue des liens des octonions avec les rotations en sept ou huit dimensions. Je parlerai ensuite un peu des automorphismes des octonions, qui constituent le groupe de Lie exceptionnel G2 (il faudra donc dire un peu ce que cela signifie), et j'évoquerai enfin quelques pistes pour la suite.

Je prévois de continuer avec encore deux entrées sur le sujet : l'une (déjà essentiellement écrite) contiendra un microscopique aperçu du sujet des octonions entiers et notamment leur lien avec mon E8 préféré, et une autre (largement à écrire ou à réécrire, donc probablement pour jamais) doit expliquer ce qu'est le carré magique de Freudenthal-Tits, qui permet vraiment de répondre (positivement !) à la question du titre — oui, les octonions sont intéressants à cause de leur lien profond avec les groupes de Lie exceptionnels G2, F4, E6, E7 et (de nouveau !) E8.

Table des matières

Présentation sans mathématiques, et petit historique

Disons immédiatement la chose suivante : les octonions (𝕆) sont une sorte de « nombres » qui s'inscrit logiquement après les nombres réels ℝ, les nombres complexes ℂ et les quaternions ℍ. Les nombres complexes sont un objet de dimension réelle 2, c'est-à-dire qu'un nombre complexe renferme essentiellement la donnée de deux nombres réels (sa partie réelle et sa partie imaginaire) ; les quaternions sont de dimension réelle 4, c'est-à-dire qu'ils ont quatre coordonnées réelles, et les octonions sont de dimension réelle 8. Ceci donne naturellement envie de prolonger la suite des puissances de 2 et d'inventer des sortes de nombres qui soient de dimension réelle 16, 32 et ainsi de suite, mais le caractère véritablement exceptionnel des octonions offre toutes sortes de raisons de comprendre, au contraire, qu'elle doit s'arrêter (et que c'est justement le fait qu'elle s'arrête qui rend les octonions intéressants !), c'est-à-dire que tout objet qu'on peut inventer pour la prolonger est soit entièrement dénué d'intérêt soit complètement délirant.

Il m'est impossible de faire l'historique des nombres réels puisque la progression historique, à ce sujet, est trop éloignée de la progression mathématique : la géométrie grecque utilise implicitement une notion de mesure, mais la mesure d'une longueur ou d'une aire ne sont pas véritablement unifiées et le concept de nombre négatif n'existe pas ; a contrario, il serait absurde de dater les nombres réels de leur première construction véritablement rigoureuse (peut-être par Cauchy ou Dedekind) car ce serait suggérer qu'Euler, Lagrange ou Gauß ne comprenaient pas ce concept, ce qui est manifestement faux parce que les questions algébriques qui m'intéressent ici sont assez peu liées aux questions (quasi fondationnelles) sur la complétude des nombres réels. Je passe donc sur les nombres réels.

Les nombres complexes ont commencé à apparaître avec la résolution des équations du troisième degré notamment par Jérôme Cardan (vers 1545) : la raison en est que même si une équation réelle du troisième degré a toujours une solution réelle, il peut être nécessaire d'introduire des racines carrées de nombres négatifs, c'est-à-dire de passer par les nombres complexes, pour exprimer ce qui sera finalement une quantité réelle (on sait maintenant, grâce à la théorie de Galois, que le cas où les trois racines d'une équation cubique réelle sont toutes réelles, le fameux casus irreducibilis, lié au problème de la trissection de l'angle, ne peut se résoudre en radicaux que si on accepte des radicaux non réels). Mais même si Cardan fait intervenir, presque malgré lui, des nombres complexes, c'est Bombelli qui en développe une première théorie un peu sérieuse dans son livre d'algèbre publié en 1572. Curieusement, ce n'est que tardivement, peut-être avec Argand en 1806, et avec la recherche de démonstrations du théorème fondamental de l'algèbre (une équation algébrique de degré n dans les nombres complexes a toujours n solutions comptées avec multiplicités), qu'on a acquis la représentation claire des nombres complexes comme les points d'un plan (donc de dimension 2 sur les nombres réels) dont la partie réelle et la partie imaginaire seraient les deux coordonnées.

Les nombres complexes ayant ainsi deux coordonnées réelles, et étant liés de façon agréable à la géométrie plane, il est naturel de chercher si on peut construire des sortes de nombres avec trois coordonnées, qu'on pourrait lier à la géométrie dans l'espace. William Hamilton a passé des années de sa vie, vers 1830–1840, à chercher de tels nombres (sans avoir, bien sûr, une définition exacte de ce qu'il cherchait). C'est en 1843 qu'il a découvert les quaternions, de dimension 4 réelle, en même temps qu'il a compris la raison pour laquelle la dimension 3 ne pouvait pas répondre à ses attentes, à savoir l'inexistence d'une « identité des trois carrés » analogue à l'« identité des deux carrés » ((a²+b²) · (a′²+b′²) = (a·a′−b·b′)² + (a·b′+b·a′)²) qui exprime la multiplicativité de la norme complexe et celle « des quatre carrés » ((a²+b²+c²+d²) · (a′²+b′²+c′²+d′²) = (a·a′−b·b′−c·c′−d·d′)² + (a·b′+b·a′+c·d′−d·c′)² + (a·c′−b·d′+c·a′+d·b′)² + (a·d′+b·c′−c·b′+d·a′)²) liée à l'existence des quaternions mais qui était déjà connue d'Euler et de Lagrange.

Malgré le fait qu'ils soient de dimension 4, les quaternions ont, comme je l'expliquerai, des applications naturelles à la géométrie euclidienne de dimension 3 (pour le calcul des rotations dans l'espace). C'est sans doute la raison pour laquelle ils ont eu un certain succès, et ont valu une grande renommée à leur inventeur. (En fait, comme souvent en mathématiques, les découvertes avaient été préfigurées par d'autres : en l'occurrence, Gauß avait essentiellement découvert les quaternions dans un texte de 1819 sur les rotations de la sphère, qu'il n'a pas jugé bon de publier.) Toujours est-il que dans la deuxième moitié du XIXe siècle ont fleuri des textes, des chaires et des cours sur la « science des quaternions ». (Une anecdote que je n'ai pas réussi à confirmer veut que quand Charles Dodgson, plus connu sous le pseudonyme de Lewis Carroll, a publié Alice in Wonderland, la reine Victoria lui a fait promettre de lui envoyer une copie du prochain livre qu'il écrirait : le livre en question était un traité sur les quaternions, et l'histoire ne dit pas si Victoria l'a autant apprécié.) Les quaternions continuent d'avoir une certaine utilité pour représenter informatiquement des orientations dans l'espace (de façon compacte et efficace).

Les octonions, en revanche, n'ont pas eu une telle popularité, et n'ont guère d'utilité pratique. Découverts (sous le nom d'octaves), à peine quelques mois après les quaternions, par un ami de Hamilton, John Graves, celui-ci s'est fait voler la vedette par Arthur Cayley qui a publié l'existence des octonions en 1845.

Il existe une façon systématique (la construction de Cayley-Dickson) pour passer des nombres réels aux complexes, des complexes aux quaternions, et des quaternions aux octonions : mais à chaque fois qu'on applique cette construction, on perd quelque chose. Quand on passe des réels aux complexes, on perd la propriété d'être un corps ordonné (ou ordonnable) ; quand on passe des complexes aux quaternions, on perd la commutativité de la multiplication, c'est-à-dire que x·y et y·x ne seront plus égaux en général dans les quaternions ; quand on passe des quaternions aux octonions, on perd l'associativité de la multiplication, c'est-à-dire que x·(y·z) et (x·yz ne seront plus égaux en général dans les octonions (ce qui doit faire frémir d'horreur tout mathématicien qui se respecte, mais heureusement on garde au moins une forme faible de l'associativité appelée alternativité) ; et si on cherche à continuer la construction, on perd la seule raison pour laquelle les choses avaient encore un intérêt, à savoir la multiplicativité des normes ou le fait que x·y=0 ne se produit que pour x=0 ou y=0. Même avec ces propriétés, il n'est pas du tout évident que les octonions aient le moindre intérêt autrement que comme une petite curiosité algébrique : il se trouve qu'ils en ont, mais il me semble que la seule explication convaincante de ce fait passe par la théorie des groupes de Lie exceptionnels, et je reporterai à plus tard ces explications.

Quelques lectures : Une excellente référence (souvent citée) concernant les octonions en général est l'introduction de John Baez à leur sujet [edit : lien cassé (en ce moment ?), mais le même texte est disponible sur l'arXiv] ; une autre est le livre de J. H. Conway et D. Smith, On Quaternions and Octonions (their Geometry, Arithmetic and Symmetry). Beaucoup de ce que je vais dire est contenu dans ces sources, mais je vais essayer de dire certaines choses de façon plus élémentaire, ou au moins d'arriver plus rapidement à ce qui est amusant. Une autre référence est les chapitre 9 et 10 par Koecher et Remmert dans le livre Numbers de Ebbinghaus &al. Pour une présentation élégante de la multiplication sur les octonions sans passer par la construction de Cayley-Dickson, je conseille cet article de Bruno Sévennec. Enfin, pour une description claire et approfondie du « carré magique » de Freudenthal (dont je devrai parler plus tard), je recommande ce survey par Barton et Sudbery, qui est le seul que j'aie trouvé vraiment satisfaisant sur le sujet (on pourra aussi consulter cet article de Freudenthal lui-même, en allemand, qui reprend les choses à zéro, de façon assez claire et efficace). Je tire la plupart des informations de mon aperçu historique du livre Mathematics and its History de John Stillwell (notamment les chapitres 14 et 20).

Définition rapide pour les gens pressés

Pour les lecteurs qui n'auraient pas la patience de lire tout ce qui suit, voici une définition ultra-rapide des algèbres à divisions des complexes, quaternions et octonions (on peut aussi l'ignorer sachant que tout va être redit ci-dessous). Il s'agit respectivement des expressions de la forme x(0) + x(1)·i pour les complexes, x(0) + x(1)·i + x(2)·j + x(3)·k pour les quaternions et x(0) + x(1)·i + x(2)·j + x(3)·k + x(4)· + x(5)·i· + x(6)·j· + x(7)·k· pour les octonions (il faudrait traiter i·, j· et k· comme trois lettres supplémentaires, même si je les ai écrites comme des produits pour économiser les lettres de l'alphabet) ; l'addition se fait terme à terme, et la multiplication se fait en développant complètement l'écriture et en utilisant la table qui suit :

×1ijki·j·k·
11ijki·j·k·
ii−1kji·k·j·
jjk−1ij·k·i·
kkji−1k·j·i·
i·j·k·−1ijk
i·i·k·j·i−1kj
j·j·k·i·jk−1i
k·k·j·i·kji−1

(La ligne de la table donne le symbole de gauche à multiplier et la colonne donne le symbole de droite : ainsi, i·j=k tandis que j·i=−k. Pour les complexes, seules les deux premières lignes et colonnes servent, et pour les quaternions, seules les quatre premières lignes et colonnes. Il y a toutes sortes de conventions différentes pour nommer la base des octonions, mais celle que j'ai choisie a l'avantage que — je pense — tous les mathématiciens seront d'accord sur le contenu de la table de multiplication une fois qu'on a choisi les noms.)

La multiplication des complexes est commutative et associative, celle des quaternions est associative mais non commutative, et celle des octonions n'est même pas associative ((i·j=k· tandis que i·(j·)=−k·) ; elle vérifie cependant des conditions plus faibles, dites d'alternativité, à savoir que x·(x·y)=(x·xy, x·(y·x)=(x·yx et y·(x·x)=(y·xx (ce qui revient à dire que l'associateur {x,y,z} := (x·yzx·(y·z) est complètement antisymétrique en ses trois variables).

Si on préfère, on peut aussi définir les octonions à l'aide des formules suivantes (où q,q′,r,r′ désignent des quaternions) : (1) q·(r′·) = (r′·q, (2) (r·q′ = (r·q* et (3) (r·)·(r′·) = −r*·r, où ici, x* désigne le quaternion conjugué de x (cf. ci-dessous). Les mêmes formules en mettant j à la place de peuvent servir à définir les quaternions à partir des complexes, et avec i à définir les complexes à partir des réels. (On parle du procédé de Cayley-Dickson. Pour aider à retenir ces formules, on peut notamment retenir le fait que si w est un quaternion de module 1 quelconque, alors l'application ℝ-linéaire qui fixe les quaternions et envoie un octonions de la forme q′· sur (w·q′)·, constitue un automorphisme des octonions : ceci contraint énormément les formules.)

On peut aussi retenir que i, j, k s'associent et vérifient i² = j² = k² = i·j·k = −1, que la même chose vaut aussi pour n'importe lequel des trois avec (par exemple, i² = ² = (i·)² = −1), et enfin que si on prend deux distincts de i, j, k, avec , alors cette fois ils s'anti-associent toujours, par exemple i·(j·) = −(i·j = −k·. Ceci suffit à reconstruire la table.

Le conjugué d'un complexe, quaternion ou octonion, s'obtient en changeant le signe de toutes les composantes x(p) sauf la partie réelle x(0) (i.e., les conjugués de 1,i,j,k,,i·,j·,k· valent respectivement 1,−i,−j,−k,−,−i·,−j·,−k·). On a (x·y)* = y*·x*, et par ailleurs N(x) := x·x* est la somme des carrés des composantes de x, donc c'est un nombre réel, qui ne peut être nul que si x l'est. En mettant ces deux propriétés ensemble, on voit que tout complexe, quaternion ou octonion x non nul a un inverse de même type, donné par x*/N(x). (Il est utile de savoir que, dans les octonions, le parenthésage n'a pas d'importance dans tout produit faisant intervenir uniquement deux octonions, x, y, ainsi qu'éventuellement leurs conjugués x* et y*, et bien sûr les nombres réels, ce qui permet de conclure que x·y multiplié à gauche par l'inverse de x ou à droite par l'inverse de y donne bien ce qu'on espérait.) On définit par ailleurs |x| = √N(x) (le module, ou la valeur absolue, de x), et aussi Re(x) = ½(x+x*) = x(0) (la partie réelle de x) : cette dernière vérifie notamment Re(x·y)=Re(y·x) et aussi Re(x·(y·z))=Re((x·yz).

Nombres complexes et quaternions

Complexes

J'imagine que tous mes lecteurs assez intéressés par les maths pour lire ce genre d'entrée (et/ou qui sont passés par un bac scientifique) savent déjà ce que sont les nombres complexes : ce sont des expressions de la forme a + b·ia et b sont des nombres réels et où i est un objet formel dont la propriété essentielle est de vérifier i²=−1. L'addition des nombres complexes se fait terme à terme, c'est-à-dire (a+b·i) + (a′+b′·i) = (a+a′) + (b+b′)·i (c'est dire, en fait, que 1 et i forment une base des complexes sur les réels), et la multiplication des complexes se calcule en développant et en utilisant la formule i²=−1, ce qui donne (a+b·i) × (a′+b′·i) = (a·a′−b·b′) + (a·b′+b·a′)·i. Tout ceci se résume dans la table de multiplication suivante :

×1i
11i
ii−1

Le nombre réel a s'appelle la partie réelle du complexe a+b·i, et le nombre réel b sa partie imaginaire ; il va de soi que si la partie imaginaire est nulle on a affaire à un nombre réel, et on dit aussi qu'un nombre de la forme b·i (=de partie réelle nulle) est imaginaire pur. Il est par ailleurs naturel de voir la partie réelle et la partie imaginaire d'un nombre complexe comme l'abscisse et l'ordonnée d'un point dans le plan, et on fera souvent cette identification tacitement (par exemple en disant que la droite réelle est l'axe des abscisses).

Les nombres complexes vérifient les mêmes propriétés algébriques essentielles que les nombres réels (existence d'un 0 neutre pour l'addition, associativité et commutativité de l'addition, existence d'opposés pour celle-ci, distributivité de la multiplication sur l'addition et linéarité par rapport aux réels, existence d'un 1 neutre pour la multiplication, associativité et commutativité de la multiplication, et existence d'inverses des éléments non nuls pour la multiplication) : on dit qu'il s'agit d'un corps, et il va falloir se résigner à perdre certaines de ces propriétés si on veut aller plus loin parce qu'il n'existe aucun corps contenant strictement les nombres complexes et qui soit de dimension finie sur eux.

On appelle conjugué (complexe) d'un nombre complexe z = a+b·i le nombre z* := ab·i (plus souvent noté avec une barre au-dessus, c'est-à-dire quelque chose comme , mais je vais préférer z* dans l'espoir que ce soit plus lisible en HTML), autrement dit le nombre obtenu en changeant le signe de la partie imaginaire b (ou, géométriquement, le symétrique orthogonal par rapport à l'axe réel). Ce conjugué a notamment la propriété que le produit z·z* = a²+b² est un nombre réel, qu'on notera N(z) et qu'on appellera module-au-carré de z (le module est, bien sûr, la racine carrée de cette quantité ; le N dans ma notation est l'initiale du mot norme, mais il y a une certaine ambiguïté quant à savoir si la norme d'un complexe vaut a²+b² ou sa racine carrée, donc je préfère le mot module et noter N(z) = a²+b² le module-au-carré). Le fait que N(z1·z2) = N(z1)·N(z2) est fondamental, mais la terminologie pour refléter ce fait est un peu fluctuante (selon les propriétés exactes qu'on met sous le N, on peut parler d'algèbre de composition, ou d'algèbre à division normée), donc je n'insiste pas trop.

L'existence d'inverses est claire compte tenu de ce que je viens de dire : pour tout complexe z non nul, il existe un unique complexe z′ (appelé inverse de z) tel que z·z′=1 : précisément si z=a+b·i on obtient son inverse z′ par la formule z′ = z*/N(z), c'est-à-dire en divisant le conjugué z* = ab·i de z par le nombre réel non nul N(z)=z·z*=a²+b² (ce qui revient à diviser chaque composante par cette quantité).

Quaternions

Les quaternions, eux, sont des expressions de la forme a + b·i + c·j + d·ka,b,c,d sont des nombres réels et où i, j, k sont des objets formels dont les propriétés essentielles sont de vérifier i² = j² = k² = i·j·k = −1 (relation que Hamilton a gravée sous Broom Bridge à Dublin). L'addition se fait encore terme à terme (et je ne répéterai plus ce genre de choses : tout ce qu'on veut construire sont des sortes d'algèbres — de dimension finie — et en particulier des espaces vectoriels sur les nombres réels), et la multiplication s'obtient grâce à la table suivante :

×1ijk
11ijk
ii−1kj
jjk−1i
kkji−1

Cette table n'est pas symétrique (la multiplication n'est pas commutative, comme je vais le souligner), donc il faut la lire dans le bon sens : le facteur de gauche du produit détermine la ligne et le facteur de droite la colonne, par exemple i·j=k alors que j·i=−k. On peut mémoriser ce tableau soit en mémorisant la relation de Hamilton soit en retenant que le produit de deux unités consécutives dans l'ordre cyclique i,j,k est égal à la troisième, alors que dans le sens contraire on obtient l'opposé.

Le nombre réel a s'appelle partie réelle du quaternion a+b·i+c·j+d·k, mais les nombres b,c,d n'ont pas de nom particulier (non, on ne dit pas partie imaginaire, partie jmaginaire et partie kmaginaire). En revanche, un quaternion dont la partie réelle est nulle est dit imaginaire pur (c'est le cas de i, j et k eux-mêmes).

Bien sûr, il faut garder à l'esprit que ce qu'on appelle i,j,k est un peu arbitraire. Il faudra un jour que j'écrive un petit discours sur ce que ça signifie que deux objets soient égaux ou indiscernables en mathématiques (il y a des problèmes philosophiques et mathématiques pas évidents là-dessous), mais disons que je veux souligner au moins deux choses. D'abord, de façon assez triviale, que si par exemple je changeais la table de multiplication de façon à redéfinir k en −k, c'est-à-dire en −i·j au lieu de i·j, on aurait quand même affaire au même objet, i.e., l'étiquetage des unités et les signes de la table de multiplication sont juste une question de convention, il se trouve juste que Hamilton a gravé dans la pierre (c'est le cas de le dire) la convention pour les quaternions i·j=k, donc tout le monde est d'accord dessus (ce ne sera plus le cas pour les octonions). Mais il y a un deuxième sens, qui est plus subtil, consistant à se demander dans quelle mesure je suis capable de retrouver, en supposant que j'ai des quaternions sous la main et que je sache les multiplier, lesquels s'appellent i, j et k : et la réponse est que non on ne peut pas (encore moins que pour les complexes où on a juste la possibilité d'échanger i et −i), et je vais devoir m'expliquer un peu mieux à ce sujet.

Voici une autre façon de définir ou de présenter les quaternions : au lieu de prendre quatre nombres réels a,b,c,d, on peut les voir comme un nombre réel a et un vecteur en trois dimensions, v=(b,c,d). L'addition ne présente pas plus de difficulté (ou d'intérêt) sous cette forme, on ajoute simplement la composante réelle et la composante vectorielle ; pour la multiplication, si je note [a,v] le quaternion de partie réelle a et vectorielle v, je définis [a,v] · [a′,v′] = [(a·a′−v·v′), (a·v′+a′·v+v×v′)], où v·v′ et v×v′ désignent respectivement le produit scalaire et le produit vectoriel (usuels) de deux vecteurs en dimension 3. On verra facilement l'analogie avec la formule que j'ai écrite pour la multiplication de deux complexes, le terme essentiellement nouveau étant le v×v′ qui reflète la manière dont on multiplie deux quaternions imaginaires purs, c'est-à-dire de composante réelle a nulle. L'avantage de cette présentation est d'éviter de faire appel à un choix de i,j,k, et on peut d'ores et déjà facilement se convaincre que n'importe quel choix de trois vecteurs formant une base orthonormée directe de l'espace de dimension 3 peut mériter les noms de i,j,k (et donc, comme on le verra plus loin, que les rotations de l'espace de dimension 3 sont des automorphismes des quaternions) ; c'est ainsi que les quaternions ont un lien si fort avec les rotations en trois dimensions.

Comme le produit vectoriel n'est pas commutatif (il est même anticommutatif), ou simplement parce que i·j=k alors que j·i=−k, les quaternions ont perdu la commutativité de la multiplication par rapport aux nombres complexes. Ils ont encore les autres propriétés que j'ai citées, notamment l'associativité de la multiplication et l'existence d'inverses. Pour résumer en un mot les propriétés d'un corps moins la commutativité de la multiplication, je dirai que les quaternions sont un corps-gauche (avec un trait d'union parce que les corps-gauches ne sont pas des corps pour ma terminologie) ou une algèbre à divisions. On a encore des notions de conjugué et de module : le produit d'un quaternion q = a+b·i+c·j+d·k et de son conjugué q* := ab·ic·jd·k est un nombre réel N(q) := a²+b²+c²+d² appelé module-au-carré de q, et si q≠0 l'unique quaternion q′ (appelé inverse de q) tel que q·q′ = q′·q = 1 se calcule en divisant q* par N(q) (i.e., comme pour les complexes, on a q′ = q*/N(q)).

Une formule amusante sur les quaternions (et assez choquante quand on a les nombres complexes à l'esprit) est que le conjugué q* d'un quaternion q est donné par la formule « linéaire » q* = −½·(q + i·q·i + j·q·j + k·q·k). (En fait, toute application ℝ-linéaire ℍ→ℍ peut être définie comme une somme d'au plus quatre termes de la forme a·q·b, où on peut faire parcourir à a les valeurs {1,i,j,k} si on veut, ce qui rend d'ailleurs les b correspondants uniques.)

De même que les nombres complexes s'identifient au plan réel, les quaternions s'identifient à l'espace euclidien de dimension 4 : par euclidien je veux dire qu'on n'a pas seulement une structure linéaire (addition et multiplication par un réel : ce qui forme un ℝ-espace vectoriel), on a une notion de distance (la distance à l'origine est ce que j'ai appelé le module d'un quaternion) et d'orthogonalité (ainsi, 1, i, j et k sont orthogonaux entre eux). Notamment, les quaternions de module 1 s'identifient à la sphère de dimension 3 (celle qui vit dans un espace de dimension 4) et les quaternions imaginaires purs de module 1 s'identifient à la sphère de dimension 2 (la sphère au sens usuel, celle qui vit dans un espace de dimension 3, en l'occurrence celui des quaternions imaginaires purs). Signalons que le produit scalaire euclidien de deux quaternions q et q′ est la partie réelle de q·q* (ceci est bien symétrique entre q et q′) : notamment, deux quaternions sont orthogonaux si et seulement si le produit de l'un avec le conjugué de l'autre est un quaternion imaginaire pur.

Il faut aussi que je souligne la chose suivante : on a tendance à identifier le corps ℂ des complexes aux quaternions de la forme a+b·i, mais il va de soi qu'on pourrait aussi le faire en mettant j ou k à la place de i ; et surtout, plus subtilement, si u est n'importe quel quaternion purement imaginaire (i.e., de partie réelle nulle) et de module 1, on peut « voir » u comme l'unité i des nombres complexes, et les quaternions de la forme a+b·u forment une algèbre de nombres complexes dans les quaternions (en particulier, u vérifie u²=−1, ce qui est d'ailleurs complètement équivalent à u est purement imaginaire et de module 1 comme on s'en convainc facilement). Mais ceci signifie que tout quaternion qui n'est pas réel appartient à une et une seule algèbre de nombres complexes dans les quaternions (en effet, on peut toujours l'écrire sous la forme a+b·u pour un u purement imaginaire de module 1, qui est alors unique au signe près) : donc, tant qu'on n'a affaire qu'à un seul quaternion, les calculs se font exactement comme sur les nombres complexes (la direction de la partie imaginaire est fixée).

Interprétation géométrique, automorphismes des quaternions

Les nombres complexes ont une interprétation géométrique évidente, que j'ai déjà mentionnée, comme des points du plan (on identifie le nombre z=a+b·i au point de coordonnées (a,b) dans un repère euclidien fixé une fois pour toutes : on dit parfois que le nombre complexe z est l'affixe du point en question). Mais il y en a une autre : les nombres complexes non nuls s'interprètent aussi comme des similitudes (vectorielles) directes du plan (une similitude vectorielle directe étant la composée d'une homothétie centrée à l'origine et d'une rotation également centrée à l'origine) ; en l'occurrence, si z≠0 est un nombre complexe, identifié au point du plan qui lui correspond (dont il est l'affixe), la similitude associée est l'unique similitude (vectorielle directe) envoyant 1 sur z : il s'agit simplement de la multiplication par z vue comme une transformation du plan. Un cas particulier est formé des nombres complexes de module 1 : vus comme des points ce sont les points du cercle unité a²+b²=1, et vus comme des similitudes ce sont les rotations du plan (vectorielles, i.e., centrées à l'origine), c'est-à-dire les similitudes de rapport 1.

Si on introduit l'exponentielle exp(z) d'un nombre complexe z comme la somme de la série convergente 1 + z + (z²/2) + (z³/3!) + ⋯ (la série habituelle de l'exponentielle), on montre que l'exponentielle de a+b·i vaut ea · (cos(b)+sin(bi) (enfin, c'est plus ou moins la définition du cosinus et du sinus). Ceci conduit à revoir toutes sortes de choses : les nombres complexes de module 1 peuvent s'écrire sous la forme exp(i·θ) où θ est un réel défini modulo 2π, et qui est l'angle de la rotation correspondante ; et les nombres complexes non nuls en général peuvent s'écrire sous la forme ρ · exp(i·θ), où ρ>0 est le module, qui est aussi le rapport de l'homothétie, et θ toujours défini modulo 2π, son angle, qui s'appelle l'argument du nombre complexe considéré.

Les quaternions ont des interprétations géométriques à la fois concernant les rotations en trois et en quatre dimensions (c'est d'ailleurs la cause d'une certaine confusion possible).

Pour en parler, commençons par considérer les quaternions de module 1, c'est-à-dire vérifiant a²+b²+c²+d²=1 : ils forment visiblement une sphère en dimension 4 (donc elle-même de dimension 3), et ils sont un groupe pour la multiplication (c'est-à-dire que la multiplication de deux quaternions de module 1 est encore un quaternion de module 1, et que l'inverse d'un quaternion de module 1 en est encore un). Je vais expliquer que ce groupe est un groupe appelé Spin3 qui est « presque » le groupe des rotations en trois dimensions, mais d'abord voyons ce qu'on peut faire en quatre dimensions.

Si u est un quaternion de module 1, la multiplication à gauche par u, c'est-à-dire l'application qu·q (sur les quaternions q) est une rotation (puisque le module de u·q est égal au module de q) : mais comme le groupe SO4 des rotations en dimension 4 est de dimension 6 contre seulement 3 pour les quaternions de module 1, on ne les attrape certainement pas toutes de cette manière. La multiplication à droite par un quaternion u de module 1, c'est-à-dire l'application qq·u, donne aussi une rotation, et pour la même raison pas toutes ; pour que les choses marchent mieux dans la suite, je vais plutôt considérer, ce qui ne change rien à ce stade, la multiplication à droite par l'inverse u* de u (c'est aussi son conjugué puisque u a été supposé de module 1), bref l'application qq·u*. Maintenant, et je ne le prouverai pas, si on prend deux quaternions, u1 et u2, tous deux de module 1, alors il s'avère que l'application T(u1,u2):qu1·q·u2* de multiplication à gauche par l'un et à droite par le conjugué de l'autre, qui est toujours une rotation, peut cette fois atteindre toutes les rotations possibles en quatre dimensions, et de plus de façon presque unique au sens où les seuls couples (u1,u2) qui donnent la rotation triviale sont (1,1) et (−1,−1). L'avantage d'avoir mis u2* à droite plutôt que bêtement u2 est qu'on a T(u1,u2)∘T(u1,u2) = T(u1·u1,u2·u2) c'est-à-dire qu'on a affaire à un morphisme T depuis le produit de deux copies du groupe des quaternions de module 1 vers le groupe SO4 des rotations en quatre dimensions, qui est « presque » un isomorphisme (le « presque » étant à cause de ce (−1,−1)). Le groupe sur lequel on a effectivement un isomorphisme et le groupe noté Spin4 qui est le revêtement double de SO4, c'est-à-dire qu'il distingue une rotation d'un tour complet de pas de rotation du tout (ou, si on ne trouve pas ça très satisfaisant comme façon de dire les choses, on peut prendre pour définition de Spin4 qu'il s'agit des couples de quaternions de module 1, opérant comme rotation via le T qu'on a défini).

Ceci constitue le lien avec les rotations en dimension 4. Et en dimension 3 maintenant ? Cette fois, on va chercher les rotations qui fixent 1, c'est-à-dire celles qui ne touchent qu'aux composantes imaginaires b,c,d (ou à la composante vectorielle v, dans une autre présentation que j'ai donnée) du quaternion, et qu'on voit comme une rotation sur cette partie-là. Or pour que T(u1,u2):qu1·q·u2* fixe le nombre 1, il faut et il suffit que u1·u2* = 1, ce qui équivaut à u1=u2. Si on simplifie la notation et qu'on note alors simplement Tu l'application qu·q·u* (toujours pour u un quaternion de module 1), vue comme une rotation en trois dimensions par restriction aux quaternions imaginaires purs, les rotations en trois dimensions se voient donc toutes sous la forme Tu et de nouveau on a Tu∘Tu = Tu·u c'est-à-dire qu'on a un « presque » isomorphisme entre le groupe des quaternions de module 1 et le groupe SO3 des rotations en trois dimensions, plus exactement un isomorphisme avec le groupe Spin3. (De nouveau, Spin3 est le « revêtement double » de SO3 qui considère qu'un tour complet n'est pas l'identité ; et, si on n'aime pas cette définition, on peut définir Spin3 comme les quaternions de module 1 opérant comme rotation via le T qu'on a défini.) Au passage, on voit que Spin3×Spin3 ≅ Spin4, c'est-à-dire qu'une rotation en quatre dimensions est « presque » la même chose que deux rotations en trois dimensions (presque signifiant que c'est la même chose si on est prêt à oublier le problème du −1, ou bien à monter au groupe Spin pour que ce problème disparaisse).

Récapitulation de ce qui vient d'être dit :

  • Toute rotation de l'espace euclidien de dimension 4 peut s'écrire sous la forme T(u1,u2): qu1·q·u2* (où q parcourt les quaternions, vus comme un espace euclidien de dimension 4), avec u1 et u2 deux quaternions imaginaires purs de module 1 ; de plus, u1 et u2 sont déterminés de façon unique à un signe commun près. Ceci permet d'identifier le groupe Spin4 à celui des couples de quaternions imaginaires purs de module 1 (la multiplication se faisant composante par composante).
  • Toute rotation de l'espace euclidien de dimension 3 peut s'écrire sous la forme Tu: qu·q·u*, où q parcourt les quaternions imaginaires purs, vus comme un espace euclidien de dimension 3, avec u un quaternion imaginaire pur de module 1 ; de plus, u est déterminé de façon unique au signe près. Ceci permet d'identifier le groupe Spin3 à celui des quaternions imaginaires purs de module 1.

Ceci suggère un certain nombre de questions ou d'observations. Par exemple, peut-on identifier directement les deux facteurs Spin3 à l'intérieur de Spin4 ? Ce sont essentiellement les rotations définies par deux angles égaux ou opposés pour une certaine orientation des axes de la rotation. On peut aussi remarquer qu'on a défini une façon de faire agir (un élément u de) Spin3 sur un espace de dimension 4, à savoir la multiplication à gauche qu·q par le quaternion u de module 1 sur l'ensemble des quaternions (ou par la multiplication à droite par son conjugué, mais via la conjugaison, justement, ces deux actions sont équivalentes) : il s'agit là de la représentation de spin de Spin3 (et les quaternions q sur lesquels il agit peuvent s'appeler spineurs : on remarquera que faire subir un tour complet, u=−1, à un spineur transforme celui-ci en son opposé !). Pour ce qui est de l'action de Spin4, les représentations de spin des deux copies de Spin3 qui le constituent s'appellent les représentations de demi-spin.

L'application Tu:qu·q·u* peut aussi être vue comme l'automorphisme intérieur défini par le quaternion u de module 1 (multiplication à gauche par lui et à droite par son inverse) : il est évident qu'on a Tu(q+q′) = Tu(q)+Tu(q′) et aussi Tu(q·q′) = Tu(q)·Tu(q′), c'est-à-dire que Tu définit bien un automorphisme du corps-gauche des quaternions (=une bijection préservant à la fois l'addition et la multiplication). Mais réciproquement, il est facile de se convaincre que tout ℝ-automorphisme des quaternions (c'est-à-dire, une bijection ℝ-linéaire préservant la multiplication) doit être une rotation préservant le quaternion 1, donc doit être de cette forme, et il s'avère que tout automorphisme est nécessairement un ℝ-automorphisme. C'est-à-dire que le groupe des automorphismes des quaternions est précisément le groupe SO3 des rotations en trois dimensions (opérant sur la partie imaginaire pure, ou sur la sphère unité de celle-ci), et ce sont tous des automorphismes intérieurs.

Remarquons que contrairement aux nombres complexes, pour lesquels la conjugaison est un automorphisme de corps, ce n'est pas le cas pour les quaternions, parce qu'elle inverse le sens de la multiplication (qui est maintenant important) : il n'y a donc que les rotations et non les réflexions qui constituent des automorphismes des quaternions.

Cette description des automorphismes nous permet de voir de nouveau que le choix des unités i,j,k était arbitraire : n'importe quels trois vecteurs formant une base orthonormée ayant la bonne orientation pouvaient convenir (pour le dire autrement, si je veux former un automorphisme des quaternions, je choisis l'image de i arbitrairement dans les quaternions imaginaires purs de module 1, puis l'image de j arbitrairement dans les quaternions imaginaires purs de module 1 orthogonaux au précédent, et l'image de k est bien sûr alors déterminée par le produit, ou si on veut le produit vectoriel, des deux précédents ; et c'est bien de la même manière qu'on fabrique une rotation en dimension 3).

Octonions

Définition et premières propriétés

Pour passer des nombres complexes aux quaternions, on abandonnait une propriété, la commutativité de la multiplication. Pour passer aux octonions, on en abandonne une autre, l'associativité : le coût serait totalement exorbitant si on n'en préservait pas au moins une forme faible. Cette version affaiblie de l'associativité s'appelle l'alternativité, qui peut s'exprimer par deux quelconques des trois propriétés suivantes (la troisième étant alors automatique) : x·(x·y)=(x·xy, x·(y·x)=(x·yx et y·(x·x)=(y·xx. Grâce à l'addition, l'alternativité peut aussi s'exprimer comme le fait que l'associateur {x,y,z} := (x·yzx·(y·z) (qui serait identiquement nul dans une algèbre associative) est totalement antisymétrique en x,y,z.

Au prix de manipulations algébriques pas franchement évidentes, on peut déduire de cette propriété d'alternativité des identités apparemment un peu plus fortes, dites identités de Moufang (du nom de la mathématicienne allemande Ruth Moufang), et qui seraient la bonne hypothèse à prendre (pour affaiblir l'associativité) si on n'avait qu'une multiplication sous la main : x·(y·(x·z))=(x·y·xz, (x·y)·(z·x)=x·(y·zx et ((y·xzx=y·(x·z·x).

Une autre version faible de l'associativité vérifiée par les octonions sera le fait (démontré par Artin dans toute algèbre-alternative) que deux octonions quelconques engendrent toujours une algèbre associative (autrement dit, dans toute expression faisant intervenir au plus deux quantités, on peut applique l'associativité) ; en fait, deux octonions engendreront toujours une algèbre isomorphe aux réels, aux complexes ou en général aux quaternions. Par ailleurs, il va de soi que les nombres réels s'associent avec n'importe quoi puisque la multiplication des octonions est ℝ-bilinéaire.

D'autre part, dans les octonions, on aura toujours l'existence d'inverses : pour chaque octonion x≠0 il existe un (unique) octonion x′ tel que x·x′=1 et x′·x=1, et on peut montrer qu'on a alors (y·xx′=y pour tout octonion y et x′·(x·y)=y, ce qui rend ces inverses pas totalement inutiles. Et on disposera toujours d'un module(-au-carré) avec N(x1·x2)=N(x1)·N(x2).

Passons maintenant à la définition. On va utiliser une base formée de huit éléments : contrairement aux quaternions pour lesquels Hamilton a fixé la notation une fois pour toutes (dans la pierre, comme je l'ai expliqué), les conventions pour les octonions sont assez divergentes, comme je l'expliquerai plus bas. Pour ce texte, je vais noter i, j, k, , i·, j·, k· les sept unités imaginaires pures : les choses à retenir sont que i, j, k se comportent comme les quaternions (et on les identifiera aux unités de même nom des quaternions), mais aussi n'importe lequel des trois avec (par exemple, ·i = −i· et ·(i·) = i sur le modèle de j·i = −i·j et j·(i·j) = i), et enfin que trois unités qui n'appartiennent pas à une même algèbre de quaternions s'anti-associent toujours, par exemple i·(j·) = −(i·j = −k·. Ceci donne la table de multiplication suivante :

×1ijki·j·k·
11ijki·j·k·
ii−1kji·k·j·
jjk−1ij·k·i·
kkji−1k·j·i·
i·j·k·−1ijk
i·i·k·j·i−1kj
j·j·k·i·jk−1i
k·k·j·i·kji−1

On vérifie différentes choses concernant les signes dans cette table de multiplication (le signe est ce qui est le plus intéressant) : elle est antisymétrique si on excepte évidemment la diagonale et la ligne et la colonne des 1 ; et deux lignes quelconques ont des signes qui coïncident sur quatre colonnes et qui diffèrent sur les quatre autres (et de façon symétrique entre lignes et colonnes, bien sûr).

Une autre construction fréquemment invoquée pour fabriquer les octonions est le doublement de Cayley-Dickson : il consiste à définir un octonion comme une paire [q,r] de quaternions (qui représente en fait q+r· dans la notation ci-dessus), avec le produit [q,r] · [q′,r′] = [(q·q′−r*·r), (r′·q+r·q*)] et la conjugaison [q,r]* = [q*,−r]. L'intérêt de cette construction est que ces mêmes formules permettent de définir les complexes à partir des réels, les quaternions à partir des complexes, et les octonions à partir des quaternions. Mais ce côté systématique est trompeur, et je n'en suis pas fan, au moins sous cette formulation : impossible de mémoriser dans quel ordre on met les facteurs et où on met les conjugaisons (est-ce r·q*, r·q′, r*·q′, q*·r ? et comment retenir ça ?) : j'ai retrouvé la formule ci-dessus à partir de la table de multiplication que j'ai écrite et pas le contraire (chaque facteur en détermine un quadrant, il faut péniblement trouver le bon ordre des facteurs et les conjugaisons à mettre pour avoir exactement les signes du quadrant).

Cependant, la construction de Cayley-Dickson est encore équivalente aux formules suivantes, où q,q′,r,r′ désignent des quaternions : (1) q·(r′·) = (r′·q, (2) (r·q′ = (r·q* et (3) (r·)·(r′·) = −r*·r. (Une façon de les retenir est de savoir que, si w est un quaternion de module 1, alors on définit un automorphisme des octonions — j'en reparlerai plus tard — en envoyant q sur q, c'est-à-dire en fixant les quaternions, et en envoyant r· sur (w·r : cette multiplication se fait par w à gauche justement à cause de la non associativité, et alors cela contraint fortement les formules (1), (2) et (3) si bien qu'on se trompe difficilement.)

Comme je l'ai déjà expliqué, on obtient ainsi une algèbre-alternative (le trait d'union entre algèbre et alternative étant là pour rappeler qu'une algèbre-alternative n'est pas une algèbre [associative]), c'est-à-dire qu'on a les propriétés suivantes : existence d'un 0 neutre pour l'addition, associativité et commutativité de l'addition, existence d'opposés pour celle-ci, distributivité de la multiplication sur l'addition et linéarité par rapport aux réels, existence d'un 1 neutre pour la multiplication, et la version faible de l'associativité de la multiplication qui s'exprime par les lois alternatives ou les identités de Moufang. Avec en plus l'existence d'inverses des octonions non nuls, on parlera d'algèbre-alternative à divisions. Le module-au-carré N(x) d'un octonion x se définit comme le produit de x avec son conjugué x* qui s'obtient en changeant le signe devant chacune des sept unités imaginaires pures i, j, k, , i·, j·, k·, et ce N(x) est un nombre réel, et on a N(x1·x2)=N(x1)·N(x2), ce qui permet de calculer l'inverse de x comme x*/N(x).

On peut décider de voir un octonion, comme un quaternion, comme la donnée d'une partie réelle a et d'une partie (imaginaire) vectorielle v, mais celle-ci a maintenant 7 dimensions. Si on demande que la formule de produit des octonions s'écrive [a,v] · [a′,v′] = [(a·a′−v·v′), (a·v′+a′·v+v×v′)] comme pour les quaternions, ceci définit un nouveau produit vectoriel v×v′ entre vecteurs en dimension 7 correspondant à la partie imaginaire de la multiplication d'octonions imaginaires purs. Comme son analogue en dimension 3, il a les propriétés d'être linéaire en chaque variable, d'être orthogonal à ses deux arguments, et d'avoir pour norme le produit des normes fois le sinus de l'angle entre les vecteurs ; une telle application n'existe qu'en dimension (1 trivialement,) 3 et 7. Mais ce produit vectoriel en dimension 7, contrairement à celui en dimension 3, n'est pas invariant par toutes les rotations, il ne l'est que par celles qui appartiennent au groupe G2 des automorphismes des octonions, dont je vais parler plus loin.

On verra bien sûr les octonions comme un espace euclidien de dimension 8 : en particulier, quand on dit que deux octonions sont orthogonaux entre eux, cela signifie qu'ils le sont pour cette structure (et cela revient à dire que le produit de l'un par le conjugué de l'autre, dans n'importe quel ordre, est imaginaire pur). C'est le cas de 1 et des sept unités imaginaires pures i, j, k, , i·, j·, k·. Notons que le produit scalaire euclidien entre deux octonions x et x′ est donné par la partie réelle de x·x* (cette partie réelle étant symétrique entre x et x′).

Sous-algèbres des octonions

J'ai signalé à propos des quaternions que n'importe quel quaternion u purement imaginaire de module 1 vérifie u²=−1, et réciproquement, et qu'alors les quaternions de la forme a+b·u forment une algèbre isomorphe au corps des nombres complexes (on peut la noter ℝ ⊕ ℝu) ; et par ailleurs que tout quaternion non réel appartient à une et une seule algèbre de cette sorte. Exactement la même chose vaut encore pour les octonions : donc on comprend assez bien comment fonctionnent les algèbres de nombres complexes dans les octonions (il y en a une pour chaque u imaginaire pur de module 1, c'est-à-dire pour chaque point de la 6-sphère, le u étant alors déterminé au signe près).

Qu'en est-il des algèbres de quaternions dans les octonions ? (C'est-à-dire les sous-algèbres des octonions qui sont isomorphes à l'algèbre des quaternions — en fait, il suffit pour une sous-algèbre des octonions d'être de dimension 4 pour être automatiquement isomorphe à celle des quaternions.) C'est le cas évidemment de l'algèbre ℍ = ℝ ⊕ ℝi ⊕ ℝj ⊕ ℝk des quaternions, mais c'est aussi le cas par exemple de ℝ ⊕ ℝi ⊕ ℝ ⊕ ℝi·, ou en fait de ℝ ⊕ ℝu ⊕ ℝ ⊕ ℝu· pour tout quaternion u imaginaire pur de module 1. En fait, si u et v sont deux octonions imaginaires purs de module 1 orthogonaux quelconques, alors w=u·v est encore imaginaire pur et orthogonal à eux, et on a u² = v² = w² = u·v·w = −1 (la relation d'Hamilton !), de sorte que ℝ ⊕ ℝu ⊕ ℝv ⊕ ℝw forment une algèbre de quaternion dans les octonions — et elles s'obtiennent évidemment toutes de la sorte. Et si on prend deux octonions, on se convainc assez facilement qu'ils appartiennent toujours à une et, s'ils ne commutent pas entre eux, une seule algèbre de quaternions (celle qu'ils engendrent) : donc les calculs faisant intervenir deux octonions sont simplement des calculs quaternioniques (de même que les calculs n'en faisant intervenir qu'un sont des calculs sur les nombres complexes).

Une sous-algèbre des octonions (c'est-à-dire un sous-espace vectoriel des octonions qui soit stable par multiplication) ne peut être que de quatre sortes : (0) la droite réelle (qui est unique), (1) une algèbre de nombres complexes ℝ ⊕ ℝu (avec u octonion imaginaire pur de module 1, qui est alors déterminé au signe près), (2) une algèbre de quaternions ℝ ⊕ ℝu ⊕ ℝv ⊕ ℝw (avec u et v imaginaires purs de module 1 orthogonaux et w=u·v, ces trois éléments pouvant être choisis comme une base orthonormée directe quelconque de la sphère imaginaire pure de l'algèbre de quaternions en question), ou enfin (3) l'algèbre de tous les octonions (elle aussi unique). Le premier et le dernier cas ((0) et (3)) sont uniques ; les algèbres de complexes (cas (1)) sont en correspondance avec la sphère unité de dimension 6 (la sphère des octonions u imaginaires purs de module 1) modulo antipodie, ce qu'on appelle l'espace projectif réel de dimension 6 ; les algèbres de quaternions dans les octonions (cas (2)) forment un espace de dimension 8 (explication intuitive : il y a 6 dimensions impliquées dans le choix de u, puis 5 dans le choix de v qui doit lui être orthogonal, ce qui fait 11 au total, mais ceci définit une algèbre donnée avec une redondance de dimension 3 correspondant au choix d'une base orthonormée directe (u,v,w) sur la 2-sphère). Cet espace de dimension 8 (l'espace des algèbres de quaternions dans les octonions) possède d'ailleurs des propriétés géométriques intéressantes (c'est l'espace riemannien symétrique G2/(SO3×Spin3)), et il faudra que j'en reparle.

Notons que deux algèbres de quaternions distinctes dans les octonions peuvent s'intersecter soit selon une algèbre de complexes (c'est-à-dire qu'elles ont en commun un u non réel, qu'on peut supposer imaginaire pur de module 1) soit seulement sur l'axe réel. Si on fixe une des deux algèbres, le premier cas se produit pour un espace de dimension 6.

Une remarque sur les différentes conventions de nommage des octonions

(Cette partie, dont le seul but est de faire le lien entre les différentes façons de nommer les unités imaginaires des octonions, peut être ignorée complètement. Elle est là simplement pour justifier le choix que j'ai fait et le relier avec les autres choix qu'on peut trouver dans la littérature.)

La convention que j'ai choisie, consistant à nommer les sept unités imaginaires i, j, k, , i·, j·, k·, a un lien fort avec le doublement de Cayley-Dickson, comme on l'a vu (puisque celle-ci consiste à exprimer les octonions sous la forme q+r·, avec q et r deux quaternions). Elle a l'inconvénient que trois des sept unités ont un nom en plusieurs lettres, ce qui suggère faussement qu'elles ne seraient pas de même nature que les autres. Elle a aussi l'inconvénient de suggérer faussement que k et joueraient le même rôle par rapport à i et j, ce qui n'est pas le cas. Elle a cependant des avantages indéniables, notamment le fait qu'avec ces noms, tous les mathématiciens seront d'accord sur la table de multiplication des unités des octonions (présentée ci-dessus) puisque i, j, k sont manifestement les quaternions de ce nom, sur la multiplication desquels il n'y a aucun doute, et peut alors être n'importe quelle unité orthogonale aux quaternions. Cette convention de nommage laisse donc clairement apparaître comment les quaternions se retrouvent dans les octonions. Je trouve enfin qu'il est plus facile de faire des calculs mentaux avec cette convention qu'avec les autres.

Conway et Baez, eux, utilisent une convention qui est assez astucieuse (normal, de la part de Conway !) : les unités sont numérotées de 0 à 6 (ou de 1 à 7 chez Baez). Pour la définir, on pose e1·e2=e4 et on impose que cette égalité subsiste après n'importe quelle combinaison de doublement ou de translation des indices modulo 7 (ceci étant d'ailleurs relié à l'isomorphisme exceptionnel entre PSL2(𝔽7) et PSL3(𝔽2)). Toute astucieuse et élégante qu'est cette convention, qui fait apparaître le plan de Fano « orienté », elle comporte une certaine ambiguïté notamment parce qu'il est possible d'orienter différemment le plan de Fano (voir cependant l'article de Bruno Sévennec mentionné dans l'introduction pour une façon de démêler les choses). Elle est reliée à celle que j'utilise en posant par exemple e1=i, e2=j, e3=−i·, e4=k, e5=−k·, e6=−j· et e7= (il me semble qu'il n'est pas possible d'éviter des signes à cause de cette histoire d'orientation). Noter que e0 est un synonyme de e7 (Conway utilise i0, Baez utilise e7 pour ne pas laisser penser que c'est 1).

La convention utilisée à l'origine par Cayley (l'article se trouve à la page 127 du volume 1 de ses œuvres complètes [page 149 du DjVu sur archive.org]) utilise e1·e2=e3, e1·e4=e5, e2·e4=e6 et e3·e4=e7 (penser à l'écriture binaire, mais attention, des signes peuvent apparaître, par exemple e1·e6=−e7). Elle est reliée à celle que j'utilise en posant naturellement e1=i, e2=j, e3=k, e4=, e5=i·, e6=j· et e7=k· (quant à e0, s'il existe, c'est juste le réel 1, neutre multiplicatif des octonions) : c'est donc essentiellement la même chose, mais avec une notation plus ambiguë et qui risque de prêter à confusion avec celle évoquée ci-dessus. C'est aussi cette convention qui a été prise par Bourbaki (qui construit les octonions par le procédé de Cayley-Dickson).

Hans Freudenthal, pour sa part (au moins dans l'article mentionné dans l'introduction), utilise une convention qui diffère par les signes, e1=i, e2=j, e3=−k, e4=, e5=i·, e6=−j· et e7=−k·.

Je n'ai pas réussi à trouver quelle convention utilisait Graves.

Octonions et rotations

Octonions de module 1, multiplications à gauche et à droite

La sphère unité des octonions, c'est-à-dire l'ensemble des octonions de module 1, est encore stable par multiplication (puisque le module des octonions est multiplicatif), et admet l'existence d'inverses. Mais contrairement à ce qui se passait dans le cas des quaternions (où je rappelle qu'on avait identifié la sphère unité au groupe Spin3 qui double le groupe des rotations en trois dimensions), l'absence d'associativité fait qu'on n'a pas affaire à un groupe, seulement à une boucle de Moufang. Le rapport avec les rotations en huit ou sept dimensions va être plus délicat à décrire que dans le cas des quaternions. Je commence par regarder ce qu'on peut dire des multiplications à gauche et à droite par un octonion de module 1.

Si u est un octonion de module 1, la multiplication à gauche par u, c'est-à-dire l'application xu·x (sur les octonions x) est une rotation (puisque le module de u·x est égal au module de x) : appelons-la Lu. Là où la non-associativité des octonions a une conséquence horrible, c'est que L n'est pas un morphisme, c'est-à-dire que Lu∘Lu ne coïncide généralement pas avec Lu·u, puisque Lu∘Lu est l'application xu·(u′·x) tandis que Lu·u est x↦(u·u′)·x. Notons quand même que Lu* est l'inverse de Lu.

On va aussi définir la multiplication à droite Ru:xx·u (cette fois, pas la peine de se fatiguer à remplacer u par u* vu que de toute façon on ne va pas avoir un morphisme, et il y a au contraire des raisons de laisser u comme on va le voir). Et on peut aussi définir la bimultiplication Bu:xu*·x·u* (grâce aux lois d'alternativité, cette expression a bien un sens sans parenthèses) ; la raison pour laquelle j'ai utilisé u* et pas u est l'identité Lu∘Ru∘Bu=Id et de même pour n'importe quelle permutation des lettres L,R,B. Toutes ces applications Lu, Ru et Bu définissent des rotations en huit dimensions, ainsi que n'importe quelle composée de ces choses-là. La situation est un peu confuse : peut-on y voir plus clair ?

Chacun de Lu, Ru ou Bu, quand u parcourt la 7-sphère des octonions de module 1, ne peut pas donner toutes les rotations en 8 dimensions, puisque ce groupe (SO8) est de dimension 28, ce qui est strictement plus grand que 7. Mais en composant plusieurs de ces applications, même lorsqu'elles sont du même type L/R/B (à cause de l'absence d'associativité), on peut obtenir de nouvelles rotations. Peut-on tout obtenir de cette façon-ci ? La réponse est oui en raison du

Théorème : toute rotation en 8 dimensions s'obtient comme composée d'au plus 7 applications de la forme Lu, et la même chose vaut pour Ru ou pour Bu (de plus, le nombre 7 est optimal dans cet énoncé).

(En fait, pour les Bu, ce théorème est la conséquence du fait plus classique que toute rotation en huit dimensions peut s'écrire comme composée d'au plus huit réflexions, où de plus on peut imposer l'une de ces réflexions. En effet, Bu s'obtient en effectuant d'abord la réflexion qui transforme u en son opposé (réflexion par rapport à l'hyperplan orthogonal à u, donc, et qui s'écrit x↦−u·x*·u) puis celle qui transforme 1 en son opposé, soit x↦−x*. Pour l'énoncé sur les L et les R, le mieux est d'utiliser la trialité que je vais introduire juste après — ma présentation ne se fait pas tout à fait dans l'ordre logique.)

Malheureusement, il n'y a aucune sorte d'unicité dans l'histoire (ne serait-ce que pour des raisons de dimension : la composée de 7 applications Lu donne 7×7=49 degrés de liberté, alors que SO7 en a seulement 28.)

Isotypies et trialité

La trialité est un phénomène mathématique profond en rapport avec les octonions, et qui justifie pour beaucoup leur importance. Je commence par revenir un peu sur les quaternions pour motiver les définitions qui vont suivre.

Rappelons que pour les quaternions, dès qu'une rotation (des quaternions, i.e., de quatre dimensions) fixe l'élément 1, donc définit une rotation des quaternions imaginaires purs, elle préserve en fait la multiplication des quaternions ; et on a vu que ces rotations s'écrivent de la forme Tu:qu·q·u* (automorphisme intérieur défini par u) avec u de module 1 (qui est uniquement déterminé au signe près).

Les rotations plus générales des quaternions s'écrivent, elles, sous la forme T(u1,u2):qu1·q·u2* (avec u1,u2 de module 1). Ceci donne envie de se demander quel est le rapport entre une rotation U = T(u1,u2) et la rotation V = T(u2,u1) qui s'obtient en échangeant les deux paramètres u1 et u2, appelons-la son « amie » (je ne connais pas de terminologie standard, alors je prends un mot au hasard) : il est facile de voir que V(q)=(U(q*))*. On peut aussi reformuler ça de la façon suivante : cette relation d'« amitié » entre U et V est satisfaite si et seulement si la relation x·y=1 (avec x,y deux quaternions) implique U(xV(y)=1. Chaque élément U de SO4 ou de Spin4 a un unique élément « ami » V, et il est son propre « ami » si et seulement si U est, en fait, un automorphisme de ℍ (i.e., il préserve 1) ; et bien sûr l'« amitié » est un morphisme (i.e., l'« ami » de U₁∘U₂ est V₁∘V₂ si V₁ est l'ami de U₁ et V₂ celui de U₂). Cette description peut sembler un peu bizarre ou bizarrement compliquée, mais elle a l'avantage de montrer la voie vers les isotypies des octonions et la trialité.

On dit que trois rotations U,V,W des octonions (c'est-à-dire juste des rotations de l'espace euclidien à huit dimensions) forment une isotypie lorsque, quels que soient les octonions x,y,z vérifiant la relation x·y·z=1 (cette relation a bien un sens car si elle est satisfaite avec un parenthésage elle l'est aussi avec l'autre), on a aussi U(xV(yW(z)=1 (i.e., la même relation après application des trois rotations aux trois octonions). Cette définition peut paraître un peu opaque, mais je vais essayer d'expliquer pourquoi elle est raisonnable.

On définit de plus la composition des isotypies : si (U₁,V₁,W₁) et (U₂,V₂,W₂) sont deux isotypies, alors les trois rotations (U₁∘U₂, V₁∘V₂, W₁∘W₂) obtenues par composition des trois rotations de l'une et de l'autre isotypie forment elles-mêmes une isotypie (c'est facile à vérifier), qu'on appelle fort logiquement isotypie composée de (U₁,V₁,W₁) et (U₂,V₂,W₂). Il en va de même pour la réciproque, et les isotypies forment donc un groupe (qui sera, comme je vais le dire dans un instant, le groupe Spin8).

Un résultat qui n'est pas très difficile, mais qui est tout à fait remarquable, est le suivant :

Théorème : pour toute rotation U, il existe des rotations V et W telles que (U,V,W) forment une isotypie et, de plus, V et W sont uniques à un signe près commun sur V et W (il existe donc exactement deux isotypies commençant par U). Ou, pour dire les choses de façon un peu plus précise : le groupe des isotypies (U,V,W) des octonions (où la multiplication sur les triplets est la composition terme à terme, cf. ci-dessous) est le groupe Spin8 (le groupe qui double le groupe SO8 des rotations en 8 dimensions), en identifiant le morphisme envoyant l'isotypie (U,V,W) sur U avec le morphisme naturel (revêtement double) Spin8 → SO8.

J'ai pris U comme point de référence dans l'énoncé ci-dessus, mais en fait, U, V et W jouent des rôles complètement symétriques, et on peut les permuter arbitrairement. Ce phénomène s'appelle la trialité. Plus exactement, la trialité est le morphisme envoyant l'isotypie (U,V,W) sur (V,W,U) (permutation circulaire des trois variables), qui peut donc se voir comme un morphisme Spin8 → Spin8. (De façon plus informelle, la trialité envoie U sur V puis sur W : ceci n'a de sens qu'à signe près, c'est-à-dire si on ignore la différence entre Spin8 et SO8, mais c'est sans doute l'imagine intuitive qu'il faut en garder.)

Maintenant, si on a x·y·z=1, et si u est un octonion de module 1, il est assez facile en utilisant les lois de Moufang de voir que (u·x)·(y·u)·(u*·z·u*)=1, c'est-à-dire que Lu(x)·Ru(y)·Bu(z)=1. Ceci prouve que (Lu,Ru,Bu) forme une isotypie. On peut donc affirmer que :

Proposition : la trialité permute cycliquement Lu, Ru et Bu ; notamment, les images V et W d'une rotation U (en huit dimensions) par la trialité s'obtiennent en choisissant une écriture quelconque de U comme composée de différentes applications Lu et en remplaçant celles-ci par Ru pour V ou bien Bu pour W.

Techniquement, ceci n'a de sens qu'au signe près (puisque la trialité est définie sur les isotypies, et qu'une isotypie n'est définie par une rotation qu'au signe près), mais on se débarrasse des problèmes de signes en voyant Lu, Ru et Bu comme des éléments de Spin8 justement en identifiant Lu à l'isotypie (Lu,Ru,Bu) vue comme un élément de Spin8.

Un point de vue différent est le suivant : on fixe Spin8 avec son action usuelle (celle de SO8) sur les octonions, et on regarde la trialité comme définissant deux autres actions. Ces actions sont alors précisément les représentations de demi-spin. C'est-à-dire que, par exemple, la rotation Bu:xu*·x·u* opère sur les deux représentations de demi-spin soit par multiplication Lu à gauche par u soit par multiplication à droite Ru. La trialité est alors le phénomène que ces espaces de demi-spineurs coïncident, en tant que représentations de Spin8, avec la représentation usuelle, et on les a tous identifiés aux octonions.

Exercice : Si U est la rotation qui échange 1,i,j,k avec respectivement ,i·,j·,k·, montrer que les images V et W de U par trialité sont (à un signe commun près) : celle V qui change le signe de i,j,k, (sans toucher à 1,i·,j·,k·), et celle W qui s'obtient en appliquant U et en changeant le signe de 1 et (sans toucher aux autres). On peut le faire, par exemple, en écrivant U=Bi∘Bj∘Bk∘R.

Automorphismes des octonions : le groupe G2

Rotations, trialités et automorphismes

Un automorphisme d'une ℝ-algèbre-alternative est une application ℝ-linéaire g bijective qui préserve la multiplication (c'est-à-dire que l'image d'un produit s'envoie sur le produit des images : g(x·y)=g(xg(y) ; on vérifie alors facilement que g(1)=1). En principe il faudrait distinguer les automorphismes de ℝ-algèbre (ou ℝ-automorphismes) des automorphismes d'anneau-alternatif (qui préservent l'addition et la multiplication, mais pas forcément les réels), mais pour les octonions comme pour les quaternions, ces deux notions coïncident : on a automatiquement g(t)=t pour tout réel t.

Un tel automorphisme g des quaternions ou des octonions doit respecter la conjugaison, c'est-à-dire que g(x*) doit être égal à g(x)* (en effet, x·x* vaut le réel N(x), envoyé sur lui-même par g), donc aussi la partie réelle ½(x+x*). Comme le produit scalaire (euclidien) entre deux quaternions ou octonions x et y est donné par la partie réelle de x·y*, l'automorphisme préserve le produit scalaire. Il s'agit donc d'une isométrie euclidienne sur la partie imaginaire des quaternions ou octonions. Il n'est pas difficile de se convaincre que l'orientation doit être préservée, donc il s'agit en fait d'une rotation.

Dans le cas des quaternions, je l'ai déjà expliqué, c'est la seule condition : la réciproque est vraie, toute rotation de la partie imaginaire des quaternions détermine un automorphisme des quaternions (forcément intérieur, c'est-à-dire de la forme xu·x·u*). Ou, si on préfère, la seule condition sur une rotation U de ℍ (vu comme espace euclidien) tout entier pour être un automorphisme des quaternions, c'est d'envoyer 1 sur 1. Cela revient aussi à dire que la rotation U en question est égale à sa propre « amie » (qui a été définie comme l'unique rotation V telle que la relation x·y=1 avec x,y deux quaternions implique U(xV(y)=1).

Puisque les octonions ne sont pas associatifs, on ne peut pas en définir des automorphismes par la formule xu·x·u*. Mais compte tenu de ce qui a déjà été dit, il n'est pas très difficile de montrer la :

Proposition : Si dans une isotypie (U,V,W), deux des trois rotations U,V,W fixent l'octonion 1, alors la troisième le fixe aussi, et c'est le cas si et seulement si on a U=V=W. Les rotations en question (i.e., les U telles que (U,U,U) soit une isotypie) sont précisément les automorphismes des octonions.

Le groupe en question (des rotations U qui préservent le produit octonionique) est noté G2 (si on veut être plus précis dans la terminologie, il s'agit ici de la forme « réelle compacte » de G2).

Si on veut, il s'agit des rotations en sept dimensions qui préservent le produit vectoriel défini par la partie imaginaire du produit de deux octonions imaginaires purs.

Pour essayer de comprendre un peu mieux ce groupe G2, on peut essayer d'imaginer comment on en fabrique un élément (par exemple s'il s'agit d'en tirer un au hasard). D'abord, regardons comment on fabrique un élément du groupe SO8 des rotations en huit dimensions : cela revient simplement à choisir les images de 1,i,j,k,,i·,j·,k·, chacune devant être de module 1 et chacune orthogonale à toutes les précédentes (avec en plus une contrainte d'orientation sur le dernier élément, mais peu importe) ; donc, choisir un élément g de SO8 revient à choisir g(1) dans la 7-sphère des octonions de module 1, puis g(i) dans la 6-sphère des octonions de module 1 orthogonaux au choix précédent, et ainsi de suite (et, d'ailleurs, si on veut choisir g au hasard uniformément dans tout le groupe SO8, il suffit de faire chacun de ces choix uniformément sur la sphère) ; ceci permet par exemple de se convaincre facilement que la dimension de SO8 (ou Spin8) vaut 7+6+5+4+3+2+1+0 = 28. De même, SO7 (ou Spin7), qu'on peut voir comme les rotations des octonions fixant 1, est de dimension 6+5+4+3+2+1+0 = 21.

Maintenant mettons que je veuille construire un élément g de G2 de la même manière. Pour ce qui est de g(1), je n'ai pas le choix, c'est forcément 1. L'image de i, en revanche, est quelconque avec les seules contraintes d'être de module 1 et imaginaire pur (=orthogonale à 1), ce qui laisse 6 degrés de liberté. L'image de j a pour contraintes d'être de module 1 et orthogonale à 1 et à l'image de i, ce qui laisse 5 degrés de liberté. L'image de k est alors complètement définie en tant le produit des images de i et j : i.e., g(k) = g(ig(j). Ensuite, l'image de a pour seules contraintes d'être de module 1 et orthogonale à toute l'algèbre de quaternions définie par les images précédemment définies, ce qui laisse 3 degrés de liberté. Enfin, les images de i·,j·,k· sont alors complètement définies comme des produits. Il n'y a pas d'autres contraintes que celles que j'ai décrites, car elles garantissent que les images des différentes unités vérifieront toutes les relations par lesquelles j'ai défini la table de multiplication des octonions (i.e., deux unités anticommutent toujours, et trois qui ne sont pas reliées par un produit s'antiassocient). On a donc 6+5+3=14 degrés de liberté au total, et G2 est de dimension 14.

Voici encore une façon de voir les choses : le groupe Spin8 des isotypies (U,V,W) est de dimension 28 ; si on impose à un quelconque parmi U,V,W d'envoyer 1 sur 1, on obtient un groupe Spin7 de dimension 21, c'est-à-dire, si l'on veut, qu'on ajoute 7 contraintes (l'image de 1 sur la 7-sphère) : si on ajoute une nouvelle contrainte identique sur un autre parmi U,V,W, on a automatiquement U=V=W dans le groupe G2 de dimension 14, avec pleinement 7 contraintes supplémentaires.

Pour dire les choses de façon encore un petit peu différente : à l'intérieur du groupe Spin8 (de dimension 28) doublant les rotations de l'espace euclidien de dimension 8, on a trois copies du groupe Spin7 (de dimension 21) : celui donné par les rotations qui préservent l'octonion 1, et les deux images de celui-ci par la trialité ; l'intersection de deux quelconques parmi les trois exemplaires de Spin7 donne le groupe G2 (de dimension 14) des automorphismes des octonions.

Quelques automorphismes explicites des octonions

La description que j'ai faite ci-dessus du groupe G2 des automorphismes des octonions (les rotations telles que les trois membres de l'isotypie soient tous égaux) est certes mathématiquement élégante, mais elle n'est pas très parlante. Essayons de décrire les choses de façon plus parlante, ou en tout cas plus explicite.

Ce qu'il est facile de comprendre assez complètement, ce sont les automorphismes de l'algèbre 𝕆 des octonions qui laissent stable la sous-algèbre ℍ = ℝ ⊕ ℝi ⊕ ℝj ⊕ ℝk des quaternions. En particulier, un tel automorphisme doit définir un automorphisme des quaternions, donc sa restriction à eux doit être de la forme qu·q·u*u est un quaternion de module 1 ; il reste ensuite à décider de l'image des octonions orthogonaux aux quaternions, c'est-à-dire ceux qui appartiennent à ℝ ⊕ ℝi· ⊕ ℝj· ⊕ ℝk· : manifestement, l'image d'un tel octonion r· doit encore être de la même forme. Or si on appelle w le quaternion de module 1 (manifestement unique et bien défini) tel que l'image de par l'automorphisme vaille (w·u*, alors il est facile de calculer que l'automorphisme prend la forme r· ↦ (w·r·u* sur les octonions orthogonaux aux quaternions ; et réciproquement, toute valeur de u et w dans la sphère unité des quaternions définit, par ces formules, un automorphisme des octonions qui laisse stable l'algèbre des quaternions. Il y a mieux : si on appelle Φ(u,w) cet automorphisme, alors Φ(u1,w1) ∘ Φ(u2,w2) = Φ(u1·u2,w1·w2), c'est-à-dire que Φ définit un morphisme entre le produit de deux copies de la sphère unité Spin3 des quaternions et le groupe G2 des automorphismes des octonions : c'est presque un isomorphisme entre Spin3 × Spin3 et le sous-groupe de G2 formé des automorphismes qui stabilisent les quaternions (presque parce que (−1,−1) s'envoie sur l'identité, c'est un isomorphisme si on quotiente par ce {±1}). En particulier, les isomorphismes des octonions qui fixent les quaternions sont ceux de la forme r· ↦ (w·r pour tout quaternion r, et ils forment un sous-groupe isomorphe à Spin3.

Il s'agit là des automorphismes des octonions qui laissent (globalement) stables les quaternions, mais la bonne nouvelle est que tout automorphisme des octonions stabilise une algèbre de quaternions, et comme par ailleurs on peut toujours amener une algèbre de quaternions quelconque sur l'algèbre de quaternions standard, que tout automorphisme des octonions est conjugué à un tel automorphisme. En fait, à un tel automorphisme où on prendrait, disons, u = exp(i·θ) = cos(θ) + sin(θi, et v = exp(i·λ) = cos(λ) + sin(λi : cet automorphisme fixe (1 et) i, effectue une rotation d'angle 2θ sur le plan ⟨j,k⟩, une rotation d'angle λθ sur le plan ⟨,i·⟩, et une rotation d'angle −λθ sur le plan ⟨k·,j·⟩ (tous ces plans sont orientés par l'ordre dans lequel j'ai donné les vecteurs unitaires les engendrant). Si on choisit d'appeler plutôt α1,α2,α3 les angles 2θ,λθ,−λθ (dont la somme est nulle), on obtient la description suivante :

Description géométrique des automorphismes des octonions : Quel que soit l'automorphisme g des octonions, il existe (1) un octonion imaginaire pur de module 1, appelons-le û, fixé par g, (2) trois octonions imaginaires purs de module 1, disons e1,e2,e3, tels que les huit octonions de module 1 1,û,e1,û·e1,e2,û·e2,û·e3,e3 soient orthogonaux (et mieux, on peut demander que l'application ℝ-linéaire qui envoie 1,i,j,k,,i·,j·,k· respectivement sur ceux-ci soit elle-même un automorphisme des octonions), et (3) trois angles α1,α2,α3 de somme nulle, tels que g envoie (1 sur 1, û sur û et) eι sur cos(αιeι + sin(αιû·eι pour chacun de ι∈{1,2,3}. De plus, pour n'importe quel choix de û (imaginaire pur de module 1) et de e1,e2,e3 (imaginaires pures de module 1, tous orthogonaux, orthogonaux à û, et orthogonaux à leurs produits avec û) et de trois angles α1,α2,α3 de somme nulle, on obtient bien ainsi un automorphisme des octonions.

Un tel automorphisme fixe donc un « plan complexe » ℝ ⊕ ℝû, et stabilise trois algèbres de quaternions s'intersectant perpendiculairement sur ce plan, à savoir les trois ℝ ⊕ ℝû ⊕ ℝeι ⊕ ℝû·eι.

Qui plus est, cette description est généralement presque unique : un automorphisme assez général des octonions fixe exactement deux octonions imaginaires purs de module 1, on peut les appeler û et −û, et une fois fait le choix de û il n'y a (en général) que trois algèbres de quaternions stabilisées par l'automorphisme, et une fois numérotées ces trois algèbres, les angles α1,α2,α3 sont bien définis (le choix des eι n'est défini qu'à rotation près entre eι et û·eι, avec éventuellement la contrainte supplémentaire e1·e2·e3=−û, mais l'algèbre de quaternions, elle, l'est). Si on change û en −û, ceci transforme les trois angles en leur opposé.

(De la description que je viens de faire, on peut tirer, sans énormément d'effort, une description explicite des racines de G2.)

Pour certains automorphismes bien particuliers, il peut y avoir plus que deux octonions imaginaires purs fixés, auquel cas la description n'est plus aussi unique, mais c'est après tout la même situation que pour les rotations.

Nec plus ultra

En passant des nombres complexes aux quaternions, on a perdu une propriété : la commutativité de la multiplication. En passant des quaternions aux octonions, on en a perdu une autre, l'associativité de la multiplication. En fait, déjà le passage des réels aux complexes perdait une propriété, même si elle n'était pas tout à fait évidente à remarquer, à savoir la trivialité de la conjugaison (il faut considérer tous ces objets comme des algèbres à involution, où la conjugaison fait partie intégrante de la structure algébrique).

On ne peut pas aller plus loin : il existe différents théorèmes plus ou moins fins (Zorn, Hurwitz) garantissant l'unicité des octonions au sens que les seules algèbres de dimension finie sur les réels et qui vérifient différents ensembles de propriétés (par exemple être une algèbre-alternative sans diviseurs de zéro, ou être une algèbre à composition réelle définie) sont une des quatre algèbres évoquées ici : les réels, les complexes, les quaternions ou les octonions.

Mais ces théorèmes supposent bien quelques propriétés sur l'algèbre, et on pourrait toujours espérer qu'en affaiblissant encore les propriétés qu'on demande d'elle il existe une algèbre de dimension 16. Il est difficile de réfuter catégoriquement cette idée : après tout, les algèbres de dimension 16 sur les réels, il en existe certainement, et on pourra toujours avoir la mauvaise foi de prétendre que celle-ci ou celle-là est la généralisation naturelle des octonions et a des propriétés intéressantes. Les variantes autour du théorème de Hurwitz sont à mon avis les plus convaincantes parce qu'elles supposent seulement la multiplicativité du module et pas de propriété du style alternativité sur le produit. Mais une façon sans doute encore plus convaincante de voir qu'il n'y a rien au-delà des octonions passe par certaines conséquences annexes de leur existence et qui ne se prolongent pas au-delà.

Voici un premier exemple, de nature algébrique : on a une identité dite « des deux carrés », (a²+b²)·(a′²+b′²) = (a·a′−b·b′)²+(a·b′+b·a′)², qui montre que, dans n'importe quel anneau commutatif, le produit de deux sommes de deux carrés est encore une somme de deux carrés, cette identité étant simplement celle qui donne le module-au-carré du produit de deux complexes z = a+b·i et z′ = a′+b′·i en fonction des modules-au-carré de ceux-ci ; la même chose appliquée aux quaternions ou aux octonions donne des identités « des quatre carrés » et « des huit carrés » (fastidieuses mais faciles à écrire) ; en revanche on peut montrer qu'il n'existe pas d'« identité des seize carrés » (ni plus, ni pour un nombre qui ne soit pas une puissance de 2) : le produit de deux sommes de seize carrés dans un anneau commutatif n'est pas forcément une somme de seize carrés (et spécifiquement, dans l'anneau des polynômes réels à 32 indéterminées, le produit entre la somme des carrés des 16 premières et la somme des carrés des 16 suivantes n'est pas une somme de 16 carrés). (Bizarrement, il s'avère que sur les corps, il y a bien une identité des 2r carrés pour tout r, mais elle prend une forme bien différente, avec des dénominateurs, et provient de la théorie des formes de Pfister — mais je digresse.)

Voici un second exemple, cette fois de nature topologique, le problème de la parallélisabilité des sphères. On peut le poser de la façon suivante : pour quels n peut-on compléter, de façon continue, tout point de la sphère unité en dimension n (c'est-à-dire la (n−1)-sphère), en une base orthonormée de l'espace (euclidien) de dimension n ? C'est possible pour n valant 1 (trivialement), 2, 4 et 8 en utilisant les algèbres que nous avons vues (par exemple, pour n=8, on complète un octonion de module 1, u, avec ses produits, à gauche ou à droite peu importe, avec les sept unités i, j, k, , i·, j·, k·, ce qui définit bien une base orthonormée) ; et on peut montrer que ce n'est possible pour aucun autre n.

Bref, quelle que soit l'algèbre de dimension 16 (ou pas une puissance de 2, d'ailleurs) qu'on chercherait à construire comme généralisation des octonions, elle devrait être bien peu intéressante puisqu'elle ne pourrait pas conduire à une identité des n carrés ni à la parallélisabilité de la (n−1)-sphère.

Mais je ne veux pas m'étendre outre mesure sur la question de savoir si rien au-delà des octonions n'est intéressant, puisque mon propos est plutôt de savoir si les octonions, eux, le sont (le fait qu'ils permettent d'écrire une identité des 8 carrés ou de paralléliser la 7-sphère incite certainement à le penser).

Alors, les octonions sont-ils intéressants ? (teasing pour la suite)

Le point de départ de cette entrée est supposé être la question de savoir si les octonions sont « intéressants ». Comme le fait d'être intéressant est profondément subjectif (surtout si on s'éloigne du terrain des applications, ce que les octonions, contrairement aux quaternions avec les rotations de l'espace, ne semblent pas avoir), il faudrait peut-être plutôt se demander s'ils sont une construction naturelle.

À vrai dire, je ne pense pas que tout ce que j'ai dit dans cette première entrée consacrée aux octonions permette de conclure sur cette question. Le fait qu'il n'y ait que quatre algèbres-alternatives à divisions de dimension finie sur les réels (à savoir les réels, les complexes, les quaternions et les octonions), ou quatre algèbres-alternatives de composition, incite vaguement à le penser, mais seulement à condition de penser que les algèbres-alternatives sont une structure naturelle, ce qui est un peu une pétition de principe. L'existence d'une identité des n carrés seulement pour n=1,2,4,8 est sans doute un argument plus fort, mais comme je l'ai dit plus haut, la théorie des formes de Pfister montre qu'il existe une certaine forme d'identité des 16 carrés, qui même si elle implique des divisions, diminue quelque peu l'éclat de remarquabilité de l'identité des huit carrés. La parallélisabilité des sphères de dimension seulement 1,3,7 est bien sûr frappante, mais elle me semble plus convaincante pour montrer qu'il ne peut rien y avoir d'intéressant au-delà des octonions que pour montrer que les octonions le sont vraiment (après tout, la topologie est pleine de phénomènes isolés, qui ne signifient pas nécessairement que la dimension où ils se produisent soit spécialement remarquable). La trialité est à mon sens la clé du caractère remarquable de l'existence des octonions, mais encore faut-il expliquer pourquoi la trialité est elle-même intéressante, ce que je n'ai pas vraiment fait.

Ce qui justifie à mon avis vraiment le caractère naturel et intéressant des octonions, c'est qu'ils permettent de construire tous les groupes de Lie exceptionnels. Pour définir les choses de façon extrêmement rapide, superficielle et approximative, un groupe de Lie est un groupe de transformations continues, par exemple le groupe des rotations d'un espace euclidien, ou le groupe spécial linéaire d'un espace vectoriel réel de dimension finie ; la théorie générale montre qu'ils se fabriquent en quelque sorte à partir de briques élémentaires qu'on appelle les groupes de Lie simples — et la classification de ces groupes de Lie simples, due à Wilhelm Killing et Élie Cartan dans les années 1880–1890, fait apparaître quatre séries infinies, notées An (essentiellement le groupe spécial linéaire — ou mieux, le groupe spécial unitaire — en dimension n+1), Bn (essentiellement le groupe spécial orthogonal en dimension 2n+1), Cn (essentiellement le groupe symplectique en dimension 2n, qui peut se définir comme un groupe spécial unitaire sur les quaternions), et Dn (essentiellement le groupe spécial orthogonal en dimension 2n), ainsi que cinq groupes « exceptionnels » notés G2 (qui a été défini ici comme les automorphismes des octonions), F4, E6, E7 et E8. Les groupes de Lie exceptionnels sont des objets naturels parce qu'on les découvre nécessairement en voulant classifier toute forme continue de symétrie, ce qui est un but incontestablement naturel. Or les groupes de Lie exceptionnels peuvent tous être construits, et d'une façon qui évoque celle des groupes de Lie classiques (=non-exceptionnels), à partir des octonions. Non seulement ils peuvent l'être, mais il y a des constructions élégantes qui font apparaître les groupes de Lie exceptionnels F4, E6, E7 et E8 comme les symétries de différentes sortes de « géométries » naturelles qu'on peut définir sur les octonions (et qui font le pendant à des géométries qu'on peut définir sur les réels, complexes et quaternions, pour lesquelles elles donnent normalement des groupes de Lie classiques). Mais je dois parler de tout ça dans une suite de cette entrée, si elle est jamais écrite.

Voici le point que je considère sans doute le plus convaincant. On se pose la question de savoir quels sont les espaces homogènes et isotropes : espace doit se comprendre ici comme une variété riemannienne, mais peu importe au niveau tellement vague où je me place, homogène signifie que tous les points se valent (n'importe quel point peut être amené en n'importe quel autre point par une transformation de la forme qui préserve les distances, i..e, une isométrie) et isotrope signifie qu'en outre toutes les directions se valent à partir de n'importe quel point (n'importe quelle direction peut être amenée en n'importe quelle autre par une isométrie). Grossièrement, donc, on cherche les espaces qui ont l'air identiques en tous les points et dans toutes les directions. Il se trouve qu'on en a une classification complète (due à Hsien-Chung Wang et Jacques Tits — et un de mes résultats mathématiques préférés). Je compte expliquer dans une entrée ultérieure ce qu'elle signifie, mais même sans chercher à définir ce que les termes veulent dire, il est intéressant de l'énoncer : les espaces homogènes et isotropes sont exactement :

  • (0) l'espace euclidien de dimension m quelconque ;
  • (1C) l'espace projectif réel (=la sphère sur laquelle les points antipodaux sont identifiés) de dimension m quelconque ;
  • (1Cbis) la sphère de dimension m quelconque ;
  • (1H) l'espace hyperbolique réel de dimension m quelconque ;
  • (2C) l'espace projectif complexe de dimension m complexe = 2m réelle quelconque [note : pour m=1, la droite projective complexe coïncide avec la sphère de dimension 2 ou « sphère de Riemann »] ;
  • (2H) l'espace hyperbolique complexe de dimension m complexe = 2m réelle quelconque [note : pour m=1, la droite hyperbolique complexe coïncide avec le plan hyperbolique réel (de dimension 2) ou « disque de Poincaré »] ;
  • (3C) l'espace projectif quaternionique de dimension m quaternionique = 4m réelle quelconque [note : pour m=1, la droite projective quaternionique coïncide avec la sphère de dimension 4] ;
  • (3H) l'espace hyperbolique quaternionique de dimension m quaternionique = 4m réelle quelconque [note : pour m=1, la droite hyperbolique quaternionique coïncide avec l'espace hyperbolique réel de dimension 4] ;
  • (4C) le plan projectif octonionique de dimension 16 réelle [note : il y a aussi la droite projective octonionique, mais elle coïncide avec la sphère de dimension 8] ;
  • (4H) le plan hyperbolique octonionique de dimension 16 réelle [note : il y a aussi la droite hyperbolique octonionique, mais elle coïncide avec l'espace hyperbolique réel de dimension 8] ;

De plus, il n'y a aucune coïncidence entre ces différents espaces autre que celles que j'ai signalées (notamment, en dimension 16, on a affaire à dix espaces homogènes et symétriques distincts). Le point que je souligne est que même si on ne connaissait pas les octonions, on serait conduit à les découvrir en étudiant la question naturelle de la classification des espaces homogènes et isotropes : mettons pour simplifier qu'on se concentre sur ceux qui sont courbés positivement, ou de façon équivalente de diamètre fini, notés ‘C’ (pour compact) dans la liste ci-dessus : on découvre qu'il y a la sphère et l'espace projectif réel (c'est presque la même chose) de toute dimension m, l'espace projectif complexe pour les dimensions 2m paires, l'espace projectif quaternionique pour les dimensions 4m multiples de 4, et un espace exceptionnel de dimension 16, qui se comporte comme un plan projectif c'est-à-dire comme les cas précédents pour m=2, mais sur une algèbre qui n'est pas associative — et si on analyse la structure de cet espace, on peut redécouvrir les octonions à partir de sa géométrie. (Par ailleurs, son groupe d'isométries est le groupe exceptionnel F4 : ce n'est pas une coïncidence de plus, c'est un reflet de ce lien naturel qu'ont les octonions avec les groupes de Lie exceptionnels.)

Bonus : un mot sur les octonions-déployés

Tout ce dont j'ai parlé jusqu'à présent concerne les octonions « standards » sur les réels. On peut bien sûr se demander ce qui se passe si on remplace les coefficients réels (devant 1,i,j,k,,i·,j·,k·) par des éléments d'un corps E quelconque (peut-être même pas commutatif, peut-être même les quaternions ou les octonions eux-mêmes, mais je ne parlerai pas aujourd'hui de ces choses-là), en gardant la même table de multiplication entre les unités. En fait, la propriété essentielle des nombres réels qui servait pour faire des octonions une algèbre-alternative à divisions est que la forme quadratique x(0)² + x(1)² + x(2)² + x(3)² + x(4)² + x(5)² + x(6)² + x(7)² n'admet pas de zéro non-trivial sur les réels (c'est-à-dire que si huit nombres réels vérifient x(0)² + x(1)² + x(2)² + x(3)² + x(4)² + x(5)² + x(6)² + x(7)² = 0, alors ils sont tous nuls ; c'est bien sûr vrai pour d'autres valeurs que huit). Si le corps E vérifie cette propriété, alors on peut former une algèbre d'octonions sur E, qu'on notera 𝕆⊗E, et qui est encore une algèbre-alternative à divisions. Mais si E n'a pas la propriété que la forme quadratique x(0)² + x(1)² + x(2)² + x(3)² + x(4)² + x(5)² + x(6)² + x(7)² soit « anisotrope » (=n'admette pas de zéro non-trivial), alors cette algèbre d'octonions sur E n'est pas une algèbre-alternative à divisions. C'est toujours une algèbre-alternative, mais on peut la voir autrement.

Sur les nombres complexes, c'est-à-dire, si E est le corps ℂ des complexes, dans lequel il sera opportun de noter autrement que i, disons plutôt и, la racine carrée standard de −1, les octonions 𝕆⊗E peuvent se réécrire un peu différemment. D'abord, si j'appelle λ = и· (où je rappelle que и=√−1 dans E, que je ne peux pas noter i parce que j'ai un autre i qui sert à construire les octonions, et est une des unités des octonions), alors λ vérifie λ²=1 (ou, si on veut, (1+λ)·(1−λ)=0, ce qui confirme qu'on ne peut pas faire de divisions). Si je réécris la table de multiplication dans les unités 1,i,j,k,λ,i·λ,j·λ,k·λ, il n'y a qu'un quart des signes qui changent :

×1ijkλi·λj·λk·λ
11ijkλi·λj·λk·λ
ii−1kji·λλk·λj·λ
jjk−1ij·λk·λλi·λ
kkji−1k·λj·λi·λλ
λλi·λj·λk·λ1ijk
i·λi·λλk·λj·λi1kj
j·λj·λk·λλi·λjk1i
k·λk·λj·λi·λλkji1

Sous cette forme, la table de multiplication n'est pas franchement intéressante, mais je peux la réécrire encore en posant e₀⁺=½(1+λ), e₀⁻=½(1−λ), e₁⁺=½(i+iλ), e₁⁻=½(iiλ), e₂⁺=½(j+jλ), e₂⁻=½(jjλ), e₃⁺=½(k+kλ), e₃⁻=½(kkλ), sous la forme suivante (où 1=e₀⁺+e₀⁻) :

×e₀⁺e₀⁻e₁⁺e₁⁻e₂⁺e₂⁻e₃⁺e₃⁻
e₀⁺e₀⁺00e₁⁻0e₂⁻0e₃⁻
e₀⁻0e₀⁻e₁⁺0e₂⁺0e₃⁺0
e₁⁺e₁⁺00e₀⁻e₃⁻0e₂⁻0
e₁⁻0e₁⁻e₀⁺00e₃⁺0e₂⁺
e₂⁺e₂⁺0e₃⁻00e₀⁻e₁⁻0
e₂⁻0e₂⁻0e₃⁺e₀⁺00e₁⁺
e₃⁺e₃⁺0e₂⁻0e₁⁻00e₀⁻
e₃⁻0e₃⁻0e₂⁺0e₁⁺e₀⁺0

Sur les nombres complexes, cette dernière table de multiplication définit une algèbre-alternative équivalente (je veux dire, isomorphe) aux octonions complexes : mais on peut l'utiliser sur un corps E quelconque, et l'algèbre-alternative qu'on obtient s'appelle l'algèbre-alternative des octonions-déployés sur E, ou split-octonions (terminologie anglaise, qui a l'avantage d'être plus courte à prononcer, parce que octonions-déployés, c'est assez long ; j'utilise dans tous les cas un trait d'union, parce que les octonions-déployés ne sont pas des octonions). Sur les réels, les octonions-déployés (définis par l'une ou l'autre des deux dernières tables de multiplication ci-dessus) sont manifestement différents des octonions, vu qu'il y a des produits qui valent 0 sans que les facteurs valent 0, et on a vu que les octonions n'ont pas de diviseurs de zéro (c'est une algèbre-alternative à divisions).

Il n'est pas franchement évident d'expliquer pourquoi les octonions-déployés sont intéressants, mais une des raisons tient à leur groupe d'automorphismes, qui est cette fois la forme déployée de G2 (qu'on peut donc définir sur un corps E quelconque). Il se trouve, par exemple, que si on écrit cette définition sur le corps fini à q éléments (autrement dit, on considère le groupe des matrices 8×8 à coefficients dans ce corps et qui, quand on les considère comme des transformations linéaires sur les octonions-déployés, préservent la multiplication de ceux-ci), on obtient un groupe G2(q) fini (d'ordre q6(q6−1)(q2−1)) qui est simple pour tout q>2 [puissance d'un nombre premier], et qui est une des familles infinies constituant la classification des groupes simples finis.

Note : On peut aussi définir des quaternions-déployés (engendrés par e₀⁺, e₀⁻, e₁⁺, e₁⁻) et des complexes-déployés (engendrés par e₀⁺, e₀⁻), mais ils ne sont pas très intéressants en soi — les quaternions-déployés sont la même chose que les matrices 2×2 sur le corps E (par exemple en identifiant e₀⁺, e₀⁻, e₁⁺, e₁⁻ respectivement aux matrices [[1,0],[0,0]], [[0,0],[0,1]], [[0,0],[1,0]] et [[0,−1],[0,0]]), et les complexes-déployés sont la même chose que les couples d'éléments de E (par exemple en identifant e₀⁺ et e₀⁻ respectivement aux couples (1,0) et (0,1)).

↑Entry #2276 [older|newer] / ↑Entrée #2276 [précédente|suivante]

Recent entries / Entrées récentesIndex of all entries / Index de toutes les entrées