David Madore's WebLog: Sons et graphes de caractères de groupes de Lie

Index of all entries / Index de toutes les entréesXML (RSS 1.0) • Recent comments / Commentaires récents

Entry #2447 [older|newer] / Entrée #2447 [précédente|suivante]:

(lundi)

Sons et graphes de caractères de groupes de Lie

Il y a quelque temps, je me désolais de ne jamais avoir réussi à trouver un objet mathématique dont je pourrais faire une représentation sous forme auditive — plutôt que visuelle — et qui serait mélodieux à entendre.

Or ces derniers temps, je réfléchissais à des problèmes — et globalement, à essayer de comprendre plus précisément des choses — autour de caractères de groupes de Lie, et j'ai été amené à tracer des fonctions qui ressemblent à ceci (cliquez pour agrandir) :

[Caractères fondamentaux du groupe de Lie F₄ restreintes au tore du SU₂ principal de Kostant]

Là, je devrais essayer de dire de quoi il s'agit. L'ennui, c'est que ce n'est pas facile. Je peux donner une explication pour les experts, mais elle n'éclairera pas du tout le grand public (ni même le public moyennement averti) ; je l'écris surtout pour m'en souvenir moi-même :

(Pour les experts, donc.)

Il s'agit des caractères fondamentaux d'un groupe de Lie (réel compact) simple (dans la figure ci-dessus, il s'agit de F₄), restreints au tore du SU₂ principal de Kostant, c'est-à-dire, plus concrètement, le groupe à un paramètre engendré par la demi-somme des coracines positives. Autrement dit, si ρ# est la demi-somme des coracines positives (ou somme des copoids fondamentaux), donnée une représentation définie par son système de poids, on applique ρ# aux poids en question, ce qui donne des demi-entiers (les multiplicités étant sommées), à interpréter comme les poids d'une représentation de SU₂, ou comme définissant un polynôme trigonométrique. Une façon de calculer en pratique consiste à appliquer la formule de caractère de Weyl avec une petite astuce (cf. §3.1 de cet article) : si ρ est la demi-somme des racines positives et λ un poids dominant, on calcule le produit des tλ+ρ,α#⟩−1 où t est une indéterminée et α# parcourt les coracines positives, et on divise ce polynôme par le produit des tρ,α#⟩−1 ; ceci donne un polynôme en t (dont la valeur en 1 est précisément la dimension de la représentation de poids dominant λ, c'est la formule de dimension de Weyl ; quant au degré, il vaut 2⟨λ,ρ#⟩, c'est-à-dire la somme des coefficients de λ sur la base des racines simples) : les coefficients de ce polynôme sont ceux recherchés : si on les décale (i.e. on divise encore par tλ,ρ#⟩) et qu'on lit comme un polynôme trigonométrique, c'est la fonction recherchée. Voici par exemple le calcul en Sage dans le cas de F₄ :

sage: WCR = WeylCharacterRing("F4", style="coroots")
sage: weylvec = sum([rt for rt in WCR.positive_roots()])/2
sage: R.<t> = PolynomialRing(QQ,1)
sage: weyldenom = prod([t^weylvec.scalar(rt.associated_coroot())-1 for rt in WCR.positive_roots()])
sage: weylnumer1 = prod([t^(weylvec+WCR.fundamental_weights()[1]).scalar(rt.associated_coroot())-1 for rt in WCR.positive_roots()])
sage: weylnumer2 = prod([t^(weylvec+WCR.fundamental_weights()[2]).scalar(rt.associated_coroot())-1 for rt in WCR.positive_roots()])
sage: weylnumer3 = prod([t^(weylvec+WCR.fundamental_weights()[3]).scalar(rt.associated_coroot())-1 for rt in WCR.positive_roots()])
sage: weylnumer4 = prod([t^(weylvec+WCR.fundamental_weights()[4]).scalar(rt.associated_coroot())-1 for rt in WCR.positive_roots()])
sage: weylnumer1/weyldenom
t^22 + t^21 + t^20 + t^19 + 2*t^18 + 2*t^17 + 3*t^16 + 3*t^15 + 3*t^14 + 3*t^13 + 4*t^12 + 4*t^11 + 4*t^10 + 3*t^9 + 3*t^8 + 3*t^7 + 3*t^6 + 2*t^5 + 2*t^4 + t^3 + t^2 + t + 1
sage: weylnumer2/weyldenom
t^42 + t^41 + 2*t^40 + 3*t^39 + 5*t^38 + 7*t^37 + 10*t^36 + 12*t^35 + 16*t^34 + 20*t^33 + 25*t^32 + 29*t^31 + 35*t^30 + 39*t^29 + 45*t^28 + 50*t^27 + 55*t^26 + 58*t^25 + 62*t^24 + 63*t^23 + 66*t^22 + 66*t^21 + 66*t^20 + 63*t^19 + 62*t^18 + 58*t^17 + 55*t^16 + 50*t^15 + 45*t^14 + 39*t^13 + 35*t^12 + 29*t^11 + 25*t^10 + 20*t^9 + 16*t^8 + 12*t^7 + 10*t^6 + 7*t^5 + 5*t^4 + 3*t^3 + 2*t^2 + t + 1
sage: weylnumer3/weyldenom
t^30 + t^29 + 2*t^28 + 3*t^27 + 4*t^26 + 5*t^25 + 7*t^24 + 8*t^23 + 10*t^22 + 11*t^21 + 13*t^20 + 14*t^19 + 16*t^18 + 16*t^17 + 17*t^16 + 17*t^15 + 17*t^14 + 16*t^13 + 16*t^12 + 14*t^11 + 13*t^10 + 11*t^9 + 10*t^8 + 8*t^7 + 7*t^6 + 5*t^5 + 4*t^4 + 3*t^3 + 2*t^2 + t + 1
sage: weylnumer4/weyldenom
t^16 + t^15 + t^14 + t^13 + 2*t^12 + 2*t^11 + 2*t^10 + 2*t^9 + 2*t^8 + 2*t^7 + 2*t^6 + 2*t^5 + 2*t^4 + t^3 + t^2 + t + 1

Le polynôme en question doit d'ailleurs avoir un rapport très fort avec les crystal graphs de Kashiwara et Littelmann (les coefficients énumèrent le nombre de nœuds à chaque hauteur du graphe) ; et sans doute avec les groupes quantiques : je n'y connais rien, mais dans le cas de Ar, on obtient exactement le coefficient binomial gaussien (r+1,i) pour la i-ième représentation fondamentale. • Par ailleurs, il y a une grande similarité avec un autre polynôme important, à savoir le produit des tα,ρ#⟩+1−1 où t est une indéterminée et α parcourt les racines positives, divisé par le produit des tα,ρ#⟩−1 : ce polynôme-là énumère les éléments du groupe de Weyl par leur longueur (Carter, Simple Groups of Lie Type (1972/1989), théorème 10.2.2 page 153), par exemple pour F₄ on trouve t^24 + 4*t^23 + 9*t^22 + 16*t^21 + 25*t^20 + 36*t^19 + 48*t^18 + 60*t^17 + 71*t^16 + 80*t^15 + 87*t^14 + 92*t^13 + 94*t^12 + 92*t^11 + 87*t^10 + 80*t^9 + 71*t^8 + 60*t^7 + 48*t^6 + 36*t^5 + 25*t^4 + 16*t^3 + 9*t^2 + 4*t + 1, il est en lien avec les exposants du groupe de Weyl (id, théorème 10.2.3 page 155), et à très peu de choses près donne la fonction zêta du groupe algébrique, c'est-à-dire compte ses points sur les corps fini (id, proposition 8.6.1 page 122), ou de façon sans doute plus pertinente, les points de la variété de drapeau associée. Je ne comprends pas bien le rapport précis entre tous ces polynômes (notons que j'ai écrit le dernier pour coller avec ce que je trouve dans Carter, mais si je ne m'abuse, c'est aussi le produit des tρ,α#⟩+1−1 où t est une indéterminée et α parcourt les racines positives, divisé par le produit des tρ,α#⟩−1, ce qui le fait ressembler encore plus à ce que j'ai écrit ci-dessus). [Ajout : ce dernier polynôme est appelé q-polynomial ici. Je devrais ajouter, pour reproduire ce qui est mentionné sur cette page, que pour obtenir le polynôme donnant nombre de points de la variété de drapeau partielle définie par un ensemble S de nœuds du diagramme de Dynkin, on fait le produit des tα,ρ#⟩+1−1 divisé par le produit des tα,ρ#⟩−1, où cette fois α parcourt seulement les racines ayant au moins un coefficient strictement positif devant une racine simple omise de S.]

Il faudrait essayer de vulgariser tout ça, mais ce n'est pas évident : pas tellement parce que les objets en question sont compliqués (fondamentalement, le calcul final est un petit calcul combinatoire, assez facile, même si évidemment le présenter comme tel ne fournit aucune motivation), mais surtout parce que, comme c'est souvent le cas dans ce domaine entre la théorie des groupes algébriques, la théorie de la représentation, et la combinatoire algébrique, chaque objet peut se voir d'une multitude de manières différentes (ce qui est d'ailleurs la source d'incompréhensions diverses et variées). J'avais commencé à essayer d'écrire quelque chose, non pas vraiment pour expliquer mais juste pour donner une idée de ce dont il est question (en agitant énormément les mains), mais même comme ça, ça partait tellement dans tous les sens que c'est incompréhensible : je le recopie quand même ici (comme un gros bloc de texte), mais je ne recommande de le lire que pour rigoler :

J'ai un peu expliqué ici ce qu'était un groupe de Lie, mais pour résumer le roman, disons très rapidement (et très grossièrement) qu'il s'agit de groupes de symétries continues ; et que les blocs qui servent à les fabriquer, les groupes simples, ont été classifiés à la fin du 19e siècle par Killing et Cartan (père), la classification se faisant maintenant au moyen de petits dessins très commodes appelés diagrammes de Dynkin. • Mais pour décrire précisément la manière dont ces groupes (de Lie réels compacts simples) se réalisent comme des groupes de symétries, il faut décrire ce qu'on appelle leurs représentations (qui sont essentiellement les manière de voir le groupe considéré comme un groupe de matrices) : grâce aux travaux entre autres de Cartan, Weyl et Chevalley, la situation est très bien comprise, et on peut décrire ces représentations grâce à des annotations sur le diagramme de Dynkin, elles sont toutes obtenues à partir de représentations dites fondamentales, une pour chaque nœud du diagramme de Dynkin (le nombre étant appelé le rang du groupe). • Une représentation est une donnée algébrique (c'est un morphisme du groupe considéré vers un groupe de matrices inversibles), mais en fait, elle se reconstruit complètement à partir d'une simple fonction sur le groupe, qu'on appelle le caractère de la représentation (on peut presque considérer le caractère et la représentation dont il provient comme synonymes) : si on sait ce que c'est qu'une matrice, le caractère est simplement la trace sur le groupe lorsque le groupe est vu comme un groupe de matrices (« vu comme » étant justement le boulot de la représentation) ; et la trace usuelle des matrices disons spéciales orthogonales, ou spéciales unitaires, est un exemple de caractère de représentation fondamentale (dans le cas du groupe spécial unitaire, les autres caractères fondamentaux sont en fait les coefficients du polynôme caractéristique de la matrice, et peuvent aussi s'obtenir comme des traces de ce qu'on appelle les puissances extérieures de la matrice, et c'est essentiellement ça la représentation). Dans le cas des matrices de rotation (=spéciales orthogonales), les caractères vont être différentes fonctions des angles de la rotation (en dimension paire 2n, disons, la trace usuelle est 2 fois la somme des cosinus des n angles de la rotation, le k-ième caractère fondamental va ressembler à la sommes de cosinus de toutes les sommes ou différences possibles de k angles, sauf les derniers, dits caractères de demi-spin, qui font intervenir des demi-angles). • Les représentations et leurs caractères s'analysent d'abord comme des sommes de représentations dites irréductibles, et celles-ci s'analysent à leur tour comme une « sorte de produit » des représentations et caractères dits fondamentaux, en nombre égal au rang du groupe, ce qui explique que ces caractères soient particulièrement importants. (Il y en a aussi un autre qui a beaucoup d'importance, c'est le caractère de la représentation dite adjointe, qui est toujours irréductible mais pas toujours fondamentale : elle se fabrique de manière « automatique » à partir du groupe — en considérant une sorte d'action par conjugaison — et c'est en fait la clé de la classification de Killing-Cartan.) • Le caractère est défini sur le groupe tout entier, qui peut être très gros (par exemple, E₈ est de dimension 248), mais en fait, toute la partie intéressante se passe sur ce qu'on appelle un tore maximal, dont la dimension est seulement égale au rang du groupe (c'est la définition du rang ; par exemple, pour E₈, c'est 8, ce qui est déjà beaucoup moins que 248) : l'idée est la même que dans le fait que pour comprendre une rotation, ce qu'il faut comprendre ce sont ses angles, peu importe les directions dans lesquelles la rotation se fait ; et le tore maximal, ici, correspondrait à toutes les rotations selon des directions données. • Cette fonction — la restriction du caractère au tore maximal — est déjà quelque chose de beaucoup plus concret, et en fait c'est sans doute à ce niveau-là que je devrais partir si je devais essayer de vulgariser correctement cette notion (au lieu de l'espèce de cascade de remarques décousues qui précèdent), parce que je crois qu'on peut laisser complètement la notion de groupe de Lie et partir de la notion de kaléidoscope euclidien (un arrangement d'hyperplans dans l'espace euclidien, qu'il faut imaginer comme un arrangement de miroirs, de sorte que la réflexion d'un hyperplan quelconque de l'arrangement par rapport à un autre hyperplan quelconque de l'arrangement soit encore un hyperplan de l'arrangement ; les réflexions en question définissent ce qu'on appelle le « groupe de Weyl affine » : dans mes exemples ci-dessus, cela correspond aux opérations qui remplacent l'angle d'une rotation par son opposé, ou en permutent deux, ou ajoutent deux tours à un des angles, ce genre de choses, tout ça n'a finalement pas d'importance pour la rotation, et notamment ne change pas les valeurs des caractères) ; on doit donc pouvoir approcher la notion de caractère comme une fonction (harmonique) sur la cellule élémentaire — dite alcôve — qui sert à construire le kaléidoscope. • Mais on peut restreindre encore plus les choses, car beaucoup des propriétés intéressantes du caractère peuvent se lire sur sa restriction à essentiellement une seule droite (dans le kaléidoscope, c'est un rayon de lumière qui, en rebondissant sur les murs-miroirs de l'alcôve, passe par un centre particulier de l'alcôve). Et c'est ce dont il est question ici.

Ce qui précède est illisible pour plusieurs raisons. La première est que je ne décide pas clairement à qui je m'adresse, et je fais sans arrêt des remarques compréhensibles à des niveaux de connaissance différents. Je devrais peut-être adopter l'approche utilisée dans une vidéo comme celle-ci (où la même personne explique le même concept cinq fois, à des niveaux de technicité croissants), mais c'est évidemment plus compliqué. Un autre problème est que je n'arrive pas à me fixer une approche d'explication (je commence par parler des groupes de Lie, puis je me suis dit qu'on aurait pu en fait ne pas en parler du tout et tout décrire par la notion de kaléidoscope / groupe cristallographique). Encore un autre problème est qu'il n'est pas toujours évident, quand on vulgarise, de savoir ce qu'on va passer sous silence, et notamment quelles notions on va tacitement identifier (faut-il ignorer la différence entre représentation et caractère, si je ne dois proprement définir aucun des deux ? entre groupe de Lie et algèbre de Lie ? quelle approche choisir dans chaque cas ?).

Bref, j'essaierai peut-être un autre jour. En attendant, essayons de faire un résumé moins indigeste :

Je vais donc me contenter de dire que je m'intéressais à des questions, d'ailleurs en bonne partie expérimentales (car les maths peuvent aussi être une science expérimentale), autour de certaines fonctions qu'on appelle les caractères fondamentaux (c'est-à-dire caractères des représentations fondamentales) et le caractère adjoint (caractère de la représentation adjointe) de groupes de Lie réels compacts simples. Peu importe ce que tout cela signifie, mais ce sont des fonctions très jolies ayant plein de propriétés algébriques et combinatoires remarquables. A priori ce sont des fonctions définies sur des objets de grande dimension (le groupe de Lie F₄, par exemple, et pour changer un peu de E₈, est de dimension 52, ça va être difficile à représenter), mais on peut faire deux réductions : une étape tout à fait classique consiste à dire que tout ce qui est intéressant se passe sur un petit bout du groupe (appelé tore maximal), dont la dimension est beaucoup plus petite (pour F₄, ça devient 4, c'est ce que signifie l'indice sous la lettre, et on appelle ça le rang du groupe). Et en fait, beaucoup de ce qui est intéressant se passe au sein de ce qu'on appelle le tore maximal du SU₂ principal de Kostant (c'est très long à dire, je me demande s'il n'y a pas une terminologie moins lourde, d'ailleurs), et là, on tombe en dimension 1. Beaucoup des choses intéressantes sur les caractères (ou sur le groupe en général) se passent au sein de ce SU₂ principal (Jean-Pierre Serre, qui m'a fait l'honneur de discuter longuement avec moi sur des problèmes apparentés, et qui a aussi fait des expérimentations graphiques et numériques du genre de ce que je raconte ici, a résumé la chose ainsi : il passe par tous les points intéressants). Même si les raisons pour ça ne sont pas claires (ça fait partie de l'expérimentation), c'est en tout cas un endroit intéressant à regarder.

Ce que j'ai tracé ci-dessus, ce sont donc les (quatre) caractères fondamentaux d'un groupe de Lie (celui qui s'appelle F₄) sur ce lieu de dimension 1, tore maximal du SU₂ principal de Kostant.

Ce sont des polynômes trigonométriques, c'est-à-dire des sommes de sinus ou de cosinus (en l'occurrence, il n'y a que des cosinus), et cela suggère qu'on puisse avoir envie de les écouter comme des sons : pour les non matheux, disons qu'un polynôme trigonométrique, c'est essentiellement (la fonction d'onde d')un som ne comportant qu'un nombre fini d'harmoniques entiers.

C'est ce que j'ai fait dans cette vidéo que j'ai mise sur YouTube (le passage précis où on entend les quatre ondes représentées ci-dessus est entre 49.5s et 55.5s dans la vidéo), en jouant ces ondes[#] sur une fréquence fondamentale de 110Hz (la note A2 en musique, qui n'a rien à voir avec le groupe de Lie A₂) ; on y entend donc, pour 26 groupes de Lie réels simples, le son de chacune de leurs caractères fondamentaux et aussi du caractère adjoint (lorsqu'il n'est pas déjà inclus dans les fondamentaux). Mais je vous préviens d'avance : contrairement à ce que j'espérais, et contrairement à ce que mes courbes joliment tracées peuvent laisser penser, ce n'est pas franchement mélodieux. C'est loin d'être inaudible, certes (même si ça devient assez strident quand on progresse en rang, et je n'ai pas voulu faire E₈ pour ne pas écorner sa réputation), mais en tout cas, il n'y a pas de magie particulière qui s'entendrait à l'oreille. Du moins, pas à la mienne.

[#] Bon, alors, techniquement, j'ai quand même triché sur le point suivant : j'ai transformé tous les cosinus en des sinus dans le polynôme trigonométrique, c'est-à-dire que j'ai déphasé tous les harmoniques d'un quart de tour (et supprimé le terme constant). La raison initiale était qu'avec les cosinus ça aurait saturé avec la normalisation que j'avais commencé par prendre ; finalement, j'ai changé de normalisation, mais j'ai laissé les sinus. Une autre raison est qu'avec des sinus, on passe sans coupure d'un son à un autre, puisque la fonction prend de toute façon la valeur 0 en 0. Ça ne devrait rien changer à l'oreille vu qu'elle est inensible à la phase, du moins en mono. (Quant au terme constant, il est encore plus inaudible, si j'ose dire.) Mais peut-être que c'est justement pour ça qu'on n'entend rien de remarquable, en fait.

Bref, j'ai été plutôt déçu : je pensais avoir enfin un truc intéressant à mettre sous forme de son, et en fait, ça n'a pas grand intérêt. Je me console avec les graphes qui, eux, sont quand même bien jolis. Voici D₆ (1′30s dans la vidéo ; j'ai gardé la couleur rouge pour le caractère adjoint), qui est intéressant parce qu'il y a un caractère (le numéro 5, en vert, ou caractère de demi-spin) qui n'a que les harmoniques impaires d'une fréquence fondamentale deux fois plus grave, ça s'entend très bien sur le son et ça se voit sur le graphique au fait qu'il n'a pas la même symétrie autour de ½ que les autres courbes (ou si on veut, pas la même valeur en 0 et en 1) :

[Caractères fondamentaux du groupe de Lie D₆ restreintes au tore du SU₂ principal de Kostant]

Voici E₆ (1′57s dans la vidéo ; intéressant parce que le minimum du caractère adjoint n'est pas atteint en ½ et n'est pas l'opposé du rang) :

[Caractères fondamentaux du groupe de Lie E₆ restreintes au tore du SU₂ principal de Kostant]

Et enfin E₈ (que je n'ai pas inclus dans ma vidéo ; je n'ai tracé que quatre caractères fondamentaux parce que c'était déjà assez confus comme ça), on imagine assez bien que le son doit être strident :

[Caractères fondamentaux du groupe de Lie E₈ restreintes au tore du SU₂ principal de Kostant]

Il y a beaucoup de choses à lire sur ces courbes. La valeur en 0 (le 0 correspondant à l'identité du groupe de Lie) est égale à la dimension de la représentation tracée (pour le caractère adjoint, c'est la dimension du groupe de Lie lui-même), ce qui explique un énorme pic en 0 (le seul qui ne dépasse pas complètement des limites de mon graphique est le caractère de la représentation ordinaire de D₆ — la numéro 1, en bleu — qui prend la valeur 12 parce que D₆=Spin(12) est le groupe des rotations, enfin le groupe spin mais peu importe, en 12 dimensions). La valeur en ½ ou tout autre point est déjà quelque chose de bien plus mystérieux.

Mais il y a quelque chose qui m'a particulièrement frappé quand j'en ai pris conscience et à quoi je n'ai aucune explication : sur chacune des courbes ci-dessus, on voit que beaucoup de valeurs tournent autour de 0 (je veux dire, si vous deviez tracer un axe horizontal intéressant sur ces graphes, ce serait à l'ordonnée 0) ; c'est particulièrement frappant sur les graphe pour E₈, les courbes sont beaucoup plus « denses » autour de l'axe des abscisses. L'explication à laquelle on pense naturellement serait : c'est sans doute juste que 0 est la valeur moyenne de toutes ces fonctions. Seulement, ce n'est pas le cas : la valeur moyenne (= le terme constant du polynôme trigonométrique) est égal à la multiplicité du poids nul sur le SU₂ principal, et ce nombre est toujours positif et rarement nul (le seul cas où ça se produit dans les courbes ci-dessus est la courbe verte/nº5/demi-spin pour D₆). Je n'ai donc pas d'explication à cette « concentration en 0 » alors que 0 n'est pas la moyenne, il y a peut-être un résultat qui dit que la valeur d'un caractère fondamental (irréductible ?) d'un groupe de Lie prend souvent des valeurs proches de 0, mais je ne le connais pas (la valeur moyenne sur le groupe tout entier est la multiplicité du poids nul de la représentation, elle est toujours positive et n'est nulle que pour une représentation dite minuscule est strictement positive dans les cas G₂, F₄ et E₈ par exemple).

↑Entry #2447 [older|newer] / ↑Entrée #2447 [précédente|suivante]

Recent entries / Entrées récentesIndex of all entries / Index de toutes les entrées