David Madore's WebLog: Comment vulgariser la géométrie riemannienne ?

La laborieusement interminable écriture de mon texte de vulgarisation sur les octonions m'a amené, de fil en aiguille (géométrie octonionique → espaces projectifs sur les réels, complexes, quaternions et octonions → géométrie riemannienne réelle de ceux-ci) à lire ou relire des choses sur la géométrie riemannienne. Pour ceux qui n'ont aucune idée de ce dont je parle, disons qu'en zéroième approximation[#], il s'agit de la géométrie des espaces courbes (le mot courbe méritant lui-même d'être expliqué, puisqu'il s'agit de courbure intrinsèque) ; et il s'agit[#2] de l'ingrédient mathématique essentiel de la relativité générale, qui explique la gravitation comme une courbure de l'espace-temps[#3].

La géométrie riemannienne est aussi quelque chose qu'on a vraiment envie de vulgariser : parce qu'elle donne l'impression, peut-être trompeuse, qu'il est possible d'en expliquer les idées fondamentales « avec les mains », tant il s'agit d'idées géométriques souvent visuellement « concrètes » ; et aussi parce que la vulgariser aiderait à mieux la comprendre et, accessoirement, à comprendre la relativité générale[#4].

La première difficulté qui surgit, c'est sans doute d'expliquer de quoi il est question : la géométrie riemannienne s'intéresse à la courbure intrinsèque ; or si on propose au profane de visualiser un espace courbe, il va fatalement le visualiser comme une courbe ou une surface à l'intérieur d'un espace euclidien (i.e., plat) de dimension 3, cette tendance étant certainement accentuée par le fait que l'exemple le plus évident soit celui d'une sphère, qu'on imaginera volontiers plongée en dimension 3. Et de même, si on explique que la relativité générale présente l'espace-temps comme courbe, la première image qui vient à l'esprit de tout un chacun est de se dire qu'il doit y avoir un espace plus gros (i.e., ayant des dimensions en plus) à l'intérieur duquel il réside. Or, s'il est vrai qu'on peut toujours plonger une variété riemannienne dans un espace plat de dimension assez grosse (ajouter une seule dimension ne suffit pas toujours), ce n'est une opération ni naturelle, ni très intéressante, et ce serait un mauvais départ que de se servir de cet artifice.

Ainsi, du point de vue de la géométrie riemannienne, et c'est assez navrant pour la terminologie, une courbe n'est jamais courbe : ici, le premier courbe désigne un espace de dimension 1 (et assez lisse pour être considéré dans le cadre de la géométrie différentielle : certainement pas une fractale, pas de point double ou ce genre de gag), le second signifie qu'il n'y a pas de courbure intrinsèque et locale : si je vis sur un espace de dimension 1, la seule chose que je puisse faire est parcourir une certaine distance dans un sens ou dans l'autre (si on veut : paramétrer la courbe par son abscisse curviligne), aucune constatation de son caractère prétendument « courbe » ne peut se faire sans quitter cette courbe. La courbure commence, donc, avec les surfaces, et plus spécifiquement avec la courbure gaussienne des surfaces et le remarquable theorema egregium (c'est-à-dire, justement, « théorème remarquable ») de Gauß, selon lequel cette mesure de courbure est intrinsèque, i.e., peut se détecter sans quitter la surface. Peut-être qu'il vaut mieux montrer des vidéos qui se situent vraiment dans un espace courbe de dimension 3, sans aucune indication qu'il y ait un « autour », pour faire passer l'idée que certaines formes de courbure peuvent se « voir » sans quitter l'espace.

Si je vis à la surface d'une sphère, par exemple, et que je suis condamné à ne pas la quitter, je peux m'apercevoir de cette courbure par le fait que la somme des angles d'un triangle dépasse les 180° attendus en géométrie euclidienne (et dépasse d'autant plus 180° que le triangle est grand, l'excès étant d'ailleurs exactement proportionnel à la surface du triangle) : par exemple, un triangle formé du pôle nord et de deux points de l'équateur distants de 90° a trois angles droits, ce qui n'est certainement pas possible dans le plan. Je peux aussi constater que la circonférence ou l'aire d'un cercle est inférieure aux 2·π·r ou π·r² prédits par la géométrie euclidienne, et d'autant plus inférieure que le rayon r est grand (par exemple, un cercle dont le rayon sphérique soit un quart de tour de la sphère, par exemple l'équateur vu comme cercle autour du pôle, a une circonférence 36% plus petite, et une surface 19% plus petite, que le cercle euclidien de même rayon). Ce sont là des observations intrinsèques. Je peux ajouter qu'elles sont locales en ce sens que je n'ai jamais besoin de faire un « tour » de la sphère pour mesurer sa courbure, je peux me contenter d'étudier des petits triangles ou des petits cercles près de l'endroit où je me trouve (plus ils sont petits plus la courbure aura un effet faible, mais en principe il est possible de l'observer arbitrairement près d'un point donné).

En dimension 2, il n'y a qu'un seul nombre qui représente la courbure intrinsèque, c'est la courbure gaussienne : elle peut être positive — c'est le cas sur une sphère — auquel cas la somme des angles d'un triangle dépasse 180° et les cercles sont plus petits en longueur ou en surface que leurs analogues euclidiens, ou négative — c'est le cas sur une selle de cheval ou un col en montagne — auquel cas le contraire des phénomènes ci-dessus décrits se produit. (Je dois souligner, en revanche, qu'un cylindre, par exemple, ou un cône hors de son sommet qui concentre une courbure infinie, ont des courbures intrinsèques nulles, comme tout ce qu'on peut obtenir en pliant doucement une feuille de papier puisqu'un triangle tracé sur celle-ci ne va pas se mettre à avoir des angles différents : on peut donner à la feuille une courbure extrinsèque mais pas une courbure intrinsèque.)

Pour être un poil plus précis, si je considère un cercle de rayon r très petit sur une surface de courbure gaussienne κ autour de ce cercle, un cercle de rayon r va avoir en première approximation la circonférence 2·π·r et l'aire π·r² attendus pour un cercle euclidien, mais la deuxième approximation va faire apparaître un défaut de circonférence de (π/3)·r³·κ (c'est-à-dire un défaut relatif de (1/6)·r²·κ) et un défaut de surface de (π/12)·r⁴·κ (c'est-à-dire un défaut relatif de (1/12)·r²·κ) : c'est-à-dire que la circonférence est donnée par le développement limité 2·π·r − (π/3)·r³·κ + o(r³), et quelque chose d'analogue pour la surface.

En dimension plus grande, les choses se compliquent, la courbure cesse d'être un simple nombre (la courbure gaussienne d'une surface) pour devenir un objet géométrique plus riche, le tenseur de Riemann. On pourrait dire qu'il rassemble l'information de la courbure de toutes les surfaces localement géodésiques (c'est-à-dire, en gros, « aussi droites que possible ») autour du point considéré, cette information s'appelant la courbure sectionnelle, mais ce n'est pas la meilleure façon de le voir.

La manière dont on préfère penser la courbure en général pourrait se décrire ainsi : je pars d'un point en regardant dans une direction donnée, et je parcours un (petit) chemin en boucle pour revenir à mon point de départ, en essayant de regarder toujours dans la même direction, et en revenant au point de départ je constate que je ne regarde plus dans la même direction. (Exemple sur la Terre : je pars du pôle nord en regardant selon le méridien de Greenwich, je descends jusqu'à l'équateur, à ce moment-là je regarde vers le sud, puis je suis l'équateur sur un quart de tour, toujours en regardant vers le sud, je remonte au pôle nord en regardant vers le sud, et je suis bien revenu au point de départ mais cette fois je fais face à un méridien à 90° du méridien de Greenwich, et je conclus ainsi que la Terre est courbe.) Le tenseur de Riemann calcule la manière dont le vecteur « regardant tout droit » a été modifié en parcourant une boucle infinitésimale (disons, un parallélogramme infinitésimal). Implicite dans cette définition est la notion de transport parallèle, c'est-à-dire l'outil géométrique (dont la formalisation est la connexion de (Christoffel-)Levi-Civita) qui permet de prendre un vecteur ou une direction en un point, le « transporter parallèlement » (ce que j'ai évoqué en disant qu'on essaye de regarder toujours dans la même direction) selon un chemin donné pour arriver en un autre point (éventuellement le même, ce qui permet de mesurer la courbure). On peut expliquer comment ce transport parallèle fonctionne grâce à la construction géométrique dite de l'« échelle de Schild » (voir les dessins de l'article Wikipédia), qui fait uniquement appel à la notion de distance (et de géodésique, c'est-à-dire, de courbe localement de plus courte distance entre deux points, autrement dit, de « droite » autant qu'on peut l'être dans un espace courbe).

La courbure de Riemann se décompose naturellement en trois morceaux : ce sont la courbure scalaire, la courbure de Ricci sans trace (ces deux premiers morceaux forment ensemble la courbure de Ricci) et la courbure de Weyl. Une courbe (=objet de dimension 1) n'a pas de courbure intrinsèque, je l'ai déjà dit ; une surface (=objet de dimension 2) n'a que la courbure scalaire (qui est égale, à un facteur 2 sans importance près, à la courbure gaussienne) ; à partir de la dimension 3, on a toute la courbure de Ricci, et à partir de la dimension 4 (notamment dans l'espace-temps de la relativité générale), l'ensemble de ces composantes (il n'y a rien de significativement nouveau au-delà). En gros, et c'est quelque chose que j'ai mis longtemps à comprendre parce que personne ne prend la peine de le dire clairement :

la courbure scalaire mesure la manière dont une sphère de rayon r va être rapetissée (courbure positive) ou grossie (courbure négative) par rapport à son analogue euclidien,
la courbure de Ricci mesure la manière dont cette sphère va être rapetissée ou grossie dans certaines directions par rapport à d'autres, c'est-à-dire la manière dont un petit élément d'angle solide à l'origine va être rapetissé ou grossi après une distance r (par rapport à la surface qu'on attend en euclidien) en fonction de sa direction, et la partie « sans trace » se réfère à la différence entre ce grossissement et le grossissement moyen dans toutes les directions constaté par la courbure scalaire,
la courbure de Weyl mesure la manière dont cette sphère va être déformée, c'est-à-dire la manière dont un petit élément d'angle solide à l'origine va être aplati dans certaines directions et élongé dans d'autres (sans tenir compte de son changement de volume total) après une distance r.

Un espace riemannien n'ayant pas de courbure de Weyl est dit conformément plat (du moins, en dimension ≠3, sachant que c'est automatiquement le cas en dimensions 1 et 2) : cela signifie, en fait, qu'il peut être ramené à un espace plat en faisant une transformation qui multiplie les longueurs — de la même façon dans toutes les directions — par un facteur pouvant dépendre du point ; autrement dit, cette transformation préserve les angles : pensez, notamment, à la sphère, où l'existence des projections cartographiques dites conformes montre qu'elle est conformément plate (comme, je le répète, toute surface) ; un matériau dont l'indice de réfraction varie peut aussi être considéré comme un espace courbe mais conformément plat (l'indice de réfraction étant, justement, le facteur appliqué aux distances). Un espace riemannien n'ayant pas de courbure de Ricci-sans-trace (autrement dit, sa seule courbure de Ricci est la courbure scalaire) est dit espace d'Einstein : ils sont un sujet d'étude mathématique très intéressant, et important pour la relativité générale. (Je ne crois pas qu'il y ait de nom particulier pour le cas où la courbure scalaire est nulle.)

[Ajout (2012-08-20) : Un ami me signale qu'il a écrit ce texte (voir essentiellement la première partie), nettement plus précis que mon agitage de mains, où il cherche aussi à rendre plus « visuelles » les notions classiques de géométrie riemannienne ; sa démonstration intuitive de l'identité de Bianchi algébrique — un point qui mérite effectivement d'être vulgarisé — est notamment intéressante.]

Du point de vue de la relativité générale, cette décomposition de la courbure en trois morceaux est également très importante. La description que j'en ai faite avec les mains doit être adaptée parce qu'on ne peut pas utilement considérer directement des sphères dans l'espace-temps, mais l'idée générale reste valable (voir par exemple l'agitage de mains de John Baez), disons que la composante « Ricci » de la courbure mesure la manière dont des boules de particules en chute libre (la chute libre, en relativité générale, signifie qu'on suit les géodésiques de l'espace-temps) se contractent ou se dilatent, tandis que la composante « Weyl » mesure la manière dont elles se déforment. En relativité générale :

la courbure de l'espace-temps reflète le phénomène physique des forces de marée, c'est à-dire (voir mes explications antérieures) la manière dont les particules en chute libre (=géodésiques) se rapprochent ou s'écartent les unes des autres, (par exemple, le fait que le bourrelet d'eau autour de la Terre se déforme, sans gonfler ou rapetisser globalement, pour donner deux marées par jour, peut être vu comme une observation directe de la courbure de Weyl de l'espace-temps causée par la Lune) ;
les équations d'Einstein mettent directement en relation les effets de la matière avec la composante Ricci de la courbure, (et notamment, en l'absence de matière, il n'y a pas de courbure de Ricci, ou du moins, pas de courbure de Ricci-sans-trace) ;
la courbure de Weyl de l'espace-temps (qui peut exister même en l'absence de matière) est ce qui « permet » à la gravitation d'avoir un effet à distance, et c'est aussi sur cette composante que se manifestent les ondes gravitationnelles prédites par la relativité (voir les dessins animés de l'article Wikipédia sur le passage d'une onde gravitationnelle) ;
la courbure scalaire est liée à la quantité totale (=masse au repos) de matière présente, plus ou moins éventuellement une constante, dite constante cosmologique, permise mais non exigée par la relativité générale, qui signifie essentiellement que le vide lui-même provoque un effet gravitationnel au niveau de la courbure scalaire (constante dont les mesures expérimentales actuelles semblent suggérer qu'elle est non nulle, quoique très faible, et du signe[#5] tel que le vide ait le même effet qu'une densité de matière positive et une pression négative) ;
un pur rayonnement électromagnétique, bien qu'il provoque des effets gravitationnels au niveau Ricci-sans-trace, ne crée pas de courbure scalaire ; et de façon générale, le fait que les effets gravitationnels en relativité générale ne viennent pas seulement de l'énergie mais aussi de la pression se lit sur l'ensemble de la partie « Ricci » de la courbure.

(Comme je le suggère dans la note #3, il est intéressant de comparer cette distinction des rôles avec celle qui en tient lieu dans la théorie de Nordström de la gravitation.)

⁂

Il y a encore quelque chose qu'il faut que j'évoque (ou qu'il faudrait que j'évoquasse si j'écrivais sérieusement un texte de vulgarisation sur la géométrie riemannienne plutôt que faire semblant de donner le plan de ce que serait un tel texte), c'est la notion de torsion. Ce n'est pourtant pas de la géométrie riemannienne (en géométrie riemannienne, la torsion, par définition, est nulle, et elle l'est en relativité générale au moins dans sa version « orthodoxe »), mais c'est quelque chose de suffisamment apparenté pour qu'il soit naturel de la définir, ne serait-ce que pour expliquer ce que cela signifie qu'elle soit nulle.

Comme je l'ai suggéré plus haut, la définition de la courbure repose essentiellement sur la donnée d'une opération de transport parallèle (formellement, une « connexion [sur le fibré tangent] »), qui permet de transporter un vecteur (ou une direction) d'un point à un autre en suivant un chemin prescrit. En géométrie riemannienne, la donnée primaire est celle d'une distance (=métrique), le transport parallèle s'en dérive (connexion de Christoffel-Levi-Civita), soit par une construction géométrique (j'ai évoqué l'échelle de Schild) soit par un ensemble de contraintes (il s'agit de la seule connexion qui préserve la longueur des vecteurs et qui soit, justement, sans torsion dans le sens que je vais expliquer). Mais si on oublie la métrique et qu'on ne retient que la connexion, on peut déjà faire certaines choses : certes, on ne peut plus définir de longueurs, mais on peut au moins donner un sens à une géodésique (en présence d'une métrique, c'est un chemin qui est localement le plus court possible) : il s'agit d'un chemin qui va « toujours tout droit » en ce sens que sa direction se transporte parallèlement par le chemin lui-même (i.e., on commence à partir dans une direction, et on continue dans la « même » direction, la notion de « même » étant justement donnée par le transport parallèle dont on dispose). C'est dans ce cadre-là qu'on peut définir la torsion (sachant que si le transport parallèle est celui qui dérive d'une métrique dans le cadre de la géométrie riemannienne, cette torsion sera nulle, plus ou moins par définition).

Voici comment on peut tester la présence de torsion : on part d'un point (disons o) et de deux vecteurs en ce point, disons u et v. On considère une géodésique dirigée selon u, qu'on suit jusqu'au paramètre ε (dans le contexte métrique, on aurait tendance à imaginer u comme unitaire et ε comme la distance sur laquelle on suit la géodésique : ici, il n'y a pas de distance, seulement le paramétrage affine de la géodésique défini par son vecteur initial, mais on peut conserver l'intuition de la distance), et on transporte parallèlement le vecteur v le long de ce bout de géodésique et, à l'arrivée (disons qu'on appelle v′ le vecteur transporté), on suit une nouvelle géodésique dirigée selon v′ de nouveau jusqu'à un paramètre ε : ceci donne un premier point, appelons-le p ; puis on repart du point o et on refait la même construction en inversant u et v (i.e., on suit pendant ε une géodésique dirigée par v, et au bout de celle-ci on suit pendant ε une géodésique dirigée par le vecteur u transporté le long du premier bout), ce qui donne un autre point q. Dans un espace euclidien, bien entendu, les points p et q coïncident ! Dans un espace courbe mais sans torsion, les points p et q coïncident à l'ordre 3, c'est-à-dire que leur écart est au pire de l'ordre de ε³ (je dis leur écart et pas leur distance parce qu'on n'a pas forcément une notion de distance, mais si on en a une c'est bien le cas, et on peut faire comme si on en avait une) ; tandis que si on a de la torsion, on n'a une coïncidence qu'à l'ordre 2, le facteur devant ε² étant justement le tenseur de torsion appliqué aux vecteurs u et v.

Ajout (2012-08-20) : Encore plus « avec les mains », la torsion correspond, intuitivement, à l'idée que quand on déplace censément-parallèlement un vecteur le long d'une courbe, il se met à « tourner » autour de cette courbe (et donc que le transport censément parallèle n'est pas si parallèle que ça) — du moins pour les connexions (transports parallèles) qui préservent une certaine métrique (=norme) sur les vecteurs, situation dans laquelle cette présentation a d'ailleurs le mérite d'expliquer pourquoi il ne peut exister de torsion qu'à partir de la dimension 3. Ce qui demeure un peu mystérieux à mes yeux, malgré l'expérience de pensée du paragraphe ci-dessus, c'est que cette torsion puisse se constater de façon intrinsèque (et pas seulement en comparant deux transports parallèles l'un à l'autre).

Je conclus par une remarque pour les matheux qui la comprendront, parce que je trouve l'exemple qui suit particulièrement éclairant pour visualiser la torsion, la courbure et le rapport entre les deux. Si G est un groupe de Lie non commutatif, il y a deux connexions évidentes dessus, ce sont celles données par la translation à gauche et par la translation à droite : ces connexions sont sans courbure, puisque la translation ne dépend pas du chemin suivi, en revanche elles ont de la torsion puisque les champs de vecteurs de dérivée covariante nulle sont les champs invariants par translation du côté considéré, et ils ont un crochet de Lie donné par (plus ou moins) le crochet dans l'algèbre de Lie 𝔤 tangente à G, ce qui donne justement la torsion de ces deux connexions (elles diffèrent uniquement par le signe). Comme les connexions données par les translations gauche et droite ont des torsions opposées, leur demi-somme n'a pas de torsion (en revanche, elle a de la courbure) : si G a une métrique bi-invariante (ce qui est le cas si G est compact, je ne suis pas sûr de la réciproque), cette dernière connexion est précisément la connexion de Christoffel-Levi-Civita pour cette métrique[#6] — c'est amusant parce que ça permet de définir cette connexion même sans avoir la métrique. Dans tous les cas, les géodésiques partant de l'origine, pour n'importe laquelle des connexions mentionnées, sont les sous-groupes à un paramètre de G.

⁂

[#] Tiens, en (zéroième|première|deuxième|…) approximation, c'est encore une expression de matheux typique du français que je parle. Est-ce que les non-matheux disent ou comprennent ça aussi ?

[#2] Les experts me pardonneront, au niveau extrêmement grossier d'agitage des mains où je me situe, de ne pas prêter attention à la signature lorentzienne de la métrique, et de considérer la géométrie pseudo-riemannienne comme de la géométrie riemannienne.

[#3] Une fois introduite la notion même d'espace-temps pour présenter la relativité restreinte, j'imagine que l'idée de chercher à le courber était naturelle. J'ai lu quelque part — mais je ne sais absolument plus où — que Riemann lui-même avait tenté d'expliquer la gravitation par une courbure de l'espace. (Ce qui ne pouvait pas marcher, la courbure de l'espace seul étant beaucoup trop faible, les seuls effets mesurables hors de situations extrêmes impliquant nécessairement la direction temps. De toute façon, cet article suggère que la théorie de Riemann de la gravitation était plus compliquée que ça.) À propos de théories historiques de la gravitation, la théorie scalaire de Nordström, sans sa présentation d'Einstein-Fokker, est extrêmement intéressante pour des raisons didactiques, notamment pour le rôle qu'elle donne — et la comparaison avec la relativité générale — aux différents morceaux de la courbure (scalaire, Ricci-sans-trace et Weyl), tout à fait dans le sujet de ce post-ci.

[#4] Il y a aussi que, toujours de fil en aiguille, j'ai cherché à comprendre la notion de géométrie de Cartan, qui est, disons, une généralisation commune de la géométrie de Riemann et de celle de Klein — mais si je comprends la définition mathématique, je pense qu'il me faudra encore pas mal d'efforts pour m'en faire une intuition correcte.

[#5] S'agissant de l'espace-temps, il vaut mieux ne pas parler de courbure « positive » ou « négative » parce que le signe de la courbure scalaire dépend d'une convention arbitraire sur le signe de la métrique d'espace-temps (la courbure positive pour une convention est négative pour l'autre). Il vaut mieux parler de courbure (ou constante cosmologique) de signe « de Sitter » ou « anti-de Sitter » parce que tout le monde est d'accord sur ce que ce sont : la courbure engendrée par une poussière de matière ordinaire est de signe « anti-de Sitter », et la constante cosmologique qui semble compatible avec les observations actuelles (rayonnement de fond diffus cosmologique, oscillations acoustiques des baryons, luminosité des supernovæ de type Ia) est de signe « de Sitter » (elle équivaut à un gaz de densité d'énergie positive mais de pression négative tellement forte que cette dernière change le signe de la courbure).

[#6] Ajout (2012-08-20) : Tant que j'y suis, voici un autre fait rigolo. Sur la sphère unité des octonions (qui n'est pas un groupe de Lie, à cause de la non-associativité des octonions), on peut définir cinq connexions naturelles qui préservent toutes la métrique sur la sphère : deux d'entre elles, les connexions de « trivialisation gauche et droite » sont données par la translation à gauche ou à droite des vecteurs tangents depuis l'origine (elles sont sans courbure puisqu'elles correspondent à une trivialisation du fibré tangent) ; deux d'entre elles, les connexions de « translation gauche et droite », correspondent à effectuer des translations gauche ou droite infinitésimales : elles ne sont plus plates, et plus précisément, la courbure de ces connexions, disons à l'origine, est donnée essentiellement par l'associateur des octonions (au signe près, et sans doute aussi à un facteur 2 ou ½ près) ; enfin, la cinquième est la connexion de Levi-Civita (sans torsion, donc) sur la sphère : il se trouve, si je ne me suis pas planté dans mes calculs, que cette cinquième connexion est la demi-somme entre la connexion de trivialisation gauche et la connexion de translation droite, ou entre la connexion de trivialisation droite et la connexion de translation gauche. De nouveau, toutes définissent les mêmes géodésiques partant de l'origine.