David Madore's WebLog: L'Univers et la cosmologie de FLRW

Avant-propos : Encore une entrée interminable dans laquelle j'ai bien failli me noyer !, commencée il y a environ trois mois, et que je publie dans un état, j'avoue, un peu inachevé et mal relu, parce que j'en ai vraiment marre de l'écrire. Il s'agit ici de parler de cosmologie. (Oui, je sais, j'ai laissé entendre que je pourrais écrire quelque chose sur la physique des particules, mais vous ne vous attendiez pas à ce que je fasse quelque chose que j'ai annoncé, quand même ?) La cosmologie, c'est l'étude de l'évolution physique de l'Univers : mais comme je suis mathématicien, je vais plutôt l'aborder sous l'angle mathématique. Un des points que je veux développer, justement, c'est que si la relativité générale est quelque chose d'assez compliqué, le cas particulier de la relativité générale qu'est la cosmologie de FLRW (Friedmann-Lemaître-Robertson-Walker), qui décrit l'évolution d'un univers homogène et isotrope (cf. ci-après) et qui s'applique fort bien au nôtre, demande beaucoup moins de bagage mathématique, et ça pourrait avoir un sens d'en parler en lycée (au moins si je compare avec ce qui était enseigné au lycée quand j'y suis passé — les choses ont pu changer depuis) ; d'autant plus que le Big Bang et l'expansion de l'Univers est un sujet qui, si j'en crois le nombre de tentatives qu'on fait pour le vulgariser, suscite au moins un certain intérêt — il est dommage qu'en plus de ces vulgarisations « grand public » on n'en trouve pas qui tentent d'aller un peu plus loin pour ceux qui ont des connaissances mathématiques un peu plus poussées. Disons qu'il s'agit en gros de savoir ce qu'est une équation différentielle ordinaire (ce qui est, donc, nettement plus simple que la relativité générale qui est décrite par un système sous-déterminé d'équations aux dérivées partielles) : même si je vais aussi dire un certain nombre de choses qualitatives ou historiques qui devraient pouvoir intéresser ceux de mes lecteurs qui ne savent pas ce qu'est une équation différentielle, mon propos principal est quand même de présenter, reformuler et commenter l'équation de Friedmann-Lemaître qui détermine l'évolution de l'Univers. Il sera aussi utile d'avoir quelques notions de relativité restreinte, même si je vais essayer de rappeler au fur et à mesure tout ce qui est pertinent.

Mode d'emploi : L'introduction est écrite de façon à être normalement compréhensible du grand public, et le survol qui suit demande également moins de notions mathématiques que le reste. Par ailleurs, de façon générale, j'essaie d'écrire mes longues entrées de manière à ce que les parties soient aussi indépendantes que possible les unes des autres (pour faciliter la vie des gens qui lisent en diagonale !) ; les passages qui sont des digressions, des approfondissements, ou qui pour d'autres raisons ne sont absolument pas nécessaires à la compréhension de l'ensemble sont en petits caractères (mais pas systématiquement). J'ai essayé de mettre des liens internes pour expliciter les références avant et arrière, mais je ne l'ai pas toujours fait de façon systématique, d'autant que ce texte a été écrit sur une période tellement longue que j'ai souvent perdu le fil de mes pensées. Pour cette raison, il y a aussi certainement beaucoup de redites dans ce texte, et d'incohérences dans le plan. Certains passages où je dois avouer mon ignorance sont marqués par un gros point d'interrogation (voir notamment ici où j'explique que je ne comprends pas vraiment ce que c'est que la pression en relativité) : si des gens plus qualifiés que moi peuvent m'Éclairer sur ces différents points, j'en serai heureux.

Structure : Après une introduction historique et un survol de la réalité physique, cette entrée comporte deux grandes parties : l'une est consacrée à la cinématique de l'univers de FLRW (les effets de l'expansion de l'Univers sans se poser la question de sa dynamique) l'autre à la dynamique, régie par les équations de Friedmann-Lemaître (pour les impatients : (a′/a)² = 8π·𝒢·ρ/3 − K₀/a² + Λ/3 d'une part, et a″/a = −4π·𝒢·(ρ+3𝓅)/3 + Λ/3 d'autre part, avec a la taille relative de l'Univers, 𝒢 la constante de Newton, ρ et 𝓅 la densité de masse-énergie et la pression respectivement, K₀ la courbure de l'espace pour a=1 et Λ la constante cosmologique), dont il s'agit d'expliquer le sens et comment on peut les résoudre.

Note : Je travaillerai toujours dans des unités dans lesquelles la vitesse de la lumière vaut 1, c'est-à-dire qu'une année et une année-lumière sont fondamentalement la même chose (même si j'essaierai de garder un semblant de distinction pour aider les lecteurs peu habitués à cette identification à se repérer), et la seconde (=seconde-lumière) et le mètre sont simplement deux façons différentes de mesurer les mêmes grandeur, différant par un facteur 299792458 (du coup, le SI passe pour tout aussi bizarre que le système d'unités américain, avec un facteur 299792458 entre la seconde et le mètre, et un facteur 31557600 entre l'année et la seconde).

Plan

Plan
Introduction générale et historique
Survol
La géométrie et la cinématique de l'univers de FLRW
La dynamique de l'Univers et les équations de Friedmann-Lemaître
Finit (non-conclusion : ce dont je n'ai pas parlé)

Introduction générale et historique

(Je rappelle que j'ai écrit une petite introduction générale à la relativité ici — le prétexte était alors de parler de trous noirs, mais ce n'est pas sans pertinence de façon plus générale, surtout à partir du paragraphe qui commence par Il faut donc que je digresse.)

Sans rentrer dans les détails, la relativité a été découverte : en 1905 — l'annus mirabilis d'Einstein — s'agissant de la relativité restreinte, celle qui décrit la cinématique des vitesses proches de celle de la lumière ; et en 1915 pour ce qui est de la relativité générale, celle qui incorpore la gravitation comme un phénomène de courbure de l'espace-temps. De façon un peu simplifiée, on peut dire que cette dernière se présente sous la forme d'une équation (G = 8π·𝒢·T avec 𝒢 la constante gravitationnelle de Newton, mais toute la difficulté est évidemment dans la définition de G et T) qui relie la courbure de l'espace-temps (le membre de gauche, G, de l'équation, ou tenseur d'Einstein) et la matière qui s'y trouve (le membre de droite, T, ou tenseur de stress-impulsion-énergie). Cette équation est trop complexe pour admettre une solution générale explicite : ce qu'on peut faire, c'est soit la traiter numériquement (ce qui pose d'ailleurs aussi des difficultés considérables), soit faire des raisonnements généraux ou des approximations (comme des développements limités), soit chercher des hypothèses simplificatrices, notamment de symétrie, sous lesquelles elle devienne résoluble exactement et explicitement. C'est ainsi que la première solution exacte particulière qui ait été trouvée (en 1916) aux équations d'Einstein est la métrique de Schwarzschild, qui décrit l'espace-temps au voisinage d'une masse ponctuelle au repos (ou plus généralement une masse au repos à symétrie sphérique), et en particulier un trou noir sans rotation.

Je crois que la deuxième solution qui ait été trouvée est celle dont je veux parler ici, en 1922, par le mathématicien russe Alexander Friedmann [Aleksandr Fridman / Александр Фридман] ; elle a été redécouverte indépendemment en 1927 par le mathématicien et physicien (et prêtre catholique) belge Georges Lemaître, et de nouveau par l'américain Howard Robertson et le britannique Arthur Walker dans les années '30. Comme on n'est pas chiche, on la nomme le plus souvent d'après les quatre noms, donc FLRW en abrégé : mais c'est bien Friedmann qui a la priorité, et c'est sans doute Lemaître qui a le plus fait pour la populariser, et pour populariser l'idée du Big Bang, même si ce n'est pas lui qui a introduit le nom, puisqu'il parlait, lui, d'atome primitif pour la singularité au début de la solution.

Ce n'est pas Lemaître, donc, qui a inventé le terme Big Bang : c'est Fred Hoyle, qui a pour la première fois utilisé ces mots, au cours d'un programme radio de 20 minutes de la BBC, le 28 mars 1949, et qui les a ensuite répétés à plusieurs reprises dans des textes ou émissions adressées au grand public, et c'est donc lui qui a popularisé le nom, qui n'est vraiment devenu courant que dans les années '70. Fred Hoyle ne croyait pas au Big Bang, et utilisait ce terme (peut-être choisi pour être un peu ridicule, même s'il l'a lui-même nié plus tard) pour souligner la différence avec la théorie de l'état stationnaire à laquelle il croyait. (C'est d'ailleurs un peu ironique : Hoyle trouvait que la théorie du Big Bang était une ânerie religieuse — comme je l'ai dit, Lemaître était prêtre, et le pape Pie XII, qui y voyait une confirmation du fiat lux biblique, avait mis un certain poids derrière cette théorie, au grand agacement de Lemaître, d'ailleurs. Or de nos jours, les seuls qui refusent de croire au Big Bang sont justement des illuminés religieux — même si des théories d'univers stationnaire ou du moins éternel peuvent trouver un semblant de retour sous forme de différentes hypothèses de multivers d'où germe une « inflation perpétuelle ».) L'histoire du nom est racontée en beaucoup plus de détails dans ce papier par ailleurs extrêmement intéressant (comme les différents autres articles du même auteur que j'ai eu l'occasion de parcourir) ; voir aussi ce que dit Google Ngrams.

La solution de FLRW, donc, décrit l'évolution sous la relativité générale d'un univers homogène et isotrope, c'est-à-dire qu'il est le même à tous les points et dans toutes les directions, ou, si on veut, qu'il n'y a pas d'endroit ni de direction privilégié. Hypothèses très simplificatrices, évidemment, car il n'aura échappé à personne que l'Univers n'est pas exactement le même partout, notamment parce qu'il y a des machins dedans, mais qui ne sont pas si fausses si on regarde ce qui se passe à des échelles extrêmement grandes (et on sait, bien sûr, mesurer la déviation de la réalité par rapport à cette hypothèse, et estimer dans quelle mesure elle modifie les conclusions). L'espace de cet univers est courbe, et cette courbure (qu'elle soit positive=sphérique, nulle=plate=euclidienne ou négative=hyperbolique) est supposée la même en tout point et en toute direction, à un instant donné ; mais elle peut évoluer avec le temps, selon que l'univers s'étend ou se contracte, et c'est cette évolution que décrit l'équation de Friedmann-Lemaître, en fonction de la quantité de matière (densité d'énergie) qui se trouve dedans.

Qualitativement (et grossièrement) parlant, l'expansion de l'Univers est un effet d'inertie : qu'on le voie comme une expansion de l'espace lui-même ou un mouvement d'éloignement de toutes les galaxies les unes par rapport aux autres (les deux points de vue ont leur mérite, même si le premier est peut-être plus correct), il s'agit essentiellement de la première loi de Newton, tandis que l'attraction gravitationnelle de toutes les parties de l'Univers les unes sur les autres va tendre à ralentir l'expansion, peut-être en forçant l'univers à se recontracter sur lui-même — mais on va voir que les choses sont un peu plus compliquées, et notamment que l'existence d'une « constante cosmologique » (ou « énergie du vide », ou « énergie noire ») peut considérablement modifier ce dessin.

Initialement (dès 1917), Einstein et d'autres favorisaient l'idée que l'Univers serait statique, i.e., ni en expansion ni en contraction. Ceci est possible dans le cadre de la relativité générale, et un cas particulier de la solution de FLRW, mais seulement en ajoutant une « constante cosmologique » (dont je vais reparler), répulsive, pour compenser les effets gravitationnels attractifs de la matière dans l'Univers ; et même ainsi, on obtient une solution instable (comme essayer de faire tenir une boule au sommet d'une colline : c'est conceptuellement possible, mais la moindre perturbation va faire que la boule va rouler en bas de la colline). À la toute fin des années '20, Edwin Hubble (celui qui, quelques années plus tôt, avait démontré que les autres galaxies que nous observons ne faisaient pas partie de notre Voie lactée mais étaient d'autres objets du même genre, et a commencé à les classifier), a mesuré la fréquence de la lumière provenant de galaxies lointaines et montré qu'elle était décalée vers le rouge (i.e., vers les basses fréquences), et ce d'autant plus que la galaxie était lointaine. Ce décalage vers le rouge, nous le savons maintenant, est le signe de l'expansion de l'Univers (ceci peut s'expliquer soit par le fait que l'Univers s'est étendu sous le passage de la lumière soit par un effet Doppler lié à la récession des galaxies les unes des autres — de nouveau, les deux explications ont leur mérite, même si le premier est peut-être plus correct) : Lemaître a défendu cette interprétation à partir de 1934. Néanmoins, elle n'a pas été reconnue tout de suite, notamment parce que la première estimation publiée par Hubble (500km/s/Mpc) sur le rapport de proportionnalité entre distance et vitesse d'éloignement et distance — ou « constante de Hubble » — était trop élevée à cause d'erreurs systématiques et amenait une conclusion sur l'âge de l'Univers inférieure[#] à l'âge connu de la Terre. Cependant, dès les années '30, Einstein considérait que c'était une erreur d'avoir introduit la constante cosmologique pour tenter de maintenir un univers stationnaire (George Gamow a prétendu en 1956 que Einstein remarked to me many years ago that the cosmic repulsion idea [=cosmological constant] was the biggest blunder he had made in his entire life : il est presque certain que les mots, et la force de ce rejet, sont une invention de Gamow, mais Einstein avait assurément abandonné l'idée). Gamow, en revanche, a énormément fait pour développer la crédibilité scientifique du modèle du Big Bang et expliquer comment les éléments chimiques sont apparus soit par nucléosynthèse primordiale soit dans les réactions thermonucléaires au cœur des étoiles. Et au début des années '60, le bon ordre de grandeur de la constante de Hubble était connu (~100km/s/Mpc) et l'expansion de l'Univers était assez fermement établie (voir d'ailleurs une référence à ce sujet dans Annie Hall de Woody Allen).

[#] Problème récurrent en sciences : déjà à la fin du XIXe siècle, Lord Kelvin (William Thomson), qui est d'ailleurs maintenant presque aussi connu pour d'autres prédictions ratées que pour ses réussites (c'est le même qui a annoncé en 1900 que les lois de la physique étaient désormais essentiellement toutes connues, et qui a plusieurs fois déclaré que les machines volantes plus lourdes que l'air étaient physiquement impossibles), avait calculé sur la base de considérations thermodynamiques l'âge du Soleil, puis l'âge de la Terre, mais parce qu'il ignorait les réactions thermonucléaires au cœur du Soleil et la convection du manteau de la Terre, il est tombé sur des chiffres totalement faux, à savoir : de l'ordre de quelques dizaines de millions d'années. Ce qui contrariait fort les géologues ; et aussi Charles Darwin et ses épigones, ces derniers se rendant bien compte que 20 millions d'années ne suffisaient pas pour expliquer la diversité de la vie à partir d'un ancêtre commun. Pour comparaison, l'âge de l'Univers est maintenant estimé à 13.8 milliards d'années.

Une confirmation majeure de l'existence du Big Bang a été obtenue en 1964 avec la découverte du rayonnement cosmologique fossile : il s'agit d'un rayonnement de micro-ondes qui baigne l'univers, venant également de toutes les directions (à des fluctuations près que nous connaissons et expliquons maintenant très bien), et dont le spectre correspond à celui d'un corps noir à 3 kelvins (plus précisément, 2.73K = −270.42°C) : comme Robert Dicke et d'autres l'ont expliqué, ceci peut s'interpréter soit comme la température d'un gaz de photons qui était en équilibre thermodynamique avec l'univers un peu après le Big Bang et qui a refroidi depuis jusqu'à cette température de 3 kelvins, soit de façon équivalente comme l'image de l'Univers un peu après le Big Bang (lorsqu'il était à environ 3000K ; ici, un peu après signifie quand même 370000 ans après, qu'on appelle la période de découplement matière-rayonnement, c'est-à-dire en gros le moment où l'Univers est devenu transparent). On dit parfois que le rayonnement cosmologique fossile est responsable pour la « neige » (le bruit de taches blanches) qu'on voit sur les anciens téléviseurs cathodiques et analogiques quand ils ne reçoivent pas de signal, il me semble que c'est exagéré, mais il doit être vrai qu'il est responsable d'une partie du bruit.

En un certain sens, la preuve la plus simple de l'existence du Big Bang est le fait que le ciel nocturne est noir. Alors que dans un univers statique et éternel, le ciel serait de la luminosité de la surface d'une étoile, vu qu'une demi-droite partant dans n'importe quelle direction finirait toujours par tomber sur la surface d'une étoile (ce qui est une façon à peu près équivalente que de dire qu'un univers statique et éternel doit être en équilibre thermodynamique, et que s'il y a des étoiles dedans, il doit être en équilibre avec elles) : même s'il y a éventuellement d'autres façons imaginables de résoudre ce « paradoxe d'Olbers », le Big Bang est la plus simple. Toujours est-il que ce « noir » que nous voyons dans le ciel nocturne est en fait le rayonnement cosmologique fossile, et on peut dire qu'il était à la température de surface d'une étoile (~3000K), mais qu'il a été décalé vers le rouge du fait de l'expansion de l'Univers.

Digression : Notons que le noir du ciel nocturne, ou de façon équivalente sa température d'environ 3K, est essentielle à l'existence de la vie sur Terre : si la vie peut exister, c'est parce que la Terre, qui reçoit autant d'énergie du Soleil qu'elle en envoie dans l'espace, évacue beaucoup plus d'entropie qu'elle n'en reçoit, ce qui lui permet d'en produire localement — ceci fonctionne car on a à disposition à la fois une source chaude, le Soleil et une source froide, le reste du ciel. (Voir par exemple cette entrée pour une petite tentative pour vulgariser la thermodynamique et le concept d'entropie.)

En 1998, des mesures beaucoup plus précises du décalage vers le rouge des galaxies avec la distance ont révélé que non seulement l'Univers est en expansion, mais de plus, cette expansion est elle-même en accélération. L'interprétation (ou au moins l'interprétation la plus simple) de cette accélération, dans le cadre de la cosmologie de FLRW, est que la constante cosmologique, qu'Einstein avait voulu introduire pour garder l'univers statique et ensuite abandonnée, n'est finalement pas nulle ; comme Lemaître l'a observé en 1934, cette « constante cosmologique » peut se réinterpréter comme une densité d'énergie (mais avec pression négative) possédée par le vide lui-même, et il est maintenant habituel de parler d'« énergie noire » pour ce phénomène. Je vais en reparler. Sa valeur, qui domine toutes les autres formes d'énergie dans l'Univers, est égale d'après nos mesures actuelles à environ 6×10⁻²⁷ kilogrammes par mètre cube si on l'interprète comme une densité de masse (ce serait en quelque sorte la masse gravitationnelle du vide), ou, si on préfère la convertir en densité d'énergie (en vertu de la célèbre formule E=m·c²), 5×10⁻¹⁰ joules par mètre cube (avec une pression associée égale à moins 5×10⁻¹⁰ pascals). Des mesures précises du spectre des variations dans le rayonnement cosmologique fossile sont venues confirmer indépendamment l'existence et la valeur de cette constante cosmologique.

Un autre point utile à signaler à ce stade-là est la question de la nature de la courbure de l'Univers : comme je l'ai rapidement évoqué plus haut, la cosmologie de FLRW admet trois courbures possibles — soit l'univers est courbé positivement, comme une sphère (mais une 3-sphère, c'est-à-dire une dimension au-dessus de la sphère habituelle), soit il est courbé négativement, comme l'espace hyperbolique (de dimension 3, c'est-à-dire une dimension au-dessus du plan hyperbolique dont j'ai parlé dans cette entrée et quelques suivantes), soit, ce qui est le cas limite d'une sphère de rayon tendant vers l'infini ou d'un espace hyperbolique de longueur naturelle tendant vers l'infini, il est plat, comme l'espace euclidien que nous visualisons naturellement. (Cette courbure influence aussi la taille de l'Univers : s'il est positivement courbé, il doit être fini ; s'il est négativement courbé ou non courbé, il doit être infini si on croit à son isotropie. Voir aussi plus loin sur la question de la topologie.) Nos mesures actuelles ne permettent pas de conclure entre ces trois possibilités (même si on penche très légèrement en direction de l'hyperbolique) : ce qui est sûr, c'est que l'Univers est presque plat, autrement dit que l'échelle de courbure, si elle n'est pas infinie, est très grande (quelque chose comme une dizaine de fois la « distance de Hubble », qui vaut elle-même 14 milliards d'années-lumière). La question de savoir pourquoi notre Univers est presque plat est d'ailleurs un problème important de la cosmologie, auquel la théorie de l'« inflation » apporte une réponse possible.

Survol

Avant de passer aux mathématiques, je veux faire un petit tour d'horizon très informel et à très haut niveau de quelques choses que nous croyons savoir sur l'Univers. En un certain sens, c'est hors sujet, parce que la cosmologie de FLRW — surtout si je prétends la regarder sous l'angle mathématique — s'intéresse à la géométrie de l'Univers et à son évolution, pas à ce qu'il y a dedans, mais c'est tout de même un peu difficile de ne pas parler du tout de la physique ou de ne pas donner au moins une idée générale sur notre Univers.

Une petite histoire de l'Univers

L'histoire de l'Univers tel que nous le comprenons commence il y a environ 13.8 milliards d'années (en temps cosmique, cf. plus loin) dans un état inimaginablement chaud et dense appelé le Big Bang. Il est douteux de dire que l'Univers soit « apparu » (ou « né ») lors du Big Bang, parce qu'il est douteux que le temps lui-même ait un sens au-delà de cet état : comme l'a signalé Hawking, se demander ce qui vient avant le Big Bang est un peu comme se demander ce qu'il y a au nord du pôle nord : la question n'a peut-être même pas de sens — ou en tout cas, certainement pas le sens naïf qu'on voudrait lui donner ; et le Big Bang n'est pas vraiment plus un acte d'apparition de l'Univers que le pôle nord ne l'est de la Terre : c'est juste l'instant le plus reculé du temps tel que nous le comprenons. Il est tout aussi douteux de dire que le Big Bang ait été une « explosion », parce que c'est l'espace lui-même qui s'étend avec lui, pas des choses qui s'étendent dans l'espace ; et il n'y a pas de centre de l'explosion — ou bien chaque point de l'Univers en est un, et en un certain sens chaque point de l'Univers peut être immobile pendant que l'Univers s'étend.

C'est peu dire que les premiers instants du Big Bang sont mal compris, faute notamment d'une théorie de la gravitation quantique qui permette de décrire l'espace-temps sur des échelles de temps de l'ordre de 10⁻⁴³ secondes (temps de Planck) : selon la théorie classique, le Big Bang apparaît comme une « singularité » de courbure, ce qui est une façon de dire que la théorie ne marche pas. Mais il y a d'autres aspects mystérieux, comme le fait que l'Univers a, selon certaines théories, grandi en taille d'un facteur considérable (passant d'une longueur typique de l'ordre de celle de Planck, soit 10⁻³⁵ mètres, à peut-être 10⁻⁹ mètres, en un temps extrêmement court comme 10⁻³² secondes) : si ces théories sont correctes, cette « inflation » était poussée par l'énergie du vide, dont je vais reparler plus loin, mais qui était beaucoup plus importante à ce moment-là parce que le « vide » était en fait un « faux vide », plus énergétique que le vide actuel ; d'autres variantes hautement spéculatives de la théorie prédisent par exemple que notre Univers fait partie d'un « multivers », perpétuellement dans cet état de « faux vide » où apparaissent des bulles donnant naissance à des Univers comme le nôtre un peu à la manière de l'eau en train de bouillir. Si ces théories sont correctes, il faut comprendre que ce qui est décrit ici (i.e., par la cosmologie de FLRW) est notre partie (bulle) du « multivers ».

La compréhension de l'Univers primordial devient plus claire et moins spéculative quand, vers 10⁻¹² secondes environ après le Big Bang, la température et les énergies deviennent assez faibles pour commencer à être accessibles par les accélérateurs de particules et, du coup, décrites par les théories bien comprises comme le modèle standard. Pour être un peu plus précis, au fur et à mesure qu'il se refroidit, l'Univers franchit un certain nombre de transitions de phases correspondant à l'état des particules élémentaires qui l'habitent : par exemple, la première vaguement connue se produit vers 10⁻¹²s ou 10⁻¹¹s après le Big Bang, quand la température était de l'ordre 10¹⁵K (vers 150GeV), le champ de Higgs a commencé à prendre la valeur qu'il prend actuellement dans le vide, donnant ainsi une masse à un certain nombre de particules élémentaires (quarks, électrons, bosons W et Z, etc.). Plus tard, quand la température est tombée à 2×10¹²K, soit vers 10⁻⁵s après le Big Bang, les quarks se sont condensés en hadrons, comme le proton et le neutron qui forment les noyaux de la matière ordinaire. Quand la température tombe en-dessous de quelques milliards de kelvins, soit quelques secondes après le Big Bang, la majorité des électrons et positrons (=anti-électrons) s'annulent, et par un mécanisme qui n'est pas totalement compris, la matière domine sur l'anti-matière (qui disparaîtra quasiment complètement).

☞ Il est utile de savoir que pendant cette période de la vie de l'Univers (en gros, les premiers 70000 ans après la fin de la période d'inflation éventuelle), dite « dominée par le rayonnement », si t est le temps écoulé, le paramètre a de taille de l'Univers est à peu près proportionnel à t^½, la température T est en gros proportionnelle à t^−½, et la densité d'énergie ρ ou la pression 𝓅 sont proportionnels à T⁴ donc à t⁻². Voici un point de données (donné avec un seul chiffre significatif) permettant d'utiliser ces proportionnalités pour en tirer des ordres de grandeur : à t ≈ 2×10¹²s ≈ 70kyr (« kyr » signifie « millier d'années »), la température était de T ≈ 9000K, la taille de l'Univers était a⁻¹ ≈ 3000 fois plus petite qu'actuellement (dans chaque dimension !), la densité ρ ≈ 9J/m³ (ou 10⁻¹⁶kg/m³) et la pression 𝓅 ≈ 3Pa (pour être un peu plus précis que la proportionalité grossière que j'ai écrite entre T et t^−½, la température va être un peu plus faible que ça aux temps très courts, parce qu'il y a plus de degrés de libertés de particules élémentaires qui sont excités). • Quant à la densité d'entropie s, elle est proportionnelle à T³ (ce qui signifie que l'entropie par volume comobile s·a³ est à peu près constante — mais voir plus bas pour des subtilités — ou que l'expansion de l'Univers dans ses premières phases peut être considérée comme adiabatique) : cette relation s ∝ T³ est encore valable maintenant si on prend pour T la température du rayonnement cosmologique fossile (T=2.73K), car la densité d'entropie s actuelle est dominée par ce rayonnement (s = 4×10⁻¹⁴J/K/m³, ou, dans des unités plus amusantes, 500 méga-octets par mètre cube d'Univers).

Quelques minutes après le Big Bang (température dans les centaines de millions de kelvins), les neutrons se combinent avec les protons pour former des noyaux de deutérium ; en moins de vingt minutes, la nucléosynthèse de l'hélium (ou plus exactement, des noyaux d'hélium) est accomplie. Cette partie-là de l'histoire de l'Univers, ou nucléosynthèse primordiale, est bien comprise. Après ce processus, à part l'hydrogène, environ 25% de l'Univers (en masse de matière baryonique) est formé d'hélium-4, 0.0025% de deutérium (=hydrogène-2), autour de 0.001% d'hélium-3, et environ 1.7×10⁻¹⁰ de lithium-7 : les autres éléments apparaissent en quantité insignifiante.

Environ 370000 ans après le Big Bang, la température étant tombée à 3000K, la matière se désionise : les protons et noyaux d'hélium capturent des électrons pour former des atomes neutres, et en ce faisant ils deviennent transparent. Les photons qui étaient alors en équilibre thermodynamique avec la matière se découplent de celle-ci et forment ce qui va devenir le rayonnement cosmologique fossile. S'ensuit une période appelée les dark ages, parce qu'il n'y a plus rien à voir dans l'Univers, seulement un rayonnement cosmologique en train de se fossiliser, et un mélange d'hydrogène neutre (ainsi que d'hélium, de deutérium, et de traces d'autres éléments), et, bien sûr, de matière noire (voir plus loin).

Dans les premières centaines de millions d'années après le Big Bang apparaissent les premières étoiles : celles-ci se forment lorsque des fluctuations de densité dans l'hydrogène et la matière noire qui remplissent l'Univers (i.e., des défauts d'homogénéité, eux-mêmes venus du Big Bang) causent un effondrement gravitationnel de certaines parties localisées : la température s'y élève suffisamment pour déclencher des réactions de fusion, qui fournissent alors suffisamment d'énergie pour contrer l'effondrement gravitationnel. (Les premières étoiles étaient différentes des étoiles actuelles : probablement plus massives, et certainement très pauvres en autre chose que l'hydrogène et l'hélium vu que le Big Bang n'a quasiment produit que ça.) D'autres fluctuations de densité ont pu donner naissance directement à des trous noirs, autour desquels se forment des disques d'accrétion qui rayonnent quand la matière tombe dans le trou noir : c'est une des explications des objets appelés « quasars ». Enfin, à des niveaux plus élevés, les fluctuations de densité donnent naissance à des (proto)galaxies, voire des proto-amas de galaxies (mais à des échelles encore plus grandes, l'Univers est véritablement très isotrope).

Cette apparition d'étoiles et surtout de quasars fait que l'Univers n'est plus entièrement sombre : à cause de leur rayonnement, l'hydrogène commence à se ré-ioniser, i.e., à reperdre son électron qu'elle avait capturé pour devenir de l'hydrogène neutre : on estime que le processus est à moitié fini 460 millions d'années après le Big Bang, et maintenant la quasi-totalité de l'hydrogène de l'Univers est ionisée.

Nous vivons actuellement à l'ère des étoiles : celles-ci sont des fournaises à réactions thermonucléaires qui convertissent l'hydrogène, puis, dans les phases ultérieures de la vie de l'étoile, l'hélium et les éléments plus lourds eux-mêmes, en éléments plus lourds (jusqu'au fer 56 : les éléments encore plus lourds ne sont produits que lors des supernovas et pas par la fusion « ordinaire »). Lors de la mort des étoiles, les éléments sont pour la plupart libérés dans l'espace, et peuvent servir à la naissance de nouvelles étoiles : notre soleil est ainsi une étoile de (vraisemblablement) troisième génération, ce qui se détecte par la quantité de « métaux » (=tous les éléments plus lourds que l'hélium) qu'il contient. Comme la quantité d'hydrogène à brûler dans l'Univers (ou plutôt, la quantité par unité de volume (comobile) si l'Univers est infini) est limitée, les étoiles ne peuvent continuer à exister indéfiniment : notre Soleil a encore quelques milliards d'années à vivre, et même si les étoiles peu massives (naines rouges, naines brunes), donc peu actives, durent beaucoup plus longtemps que les grosses, elles finiront elles aussi par épuiser leurs réserves, devenant des naines bleues puis blanches qui elles-mêmes prennent un temps extrêmement long pour refroidir en naines noires (l'Univers est sans doute encore trop jeune pour qu'il existe des naines noires).

On peut imaginer plusieurs scénarios finaux pour l'Univers : les plus évidents sont un « Big Crunch » symétrique du Big Bang (et qui pourrait d'ailleurs évoluer vers une sorte de rebond), mais on verra que l'énergie noire devrait exclure ce scénario ; ou bien une mort thermodynamique, dont les détails sont incertains (cela dépend de choses comme le fait que les trous noirs s'évaporent vraiment, ou que le proton puisse se désintégrer), mais qui aboutit en tout cas à un état très inintéressant où plus rien ne se passe parce que l'entropie est maximale (sauf lors de très rares fluctuations statistiques au cours desquelles l'entropie redescend légèrement pendant un temps très court). Cette mort thermodynamique peut avoir lieu dans le cadre d'une expansion de l'Univers qui ralentit (ce qui serait le cas en l'absence d'énergie noire) ou qui accélère exponentiellement (paramètre de Hubble ne tendant pas vers 0), cela conduit à des petites différences.

Un autre scénario imaginable et amusant — mais peu vraisemblable — s'appelle le « Big Rip », et il suppose que l'énergie noire observée, ou au moins une partie d'entre elle, n'est pas, comme cela semble le plus crédible, une constante cosmologique (énergie du vide), mais une forme d'énergie qui a une pression « encore plus négative » que l'énergie du vide (paramètre d'équation d'état w<−1 comme il sera défini plus loin) : dans ce cas, l'Univers connaîtrait une expansion superexponentielle qui diverge en temps fini après avoir « déchiré » toutes les structures des galaxies (peut-être quelques millions d'années avant le Big Rip) aux atomes (une fraction de seconde avant le Big Rip).

L'expansion de l'Univers en bref

L'expansion de l'Univers décrit le phénomène que les galaxies dans l'Univers semblent généralement s'éloigner de nous (éloignement mesuré en pratique, je l'ai déjà dit, par le fait que la lumière qu'elles nous envoient est décalée vers le rouge) : et plus une galaxie est éloignée, plus elle s'éloigne rapidement. Plus précisément, il y a une relation de proportionalité v = H × d entre la distance d et la vitesse v à laquelle les galaxies à cette distance tendent à s'éloigner de nous. J'écris tendent à, parce que bien sûr, ce n'est pas exactement vrai : cette relation s'applique à de très grandes échelles, mais rien n'interdit que localement les galaxies aient (et elles ont !) des mouvements plus compliqués — une galaxie juste à côté peut se rapprocher de la nôtre (c'est le cas d'Andromède), ou tourner autour (c'est le cas des nuages de Magellan), ou quelque chose comme ça (et en plus, « nous » mériterait d'être qualifié, parce que la Terre n'est pas tout à fait « comobile » comme je vais le définir, ne serait-ce que parce qu'elle tourne autour du Soleil, qui tourne autour de la Voie lactée, etc.) ; mais à grande échelle, l'Univers suit cette loi de Hubble (au moins si on a correctement défini d et v, parce qu'il y a des petites subtilités là-dessous aussi).

Cette description peut faire penser que notre place est particulière dans l'Univers (les galaxies s'éloignent toutes de nous !), mais bien sûr il n'en est rien : même à partir d'une description simpliste comme v = H·d (en imaginant que l'espace est euclidien, que la composition des vitesses est galiléenne), en réfléchissant à la composition des vitesses, on peut comprendre que l'origine choisie n'a rien de particulier : chaque galaxie voit chaque galaxie (abstraction faite des petits mouvements locaux) s'éloigner à une vitesse donnée par la même loi. Chaque galaxies a l'impression d'être immobile (on dira qu'elles sont « comobiles ») et de voir toutes les autres s'écarter d'elle de façon isotrope. Pour décrire les choses de façon moins géocentrique, donc : deux galaxies séparées d'une distance d voient chacune l'autre s'éloigner à la vitesse v = H·d (c'est-à-dire que pendant un temps t assez court, leur distance augmente de H·d·t).

C'est pour mieux souligner cette indépendance de l'origine qu'il est plus éclairant de penser que c'est l'espace lui-même qui s'étend : une grande distance dans l'Univers qui valait d à un certain moment vaut, un petit intervalle t de temps plus tard, d + H·t·d = (1 + H·t)·d. Mais il ne faut pas s'imaginer que tout gonfle avec l'espace — par exemple, les atomes, les planètes ou les galaxies (ou même les amas de galaxies) ne grandissent pas — sinon on ne verrait pas de changement du tout ! À plus forte raison, la taille d'un atome ne change pas avec l'expansion de l'Univers (c'est évident, mais ça va mieux en le disant).

Une question qui s'impose assez naturellement est de savoir si on peut prédire, ou décrire facilement, ce qui va rester lié et ce qui va s'étendre avec l'expansion de l'Univers. Il me semble que la réponse est essentiellement la suivante : pour savoir si une structure va rester gravitationnellement liée lors de l'expansion de l'Univers, il faut tout simplement regarder la vitesse d'échappement (donc en gros, les structures qui restent liées sont celles dont la vitesse d'échappement est plus grande que la vitesse H·d sur la taille d de la structure). Par exemple, comme la vitesse d'échappement à notre galaxie est dans les 500km/s alors que la vitesse d'éloignement qui correspondrait à sa taille est environ 100 fois plus faible, la Voie lactée ne sera pas déliée par l'expansion de l'Univers (au moins tant que H ne grandit pas, mais il n'est pas censé grandir). Une autre façon de reformuler la même chose est de comparer la densité typique de la structure avec la « densité critique » ρ_crit := 3H²/(8π·𝒢) qui sera introduite plus loin : une structure qui dépasse cette densité critique reste liée malgré l'expansion de l'Univers.

La quantité H qui intervient ici, et qui a les unités d'une vitesse par unité de distance, c'est-à-dire de l'inverse d'un temps, s'appelle paramètre d'expansion de Hubble, ou, abusivement, « constante » de Hubble. Abusivement, parce qu'elle n'est, justement, pas constante dans le temps.

Les équations de Friedmann-Lemaître ont pour mission de gouverner la manière dont H (donc indirectement, la taille de l'Univers) évolue avec le temps, en fonction de ce qui se trouve dans l'Univers (notamment, la densité de matière). Très grossièrement, on peut dire que l'Univers a été « lancé » par le Big Bang avec une certaine expansion, mais la gravitation, qui fait que les différentes parties de l'Univers s'attirent les unes les autres, va vouloir la ralentir. Il y a néanmoins une complication, à savoir que l'« énergie noire », bien qu'elle ait une densité d'énergie positive, tend, pour des raisons pas évidentes à expliquer intuitivement, à provoquer une sorte de répulsion universelle qui peut plus que compenser la gravitation.

Il y a un autre facteur à prendre en compte : c'est la courbure de l'Univers. Celle-ci peut être positive, c'est-à-dire que l'Univers ressemble à la surface d'une sphère mais avec une dimension de plus (dans ce cas, l'expansion se passe comme si le rayon de la sphère — ou rayon de courbure — augmentait avec le temps : imaginer un ballon qu'on gonfle, si bien que tous les points à sa surface s'éloignent les uns des autres). Ou elle peut être nulle, comme décrite par la géométrie euclidienne. Ou elle peut être négative, c'est-à-dire de type hyperbolique (voir ici pour une introduction), qui a aussi une notion de rayon de courbure. Il ne faut cependant pas s'imaginer qu'il existe une sorte de super-espace de dimension plus élevée dans lequel vivrait l'espace de notre univers : même s'il est une 3-sphère, cette 3-sphère ne vit pas dans quelque chose d'autre. La courbure est simplement une propriété intrinsèque, qu'on peut en principe mesurer, par exemple, en considérant la somme des trois angles d'un triangle (qui va être supérieure, égale, ou inférieure à 180° selon qu'on a affaire à un espace courbé positivement, non courbé, ou courbé négativement). En tout état de cause, il semble que notre Univers soit, sinon exactement plat, du moins très près de l'être (=de courbure très faible, i.e., de rayon de courbure très élevé).

En l'absence d'énergie noire, les équations de Friedmann-Lemaître prédisent que le destin de l'Univers est lié à sa courbure : si la courbure est positive, l'Univers s'étend jusqu'à une taille maximale, puis se recontracte jusqu'à retomber sur une singularité analogue au Big Bang (qu'on peut donc appeler « Big Crunch »). Si la courbure est négative, l'Univers s'étend indéfiniment, quoiqu'en ralentissant (en tendant vers une « vitesse » d'expansion a′ minimale). Si la courbure est nulle, l'Univers s'étend indéfiniment, mais de plus en plus lentement (en tendant vers une vitesse d'expansion a′ nulle). En présence d'une énergie noire positive (« de type de Sitter »), l'Univers peut s'étendre indéfiniment même s'il est à courbure positive ; dans ce cas, et nécessairement s'il est de courbure nulle ou négative, l'expansion finit par accélérer de façon exponentielle et donc la taille de l'Univers grandit de même. C'est le destin qui semble actuellement le plus probable pour notre Univers.

(Il faut sans doute préciser le exponentiel du paragraphe précédent : il est vrai que la taille a de l'Univers — mesurée par rapport à une taille de référence quelconque — et donc sa dérivée a′, augmentent exponentiellement, donc la distance entre deux galaxies (« comobiles ») fixées augmente exponentiellement. Néanmoins, la « constante » de Hubble H, elle, tend vers une valeur finie, d'ailleurs pas forcément la plus grande valeur de son histoire : c'est-à-dire que la vitesse d'expansion à distance fixée n'augmente pas exponentiellement. De façon plus concise : H est le facteur exponentiel d'expansion, ce n'est pas lui qui augmente exponentiellement. D'ailleurs, on pense que pour notre Univers, H tendra vers une valeur environ 80% de ce qu'elle est actuellement.)

Une subtilité : En fait, tous ces scénarios sont réversibles dans le temps : par exemple, vu qu'on peut avoir un univers qui part d'un Big Bang et s'étend indéfiniment, on peut aussi en avoir un qui se contracte depuis un passé indéfini et termine en Big Crunch (singularité en temps fini). Pour dire les choses autrement, la dynamique de l'Univers ne définit pas la flèche du temps, la flèche du temps est définie par un minimum d'entropie — et un des problèmes profonds et complètement non-résolu de la physique est de savoir pourquoi le Big Bang est un état d'entropie très faible (voir aussi plus bas).

Matière noire et énergie noire

Une des surprises de la cosmologie est que tout ce que nous voyons dans l'Univers (les étoiles visibles des galaxies, et les planètes qui tournent autour), en fait, toute la matière « ordinaire » (pour laquelle on utilisera le terme baryonique) ne constitue qu'une petite proportion, environ 5%, de toute la masse-énergie qui gravite dedans. Une proportion plus importante, estimée à 27% du total, est constituée de matière noire, et les 68% restants sont de l'énergie noire. Il faut donc que j'explique un peu ce que sont ces choses (i.e., le peu qu'on en sait), pourquoi on les distingue, et comment on sait qu'elles existent.

La matière noire est la moins mystérieuse des deux. On ne sait pas ce que c'est, mais on sait pas mal de choses à son sujet. Il s'agit d'une forme de matière (elle bouge, se concentre typiquement en halos autour des galaxies, etc.), mais qui n'interagit presque pas avec la matière ordinaire (=baryonique) : presque pas, c'est-à-dire, sans doute uniquement par gravitation. Il s'agit probablement d'une particule WIMP, c'est-à-dire Weakly Interacting Massive Particle, mais ce terme n'est pas vraiment une explication, juste une description. Notons qu'à la différence des neutrinos (qui interagissent aussi faiblement, mais quand même via les interactions faibles, alors que la matière noire probablement même pas), qui vont presque à la vitesse de la lumière, on sait que la matière noire n'est pas constituée de particules relativistes — elle est plus ou moins « froide ». Les preuves d'existence de la matière noire ne sont pas uniquement cosmologiques : le premier signe de son existence vient de la rotation des galaxies, qui ne se comporte pas comme elle devrait s'il n'y avait que la matière visible (celle-ci est concentrée au centre, donc on attendrait une courbe de rotation suivant en gros la 3e loi de Kepler ; et en fait, on obtient une courbe qui montre qu'il doit exister un halo de matière à peu près sphérique englobant la galaxie). Mais maintenant, les preuves d'existence de la matière noire sont très nombreuses, on a des simulations qui prédisent très bien la façon dont elle tend à se répartir, on la « voit » parfois par des effets de lentille gravitationnelle, on a confirmation de son effet sur le rayonnement cosmologique fossile — bref, il y a très peu de doutes sur son existence, c'est juste qu'on ignore de quel genre de particule elle est formée.

•

L'énergie noire est tout autre chose, et ce n'est vraiment pas une forme de « matière » en un sens raisonnable du terme : c'est, au moins dans l'interprétation la plus simple et la plus répandue, une propriété du vide lui-même, une énergie du vide ; elle n'a pas de vitesse ni de température (contrairement à la matière noire), (on pense qu')elle a la même densité en tout point de l'espace et du temps et ne se dilue pas quand l'Univers s'étend, et elle a d'autres propriétés bizarres comme celle d'avoir une pression négative. J'ai déjà dit qu'Einstein avait avancé cette idée d'une « constante cosmologique » dès 1917, pour tenter de garder un univers statique, et qu'il y avait ensuite renoncé suite aux observations de Hubble. L'indice de l'existence de l'énergie noire est venue en 1998 quand on a constaté que l'expansion de l'Univers s'accélérait (ce qui ne peut s'expliquer que par l'existence d'une force répulsive du type de celle que donne la constante cosmologique à cause de la pression négative — voir plus loin) : des observations plus fines ont permis de confirmer que cette force semble avoir toutes les caractéristiques de l'énergie noire décrite par une constante cosmologique (essentiellement, elle a la bonne « équation d'état » à la précision de nos mesures).

Comment est-il possible que le vide lui-même possède de l'énergie, est-on naturellement tenté de demander ? Comment se fait-il qu'on ne s'en aperçoive pas ? Et n'est-il pas possible de récupérer cette forme d'énergie pour en faire quelque chose d'utile ? La raison pour laquelle l'énergie du vide ne se manifeste normalement pas en physique est un peu analogue à la raison pour laquelle nous ne sentons pas la pression atmosphérique autour de nous : une feuille de papier n'est pas détruite par la pression atmosphérique parce qu'il y a la même pression des deux côtés. De même, l'énergie et la pression du vide ne s'appliquent pas qu'au vide mais viennent s'ajouter à toutes les autres formes d'énergie et de pression dans l'Univers ; or, dans toutes les interactions physiques autres que la gravitation, seules importent des différences d'énergie et de pression, donc cette énergie et pression du vide n'apparaissent pas — il n'y a que la gravitation qui puisse la sentir, et en pratique il faut se placer à l'échelle de l'Univers pour qu'elle devienne sensible.

☞ L'existence de l'énergie du vide n'est pas tellement une surprise : la théorie quantique des champs (voir ce que j'en disais ici) explique en effet que le vide, qui est simplement le niveau d'énergie le plus bas de la théorie, est un état complexe (qui peut avoir un diagramme de phases, des champs non nuls comme le condensat de Higgs, etc.), et en quelque sorte, des particules et anti-particules sont sans arrêt en train d'y apparaître pour disparaître de nouveau ; il n'est donc pas du tout nécessaire que le vide ait une énergie nulle, et d'ailleurs, il y a des expériences bien réelles, la plus célèbre étant la mesure de l'effet Casimir, où cette énergie apparaît, précisément parce qu'on la modifie. La théorie quantique des champs, pour autant, n'attribue pas une valeur précise à l'énergie du vide (ou, si elle le fait, c'est l'infini, et elle explique ensuite qu'on peut ignorer cet infini), parce que la seule chose qui importe est une différence d'énergie. Il y a cependant une force (que nous ne savons pas décrire de façon quantique, et c'est bien là le cœur du problème) pour laquelle la valeur exacte de l'énergie et pas juste des différences a une importance, c'est la gravitation — donc il n'est pas si surprenant de découvrir que le vide a bien un effet gravitationnel. Ce qui est surprenant, en revanche, c'est que cet effet soit si faible (5×10⁻¹⁰ joules par mètre cube) : certes, j'ai dit qu'on ne savait pas la calculer faute d'une théorie de la gravitation quantique, mais une analyse dimensionnelle suggère au moins que la valeur devrait être de l'ordre d'une énergie de Planck par volume de Planck, c'est-à-dire 5×10¹¹³ joules par mètre cube, ce qui est donc faux par un facteur 10¹²³ et mérite donc la palme de la plus mauvaise prédiction de toute la physique. Et comme je le signalais dans l'entrée que j'ai liée ci-dessus, même si on ignore ce raisonnement d'analyse dimensionnelle au niveau de l'échelle de Planck, on connaît au moins un champ qui existe vraiment et qui prend une valeur non-nulle (mesurée) dans le vide, le champ de Higgs, et ce champ a une énergie de −2.5×10⁴⁵ joules par mètre cube par rapport à l'état où il serait nul, donc ce terme doit apparaître quelque part dans la constante cosmologique, ce qui veut dire que les autres termes qui la forment doivent réussir à compenser cette énergie avec une précision extraordinaire (mais pas infinie) pour que le total fasse 5×10⁻¹⁰ joules par mètre cube. Il s'agit là d'un des plus profonds mystères de la physique fondamentale. (Voir aussi ce que dit John Baez à ce sujet.)

Notons par ailleurs que si j'ai dit que l'énergie du vide ne change pas avec l'endroit ou avec le temps, il y a une nuance importante à apporter : ceci est vrai pour un vide donné. La théorie quantique des champs rend imaginable l'existence de plusieurs vides différents (qui peuvent être métastables, ou carrément instables, comme celui où le champ de Higgs est nul, et peut-être une stabilité qui dépend de la température, comme les phases solide/liquide/gazeuse d'une substance ordinaire), avec des niveaux d'énergie différents : l'énergie du vide sera différente selon le vide considéré. (La théorie quantique des champs prédit en principe les différences entre ces énergies : le mystère, comme expliqué dans le paragraphe précédent, c'est qu'on ne sait pas quel sens a le « niveau zéro », qui n'est ressenti que par la gravitation.) Certaines théories d'« inflation » proposent que l'Univers a commencé dans un « faux vide » plus énergétique que le vide actuel, et que cet état (et l'énergie du vide associée) a causé une augmentation exponentielle de la taille de l'Univers au tout début de son histoire, avant de retomber dans le vide actuel (d'énergie plus basse, donc plus stable).

Mais si on n'aime pas cette histoire d'énergie du vide, il est aussi possible de ne pas la regarder comme telle et de considérer la constante cosmologique comme une constante Λ qui vient modifier les équations d'Einstein un peu comme si le vide avait une densité d'énergie ρ = Λ/(8π·𝒢) et une pression opposée, sans pour autant considérer qu'il s'agit de quelque chose de réel — la différence est une simple question de point de vue.

Remarquons enfin que l'énergie du vide observée dans notre Univers est positive (avec une pression négative, j'expliquerai ça plus loin), mais conceptuellement, rien n'empêche qu'elle soit négative (avec une pression positive), qui provoquerait alors à coup sûr une recontraction de l'Univers sur lui-même. Si on veut rendre les signes plus clairs, on pourra parler de constante cosmologique de type « de Sitter » pour Λ>0 (correspondant à une densité d'énergie positive et une pression négative, tendant à faire accélérer l'expansion de l'Univers) ou de type « anti-de Sitter » pour Λ<0 (correspondant à une densité d'énergie négative et une pression positive, tendant à faire se recontracter l'Univers).

La géométrie et la cinématique de l'univers de FLRW

Je veux maintenant décrire en un peu plus de détails à quoi ressemble l'espace-temps de l'univers de FLRW en laissant pour l'instant de côté sa dynamique. Un certain soin doit être apporté à la définition des coordonnées (temps cosmique et coordonnées comobiles d'espace) si on ne veut pas faire des erreurs ou tomber dans des paradoxes : je vais donc expliquer un peu longuement leur construction, quitte à dire des choses qui pourront passer pour des trivialités. Il est vrai que les subtilités des définitions qui vont suivre n'apparaîtront peut-être qu'aux lecteurs qui ont déjà de bonnes notions de relativité, mais les définitions elles-mêmes ne devraient pas, j'espère, paraître trop opaques (si on veut juste lire les grandes idées, on peut lire en diagonale les quelques sections qui vont suivre). Le mot le plus important à retenir est le mot comobile, qui signifie qui bouge avec l'Univers : c'est celui-là qu'il faut définir le plus précisément, et les coordonnées en découleront assez naturellement. Et le paramètre le plus important est certainement a, qui mesure le rapport dans la taille de l'Univers entre un instant t₀ choisi arbitrairement et l'instant t considéré.

L'existence de référentiels privilégiés

Comme je l'ai dit plusieurs fois ci-dessus, on se base sur l'hypothèse que l'espace est homogène et isotrope, c'est-à-dire, le même dans tous les points et dans toutes les directions. Mais pour que ceci ait même un sens, il faut d'abord séparer l'espace et le temps, ce qui n'est pas naturel en relativité : car l'Univers n'est certainement pas isotrope pour tout le monde (un rayon cosmique qui avance à près de la vitesse de la lumière voit évidemment une direction privilégiée, celle depuis laquelle les galaxies semblent toutes arriver vers lui). Autrement dit, il existe dans l'univers de FLRW des référentiels (observateurs) privilégiés, appelés observateurs comobiles, et ce sont eux qui voient l'espace homogène et isotrope. Pour dire les choses autrement, il existe une notion de « repos absolu », ou sinon, de vitesse absolue, c'est-à-dire de repos ou vitesse par rapport à l'Univers : concrètement, cela va se voir en mesurant le rayonnement cosmologique fossile — si on n'est pas au repos par rapport à lui, on mesurera une inhomogénéité dans ce fond, avec un côté décalé vers le rouge (celui dont on s'éloigne plus) et un côté décalé vers le bleu (celui vers lequel on s'approche plus) par rapport à la moyenne, ou, si on veut, un moment dipolaire. À titre d'exemple, le Soleil n'est pas au repos par rapport à l'ensemble de l'Univers (nous ne sommes pas des observateurs comobiles), on sait que sa vitesse vaut 370km/s (dans la direction approximative de l'étoile φ Leonis), à savoir 630km/s dus à la vitesse de la Voie lactée elle-même, partiellement compensés par la vitesse du Soleil à l'intérieur de la galaxie ; cette vitesse étant néanmoins relativement faible (c'est environ 0.1% de la vitesse de la lumière), on peut souvent faire « comme si » le Soleil était un observateur comobile.

Cette existence d'une notion de « repos absolu » peut sembler contradictoire avec le principe de relativité, mais elle ne l'est pas : les lois de la physique restent les mêmes dans tous les référentiels, c'est juste la matière formant l'Univers qui définit un référentiel privilégié, et c'est par rapport à la « moyenne de toute cette matière » qu'on définit une vitesse. Une autre façon de dire les choses est que l'espace est isotrope, dans l'univers de FLRW, mais l'espace-temps, lui, ne l'est pas : l'espace-temps a une direction privilégiée (le « sens du temps » pour la matière dans l'Univers). Il y aura néanmoins un cas spécial, c'est quand l'Univers n'est rempli que d'énergie du vide, ce qu'on appelle les univers de de Sitter ou anti-de Sitter, où l'espace-temps tout entier est homogène et isotrope (et en dimension 1+3 c'est la seule possibilité — outre, bien sûr, l'espace-temps plat) : dans ce cas, il y aura un choix arbitraire à faire pour définir les observateurs comobiles ; mais pour l'instant, on va ignorer ce cas particulier et considérer qu'on a toujours une notion bien définie d'observateur comobile.

Ces remarques étant faites, on peut maintenant être plus précis sur les observations qui vont caractériser l'expansion (ou éventuellement, la contraction) de l'Univers : on suppose qu'on a disposé dans l'Univers tout un réseau d'observateurs comobiles (chacun, donc, constate que l'Univers est isotrope autour de lui et en conclut qu'il est « au repos absolu », c'est-à-dire au repos par rapport à la matière dans Univers, ou concrètement, par rapport au rayonnement cosmologique fossile) ; l'expansion (ou la contraction) se caractérise alors par le fait que chacun de ces observateurs voit tous les autres s'éloigner de lui (ou se rapprocher, dans le cas d'une contraction), avec une vitesse qui ne dépend pas de la direction (par isotropie !) mais qui, convenablement définie, est proportionnelle à la distance ; et les signaux que les autres émettent apparaissent décalés vers le rouge (ou vers le bleu dans le cas d'une contraction).

Comme je l'ai évoqué plus haut, ce décalage vers le rouge (ou vers le bleu) peut s'interpréter de deux façons différentes : on peut dire qu'il s'agit d'un effet Doppler reflétant la vitesse d'éloignement, ou que l'expansion de l'Univers a fait grandir la longueur d'onde des photons au cours de leur déplacement : mon avis est que ces deux interprétations sont également correctes et sont simplement deux façons différentes de voir la même chose (l'une étant faite dans un système de coordonnées attaché à l'observateur, l'autre dans le système de coordonnées comobile qui s'étend avec l'Univers), mais certains insistent pour dire que seule une interprétation est la bonne.

Une autre question vaseuse qui revient souvent quand on parle de l'expansion de l'Univers est de savoir si celle-ci peut avoir lieu plus rapidement que la vitesse de la lumière. La réponse est : oui, mais c'est surtout que la question est mal posée — parce qu'on ne sait pas exactement ce qu'est une vitesse, et c'est une des choses que je vais devoir expliquer. Indubitablement, il existe des points dans l'Univers suffisamment espacés pour que la distance entre eux (convenablement définie : il s'agit de « distance propre ») augmente de plus qu'une année-lumière en une année, mais il n'est pas dit que ce soit une bonne façon de présenter les choses.

Temps cosmique

La relativité (restreinte, et a fortiori générale) prédit que différents observateurs ne sont pas d'accord entre eux sur la notion de temps (par exemple, la séparation de temps entre deux événements). Quand on parle de temps d'un événement, il faut donc être précis sur ce qu'on entend par là : le temps cosmique est le temps mesuré par les observateurs comobiles. Plus précisément, le temps cosmique d'un événement est l'intervalle de temps mesuré, par un observateur comobile se trouvant là, depuis le Big Bang jusqu'à l'événement en question. (À titre d'exemple, le temps cosmique estimé au moment où j'écris est : 13.8 milliards d'années.)

Pour les plus experts, il vaut peut-être la peine de préciser ce qui se passerait si on n'avait pas de Big Bang (ou si on ne voulait pas s'en servir) comme point de synchronisation. Imaginons un réseau d'observateurs comobiles : chacun d'entre eux voit les horloges de tous les autres tourner plus lentement que la leur (si l'Univers est en expansion ; plus vite s'il est en contraction), c'est une des manifestations du décalage vers le rouge. Comment, dans ces conditions, décider d'une origine commune du temps cosmique ? La réponse est de faire appel, pour synchroniser les horloges de A et B (deux observateurs comobiles) à un troisième, M situé mi-chemin entre eux (cette propriété restera vraie avec l'expansion de l'Univers : la notion de milieu est comobile) : comme M voit les horloges de A et B tourner au même rythme (plus lent que la sienne), il peut calculer le décalage (qui ne change pas avec le temps) entre l'horloge de A vue par lui et l'horloge de B vue par lui, et communiquer à eux la correction à apporter pour qu'elles soient synchronisées. Avec cette expérience de pensée, on peut imaginer tout un réseau d'observateurs comobiles dont les horloges sont synchronisées : cela signifie essentiellement que chacun voit les horloges de tous les autres situés sur une sphère de même distance indiquer la même heure.

On dispose maintenant d'une notion rigoureusement définie d'espace à l'intérieur de l'espace-temps de FLRW : une tranche d'espace est définie par l'ensemble de tous les points de l'espace-temps qui ont le même temps cosmique. Pour les plus experts, je dois attirer l'attention sur le fait suivant : ces hypersurfaces d'espace que je viens de définir ne sont pas totalement géodésiques, c'est-à-dire qu'il ne s'agit pas de l'ensemble de tous les événements qu'un observateur comobile donné considère comme simultanés — plutôt, il s'agit d'une notion de simultanéité passée localement d'observateur comobile en observateur comobile.

Distance et coordonnées comobiles

Une fois qu'on a découvert l'existence d'une notion de « repos absolu » (celle définie par les observateurs comobiles, ceux qui observent que l'Univers — ou concrètement, le rayonnement cosmologique fossile — est isotrope), il vient avec elle une notion d'« être au même endroit » à des temps différents : deux événements (séparés dans le temps) ont lieu au même endroit dans l'Univers lorsqu'un observateur comobile qui a vu l'un se dérouler là où il est voit aussi l'autre se dérouler là où il est (oui, cette définition est passablement triviale, mais je tiens surtout à préciser que cette notion de « même endroit » n'a normalement pas de sens en relativité — c'est peut-être la découverte la plus importante de Galilée (oui, Galilée !) — et c'est de nouveau l'hypothèse faite sur l'univers de FLRW qui lui donne un sens ici).

On appellera coordonnées comobiles (d'espace) un système de coordonnées sur l'espace qui respecte cette notion d'« être au même endroit », c'est-à-dire : tel que deux événements situés au même endroit (mais séparés dans le temps) reçoivent les mêmes coordonnées d'espace. De nouveau, ma façon de poser cette définition peut paraître incroyablement minutieuse ou pédante, mais il faut attirer l'attention sur ce qu'elle écarte : même si le Soleil était rigoureusement comobile (et j'ai expliqué qu'il ne l'était pas tout à fait, il se déplace à environ 370km/s dans l'Univers), une indication de distance comme « à 3 milliards d'années-lumière du Soleil » ne serait pas une coordonnée comobile, justement à cause de l'expansion de l'Univers : une galaxie, elle aussi supposée comobile, distante de 3 milliards d'années-lumière de nous maintenant, sera plus éloignée dans un milliard d'années, et était moins éloignée il y a un milliard d'années.

Pour définir une distance comobile, on choisira donc un instant de référence (en temps cosmique) ; comme nous vivons essentiellement un instant à l'échelle de l'Univers, l'instant de référence (ou époque) est généralement « maintenant », c'est-à-dire, « vers l'an 2000 », ça suffit largement pour la précision de nos mesures. Une fois cet instant de référence t₀ choisi, la distance est effectivement comobile : une galaxie (supposée comobile) située à 3 milliards d'années-lumière du Soleil (lui-même abusivement supposé comobile, et sinon, à remplacer par l'observateur comobile qui occupe le même emplacement que le Soleil vers l'an 2000) en distance comobile, le sera aussi dans l'avenir et l'était aussi dans le passé, puisque par définition cette distance comobile se rapporte à l'instant de référence. Si on préfère, la distance comobile est la distance mesurée en années-lumière-en-l'an-2000 entre les points en question. Si on compare deux événements qui ont lieu en même temps (plus exactement, au même temps cosmique t), on peut bien sûr préférer mesurer la distance à ce temps-là, et dans ce cas on parle de distance propre, cette distance propre étant proportionnelle à la distance comobile par un facteur qui dépend du temps t auquel on la considère (et qui vaut 1 pour l'époque t₀ choisie).

Voici maintenant une définition plus rigoureuse de la distance comobile et de la distance propre : si on déploie un réseau d'observateurs comobiles dans l'Univers, en synchronisant les horloges comme je l'ai indiqué pour définir le temps cosmique, et qu'à l'instant t₀ (époque de référence), chacun mesure la distance à ses proches voisins (suffisamment petite pour que les effets de courbure soient négligeables), ces distances définissent la structure métrique sur l'espace à l'instant t₀, et en particulier la distance propre à t₀, la distance comobile étant alors la même. Pour les experts : il faut prendre garde au fait que ces distances ne sont pas des distances géodésiques. Le mieux, pour visualiser les choses, est de penser à un cône de révolution : le temps cosmique est alors donné par la distance au sommet du cône, la distance propre entre deux points à même distance t du sommet est la distance mesurée le long du cercle de distance t du sommet, ce qui n'est généralement pas pareil que la plus courte distance sur le cône ; la distance comobile est bien sûr (proportionnelle à) la séparation angulaire mesurée au sommet du cône.

La distance comobile peut ensuite être complétée en un système complet de coordonnées comobiles : si on suppose que nous sommes un observateur comobile, pour repérer la position d'une galaxie elle aussi supposée comobile, on utilisera sa distance à nous (comobile, donc par exemple en années-lumière-de-2000) ainsi que deux angles définissant la direction de cette galaxie ; ces angles doivent être rapportés par rapport à des directions qui ne changent pas (i.e., ne tournent pas), de façon que ces angles d'objets comobiles lointain ne varient pas avec le temps. (En pratique, un tel système de coordonnées angulaires est réalisé par ce qu'on appelle le repère de référence céleste international, en observant, justement, quelques centaines d'objets extragalactiques choisis pour leur stabilité.) Le choix habituel d'angles consiste à choisir un pôle et un méridien célestes et d'appeler θ (colatitude) l'angle mesuré depuis le pôle du système de référence céleste (parfois on préfère la latitude, π/2 − θ, qui est l'angle mesuré depuis l'équateur) et φ (longitude) l'angle projeté sur l'équateur et mesuré depuis le méridien du système de référence céleste. (Dans le cas où il s'agit du pôle terrestre et du méridien de l'équinoxe de printemps, on parle de déclinaison et ascension droite pour la latitude et la longitude ; mais pour les objets lointains, on a plutôt tendance à utiliser le système de coordonnées galactiques qui effectue une simple rotation pour que les axes coïncident avec des directions privilégiées dans notre galaxie. De toute façon, l'isotropie de l'Univers empêche qu'on puisse choisir des angles fondamentalement privilégiés.)

Digression : Les experts vraiment pinailleurs devraient me faire la remarque suivante : le fait pour un système d'axes de « ne pas tourner » est une considération inertielle (essentiellement, donnée par un gyroscope idéalisé, interféromètre Sagnac, ou de façon plus abstraite, par transport parallèle), ce qui est a priori distinct de la question de voir les objets lointains rester à la même position. Les deux notions vont, d'ailleurs, différer sur la Terre, à cause de la précession de de Sitter due à l'orbite terrestre autour du Soleil et dans une moindre mesure de l'effet Lense-Thirring dû à la rotation de la Terre et du Soleil eux-mêmes. Mais si on avait un observateur comobile et loin de toute perturbation stellaire ou planétaire, la question de savoir si le système inertiel et le système défini par les objets lointain coïncident revient à la question de savoir si l'Univers lui-même est en rotation, une question qui a énormément fasciné Gödel (le mathématicien plus connu pour ses travaux en logique, et qui a découvert une très belle solution des équations d'Einstein montrant qu'il est concevable que l'Univers tout entier soit en rotation) ; cette question, néanmoins, reçoit une réponse négative dans le cas de l'univers de FLRW parce que la rotation contredit l'isotropie à cause de l'existence d'un axe de rotation. Cette question a aussi un rapport avec le principe de Mach cher à Einstein et selon lequel le sens inertiel de la rotation devrait être définie, justement, par le mouvement par rapport aux objets lointains — mais ceci est faux en relativité générale.

La forme et la courbure de l'espace

Maintenant que la notion de coordonnées comobiles d'espace a été définie précisément, il est permis de se pencher sur la question de la forme de cet espace.

L'espace de FLRW (vu par les observateurs comobiles) étant homogène et isotrope, il n'y a, en dimension 3, que trois formes possibles, ou plus exactement, deux formes possibles et un cas limite entre elles : la 3-sphère, l'espace hyperbolique de dimension 3, et, comme cas limite, l'espace euclidien ordinaire. ((Bon, techniquement, il y aussi l'espace projectif de dimension 3, obtenu à partir de la 3-sphère en identifiant les points antipodaux, qui serait aussi homogène et isotrope, mais on a fortement tendance à penser que ce ne serait pas naturel, ~~ne serait-ce que parce que l'Univers ne serait alors pas orientable ;~~ et de toute façon, ce cas se traite comme la 3-sphère.))

La 3-sphère est l'analogue naturelle de la surface d'une sphère ordinaire (=2-sphère), mais avec une dimension de plus ; il ne faut cependant pas penser qu'elle est courbée dans quelque chose de plus grand (comme quand on pense à la 2-sphère à l'intérieur d'un espace euclidien de dimension 3) : elle est juste intrinsèquement courbée. (Cf. par exemple ce que je racontais ici sur la notion de courbure en général.) Voir cette vidéo que j'ai faite, ou celle-ci, faite par un copain et plus correcte que la mienne, pour avoir une petite idée de ce à quoi peut ressembler la vie (ou en tout cas, la vue) dans une 3-sphère, en l'occurrence pavée par 120 dodécaèdres.

Puisque je parle du pavage de la 3-sphère par 120 dodécaèdres et de cosmologie, je ne peux pas ne pas dire un mot de la spéculation selon laquelle la forme de l'Univers serait non pas la 3-sphère mais l'« espace dodécaédral de Poincaré » : l'espace en question est tout aussi bien représenté par les vidéos que je viens de lier, tout dépend des points qu'on choisit de considérer comme identiques — en effet, cet espace dodécaédral s'obtient en identifiant les 120 dodécaèdres les uns aux autres au moyen d'une transformation qui identifie deux faces d'un dodécaèdre quelconque après rotation de π/10 (voir par exemple ici pour des détails, et voir ici dans les Notices de l'AMS pour des explications sur pourquoi ça peut intéresser la cosmologie) ; on peut dire qu'il s'agit d'un quotient de la 3-sphère par un groupe d'isométrie d'ordre 120 et sans points fixes (pour les mathématiciens, plus précisément : le groupe des isométries d'un dodécaèdre, vu comme sous-groupe de SO₃ et transporté à SO₄ isogène à SO₃×SO₃ ; pour plus de détails on pourra consulter la partie III du livre de Wolf, Spaces of Constant Curvature, consacrée à la classification des quotients de la n-sphère par des groupes d'isométrie sans points fixes) : du coup, il n'y a pas de problème à le décrire dans le cadre de la cosmologie de FLRW — il n'y a en effet aucune différence conceptuelle entre une 3-sphère quotientée par ces 120 isométries et une 3-sphère qui se trouve être habitée par une distribution de matière (ou de champs quelconques) symétrique par les mêmes isométries, et comme de toute façon la cosmologie de FLRW suppose que la matière est la même partout, en particulier, elle a toutes les isométries possibles. Mais il faut que je souligne qu'un tel espace, même s'il est de courbure constante et isotrope, n'est pas lui-même globalement homogène ni isotrope — comme je le disais ci-dessus, les seuls espaces de dimension 3 de courbure positive qui sont homogènes et isotropes sont la 3-sphère elle-même et son quotient par l'antipodie, à savoir l'espace projectif de dimension 3. L'espace dodécaédral de Poincaré, donc, s'il est décrit par la cosmologie de FLRW, ne vérifie pas les hypothèses justifiant celle-ci. (Voir aussi plus loin sur la question de la topologie.)

Pour ce qui est de l'espace hyperbolique de dimension 3, il est de même tout à fait analogue au plan hyperbolique dont j'ai parlé en long et en large dans des entrées passées (à commencer par ici), et possède la même « dualité » par rapport à la 3-sphère que le plan hyperbolique par rapport à la 2-sphère. Le point le plus important, cependant, est que les mêmes formules de trigonométrie du triangle fonctionnent en dimension 3 qu'en dimension 2 (puisqu'un triangle, de toute façon, vit en dimension 2) ; il faudra cependant faire attention, avant de les appliquer, à mesurer les distances dans les unités « naturelles », c'est-à-dire en multiples du rayon de courbure (=radians dans le cas de la sphère), ce dont il faut que je parle.

En effet, quand on veut mesurer une distance sur une sphère, il y a une unité naturelle : le rayon de la sphère. Ceci s'applique encore à une 3-sphère. J'ai expliqué ci-dessus qu'il ne faut pas imaginer l'espace de la relativité générale comme faisant partie d'un espace de dimension plus grande dans lequel il serait « plongé » : la notion de rayon n'a donc pas vraiment de sens en tant que telle, mais ce qui a un sens, c'est la notion de rayon de courbure, qui coïncide exactement. Ce rayon de courbure définit une unité naturelle de distance qui s'appelle le radian, et on peut le caractériser (donc caractériser le rayon de courbure) par le fait que les formules de trigonométrie sphérique que j'ai évoquées ci-dessus (par exemple, la loi des cosinus sphérique, cos(c) = cos(a)·cos(b) + sin(a)·sin(b)·cos(γ), pour un triangle de côtés a,b,c, avec γ l'angle opposé au côté c) fonctionnent à condition que les distances soient mesurées en radian (de façon équivalente, si on divise toutes les distances par le rayon de courbure : par exemple, la loi des cosinus sphériques sur une sphère de rayon [de courbure] R affirme que cos(c/R) = cos(a/R)·cos(b/R) + sin(a/R)·sin(b/R)·cos(γ)).

Il existe de même une unité naturelle de distance sur l'espace hyperbolique : celle-ci est un petit peu moins évidente à expliquer géométriquement que le rayon d'une sphère, mais c'est aussi un rayon de courbure, et on peut aussi le caractériser par le fait que les formules de trigonométrie hyperbolique fonctionnent si on les exprime dans cette unité. Ainsi, la loi des cosinus hyperbolique, cosh(c) = cosh(a)·cosh(b) − sinh(a)·sinh(b)·cos(γ) lorsque les longueurs des côtés a,b,c sont exprimées dans les unités naturelles, ou sinon, cosh(c/R) = cosh(a/R)·cosh(b/R) − sinh(a/R)·sinh(b/R)·cos(γ) pour un rayon de courbure R.

En revanche, l'espace euclidien n'a pas d'unité naturelle de distance : la loi des cosinus euclidienne (théorème d'al-Kashi), c² = a² + b² − 2a·b·cos(γ), fonctionne quelle que soit l'unité dans laquelle sont exprimées les longueurs a,b,c. Ceci est cohérent avec le fait que la géométrie euclidienne (par exemple dans cette formule) est la limite des géométries sphérique ou hyperbolique quand le rayon de courbure R tend vers l'infini.

L'unité naturelle de distance d'un univers sphérique ou hyperbolique donne une distance comobile : concrètement, ceci signifie que lorsque l'Univers s'étend (ou se contracte), ce qui change est son rayon de courbure, pas la position relative sur la sphère ou l'espace hyperbolique (penser, intuitivement, à un ballon qu'on gonfle et sur lequel des points ont été marqués — ces points s'écartent parce que le rayon du ballon augmente, mais leur position en géométrie sphérique ne change pas). En fait, il n'est tout simplement pas possible de changer les distances naturelles, en géométrie sphérique ou hyperbolique, sans changer les formes (il n'existe pas de similitudes en géométrie sphérique ou hyperbolique : la taille d'un triangle est déterminée par ses angles), donc le fait que les angles ne doivent pas changer quand l'Univers s'étend impose que l'unité naturelle de distance soit nécessairement comobile.

Il est tentant, à cause de ce qui vient d'être dit, de mesurer les distances (comobiles) en unités naturelles, c'est-à-dire en rayons de courbure de l'Univers. Ceci donne un système de coordonnées comobiles assez agréables : χ (la distance en unités naturelles à une origine choisie arbitrairement — typiquement là où nous sommes, ou comme nous ne sommes pas vraiment comobiles, là où nous étions à un certain moment), θ (l'angle par rapport au pôle du système de référence céleste, ou co-déclinaison céleste) et φ (l'angle par rapport au méridien du système de référence céleste, ou ascension droite céleste) ; c'est particulièrement élégant dans le cas sphérique, car on a trois angles tous mesurés en radians, et qui sont un paramétrage standard de la 3-sphère. Il y a néanmoins un problème théorique et un problème pratique avec cette idée : le problème pratique est qu'il n'y a pas d'unité naturelle pour le cas euclidien (on doit donc mesurer la distance comobile χ en unités arbitraires), et le problème pratique est que nous ne connaissons pas le rayon de courbure de l'Univers (on sait juste qu'il est très grand, mais on ne sait même pas si la courbure est positive ou négative). À cause de ça, on va éviter cette coordonnée χ qu'on ne sait pas mesurer et utiliser à la place la distance comobile ℓ à l'origine, mesurée en unités de distance à une époque t₀ choisie arbitrairement (donc par exemple, ℓ = distance en l'an 2000).

Par ailleurs, plutôt que manipuler le rayon de courbure R, dont je viens de dire qu'on ne le connaît essentiellement pas (dans l'Univers dans lequel nous vivons), il est souvent plus commode de travailler avec la courbure (en fait, la « courbure sectionnelle »), qui vaut K = 1/R² pour le cas sphérique, K = −1/R² pour le cas hyperbolique, et K=0 pour le cas euclidien. Parfois, on introduira aussi K₀ la courbure à une époque t₀ de référence, la courbure à l'instant t étant alors donnée par K₀/a² où a est le rapport des rayons de courbure entre t₀ et t, que je vais maintenant discuter plus en détail.

Le paramètre `a` de taille de l'Univers

Supposons choisi une époque de référence t₀ : on veut introduire un paramètre a(t) qui mesure le facteur d'expansion de l'Univers entre t₀ et une époque t variable. Dans le cas d'un univers à courbure sphérique ou hyperbolique, on peut définir ce a comme R/R₀ où R est le rayon de courbure au temps t et R₀=R(t₀) est celui à l'époque de référence. (En particulier, la courbure K vaut alors K₀/a², où K₀ est la courbure à l'époque de référence.) Mais comme je l'ai expliqué plus haut, on ne peut pas procéder ainsi dans le cas euclidien, et de toute façon ce n'est pas pratique du tout : il faut donc plutôt considérer a(t) comme un facteur de multiplication des distances : si une galaxie lointaine (comobile) est située à la distance comobile ℓ d'une autre, alors à l'instant t, la distance propre entre ces deux galaxies sera a(t)·ℓ (et le fait que a(t₀)=1 reflète simplement le fait qu'on a choisi de mesurer les distances comobiles en unités de ce qu'elles étaient à l'époque t₀).

Le but de l'équation de Friedmann-Lemaître, qui régit la dynamique de l'Univers, est de prédire la manière dont a va évoluer avec le temps (mais pour cela, il faudra faire des hypothèses sur la matière qui occupe l'espace dans l'Univers). Il y a cependant des choses qu'on peut dire en laissant a complètement indéterminé (comme fonction de t).

La « constante » de Hubble `H` = `a`′/`a`

Maintenant qu'il est convenu d'appeler a(t) le rapport de taille de l'Univers entre l'époque t₀ de référence et l'instant t considéré, on peut considérer sa dérivée a′ par rapport au temps cosmique t. Mais, comme a, celle-ci dépend du choix (arbitraire) d'une époque de référence t₀ : il est donc plus intéressant de considérer la dérivée logarithmique a′/a, c'est-à-dire la dérivée de log(a) (le log étant entendu en base naturelle). Cette quantité H = a′/a est suffisamment importante pour mériter un nom spécial : on l'appelle paramètre d'expansion de Hubble, ou, abusivement, « constante » de Hubble. Actuellement, dans notre Univers, on observe une valeur de H de 2.1 centimètres par seconde et par année-lumière (généralement donnée sous la forme : 67km/s/Mpc, mais je trouve qu'on a déjà suffisamment d'unités à la con en astronomie, entre la seconde, le mètre et l'année/année-lumière, pour ne pas avoir besoin d'ajouter le parsec), ou, plus simplement 6.9×10⁻¹¹ par année. Il faut comprendre intuitivement que, sur un intervalle de temps dt assez petit, les grandes distances dans l'Univers s'étendent d'un facteur H·dt (i.e., sur des grandes échelles, l'Univers grandit de 0.0000000069% dans toutes les directions chaque année).

Le terme de constante est essentiellement historique : il s'agit de la constante de proportionnalité entre la distance d'une galaxie et sa vitesse d'éloignement (cf. ci-dessous), mais il ne faut pas s'attendre à ce que cette quantité reste constante dans le temps. D'ailleurs, pour parler de la variation de la constante de Hubble, on a tendance à introduire le paramètre d'accélération sans dimension a·a″/a′² = (H′/H²) + 1, et on verra dans la partie consacrée à la dynamique que ce paramètre d'accélération reflète essentiellement la composition de l'Univers (−1 pour un univers dominé par le rayonnement, −½ pour un univers dominé par la « poussière », 0 pour un univers dominé par sa courbure, et +1 pour un univers dominé par l'énergie du vide ; et dans l'Univers où nous vivons, on estime qu'il vaut environ 0.5).

Si deux observateurs comobiles sont situés à une distance comobile ℓ l'un de l'autre (qui par définition ne change pas avec le temps), leur distance propre sera d := a(t)·ℓ, et la variation de cette distance avec le temps vaut donc a′(t)·ℓ = H·d. C'est ce qui justifie l'interprétation de la « constante » de Hubble comme un facteur de proportionalité entre la distance d et la vitesse d'éloignement pour cette distance. Il faut cependant noter que les deux quantités dans cette proportionalité (la distance propre, dont j'ai signalé que ce n'était pas la vraie « distance géodésique », et aussi la variation de celle-ci avec le temps cosmique) sont sujettes à des subtilités de définition ou d'interprétation.

L'inverse du paramètre de Hubble a les dimensions d'un temps, qu'on appelle parfois temps de Hubble (ou âge de Hubble, ou durée de Hubble) : ce temps sera très fortement relié à l'âge de l'Univers, sans toutefois lui être égal (on verra, par exemple, que dans un univers de « poussière » sans courbure, le temps de Hubble vaut 3/2 fois l'âge de l'univers en temps cosmique, tandis qu'en cas de courbure négative le rapport entre le temps de Hubble et l'âge de l'Univers décroît de 3/2 vers 1 ; et dans un univers de « rayonnement » sans courbure, le temps de Hubble vaut 2 fois l'âge de l'univers).

Le mouvement uniforme dans l'univers de FLRW

Si une particule n'est pas comobile, on peut considérer sa vitesse par rapport aux observateurs comobiles, c'est-à-dire mesurée par eux : comme je travaillerai toujours dans des unités dans lesquelles la vitesse de la lumière vaut 1, cette vitesse v est comprise entre 0 (particule comobile) et 1 (particule allant à la vitesse de la lumière). Pour être bien clair, quand j'écris vitesse ici, je veux bien parler de la vitesse au sens où on l'entend naïvement, i.e., la « vraie » distance parcourue par unité de temps (cosmique), c'est-à-dire que la distance comobile parcourue par unité de temps sera v/a (comprendre : à vitesse v égale, si l'Univers est plus grand, on parcourt une plus petite proportion de celui-ci — c'est assez évident). La question que je veux discuter est de savoir ce que devient une particule lâchée à vitesse v (mesurée par rapport aux observateurs comobiles), sans aucune force agissant sur elle (autre que la gravité, mais ce n'est pas une « force » en relativité générale), dans l'univers de FLRW, au fur et à mesure que le paramètre de taille a de l'Univers varie. Cette particule va, bien sûr, continuer d'aller en ligne droite — la question est de savoir à quelle vitesse. On pourrait croire que la vitesse reste constante, mais ce n'est pas le cas en général.

Il y a un cas facile : une particule qui va à la vitesse de la lumière (v=1) doit continuer à aller à la vitesse de la lumière (parce que c'est une propriété fondamentale de la particule : une particule massive ne peut jamais aller aussi vite que la lumière et une particule sans masse ne peut jamais aller à une autre vitesse). Donc si v vaut 1, il reste toujours égal à 1 ; et comme j'ai signalé que la distance comobile parcourue par unité de temps valait v/a, donc ici 1/a, on en déduit qu'entre les temps cosmiques t₁ et t₂, une particule allant à la vitesse de la lumière parcourt une distance comobile égale à l'intégrale de 1/a(t) pour t allant de t₁ à t₂. Cette quantité (l'intégrale indéfinie de 1/a(t), ou disons, l'intégrale entre t₀ et t) est suffisamment importante pour porter un nom spécial : on l'appelle le temps conforme η. De façon plus intuitive, le temps conforme est celui qui mesure le temps en utilisant la distance comobile parcourue par la lumière : par exemple, si j'ai décidé de prendre l'an 2000 pour époque, et si on considère deux galaxies (supposées comobiles) séparées de 3 milliards d'années-lumière à ce moment-là, donc de cette distance comobile, la lumière prendra 3 milliards d'années de temps conforme pour aller de l'une à l'autre quelle que soit la taille de l'Univers, c'est la définition du temps conforme. (Remarque : il n'est pas dit que le temps conforme tende vers l'infini, j'y reviendrai à propos de l'horizon des événements.)

Il y a un autre cas facile : une particule qui va à la vitesse nulle v=0 est comobile par définition, et elle le reste.

Mais pour toute autre vitesse v, on a une surprise : v ne reste pas constante. En fait, ce qui reste constant est a·v/√(1−v²) (note : le facteur 1/√(1−v²) s'appelle facteur de Lorentz en relativité restreinte, il est souvent noté γ, c'est le facteur de dilatation du temps ; et la quantité w := v/√(1−v²) s'appelle parfois célérité ou vitesse propre, et elle est directement liée à la quantité de mouvement). Lorsque la vitesse v est très petite devant celle de la lumière, ceci signifie que v est proportionnelle à 1/a : quand l'Univers s'étend, non seulement les distances à parcourir augmentent, mais la vitesse à laquelle on les parcourt diminue !

Comment expliquer ce phénomène ? Je peux offrir trois explications physiques différentes :

La plus simple est la suivante : la particule est en train de courir pour attraper les galaxies (comobiles) qui s'éloignent à cause de l'expansion de l'Univers, et comme sa vitesse est toujours mesurée par rapport à elles, plus la particule avance, plus la vitesse mesurée est faible. ((Ce raisonnement peut être rendu quantitatif, en supposant pour simplifier que v est très petit devant 1 (la vitesse de la lumière) : pendant un petit intervalle de temps dt, la particule avance d'une distance v·dt, à cet endroit les galaxies comobile ont une vitesse apparente (mesurée par rapport à l'observateur comobile initial) de H·v·dt où H = a′/a est la « constante » de Hubble, donc la vitesse de la particule considérée décroît d'autant et ainsi v′ = −H·v = −(a′/a)·v, c'est-à-dire v′/v = −a′/a, ce qui signifie bien que a·v est constant.))
On peut aussi expliquer les choses en termes de quantité de mouvement : si on considère un photon, sa vitesse v=1 ne va évidemment pas changer (je l'ai souligné ci-dessus) quand l'Univers s'étend d'un facteur a (entre t₀ et t), mais sa longueur d'onde va augmenter de ce facteur, donc sa quantité de mouvement (mesurée par les observateurs comobiles), qui est inversement proportionnelle à la longueur d'onde, va diminuer d'un facteur a ; si le même phénomène s'applique à une particule massive, disons de masse m, le fait que la quantité de mouvement m·w = m·v/√(1−v²), diminue d'un facteur a signifie justement que a·w = a·v/√(1−v²) se conserve.
La dernière explication est plus une analogie qu'une explication, et sans doute critiquable, mais est peut-être quand même éclairante : mettons que v soit petit pour simplifier (ce qui permet d'ignorer les effets relativistes), et que l'Univers soit sphérique de rayon R. Même si j'ai expliqué qu'il ne faut pas imaginer l'Univers courbe comme étant plongé dans un espace plus grand, faisons-le quand même : on a alors affaire à une particule, disons de masse m, en mouvement circulaire, à vitesse angulaire v/R. Mais le moment d'inertie associé à ce mouvement est m·R², et le moment cinétique est donc m·R·v, et c'est cette quantité qui reste constante si on change le rayon de la trajectoire, ce qui revient à dire que a·v reste constant. (Bref, l'effet serait le même que quand on est sur une chaise en train de tourner et qu'on étend les bras : non seulement la vitesse angulaire diminue, mais même la vitesse linéaire diminue.)

Par souci de complétude, je voudrais aussi dire ce qui se passe si on effectue un mouvement accéléré dans un univers en expansion. Rappelons (ou précisons) qu'en relativité, l'accélération, c'est-à-dire l'accélération propre, ou inertielle, celle que ressent la particule en accélération (comme effet inertiel), et qui est aussi égale au rapport de la force exercée sur la masse au repos, cette accélération est la dérivée w′ := dw/dt de la célérité w par rapport au temps extérieur. (S'agissant du mouvement uniformément accéléré à l'accélération g, en relativité restreinte, les formules sont : pour la position x = (cosh(g·s)−1)/g où s est le temps propre, et pour le temps extérieur t = sinh(g·s)/g, donc v = dx/dt = tanh(g·s), et w = dx/ds = sinh(g·s) = g·t, qui augmente bien linéairement avec t.) Dans l'univers de FLRW, donc, pour l'accélération inertielle g, on a : w′ + (a′/a)·w = g ; autrement dit, tout se passe comme si l'Univers exerçait, sur une particule de célérité w, une force par unité de masse −H·w, où H = a′/a (qu'on se rassure, avec la valeur de H actuellement observée dans notre Univers, soit environ 2 centimètres par seconde et par année-lumière, cette force/accélération est complètement négligeable même pour des particules allant à des vitesses comparables à celle de la lumière).

Déconfusion : À toutes fins utiles, signalons que le w qui sera introduit plus bas (équation d'état de la matière) n'a aucun rapport avec celui introduit ci-dessus (célérité).

Horizons cosmologiques des particules et des événements : Univers observable, Univers atteignable

J'ai fait remarquer ci-dessus qu'entre les temps cosmiques t₁ et t₂, une particule allant à la vitesse de la lumière parcourt une distance comobile égale à l'intégrale de 1/a(t) pour t allant de t₁ à t₂, également appelée différence de temps conforme entre t₁ à t₂. Tout ce qui est au-delà de cette distance, donc, ne peut pas avoir d'effet à l'échelle de cet intervalle de temps. En particulier, si l'intégrale de 1/a converge entre le Big Bang et un instant donné, respectivement entre un instant donné et la fin des temps (qu'il s'agisse d'un Big Crunch ou véritablement de t→+∞), on va avoir un « horizon » cosmologique, au sens où les objets trop lointains ne pourront pas avoir d'effet à l'instant considéré, respectivement ne pourront pas être influencés par lui. Il faut discuter précisément ces deux horizons.

On a d'abord l'horizon du passé, appelé horizon cosmologique des particules. Il s'agit de l'étendue spatiale de notre cône de lumière du passé (rapportée à l'espace comobile), c'est-à-dire, concrètement, le rayon de tout ce que nous pouvons voir dans l'Univers (à n'importe quel moment du passé), ou Univers observable ; pour le dire encore autrement, c'est la région de l'Univers telle que des signaux émis depuis elle au moment du Big Bang (ou peut-être plutôt : juste après la phase d'inflation qui a immédiatement suivi le Big Bang) a eu le temps de nous atteindre. C'est, bien sûr, symétrique, donc si on préfère, c'est l'ensemble des galaxies auxquelles on aurait pu envoyer un signal qui arrive maintenant si on s'y était pris dès le Big Bang. Le rayon de cet Univers observable, donc la taille de cet horizon cosmologique des particules, est estimée à 46.9 milliards d'années-lumière (46.9 milliards d'années est donc l'âge de l'Univers en « temps conforme »). Le fait que cette distance soit supérieure à l'âge de l'Univers (13.8 milliards d'années) ne doit pas nous surprendre : comme l'Univers est en expansion, dans le passé la lumière parcourait en distance comobile beaucoup plus par unité de temps que maintenant. Bref, 46.9 milliards d'années-lumière est le rayon de notre univers observable.

Il ne faut pas s'imaginer qu'il y a un grand rideau noir aux bords de l'Univers observable qui nous empêche de voir au-delà. Ce qui se passe est, tout simplement, que plus on regarde loin, plus on regarde dans le passé : nos télescopes permettent d'ores et déjà de voir presque aussi loin que l'époque de l'apparition des premières galaxies dans l'Univers — donc si on regarde plus loin, il n'y a plus de galaxies ; et si on regarde encore plus loin, ce qu'on observe est le rayonnement cosmologique fossile, et comme celui-ci correspond au moment où l'Univers est devenu transparent, il n'y a pas moyen de regarder plus loin (du moins avec des photons : avec des neutrinos on pourrait regarder encore un peu plus loin). Donc, en fait, si, il y a bien un grand rideau noir, mais pas exactement comme on l'imaginerait naïvement. Et en tout cas, la finitude de cet Univers observable ne dit rien sur le fait que l'Univers soit fini ou infini (ou fini mais considérablement plus grand que 50 milliards d'années-lumière).

Symétriquement, on a l'horizon du futur, appelé horizon cosmologique des événements [même s'il y a un peu de flottement dans ce terme pour savoir s'il est compté depuis maintenant, comme je le suppose ici, ou depuis le Big Bang]. Il s'agit de l'étendue spatiale de notre cône de lumière du futur (rapportée à l'espace comobile), c'est-à-dire, concrètement, le rayon de tout ce que nous pouvons atteindre dans l'Univers (à n'importe quel moment de l'avenir), ou qui pourra un jour nous voir tels que nous sommes maintenant, bref, l'Univers atteignable ; pour le dire encore autrement, c'est la région de l'Univers telle que des signaux émis depuis la Terre maintenant puissent y arriver d'ici la fin des temps. C'est, bien sûr, symétrique, donc si on préfère, c'est l'ensemble des galaxies que nous pourrons un jour voir dans l'état où elles sont maintenant [maintenant en temps cosmique]. Il est peut-être surprenant que cet horizon soit fini (vu qu'on se permet d'aller un temps arbitrairement long à la vitesse de la lumière), mais c'est le cas si on croit à la mesure actuelle de la constante cosmologique : l'Univers entrant en phase d'expansion exponentielle, même en un temps infini la lumière ne peut parcourir qu'une distance comobile finie. Cette distance est bien sûr connue moins précisément que l'autre, mais on l'estime à environ 15 milliards d'années-lumière (15 milliards d'années est donc la durée restant à l'Univers en « temps conforme », finie même s'il s'agit d'une durée infinie en temps cosmique).

La différence entre ces deux horizons signifie qu'il y a des galaxies, celles situées à plus de 15 milliards d'années-lumière environ, qui sont désormais totalement inatteignables : nous pouvons les voir, mais nous ne pourrons jamais les atteindre, même en allant arbitrairement proche de la vitesse de la lumière et pendant une durée arbitrairement longue — car elles s'éloignent plus vite qu'il n'est possible de les rattraper. Nous ne verrons jamais non plus ces galaxies telles qu'elles sont maintenant : de nouveau, il ne faut pas imaginer qu'elles se cacheront derrière un grand rideau noir, mais simplement qu'elles apparaîtront de plus en plus décalées vers le rouge, de plus en plus ralenties dans le temps, si bien que même en attendant arbitrairement longtemps nous ne verrons d'elles qu'une image figée dans le passé.

Supplément : Différentes notions de distance

Même si la description mathématique de l'espace-temps de FLRW est passablement simple, il y a tout de même un nombre assez important de « distances » plus ou moins naturelles qu'on peut définir entre deux points : la complexité est surtout augmentée par le fait qu'il faut bien distinguer différentes sortes de « points » entre lesquels on peut vouloir chercher à définir une distance :

on peut avoir affaire à deux points quelconques de l'espace-temps, le terme standard étant alors événement (en gros, donc, position+instant),
on peut avoir affaire à deux événements ayant lieu en même temps cosmique, auquel cas il est légitime de les considérer comme deux points d'espace (c'est dans ce cadre qu'on a défini, par exemple, la distance propre, qui est la distance sur la tranche d'espace correspondant à ce temps précis),
on peut avoir affaire à deux observateurs comobiles, donc à n'importe quel instant donné on se ramène au cas précédent, mais il faut choisir une époque de référence (ce qui amène à la définition de la distance comobile, comme je l'ai déjà dit),
on peut avoir affaire à deux événements dont l'un est exactement sur le cône de lumière du passé de l'autre, c'est-à-dire qu'on est en train de considérer un photon qui a voyagé d'un point de l'Univers à un autre et qu'on se demande quelle « distance » il a parcourue (ce cas est particulièrement important en astronomie puisqu'on s'intéresse à la distance d'objets astronomiques — comme des galaxies lointaines — que nous voyons maintenant).

Il existe différentes façons de convertir ces cas les uns en les autres (le premier cas évoqué recouvre en particulier le deuxième et le dernier ; mais on peut aussi toujours convertir un événement d'espace-temps en un « emplacement » considéré comme comobile + un temps cosmique, et choisir d'oublier le temps, ce qui nous amène au troisième cas ; qui à son tour se ramène au deuxième comme je l'ai dit). Et pour chacun de ces cas, il existe différentes façons de mesurer la distance : par exemple, dans le deuxième ou troisième cas, j'ai signalé que la distance peut se mesurer en unités naturelles χ (si la courbure est non-nulle et donne ainsi naissance à une unité naturelle), la distance propre étant alors d = R·χ avec R le rayon de courbure de l'Univers : mais certains préfèrent introduire r = R·sink(χ) où sink signifie soit sin, soit sinh selon que l'Univers est courbé positivement ou négativement (et en courbure nulle on pose juste r = d) — ce paramètre r est aussi une forme de distance, c'est le rayon de courbure de la sphère de dimension 2 centrée sur l'un des points et passant par l'autre (et au temps cosmique considéré), par exemple son aire vaut 4πr². Il peut donc y avoir une certaine confusion dans le fait que des gens appelleront « distance » la quantité d alors que d'autres utiliseront le mot pour r, et une confusion supplémentaire dans le choix de l'époque à laquelle on mesure la distance (implicite dans le R ci-dessus).

Dans la situation où nous observons en t₀=maintenant des événements passés de l'Univers, mesurer leur distance revient à mesurer aussi le temps dans le passé. Que veut-on dire si on parle d'observer une galaxie à cinq milliards d'années-lumière : que la distance propre entre nous et la galaxie est maintenant de cinq milliards d'années-lumière ? que la distance entre nous et la galaxie était de cinq milliards d'années-lumière quand le photon est parti ? ou que chaque photon a parcouru cinq milliards d'années-lumière mesuré contre l'espace au fur et à mesure de son expansion ? cette dernière notion signifie exactement que le lumière a quitté la galaxie observée il y a cinq milliards d'années de temps cosmique (d'un autre côté, on peut aussi inverser les choses, et si on choisit t₀=maintenant comme époque de référence, dire que la distance propre maintenant (=comobile) entre nous et la galaxie observée est de cinq milliards d'années-lumière signifie aussi que la lumière a quitté cette galaxie il y a cinq milliards d'années de temps conforme).

Pour standardiser les choses et diminuer la confusion, il est habituel de désigner ce genre de distance en utilisant le redshift : si la lumière partait au temps t₁ avec une fréquence ν₁, et est observée maintenant au temps t₀ avec une fréquence ν₀, le redshift est défini comme z := (ν₁−ν₀)/ν₀, et il vaut simplement z = 1/a(t₁) − 1 où 1/a(t₁) est le rapport entre la taille de l'Univers actuellement et ce qu'elle était en t₁. Par exemple, quand on dit que le rayonnement cosmologique fossile est au redshift z = 1090, ça signifie que l'Univers était 1/a(t₁) = 1091 fois plus petit au moment où les photons qui le constituent se sont découplés. (À mon avis, ce ±1 est une bêtise, on devrait définir le redshift par log(ν₁/ν₀) = −log(a) plutôt que (ν₁−ν₀)/ν₀ = 1/a − 1, mais la convention est assez fermement établie, c'est comme pour les pourcentages où on doit dire qu'une grandeur a augmenté de 4100% pour dire qu'elle a été multipliée par 42 parce que les gens qui ont inventé les pourcentages ne savaient pas ce qu'est un logarithme.) Pour relier le redshift à la distance parcourue sous une forme ou une autre, de toute façon, il faudra connaître des choses sur la fonction a et son évolution avec le temps.

Mais si on cherche justement à mesurer a(t) expérimentalement, il faut bien pouvoir relier le redshift (qui est physiquement mesurable en considérant les raies spectrales d'éléments chimiques bien connus) à une autre notion de distance (elle aussi physiquement mesurable). Ce qu'on fait, bien sûr, est de considérer la décroissance de la luminosité avec la distance (en se basant sur des phénomènes astronomiques — comme des supernovæ de type Ia — qui ont toujours la même luminosité intrinsèque). Dans un espace-temps plat, la luminosité de la lumière décroît en 1/r² : qu'en est-il dans l'espace-temps de FLRW ? Il y a plusieurs effets qui jouent : il y a bien un facteur 1/r² due à la dilution des photons, où r est la distance mesurée par le rayon de courbure d'une sphère et dont j'ai parlé ci-dessus (mesurée au temps t₀ de réception ; en pratique, cependant, comme l'Univers est plat ou presque, on peut identifier r et la distance propre ℓ mesurée au temps de réception, c'est-à-dire la distance comobile si on a pris cet instant comme époque de référence) ; mais si le redshift de l'émission est z, on doit encore diviser la luminosité reçue par 1+z une première fois parce que, pour chaque fréquence donnée les photons arrivent 1+z fois plus rarement à la destination, et une seconde fois parce que la fréquence des photons est elle-même divisée par 1+z (c'est la définition du redshift). Bref, la luminosité observée est proportionnelle à 1/(r·(1+z))², ce qui explique que la quantité r·(1+z) = r/a s'appelle parfois la distance de luminosité. Je répète que le r ici est mesuré au moment t₀ de la réception de la lumière : si on utilise le r mesuré au moment t₁ de l'émission, on obtient une décroissance en 1/a⁴ de l'intensité de la lumière, cet exposant étant à rapprocher de la décroissance en 1/a⁴ de l'intensité du rayonnement avec l'expansion de l'Univers dont je parlerai plus loin.

Supplément : Et la topologie dans tout ça ?

(Tout ce passage ajouté 2015-10-14T12:00+02:00.)

La relativité générale impose des contraintes locales sur la géométrie de l'espace-temps, i.e., sur sa courbure en un point donné, mais elle ne dit rien sur la forme globale, c'est-à-dire, sur la topologie. Un espace de courbure constante en dimension 3 n'est pas nécessairement globalement la 3-sphère, l'espace euclidien de dimension 3 ou l'espace hyperbolique de dimension 3 (espaces « modèles » des trois géométries), il peut en être un « quotient ».

Par exemple, un « tore plat », qui s'obtient en prenant un cube, ou plus généralement un parallélépipède quelconque, et en en identifiant les faces opposées (c'est-à-dire que quand on passe dans l'une on arrive dans l'autre, un peu à la façon du jeu Portal si je peux me permettre l'allusion), un tel espace est plat et est un quotient de son espace modèle, l'espace euclidien de dimension 3, mais ce n'est pas celui-ci. Pour ce qui est d'un quotient hyperbolique, au moins en dimension 2, on peut jouer à mon labyrinthe hyperbolique dont j'ai souvent parlé : le labyrinthe n'a qu'un nombre fini de cases parce qu'il est un quotient fini de l'espace modèle hyperbolique (c'est peut-être plus clair sur ce labyrinthe jouet qui n'a que trente cases, et dont le plan de recollement est présenté en détails dans cette entrée). Et pour ce qui est d'un quotient sphérique, j'en évoque un à propos de l'espace dodécaédral de Poincaré ci-dessus. Ces quotients montrent que l'espace peut être fini tout en étant de courbure constante nulle ou hyperbolique. Est-il imaginable que l'Univers soit fait ainsi ? Oui, c'est imaginable, MAIS il faut souligner deux objections importantes.

D'abord, à une seule exception près, un tel quotient n'est pas homogène et isotrope (il est localement homogène et isotrope, au sens où sa courbure est égale en tout point et n'a pas de direction privilégiée, mais il n'est pas globalement homogène et isotrope). Un tore plat est homogène mais n'est pas isotrope : on peut s'en convaincre en cherchant les directions dans lesquelles on revient le plus vite à son point de départ (concrètement : j'envoie des rayons de lumière dans toutes les directions, je vois ce qui revient en premier). À une exception près, les autres quotients sphériques ou hyperboliques ne sont ni isotropes ni même homogènes (c'est moins facile à expliquer). La seule exception, c'est le quotient de la sphère par l'antipodie, i.e., l'espace projectif, mais il a un autre problème, c'est de ne pas être orientable (dans cet espace, je peux partir très loin et revenir à mon point de départ en étant mon symétrique par rapport à un miroir, ce qui est non seulement bizarre mais aussi incompatible avec ce que nous croyons savoir de la mécanique quantique, qui a besoin d'une orientation bien définie de l'espace). (Correction : comme on me le fait remarquer, l'espace projectif de dimension 3 est orientable. En revanche, son équateur — qui est un espace projectif de dimension 2 — n'est pas orientable, c'est-à-dire qu'il existe des surfaces plongées non-orientables, ou, si on préfère, dont on ne peut pas définir d'intérieur et d'extérieur, ce qui ne contredit peut-être pas les lois de la physique quantique, mais c'est à peu près aussi bizarre.) Bref, si on suppose que l'espace est homogène et isotrope globalement, ce qui est à la fois suggéré par l'observation et intellectuellement séduisant comme hypothèse, on doit écarter tous les quotients non-triviaux des espaces modèles, sauf peut-être l'espace projectif qui est écarté pour d'autres raisons.

L'autre objection est la suivante : dire que l'Univers serait un quotient non-trivial d'un des trois espaces modèles, cela ne fait aucune différence physique par rapport à dire qu'il serait l'espace modèle lui-même et que tout ce qu'il y a dans l'Univers serait périodique. Il n'y a aucune différence physique entre un univers qui est un tore plat et un univers qui est un espace euclidien dans lequel la matière (particules et champs) se trouve se répéter exactement selon un pavage par des parallélépipèdes. Il n'y a aucune différence physique entre un univers qui est un espace dodécaédral de Poincaré et un univers qui est une 3-sphère et qui se trouve se répéter selon le pavage par 120 dodécaèdres qui définit cet espace. Si on voit les choses comme ça, on peut dire que (A) du coup, ce n'est pas la peine de considérer de tels quotients, autant considérer les espaces modèles, et (B) l'hypothèse que l'Univers serait fait ainsi paraît extrêmement peu naturelle.

Ceux qui veulent en savoir plus sur ces espaces de courbure constante et leurs quotients (le problème des « formes d'espace ») peuvent consulter le livre de Wolf, Spaces of Constant Curvature.

La dynamique de l'Univers et les équations de Friedmann-Lemaître

Toute la partie qui précède était cinématique, c'est-à-dire qu'elle considère comme une donnée l'expansion de l'Univers (i.e., la fonction a(t)) et en tire certaines conclusions. Il est maintenant temps d'étudier ce que la relativité générale impose comme contraintes sur cette fonction, autrement dit, comment elle prédit l'expansion (ou la recontraction) de l'Univers en fonction de la matière qui s'y trouve.

Densité de masse-énergie, pression, et équation d'état

La pression a des effets gravitationnels

En mécanique classique et gravitation newtonienne, le champ gravitationnel a une source unique, c'est la densité de masse. ((Précisions : la formulation originale de la loi de Newton est quelque chose comme F = −𝒢·m₁·m₂/d² pour la force gravitationnelle s'exerçant entre deux masses m₁ et m₂ séparées par une distance d ; sa reformulation de Laplace-Gauß-Poisson est quelque chose comme : ΔΦ = 4π·𝒢·ρ où ρ est la densité de masse, Φ est le potentiel gravitationnel qui détermine la force sur une particule test de masse m par F = −m·∇Φ, et Δ=∇² est le laplacien — peu importe ce que cela signifie exactement, ce que je veux simplement dire est que tout découle de ρ, la densité de masse.))

En relativité générale, comme la masse et l'énergie sont interchangeables, la densité masse-énergie ρ va indiscutablement jouer un rôle comme source du champ gravitationnel. Mais ce n'est pas la seule. Comme je l'ai très rapidement suggéré dans l'introduction, les équations d'Einstein (G = 8π·𝒢·T) relient la courbure G de l'espace-temps à un objet T plus complexe que la simple densité de masse ou masse-énergie : le tenseur de stress-impulsion-énergie. À un niveau fondamental, ceci est lié au fait que le graviton (la particule théorique censée véhiculer les effets gravitationnels) a un spin 2, mais je ne vais pas chercher à expliquer ce point. Disons qu'une des conséquences est qu'on a des effets comme le gravitomagnétisme[#2] (par exemple l'effet Lense-Thirring), c'est-à-dire des effets qui sont analogues, par rapport à la gravitation newtonienne, de ce qu'est le magnétisme par rapport à l'électrostatique : des effets liés au mouvement des sources ou des cibles gravitationnelles — parce que la quantité de mouvement apparaît dans le tenseur de stress-impulsion-énergie. Ces effets gravitomagnétiques peuvent souvent être annulés en passant dans un référentiel où la source du champ gravitationnel est immobile (notamment, dans le système comobile pour l'univers de FLRW). Néanmoins, on a un effet encore plus subtil : la pression a un effet gravitationnel spécifique. (La pression étant définie dans le cas particulier d'un matériau isotrope pour une certaine notion d'espace : dans un cas plus général, on aura trois directions orthogonales de pressions principales, et des valeurs possiblement différentes dans ces différentes directions. L'univers de FLRW étant isotrope, en particulier, la matière qui s'y trouve l'est et la pression l'est.)

[#2] Le magnétisme est causé par les charges en mouvement : le gravitomagnétisme est donc, au moins pour parler grossièrement, créé par des masses en mouvement. Voici un exemple qui m'a semblé très éclairant quand je l'ai compris. En relativité générale, la gravitation se propage à la vitesse de la lumière (et non instantanément comme dans la théorie de Newton) : ceci est nécessaire pour sauvegarder la causalité car sinon on pourrait envoyer une information plus vite que la lumière en déplaçant une masse très lourde et en mesurant finement son effet gravitationnel à une distance très importante. Néanmoins, la « force gravitationnelle » effective exercée par une masse en mouvement (au moins en mouvement uniforme, ou faiblement accéléré) est dirigée vers l'endroit où se trouve cette masse à l'instant considéré et pas à l'endroit où elle se trouvait au moment où la lumière l'a quittée (par exemple, la Terre, considérée dans son propre référentiel, est effectivement attirée par le Soleil à l'endroit où se trouve le Soleil maintenant, pas l'endroit où il se trouvait il y a huit minutes). Comment réconcilier cette apparente contradiction ? La réponse est que le mouvement de la masse produit un effet gravitationnel spécifique, et que cet effet vient justement compenser (au moins pour un mouvement uniforme) le retard dû au temps de propagation de la gravitation. Ou, de façon plus concise : en relativité générale, la gravitation se propage à la vitesse de la lumière, mais elle donne l'illusion de se propager instantanément (comme dans la théorie de Newton) parce qu'elle anticipe le mouvement de la source.

Note typographique : J'utiliserai le symbole 𝓅 pour désigner la densité de pression : s'il ne s'affiche pas correctement, sachez qu'il s'agit d'un p cursif minuscule. Je préfère 𝓅 à p parce que ce dernier est trop facilement confondu avec ρ (or on va justement être amené à comparer les deux).

Qu'est-ce que c'est que la pression ?

Avertissement : Je dois prévenir que sur ces histoires de pression, je n'ai pas les idées parfaitement claires : je comprends bien les équations mathématiques (enfin, je crois), mais le sens précis des paramètres ρ et 𝓅 ne m'est pas totalement clair, ni ce que cela signifie exactement que la pression a des effets gravitationnels spécifiques. Je n'ai pas réussi à savoir exactement, par exemple, quel test expérimental (ou au moins expérience de pensée) permet de confirmer cette prévision de la relativité générale (je sais que c'est censé être mesuré par le paramètre β₄ ou ζ₄ de la paramétrisation post-newtonienne, mais je ne sais pas comment ils sont définis ou mesurés exactement). Je crois que la question de savoir si et dans quelle mesure la pression a des effets gravitationnels dépend très fortement de ce qu'on garde constant entre deux situations où on fait varier la pression : par exemple, le champ gravitationnel du Soleil ne dépend pas de la pression à l'intérieur du Soleil, au moins dans la mesure où on suppose celui-ci à symétrie sphérique, parce que ce qu'on appelle masse du Soleil est une masse effective de Kepler (c'est-à-dire, celle qui intervient dans la solution de Schwarzschild ou dans la 3e loi de Kepler), et elle tient déjà compte de l'effet de la pression (je crois qu'il s'agit de l'intégrale de ρ+3𝓅). Mais du coup, je ne sais pas quel sens ça aurait vraiment de ne pas en tenir compte : i.e., je ne comprends pas exactement ce que c'est que ρ et 𝓅 séparément, sachant que différentes expressions intervenant en relativité sont souvent des combinaisons linéaires comme ρ+3𝓅 ou ρ+𝓅 ou encore ρ−3𝓅 ou ρ−𝓅, ce qui rend la division entre ρ et 𝓅 particulièrement obscure (la pression n'est-elle pas une forme d'énergie cinétique qui serait déjà comptée dans ρ ?). Disons au moins la chose suivante : grossièrement parlant, la courbure de l'espace (spécifiquement, la courbure de Ricci de l'espace, cf. cette autre entrée) en relativité générale est donnée par 4π·𝒢·(ρ−𝓅), tandis que la courbure dans le temps (la valeur propre dans le temps de la courbure de Ricci) est donnée par 4π·𝒢·(ρ+3𝓅) : ainsi, la densité d'énergie ρ a tendance à courber positivement (=sphériquement) l'espace et positivement le temps (=rapprocher les particules en chute libre) tandis que la pression 𝓅 a tendance à courber négativement (=hyperboliquement) l'espace mais à courber positivement le temps (de façon plus importante que ρ). Quant à la « courbure scalaire » 8π·𝒢·(ρ−3𝓅), elle a un rapport avec la masse au repos totale (par exemple, pour un gaz de photons, elle vaut 0), mais je ne prétends pas tout comprendre. (Remarquez, je ne suis pas le seul à être embrouillé par ces questions.) Mise à jour (2023-06-27) : cf. ce billet ultérieur sur la question de la pression.

Qu'est-ce que la pression, donc ? (Modulo le fait que je ne comprends pas bien, comme je le dis ci-dessus.) C'est la manière dont l'énergie varie quand on change le volume. Par exemple, le fait que la pression atmosphérique soit environ 10⁵ pascals, i.e., 10⁵ joules par mètre cube, signifie que si pour comprimer une masse d'air à pression atmosphérique en diminuant son volume d'un petit −dV, on doit fournir une énergie de 𝓅·dV : cette énergie étant ensuite stockée dans le gaz (et pouvant être libérée plus tard en le décomprimant), l'énergie totale de ce gaz, ρ·V, a varié d'autant : autrement dit, d(ρ·V) = −𝓅·dV, c'est la première loi de la thermodynamique sous forme différentielle, en l'absence d'échanges de chaleur. (Parfois il est utile d'introduire une autre quantité, l'enthalpie, (ρ+𝓅)·V, qui vérifie alors d((ρ+𝓅)·V) = d𝓅·V : cette astuce s'appelle la transformation de Legendre.)

Il résulte de la définition ci-dessus que la pression a les unités d'une énergie par unité de volume : ρ et 𝓅 ont donc bien les mêmes unités — à ceci près que ρ incorpore deux quantités classiques, la densité de masse et la densité d'énergie interne, sous une seule quantité relativiste, la densité de masse-énergie, et que du coup pour un gaz usuel, comme l'air, ρ est incroyablement plus élevé que 𝓅. Précisément : pour de l'air standard à température et pressions usuelles, ρ vaut environ 1.2kg/m³, soit environ 1.1×10¹⁷ J/m³ (une fois multiplié par c², le carré de la vitesse de la lumière — une quantité très grande dans les unités SI), alors que la pression atmosphérique 𝓅 vaut environ 1.0×10⁵ J/m³, mille milliards de fois moins (ce rapport est en gros le carré du rapport entre la vitesse des particules de gaz et celle de la lumière). Pas étonnant que les effets gravitationnels de 𝓅 soient généralement peu observables ! Mais pour un gaz de photons, on a 𝓅 = ρ/3 (cf. plus loin).

Néanmoins, les effets gravitationnels de la pression existent bien. En gros, c'est ρ+3𝓅 qui intervient dans l'expression de l'« attraction gravitationnelle » (en fait, la « courbure dans le temps » de Ricci), i.e., ρ+3𝓅 se comporte comme densité de masse gravitationnelle ; mais il y a d'autres effets pour lesquels ρ−𝓅, ou encore ρ+𝓅, interviennent. (Ce qui n'est pas terriblement clair pour moi, cf. plus haut, c'est dans quelles conditions ρ intervient seul, et comment on sait qu'on n'a pas appelé ρ+3𝓅 ce qu'on aurait dû appeler ρ.) Mais l'idée générale est que la pression compte comme une source de gravitation. Je souligne que cet effet est attractif, ce qui peut sembler un peu contre-intuitif puisque l'effet « ordinaire » de la pression est de repousser les choses les unes des autres : il faut donc simplement se faire à l'idée que ce sont des effets totalement différents ; d'ailleurs, l'effet « ordinaire » de la pression n'a de sens qu'en cas de différence de pression, alors que l'effet gravitationnel est capable de mesurer une pression absolue (comme une densité d'énergie absolue, j'en ai déjà parlé).

Il est peut-être aussi éclairant de donner les formules permettant de changer de référentiel sur ρ et 𝓅. Implicitement, on a parlé ci-dessus des valeurs mesurées dans le référentiel de la matière elle-même (i.e., dans lequel elle est immobile). Mais si on se déplace à vitesse v par rapport au fluide, on observe une densité de masse-énergie ρ′ = (ρ+𝓅·v²)/(1−v²) et une pression 𝓅′ = (𝓅+ρ·v²)/(1−v²) dans la direction du mouvement (dans les autres directions, la pression reste 𝓅, i.e., on perd l'isotropie). • Il devrait être possible d'expliquer, au moins pour v petit, ces deux formules (soit ρ′ = ρ + (ρ+𝓅)·v² + o(v³) et 𝓅′ = 𝓅 + (ρ+𝓅)·v² + o(v³)) comme une correction non-relativiste de la pression due au principe de Bernoulli et une correction de la masse-énergie ρ·V totale contenue dans un volume V (subissant lui-même une contraction de Lorentz V/√(1−v²) = V·(1−½v²+o(v³))) pour y ajouter l'énergie cinétique et l'énergie apportée pour contracter le volume, mais, en toute honnêteté, je n'arrive pas à mettre les ½ aux bons endroits pour que ça colle. • On peut au moins signaler que, dans ces conditions, ρ−𝓅 reste inchangé, et ρ+𝓅 est multiplié par (1+v²)/(1−v²), ce qui a certainement une interprétation physique intéressante, mais je ne sais pas laquelle.

L'équation d'état

En général, la pression 𝓅 va être reliée à ρ par ce qu'on appelle une équation d'état. Normalement, cette équation d'état fait apparaître d'autres grandeurs (comme la température ou la densité d'entropie, ces deux-là étant elles aussi contraintes par une seconde équation faisant intervenir ρ et/ou 𝓅). À titre d'exemple, pour un gaz parfait non-relativiste monoatomique, on a : ρ = ρ₀ + u où ρ₀ = m₀·n est la densité de masse, avec m₀ la masse d'un atome du gaz et n le nombre d'atomes par unité de volume, et u = (3/2)·𝓅 est la densité d'énergie interne reliée à la pression 𝓅 = k·T·n (avec k la constante de Boltzmann et T la température) ; bref, ρ = (m₀ + (3/2)k·T)·n tandis que 𝓅 = k·T·n. Seulement, comme je l'ai dit ci-dessus, pour un gaz fortement non-relativiste, k·T est négligeable devant m₀ : la quasi-totalité de l'énergie des particules du gaz est sous la forme de leur masse au repos, pas de leur énergie cinétique d'agitation, et du coup 𝓅 est négligeable devant ρ. Du coup, on simplifiera les choses en considérant que 𝓅=0. Un tel matériau est appelé, en relativité, une poussière. À l'inverse, pour un gaz ultra-relativiste, on a ρ = 3𝓅 (la relation 𝓅 = k·T·n reste valable, je crois, pour le genre de gaz où le nombre n de particules est conservé, mais ne nous intéresse pas ici ; pour un gaz de photons, la dépendance est en T⁴). Le 3 dans cette relation représente le nombre de dimensions d'espace : intuitivement et grossièrement parlant, l'énergie cinétique (qui est, ici, la seule forme d'énergie) est répartie également dans toutes les directions, et la pression voit sa composante selon une direction particulière. Cette situation où 𝓅 = ρ/3 est appelée, en relativité, un rayonnement.

Pour écarter les subtilités du paragraphe précédent, de façon générale, on aura tendance à considérer une équation d'état de la forme 𝓅 = w·ρ. Ce w (paramètre de l'équation d'état) pourrait, bien sûr, dépendre de toutes sortes de choses (par exemple de la température, ou à la limite de ρ lui-même c'est-à-dire qu'on aurait juste posé w := 𝓅/ρ), mais cela aide à voir les choses : on a vu que pour de la matière non-relativiste on a w = 0 (on considère qu'on a de la « poussière »), et que pour du rayonnement (un gaz relativiste, par exemple un gaz de photons) on a w = 1/3. Rien n'interdit d'avoir des mélanges de différentes espèces, par exemple poussière + rayonnement, mais en général il y a quelque chose qui domine (éventuellement différent par époque) : par exemple, dans notre Univers, à l'époque actuelle, on estime que le rayonnement, constitué environ moitié de photons et moitié de neutrinos, ne compte que pour 0.01% de la masse-énergie totale de l'Univers (matière noire et énergie noire comprises : cela représente environ cinq cents fois moins que la matière baryonique, qui est déjà une petite partie du total comme je l'ai dit).

Comme je vais l'expliquer plus bas, l'énergie du vide décrite par la constante cosmologique (énergie noire, donc — ou du moins l'explication la plus simple et la plus répandue de l'énergie noire) a une équation d'état donnée par w = −1, c'est-à-dire 𝓅 = −ρ. Mais ce n'est certainement pas une forme « normale » de matière. On verra aussi que la courbure de l'espace elle-même se comporte un petit peu comme si elle aussi était une forme bizarre de matière avec une équation d'état w = −1/3, c'est-à-dire 𝓅 = −ρ/3 (en l'occurrence ρ = −3K/(8π·𝒢)), mais ce n'est qu'une analogie et pas une vraie forme d'énergie (ceci dit, certains diraient déjà ça pour la constante cosmologique…).

Un mot sur les conditions d'énergie

Quelles sont les contraintes sur les valeurs de ρ et 𝓅 ? En vérité, on ne sait pas vraiment ! On peut imposer un certain nombre de conditions qui semblent raisonnables pour la matière « ordinaire », et qui ne seront pas forcément vérifiées pour de l'énergie noire ou dans le cadre de certaines théories des champs (quantiques, ce qui était prévisible si on pense que l'énergie du vide doit s'expliquer par la théorie quantique des champs, ou même classiques).

Par exemple, si on impose que la densité de masse-énergie soit toujours positive (donc ρ ≥ 0), ce qui est sans doute nécessaire en un certain sens pour que l'Univers soit stable, mais aussi qu'elle soit positive mesurée par n'importe quel observateur quelle que soit sa vitesse inférieure ou égale à celle de la lumière, on obtient les contraintes ρ ≥ 0 et 𝓅 ≥ −ρ (alternativement : la densité d'énergie et la densité d'enthalpie doivent être positives), et on appelle ça la condition d'énergie faible. Demander que le son ne se propage pas plus vite que la lumière semble demander la contrainte |𝓅|≤ρ (qui implique la précédente), appelée condition d'énergie dominante. Si on demande que la gravité soit toujours attractive et jamais répulsive, c'est-à-dire que la « courbure de Ricci dans le temps » soit toujours positive, on obtient les contraintes ρ+𝓅 ≥ 0 et ρ+3𝓅 ≥ 0 (condition d'énergie forte, un terme mal choisi vu qu'elle n'implique pas la faible). La validité universelle de cette dernière est suspecte puisqu'elle est violée par l'énergie du vide telle qu'on l'a mesurée, mais en fait aucune de ces conditions ou des inégalités impliquées (ρ ≥ 0 ou ρ+𝓅 ≥ 0 ou bien ρ−𝓅 ≥ 0 ou encore ρ+3𝓅 ≥ 0) n'est universellement acceptée. D'ailleurs, on a longtemps cru que l'inégalité ρ−3𝓅 ≥ 0, dite condition d'énergie de trace était nécessairement vraie (autrement dit, que le cas 𝓅 = ρ/3 d'un gaz ultra-relativiste est le maximum que peut atteindre la pression), et Zel'dovich a montré en 1960 que cette contrainte était violée dans un cas vraisemblablement réalisé à l'intérieur des étoiles à neutron (à savoir, des particules repoussées par une force véhiculée par un boson massif de spin 1) : dans de tels milieux « ultra-rigides », la pression 𝓅 peut devenir arbitrairement proche de la densité de masse-énergie ρ, et la vitesse du son de celle de la lumière.

Ceci ne signifie pas qu'on pense qu'il n'existe aucune condition sur la densité et la pression (ou sur le tenseur de stress-impulsion-énergie) possibles : s'il n'existe aucune contrainte de ce genre sur la matière dans l'Univers, on pourrait réaliser absolument n'importe quelle courbure de l'espace-temps — on pourrait par exemple voyager plus vite que la lumière ou violer la causalité de toutes sortes de manières, ce qui serait certainement amusant (et ferait plaisir aux amateurs de Star Trek), mais n'est pas très plausible. Seulement, ces conditions sont probablement plus subtiles que des inégalités simplistes sur ρ et 𝓅.

Retour sur l'énergie noire

Admettons que le vide possède effectivement une densité de masse-énergie ρ_vac (positive ou négative, et ressentie en pratique uniquement par la gravitation). Expliquons pourquoi la pression associée est forcément 𝓅_vac = −ρ_vac. Ceci résulte simplement de la première loi de la thermodynamique que j'ai écrite plus haut : d(ρ·V) = −𝓅·dV (la variation de la masse-énergie totale ρ·V contenue dans un volume V est égale à −𝓅 fois la variation dV de volume) ; mais comme ρ_vac ne dépend de rien du tout (puisque le vide est le vide : on ne va pas le diluer, changer sa température ou quoi que soit du genre), on a d(ρ·V) = ρ·dV, donc 𝓅 = −ρ comme annoncé. L'équation d'état du vide est donc donnée par w=−1.

La constante cosmologique Λ est une façon d'exprimer l'énergie du vide si, au lieu de dire que le vide a une énergie ρ_vac et une pression 𝓅_vac = −ρ_vac, on préfère mettre ces quantités comme un terme à part (et normalisé différemment), à savoir Λ = 8π·𝒢·ρ_vac. Je répète qu'il s'agit juste de deux façons différentes de dire la même chose : soit (présentation moderne) on convient que ρ inclut l'énergie du vide comptée comme toutes les autres, et alors il n'y a pas de Λ, soit (présentation traditionnelle) on veut faire un cas spécial de cette quantité, qu'on n'est pas obligé de considérer comme une énergie du vide si on n'aime pas cette terminologie, et alors on peut mettre un Λ dans les équations.

Les équations de Friedmann-Lemaître

Avec tout ce que j'ai écrit, il est temps que j'écrive enfin les équations de Friedmann-Lemaître qui prédisent la manière dont a varie (rappelons qu'il s'agit du rapport de taille de l'Univers entre l'époque t₀ de référence et l'instant t considéré) en fonction de la densité de matière ρ et de la pression 𝓅 dans l'Univers. Ces équations sont une conséquence (ou peut-être plutôt, un cas particulier) des équations d'Einstein dans le cas où la géométrie de l'espace-temps est celle que j'ai décrite dans la section consacrée à la géométrie et à la cinématique (i.e., un univers spatialement homogène et isotrope de courbure K = K₀/a²).

Note typographique : J'écrirai a′ et a″ (i.e., avec des primes) plutôt que les notations peut-être plus habituelles ȧ et ä (i.e., avec des points au-dessus) pour les dérivées première et seconde de a par rapport au temps (cosmique), parce que mettre un point sur une lettre en HTML est une opération assez aléatoire (dans cette phrase, j'ai utilisé des caractères Unicode, mais je ne pense pas que ce soit la bonne façon de s'y prendre quand ce n'est pas pour écrire de l'allemand ou je-ne-sais-quelle-langue-qui-utilise-le-a-avec-point).

Les équations — que je vais ensuite discuter et tâcher d'expliquer — sont :

(a′/a)² = 8π·𝒢·ρ/3 − K₀/a² + Λ/3

a″/a = −4π·𝒢·(ρ+3𝓅)/3 + Λ/3

où ρ et 𝓅 sont la densité de masse-énergie et la pression en ne comptant pas l'énergie du vide, celle-ci étant mise sous la forme de la « constante cosmologique » Λ : on peut bien sûr préférer réécrire les choses en supprimant Λ et en ajoutant à la place à ρ et 𝓅 respectivement des termes ρ_vac = Λ/(8π·𝒢) et 𝓅_vac = −Λ/(8π·𝒢) correspondant à une densité de masse-énergie et une pression du vide.

S'il faut faire référence à ces deux équations, j'appellerai dorénavant équation première celle qui donne (a′/a)² et équation d'accélération celle qui donne a″/a. Ce dernier terme est assez classique (et assez évident) ; je choisis le terme d'équation première pour parler de l'équation donnant (a′/a)², parce qu'elle définit ce qu'on appelle une intégrale première (il s'agit d'une équation différentielle du premier ordre).

Si on ne veut pas faire intervenir a et qu'on lui préfère le vrai rayon de courbure R=R₀·a de l'Univers (qui est naturel dans le cas de la courbure sphérique ou hyperbolique ; dans le cas euclidien, on peut prendre R₀ arbitraire, mais ça ne changera rien par rapport à ce qui est déjà écrit ci-dessus), et alors, en se rappelant que K₀/a² = K = ε/R² avec ε valant +1, −1 ou 0 pour un univers à l'espace sphérique, hyperbolique ou euclidien, les équations se réécrivent :

(R′/R)² = 8π·𝒢·ρ/3 − ε/R² + Λ/3

R″/R = −4π·𝒢·(ρ+3𝓅)/3 + Λ/3

Si on veut faire intervenir le paramètre de Hubble H = a′/a et sa dérivée H′, on peut préférer écrire :

H² = 8π·𝒢·ρ/3 − K₀/a² + Λ/3

H′ = −4π·𝒢·(ρ+𝓅) + K₀/a²

Notons que les deux équations de Friedmann-Lemaître (sous une forme ou une autre) ne sont pas équivalentes : si on dérive la première et qu'on la combine à la seconde, on obtient

ρ′ = −3(a′/a)·(ρ+𝓅)

ou si on préfère, ρ′ = −3H·(ρ+𝓅). Cette équation est souvent appelée la première loi de la thermodynamique dans ce contexte, ou équation de conservation (la conservation de la matière, en relativité-générale, est une conséquence nécessaire des équations d'Einstein). Il faut la comprendre comme un reflet de l'équation d(ρ·V) = −𝓅·dV que j'ai déjà introduite sous ce nom, dans le cadre d'un univers en expansion (sous l'effet de l'expansion de l'Univers, pendant un intervalle de temps dt, le volume V augmente de dV = 3H·V·dt, le 3 étant dû au fait que chaque dimension d'espace grandit d'autant, et la quantité de masse-énergie contenue dedans augmente donc de −3H·𝓅·V·dt ; comme par ailleurs, d(ρ·V) = V·dρ + ρ·dV, on trouve bien dρ = −3H·(ρ+𝓅)·dt comme annoncé). Si on préfère, cette équation signifie que quand l'Univers s'étend, la quantité de masse-énergie par unité de volume diminue pour deux raisons : parce que la masse-énergie se dilue (le terme −3H·ρ), et parce que les forces de pression effectuent un travail donc sortent de l'énergie (le terme −3H·𝓅).

Pour clarifier les choses, nous avons trois équations (l'équation première, l'équation d'accélération, et l'équation de conservation), mais seulement deux sont vraiment indépendantes : l'équation première combinée avec l'une des deux autres implique la troisième, et les deux dernières ensemble impliquent l'équation première à une constante d'intégration près.

Si on appelle w = ∂𝓅/∂ρ (techniquement : dérivée partielle prise sans échange de chaleur, reliée à la compressibilité adiabatique, ou à la vitesse du son), on a bien sûr aussi 𝓅′ = −3w·H·(ρ+𝓅). Si on suppose que w est une constante, c'est-à-dire que le rapport w=𝓅/ρ ne varie pas avec les conditions, alors l'équation de conservation s'écrit en fait ρ′ = −3(1+w)·H·ρ, ou encore : ρ′/ρ = −3(1+w)·a′/a ; ceci s'intègre (en se rappelant que x′/x est la dérivée de log(x)) en :

ρ = ρ₀ · a^−3(1+w)

Sous cette forme, l'interprétation du rapport pression/énergie w (paramètre de l'équation d'état) est différente : il détermine l'exposant n = 3(1+w) tel que ρ·aⁿ soit constant. Pour la poussière (w=0), la quantité ρ·a³ est constante, ce qui est intuitif vu qu'il représente la masse totale de la poussière dans une unité de volume comobile ; pour le rayonnement (w=1/3), c'est ρ·a⁴ qui est constant, ce qui s'explique intuitivement par le fait que quand l'Univers s'étend, non seulement les photons sont dilués, mais chaque photon est décalé vers le rouge, donc perd de l'énergie. Remarquez qu'on peut être assez choqué par le problème de la conservation de l'énergie, et je vais y revenir. Pour le vide (si on choisit de le présenter comme ceci), ρ_vac ne varie pas avec le temps, conformément à l'analyse w_vac = −1 qui a été faite. On peut aussi faire semblant que le terme de courbure −K₀/a² est aussi analogue à une densité d'énergie ρ_crb = −3K/(8π·𝒢) = −3K₀/(8π·𝒢·a²) : dans ce cas, il décroît manifestement en a² quand l'Univers s'étend, ce qui suggère que cette forme d'énergie (l'« énergie de courbure ») se comporte avec w=−1/3.

Une autre façon de présenter les équations de Friedmann-Lemaître consiste à prendre l'équation première H² = 8π·𝒢·ρ/3 − K₀/a² + Λ/3 et à la diviser par le membre de gauche. On introduira la quantité ρ_crit, dite densité critique, définie par ρ_crit := 3H²/(8π·𝒢), c'est-à-dire en gros la densité de masse-énergie assurant que l'Univers soit plat (et qui vaut, maintenant dans notre Univers, et dans différentes unités : 8.5×10⁻²⁷ kilogrammes par mètre cube ou 7.6×10⁻¹⁰ joules par mètre cube, ou 5.1 unités de masse atomique par mètre cube — ce qui est peut-être le plus mémorisable vu que l'unité de masse atomique est environ la masse d'un atome d'hydrogène -, ou 3.6×10⁻⁹ masses solaires par année-lumière cube). En posant alors Ω_mat := ρ/ρ_crit et Ω_vac := Λ/(3H²) et Ω_crb := −K/H² = −K₀/(a²·H²) = −K₀/a′², l'équation première devient simplement :

Ω_mat + Ω_vac + Ω_crb = 1

où n'interviennent que des quantités sans dimension : Ω_mat est la proportion de la densité critique représentée par la masse-énergie de la matière (y compris le rayonnement et la matière noire), Ω_vac la proportion représentée par l'énergie du vide et Ω_crb (d'usage critiqué) est la proportion compensée par la courbure, ces deux derniers termes pouvant être positifs ou négatifs. Avec ces mêmes quantités, l'équation d'accélération (a″/a = −4π·𝒢·(ρ+3𝓅)/3 + Λ/3) se réécrit :

a·a″/a′² = −½(1+3w)·Ω_mat + Ω_vac

— où le membre de gauche est le « paramètre d'accélération » sans dimension mesurant la manière dont l'expansion de l'Univers accélère, et w = 𝓅/ρ est le rapport pression sur densité de la matière. Sous cette forme, on voit bien que la matière a tendance à ralentir l'accélération de l'Univers (et deux fois plus pour le rayonnement w=1/3 que pour la poussière w=0), tandis que l'énergie du vide, elle, a tendance à l'accélérer.

Comme je l'ai déjà dit plus haut, dans notre Univers, on estime que Ω_vac vaut environ 0.68, Ω_mat vaut environ 0.32 (dont environ 16% sont dus à de la matière « baryonique », i.e., ordinaire, et le reste à de la matière noire, la part du rayonnement étant très faible — et en particulier, w vaut quasiment 0 pour la matière).

La dérivation newtonienne des équation de Friedmann-Lemaître

Les équations de Friedmann-Lemaître que j'ai présentées ci-dessus découlent des équations d'Einstein appliquées à l'univers supposé homogène et isotrope. Comme je n'ai pas décrit les équations d'Einstein, je n'ai pu qu'écrire les équations sans justification dans la section ci-dessus.

Il est cependant vrai que ces équations de Friedmann-Lemaître peuvent, au moins dans le cas sans pression, être obtenues à partir de la mécanique newtonienne et de la théorie newtonienne de la gravitation. (J'ignore s'il y a quelque chose de profond à ce fait, ou si c'est une sorte de coïncidence que la relativité générale n'apporte pas de contribution particulière à la dynamique de la situation.) Néanmoins, comme la mécanique newtonienne ne peut pas vraiment traiter un espace infini rempli d'une substance homogène et isotrope (encore moins un espace courbe !), cette dérivation s'apparente un peu à un tour de passe-passe, où on joue avec les inconsistances pour arriver à un résultat final correct. Le lecteur qui n'est pas intéressé par ce genre de tours de passe-passe peut ignorer cette partie, elle ne sert qu'à motiver au moins vaguement les équations présentées ci-dessus.

On suppose, donc, que l'Univers est rempli d'une substance homogène de densité ρ. On choisit arbitrairement une origine et on va considérer le mouvement relatif à cette origine (c'est surtout ici qu'on joue avec les inconsistances : la mécanique newtonienne n'a pas vraiment moyen de gérer le fait que le choix de l'origine est arbitraire). Considérons une boule de rayon R centrée sur cette origine : la masse de cette boule vaut M_R := (4/3)π·ρ·R³, et l'accélération gravitationnelle qu'elle provoque à sa surface vaut −𝒢·M_R/R² = −(4/3)π·𝒢·ρ·R (le signe moins sert à rappeler qu'elle est orientée vers l'intérieur) car le champ gravitationnel provoqué par une boule est égal au champ provoqué par une masse ponctuelle placée au centre de la boule ; en revanche, le champ gravitationnel provoqué, toujours à la distance R de l'origine, par n'importe quelle coquille sphérique de rayon intérieur plus grand que R est nulle, en vertu du théorème de la sphère creuse de Newton (à l'intérieur d'une coquille sphérique isotrope, le champ gravitationnel est nul) : en appliquant de nouveau un argument qui jongle avec les inconsistances, on dira donc que tout ce qu'il y a à l'extérieur de la boule de rayon R n'a donc aucun effet sur la surface de cette dernière. L'accélération subie par la sphère de rayon R est donc celle écrite ci-dessus, et on a R″ = −(4/3)π·𝒢·ρ·R. C'est l'équation d'accélération de Friedmann-Lemaître (pour R=R₀·a) dans le cas où 𝓅=0 (et Λ=0, ou bien que ce terme a été incorporé dans ρ), ce qui est normal vu que la vitesse de la lumière est maintenant essentiellement infinie donc le terme en 𝓅 (en fait 𝓅/c²) est devenu nul.

Si on veut obtenir l'équation première, il suffit de multiplier R″ = −𝒢·M_R/R² par R′ et d'intégrer (en se rappelant que M_R reste constant vu qu'il y a conservation de la matière), ce qui donne ½R′² = 𝒢·M_R/R + Cte (équation de conservation de l'énergie) donc R′² = (8/3)π·𝒢·ρ·R² + Cte, et pour R=R₀·a on obtient bien l'équation première de Friedmann-Lemaître avec Λ=0, à ceci près qu'on n'a pas d'explication de la constante en lien avec la courbure.

La (non-)conservation de l'énergie

La chose sans doute la plus surprenante en cosmologie est qu'il n'y a pas vraiment de notion de conservation de l'énergie. En tout cas, sous la forme la plus naïve, celle-ci n'est pas vérifiée : la quantité totale de masse-énergie dans une unité de volume comobile vaut ρ·a³, et on a vu ci-dessus que la dérivée de ceci (par rapport au temps cosmique) vaut −3H·𝓅·a³ parce que les forces de pression travaillent lors de l'expansion de l'Univers. Et en particulier, bien sûr, si le vide possède une densité d'énergie ρ_vac = Λ/(8π·𝒢) non nulle, comme elle ne dépend de rien, la quantité totale d'énergie du vide augmente quand l'Univers s'étend ! A contrario, si l'Univers est dominé par le rayonnement, pour lequel w := 𝓅/ρ = 1/3, la quantité totale d'énergie décroît quand l'Univers s'étend, parce que l'expansion décale les longueurs d'onde vers le rouge (donc diminue leur fréquence et leur énergie). Comme je l'ai dit ci-dessus, c'est plutôt ρ·aⁿ avec n = 3(1+w) qui reste constant — mais pour chaque espèce de matière, et comme elles peuvent se convertir les unes en les autres, il n'y a pas de conservation globale.

Comment faut-il comprendre ce paradoxe ? L'interprétation classique de la chose serait la suivante : l'énergie définie naïvement comme ρ·a³ (par unité de volume comobile) ne se conserve pas parce qu'elle peut se transformer en énergie potentielle gravitationnelle (ou vice versa) : lorsque 𝓅 est positif (pour fixer les idées), les forces de pression fournissent un travail en participant à l'expansion de l'Univers, et (classiquement) cela signifie que de l'énergie est convertie depuis l'énergie interne de la matière ρ·a³ vers l'énergie potentielle gravitationnelle — il est donc logique que pour 𝓅≠0, la quantité ρ·a³ ne soit pas constante.

En relativité générale, cependant, la notion d'énergie gravitationnelle, ou, du coup, de masse-énergie totale, est particulièrement épineuse, et ne peut être définie qu'en bloc, si on s'éloigne suffisamment de la région où les transferts d'énergie ont lieu (plus exactement, si l'espace-temps est « asymptotiquement plat »), ce qui n'est certainement pas le cas de l'Univers tout entier. (La façon la plus simple de définir la masse-énergie totale d'un système gravitationnel borné est comme masse effective de Kepler, c'est-à-dire, celle qui intervient dans la solution de Schwarzschild ou dans la 3e loi de Kepler. Comme on ne peut pas faire tourner une particule loin de l'Univers entier, cette définition n'est pas utile en cosmologie.) L'interprétation orthodoxe est que la conservation de l'énergie n'a un sens que localement (en l'occurrence, dans le cadre de l'univers de FLRW, c'est l'équation ρ′ = −3(a′/a)·(ρ+𝓅) déjà écrite ci-dessus). Appliquée à l'Univers tout entier, la conservation de l'énergie n'a pas de sens, ou alors se réduit à la trivialité 0=0 : l'énergie totale de l'Univers est indéfinissable ou peut-être nulle (l'énergie gravitationnelle, qui est négative, compense exactement les autres formes d'énergie). Voici un passage dans ce sens d'un livre célèbre qui passe parfois pour la bible de la relativité générale :

There is no such thing as “the energy (or angular momentum, or charge) of a closed universe,” according to general relativity, and this for a simple reason. To weigh something one needs a platform on which to stand to do the weighing.

To weigh the sun, one measures the periods and semimajor axes of planetary orbits, and applies Kepler's “1-2-3” law, M=ω²·a³. […] To determine the electric charge of a body, one surrounds it by a large sphere, evaluates the electric field normal to the surface at each point on this sphere, integrates over the sphere, and applies the theorem of Gauss. But within any closed model universe with the topology of a 3-sphere, a Gaussian 2-sphere that is expanded widely enough from one point finds itself collapsing to nothingness at the antipodal point. Also collapsed to nothingness is the attempt to acquire useful information about the “charge of the universe”: the charge is trivially zero. By the same token, every “surface integral” […] to determine mass-energy or angular momentum collapses to nothingness. To make the same point in another way: around a closed universe there is no place to put a test object or gyroscope into Keplerian orbit to determine either any so-called “total mass” or “rest frame” or “4-momentum” or “angular momentum” of the system. These terms are undefined and undefinable. Words, yes; meaning, no.

Not having a defined 4-momentum for a closed universe may seem at first sight disturbing; but it would be far more disturbing to be given four numbers and to be told authoritatively that they represent the components of some purported “total energy-momentum 4-vector of the universe.” Components with respect to what local Lorentz frame? At what point? And what about the change in this vector on parallel transport around a closed path leading back to that strangely preferred point? It is a happy salvation from these embarrassments that the issue does not and cannot arise!

Imagine a fantastically precise measurement of the energy of a γ-ray. The experimenter wishes to know how much this γ-ray contributes to the total mass-energy of the universe. Having measured its energy in the laboratory, he then corrects it for the negative gravitational energy by which it is bound to the Earth. The result, E_corrected = h·ν·(1−M_♁/R_♁) is the energy the photon will have after it climbs out of the Earth's gravitational field. But this is only the first in a long chain of the gravitational fields of the solar system, the galaxy, the local cluster of galaxies, the supercluster, and then what? These corrections show no sign of converging, unless to E_corrected = 0.

—Charles Misner, Kip Thorne & John A. Wheeler, Gravitation (§19.4, p. 457–458)

On peut néanmoins se sentir un peu floué par cette réponse : parce que même si la conservation de l'énergie est impossible à formuler en toute généralité en relativité générale, il n'est pas interdit qu'on arrive à dire quelque chose d'intelligent sur le cas précis d'un univers de FLRW où manifestement l'énergie se transforme d'une forme en une autre. Notamment, si on regarde l'équation de Friedmann-Lemaître que j'ai qualifiée d'équation première, (a′/a)² = 8π·𝒢·ρ/3 − K₀/a² + Λ/3, elle assure que si l'Univers devait revenir à la même taille a avec le même facteur d'expansion H = a′/a, forcément la densité d'énergie ρ sera la même, donc on a envie de dire (je vais détailler ci-dessous) qu'elle exprime la conservation d'une certaine quantité, et cette quantité ressemble beaucoup à de l'énergie, donc on a envie que les différents termes représentent des formes d'énergie entre lesquels on ait des transferts — mais ce qu'ils sont n'est pas clair.

Je voudrais maintenant proposer deux façons de tenter de donner un sens énergétique aux différents termes de l'équation première, dont malheureusement aucune n'est satisfaisante, et qui de plus se contredisent ; j'en donnerai une troisième ensuite, qui est pleinement satisfaisante, mais qui n'explique pas vraiment ce que devient l'énergie dans l'Univers puisqu'il s'agit d'une analogie. Mettons que Λ=0 pour simplifier (quitte à ajouter l'énergie du vide dans le terme ρ), et, pour éviter de raisonner avec des infinis, prenons le cas d'un univers sphérique de courbure K = +1/R² avec R = R₀·a son rayon de courbure, si bien que l'équation première s'écrit ainsi : (R′/R)² − (8/3)π·𝒢·ρ + 1/R² = 0. Le but de l'opération est de multiplier ces quantités par différentes choses et d'obtenir ainsi des énergies qu'on pourrait tâcher d'interpréter de façon intuitive. J'aurai besoin du fait que le volume total de l'univers sphérique de rayon R vaut : 2π²·R³.

Si on revient à la dérivation newtonienne proposée plus haut des équations de Friedmann-Lemaître, l'équation première est obtenue sous la forme ½R′² − (4/3)π·𝒢·ρ·R² = Cte, dans laquelle les différents termes ont un sens énergétique assez clair : le terme ½R′² représente l'énergie cinétique par unité de masse (au niveau de la sphère de rayon R autour de l'origine) tandis que le terme −(4/3)π·𝒢·ρ·R² représente l'énergie potentielle par unité de masse, et la constante, qui vaut −½ même si la dérivation newtonienne ne le voit pas, représente l'énergie totale par unité de masse (qui reste constante donc). Rappelons qu'en mécanique newtonienne la masse se conserve séparément de l'énergie. On est donc tenté, au moins pour le cas d'un univers à courbure sphérique, de multiplier ces énergies par unité de masse par la « masse totale de l'Univers » 2π²·ρ·R³ (ici, 2π²·R³ est le volume total de l'Univers), ce qui conduit à mettre l'équation première sous la forme π²·ρ·R³·R′² − (8/3)π³·𝒢·ρ²·R⁵ + π²·ρ·R³ = 0 : ici, on a envie de proposer que π²·ρ·R³·R′² = π²·ρ·R⁵·H² soit la quantité d'énergie cinétique d'expansion totale dans l'Univers, et −(8/3)π³·𝒢·ρ²·R⁵ la quantité d'énergie gravitationnelle totale dans l'Univers, et que π²·ρ·R³ soit le total de toutes les autres formes d'énergie dans l'Univers (notamment la masse), pour un total conservé de 0. Malheureusement, il manque clairement un facteur 2 dans le dernier terme, et de toute façon toute l'analyse est hautement fumeuse (en relativité, la distinction entre énergie cinétique et énergie de masse au repos est très douteuse). Le fait d'arriver à des puissances cinquièmes de la taille de l'Univers me semble également suspect.
Pour voir les choses autrement, imaginons une civilisation ultra-avancée qui ait la possibilité d'agir sur toute la matière de l'Univers. Néanmoins, elle est liée par la conservation de l'énergie, donc elle ne peut modifier que la pression 𝓅 à un instant donné (partout dans l'Univers), pas la densité ρ. Mais en jouant sur la pédale de pression 𝓅, d'après l'équation d'accélération de Friedmann-Lemaître, elle peut contrôler l'expansion de l'Univers. De quelle manière voit-elle son bilan énergétique ? Notre civilisation voit le terme faisant intervenir ρ comme l'énergie dont elle dispose, et qu'elle consomme ou régénère en contrôlant 𝓅 ; si 𝓅=0 alors on a vu que ρ·a³ se conserve, ou disons l'énergie disponible 2π²·ρ·R³ (de nouveau, 2π²·R³ est le volume total de l'Univers). On va donc multiplier l'équation première par la bonne quantité (−(3π)/(4𝒢)·R³) pour faire intervenir ce terme, soit : −(3π)/(4𝒢)·R′²·R + 2π²·ρ·R³ − (3π)/(4𝒢)·R = 0. De nouveau, le terme −(3π)/(4𝒢)·R′²·R = −2π²·ρ_crit·R³ doit se comprendre comme une sorte d'énergie cinétique d'expansion, sauf que cette fois elle est négative, ce qui rend son interprétation hautement délicate : mais c'est l'énergie que notre civilisation ultra-avancée doit consommer pour arrêter l'expansion de l'Univers (à sa taille actuelle). Et une fois cette expansion arrêtée, le terme −(3π)/(4𝒢)·R doit certainement se comprendre comme une sorte d'énergie potentielle gravitationnelle liée à la configuration (i.e., la taille) de l'Univers : on aurait envie de penser à une sorte d'énergie élastique, mais de nouveau, le fait qu'elle soit négative (quoique cohérent avec le fait que les énergies gravitationnelles ont tendance à l'être) rend son interprétation hautement délicate. Le fait d'avoir des constantes de Newton au dénominateur me semble aussi suspect.

Comme on le voit, ces deux interprétations sont contradictoires : dans les deux cas, on donne un sens à 2π²·ρ·R³, mais les termes « cinétique » et « potentiel » ne collent absolument pas entre les deux analyses. Je n'exclus pas que tout ceci soit complètement idiot, et que l'idée même de donner un sens énergétique aux différents termes de l'équation première de Friedmann-Lemaître soit fondamentalement vouée à l'échec. Mais il y aurait alors quelque chose de vraiment insatisfaisant à exprimer la conservation d'une quantité qu'on n'arriverait pas à relier à l'énergie dans l'Univers.

Le fait qu'il n'y ait pas de conservation de l'énergie (ou en tout cas, que cela pose des problèmes conceptuels) ne s'applique pas qu'à l'Univers tout entier : il n'y a pas non plus de conservation d'une particule dans l'espace en expansion, même si elle semble ne pas interagir avec la matière qui s'y trouve. Voici un exemple d'expérience de pensée qui le montre : dans un univers sphérique en expansion, assez petit pour qu'on puisse en faire un tour complet, j'ai une petite réserve d'énergie dans mon coin (comobile) de l'Univers ; j'extrais de cette réserve de quoi envoyer deux rayons de lumière parfaitement directionnels (peut-être deux photons) avec la même énergie dans deux directions opposées (il n'y a donc pas de changement de ma quantité de mouvement, et je reste comobile) : ces rayons de lumière ou ces photons vont faire le tour de l'Univers et revenir à moi, mais ils auront été décalés vers le rouge pendant le processus, c'est-à-dire qu'ils auront perdu de l'énergie, et quand je les remets dans ma réserve, j'ai perdu de l'énergie par rapport à une situation où je n'aurais rien fait du tout. Où est passée cette énergie ? Si on fait le bilan comptable de mon énergie à moi, il n'y a rien à expliquer : elle est juste perdue, il n'y a pas de conservation de l'énergie dans l'univers de FLRW. (Techniquement, l'explication à ce fait est qu'il n'y a pas de champ de Killing orienté dans le temps.) Si on se hasarde à faire un bilan de l'Univers tout entier (j'ai expliqué que c'est très douteux), l'émission de photons dans des directions opposées, ou généralement la conversion d'une masse en rayonnement, revient à augmenter légèrement la pression (appuyer sur la « pédale de pression » qui contrôle l'accélération de l'expansion de l'Univers) : dans le processus, quand l'Univers s'étend, on perd de l'énergie, et l'expansion de l'Univers est epsilonesquement ralentie par le processus (oui, c'est peut-être surprenant, mais notre émission de photons ralentit très légèrement l'expansion de l'Univers, d'après le signe de 𝓅 dans l'équation d'accélération de Friedmann-Lemaître).

De même, il doit y avoir moyen théoriquement de récupérer de l'énergie en accélérant epsilonesquement l'expansion de l'Univers, et c'est d'ailleurs ce que fait le vide si la constante cosmologique est positive (ce qu'on croit) ; notons que ceci implique d'utiliser une pression négative (une tension, comme un élastique, peut-être un élastique qui ferait le tour de l'Univers), mais je reste sceptique quant à l'idée de tirer un élastique entre des galaxies proposée ici parce qu'il me semble que ça ralentirait l'expansion de l'Univers alors qu'il s'agit justement de l'accélérer (cette différence de signe est au cœur de la contradiction entre les deux interprétations énergétiques suggérées ci-dessus : je n'ai donc pas du tout les idées claires).

Digression : Il n'y a pas que la balance énergétique de l'Univers qui est subtile à établir : la balance entropique l'est au moins autant. L'Univers a démarré dans un état très homogène, et apparemment en équilibre thermodynamique (donc apparemment d'entropie maximale), et plus tard des sources d'énergie libre sont apparues : le fait que la matière et le rayonnement se soient découplés, donc aient maintenant des températures différentes, ou le fait que l'Univers soit essentiellement composé d'hydrogène et d'hélium qui peuvent être fusionnés, ou encore le fait que des étoiles apparaissent par effondrement gravitationnel, sont autant de signes que l'Univers est hors équilibre et peut créer de l'entropie. Intuitivement, l'explication de ce paradoxe est qu'un système gravitationnel homogène n'est justement pas en équilibre thermodynamique puisqu'il peut s'effondrer — ou alors, il est en équilibre thermodynamique mais pas gravitationnel, selon la façon dont on veut définir les termes — et il peut produire de l'entropie par cet effondrement (probablement quantifiée par la surface de l'horizon du trou noir qui résulterait d'un effondrement gravitationnel complet, ou quelque chose comme ça). L'état du Big Bang est spécial précisément parce qu'il est très homogène, alors que si on partait d'un état macroscopiquement semblable à l'état actuel (mais microscopiquement aléatoire) et qu'on retraçait les lois de la physique jusqu'à la singularité au temps du Big Bang, on y trouverait certainement un état partiellement effondré (donc plein de trous noirs). Seulement, tout le monde n'est pas d'accord avec la manière dont il faut tenir compte de cette subtilité dans la balance entropique : je crois comprendre que le point de vue standard est d'ignorer la contribution gravitationnelle de l'entropie, auquel cas l'expansion de l'Univers se fait en général à entropie constante mais à entropie maximale croissante, ce qui peut mettre le système hors équilibre ; un autre point de vue consiste à introduire une entropie gravitationnelle, mais il me semble que personne ne sait la calculer au juste (ce qui n'est pas surprenant si déjà l'énergie pose problème). Pour ce dernier point de vue, voir par exemple Penrose, The Road to Reality (A Complete Guide to the Laws of the Universe) (2004), chapitre 27, et Lineweaver, Davies & Ruse (eds.), Complexity and the Arrow of Time (2013), §3.3.

Les équations de Friedmann-Lemaître comme un puits de potentiel

Ce que je veux évoquer ici diffère subtilement de la section précédente, où il était question de (non-)conservation ou de transmutation de l'énergie, la vraie, celle qui existe physiquement. Ici, je propose de réécrire l'équation première de Friedmann-Lemaître pour la faire apparaître comme le mouvement d'une particule dans un puits de potentiel (de dimension 1) dont la forme permet de tirer immédiatement des conclusions qualitatives sur l'évolution de l'Univers. Reprenons l'équation (a′/a)² = 8π·𝒢·ρ/3 − K₀/a² + Λ/3, et écrivons-la sous la forme plus systématique, en faisant l'hypothèse que ρ est la somme d'une densité ρ_dst de poussière (en gros, matière non relativiste — y compris la matière noire), pour laquelle ρ_dst·a³ est constante, et d'une densité ρ_rad de rayonnement, pour laquelle ρ_rad·a⁴ est constante :

a′² = C₄·a⁻² + C₃·a⁻¹ + C₂ + C₁·a + C₀·a²

où les cinq constantes C ne dépendent que de l'Univers :

C₄ = (8/3)π·𝒢·ρ_rad·a⁴ est la « quantité » de rayonnement (par exemple, son énergie totale par unité de volume à l'époque t₀ de référence pour laquelle a(t₀)=1).
C₃ = (8/3)π·𝒢·ρ_dst·a³ est la masse de poussière (matière non relativiste) par unité de volume comobile (elle ne change pas avec le temps).
C₂ = −K₀ est, au signe près, la courbure de l'Univers à l'époque t₀ de référence.
C₁ = 0 : on peut trouver des choses à mettre dedans (ne serait-ce, par définition, qu'une forme de matière d'équation d'état w=−2/3), mais elles ne sont pas très intéressantes ; mais il est tellement logique d'avoir ce terme que je l'écris quand même.
C₀ = Λ/3 est, à un facteur près, la constante cosmologique.

Ces constantes sont d'ailleurs immédiatement reliées, via C_i = Ω_i(t₀)·H₀², aux proportions de criticité Ω_i(t₀) des différentes espèces (si on veut, Ω_rad, Ω_dst, Ω_crb, Ω₁ et Ω_vac, dont la somme vaut 1), mesurées à l'époque de référence t₀, et rapportées au paramètre de Hubble H₀ = a′(t₀) à cette époque (donc, si on préfère, à sa densité critique ρ_crit,0 = 3H₀²/(8π·𝒢)). On notera que H₀² = C₄ + C₃ + C₂ + C₁ + C₀.

Or cette équation a′² = C₄·a⁻² + C₃·a⁻¹ + C₂ + C₁·a + C₀·a² peut s'interpréter comme celle du mouvement d'une particule de masse 1 dans un puits de potentiel de forme −½ (C₄·a⁻² + C₃·a⁻¹ + C₂ + C₁·a + C₀·a²) : en effet, la somme de ce terme et de l'énergie cinétique ½a′² vaut toujours 0. On peut donc imaginer la dynamique décrite par les équations de Friedmann-Lemaître comme celle d'une particule qui se déplace dans ce potentiel. Par exemple, le graphe ci-contre représente le potentiel de Friedmann pour notre Univers tel que nous le comprenons actuellement (dominé par la poussière C₃ et l'énergie du vide C₀), avec en abscisse, la taille a relative à la taille actuelle, en ordonnée, le potentiel : l'Univers se déplace de la gauche vers la droite (en partant du Big Bang au bord gauche de la figure) et son énergie totale est au niveau de l'axe des abscisses (i.e., 0) ; on voit que l'expansion de l'Univers a ralenti jusqu'à un maximum de potentiel atteint vers a≈0.6, et accélère depuis.

La résolution des équation de Friedmann-Lemaître

On reprend maintenant l'équation première sous la forme a′² = C₄·a⁻² + C₃·a⁻¹ + C₂ + C₁·a + C₀·a², où C₄,…C₀ sont liées respectivement à la quantité de radiation, de poussière, de courbure, (rien), et d'énergie du vide. Cette équation différentielle est dite à variables séparées, c'est-à-dire qu'on peut faire la manip (formelle mais facile à justifier rigoureusement) consistant à écrire da/dt = √(C₄·a⁻² + C₃·a⁻¹ + C₂ + C₁·a + C₀·a²) sous la forme dt = da / √(C₄·a⁻² + C₃·a⁻¹ + C₂ + C₁·a + C₀·a²) et à intégrer des deux côtés : ceci exprime t en fonction de a comme l'intégrale d'une fonction qui est l'inverse de la racine carrée d'un polynôme du quatrième degré en a. On peut éventuellement vouloir faire un changement de variable b = 1/a, ce qui écrit t comme l'intégrale de −db / (b · √(C₄·b⁴ + C₃·b³ + C₂·b² + C₁·b + C₀)).

Une telle intégrale est une intégrale elliptique, et on peut en principe la calculer en toute généralité en utilisant des fonctions spéciales (malheureusement, ceci donnera éventuellement t en fonction de b, donc de a : donner une expression intelligente de la réciproque ne semble pas possible, le mieux qu'on puisse faire a l'air d'être de calculer a en fonction du « temps conforme » η).

Mais avant de se lancer dans un calcul général, on peut commencer par traiter le cas où seulement une ou deux des constantes C est non-nulle, c'est-à-dire lorsque l'Univers est dominé par une ou deux espèces, ce qui, en physique, est quasiment toujours suffisant en pratique. (Rappelons qu'ici la courbure a été mise dans le terme C₂, donc compte comme les autres : par exemple, si je dis que l'Univers est « dominé par le rayonnement », ça signifie que le rayonnement domine non seulement le terme de matière et le terme d'énergie du vide, mais aussi le terme de courbure, i.e., |(8/3)π·𝒢·ρ_rad| ≫ |K| pendant tout l'intervalle considéré.)

Univers dominé par le rayonnement

Si Ω_rad=Ω₄ domine tous les autres (donc vaut 1), l'intégrale de da/√(a⁻²) est simplement celle de a·da, qui vaut donc ½a² (plus une constante), et on obtient a = (2t·H₀)^½ = (t/t₀)^½. On a bien sûr H₀ = √((8/3)π·𝒢·ρ_rad(t₀)). Notons que H(t) ∝ t⁻¹, plus précisément H(t) = 1/(2t), et que ρ_rad(t) ∝ t⁻².

Ceci justifie que (après la fin de l'inflation, si elle a eu lieu) pendant les premiers environ 70000 ans de la vie de l'Univers, l'expansion avait lieu en t^½.

Univers dominé par la poussière

Si Ω_dst=Ω₃ domine tous les autres (donc vaut 1), l'intégrale de da/√(a⁻¹) est simplement celle de a^½·da, qui vaut donc (2/3)·a^3/2 (plus une constante), et on obtient a = ((3/2)·t·H₀)^2/3 = (t/t₀)^2/3. On a bien sûr H₀ = √((8/3)π·𝒢·ρ_dst(t₀)). Notons que H(t) ∝ t⁻¹, plus précisément H(t) = 2/(3t), et que ρ_dst(t) ∝ t⁻².

Univers dominé par la courbure

Si Ω_crb=Ω₂ domine tous les autres (donc vaut 1 ; la courbure est alors forcément négative, puisque Ω_crb := −K/H²), l'intégrale de da est simplement a (plus une constante), et on obtient a = t·H₀ = t/t₀. On a bien sûr H₀ = √(−K₀). Notons que H(t) ∝ t⁻¹, plus précisément H(t) = 1/t, et que K(t) ∝ t⁻².

Ce cas particulier s'appelle l'univers de Milne, et il mérite une attention pour la raison suivante : bien que je l'aie décrit comme « dominé par la courbure », en fait, l'espace-temps de cet Univers est plat ! La raison de ce paradoxe est qu'il faut faire attention à ce qu'on appelle « espace » — normalement, j'ai défini l'espace (c'est-à-dire, la séparation de l'espace et du temps) au moyen des observateurs comobiles qui sont eux-mêmes ceux qui sont au repos par rapport à la matière isotrope qui baigne l'Univers, mais ici, il n'y a justement pas de matière, donc le choix de l'espace est un peu arbitraire, et en choisissant celui-ci convenablement (ou peut-être mal, justement), on peut arriver à le présenter comme courbe. Une analogie pertinente est celle d'un cône (de révolution ordinaire) : un cône est, en fait, de courbure nulle (à part en son sommet, qui est singulier) puisqu'un de ses rayons de courbure principaux est infini, ou comme on le voit concrètement en prenant une feuille de papier (plate !) et en la mettant en forme de cône ; mais on peut aussi faire apparaître un cône comme un cercle qui grandit linéairement avec la distance à l'origine, ce qui est analogue à l'univers de Milne dont le paramètre de taille a croît linéairement avec le temps. • Il ne faut pas en déduire, cependant, que ce cas particulier n'a pas d'intérêt : si la densité de masse-énergie ρ (sous toutes ses formes) est très faible mais que l'espace dans lequel elle est isotrope est effectivement courbé, la solution de Milne s'applique — simplement, on n'est pas vraiment en train de faire de la relativité générale mais de la relativité restreinte (mais dans un système de coordonnées qui donne l'illusion de la courbure).

Univers dominé par l'énergie du vide

Si Ω_vac=Ω₀ domine tous les autres (donc vaut 1), l'intégrale de da/√(a²) est simplement celle de da/a, qui vaut donc log(a) (plus une constante), et on obtient a = exp(H₀·(t−t₀)). On a bien sûr H₀ = √(Λ/3). Notons que H est constant dans ce cas.

Ce cas particulier s'appelle l'univers de de Sitter (on a forcément Λ>0 dans la présentation qui vient d'être faite, puisque H² = Λ/3 : le cas Λ<0 est aussi théoriquement possible, mais il se présente nécessairement avec une courbure de l'espace). On va expliquer que, comme dans le cas de l'univers de Milne ci-dessus, il n'y a pas de référentiel privilégié pour fixer la courbure de l'espace, et — en l'absence de matière — le même espace-temps peut apparaître comme ayant une courbure d'espace positive, négative ou nulle (c'est ce dernier cas qui est décrit ici). En revanche, cette fois-ci, l'espace-temps est bien courbé.

Rayonnement et poussière

Si Ω_rad=Ω₄ et Ω_dst=Ω₃ dominent tous les autres, il est naturel de faire apparaître la taille a_eq de l'Univers pour laquelle ils sont égaux, c'est-à-dire C₃·a_eq = C₄. L'intégrale de da/√(C₄·a⁻² + C₃·a⁻¹) vaut (2/3)·(C₃·a−2C₄)·√(C₃·a+C₄)/(C₃)² plus une constante : c'est-à-dire que t égale (2/(3H₀))·(a−2a_eq)·√((a+a_eq)·(1+a_eq)) plus une constante, cette constante étant bien sûr l'opposé de la valeur de la même expression pour a=0. Malheureusement, s'il est possible de calculer la réciproque de cette expression (i.e., retrouver a à partir de t) en résolvant une équation du 3e degré, la formule est très pénible à écrire et peu éclairante : je me contente donc de cette expression de t en fonction de a.

Ce modèle décrit très bien notre Univers pendant le premier ou les deux premiers milliards d'années de son existence (tant que l'énergie du vide est très faible par rapport à la poussière), même s'il n'a un réel intérêt par rapport au modèle « poussière seule » que pendant quelques millions d'années. Le temps t_eq d'égalité poussière-rayonnement vaut environ 52kyr (« kyr » signifie « millier d'années ») : si on prend cette époque pour référence dans le modèle ci-dessus, c'est-à-dire qu'on impose a_eq=1, alors t=((2√2)/(3H₀))·((a−2)·√(a+1)+2) où H₀ (constante de Hubble à l'égalité poussière-rayonnement) vaut 3.2km/s par année-lumière, soit 1.1×10⁻⁵ par année. Si on préfère prendre l'époque présente comme référence t₀ dans ce modèle, ce qui est plus standard en général mais plus déplaisant ici parce qu'elle est en-dehors de la validité du modèle, alors t vaut (2/(3H₀)) · [(a−2a_eq)·√((a+a_eq)·(1+a_eq)) + 2a_eq·√(a_eq·(1+a_eq))] où a_eq vaut environ 1/3360 et H₀ vaut 56% de la vraie constante de Hubble actuelle (soit 1.2 centimètres par seconde et par année-lumière ou 3.9×10⁻¹¹ par année), i.e., ce que vaudrait la constante de Hubble actuelle s'il n'y avait pas d'énergie noire.

Rayonnement et courbure

Si Ω_rad=Ω₄ et Ω_crb=Ω₂ dominent tous les autres, on doit distinguer le cas de courbure positive et le cas de courbure négative (le cas de la courbure nulle a déjà été traité). Si la courbure est négative, c'est-à-dire que Ω₂>0, il est naturel de faire apparaître la taille a_eq de l'Univers pour laquelle Ω₄ et Ω₂ sont égaux, c'est-à-dire C₂·a_eq² = C₄. L'intégrale de da/√(C₄·a⁻² + C₂) vaut √((a²+a_eq²)/C₂) plus une constante, c'est-à-dire √((a²+a_eq²)·(1+a_eq²)/H₀ plus une constante qui est l'opposé de la valeur de cette même expression en a=0. Cette fois, on peut trouver l'expression réciproque : on obtient a = √[(H₀·t·(H₀·t+2·a_eq·√(1+a_eq²)))/(1+a_eq²)].

Si la courbure est positive, c'est-à-dire que Ω₂<0, on fait apparaître la taille a_eq de l'Univers pour laquelle Ω₄ et Ω₂ sont opposés, c'est-à-dire C₂·a_eq² = −C₄, et c'est aussi visiblement la taille maximale qu'atteint l'Univers (noter que a_eq≥1 puisque l'Univers ne dépassera pas cette taille). L'intégrale de da/√(C₄·a⁻² + C₂) vaut √((a_eq²−a²)·(a_eq²−1)/H₀ plus une constante qui est l'opposé de la valeur de cette même expression en a=0. On peut faire la réciproque : on trouve a = √[(H₀·t·(−H₀·t+2·a_eq·√(a_eq²−1)))/(a_eq²−1)]. L'Univers connaît un Big Crunch pour t valant 2·a_eq·√(a_eq²−1)/H₀.

Poussière et courbure

Les univers dominés par la poussière et la courbure sont les univers classiques de Friedmann :

Si Ω_dst=Ω₃ et Ω_crb=Ω₂ dominent tous les autres, on doit de nouveau distinguer le cas de courbure positive et le cas de courbure négative (le cas de la courbure nulle a déjà été traité). Si la courbure est négative, c'est-à-dire que Ω₂>0, il est naturel de faire apparaître la taille a_eq de l'Univers pour laquelle Ω₃ et Ω₂ sont égaux, c'est-à-dire C₂·a_eq = C₃. On peut exprimer l'intégrale t de da/√(C₃·a⁻¹ + C₂), mais elle n'admet pas de réciproque facilement exprimable. Il est donc préférable de faire intervenir le temps conforme η défini par dη = dt/a, qui est donc l'intégrale de da/√(C₃·a + C₂·a²) : je passe sur les détails des calculs et de l'inversion, mais on trouve : a = ½·a_eq·[cosh(η·H₀/√(1+a_eq)) − 1] ; le temps cosmique t s'exprime ensuite comme l'intégrale de a·dη, donc t = ½(a_eq·√(1+a_eq)/H₀)·[sinh(η·H₀/√(1+a_eq)) − (η·H₀/√(1+a_eq))]. On donne souvent à l'expression (η·H₀/√(1+a_eq)) le nom d'angle de développement φ (même si ce n'est pas vraiment un angle dans le cas de la courbure négative), il s'agit juste d'une façon d'exprimer le temps conforme en unités sans dimension et adaptées à l'Univers, ce qui simplifie ces expressions paramétriques en : a = ½·a_eq·[cosh(φ) − 1] et t = ½(a_eq·√(1+a_eq)/H₀)·[sinh(φ) − φ].

Dans le cas de la courbure positive, on fait apparaître la taille a_eq de l'Univers pour laquelle Ω₃ et Ω₂ sont opposés, c'est-à-dire C₂·a_eq = −C₃, et c'est aussi visiblement la taille maximale qu'atteint l'Univers (noter que a_eq≥1 puisque l'Univers ne dépassera pas cette taille). On donne à l'expression (η·H₀/√(a_eq−1)) le nom d'angle de développement φ (cette fois, il ressemble bien à un angle), ce qui donne les expressions paramétriques : a = ½·a_eq·[1 − cos(φ)] et t = ½(a_eq·√(a_eq−1)/H₀)·[φ − sin(φ)]. L'Univers connaît un Big Crunch pour t valant π·a_eq·√(a_eq−1)/H₀.

Courbure et énergie du vide

Si Ω_crb=Ω₂ et Ω_vac=Ω₀ dominent tous les autres, comme leur somme doit être positive (elle vaut 1, ou si on préfère, C₂+C₀ vaut H₀²), on doit distinguer trois cas : soit la courbure est négative (Ω₂>0) et l'énergie du vide est positive (Ω₀>0), soit la courbure est positive (Ω₂<0) et l'énergie du vide est positive (Ω₀>0), soit la courbure est positive (Ω₂>0) et l'énergie du vide est négative (Ω₂<0). Dans tous les cas, l'intégrale de da/√(C₂ + C₀·a²) se calcule facilement et la réciproque s'exprime sans problème avec des lignes trigonométriques circulaires ou hyperboliques. On va de nouveau faire intervenir la taille a_eq de l'Univers pour laquelle Ω₂ et Ω₀ sont égaux (dans le premier cas) ou opposés (dans les deux autres) : si on préfère, a_eq = √(±3K₀/Λ) (avec le signe − dans le premier cas et + dans les deux autres), où Λ est la constante cosmologique et K₀ la courbure de l'espace à l'instant t₀ de référence.

Dans le premier cas (courbure négative et énergie du vide positive), on trouve a = a_eq·sinh(H₀·t/√(1+a_eq²)). Ce cas connaît donc un Big Bang (mais je vais expliquer qu'il est illusoire) et s'étend ensuite indéfiniment. Dans le second cas (courbure positive et énergie du vide positive), on trouve a = a_eq·cosh(H₀·t/√(1+a_eq²)). Ce cas ne connaît donc ni Big Bang ni Big Crunch : il se contracte depuis les temps infinis négatifs jusqu'à une taille minimale (a_eq, atteinte pour t=0 : je l'ai prise pour origine des temps puisqu'il n'y a pas de Big Bang qui puisse jouer ce rôle). Dans le troisième cas (courbure positive et énergie du vide négative), on trouve a = a_eq·sin(H₀·t/√(a_eq²−1)) : il y a un Big Bang et un Big Crunch, dans une durée totale de π·√(a_eq²−1)/H₀.

En fait, malgré les apparences, les deux premiers cas (les deux avec énergie du vide positive) décrivent la même chose, l'univers de de Sitter, déjà considéré ici : comme il n'y a pas de matière dans cet univers, la séparation de l'espace et du temps est arbitraire, et ce choix arbitraire peut faire apparaître le même univers comme ayant une courbure d'espace nulle, négative ou positive (avec, dans le cas de courbure négative, une illusion de Big Bang qui signifie simplement que les coordonnées d'espace choisies deviennent singulières à un certain moment). En un certain sens, la présentation avec courbure positive est la meilleure car on peut montrer que c'est la seule qui décrit vraiment tout l'espace-temps.

Le dernier cas, en revanche, c'est-à-dire celui de l'énergie du vide négative, est vraiment différent (l'énergie du vide est quelque chose d'objectivement mesurable, qui ne dépend pas de la séparation entre espace et temps), et il se présente nécessairement comme ayant une courbure d'espace positive. On l'appelle l'univers « anti-de Sitter ». De nouveau, cependant, le Big Bang et le Big Crunch que semblent connaître cet univers sont plutôt une singularité de coordonnées qu'un vrai phénomène physique : l'espace-temps anti-de Sitter, comme l'espace-temps de de Sitter, est lisse (il s'agit d'ailleurs de quadriques — des sortes d'hyperboloïdes — dans un espace-temps une dimension supérieure) ; l'interprétation physique, cependant, n'est pas franchement évidente, parce que la version mathématique la plus naturelle donne à l'espace-temps anti-de Sitter un temps cyclique.

Je renvoie à ce texte d'Ugo Moschella pour plus de détails sur les espaces-temps de de Sitter et anti-de Sitter.

Poussière et énergie du vide

Traitons encore un cas guère passionnant du point de vue mathématique, mais qui a l'intérêt de bien décrire notre univers à l'époque actuelle. Si Ω_dst=Ω₃ et Ω_vac=Ω₀ dominent tous les autres, on introduit comme d'habitude la taille a_eq de l'Univers pour laquelle Ω₃ et Ω₀ sont égaux, c'est-à-dire C₀·a_eq³ = C₃, et on trouve a = a_eq·(sinh((3/2)·H₀·t/√(1+a_eq³)))^2/3.

Pour notre Univers dans son époque actuelle, on a a_eq=0.77 (mesuré par rapport à l'époque t₀ actuelle) et H₀ = 2.1 centimètres par seconde et par année-lumière ou 6.9×10⁻¹¹ par année, et la formule ci-dessus décrit très bien notre univers à partir de l'âge de quelques dizaines de millions d'années (quand la part du rayonnement devient négligeable).

Dans le cas où l'énergie du vide est négative, on introduit comme d'habitude la taille a_eq de l'Univers pour laquelle Ω₃ et Ω₀ sont opposés, c'est-à-dire C₀·a_eq³ = −C₃, et on trouve a = a_eq·(sin((3/2)·H₀·t/√(a_eq³−1)))^2/3.

Rayonnement et énergie du vide

Traitons un dernier cas très semblable au précédent. Si Ω_rad=Ω₄ et Ω_vac=Ω₀ dominent tous les autres, on introduit comme d'habitude la taille a_eq de l'Univers pour laquelle Ω₄ et Ω₀ sont égaux, c'est-à-dire C₀·a_eq⁴ = C₄, et on trouve a = a_eq·(sinh(2·H₀·t/√(1+a_eq⁴)))^1/2.

Dans le cas où l'énergie du vide est négative, on trouve a = a_eq·(sin(2·H₀·t/√(a_eq⁴−1)))^1/2.

Sur la solution générale des équations de Friedmann

Ci-dessus ont été traités tous les cas de non-nullité d'un ou deux des coefficients Ω_rad (rayonnement), Ω_dst (poussière), Ω_crb (courbure), et Ω_vac (énergie du vide), auxquels j'aurais encore pu ajouter Ω₁. Concernant le cas général, il faut se pencher, par exemple, sur l'intégrale de −db / (b · √(C₄·b⁴ + C₃·b³ + C₂·b² + C₁·b + C₀)) où b = 1/a. Comme les géomètres algébristes savent bien, ceci est l'intégrale d'une différentielle globale méromorphe −db / (b · y) sur une courbe elliptique (celle d'équation y² = C₄·b⁴ + C₃·b³ + C₂·b² + C₁·b + C₀), et elle peut donc en principe s'exprimer en toute généralité au moyen d'intégrales elliptiques. Ceci donnera t en fonction de b (ou, du coup, de a), mais je pense qu'il n'y a aucun espoir d'obtenir une réciproque vaguement en forme close (encore faudrait-il décider ce qu'on veut dire par là exactement…) donnant a en fonction de t.

Ce qu'on peut faire, en revanche (et j'ai déjà montré la technique dans le cas beaucoup plus simple des univers de poussière et courbure), c'est faire intervenir le temps conforme η défini par dη = dt/a = b·dt = −db / √(C₄·b⁴ + C₃·b³ + C₂·b² + C₁·b + C₀). Cette fois, il s'agit d'une différentielle bien particulière, pour laquelle on sait non seulement calculer l'intégrale, mais même exprimer sa réciproque au moyen de la fonction ℘ de Weierstraß : je ne vais pas faire les calculs ici mais ceux qui veulent les voir peuvent se tourner vers cet article de Frank Steiner (Solution of the Friedmann Equation…) et celui-ci de Robert Coquereaux (The history of the universe is an elliptic curve).

Les deux articles en question se penchent sur les invariants de cette courbe elliptique (g₂, g₃ et j — bon, g₂ et g₃ ne sont pas vraiment des invariants de la forme elliptique mais ils sont intimement apparentés aux invariants de la forme binaire quartique définie par les coefficients C₀ à C₄). À mon avis, c'est un peu hors propos : ces invariants sont pertinents si on s'intéresse aux reparamétrages de la forme a ↦ (α·a+β)/(γ·a+δ) (i.e., les homographies), mais je vois assez mal quel sens physique intéressant cela aurait sur la taille de l'Univers. Il me semble que les seules transformations physiquement sensées sont celles de la forme a ↦ α·a. Voici donc plutôt comment je vois les choses :

Remarque sur les invariants d'un univers

Quand on réfléchit aux différents cas que j'ai évoqués un par un ci-dessus, c'est-à-dire ceux où un ou deux des coefficients C₀ à C₄ sont non-nuls, on s'aperçoit qu'aucun n'a de paramètre sans dimension. Il y a bien un H₀ et un a_eq qui interviennent dans les formules, mais H₀ est un paramètre avec dimension, qui détermine l'échelle de temps (la constante de Hubble a pour unités l'inverse d'un temps, cet inverse étant appelé temps de Hubble), tandis que a_eq est certes sans dimension, mais il détermine, en fait, l'époque t₀ à laquelle on a mesuré cette constante de Hubble H₀. De fait, un univers avec deux coefficients non-nuls est complètement déterminé à des signes près : si on reparamètre a pour que les deux substances aient la même valeur Ω, ou peut-être des valeurs opposées, à a=1 (i.e., si on impose a_eq=1), il ne reste comme paramètre libre que le paramètre de Hubble à ce moment, qui correspond à choisir l'échelle de temps.

Pour dire les choses autrement, on considère deux univers définis par des constantes C₀ à C₄ comme équivalents lorsqu'on effectue les opérations suivantes :

multiplier chacune des constantes de C₀ à C₄ par la même constante non nulle : ceci revient à faire un changement d'échelle sur le temps (i.e., sur la constante de Hubble),
multiplier chaque C_i par α⁻ⁱ, la puissance i-ième d'une même constante non nulle 1/α : ceci revient à faire un changement d'échelle de a en α·a.

Les invariants, ou paramètres sans dimension, qui caractérisent l'univers, sont donc les expressions en les C_i, produits de puissances positives ou négatives de ceux-ci, qui sont à la fois de degré total 0 (somme des puissances des C_i qui interviennent) et aussi de « poids » total 0 (somme des puissances des C_i chacune multipliée par i) : par exemple, C₂·C₄/C₃² est un tel invariant, qui vaut aussi Ω₂·Ω₄/Ω₃² à tout instant (les Ω changent avec le temps, mais une telle expression ne change pas), ou encore −(3ρ_rad·K)/(8π·𝒢·ρ_dst²). En fait, il y a exactement trois invariants basiques :

Ω₂·Ω₄/Ω₃² = −(3K·ρ_rad)/(8π·𝒢·ρ_dst²),
Ω₀·Ω₄³/Ω₃⁴ = (Λ·ρ_rad³)/(8π·𝒢·ρ_dst⁴),
Ω₁·Ω₄²/Ω₃³ si on autorise un Ω₁.

J'ai envie d'appeler le premier la courbure cosmologiquement sans dimension et le second la constante cosmologique cosmologiquement sans dimension (cosmologiquement sans dimension étant mis par opposition à sans dimension dans les unités de Planck). Pour ce qui est de l'univers où nous vivons, on sait seulement du premier qu'il est plus petit que quelque chose comme 10⁻⁵ en valeur absolue (et on ne connaît pas son signe), du second qu'il est de l'ordre de 6×10⁻¹¹, et on n'a pas de raison de penser que le troisième serait non nul.

Finit (non-conclusion : ce dont je n'ai pas parlé)

J'ai passé beaucoup trop de temps sur cette entrée, et à ce stade-là j'en ai franchement marre, donc je n'arrive plus à la conclure. On me pardonnera donc de la finir un peu brutalement.

Je me contente de mentionner, sans plus de précisions, deux choses dont j'envisageais de parler et que je n'ai pas eu le courage d'ajouter ici : d'une part, une description plus approfondie des espaces de de Sitter et anti-de Sitter (mathématiquement intéressants et naturels parce qu'il s'agit d'espaces-temps homogènes et isotropes dans l'espace-temps et pas juste dans l'espace, et aussi assez riches en « paradoxes » apparents), et d'autre part quelques remarques sur l'inflation, les problèmes qu'elle prétend résoudre et les problèmes qu'elle pose à son tour (en gros, elle résout beaucoup de problèmes apparemment sans rapport les uns avec les autres, mais comme on n'a aucune idée de ce qui a pu causer cette inflation, cela pose à son tour d'autres problèmes importants), et une digression sur l'inflation éternelle.