Précisions d'emblée que le but de ce billet, qui évoque le rapport
entre (pour prendre un exemple célèbre) un chat vivant avec
probabilité ½ et mort avec probabilité ½
(« mélange
probabiliste ») et un chat dans un état quantique qui combine
vivant et mort
(« superposition quantique ») n'est pas vraiment de
faire de la vulgarisation, encore moins de la physique. Je m'en sers,
comme je fais parfois, surtout pour gribouiller rapidement ce que j'ai
(moi matheux) réussi à comprendre de textes que je trouve souvent
obscurs, et pour noter des questions que je (me) pose si je veux y
réfléchir plus attentivement Un Jour™, mais ça ne signifie pas que
d'autres trouveront mes explications plus claires que ce qu'on peut
trouver ailleurs. Il s'agit essentiellement de choses très
classiques, mais que je trouve généralement très mal expliquées
(notamment par le fait qu'on prend rarement le soin d'essayer de
décrire le parallèle entre mélanges probabilistes et superpositions
quantiques séparément avant de dire comment ces deux choses se
combinent), quoique certaines des questions que je soulève au passage
n'ont pas l'air d'être beaucoup discutées, et c'est dommage.
Quoi qu'il en soit, ce qui suit s'adresse à des lecteurs qui savent
au moins un peu d'algèbre linéaire (en gros, pour qui les
mots espace de Hilbert
ont un sens — je ne parlerai que de la
dimension finie donc on peut préférer espace hermitien
), et
sont globalement familiers avec le fait qu'une matrice hermitienne est
diagonalisable. Et encore une fois, mon point de vue va être celui
d'un matheux, pas d'un physicien (témoin le fait que je vais à peine
évoquer de lois de la physique) : la question est celle de la
représentation mathématique d'états d'un système physique. (Et j'en
profite pour pointer du doigts certains faits géométriques sur cette
représentation.) Mais au passage, ça soulève des questions, qui me
semblent intéressantes, sur la philosophie de la physique (notamment
que signifient les probabilités, et dans quelle mesure elles font
partie de la réalité du monde).
Je dois aussi préciser que j'ai changé plein de fois d'avis sur ce que je voulais raconter ici, que j'ai fait mon plan a posteriori et que j'ai réécrit plein de fois des passages sans vérifier la cohérence avec ce qui était déjà ailleurs, ce qui explique sans doute des virages un peu bizarres, des redites ou incohérences de propos et des digressions inutiles (comme d'habitude, j'essaie de rédiger de manière à ce qu'on puisse les sauter, mais je ne sais pas dans quelle mesure j'y arrive). Par ailleurs, comme ça m'arrive souvent, j'ai écrit ce texte jusqu'au point où j'en ai eu marre de l'écrire, ce qui explique qu'après être parti dans toutes les directions il s'arrête un peu brutalement et sans vraie conclusion — mais je pense que mes lecteurs (enfin, ceux qui sont assez patients pour lire mes billets jusqu'au bout) ont l'habitude de ça.
Plan
Mélanges probabilistes et superpositions quantiques séparément
Comme promis, je commence comme un matheux. Supposons
que A soit un ensemble, que je vais prendre fini pour
simplifier et que j'imagine comme les états
basiques
que peut prendre un système physique.
Mon but est dans un premier temps de définir deux types de
constructions[#] qu'on peut
faire sur cet ensemble A, que je vais ensuite comparer et
contraster, et que je vais appeler mélanges probabilistes
et superpositions quantiques
; puis, dans la suite, je
discuterai comment on peut les combiner.
[#] Techniquement, j'imagine qu'on doit pouvoir faire de chacune de ces constructions une monade, mais je ne veux pas tomber dans ce trou de lapin-là.
Mélanges probabilistes
Si je ne sais pas exactement dans quel état se trouve mon système,
je peux représenter mon ignorance sous la forme d'une distribution
de probabilités sur A : concrètement, ça
va prendre la forme d'une fonction de A vers les réels
positifs (donnant la probabilité de chaque état) dont la somme totale
est 1. De façon équivalente, si je note [a],
lorsque a∈A la fonction qui vaut 1
en a et 0 ailleurs (i.e., la distribution de probabilités
concentrée en a), une distribution de
probabilités p quelconque sur A s'écrit comme
une combinaison convexe des [a],
c'est-à-dire une combinaison linéaire à coefficients positifs de
somme 1 (les coefficients étant justement la
probabilité p(a) de chaque a, i.e.,
on a p =
∑a∈A p(a) · [a],
avec, je répète, p(a)≥0 pour
chaque a, et
∑a∈A p(a) = 1).
Je parlerai aussi de mélange probabiliste
des
éléments de a pour une telle combinaison convexe.
À titre d'exemple, si A = {vivant, mort} désigne les deux états possibles de vie d'un chat, le mélange probabiliste ½([vivant] + [mort]) désigne un chat qui a 50% de chances d'etre vivant et 50% de chances d'être mort.
Géométriquement, il faut penser à cet ensemble de distributions de probabilités / combinaisons convexes / mélanges probabilistes (selon le terme qu'on préfère) comme un simplexe dont les sommets sont les éléments de A (i.e., lorsque A a 2 éléments, c'est un segment les reliant, quand il en a 3 c'est un triangle ayant ces sommets, quand il en a 4 c'est un tétraèdre, etc.) ; et les coordonnées barycentriques dans le simplexe sont les valeurs p(a) de la distribution de probabilités p considérée.
Je n'ai rien dit d'intelligent, ou même d'intéressant dans tout ça : c'est complètement standard, c'est juste différents points de vue un tout petit peu différents sur la même chose.
Superpositions quantiques
Maintenant, quand on fait de la mécanique quantique, il y a autre chose qui intervient, et qu'il faut bien distinguer de ce qui précède : ce sont les superpositions quantiques. Cette fois, je vais considérer un espace vectoriel complexe[#2], et même hilbertien (= hermitien), dont une base orthonormée est formée de vecteurs notés |a⟩ où a∈A, et je m'intéresse aux vecteurs de norme 1 dans cet espace (éventuellement : modulo la phase, c'est-à-dire modulo multiplication par les complexes de module 1, ce qui en fait un « espace projectif » complexe, cf. ici). Autrement dit, les éléments de l'espace sont les ∑a∈A u(a) · |a⟩ avec u(a) des nombres complexes et ∑a∈A |u(a)|² = 1 ; le produit scalaire hermitien de deux tels éléments |u⟩ := ∑a∈A u(a) · |a⟩ et |v⟩ := ∑a∈A v(a) · |a⟩ est donné par ⟨u|v⟩ := ∑a∈A u(a)* · v(a) où z* désigne ici le conjugué d'un nombre complexe (normalement noté avec une barre au-dessus, mais c'est pénible à faire en HTML) (j'ai pris ici la convention des physiciens selon laquelle le produit scalaire hermitien est antilinéaire dans sa première variable et linéaire dans la seconde). La notation suggère de définir ⟨a| comme la forme linéaire valant 1 en |a⟩ et 0 sur tous les autres |b⟩, si bien que le produit scalaire par ∑a∈A u(a) · |a⟩ à gauche s'écrit comme la forme linéaire ∑a∈A u(a)* · ⟨a|. Bon, là je n'ai rien dit d'intelligent.
[#2] Le fait qu'on ait apparemment nécessairement affaire à des coefficients complexes, quel que soit le système physique décrit, me laisse un peu perplexe, et apparemment je ne suis pas le seul.
Pour reprendre l'exemple précédent, si A = {vivant, mort} désigne les deux états possibles de vie d'un chat, alors (|vivant⟩ + |mort⟩)/√2 désigne un chat dans un état quantique qui superpose ces deux états. Mais on notera que (|vivant⟩ − |mort⟩)/√2 est aussi un tel état, qui semble très analogue, mais qui est orthogonal au précédent comme on le voit en calculant le produit hermitien (et on peut légitimement se demander ce que tout ça veut dire). Et de même, (|vivant⟩ + i·|mort⟩)/√2 et (|vivant⟩ − i·|mort⟩)/√2 devraient avoir un sens et être orthogonaux l'un à l'autre (quoique pas aux précédents). Ceci étant dit, autant c'est rigolo de donner mes exemples avec des chats vivants ou morts ou en superposition quantique entre les deux, ce n'est peut-être pas un très bon exemple[#3][#3b], en fait, justement à cause de la difficulté de donner un sens à ces états que je viens d'écrire, donc dans la suite je vais passer à un exemple plus abstrait du genre A = {0,1}, c'est-à-dire les états basiques de ce qu'on appelle un qubit : vous pouvez imaginer ‘0’ et ‘1’ comme signifiant qu'un chat est vivant et mort si vous voulez, mais si vous voulez des exemples physiquement plus plausibles, l'article Wikipédia que je viens de lier a divers exemples, et je vais juste dire un mot de deux d'entre eux dans les paragraphes suivants.
[#3] Je ne sais plus qui me faisait le reproche je ne sais où d'utiliser le chat de Schrödinger comme exemple de superposition quantique, alors que c'est justement un exemple censé illustrer le doute qu'on peut avoir sur l'existence ou le sens de superpositions quantiques sur des objets macroscopiques. Si on croit la mécanique quantique jusqu'au bout, et notamment si on croit sa linéarité exacte, alors oui, on peut faire des superpositions quantiques macroscopiques, et même c'est ce qui arrive à l'Univers tout entier dès qu'on fait une « mesure », et il y a toutes sortes de tentatives d'explications, ou de bouts d'explications (décohérence, interprétation « multi-mondes » d'Everett-DeWitt) sur pourquoi on ces superpositions ne se manifestent pas de façon visible dans notre expérience quotidienne. Mais mon but ici n'est pas vraiment de parler de ces choses-là (même si je ne peux pas faire l'économie d'au moins une mention au passage — dont acte ; cf. aussi la note #8 plus bas).
[#3b] Ajout
() : Bien sûr, le problème avec le chat, ce
n'est pas juste qu'il est macroscropique, c'est qu'il a bien plus
d'états que {vivant, mort} : il y a peut-être quelque chose comme
101027 états qualifiables de vivant
et
de mort
. En quoi ceci est vraiment pertinent pour toute la
discussion n'est pas clair pour moi, ni si on choisit de les regrouper
en deux paquets (i.e., de fabriquer deux sous-espaces de grande
dimension) ni si on décide d'en choisir un très particulier dans
chaque paquet (mais je note quand même que, par un phénomène de
concentration de la mesure, si on choisit un état vivant
au
hasard et un état mort
au hasard, ils seront essentiellement
orthogonaux — donc au moins ça justifie de travailler avec comme des
états basiques).
À titre d'exemple de qubit, il y a la polarisation d'un photon : si |↺⟩ représente un photon polarisé circulairement d'hélicité droite[#4] et |↻⟩ un photon polarisé circulairement d'hélicité gauche, alors (|↺⟩ + |↻⟩)/√2 et (|↺⟩ − |↻⟩)/√2 peuvent représenter des photons respectivement polarisés horizontalement et verticalement[#5][#6], tandis que (|↺⟩ + i·|↻⟩)/√2 et (|↺⟩ − i·|↻⟩)/√2 peuvent en représenter de polarisations diagonales.
[#4] Comme bien
expliqué sur Wikipédia, il y a deux conventions opposées sur ce
qu'une polarisation circulaire horaire
ou anti-horaire
signifie, selon qu'on prend le point de vue de la source qui voit
l'onde partir ou de la cible qui voit l'onde arriver. Par contre,
l'hélicité, il me semble que ça devrait être inambigu : on met le
pouce (droit ou gauche, selon qu'on parle d'hélicité droite ou gauche)
dans le sens de propagation de l'onde et en courbant les autres doigts
ils indiquent dans quel sens l'onde tourne autour de son sens de
propagation. Donc pour moi, hélicité droite = sens anti-horaire
(= trigonométrique) vu par la cible = sens horaire (= rétrograde) vu
par la source, tandis que hélicité gauche = sens horaire
(= rétrograde) vu par la cible = sens anti-horaire (= trigonométrique)
vu par la source. (Et les petits dessins ‘↺’ et ‘↻’ que j'utilise
évoquent ce que voit la cible.) Mais apparemment, toujours si j'en
crois Wikipédia, des gens ont aussi réussi à mélanger les
conventions gauche/droite, et là je ne comprends pas comment ils ont
pu faire un truc pareil. Enfin bon, tout ça n'a aucune importance
pour ce que je veux raconter ici.
[#5] Là aussi, on
trouve des conventions contradictoires, bien sûr, mais la convention
moderne semble être de dire qu'une onde se propageant horizontalement
a une polarisation horizontale
par référence à la direction du
champ électrique oscillant : le champ magnétique, lui,
oscille dans une direction perpendiculaire au champ électrique et au
vecteur de propagation de l'onde, donc verticalement pour une onde de
polarisation horizontale.
[#6] Mathématiquement, imaginez que |↺⟩ est la fonction exp(2iπν·t) où ν est la fréquence du photon et t est le temps retardé par la distance depuis la source, et le composantes réelle et complexe sont, disons, les composantes horizontale et verticale du champ électrique ou quelque chose comme ça, tandis que |↻⟩ est exp(−2iπν·t) ; alors (|↺⟩ + |↻⟩)/√2 et (|↺⟩ − |↻⟩)/√2 décrivent les fonctions cos(2πν·t) et i·sin(2πν·t) respectivement.
La raison pour laquelle je précise l'exemple du paragraphe précédent est pour souligner que ces états en superposition quantique sont parfaitement valables (je vais dire ci-dessous que, contrairement à la situation probabiliste, il n'y a rien d'objectif qui distingue les états basiques que j'ai choisis des autres états fabriqués par combinaisons linéaires de ceux-ci : le fait qu'un état soit « superposé » n'a pas de sens en soi), et ça se voit bien sur cet exemple-là : les polarisations circulaires n'ont rien de plus naturel que les polarisations horizontales/verticales ou diagonales. Par ailleurs, on se dit que ce sont des choses qui ont un vrai sens physique, pas des expressions de notre ignorance.
J'ai évoqué les photons ci-dessus pas juste pour le plaisir d'utiliser les caractères ‘↺’ et ‘↻’, mais aussi parce que je pense que c'est raisonnablement simple à comprendre — modulo les prises de tête sur les conventions contradictoires quant au sens de la polarisation — mais on peut aussi dire un mot du qubit décrivant le spin de l'électron au repos. Là les deux états basiques pourraient être |↑⟩ et |↓⟩ représentant un électron avec un spin dirigé vers le haut ou vers le bas respectivement : alors (|↑⟩ + |↓⟩)/√2 et (|↑⟩ − |↓⟩)/√2 peuvent représenter un électron avec un spin dirigé vers la droite et la gauche respectivement, tandis que (|↑⟩ + i·|↓⟩)/√2 et (|↑⟩ − i·|↓⟩)/√2 peuvent en représenter un avec un spin dirigé vers l'avant et l'arrière respectivement[#7].
[#7] Le lecteur
astucieux me demandera mais ça dépend très hautement du fait que
l'espace est de dimension 3, ça : que se passe-t-il en d'autres
dimensions ?
— et, en effet, c'est une particularité de la
dimension 3 que l'état de spin d'une particule de spin ½ soit
représenté par un qubit. En général, en dimension d le
spin d'une telle
particule devrait
avoir 2⌊d/2⌋ états basiques (c'est la
dimension de la représentation spinorielle du groupe
Spind ; je ne sais d'ailleurs pas comment
Wikipédia réussit à cacher cette information aussi efficacement dans
la page que je viens de lier), c'est-à-dire l'équivalent de
⌊d/2⌋ qubits. Donc, oui, c'est particulier à la
dimension 3 qu'on puisse décrire ça aussi simplement que vers le
haut
et vers le bas
. Pour la polarisation du photon, il me
semble que c'est d−1 états basiques (donc, en grande
dimension, il y a beaucoup moins d'information dans le spin d'un
photon que d'un électron, vous interprétez ça comme vous voulez).
Ressemblances et différences entre les deux
Il y a des ressemblances entre mélange probabiliste et superposition quantique, et j'ai fait exprès de choisir une description analogue avec des combinaisons linéaires pour faire ressortir ces ressemblances (et je regrette que toute description de la mécanique quantique ne commence pas par une telle discussion). Il y a aussi des différences cruciales, à la fois physiques et mathématiques.