David Madore's WebLog

This WebLog is bilingual, some entries are in English and others are in French. A few of them have a version in either language. Other than that, the French entries are not translations of the English ones or vice versa. Of course, if you understand only English, the English entries ought to be quite understandable without reading the French ones.

Ce WebLog est bilingue, certaines entrées sont en anglais et d'autres sont en français. Quelques-unes ont une version dans chaque langue. À part ça, les entrées en français ne sont pas des traductions de celles en anglais ou vice versa. Bien sûr, si vous ne comprenez que le français, les entrées en français devraient être assez compréhensibles sans lire celles en anglais.

Note that the first entry comes last! Notez que la première entrée vient en dernier !

Index of all entries / Index de toutes les entréesXML (RSS 1.0) • Recent comments / Commentaires récents

(jeudi)

Je me noie dans les entrées de blog que j'essaie d'écrire

Ma motivation principale pour faire de la vulgarisation scientifique dans ce blog est de me forcer à faire un petit tour d'un sujet et vérifier que je le comprends comme je voudrais (parce qu'il n'y a pas de meilleur moyen pour s'assurer qu'on comprend quelque chose que de l'enseigner, et comme il est peu probable qu'on me laisse faire des enseignements de quelque chose d'éloigné de ce qui est censé être ma « spécialité », je ne peux pas faire mieux que de les raconter en ligne) ; de façon apparentée, ça me sert d'« espace de swap » de ma mémoire, me permettant donc de libérer mon cerveau de ce que j'ai appris sur le sujet (ou en tout cas, de ne pas angoisser à l'idée de l'oublier) en me disant que je pourrai le retrouver ici. (Quand il s'agit de sujets trop techniques qui ne se prêtent pas trop à de la vulgarisation, bien sûr, je fais autrement : j'écris par exemple des petites notes en TeX que je garde sous le coude.)

Un des problèmes que je rencontre souvent (et dont je me suis déjà plaint par le passé, mais si vous n'aimiez pas m'entendre radoter vous ne liriez pas ce blog, n'est-ce pas ?) c'est que je sous-estime radicalement la quantité de choses que j'ai à raconter sur un sujet donné. Et par conséquent le temps et l'espace que ça va me prendre de les raconter.

Par exemple, il y a quelques semaines, je me suis dit que j'écrirais bien une « petite entrée » (famous last words!) sur la cosmologie (oui, je sais, j'ai récemment laissé entendre que je pourrais écrire quelque chose sur la physique des particules, mais si vous cherchiez la cohérence thématique vous ne liriez pas ce blog, n'est-ce pas ?). Je pensais sincèrement ne pas avoir grand-chose à raconter à ce sujet : je voulais juste écrire une petite introduction historique et physique, et ensuite me concentrer sur les mathématiques. Comme il s'agit essentiellement — me disais-je — de commenter deux équations différentielles pas très compliquées (et dont, d'ailleurs, l'une est essentiellement une intégrale première de l'autre), à savoir

(a′/a)² = 8π·𝒢·ρ/3 − K₀/a² + Λ/3

et

a″/a = −4π·𝒢·(ρ+3𝓅)/3 + Λ/3

(avec a la taille de l'Univers à la taille présente, 𝒢 la constante de Newton, ρ et 𝓅 la densité de masse-énergie et la pression respectivement, K₀ la courbure actuelle de l'espace pour et Λ la constante cosmologique), je me suis dit que je n'aurais pas des masses à en dire. Et je me suis dit que ce serait assez sympa parce que comme les maths ne sont pas trop compliquées (les équations d'Einstein en général sont difficiles à expliquer, mais ici il s'agit du cas très particulier, à peu près le plus simple possible, où l'espace est homogène et isotrope, c'est-à-dire le même en tout point et dans toutes les directions), ça pourrait intéresser beaucoup de gens qui savent en gros ce qu'est une équation différentielle mais ne savent pas ce que c'est qu'un tenseur de courbure.

Sauf que bien sûr ça a débordé dans tous les sens. En voulant écrire une introduction historique, j'ai appris plein de choses sur l'histoire de la cosmologie : sur l'histoire du mot Big Bang (racontée en détails ici), sur la manière dont on a découvert l'expansion de l'Univers et le rayonnement cosmologique fossile, etc. En voulant écrire une introduction physique, j'ai appris plein de choses sur l'histoire de l'Univers, sur la thermodynamique des premiers instants après le Big Bang, sur la cinétique de la nucléosynthèse primordiale, sur la formation des étoiles et des galaxies, etc. En voulant écrire une petite partie rapide sur la cinématique et la géométrie d'un espace-temps dont l'espace est homogène et isotrope (avant même de poser les équations de Friedmann-Lemaître, ci-dessus, qui gouvernent sa dynamique), j'ai fait plein de calculs sur le mouvement et les distances dans un tel espace-temps. En voulant écrire des généralités sur la notion d'énergie et de pression en relativité générale, j'ai surtout compris que je ne comprenais pas grand-chose à la notion de pression (et de ce que ça a comme sens qu'elle ait ou pas des effets gravitationnels autonomes), mais j'ai aussi appris plein de choses sur la notion de conditions d'énergie (i.e., inégalités entre ρ et 𝓅). En voulant parler du problème de la (non-)?conservation de l'énergie lors de l'expansion de l'Univers, je suis tombé dans un abîme de difficultés et j'ai de nouveau compris que je ne comprenais rien. En voulant parler de la résolution exacte des équations de Friedmann-Lemaître, je suis tombé dans un bourbier de fonctions elliptiques. En passant, je me suis aussi englué dans la thermodynamique du gaz de photons, dans la dérivation purement newtonienne des équations de Friedmann-Lemaître (qui est peut-être inconsistante, mais peut-être pas), dans les différentes descriptions de l'espace de de Sitter, et quelques autres bêtises de ce genre. Bref, rien que lister tout ça est un peu long : je ne suis pas mécontent d'apprendre plein de choses, mais, forcément, mon texte est devenu d'une longueur un peu délirante, et probablement d'un niveau moins élémentaire que ce que j'espérais initialement (même si je fais l'effort d'essayer de mettre clairement à part toutes les digressions « pour les lecteurs plus avertis »). Et, fatalement, je commence à en avoir un peu par-dessus la tête de la cosmologie, à ce niveau-là. Du coup, je ne sais pas si l'expansion de mon entrée sur l'Univers va converger, ou se terminer en Big Crunch (tout disparaît) ou Big Rip (j'en ai tellement marre que je déchire tout) ou ou mort thermodynamique (plus rien ne se passe) ou quelque chose comme ça. Ce qui est un peu ennuyeux, vu que l'idée était quand même d'écrire tout ça pour le retrouver plus tard : je me dis à la fois que ce serait un gâchis terrible d'avoir écrit un texte très long pour rien, et en même temps que je n'aime pas publier quelque chose de profondément inachevé.

En marge de tout ça, j'ai quand même appris des chiffres rigolos : par exemple, l'entropie de l'Univers (qui est, en fait, complètement dominée par le rayonnement cosmologique fossile) vaut 500 méga-octets par mètre cube. Et je crois que la production d'entropie de l'Univers vaut à peu près un bit par mètre cube et par millénaire (je suis moins sûr de celle-là, je la tire d'une estimation de sa luminosité à 3×1034 watts par mégaparsec cube et d'une hypothèse hasardeuse que c'est ce qui domine la production d'entropie). Ces chiffres sont probablement dénués de sens, mais ils sont indiscutablement amusants à annoncer.

Il faudrait que j'apprenne à mieux évaluer la quantité de choses que j'ai à dire sur un sujet donné, mais comme je ne sais pas vraiment analyser d'où me vient cette impression que c'est « pas grand-chose », je ne sais pas non plus m'en départir. Et il faudrait peut-être que j'apprenne à écrire les textes de vulgarisation par balayage en largeur (c'est-à-dire en commençant par un plan et en ajoutant des détails sur tout le plan, ce qui le rend utilisable à n'importe quel stade d'avancement) plutôt qu'en profondeur : mais je ne sais pas si c'est vraiment possible d'écrire des textes clairs de cette façon.

Il est évidemment aussi permis de se moquer de mon hubris d'avoir pensé que l'Univers tout entier était un sujet sur lequel il n'y avait pas grand-chose à raconter. ☺

En attendant, je me retrouve une fois de plus à faire du méta, et ça m'énerve (et le méta-méta que je viens de faire, encore plus, etc.).

(samedi)

Comment survoler l'état de l'art d'un bout des mathématiques

J'aime bien dire que faire de la recherche en mathématiques est un peu comme explorer un palais magnifique et incompréhensiblement gigantesque, à la structure à la fois labyrinthique et élégante, — en étant totalement aveugle, si bien qu'on ne peut que tâtonner pour comprendre comment les salles sont agencées et quels bibelots précieux elles contiennent. Mais bien sûr il y a des ailes du palais qui sont bien explorées, transformées en musée depuis des siècles, dont plein de gens peuvent vous faire une visite guidée (parfois en vous montrant juste la Joconde que tout le monde vient admirer) ; et il y a les contrées lointaines et inexplorées où on se sent plus comme les archéologues qui déterrent des édifices entiers à la brosse à dent (hum, est-ce que je viens de trébucher sur un bout de la salle du trône ou des toilettes ?) ; et entre les deux, il y a les régions bien connues de certains, mais dont les cartes sont mal faites, incomplètes et, pour commencer, difficiles à trouver.

Ma comparaison a ses limites, bien sûr. Mais elle peut servir à donner une idée de ce dont je veux me plaindre ici (je me suis déjà plaint d'un problème semblable, mais probablement sans réussir à être très clair) : même quand on cherche à apprendre un domaine mathématique déjà connu (voire « bien » connu, même si ce genre de jugement sera toujours en bonne partie dans l'œil du spectateur), et d'autant plus si on cherche juste à s'en faire rapidement une idée générale sans forcément entrer dans les détails sordides, on se retrouve fréquemment devant une sorte de puzzle à résoudre, certes plus facile que si on devait tout découvrir soi-même, mais dans lequel il n'est pas pour autant facile de comprendre comment les pièces s'emboîtent.

Le problème est que l'immense majorité des articles mathématiques ont pour objet de démontrer un résultat nouveau, ce qui, dans ma métaphore palatiale, reviendrait environ à pointer l'existence d'un passage menant à telle pièce du palais, et donc à dresser une carte d'une minuscule région de celui-ci. Or, si on cherche à comprendre comment toute une aile est agencée et qu'on a seulement des cartes de ce genre, on est dans une situation un peu comme si on devait se faire une idée de la géographie générale de la France à partir d'une armoire de cartes au 1:25000, triées, qui plus est, par ordre alphabétique.

(Une question qui se pose inévitablement, d'ailleurs, en lien avec cette réflexion, est de savoir quel est le lectorat des articles de recherche mathématique. Certes, on peut naturellement penser qu'il s'agit presque exclusivement de mathématiciens professionnels, mais la proportion n'est peut-être pas si écrasante que ça. Après tout, moi qui ne suis pas physicien, je lis beaucoup d'articles de physique théorique. Et bien sûr, quand je le fais, j'ai tendance à chercher surtout les surveys, et/ou à sauter les calculs et les détails qui m'intéressent moins, et à rechercher là où sont les « grandes idées » de l'article ; souvent, bien sûr, l'abstract, l'introduction et les conclusions — à ce sujet, les mathématiciens ont d'ailleurs le snobisme de ne pas mettre de conclusions à leurs articles, ce qui est peut-être regrettable dans la perspective qu'ils puissent être lus par des non-spécialistes. Même si les non-spécialistes ne sont pas complètement étrangers aux mathématiques, ils peuvent être simplement des mathématiciens venus d'autres domaines et qui veulent connaître un peu le terrain de telle ou telle région du « palais » : il est réellement dommage d'écrire des articles fondamentalement hostiles à un tel lectorat.)

Bien sûr, il existe des articles, des monographies, des notes de cours, ou des livres (voire, d'encyclopédies), censés donner un panorama un peu plus vaste ! On parle généralement de surveys, ce qui colle assez bien avec ma comparaison cartographique. Mais d'une part ils sont loin d'être assez nombreux, ou de couvrir autant de territoire que les articles de recherche « active », même si on se limite aux terrains relativement bien explorés par la recherche : le problème est que, chez les hiérarques qui décident comment la recherche est évaluée comme chez les rédacteurs des journaux où elle paraît, ce genre d'activité est moins valorisé que le travail de fouille à la brosse à dent (hum, mes métaphores commencent à s'embrouiller un peu…). Je le regrette beaucoup, parce que je trouve que, de façon assez générale, la recherche mathématique (ou, à encore plus forte raison, informatique) souffre d'une surabondance de publications insignifiantes qui serait atténuée si on voulait bien un peu développer l'esprit de synthèse, de récapitulation et d'organisation à plus haut niveau. D'autre part, même quand des surveys existent, ils ont souvent tendance à présenter un petit nombre de résultats, certes dans un ordre qui met mieux en perspective leur rapport les uns aux autres, mais parfois sans donner pour autant une vision d'ensemble claire, et surtout, sans expliquer l'intuition, la philosophie, et les différents langages qui peuvent coexister, dans une branche ou sous-banche donnée de la science, et comment cette branche communique avec les régions adjacentes. Ici, la raison principale est que les auteurs de surveys aiment souvent privilégier leurs propres résultats, ou au moins, leur propre vision de l'état de l'art et de ce qui est important.

La manière dont j'essaie généralement d'apprendre un bout des mathématiques consiste d'abord à essayer de deviner les mots-clés qui pourraient m'y mener, puis faire des recherches sur ces mots-clés (le plus souvent avec Google, tout simplement : je n'ai pas trouvé que des moteurs plus spécialisés apportent vraiment quoi que ce soit de significatif). Je collecte un tas de références, qu'il s'agit ensuite de récupérer en ligne comme je peux (en maudissant, donc, la rapacité des éditeurs qui fait que les abonnements auxquels j'ai accès sont souvent la portion congrue, et je suis embêté de demander à des collègues d'autres institutions de m'aider, vu que la majorité des articles récupérés à ce stade ne m'intéresseront finalement pas ; s'il s'agit de livres, soit dit en passant, il y a des sites FTP pirates russes qui font certainement beaucoup plus pour les progrès de la recherche scientifique dans le monde que toutes les subventions des organismes bureaucratiques chargés de la financer). Cette première moisson me permet de collecter d'autres références (dans la bibliographie des articles en question) et d'affiner les mots-clés (parce que souvent je n'avais qu'une mauvaise idée de la terminologie), et j'essaie ainsi de faire un parcours en largeur du graphe d'adjacence du puzzle, si j'ose dire. J'imagine que cette façon de procéder n'a rien d'original.

J'ai parfois l'impression, cependant, que le parcours du graphe d'adjacence va me mener à l'infini (peut-être que sa géométrie naturelle est hyperbolique). En fait, j'ai souvent l'impression désagréable qu'a Alice (Through the Looking-Glass, chapitre V) that whenever she looked hard at any shelf, to make out exactly what it had on it, that particular shelf was always quite empty: though the others round it were crowded as full as they could hold — quand je lis un article, il n'y a jamais rien de bien passionnant dedans mais plein d'indications que les articles cités en références sont très intéressants pour le genre de question que je cherche à comprendre. Mais bon, je finis par me constituer une petite pile d'articles à éplucher.

Ensuite, il faut décider dans quel ordre lire les choses, ce qui n'est souvent pas du tout une mince affaire. Mais ce n'est pas le seul problème : voici deux difficultés que je rencontre fréquemment, et qui me rendent absolument furieux :

Primo, il y a les définitions-dont-on-ne-sait-pas-si-elles-sont-équivalentes. Typiquement, on lit un premier article consacré à la foobarologie et qui donne une certaine définition d'un foobar bleuté et en tire des conséquences sur leur frobnication. Puis on lit un second article sur un sujet (apparemment) très proche, qui donne une définition différente d'un foobar bleuté et en tire d'autres conséquences : forcément, on se pose la question, s'agit-il bien du même objet ?

Peut-être que la réponse est oui, et que c'est absolument évident pour le spécialiste de foobarologie, mais comme on essaie de s'y initier, par définition, on n'est pas encore spécialiste. Peut-être que la réponse est oui et que c'est un fait bien connu mais non évident. Peut-être que la réponse est non, mais que la différence est hautement technique et sans grande importance. Ou peut-être que c'est non, parce qu'il y a une hypothèse essentielle dans le cadre où s'est placé un des deux auteurs (peut-être qu'il est spécialiste de frobnification compacte, et que du coup il ne considère que les foobars compacts, et il n'a pas pris la peine de le dire, ou en tout cas, de le souligner de façon indiscutablement spectaculaire). Ou à cause d'un formalisme différent (un auteur considère les foobars bleutés en géométrie différentielle, un autre en géométrie algébrique, et les définitions sont certes très fortement reliées mais ne sont absolument équivalentes qu'à l'intersection des deux domaines — ou même pas). Ou à cause d'un objet sous-jacent à la donnée (les deux définitions de X-foobars bleutés sont équivalentes si X est un bazqux orangé, mais si X est un bazqux plus général, l'une ne marche pas). Dans tous les cas, on aimerait bien soit une explication sur l'équivalence entre les deux définitions, soit un contre-exemple à celle-ci, et on ne sait même pas où chercher.

La situation à de quoi rendre fou : et c'est encore pire si un troisième article fait vaguement référence à une définition, et on ne sait même pas laquelle on est censé imaginer (maintenant qu'on sait qu'il y en a au moins deux !). Je prétends donc qu'il est du devoir de tout auteur qui introduit une définition, surtout quand elle est un peu centrale à son propos, de rappeler s'il en existe des variations significatives, et le cas échéant si elles sont pertinentes et en quoi.

Secundo, il y a la situation où on sent bien que deux concepts ont un très fort rapport entre eux (je ne veux pas dire qu'ils soient synonymes, mais qu'il serait intéressant d'étudier la combinaison des deux, ou d'étudier l'un dans le contexte de l'autre, ou quelque chose comme ça), et qu'on ne trouve rien qui mentionne les deux à la fois. À nouveau, cela peut être pour différentes raisons : peut-être qu'on a mal compris et que ces concepts ne sont pas applicables l'un à l'autre ; peut-être qu'il y a une raison pour laquelle l'application de l'un à l'autre serait absolument triviale ; ou peut-être qu'elle se ramènerait à un autre problème trop simple ou trop classique ; peut-être au contraire que c'est trop compliqué et que personne n'a rien réussi à dire d'intéressant (mais que personne n'ose, et c'est bien dommage, écrire ce fait explicitement pour aider le débutant qui se demande pourquoi la connexion n'est pas faite) ; ou peut-être, ce qui est malheureusement fréquent, que l'un des deux concepts porte un nom totalement différent quand il est étudié par les spécialistes de l'autre concept ce qui explique la non occurrence simultanée des deux mots. Bref, on peut passer plein de temps à essayer de comprendre ce qui est relié à quoi (et comment). Cette fois, il est plus difficile de faire des reproches à l'auteur de tel ou tel article, mais on peut au moins préconiser que tout article susceptible d'être lu par un non-initié signale autant que possible les connexions avec des sujets proches.

Un problème annexe que je rencontre est que j'accumule quantité d'articles sur mes disques durs, et que je ne sais pas les organiser de manière à les retrouver ensuite : évidemment, je les étiquette par leur auteur, leur année et leur titre (ou du moins, les mots saillants du titre, enfin peu importe) ; mais si plus tard je veux réapprendre ce que j'aurai appris sur la frobnification des foobars bleutés et que j'aurai, évidemment, oublié dans l'intervalle, je devrai à nouveau essayer de retrouver par quel article il vaut mieux commencer, qui dans ma pile d'auteurs a écrit sur ce sujet, et où peut bien se cacher ce petit paragraphe qui m'avait un peu plus éclairé que les autres.

[À suivre… Je voulais continuer en donnant l'exemple des difficultés que j'ai eu à lire des introductions sur la théorie des variétés sphériques et sur l'analyse harmonique sur les espaces homogènes sous les groupes compacts, mais l'écriture de cette entrée s'éternisant, il vaut mieux que je publie déjà ça.]

(mardi)

Comment vulgariser la théorie des particules (le modèle standard et le boson de Higgs) ?

Je sais qu'il n'est pas une bonne idée, sur un blog, de parler des choses qu'on va faire ou des textes qu'on va écrire, mais comme je ne finis pas le quart du dixième de ce que je commence (ou alors ça prend une éternité, comme ça m'a pris pour parler des octonions, et d'ailleurs je n'ai fait que le tiers de ce que j'avais prévu donc j'en ai encore deux tiers à faire derrière), peut-être que ça vaut quand même mieux parce qu'au moins j'arrive un peu mieux à finir les entrées où je parle de ce que je voudrais écrire que celles où je les écris vraiment. Bref.

La dernière fois que j'avais écrit quelque chose sur la physique fondamentale, j'avais laissé plein de choses en suspens, et au fil de la marche aléatoire (hautement récurrente) de mes intérêts passagers je suis revenu plusieurs fois travailler un bout de texte de vulgarisation sur la physique des particules et le modèle standard. Deux textes, même : l'un pour le très grand public, et un autre, sans doute plus original, pour tenter d'expliquer comment avec un tout petit peu de connaissances mathématiques — spécifiquement, d'algèbre linéaire et peut-être de théorie des groupes élémentaire — on peut déjà expliquer tout un tas de choses plus précisément que l'agitage de mains totalement « grand public » (j'avais déjà fait ça à propos des neutrinos, mais il y a un certain nombre de choses dans le même genre qu'on peut expliquer avec des maths pas trop compliquées, sans entrer dans les détails). Mais bon, mon intérêt va certainement passer à autre chose bien avant que j'aie fini l'un ou l'autre. (Généralement, quand je regarde la théorie quantique des champs, je finis par essayer de comprendre ce qu'est un instanton, par chercher à visualiser un sphaléron en train de se désintégrer, par essayer de comprendre ce qui se passe si on regarde un neutrino en train d'interagir avec un boson W en allant plus vite que le neutrino — ce qui est possible maintenant qu'ils ont une masse — de sorte qu'il paraisse tourner dans le sens inverse, et finalement par essayer d'imaginer à quoi ressembleraient 100g de neutrinos froids, et au bout du compte je me rends compte que je n'y comprends rien et que je ferais mieux de faire des maths.)

Du coup, pour ne pas que cette entrée soit complètement du vaporware, je voudrais quand même donner quelques liens sur lesquels je suis tombé sur le sujet. Ou peut-être plus précisément au sujet du boson de Higgs, parce qu'il y a eu beaucoup d'efforts faits par plein de gens différents pour expliquer (notamment aux contribuables qui ont payé pour le LHC) l'importance de cette découverte quand elle a été confirmée il y a trois ans environ — donc avec le recul on peut se demander qui a été le meilleur vulgarisateur.

D'abord, il y a cet exposé grand public de Sean Carroll (qui est d'ailleurs très amusant à écouter parler), et intitulé Particles, Fields and The Future of Physics. Je trouve qu'il est assez doué pour la vulgarisation, et en tout cas pour trouver des analogies pour expliquer des choses pas du tout évidentes à présenter au non-initié : la difficulté dans la vulgarisation est toujours surtout de trouver la bonne quantité de poussière à glisser sous le proverbial tapis — si on en laisse trop dehors, le public n'y voit plus rien, si on cache tout, le public repart avec des idées tellement fausses que c'est peut-être pire que s'il n'avait rien appris du tout. Il me semble que Sean Carroll trouve un très bon équilibre. Ce qui n'est pas du tout évident quand on parle du boson de Higgs ! Si on compare avec cet autre exposé, par Nima Arkani-Hamed (que j'ai déjà mentionné), aussi de vulgariation (peut-être un tout petit peu moins « grand public ») et sur un sujet proche, ce dernier rentre plus dans les détails précis de pourquoi le Higgs doit exister, il critique d'ailleurs (à partir de de 1h08min dans la vidéo) diverses métaphores utilisées pour vulgariser le rôle de ce boson, moi je trouve son exposé très intéressant parce que je sais un peu de quoi il s'agit, mais au final je ne sais pas si c'est vraiment éclairant pour le profane. Je veux bien que mes lecteurs qui ont la patience de regarder les deux vidéos me disent laquelle est la meilleure vulgarisation — ou si vous en trouvez d'autres du même genre à comparer. (Pour ceux qui ne veulent pas y passer des heures, cette vidéo de physiciens de l'université de Nottingham — qui font de la vulgarisation sur YouTube sous le nom Sixty Symbols, et c'est en général assez réussi, parle du Higgs en 12 minutes, mais ils reconnaissent explicitement que c'est très difficile de faire passer un message utile en si peu de temps et sans mathématiques.)

Si vous n'aimez pas les vidéos, j'ai repéré des bons textes de vulgarisation de Matt Strassler : ici une FAQ sur le boson de Higgs, qui est bien faite mais sans doute pas le plus intéressant : j'aime surtout bien sa récapitulation des particules décrites par le modèle standard et son compagnon, ce que ces particules seraient si le champ de Higgs était nul (ce qui a d'ailleurs peut-être été le cas très tôt après le Big Bang), je trouve ça extrêmement éclairant.

Enfin, pour ceux qui connaissent déjà un peu de théorie quantique des champs, cet article est ce que j'ai trouvé de mieux comme survey clair et concis du modèle standard (en fait, une des choses que j'aimerais expliquer, c'est qu'on peut réussir à lire pas mal d'information dans une telle description sans connaître la théorie quantique des champs, juste avec des notions d'algèbre linéaire et multilinéaire, mais évidemment pour ça il faut un petit dictionnaire, qui, s'il est plus simple qu'un cours de théorie quantique des champs, est néanmoins non-trivial notamment parce qu'il y a pas mal de notations à expliquer).

(lundi)

Le sens métaphorique du Seigneur des anneaux — Tolkien, Asimov (et moi)

Quand j'étais petit, je n'ai pas lu le Seigneur des anneaux. Je le souligne, parce que j'ai passé plein de temps, à l'école primaire puis au collège, à baigner dans un monde imaginaire qui était le descendant spirituel de celui inventé par Tolkien : à travers les livres dont vous êtes le héros et d'autres histoires que j'ai pu lire ou des jeux sur ordinateur, mais surtout à travers les « aventures » que mes copains et moi nous racontions (soit sous forme de jeux de rôles, soit sous forme de fictions assumées, soit sous forme d'histoires où nous nous imaginions jouer un rôle, aux frontières de la réalité et du rêve). Quand on dit elfe, par exemple, je pensais — comme tout le monde depuis 1955[#] — à une créature humanoïde grande et majestueuse et éminemment baisable, et pas aux petits êtres malicieux voire maléfiques et voleurs d'enfants dont le nom a donné oaf en anglais ou Alp (comme dans Alptraum, le cauchemar) en allemand. Certes, j'ai lu The Hobbit assez tôt, mais The Lord of the Rings restait de ces œuvres qui m'intimidaient et que je n'osais aborder : pas tellement à cause de sa taille ou de sa complexité, mais plutôt parce que j'avais peur de détruire l'idée que je m'étais formée du contenu de ce roman mythique, à force d'indices lâchés çà et là par des amis qui l'avaient lu et d'autres ombres projetées sur le mur de la caverne culturelle par l'influence de Tolkien. Voici ce que j'écrivais dans la postface de La Larme du Destin :

Quant au monumental The Lord of the Rings, je n'ai osé en entreprendre la lecture qu'en 1991 ; or ce retard ne m'a rendu l'œuvre que plus grandiose. Car j'en avais entendu parlé bien des années auparavant et dans l'entre-temps j'en avais beaucoup rêvé. Chaque fois qu'une personne qui avait lu l'épopée m'en révélait un détail, le livre grandissait dans mon esprit et se nourrissait de mes songes. Si bien que lorsque enfin je fus forcé par les circonstances à le lire, il y avait deux versions différentes de The Lord of the Rings : celle, réelle, que Tolkien avait écrite et celle que mon imagination avait échafaudée, réflexion déformée dans le miroir étrange de ma fantaisie. L'impression que j'eus en lisant le roman est celle qu'on a lorsqu'on n'a jamais vu d'une montagne que son image trouble dans un lac et qu'on lève soudain la tête pour apercevoir la masse granitique dans toute sa splendeur cristalline, majestueuse, si familière et pourtant si différente de ce qu'on en connaissait. L'effet produit sur moi fut très profond et je lus en moins d'une semaine les quelque mille pages écrites par Tolkien.

(Désolé pour mon style inimitablement pompeux dans le paragraphe ci-dessus. Dans les deux paragraphes ci-dessus, en fait, ainsi que dans ceux qui suivent. 😉)

En fait, je regrette un peu la version du Seigneur des anneaux que j'avais imaginée, et qui a maintenant complètement disparu de ma mémoire : les œuvres imaginaires sont souvent bien plus grandioses que les livres existants comme les songes peuvent être plus grandioses que la réalité. C'est sur cette idée que j'ai écrit cette nouvelle, qui essaie vaguement de décrire ce qu'était mon Seigneur des anneaux fantasmé — mais c'est un peu comme se souvenir d'un rêve. C'est sans doute aussi pour ça que j'écris des fragments d'œuvres imaginaires.

Mais je reviens au livre réel que Tolkien a écrit. Je l'ai lu en 1991, en très peu de jours, pendant des vacances scolaires. Ce qui s'est passé est que trois de mes camarades de classe devaient faire un exposé à son sujet pour le cours de français (oui, de français — enfin, de litérature, quoi). Je savais qu'ils seraient bien obligés de le résumer et que la version du livre dans mon imagination devrait bien cesser d'exister, et je préférais rencontrer le vrai à travers son texte même qu'à travers un exposé scolaire. Je suis donc allé à Paris l'acheter (mon lycée était en banlieue, à Orsay, où habitent mes parents), précisément à la librairie Le Nouveau Quartier Latin (elle n'existe plus, mais c'était sur le boulevard Saint-Michel, entre les Mines et Port-Royal), une des seules à vendre des livres en anglais à l'époque, et quasiment la seule rive gauche.

En rentrant, je me suis arrêté pour boire à la fontaine située juste à côté de l'entrée sud de la station de RER Luxembourg (rue de l'Abbé de l'Épée), parce que ce n'était pas marqué eau non potable, mais il faut croire qu'elle l'était quand même (non potable), en tout cas j'ai attrapé une gastro terrible. J'ai donc passé quelques jours au lit, et sans avoir rien de mieux à faire que lire le Seigneur des anneaux, si bien que je l'ai lu à une vitesse assez grande — au moins pour moi, qui ne suis pas lecteur compulsif. Je mentionne ça entre autres pour dire que je ne suis pas complètement honnête dans le passage où je m'auto-cite ci-dessus : le fait que j'aie dévoré le livre était plus dû au fait que mon estomac refusait de dévorer autre chose qu'à la manière dont le style de Tolkien m'aurait captivé.

Et, en vérité, je ne suis même pas totalement sûr d'avoir tant aimé que ça. Il y a toujours une certaine inertie quand je lis un livre : de même que j'ai du mal à en commencer un, j'ai aussi du mal à arrêter, et j'ai dû lire quelque chose comme 500 pages de la saga Dune de Frank Herbert avant de me rendre compte que je trouvais ça aussi intéressant que les aventures de Xenu selon L. Ron Hubbard (comprendre : les délires des mystiques, ce n'est pas ma tasse de thé). Donc le fait d'avoir lu mille pages en quelques jours ne prouve pas forcément grand-chose. Ai-je donc vraiment aimé le Seigneur des anneaux ? Si je m'en tiens à the big picture, certainement, oui, beaucoup, et je suis assurément fasciné par la richesse du monde que l'auteur a créé ; et le langage est très beau et incontestablement maîtrisé, et j'ai certainement appris des mots d'anglais en lisant le livre (notamment, lest, je suis à peu près sûr que c'est là que je l'ai rencontré pour la première fois, et il doit apparaître toutes les quelques pages) ; mais il est aussi vrai qu'il y a un certain nombre de passages que j'ai trouvés interminables et sans intérêt, où l'intrigue n'avance pas, où les descriptions me donnent une impression de ne pas correctement situer les choses malgré une abondance de détails. (Je crois me souvenir que j'ai été particulièrement rebuté par la bataille de Helm's Deep, dont je ne comprenais pas vraiment l'importance stratégique ou tactique, ni pourquoi les héros s'étaient retrouvés là-dedans, ni comment les lieux étaient agencés, et tout ça dure un nombre de pages considérable.) Maintenant, il est possible que j'aie été trop jeune pour bien l'apprécier, ou trop distrait par mes entrailles pour pouvoir me concentrer correctement : mais il y a une critique que je maintiens certainement, c'est qu'il manque cruellement la légèreté de ton qui dans le Hobbit venait fournir un contrepoint bien apprécié à la gravité ; je veux dire, il arrive aux personnages du Seigneur des anneaux de ne pas être graves (ne serait-ce que Bilbo lors de son anniversaire), mais le narrateur l'est toujours.

Passons, ce n'est pas de ça que je veux parler. Mes copains ont fait leur exposé, qui n'était pas spécialement mémorable, et je leur ai posé une question, qui était une sorte de piège (mais je les avais prévenu à l'avance que j'allais demander ça) : quel est, selon eux, le sens profond ou symbolique du roman — est-il une allégorie, bref, y a-t-il un message à en tirer au-delà de l'histoire telle qu'elle apparaît prima facie ? Je ne sais plus exactement pourquoi j'ai voulu leur tendre ce petit piège, je ne leur voulais certainement pas (l'un des trois était un très bon copain, un autre était un garçon dont j'étais éperdument — et bien sûr en secret — amoureux, et le troisième était très sympa), je crois que j'en voulais à la prof de français, mais la logique m'échappe actuellement assez ; peu importe. Je ne sais plus non plus ce qu'ils ont répondu à ma question, mais ils ont inventé un sens métaphorique, peut-être en invoquant la seconde guerre mondiale (peut-être même que je leur ai explicitement posé la question), et là j'ai sorti mon édition, qui contenait une préface de Tolkien qui je ne sais pas pourquoi ne s'était pas retrouvée dans l'édition française (en tout cas celle qu'avaient les exposants), et j'ai lu :

As for any inner meaning or ‘message’, it has in the intention of the author none. It is neither allegorical nor topical. As the story grew it put down roots (into the past) and threw out unexpected branches: but its main theme was settled from the outset by the inevitable choice of the Ring as the link between it and The Hobbit. The crucial chapter, ‘The Shadow of the Past’, is one of the oldest parts of the tale. It was written long before the foreshadow of 1939 had yet become a threat of inevitable disaster, and from that point the story would have developed along essentially the same lines, if that disaster had been averted. Its sources are things long before in mind, or in some cases already written, and little or nothing in it was modified by the war that began in 1939 or its sequels.

The real war does not resemble the legendary war in its process or its conclusion. If it had inspired or directed the development of the legend, then certainly the Ring would have been seized and used against Sauron; he would not have been annihilated but enslaved, and Barad-dûr would not have been destroyed but occupied. Saruman, failing to get possession of the Ring, would in the confusion and treacheries of the time have found in Mordor the missing links in his own researches into Ring-lore, and before long he would have made a Great Ring of his own with which to challenge the self-styled Ruler of Middle-earth. In that conflict both sides would have held hobbits in hatred and contempt: they would not long have survived even as slaves.

Other arrangements could be devised according to the tastes or views of those who like allegory or topical reference. But I cordially dislike allegory in all its manifestations, and always have done so since I grew old and wary enough to detect its presence. I much prefer history, true or feigned, with its varied applicability to the thought and experience of readers. I think that many confuse ‘applicability’ with ‘allegory’: but the one resides in the freedom of the reader, and the other in the purposed domination of the author.

La prof de français m'a rétorqué que l'auteur n'était pas forcément le mieux placé pour analyser son œuvre. Et elle avait parfaitement raison (et d'ailleurs, Tolkien écrit bien : in the intention of the author). Comme ont raison ceux qui continuent à chercher leur propre interprétation, s'ils arrivent à la défendre par des arguments intelligents (ou rigolos, comme dans cette vidéo ; ou, plus sérieusement, de vouloir voir dans le Gandalf de Tolkien, sa mort et sa résurrection, une figure christique comparable au Aslan dans Narnia de C. S. Lewis lequel est, pour le coup, tellement transparent que ça devient un peu ridicule). Seulement, à l'époque je n'étais pas de cet avis, et j'ai surtout dû être vexé.

Mais j'ai été pris à mon propre piège quand, six ans plus tard, je suis tombé sur un recueil de textes d'Asimov sur et autour du fantastique (Magic : il s'agit à la fois de nouvelles — qui ne sont sans doute pas ses meilleures — et de courts essais sur des sujets variés — qui sont plus intéressants que les nouvelles). Asimov appréciait beaucoup l'œuvre de Tolkien, et il y a d'ailleurs une nouvelle de science-fiction intéressante (dans un autre recueil) où il lui rend hommage, en imaginant quelqu'un qui crée le premier film en images de synthèse, en secret sur un ordinateur censé servir à autre chose, et ce film est une adaptation du Seigneur des anneaux. Et moi-même, je suis un grand fan d'Asimov, et j'ai lu le recueil avec beaucoup d'attention.

Bref, je suis tombé sur cet essai (Concerning Tolkien, je crois que c'est une version un peu développée — ironiquement, en 1991, l'année même où j'insistais sur le fait que, non, Tolkien avait écrit qu'il n'y avait pas de sens métaphorique, point-barre — d'une petite note qu'Asimov avait déjà dû publier ailleurs en 1980 et qui s'appelait The Ring of Evil), et dedans, Asimov, propose son interprétation de l'Anneau. Tout en reconnaissant (et en décomptant) les dénégations de Tolkien que j'ai citées ci-dessus à propos d'un sens métaphorique du Seigneur des anneaux (Tolkien is reported to have denied any application of his saga to the events of the day or any tortured symbolism of various items in the novels—but I don't believe him), voici l'explication que propose Asimov, et qui m'a semblé extrêmement convaincante :

What does [the One Ring] symbolize?

The answer came to me (and an obvious answer, too, once I had it) through a remark made by my dear wife, Janet.

Sauron rules over a region called Mordor, a blasted land in which nothing grows, a land destroyed by Sauron's evil, and one which Frodo must enter to complete his task. The description of Mordor is of a horrifying place.

Well, One day, Janet and I were driving along the New Jersey Turnpike, and we passed a section given over to oil refineries. It was a blasted region in which nothing was growing and which was filled with ugly, pipelike structures, which refineries must have. Waste oil was leaking at the top of tall chimneys and the smell of petroleum products filled the air.

Janet looked at the prospect with troubled eyes and said, There's Mordor.

And, of course, it was. And that was what had to be in Tolkien's mind. The ring was industrial technology, which uprooted the green land and replaced it with ugly structures under a pall of chemical pollution.

But technology meant power, and though it destroyed the environment and would eventually destroy the earth, no one who had developed it dared give it up or even wanted to. There is no question, for instance, that America's automobiles pollute and filthify the atmosphere, and kill uncounted people with respiratory ailments. Yet is it conceivable that Americans would give up their automobiles, or even curtail their use somewhat? No, the ring of technology holds them in its grip and they won't give it up even if they are gasping for breath and dying.

(Mind you, I don't entirely agree with Tolkien's view of technology. I am not an Oxford don used to the calm pleasures of an upper-class Englishman in a preindustrial day. I know very well that the mass of humanity—including me—derives what comfort they now have from the advance of technology and I do not want to abandon it so that upper-class Englishmen can substitute servants for machines. I don't want to be a servant. While I recognize the dangers of technology, I want those dangers corrected while keeping the benefits.)

J'aime quand quelqu'un fournit une explication sur un texte (ou une autre œuvre d'art) qui est tellement lumineuse qu'on a envie de dire : oui, c'est totalement évident, d'ailleurs <GROSSE_MAUVAISE_FOI> je ne pensais même pas que c'était la peine de le dire. </GROSSE_MAUVAISE_FOI> Quand on est éclairé de la même manière que quand on a la réponse à une énigme bien pensée, i.e., la réponse doit être tellement convaincante que personne ne doit se demander si c'est vraiment la bonne. On atteint rarement ce niveau, mais l'explication ci-dessus a produit un effet semblable dans ma tête : bien sûr, comment avais-je pu ne pas voir quelque chose d'aussi évident, la Comté et les Hobbits représentent le monde rural préindustriel anglais, les Elfes représentent les traditions ancestrales du pays, et généralement parlant les différentes races intelligentes représentent les formes d'activités humaines et les anneaux le rôle de la technologie dans ces activités.

Certes, quand on commence à regarder trop dans le détail, les choses ne marchent pas parfaitement, et c'est normal si l'allégorie est plus ou moins involontaire ou au moins inassumée de la part de Tolkien — ce n'est pas une devinette à résoudre[#2], c'est plutôt comme expliquer un rêve, et plusieurs formes d'explications peuvent s'entrecroiser et même se contredire. Je ne saurais pas dire exactement ce que devraient représenter chacune des sortes d'anneaux (les trois anneaux des Elfes, les seuls à ne pas être contaminés par Sauron, symboliseraient-ils le savoir pour le savoir, le genre de choses enseignées à Oxford ? — voire, spécifiquement, si on veut pousser le bouchon un peu plus loin, le trivium, grammaire, dialectique et rhétorique ?). Que sont censés être les magiciens ? Que faire de la différence entre Sauron et Saruman ? Je ne sais pas, et, de toute façon, je ne prétends pas dire que l'explication que j'esquisse est forcément la bonne, encore moins qu'elle est la seule correcte, mais assurément elle me plaît. D'ailleurs, j'y vois une sorte de référence voilée juste un petit peu plus loin dans la préface de Tolkien, où celui-ci, principalement occupé à réfuter l'idée que la Guerre de l'Anneau serait une métaphore de la Seconde Guerre mondiale, propose un début de commencement de piste :

It has been supposed by some that ‘The Scouring of the Shire’ reflects the situation in England at the time when I was finishing my tale. It does not. It is an essential part of the plot, foreseen from the outset, though in the event modified by the character of Saruman as developed in the story without, need I say, any allegorical significance or contemporary political reference whatsoever. It has indeed some basis in experience, though slender (for the economic situation was entirely different), and much further back. The country in which I lived in childhood was being shabbily destroyed before I was ten, in days when motor-cars were rare objects (I had never seen one) and men were still building suburban railways. Recently I saw in a paper a picture of the last decrepitude of the once thriving corn-mill beside its pool that long ago seemed to me so important. I never liked the looks of the Young miller, but his father, the Old miller, had a black beard, and he was not named Sandyman.

Il y a aussi des réflexions de ce genre, apparemment, dans un discours qu'a prononcé Tolkien le 28 mars 1958 à Rotterdam, au cours d'un dîner entouré de ses fans : ce discours a été enregistré, l'enregistrement a apparemment été retrouvé un peu par hasard autour de l'an dernier, il devait être diffusé sur Internet et ne l'a jamais été, ou peut-être il l'a été puis supprimé aussitôt, si bien qu'en tout cas je ne sais pas ce qu'il contient à part un tout petit bout révélé par exemple ici :

Twenty years have flowed away down the long river,
but never in my life will return to me from the sea.
Ah, years in which looking far away I saw ages long past,
when still trees bloomed free in a wide country.
Alas, for now all begins to wither in the breath of cold-hearted wizards.
To know things they break them,
and their stern lordship they establish through the fear of death.

I looked East and West, I looked North and South and I do not see a Sauron. But I see many many descendants of Saruman! And I think we hobbits now we have no magic weapons against them. And yet, dear gentle hobbits, may I conclude by giving you this toast: To the hobbits! And may they outlast all the wizards!

De nouveau, je ne sais pas au juste ce que Tolkien prétend souligner comme différence entre Saruman et Sauron qui expliquerait qu'il voie les descendants de l'un et pas l'autre (et, de nouveau, l'auteur n'est pas forcément le mieux placé pour analyser ses propres œuvres), et je ne vois pas vraiment comment situer ça dans une allégorie : mais certainement, la différence a un rapport avec le proverbe selon lequel le chemin de l'enfer est pavé de bonnes intentions — si l'Anneau doit représenter, comme le suggère Asimov, la technologie industrielle, alors Sauron est le créateur de la technologie essentiellement malveillante tandis que Saruman est celui qui cherche à l'utiliser à bon escient et qui se laisse séduire par elle. Dans ce cas, on ne peut qu'être d'accord avec le fait qu'il y a surtout des Saruman (Sarumen ?) dans le monde qui nous entoure. Maintenant, je ne vais certainement pas faire de Tolkien un prophète écologiste qui aurait prévu, par exemple, le réchauffement climatique consécutif à l'utilisation effrénée de carburants fossiles, ou quoi que ce soit de la sorte : j'ai plutôt tendance à le voir comme un conservateur anglais grincheux sur le mode c'était mieux âvant (cf. ci-dessous), et en tout cas je ne suis certainement pas d'accord avec l'idée, si vraiment elle est la sienne, que la technologie moderne non seulement est la cause de toutes sortes de maux mais que ces mots ne peuvent pas être évités et que la seule solution est de la détruire dans un grand volcan (imaginez Tolkien dans le rôle de la prêtresse du dialogue rapporté dans cette chanson).

Je ne sais pas non plus, et je ne prétends pas savoir, comment il faut comprendre la fin que Tolkien a imaginée à son roman. Déjà, dans le monde interne, je la trouve assez incohérente : je veux dire, qu'après la destruction de l'Anneau Unique, les trois anneaux des Elfes perdent aussi leur pouvoir, alors qu'il nous a explicitement été dit qu'ils avaient été créés sans l'influence de Sauron et sans être corrompus par lui, c'est juste une règle complètement bizarre sortie du chapeau de Tolkien et pour laquelle aucune explication n'est fournie (seulement que c'est Sauron qui a enseigné aux Elfes comment faire des anneaux — mais la seule façon de compter ça comme une explication serait justement en contredisant le fait que ces anneaux sont censés ne pas avoir été corrompus par lui) ; et c'est tout aussi bizarre et inexpliqué que la perte des pouvoirs des trois anneaux oblige les Elfes à quitter la Terre du Milieu (alors qu'ils étaient là bien avant les anneaux en question). Du coup, toute tentative de trouver un décodage allégorique de ce aspect de l'histoire va tomber sur la même incohérence : si l'Anneau unique représente la technologie et qu'on y renonce(?), on voit mal pourquoi on serait obligé de renoncer aussi à des traditions plus anciennes. Bref, cette incohérence dans l'histoire (enfin, le mot incohérence est peut-être exagéré, mais une règle vraiment bizarre) pose problème à tous les niveaux — ce qui est problématique, vu que c'est manifestement un thème central chez Tolkien.

Plus généralement, un thème central chez lui est une sorte de décadence inexorable qui fait que plus le temps passe plus les choses qui eurent été possibles autrefois deviennent difficiles voire impossibles : plus de 6000 ans avant le Seigneur des anneaux, Morgoth a été vaincu avec son armée de balrogs ; puis, environ 3000 ans plus tard, Sauron, qui n'était que son bras droit, a été vaincu à son tour avec son anneau ; et dans le Seigneur des anneaux, on a un mal fou à le vaincre alors qu'il n'a plus son anneau, ou à vaincre un seul balrog — il faut croire que si des suites étaient écrites, 3000 ans plus tard, le grand méchant serait le bras droit de Sauron et qu'un seul orc constituerait un adversaire redoutable. Ça change des auteurs de heroic fantasy qui cherchent à maintenir l'intérêt du lecteur en faisant apparaître des adversaires toujours plus puissants au fur et à mesure que leur histoire avance (jusqu'au moment où les héros bataillent des dieux et que tout devient franchement trop absurde), ici ça va dans le sens contraire, mais je ne suis pas sûr que ce soit fondamentalement mieux d'avoir de la déflation épique que de l'inflation épique. (Je pense qu'un bon auteur doit chercher à maintenir la progression épique en-dessous, mais proche de, 2%. 😉) Bref, Tolkien a l'air obsédé par l'idée que tout était mieux âvant, ou en tout cas plus épique : et il explique ça par une sorte de décadence du sang qui se retrouve mêlé avec celui de gens plus médiocres (sans expliquer, finalement, d'où ces gens plus médiocres sortent, au juste, pour arriver à ainsi polluer les glorieuses lignées héroïques). Transposée dans le monde réelle, cette idée est soit un peu ridicule, soit franchement répugnante (disons très exactement réactionnaire[#3]), et très en ligne avec une profonde méfiance envers le progrès technologique.

Bon, j'ai un peu perdu le fil de mes réflexions décousues, alors je vais finir en invoquant un autre auteur de science-fiction, H. G. Wells, pour expliquer Tolkien : peut-être que le message du Seigneur des anneaux est que les hommes ont eu le choix entre devenir des Morlocks (qui ressemblent un peu à des orcs, non ?) ou des Eloi (après une inévitable décadence vers la médiocrité). Ce n'est pas exactement un choix réjouissant.

[#] J'exagère : avant Tolkien, il y a eu Dunsany (mais j'ai lu The King of Elfland's Daughter encore plus tard que The Lord of the Rings), et il est possible que Dunsany ait déjà largement transformé l'image qu'on avait du mot elfe. Mais où sont les historiens du Zeitgeist, pour nous dire ce que Google images aurait renvoyé en réponse à une recherche de elf à différentes époques, si Google images avait existé ? (J'ai essayé de tirer ce genre d'informations de Google Ngrams en plaçant différentes épithètes après elf, mais rien de franchement convainquant.)

[#2] Quelque chose qui apparemment est une devinette à résoudre, c'est : qui est Tom Bombadil ? Tolkien a, à plusieurs reprises, suggéré qu'il y avait une réponse bien précise à trouver à cette question (il écrit dans une lettre : Even in a mythical Age there must be some enigmas, as there always are. Tom Bombadil is one (intentionally).) — mais je ne sais pas si je le crois, surtout que beaucoup de gens ont essayé à peu près toutes les réponses possibles à cette énigme (voir par exemple celle-ci), sans qu'aucune ne soit satisfaisante comme devrait l'être la bonne réponse à une bonne énigme.

[#3] Il est assez ironique, dans ces conditions, que Tolkien ait eu une si grande influence dans la contre-culture des années '60 et '70 et qu'il ait pu être considéré comme vaguement subversif (parce que le genre tout entier l'était). Que des étudiants américains protestant contre la guerre du Viêt-Nam aient pu arborer des badges Gandalf for President est amusant. Remarquez, Tolkien (aussi bien l'homme lui-même, ce qui n'est pas franchement pertinent, que ce qu'il ressort de ses œuvres de fiction) était opposé à l'impérialisme britannique ou américain — mais peut-être pas pour les bonnes raisons.

(mardi)

De la difficulté de refuser une thèse

La question revient régulièrement, avec un certain embarras pour la communauté scientifique en général, de comment on a pu décerner un doctorat à chacun des frères Bogdanov, ou accepter pour publication certains de leurs papiers, alors que le contenu scientifique de ceux-ci et de leur thèse est rigoureusement nul et que cette vacuité se cache derrière une fumisterie verbale.

Un des problèmes, certainement, est que les rapporteurs qui reçoivent des articles à relire sont souvent débordés, et qu'il est malheureusement bien plus facile, quand on manque de temps, de laisser passer un paragraphe — voire un article complet — qu'on n'a pas compris, que de commencer à dire c'est incompréhensible et risquer de passer pour un imbécile auprès de l'éditeur du journal (l'auteur ignore l'identité du rapporteur, mais l'éditeur, lui, la connaît forcément, et jugera certainement les échanges). Il y a aussi qu'il est plus facile de rejeter quelque chose de mathématiquement faux, parce qu'on peut pointer du doigt une erreur de raisonnement précise, que quelque chose d'approximatif, vague au point d'être soit dénué de sens soit totalement trivial (tout en donnant l'impression d'être profond) : des escrocs en physique théorique peuvent ainsi s'en tirer en publiant des raisonnements censément « impressionnistes » ou « conceptuels », et en informatique en déguisant des évidences mathématiques pour faire croire qu'elles pourraient être applicables — tandis qu'en mathématique, on pourra essayer de noyer les trivialités sous des notations tellement absconses qu'elles finissent par rendre opaque tout le sujet.

Mais il y a d'autres facteurs. Je voudrais à ce propos évoquer une soutenance de thèse qui a eu lieu récemment : je tairai le nom des personnes concernées, pour protéger aussi bien les coupables que les innocents, mais celle qui m'a raconté les événements présidait le jury, donc même si je ne suis personnellement impliqué à aucun titre, ce n'est pas non plus de N-ième main. Je ne préciserai pas quel est le domaine scientifique exact, parce que je ne pense pas qu'il soit pertinent, mais disons qu'il s'agit de sciences « dures ». Tout ceci a lieu en France : je ne sais pas dans quelle mesure les procédures seraient plus efficaces dans d'autres pays pour servir de garde-fou contre de telles situations.

Beaucoup d'éléments sont sans doute tristement banals : le directeur de thèse est un peu un « mandarin », il a certainement plus de doctorants et/ou d'obligations administratives qu'il ne peut suivre avec attention, il n'a donc pas suffisamment regardé ce que son thésard a écrit. L'étudiant n'est certainement pas un escroc, mais il s'est probablement autoconvaincu qu'il faisait des choses nouvelles, intéressantes et profondes, alors qu'il a écrit une thèse dont certains passages sont déjà connus et médiocres et d'autres sont nouveaux et encore plus médiocres, voire carrément faux, et qui plus est il y a une partie qui n'est pas loin d'être du plagiat (qu'on peut croire involontaire). Le directeur de thèse n'en est qu'à moitié conscient, mais j'imagine que la dissonance cognitive contre reconnaître le problème, quand il est trop tard pour redémarrer la thèse et humiliant de l'arrêter, fait qu'il préfère se réfugier dans l'illusion que le doctorant a une approche originale et à laquelle il ne manque qu'un peu de rigueur. La thèse est envoyée aux rapporteurs : l'un d'entre eux écrit un rapport très tiède, mais il n'a pas détecté que certains des meilleurs passages ne sont pas nouveaux ; l'autre est à l'étranger, son rapport est sans doute sur le même ton, et en tout cas on n'arrive plus à communiquer avec lui quand les choses se précipitent. L'école doctorale autorise la soutenance sur la base des rapports. Le manuscrit est envoyé aux membres du jury bien tard, comme toujours, et sans les corrections demandées par les rapporteurs. Certains sont évidemment débordés et ne pourront lire ce texte que la veille au soir.

Bref, ce n'est qu'une heure avant la soutenance que le jury arrive enfin à se concerter pour se mettre d'accord que la thèse est d'un niveau insuffisant, et se demander quoi faire. Et se rendre compte qu'ils ont extrêmement peu d'information (ou des informations contradictoires), en tant que membres du jury, sur ce qu'ils ont le droit de faire ou ce qu'est la procédure. Par exemple : est-il possible à ce stade-là de décider de reporter la soutenance ? apparemment pas, à partir du moment où l'école doctorale l'a ordonnée et a convoqué le jury. Refuser la délivrance du diplôme est certainement possible, mais (surtout après le « précédent » des Bogdanov, qui ont fini par l'avoir) excessivement humiliant pour l'étudiant, qui n'est pas le premier coupable dans l'affaire ; et pour le directeur de thèse, qui est le premier coupable mais qui n'acceptera certainement pas cette solution vu qu'il fait partie du jury. Ce dernier point va d'ailleurs changer à l'avenir, mais ce n'est pas sûr que ça résolve le problème de fond : refuser une thèse, c'est se faire un ennemi mortel du directeur de thèse, et les gens préfèrent certainement avaler une couleuvre académique que se faire un ennemi (particulièrement d'un « mandarin »). Après une soutenance de thèse mouvementée, dont la séance de questions a tourné au vinaigre, le jury utilise la seule option restante : demander des corrections au manuscrit (ce qui n'est pas infamant en soi, j'ai vu des cas où cette procédure était utilisée alors que la thèse n'était pas mauvaise, mais ici les « corrections » seront considérables). Mais il n'est même pas clair que la délivrance du diplôme soit alors suspendue (apparemment les papiers distribués au jury étaient contradictoires sur ce point). Par ailleurs, l'impétrant-qui-ne-l'est-pas, qui n'avait pas vraiment compris ce qui se passait lors de la soutenance, l'a très mal vécu ; et le directeur de thèse s'est finalement désolidarisé du reste du jury, reprenant la défense de son étudiant.

Je n'ai pas le fin mot de l'histoire, mais peu importe : il est clair qu'il y a eu du gâchis dans l'histoire, et que cela révèle beaucoup de dysfonctionnements. Que le jury n'ait pas l'option de reporter la soutenance, notamment, et ne soit pas correctement informé des détails de la procédure par l'Université. Qu'il n'ait pas reçu — que les jurys de thèse ne reçoivent jamais — le manuscrit dans les délais corrects — et que tout le monde manque de temps pour les lire de façon un peu approfondie. Que l'école doctorale ait autorisé la soutenance sur la base de rapports tièdes, et que ces rapports n'aient été que tièdes (plutôt que : carrément froids) pour commencer. Mais surtout, que le directeur de thèse ne se soit pas assez occupé de son thésard, et de regarder ce qu'il faisait, et que personne d'autre ne soit intervenu pour détecter le problème bien plus tôt.

À Télécom ParisSaclayPloumTech, et ce n'est certainement pas unique, nous organisons des entretiens d'évaluation des thèses en cours de parcours, où d'autres chercheurs que le directeur de thèse sont amenés à se prononcer sur le bon déroulement de la thèse, et pouvoir arrêter les frais bien en amont de la soutenance s'il y a un gros problème. Reste à savoir si ces entretiens sont vraiment efficaces : arrive-t-on vraiment à mettre un terme à une thèse sans se faire un ennemi du directeur de thèse ? sans que le doctorant le ressente comme une catastrophe ? sans que ça ne cause des emmerdes administratives infinies ? J'avoue que je n'en sais rien. Mais au moins leur principe est-il une bonne chose.

Une source de difficultés est que les thèses sont de plus en plus contraintes par toutes sortes de facteurs. Il devient de plus en plus difficile de dépasser la durée normale de trois ans. D'un côté, c'est une bonne règle pour empêcher les dérives de certaines disciplines (je ne vise personne, m'enfin, lisez la BD Carnets de thèse de Tiphaine Rivière, c'est instructif), où une thèse courte est considérée comme impossible, ou le signe d'un travail de recherche insuffisamment approfondi. Mais d'un autre côté, on comprend bien que le processus de recherche est par nature même imprévisible, et qu'il est impossible de fournir un sujet dont on peut assurer qu'il fournira des résultats corrects en trois ans : donc à moins d'autoriser officiellement de soutenir un rapport qui dirait j'ai essayé ceci, ça n'a rien donné du tout (ce qui, à mon avis, devrait effectivement être publiable… parce que c'est une vraie information), il faut qu'il y ait un mécanisme de dérogation, si on ne veut pas aboutir à des absurdités. Il faut admettre que la durée d'une thèse « honnête » est une variable aléatoire — probablement de distribution log-normale : sur la base de cette idée, il devrait être raisonnablement facile, mais non automatique, d'obtenir une extension d'un an, difficile d'en obtenir une deuxième, et très difficile mais non impossible d'en obtenir une troisième.

Évidemment, tout ceci ne rentre pas bien dans l'optique de planification par projets qui domine l'organisation de la recherche actuelle : je ne vais pas redire tout le mal que j'en pense (je devrais sans doute mieux m'exprimer à ce sujet, mais les insultes que j'ai envie de proférer contre l'ANR et consorts me mettent rapidement dans des états d'excitation qui sont mauvais pour mon foie) ; mais une des conséquences de ce système est que les financements de thèse sont de plus en plus liés à ces fameux « projets » et que, du coup, au lieu que le cadencement de la thèse se fasse selon les besoins de la recherche menée par le doctorant et le sujet selon la rencontre de ses intérêts et de ceux du directeur, à la place, tout résulte d'un jeu administratif absurde dans lequel, parfois, on a obtenu de l'argent pour le projet Scoubidou de l'année N à l'année N+3, et du coup il faut absolument trouver un doctorant Scoubidou sur cet intervalle. Bon, comme je l'ai dit, il vaut mieux que j'arrête de parler de ça, il faut que je pense à ma bile, tout ça tout ça.

(lundi)

Comment faire un jeu de Tribble

Je continue sur les idées développées dans cette entrée (et dans une moindre mesure la suivante) : ma métaphorique petite sœur se plaint qu'un quadrangle généralisé ce n'est pas, nonobstant mes explications fumeuses, une structure très convaincante pour inventer des jeux de cartes, alors que le jeu de Dobble a au moins réussi à convaincre des gens de l'éditer. Si ce dernier est basé sur le principe que deux cartes quelconques ont toujours un symbole en commun, peut-on faire un paquet où trois cartes quelconques auraient toujours un symbole en commun ?

Réponse : oui, on peut, mais je crois qu'il va falloir admettre un nombre de symboles par carte un peu désagréablement élevé (ou un nombre total de cartes bien bas) :

[Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles]

J'ai créé ici 26 cartes portant chacune 30 symboles choisis parmi un répertoire de 130, chaque symbole apparaissant sur 6 cartes différentes, deux cartes distinctes ayant toujours exactement 6 symboles en commun, et trois cartes distinctes ayant toujours exactement 1 symbole en commun. On peut donc imaginer toutes sortes de jeux de rapidité (ou en fait, plutôt de patience) consistant à chercher le symbole en commun à trois cartes, selon des règles inspirées de celles qui servent pour Dobble. Maintenant, à vrai dire, je trouve ça surtout excessivement fastidieux : il m'a fallu plus de deux minutes pour trouver le symbole commun entre les trois premières cartes (notons que l'ordre des cartes affiché ci-dessus n'est pas aléatoire, et ce symbole est en fait commun aux cinq premières cartes et à la dernière, mais ce n'est pas un bug), et je ne trouve pas ça spécialement ludique. Mais bon, il y a plein de choses que je ne trouve pas ludique et que d'autres gens aiment, alors peut-être que ce jeu peut quand même trouver des adeptes (si quelqu'un veut un tirage physique, qu'il me fasse signe).

Ajout : Un jeu qu'on pourrait jouer avec ces cartes consiste à distribuer à chaque joueur le même nombre de cartes (le plus élevé possible) en en laissant deux face retournée sur la table ; quiconque peut montrer du doigt un symbole en commun entre une carte quelconque de sa main et les deux cartes sur la table pose sa carte sur la table et défausse l'une des deux qui y étaient déjà (de façon qu'il y en ait toujours deux) ; le jeu se continue jusqu'à ce que quelqu'un se soit ainsi débarrassé de toutes ses cartes. La particularité de cette procédure est que celui qui arrive à poser une de ses cartes gagne un avantage pour le coup suivant vu qu'il a pu déjà rechercher l'intersection entre les deux cartes sur la table.

Pour répondre à des questions naturelles : l'ordre de disposition des symboles sur une carte donnée est totalement aléatoire (j'ai commencé par essayer de trouver une logique qui me convienne, mais j'ai vite craqué et opté pour un tirage au hasard — enfin, au hasard déterministe —, au prétexte qu'il vaut mieux un chaos garanti qu'un ordre basé sur une logique douteuse) ; et la permutation des symboles à l'intérieur du répertoire l'est aussi. L'ordre des cartes affiché ci-dessus n'est pas aléatoire, mais ça n'a pas d'importance puisqu'un vrai jeu de cartes serait de toute façon mélangé avant usage. Et sinon, je sais que mon choix de symboles est certainement merdique, mais je n'accepterai de critiques que de la part de gens qui peuvent en suggérer un meilleur ; j'ai cherché à avoir une proportion raisonnable de signes d'écriture (lettres ou caractères chinois) et de dessins, j'ai voulu éviter les symboles qui se ressemblent trop (par exemple, je n'ai pas mis le ‘C’ parce qu'il est trop semblable au ‘G’, je n'ai pas mis le ‘Ш’ parce qu'il est trop semblable au ‘Щ’, etc.) même si je sais qu'il en reste, et globalement il n'y a pas trop de logique mais c'est un peu l'idée.

J'explique maintenant comment construire la chose, parce que je trouve ça assez joli : pour résumer très brièvement, on peut dire que si le jeu de Dobble est basé sur l'idée que deux points distincts dans le plan (projectif, mais peu importe) déterminent une unique droite, celui-ci est basé sur l'idée que trois points distincts sur la sphère déterminent un unique cercle (cercle signifiant petit ou grand cercle, i.e., l'intersection de la sphère avec un plan ; en l'occurrence, le plan passant par ces trois points) : on imaginera les cartes du jeu comme les points de la sphère, et les symboles sur une carte comme les cercles passant par ce point. Il ne reste plus qu'à transformer ça en une structure finie en passant sur un corps fini, donc à expliquer ce que sphère et cercle veulent dire dans ce contexte. En gros, je dois parler un peu de géométrie de Möbius.

Le plus simple est sans doute de partir de la description de la sphère usuelle comme la sphère de Riemann : autrement dit, on identifie les points de la sphère unité {(u,v,w)∈ℝ | u² + v² + w² = 1} avec l'ensemble ℂ∪{∞} des nombres complexes auxquels on a adjoint le symbole ∞, l'identification étant faite par la projection stéréographique de la sphère. C'est-à-dire que pour projeter un point (u,v,w) de la sphère, on trace la droite qui le relie au pôle « nord » (0,0,1), et où cette droite rencontre le plan équatorial donnera le nombre complexe avec lequel on identifie ce point ; ce n'est pas très important, mais la formule explicite pour ce complexe est : z = (u+i·v)/(1−w) (et réciproquement : u=2Re(z)/(|z|²+1), v=2Im(z)/(|z|²+1) et w=(|z|²−1)/(|z|²+1)), avec la convention que le pôle nord lui-même est vu comme le point ∞. En quoi cette identification est-elle pertinente pour ce que je veux raconter ? D'abord, la projection stéréographique fait que les cercles de la sphère deviennent (ce n'est pas complètement évident géométriquement !) des cercles du plan complexe, ou éventuellement des droites pour les cercles qui passaient par le pôle nord (on conviendra donc que les cercles de ℂ∪{∞} sont les cercles du plan complexe usuel, ainsi que les droites de celui-ci auxquelles on a adjoint ∞). Par ailleurs, une propriété fort sympathique est que quatre points distincts z₁,z₂,z₃,z₄ de ℂ∪{∞} sont situés sur un même cercle (dans ℂ∪{∞} ou, ce qui revient au même, sur la sphère projetée stéréographiquement) si et seulement si leur birapport, défini comme ((z₁−z₃)·(z₂−z₄))/((z₂−z₃)·(z₁−z₄)) (avec les conventions assez évidentes si l'un des quatre est ∞), est un nombre réel.

En fait, cette quantité a la propriété de rester invariante quand on applique une homographie, c'est-à-dire une application z ↦ (a·z+b)/(c·z+d) où a,b,c,d sont quatre complexes tels que a·db·c ≠ 0, condition ici nécessaire et suffisante pour qu'il s'agisse d'une bijection ; mieux : on peut envoyer quatre points distincts sur quatre autres points distincts si et seulement si ils ont le même birapport ; comme par ailleurs les homographies transforment les cercles en cercles et peuvent même transformer tout cercle en n'importe quel autre cercle, et comme on est convenu que l'axe réel ℝ∪{∞} comptait comme un cercle, ces différentes propriétés expliquent que le birapport est réel si et seulement si les quatre points sont cocycliques.

On peut maintenant expliquer comment passer à une structure finie. Pour commencer, soit F un corps fini ayant q éléments (où q est nécessairement une puissance d'un nombre premier ; par exemple, si q est premier, F est le corps ℤ/qℤ des entiers modulo q), et soit K le corps à q² éléments ; pour mes lecteurs qui ne sont pas trop familiers avec les corps finis, disons que dans le cas particulier où q est un nombre premier congru à 3 modulo 4, on peut définir K comme l'ensemble des r+s√−1 où r,s sont des éléments de F, c'est-à-dire des entiers modulo q, et √−1 est un symbole formel, et ces expressions se manipulent exactement comme les nombres complexes (notamment, (√−1)² = −1 ; le moins évident est que l'inverse de r+s√−1 vaut (rs√−1)/(r²+s²) comme on s'en convainc en développant). Comme je veux aussi pouvoir travailler avec q=5, je donne aussi une construction lorsque q est un nombre premier congru à 3 ou 5 modulo 8 : dans ce cas, on peut définir K comme l'ensemble des r+s√2 où r,s sont des éléments de F et √2 est un symbole formel vérifiant (√2)² = 2 (et l'inverse de r+s√2 vaut (rs√2)/(r²−2s²)).

Il faut imaginer qu'on va refaire la même chose que la sphère de Riemann, en faisant jouer à F le rôle de ℝ et à K le rôle de ℂ. Notamment, on va appeler « sphère sur F » l'ensemble K∪{∞} obtenu en adjoignant le symbole ∞ à K. On appelle « cercle » passant par z₁,z₂,z₃ sur cette « sphère » l'ensemble formé de ces trois points et des des z₄∈K∪{∞} (différents d'eux et) tels que le birapport, défini par exactement la même formule ((z₁−z₃)·(z₂−z₄))/((z₂−z₃)·(z₁−z₄)) que ci-dessus, soit un élément de F (ou ∞, mais en fait ceci ne se produit que pour z₄ valant z₁, que j'ai écarté) ; il faut néanmoins compléter ma définition du birapport par différentes règles assez intuitives pour traiter les cas indéterminés (essentiellement, si z₁ vaut ∞, on s'autorise à simplifier ∞ au numérateur et au dénominateur et le birapport vaut juste (z₂−z₄)/(z₂−z₃)). Une autre façon de dire la même chose est que les cercles sont les images de F∪{∞} par les homographies z ↦ (a·z+b)/(c·z+d) (avec a,b,c,d quatre éléments de K tels que a·db·c ≠ 0). Notamment, tous les cercles ont exactement q+1 points. On peut par ailleurs montrer qu'il y a q³+q = q(q²+1) cercles au total, q²+q = q(q+1) cercles passant par un point quelconque donné et q+1 cercles passant par une paire quelconque donnée de points distincts, et exactement un par un triplet de points distincts.

Pour montrer que cette construction est assez concrète, et manipulable à la main, je prends l'exemple de q=3, c'est-à-dire que F est le corps ℤ/3ℤ = {0, 1, −1} des entiers modulo 3. Je peux construire K en ajoutant le symbole formel √−1 ou √2 (ça revient au même dès que les deux sont permis c'est-à-dire lorsque q est congru à 3 modulo 8 ; et ici c'est même exactement pareil puisque −1 = 2 modulo 3). Autrement dit, le corps K à q²=9 éléments est l'ensemble {0, 1, −1, √−1, 1+√−1, −1+√−1, −√−1, 1−√−1, −1−√−1}, où on fait les sommes terme à terme modulo 3 et les produits en développant, en utilisant le fait que (√−1)²=−1 et en travaillant toujours modulo 3 (au final, cela revient à faire sommes et produits dans les complexes et réduire parties réelle et imaginaire modulo 3). La « sphère » K∪{∞} sur F=ℤ/3ℤ a donc dix éléments (les neuf que je viens de citer, et ∞). Pour construire les cercles, on part de {∞,0,1,−1}, et on applique ad libitum les opérations consistant à translater (ajouter une même constante aux quatre éléments), homothétiser (multiplier par une même constante les quatre éléments) ou prendre l'inverse. Par exemple, en translatant le cercle {∞,0,1,−1} par −1+√−1, on obtient le cercle {∞, −1+√−1, √−1, 1+√−1} (ces deux cercles, comme ils contiennent ∞, méritent sans doute plutôt d'être appelés des droites) ; en prenant l'inverse, {0, 1+√−1, −√−1, −1+√−1} (l'ordre n'a pas d'importance : il s'agit juste d'un ensemble ; je garde juste les éléments dans l'ordre dans lequel je fais les opérations, pour aider à suivre celles-ci) ; en multipliant par √−1, on obtient {0, −1+√−1, 1, −1−√−1}, et en translatant par 1, on obtient {1, √−1, −1, −√−1}, qu'on peut appeler le cercle unité si on veut ; sur chacun de ces exemples successifs, on peut vérifier que le birapport des quatre points dans l'ordre dans lequel je les ai écrits vaut toujours −1. Avec un peu de patience, on peut déterminer les 30 cercles à travers les 10 points de K∪{∞}, et se convaincre qu'il y a bien 12 cercles à travers chaque point donné, 4 cercles à travers chaque paire de points distincts, et un unique cercle à travers chaque triplet de points distincts.

La construction du paquet de cartes de Tribble (rien à voir avec Star Trek ☺) est alors la suivante : on crée q²+1 cartes, une pour chaque élément de la « sphère » K∪{∞}, on choisit q³+q symboles au total, un pour chaque « cercle » tel que défini précédemment, et chaque carte porte q²+q symboles, un pour chaque cercle passant par ce point. Puisque trois points quelconques définissent un unique cercle, trois cartes distinctes auront toujours un unique symbole en commun (et deux cartes ont q+1 symboles communs). C'est ce que j'ai fait ci-dessus pour q=5 (puis j'ai randomisé la correspondance cercles↔symboles, et l'ordre des symboles sur chaque carte).

Je suppose que cette construction est (au moins approximativement) optimale en un certain sens, mais je ne sais pas en quel sens… En tout cas, ce que j'ai raconté est une construction classique (due apparemment à Witt en 1938 — je n'ai pas vérifié la référence).

On pourrait aussi se poser la question suivante. Maintenant, je veux faire un jeu de cartes dans lequel toutes les cartes portent des symboles en un certain nombre d'emplacements, le même nombre pour chaque carte (cette fois, une carte peut porter deux symboles identiques en des emplacements différents), de façon que trois cartes quelconques aient toujours exactement un emplacement commun portant le même symbole sur les trois cartes. (Formellement, donc, les cartes sont des mots de même longueur sur un certain alphabet, et on demande que trois mots quelconques aient toujours un unique emplacement auquel elles ont le même symbole.) Y a-t-il une façon intelligente, mathématiquement élégante, hautement symétrique et/ou vaguement optimale de s'y prendre ? Je sais faire avec q cartes, q symboles, et q² emplacements par carte : il suffit, si j'appelle F le corps fini à q éléments, de mettre à l'emplacement (a,b) de la carte x (où a,b,x appartiennent tous à F) le symbole ψ(x) + a·x² + b·x, où ψ:FF est une fonction quelconque (on peut prendre 0 mais ça ne donne pas une réponse très intéressante : toutes les cartes ont juste le symbole 0 en commun à l'emplacement (0,0)). Il est facile de vérifier, en résolvant un système linéaire et en utilisant un discriminant, que si x₀,x₁,x₂ sont trois cartes quelconques, il existe a,b uniques tels que a·(x₁²−x₀²) + b·(x₁−x₀) = ψ(x₀)−ψ(x₁) et a·(x₂²−x₀²) + b·(x₂−x₀) = ψ(x₀)−ψ(x₂), ce qui est la propriété voulue. Je ne sais pas si on peut faire avec une construction plus jolie ou plus symétrique et/ou plus efficace.

Par ailleurs, il est naturel de se demander alors ce qui se passe si on veut que quatre cartes ou plus aient toujours un symbole en commun : si on ajoute la contrainte que chaque symbole apparaisse sur le même nombre de cartes, cela revient à chercher un système de Steiner, mais je ne crois pas qu'on connaisse de constructions jolies ou efficaces de familles infinies de systèmes de Steiner semblable à la construction que j'ai présentée ci-dessus ou à la construction des plans projectifs (cependant, je n'y connais essentiellement rien). Si on veut juste la propriété que r cartes quelconques aient toujours un unique symbole en commun, sans rien demander de plus, à part la construction triviale consistant à mettre un symbole en commun à toutes les cartes et éventuellement des symboles uniques par ailleurs, on peut reprendre ce que je propose au paragraphe précédent, et qui se généralise à ψ(x) + ar·xr + ⋯ + a1·x, et ensuite utiliser cette valeur ainsi que les ai eux-mêmes, pour désigner le symbole : ceci donne une construction avec q cartes, et qr symboles par carte parmi qr+1 ; on peut certainement faire mieux, mais comme je ne sais pas très bien ce que « mieux » veut dire, je n'irai pas plus loin.

(samedi)

Les petits machins qui tournent dans notre système solaire

Je me rappelle en commençant cette entrée que j'ai créé une catégorie astro sur ce blog, qui ne me sert franchement pas beaucoup. D'ailleurs, je suis assez nul en astronomie sauf peut-être dans ses aspects les plus mathématiques (genre, la mécanique céleste), et comme je suis trop myope pour voir les étoiles même quand je ne suis pas à Paris où c'est essentiellement impossible de toute façon, regarder le ciel nocturne a assez peu d'intérêt pour moi. Mon papa m'a montré Saturne à travers un télescope emprunté à l'Université de Toronto quand j'étais petit, mais ma pratique de l'observation directe s'est arrêtée là.

Pour autant, je ne peux pas nier que, parmi d'autres objets monstrueux qu'il est intéressant de s'exercer à imaginer, les planètes et autres corps du système solaire exerçaient et exercent toujours sur moi une certaine fascination et si j'ose dire une certaine collectionnite. Soit en raison de leur similarité avec la Terre qui les rend au moins vaguement imaginables : Mars, maintenant, on en a tellement de photos en très haute résolution, de vidéos, et de toutes sortes de mesures, que ce n'est même plus drôle de l'imaginer (enfin bon, si par hasard la NASA lit mon blog, j'aimerais bien voir des vues d'Olympus Mons depuis une bonne distance, et de Valles Marineris depuis son bord). Titan est, de nos jours, ce que Mars était quand j'étais petit, et j'ai déjà mentionné que cette photo, la seule que nous ayons prise depuis la surface d'autre chose que la Terre, la Lune, Mars ou Vénus, est, à mes yeux, l'image la plus extraordinaire de l'astronomie et peut-être de toute la science, parce que ces cailloux d'apparence banale (et qui sont d'ailleurs essentiellement de la glace d'eau) ont été photographiés à plus d'un milliard de kilomètres d'ici, sur un astre qui a une surface solide, une atmosphère de pression semblable à celle de la Terre (certes pas très respirable pour nous), et même des vrais lacs et mers (d'hydrocarbures). Je rêve de voir une vidéo des lacs de Titan (y a-t-il des vagues dessus ? [ajout : apparemment non et c'est un peu un mystère]). Mais si on écarte cet intérêt pour ce qui ressemble au moins formellement à la Terre, j'ai tendance à trouver que c'est la taille qui compte, et (comme Randall Munroe) j'aimerais bien voir des photos de près des nuages des planètes géantes. Ou d'ailleurs, des bonnes photos d'Uranus et Neptune, parce que franchement celles qu'on en a ne sont pas terribles : à tel point que quand on cherche Uranus dans Google Images, une bonne partie des images renvoyées sont, en fait, celles de Neptune (bizarrement, celles renvoyées pour Neptune ont bien l'air d'être de Neptune — mais c'est aussi un peu toujours la même).

Au rayon c'est la taille qui compte, d'ailleurs, bien avant que Pluton ne soit dégradé au rang de planète naine, je militais pour qu'on arrête d'appeler par le même nom les satellites sérieux qui ont une forme bien ronde (ceux qui sont à peu près en équilibre hydrostatique sous l'effet de leur propre gravité) et les autres petites merdes qui tournent autour des différentes planètes. Non, dis-je fermement, Jupiter n'a pas 67 lunes (nombre qui change d'ailleurs régulièrement, quand j'étais petit c'était évidemment beaucoup moins, et il ne peut que tendre vers des quantités colossales quand on en sera à répertorier chaque molécule de son système d'anneaux), il en a exactement 4, à savoir celles, Io, Europe, Ganymède et Callisto, connues depuis Galilée, et les autres cailloux qui orbitent autour méritent à peine qu'on les compte, pas qu'on les range dans la même catégorie, et certainement pas qu'on leur donne des noms individuels (je sais que Zeus était gros coucheur, mais au bout d'un moment, l'arrachage de cheveux pour trouver la nymphe violée après laquelle on va nommer le caillou du mois, ça devient ridicule). Évidemment, quelle que soit la définition, il y aura des cas tangents (comme Mimas ou Encélade, si bien que je ne sais pas combien de lunes « sérieuses » a Saturne), mais au moins si on convient de ne nommer que les objets ronds sous l'effet de leur propre gravité, on a un espoir que le système solaire ait un nombre d'objets localement exhaustible, c'est-à-dire, dont on puisse énumérer la totalité jusqu'à une distance donnée du Soleil.

À ce titre-là, la consultation de cette page Wikipédia ou de celle-ci est assez intéressante comme catalogue des objets sérieux du système solaire. La liste des transneptuniens, notamment, c'est-à-dire des objets du même genre que Pluton et qui ont fait qu'on a dû déclasser ce dernier parce que sinon on arrivait à un nombre ridicule de planètes, est très rigolote, et on peut légitimement s'interroger sur ce que peut être la taille du plus gros objet qui tourne autour du Soleil au-delà de l'orbite de Neptune. Je ne comprends pas parfaitement le diagramme de Venn des différentes classifications d'objets transneptuniens (ceinture de Kuiper, disque épars, plutinos, objets à orbites classiques ou résonantes, objets « détachés », objets intérieurs du nuage d'Oort), et les définitions ne sont peut-être pas très bien établies, mais ce qui est sûr c'est qu'il y a beaucoup plus d'objets ronds connus dans le système solaire que quand j'étais petit, et qu'ils ont des caractéristiques rigolotes. Dites bonjour à : Éris, à peu près de la taille de Pluton mais avec une orbite bien excentrique et très inclinée qui l'emmène nettement plus loin que lui ; Haumea, qui tourne incroyablement vite sur lui-même et qui du coup est déformé en un ellipsoïde très aplati ; Makemake, le plus gros connu après Pluton et Éris et dont l'orbite ressemble à celle de Haumea ; Orcus, qui a une orbite sembablable en taille, excentricité et inclinaison à celle de Pluton (on dit que c'est un Plutino) ; 2007 OR₁₀, qui n'a même pas encore été nommé, et qui a une orbite semblable à Éris ; Quaoar, qui a une orbite bien classique (ronde et peu inclinée) et qui est apparemment la première du lot à avoir été découverte ; et Sedna, dont l'orbite extrêmement elliptique l'entraîne à plus de 900 unités astronomiques du Soleil (pour mémoire, Neptune est autour de 30 ; actuellement, Sedna est autour de 90UA — c'est bien sûr parce qu'il est vers son périhélie qu'on a pu le détecter), ce qui pose plein de questions sur le nombre d'objets de ce genre. Si comme moi vous avez du mal à vous y repérer, voyez ce diagramme ou celui-ci pour les orbites (demi-grand-axe et inclinaison) ou si vous voulez voir Sedna dans le tas, et pour une idée de la taille, forme et couleur de ces objets.

Tout ça pour dire que je suis content qu'on ait enfin de jolies photos de Pluton, mais que maintenant je voudrais en avoir d'Éris et autres (voire une vidéo de Haumea en train de tourner ?), et en tout cas j'ai plein d'images que je rêve d'avoir du système solaire. Par comparaison, les planètes extrasolaires, je n'arrive pas du tout à m'y intéresser, même quand on nous pipote qu'elles ressemblent à la Terre.

(mercredi)

Comment faire un jeu de cartes à partir d'un quadrangle généralisé

L'entrée précédente m'a donné envie de concevoir des jeux de cartes avec des structures combinatoires mathématiques remarquables. Je vais déjà en tirer un avec une structure liée à celle des 27 droites sur une surface cubique (à savoir, l'ensemble des 36 double six de telles droites)[#], mais ce serait plutôt pour faire de la cartomancie oulipienne. Je me demandais ce que je pourrais inventer de plus jouable. Et d'un autre côté, parmi les structures combinatoires que j'avais vaguement à l'esprit, il y avait (je les ai mentionnées dans l'entrée précédente, et je vais dire ci-dessous de quoi il s'agit) les quadrangles généralisés.

((Ceux de mes lecteurs qui ne sont pas intéressés par les aspects mathématiques peuvent directement sauter au dessin des cartes ci-dessous, après quoi je pose quelques questions de design, si j'ose dire.))

Pour essayer d'imaginer quelque chose de jouable, j'ai médité sur la structure d'un jeu ordinaire de 52 cartes. Tout le monde sait qu'il s'agit des 13×4 cartes constituant chacune des combinaisons, des couples si on veut, entre un symbole de {A,2,3,4,5,6,7,8,9,X,V,D,R} (la « valeur » de la carte) et un symbole de {♣,♢,♡,♠} (la « couleur » de la carte, le terme français était d'ailleurs épouvantablement ambigu parce qu'il recouvre à la fois ce que les Anglais appellent suit, c'est-à-dire le symbole que je viens de dire, et ce que les Anglais appellent colour, c'est-à-dire noir pour ♣,♠ ou rouge pour ♢,♡ — mais passons). Mathématiquement, on a donc affaire au produit cartésien {A,2,3,4,5,6,7,8,9,X,V,D,R} × {♣,♢,♡,♠}, qui n'est pas une structure combinatoire très intéressante. Si on considère les cartes comme des points et les symboles comme des droites (verticales ou horizontales : voir le dessin ci-dessous), on a affaire à une simple grille. Maintenant, voici quelques propriétés de cette « géométrie », qui peuvent paraître bizarrement compliquées, mais dont on va voir le sens à les énoncer ainsi :

A 2 3 4 5 6 7 8 9 X V D R
  1. Sur chaque carte figurent exactement 2 symboles (distincts) [à savoir, l'indication de sa valeur et l'indication de sa couleur].
  2. Chaque symbole figure sur exactement 4 ou 13 cartes (distinctes) [4 dans le cas d'une valeur, 13 dans le cas d'une couleur].
  3. Deux cartes ayant deux symboles en commun coïncident [il n'y a pas de cartes différentes ayant la même valeur et la même couleur]. Diverses reformulations équivalentes : deux cartes distinctes ont au plus un symbole en commun ; deux symboles distincts figurent sur au plus une carte ; deux symboles figurant tous les deux sur deux cartes distinctes coïncident.
  4. Si C est une carte et σ est un symbole qui ne figure pas sur C, alors il existe exactement une carte D et un symbole τ tels que σ figure sur D et τ figure à la fois sur C et sur D. [Explication ci-dessous.]

La propriété (4) peut sembler bizarre, mais concrètement, elle signifie simplement que si C est une carte et σ est soit une valeur différente soit une couleur différente de celle de C, alors il existe une carte D qui a cette valeur ou couleur et qui pour l'autre symbole (couleur ou valeur respectivement) τ a la même que celle de C.

Cette dernière propriété, d'ailleurs, est en quelque sorte celle utilisée dans un nombre essentiellement infini de jeux de cartes (par exemple le jeu commercial Uno, le « huit américain » ou « maou maou », le « Tschau Sepp » suisse, etc.) qui sont des variantes mineures autour du principe suivant : chaque joueur a des cartes dans sa main dont il doit se débarrasser, ils jouent tour à tour et chacun peut poser une carte ayant un symbole commun avec la carte précédemment jouée (c'est-à-dire concrètement : ayant la même valeur ou la même couleur — le plus souvent la même couleur, bien sûr, puisqu'il y a plus de telles cartes). La propriété signifie alors que si la carte C a été jouée et que je veux passer le jeu à σ qui n'est pas actuellement jouable (i.e., changer la valeur ou la couleur), il y a une unique carte jouable D qui permettra de faire ce changement.

Si j'ai écrit les propriétés sous la forme bizarre ci-dessus, c'est pour pouvoir amener la définition d'un quadrangle généralisé, ou plus exactement, un quadrangle généralisé fini de paramètres (s,t) (deux entiers), définition que je vais formuler ici avec des cartes et des symboles (mais les termes classiques seraient points et droites, sachant que la définition est symétrique entre les deux, à permutation près des paramètres s et t ; je fais ici la convention que les cartes sont les points et les symboles les droites, mais le contraire irait tout aussi bien) :

  1. Sur chaque carte figurent exactement t+1 symboles (distincts).
  2. Chaque symbole figure sur exactement s+1 cartes (distinctes).
  3. Deux cartes ayant deux symboles en commun coïncident. Diverses reformulations équivalentes : une carte est complètement déterminée par la donnée de deux quelconques de ses symboles ; deux cartes distinctes ont au plus un symbole en commun ; deux symboles distincts figurent sur au plus une carte ; deux symboles figurant tous les deux sur deux cartes distinctes coïncident ; un symbole est complètement déterminé par la donnée de deux cartes sur lequel il figure.
  4. C σ D τ Si C est une carte et σ est un symbole qui ne figure pas sur C, alors il existe exactement une carte D et un symbole τ tels que σ figure sur D et τ figure à la fois sur C et sur D. (Cf. dessin ci-contre.)

Les propriétés (3)&(4) sont donc exactement les mêmes que ce que j'ai énoncé pour un jeu de cartes usuelles. La (1) est une généralisation de ce qu'elle était ci-dessus pour autoriser plus que 2 symboles par carte (par contre, on notera bien que la troisième propriété continue à parler de deux symboles : une carte est complètement déterminée par deux quelconques de ses symboles). La propriété (2), en revanche, diffère de ce qu'on avait pour un jeu de cartes ordinaires, en ce sens que chaque symbole figure maintenant sur le même nombre de cartes, au lieu qu'il y ait des types de symboles figurant sur un nombre plus ou moins grand de cartes.

Dans la propriété (4), on dit parfois que τ est le perpendiculaire de σ à travers C : cette terminologie a l'avantage de bien faire ressortir l'unicité, et elle est raisonnable quand on pense à l'exemple d'une grille (par exemple, le perpendiculaire à ♠ passant par 8♡ est 8 : c'est bien le cas sur le dessin de la grille que j'ai fait plus haut). Néanmoins, cette terminologie suggère une notion métrique (des angles), qui n'existent pas ici : on demande simplement une condition d'incidence entre σ et τ (à savoir, qu'ils figurent sur la carte D). D'autre part, comme cartes et symboles jouent des rôles totalement symétriques dans les propriétés (j'ai fait mes dessins avec les cartes pour points et les symboles pour droites, mais je pouvais faire le contraire), on pourrait tout aussi bien dire que D est la perpendiculaire de C à travers σ (et pour le coup, dans le cas d'une grille, c'est beaucoup moins intuitif : la perpendiculaire à 8♡ par ♠ est 8♠). Passons.

Une conséquence facile mais importante de ces propriétés (plus exactement, des propriétés (3)&(4)) est l'inexistence de triangles : il n'est pas possible que trois cartes distinctes aient deux à deux un symbole en commun sauf si ces trois symboles sont tous le même (ce qui contraste donc totalement avec les plans projectifs finis dont j'ai parlé dans l'entrée précédente où deux cartes quelconques ont un symbole en commun). Pour le cas d'un jeu ordinaire de 52 cartes, c'est complètement évident ; dans le cas général on peut raisonner comme ceci : si C, D₁ et D₂ sont trois cartes censées avoir deux à deux un symbole en commun mais non commun aux trois, soit σ le symbole commun supposé exister entre D₁ et D₂, il n'apparaît pas sur C (sinon les trois cartes auraient un unique symbole commun, contrairement à l'hypothèse), et d'après la propriété (4) des quadrangles généralisés, il doit exister une unique carte D ayant le symbole σ ainsi qu'un symbole en commun avec C — mais D₁ et D₂ vérifient cette propriété, d'où une contradiction.

Je ne vais pas essayer d'expliquer ce qu'on sait sur la classification des quadrangles généralisés, parce que je n'y connais pas grand-chose (pour moi, tout le sujet ressemble à un labyrinthe de petits théorèmes tordus tous semblables) et que je me planterais à coup sûr si j'essayais. Pour en savoir plus, on pourra par exemple consulter le livre de van Maldeghem, Generalized Polygons, ou plus spécifiquement celui de Payne & Thas, Finite Generalized Quadrangles, ou encore celui de Shult, Points and Lines. Personnellement, je trouve ça passablement illisible.

Disons juste qu'il existe quelques constructions « classiques », dont je n'évoquerai que la suivante. Si F est un corps fini ayant q éléments (où q est nécessairement une puissance d'un nombre premier ; par exemple, si q est premier, F peut être le corps ℤ/qℤ des entiers modulo q), on appelle quadrique projective de dimension 3 sur F l'ensemble des solutions (X₀:X₁:X₂:X₃:X₄) de l'équation X₀·X₁ + X₂·X₃ + X₄² = 0, où les ‘:’ entre les coordonnées X signifient qu'on demande que ces coordonnées ne soient pas toutes simultanément nulles et que de plus on identifie deux solutions proportionnelles (c'est-à-dire qui se déduisent l'une de l'autre par multiplication par un élément non nul de F) ; chacune de ces solutions s'appelle un point de la quadrique. (À titre d'exemple, si F = ℤ/3ℤ, (1:0:0:0:0)=(2:0:0:0:0) est un point de la quadrique car 1×0 + 0×0 + 0² = 0, (1:2:0:0:1)=(2:1:0:0:2) en est un autre, car 1×2 + 0×0 + 1² = 0 modulo 3, et (1:2:0:0:2) en est encore un autre.) Si on a deux solutions (X₀:X₁:X₂:X₃:X₄) et (Y₀:Y₁:Y₂:Y₃:Y₄) dont toute combinaison linéaire (à coefficients dans F) est encore solution (ce qui revient au même que de dire qu'en plus de X₀·X₁ + X₂·X₃ + X₄² = 0 et Y₀·Y₁ + Y₂·Y₃ + Y₄² = 0 on a aussi X₀·Y₁ + Y₀·X₁ + X₂·Y₃ + Y₂·X₃ + 2X₄·Y₄ = 0), on dit que l'ensemble de ces combinaisons linéaires est une droite sur la quadrique. (À titre d'exemple, la droite passant par (1:0:0:0:0) et (0:0:1:0:0), c'est-à-dire l'ensemble des (u:0:v:0:0), est une droite sur la quadrique car u×0 + v×0 + 0² = 0 quels que soient u et v.) Ces définitions fonctionnent sur n'importe quel corps (si ce n'est que mon choix d'équation de quadrique serait assez arbitraire sur un corps quelconque, alors que sur un corps fini elles reviennent toutes au même), mais sur un corps fini F à q éléments, on peut montrer qu'il y a q³ + q² + q + 1 = (q²+1)(q+1) points sur la quadrique, et exactement autant de droites, que chaque point est sur q+1 droites, que chaque droite contient q+1 droites, et que tout ça forme un quadrangle généralisé de paramètres (q,q). En fait, on obtient deux quadrangles généralisés différents : pour l'un, ce que j'ai appelé cartes seront les points de la quadrique et les symboles figurant sur la carte seront les droites passant par le point, alors que pour l'autre, ce sera le contraire, on mettra un symbole par point de la quadrique et une carte sera formée par une droite de la quadrique et étiquetée par les points sur celle-ci ; de façon peut-être surprenante, bien qu'ils aient les mêmes paramètres, ces deux quadrangles généralisés ne sont pas le même (sauf si q est pair, c'est-à-dire en fait, est une puissance de 2) : ceci est en contraste au cas des plans projectifs où le dual d'un plan projectif (c'est-à-dire l'échange des points et des droites) donne bien la même structure combinatoire.

Si je prends le cas particulier q=3, la construction ci-dessus définit un quadrangle généralisé de paramètres (3,3), qui a 40 cartes et 40 symboles (et en fait, à dualité près, c'est le seul). En voici[#2] une représentation possible (du moins pour les gens dont le navigateur sait afficher le SVG) :

[Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Carte à quatre symboles] [Dos des cartes]

Voici donc un jeu de 40 cartes (le dernier dessin de la liste est, bien sûr, le dos), chacune comportant 4 symboles parmi 40, chaque symbole apparaissant sur exactement 4 cartes, deux cartes distinctes ayant au plus un symbole en commun, et de sorte que si on se donne une carte C et un symbole σ qui n'est pas dessus, il y a une unique carte D qui comporte à la fois le symbole σ et un symbole τ en commun avec C. (À titre d'exemple, comme la première carte a les symboles 1234, n'importe quel autre symbole apparaît sur une unique carte avec l'un de ces chiffres.)

À quels jeux pourrait-on jouer avec un tel paquet de cartes ? Cela fait partie du problème. Un point de départ pourrait être, comme je le suggère plus haut, les variantes du jeu de défausse (« huit américain ») : chaque joueur essaie de se débarrasser de ses cartes et peut poser une carte à condition qu'elle ait un symbole en commun avec la carte précédemment jouée. (Notons que chaque carte a un symbole en commun avec exactement 12 des 39 autres : la proportion des cartes jouables est donc toujours de 31%, ce qui est très proche des 29% dans le cas d'un jeu de 52 cartes où on doit suivre avec la même valeur ou la même couleur.) Une autre possibilité serait de faire un jeu de poker : dans ce cas, deux des figures évidentes à atteindre avec quatre cartes seraient la droite (quatre cartes ayant un symbole en commun à toutes : il y en a 40 possibles, donc c'est une figure rare), ou le quadrangle (quatre cartes qui ont chacune un symbole commun avec la suivante cycliquement ; il y a 1620 quadrangles possibles ; comme je l'ai signalé plus haut, il n'existe pas de triangle : si trois cartes ont un symbole commun deux à deux, ce symbole est forcément le même pour les trois, et il s'agit d'une droite incomplète). On peut aussi certainement imaginer toutes sortes de solitaires/réussites. (Évidemment, il est plus facile de concevoir des jeux si on s'autorise à donner un sens particulier à tel ou tel symbole, c'est-à-dire à rompre la symétrie du paquet de cartes, mais ceci va à l'encontre de l'élégance de la structure mathématique représentée. Néanmoins, pour un jeu de poker, il faudra bien trouver un moyen soit de départager les mains de même forme, soit de décider ce qu'on fait quand ça se produit.)

Une autre question est de savoir quels symboles utiliser sur les cartes. Pour ça, j'ai eu à me bagarrer avec deux contraintes : la contrainte de mon sens de l'esthétique toujours difficile à satisfaire, et la contrainte pratique de trouver des symboles alors que le summum de mes talents en dessin informatique ne me permet même pas de faire un smiley. J'ai remarqué qu'il y a une symétrie de la structure qui opère par 10 cycles de longueur 4, c'est-à-dire que je peux diviser mes 40 symboles en 10 blocs[#3] de 4, chacun muni d'un ordre cyclique, de façon que si on remplace chaque symbole par le suivant cycliquement dans le bloc, chaque carte est transformée en une autre carte (éventuellement la même). J'ai donc cherché 10 quatuors de symboles qui présentent au moins un semblant de cycle : quatre couleurs dans le cycle des couleurs, les quatre « couleurs » d'un jeu de cartes traditionnel (mais l'ordre cyclique n'est vraiment pas clair), quatre phases de la lune, quatre saisons représentées par leurs signes astrologiques, et franchement, j'ai manqué un peu d'imagination, alors j'ai vaguement déniché quatre animaux chinois, et pour le reste j'ai pris quatre chiffres, quatre lettres latines majuscules, quatre lettres grecques minuscules, quatre sortes d'étoiles/astérisques, et enfin quatre symboles qui ne me semblaient pas trop moches (caducée, couronne, gemme et tête de mort — trouvez la symbolique que vous voudrez).

Si vous avez de meilleures suggestions, elles sont les bienvenues, mais ce n'est pas évident : j'ai besoin de dessins vectoriels, et le mieux que j'aie trouvé pour ça, à part pour juste faire des disques de couleur, est encore d'aller chercher dans les symboles Unicode de polices raisonnablement bien faites (notamment la police Symbola de George Douros, et la police DejaVu Sans). Je suis conscient qu'il y a plein de problèmes, mais les contraintes sont difficiles. Par exemple, c'est triste que tout soit en noir et blanc — d'un autre côté, je ne vois pas comment faire de la couleur sans briser des symétries : j'aurais pu mettre le cœur et le carreau en rouge, mais ça me semble mauvais car ça leur donnerait un rôle apparemment spécial. Je sais aussi bien que les phases de la lune ne sont pas évidentes à distinguer, que certains dessins ont des traits trop fins ou trop épais, mais je n'ai pas mieux sous la main. Comme en plus quatre de mes dix groupes de 4 symboles sont une carte à eux tout seuls (en l'occurrence, les chiffres, les lettres latines majuscules, les lettres latines minuscules, et les sortes d'astérisques), il fallait que ces symboles soient relativement « neutres » pour que la présence de quatre d'entre eux sur une carte ne détonne pas trop. On m'a suggéré d'aller fouiller dans openclipart, mais c'est un tel capharnaüm que je n'y trouve rien du tout. J'ai aussi vaguement regardé les hiéroglyphes (j'ai une police hiéroglyphique assez complète), et les idéogrammes chinois, mais je n'en ai pas trouvé qui me plaisent vraiment.

(Je précise par ailleurs que le cadre aux bords arrondis que j'ai mis autour de chaque carte ne serait pas destiné à être imprimé au final, sauf pour le dos commun. J'envisage des cartes de 63.5mm×88.9mm, et la limite extérieure de ce bord dessiné correspond à la tolérance intérieure extrême sur la découpe.)

L'étape suivante, ce sera de faire un jeu de cartes à partir d'un hexagone généralisé (plus exactement, l'hexagone « déployé de Cayley », qui a un rapport étroit avec les octonions et qui donne 63 cartes avec chacune 3 symboles parmi 63 ; un des très rares dessins qu'on en trouve en ligne est ici), mais ce sera certainement encore plus difficile de trouver des jeux à faire avec ça.

[#] De façon surprenante (je ne m'en suis rendu compte qu'a posteriori), le groupe des symétries de la structure des 27 droites sur la surface cubique, donc le groupe de symétries de mon premier jeu avec 36 cartes, est le même que le groupe projectif orthogonal de dimension 5 sur le corps à 3 éléments, donc celui avec 40 cartes que je présente dans cette entrée. Pour plus de précisions, voir page [26] de l'ATLAS des groupes finis.

[#2] Bon, à vrai dire, je ne suis pas complètement sûr si c'est la construction expliquée ci-dessus ou son dual. Je crois que les cartes sont les points de la quadrique et que les symboles sont les droites dessus, mais c'est peut-être l'inverse — parce que la manière dont j'ai fait les choses, c'est de prendre le programme Gap, considérer le groupe de symétries que je voulais, lister ses sous-groupes maximaux à conjugaison près, et choisir l'une des deux classes d'indice 40 qui me semblait la plus satisfaisante pour des raisons esthétiques, et ce n'est qu'après coup que j'ai cherché à identifier à quel quadrangle j'avais affaire.

[#3] Les dix blocs ne jouent eux-mêmes pas tous le même rôle : quatre d'entre eux apparaissent en bloc sur une carte (en l'occurrence, les chiffres, les lettres latines majuscules, les lettres latines minuscules, et les sortes d'astérisques), les six autres non. Toutes les combinaisons entre disque-de-couleur et couleur-de-carte sont réalisées (bien sûr de façon unique), ainsi que toutes les combinaisons entre phase de la lune et symbole astrologique de saison, ou encore entre caducée-couronne-gemme-tête-de-mort et animal. En fait, techniquement, le stabilisateur (dans le groupe de toutes les symétries du quadrangle) de mon système de 10 blocs de 4 est un produit direct entre un groupe diédral du carré et un groupe symétrique sur 4 objets.

(mercredi)

Le jeu de cartes Dobble et la géométrie projective expliquée aux enfants

[Arrangement des cartes de Dobble]J'avais déjà entendu parler du jeu de cartes Dobble (appelé Spot it! aux États-Unis). Il s'agit d'un jeu de 55 cartes circulaires (logiquement il devrait y en avoir 57, mais il en manque deux pour une raison que seul l'éditeur du jeu connaît), chacune portant 8 symboles différents parmi 57 symboles possibles (un peu façon émojis : cœur, clé, cadenas, flocon de neige, sens interdit, coccinelle, vous voyez le genre). La propriété sur laquelle se base le jeu est que deux cartes quelconque du jeu ont toujours un et un seul symbole en commun, et le jeu est un jeu de rapidité consistant à identifier le plus rapidement possible ce symbole (selon les variantes : entre une carte qu'on a en main et une carte au sommet d'une pioche, ou quelque chose comme ça). Le jeu est assez distrayant et intéressant en ce que c'est un jeu auquel des adultes et des très jeunes enfants peuvent jouer ensemble et trouver également rigolo, ce qui n'est pas une contrainte évidente.

Mais son intérêt est également mathématique, car il s'agit d'une structure combinatoire classique et remarquable : pour les mathématiciens qui me lisent, disons brièvement qu'il s'agit du plan projectif sur le corps fini à 7 éléments (les cartes étant, disons, les points, et les symboles les droites — ou le contraire si on préfère — et le fait pour un symbole de figurer sur une carte étant la relation d'incidence). Pour les non-mathématiciens, on peut mentionner une autre propriété, duale de la précédente, qu'ont les cartes : deux symboles quelconques figurent toujours sur une et une seule carte — sauf s'il s'agit d'une des deux cartes « manquantes ». Mais le jeu n'exploite pas cette autre propriété, ce qui est vraiment dommage, parce que c'est la combinaison des deux qui rend la structure mathématiquement vraiment intéressante (voir ici par exemple). Voir aussi cet article de vulgarisation sur le site Images des mathématiques qui tente d'expliquer un peu les choses pour les non-mathématiciens. Comme son auteur (que je salue au passage si par hasard il me lit), je trouve vraiment dommage que les éditeurs n'aient pas eu de meilleure idée pour exploiter la structure combinatoire remarquable qu'ils ont concrétisée que de faire un simple jeu de rapidité (et n'utilisant qu'une seule des deux propriétés duales que j'ai mentionnées), et j'appelle à ce qu'on invente d'autres jeux amusants avec ce jeu de cartes. On pourrait par exemple jouer à choisir deux symboles (i.e. : deux joueurs en choisissent chacun un, le notent sur un papier, et le révèlent simultanément), et essayer de trouver le plus rapidement possible, toutes les cartes étant étalées simultanément, quelle est celle qui contient les deux symboles choisis — mais il y a certainement plus intelligent à faire.

J'avais entendu parler de Dobble, disais-je, parce que plusieurs personnes m'avaient indépendamment proposé, comme une énigme, d'imaginer comment je concevrais un tel jeu (ce qui n'est pas vraiment une énigme, parce que pour un matheux un peu algébriste, un peu géomètre et/ou un peu combinatoricien, la structure d'un plan projectif sur un corps fini est tellement naturelle que j'avais donné la réponse avant d'avoir compris la question). Toujours est-il que je n'avais pas vu les cartes ni retenu le nom. Mais ce week-end, en passant chez des amis à Lyon, j'ai vu le jeu en question. (Il s'agit, d'ailleurs, des mêmes amis qui m'avaient fait découvrir le jeu de Set, un autre jeu de cartes basé sur une géométrie finie — en l'occurrence l'espace affine de dimension 4 sur le corps à 3 éléments.)

Et il y a assurément quelque chose de fascinant pour un matheux (surtout fasciné par les jolies structures combinatoires) d'avoir un plan projectif fini entre les mains. Ceci permet d'expliquer de façon visuelle et interactive comment fonctionne la géométrie projective finie bien mieux que je ne saurais le faire avec un tableau. Avec toutes sortes de questions qui se soulèvent naturellement, par exemple : comment trouver, le plus efficacement possible, quelles sont les deux cartes manquantes ? (imaginons que j'aie un jeu complet de 57 cartes, avec un ensemble de symboles inconnu a priori, et que j'en retire deux au hasard, comment trouver le plus rapidement l'ensemble des symboles de ces deux cartes retirées ?). Et comment disposer efficacement les cartes pour exhiber la structure géométrique ? Sur la photo ci-dessus, même si elle n'est pas terrible, on voit un tel arrangement possible : le carré 7×7 principal (celui où il manque une carte dans le coin en bas à gauche) a la propriété que chaque ligne de cartes a un symbole en commun, chaque colonne en a un, mais aussi chaque diagonale (prolongée cycliquement), chaque antidiagonale, et en fait, les diagonales de pas quelconques (cherchez les cartes ayant un cactus, par exemple) — un matheux dira qu'il s'agit du plan affine sur le corps à 7 éléments, et les cartes restantes (où il en manque aussi une) sont la droite à l'infini. Avec cette disposition, il n'est pas difficile de trouver quels sont les symboles des deux cartes manquantes ; reste que c'est un chouïa fastidieux d'y parvenir. Je me suis aussi amusé à calculer la disposition (duale) des symboles, ce qui permet de faire des petits tours de magie, du genre : choisis une carte, ne me la montre pas, dis-moi deux symboles qu'elle porte, et je te dirai quels sont les autres.

Je me serais précipité pour acheter le jeu s'il n'y avait pas ce gag des deux cartes manquantes, ce qui pour un obsessif-compulsif comme moi est aussi frustrant que l'idée d'avoir un beau rayonnage de livres tous identiques sauf un qui dépasserait les autres de 1cm. (Il existe aussi un Dobble Kids, dont les images laissent suggérer qu'il doit être basé sur un plan projectif d'ordre 5 au lieu de 7, et au lieu d'avoir les 31 cartes qu'il est alors censé avoir, les descriptions que je lis çà et là suggèrent qu'il n'en a que 30 — décidément, cet éditeur cherche à tuer les mathématiciens obsessifs.) Je pourrais aussi concevoir et faire imprimer mes propres cartes. (Je ne sais pas ce que valent les sites Web qui proposent l'impression de cartes personnalisées, mais je tombe par exemple sur celui-ci, qui proposent des tarifs raisonnables, même s'ils le deviendront certainement moins après frais de port depuis les États-Unis — je ne trouve pas grand-chose basé en France ou en Europe, et le problème c'est que les jeux de cartes personnalisés font référence à la personnalisation des dos, pas des faces.) En revanche, si je fais ça, je passerai sans doute une éternité à me torturer sur la manière la plus logique, symétrique et élégante de choisir les symboles et de les disposer sur les cartes (dans le cas de Dobble, c'est visiblement fait au hasard, y compris pour la forme et l'orientation, ce qui participe justement à la difficulté du jeu).

On pourrait aussi chercher à faire des jeux de cartes avec d'autres structures mathématiques (après tout, un plan projectif, c'est un immeuble de Bruhat-Tits classique sphérique de type A₂ : je peux regarder par exemple le type B₂ [ajout : voir l'entrée suivante], et ainsi fabriquer un jeu de 40 cartes avec 4 symboles parmi 40 sur chacune, telles que deux cartes aient toujours au plus un symbole en commun, et que si un symbole ne figure pas sur une carte donnée, alors il existe exactement une autre carte ayant ce symbole et ayant un symbole en commun avec la carte donnée). Mais bon, avant de trouver un jeu à faire avec une structure plus compliquée, il serait déjà intéressant d'en trouver avec les plans projectifs.

(samedi)

Séparation mentale des langues : un exemple

Je mentionnais récemment la difficulté à apprendre au cerveau à séparer les langues étrangères, et spécifiquement l'exemple, dans mon cas, du néerlandais et du suédois. Complètement par hasard, je suis tombé sur un exemple intéressant sous la forme de ce court-métrage (fiche ici sur IMDB), que j'avais bookmarké et que j'ai regardé pour passer le temps pendant qu'il fait trop chaud pour sortir.

Le court-métrage en lui-même n'est pas franchement intéressant, la seule chose qui fait que je le mentionne[#], c'est qu'il est en néerlandais, en suédois et en anglais (mais bon, comme il doit y avoir 15 répliques en tout, ça fait environ 5 répliques dans chaque langue, ce n'est pas énorme). Le truc, c'est qu'en regardant juste le titre donné par YouTube (vattnet, c'est du suédois, et water, j'ai compris ça — à raison — comme la traduction anglaise du titre, mais je n'ai pas spécialement pensé que c'était aussi du néerlandais), je m'attendais à ce que ce soit en suédois, avec pour raison de plus que le premier personnage qu'on voit (et qui est en fait néerlandais) a un drapeau suédois dans sa chambre. Du coup j'ai cherché à comprendre les premières répliques comme du suédois, et j'étais surpris de ne comprendre absolument rien, même avec les sous-titres. Puis un personnage suédois apparaît, et demande vem är du? (qui es-tu ?) à l'autre, et là j'ai évidemment compris, mais le néerlandais répond I don't understand, et là j'ai saisi que c'était de l'anglais, mais j'étais totalement embrouillé quant à la raison pour laquelle il prétendait ne pas comprendre. Ce n'est que quand j'ai vu un panneau avec l'indication verboden toegang que mon cerveau a enfin tilté. Et ce qui est intéressant, c'est qu'à ce moment-là les répliques suivantes en néerlandais sont devenues parfaitement compréhensibles pour moi (je n'ai pas réécouté le début, mais je n'ai aucune raison de penser que les premières répliques auraient été moins bien articulées que les suivantes).

Bref, mon cerveau écoutant du néerlandais en s'attendant à entendre du suédois ne comprend rien, alors qu'avec la bonne information de la langue à comprendre, y arrive. Ça n'a rien de spécialement surprenant, mais c'était vraiment frappant. Et en quelque sorte, c'est une bonne nouvelle, parce que ça veut dire que j'ai effectivement créé deux catégories mentales bien distinctes, pour le néerlandais et le suédois (après, peut-être que ce court-métrage m'a totalement embrouillé et que c'était une grave erreur que de le regarder…).

J'avais eu un exemple vaguement semblable, mais moins frappant, en tombant par hasard à la télé sur une série historique diffusée sur Arte sur la guerre prusso-danoise de 1864, série qui était à moitié en allemand et à moitié en danois : n'ayant pas regardé le résumé, je n'en avais aucune idée, et ayant d'abord entendu et compris de l'allemand, j'ai été très surpris ensuite d'entendre du danois et de n'y comprendre absolument rien, alors que je pensais que c'était encore de l'allemand, prononcé avec un accent à couper au couteau. Certes, il est assez normal que je ne comprenne pas le danois, mais une fois que j'ai lu le résumé, appris qu'il s'agissait de danois, et mis les sous-titres, j'ai au moins pu comprendre un certain nombre de phrases simples. • Encore un autre exemple est fourni par cette musique (que j'aime d'ailleurs énormément sur le plan musical, mais c'est parce que j'ai notoirement des goûts de chiottes) : je pensais que les paroles étaient dans une langue inventée[#2]. Et après l'avoir écouté je ne sais combien de fois[#3], mon cerveau a capté du kan om du vil, ce qui est du bon suédois (tu peux si tu veux) ; après, en fait, il s'avère que ce n'est pas du suédois, c'est du norvégien (bokmål), mais on voit l'idée. Ceci étant, les paroles des chansons, en général, même quand c'est dans une langue que je comprends parfaitement, je n'y capte rien du tout, et je ne suis pas le seul apparemment. Bref.

[Note pour moi-même : il y a deux choses qui me viennent à l'esprit au sujet de l'apprentissage des langues et qu'il faut que je raconte dans des entrées ultérieures : la difficulté à se créer une catégorie mentale pour un phonème (même si on arrive parfaitement bien à le prononcer et à le reconnaître prononcé, ce qui sont des choses différentes), et la difficulté à se former une mémoire automatique pour appliquer les sortes de fonctions booléennes qui sont utilisées par les règles grammaticales.]

[#] Et que je ne le recommanderais qu'à quelqu'un qui est dans la même situation que moi, i.e., qui comprend juste un petit peu le néerlandais et le suédois, chose qui n'est probablement pas très fréquente parmi les lecteurs de blogs en français, donc je serais, en vérité, un peu surpris d'apprendre que j'ai ne serait-ce qu'un lecteur dans ce cas.

[#2] Ce n'est pas rare !, s'agissant de ce genre de musique. Je l'ai appris après avoir vainement cherché à comprendre le « latin » de Conquest of Paradise de Vangelis.

[#3] Dans une autre version que celle vers laquelle je pointe sur YouTube, bien sûr : si j'avais vu les paroles écrites, bien sûr, je n'aurais pas eu de mal à comprendre.

(mardi)

Une conversation entre Ruth Bader Ginsburg et la Baronne Hale de Richmond

Je parlais dans l'entrée précédente de la chambre des Lords et de sa réforme de 1999 (consistant à en faire partir presque tous les pairs héréditaires), et j'ai brièvement mentionné une autre réforme consistant, en 2009, à en séparer la partie judiciaire (les Law Lords) qui sont devenus une nouvelle Cour suprême du Royaume-Uni. En cherchant des documentaires sur ce sujet (j'aimerais pouvoir dire que YouTube me les a intelligemment suggérés, mais non, j'ai ses recommandations basées sur ce que je regarde sont décidément merdiques, et j'ai dû chercher moi-même), je suis tombé sur quelques vidéos qui m'ont intéressé et qui pourraient plaire à mes lecteurs ayant quelques heures à perdre. Voici un documentaire de la BBC sur cette nouvelle Cour suprême du Royaume-Uni, qui est intéressant (au-delà du cadre spécifiquement britannique) dans la manière dont les juges racontent la façon dont ils conçoivent leur rôle, leur indépendance, leur façon de travailler (je peux me tromper, mais j'ai l'impression que les juges français, qu'ils soient judiciaires, administratifs ou constitutionnels, sont rarement aussi diserts). Mais surtout, cette conversation (débat n'étant sans doute pas le bon mot) entre Ruth Bader Ginsburg, qui siège à la Cour Suprême des États-Unis, et la Baronne Hale de Richmond, qui siège à la Cour Suprême du Royaume-Uni (au moment de cette discussion, à la chambre des Lords dans sa fonction judiciaire) et qu'on voit d'ailleurs dans le documentaire précédemment mentionné. Il y est question de toutes sortes de choses, notamment de la différence entre les États-Unis et le Royaume-Uni dans l'approche du rôle de la fonction judiciaire, de la sélection des juges et de leur indépendance[#], mais aussi du sexisme qu'elles ont pu subir, et de pas mal de petites anecdotes amusantes (comme la raison pour laquelle Brenda Hale est devenue la baronne Hale of Richmond). Les oratrices sont toutes les deux extraordinaires, et très amusantes à écouter. Je suis aussi tombé sur cet exposé de la même baronne Hale sur la Convention européenne des Droits de l'Homme, l'interprétation de plus en plus large qu'en fait — et on sait que ça ne plaît pas à tout le monde au Royaume-Uni — la Cour qui siège à Strasbourg, et les limites que peut avoir cette extension (et aussi les difficultés pour les juges britanniques de suivre et de prévoir l'interprétation que fera la Cour européenne des Droits de l'Homme).

Ajout () : Parmi les anecdotes racontées dans une de ces vidéos (je ne sais plus laquelle), il y a le fait que la baronne Hale, qui est, ainsi que tous ses collègues nommés avant la création de la Cour Suprême du Royaume-Uni, membre de la chambre des Lords, même si elle n'a pas le droit d'y siéger effectivement avant de prendre sa retraite en tant que juge, n'a pas le droit de vote (pour la chambre des Communes). L'un de ses collègues, dans la même situation, trouve que c'est particulièrement injuste que son métier de juge (in fine) le prive du droit de vote, et envisage de déposer un recours contre le Royaume-Uni devant la Cour européenne des Droits de l'Homme. Ce qui soulève une subtilité juridique amusante : avant de pouvoir faire ce recours, il doit avoir épuisé toutes ses voies de recours internes, ce qui signifie en particulier, devant la Cour Suprême du Royaume-Uni, où la majorité de ses collègues est dans précisément cette situation ! — comment une cour peut-elle statuer impartialement lorsqu'il s'agit précisément de décider si le traitement des juges de cette cour est contraire aux droits de l'Homme ?

[#] J'ai beaucoup aimé la remarque suivante : quand on a retiré au Lord Haut Chancelier de Grande-Bretagne, et qui est, de fait, le ministre de la Justice du Royaume-Uni, ses fonctions judiciaires (en même temps que ses fonctions législatives de président de la chambre des Lords), il y a eu deux points de vue différents : l'un consistant à dire que c'était un progrès pour l'indépendance judiciaire (c'était bien le but de la réforme), mais un autre consistant à dire que c'était une attaque contre l'indépendance judiciaire, puisque cela voulait dire que les juges n'auraient plus l'un des leurs au sein du gouvernement pour faire valoir leur point de vue.

(dimanche)

Quelques réflexions à 0.02¤ sur les traditions du Royaume-Uni (et la chambre des Lords)

Peut-être parce que je suis citoyen d'une ancienne colonie du Royaume-Uni qui en partage encore le souverain et qui en a imité une partie du cérémonial constitutionnel, j'ai une certaine fascination pour les institutions et traditions du pays qui peut se targuer d'avoir, entre autres choses, la plus vieille monnaie du monde, et probablement les plus anciennes lois encore en vigueur. Ou peut-être au contraire est-ce parce que je suis aussi citoyen d'un autre pays qui a coupé la tête à son roi et qui ne semble jamais s'en être complètement remis (et donc regarde avec envie outre-manche ces gens qui n'ont jamais eu de constitution écrite pendant que la France en a changé tous les quinze ans en moyenne depuis sa première révolution). Ou peut-être encore est-ce parce qu'à force de croiser sur Internet des citoyens des États-Unis d'Amérique si fiers d'appartenir à la plus ancienne démocratie du monde il est amusant de leur rappeler que le pays dont ils ont fait sécession avait fait sa dernière révolution quelque chose comme 88 ans avant la leur, et intéressant de leur demander depuis combien de temps, au juste, le Royaume-Uni est une « démocratie », parce que l'impossibilité de répondre à cette question illustre bien la difficulté à définir ce que signifie, au juste, la plus ancienne démocratie du monde. Ou peut-être est-ce juste que je suis un traditionaliste qui s'assume mal — à part le Saint-Siège, il n'y a vraiment que le Royaume-Uni qui peut se targuer d'une telle continuité dans ses institutions.

Mais cette dernière question, depuis quand le Royaume-Uni est-il une démocratie ?, est intéressante, parce qu'à chaque fois qu'on pose ce genre de questions s'agissant de ce pays, la réponse est toujours la même : c'est impossible de savoir exactement parce que les choses ont évolué lentement. Il est aussi difficile de dire, par exemple, à quel moment la peine capitale a été abolie au Royaume-Uni (la réponse la plus correcte semble être 1998, mais on conviendra que vu que la dernière exécution remonte, en fait, à 1964, cette date se défend aussi). Il est impossible de dire qui était le premier Premier ministre du Royaume-Uni (ou, si ça devait être avant 1707, d'Angleterre), et d'ailleurs on ne sait même pas au juste quand le terme de Premier ministre est apparu.

C'est entre autres pour ça que je suis persuadé que le Royaume-Uni, s'il devait un jour abolir la royauté, ne le ferait pas comme le font les autres pays qui font ce genre de choses (c'est-à-dire en changeant de régime), mais au contraire en gardant l'illusion de la continuité. Car les fictions juridiques, et notamment celle de la continuité, sont une clé de la tradition historique et juridique de ce pays : on n'abolit pas les choses, on les vide de leur substance pour mettre quelque chose d'autre à la place, souvent en maintenant la fiction que ces nouvelles choses sont faites par délégation pour la première. C'est ainsi que le souverain a perdu ses pouvoirs en maintenant l'illusion de les avoir encore[#] : ils ont été transférés au Premier ministre, sur le conseil duquel le souverain agit en matière constitutionnelle. Et si on devait abolir complètement la royauté, on le ferait sans doute sans abolir la couronne et sans renommer le royaume en république, mais en déclarant simplement le trône vacant et en élisant un régent qui serait de fait président et chef d'État mais de droit remplaçant d'un monarque désormais inexistant. D'ailleurs, je retrouve exactement cette idée chez un auteur de science-fiction éminemment anglais :

President: full title President of the Imperial Galactic Government. The term Imperial is kept though it is now an anachronism. The hereditary Emperor is nearly dead and has been so for many centuries. In the last moments of his dying coma he was locked in a statis field which keeps him in a state of perpetual unchangingness. All his heirs are now long dead, and this means that without any drastic political upheaval, power has simply and effectively moved a rung or two down the ladder, and is now seen to be vested in a body which used to act simply as advisers to the Emperor — an elected Governmental assembly headed by a President elected by that assembly.

— Douglas Adams, The Hitchhiker's Guide to the Galaxy (chap. 4)

Mais ce dont je veux surtout parler ici, c'est de la chambre des Lords. Parce que s'il y a d'autres pays européens qui sont des monarchies cérémoniales, la chambre des Lords est une institution vraiment remarquable par son archaïsme. Jusqu'en 1999(!), il y avait encore quelque 800 personnes, les pairs héréditaires du Royaume-Uni, qui avaient le droit de siéger à la chambre haute du parlement britannique du simple fait d'avoir hérité un titre de noblesse. (Je dis environ 800 personnes, mais je il doit s'agir d'essentiellement 800 hommes, parce que, normalement, les titres de nobless héréditaires au Royaume-Uni s'héritent par primogéniture mâle[#2].) Ces pairs héréditaires, même s'ils étaient loin de 800 à siéger en pratique, formaient ainsi la majorité d'une chambre non entièrement dénuée de pouvoirs (là aussi, les choses ont évolué progressivement : depuis 1949, la chambre des Lords ne peut que[#3] retarder d'un an le passage d'une loi, mais c'est un pouvoir relativement comparable au Sénat français, le verrou constitutionnel en moins), et c'est bien parce qu'ils faisaient de l'obstruction parlementaire que Tony Blair a décidé de réformer cette chambre haute.

Depuis 1999, donc, les choses ont évolué : les pairs héréditaires n'ont conservé le droit[#4] qu'à 92 représentants à la chambre des Lords (90 élus à vie par leurs pairs de plusieurs façons différentes dans une élection compliquée, et toujours 2 — le Lord Grand Chambellan et le Comte Maréchal — qui sont spécialement exemptés d'élection ex officio et continuent donc à être là par droit héréditaire) ; la majorité est maintenant constituée de pairs à vie (c'est-à-dire, non-héréditaires), nommés par le souverain sur le conseil du Premier ministre (donc, en pratique, par le gouvernement). Mais il y a de tout dans cette chambre hétéroclite : il y a 26 évêques (dont les 2 archevêques) de l'Église Établie, i.e., l'Église anglicane, à savoir les archevêques de de Cantorbéry et York et les évêques de Londres, Durham et Winchester, ainsi que les 21 autres premiers évêques par ordre de séniorité, qui siègent aussi parmi les Lords (notons qu'en pratique, ces gens sont également nommés par le gouvernement). Et jusqu'à 2009 (lorsqu'a été créée la Cour suprême du Royaume-Uni) siégeaient aussi des juges : parce que cette chambre haute de la législature cumulait aussi des fonctions judiciaires (même si, en pratique, elles étaient complètement séparées — seuls les juges participaient aux fonctions judiciaires, et ils ne participaient aux fonctions législatives qu'à partir de leur retraite) ; et c'est ce déplaisant mélange des genres (et notamment la confusion particulière entretenue par Lord [Haut] Chancelier, membre à la fois du gouvernement, de la chambre des Lords et de sa section judiciaire) qui a poussé en 2009 à la suppression des fonctions judiciaires de la chambre des Lords et à la réforme de celles du Lord Chancelier (la Cour européenne des Droits de l'Homme étant assez sourcilleuse quant à la séparation des pouvoirs).

À la contemplation de ce dernier exemple, on comprend aisément que les traditions multiséculaires anglaises ou britanniques ne cadrent pas toujours parfaitement avec les principes du droit européen, et que cela peut causer une certaine tension. S'agissant du droit héréditaire patrilinéaire d'être représenté spécialement au parlement, c'est un peu un euphémisme de dire que ça pose un problème vis-à-vis de l'égalité entre citoyens consignée dans les différents textes de droits de l'homme. Même s'il y a évidemment d'autres considérations (économiques, politiques, pour ne pas dire démagogiques) qui interviennent, la volonté de l'actuel Gouvernement de Sa Majesté de réformer l'Union européenne ou d'en sortir, mais aussi la volonté, peut-être moins connue, de supprimer la loi qui oblige les cours de justice britanniques, dans la mesure où c'est logiquement possible, à interpréter les lois de façon à les rendre conformes à la Convention européenne des Droits de l'Homme et aux arrêts de la Cour qui en dit le sens, relèvent manifestement de ce conflit. (Les décisions précises de la Cour qui sont probablement le plus critiquées par ce Gouvernement, comme Chahal c. Royaume-Uni ou surtout Vinter et autres c. Royaume-Uni, ne peuvent pas vraiment être considérées comme des conflits concernernat des institutions ou des traditions anciennes du Royaume-Uni, mais la question sous-jacente de savoir qui a vraiment la souveraineté est indiscutablement présente dans la tension qu'elles soulèvent.)

Mais je reviens sur quelque chose : j'ai remarqué ci-dessus que le pouvoir de la chambre des Lords était faible (sur le papier). Le pouvoir du souverain est peut-être encore plus faible (là, le problème est justement qu'il n'y a pas de papier sur lequel la Constitution anglaise soit écrite, donc on ne sait pas exactement quels sont les pouvoirs qui restent au souverain — mais on se doute qu'ils doivent être bien minces). Mais il faut souligner que même un pouvoir cérémonial est une forme de pouvoir. Par cela je veux dire que par exemple si le seul pouvoir qui reste au grand mamamouchi est de nommer des délégués-mamamouchis qui n'ont eux-mêmes aucun pouvoir, il se peut qu'il y ait quand même assez de gens intéressés par le titre de délégué-mamamouchi pour que cela donne un pouvoir réel, par influence, au grand mamamouchi. Et le simple fait d'avoir le titre officiel de grand mamamouchi peut donner à celui qui le porte un poids (le terme anglais que je cherche est : clout) que n'a pas l'individu lambda. (Il est d'ailleurs arguäble qu'une bonne partie des pouvoirs du président de la République française viennent non pas de ce que la Constitution lui réserve directement, mais des postes auxquels il peut nommer, ou simplement du fait qu'il a de l'influence parce les gens se disent qu'il doit logiquement être le chef.) Définir quel est, au juste, le pouvoir du souverain du Royaume-Uni est donc extrêmement difficile, et ce l'est quasiment autant pour la chambre des Lords.

Mais voici une autre question difficile : quel devrait être son pouvoir ? À quoi sert, au juste, la chambre haute du parlement, qui représente-t-elle, et comment devrait-elle être choisie ? La chambre des Lords, bien sûr, est une bizarrerie historique comme il convient à l'ancêtre de tous les parlements, et non-démocratique. Le Sénat des États-Unis a montré la voie d'une réponse possible : représenter les entités fédérées dans le cadre d'un état fédéral — voie qui a été suivie, entre autres, par le Reichsrat/Bundesrat allemand ou le Conseil de l'Union européenne[#5], ou encore le Sénat australien (mais pas vraiment, par exemple, le Sénat canadien). Mais à part dans ce cas-là, personne n'a vraiment de réponse à la question[#6]. Peut-être devrait-on s'en débarrasser complètement ?

À ce sujet, il est sans doute pertinent de réexaminer une très célèbre citation de Churchill (que j'ai déjà évoquée), et surtout, de se rappeler dans quel contexte elle a été prononcée. La citation est : No one pretends that democracy is perfect or all-wise. Indeed, it has been said that democracy is the worst form of government except all those other forms that have been tried from time to time. Elle a été prononcée le 11 novembre 1947 (Churchill était alors chef de l'opposition conservatrice au gouvernement travailliste de Clement Attlee) lors du débat sur ce qui allait devenir le Parliament Act 1949 dont le contenu essentiel est de limiter le pouvoir de blocage dont dispose la chambre des Lords (laquelle avait déjà perdu le pouvoir de rejeter totalement une loi par le Parliament Act 1911). L'argumentaire de Churchill (avec lequel je ne prétends pas forcément être d'accord, surtout s'il s'agit de proposer la chambre des Lords comme contre-pouvoir plutôt que, disons, des juges[#7], mais qui est néanmoins intéressant) consiste à défendre l'idée qu'il est utile que la chambre basse et le gouvernement, censés refléter la volonté immédiate de l'opinion publique, disposent de contre-pouvoirs efficaces, qui puissent l'obliger au moins à réfléchir à deux fois même si dans une démocratie le peuple souverain finit par avoir le dernier mot. Voici quelques extraits tirés du compte-rendu intégral des débats :

No Government in time of peace has ever had such arbitrary power over the lives and actions of the British people, and no Government has ever failed more completely to meet their daily practical needs. Yet the right hon. Gentleman and his colleagues are avid for more power. No Government has ever combined so passionate a lust for power with such incurable impotence in its exercise.

The whole history of this country shows a British instinct — and, I think I may say, a genius — for the division of power. The American Constitution, with its checks and counterchecks, combined with its frequent appeals to the people, embodied much of the ancient wisdom of this island. Of course, there must be proper executive power to any Government, but our British, our English idea, in a special sense, has always been a system of balanced rights and divided authority, with many other persons and organised bodies having to be considered besides the Government of the day and the officials they employ. This essential British wisdom is expressed in many foreign Constitutions which followed our Parliamentary system, outside the totalitarian zone, but never was it so necessary as in a country which has no written Constitution.

The right hon. Gentleman spoke about Parliament, about the rights of Parliament, which I shall certainly not fail to defend. But it is not Parliament that should rule; it is the people who should rule through Parliament. That is the mistake he made, an important omission. […]

The object of the Parliament Act [of 1911], and the spirit of that Act, were to give effect, not to spasmodic emotions of the electorate, but to the settled, persistent will of the people. […]

All this idea of a group of super men and super-planners, such as we see before us, “playing the angel,” as the French call it, and making the masses of the people do what they think is good for them, without any check or correction, is a violation of democracy. Many forms of Government have been tried, and will be tried in this world of sin and woe. No one pretends that democracy is perfect or all-wise. Indeed, it has been said that democracy is the worst form of Government except all those other forms that have been tried from time to time; but there is the broad feeling in our country that the people should rule, continuously rule, and that public opinion, expressed by all constitutional means, should shape, guide, and control the actions of Ministers who are their servants and not their masters.

Churchill défend ensuite l'idée (et là, je ne suis vraiment pas d'accord avec lui, parce que je trouve qu'il est franchement de mauvaise foi, mais c'est néanmoins toujours intéressant à lire) que cette seconde chambre devrait être conservatrice par nature, en la comparant à un frein :

However, it is argued that the present Second Chamber is a biased and unrepresentative body; that it does not act evenly between the two sides or parties in the State. Let me just look into that dispassionately. There is, of course, a difference between the two sides in our political life. Temperament, conditions, upbringing, fortunes, interests, environment decide for every individual in a free country which side he will take. One side claims to be the party of progress, as if progress was bound to be right, no matter in what direction. The other side emphasises stability, which is also very important in this changing world. But no one would rest content with that. This is an unreal and far too narrow a dichotomy. I heard that word 40 years ago as a debating rejoinder from Mr. Asquith. I went home and looked it up in the dictionary, and I do not think that it has been used in this House until now. Both progress and stability are needed to make a happy country. But the right hon. Gentleman complains that the present Second Chamber has, from its composition, an undue bias in favour of stability.

Well, Mr. Speaker, if you have a motor car — and I believe some are still allowed — you have to have a brake. There ought to be a brake. A brake, in its essence, is one-sided; it prevents an accident through going too fast. It was not intended to prevent accidents through going too slow. For that you must look elsewhere, to another part of the vehicle; you must look to the engine and, of course, to the petrol supply. For that there is the renewed impulse. To prevent your going too slow you must look to the renewed impulse of the people's will; but it is by the force of the engine, occasionally regulated by the brake, that the steady progress of the nation and of society is maintained, and tens of millions of humble people are given steady conditions in which they can live their lives and make all their plans for their homes, their families and for bringing up their children, and have a chance of bettering themselves, and, at the same time, forwarding the cause of the whole community.

S'ensuit une attaque assez amusante contre le gouvernement qui préfère limiter les pouvoirs de la chambre de Lords plutôt que de changer sa composition, ou se livrer à une réflexion plus profonde sur ce qu'elle devrait être :

I must say that the Government themselves seem to be a little more reconciled to it than they used to be, judging by the number of Socialist hereditary nobles who are being created. If they do not like the character of the brake, why do they not propose the reform of the Second Chamber? We are quite ready to confer with them and to help them in such a task. As the Socialist Government now stand, they maintain the hereditary principle. The hereditary Chamber is to have one year's suspensory veto but not two. One year's suspensory veto by a hereditary assembly is the true blue of Socialist democracy; two years is class tyranny. One is astonished that the human mind can be constrained into such silly postures.

Toujours est-il que cette réforme a finalement été faite, par un autre gouvernement travailliste, celui de Tony Blair. Je suis tombé sur cette vidéo (le documentaire The Lords' Tale de Molly Dineen), qui raconte de façon étonnamment intéressante comment les personnes concernées par cette réforme, c'est-à-dire les pairs héréditaires qui siégeaient à la chambre des Lords avant d'en être retirés, ont vécu ce changement. Précisons bien : personne ne contestait sérieusement qu'il fût devenu totalement absurde et anachronique (en 1999) que des gens aient le droit de siéger au parlement du simple fait de leur naissance. Le débat porte plutôt sur la manière dont ces membres devraient être remplacés, et sur la nécessité d'une réflexion approfondie sur ce que pourrait être une chambre censée servir de contre-pouvoir au gouvernement, réflexion qui n'a pas vraiment plus eu lieu en 1999 que cinquante ans auparavant.

J'apprends au hasard de ce documentaire que Bertrand Russell était de la noblesse héréditaire anglaise, et j'ai un peu honte vu qu'il s'agit de quelqu'un pour qui j'ai énormément d'admiration (comme philosophe, mathématicien, et militant de plusieurs causes que j'apprécie). Son grand-père (qui a été plusieurs fois Premier ministre et descend d'une famille déjà célèbre plusieurs siècles plus tôt) a été créé comte Russell en 1860 par la reine Victoria, et a effectivement siégé à la chambre des Lords. Bertrand lui-même a hérité du titre en 1931 à la mort de son frère, il a notamment prononcé un discours devant la chambre des Lords le 28 novembre 1945 sur la nécessité de contrôler internationalement l'armement atomique. Son fils à lui, Conrad Russell, historien spécialiste du 17e siècle, devenu à son tour (cinquième) comte Russell en 1987, a été le premier parlementaire libéral-démocrate du Royaume-Uni, dès la création de ce parti, et il intervient à plusieurs reprises dans le documentaire dont je parle. Il a été un des 90 pairs héréditaires élus à conserver leur siège à la chambre des Lords suite à la réforme de 1999 — ce qui est un peu ironique vu qu'il était parmi les premiers à proposer la suppression de cette chambre pour la remplacer par un Sénat élu. (Sa nécrologie, publiée par le Guardian, est ici.) Ses deux fils qui ont successivement hérité le titre de comte Russell (les numéros pairs semblent porter malheur, dans cette famille) se sont aussi engagés en politique (côté travailliste pour le 6e comte Russell, et côté libéral-démocrate pour le 7e, celui qui est encore vivant), mais n'ont pas siégé chez les Lords.

[#] Un des symboles de ce phénomène est, d'ailleurs, le fait que l'État, dans les royaumes du Commonwealth, s'appelle la Couronne. Cela cause une certaine confusion, mais la Couronne, c'est tout simplement la personnalité juridique du Royaume-Uni (resp. du Canada, resp. de l'Australie, etc.), le souverain n'en est que le symbole. Il ne faut pas confondre, d'ailleurs, avec le Crown Estate, ou états de la Couronne, qui est un portefeuille de propriétés essentiellement foncières dont on maintient la fiction juridique qu'elles appartiennent au souverain et que, depuis George III, en chaque début de règne, celui-ci en délègue la charge, la gestion, et l'usufruit, à, euh, à la Couronne justement, à travers le parlement. (Il y a aussi des choses que le souverain possède en propre, comme le château de Balmoral.) C'est expliqué par CGP Grey dans cette vidéo, mais, contrairement à son habitude, je trouve qu'il a été un peu imprécis (notamment en n'expliquant pas cette distinction entre la propriété personnelle du souverain, le Crown Estate, et la Couronne).

[#2] Les règles de chaque titre sont définies par les lettres patentes l'ayant créé, sauf s'il est très ancien, mais le mécanisme normal est que seuls les fils peuvent hériter, par ordre de primogéniture ; s'il y a un unique enfant vivant et que c'est une fille, elle pourra hériter aussi, mais s'il y a plusieurs filles et pas de fils (vivants), le titre tombe en abeyance (c'est un mot normand, donc on devrait dire abéance, je suppose, mais personne n'a l'air de l'utiliser), c'est-à-dire qu'il est partagé entre toutes les héritières, mais aucune ne peut le porter (et, du coup, siéger à la chambre des Lords). Je ne suis pas certain d'avoir tout compris (encore moins ce qui se passe si le titre est ainsi partagé entre deux sœurs, et que l'une meurt avec une fille et l'autre avec un fils).

[#3] Il y a cependant quelques pouvoirs qu'a la chambre des Lords dans le cadre de l'Union européenne, et qui valent sans doute la peine d'être mentionnés puisque j'évoque les relations bizarres entre les traditions anglaises et le droit européen (tiens, saviez-vous que la reine d'Angleterre avait le droit de voter aux élections européennes ?, mais qu'elle ne le fait pas parce que la tradition veut qu'elle ne vote pas). Notamment, dans le cadre de ce qu'on appelle le mécanisme de contrôle de subsidiarité (et informellement, les cartons jaunes et orange), l'article 6 du protocole nº2 permet à tout parlement national ou toute chambre de l'un de ces parlements de saisir la Commission lorsqu'il ou elle considère qu'un projet n'est pas conforme au principe de subsidiarité ; il y a un système un peu compliqué pour attribuer les cartons « jaunes » et « orange », mais pour résumer disons qu'on compte le nombre de chambres qui demandent le réexamen (en comptant pour doubles les parlements unicaméraux). Du coup, dans cette procédure (dont il faut admettre qu'elle est assez anecdotique), la chambre des Lords du Royaume-Uni, avec ses 92 membres héréditaires et ses évêques de l'Église anglicane et autres bizarreries, dispose d'un pouvoir égal à la chambre des Communes.

[#4] Pour la petite anecdote, en échange de la perte de leur droit à siéger à la chambre des Lords, les pairs héréditaire du Royaume-Uni ont au moins regagné le droit de voter pour, et d'être élus à, la chambre des Communes, s'ils ne font pas partie des 92 qui restent siéger à la chambre des Lords.

[#5] Il ne faut pas confondre le Conseil (de l'Union européenne), qui est une sorte de chambre haute du parlement, avec le Conseil européen, qui est une sorte de chef d'état collégial de l'Union européenne. (Même si, dans les deux cas, les membres du Conseil viennent directement des États membres de l'Union : ministres dans un cas, chefs d'État ou de gouvernement dans l'autre.) Il ne faut pas non plus le confondre avec le Conseil de l'Europe qui est une institution séparée de l'Union européenne. Quelqu'un a vraiment dû s'amuser à inventer ces noms (sérieusement, j'aimerais savoir qui a le premier eu l'idée d'avoir un Conseil et un Conseil européen, et comment ça se fait qu'on ne lui a pas dit c'est une blague ou tu es complètement cinglé ?). Remarquez, c'est sans doute la même personne qui a décidé que la Cour de justice de l'Union européenne serait une institution tripartite, dont une des parties s'appellerait la Cour de justice (de l'Union européenne). Toujours est-il que ces subtilités devraient logiquement bien plaire aux Anglais, eux qui ont à la fois un Lord Chancellor et un Chancellor of the Exchequer : pensez à mettre en avant cet argument dans le futur referendum sur l'adhésion du Royaume-Uni à l'Union européenne, ils ont des institutions au nom tout aussi absurdement confusant que les nôtres.

[#6] Voici une proposition qui me semble intéressante, et qui ne semble pas avoir jamais été explorée (même si elle n'est pas si différente de ce que la chambre des Lords est en train de devenir) : renouveler la chambre haute par petites fractions, peut-être 1/5 à chaque fois, à la fin de chaque mandat de la chambre basse, en faisant élire les nouveaux membres par la chambre basse sortante (et de façon proportionnelle). L'idée étant de représenter à la chambre haute les différentes majorités qui se sont succédé à la chambre basse. S'il s'agit de forcer un gouvernement à réexaminer des lois, ou de ne modifier la Constitution que d'une main tremblante, représenter les majorités précédentes semble être une façon non dénuée de sens de s'y prendre. • Encore une autre idée consiste à tirer ses membres au hasard : il y a toutes sortes de gens qui trouvent que la vraie démocratie consiste à tirer les gens au hasard, comme le faisaient les anciens Grecs — ils ont peut-être raison, mais je ne crois pas que cette « vraie démocratie » soit souhaitable (et le modèle de gens qui votent pour détruire Mélos, et qui votent pour détruire Mytilène et changent d'avis le lendemain, n'est pas vraiment un modèle à suivre). L'idée du tirage au sort est cependant sans doute plus défendable dans le cas et dans le cadre d'une seconde chambre du parlement, ou d'une partie de celle-ci (même s'il y a quelque chose de délicieusement ironique à remplacer une chambre dont les membres proviennent du hasard de leur naissance par une autre dont les membres proviendraient du hasard d'un tirage au sort public).

[#7] Disons que le plus gros problème avec la (non-)constitution britannique me semble être non pas au sein du parlement, mais le principe de la souveraineté parlementaire, c'est-à-dire l'idée que le parlement peut légiférer absolument n'importe quoi et que les juges doivent s'y plier et appliquer les lois en question, aussi idiotes ou répugnantes fussent-elles. (A contrario, la Constitution des États-Unis d'Amérique et ses amendements successifs pose des limites : sur ce que le Congrès fédéral peut légiférer vis-à-vis des États fédérés, sur ce que le Congrès fédéral peut légiférer vis-à-vis des individus, et, essentiellement depuis 1925, sur ce que les législatures des États fédérés peuvent légiférer vis-à-vis des individus ; et la Cour suprême des États-Unis est, depuis qu'elle l'a elle-même décidé dans son célèbre arrêt Marbury contre Madison, la gardienne de ces limites. En vue de cette opposition, je trouve que Churchill est assez culotté de prétendre que the American Constitution, with its checks and counterchecks […], embodied much of the ancient wisdom of [Great-Britain].)

(vendredi)

Je passe plusieurs jours à paramétrer une surface cubique

Un des paradoxes de la manière dont je gère (mal !) mon temps est que quand je n'ai pas de choses importantes et urgentes qui m'occupent de façon pressante, toutes sortes de petites choses moins importantes ou moins urgentes que j'ai laissé de côté pendant d'autres périodes percolent alors à la surface, et j'ai l'impression d'être presque plus débordé. D'autant plus que le temps que prennent ces choses n'est pas forcément évident à évaluer. Ainsi l'exemple d'un calcul que j'ai commencé de façon très accessoire suite à une question d'un collègue, que je pensais pouvoir traiter assez rapidement, et qui m'a finalement obsédé pendant à peu près dix jours, à m'énerver de ne pas arriver à faire ce que je voulais et de croire N fois avoir trouvé le bon bout pour tomber en fait dans un cul-de-sac, au point que j'en ai perdu le sommeil pendant une nuit.

D'autant plus que ce n'était pas tellement le résultat du calcul qui m'intéressait, et dont je suis totalement certain qu'il est connu depuis Klein, Cayley, Clebsch ou, au pire, Segre, et qu'il figure dans quantité de livres ou d'articles, mais d'y arriver moi-même, et de façon systématique, sans essayer de « deviner » le résultat (qui, a posteriori, était éminemment devinable), bref, de vérifier que je savais mener ce calcul à bien. Apparemment, la réponse est : oui, j'y arrive, mais très difficilement (et je ne suis pas certain d'avoir été complètement systématique, au final).

Mais je crois qu'il est important pour un mathématicien, en tout cas pour un géomètre algébriste, d'essayer de faire des calculs parfois. Même, ou plutôt surtout, en utilisant un ordinateur : comme l'a écrit Knuth, Science is knowledge which we understand so well that we can teach it to a computer, et l'intérêt d'essayer d'expliquer quelque chose à un ordinateur est de vérifier qu'on le comprend soi-même bien (à défaut d'ordinateur, un étudiant neuneu peut être utile, ou un post de blog 😉). Donc, vérifier qu'on sait passer d'une incantation magique comme une surface cubique est, géométriquement, l'éclaté du plan projectif en six points en position générale (et ces 6 points, les 15 droites passant par deux d'entre eux, et les 6 coniques par cinq d'entre eux, forment les 6+15+6 = 27 droites de la surface cubique) à une suite de calculs qui donnent le paramétrage d'une surface donnée, c'est vérifier qu'on a compris l'incantation.

Bon, j'avoue, je dis ça pour essayer de me convaincre que mon calcul était difficile, or il ne l'était pas, ou du moins, il n'aurait pas dû l'être vu que j'ai passé trois quatre cinq ans à faire une thèse sur les (hyper)surfaces cubiques et que j'en ai même fait un DVD.

Bref.

Le but, si on veut, est de décrire (paramétrer) toutes les solutions rationnelles de l'équation z₁³ + z₂³ + z₃³ = 1, autrement dit, toutes les façons d'écrire 1 comme somme des cubes de trois rationnels (en fait, ce serait plutôt −1, mais ça n'a pas d'importance, il suffit de changer les signes). Pour donner un peu de contexte sur ces sortes d'équations diophantiennes, il faut que j'explique ce qui se passe pour les problèmes analogues s'agissant de la somme de deux carrés, de trois carrés, et de deux cubes.

[Figure géométrique] Je devrais donc commencer par parler des solutions rationnelles de l'équation z₁² + z₂² = 1 (les points rationnels sur le cercle unité si on considère que z₁ représente l'abscisse et z₂ l'ordonnée) et de leur paramétrage. Les solutions rationnelles de z₁² + z₂² = 1 sont données par z₁ = (1−t²)/(1+t²) et z₂ = 2t/(1+t²) pour t parcourant les rationnels (on obtient exactement toutes les solutions comme ça si on convient en outre que t=∞ donne (z₁,z₂)=(−1,0) ; la réciproque est donnée par t = z₂/(1+z₁) = (1−z₁)/z₂). Ces formules peuvent se relier aux formules donnant le cosinus et le sinus d'un angle θ en fonction de la tangente de l'angle moitié (attention !, je ne prétends pas que l'angle θ lui-même soit rationnel, ni même que sa valeur ait un intérêt quelconque dans le problème). La figure ci-contre (si votre navigateur vous la montre et que vous arrivez à la déchiffrer) est censée illustrer ce paramétrage, figure sur laquelle j'ai pris t=1/3, qui donne la solution z₁=4/5 et z₂=3/5 (on a (4/5)² + (3/5)² = 1, c'est-à-dire que le point (4/5,3/5) est sur le cercle unité, ou, si on préfère chasser les dénominateurs, 4² + 3² = 5²). Ces formules (le « paramétrage rationnel d'une conique par une droite de pente variable par un de ses points ») sont une sorte de pons asinorum de la géométrie arithmétique, et avec un tout petit peu de mauvaise foi on peut les attribuer à Pythagore ou à Euclide (dans la recherche des « triplets pythagoriciens », c'est-à-dire des solutions entières de l'équation Z₁² + Z₂² = Z₀² : le fait que le 4² + 3² = 5², c'est-à-dire que le triangle de côtés entiers 4,3,5 est rectangle, est connu depuis très longtemps, et la recherche de solutions analogues intéressait les mathématiciens dès l'antiquité). Il est donc assez naturel de se demander ce qui se passe si on change un petit peu l'équation.

La même technique que ci-dessus marche mutatis mutandis si on cherche les solutions rationnelles de z₁² + z₂² + z₃² = 1 (les points rationnels sur la sphère unité) ou même pour n'importe quel nombre de variables : on s'inspirera de la projection stéréographique de la sphère pour arriver à quelque chose comme z₁ = (1−v²−w²)/(1+v²+w²) avec z₂ = 2v/(1+v²+w²) et avec z₃ = 2w/(1+v²+w²) pour v et w rationnels (je passe sous silence des petites subtilités notamment sur ce qui arrive « à l'infini »).

Si on remplace les carrés par des cubes, en revanche, les choses sont très différentes : l'équation z₁³ + z₂³ = 1 n'a pas de solution rationnelle autre que les deux évidentes (1,0) et (0,1), cela a été démontré par Euler en 1770 (en montrant le cas particulier n=3 du théorème de Fermat, c'est-à-dire que Z₁³ + Z₂³ = Z₀³ n'a pas de solution entière). • Mais en ajoutant une variable, l'équation z₁³ + z₂³ + z₃³ = 1 a de nouveau quantité de solutions rationnelles, et mon calcul consistait essentiellement à en trouver le paramétrage :

z₁ = (9 − 9v + 3v² − 3v³ − 3w − 6v·w − 3v²·w + 3w² − v·w² − w³)/(9 − 9v + 3v² − 3v³ + 3w + 6v·w + 3v²·w + 3w² − v·w² + w³)

z₂ = (−9 − 9v − 3v² − 3v³ + 3w − 6v·w + 3v²·w − 3w² − v·w² + w³)/(9 − 9v + 3v² − 3v³ + 3w + 6v·w + 3v²·w + 3w² − v·w² + w³)

z₃ = (9 + 9v + 3v² + 3v³ + 3w − 6v·w + 3v²·w + 3w² + v·w² + w³)/(9 − 9v + 3v² − 3v³ + 3w + 6v·w + 3v²·w + 3w² − v·w² + w³)

vérifient z₁³ + z₂³ + z₃³ = 1 quels que soient v,w,

avec pour réciproque (« presque partout »)

v = (−1 + z₁² − z₂ − z₂² − z₁·z₃ + z₃²)/(z₁·z₂ + z₃)

w = (1 − 2z₁ + z₁² + z₂ − z₁·z₂ + z₂² + z₃ − z₁·z₃ + 2z₂·z₃ + z₃²)/(z₁·z₂ + z₃)

(Je vais expliquer qu'on peut écrire ces formules de façon un peu plus jolie !) Par exemple, v=2 et w=3 donnent la solution z₁=−5/4, z₂=−3/4 et z₃=3/2, et on a bien (−5/4)³ + (−3/4)³ + (3/2)³ = 1, ou, si on préfère chasser les dénominateurs, (−5)³ + (−3)³ + 6³ = 4³, ou encore, si on est resté un peu en retard sur les derniers progrès mathématiques et qu'on n'aime pas les nombres négatifs, 6³ = 5³ + 3³ + 4³ (au niveau des entiers naturels, les formules ci-dessus produisent donc plein de cubes égaux à la somme de trois autres cubes, ou, selon les signes, de sommes de deux cubes égaux à une autre telle somme). Remarquer que ces formules, comme celles que j'ai données plus haut pour le paramétrage rationnel du cercle ou de la sphère, permettent non seulement de trouver des solutions rationnelles, mais aussi d'approcher une solution réelle par une solution rationnelle (il suffit d'appliquer la « réciproque » sur les réels, d'approcher les paramètres, et d'appliquer la formule directe). Par exemple, si je veux trois entiers « assez proches » dont la somme des cubes est encore un cube, je pars de la solution réelle où z₁, z₂, z₃ valent 3−1/3 ≈ 0.6933612744, pour laquelle les formules réciproques me donnent v ≈ −1.4422495703 et w ≈ 2.0800838231, qui sont proches de −450/312 et 649/312 respectivement, et en appliquant les formules directes avec ces deux rationnels, on trouve, après avoir chassé les dénominateurs, 1403846621³ + 1403905879³ + 1403840755³ = 2024722855³, et ce n'est pas évident de trouver des choses comme ça autrement qu'en utilisant ce genre de techniques.

(Évidemment, c'est plus impressionnant avec le paramétrage rationnel du cercle : si vous cherchez des triangles rectangles à côtés entiers dont les angles non-droits soient proches de 45°, on remplacera t dans les formules donnant le paramétrage rationnel du cercle par les approximants successifs de √2 − 1, et on obtient ainsi successivement 3²+4²=5², 21²+20²=29², 119²+120²=169², 697²+696²=985², 4059²+4060²=5741², etc., où à chaque fois les deux carrés sommés sont non seulement proches mais même consécutifs — je ne sais pas si cette suite était connue des anciens Grecs.)

Je voudrais en dire un peu plus, mais avant ça il faut que parle des coordonnées homogènes, parce que ces dénominateurs sont vraiment pénibles. Très souvent, les géomètres algébristes, plutôt que de regarder une équation comme z₁³ + z₂³ + z₃³ = 1 dans l'espace « affine » des triplets (z₁,z₂,z₃) de rationnels, préfèrent rendre l'équation « homogène », c'est-à-dire l'écrire avec des polynômes dont tous les monômes sont de même degré, quitte à ajouter une variable supplémentaire pour ça : en l'occurrence, ça deviendra Z₁³ + Z₂³ + Z₃³ = Z₀³, la variable Z₀ servant à assurer qu'on a du degré 3 partout. Le rapport entre l'équation de départ (inhomogène) et l'équation transformée (homogène), est qu'une solution de l'équation inhomogène donne une solution de l'équation homogène (il suffit de poser Z₀=1), et même une infinité de solutions (sur l'équation homogène, on peut multiplier toutes les variables par une constante non nulle, ça ne change rien), et même une solution rationnelle donne une solution entière si on veut (il suffit de prendre pour Z₀ un dénominateur commun, j'ai donné des exemples ci-dessus de cette façon de « chasser les dénominateurs »), et inversement, une solution de l'équation homogène, dès que Z₀≠0, donne une solution de l'équation inhomogène, quitte à diviser par Z₀ (autrement dit, z₁ = Z₁/Z₀, et pareil pour les autres variables). Bref, ces équations sont presque la même chose, à ceci près que l'équation homogène admet peut-être aussi des solutions « à l'infini » pour lesquelles Z₀=0. On écarte cependant toujours la solution triviale pour laquelle toutes les variables valent 0. Comme on peut toujours multiplier toutes les variables de l'équation homogène par une même constante non nulle, on considère que deux solutions qui se déduisent ainsi l'une de l'autre (i.e., proportionnelles) sont en fait la même solution, et on notera (Z₀:Z₁:Z₂:Z₃) une solution typique, le symbole ':' servant à rappeler que ces coordonnées ne sont pas toutes nulles et ne sont définies qu'à multiplication près par une constante non nulle (il s'agit de coordonnés homogènes sur l'espace projectif de dimension, ici, 3). Ainsi, (6:5:3:4)=(12:10:6:8), c'est-à-dire que les deux solutions 5³ + 3³ + 4³ = 6³ et 10³ + 6³ + 8³ = 12³ de l'équation homogène sont considérées comme égales (et correspondent à la solution (5/6)³+(1/2)³+(2/3)³=1 de l'équation inhomogène).

D'autre part, pour rendre les variables plus symétriques, j'ai plutôt envie de considérer l'équation Z₀³ + Z₁³ + Z₂³ + Z₃³ = 0 (cela revient à changer le signe de Z₁,Z₂,Z₃ : l'équation inhomogène correspondante est z₁³ + z₂³ + z₃³ = −1, qui s'obtient à partir de z₁³ + z₂³ + z₃³ = 1 en changeant juste le signe de de z₁,z₂,z₃).

Ceci étant dit, en coordonnées homogènes, le paramétrage que j'ai calculé s'écrit de façon un peu plus jolie :

Z₀ = 9U³ − 9U²·V + 3U²·W + 3U·V² + 6U·V·W + 3U·W² − 3V³ + 3V²·WV·W² + W³

Z₁ = −9U³ + 9U²·V + 3U²·W − 3U·V² + 6U·V·W − 3U·W² + 3V³ + 3V²·W + V·W² + W³

Z₂ = 9U³ + 9U²·V − 3U²·W + 3U·V² + 6U·V·W + 3U·W² + 3V³ − 3V²·W + V·W² − W³

Z₃ = −9U³ − 9U²·V − 3U²·W − 3U·V² + 6U·V·W − 3U·W² − 3V³ − 3V²·WV·W² − W³

vérifient Z₀³ + Z₁³ + Z₂³ + Z₃³ = 0 quels que soient U,V,W,

avec pour réciproque (« presque partout » et à homogénéité près)

U = −Z₀·Z₃ + Z₁·Z

V = −Z₀² + Z₀·Z₂ + Z₁² − Z₁·Z₃ − Z₂² + Z₃²

W = Z₀² + 2Z₀·Z₁ − Z₀·Z₂ − Z₀·Z₃ + Z₁² − Z₁·Z₂ − Z₁·Z₃ + Z₂² + 2Z₂·Z₃ + Z₃²

Si vous trouvez que ça manque de symétrie, il faut observer la chose suivante : si on remplace (U:V:W) par (V:W:−3U), on remplace en même temps (Z₀:Z₁:Z₂:Z₃) par (Z₀:Z₂:Z₃:Z₁). (Si on applique cette substitution de (U:V:W) par (V:W:−3U) aux formules directes, on obtient exactement les mêmes formules permutées, à un facteur d'homogénéité près ; pour les formules réciproques, en revanche, ceci donne des formules différentes, par exemple U = Z₀² − Z₀·Z₁ + 2·Z₀·Z₂ − Z₀·Z₃ + Z₁² − Z₁·Z₂ + 2·Z₁·Z₃ + Z₂² − Z₂·Z₃ + Z₃² avec V = 3Z₀·Z₁ − 3Z₂·Z₃ et W = 3Z₀² − 3Z₀·Z₃ − 3Z₁² + 3Z₁·Z₂ − 3Z₂² + 3Z₃², et lorsque (Z₀:Z₁:Z₂:Z₃) vérifient Z₀³ + Z₁³ + Z₂³ + Z₃³ = 0, ces quantités sont proportionnelles à celles écrites ci-dessus, même si ce n'est pas du tout évident sur ces formules.)

Pour essayer d'expliquer d'où vient le fait qu'on peut paramétrer les solutions de certaines équations algébriques et pas d'autres, il faut que j'introduise un peu de terminologie. Malheureusement, celle-ci est assez épouvantablement pourrie, notamment parce que le mot rationnel a plusieurs sens différents et qu'il s'agit justement d'essayer de comprendre l'interaction subtile entre ces différents sens. Le problème est qu'un [nombre] rationnel est le quotient de deux nombres entiers et qu'une fraction rationnelle est le quotient de deux polynômes (pas forcément à coefficients rationnels !), et que ces deux sens du mot rationnel vont intervenir, et qu'on va devoir considérer des fractions rationnelles à coefficients rationnels. Voici quand même une tentative pour définir les choses en gros (je glisse de la poussière sous le tapis, mais j'essaie de ne pas y mettre des montagnes quand même) :

De toute évidence, quand une variété (définie sur ℚ) est ℚ-rationnelle, i.e., quand on peut paramétrer de façon essentiellement unique ses points (géométriques) par des fractions rationnelles à coefficients dans ℚ, on peut trouver beaucoup de points rationnels : il suffit de mettre (« presque ») n'importe quelles valeurs rationnelles dans les fonctions du paramétrage, et on obtient un point rationnel. C'est ce que j'ai fait abondamment dans les exemples ci-dessus. Il se trouve (ce n'est pas très difficile, mais ce n'est pas une trivialité) que la réciproque du paramétrage peut automatiquement être définie sur ℚ (i.e., si vous avez un paramétrage de solutions d'équations à coefficients dans ℚ par des fractions rationnelles à coefficients dans ℚ, et que ce paramétrage admet une réciproque sur les complexes, alors cette réciproque peut être définie elle aussi à coefficients dans ℚ) : ceci entraîne qu'on obtient (« presque ») tous les points rationnels par le paramétrage. • La situation des variétés ℚ-unirationnelles est plus subtile : comme (« presque tous ») les points géométriques s'obtiennent par des fractions rationnelles sur ℚ, on obtient certainement « beaucoup » de points rationnels comme ça (en mettant des valeurs rationnelles dans le paramétrage), mais on ne les obtient pas forcément tous, ni même « presque » tous, parce que certains points ne s'obtiendront peut-être que pour des valeurs complexes irrationnelles des paramètres : pensez au fait que la droite (d'abscisse z) se paramètre par z = t², et en mettant des valeurs rationnelles de t là-dedans on obtient bien des valeurs rationnels de z (ici on ne demande aucune équation, ou si vous voulez je cherche les solutions rationnelles de 0=0 en une variable z), mais on n'obtiendra pas z=2 ni z=−1 par exemple comme ça.

Pour compliquer les choses, une variété (sur ℚ) peut très bien être [géométriquement] rationnelle et ℚ-unirationnelle sans être ℚ-rationnelle ! (C'est-à-dire qu'on pourra paramétrer ses points sur les complexes de façon « presque » univoque par des fractions rationnelles à coefficients complexes, et on pourra aussi fabriquer plein de points par des fractions rationnelles sur ℚ, mais dans ce cas on perd l'unicité du paramétrage : on ne peut pas avoir les deux à la fois.) C'est même « assez souvent » le cas pour les surfaces cubiques.

On se retrouve assez facilement perdu dans un labyrinthe mathématique. Le slogan folklorique général du domaine (la géométrie arithmétique) est quelque chose comme :

La géométrie influence l'arithmétique.

La géométrie signifiant ici ce qui se passe sur les complexes (ou plus généralement, sur un corps algébriquement clos), et l'arithmétique signifiant ce qui se passe sur les rationnels (ou plus généralement, sur un corps non algébriquement clos, où on cherche des solutions). L'intérêt du slogan étant que la géométrie est quelque chose de beaucoup plus simple que l'arithmétique (à titre d'exemple, décider si un système d'équations polynomiales à plusieurs indéterminées et à coefficients rationnels a des solutions complexes est un problème algorithmiquement décidable, alors que décider s'il a des solutions rationnelles est un problème conjecturalement indécidable). Un slogan plus précis est :

Plus une variété est (géométriquement) « proche » d'être rationnelle en un sens ou un autre, plus elle (i.e., son arithmétique) aura tendance à admettre « beaucoup » de points rationnels en un sens ou un autre.

(De nouveau, le mot rationnel a deux sens différents ici, et le slogan, justement, les relie : le premier sens d'être rationnel est que la variété est supposée paramétrée par des fractions rationnelles à coefficients complexes, le second est que les solutions sont recherchées dans ℚ.)

Pour les courbes, c'est-à-dire pour les objets de dimension 1, ce slogan est parfaitement bien compris : la géométrie d'une courbe algébrique est déterminée principalement par un invariant numérique appelé le genre de la courbe (si la courbe est projective et non-singulière, c'est, par exemple, le nombre d'anses des points complexes de la courbe vus comme une surface). Les courbes de genre 0 sont exactement celles qui sont rationnelles, i.e., paramétrables par des fractions rationnelles (par exemple, un cercle, ou plus généralement une conique, ce qui géométriquement et dans l'espace projectif ne fait aucune différence) : et dès qu'une courbe de genre 0 a un point rationnel, elle en a énormément (en fait, la courbe est « isomorphe sur ℚ » à la droite projective). Les courbes de genre ≥2 sont celles qui sont très éloignées d'être rationnelles, et un théorème très important garantit qu'elles n'ont jamais qu'un nombre fini de points rationnels. Entre les deux, il y a les courbes de genre 1, c'est-à-dire essentiellement les courbes elliptiques, dont les points rationnels (s'il y en a) forment un groupe, et ce groupe est de type fini, ce qui est une façon de dire qu'il n'y en a pas trop (mais il peut quand même y en avoir une infinité).

À partir de la dimension 2, le slogan devient immensément plus compliqué à comprendre, ne serait-ce que parce qu'il y a toutes sortes de façons d'être plus ou moins rationnel et toutes sortes de façons d'avoir beaucoup de points rationnels, et toutes sortes de variétés particulières pour lesquelles on peut se poser la question. Il y a donc un labyrinthe de résultats, et surtout de conjectures, qui illustrent, ou parfois nuancent, le slogan en question. Je ne peux donc pas en raconter le millième.

S'agissant des surfaces cubiques (lisses), c'est-à-dire, disons, si on s'intéresse à une équation polynomiale homogène de degré 3 en 4 variables (et dont on suppose que les quatre dérivées partielles par rapport aux quatre variables ne s'annulent jamais simultanément, ou, ce qui revient au même, qu'on peut écrire une puissance de chaque variable comme combinaison de ces quatre dérivées partielles à coefficients polynomiaux ; ceci revient à demander qu'il n'y a pas de points singuliers sur la surface, i.e., qu'elle est « lisse »), la géométrie est très bien comprise. Une surface cubique contient 27 droites (c'est-à-dire : il y a 27 droites de l'espace projectif qui sont entièrement situées dans la surface cubique ; je rappelle que je parle ici de géométrie, donc, implicitement, tout est sur les nombres complexes). Sur la surface cubique Z₀³ + Z₁³ + Z₂³ + Z₃³ = 0, ces 27 droites sont données par les 9 paires d'équations {Z₁=−ωi·Z₀, Z₃=−ωj·Z₂} où ωi et ωj sont deux (éventuellement égales) parmi les trois racines cubiques de l'unité 1, ω=exp(2iπ/3) ou ω²=exp(4iπ/3), les 9 paires d'équations {Z₂=−ωi·Z₀, Z₃=−ωj·Z₁}, et les 9 paires d'équations {Z₃=−ωi·Z₀, Z₂=−ωj·Z₁}. Il n'y a que trois droites rationnelles (et en fait, que trois droites réelles), à savoir celles pour lesquelles i=j=0 dans les équations ci-dessus, et ce sont les lieux des solutions « évidentes » de l'équation Z₀³ + Z₁³ + Z₂³ + Z₃³ = 0, i.e., celles où les quatre variables forment deux paires opposées.

La relation d'incidence entre les 27 droites, c'est-à-dire laquelle intersecte laquelle, est la même quelle que soit la surface, et représente d'ailleurs une structure combinatoire intéressante en elle-même (liée, par exemple, au système de racines E₆) : chaque droite en rencontre 10 autres, chaque paire de droites qui s'intersectent en rencontre une unique troisième tandis que chaque paire de droites qui ne s'intersectent pas en rencontre 5 autres, etc. Tout ça est pareil quelle que soit la surface cubique (lisse). Ce qui change d'une surface cubique à une autre est la manière dont les droites se rencontrent : par exemple, il se peut qu'il y ait des points (dits points d'Eckardt) où trois droites se rencontrent simultanément, il se peut qu'il n'y en ait pas du tout (il y aura toujours les mêmes triplets de droites qui se rencontrent deux à deux, mais ce qui change est si elles se rencontrent au même point). Sur la surface cubique Z₀³ + Z₁³ + Z₂³ + Z₃³ = 0, les points d'Eckardt sont au nombre de 18 (seuls 6 d'entre eux sont réels, et même rationnels), ce sont les points pour lesquels deux des coordonnées sont nulles (et les deux autres sont alors en rapport −1, −ω ou −ω²). Si on convient de compter triple les points d'Eckardt, alors une surface cubique a 135 points d'intersection de deux droites (ceci met un maximum à 45 points d'Eckardt, mais il n'est pas atteignable sur les complexes — par contre, il l'est sur un corps de caractéristique 2).

Pour expliquer ce qu'on peut dire du paramétrage rationnel des surfaces cubiques, on va commencer par choisir six droites sur la surface deux à deux ne s'intersectant pas (or il y a 72 tels sextets de droites deux à deux ne s'intersectant pas). Il existe alors quatre polynômes (Z₀,Z₁,Z₂,Z₃), à coefficients complexes (puisque je parle pour l'instant de géométrie), homogènes de degré 3 en trois variables (U,V,W), qui vérifient identiquement l'équation de la surface (dans mon cas Z₀³ + Z₁³ + Z₂³ + Z₃³ = 0, mais ça pourrait être n'importe quelle équation cubique non singulière), et tels que l'application (U:V:W) ↦ (Z₀:Z₁:Z₂:Z₃) soit définie partout sur le plan projectif (i.e., l'ensemble des triplets (U:V:W) de complexes non tous nuls modulo multiplication par une constante) sauf en six points, et réalise une bijection (toujours, sur les complexes) entre le complémentaire de ces six points dans le plan projectif et le complémentaire des six droites choisies sur la surface cubique. Comment une application définie par des polynômes pourrait-elle ne pas être définie ? Tout simplement parce que les polynômes peuvent s'annuler simultanément (auquel cas le point (Z₀:Z₁:Z₂:Z₃) n'a pas de sens) : on est donc en train de dire qu'il y a six triplets de complexes non nuls, (U:V:W), à multiplication près par une constante, tels que les quatre polynômes s'annulent. Si on fait tendre un point du plan projectif vers un des six points d'indétermination, en suivant une certaine direction, l'image va tendre vers un point sur la droite correspondante de la surface cubique, mais le point en question va dépendre de la direction d'approche choisie. On dit que ces six points ont été éclatés, c'est-à-dire qu'ils ont été remplacés chacun par l'ensemble des directions au point en question (en termes plus précis : par le projectivisé de l'espace tangent). Et on dit, du coup, qu'une surface cubique est (géométriquement) l'éclaté du plan projectif en six points en position générale, ou qu'en contractant six droites deux à deux sans intersection sur la surface cubique on obtient le plan projectif. Cette contraction, réciproque du paramétrage, va être définie par des équations polynomiales (U,V,W) de degré 2 en Z₀,Z₁,Z₂,Z₃ : elle va être définie en tout point de la surface (elle enverra chacune des six droites contractées sur un unique point), mais il faut faire attention que pour avoir cette définition en tout point il faudra « recoller » plusieurs triplets d'équations polynomiales, aucun triplet n'étant défini (i.e., non simultanément nul) sur toute la surface, mais ils coïncident là où plusieurs sont définis.

(Pour être plus clair : n'importe quel choix de six droites deux à deux sans intersection peut être contracté simultanément, le paramétrage correspondant est essentiellement unique — c'est-à-dire unique, à une transformation projective près — et réciproquement, donnés six points du plan qui sont « en position générale » au sens où trois ne sont jamais alignés et que les six ne sont pas sur une même conique, alors il existe une surface cubique essentiellement unique — c'est-à-dire, unique à une transformation projective près, qui est l'éclaté du plan en ces six points.) Pour le paramétrage de Z₀³ + Z₁³ + Z₂³ + Z₃³ = 0 dont j'ai donné les équations plus haut, les six points éclatés sont ceux de coordonnées (1:±√(−3):0), (0:1:±√(−3)) et (±√(−3):0:−3), sachant que, par exemple, (1:√(−3):0) correspond à la droite {Z₃=−ωZ₀, Z₂=−ωZ₁}.

Cette vision des surfaces cubiques comme l'éclaté du plan projectif en six points permet de voir celles-ci un peu différemment : par exemple, les 27 droites, transportées sur le plan, deviennent : les 6 points éclatés (par définition), les 15 droites du plan reliant deux d'entre eux, et les 6 coniques passant par cinq des six points éclatés. On peut ainsi mieux visualiser lesquelles se rencontrent (mais il faut faire un peu attention : deux droites qui, sur le plan, se rencontrent en un point éclaté ne se rencontrent pas sur la surface cubique puisqu'elles arrivent en ce point éclaté en des directions différentes).

Maintenant, tout ce que j'ai raconté sur les surfaces cubiques vues comme l'éclaté du plan projectif en six points ne vaut que géométriquement, c'est-à-dire sur les complexes (ou sur un corps algébriquement clos — et sans doute faut-il le supposer de caractéristique ≠3). La même construction va fonctionner sur les rationnels (disons) à condition qu'on puisse trouver un sextet de droites défini sur les rationnels, où un sextet de droites signifie six droites deux à deux sans intersection sur la surface, et défini sur les rationnels signifie que la réunion des six droites du sextet peut être définie par des équations à coefficients dans ℚ (c'est moins contraignant que de demander que chacune des droites le soit ; si on préfère, le sextet est une réunion d'orbites sous l'action du groupe de Galois). Ici, le sextet que j'ai choisi était formé de la réunion des deux droites {Z₃=−ωZ₀, Z₂=−ωZ₁} et {Z₃=−ω²Z₀, Z₂=−ω²Z₁}, réunion qui peut être décrite par les équations {Z₀·Z₂ − Z₁·Z₃ = 0, Z₁² − Z₁·Z₂ + Z₂² = 0, Z₀·Z₁ − Z₁·Z₃ + Z₂·Z₃ = 0, Z₀² − Z₀·Z₃ + Z₃² = 0}, avec encore deux fois deux autres droites, obtenues par permutation cyclique de (Z₁,Z₂,Z₃). L'existence du sextet de droites que je viens de décrire garantit que la surface cubique Z₀³ + Z₁³ + Z₂³ + Z₃³ = 0 est ℚ-rationnelle (et pas juste géométriquement rationnelle).

Ceci ne dit pas comment j'ai effectivement trouvé les équations du paramétrage, cependant. Et j'avoue qu'après avoir raconté tout ça, je commence à fatiguer, alors je ne vais pas le dire (à moins que je sois motivé un autre jour pour écrire une nouvelle entrée sur le sujet). Le problème est que si on lit des textes standards de géométrie algébrique, on voit que le calcul est certes faisable en principe, mais pour y arriver en pratique, il faut enjamber pas mal de petites crottes de ragondin (et je ne suis pas du tout sûr de m'y être pris de la meilleure façon possible). Pour un géomètre algébriste, un morphisme vers l'espace projectif est défini par les sections globales d'un faisceau inversible, et en l'occurrence pour contracter six droites choisies sur une surface cubique on est censé commencé par prendre le faisceau anticanonique sur la surface tensorisé par le diviseur des six droites, or tout ce charabia est un peu éloigné des polynômes que saura vraiment manipuler un ordinateur : de façon déjà un peu plus concrète, j'ai commencé par chercher les fractions rationnelles de degré 1 admettant au plus des pôles simples le long des droites choisies (c'est ça, les sections globales du faisceau anticanonique sur la surface tensorisé par le diviseur des six droites). Il y en a 10 linéairement indépendantes, qui définissent un morphisme de la surface cubique, contractant les six droites, vers l'espace projectif de dimension 9, dont l'image est, à un changement de variable linéaire près, la surface de Veronese cubique c'est-à-dire l'image de l'application envoyant (U:V:W) sur tous les monômes de degré total 3 (il y en a 10, donc ça tombe dans l'espace projectif de dimension 9, voir ici par exemple). Reste à identifier le changement de variable qui remet la surface de Veronese dans sa bonne position, et j'ai eu un mal fou à faire ça : je ne m'en suis sorti qu'en calculant quelles devaient être les coordonnées des six points éclatés (après un tout petit nombre de choix, tout est déterminé par toutes sortes de birapports entre points d'intersections des différentes droites les unes sur les autres) pour finalement obtenir assez de valeurs de (U:V:W) et de (Z₀:Z₁:Z₂:Z₃) correspondant qui me permette de reconstituer la transformation projective sur la surface de Veronese cubique. Ouf !

Maintenant, il est sans doute naturel de se demander ce qui se passe en plus haute dimension. Puisque l'équation z₁³ + z₂³ = 1 n'a pas de solutions rationnelles (à part les triviales) et que z₁³ + z₂³ + z₃³ = 1 en a plein, il est naturel de penser que z₁³ + z₂³ + z₃³ + z₄³ = 1 en a plein aussi (même en écartant celles qui proviennent de la dimension en-dessous, c'est-à-dire qui ont une des variables nulle). Et c'est vrai, il y en a beaucoup, mais cette fois on ne peut pas les paramétrer comme je l'ai fait pour z₁³ + z₂³ + z₃³ = 1. En effet, dans le langage que j'ai introduit ci-dessus, alors que la surface cubique Z₁³ + Z₂³ + Z₃³ = Z₀³ est ℚ-rationnelle, l'hypersurface cubique Z₁³ + Z₂³ + Z₃³ + Z₄³ = Z₀³ n'est même pas géométriquement rationnelle — même sur les nombres complexes, on ne peut pas la paramétrer (de façon presque bijective) par des fractions rationnelles. C'est un résultat surprenant de Clemens et Griffiths de 1972 qu'aucune hypersurface cubique lisse de dimension 3 n'est géométriquement rationnelle (en dimension 4 ou plus, je crois qu'on ne sait franchement pas grand-chose) ; elles sont, cependant, géométriquement unirationnelles, et Z₁³ + Z₂³ + Z₃³ + Z₄³ = Z₀³ est ℚ-unirationnelle (par exemple d'après ce résultat, mais pour cette hypersurface particulière il n'est pas du tout nécessaire), donc on peut bien fabriquer plein de solutions rationnelles par des fractions rationnelles à coefficients rationnels, mais on ne peut pas les fabriquer (même presque toutes) comme ça.

On peut bien sûr aussi essayer de changer le degré : la courbe d'équation zn + zn = 1 n'a de point rationnel (autre que les solutions triviales) pour aucun n≥3, c'est le fameux théorème de Fermat-Wiles(-plein-de-gens). Concernant la surface z₁⁴ + z₂⁴ + z₃⁴ = 1, c'est une surface K3 (de nombre de Picard 20), mais je ne sais pas ce qu'on peut dire de ses points rationnels, ce qui est sûr c'est qu'elle n'est pas rationnelle, ni même unirationnelle, même pas géométriquement, donc dans le slogan la géométrie influence l'arithmétique, on est plutôt à un niveau comparable aux courbes elliptiques ; cet article est le plus proche que je connais de ce genre de questions. De toute façon, il est vain d'essayer d'énumérer toutes les équations diophantiennes possibles, et comme je l'ai mentionné, on conjecture que le problème (de savoir si des équations polynomiales ont des solutions rationnelles) est indécidable en général ; et même la question géométrique (donc a priori plus simple) de savoir si une variété donnée est géométriquement rationnelle, ou géométriquement unirationnelle, n'est peut-être pas décidable (je n'en sais rien, en fait — le problème est sans doute lié à la difficulté du dixième problème de Hilbert sur ℂ(t), sur laquelle je n'ai pas l'impression qu'on sache grand-chose, et je ne sais même pas ce que les experts en pensent).

Pour donner quand même un exemple de situation dans laquelle on sait dire pas mal de choses, on peut considérer l'exemple des surfaces définies par deux équations quadratiques indépendantes, i.e., les intersections de deux quadriques, en cinq variables (dites surfaces de Del Pezzo de degré 4 ; les surfaces de Del Pezzo sont définis pour les degrés 1 à 9, celles de degré 3 sont exactement les surfaces cubiques, celles de degré 9 sont — géométriquement — le plan projectif, ou plutôt la surface de Veronese cubique que j'ai mentionnée plus haut ; ces surfaces de Del Pezzo ont tendance à être d'autant plus compliquées que le degré est petit). Ces intersections de deux quadriques ont 16 droites tracées dessus, et sont géométriquement l'éclaté du plan projectif en cinq points en position générale (c'est-à-dire, dont trois quelconques ne sont pas alignés ; en fait, une surface de Del Pezzo de degré d est géométriquement l'éclaté du plan projectif en 9−d points) ; il y a donc beaucoup en commun avec les surfaces cubiques. Un exercice qui pourrait être intéressant serait de calculer la contraction de droite, disons, {Z₁=−Z₀, Z₃=−Z₂} sur la surface cubique Z₀³ + Z₁³ + Z₂³ + Z₃³ = 0 dont j'ai parlé tout du long — cela doit donner une intersection de deux quadriques, qu'il peut être instructif de calculer et de paramétrer.

Mise à jour : J'ai fait ce calcul (je ne sais pas s'il était intéressant, en fait). Pour contracter la droite {Z₁=−Z₀, Z₃=−Z₂} sur la surface cubique Z₀³ + Z₁³ + Z₂³ + Z₃³ = 0 (qui correspond à W=0 dans le paramétrage donné plus haut), il suffit d'ajouter une variable Z₄, et on obtient l'intersection de deux quadriques définies par les deux équations {(Z₀+Z₁)·Z₄ − Z₂² + Z₂·Z₃ − Z₃² = 0, Z₀² − Z₀·Z₁ + Z₁² + (Z₂+Z₃)·Z₄ = 0} (ces équations impliquent Z₀³+Z₁³+Z₂³+Z₃³=0) et un paramétrage s'obtient en reprenant les équations de Z₀ à Z₃ données plus haut (à savoir : Z₀ = 9U³ − 9U²·V + 3U²·W + 3U·V² + 6U·V·W + 3U·W² − 3V³ + 3V²·WV·W² + W³, Z₁ = −9U³ + 9U²·V + 3U²·W − 3U·V² + 6U·V·W − 3U·W² + 3V³ + 3V²·W + V·W² + W³, Z₂ = 9U³ + 9U²·V − 3U²·W + 3U·V² + 6U·V·W + 3U·W² + 3V³ − 3V²·W + V·W² − W³, Z₃ = −9U³ − 9U²·V − 3U²·W − 3U·V² + 6U·V·W − 3U·W² − 3V³ − 3V²·WV·W² − W³) et en y insérant la valeur suivante, Z₄ = (81U⁴ + 54U²·V² + 30U²·W² + 9V⁴ + 6V²·W² + W⁴)/(2W) (c'est une fraction rationnelle, donc il vaut mieux chasser ce 2W et le mettre sur les autres variables, mais je n'ai pas voulu le faire pour garder les mêmes expressions).

(vendredi)

L'avenir n'est-il plus ce qu'il était ? (Tomorrowland et le paléofuturisme)

J'avais oublié de mentionner que je suis aller voir Tomorrowland (À la poursuite de demain en français), un film qu'on pourrait qualifier de paléofuturiste parce qu'il évoque la vision de l'avenir que nous avions autrefois (ou du moins, que les Américains avaient dans les années '60), en l'occurrence spécifiquement celle incarnée par l'exposition [techniquement pas] universelle de New York de 1964 (et dont il reste un immense globe terrestre dans le parc de Flushing Meadows).

Et j'avoue que je suis bon public pour ce genre de choses, parce que j'ai tendance à regarder les images de cette exposition universelle (ou d'autres expositions universelles passées, comme celle de Paris de 1900 ou de 1937) avec la nostalgie si particulière d'une époque que je n'ai pas connue. Pourtant, je ne suis pas spécialement tenté d'aller à Milan où a lieu une exposition universelle en ce moment (disons-le franchement, nourrir la planète, c'est chiant, ça ne me fait pas rêver) : est-ce parce que notre vision de l'avenir, l'optimisme qu'on a pu avoir d'être sur le droit chemin vers le meilleur des mondes[#], a changé, ou est-ce simplement une question de nostalgie qui fait que l'avenir paraît toujours plus radieux dans le passé que celui que notre présent nous propose ? (ou, variante, une question de génération : que l'avenir promis par les époques qu'on n'a pas connues paraît toujours plus rose que celui de la nôtre).

Je n'ai pas vraiment de réponse à cette question, qui est sans doute trop vague pour en admettre une. Mais j'ai tendance à soupçonner que deux ans après la crise des missiles de Cuba, l'avenir paraissait un peu plus inquiétant que le Duck and Cover de la décennie précédente ; j'ai tendance à penser que si le steampunk (et ses variantes pour les époques suivantes : decopunk, atompunk et autres choses rigolotes à chercher dans Google images) a du succès, c'est parce que nous gardons de ces futurs antérieurs exactement ce que nous voulons en garder. Peut-être que les générations futures (s'il y en a !) garderont comme souvenir de notre époque non pas notre mélange de défaitisme et d'incapacité à agir concernant les problèmes écologiques et géopolitiques majeurs, mais les zoulies images qu'on peut trouver dans certains films de science-fiction que nous produisons encore (ou qu'on peut trouver en ligne et qui prouvent que les gens rêvent encore de quelque chose).

Le film, cependant, part de l'idée que nous avons effectivement perdu une forme d'optimisme dans l'avenir qui eut prévalu autrefois. Forcément, j'ai aimé l'évocation de cette forme d'optimisme, et j'ai globalement bien aimé le film, mais il y avait quelque chose qui me dérangeait, et la critique qu'en fait le blog Paleofuture (que j'ai peine à croire que je n'ai encore jamais mentionné ici, et que j'en profite donc pour recommander) met exactement le doigt dessus (je recopie juste le passage concerné, qui ne contient guère de spoiler) :

The movie becomes an ouroboros of retro-futurism — a jetpack eating itself. We hear again and again that nobody dreams about the shiny, fantastic futures anymore. But instead of showing viewers those futures, they spend the better part of two hours complaining that nobody dreams of those shiny, fantastic futures anymore.

Tomorrowland is a mere shadow of the future we wanted to see. It could've been a film about a fantastic, futuristic world come to life. Instead it was a 2-hour lecture about our lack of optimism, only hinting briefly at the fun and excitement we're supposed to be dreaming of.

Il y a néanmoins quelques séquences — relativement courtes — où les personnages s'amusent effectivement dans un monde qui combine l'optimisme de l'avenir des années '60 et le raytracing des ordinateurs modernes, et rien que pour ces séquences, ça vaut peut-être la peine de voir le film.

[#] Je paraphrase ici formulation tirée d'un texte que j'aime beaucoup de Stefan Zweig (Die Welt von Gestern (Erinnerungen eines Europäers), c'est-à-dire Le Monde d'hier (Souvenirs d'un Européen)), entièrement consacré à l'esprit, à la fois optimiste mais en même temps incapable de comprendre ses propres tâches aveugles, de la Vienne du début du XXe siècle, vu à travers le regard du témoin de la montée du nazisme et qui ne va pas tarder à se suicider. Voici ce qui pourrait sans doute caractériser l'esprit de l'exposition universelle de 1900 :

Das neunzehnte Jahrhundert war in seinem liberalistischen Idealismus ehrlich überzeugt, auf dem geraden und unfehlbaren Weg zur „besten aller Welten“ zu sein. Mit Verachtung blickte man auf die früheren Epochen mit ihren Kriegen, Hungersnöten und Revolten herab als auf eine Zeit, da die Menschheit eben noch unmündig und nicht genug aufgeklärt gewesen. Jetzt aber war es doch nur eine Angelegenheit von Jahrzehnten, bis das letzte Böse und Gewalttätige endgültig überwunden sein würde, und dieser Glaube an den ununterbrochenen, unaufhaltsamen „Fortschritt“ hatte für jenes Zeitalter wahrhaftig die Kraft einer Religion; man glaubte an diesen „Fortschritt“ schon mehr als an die Bibel, und sein Evangelium schien unumstößlich bewiesen durch die täglich neuen Wunder der Wissenschaft und der Technik. In der Tat wurde ein allgemeiner Aufstieg zu Ende dieses friedlichen Jahrhunderts immer sichtbarer, immer geschwinder, immer vielfältiger. Auf den Straßen flammten des Nachts statt der trüben Lichter elektrische Lampen, die Geschäfte trugen von den Hauptstraßen ihren verführerischen neuen Glanz bis in die Vorstädte, schon konnte dank des Telephons der Mensch zum Menschen in die Ferne sprechen, schon flog er dahin im pferdelosen Wagen mit neuen Geschwindigkeiten, schon schwang er sich empor in die Lüfte im erfüllten Ikarustraum.

Tentative de traduction par mes soins :

Le dix-neuvième siècle, dans son idéalisme libéral, était sincèrement convaincu d'être sur la route rectiligne et infaillible vers le « meilleur des mondes ». C'est avec dédain qu'on considérait les époques antérieures, avec leurs guerres, leurs famines et leurs révoltes, comme un temps où l'humanité était encore mineure et insuffisamment éclairée. Ce n'était désormais qu'une question de décennies jusqu'à ce que le dernier mal et la dernière violence soient définitivement surmontés, et cette croyance en un « Progrès » ininterrompu et irrésistible avait véritablement en ce temps-là la force d'une religion ; on croyait en ce « Progrès » déjà plus qu'en la Bible, et son évangile semblait irréfutablement démontré à travers les merveilles quotidiennement nouvelles de la Science et de la Technique. En effet, une ascension générale, à la fin de ce siècle paisible, devenait toujours plus visible, toujours plus rapide, toujours plus variée. Dans les rues, la nuit, au lieu des lumières pâles, brillaient des lampes électriques ; les magasins portaient leur nouvel éclat tentateur depuis les grandes artères jusque dans les banlieues ; déjà, grâce au téléphone, les hommes pouvaient parler au loin, déjà ils s'y élançaient dans des voitures sans chevaux avec une vitesse nouvelle, déjà ils se projetaient dans les airs en accomplissant le rêve d'Icare.

(jeudi)

Volumes intrinsèques (quermaß) des convexes

Considérons les questions suivantes, dont l'énoncé ne fait pratiquement appel qu'à des notions de niveau collège (quitte à les reformuler ou spécialiser un tout petit peu : par exemple, j'ai écrit convexe dans la seconde, mais si on veut, on peut considérer des cas particuliers comme un triangle, rectangle ou ellipse, pour simplifier) :

Ces questions ont ceci en commun que, selon le niveau de réflexion qu'on leur accorde, elles semblent faciles (leur énoncé est tout à fait élémentaire), puis difficiles (on ne sait pas par quel bout les aborder), puis faciles (quand on les prend bien) : elles ont aussi ceci en commun qu'elles sont toutes résolubles grâce à la même notion mathématique, celle de volume intrinsèque d'un convexe (ou intégrale de quermaß, c'est la même chose à une constante et une renumérotation près) : c'est une notion que je trouve très jolie et naturelle, pas du tout compliquée à expliquer, et qui semble bizarrement peu connue même des mathématiciens en-dehors des spécialistes de la convexité ou de la géométrie intégrale/stochastique, alors qu'on peut en tirer des choses très simples (comme l'illustrent les problèmes ci-dessus). Bon, peut-être qu'en fait tout le monde connaît, et que j'étais le dernier à être mis au courant (il y a environ quatre ans, quand j'ai entendu parler de ces choses-là pour la première fois), mais ma réaction a été pourquoi aucun cours de maths que j'ai suivi ne m'a présenté ce concept vraiment naturel et intéressant ?!. Il y a toutes sortes de façon de l'approcher, je vais me contenter de donner les résultats basiques qui me semblent les plus importants.

Très grossièrement, l'idée est qu'à côté du volume (de dimension n) et de la surface (de dimension n−1, où n est la dimension ambiante — en fait, on prendra plutôt la demi-surface pour une raison de cohérence d'ensemble), on peut définir (pour un convexe compact) une sorte de « mesure » en chaque dimension entre 1 et n ; dans le cas d'un parallélotope (pas forcément rectangle, mais imaginons-le rectangle pour fixer les idées), le i-ième volume intrinsèque est égal, à une constante près (1/2i) à la somme des volumes i-dimensionnels (longueur, surface, volume, etc.) de toutes les faces de dimension i du parallélotope.

Voici une façon d'approcher cette notion. Si K est un convexe compact dans l'espace euclidien de dimension n, on peut considérer K+B(ρ) (où B(ρ) désigne la boule fermée centrée en l'origine et de rayon ρ, c'est-à-dire) l'ensemble des points situés à distance ≤ρ de K, autrement dit l'épaississement de K jusqu'à distance ρ, ou simplement la « boule » (mais j'éviterai ce terme) centrée sur K et de rayon ρ. On s'intéresse au volume [i.e., à la mesure de Lebesgue] V(K+B(ρ)) de cet ensemble de points : on peut montrer que c'est un polynôme en ρ (pour ρ≥0), et ce sont les coefficients de ce polynôme qui vont m'intéresser. Il est évident, en considérant séparément les cas ρ=0 et ρ très grand, que le coefficient constant (donc la valeur pour ρ=0) est simplement le volume V(K) de K, et que le terme dominant est le volume V(B(ρ)) de la n-boule de rayon ρ, que je vais noter 𝒱n·ρn avec 𝒱n le volume de la n-boule unité (qui vaut πn/2/(n/2)!, mais ce ne sera pas très important). On peut aussi se convaincre, en considérant le comportement pour ρ très petit mais non nul (disons, la dérivée en ρ=0), que le coefficient de degré 1 est la surface de K (c'est-à-dire la mesure (n−1)-dimensionnelle de son bord).

Pour imaginer les choses un peu plus clairement, on peut considérer par exemple le cas où K et un parallélépipède rectangle P dans l'espace de dimension 3, de côté a,b,c : alors l'ensemble V(P+B(ρ)) des points à distance ≤ρ du parallélépipède P se décompose assez facilement en géométrie élémentaire : on a le parallélépipède P lui-même (de volume a·b·c), on a un parallélépipède d'épaisseur ρ à côté de chaque face de P (donc six au total, de volume total 2(a·b+b·c+a·cρ), on a un quart-de-cylindre de rayon ρ placé à côté de chaque côté de P (donc douze au total, de volume total π·(a+b+cρ²), et enfin huit huitièmes de sphère placées à côté de chaque sommet de P (donc au total le volume d'une sphère, (4/3)π·ρ³). Cet exemple suggère qu'il est raisonnable de considérer les différents termes du volume de V(K+B(ρ)), chacun divisé par le volume de la boule dans la dimension correspondant à la puissance de ρ en question : sur le pavé P considéré, on obtient les quantités a·b·c, a·b+b·c+a·c et a+b+c (et 1, bien sûr), c'est-à-dire, si on veut, les polynômes symétriques élémentaires en a,b,c, et en tout cas des quantités homogènes à un volume, une surface, une longueur (et le nombre 1).

De façon générale, pour 0 ≤ in, le i-ième volume intrinsèque Vi(K) d'un convexe compact K de l'espace euclidien de dimension n est défini par le fait que V(K+B(ρ)) est la somme des Vi(K) · 𝒱ni · ρni (je rappelle que 𝒱n · ρn = V(B(ρ)), volume de la boule en dimension n). Autrement dit, Vi(K) est le coefficient de degré ni en ρ du polynôme V(K+B(ρ)), divisé par le volume de la boule unité de la dimension correspondante. Avec ce que j'ai dit, Vn(K) (le n-ième volume intrinsèque) est simplement V(K) (le volume), V0(K) vaut toujours 1, et Vn−1(K) est la moitié de la surface de K. Ce coefficient ½ est un peu déplaisant, ici, mais il rend d'autres choses plus agréables ; une façon d'y penser est de voir que les Vi(K) ne changent pas si on plonge K dans un espace euclidien de dimension plus grande (dans lequel l'espace euclidien de dimension n est vu comme un plat, i.e., comme un sous-espace affine de dimension n) : en particulier, la surface intrinsèque d'un disque de rayon r doit bien être π·r², même si c'est la moitié de la surface du disque vu dans l'espace (puisqu'il faut alors compter les deux faces), et on peut être d'accord que π·r² est une meilleure mesure.

Pour un parallélotope rectangle de côtés a1,…,an, le i-ième volume intrinsèque est le i-ième polynôme symétrique élémentaire des ai, ce qui est aussi assez naturel ; notamment, le i-ième volume intrinsèque d'un cube de côté c vaut n!/(i!·(ni)!) · ci (j'écris n!/(i!·(ni)!) pour le coefficient du binôme parce que personne n'a encore été capable de lui trouver une notation qui ne soit pas épouvantablement pourrie). Pour un parallélotope non nécessairement rectangle (c'est-à-dire l'ensemble des combinaisons linéaires à coefficients dans [0;1] d'un ensemble de n vecteurs linéairement indépendants mais non supposés orthogonaux), le i-ième volume intrinsèque est encore égale à 1/2i fois la somme des volumes i-dimensionnels de toutes les faces de dimension i (on peut encore dire ça ainsi : la somme des volumes de dimension i des faces de cette dimension, en comptant une seule fois chaque jeu de faces parallèles entre elles — et qui ont donc évidemment la même taille et forme). Pour un polytope convexe plus général, il y a une formule qui fait intervenir les angles externes du polytope aux différentes faces. Pour ce qui est de la sphère de rayon r, en développant (r+ρ)n avec la formule du binôme, on voit que son i-ième volume intrinsèque vaut n!/(i!·(ni)!) · 𝒱n/𝒱ni · ri.

Plus généralement, on peut introduire la notion de volume mixte de n convexes compacts K1,…,Kn, qui est 1/n! fois le coefficient de t1tn dans ce qui s'avère être un polynôme, V(t1·K1 + ⋯ + tn·Kn) : le i-ième volume intrinsèque de K est, à une constante muliplicative près (à savoir n!/(i!·(ni)!·𝒱ni)), le volume mixte de K,…,K,B,…,B, où on a mis i fois K et ni fois la boule unité B=B(1) ; ce volume mixte (donc la même chose que le i-ième volume intrinsèque de K fois la constante i!·(ni)!·𝒱ni/n!) s'appelle aussi la (ni)-ième intégrale de quermaß de K. (L'allemand Quermaß signifie quelque chose comme mesure à travers.)

Pour répondre aux deux premières questions que j'ai posées ci-dessus, il suffit de montrer que si KK′, où K,K′ sont deux convexes compacts, alors 0 ≤ Vi(K) ≤ Vi(K′) (la monotonicité [et positivité] des volumes intrinsèques). Ce qui n'est pas totalement évident (le fait que V(K+B(ρ)) ≤ V(K′+B(ρ)) pour tout ρ n'entraîne pas immédiatement une inégalité sur les coefficients), mais néanmoins vrai en général (la preuve standard de la monotocité des volumes intrinsèques passe par celle des volumes mixtes en général, et celle-ci se fait par approximation par des polytopes ; mais on doit pouvoir s'en tirer aussi par la formule de projection moyenne, cf. ci-dessous). Pour la première question ou la première partie de la deuxième, néanmoins, c'est très facile : comme les polynômes V(K+B(ρ)) et V(K′+B(ρ)) ont le même coefficient de degré n (à savoir 𝒱n), l'inégalité V(K+B(ρ)) ≤ V(K′+B(ρ)) entraîne l'inégalité correspondante sur les coefficients de degré n−1 (en faisant la différence et en regardant le comportement à l'infini).

Je vais maintenant donner quelques formules basiques de ce qu'on appelle la géométrie intégrale, et qui relient ces volumes intrinsèques à des espérances (=valeurs moyennes) de différentes grandeurs géométriques aléatoires (projections aléatoires, intersections aléatoires), elles-mêmes pouvant être des volumes ou plus généralement d'autres volumes intrinsèques.

La formule de la projection moyenne affirme que le i-ième volume intrinsèque de K est proportionnel au volume i-dimensionnel moyen de la projection orthogonale de K sur un plat (=espace affine) de dimension i de direction aléatoire. La constante de proportionalité (ne dépendant que des dimensions n et i, et pas de K, donc) vaut : n!/(i!·(ni)!) · 𝒱n/(𝒱i·𝒱ni) (ce coefficient a lui-même un certain nombre de propriétés intéressantes, d'ailleurs : c'est un analogue sur les réels du coefficient gaussien, et par transitivité du coefficient du binôme). Notamment : la largeur moyenne [=espérance de la largeur d'une projection orthogonale sur une droite de direction aléatoire] d'un convexe compact du plan est égale à 1/π fois sa circonférence (on retrouve facilement ce facteur de proportionalité en pensant au cas d'un disque, dont le diamètre vaut 1/π fois la circonférence) ; la largeur moyenne d'un convexe compact de l'espace de dimension 3 est égale à ½ fois sa longueur intrinsèque (=1er volume intrinsèque), et la surface moyenne de sa projection est égale à ½ fois sa surface intrinsèque, qui est elle-même la moitié de sa surface, donc au final, ¼ fois la surface (on retrouve facilement ce facteur de proportionalité en pensant au cas d'une boule, dont la surface de projection vaut ¼ fois la surface). Ceci répond à ma dernière question : un parallélépipède rectangle de côtés a,b,c a une surface de projection sur un plan de direction aléatoire qui vaut ½(a·b+b·c+a·c) et une largeur dans une direction aléatoire qui vaut ½(a+b+c), et dans le cas particulier d'un cube de côté c, on obtient (3/2)·c² et (3/2)·c respectivement (plus généralement, le volume volume i-dimensionnel moyen de la projection orthogonale d'un cube de côté c en dimension n sur un plat de dimension i de direction aléatoire vaut (𝒱ni·𝒱i)/𝒱n · ci).

Plus généralement, la formule de projection moyenne se généralise en formule de Kubota, qui relie le i-ième volume intrinsèque d'un convexe compact K à celui [i.e., le i-ième volume intrinsèque] d'une projection orthogonale aléatoire en dimension j : de nouveau, ces deux quantités sont proportionnelles par une constante qui ne dépend que de la dimension, et qui vaut (n!·(ji)!)/(j!·(ni)!) · (𝒱n·𝒱ji)/(𝒱j·𝒱ni). (Cas particulier : la largeur moyenne d'un convexe compact en dimension 3 est égale à 1/π fois la circonférence de sa projection orthogonale sur un plan de direction aléatoire. Mais bon, ce n'est pas spécialement intéressant, là, parce que c'est essentiellement ce que j'ai déjà dit.)

Il y a aussi des formules intéressantes pour non pas une projection aléatoire mais une intersection aléatoire. En voici un exemple : si KK′,L sont trois convexes compacts (le premier inclus dans le deuxième) de l'espace euclidien de dimension n, on peut se demander avec quelle probabilité un déplacement aléatoire g(L) de L (où g est une isométrie affine directe, i.e., un déplacement de l'espace euclidien), qui se trouve intersecter K′, intersecte aussi K. La réponse est apportée par la formule cinématique principale : c'est le rapport entre la somme des i!·(ni)! · 𝒱i·𝒱ni · Vi(K) · Vni(L) pour i allant de 0 à n et la même somme en remplaçant K par K′ (mon K′ ne sert donc pas à grand-chose dans l'histoire : je l'ai mis essentiellement parce que je ne voulais pas expliquer comment normaliser les choses, voir la note ci-dessous). À titre d'exemple, si L est un segment de longueur , on obtient ainsi la probabilité qu'un segment de longueur aléatoire intersectant K′ intersecte aussi K, à savoir le rapport entre n·(𝒱n/𝒱n−1)·V(K) + ·surf(K) (où surf(K) est la surface de K) et la même quantité avec K′ à la place ; notamment, pour n=2, la probabilité qu'un segment de longueur qui intersecte K′ intersecte aussi K vaut π·V(K) + ·circ(K) (où circ(K) est la circonférence de K) divisé par la même chose avec K′, et pour n=3, cette probabilité vaut 4·V(K) + ·surf(K) divisé par la même chose avec K′. On peut aussi considérer une limite quand le j-ième volume intrinsèque de L écrase tous les autres : si la probabilité qu'un j-plat (=espace affine de dimension j) aléatoire qui intersecte K′ intersecte K vaut Vnj(K) / Vnj(K′) (formule de Sylvester). On peut donc donner l'explication intuitive suivante du i-ième volume intrinsèque de K, au moins à constante près : c'est la proportion des (ni)-plats qui intersectent K (de la même façon que le volume est, intuitivement et à une constante près, la « proportion des points qui sont dans K »).

Note : Ma façon de raconter les choses est peut-être un peu bizarre, parce que pour rester à un niveau assez intuitif je ne veux pas introduire de mesure autre qu'une mesure de probabilité. Ça ne se passe pas trop mal pour les projections aléatoires, parce que le groupe spécial orthogonal est compact, donc a une mesure de Haar normalisée en probabilité, ce qui donne un sens clair à une projection orthogonale aléatoire, mais c'est évidemment plus déplaisant quand il s'agit d'espaces non compacts, d'où mon introduction d'un K′ de normalisation dans la formule cinématique principale, et ma façon de glisser de la poussière sous le tapis. Klain et Rota (référence ci-dessous) définissent le i-ième volume intrinsèque de K comme la mesure, dans la grassmannienne correctement normalisée, de l'ensemble des (ni)-plats qui intersectent K, et ça n'a rien d'approximatif (mais il s'agit bien sûr de dire ce que correctement normalisé veut dire). D'autre part, ce qui n'est peut-être pas très intuitif, c'est que la notion de déplacement aléatoire de L intersectant K, et donc notamment segment aléatoire de longueur intersectant K ou plat de dimension j intersectant K, est celle définie par la mesure de Haar sur les déplacements de l'espace euclidien, conditionnée par la condition d'intersection — ce n'est pas la même chose de prendre une droite aléatoire qui se trouve intersecter K (parfois appelée une droite μ-aléatoire) que de prendre deux points aléatoires de K et considérer la droite qui les relie (parfois appelée droite λ-aléatoire) ou encore de prendre un point aléatoire de K et considérer la droite passant par ce point dans une direction aléatoire (parfois appelée ν-aléatoire). Les densités (dérivées de Radon-Nikodym) des droites ν-aléatoires, resp. λ-aléatoires, relativement aux μ-aléatoires, sont proportionnelles à la longueur de la corde coupée sur K, resp. la longueur de la corde à la puissance n+1. Par exemple, pour la boule de dimension 3, la longueur moyenne d'une corde μ-aléatoire [donc, de l'intersection de la boule avec une droite qui se trouve intersecter la boule] vaut 4/3 (cf. ci-dessous), la longueur moyenne d'une corde λ-aléatoire [définie par deux points aléatoires uniformes dans la boule] vaut 12/7, la longueur moyenne d'une corde ν-aléatoire [définie par un point aléatoire de la boule et une direction aléatoire] vaut 3/2, et ce ne sont évidemment pas les seules façons de tirer une corde au hasard ; soit dit en passant, la distance moyenne entre deux points tirés au hasard dans la boule est encore autre chose, c'est 36/35. (Pour un disque, les valeurs sont respectivement π/2, 256/(45π), 16/(3π) et 128/(45π).) Cf. le paradoxe de Bertrand.

Voici une autre formule intéressante : si on intersecte K avec un j-plat aléatoire qui se trouve l'intersecter, le volume (j-dimensionnel, ou de façon équivalente, le j-ième volume intrinsèque) de l'intersection a pour espérance n!/(j!·(nj)!) · 𝒱n/(𝒱j·𝒱nj) · Vn(K) / Vnj(K) (et plus généralement, le i-ième volume intrinsèque de l'intersection a pour espérance (n+ij)!/(i!·(nj)!) · 𝒱n+ij/(𝒱i·𝒱nj) · Vn+ij(K) / Vnj(K), c'est la formule d'intersection de Crofton). Dans le cas particulier de la boule de rayon r, on trouve simplement 𝒱n/𝒱nj · rj comme espérance du volume j-dimensionnel de l'intersection de la boule avec un plat de dimension j aléatoire qui l'intersecte (et plus généralement, j!/(i!·(ji)!) · (𝒱n+ij·𝒱j)/(𝒱nj·𝒱i·𝒱ji) · ri pour l'espérance du i-ième volume intrinsèque de l'intersection). À titre d'exemple, la longueur moyenne d'une corde de la boule de rayon r en dimension 3, c'est-à-dire plus exactement (cf. la note ci-dessus) la longueur moyenne de l'intersection avec cette boule d'une droite aléatoire qui se trouve l'intersecter, vaut (4/3)·r, et la surface moyenne du disque coupé par un plan aléatoire qui se trouve intersecter la boule vaut (2/3)·π·r². Pour le cube de côté c, l'espérance correspondante vaut 𝒱n/(𝒱nj·𝒱j) · cj (et plus généralement j!/(i!·(ji)!) · 𝒱n+ij/(𝒱nj·𝒱i) · ci). En dimension 3, on trouve que la longueur moyenne de l'intersection d'un cube de côté c avec une droite aléatoire qui se trouve l'intersecter vaut (2/3)·c, et la surface moyenne du polygone coupé par un plan aléatoire qui se trouve couper le cube vaut (2/3)·c².

Certaines (mais pas toutes) des formules ou résultats évoqués ci-dessus se généralisent aux ensembles polyconvexes, c'est-à-dire les réunions finies de convexes compacts (qui sont aussi stables par intersection, donc sont l'anneau booléen engendré par les convexes compacts), ou même aux différences booléennes de tels ensembles, lorsqu'on y étend les volumes intrinsèques par additivité. Ces fonctions ne sont néanmoins pas très agréables : le 0-ième volume intrinsèque est la caractéristique d'Euler (ou un des avatars de la caractéristique d'Euler…) et elle peut tout à fait être négative (par exemple pour l'intérieur d'un cube de dimension n c'est (−1)n — on voit d'ailleurs que ce n'est pas la caractéristique d'Euler topologique la plus évidente — et même pour un compact non convexe elle peut être négative).

Par ailleurs, même sur les convexes compacts les plus simples, les mesures intrinsèques sont compliquées à calculer en général : on sait que la simple longueur d'une ellipse fait appel à une intégrale elliptique (« complète de seconde espèce », j'ai même su ce que ça signifiait), et que la surface d'un ellipsoïde ne s'exprime en termes élémentaires que s'il est de révolution. Donc même pour une forme aussi simple qu'un ellipsoïde généralisé, il n'y a pas chances qu'on puisse exprimer complètement (ou en tout cas, pas sans faire appel à des fonctions spéciales) les volumes intrinsèques.

Ceci dit, il s'agit peut-être là d'une fonction intéressante : que peut-on dire (algébriquement ou analytiquement) de la fonction fi qui à a1,…,an associe le rayon r de la boule qui a le même i-ième volume intrinsèque que l'ellipsoïde de demi-axes a1,…,an ? Notamment, comment se compare-t-elle à la fonction hi (facilement reliable au i-ième polynôme symétrique élémentaire) qui à a1,…,an associe le côté c du cube qui a le même i-ième volume intrinsèque que le parallélotope rectangle de côtés a1,…,an ? (J'ai formulé mes deux fonctions fi et hi de façon à ressembler à des sortes de moyennes des aj, notamment hi est la racine i-ième de (i!·(ni)!)/n! fois le i-ième polynôme symétrique élémentaire, pour i=1 on trouve la moyenne arithmétique, pour i=n la moyenne géométrique, et ça porte certainement un nom en général. En revanche, si fn est aussi la moyenne géométrique, les autres sont plus inattendues.) Du point de vue de la géométrie algébrique (ou semi-algébrique), le bord de E(a1,…,an) + B(ρ) (somme de Minkowski de l'ellipsoïde de demi-axes a1,…,an et de la boule de rayon ρ) est peut-être intéressant à étudier aussi (même dans le cas de la somme d'un disque et d'une ellipse, qui a certainement un nom classique). (Hum, bien sûr, je ne suis pas le premier à me poser ce genre de question.)

Bref, pour ceux qui veulent en savoir plus, je peux recommander le très joli petit livre de Daniel Klain & Giancarlo Rota, Introduction to Geometric Probability (et qui, contrairement à ce que le titre peut laisser penser, est beaucoup plus algébriste que probabiliste dans son approche ; de toute façon, quelle que soit la branche des maths qu'on préfère, le style de Giancarlo Rota est toujours très agréable à lire). Pour aller plus loin, il y a le livre de Schneider, Convex Bodies: the Brunn-Minkowski Theory, mais il est assez aride (et les choses les plus élémentaires sont difficiles à trouver tellement elles sont noyées dans le tout). À part le livre de Klain et Rota que je viens de citer, je ne connais aucun endroit où les choses soient traitées de façon vraiment pédagogique, et il n'y a pas non plus d'article Wikipédia sur les volumes intrinsèques qui présenterait les différentes choses que j'ai dites ci-dessus (hint, hint), ce qui est bien dommage parce qu'il s'agit quand même de choses qui mériteraient d'être mieux connues. En plus de ça, la terminologie a l'air assez aléatoire, et ce que j'ai appelé la formule de projection moyenne n'est pas référencé, par exemple, dans l'index du livre de Schneider (elle est cachée dans la formule de Kubota, et même pas signalée comme cas particulier notable), ou de l'encyclopédie Handbook of Convex Geometry de Gruber & Wills.

(mardi)

La 3D sous Linux, c'est toujours incompréhensible

Il y a quatre ans, j'avais écrit cette entrée pour me plaindre que je n'arrivais pas à faire fonctionner la 3D et le WebGL sous GNU/Linux parce que que Personne N'Y Comprend Rien® : ce n'est pas la peine de la (re)lire, parce que je vais surtout me plaindre ici que les choses sont encore largement incompréhensibles. Mais pour tâcher d'être un peu constructif, je vais quand même rapporter les rares choses que j'ai quand même réussi à comprendre. (Je souligne : mon grief n'est pas tant que les choses ne marchent pas — globalement, elles ne marchent pas si mal — mais que c'est si difficile de comprendre comment elles marchent.)

Pour fixer la terminologie pour ceux qui ne sont pas au courant des derniers gadgets à la mode, je rappelle que ce que j'appelle la 3D, c'est un ensemble d'interfaces graphiques permettant d'effectuer du dessin principalement (quoique non exclusivement) orienté vers le tracé d'images tridimensionnelles (c'est-à-dire, plus exactement, de projections en deux dimensions d'images tridimensionnelles) — l'opération de base étant typiquement le tracé d'un triangle en projection (on trace des formes plus complexes en les triangulant), l'intérêt étant notamment que le mécanisme 3D va s'occuper de ne tracer que les triangles visibles et pas ceux qui sont masqués par d'autres. Les calculs peuvent être faits par le processeur principal, ou par des circuits dédiés dans la carte graphique, et dans ce dernier cas on parle de 3D accélérée ou de 3D en matériel. Sinon, on parle de 3D non-accélérée ou émulée ou en logiciel. Faire de la 3D accélérée nécessite un chipset graphique correctement supporté ; faire de la 3D émulée (=logicielle), en revanche, devrait être possible sur absolument tous les systèmes — en contrepartie, c'est plus lent. Je dis devrait, parce que ce n'est pas forcément évident de trouver comment il faut s'y prendre en pratique.

L'interface dominante pour faire de la 3D (et en tout cas celle qui servira sous Unix) s'appelle OpenGL, et il y a une variante d'OpenGL connue sous le nom de WebGL, qui rend ces fonctions graphiques 3D disponibles aux pages Web, c'est-à-dire, aux programmes JavaScript. De plus en plus de pages Web dynamiques se servent de ces fonctionnalités WebGL, par exemple le nouveau Google maps (que je trouve épouvantablement mauvais par rapport à l'ancien, mais c'est un autre problème), même s'il y a un mode lite qui n'utilise pas WebGL et qui sera activé si celui-ci n'est pas disponible. J'avais moi-même écrit (cf. cette entrée passée) un petit jeu de labyrinthe en JavaScript utilisant WebGL, et qui peut servir de test extrêmement simpliste pour vérifier que WebGL fonctionne au moins minimalement (sinon, l'exemple le plus simple qui puisse servir de test standardisé est probablement cette page qui doit afficher un bête cube qui tourne).

J'ai cru comprendre les choses suivantes. Je rappelle que sous Unix (et notamment sous GNU/Linux, au moins avant l'arrivée de Wayland), l'affichage graphique passe par un programme appelé le serveur X[11], qui centralise les accès à la carte graphique, les programmes voulant faire de l'affichage étant alors des clients X, qui parlent au serveur X pour lui demander d'afficher tel ou tel truc. J'ai cru comprendre, donc, qu'il existe quatre mécanismes possibles pour faire de la 3D dans le cadre X11 :

  1. on peut faire de la 3D émulée (c'est-à-dire, non accélérée), et pour ça, il y a deux approches :
    1. soit l'émulation est faite au niveau du serveur X, qui prétend donc avoir des capacités 3D, et qui reçoit des commandes OpenGL (≈GLX) de la part du client, et effectue les calculs 3D de son côté (dans ce cas de figure, le client X n'a même pas à savoir si la 3D est accélérée ou non : il fait des appels OpenGL et le serveur X se débrouille comme il peut avec le matériel derrière),
    2. soit l'émulation est faite au niveau du client X, qui fait les calculs avant de les envoyer au serveur X (dans ce cas de figure, le serveur X n'a rien à savoir de la 3D, il ne reçoit que des ordres de tracé 2D) ;
  2. soit le serveur X parle à une carte graphique capable de faire de la 3D accélérée, reçoit des commandes OpenGL (≈GLX) de la part du client et les transmet à la carte graphique (ou plutôt, au pilote pour la cate graphique qui est dans le noyau Linux), en convertissant éventuellement au passage certaines opérations (dans ce cas de figure, le client voit exactement la même chose que dans le cas (1a) ci-dessus, à savoir, il parle OpenGL à un serveur X qui se débrouille comme il peut derrière) ;
  3. soit enfin le client parle directement à la carte graphique capable de faire de la 3D accélérée : le client négocie avec le serveur X le droit de parler à la carte graphique, et il doit aussi recevoir cette possibilité de la part du pilote noyau, et alors le serveur X se contente de laisser le client s'occuper d'un bout de l'écran (une fenêtre, un tampon graphique dans la carte graphique, je ne sais quoi) (on notera que ce mécanisme est probablement plus rapide que tous les précédents, mais il a l'inconvénient d'exiger que le client tourne sur la même machine que le serveur).

J'ai repris la typologie de l'entrée précédente que j'avais écrit sur ce sujet (en gros du plus lent au plus rapide, sachant qu'entre (1a) et (1b) ce n'est pas certain), mais elle n'est sans doute pas idéale, et il sera peut-être plus clair de la disposer sous forme du tableau suivant :

Indirect renderingDirect rendering
3D émulée (=logicielle)(1a)(1b)
3D accélérée (=matérielle)(2)(3)

J'ai déjà expliqué ce que signifie 3D émulée et accélérée. Le direct rendering fait référence au mécanisme (3), et peut-être aussi à (1b), c'est-à-dire au fait que c'est le client qui gère la 3D directement (soit en parlant au matériel qui va faire les calculs, soit en faisant lui-même les calculs). Lorsque c'est le serveur X qui gère la 3D en recevant des commandes OpenGL du client, on parle d'indirect rendering.

Le mode que tout le monde essaye d'utiliser, puisque c'est le plus rapide, c'est celui que j'ai appelé (3) : l'accélération matérielle avec rendering direct. À cause de ça, il est assez difficile de trouver des informations sur les autres mécanismes (comment les détecter, ou comment les utiliser).

Je répète que je ne suis pas sûr d'avoir bien compris (ni si ceci est toujours d'actualité). Même si j'ai bien compris, je n'ai pas de source fiable pour confirmer mon analyse : personne n'a l'air foutu de faire un petit tableau clair montrant les quatre cas de figure que je viens de décrire ; le plus proche que je trouve d'une confirmation est cette page qui affirme bien que all four combinations of direct/indirect software/hardware rendering are possible, ce qui semble coller avec les quatre cases de mon tableau ; elle explique par ailleurs comment distinguer les cas (1a|2), (1b) et (3) (mais pas comment départager (1a) et (2)) : pour savoir si on est en rendering direct ou indirect, il faut chercher la ligne direct rendering dans la sortie de glxinfo, et pour distinguer (1b) du reste, on devrait voir apparaître Software Rasterizer dans la ligne OpenGL renderer string (mais je soupçonne que cette explication est partielle et cache des choses, cf. plus bas).

On en déduit même quelques indications sur comment forcer certains de ces modes, et l'information semble être sur cette page : mettre LIBGL_ALWAYS_INDIRECT à 1 dans l'environnement force le passage à la colonne de gauche, et mettre LIBGL_ALWAYS_SOFTWARE à 1 force le passage à (1b) (je ne sais pas comment les deux interagissent : je crois que c'est la première qui a priorité ; on ne peut logiquement pas choisir entre (1a) et (2) côté client, ça doit être dans la configuration du serveur — mais je ne sais pas où). Ceci étant, chez moi, LIBGL_ALWAYS_INDIRECT ne marche pas :

vega david ~ $ LIBGL_ALWAYS_INDIRECT=1 glxgears
X Error of failed request:  BadValue (integer parameter out of range for operation)
  Major opcode of failed request:  156 (GLX)
  Minor opcode of failed request:  3 (X_GLXCreateContext)
  Value in failed request:  0x0
  Serial number of failed request:  21
  Current serial number in output stream:  23

…je me demande si le mécanisme (2) est encore supporté ou s'il est tombé en désuétude. Je n'ai pas vraiment envie de pousser mon enquête trop loin, de peur de faire planter mon serveur X, sur lequel j'ai des fenêtres ouvertes que je ne veux pas perdre pour le moment.

Une chose pas très claire dans l'histoire, c'est le rôle exact joué par la bibliothèque Mesa, qui est responsable de l'interface OpenGL sous les Unix libres. Celle-ci semble servir à la fois à parler au matériel (via, sans doute, une autre bibliothèque) et à faire de l'émulation logicielle. J'ai tendance à imaginer que dans les cas de figure (1a) et (2), le serveur X doit utiliser la bibliothèque Mesa (dans le cas (1a), pour faire l'émulation, et dans le cas (2), pour parler à la carte graphique) alors que le client utilisera la bibliothèque Mesa dans les cas (1b) et (3) et peut-être en fait dans tous les cas, mais ça non plus, ce n'est pas clair du tout.

Par ailleurs, je crois que les choses sont en fait un peu plus compliquées que ce que suggère la typologie ci-dessus, et qu'il existe plusieurs variantes de (1b). Notamment, si j'en crois cette discussion, où un autre utilisateur tout aussi perdu que moi dans le dédale des subtilités de Mesa se fait engueuler par des développeurs qui daignent à peine expliquer les choses, il y a deux mécanismes pour faire (1b), qui consistent (sous Debian, pour fixer les idées) à utiliser (1b₁) le paquet libgl1-mesa-swx11, ou (1b₂) le paquet libgl1-mesa-glx avec le module/pilote(?) swrast_dri.so — tout ceci n'étant bien sûr documenté absolument nulle part. Je pense que LIBGL_ALWAYS_SOFTWARE force le mécanisme (1b₂), mais je ne suis vraiment sûr de rien. Ce qui est sûr, c'est que chez moi, glxinfo renvoie OpenGL renderer string: Gallium 0.4 on llvmpipe (LLVM 3.5, 128 bits) si j'ai mis LIBGL_ALWAYS_SOFTWARE et Gallium 0.4 on AMD CAICOS si je ne l'ai pas mis, mais apparemment jamais Software Rasterizer comme suggéré par la page mentionnée plus haut. C'est peut-être un signe de la différence entre (1b₁) et (1b₂). Je n'en sais pas plus, et je ne comprends pas grand-chose à ces subtilités.

Ajout () : On me signale en commentaire l'existence de la variable d'environnement (évidemment documentée nulle part…) GALLIUM_DRIVER qui, combinée à LIBGL_ALWAYS_SOFTWARE, permet de choisir entre softpipe et llvmpipe, deux rasterizers logiciels différents de Mesa (que je devrais sans doute appeler (1b₂(i)) et (1b₂(ii))) ; je n'ai aucune idée de la différence entre eux, ni de si swrast est au même niveau que ces deux-là ou encore autre chose. D'autre part, j'aurais dû souligner que si on utilise une carte graphique nVidia avec le pilote propriétaire nVidia, celui-ci vient avec sa propre version de Mesa, qui ne fonctionne pas comme le reste, du coup ces diverses variables d'environnement n'auront pas d'effet (c'est une raison parmi d'autres de ne pas aimer ce pilote propriétaire).

À part les variables d'environnement servant à configurer la bibliothèque Mesa, il existe aussi un fichier .drirc (ou globalement /etc/drirc), lu par Apollon sait qui, dont le seul semblant de documentation semble être cette page (qui ne dit essentiellement rien), celle-ci (idem) ainsi que ce que peut afficher la commande xdriinfo (notamment xdriinfo options 0 et xdriinfo options $(xdriinfo driver 0) si votre écran s'appelle 0, ce qui est probable), mais tout ceci est de toute façon assez incompréhensible.

Mais sinon, une autre difficulté est que Firefox (qui est, après tout, le principal programme sur lequel j'ai envie de faire de la 3D, de façon à avoir du WebGL qui marche) n'utilise apparemment pas Mesa. Enfin, ce dont je suis sûr, c'est que Mesa n'apparait pas dans la liste des bibliothèques chargées en mémoire par lui dans le /proc/$PID/maps de mes processus Firefox. Du coup, les variables LIBGL_ALWAYS_INDIRECT et LIBGL_ALWAYS_SOFTWARE, qui sont lues par Mesa, n'ont pas de raison a priori de fonctionner sous Firefox : comment forcer Firefox à faire du rendering indirect ou du rendering logiciel ? J'avais noté autrefois qu'il fallait faire pointer la préférence webgl.osmesalib vers le chemin de Mesa (du genre, /usr/lib/x86_64-linux-gnu/libOSMesa.so sous Debian) et mettre webgl.prefer-native-gl à false — mais ça ne semble plus marcher. Mais en fait, LIBGL_ALWAYS_SOFTWARE a quand même l'air de marcher chez moi (si j'ouvre about:support, il affiche quelque chose de différent). Soit c'est parce que Firefox utilise quand même Mesa de façon cachée (compilé en statique ? ils n'auraient quand même pas osé ?), soit parce qu'ils ont repris la convention. Au final, je n'en sais rien, et je suis perdu.

Ajout () : On me rappelle en commentaire que Firefox a une liste blanche/noire de pilotes avec lesquels il accepte/refuse de fonctionner. Autrefois, on demandait à Firefox d'ignorer cette liste en mettant MOZ_GLX_IGNORE_BLACKLIST à 1 dans l'environnement, mais ce n'est pas clair que ce soit encore d'actualité : maintenant il semble plutôt que ce soit la variable de configuration webgl.force-enabled qui soit pertinente. L'effet des autres variables mentionnées m'est complètement obscur (qu'est-ce que c'est que le layers acceleration et en quoi est-ce différent de l'accélération 3D ?). Et de nouveau, je ne sais pas si les variables webgl.osmesalib et webgl.prefer-native-gl ont encore un sens.

Bref, voilà à peu près ce que j'ai réussi à comprendre, et où je ne comprends plus. Si par hasard un de mes lecteurs comprend mieux que moi et peut m'éclairer un point quelconque (ou simplement confirmer que j'ai bien compris tel ou tel aspect des choses), je lui en serai très reconnaissant !

On va dire que mon but principal est d'avoir au moins les fonctionnalités WebGL basiques dans Firefox et si possible aussi dans Google Chrome, sur toutes les machines que j'utilise physiquement (c'est-à-dire, le PC qui est chez moi, celui qui est dans mon bureau, et celui qui est chez mes parents). Je souligne qu'à défaut de 3D accélérée par la carte graphique, je suis prêt à me contenter au moins de 3D émulée, si elle marche correctement (c'est plus la fiabilité que l'efficacité qui m'intéresse). Mon PC chez moi utilise une carte graphique AMD (ex-ATI) avec le pilote Linux radeon, ça a l'air de marcher à peu près correctement depuis que j'ai mis à jour ma Debian vers la Jessie (8). Mon PC de bureau utilise une carte graphique nVidia avec le pilote propriétaire nvidia, et les choses marchouillent aussi à peu près (même si je voudrais bien me débarrasser de ce pilote, qui est une horreur). Mon PC chez mes parents, en revanche, utilise une carte graphique nVidia avec le pilote libre nouveau, et si le WebGL fonctionnait (fût-ce lentement) avant la mise à jour de Debian, maintenant ma page de labyrinthe qui me sert de test affiche n'importe quoi (pourtant, glxgears semble marcher correctement) ; c'est peut-être lié à un message d'avertissement me signalant que la variable force_s3tc_enable a été modifiée par rapport au défaut (apparemment c'est quelque chose qui se change dans le .drirc, mais je n'y ai pas touché, donc je n'en sais rien). Je n'ai pas eu le temps de comprendre les choses en détail (notamment parce que je ne connaissais pas certaines des choses que j'ai racontées ci-dessus), mais il est sûr que j'ai encore des choses à régler.

(lundi)

Notes sur les réseaux euclidiens, et le réseau de Leech

Je mets ici les transparents d'un exposé que j'ai donné vendredi matin dans le cadre d'une journée Télécom-UPS (Le Numérique pour tous) s'adressant aux professeurs de classes préparatoires : le sujet que j'ai évoqué était celui des réseaux euclidiens[#] et de leurs applications en cryptographie. Comme j'ai moi-même appris plein de choses en préparant cet exposé (entre autres en me plongeant un peu plus que je ne l'avais fait jusqu'alors dans le célèbre livre Sphere Packings, Lattices and Groups des deux mathémagiciens John Conway et Neil Sloane), je n'ai pas résisté à partir un peu dans tous les sens, et forcément j'avais beaucoup plus de choses sur mes planches que je ne pouvais en exposer en une heure : inversement, j'espère que leur lecture peut être intéressante sans l'exposé oral pour les accompagner.

Je n'ai notamment pas pu m'empêcher d'évoquer (le réseau) E₈, même s'il n'a aucun rapport avec la crypto dont j'étais censé parler. Ce qui me fait penser que si j'ai beaucoup parlé de E₈ sur ce blog, soit de l'algèbre ou du groupe de Lie de ce nom, soit du système de racines qui le définit, je n'ai pas vraiment parlé du réseau E₈ (celui engendré par le système de racines), qui est pourtant un objet plus simple (dans sa définition sans doute la plus compacte, c'est l'ensemble {(x₁,…,x₈) ∈ (ℤ⁸∪(ℤ+½)⁸) : x₁+⋯+x₈ ∈ 2ℤ} des octuplets de réels soit tous entiers soit tous ½+entiers, et dont la somme est un entier pair) ; et je n'ai jamais parlé du réseau de Leech de dimension 24 (qui est pourtant presque aussi ubiquiste dans les mathématiques que E₈, et peut-être encore plus exceptionnel). Voici une façon concise (mais peu constructive) de caractériser ces deux objets : si vous vivez dans un espace de dimension 8 (resp. 24) et que vous cherchez à empiler des boules toutes identiques, vous remarquerez qu'il y a une unique façon de mettre le nombre maximum de boules autour d'une boule centrale de façon à ce qu'elle la touchent toutes, à savoir 240 d'entre elles (resp. 196560), et de plus, une fois réalisé ce motif, il se continue de façon périodique (chaque boule ayant toujours ce même nombre maximum de voisines) ; en regardant le centre des boules, vous avez ainsi réalisé le réseau E₈ (resp. le réseau de Leech ou son symétrique). À part en dimension 2 où on obtient facilement le réseau hexagonal par la même construction (en disposant six cercles identiques autour d'un septième qu'ils touchent tous), les dimensions 8 et 24 sont exceptionnelles, au moins parmi celles qu'on connaît (j'ignore si on sait dire quelque chose sur les dimensions telles que l'arrangement maximal de boules identiques autour d'une boule centrale soit unique et engendre de plus un réseau, mais il n'y en a pas d'autre que 2,8,24 en dimension ≤24, et pas d'autre connue : dans les autres dimensions, les boules ne sont pas du tout rigides — par exemple, en dimension 3, on peut placer au maximum 12 boules identiques touchant une autre donnée, mais il y a beaucoup de façons de le faire, et elles peuvent se déplacer tout en gardant le contact avec la boule centrale).

Ceci étant, si les questions d'empilement de sphère sont frappantes, elles ne permettent pas vraiment de travailler avec le réseau de Leech. Sur le modèle de la définition que j'ai donnée ci-dessus du réseau E₈ (les octuplets de réels, soit tous entiers soit tous ½+entiers, dont la somme est un entier pair), voici la façon la plus simple et constructive que je connaisse de définir le réseau de Leech. Comme il vit en 24 dimensions, il y a 24 coordonnées à donner, et je disposerai ces 24 coordonnées sur les sommets d'un icosaèdre régulier (rappelons qu'un icosaèdre régulier a 12 sommets), deux par sommet, que j'appellerai arbitrairement la coordonnéee rouge et la coordonnée bleue (pour ce sommet). Le réseau de Leech est formé des points dont les coordonnées multipliées par √8 sont 24-uplet d'entiers vérifiant les conditions suivantes : (0) les bits 0 (=bits de poids faible) de ces 24 entiers sont tous les mêmes (i.e., ils sont soit tous pairs, soit tous impairs), (1) le bit 1 de l'entier rouge sur chaque sommet de l'icosaèdre est égal au XOR des bits 1 des entiers bleus des sommets qui ne sont pas adjacents à lui [la même chose est alors automatiquement vraie en échangeant bleue et rouge, et cette condition est une façon de dire que les bits 1 forment un mot du code de Golay binaire (24,12,8)], et enfin (2) le XOR des bits 2 de tous les entiers est égal à leur bit 0 commun [on a déjà dit que les bits 0 sont tous les mêmes]. (Note : le facteur √8 est un simple facteur de normalisation. Il a pour but d'assurer que le réseau de Leech a un covolume — c'est-à-dire la valeur absolue du déterminant d'une base — égal à 1, et alors les produits scalaires de deux vecteurs quelconques sont toujours entiers.)

±?/√8±?/√8±?/√8±?/√8±?/√8±?/√8
±?/√8±?/√8±?/√8±?/√8±?/√8±?/√8
±?/√8±?/√8±?/√8±?/√8±?/√8±?/√8
±?/√8±?/√8±?/√8±?/√8±?/√8±?/√8

Le tableau ci-contre, si mon JavaScript est bien fait, est censé afficher des vecteurs aléatoires de la plus petite longueur non nulle (à savoir 2) uniformément choisis parmi les 196560 possibles dans le réseau de Leech (qui est engendré par eux, c'est-à-dire, est l'ensemble de toutes les combinaisons entières de ces vecteurs) ; j'ai laissé non simplifiées des expressions comme 2/√8 (ou 4/√8, qui apparaît très rarement) pour mieux coller avec la présentation que je viens de donner. Ici, les coordonnées ont été disposées en tableau 6×4 parce que c'est plus commode à mettre sur une page Web qu'un icosaèdre avec deux coordonnées par sommet : si on veut faire le lien entre ces deux présentations, on peut reprendre l'étiquetage des cases que j'avais utilisée dans une entrée récente, et qui est rappelée en attributs title (i.e., si on passe la souris au-dessus d'une case), et les disposer sur un icosaèdre de la façon suivante : en appelant un premier sommet, les cinq sommets adjacents s'appelleront cycliquement , et les six sommets opposés aux six que je viens de nommer seront et respectivement (à chaque fois, les deux étiquettes que je donne servent à définir la coordonnée « rouge » et la coordonnée « bleue » au sommet en question de l'icosaèdre).

Mais bon, il y a quantité de manières de décrire ou de construire le réseau de Leech (dans un seul chapitre du livre précédemment mentionné — le chapitre 24, et je soupçonne d'ailleurs que le numéro n'est pas un hasard —, Conway et Sloane donnent d'ailleurs 23 constructions différentes, une pour chacun des types de trous profonds [sic] du réseau). C'est un des signes qu'il s'agit d'un objet mathématique riche et extraordinaire qu'il y ait tellement de façons de le décrire. En voici une autre : on considère d'abord le réseau appelé II25,1 (dans l'espace Minkowskien de dimension 25+1) dont les points sont (exactement comme pour ma description de E₈ ci-dessus) les 26-uplets de réels, soit tous entiers soit tous ½+entiers, dont la somme est un entier pair ; dans ce réseau, on considère le vecteur v = (0,1,2,3,…,24|70), qui, vu que 70² = 0² + 1² + ⋯ + 24², est orthogonal à lui-même pour le produit scalaire Minkowskien ; on considère alors les vecteurs de II25,1 qui sont orthogonaux à v (c'est-à-dire que la somme des 25 premières coordonnées multipliées par 0,1,2,3,…,24 respectivement, est égale à la dernière multipliée par 70), modulo v lui-même : le réseau ainsi formé est isométrique au réseau de Leech. Ou, pour parler en physicien, on se place dans un espace-temps de relativité restreinte avec 25 dimensions d'espace et 1 de temps, on considère un photon qui se déplace à la vitesse (0/70, 1/70, …, 24/70), et le réseau très simple II25,1, vu par ce photon (dans l'espace perpendiculaire à son déplacement) est le réseau de Leech. Le passage entre cette description et la précédente, cependant, n'est pas évident.

[#] La terminologie prête vraiment à confusion, parce que le mot français réseau correspond à la fois à l'anglais network et lattice, et c'est du second qu'il est question. Mais l'anglais n'est pas moins ambigu, puisque lattice correspond à la fois au français réseau et treillis. Il ne reste plus qu'à inventer une quatrième sorte d'objet, qui s'appellerait treillis en français et network en anglais, et on aura un beau graphe bipartite complet K(2,2) dans les traductions.

(dimanche)

Mes 0.02¤ sur la sécurité des avions vis-à-vis des attaques informatiques

[Dessin humoristique de Ritsch & Renn]J'ai le souvenir d'avoir vu (il y a longtemps) un dessin humoristique qui montrait un passager sur un siège d'avion, avec son portable ouvert devant lui, et qui regardait avec un air terrifié l'écran de ce portable qui affichait quelque chose comme nouveau périphérique BlueTooth détecté : Airbus A310 ; autoconfigurer ? OK / annuler. [Ajout : apparemment ce dessin (dont l'original, allemand, est ci-contre) est de Ritsch & Renn — même si je ne peux pas vraiment vérifier vu que leur site tout en Flash est tout cassé chez moi.]

Je mentionne ça parce que j'ai entendu quelques échos d'une histoire selon laquelle un expert en sécurité informatique (Chris Roberts) aurait réussi à plusieurs reprises à émettre des commandes en direction du système de pilotage d'avions commerciaux en vol en se branchant simplement au niveau du système d'in-flight entertainment [je ne sais pas comment on dit ça en français : je veux dire le système qui vous propose de voir des films, d'écouter de la musique, de voir la position de l'avion sur une carte, etc.]. C'est du moins ce qu'il a lui-même déclaré dans un tweet, puis expliqué au FBI qui l'a interrogé, comme il résulte d'un affidavit du FBI (les deux sont liés depuis l'article d'Ars Technica vers lequel je viens de pointer).

Je ne sais pas si ces affirmations sont vraies (je dois dire que si je crois vaguement qu'il aurait pu envoyer une commande pour lâcher les masques à oxygène, j'ai du mal à croire qu'il aurait pu passer une commande climb au système de navigation : je serais déjà surpris, en fait, qu'il existât une telle commande — que ce soit entre les commandes du cockpit et le pilote automatique, ou entre le pilote automatique et l'avionique, les commandes doivent probablement refléter soit l'interface côté cockpit soit les mouvements de bas niveau des différentes parties de l'avion, et je ne vois pas à quel niveau on dirait à l'avion grimpe, mais bon). Comme le dit quelqu'un dans un autre tweet cité par Ars Technica, soit Chris Roberts a menti, soit il a vraiment joué avec un avion en vol, et dans les deux cas c'est irresponsable pour un expert en sécurité informatique. Je suis d'accord avec ce jugement, mais ça n'empêche pas qu'on ait envie de se pencher sur la question de savoir si ce serait possible. Une autre question est de savoir si une attaque serait possible depuis le Wifi de bord, ou en utilisant celui-ci pour monter l'attaque depuis le sol (ce qui serait encore plus terrifiant).

Le problème, c'est que je doute que nous obtenions une réponse claire et publique de la part d'Airbus ou Boeing (ou d'autres concernés) : je soupçonne qu'ils n'ont pas compris que la seule approche qui marche un peu pour la sécurité informatique, c'est la transparence. Et en l'occurrence, j'aimerais bien avoir confirmation du fait qu'ils ont suivi des principes qui me semblent aller complètement de soi, tels que :

Est-ce le cas ? Je l'ignore. En principe, il devrait être possible de faire quelque chose de sûr où les câbles (A), (B) et (C) seraient interconnectés, mais vue notre incapacité (où nous = l'espèce humaine) à écrire du code informatique sûr même pour des choses très simples, je n'aurais vraiment pas envie de me risquer dans un avion où un simple switch sépare les commandes de vol et la diffusion des films dans la cabine. Même si un switch est probablement ce qu'on a le plus de chances d'arriver à programmer de façon totalement sûre (interdire tout paquet passant dans un certain sens, même un chimpanzé relativement réveillé doit réussir à programmer ça si on lui propose une banane suffisamment juteuse), je me méfierais quand même des attaques de déni de service (risque-t-on de pouvoir flooder le switch ?), y compris au niveau physique (risque-t-on de pouvoir griller le switch depuis un port de façon à l'empêcher de fonctionner depuis d'autres ?). Je me sentirais plus à l'aise de savoir que les signaux sont totalement séparés (d'ailleurs, je me sentirais aussi plus à l'aise de savoir que les commandes de vol, à tous les niveaux, utilisent non pas Ethernet mais quelque chose qui garantit des canaux à bande passante fixe, comme une forme de bus série blindé — peut-être que David Monniaux saura nous en dire plus).

Remarquez que si la séparation dont je parle peut sembler de simple bon sens, elle a des conséquences non évidentes : par exemple, s'il ne doit y avoir une séparation absolue entre les commandes de vol et tout ce qui concerne la cabine, ceci signifie que l'affichage fait aux passagers de la position actuelle, vitesse et altitude de l'avion doit venir d'un GPS (par exemple) différent de celui qui assiste le pilotage, puisque la transmission d'informations de ce dernier vers la cabine, même à sens unique juste pour les afficher, violerait la séparation que je propose. Bon, à défaut d'un second GPS juste pour afficher la position aux passagers (enfin, c'est pas comme si un GPS coûtait cher, par rapport à un avion, mais c'est vrai que si c'est pour un usage aéronautique, tous les prix sont multipliés par un zillion, même les sièges coûtent les yeux de la tête), on peut imaginer capter le signal émis par le transpondeur de l'avion lui-même, comme le fait FlightRadar (si vous ne connaissez pas, suivez ce lien, c'est fascinant — d'ailleurs, mon poussinet est totalement accroc). Mais en tout cas, ce n'est pas totalement évident. Et il y a probablement d'autres choses qu'il faudrait penser intelligemment comme ça.

(Dans le genre, il me semble comprendre que toutes les agences de services de renseignements ont deux ordinateur dans chaque bureau — typiquement repérés par un code de couleur, genre blanc et noir —, l'un étant connecté à Internet, l'autre étant connecté au réseau interne sécurisé, et il n'y a tout simplement aucune connexion entre les deux. J'imagine qu'ils ont des règles très strictes pour passer quand même de temps en temps des informations de l'un à l'autre : peut-être graver un DVD avec des fichiers sous un format précis et très contrôlé, et insérer le disque dans l'autre ordinateur où il sera soigneusement validé avant quelque usage que ce soit.)

[Mise à jour () : on me signale que Bruce Schneier a écrit une entrée de blog sur le sujet, où il affirme explicitement : Newer planes such as the Boeing 787 Dreamliner and the Airbus A350 and A380 have a single network that is used both by pilots to fly the plane and passengers for their Wi-Fi connections. Mais comment a-t-on pu autoriser ça ‽ (Par ailleurs, sur le fond, Schneier a le même avis que moi.) • Pour ce qui est des services de renseignement ou autres agences sensibles, je propose que le transfert se fasse par média optique plutôt que par clé USB, parce qu'une clé USB contient une puce qui a un firmware, et qu'on dont on peut donc potentiellement prendre le contrôle, donc c'est une mauvaise idée. (Après, je suis aussi persuadé que l'immense majorité des secrets des services secrets sont totalement bidon, donc je m'en fous un peu, mais bon.)]

Je répète que je ne sais pas ce qu'il en est pour ce qui est de l'éventuelle connexion des avions. Mais le simple fait qu'on peut avoir à se poser la question n'est pas très rassurant. Je pourrais me moquer de l'aviation, une industrie qui comme beaucoup d'autres continue à penser la sécurité en terme d'obscurité plutôt que de transparence (pour donner un exemple : quand j'étais à l'ENS, le laboratoire d'analyse statique était très fier de ce que leur analyseur statique, Astrée, avait réussi, en partenariat avec Airbus, à analyser et valider le système de commande de vol principal de l'Airbus A340 ; mais une question à laquelle je n'ai pas eu de réponse est : pourquoi ce logiciel de commande de vol n'est-il pas rendu public, au juste ?, ce qui permettrait à d'autres gens de faire des analyseurs statiques capables de l'étudier, ou simplement de l'examiner avec des yeux d'humains ; étant donné que le business d'Airbus est de vendre des avions, pas du logiciel, pourquoi les sources de toutes les parties logicielles de leurs avions ne sont-elles pas publiées ? ce n'est pas comme si leurs concurrents pouvaient les exploiter sur des avions différents avec des technologies différentes — et de toute façon je suis sûr que les espions industriels sont assez bons pour que Boeing ait déjà le code utilisé par Airbus et réciproquement, donc l'enjeu est juste de savoir si le public, lui, l'aura). L'avion est, par ailleurs, un milieu où on continue à mesurer la hauteur des avions en multiples de la longueur du pied de je ne sais quel roi anglo-saxon : c'est-à-dire, un monde complètement enfermé dans ses habitudes absurdes et incapable d'évoluer. (Je pourrais aussi raconter que les systèmes de réservation des places des compagnies aériennes sont, encore de nos jours, écrits en assembleur IBM/360 et échangent des données en EBCDIC. Ça va très bien avec l'usage du pied et du mille comme unités de mesure pour démontrer l'état d'esprit de tout le milieu.) Bref, je ne sais pas si je fais confiance aux constructeurs d'avions pour avoir fait les choses correctement au départ en ce qui concerne la sécurité informatique, mais je suis persuadé d'une chose : s'ils n'ont pas fait les choses correctement au départ, alors ils vont tout faire pour le cacher, et surtout ne rien changer, nier le problème, menacer ceux qui en parlent de procès en diffamation, etc.

Mais bon, au-delà des petites turpitudes du monde de l'aviation, de façon plus large, ceci doit nous inviter à méditer sur ce problème qui se pose de façon de plus en plus aiguë : nous sommes incapables d'écrire du code informatique sûr, et nous avons besoin de quantités de plus en plus gigantesques de code informatique. Je ne sais pas où nous allons au juste comme ça, mais c'est inquiétant, parce que dans le monde de l'Internet des objets, on devra se soucier en permanence de la sécurité logicielle de chacun des objets qui nous entourent — bof.

(samedi)

Comment le cerveau sépare-t-il les langues ?

En tant qu'aspirant polyglotte amateur, je trouve fascinante la question de savoir comment le cerveau crée des contextes mentaux pour des langues différentes. La séparation entre ces contextes varie d'ailleurs fortement d'une personne à une autre : je connais des gens polyglottes qui arrivent à passer sans aucune transition d'une langue à une autre ou à les mélanger, et d'autres — c'est un peu mon cas — pour qui ceci demande un certain effort de changement de contexte, et qui ont, du coup, une certaine difficulté à traduire, même entre des langues dont ils ont par ailleurs une excellente maîtrise. Je connais des gens qui préfèrent utiliser une certaine langue pour certaines sortes de conversations ou de pensées, ou qui prétendent ne pas avoir tout à fait la même personnalité dans telle langue que dans telle autre (je pense que c'est exagéré ; en revanche, il est vrai que les gens peuvent avoir une voix étonnamment différente dans des langues différentes). Apparemment, il n'y a pas une région différente du cerveau par langue : ceci rend d'autant plus fascinante la façon dont fonctionne cette séparation.

Un exemple que je trouve assez frappant de l'existence de ces « contextes » linguistiques est le suivant : il m'est arrivé d'entendre quelqu'un parler une langue qui n'est pas celle que j'attendais, et de ne rien comprendre avant de me rendre compte de la langue qui était parlée. Notamment, il m'est arrivé de ne pas comprendre des gens qui étaient en train de parler français, simplement parce j'étais persuadé qu'ils parlaient une autre langue et mon cerveau n'analysait pas les sons comme du français — je n'étais pas dans le bon contexte.

Et si ces contextes mentaux existent, il faut commencer par les créer. C'est-à-dire, en démarrant l'apprentissage d'une nouvelle langue, convaincre le cerveau qu'il va falloir créer un nouveau contexte, à séparer de ceux qui existent déjà. Si la langue est très différente, ça ne devrait pas être trop difficile (l'apprentissage lui-même sera d'autant plus ardu, bien sûr, mais au moins on risque moins de s'embrouiller). Mais si on commence à apprendre une langue proche d'une autre qu'on connaît déjà, ou, pire, de deux langues proches simultanément, il faut trouver des moyens de se créer des barrières mentales entre ces langues. Sans pour autant s'interdire d'utiliser la proximité des deux langues pour extrapoler du vocabulaire qu'on ne connaît pas (au moins en compréhension).

Je suis notamment confronté à cette situation entre le néerlandais et le suédois, deux langues dont j'ai une connaissance tout à fait rudimentaire, et dans une moindre mesure, entre l'allemand (que je parle mal mais que je comprends passablement bien) et le néerlandais. Ce qui pousse à la confusion n'est cependant pas toujours ce qu'on imagine : par exemple, le mot néerlandais wie, signifiant qui (le pronom interrogatif) ait exactement la même écriture et une prononciation très proche, du mot allemand wie, lequel signifie comment (l'adverbe interrogatif), ne m'a pas semblé source de confusion. Mais comparons les deux phrases suivantes, que j'écris d'abord en néerlandais, puis en allemand, puis en anglais, pour mieux rendre apparentes les similarités :

Is het de vrouw die ik heb gezien? Nee, het is de man die je hebt gezien.

Ist es die Frau, die ich gesehen habe? Nein, es ist der Mann, den du gesehen hast.

Is it the woman that I have seen? No, it is the man that you have seen.

(Soit en français : Est-ce la femme que j'ai vue ? Non, c'est l'homme que tu as vu. L'emploi du parfait plutôt que du prétérit est sans doute moins naturel en anglais que dans les deux langues précédentes, et on aurait tendance à omettre le that, mais je garde les choses pour maintenir le parallélisme.) Une première observation est que l'ordre des deux derniers mots de chaque phrase est inversé en allemand par rapport à ce qu'il est en néerlandais et en anglais : la raison est qu'à la fois l'allemand et le néerlandais mettent le verbe en position finale dans les subordonnées, mais quand il y a plusieurs morceaux du verbe, l'allemand gère la priorité pour la fin de la subordonnée comme une pile alors que le néerlandais la gère comme une file, ce qui conduit à une inversion de l'auxiliaire et du participe passé en allemand qui n'a pas lieu en néerlandais. Bizarrement, ceci ne m'a demandé aucun effort particulier, je trouve parfaitement naturel de passer de l'ordre de l'allemand à celui du néerlandais ou vice versa. (À cette seule exception près, les mots se correspondent exactement, et doivent montrer de façon assez nette la similarité de ces trois langues. J'aime bien dire que le néerlandais est à peu près ce qu'aurait été l'anglais si les Normands n'avaient pas conquis l'Angleterre en 1066.)

En revanche, ce qui me pose beaucoup de problème avec les phrases, c'est le pronom relatif die dans la deuxième phrase en néerlandais. En allemand, il y a trois genres : le masculin, le féminin et le neutre ; die Frau est féminin alors que der Mann est masculin, et le pronom relatif est (en gros) le même que l'article défini (ici, on a den dans la seconde phrase parce que c'est un accusatif, mais peu importe). En néerlandais (comme, d'ailleurs, en suédois), il n'y a que le neutre et le non-neutre (c'est-à-dire, logiquement, l'utre, ou genre commun), et de vrouw comme de man sont non-neutres ; le pronom relatif (qui est d'ailleurs le même que le démonstratif) est die au non-neutre. C'est donc la même forme que le pronom relatif féminin en allemand : et quand j'entends la deuxième phrase (ou simplement die man, =cet homme-là), mon cerveau me crie qu'il y a un problème de genre.

Voici maintenant un problème entre le néerlandais et le suédois : comme je viens de le dire, ces deux langues ont en commun d'avoir deux genres, le neutre et le non-neutre. L'article indéfini non-neutre est à peu près le même entre les deux langues : een man en néerlandais signifie la même chose que en man en suédois (d'ailleurs, la prononciation n'est pas très éloignée non plus), c'est-à-dire un homme ; l'article défini n'est pas du tout pareil (en suédois il est postposé, au moins tant qu'il n'y a pas d'article), mais ce n'est pas très grave, ça ne cause pas de confusion, en tout cas pas sur ce mot-là (de man en néerlandais, mannen en suédois) — d'ailleurs, s'il y a un adjectif, ça redevient très proche et toujours peu confusant (l'homme fort se dit de sterk man en néerlandais, den starke mannen en suédois). Mais pour le neutre, il y a une chose qui est particulièrement gênante pour mon cerveau, c'est que l'article neutre indéfini en suédois, ett est presque le même (au moins au niveau de la prononciation), que l'article neutre défini en néerlandais, het (le ‘h’ se prononce très peu vu qu'il est sonore — oui, la terminologie des phonéticiens est confusante elle aussi). Ainsi, het huis signifie la maison en néerlandais, mais ett hus signifie une maison en suédois. (Si on veut dire une maison en néerlandais, c'est een huis, l'article indéfini étant le même pour les deux genres ; et si on veut dire la maison en suédois, c'est huset.) J'ai mis un certain temps à me rendre compte de pourquoi j'avais du mal à me forcer à penser que ett hus signifie une maison alors que je n'avais pas de mal pour en man, et ce n'est qu'après une certaine réflexion que j'ai compris que c'était ma (faible) connaissance du néerlandais qui bloquait mon cerveau.

Sur d'autres mots, je vais être gêné par le fait que l'article défini postposé suédois -(e)n évoque très fort un pluriel allemand (le pluriel suédois ayant plutôt tendance à être en -r pour ces mots). Ceci ne se produit pas pour l'exemple mannen, en revanche je peux prendre l'exemple de tidningen, qui veut dire le journal en suédois et qui ressemblent beaucoup — et le radical est cognat — à Zeitungen, qui signifie des journaux en allemand. Comme les verbes en suédois ne varient ni selon la personne ni selon le nombre du sujet, ça n'aide pas à identifier l'erreur (et elle est d'autant plus tentante si le verbe est är, le présent du verbe être à toutes les personnes, qui a plus ou moins donné l'anglais are, et qui fait donc aussi vibrer mes neurones à pluriel, si j'ose dire).

D'autres confusions viennent de la prononciation, c'est-à-dire du passage de l'écrit à l'oral : l'allemand et le néerlandais ont des prononciations très régulières (il y a des langues encore plus régulières en la matière, comme le hongrois, le finlandais ou le turc, mais l'allemand et le néerlandais sont tout de même assez hauts, surtout quand on les compare au français ou — shudder — à l'anglais) ; une des spécificités du néerlandais est que dans les terminaisons -en (typiquement d'un infinitif ou d'un pluriel), le ‘n’ ne se prononce pas (je simplifie). Le suédois, lui, est beaucoup plus irrégulier, avec des lettres finales qui ne se prononcent pas (mais pas le ‘n’), un ‘r’ qui subit un phénomène un peu comme en anglais anglais (je veux dire, en anglais d'Angleterre, où il tombe devant les consonnes avec une modifications du contexte), un ‘o’ qui peut se prononcer aléatoirement /oː/–/ɔ/ ou /uː/–/ʊ/ sans logique apparente, etc. Qui plus est, le suédois a un système d'accent tonique sérieusement différent de l'allemand et du néerlandais (ceux-ci accentuent une syllabe par mot, en gros la première à l'exception de quelques préfixes inaccentués, et en tout cas dans la première partie des mots composés ; le suédois, lui, a très fréquemment un accent secondaire, même dans des mots de deux syllabes, et cet accent a une composante tonale/mélodique). Par ailleurs, l'allemand, le néerlandais et le suédois n'ont pas les mêmes phénomènes d'assimilation (en allemand, les sonores à la fin des mots s'assourdissent, et il y a une assimilation régressive causée par les affixes sourds : le verbe geben, =donner, devient à la 3e presonne du singulier [er] gibt, =il donne, où le ‘b’ est prononcé /p/ parce que le ‘t’ qui suit est sourd ; en néerlandais, il y a également une assimilation dans les mots composés, ou même entre deux mots d'une même phrase, qui peut etre progressive ou régressive selon des règles que je ne comprends pas bien, mais en gros les fricatives sont assimilées par les occlusives : dans huisbezoek, =visite à domicile, le ‘s’ est prononcé /z/, sonore à cause du ‘b’ sonore qui suit, exemple d'assimilation régressive, alors que dans diepzee, =mer profonde, le ‘z’ est prononcé /s/, sourd à cause du ‘p’ sourd qui précède, et si les deux sont des occlusives, l'assimilation est régressive, enfin je crois ; le suédois semble avoir une assimilation régressive ou progressive de la surdité dans les affixes, mais pas d'assourdissement en fin de mot : bröd, [du] pain, est prononcé /brøːd/ avec un /d/ sonore final, à la différence du néerlandais brood, prononcé /broːt/ avec un /t/ sourd, au moins en fin de phrase — en allemand, ça s'écrit carrément avec un ‘t’, Brot). Toutes ces différences font qu'il faut avoir le cerveau correctement câblé pour prononcer correctement et dans la bonne langue un mot écrit (il n'est pas question de réfléchir consciemment aux règles d'assimilation, par exemple, elles sont trop complexes, et d'ailleurs je serais incapable de les énoncer complètement).

Bien sûr, il est certain que ces difficultés que j'éprouve maintenant se résoudront toutes seules (et seront remplacées par d'autres !) si je persiste dans l'apprentissage de ces langues, au fur et à mesure que mon cerveau arrivera à se construire des catégories mentales bien délimitées pour des langues dont ma connaissance pour l'instant trop primitive les rend assez informes. Je peux néanmoins me demander quelle approche il vaut mieux adopter pour éviter de me mélanger les pinceaux : laisser la langue X de côté pendant une assez longue période lorsque j'apprends la langue Y avec laquelle je pourrais confondre ? Ou au contraire m'efforcer à confronter la difficulté, à traduire entre X et Y et vice versa pour bien m'obliger à constater que c'est différent ? Les deux stratégies font sens : éviter tout rapprochement pour éviter tout mélange, ou au contraire faire les rapprochements pour comprendre et ainsi écarter ce qui peut m'embrouiller. D'ailleurs, forcément, en écrivant cette entrée, j'ai dû me forcer à jongler entre différentes langues.

Il faut aussi se demander quel est le but (je ne m'imagine pas sérieusement pouvoir un jour parler le néerlandais ou le suédois, juste les comprendre un petit peu, ou simplement me faire une idée de comment ces langues fonctionnent). Si on se fixe simplement comme objectif de comprendre des langues, les confusions sont beaucoup moins nombreuses et moins risquées que si on cherche à s'y exprimer (mais il y en a : j'ai donné ci-dessus l'exemple de het huis contre ett hus, où le sens est bien différent, et qui peut bien poser problème à la compréhension). Et j'ai tendance à penser qu'il faut apprendre les langues comme si on se donnait comme objectif d'arriver un jour à les parler, même si on ne croit pas réalistement arriver à ce stade.

(jeudi)

Mon obsession pour la symétrie (et un peu de mysticisme)

J'ignore dans quelle mesure ma fascination pour la symétrie est commune à beaucoup de gens, à tous les mathématiciens, ou peut-être seulement les algébristes et apparentés, ou si elle m'est propre, mais elle a parfois tendance à tourner à l'obsession, voire à la compulsion.

Je pourrais donner l'exemple suivant, anecdotique, mais assez représentatif de l'esprit dont je parle. Il y a, dans l'entrée de la maison de mes parents (où j'ai vécu entre les âges de 10 et 28 ans environ), quatre interrupteurs identiques en ligne. Les trois premiers commandent des lampes (celle de l'entrée, celle de l'extérieur, et celle de l'escalier, mais peu importe), le quatrième n'est relié à rien. La plupart des gens, sans doute, n'actionneraient que les trois premiers, le quatrième restant donc toujours dans la même position, sauf au hasard des personnes de passage qui tenteraient de s'en servir. Mais mon sens de l'esthétique demandait que je recherchasse la manière la plus symétrique de positionner ce quatrième interrupteur en fonction des trois autres : spontanément, quand j'ai emménagé dans cette maison, j'ai décidé que la « bonne » position pour celui-ci était d'être dans la position telle qu'il y ait un nombre pair d'interrupteurs dans chaque position (ou, si on préfère, que le quatrième soit le ou exclusif des trois premiers ; ou encore : si les trois premiers sont dans une même position, le quatrième doit l'être aussi, tandis que si les trois premiers sont dans deux positions différentes, le quatrième adoptera la position minoritaire pour la rendre égale en nombre à l'autre). J'ai donc pris l'habitude, pendant tout le temps que j'ai habité là, de positionner cet interrupteur inutile selon cette considération esthétique de symétrie. Et le plus bizarre, c'est que je ne saurais pas dire exactement en quoi ce système est le plus symétrique, mais je suis tout à fait persuadé que c'est la bonne réponse à la question comment choisir la position du quatrième interrupteur en fonction de celle des trois autres pour maximiser la symétrie ? — et que la grande majorité de ceux qui se donneraient la peine de réfléchir à cette question seront d'accord avec moi. Ce qui est sûr, aussi, c'est que ce système est idiot, ou en tout cas peu économique, du point de vue pratique, puisqu'il signifie que, si je suis seul à la maison (donc que personne ne dérange mon arrangement), je vais devoir actionner le quatrième interrupteur à chaque fois que j'en actionne un autre.

Cette obsession pour la symétrie n'affecte pourtant pas tout ce que je fais, et je ne saurais pas expliquer pourquoi je m'en préoccupe dans certaines choses et pas dans d'autres. Je ne dispose pas mes couverts de façon spécialement symétrique, par exemple (en tout cas, je ne mets pas mon verre au milieu de mon assiette). En fait, je ne recerche pas tant les symétries géométriques que structurales, abstraites, conceptuelles, mais la symétrie géométrique peut bien sûr en faire partie. Pour donner un exemple, dans une vidéo récente, j'ai été amené à choisir comment colorier les faces d'un dodécaèdre — donc comment choisir 12 couleurs et comment les attribuer aux 12 pentagones — et j'ai passé sans doute plus de temps pour faire ce choix totalement sans importance que pour le reste de la vidéo (et d'ailleurs, je ne suis pas content du choix que j'ai fait[#]). Je serais curieux de savoir ce que d'autres mathématiciens et/ou passionnés de symétries auraient fait comme choix !

[#] Précisément : on peut trouver quatre sommets du dodécaèdre qui forment un tétraèdre régulier, j'affecte arbitrairement à chacun une couleur parmi {rouge, jaune, vert, bleu}, puis les trois pentagones se rencontrant en ce sommet reçoivent la couleur en question dans une variante respectivement claire, moyenne ou foncée selon que le pentagone contient le segment reliant le sommet au sommet auquel j'ai attribué la couleur respectivement suivante, opposée ou précédente dans l'ordre cyclique sur {rouge, jaune, vert, bleu}. Les couleurs claire moyenne et foncée pour le rouge ont dans l'espace RGB les valeurs (255,128,128), (192,64,64) et (128,0,0) ; pour le vert et le bleu, on fait les changements évidents. Le jaune est le max composante par composante entre le rouge et le vert : vous ne pouvez pas savoir combien j'ai hésité entre ce choix-là (plus agréable visuellement) et celui consistant à espacer de façon égale le rouge, jaune, vert et bleu sur l'hexagone des teintes RGB (c'est-à-dire, disons, garder le jaune et le bleu, mais remplacer le vert par une couleur à mi-chemin entre vert et cyan, et le rouge par une couleur à mi-chemin entre le rouge et le magenta).

Un problème avec la symétrie est qu'on est parfois obligé de la briser. Pour prendre un exemple parfaitement trivial, le cycle des sept jours de la semaine (lundi, mardi, mercredi, jeudi, vendredi, samedi, dimanche) a une symétrie cyclique d'ordre 7 : mais si je veux écrire les jours de la semaine comme je viens de le faire dans la parenthèse précédente, il faut bien que j'en choisisse un par lequel commencer, ce qui brise la symétrie. (D'ailleurs, il y a deux conventions culturelles sur la façon de briser ce cycle : commencer le lundi ou commencer le dimanche. Sinon, je peux bien sûr écrire les jours sur le bord d'un cercle pour éviter de briser la symétrie, encore qu'il faudra bien décider comment positionner ce cercle sur une feuille de papier ou une page Web.) Mais pour des structures mathématiques plus complexes, ou en tout cas plus symétriques, se demander ce qu'on doit briser comme symétries, et quelle est la façon la moins désagréable de le faire, peut être un problème délicat : je m'en étais rendu compte en faisant des petits jeux de taquin autour du groupe de Mathieu M24 (voir ici, ic et mes tentatives à ce sujet, seule la dernière étant vaguement satisfaisante à mes yeux). Le problème est que la structure sous-jacente à M24 (le système de Steiner (5,8,24)) est un objet immensément symétrique, c'est bien ce que traduit le groupe de Mathieu, et la représentation graphique choisie, que ce soit un tableau de taille 6×4 ou 8×3 ou 12×2, va forcément casser presque toute cette symétrie — encore faut-il trouver la façon la moins déplaisante de le faire. Même des structures a priori plus simples, comme les plans projectif sur les corps finis, sont difficiles à représenter de façon satisfaisante. Heureusement, il y a des structures mathématiques dont la symétrie se prête mieux à une représentation graphique, et j'en ai aussi fourni des exemples sur ce blog (comme ici, ou tous les endroits où j'ai parlé de E₈, comme — la vidéo liée depuis cette dernière entrée est d'ailleurs intéressante, parce qu'on montre un objet qui a énormément de symétries passer par toutes sortes de représentations graphiques avec des symétries différentes, donc des façons différentes de briser la symétrie du tout).

Mais il y aussi un lien entre mon obsession pour la symétrie et ma fascination artistique pour l'ésotérisme. J'expliquais cette dernière dans une entrée récente de la façon suivante :

Et il y a un autre intérêt à mes yeux, que tout le monde ne partage pas : c'est l'aspect artistique de la théorie crackpot. Car certaines peuvent être comparées à des œuvres d'art par la fascination qu'elles dégagent. C'est un côté qu'Umberto Eco a beaucoup exploré (notamment dans Le Pendule de Foucault), et sur lequel Dan Brown (s'il existe vraiment) a fait beaucoup d'argent. Je parle soit de mettre en scène des crackpots dans une œuvre de fiction, soit de considérer la théorie crackpot comme un cadre dans lequel pourrait se dérouler une œuvre de fiction (comme de la science-fiction), soit encore d'utiliser un schéma ésotérique comme base pour une règle oulipienne (voyez ce qu'Italo Calvino fait avec le jeu de tarot dans Le Château des destins croisés ; on peut faire des choses semblables avec l'astrologie, l'alchimie, etc.), soit enfin de considérer la théorie elle-même comme de l'art, obéissant à ses propres règles ; ou, bien sûr, un mélange de tout ça. J'ai déjà expliqué que les frontières entre l'art et la crackpoterie peuvent être poreuses, et aussi que la vérité n'est pas forcément ce qui est le plus intéressant du point de vue artistique.

Or il se trouve que les ésotéristes ont aussi une certaine fascination pour la symétrie. N'ayant pas de réalité à laquelle se confronter (la réalité a elle-même ses symétries, mais il faut une certaine habileté aux physiciens pour les découvrir), les astrologues, par exemple, peuvent inventer toutes les symétries qu'ils veulent dans leurs systèmes mystiques. C'est d'ailleurs en cherchant une correspondance ésotériques entre les planètes et les solides réguliers que Kepler a découvert, presque par accident, les lois qui régissent réellement le mouvement des planètes — et c'est avec beaucoup de regret qu'il a abandonné le cercle et son élégante symétrie en faveur de l'ellipse, moins satisfaisante pour l'esprit mais qui a l'avantage d'être correct. Mais sinon, quand la réalité n'a pas toute l'élégance qu'on voudrait, on peut toujours se réfugier dans la fiction.

J'avais beaucoup aimé, quand j'étais ado, le jeu informatique Ultima VI et son successeur Ultima VII, et c'est un des rares jeux informatiques auxquels j'aie vraiment accroché et joué assez longtemps. Or une des caractéristiques du monde de la série Ultima est le système des « huit vertus » : l'idée, expliquée plus en détails ici, est que trois principes fondamentaux (Vérité, Amour et Courage) créent, par leur présence ou absence, huit vertus (les huit combinaisons booléennes des trois principes : Honnêteté, Compassion et Valeur pour un seul principe, Justice, Sacrifice et Honneur pour deux des trois, Spiritualité pour les trois, Humilité pour aucun des trois). Manifestement, les concepteurs du jeu avaient le même genre de sens de l'esthétique et de la symétrie que moi ; par exemple, les couleurs associées aux huit vertus (et qui réapparaissent régulièrement dans le jeu) sont les huit couleurs déterminées par les combinaisons correspondantes d'un système de couleurs primaires (la Vérité étant associée au bleu, l'Amour au jaune, le Courage au rouge), ce qui est exactement le genre de choses que j'aurais fait. Sauf que j'aurais utilisé les couleurs primaires RGB à la place (pas seulement parce que ça fait des couleurs secondaires plus jolies, mais aussi parce qu'elles correspondent, du coup, aux pierres précieuses colorées les plus célèbres, rubis, émeraude et saphir ; je pourrais évoquer trois couleurs héraldiques, gueules, sinople et azur, mais il ne faut jamais parler sur le Web d'héraldique ou de vexillologie de peur de voir débarquer des légions de pédants pénibles). Enfin, je ne sais pas pourquoi je dis que j'aurais utilisé les couleurs primaires RGB, parce que je les ai utilisées dans quantité d'œuvres de fiction faisant plus ou moins référence à l'ésotérisme ou simplement à des considérations d'esthétiques proches de mes idées sur la symétrie. Notamment dans les armoiries (euh, non, pas les armoiries — cf. la dernière phrase de la parenthèse précédente — disons le logo) de la ville de Tekir dans le roman La Larme du Destin que j'ai écrit quand j'étais petit, et qui sont des anneaux borroméens rouge, vert et bleu. D'ailleurs, quand on voit la page Wikipédia en question, on s'aperçoit que je ne suis certainement pas le premier ni le dernier à trouver que les anneaux borroméens sont élégants par leur symétrie, et que cette façon particulière de les colorier leur convient bien.

Je pourrais multiplier les exemples. Avant de jouer à Ultima VI, j'avais lu le Livre dont Vous Êtes le Héros Les Sept Serpents de Steve Jackson, où les sept créatures éponymes sont affectées au feu, à la terre, à l'eau, à l'air, à la lune, au soleil et au temps : j'ai repris cette affectation, à l'ordre et un petit changement près, dans le scénario du jeu informatique Légendes, que j'ai passé un bon bout de mes années lycée à écrire avec deux amis (on peut le récupérer ici, et il doit être jouable avec DOSbox ou équivalent). Les variations ésotériques autour des éléments, qu'ils soient au nombre de quatre, cinq, cinq différents, sept comme je viens de le citer, ou encore huit, sont innombrables. Quelque part, comme Kepler avec son ellipse, on ne peut que se sentir désolé que la science moderne ait remplacé ces systèmes esthétiquement satisfaisants et tragiquement faux par un système irrégulier avec plus d'une centaine d'éléments parmi lesquels des choses aussi absurdement bizarres que le praséodyme ou le thulium. (Franchement, si vous êtes en train de jouer à un jeu de rôles et que le maître du jeu vous dit que vous rencontrez un élémental de praséodyme, ça ne le fait pas. Je n'ai rien contre les terres rares, certains de mes meilleurs amis sont des terres rares, mais à moins qu'il y ait des eaux rares, des airs rares et des feux rares parmi les éléments, elles ne sont ni très élégantes ni très symétriques.)

Sinon, bien sûr, il y a le Yi Jing (et certains de ses épigones comme le Tai Xuan Jing — une sorte de Yi Jing ternaire plutôt que binaire), qui a fasciné des générations de mystiques, de philosophes et d'artistes par sa combinatoire. (Même si le manque de logique de l'arrangement traditionnel des hexagrammes Yi Jing ne peut qu'énerver celui qui, comme moi, recherche partout la symétrie.) Combinatoire qui procède de la symétrie simple mais incontournable des principes fondamentaux de la dualité taoiste, manifeste dans son si célèbre symbole à la beauté intrigante.

Bref, les mystiques et ésotéristes de toutes sortes, qu'ils croient vraiment en leurs théories ou qu'elles soient une construction artistique, ont aussi tendance à rechercher la symétrie, et je suis en bonne, ou devrais-je dire en mauvaise, compagnie.

Néanmoins, en tant que mathématicien, je me désole un peu que la symétrie impliquée par ces différents jeux ésotériques soit toujours quelque chose de très simple : dans la mesure où on arrive à la formaliser, il s'agit typiquement d'un groupe cyclique, ou diédral, ou peut-être le groupe symmétrique tout entier, mais c'est tout. Quel manque d'originalité ! Merde, quoi, si une théorie physique a la contrainte de devoir coller avec l'expérience, une théorie magique n'a que la contrainte d'être élégante et satisfaisante pour l'esprit, alors la moindre des choses est de le faire bien. [Heptagramme mystique] Par exemple, si votre système ésotérique a sept éléments (ou sept planètes, ou je ne sais quoi), et que vous voulez un système de domination / transmutation / quidlibet entre ces sept entités, il devrait être donné par le graphe orienté de Paley d'ordre 7, qui a le maximum de symétries (21) pour un tournoi sur sept objets (cf. la figure à droite, si elle s'affiche : on peut envoyer n'importe quelle flèche sur n'importe quelle autre flèche par une unique symétrie). S'ils faisaient correctement leur boulot, les astrologues, alchimistes et autres auraient dû découvrir plein d'objets mathématiques intéressants.

(Hum, en écrivant ça, j'ai tout d'un coup peur que des lecteurs aient un degrémètre mal calibré et me prennent au sérieux : la phrase précédente devrait mesurer 2.236±0.015 à votre degrémètre, sinon il est à réviser.)

Ceci m'amène à poser une question (sérieuse) et à proposer un défi (amusant). La question est la suivante : quelles sont les structures mathématiques (combinatoires) les plus complexes qui aient été introduites dans le cadre d'une recherche non-mathématique d'élégance et de symétrie ? Les hexagrammes du Yi Jing seraient un exemple intéressant si ce n'était que, comme je l'ai mentionné, leur ordre traditionnel est ad hoc ; c'est une des raisons pour lesquelles j'ai mentionné le Tai Xuan Jing : il semble que ses tétragrammes soient ordonnés selon le système ternaire (modulo l'ignorance du nombre zéro et donc le fait qu'il faudrait numéroter de 0 à 80 au lieu de 1 à 81), mais bon, la traduction que j'ai de ce texte est tellement mauvaise et bourrée d'erreurs que c'est impossible d'en être vraiment sûr. Y a-t-il une occurrence quelconque d'un graphe un peu intéressant (comme le tournoi de Paley d'ordre 7 que je viens de mentionner) dans un texte mystique ancien ? L'écriture décimale positionnelle peut aussi compter comme une structure mathématique intéressante, mais je ne sais pas dans quelle mesure elle a été inspirée par l'intérêt de représenter les longs cycles de la cosmogonie hindoue (par exemple le mahākalpa, ou durée de vie de Brahmā, de 311 040 000 000 000 = 100 × 12 × 30 × 2 × 1000 × 12000 × 12 × 30 ans), ou si c'est au contraire le fait de pouvoir écrire des nombres comme ça et les multiplier qui a conduit à inventer de tels cycles. (Néanmoins, ces nombres sont loin d'atteindre ceux que, par exemple, Archimède décrit dans L'Arénaire. Et ils ne semblent pas non plus associés à une structure combinatoire intéressante. Le calendrier maya, de ce point de vue-là, est déjà peut-être plus intéressant.)

Le défi, c'est, à supposer que la réponse à la question précédente est essentiellement négative, de combler ce manque. Autrement dit, d'inventer, comme une construction oulipienne, un système ésotérique — par exemple, les règles de la magie dans un monde imaginaire, un oracle tel que le Yi Jing, une théorie astrologique, une théologie ou cosmogonie, le Vrai Nom de Dieu, la musique qui amène la fin du monde, quelque chose de ce genre — dont la construction repose sur un objet mathématique un peu complexe et possédant une très grande symétrie. Mais attention, il faut prendre les symétries très au sérieux : par exemple, si on voulait introduire, disons, les douze signes du zodiaque, il faudrait prendre garde au fait que ceux-ci forment naturellement un 12-cycle et que la symétrie de ce 12-cycle doit être reflétée dans l'utilisation qui en est faite (à titre d'exemple, on ne doit pas utiliser les signes du zodiaque pour représenter le groupe de Mathieu M12 parce que ce dernier ne contient pas de 12-cycle ; on peut s'en servir, avec 12 autres symboles formant un autre 12-cycle, pour représenter M24, comme le montre le tableau ci-contre dont je vous laisse comprendre la logique, parce que M24 contient un produit de deux 12-cycles, mais encore faut-il trouver un narratif qui expliquerait quoi faire de cet agencement). J'avais proposé une piste possible (faisant intervenir E₈), mais ce n'est pas du tout évident d'en tirer vraiment quelque chose. Je pense que c'est un défi comparable en difficulté à celui d'écrire un roman basé sur le parcours hamiltonien d'un cavalier sur un échiquier (pour prendre un exemple, euh, complètement au hasard).

Only the 20 most recent entries were included above. Continue to older entries.

Seules les 20 plus récentes entrées ont été incluses ici. Continuer à lire les entrées plus anciennes.


Entries by month / Entrées par mois:

2015 Jan 2015 Feb 2015 Mar 2015 Apr 2015 May 2015 Jun 2015 Jul 2015 Aug 2015 Sep 2015
2014 Jan 2014 Feb 2014 Mar 2014 Apr 2014 May 2014 Jun 2014 Jul 2014 Aug 2014 Sep 2014 Oct 2014 Nov 2014 Dec 2014
2013 Jan 2013 Feb 2013 Mar 2013 Apr 2013 May 2013 Jun 2013 Jul 2013 Aug 2013 Sep 2013 Oct 2013 Nov 2013 Dec 2013
2012 Jan 2012 Feb 2012 Mar 2012 Apr 2012 May 2012 Jun 2012 Jul 2012 Aug 2012 Sep 2012 Oct 2012 Nov 2012 Dec 2012
2011 Jan 2011 Feb 2011 Mar 2011 Apr 2011 May 2011 Jun 2011 Jul 2011 Aug 2011 Sep 2011 Oct 2011 Nov 2011 Dec 2011
2010 Jan 2010 Feb 2010 Mar 2010 Apr 2010 May 2010 Jun 2010 Jul 2010 Aug 2010 Sep 2010 Oct 2010 Nov 2010 Dec 2010
2009 Jan 2009 Feb 2009 Mar 2009 Apr 2009 May 2009 Jun 2009 Jul 2009 Aug 2009 Sep 2009 Oct 2009 Nov 2009 Dec 2009
2008 Jan 2008 Feb 2008 Mar 2008 Apr 2008 May 2008 Jun 2008 Jul 2008 Aug 2008 Sep 2008 Oct 2008 Nov 2008 Dec 2008
2007 Jan 2007 Feb 2007 Mar 2007 Apr 2007 May 2007 Jun 2007 Jul 2007 Aug 2007 Sep 2007 Oct 2007 Nov 2007 Dec 2007
2006 Jan 2006 Feb 2006 Mar 2006 Apr 2006 May 2006 Jun 2006 Jul 2006 Aug 2006 Sep 2006 Oct 2006 Nov 2006 Dec 2006
2005 Jan 2005 Feb 2005 Mar 2005 Apr 2005 May 2005 Jun 2005 Jul 2005 Aug 2005 Sep 2005 Oct 2005 Nov 2005 Dec 2005
2004 Jan 2004 Feb 2004 Mar 2004 Apr 2004 May 2004 Jun 2004 Jul 2004 Aug 2004 Sep 2004 Oct 2004 Nov 2004 Dec 2004
2003 May 2003 Jun 2003 Jul 2003 Aug 2003 Sep 2003 Oct 2003 Nov 2003 Dec 2003