David Madore's WebLog: Mathematics

This WebLog is bilingual, some entries are in English and others are in French. A few of them have a version in either language. Other than that, the French entries are not translations of the English ones or vice versa. Of course, if you understand only English, the English entries ought to be quite understandable without reading the French ones.

Ce WebLog est bilingue, certaines entrées sont en anglais et d'autres sont en français. Quelques-unes ont une version dans chaque langue. À part ça, les entrées en français ne sont pas des traductions de celles en anglais ou vice versa. Bien sûr, si vous ne comprenez que le français, les entrées en français devraient être assez compréhensibles sans lire celles en anglais.

Note that the first entry comes last! Notez que la première entrée vient en dernier !

Index of all entries — Index de toutes les entréesXML (RSS 1.0) — Recent comments — Commentaires récents

Entries with category math / Entrées de la catégorie math:

(dimanche)

Matrice de report des voix : mes résultats

Je conclus (enfin, j'espère !, parce que je commence à en avoir un peu marre) la série des trois derniers posts (1, 2 et 3) avec les résultats promis.

D'abord, en petits caractères, voici de façon très détaillée la méthodologie que j'ai suivie.

Premièrement, le jeu de données. S'agissant de 2012, elles sont ici pour le 1er tour et pour le 2d ; s'agissant de 2007, elles sont ici pour le 1er tour et pour le 2d. Pour bien s'entendre, il y a 36791 lignes de données pour 2012, et 36698 pour 2007.

J'ai d'abord retiré tous les départements et autres collectivités d'outre-mer (mais gardé la Corse), au motif que les reports s'y effectuent sans doute de façon différente de la métropole, et aussi parce que certaines ne sont pas détaillées dans le fichier pour 2007. Ensuite, comme je voulais un fichier unifié entre 2007 et 2012, j'ai fusionné toutes les données selon les codes de département et de commune, en ne gardant que les clés qui étaient présentes à la fois en 2007 et 2012 : ceci implique que pour les communes qui ont fusionné entre les deux (par exemple 21084 Blessey et 21551 Saint-Germain-Source-Seine ont fusionné pour former 21084 Source-Seine), je n'ai gardé que la commune ayant le numéro donné à la commune fusionnée, et inversement en cas de scission (par exemple, je supprime des données de 2012 la commune de 52033 Avrecourt qui faisait en 2007 partie de 52332 Val-de-Meuse). Je supprime encore les 15 communes (05014 Barret-sur-Méouge, 05181 Villar-d'Arêne, 10298 Pont-sur-Seine, 14726 Vassy, 31019 Artigue, 31081 Bourg-d'Oueil, 39364 Montrond, 43122 Lissac, 50049 Besneville, 50105 Catteville, 50614 Le Valdécie, 63181 Joserand, 79076 La Chapelle-Saint-Laurent, 80197 Cizancourt et 86241 Saint-Rémy-sur-Creuse) dont la totalité des votes a été annulée par le Conseil constitutionnel sur l'un des quatre tours d'élection considérés. Au final, il reste 36538 lignes de données.

S'agissant des colonnes de données, je conserve, pour chaque élection : le nombre d'abstentions, le nombre de blancs+nuls, et le nombre de votes pour chaque candidat, le total étant toujours égal au nombre d'inscrits. Qui peut, en revanche, changer, même entre les deux tours d'une même élection, oui : mon fichier totalise 42057423 inscrits (sur 44472834 en vérité, c'est-à-dire surtout avec l'outre-mer) au premier tour en 2007, 42057755 au second tour (sur 44472733), et en 2012 : 43250761 inscrits (sur 46028542) au premier tour et 43253197 (sur 46066307) au second.

J'attribue à chaque commune et indépendamment pour chacune des deux élections, une répartition gauche-droite grossière, sur la base des suffrages exprimés au 1er tour, en sommant les voix des candidats que j'ai classés, de façon ad hoc, comme étant « de gauche » d'un côté, « de droite » de l'autre, les centristes comptant pour moitié de chaque côté. J'ai classé de cette manière : en 2007, Besancenot, Buffet, Schivardi, Bové, Voynet, Royal et Laguiller à gauche, Bayrou et Nihous au centre, de Villiers, Le Pen et Sarkozy à droite ; en 2012, Joly, Mélenchon, Poutou, Arthaud et Hollande à gauche, Cheminade et Bayrou au centre, Le Pen, Sarkozy et Dupont-Aignan à droite. Par exemple, ce score répartit Paris en 2007 à 48.8% à gauche (et donc 51.2% à droite) et en 2012 à 55.8% à gauche (et donc 44.2% à droite). Ce score ne sera pas utilisé directement mais simplement pour analyser plus finement les populations d'abstentionnistes et d'électeurs de Le Pen (l'idée étant que les électeurs de Le Pen ne sont pas vraiment les mêmes à Calais et à Cannes et n'ont pas le même comportement au second tour).

Je divise fictivement les populations d'abstentionnistes et de votants pour Le Pen au premier tour en deux dans les proportions données par la répartition gauche-droite grossière évoquée ci-dessus (par exemple, comme j'ai dit qu'à Paris en 2012 la répartition est de 55.8% à gauche et 44.2% à droite, je ferai deux sous-populations des abstentionnistes du premier tour avec 55.8% d'un côté et 44.2% de l'autre, et pareil pour les électeurs de Le Pen du premier tour). J'appellerai ces sous-populations des abstentionnistes de gauche et abstentionnistes de droite et de même électeurs de Le Pen gauche et électeurs de Le Pen droite, ce qui ne signifie pas que je préjuge des choses à leur sujet, encore moins leur vote, il s'agit juste de refléter l'environnement général où ils se trouvent pour modéliser la façon dont ils se comporteront au second tour.

J'ai donc divisé les électeurs du premier tour en N populations : il y a 16 populations en 2007 (une pour chacun des 12 candidats, sauf Le Pen qui en a récupéré deux, plus encore deux pour les abstentionnistes et une pour les blancs-ou-nuls), et 14 populations en 2012. Pour le second tour, je n'ai que 4 populations : les abstentionnistes, les votes blancs-ou-nuls, et les deux candidats. Pour éviter de s'ennuyer avec la variation du nombre d'inscrits, je multiplie les populations du second tour par le rapport d'inscrits pour faire comme si le nombre d'inscrits du second tour était égal à celui du premier tour : ce sera ça ma cible. (On aurait aussi pu imaginer créer une nouvelle population, les absents-au-premier-tour, mais je ne pense pas qu'ils soient suffisamment nombreux ou homogènes pour être modélisables de façon sensée.)

Maintenant, je vais chercher à trouver la matrice de report entre les N populations du premier tour et les 4 populations du second tour (ramenées proportionnellement au nombre d'inscrits du premier tour). Je cherche donc une matrice 4×N de nombres réels entre 0 et 1 (les N colonnes représentant la répartition des votes au second tour, en proportion, de chacune des populations du premier tour). Les contraintes exigées de cette matrice sont :

  • toutes les entrées sont comprises entre 0 et 1,
  • la somme de chaque colonne vaut 1 (i.e., la matrice est stochastique à gauche),
  • la matrice appliquée au vecteur total de chacune des N populations de premier tour pour toute la France doit donner le vecteur total des 4 populations de second tour (par exemple, pour 2012, la matrice appliquée au vecteur [abstention-gauche:3930068 abstention-droite:4126717 blancs-ou-nuls:648166 Joly:786363 Le-Pen-gauche:2923896 Le-Pen-droite:3397710 Sarkozy:9340798 Mélenchon:3899288 Poutou:399753 Arthaud:194859 Cheminade:84939 Bayrou:3173183 Dupont-Aignan:627892 Hollande:9717129] doit donner [abstention:7804808 blancs-ou-nuls:2076910 Hollande:17125029 Sarkozy:16244014]), ces deux vecteurs étant évidemment de même total à savoir le nombre d'inscrits du premier tour.

Les deux derniers points déterminent N+3 conditions linéaires indépendantes (une pour chaque colonne et une pour chaque ligne, sachant qu'une quelconque de ces conditions peut être éliminée comme découlant de toutes les autres).

Je cherche maintenant la matrice, vérifiant ces contraintes, qui parmi les matrices vérifiant ces contraintes réalise la plus petite somme des erreurs quadratiques sur toutes les communes (enfin, parmi les 36538 communes de mon tableau) : les erreurs étant la différence, en nombre total de voix, entre l'application de la matrice au vecteur donnant les populations de premier tour, et le vecteur de second tour (ramené au nombre d'inscrits du premier tour) — on somme donc les carrés des erreurs sur chacune des quatre composantes du vecteur et sur chacune des 36538 communes. Ce calcul est un problème de programmation quadratique en 4N variables, que j'ai résolu avec la fonction qp de GNU Octave.

On peut éventuellement ajouter une contrainte demandant que le report d'un candidat du premier tour qui est admis au second tour soit parfait sur ce candidat lui-même : je n'ai pas eu à ajouter cette contrainte pour 2012 (la solution trouvée vérifiait déjà cette contrainte) ; pour 2007, la solution vérifiait cette contrainte sur Nicolas Sarkozy, et seulement approximativement sur Ségolène Royal (la matrice trouvée reportait 3% des voix de Ségolène Royal du premier tour sur l'abstention au second tour, et seulement à 97% sur elle-même) : ajouter de force la contrainte ne changeait que de quelques pour cent les reports sur les autres candidats, une précision à laquelle je ne prétends de toute façon pas, donc je l'ai introduite pour plus de propreté.

Évidemment, pour indiquer les résultats finaux, il faut réagréger les populations qui ont été artificiellement séparées, c'est-à-dire les « abstentionnistes-de-gauche » et les « abstentionnistes-de-droite », et de même « Le Pen-gauche » et « Le Pen-droite ».

Par contre, je n'ai finalement pas agrégé ensemble dans les calculs les candidats trop semblables (Arthaud et Poutou, ou bien Cheminade avec les blancs-et-nuls), au motif que de toute façon les résultats calculés pour eux sont probablement dénués de sens de toute façon mais que les garder séparés dans les calculs permet peut-être d'obtenir de meilleurs résultats sur les autres candidats (après tout, tout prédicteur en entrée est bon à prendre, je suppose). J'agrège ces résultats uniquement dans le résultat que j'indique :

Pour 2012 :

1er tour→
↓2d tour
Abstentions Blancs+nuls + Cheminade Joly Le Pen Sarkozy Mélenchon Poutou + Arthaud Bayrou Dupont-Aignan Hollande
Abstentions 79% 0% 0% 23% 0% 0% 0% 0% 0% 0%
Blancs+nuls 0% 46% 0% 15% 0% 0% 40% 9% 44% 0%
Hollande 6% 43% 74% 6% 0% 98% 60% 42% 25% 100%
Sarkozy 15% 10% 26% 56% 100% 2% 0% 49% 31% 0%

Pour 2007 :

1er tour→
↓2d tour
Abstentions Blancs+nuls Besancenot + Schivardi + Laguiller Buffet Bayrou Bové + Voynet De Villiers Royal Nihous Le Pen Sarkozy
Abstentions 82% 0% 0% 0% 17% 0% 0% 0% 0% 0% 0%
Blancs+nuls 0% 75% 1% 0% 11% 1% 0% 0% 14% 9% 0%
Sarkozy 13% 0% 5% 0% 31% 0% 100% 0% 86% 85% 100%
Royal 5% 25% 94% 100% 41% 99% 0% 100% 0% 6% 0%

Évidemment, ces tableaux sont à prendre avec énormément de pincettes ! Pour avoir une idée de l'imprécision, on peut comparer le tableau pour 2007 ci-dessus avec celui donné dans une entrée précédente (où les principales différences étaient que (a) je n'avais pas scindé les abstentions et Le Pen, (b) je n'avais pas imposé les contraintes linéaires sur les lignes de la matrice, et (c) je n'avais pas exclu l'outre-mer) : je pense que mon nouveau tableau est un poil meilleur, mais il ne l'est sans doute pas énormément, donc il faut prendre l'énorme différence dans les scores de reports de Frédéric Nihous comme signifiant simplement on n'en sait rien (même si le nouveau tableau suggère quand même plutôt que son électorat était de droite). Évidemment il est invraisemblable que l'électorat de Bové et Voynet se soit reporté à 99% sur Ségolène Royal en 2007, ou celui de Mélenchon à 98% sur Hollande en 2012, ou autres colonnes de ce genre, donc ces reports doivent simplement être considérés comme signifiant que l'algorithme a correctement classifié ces candidats comme étant de gauche, ou a contrario De Villiers comme étant de droite (on pourra m'objecter que ma méthodologie supposait de toute façon de classifier a priori les candidats grossièrement à gauche ou à droite, mais en fait les scores dont je parle sont relativement robustes à cette classification).

(mercredi)

Encore des considérations sur les statistiques électorales

Pour ceux qui auraient la flemme de lire les deux entrées précédentes (ici et ), la question qui m'intéresse est la suivante : peut-on, à partir des données électorales détaillées des deux tours d'une élection présidentielle, estimer statistiquement la matrice de report des voix d'un tour sur l'autre, c'est-à-dire, la proportion de chacun des types d'électeurs du premier tour (électeurs de chacun des candidats + nuls + abstentionnistes) qui a eu tel ou tel vote au second tour (l'un des deux candidats, ou le nul, ou l'abstention) ? Je voudrais faire cette analyse pour les élections présidentielle de 2007 et de 2012[#].

Des commentaires éclairants sur les deux dernières entrées font que j'y vois plus clair : d'abord concernant la terminologie, on parle d'inférence écologique parce qu'il s'agit de reconstituer des comportements individuels à partir d'agrégats (on sait simplement le nombre total de votes de chaque type au premier et au second tour dans chacune des ∼37000 communes de France). Ce type d'inférence est hasardeux en général, et l'idée naïve d'appliquer une simple régression linéaire peut donner des résultats aberrants ou faux quoique apparemment plausibles. Un exemple célèbre du paradoxe écologique est celui souligné en 1950 par W. Robinson, qui observe qu'en faisant une régression entre (état par état) le nombre de personnes nées à l'étranger et le nombre de personnes sachant lire et écrire sur les données du recensement de 1930 aux États-Unis, il observe une corrélation positive, i.e., plus un état compte de personnes nées à l'étranger, plus il compte de personnes sachant lire et écrire : peut-on en conclure que les personnes nées à l'étranger savent plus lire et écrire (dans la population des États-Unis de 1930) ? non, l'explication est simplement que les personnes nées à l'étranger et ayant immigré aux États-Unis ont eu tendance à s'installer dans des états où la population (native) savait plus lire et écrire, par exemple parce que ces états étaient plus riches. Ce texte résume un peu le problème ainsi que différents éléments de réponse.

Les deux problèmes que je répertoriais dans l'entrée précédente sont : primo, que le nombre de coefficients que je cherche à estimer est important et que les données ne sont pas assez nombreuses, ou surtout pas assez dispersées pour permettre une estimation raisonnable (un commentateur me signale que la taille de l'échantillon pour avoir des coefficients peu bruités croît exponentiellement avec le nombre de coefficients à déterminer) ; secundo, qu'on a des effets que j'appelle non-linéaires et qui sont en vérité la même chose que le paradoxe écologique décrit ci-dessus : les abstentionnistes du premier tour, pour ceux qui se mobilisent au second tour, par exemple, n'ont pas le même profil dans les communes qui votent globalement à gauche que dans celles qui votent globalement à droite (si on y réfléchit, il s'agit du même phénomène que dans l'exemple de Robinson mentionné ci-dessus : une hétérogénéité des populations concernées).

Différentes méthodes ont été proposées pour essayer de faire quand même cette fameuse inférence écologique. La méthode consistant à faire une simple régression linéaire a été analysée par L. Goodman dans les années '50, qui montre (si je comprends bien, parce que je n'ai pas pu avoir accès aux articles) qu'elle fonctionne bien sous des hypothèses qui, dans mon cas, doivent dire grosso modo que la répartition des reports de chaque type d'électeurs du premier tour n'est pas corrélé à la configuration des votes dans la commune (comme je le signale ci-dessus, c'est sans doute assez faux, par exemple dans le cas de l'abstention ou dans une moindre mesure du vote pour Le Pen ; ça me semble plus plausible pour le vote Bayrou). Divers statisticiens ont eu, comme moi, l'idée de borner les coefficients et de faire une régression linéaire contrainte (je n'ai regardé que très sommairement, mais ce papier et celui-là ont l'air de faire des choses de ce genre : le second, d'ailleurs, semble extrêmement proche de ce que j'ai fait).

Des méthodes plus sophistiquées existent : on me signale que Gary King en a écrit tout un livre, où il propose une « solution » au problème ; comme je n'ai pas accès à ce livre, je dois me contenter d'en lire des recensions et commentaires, et des résumés de la méthode de King, et je note que cette dernière ne fait pas l'unanimité. Voir par exemple ce texte, écrit par un critique. Le principal problème que j'ai, moi, est d'ordre pratique : l'implémentation de la méthode pour [le programme de statistiques] R, écrite par King lui-même, est limitée à des matrices 2×2 (or celle qui m'intéresse est 4×14 pour 2007 et 4×12 pour 2012) ; de même, ce package, qui implémente une autre méthode « sophistiquée » d'inférence écologique, est limité de la même façon ; et toutes ces méthodes sont algorithmiquement bien trop pénibles pour être implémentées de novo en un temps raisonnable. Donc il faut bien que je me contente de quelque chose de plus simple.

D'un autre côté, je pense qu'il est raisonnable, pour le problème considéré, de se contenter de quelque chose de plus simple : notamment parce que les populations des différents votes au premier tour sont relativement homogènes quand il s'agit de prévoir le vote au second tour (contrairement aux exemples classiques de « paradoxe écologique » où on relie des variables très différentes et mal corrélées). Un exemple extrême est évidemment la population d'électeurs au premier tour d'un des candidats qui passent au second tour : il est évident qu'une énorme majorité d'entre eux votent encore pour le même candidat au second tour — ici, la prédiction est presque parfaite.

Je défends donc finalement mon idée de rester sur une régression linéaire, avec trois principales idées que j'ai déjà exposées pour améliorer la qualité des chiffres :

  1. Contraindre les coefficients de la régression à être entre 0 et 1 et de somme 1 pour chaque colonne. (Comme je l'ai signalé, je ne suis pas le premier à faire ça.) Autrement dit, j'effectue une régression linéaire contrainte (je minimiser la somme des erreurs quadratiques parmi les matrices vérifiant les contraintes ci-dessus). L'idée sous-jacente est que certains coefficients sont connus trop grossièrement, leur valeur calculée naïvement peut être délirante, cette contrainte assure qu'ils seront tronqués à quelque chose de raisonnable (ce qui, du coup, assure de répercuter une erreur déraisonnable sur d'autres coefficients).
  2. Regrouper les candidats du premier tour trop petits et ayant un profil sociologique proche (ça ne sert à rien d'essayer de déterminer séparément les reports du vote pour Poutou et du vote pour Arthaud, ou du vote pour Cheminade et du vote blanc/nul).
  3. À l'inverse, scinder les populations du premier tour qui risquent d'être sociologiquement trop inhomogènes (abstentionnistes et vote Le Pen) en sous-populations artificielles dans les mêmes proportions qu'une proportion gauche-droite approximative sur la commune. Ceci permet (au prix de nouveaux coefficients à déterminer !) d'introduire un effet non-linéaire relativement raisonnable et donc de diminuer l'effet d'inhomogénéité de ces populations (et le « paradoxe écologique » qui va avec).

Je donnerai les chiffres que j'obtiens dans la prochaine entrée (qui sera, j'espère, la dernière sur ce sujet !), parce que je suis fatigué d'avoir écrit tout ça. Mais disons qu'ils sont assez plausibles (évidemment, il faut imaginer qu'ils ne sont que des ordres de grandeur !) et qu'ils prédisent, par exemple, que les électeurs de François Bayrou du premier tour se sont plus reportés sur Sarkozy que sur Hollande en 2012, alors qu'en 2007 ils s'étaient plus reportés sur Royal que sur Sarkozy — or ceci est conforme aux sondages directs sur la question ainsi qu'aux analyses des politologues.

[#] J'ai fini par obtenir les données du second tour de 2012, qui étaient effectivement sur RegardsCitoyens.org comme on me l'avait soufflé, mais bien cachées et pas à l'endroit où on les attendait. Elles sont par ailleurs un peu incomplètes puisqu'il y manque la Corse, mais peu importe.

(lundi)

De la difficulté de faire une régression linéaire contrainte en politique

Dans l'entrée précédente, j'ai suggéré l'idée de faire une régression linéaire multivariée entre les deux tours des résultats de l'élection présidentielle, c'est-à-dire, essayer de calculer quelle combinaison linéaire des résultats du premier tour de la présidentielle (considérés comme un vecteur de N+2 nombres, à savoir le nombre de voix pour chacun des N candidats + bulletins blancs/nuls + abstentions) approche le mieux, sur l'ensemble des communes de France, les résultats du second tour (considérés comme un vecteur de 4 nombres, pour 2 candidats + blancs/nuls + abstentions). J'espérais[#] — un peu naïvement comme on va le voir — que ce calcul permettrait de connaître la matrice de reports des voix, c'est-à-dire, la proportion, dans chacun des N+2 votes possibles au premier tour, des 4 votes possibles au second tour : par exemple savoir que les électeurs de François Bayrou au premier tour se seraient reportés à 30% sur l'abstention, à 5% sur le vote blanc, à 35% sur Nicolas Sarkozy et à 30% sur François Hollande (chiffres imaginaires mais pas aberrants).

Les résultats du second tour n'étant pas encore disponibles sur www.data.gouv.fr au moment où j'écris, je me suis dit que j'allais m'exercer sur les résultats de 2007 (pour calculer les reports entre les deux tours de celle-ci soit, de façon plus osée, entre 2007 et 2012). Je passe sur les différentes petites crottes de ragondin rencontrées en chemin pour préformater les données sous une forme sympathique (par exemple les communes qui ont eu la fort sotte idée de fusionner ou de se séparer ; je passe aussi sur le fait qu'il n'y a pas de version détaillée des résultats de Paris, parce que Paris a le malheur d'être une unique commune). Disons que j'ai un gros tableau de données raisonnables, d'où j'ai retiré tout ce qui me chagrine.

Il n'est alors pas difficile de faire les régressions linéaires, avec un programme comme R[#2]. C'est-à-dire trouver les (2+2)×(12+2)=56 coefficients tels que, pour chaque vote possible au second tour, le nombre de ces votes soit au mieux prédit par la combinaison, affectée par les coefficients correspondants, des 14 votes possibles au premier tour (il y avait 12 candidats en 2007, ce qui fait 14 avec blancs et abstention). Il est assez facile de se convaincre, dans la mesure où le nombre d'inscrits ne change pas entre les deux tours (ce qui est quasiment vrai — pas rigoureusement, et ça fait partie des petites crottes de ragondin — mais suffisamment pour qu'on puisse faire comme si), que la somme des coefficients sur une colonne de cette matrice (c'est-à-dire pour chaque vote possible de premier tour) vaut 1. Maintenant, j'espérais que quelque chose ferait que ces coefficients seraient aussi tous positifs, et auraient l'interprétation naïve que j'ai décrite ci-dessus comme matrice de transfert des voix. Or ce n'est pas le cas, et voici la matrice des coefficients :

1er tour→
↓2d tour
Abstentions Blancs/nuls Besancenot Buffet Schivardi Bayrou Bové Voynet De Villiers Royal Nihous Le Pen Laguiller Sarkozy
Abstentions 0.8519 −0.4145 0.1060 0.0578 −0.2845 0.1705 0.5994 −0.5476 0.0281 0.0002 −0.5410 −0.0405 0.3789 0.0047
Blancs/nuls 0.0035 0.4859 0.1085 0.0113 0.5714 0.0867 −0.1229 0.0775 0.0596 −0.0019 0.2442 0.0119 0.2184 0.0153
Sarkozy 0.0910 0.5596 −0.0944 −0.0309 0.8717 0.3499 0.0586 0.9280 0.9056 −0.1129 0.7721 0.9979 −1.2629 1.0427
Royal 0.0532 0.3785 0.8656 0.9573 −0.1743 0.3938 0.5116 0.5719 0.0021 1.1131 0.5122 0.0283 1.6956 −0.0627

Le fit linéaire est excellent : même si je ne sais pas lire exactement les données de marges d'erreur que R me sort, je sais lire qu'elles sont très faibles (par exemple s'il me dit que 99.99% de la variance est expliquée par ce modèle linéaire, ou que dans 50% des communes l'écart est inférieur à 6 voix) ; bref, ces coefficients ont un sens. Mais pas exactement celui que je veux !

Il est relativement concevable que 85% des abstentionnistes du premier tour en 2007 l'aient encore été au second, tandis que 9% seraient allés voter Sarkozy et 5% Royal ; ou que les électeurs de Bayrou se soient reportés à 17% sur l'abstention, à 9% sur le vote blanc, à 35% sur Sarkozy et à 39% sur Royal : j'y crois assez ; ou encore que, comme le tableau le suggère, ceux de Villiers aient voté à 91% pour Sarkozy au second tour tandis que 3% se seraient abstenus et 6% auraient voté blanc. Mais il est impossible que 93% des électeurs de Voynet aient voté Sarkozy au second tour, 57% pour Royal, et un pourcentage négatif, −55%, se soient abstenus.

C'est assez perturbant : ce tableau montre des chiffres relativement sensés, dans un monde où un vote négatif serait possible. :-)

Bon, ben si les chiffres ne veulent pas d'eux-mêmes être raisonnables, il n'y a qu'à les forcer à l'être : je peux demander à chercher, après tout, quelle est la matrice à coefficients positifs, où chaque colonne a pour somme 1, et qui réalise la meilleure approximation linéaire parmi celles vérifiant ces contraintes : on parle de régression linéaire avec contraintes. Il s'agit là d'un problème d'optimisation quadratique (avec contraintes linéaires, et terme quadratique positif défini) : quelque chose qu'on sait très bien faire. En principe, R a ce qu'il faut pour y arriver : mais nouvelle petite crotte de ragondin, ce package ne marche pas chez moi, il prétend que mes contraintes (=la positivité des variables) sont impossibles à satisfaire, je ne sais pas ce qu'il a fumé. À la place, j'ai dû passer par Octave, qui est encore plus pénible à manipuler et que je connais encore moins, mais enfin qui sait faire le boulot (quand on réussit à exporter les matrices du problème de R vers Octave, ce qui n'est pas la chose la plus agréable qui soit).

Voilà ce que ça donne :

1er tour→
↓2d tour
Abstentions Blancs/nuls Besancenot Buffet Schivardi Bayrou Bové Voynet De Villiers Royal Nihous Le Pen Laguiller Sarkozy
Abstentions 0.8424 0.0000 0.0000 0.0000 0.0000 0.1679 0.0275 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
Blancs/nuls 0.0424 0.2600 0.0000 0.0000 1.0000 0.1093 0.0000 0.0000 0.0026 0.0000 0.5503 0.0004 0.0000 0.0000
Sarkozy 0.0495 0.0900 0.0000 0.0000 0.0000 0.3283 0.0000 0.0000 0.9974 0.0000 0.1999 0.9996 0.0000 1.0000
Royal 0.0657 0.6500 1.0000 1.0000 0.0000 0.3945 0.9725 1.0000 0.0000 1.0000 0.2498 0.0000 1.0000 0.0000

De nouveau, il est relativement raisonnable de penser que les électeurs de François Bayrou au premier tour en 2007 se seraient divisés au second tour entre l'abstention à 17%, le vote blanc à 11%, Sarkozy à 33% et Royal à 39% (les chiffres diffèrent très peu du tableau précédent, et sont toujours crédibles). À la limite, il n'est pas totalement délirant d'imaginer que, avec la précision des mesures, près de 100% des électeurs de Marie-George Buffet, ou même d'Olivier Besancenot, se soient reportés sur Ségolène Royal au second tour, comme d'ailleurs les électeurs du premier tour de Ségolène Royal elle-même. Mais alors croire que les électeurs de Gérard Schivardi au premier tour auraient tous voté blanc au second (sans s'abstenir, mais vraiment voté blanc), ou croire que ceux qui ont voté blanc au premier tour auraient été 65% à voter pour Royal au second, ce n'est, comme qui dirait, pas très crédible. Je suis aussi amusé du 99.96% de report calculé de Le Pen sur Sarkozy (les 0.04% restants ayant censément voté blanc, c'est très précis) !

Voici donc la question à 100¤ : ces chiffres ont-ils une quelconque signification en rapport avec la réalité, ou un quelconque intérêt pour l'analyse politique ? À défaut, y a-t-il un autre traitement statistique que je puisse mener pour en obtenir de meilleurs ? Et en tout état de cause, quand (et si) le ministère de l'intérieur se sortira les doigts du c** pour fournir les chiffres complets du second tour de 2012 en Open Data, sera-t-il intéressant de mener la même analyse ou doit-on considérer que c'est du temps perdu ?

[#] Pourquoi espérer ça ? Parce que si les reports de voix du premier vers le second tour se font à peu près de la même façon partout, et notamment, indépendamment de ce pour quoi votent les autres électeurs de la commune, ce qui a priori ne semblait pas une hypothèse délirante, alors on devrait bien retomber dessus en faisant une régression linéaire.

[#2] Programme au nom incroyablement stupide quand on pense à la difficulté que cela cause de chercher dans Google des informations sur un truc à une lettre.

(vendredi)

Le jugement de paris : comment établir une cote ?

Une obscure province des États-Unis d'Europe va bientôt tenir l'élection de son gouverneur. Les deux candidats encore en course s'appellent M. Sarlande et M. Holkozy. Toutes sortes d'instruments sont utilisés pour mesurer l'état de l'opinion de l'électorat avant cette échéance (sondages, pronostics de politologues et autres boules de cristal), mais au final on aimerait avoir des résultats lisibles sous la forme M. Sarlande a x% de chances d'être élu gouverneur, M. Holkozy a (100−x)% de chances. Déjà, il est un peu difficile de donner un sens à une telle affirmation : si je prétends que M. Sarlande a 85% de chances et M. Holkozy en a 15%, que l'un ou l'autre soit élu, on ne pourra pas me dire que j'avais tort (après tout, les deux nombres étaient strictement positifs) ; or l'expérience (=l'élection) n'a lieu qu'une fois, on ne va pas la répéter d'une manière qui permette de donner un sens statistique aux probabilités.

On pourrait cependant faire des statistiques pour savoir si je suis un fin analyste politique. Si, par exemple, à chaque fois qu'il y a une élection je fais un pronostic du style le candidat 1 a une probabilité q1 d'être élu, le candidat 2 en a q2, le candidat 3 en a q3, etc. (la somme ∑i(qi) des probas annoncées valant 1), si c'est le candidat numéro i qui est effectivement élu on m'attribue un score de fiabilité de valeur log(n)+log(qi) où n est le nombre total de candidats. (Pourquoi log(qi) ? Parce qu'il est facile de se convaincre que la stratégie optimale pour maximiser son succès dans ce contexte, si on connaît les « vraies » probabilités pi, consiste à annoncer effectivement qi=pi, auquel cas on a une espérance de gain de l'opposé de l'entropie de Shannon de la distribution, plus le terme ajouté log(n) (=l'entropie d'une distribution uniforme sur les candidats) qui est là pour assurer qu'on ne gagne ni ne perd rien en faisant la prévision triviale de donner la même proba qi=1/n à chaque candidat.) Par exemple, quand je prédis 85% de chances à M. Sarlande et 15% à M. Holkozy, il convient d'ajouter 0.77 logons à mon score de fiabilité si c'est le premier qui est élu et d'y retranche 1.74 logons si c'est le second qui est élu. Et si mes chiffres sont corrects, mon espérance de score est de 0.39 logons. (Le mot logon indiquant que j'ai pris des logs base 2.) Si on somme ce score fiabilité sur un grand nombre de prévisions, on peut comparer mes capacités d'analyse à celles d'autres analystes. Je me dis souvent qu'on devrait faire des concours de prévisions de ce genre entre analystes politiques.

Bon, maintenant, comme les gens aiment bien jouer aux jeux de hasard, inévitablement, on va vouloir transformer cette question d'évaluer les chances en un pari. La conversion est la suivante : dire que je considère que M. Sarlande a x% de chances d'être élu et que M. Holkozy en a (100−x)%, ça signifie que je suis prêt à accepter de payer x¤ pour un contrat qui me promet 100¤ si c'est M. Sarlande qui gagne, et dualement (100−x)¤ pour un contrat qui me promet 100¤ si c'est M. Holkozy qui l'emporte. Il y a donc moyen de mettre en place un marché de tels contrats, laisser faire l'axiome libéral de l'efficience des marchés, et voir ce qu'il en résulte. C'est ce que fait le site intrade.com (dont le fonctionnement est résumé ici), et sur lequel on peut notamment voir le cours de MM. Sarlande et Holkozy ici et (à moins que ce soit le contraire). Ces cours (le prix auquel s'échange un contrat je paie 10$ en cas d'élection de Untel) se lisent assez directement comme des probabilités, c'est assez agréable. Il serait intéressant de les évaluer sur un grand nombre d'élections selon le score de fiabilité que je propose plus haut. À vrai dire, je ne suis pas trop convaincu par l'efficience de ces marchés, qui ont des volumes assez petits dont les acteurs sont largement des Américains pas forcément bons analystes de la situation politique française (même si ceux qui parient, évidemment, doivent se renseigner). La logique voudrait que j'intervinsse moi-même dans le marché si je m'estime meilleur analyste (ou simplement pour acheter une assurance contre l'élection d'un candidat qui me déplairait), mais j'ai assez peu de confiance dans ce genre de site et dans mes chances de récupérer effectivement une grosse somme d'argent si je parie comme je le pense.

Un système apparenté mais différent est utilisé par les bookmakers anglais : il s'agit cette fois de cotations (on n'échange pas des contrats mais on place des paris à une certaine cote), et on peut voir ici une synthèse des cotes qu'ils attribuent (c'est un peu pénible à lire : le système traditionnel d'affichage de la cotation indique la fraction de la mise qu'on récupère en plus de celle-ci si on a raison sur la prévision — sachant que si on a tort on perd tout ; alors que le système décimal indique combien on récupère au total, mise comprise, si on a raison, comme un nombre décimal).

J'en viens à la question qui m'a pas mal tracassé : comment fait-on, au juste, pour établir une cote de paris ? (Autrement dit, je veux imaginer un système où chacun peut décider de placer un pari sur un des candidats, à une cote instantanée déterminée automatiquement en fonction des paris précédents, pari qui sera payé par une autorité centrale organisatrice, et pas un système de marché comme sur intrade.com ; notamment, une personne doit pouvoir parier même si elle est seule à le faire.)

Une première idée naïve pour un système de paris pourrait être ceci : tous ceux qui le veulent placent un pari de la somme qu'ils veulent sur un des deux candidats, toutes ces sommes sont mises en commun (mettons que u zorkmids aient été pariés sur Sarlande et v sur Holkozy), et lorsque le gagnant est connu, la somme totale u+v est redistribuée à ceux qui ont parié sur ce gagnant, proportionnellement à leur mise (donc par exemple si c'est Sarlande qui gagne, la mise de ceux qui ont parié sur lui est multipliée par (u+v)/u, autrement dit ils emportent v/u fois leur mise en plus de celle-ci). Ce système est extrêmement simple, mais souffre de défauts rédhibitoires : essentiellement, la cote est la même pour tous et n'est connue qu'à la clôture des paris et ne dépend pas du moment où on a parié — ce qui va conduire à des paris de dernière minute alors que le résultat de l'élection se précise, et pénaliser les parieurs de la première heure qui auraient une vision claire bien en avance. On peut imaginer un tel système où les paris seraient clos à une date butoir, ou renouvelés dans le temps, ou ce genre de choses, mais on ne résout pas vraiment le problème.

Ensuite, je me suis imaginé la chose suivante : lorsqu'on parie une somme sur l'un des deux candidats, la cote instantanée utilisée est donnée simplement par le rapport entre la somme totale qui a été pariée sur l'un et celle qui a été pariée sur l'autre. Plus exactement, le système serait le suivant : initialement, l'autorité centrale place 100¤ (disons) comme somme fictive pariée sur Sarlande et autant sur Holkozy ; puis, si à un instant donné u zorkmids ont été pariés sur le premier et v sur le second, et si je veux miser δ (une somme infinitésimale) sur Sarlande, je récupérerai δ·(u+v)/u (c'est-à-dire ma mise δ plus encore δ·v/u de bonus) si j'ai eu raison et 0 (=ma mise est perdue) si j'ai eu tort. On convient que les cotations sont modifiées instantanément : pour parier une somme non infinitésimale, il faut diviser celle-ci en mises infinitésimales et faire l'intégrale qui convient — je n'insiste pas là-dessus. L'ennui c'est qu'avec ce système, les pertes de l'autorité centrale ne sont pas bornées : si après la mise fictive initiale de 100¤ de chaque côté je suis seul à parier et que je mise A sur Sarlande, et si j'ai gagné, je récupère ma mise A plus un gain de 100¤·log(1+(A/100¤)) payé par la banque (comme on le vérifie en calculant l'intégrale 100¤ (A+100¤) ( u+100¤ u ) du — ici écrite en MathML — qui vaut A + 100¤ · log ( 1 + A100¤ ) ). La divergence est certes logarithmique, mais elle est là (sans regarder le détail de l'intégrale, on voit bien que la divergence doit être logarithmique parce que le gain varie comme l'inverse de u).

Voici comment on peut y remédier. Disons que la banque (=l'autorité qui mène les paris) veut limiter ses pertes à 100¤ dans le pire cas. Elle met donc initialement 100¤ dans deux comptes, le compte u somme pariée sur Sarlande et restant à distribuer et le compte v somme pariée sur Holkozy et restant à distribuer. Si je veux miser δ (une somme infinitésimale) sur Sarlande, ce δ est ajouté à u comme précédemment, et placé à la même cote que précédemment (je récupérerai δ·(u+v)/u en cas de victoire de Sarlande, c'est-à-dire ma mise plus δ·v/u), mais cette fois je déduis la somme δ·v/u du compte v, puisque c'est à partir de là que je paie les gains. Il est facile de se convaincre que dans ce système, le produit u·v (ou, si on veut, la moyenne géométrique entre les deux) reste constant ; la banque réalise un bénéfice net de v−100¤ si c'est Sarlande qui gagne, et u−100¤ si c'est Holkozy, ses pertes sont donc minorées dans le pire cas (le reste des gains éventuels venant des mises des autres joueurs). Cette fois, si après la mise fictive initiale de 100¤ de chaque côté je suis seul à parier et que je parie A sur Sarlande, et si j'ai gagné, je récupère ma mise A plus un gain de 100¤·(A/(100¤+A)) payé par la banque, puisque u vaut 100¤+A après mes mises et v vaut 10000¤²/(100¤+A). Cette fois il n'y a pas de divergence puisqu'on intègre quelque chose en v/u, c'est-à-dire en fait en 1/u² (précisément, l'intégrale est 100¤ (A+100¤) ( u + ( 100¤/u ) u ) du ce qui vaut A + 100¤ · ( A 100¤ + A ) ).

Ce système semble mathématiquement assez naturel (et se généralise assez bien à plus de 2 candidats), et il me rappelle l'apparition de la moyenne géométrique que j'avais vue dans la réalisation des paniers de monnaies. Mais je ne sais pas si elle porte un nom standard, ni si c'est ce qu'utilisent les bookmakers anglais (modulo leurs marges, et modulo le fait qu'ils ne remettent évidemment pas à jour leur cotation instantanément).

(dimanche)

J'essaie de comprendre comment la Terre tourne

Je me suis laissé convaincre par un ami d'écrire une application pour Android d'éphémérides astronomiques (il en existe certainement déjà plein, mais guère qui soient libres / open source) : c'est-à-dire un truc qui calcule au moins des choses comme la position et les heures de lever et coucher du Soleil, de la Lune et des planètes, les dates et heures des saisons et des phases de la Lune, et sans doute d'autres choses du même acabit. Normalement, ça ne devrait pas être difficile, il y a plein de code pour ça, presque déjà écrit, en fait, qu'il suffit de convertir en Java.

Mais le truc, c'est que je suis un chouïa maniaque (←ceci est un euphémisme) sur certaines choses, et j'ai une idée assez arrêtée sur la façon dont les choses devraient être faites. Notamment, un calcul astronomique ne se mène pas vraiment de la même façon si on vise une précision d'une fraction de minute d'arc ou de quelques microsecondes d'arc. Et je n'ai pas envie de faire silencieusement des approximations qui empêcheraient de passer à une précision nettement plus grande : i.e., je ne tiens pas spécialement à ce que mon application permette une précision énorme, mais je tiens à ce que le cadre logiciel le permette. Ça devient un peu un défi (stupide) en soi.

Or il se trouve que réaliser des calculs astronomiques permettant, même en principe, une très haute précision, c'est compliqué. (Ne serait-ce que parce qu'on ne va plus pouvoir négliger les effets relativistes, et qu'on commence à avoir mal à la tête juste pour définir ce que c'est que le temps.) J'ai une assez bonne vision des phénomènes les plus simples, mais si je m'impose le carcan de bien prendre conscience de toutes les approximations, je m'y perds assez.

Prenons l'exemple de la rotation de la Terre.

La zéroïème approximation, celle qu'on apprend à l'école primaire, c'est que la Terre tourne autour du Soleil, effectuant une révolution en une année dans un plan appelé écliptique, et qu'elle tourne aussi autour d'elle-même selon un axe de direction fixe appelé l'axe des pôles et dont le plan perpendiculaire s'appelle le plan équatorial ; l'angle entre les plans écliptique et équatorial, ou bien entre l'axe des pôles et l'axe perpendiculaire au plan écliptique, s'appelle l'obliquité ou inclinaison de l'axe terrestre, notée ε, et vaut 23°26′15.66″. L'angle entre l'axe de rotation et la droite Terre-Soleil est responsable des saisons, lesquelles sont limitées par les deux équinoxes lorsque l'axe est en quadrature avec cette droite, ou, si on préfère, que le Soleil se trouve dans le plan équatorial de la Terre, et par deux solstices lorsque le Soleil atteint ses latitudes minimale et maximale par rapport au plan équatorial terrestre, qu'on appelle tropiques du Capricorne (→été austral) et du Cancer (→été boréal). Ça c'est ce que tout le monde devrait savoir, sauf à être un sombre inculte.

Même en zéroïème approximation, il y a moyen de faire une erreur classique[#] : c'est de penser que la période de la rotation de la Terre est égale à un jour solaire (24h), alors qu'en fait 24h est la période moyenne de la rotation par rapport à la direction du Soleil ; or, comme la Terre tourne en même temps (et dans le même sens) autour du Soleil, la période de rotation par rapport aux étoiles fixes — ou jour sidéral — est plus courte, de sorte qu'il y a tout juste un jour sidéral de plus dans une année qu'il n'y a de jours solaires, c'est-à-dire environ 366.2564 jours sidéraux contre 365.2564 jours solaires, la différence étant justement la révolution qu'on a faite autour du Soleil pendant ce temps ; ce qui donne 23h56min04.1s pour le jour sidéral. Ou pour dire les choses autrement : au bout de 23h56min et un chouïa, les étoiles vues depuis la Terre ont fait un tour complet de la voûte céleste, mais comme le Soleil parcourt l'écliptique d'ouest en est en une année, au bout d'un jour il s'est déplacé de l'ordre de 1° vers l'est (par rapport aux étoiles), et il faut attendre en moyenne à peu près 4min de plus pour qu'il revienne à la même longitude dans le ciel, soit 24h, et c'est la différence entre le jour sidéral et le jour solaire.

Soulignons par ailleurs que ceci n'est dit qu'en moyenne : si le jour sidéral est assez constant, le jour solaire (également appelé synodique) n'est égal à 24h qu'en moyenne. Il y a deux raisons à ça, c'est-à-dire deux raisons au fait que la longitude du Soleil par rapport aux étoiles fixes ne progresse pas à un rythme constant. La première est le fait que la Terre ne tourne pas à vitesse constante autour du Soleil : à cause de la loi des aires, elle tourne un peu plus vite vers janvier (quand elle est plus près du Soleil) qu'en juillet (quand elle est plus loin) ; ce phénomène introduit un terme périodique de période 1 an dans le décalage entre heure solaire vraie et heure solaire moyenne. Le second phénomène est le fait que le Soleil vu depuis la Terre parcourt la voûte céleste non selon l'équateur mais selon l'écliptique, qui est penché de ε par rapport à lui : donc même si le Soleil tournait à vitesse constante sur l'écliptique de la voûte céleste, sa projection sur l'équateur, elle, avancerait un peu plus vite au moment des solstices et un peu plus lentement au moment des équinoxes ; ce deuxième phénomène introduit un terme périodique de période 6 mois dans le décalage entre heures solaires vraie et moyenne. La somme de ces deux phénomèmes (et, si on en considère d'autre, tout ce qui peut faire que l'heure solaire vraie n'est pas égale à l'heure solaire moyenne) s'appelle l'équation du temps — je renvoie à cet article, qui est très bien écrit, pour une discussion détaillée.

Pour passer à l'approximation suivante, il y a un nouveau phénomène à prendre en compte, c'est le fait que l'axe des pôles de la Terre ne reste pas de direction constante : cette direction tourne elle-même autour d'un axe perpendiculaire au plan écliptique, dans un phénomène qui s'appelle la précession des équinoxes, dont la période est de 25770 ans. Ceci peut se voir de différentes façons : au bout d'une année qu'on peut qualifier de sidérale, le Soleil est revenu à sa place sur l'écliptique par rapport aux étoiles fixes, mais l'équateur, lui, s'est un peu décalé dans le sens contraire par rapport à l'écliptique, et donc l'intersection des deux, qu'on appelle l'équinoxe (de printemps, disons), et il faut environ 20 minutes de moins pour que le Soleil revienne à sa même position par rapport à l'équinoxe. Donc de même que la révolution de la Terre autour du Soleil (ou, vue depuis la Terre, le parcours de l'écliptique par le Soleil) introduit une différence entre jour sidéral et jour solaire, la précession des équinoxes introduit une différence entre année sidérale (mesurée par rapport aux étoiles fixes) et année tropique (mesurée par rapport aux équinoxes, i.e., par rapport aux saisons) : la période de la précession des équinoxes est de 25770[#2] années sidérales, mais 25771 années tropiques. Du coup, on peut aussi définir trois jours différents, selon qu'on considère la période de rotation par rapport au Soleil (24h), par rapport aux étoiles fixes (23h56min04.10s) ou par rapport aux équinoxes (23h56min04.09s), mais les deux derniers diffèrent évidemment très peu.

La précession des équinoxes est un phénomène connu depuis fort longtemps, et qui fait que parfois les gens se moquent des astrologues (ce qui est en soi une activité louable, certes, mais encore faut-il le faire pour les bonnes raisons) parce que ceux-ci appellent bélier, taureau, gémeaux, etc., un douzième de l'écliptique chacun et définis par rapport aux équinoxes tandis que les constellations astronomiques de ce nom sont (d'une part au nombre de treize et inégalement espacées) assurées par des étoiles fixes : c'est une mauvaise critique et j'ai déjà défendu le fait que les douze saisons « astrologiques » sont une division parfaitement sensées des quatre saisons qu'on définit usuellement, et d'ailleurs je les fais figurer sur les calendriers que je me fabrique chaque année. La cause principale de la précession est l'action des forces de marées causées par la Lune et le Soleil sur le bourrelet équatorial de la Terre (i.e., comme cette dernière n'est pas sphérique, l'action de la Lune et du Soleil qui attirent de façon plus importante la partie qui en est la plus proche, n'équivaut pas à une action ponctuelle) : il y a donc un couple de force qui cause une précession gyroscopique ; on parle pour cet effet de précession luni-solaire (il existe aussi une précession planétaire, due à l'effet des autres planètes du système solaire, c'est-à-dire surtout Jupiter, mais elle est plus faible).

En plus de la rotation de la Terre et de la précession des équinoxes, il y a un phénomène appelé la nutation : alors que la précession des équinoxes est un mouvement très lent mais très important de l'axe des pôles, la nutation est un mouvement de bien plus faible amplitude (de l'ordre de la quinzaine ou vingtaine de secondes d'arc) et beaucoup plus rapide (le terme le plus important a une période de 18.6 années qui est la période de la régression des nœuds lunaires, c'est-à-dire la droite d'intersection du plan d'orbite de la Lune avec l'écliptique). En gros, la nutation correspond à de petites oscillations de l'axe des pôles autour de sa position moyenne. Il faut noter que cette nutation se produit à la fois dans le sens de la précession (l'axe avance et recule un peu par rapport à son mouvement de précession) et dans le sens orthogonal (l'axe s'incline plus ou moins que l'obliquité moyenne) : on parle respectivement de nutation en longitude et de nutation en obliquité.

Ensuite, les choses se compliquent® : l'écliptique lui-même n'est pas fixe (il varie lentement sous l'effet de l'attraction des autres planètes du système solaire), l'inclinaison de la Terre n'est pas non plus constante même à long terme (c'est-à-dire même une fois moyennée la nutation en obliquité — même si en fait l'essentiel de cet effet est alors dû, justement, au mouvement de l'écliptique), la rotation de la Terre n'est pas uniforme (elle comporte à la fois des variations périodiques pas toujours bien connues, et un ralentissement séculaire qui est estimé — de façon un peu conventionnelle — à 1.64 milliseconde par jour et par siècle, d'ailleurs pour des raisons que j'ai déjà expliquées, la durée du jour est entre 1ms et 2ms plus longue que 24h), et d'ailleurs l'axe des pôles varie non seulement dans l'espace mais aussi à la surface de la Terre (on parle de polhodie ou oscillation de Chandler) avec une période de l'ordre de 430 jours et une amplitude de l'ordre de 10m (et ça n'arrange rien qu'il soit difficile de définir ce qu'on appelle, au juste, le pôle[#3]).

Normalement, à ce point-là, le mathématicien explose et s'exclame : Mais aussi compliqués que soient les phénomènes physiques sous-jacents (qu'il ne s'agit pas ici de modéliser mais simplement de décrire), l'orientation d'un objet rigide dans l'espace peut se décrire par exactement trois angles (angles d'Euler, qui s'appellent justement, et pas par hasard : la précession, la nutation et la rotation propre — terminologie néanmoins un peu confusante puisque par exemple la nutation astronomique en longitude est, du point de vue des angles d'Euler, une précession). Donc, pour tout décrire, il suffit de donner un développement temporel de ces trois angles d'Euler (qui caractérisent la transformation entre le système de coordonnées terrestre[#4] de l'IERS[#5] et leur système de coordonnées céleste[#6]).

Il y a différentes raisons pour lesquelles ce n'est pas ce qui se fait, et pour lesquelles on (=l'IERS) décrit l'orientation de la Terre non comme une seule rotation mais comme une composition de plusieurs rotations (une pour la précession générale, une pour la nutation, une pour la rotation proprement dite, et une pour la polhodie). Une raison est qu'il est utile de décrire non seulement l'orientation stricto sensu de la croûte terrestre mais aussi différents repères ou objets géométriques intermédiaires (l'écliptique, l'équateur moyen, l'équateur instantané, le pôle à la surface de la Terre…). La séparation des mouvements entre précession et nutation, par exemple, est un peu arbitraire (grosso modo, on met dans la précession ce qu'on appelle les termes séculaires et dans la nutation les termes périodiques, mais tout dépend en fait de l'échelle de temps considéré), cependant il est utile d'avoir fixé une convention à ce sujet, pour pouvoir parler d'équateur moyen (celui qui est sujet à la précession mais pas à la nutation) et d'équateur instantané (celui qui est sujet aux deux), et s'en servir dans d'autres définitions, par exemple pour le point vernal — ou équinoxe de printemps — qui est l'intersection (ascendante) d'un de ces équateurs avec l'écliptique[#7], et qui définit le début du printemps. Une autre raison (ou une autre facette de la même) est de séparer autant qu'on peut les phénomènes qu'on sait prévoir et ceux qu'on ne peut qu'observer.

Spécifiquement, un phénomène qu'on ne sait qu'assez mal prévoir (même si j'ai du mal à savoir la meilleure précision qu'on sache atteindre pour une prévision à 10 ans, 100 ans, 1000 ans) est celui de la rotation propre de la Terre ou ce qu'on appelle en astronomie le temps universel. Le temps universel (UT1) est défini par le fait que la Terre effectue une rotation par rapport au Soleil en 24h de temps universel, ou, en fait, une rotation sidérale en 23h56min04.0989036903511s. Mais cette définition cache de nombreuses subtilités (pour commencer, qu'est-ce que c'est exactement, effectuer une rotation ?). Par exemple, la très lente rotation constituant la précession des équinoxes constitue, après tout, une forme de rotation de la Terre, et si on écrit la matrice de transformation donnant l'orientation finale de la Terre comme composée d'une matrice de précession, d'une matrice de nutation et d'une matrice de rotation propre dépendant du temps universel, cette dernière doit décompter la partie de rotation qui a déjà été incluse dans la précession et la nutation. Ceci conduit à différentes façons, toutes désagréables, de traiter cette séparation, soit en calculant une équation des équinoxes qui correspond à évaluer la rotation cachée dans la précession et la rotation, soit en utilisant un point intermédiaire appelé point de référence céleste intermédiaire (et qui est défini comme le point toujours situé sur l'équateur de la voûte des étoiles fixes et dont le mouvement est non tournant en ce qu'il est toujours perpendiculaire à l'équateur lorsque l'équateur effectue des petits déplacements sous l'effet de la précession ou de la nutation) ; de même, sur terre, les effets du mouvement du pôle qui contaminent la rotation de la Terre conduisent à introduire un point de référence terrestre intermédiaire. Tout ceci est assez fastidieux à comprendre. Heureusement, il existe des documents pas trop mal écrits qui expliquent tout ce qu'il y a à savoir : soit les arides Conventions 2010 de l'IERS soit une circulaire un peu plus pédagogique écrite par l'observatoire de l'US Navy.

Après, même si on a compris comment les choses fonctionnent (ce dont, dans mon cas, je ne suis que partiellement convaincu), il faut encore trouver les données. La précession est décrite par trois angles dont la signification est un peu pénible à voir quand on est comme moi handicapé des trois dimensions, mais qui sont au moins décrits par des simples polynômes du temps et dont l'utilisation est clairement indiquée dans les documents que je viens de citer. La nutation est décrite par des séries de Poisson (une pour la nutation en longitude et une pour la nutation en obliquité) ; les astronomes aiment bien ça pour les développements numériques, les séries de Poisson : ce sont des sortes de séries de Fourier (finies, bien sûr), mais comportant aussi des puissances du temps, et dont les périodes sont généralement exprimées comme des combinaisons entières de périodes perturbatrices fondamentales (typiquement les longitudes moyennes des planètes ainsi, pour tout ce qui a trait au système Terre-Lune, que les arguments de Delaunay c'est-à-dire les anomalies moyennes du Soleil et de la Lune, l'argument moyen de la Lune mesurée depuis le nœud, la longitude moyenne du nœud, et l'élongation moyenne entre le Soleil et la Lune ; les arguments de Delaunay sont donnés comme des polynômes du temps, donc stricto sensu on n'a plus affaire à une série trigonométrique). La désagréable équation des équinoxes (qui sert à neutraliser la partie de rotation de la Terre introduite dans la précession et la nutation) est également exprimée comme polynôme plus série de Poisson (et en principe calculable à partir de la précession et de la nutation). Tout ça est un peu pénible à évaluer, d'autant qu'il faut commencer par trouver où sont cachées les données et les convertir depuis divers formats texte assez pourris prévus pour être évalués par des procédures en *shudder* Fortran. Pour la rotation de la Terre, ainsi que la position du pôle, on peut soit utiliser différents modèles approximatifs soit prendre des données d'observation publiées par l'IERS : je suis loin d'avoir les idées aussi claires que je voudrais sur le rapport entre ces différents ensembles de données (par exemple sur la question de savoir comment mélanger des théories plus ou moins anciennes et qui n'utilisent pas forcément exactement les mêmes conventions).

[Bon, encore une entrée qui s'est retrouvée à devenir beaucoup plus longue que je l'imaginais, dont j'ai maintenant franchement marre puisque ça fait quelque chose comme dix jours que je l'écris, et du coup j'ai la flemme de relire, bref, qui doit être bourrée de fautes en tous genres. De toute façon, les gens vont râler que gnagnagna je n'écris pas ce que j'ai promis sur les octonions gnagnagna.]

[#] Subtilité qui n'est pas relevée à l'école primaire. Quand j'étais en CM2, dans le cadre d'une introduction à l'astronomie, notre institutrice nous a demandé de définir un jour, j'ai essayé d'expliquer la différence entre jour solaire et jour sidéral, je me suis mal exprimé, et c'est moi qui suis passé pour un sombre inculte qui croit que le Soleil tourne autour de la Terre. :-)

[#2] En réalité, les niveaux d'approximation suivants font que cette période n'a pas beaucoup de sens en tant que période : ce que je donne là est la vitesse actuelle de précession des équinoxes, mais comme cette vitesse varie elle-même, ce n'est pas dans 25770 ou 25771 ans que les équinoxes auront accompli « un tour complet » de l'écliptique (notion qui n'est d'ailleurs pas évidente à définir vu que l'écliptique n'est pas non plus fixe…).

[#3] Cela peut faire référence à l'axe de rotation instantané, à l'axe de moment cinétique, ou à l'axe principal d'inertie. Il semble que les deux premiers diffèrent de quelques centimètres alors que le second diffère d'eux de quelques dizaines de centimètres. En fait, le bon pôle n'est rien de tout ça, mais une construction un peu compliquée appelée les axes de Tisserand, qui coïnciderait avec l'axe principal d'inertie si la Terre était rigide, mais tient plus intelligemment compte de l'élasticité du manteau, et cette construction elle-même suppose une distinction un peu arbitraire dans les périodes des perturbations (celles qui sont plus longues que deux jours sont placées dans la nutation, celles qui sont plus courtes sont placées dans la rotation propre et la polhodie) : on parle de pôle intermédiaire céleste pour l'objet ainsi construit.

[#4] J'aimerais dire qu'il s'agit de la latitude, de la longitude mesurée par rapport au méridien de Greenwich, et de l'altitude mesurée par rapport à l'ellipsoïde WGS84, mais en fait la définition du système de référence terrestre de l'IERS est un chouïa plus compliquée (à ce niveau de précision, on ne peut pas ignorer le fait que la croute terrestre n'est pas rigide et que les plaques tectoniques se déplacent les unes par rapport aux autres et sont sujettes à des marées). Suite à toutes sortes de définitions historiques se précisant les unes les autres, le méridien international, celui de l'IERS et qui est utilisé par les GPS, est situé 5.31″ à l'est du méridien historique. C'est ce que constatent, déçus, les geeks qui se rendent à l'observatoire royal de Greenwich avec un GPS ou qui simplement regardent sur Google Maps.

[#5] Le Service International de la Rotation de la Terre, qui a pour but de décrire et modéliser aussi précisément que possible l'orientation de la Terre dans l'espace (et de décider quand on introduit les secondes intercalaires). Même si on a tendance à s'imaginer en entendant le nom que ce sont eux qui la font tourner : j'avoue que ça a une classe infinie, quand on vous demande et vous, vous faites quoi, dans la vie ? de pouvoir répondre oh, je travaille au service de rotation de la Terre.

[#6] Système de coordonnées qui est à peine moins difficile à définir en théorie, est certainement beaucoup plus en pratique : on utilise de l'interférométrie à très longue base pour définir un repère cinétiquement sans rotation par rapport à des objets très lointains (des quasars).

[#7] L'écliptique lui-même pose des problèmes de définition, et doit être considéré comme largement conventionnel. Vu que l'orbite du barycentre Terre-Lune, qui est censée définir ce plan, comporte différentes perturbations périodique, on veut prendre une moyenne dans le temps. Traditionnellement, on utilisait le plan (écliptique moyen rotationnel) tel que la position du barycentre Terre-Lune, débarrassée de ses perturbations périodiques, se fasse toujours dans le plan en question. Maintenant, on considère plutôt le plan (écliptique moyen inertiel) orthogonal au moment cinétique moyen du mouvement orbital du barycentre Terre-Lune calculé dans un référentiel sans rotation par rapport aux étoiles lointaines. La différence entre ces deux concepts réside dans le fait que l'écliptique inertiel tient compte de la composante de moment cinétique qui provient de la variation (séculaire) du plan écliptique lui-même, tandis que l'écliptique rotationnel l'ignore (ce qui constitue une définition vaguement circulaire, mais néanmoins utilisable) : voyez cet article pour les détails.

(lundi)

Quelques réflexions sur l'inertie

Quand j'écris inertie dans le titre de cette entrée, je ne parle pas du phénomène psychologique mais scientifique : scientifique, c'est-à-dire notamment physique mais pas seulement. Dans ce sens, l'inertie, de façon volontairement très vague, c'est le mécanisme qui fait qu'un phénomène qui se produit a tendance à continuer à se produire (plutôt que, par exemple, cesser immédiatement que sa cause cesse).

En physique, il s'agit de la loi d'inertie, ou première loi de Newton, selon laquelle en l'absence de forces extérieures un objet continue à se déplacer en ligne droite et à vitesse constante : ce n'est pas une évidence, et historiquement il semble qu'on ait pu croire — dans la mesure où la physique aristotélicienne énonçait ces choses clairement, ce dont je ne suis pas sûr du tout — qu'une force était toujours nécessaire pour mouvoir un objet, i.e., le que fait qu'un objet en mouvement finisse par s'arrêter dans les situations concrètes n'était pas l'action des forces de frottement mais le phénomène normal, et que du coup l'inertie était ce qu'il fallait expliquer, ce qu'on a pu faire, semble-t-il, par des mécanismes du genre la poussée de l'air exercée par l'endroit que l'objet venait de quitter (je ne suis pas compétent en histoire des sciences, donc j'affabule peut-être en disant ça, ce sont des souvenirs de manuels de physique lus il y a longtemps, mais Wikipédia suggère des choses compatibles). Le principe général d'inertie, ce que j'ai appelé première loi de Newton, a été formulé clairement par Galilée, même s'il est sans doute exagéré de dire que c'est lui qui l'a dégagé.

Toujours est-il qu'on aurait tort de prendre ça pour une évidence. Il y a une célèbre anecdote racontée par Richard Feynman (qui vaut la peine d'être écoutée rien que pour son délicieux accent new-yorkais) sur la manière dont son père (Melville Feynman) lui a expliqué ce qu'est l'inertie : personne ne sait à quoi c'est dû. Un mathématicien va voir l'inertie comme le fait que la physique est décrite par des équations différentielles du second ordre (la force contrôle non pas la vitesse mais l'accélération, c'est-à-dire la variation de la vitesse), mais ce n'est que reformuler le problème ; ou encore, que si on ramène ces équations au premier ordre, cela se fait en introduisant de nouvelles variables en plus de la position, à savoir la quantité de mouvement des objets : l'état d'un système mécanique classique se traduit par la donnée non seulement des positions des objets mais aussi de leurs quantités de mouvement (ou de façon plus approximative, vitesses[#]). On peut reformuler ces choses de façon plus ou moins sophistiquée, parler d'espace des phases, de principes variationnels, de formulations lagrangienne ou hamiltonienne de la mécanique, on peut généraliser à la mécanique quantique ou à la relativité générale, mais il reste toujours ce même mystère qu'on pousse ou cache sous ces diverses formulations[#2].

Mais il y a d'autres domaines où la notion d'inertie peut être considérée, et c'est alors d'autant plus frappant qu'il ne faut pas la prendre pour une évidence.

Prenons l'économie. Voici une question qui me semble assez profonde : si vous avez une grandeur économique ou financière, peut-être le cours d'une action ou d'une monnaie, dont vous ne savez rien sauf sa valeur à l'instant présent, manifestement la meilleure chose que vous puissiez faire pour prévoir sa valeur demain, c'est de prévoir la même valeur (ce n'est évidemment pas une bonne prévision, mais si vous ne savez rigoureusement rien de plus, c'est certainement le mieux qu'on puisse faire) ; maintenant, je vous donne la valeur d'aujourd'hui et aussi la valeur d'hier : est-ce que la connaissance de cette valeur d'hier peut aider à faire une prévision meilleure ? Si on croit à une forme d'inertie en économie, on va se dire que si la grandeur a augmenté entre hier et aujourd'hui, elle risque d'augmenter de nouveau entre aujourd'hui et demain, et peut-être dans les mêmes proportions, donc on va peut-être prévoir pour demain la valeur symétrique de celle d'hier par rapport à celle d'aujourd'hui (de fait, en physique, si vous voulez prévoir le mouvement d'un objet, c'est exactement ça que vous prévoit la loi d'inertie en l'absence de forces, et donc ce sera une approximation sensée si vous ne savez rien du tout). Mais en fait, s'agissant du cours d'une action, cette idée n'est pas du tout bonne : au contraire, on a tendance à modéliser ces choses-là — en toute première approximation — par des objets mathématiques appelés des martingales, ce qui signifie essentiellement que connaître des choses sur le passé ne vous avancera absolument pas à prévoir l'avenir (par rapport à juste connaître le présent) ; ou, de façon plus concise mais moins précise, il n'y a aucune sorte d'inertie. C'est raisonnable si on pense au cours d'une action comme déterminé par des agents rationnels : ils ont connaissance du passé et ils en tiennent compte, donc si une prévision simpliste basée dessus peut donner une meilleure approximation pour l'avenir qu'une prévision simpliste seulement basée sur le présent, ils en tiendront compte déjà au présent, donc anticipent sur cette prévision !, qui du coup devrait être réalisée déjà maintenant et pas dans l'avenir.

Mais l'absence totale d'inertie signifie que l'idée que le cours d'une action est en train de monter est dénué de sens, ou, en tout cas, de sens prédictif : le fait que ce cours ait augmenté ces N derniers jours ne donnerait aucune information sur le fait qu'il risque d'augmenter encore demain, pas plus que le fait de savoir qu'une pièce non truquée est tombée 20 fois sur pile ne vous donne d'information sur le fait qu'elle tombera sur pile la fois suivante. Or on a quand même tendance à s'imaginer qu'il y a de l'inertie : c'est contraire à cette idée que les marchés anticipent sur toute prévision qu'ils peuvent faire quant à l'avenir. Même si le cours d'une action dépend de phénomènes (physiques, par exemple) qui, eux, peuvent avoir de l'inertie, si ces phénomènes sont connus, ils devraient être anticipés. Je ne sais pas si on peut exhiber des cas où il y a quand même incontestablement une forme inertie dans des cours économiques, mais j'ai toujours été perturbé par cette dissonance entre le fait qu'on soit censé croire à l'absence d'inertie si les agents sont rationnels et le fait qu'on dise, par exemple, que le cours du pétrole va certainement continuer à monter au cours des prochaines années (si cette prévision est si évidente, tout le monde va vouloir prendre des options dessus, ce qui va faire augmenter le cours du pétrole maintenant).

Mais ce qui a motivé cette réflexion à ¤0.02 sur l'inertie, c'est encore un autre domaine, celui de la sociologie : j'entends les commentateurs politiques (dont je ne pense pas forcément grand bien) expliquer que la progression ou régression de tel ou tel homme politique dans les sondages électoraux constitue une dynamique. Le fait de parler de dynamique suppose qu'il y a inertie. Mais est-ce le cas ? Je n'ai cette fois pas d'argument comme pour l'économie qui expliquerait qu'il ne dût pas y en avoir, mais je n'ai pas non plus d'explication vraiment convaincante au fait qu'il y en ait (à part que les électeurs seraient naturellement portés à apprécier en soi les hommes politiques qui enregistrent déjà une progression dans les sondages récents, ce qui est possible mais pas évident). En tout état de cause, je trouve qu'on ne devrait prendre ni l'existence de l'inertie, ni son absence, pour une évidence : c'est une question essentielle qu'on doit se poser sur tout phénomène auquel on est confronté.

[#] Quand on parle d'un seul objet sans interaction extérieure, la masse n'intervient pas du tout, et l'inertie au sens physique peut porter aussi bien sur la vitesse (c'est la manière dont Newton la formule) que sur la quantité de mouvement. Quand il y a plusieurs objets qui interagissent, la masse (inertielle) d'un objet devient, très grossièrement, la proportion avec laquelle l'inertie de cet objet est importante relativement à celle des autres, donc la difficulté des forces à agir sur cet objet.

[#2] La relativité générale est peut-être ce qui arrive le plus proche d'une réponse au mystère, aux yeux du matheux que je suis, parce que l'équation des géodésiques et les équations d'Einstein sont des équations du second ordre mathématiquement très naturelles alors qu'il n'y a rien de la sorte au premier ordre ; mais on peut difficilement prétendre avoir tout résolu en disant ça.

(vendredi)

Quelques formules en radicaux

On a (en MathML, donc à condition que votre navigateur sache l'afficher correctement) :

cos ( 2π 3 ) = 1 2

cos ( 2π 5 ) = 1 4 + 1 4 5

cos ( 2π 7 ) = 1 6 + 1 6 7 2 21 2 −3 3 + 1 6 7 2 + 21 2 −3 3

cos ( 2π 11 ) = 1 10 + ( 1 40 + 1 40 5 + 1 40 10 2 5 ) 979 4 275 4 5 55 10 2 5 + 275 4 10 + 2 5 5 + ( 1 40 + 1 40 5 + 1 40 10 2 5 ) 979 4 + 275 4 5 275 4 10 2 5 55 10 + 2 5 5 + ( 1 40 + 1 40 5 1 40 10 2 5 ) 979 4 + 275 4 5 + 275 4 10 2 5 + 55 10 + 2 5 5 + ( 1 40 + 1 40 5 1 40 10 2 5 ) 979 4 275 4 5 + 55 10 2 5 275 4 10 + 2 5 5

cos ( 2π 13 ) = 1 12 + 1 12 13 + ( 1 24 + 1 24 −3 ) 65 2 39 2 −3 3 + ( 1 24 1 24 −3 ) 65 2 + 39 2 −3 3 + ( 1 24 + 1 24 −3 ) 4381 2 195 2 −3 6 + ( 1 24 1 24 −3 ) 4381 2 + 195 2 −3 6

cos ( 2π 17 ) = 1 16 + 1 16 17 + 1 8 17 2 1 2 17 + 1 4 17 4 + 3 4 17 1 2 17 2 1 2 17 17 2 + 1 2 17

L'existence de ces formules n'a rien de nouveau ou d'extraordinaire (celles de cos(2π/3) et cos(2π/5) sont essentiellement connues depuis l'antiquité, celle de cos(2π/17) a été trouvée par Gauß en 1796, lequel a aussi trouvé la méthode permettant de calculer toutes les formules de ce genre ; j'ai d'ailleurs déjà écrit une formule de ce genre ici, et la formule la plus compliquée, celle de cos(2π/11), dans l'exercice 5 de cette feuille d'exercices que je donnais quand j'enseignais à l'ENS) ; il s'agit de résultats classiques tournant autour de la théorie de Galois, et d'ailleurs c'est parce que j'écrivais quelque chose sur la théorie de Galois que je les ai calculées (et aussi pour m'amuser avec Sage). Ceci dit, la formule de cos(2π/13) ou cos(2π/11), je ne l'ai jamais vue écrite nulle part dans un bouquin.

Mais une question qui me laisse modérément perplexe, c'est la question de formes plus canoniques que d'autres (plus naturelles, plus élégantes, ce que vous voudrez, bref, préférables) pour ces expressions. Je ne parle même pas de factorisations possibles (comme on peut factoriser une racine 5-ième de 11/4 dans l'expression de cos(2π/11)), mais de réécritures un peu plus profondes. Par exemple, l'expression de exp(2·i·π/17) donnée dans l'entrée liée ci-dessus n'est pas la même que celle donnée dans le livre Galois Theory (formule (9.11) page 239) : j'ai tendance à trouver que la mienne (avec deux racines sixièmes plutôt qu'une racine carrée d'expressions faisant intervenir des racines cubiques) est préférable. Mais une autre formule pour cos(2π/17), qui est assurément moins agréable que celle donnée ci-dessus, et qui apparaît pourtant plus naturellement quand on applique un algorithme systématique, est la suivante :

cos ( 2π 17 ) = 1 16 + 1 16 17 + 1 16 −1 255 136 −1 4 1 16 −1 255 + 136 −1 4 + ( 1 32 2 1 32 −2 ) 73185 + 39032 −1 + 3264 2 6120 −2 8 + 1 16 −1 73185 39032 −1 3264 2 6120 −2 8 1 16 −1 73185 + 39032 −1 3264 2 + 6120 −2 8 + ( 1 32 2 + 1 32 −2 ) 73185 39032 −1 + 3264 2 + 6120 −2 8

Une autre question sur laquelle je ne sais pas dire grand-chose, c'est comment produire de façon systématique de telles expressions en MathML (pour celles que je viens de donner, j'ai utilisé un mélange de techniques pas complètement automatisées, jusqu'à terminer quelques réécritures à la main). Rien que mettre les termes dans un ordre raisonnable, ou transformer quelque chose qui apparaît naturellement comme −1·x + (−3/2)·y + (2−tz (une somme pondérée par des coefficients) en −x − (3/2)·y + (2−tz (extraire les signes pour les mettre au niveau de la somme), ce n'est pas évident.

(mardi)

De la difficulté de visualiser trois dimensions ou plus

Je suis notoirement incapable de visualiser la géométrie déjà en trois dimensions. Pourtant, quand j'étais petit, mon papa avait fabriqué pour moi, et suspendu au-dessus de mon lit, un mobile qui faisait tournoyer les cinq solides platoniciens : ça m'a peut-être donné le goût de la géométrie, mais ça ne m'a pas aidé à voir dans l'espace.

Un exemple de quelque chose de très simple que je n'ai jamais réussi à correctement me représenter mentalement, c'est le réseau que les chimistes appellent cubique faces centrées (tiens, pour une fois, Wikipédia en français n'est pas mauvais) et les mathématiciens le réseau A3 : il s'agit simplement d'un arrangement régulier de cubes où on place des points au sommets des cubes et aux milieux de leurs faces — dit comme ça ce n'est pas difficile à visualiser, mais on est censé pouvoir se rendre compte que le réseau en question est engendré par les vecteurs arêtes d'un tétraèdre régulier (voyez notamment cette image), et par ailleurs qu'en le tournant juste de la bonne façon on arrive à une superposition de plans sur chacun desquels les points sont en arrangement hexagonal (ce que les matheux appellent A2). Malgré la quantité tout à fait impressionnante de pages web qui illustrent ces choses de quantités de façons différentes (par exemple ici), et bien que mathématiquement je comprenne parfaitement ce qui se passe, je n'arrive décidément pas à le « voir » : soit je vois les cubes, soit je vois les tétraèdres et les hexagones, mais jamais les deux à la fois. (C'est un peu comme la fameuse illusion qu'on peut voir tourner dans un sens ou dans l'autre mais qu'il est très difficile de faire passer de l'un à l'autre.) Remarquez, si j'en crois le nombre de pages consacrées au réseau cubique faces centrées, justement, je ne dois pas être le seul à avoir du mal.

Dans ces conditions, il n'est pas surprenant que je n'arrive pas à visualiser quatre dimensions ou plus. Et si déjà le réseau A3 est surprenant par sa capacité à avoir une symétrie cubique, tétraédrale et hexagonale à la fois, il n'est pas étonnant que E8 recèle aussi des surprises.

Parfois les gens vous disent qu'ils arrivent à voir en quatre dimensions parce qu'ils ont regardé un tesseract tourner pendant assez longtemps. Demandez-leur alors : existe-t-il un hyperplan qui coupe le tesseract selon un tétraèdre régulier ? (la réponse est évidemment oui, et même un tétraèdre arbitrairement petit, de la même façon qu'on peut couper un cube par un plan proche d'un sommet pour obtenir un triangle équilatéral) ; puis : et pour un octaèdre régulier ? (la réponse est encore oui, en prenant un hyperplan défini par six sommets du tesseract). Je pense que ces questions en embarrasseront plus d'un.

Pour prendre un exemple très simple de quelque chose sur quoi notre intuition de trois dimensions conduit à penser des choses fausses, considérons une simple rotation uniforme. Par rotation uniforme j'entends ici ce que les mathématiciens appellent un sous-groupe à un paramètre du groupe des rotations : un mécanicien aura plutôt tendance à dire qu'on a affaire à une rotation (à vitesse) constante ; si l'on veut, on fait une rotation infinitésimale entre les temps 0 et δt puis on répète indéfiniment cette même rotation. Je ne sais pas bien quelle terminologie adopter pour souligner que c'est le concept le plus simple qu'on puisse concevoir, on fait juste tourner un solide toujours de la même façon et à vitesse toujours égale. Sauf qu'en fait ce n'est pas si simple que ça, parce que notre intuition de la dimension trois nous induit facilement en erreur : en dimension trois, une telle rotation uniforme se fait autour d'un axe de rotation, qui est une droite de points laissés fixes lors du mouvement ; mais en dimension quatre, il n'y a généralement pas d'axe de rotation : si on applique une rotation uniforme à une boule, il n'y a en général qu'un seul point fixe (le centre de la boule), et c'est le cas en toute dimension paire. Mais il y a pire : en dimension trois, si on continue la rotation pendant suffisamment longtemps, le solide finit par revenir à son orientation de départ, i.e., le mouvement est périodique. À partir de la dimension quatre, ce n'est plus le cas : une rotation uniforme très générale n'a pas de période[#]. Autre idée fausse : le fait que le mouvement d'un point donné, sous une rotation uniforme, soit un cercle — ceci est vrai de façon évidente en dimension deux, et aussi en dimension trois où c'est un cercle centré sur, et perpendiculaire à, l'axe de rotation. En dimension quatre ou plus, la trajectoire d'un point sous l'effet d'une rotation uniforme est une sorte de courbe de Lissajous, qui en dimension paire va avoir tendance à être dense dans [correction] un tore de la sphère (c'est-à-dire à passer arbitrairement près d'un point quelconque de celui-ci).

On pourrait illustrer les choses comme ceci : en dimension quatre, les habitants d'une planète sphérique en rotation dans l'espace pourraient généralement connaître l'heure et la date par la simple observation de la position d'une seule étoile. Ou pourraient réaliser des pendules qui sont une simple boule qui tourne uniformément, avec un point marqué. (Bon, tout ceci ne serait pas très pratique, certes, parce que ce serait pénible de faire une lecture précise, mais au moins dans l'idée de nos horloges analogiques avec deux aiguilles qui tournent on pourrait faire des horloges sphériques qui tournent rapidement dans une direction pour indiquer la minute et plus lentement dans une autre pour indiquer l'heure.)

La notion implicite sous-jacente, c'est plus ou moins celle du rang d'un groupe de Lie : le groupe SO3 des rotations en trois dimensions est de rang 1, c'est à peu près ça qui fait qu'on a une seule vitesse de rotation, que les trajectoires des points sont des cercles, etc. Mais en général, SOn est de rang ⌊n/2⌋, c'est par exemple le nombre de vitesses de rotation différentes qu'il faudra donner (sans même chercher à savoir dans quelles directions elles se font), le nombre de paramètres des courbes de Lissajous décrites par les points, etc.

Bref, ce sont différentes réflexions qui me sont venues en réalisant une nouvelle vidéo de rotation du système de racines de E8, rotation cette fois uniforme tout du long. (Pour l'instant la vidéo est sur YouTube, mais la qualité en est tellement abominablement atroce que ça n'a vraiment pas grand intérêt de la regarder ; je publierai une version JavaScript dès que j'aurai fini d'écrire une petite introduction mathématique pour aller avec.) Comme en huit dimensions il y a beaucoup de directions dans lesquelles on puisse tourner (SO8 est de dimension 28 et de rang 4), j'ai fait un choix qui m'a semblé amusant — et je reviendrai dessus pour l'expliquer plus précisément — consistant à prendre une rotation qui appartienne au groupe de Lie exceptionnel G2 (de dimension 14 et de rang 2) formé des rotations qui laissent invariante une structure octonionique sur l'espace de dimension 8, structure octonionique avec laquelle le réseau de E8 a d'intéressants rapports. Du coup, la vidéo fournit une illustration de deux groupes de Lie exceptionnels à la fois, G2 par son action et E8 par son système de racines.

[#] Ce qui ne signifie pas pour autant qu'il soit compliqué : si je prends bêtement deux points tournants à vitesse uniforme sur deux cercles dans le plan, et que leurs vitesses de rotation sont irrationnelles entre elles — ce qui est la situation la plus générale — alors ce mouvement n'est pas périodique non plus, et c'est quand même quelque chose de très simple ; en vérité, la rotation uniforme d'une sphère en dimension quatre n'est pas très éloignée de cette idée (justement parce que le rang du groupe des rotations vaut 2).

(jeudi)

La beauté du système de racines E8

[Une projection de E8]Parmi les objets mathématiques qui me fascinent complètement, un des plus beaux et des plus remarquables est certainement le système de racines de E8 (ou du moins tout le cortège d'objets mathématiques plus ou moins liés à E8 : le système de racines, les polytopes associés et leur groupe de Weyl, le réseau des poids, les groupes de Lie ou de Chevalley associés, les immeubles de Bruhat-Tits qui en découlent et les variétés de drapeaux en question, etc. : il y a plein de choses auxquelles on pense quand on dit E8). Sans rentrer dans les détails mathématiques, disons qu'il s'agit ici d'un solide semi-régulier en dimension 8 (pas exactement régulier — il n'y a que trois solides réguliers à partir de la dimension 5 et ils ne sont pas très amusants — mais uniforme), le plus grand et le plus remarquable d'une famille de cinq objets exceptionnels ; il s'agit aussi des points les plus proches de l'origine dans un certain réseau cristallographique aux propriétés mirobolantes[#].

J'avais déjà fait une page interactive à son sujet (que je devrais d'ailleurs retravailler un peu), mais je reste sur ma faim : cette page ne laisse pas vraiment voir la beauté de l'objet, parce qu'on ne le voit pas bouger.

Bref, je voulais me faire une image du système de racines de E8 en train de tourner et d'exhiber quelques unes de ses impressionnantes symétries.

Le problème est que le polytope dont je parle a 240 sommets et 6720 arêtes[#2], et que tracer 6720 arêtes 25 fois par seconde ça a l'air un chouïa trop rapide pour une bête application en JavaScript sur Canvas (enfin, si quelqu'un trouve moyen d'optimiser ça et peut m'expliquer comment faire, je suis preneur ; le calcul des projections de 240 points, lui, devrait être très rapide). À défaut, je me suis fait une vidéo, que j'ai entre autres mise sur YouTube ; bon, l'ennui, c'est que la compression drastique que YouTube fait subir à ses vidéos fait que c'est en fait épouvantablement moche (surtout dans la deuxième partie de la vidéo, celle où ça tourne très vite), ce qui est dommage pour quelque chose censé être d'une beauté ineffable : j'en ai donc aussi fait une version en plus haute qualité à télécharger (170Mo ; le lien qui précède pointe sur un fichier BitTorrent[#3], si ça ne marche pas, vous pouvez réessayer sans l'extension .torrent pour télécharger directement le fichier WebM), ce n'est toujours pas très satisfaisant, il y a encore des artefacts de compression et aussi des artefacts d'aliasing dans le tracé, mais bon, c'est quand même joli à regarder (et certainement mieux que l'horreur qui a atterri sur YouTube).

Les premières 1′30″ montrent différentes petites rotations du polytope pour illustrer certains de ses plans de projection à haute symétrie (à 10″ on voit une symétrie d'ordre 30 appelée figure de Petrie, à 20″ une symétrie d'ordre 20, à 30″ une symétrie d'ordre 24, à 50″ une symétrie d'ordre 18, à 1′10″ une symétrie d'ordre 14). Les 2′30″ restantes sont différentes : cette fois, on revient toutes les 10″ à une projection équivalente, après avoir fait une rotation qui laisse le polytope symétrique (ça tourne donc beaucoup plus vite, et c'est cette partie-là qui a été le plus complètement massacrée par la compression vidéo sur YouTube).

Bizarrement, le plus difficile dans l'histoire a surtout été d'écrire le code qui interpole une rotation discrète en un mouvement continu (ou, de façon mathématiquement plus précise, qui inscrit une transformation orthogonale directe au bout d'un groupe à un paramètre de telles transformations[#4]).

[#] Par exemple, concernant le problème de savoir combien de sphères identiques on peut placer en contact avec une sphère donnée (sans qu'elles se chevauchent, bien sûr), la réponse est connue en toute petite dimension (≤4), en dimension 8 grâce à E8, en dimension 24 grâce au réseau de Leech (un autre réseau aux propriétés mirifiques), et c'est tout. Donc en fait je pourrais définir mon polyèdre E8 de la façon suivante : placez 240 sphères toutes identique autour d'une autre (également identique) en dimension 8, il n'y a essentiellement qu'une seule façon de faire ça, et les centres des 240 sphères forment le polyèdre dont je parle. Mais bon, il est plus simple de dire constructivement que mes 240 points sont ceux qui ont les coordonnées (±1,±1,0,0,0,0,0,0) (pour un choix quelconque de deux coordonnées non nulles et deux signes indépendants, ce qui fait 112 points) ou bien (±½,±½,±½,±½,±½,±½,±½,±½) (pour un nombre pair de signes moins, ce qui fait 128 points).

[#2] Il a aussi 60480 faces, qui sont des triangles équilatéraux, 241920 trois-cellules (c'est-à-dire les faces de dimension 3), qui sont des tétraèdres réguliers, 483840 quatre-cellules, qui sont des 4-simplexes réguliers, 483840 cinq-cellules, qui sont des 5-simplexes réguliers, 207360 six-cellules (dont 138240 relient une facette 7-simplexe à une facette 7-croix et 69120 relient deux 7-croix), et enfin 19440 facettes (=sept-cellules), 17280 étant des 7-simplexes réguliers et 2160 étant des octaèdres généralisés (des 7-croix). Enfin, son groupe de symétries (le groupe de Weyl de E8) est d'ordre 696729600 (et il est isomorphe, à un facteur 2 près, au groupe des transformations préservant une forme quadratique déployée de rang 8 sur 𝔽8).

[#3] Mon organisation BitTorrent, basée sur XBT est d'ailleurs épouvantablement bordélique, mal foutue, et probablement bourrée de trous de sécurité inquiétants. Mais je n'ai jamais réussi à trouver un tracker et client BitTorrent qui me satisfassent (notamment, sans PHP), à utiliser en ligne de commande (sur des machines qui sont essentiellement des serveurs) ; si quelqu'un a des suggestions, je suis preneur. Je devrais peut-être essayer la combinaison opentracker et rTorrent, ce sera peut-être plus agréable que l'horreur que j'ai actuellement.

[#4] En principe c'est très facile : on veut calculer Mt, pour M une transformation orthogonale directe, avec t variant de 0 à 1 : on calcule une matrice P de vecteurs-propres de sorte que D:=P·M·P−1 soit diagonale, et on calcule P−1·Dt·P pour différentes valeurs de t. Le problème est que M peut avoir la valeur-propre −1, auquel cas (−1)t a un problème de détermination (si on ne fait pas attention, on va se retrouver avec une matrice complexe et pas une matrice orthogonale réelle comme on le veut) : il faut donc trouver une base orthogonale de l'espace propre de −1 (et commencer par en trouver une base réelle, parce que les approximations numériques peuvent faire que le calcul initial donne des résultats complexes), puis fabriquer une matrice diagonale par blocs 2×2 de rotation d'angle 2π·t, bref, c'est lourdingue d'avoir quelque chose d'un peu robuste numériquement.

(lundi)

Un joli livre de géométrie

Je mentionnais récemment que je n'écrivais pas beaucoup sur ce blog de critiques de livres. Il est encore plus vrai que je n'écris pas beaucoup de critiques de livres de maths : ce n'est pas que je n'aie pas de livres de maths préférés, bien au contraire, mais la difficulté extrême que je trouve à critiquer un tel livre est que je ne parviens généralement pas à séparer mon appréciation du sujet de celle de la forme (au moins dans le cas où les deux me plaisent). Par exemple, un de mes livres de maths préférés est Algorithms in Invariant Theory de Bernd Sturmfels, dont j'ai déjà parlé, mais en vérité il est difficile de savoir si je l'aime parce que la présentation est excellente ou simplement parce que les théorèmes sont très beaux (auquel cas l'auteur n'y est pas pour grand-chose : c'est juste que je trouve que la théorie des invariants est un petit bijou de mathématiques). Il y a bien sûr des cas où on sait distinguer : par exemple, pour tout livre écrit par Conway, on sait que le sujet va être magnifique mais que l'exposition va être insupportable parce qu'il s'adresse à des génies comme lui et pas à des êtres humains comme vous et moi, et qu'en plus il fait des espèces de jeux de mots insupportables dans sa façon de nommer tous les objets.

Bref, je ne parle normalement pas trop de livres de maths, mais je vais faire une exception pour signaler un livre récent de Jürgen Richter-Gebert, Perspectives on Projective Geometry (A guided tour through real and complex geometry) (Springer 2011, ISBN 978-3-642-17285-4), sur lequel je suis tombé un peu par hasard il y a quelques jours dans la librairie Eyrolles. D'abord parce qu'il ne s'agit pas d'un livre de recherche : il s'agit d'un livre pédagogique qui peut s'adresser à un lectorat extrêmement varié, et même si le mathématicien professionnel n'y apprendra probablement pas grand-chose (en tout cas celui qui se spécialise en géométrie), je pense que beaucoup de gens peuvent l'apprécier, entre un bon lycéen passionné de géométrie et un agrégatif de maths à la recherche de développements originaux.

Pour être clair, et pour m'adresser à mes lecteurs non mathémeticiens qui ont peut-être l'idée que quand je dis géométrie je parle de quelque chose de complètement abscons (du style donnée une variété algébrique projective de dimension n et une section hyperplane dont le complémentaire est lisse, le morphisme de restriction de l'une à l'autre, sur la cohomologie à coefficients entiers, est un isomorphisme jusqu'en dimension n−2 et injectif en dimension n−1), là il s'agit vraiment de géométrie au sens où les gens normaux l'entendent, avec des points, des droites et des triangles. Ceci étant, il s'agit quand même d'un point de vue projectif, algébrique et très élégant : donc de la géométrie plutôt façon Poncelet et Klein que façon Euclide et Apollonios[#]. Donc on a à la fois des choses vraiment élémentaires sur des angles et des distances, et des outils plus sophistiqués venus justement de la théorie des invariants (bracket algebras — comment dit-on ça en français ?).

En vérité, et c'est surtout la raison pour laquelle je le mentionne, il s'agit d'un livre que j'aurais voulu écrire, et qui présente exactement la manière dont je pense la géométrie élémentaire. En tout cas, c'est certainement selon ces lignes que j'aurais fait ma présentation de la géométrie sur ce blog si j'avais eu le courage de la mener à terme. Ce qu'on m'a plusieurs fois reproché de ne pas faire, donc, ceux qui m'ont dit ça, lisez le livre de Richter-Gebert !

Qui plus est, c'est un très joli livre, avec des illustrations bien faites (ce qui n'est jamais mal pour un livre de géométrie, même si le proverbe dit qu'il s'agit de l'art de raisonner juste sur une figure fausse), et imprimé en couleur. Donc même si vous en trouverez certainement un exemplaire électronique diffusé par rayons cosmiques, je conseille vivement d'en prendre une version bouts d'arbres morts, qui n'est pas très chère et qui fera belle figure sur la table basse du salon.

⁂ Un autre livre, sur un sujet vaguement apparenté, que j'ai aussi acquis récemment, et que je ne recommande pas, en revanche, c'est d'Ernest E. Shult, Points and Lines (Characterizing the classical geometries), qui porte sur la géométrie d'incidence. J'espérais y lire des choses qui m'éclairent un peu sur les immeubles et les quotients paraboliques des groupes algébriques réductifs vus comme des géométries, et le genre d'idées sur lesquelles je ne connais que le trop pléthorique et assez indigeste livre de Boris Rosenfeld, Geometry of Lie Groups. L'intention pédagogique de Shult est excellente en ce qu'il a fait un livre self-contained, mais le résultat est malheureusement un fouillis abscons de termes ultra-techniques qui me laisse exactement aussi peu Éclairé qu'au début et beaucoup plus embrouillé, et où il ne parle même pas de groupes de Lie ; et indépendamment du fond, beaucoup de termes sont utilisés avant d'être définis et ne figurent pas dans l'index, ce qui est à peu près rédhibitoire : par exemple, il dit tout un tas de choses sur les espaces métasymplectiques et leur caractérisation, et je n'ai pas réussi à trouver où il en a caché la définition ! C'est d'autant plus dommage que je pense qu'il y aurait eu le moyen de faire quelque chose d'excellent.

[#] Anecdote gratuite : j'ai un ami qui a fait un développement d'agreg sur les coniques sans jamais parler d'ellipse, parabole ou hyperbole. Rached Mneimné, qui était dans son jury, le lui reprochant, lui a dit : Je pense que votre leçon n'aurait pas plu à Archimède. Et il aurait répondu : Mais peut-être qu'elle aurait plu à Poncelet ? (enfin, non, en vérité, malheureusement, il n'a pas eu le culot de dire ça — mais il aurait voulu et eu raison de le faire, et du coup je raconte sans vergogne l'anecdote ainsi arrangée en espérant qu'elle devienne une jolie légende urbaine).

❄ Tiens, et pour ceux qui aiment la géométrie projective, voici une question à 0.02 zorkmids à laquelle je cherche toujours une solution simple et élégante : soient C et D deux coniques planes en position assez générale, p1,p2,p3,p4 leurs quatre points d'intersection, et 1,2,3,4 leurs quatre tangentes communes (c'est-à-dire les intersections des coniques duales C* et D*). Montrer que, quitte à réordonner les points, le birapport de p1,p2,p3,p4 sur C est égal au birapport de 1,2,3,4 sur D*. (Ce dernier étant le birapport sur D des quatre points de tangence de 1,2,3,4. On peut aussi éventuellement remarquer que le premier est aussi le birapport, dans le pinceau linéaire L de coniques engendré par C et D, de C,X,Y,ZX, Y et Z désignent les trois coniques dégénérées passant par p1,p2,p3,p4 ; et de même, le second birapport est aussi celui, dans le pinceau M de coniques simultanément tangentes à 1,2,3,4 de D,U,V,WU, V et W désignent les duales dégénérées qu'on devine. Mais peut-être que cette observation ne fait qu'embrouiller les choses.)

[Ajout () par rapport à la question précédente : cela revient plus ou moins à montrer qu'il existe une conique Γ telle que C et D soient polaires l'une de l'autre par rapport à Γ (car alors la polarité par Γ transforme p1,p2,p3,p4 en 1,2,3,4 à l'ordre près, ce qui implique ce qu'on veut sur le birapport) ; la conique Γ doit nécessairement admettre le triangle autopolaire commun à C et D comme on s'en persuade assez facilement ; on peut montrer son existence en considérant des coordonnés (x:y:z) pour lesquelles ce triangle autopolaire est donné par (1:0:0), (0:1:0) et (0:1:0), ce qui revient à diagonaliser simultanément les formes quadratiques définissant C et D : leurs équations deviennent, disons, cx·x² + cy·y² + cz·z² = 0 et dx·x² + dy·y² + dz·z² = 0, et Γ peut être définie par γx·x² + γy·y² + γz·z² = 0 où chaque γi vaut ±√(ci·di). Mais je voudrais quelque chose de purement géométrique.]

(samedi)

Différentes manières de permuter six objets

Voici un petit gadget qui pourrait servir de décoration de Noël (choisissez une entrée au hasard dans le menu déroulant puis cliquez sur Start, avant de lire les explications ci-dessous) :

Il s'agit d'une représentation sous forme animation de n'importe lequel des seize (classes de) sous-groupes transitifs sur six objets. J'avais évoqué des questions semblables à propos des symétries possibles sur cinq objets dans une entrée récente, mais la discussion pour six objets est évidemment plus compliquée. Un groupe de permutations sur six objets (=sous-groupe de 𝔖6), c'est un ensemble de façon de permuter (réordonner) ces six objets de façon que si on effectue deux permutations du groupe à la suite (=on les compose), on obtient encore une permutation du groupe ; le nombre de permutations s'appelle l'ordre du groupe. Un tel groupe de permutations est dit transitif lorsqu'il y a moyen d'envoyer n'importe quel objet à n'importe quel emplacement par (au moins) un élément du groupe. On dit que deux sous-groupe de 𝔖6 sont conjugués lorsqu'on peut transformer l'un en l'autre en permutant les objets. À conjugaison près, il existe exactement seize groupes de permutation transitifs sur six objets, et c'est ça que cette petite animation représente : on choisit un groupe dans la liste, et le script va choisir aléatoirement une permutation du groupe, puis une autre, puis une autre, et ainsi de suite indéfiniment, et anime à chaque fois le déplacement des six objets. À une extrême, 𝔖6 contient toutes les permutations possibles, à l'autre, C6 ne contient que les permutations cycliques. Entre les deux, chacun des sous-groupes proposés correspond à une petite danse que peuvent faire mes six cercles colorés, je trouve ça assez envoûtant à regarder.

Le cas de 𝔖6 est intéressant, parce que 𝔖6 est l'unique groupe symétrique qui possède des automorphismes extérieurs (c'est-à-dire des façons d'associer à toute permutation une autre de façon à préserver la composition). Pour reprendre la terminologie de Sylvester (qui aimait bien les mots commençant par sy), on appelle pentade synthématique une façon de partitionner en 5 classes les 15 arêtes du graphe complet sur les six objets de façon que deux arêtes ayant un sommet commun ne soient jamais dans la même classe : il existe exactement 6 pentades synthématiques, et 𝔖6 réalise toutes les permutations possibles sur les pentades, ce qui signifie qu'en même tant qu'il agit sur les six objets, il agit aussi sur les six pentades, la correspondance entre les deux définissant un automorphisme extérieur. Beaucoup des sous-groupes transitifs de 𝔖6 se voient assez naturellement à travers cette description.

Par ailleurs, je dois signaler que j'ai dû faire des choix de représentants dans mes classes de conjugaisons de sous-groupes. (Il n'est malheureusement pas possible de les faire de façon parfaite, c'est-à-dire de façon que deux sous-groupes inclus à conjugaison près soient effectivement représentés par des sous-groupes inclus exactement.) J'ai fait ces choix de façon à respecter la structure de l'hexagone, c'est-à-dire, techniquement, que le groupe diédral de l'hexagone soit dans le normalisateur de tous les représentants ici choisis (ça doit rendre mes choix uniques ou quasiment uniques, et ça les rend en tout cas assez naturels).

(dimanche)

Polynômes plus ou moins symétriques en cinq variables

Suite à des réflexions autour de la théorie de Galois (notamment des équations de degré 5, dans le cadre de l'écriture d'un livre sur le sujet) et autour de la théorie des invariants, je me suis amusé à regarder un peu la façon dont « fonctionnent » les polynômes plus ou moins symétriques à cinq variables. Par plus ou moins symétrique je veux dire qu'il y a des permutations échangeant les cinq variables qui laissent le polynôme invariant, mais pas nécessairement que le groupe G de ces permutations doive être le groupe symétrique 𝔖5 de toutes les (120) permutations possibles. Par exemple, le polynôme Q = Z1·Z2 + Z2·Z3 + Z3·Z4 + Z4·Z5 + Z5·Z1 (dans les cinq variables Z1, Z2, Z3, Z4, Z5) est symétrique sous l'effet de 10 permutations des variables, à savoir les 10 symétries d'un pentagone régulier dont les sommets seraient étiquetés par les cinq variables (dans l'ordre donné), i.e., ce qu'on appelle le groupe diédral D5 du pentagone : concrètement, Q est invariant si on permute cycliquement les variables (Z1 devient Z2, Z2 devient Z3 et ainsi de suite) ou si on les inverse (Z1 devient Z5 et réciproquement, Z2 devient Z4 et réciproquement, et Z3 reste) ou par n'importe quelle composition de ces symétries.

Pourquoi précisément cinq variables ? Parce que c'est le plus petit nombre pour lequel il commence à y avoir des choses intéressantes à dire, parce qu'historiquement cela a eu de l'importance (pour montrer que l'équation algébrique générale du cinquième degré n'est pas résoluble par radicaux et pour savoir précisément détecter si une équation donnée l'est), parce que ça fait une situation sur laquelle faire des calculs explicites, et parce que la situation pour plus de variable commence à devenir franchement compliquée. Bref, c'est un cadre sympathique pour faire quelques observations élémentaires de théorie des invariants ou de Galois, et un peu de vulgarisation comme j'aime en faire.

(dimanche)

Les nombres surréels sont-ils intéressants ?

J'ai évoqué brièvement dans une entrée passée les nombres surréels de Conway. En marge de ma saga sur les ordinaux (commencée ici), je voudrais essayer d'en parler un peu plus ici (comme d'habitude, je promets de faire en sorte de dépendre le moins possible des entrées passées et d'être largement self-contained), et discuter notamment de la question de savoir dans quel mesure ces objets sont naturels, ou intéressants. Je sais qu'ils fascinent beaucoup les mathématiciens amateurs ou moins amateurs, parce qu'ils sont une classe de nombres extrêmement généraux, unifiant à la fois les ordinaux et les nombres réels : on aime bien, en maths, trouver des généralisations communes à plusieurs choses (et c'est vrai que c'est assez rigolo de se dire qu'il y a des « nombres » comme ω√2 ou ε−½). Il y a aussi de jolies analogies entre ces nombres surréels et les nimbres, ces derniers étant une sorte de version en caractéristique 2 de la même chose. Ceci étant, je n'arrive pas vraiment à décider si je trouve les nombres surréels vraiment élégants ou insupportablement bricolés, et je veux présenter des arguments dans les deux sens.

Suites de signes

Je vais prendre la définition suivante : un nombre surréel est une suite de signes plus (+) et moins (−), dont la longueur peut être ou non finie, et est en général un ordinal. (Cet ordinal est appelé par Conway la date de naissance du nombre surréel en question.) Parfois on peut avoir envie d'imposer à cette longueur de ne pas être trop grande, j'y reviendrai.

0 −1 1 −2 −½ ½ 2 −3 −3⁄2 −¾ −¼ ¼ ¾ 3⁄2 3

Par exemple, la suite vide () servira à désigner le nombre 0 (c'est le seul nombre surréel né le jour 0), la suite de longueur 1 formée d'un seul plus (+) le nombre 1 tandis que la suite (−) sera le nombre −1 (ce sont les deux nombres surréels nés le jour 1). Les quatre suites possibles de longueur 2, (++), (+−), (−+) et (−−) seront les nombres 2, ½, −½ et −2 respectivement (les quatre nombres surréels nés le jour 2). Comme je n'ai pas encore expliqué comment on ajoute ou multiplie les nombres surréels, il est normal de ne pas comprendre pourquoi ils correspondraient à ces valeurs précises, mais je donne ces exemples juste pour situer. En fait, n'importe quelle suite finie de + et de − codera un nombre dyadique, c'est-à-dire de la forme p/2r (avec p et r entiers). Ces suites forment un arbre, représenté ci-dessus si votre navigateur gère le SVG (prendre la branche qui descend à droite revient à ajouter un + à la fin de la suite, et celle qui descend à gauche revient à ajouter un −), et dont on devine assez bien la règle de correspondance avec les dyadiques : pour construire le niveau r en ayant construit les niveaux antérieurs, chaque nœud représente le nombre qui est la demi-somme du nombre immédiatement à gauche et du nombre immédiatement à droite dans les niveaux précédents (je veux dire, l'ancêtre le plus récent qui soit situé sur la gauche, resp. sur la droite, du nœud considéré), sauf pour le nombre le plus à droite d'un niveau donné qui s'obtient en ajoutant 1 à celui du niveau précédent (c'est donc l'entier r) et pour le nombre le plus à gauche qui s'obtient en soustrayant 1 à celui du niveau précédent (c'est donc l'entier −r).

(dimanche)

Jeux combinatoires et ordinaux

Je continue ma série sur les ordinaux commencée ici et (tout en promettant de faire mon possible pour que chaque entrée soit au moins vaguement lisible si on n'a pas bien lu les précédentes !, sinon je n'aurai vite plus personne qui suive).

Je commence par évoquer un des jeux mathématiques les plus classiques (et dont j'ai déjà parlé par le passé), le jeu de nim (que j'ai parfois aussi entendu appeler jeu de Marienbad parce qu'il apparaît dans le film L'année dernière à Marienbad de Resnais). C'est un jeu extrêmement simple, que n'importe qui peut comprendre :

On dispose un certain nombre d'allumettes (bâtonnets, jetons, ce que vous voudrez) en un certain nombre de lignes, classiquement 1+3+5+7=16 allumettes dans la position de départ (cf. la figure ci-contre si votre navigateur supporte le SVG). Deux joueurs s'affrontent et chacun, tour à tour, retire des allumettes, autant qu'il en souhaite mais provenant d'une seule ligne (il peut retirer la totalité de la ligne s'il le souhaite, et il peut ne retirer qu'une seule allumette, ou n'importe quoi entre les deux ; mais il doit retirer au moins une allumette et ne doit affecter qu'une seule ligne). Le gagnant est celui qui retire la dernière allumette (de façon équivalente, celui qui ne peut plus jouer parce qu'il n'y a plus aucune allumette a perdu).

La variante misère, dans laquelle celui qui retire la dernière allumette a perdu, existe aussi, et est même peut-être plus fréquente, mais elle est moins satisfaisante mathématiquement et je ne vois aucune raison de la préférer.

Ce petit jeu peut avoir un certain succès auprès des gens qui ne le connaissent pas (et quand on connaît le truc, c'est rigolo de les faire perdre). Si vous ne connaissez pas, et si votre navigateur le supporte, la figure ci-contre est jouable (je vous laisse deviner le mode d'emploi, qui n'est peut-être pas terrible, mais je fais ce que je peux).

Évidemment, la seule chose qui importe pour définir un état du jeu est le nombre d'allumettes restant dans chaque ligne (on pourrait imposer que les joueurs retirassent les allumettes à partir de le droite, ça ne changerait rien). Mathématiquement, on peut dire que le jeu est basé sur les idées que (1) si on décroît un nombre, on finit forcément pas s'arrêter (parce qu'on tombe sur zéro) et que (2) on va faire perdre le joueur qui ne peut plus jouer (selon la logique que chaque joueur est obligé de jouer, donc celui qui ne le peut pas à perdu).

Décrit comme ça, et vu que j'ai présenté les ordinaux comme des lignes de bâtonnets et que j'ai lourdement insisté sur le fait que quand on décroît un ordinal on obtient un processus qui termine toujours, on devine bien sûr que je vais définir un jeu de nim transfini (ou ordinal), dans lequel les lignes peuvent comporter un nombre éventuellement infini de bâtonnets. Mais en fait, ceci sera mon deuxième thème : je commence par un type de jeu un petit peu différent selon le même genre d'idées.

(Les deux parties qui suivent sont indépendantes, et les deux sous-parties de la première le sont aussi à peu près.)

(dimanche)

Petit navigateur d'ordinaux

À la fois pour m'exercer à la programmation en JavaScript (dont j'ai déjà dû dire que c'est un langage dans lequel je trouve un mélange très étonnant de choix très élégants et puissants et de bizarreries insupportables), et pour exercer mon intuition sur les ordinaux, j'ai créé une petite page dynamique (devrais-je dire un jeu en HTML5 ?) d'exploration des ordinaux sous la forme de bâtonnets comme je les présentais dans une entrée récente.

La page est ici, et je l'inclus aussi dans une frame plus bas dans cette entrée (mais c'est moins commode de cette manière parce qu'on ne peut pas utiliser l'historique du navigateur et notamment le bouton back) ; son utilisation mérite sans doute quelques explications. L'idée est qu'un certain ordinal est présenté sous forme de bâtonnets (au départ, ε0, mais on peut en sélectionner d'autres), et plus précisément comme une somme infinie, toujours aux mêmes proportions géométriques, de différents termes (du genre ε0 = ω + ωω + ωωω + ωωωω + ⋯, les termes omis valant d'ailleurs tout autant que le total), et on peut sélectionner un de ces termes (soit un des quatre premiers termes, soit la totalité du reste de la série, ce qui fait cinq choix) pour zoomer dessus : cela se fait soit en cliquant sur le graphique, soit sur un des noms des ordinaux en-dessous (ce sont des liens) qui représentent les valeurs de ces différents termes. Le faire devrait déclencher une animation où on voit la partie en question s'étendre jusqu'à occuper toute la largeur de l'image. Lorsque ceci se produit, le titre reflète le nouvel ordinal qu'on est en train d'observer (la valeur de l'ordinal représenté dans l'image, le « nombre » de bâtonnets sur lesquels on a zoomé, si l'on veut).

En bas de l'image s'affiche aussi le « nombre » de bâtonnets qu'on a fait disparaître sur la gauche, c'est-à-dire la valeur de la somme des termes précédents de la série (à toutes les étapes), ou encore, si l'on préfère, l'ordinal du bâtonnet le plus à gauche à l'intérieur de l'ordinal initial : en quelque sorte, c'est notre position actuelle dans l'ordinal de départ alors que l'ordinal affiché dans le titre est en quelque sorte notre niveau de zoom ; il est donc possible, pour n'importe quel ordinal α plus petit que l'ordinal de départ (et multiple de ω, parce que mon programme refuse de descendre plus loin), de faire en sorte que cet ordinal removed at left vaille exactement α.

En cliquant sur la partie tout à droite (celle qui représente la somme de tous les autres termes de la série), on ne fait pas diminuer l'ordinal représenté, et le processus ne termine jamais (enfin, jusqu'à ce qu'on ait fait exploser JavaScript, ce qui ne devrait pas être long, j'imagine). Si on clicke sur d'autres parties, l'ordinal décroît toujours (je parle de celui indiqué dans le titre, i.e. la « largeur », pas celui du bas, la « position », qui elle augmente toujours), et donc on tombe forcément en un nombre fini d'étapes sur ω, mais à moins de clicker sur la partie la plus à gauche, ce nombre fini d'étapes risque souvent d'être considérablement plus long que la durée de vie de l'Univers, ou en tout cas que la mémoire de votre navigateur, donc il est facile de tomber sur des ordinaux impossiblement compliqués.

Bref, voilà le joujou, je fais d'autres remarques plus sérieuses en-dessous :

Quelques remarques d'ordre mathématique, maintenant, suivies de quelques remarques d'ordre informatique :

  • Tous les ordinaux dans l'histoire ressemblent un peu à la même chose. En fait, dès qu'ils sont plus que légèrement compliqués, ils doivent être identiques au pixel près. La fractale à laquelle ils ressemblent, qui a tout à voir avec mon choix d'arrangement des bâtons, et rien avec la nature fondamentale des ordinaux, peut être décrite comme ceci : si on appelle u la transformation affine qui fixe le point au milieu à gauche du dessin et qui transforme l'axe des abscisses par un coefficient 10/3 et laisse les ordonnées identiques (c'est la transformation qui sert à zoomer sur la partie la plus à gauche de l'ordinal) et v la similitude qui fixe la pointe droite du dessin et qui a pour rapport 10/7 (les transformations qui servent à zoomer sur les autres parties de l'ordinal sont alors uv, uv², uv³, et v4 pour la partie restante), alors il s'agit du plus petit fermé contenant le bâtonnet tout à droite et stable par u et v. Ça, je répète, c'est à quoi mes dessins d'ordinaux ressemblent, et ça signifie simplement que la complexité est telle qu'on ne peut pas résoudre les petits bâtons individuels à moins de clicker très souvent ; mais cette fractale comporte un nombre infini de « bâtonnets » entre deux abscisses distinctes, alors que mes dessins d'ordinaux ont, en principe, un bâtonnet distinct à droite de n'importe quel bâtonnet donné. Bref, voilà une première limitation sérieuse de mon système, c'est qu'on n'y voit rien, et qu'on se retrouve plus ou moins à zoomer tout le temps de la même façon sur le même dessin, avec juste les noms qui changent, ce n'est ni très intéressant, ni très éclairant. :-(
  • Encore plus sérieux : ce système suggère, alors que c'est faux, qu'il existerait une façon unique, ou au moins très naturelle, de fabriquer n'importe quel ordinal comme somme d'une série d'ordinaux plus petits ; ou que la subdivision de l'ordinal a quelque chose d'intrinsèque. Or ce n'est pas le cas. Par exemple, l'écriture de ωω comme ω + ω² + ω³ + ⋯ laisse penser, comme elle est représentée, que le premier ω est spécial ou différent des autres ω qui peuvent se trouver à l'intérieur des autres termes : il n'en est rien, il a un rôle totalement semblable à celui que joue par exemple le premier ω du terme ω², c'est-à-dire que la séparation des termes n'a rien de magique ou d'intrinsèque. Je suis donc en train de donner une impression totalement fausse de certains ordinaux comme quoi ils seraient plus ou moins espacés à tel ou tel endroit, ce qui n'a aucun sens — seul l'ordre compte. J'avais fait plus attention à ce problème dans mon entrée précédente sur la question, notamment dans mon dessin de ωω, où j'ai fait au moins en sorte que rien ne distingue fondamentalement le premier ω du suivant, mais je ne sais pas généraliser naturellement ce genre d'astuce un peu ad hoc à des ordinaux considérablement plus grands (et de toute façon je ne suis pas persuadé que c'était vraiment plus clair).
  • Les noms que mon programme donne aux ordinaux ne sont pas forcément idéaux : ils sont systématiques et raisonnables, mais ce ne sont pas forcément ceux qu'on utiliserait le plus naturellement. Par exemple, on a ε0ω = ωε0+1, et ε02 = ωε0⁢2, et ε0ω = ωωε0+1, et ε0ε0 = ωωε0⁢2, et ε0ε0ω = ωωωε0+1 (tout cela est laissé en exercice au lecteur, c'est assez facile en se rappelant que ε0=ωε0 et en partant plutôt du membre de gauche) ; or dans chacune de ces égalités, mon programme utilisera la forme de droite pour nommer les ordinaux en question (parce qu'il utilise autant que possible la forme normale de Cantor) alors que la version de gauche (basée en premier lieu sur une écriture en base ε0) semble plus naturelle. Cela peut, au moins, surprendre.
  • Le programme en JavaScript contient un vrai petit système d'objets permettant de représenter les plus petits ordinaux (les plus petits signifiant ici, les ordinaux jusqu'à l'ordinal εεε, qui est le plus petit ordinal vérifiant l'équation α=εα, exclu). Il « sait » vraiment faire des additions, comparer deux ordinaux, trouver une suite qui converge vers un ordinal limite, fabriquer un nom HTML, etc. Ça m'a donné l'occasion de faire de la programmation orientée objet en JavaScript (mélangée à un petit peu de programmation fonctionnelle, puisque je n'hésite pas à renvoyer des fonctions qui capturent des variables internes, etc.). Et à comprendre un peu plus précisément comment fonctionne le système de prototypage de JavaScript (je savais le principe général que chaque objet avait un prototype, qui sert à déterminer la chaîne d'héritage, mais je ne comprenais pas bien la façon dont il était initialisé avec new ou Object.create).
  • C'était aussi l'occasion de faire joujou avec la manipulation des URL en JavaScript : je voulais faire en sorte que chaque état du programme (l'ordinal qu'on voit, mais aussi celui laissé à gauche) corresponde à une URL stable qu'on peut charger directement, du style http://www.madore.org/~david/math/drawordinals.html#?v=e pour la représentation initiale de ε0 (et de même, tous les liens dans la page activent des fonctions JavaScript mais comportent aussi des URL correctes et qu'on peut utiliser directement) ; j'ai donc suivi cette fameuse convention (souvent décriée, mais enfin je ne vois pas comment faire autrement) consistant à coder les paramètres à passer au JavaScript dans ce qui devrait normalement être l'identificateur de fragment. (J'ai utilisé un ‘?’ pour séparer ces paramètres, ça me semble plus propre que de ne rien mettre pour signaler qu'il est normal qu'il n'y ait pas de balise HTML ayant cet ID, mais en même temps je ne voulais pas utiliser le ‘!’ qu'on voit souvent dans cette fonction parce qu'il a un sens magique pour Google.) Ceci permet aussi que (si vous essayez le truc dans sa propre page et pas tel qu'il est inclus dans la présente entrée) les boutons de navigation dans l'historique (back/forward) marchent normalement, ce qui est toujours plus plaisant ; la magie, là, est de capter l'événement hashchange (ça ne marche pas sur tous les navigateurs, mais bon, c'est déjà ça).
  • Ah, et vous vous en foutez, mais si vous voyez des petites mains qui pointent pour marquer les items de cette liste de remarques, je suis assez fier de ma petite magouille en CSS qui m'a fait un peu suer (mais ça c'est parce que je suis mauvais en CSS, pas parce que c'était dur).

(mardi)

Edward Nelson prétend montrer que les mathématiques sont inconsistantes

On me signale cette esquisse d'une démonstration (dont la version complète formerait un gros bouquin), par Edward Nelson (qui est pourtant un matheux relativement renommé, pas un fou dans sa cave), du fait que les mathématiques usuelles, et en fait déjà l'arithmétique de Peano, serait contradictoire.

L'idée serait une sorte de variante du paradoxe bien connu de l'« examen surprise » :

Un prof annonce à ses élèves qu'ils auront un examen au cours de la semaine qui vient (lundi à vendredi) et qu'ils ne pourront pas savoir avant le jour même quel sera le jour de l'examen ; les élèves raisonnent alors que l'examen ne peut pas être le vendredi puisque sinon le jeudi soir ils sauraient que ce ne peut être que le lendemain, et du coup le vendredi est exclu donc l'examen ne peut avoir lieu que du lundi au jeudi, mais les élèves peuvent alors répéter le même raisonnement pour exclure le jeudi, et ainsi de suite, et du coup l'examen ne peut pas avoir lieu du tout ; pourtant, lorsque le mercredi l'examen a lieu, il est effectivement une surprise.

On peut gloser cent mille ans sur ce paradoxe, je ne vais pas le faire parce que ça m'énerve particulièrement (voyez l'article Wikipédia à ce sujet), mais la résolution n'est pas particulièrement compliquée : si on appelle T0 l'axiome il y aura un examen cette semaine et Ti+1 l'axiome (T0 et) on ne peut pas conclure sur la base de Ti quel jour l'examen aura lieu avant qu'il ait lieu, alors T1 implique que l'examen n'a pas lieu vendredi, T2 implique qu'il n'a pas lieu jeudi non plus, T4 implique que l'examen a forcément lieu le lundi, et T5 est contradictoire. Si l'examen a lieu le mercredi, c'est que T3 était faux, voilà tout : si on interprète l'énoncé du prof comme T défini comme (T0 et) on ne peut pas conclure sur la base de T quel jour l'examen aura lieu avant qu'il ait lieu, c'est contradictoire et faux, ce qui n'empêche que T2 peut être vrai, ce qui présente déjà un certain élément de surprise. Bref, je trouve que ce paradoxe n'est pas spécialement intéressant. Mais je veux surtout faire remarquer que ce paradoxe appelle naturellement à faire appel à différentes théories, de plus en plus complexes, dans lesquelles on sait (ou on peut conclure) des choses.

L'erreur technique de Nelson (parce que comme Randall Munroe je n'ai pas le moindre doute qu'il y en ait une, et je ferais bien de prendre son conseil et d'ouvrir les paris au lieu d'essaier d'expliquer les choses) est facile à trouver : même si je n'ai pas envie d'essayer de comprendre exactement ce qu'il prend comme théories faibles de l'arithmétique, il est clair que le qu'il considère en haut de la page 4 (de l'esquisse signalée au début de cette entrée) dépend de la complexité (de Kolmogorov) de la théorie T. Or page 5 il considère des preuves qui increase in rank and level (de nouveau, je n'ai pas envie de savoir exactement ce qu'il entend par là), donc dans des théories T dont la complexité varie, alors qu'il prétend garder fixe. Perdu.

Du moins c'était ma réaction immédiate en lisant son esquisse, et comme je vois ici que Terence Tao est arrivé à la même conclusion, je suis raisonnablement confiant que c'est bien là le problème (au moins dans la façon dont Nelson explique les choses). Les mathématiques sont sauves (et nous avec) !

Mais même si j'ai envie d'ironiser en disant que c'est un peu inquiétant qu'un membre de la National Academy of Science puisse prétendre des choses aussi sottes, il y a un certain intérêt à essayer de comprendre ce que croit en fait Nelson, parce que ce n'est pas idiot (même si quand il pense que l'arithmétique de Peano est contradictoire, je suis totalement et complètement convaincu qu'il se trompe), et c'est une question qui est revenue à diverses reprises sur ce blog. Il ne prétend pas que les mathématiques réellement pratiquées sont contradictoires (et encore moins que 0=1), seulement que tous les systèmes dans lesquels on les fait habituellement sont contradictoires, parce que le principe de récurrence est faux et contradictoire. (Et il pense pouvoir reformuler beaucoup de résultats mathématiques dans un système plus faible qui lui convient, ce qui est en soi intéressant, par exemple du point de vue des mathématiques à rebours, même si on ne croit pas une seule seconde que ZF soit contradictoire.)

Peut-être que pour comprendre sa thèse je peux inviter mon lecteur à lire un texte de vulgarisation sur l'infini que j'avais écrit il y a quelques années, où je commence par expliquer le principe de récurrence sous la forme : 0 est un nombre fini, si n est un nombre fini alors n+1 est aussi un nombre fini (et les entiers naturels sont exactement ce qui s'obtient de cette manière, cf. ce que je racontais récemment sur les ordinaux) ; de ça, je prétends conclure que 1000, mais aussi 101000 ou 10↑10↑10↑10↑⋯↑1000 (avec 1000 élévations à la puissance), ou encore d'autres choses beaucoup plus grandes, sont des nombres finis. Faux, me rétorquerait Nelson : la seule façon dont je pourrais montrer que 101000 est un nombre fini, c'est par une démonstration qui commencerait par 0 est fini, donc 1 est fini, donc 2 est fini, donc 3 est fini, donc 4 est fini… et qui terminerait 101000 par donc 101000 est fini. Or si on met en doute le fait que 101000 soit fini, cette démonstration ne vaut que si elle est écrite complètement, ce qui est manifestement impossible, et je ne peux pas agiter des mains en disant oui, je pourrais le faire en principe, mais c'est très long alors il n'en est pas question : la question est justement de savoir si on pourrait le faire en principe, et si je ne le fais pas, mon raisonnement est circulaire. (Le problème est sérieux, puisque si on permet des longueurs non-standard, il est connu et certain qu'il existe des démonstrations de contradiction dans les mathématiques, mais ces démonstrations ne sont justement pas de longueurs finie, ce ne sont pas du tout des démonstrations, donc tout repose crucialement sur la question de la finitude.)

Maintenant, dans l'arithmétique de Peano, il n'y a aucun problème : si x et y sont des entiers naturels, alors xy existe (=est fini, a bien un sens, est un entier naturel). Mais c'est justement ça que Nelson met en doute : dans les théories faibles de l'arithmétique qu'il considère (je n'ai pas regardé les détails, mais ce genre de choses est assez habituel, voyez par exemple la partie C de ce livre), la fonction exponentielle n'est pas forcément totale : il n'y a pas de raison que xy existe si x et y sont des entiers naturels. Du coup, il faudrait effectivement une démonstration démesurément longue pour montrer que 101000 est un nombre fini ; et ces théories faibles ont un intérêt certain en algorithmique (à cause d'un rapport profond entre leurs théorèmes et différentes hiérarchies de complexité).

Maintenant, je ne sais pas si Nelson croit vraiment que le nombre 101000 n'existe pas ([ajout : en fait, probablement pas, parce que la fonction de multiplication, elle, est bien totale, et on peut construire 101000 en multipliant 1000 fois par 10, ce qui constitue une démonstration assez courte pour être écrite] ; mais il le croit sans doute pour le nombre 10↑10↑10↑10↑⋯↑1000 avec 1000 élévations à la puissance). Cela ne signifie pas qu'il existerait un plus grand entier naturel : tout le monde est d'accord que si n est un entier naturel, alors n+1 en est un, juste qu'on n'atteindrait jamais des nombres comme ce que je prétends avoir écrit ; c'est une opinion provocatrice, que je ne partage pas du tout parce que je suis religieusement platoniste, mais qu'il est difficile de disqualifier, parce qu'il est vrai qu'il faut pour éviter des démonstrations ridiculement longues (et peut-être, justement, prétendra Nelson, infiniment longues !) des axiomes strictement plus forts que ce qu'il admet, et dont il peut tout à fait croire qu'ils sont contradictoires (même si, en l'occurrence, il s'est trompé).

Et c'est un problème philosophique que je considère comme assez sérieux, de savoir si vraiment ces nombres ridiculement grands existent, et comment, et dans quelle mesure et pourquoi on a besoin qu'ils existent, et si les mathématiques peuvent s'en passer. Si on pense qu'ils existent (ce qui est mon cas), la difficulté est d'éviter le côté religieux du paradis platoniste. À l'inverse, si on pense qu'ils n'existent pas (ce qui est le cas de Nelson et, je crois, dans une certaine mesure, d'au moins un lecteur de ce blog), la difficulté est d'expliquer pourquoi ils ne causent pas de contradiction (s'ils n'en causent pas, c'est une forme d'existence au moins potentielle : pourquoi des choses inexistantes auraient-elles des conséquences tangibles comme la non-contradiction de Peano ou de ZFC ?), ou sinon, de trouver cette contradiction (comme Nelson semble déterminé à faire). Les paris sont ouverts !

(dimanche)

Nombres ordinaux : une (longue) introduction

Encore une fois je vais tenter de communiquer mon enthousiasme pour un objet mathématique en essayant d'en parler de façon compréhensible par ma petite sœur[#] : et encore une fois je vais échouer lamentablement parce que les non-matheux n'y comprendront vite rien ou n'essaieront pas de lire, et les matheux n'y apprendront rien. Encore une fois j'écris un post de blog en promettant que c'est le premier d'une série : et encore une fois je vais échouer parce que cette série s'arrêtera probablement à un élément (c'est toujours mieux que zéro, certes).

Parmi les choses qui me fascinent dans les mathématiques (un jour, je publierai un petit catalogue de mes objets mathématiques préférés), il y a beauté qui émane de la symétrie (dans quoi je range toute structure algébrique assez rigide), mais il y a aussi quelque chose sur quoi j'ai plus de mal à mettre un mot, disons peut-être la grandeur. Les ordinaux sont très représentatifs de cette dernière catégorie, et ils forment d'ailleurs une échelle de grandeur à l'aune de laquelle on peut mesurer beaucoup de « phénomènes » mathématiques (souvent pour un résultat décevamment[#2] médiocre, d'ailleurs). J'ai déjà tenté d'en parler sur ce blog (et encore), mais sans vraiment faire l'effort de vulgariser de quoi il s'agit au juste : voici donc une nouvelle tentative, agrémentée de petits dessins.

Plan de cette entrée :

(mercredi)

Passage en HTML5

On va encore me reprocher de faire des annonces techniques qui n'ont aucune conséquence perceptible (mais bon, quand je parle d'autre chose, l'électro-encéphalogramme des commentaires enregistre un calme plat, alors que voulez-vous ?) : je viens de passer ce blog (et toutes les pages de ce site gérées par le même moteur) en HTML5[#]. C'est encore mal dégrossi, mais j'ai essayé de mettre les balises sémantiques comme article, header, footer, nav là où elles s'imposaient. Sur les navigateurs modernes, cela ne devrait faire aucune différence visible. Il y a peut-être un espoir que Google soit moins désorienté dans l'indexation, mais je n'y crois pas trop[#2].

En revanche, ce qui est bien est que je peux maintenant, enfin, librement inclure du SVG et du MathML dans mon blog. Et pour que mon annonce ne soit pas complètement creuse, donc, voici à gauche une étoile à sept branches en SVG (donc si vous ne voyez pas d'étoile à sept branches, c'est que votre navigateur n'est pas assez récent), et voici une formule en MathML permettant de montrer que l'étoile en question est constructible par origami :

e 2iπ 7 = 16 ( 1 +7 + 72 + 213 2 3 + 72 213 2 3 + 4972 + 2733 2 6 4972 2733 2 6 )

(La démonstration de la formule est laissée en exercice au lecteur. Je ne sais pas ce que j'ai trouvé le plus pénible dans l'histoire, d'ailleurs, entre la calculer et la taper en MathML.) Si vous voyez juste quelques nombres éparpillés mais pas de fraction ou de racine, même conclusion que pour le SVG : votre navigateur est trop vieux ou mauvais (et je note avec déception que, chez moi, aussi bien Chrome qu'Opera sont incapables d'afficher le MathML — ce qui est d'autant plus bizarre, s'agissant de Chrome, que WebKit est censé avoir au moins une implémentation partielle de MathML).

[#] Techniquement, et pour répondre à la première de mes questions techniques de l'autre jour, en polyglotte HTML5/XHTML5. J'ai validé un certain nombre de pages (certes pas toutes) contre le validateur expérimental, ce qui m'a d'ailleurs fait trouver un bug dedans (dû à la façon dont Java saucisonne l'Unicode en UTF-16 ; c'est assez ironique, parce que l'auteur de ce validateur écrit en faisant l'éloge de Java's notion of Unicode frozen as UTF-16 from to dawn of time until eternity).

[#2] En revanche, et cela devrait répondre du même coup à la deuxième de mes questions techniques de l'autre jour, si j'adopte, et je vais envisager de le faire, le microformat hAtom, j'ai bon espoir que cela permette de vraiment définir la limite des entrées et aux agrégateurs de fournir un contenu complet.

(mercredi)

Qu'est-ce qu'un panier pour les économistes ?

J'éprouve toujours une certaine satisfaction un peu puérile quand je redécouvre ou réinvente quelque chose qui était déjà connu ou inventé. Il y a longtemps je m'étais demandé comment on devrait fabriquer une monnaie fictive qui représente une sorte de moyenne de devises existantes pour pouvoir, par exemple, toutes les comparer à cette moyenne plutôt que les unes aux autres (notamment pour atténuer les fluctuations dans le point de comparaison lui-même), et j'avais conclu pour plusieurs raisons que la bonne chose à faire était indiscutablement de prendre une moyenne géométrique et pas arithmétique des monnaies. Les deux arguments les plus évidents sont : (1) que ce qui a un sens important, ce ne sont pas vraiment les cours relatifs des devises, ce sont leurs logarithmes[#] — d'ailleurs, il faudrait toujours afficher les graphiques boursiers sur une échelle logarithmique — et que prendre la moyenne des logarithmes, c'est justement prendre une moyenne géométrique ; et (2) une moyenne arithmétique n'a pas trop de sens parce qu'il faut savoir comment on la pondère : on voit bien que prendre la moyenne arithmétique également pondérée au sens idiot entre 1$ et 1¥, c'est-à-dire 0.50$+0.50¥, ne va refléter que les variations du dollar et pas celles du yen vu que celui-ci compte, au final, pour à peu près 1.3% du total. Ceci étant, je ne voyais pas trop la moyenne géométrique utilisée, et je me suis dit, bon, ça doit être une idée saugrenue de matheux que j'ai eue.

Je savais bien qu'il existait un truc appelé un panier de monnaies (par exemple l'écu[#2] était un panier des monnaies européennes) (il existe d'ailleurs des paniers de beaucoup de choses : un panier de biens pour mesurer l'inflation des prix, un panier d'actions pour constituer des indices, etc.), mais la (mauvaise) explication qu'on lit en général, c'est qu'un panier est obtenu en prenant les différentes valeurs constituantes dans différentes proportions, et ceci semble suggérer une moyenne arithmétique. Pourtant, à regarder d'un peu plus près, on se rend compte que les proportions sont déterminées en proportion du panier et pas comme des fractions absolues des valeurs du panier. Qu'est-ce que cela signifie ?

Imaginons que je cherche à constituer un panier, le zorkmid (symbole ¤), avec pour simplifier deux monnaies dedans, disons le dollar ($) et l'euro (€). A priori je vais poser : 1¤ :≡ u$ + v, où les coefficients u et v sont susceptibles de varier dans le temps : à ce stade-là il s'agit d'une moyenne arithmétique ou plutôt d'une combinaison linéaire, et je n'ai rien dit du tout. Après tout, l'euro lui-même a un cours en dollars (ou vice versa), donc je pourrais écrire 1€ = z$ (pour le coup, il est certain que z varie au cours du temps) et 1¤ = (u+v·z)$ et du coup j'ai plutôt trop de variables. (Noter que j'utilise ‘=’ pour indiquer une égalité des cours, alors que j'ai écrit ‘≡’ pour indiquer quelque chose de peut-être un peu plus fort, reste à savoir ce que ça veut dire au juste.) Cherchons à voir ce qu'on pourrait imposer de plus.

La première condition consiste à se dire, comme je le suggère plus haut, que les coefficients u et v, au lieu d'être fixés de façon absolue, sont contraints par le fait qu'on veut que le dollar et l'euro comptent pour des proportions respectivement p et q (fixes, cette fois, avec p+q=1) de la valeur totale du zorkmid. Autrement dit, la valeur de u$ et v€ est dans des proportions p et q du total : en introduisant le taux de change 1€=z$, on va donc imposer que v·z = (q/pu (je répète qu'ici, u, v et z sont des fonctions du temps et que p et q, a priori, sont constants). Cette condition dit donc qu'on va ajuster les coefficients u et v de sorte que les u$ et v€ constituant le zorkmid soient toujours dans les proportions p contre q (si l'une des monnaies s'effondre par rapport à l'autre, le coefficient dans lequel elle entre augmentera relativement à l'autre pour compenser).

Mais il me reste une condition à trouver, totalement indépendante de la précédente (et qui consiste, en quelque sorte, à expliquer ce que signifie le ‘≡’ ci-dessus). C'est l'affirmation que, quand la valeur du dollar et de l'euro change, la valeur du zorkmid change de la même façon comme prescrit par les coefficients u et v (c'est-à-dire, comme si on avait effectivement u dollars et v euros) et pas suite à des changements de u et v eux-mêmes. De façon peut-être plus claire : en imaginant qu'on décompose les choses en variations infinitésimales, dans un premier temps la valeur du dollar et de l'euro change, ce qui change la valeur du zorkmid comme u dollars plus v euros, puis dans un second temps on change u et v mais en préservant alors la valeur du zorkmid. De façon plus succincte : cette condition affirme qu'on n'apporte pas d'argent et qu'on n'en retire pas au panier, on se contente de changer les proportions u et v. De façon encore plus parlante : on a en permanence un capital (le zorkmid) formé de u dollars et v euros, la valeur de ce capital évolue au fur et à mesure que ces devises varient, et on joue à convertir l'une en l'autre ou vice versa (par exemple pour vérifier la condition précédente, ou peut-être une autre) mais c'est la seule opération qu'on se permet de faire pour modifier u et v — on n'apporte pas d'argent de l'extérieur. Cette condition se traduit de la façon suivante : (u+v·z)′=v·(z′) où ′ dénote la dérivée par rapport au temps (le membre de gauche représentant la variation de la valeur du zorkmid en dollars au cours du temps, et le terme de droite impose qu'il soit donné uniquement par la variation de l'euro puisqu'on a exprimé les choses en dollars ; ce serait heureusement équivalent de les exprimer en euros). Autrement dit (en développant la dérivée du membre de gauche), la seconde condition est : u′ + v′·z = 0 (on me souffle que ça s'appelle la condition d'autofinancement, justement parce que cela signifie qu'on n'apporte ni ne retire d'argent au panier).

Maintenant, si je mets ensemble les deux conditions que je viens d'exprimer, j'ai un système d'équations différentielles (les variables étant u et v, et z une fonction paramètre) dont la solution est : u = K·p·zq et v = K·q·zpK est une constante arbitraire (on rappelle que q=1−p), c'est-à-dire que le zorkmid vaut 1¤ = (K·zq)$ = (K·zp)€. C'est précisément ce qu'on appelle, à une constante multiplicative près, la moyenne géométrique (pondérée des coefficients p et q) entre le dollar et l'euro ! (La moyenne géométrique entre 1$ et 1€=z$ est (1p·zq)$ = (zq)$.) Ceci se généralise assez simplement à un nombre quelconque de monnaies.

On ne peut pas dire que ce soient des maths de haute sophistication, mais je suis quand même content d'avoir retrouvé la moyenne géométrique, et d'avoir redécouvert tout seul comme un grand ce qu'est un panier (et on me confirme que je ne me suis pas trompé). Mais au-delà de ça j'ai deux remarques à faire.

La première concerne la réalisabilité du panier. Si je dois réaliser une combinaison u$ + v€ avec u et v constants (une combinaison arithmétique/linéaire, quoi), c'est facile, on prned u dollars plus v euros, on n'y touche pas, et la combinaison est ainsi réalisée. Pour le panier décrit ci-dessus, on doit en permanence convertir les monnaies l'une en l'autre au fur et à mesure qu'elles fluctuent pour maintenir vraie la première condition, v·z = (q/pu. Or ceci n'est pas possible de façon infinitésimale. Mais ce qui est magique, c'est qu'en vertu d'une inégalité classique (de convexité ou de moyenne ou de Hölder ou je ne sais quoi, j'ai la flemme de réfléchir à celle qui sert vraiment), si on a 1¤ sous la forme u0$ + v0€ à un certain moment t0, et que les cours relatifs de l'euro et du dollar changent, quelle que soit la durée qu'on attende, on aura au moins 1¤ (c'est-à-dire que u0+v0·zu+v·z si u = K·p·zq et v = K·q·zp et pareil avec des indices 0). Autrement dit, bien qu'au niveau infinitésimal on ait mis une condition d'autofinancement, si j'attends un temps fini, j'extrais de l'argent de mon u$ + v€ pour conserver 1¤ (ou bien : si j'ai 1¤ sous la forme u0$ + v0€ au moment t0 et que je le garde sur ma table sous la forme de u0 dollars et v0 euros, une semaine plus tard quand les cours auront changé, si je fais les conversions qui s'imposent pour revenir dans les proportions p et q, j'aurai plus que 1¤). Je suppose même que c'est une façon certes très simple mais raisonnable de hedger contre les variations de monnaies, et je suppose que c'est un fait bien connu. (En revanche, plus ou fait souvent les rééquilibrages des proportions de l'euro et du dollar dans le panier, moins on extrait d'argent, et à la limite si on le fait en continu, on n'extrait rien puisqu'il y a autofinancement.)

L'autre remarque concerne une analogie dont je ne sais pas très bien quoi faire. Un fait bien connu en thermodynamique est le suivant : si je prends deux corps, de capacités calorifiques constantes, disons égales pour simplifier, qui sont à des températures différentes, et que je les mets bêtement en contact, à l'équilibre la température sera la moyenne arithmétique (naïvement, si je mélange 1kg d'eau à 20°C et 1kg d'eau à 80°C, j'obtiens à peu près 2kg d'eau à 50°C, même si ce n'est pas tout à fait exact parce que la chaleur spécifique de l'eau varie un peu avec la température) ; en revanche, si au lieu de les mettre bêtement en contact je fais tourner un moteur idéal pour extraire tout le travail que je peux de cette différence de température, c'est-à-dire que je fais le mélange sans produire d'entropie, alors la température résultante est la moyenne géométrique des températures thermodynamiques absolues des deux corps (qui est plus basse que la moyenne arithmétique justement par l'inégalité mentionnée ci-dessus, et la différence a été récupérée sous forme de travail par le moteur). Il y a une certaine analogie dans les formules avec ce que je viens de dire ci-dessus, ce qui n'est certes pas surprenant vu que la moyenne géométrique apparaît à cause d'une différentielle logarithmique quelque part (dans le cas de la thermo, c'est la quantité d'entropie δQ/T qui s'écrit c·dT/T lorsque la chaleur spécifique c est constante, et c'est de là que tout sort), mais il reste que la condition d'autofinancement évoquée ci-dessus évoque quand même de façon surprenante la condition de non production d'entropie. Peut-on dire qu'en récupérant de l'argent de la réalisation du zorkmid évoquée au paragraphe précédent on est en train de faire fonctionner un moteur de Carnot entre le dollar et l'euro ? Ou est-ce que je suis en train de virer au crackpotisme, là ?

Je vais m'arrêter sur cette angoissante question, et sur l'étonnement du nombre de mots que j'arrive à pondre sur un sujet aussi trivial, mais au moins j'aurai fait le service que je dois au fan-club de la moyenne géométrique (dont je suis un membre militant).

[#] Une « règle du pouce » est que quand une grandeur ne peut pas être négative, il est probable que ce soit une grandeur logarithmique (au sens où c'est son logarithme, éventuellement rapporté à une origine arbitraire, qui a un sens naturel). Une indication supplémentaire, c'est que ça ait beaucoup plus de sens que cette grandeur soit doublée ou divisée par deux que augmentée ou soustraite d'une quantité constante.

[#2] On apprend des choses amusantes en lisant cet article de Wikipédia, notamment que les états américains de l'Illinois et de New York ont passé des lois déclarant que l'euro est le successeur de l'écu, par prudence pour éviter que certains contrats rencontrent des difficultés légales.

(samedi)

Pourrait-on appliquer la logique linéaire aux produits financiers ?

Il faut que je me dépêche de parler de produits financiers, parce qu'il paraît que lundi le monde va s'écrouler parce qu'un truc est passé de AAAAA à AAAA++ ou quelque chose de ce genre.

Je n'ai jamais eu la patience (ou le temps à perdre) pour dépasser les quelques premiers chapitres du classique livre de Hull, Options, Futures, and Other Derivative Securities, et je n'ai pas énormément d'intérêt[#] en général pour la finance ou pour les maths financières, mais j'avoue qu'il y a dans la structure des produits dérivés quelque chose que je trouve intellectuellement intéressant. Pas tellement le détail des produits en question, mais l'idée sous-jacente qu'un produit dérivé, qui est un contrat visant une certaine transaction (par exemple, s'agissant d'un future, s'engageant à vendre ou à acheter quelque chose dans l'avenir à un taux déterminé dans le contrat), puisse lui-même être acheté ou vendu, donc faire l'objet d'autres transactions, y compris dans des contrats constituant d'autres produits dérivés.

Ces produits dérivés sont étudiés mathématiquement sous l'angle des probabilités (par exemple, des équations différentielles stochastiques s'il s'agit de modéliser comment pourrait évoluer le cours d'une action ou d'une commodité afin de pricer un future ou une option sur sa vente ou son achat). Mais je n'ai pas l'impression que qui que ce soit se soit vraiment penché sur la question plus basique (et peut-être pas du tout intéressante, c'est vrai) de la structure, algébrique si j'ose dire, des contrats qui peuvent être passés.

Pour donner une idée de ce dont je veux parler, mettons que je note €⊸¤ un contrat qui m'oblige et me permet à la fois, dès maintenant, d'acheter 1 zormid au prix de un 1 euro, et □2012-12-21(€⊸¤) un contrat (un future — ou peut-être un forward peu importe) qui m'oblige et me permet d'acheter au 21 décembre 2012, 1 zorkmid au prix de 1 euro. L'option qui consisterait à m'autoriser (sans que ce soit obligatoire ; les financiers diraient que je suis long sur l'option d'achat d'un zorkmid) à échanger 1€ contre 1¤ le 21 décembre 2012 s'appellerait □2012-12-21(1&(€⊸¤)), où le 1 (qui devrait sans doute être un 𝟏, en fait) signifie rien du tout (pour des raisons qui deviendront claires plus tard — ou pas — je choisis une notation multiplicative, dont c'est un 1 qui désigne le rien, et dans le même genre, 5 euros devraient normalement se noter €⊗5) et le & signifie que j'ai le choix entre les deux parties proposées. En revanche, si je suis le cocontractant (c'est-à-dire court) pour une option qui autorise quelqu'un à me vendre 1 zorkmid pour le prix de 1 euro et que je serais obligé d'accepter, je noterais ça □2012-12-21(1⊕(€⊸¤)), le signe signifiant cette fois que ce n'est pas moi qui choisis. L'action consistant à vendre pour 1 dollar cette dernière option (celle par laquelle je m'engage à accepter d'acheter 1 zorkmid pour le prix de 1 euro le 12 décembre 2012) se noterait (□2012-12-21(1⊕(€⊸¤)))⊸$, et ainsi de suite.

Mes notations sont un peu barbares, mais le lecteur qui aurait lu le titre ou qui les aurait reconnues comprendra qu'il s'agit de celles de la logique linéaire de Girard, avec l'interprétation intuitive classique des connecteurs de celle-ci : AB désigne un contrat qui oblige et permet de transformer A en B, tandis que A&B désigne un contrat qui garantit de pouvoir disposer au choix de A ou de B (au choix de celui du point de vue duquel on se place) alors que AB désigne un contrat qui garantit qu'on disposera soit de A soit de B sans garantir lequel des deux. Et AB indique qu'on a à la fois A et B (s'agissant de beaucoup de choses, comme des euros, je suppose[#2] que AB, pour beaucoup de valeurs de A et de B, par exemple des sommes en euros, serait en fait égal à AB). Reste que ma sémantique n'est pas aussi claire que je voudrais le faire croire, et surtout que le rapport avec le temps qui passe, que j'ai arbitrairement noté □ (comme une sorte de modalisateur) n'est pas évident : il faudrait une logique linéaire temporelle…

⚠ Là, le Club Contexte est très fier de lui : il existe un truc qui s'appelle la logique temporelle linéaire, et qui n'a rien à voir avec la logique linéaire ou avec la logique linéaire temporelle que je voudrais.

C'est peut-être une idée très fumeuse, mais la symétrie entre les positions longue et courte sur une option et les opérations & et ⊕ de la logique linéaire me semble assez frappante, et j'ai l'impression que beaucoup de clauses de contrats peuvent effectivement se formuler dans ce langage. En tout cas, bizarrement, je ne trouve aucun indice que quelqu'un ait eu cette idée avant moi (et il y a quelques années j'avais évoqué la question avec un ami qui a fait de la logique linéaire quand il était plus jeune puis, après un petit passage par les topoï, est devenu trader, et il a reconnu qu'il n'avait jamais fait le lien).

Il y a un peu plus d'un an, quelqu'un avait sorti un canular selon lequel l'analyse ordinale (un sujet qui m'intéresse beaucoup — et je suis le principal auteur de cet article de Wikipédia) aurait trouvé des applciations en finance. Ce n'était pas crédible, mais pas complètement absurde non plus : quiconque a lu les très étranges livres de Conway, On Numbers and Games et Winning Ways sait que de la théorie (combinatoire) des jeux aux ordinaux il n'y a pas très loin, et de la théorie (fût-elle combinatoire) des jeux à la finance, il n'y a pas très loin non plus. En tout cas, le canular était rigolo et bien trouvé (mais je n'ai jamais eu d'explication au juste sur qui l'avait lancé et pourquoi). Moi je propose la logique linéaire (quelque chose qui est aussi notoirement considéré dans le contexte de la théorie des jeux) à la place des ordinaux. Enfin, bien sûr, si je devais écrire un projet ANR, je n'hésiterais pas à expliquer que je vais mettre tout ça ensemble, la logique linéaire, les ordinaux, les équations différentielles stochastiques, la théorie des jeux, peut-être même les topoï, pour attaquer les marchés financiers, et gagner ‹ordinal de Bachmann-Howard› euros (mais qui ne vaudront plus rien parce que l'euro se sera écroulé et ce sera la fin du monde).

[#] Tout, bien sûr, est relatif. Par rapport au foot ou aux frasques des célébrités du show-biz, je trouve la finance fascinante (et cette comparaison n'est pas gratuite : dans mon club de muscu on nous distribue des journaux gratuitement, les plus fréquents étant La Tribune, un journal « people » dont je ne me rappelle pas bien le titre, et évidemment L'Équipe — dans ce contexte, clairement, La Tribune est ce qui m'intéresse le plus). Ceci étant, je crois que je préférerais le bulletin de la société slovène de philologie.

[#2] C'est toujours le ⅋ (par) qui est embêtant, quand on essaie de donner une sémantique, formelle ou intuitive, à la logique linéaire. Mais pour quelque chose de dénombrable et de fractionnable comme des euros, des dollars, des zorkmids ou des onces d'or, il est assez clair que AB et AB sont égaux ; une façon de s'en convaincre est de se dire que dans ce contexte, AA′ a manifestement la valeur somme de A et A′ (par exemple, si A et A′ sont un certain nombre de zorkmids, AA′ est la somme de ces nombres), et AB a la valeur de B moins celle de A (puisqu'on donne A pour recevoir B), or il se trouve que (AB)⅋(A′⊸B′) est exactement équivalent, en logique linéaire, à (AA′)⊸(BB′). En raisonnant sur cette base, on peut arguër que ⊥ (l'unité pour ⅋) ou AA pour tout A (dans le domaine considéré de choses dénombrables et fractionnables) représente la même chose que 1 (l'unité pour ⊗), à savoir une valeur nulle ; et du coup que AB et AB valent la même chose.

(samedi)

Ordres de succession, et encore de la généalogie mathématique

Je repense à ça en apprenant la mort du prince Otto von Habsburg (dernier prince hériter de l'empire d'Autriche) : j'ai cru un instant lire que la maison des Habsbourgs s'était éteinte, ce qui n'est bien sûr pas le cas.

Récemment j'avais lu un article qui m'avait bien fait rire sur une certaine Karin Vogel, assistante médicale vivant à Rostock en Allemagne, qui aurait l'honneur fort douteux, selon certains généalogistes amateurs, d'être la dernière (et 4973e), au moment où l'article a été écrit, dans l'ordre de succession à la couronne britannique. La liste est finie parce que l'Act of Settlement de 1701 ne désigne comme héritiers possibles que les descendants de la princesse électrice Sophie de Hanovre. La liste complète était maintenue sur Wikipédia dans le temps (Mme Vogel y figure bien en dernier, mais avec un rang très différent parce qu'elle ne numérote pas les catholiques qui sont expressément exclus par l'Act of Settlement). Comme Wikipédia a des choses plus sérieuses et importantes à maintenir que les héritiers de la couronne britannique, la liste a été remplacée par une version abrégée.

Il y a deux principales conceptions qui s'opposent pour déterminer l'ensemble des héritiers potentiels d'une couronne : la monarchie française utilisait une loi dite salique (inventée de toutes pièces par un bricolage historique, et appliquée plus ou moins rétroactivement) qui excluait de la succession non seulement les femmes mais surtout toute leur descendance. Selon cette règle, les héritiers potentiels du roi Truc (disons, Hugues Capet) sont les fils (légitimes) de celui-ci, et les fils de ceux-ci, et ainsi de suite récursivement. (Je discuterai plus loin de l'ordre de primogéniture.) D'autres sont moins difficiles et utilisent non seulement les fils mais tous les enfants : les héritiers potentiels du roi Machin sont les enfants, les enfants de ses enfants, et ainsi de suite récursivement. Appelons descendance patrilinéaire de Truc le premier ensemble (défini par la loi salique, donc les fils et les fils des fils et ainsi de suite) et descendance (tout court) de Machin le second ensemble. Et oublions commodément l'existence d'enfants illégitimes ou de toute autre complication généalogique (adoption ou n'importe quoi d'autre).

La descendance patrilinéaire se reflète par la tradition du nom de famille (modulo innovations récentes). Elle se reflète également par la transmission du chromosome Y. Elle a une propriété évidente, c'est qu'elle est réversible de façon unique : je n'appartiens à la descendance patrilinéaire que de mon père, de son père à lui, et ainsi de suite : donc en remontant le temps on obtient une suite unique d'individus dont je tiens mon chromosome Y. Faisons maintenant l'hypothèse d'une population constante, c'est-à-dire qu'on est à la limite ténue entre l'extinction et l'explosion exponentielle. Si à un instant donné dans le passé on note tous les individus de la population (appelons-les les têtes de clans), et qu'on appelle clans leur descendance patrilinéaire dans l'avenir, alors les clans sont en compétition pour partitionner la population : plus un clan est grand, plus il a de chances de s'étendre, tandis qu'un clan petit peut facilement s'éteindre. C'est la raison qui fait que les noms de famille se raréfient (c'est particulièrement frappant en Corée, qui utilise apparemment, et depuis très longtemps, la même règle patrilinéaire que dans de nombreux pays occidentaux). À la limite, si on attend assez longtemps, ou si on remonte assez haut la délimitation des têtes de clans, on s'attend à ce que tout le monde descende patrilinéairement de la même tête de clan, et que tous les autres clans se soient éteints. C'est la raison pour laquelle la loi salique a causé tant de difficultés dynastiques aux capétiens (le clan est toujours à la limite de l'extinction).

Si on place les têtes de clan non pas à un instant donné dans le passé mais au moment où une mutation significative s'est produite sur le chromosome Y, les clans ainsi définis s'appellent les haplogroupes Y : et le dernier homme dont tous les hommes actuels descendent est désigné sous le nom de code d'Adam (qui vivait probablement il y a autour de 60000 ans, si j'en crois cet article). À un niveau plus récent, il y a toutes sortes d'anecdotes rigolotes, par exemple le fait que peut-être 0.5% de la population humaine actuelle descende patrilinéairement de Genghis Khan (ou d'un de ses ancêtres patrilinéaires proches), ou qu'on a pu retrouver un Aaron ancêtre des Kohanim juifs (essentiellement ceux qui portent le nom de famille Cohen).

Tout ce que je dis sur la descendance patrilinéaire pure vaut bien sûr, mutatis mutandis, pour la descendance matrilinéaire pure, qui se reconnaît scientifiquement à l'ADN mitochondrial (passé de la mère à ses enfants), et pour lequel on définit également des haplogroupes. On appelle Ève (qui vivait il y a environ 200000 ans, bien avant l'Adam du chromosome Y peut-être à cause d'asymétries entre la polygynie et la polyandrie).

La descendance générale (ni uniquement patrilinéaire ni uniquement matrilinéaire), en revanche, c'est très différent : elle ne forme plus du tout des clans mais a, au contraire, tendance à fusionner. On a deux parents, quatre grands-parents, etc., donc donnés deux individus dans le présent, il n'y a généralement pas à remonter très loin pour leur trouver un ancêtre commun, et si je remonte de 2000 ans et que je prends n'importe qui vivant à cette époque, il y a de fortes chances pour qu'il soit mon ancêtre ou bien qu'il n'ait aucune descendance vivante actuellement. On peut essayer d'estimer différentes grandeurs subtilement différentes (le temps qu'il faut remonter en moyenne pour que deux individus aléatoires vivant actuellement aient un ancêtre commun, le temps qu'il faut remonter en moyenne pour que deux individus aléatoires vivant actuellement aient tous leurs ancêtres communs, le temps qu'il faut remonter pour que tous les individus vivant actuellement aient un ancêtre commun, le temps qu'il faut remonter pour que tous les individus vivant actuellement aient tous leurs ancêtres communs, et sans doute quantité d'autres), et on peut ergoter sur l'effet des tribus amazoniennes sans contact avec le reste de l'humanité (j'ai eu des débats sans fins à ce sujet — mon avis est qu'elles ne sont pas si dénuées de contact que ça : il suffit qu'une seule personne de l'extérieur soit entrée dans la tribu ou ait fait un enfant avec quelqu'un de la tribu au cours de ces derniers siècles pour que, vu leur niveau de consanguinité, tous les descendants actuels en descendent), mais l'idée essentielle est que ces durées ne sont pas très longues. Bref, il est hautement probable que je descende de Charlemagne, et que tous les lecteurs de ce blog aussi (sauf si vous appartenez à une tribu non contactée en Amazonie, auquel cas je suis ravi d'être votre premier contact), alors qu'il est certain que je ne descends pas patrilinéairement de Charlemagne (et même si les choses ne sont pas totalement claires, apparemment plus personne ne descend patrilinéairement de lui). Ensuite, on pourrait chercher à définir une mesure de carolinginité d'un individu, en retraçant chaque branche de son arbre généalogique et en comptant un poids 2n si elle croise Charlemagne au bout de n générations : il serait intéressant de connaître la moyenne et l'écart-type d'une telle mesure sur la population. Mais je digresse.

La morale, en tout cas, c'est que si les descendances patrilinéaires ont tendance à s'éteindre, les descendances générales, elles, ont tendance à grandir jusqu'à capturer toute la population (à moins qu'elles s'éteignent très très vite : si un individu n'a pas d'enfants, ou pas de petits enfants, évidemment il n'aura pas de descendance).

Bon, ce n'est pas tout de définir un ensemble de descendants, mais si on veut leur passer une couronne, il faut encore décider qui la reçoit dans quel ordre. Même en partant du principe qu'on préfère les aînés aux cadets, il y a quantité de façons de faire ça.

La façon dont fonctionnait apparemment l'ordre de succession pour la couronne de France est (de nouveau, il s'agit plus ou moins d'une reconstruction rétroactive) selon l'algorithme suivant : à partir du roi mort, on recherche un héritier parmi ses fils (légitimes), dans l'ordre de naissance, et si un fils est mort avec de la descendance on lance le même algorithme à partir de lui pour rechercher des héritiers à partir de lui ; si l'algorithme échoue, on remonte d'une génération au père du roi défunt et on recommence la recherche (la question de savoir si on peut remonter au-delà d'Hugues Capet si la descendance patrilinéaire de celui-ci s'éteint n'est pas spécifiée, mais probablement non : dans ce cas, on appellerait des états généraux pour élire un nouveau roi). Formellement, et en pseudo-Haskell, cela donnerait quelque chose comme :

findHeir :: Persona -> Persona
findHeir persona =
  findHeir1 persona $ findHeir $ father persona
  where findHeir1 persona failCont =
          if isMale persona
          then if alive persona
               then persona
               else tryList $ children persona
          else failCont
            where tryList [] = failCont
                  tryList (eldest:others) = findHeir1 eldest $ tryList others

(où j'ai supposé que alive :: Persona -> Bool indique si une personne est vivante, isMale :: Persona -> Bool indique si c'est un homme, children :: Persona -> [Persona] renvoie la liste des enfants d'une personne dans l'ordre de naissance, et father :: Persona -> Persona renvoie son père; pour ceux qui ne connaissent pas Haskell, le $ est simplement une parenthèse associative à droite (findHeir1 persona $ findHeir $ father persona signifie findHeir1 persona (findHeir (father persona)))).

Si on décidait que les femmes ne peuvent pas recevoir la couronne mais peuvent quand même la transmettre, j'ai eu tendance à écrire :

findHeir :: Persona -> Persona
findHeir persona =
  findHeir1 persona $ findHeir $ father persona
  where findHeir1 persona failCont =
          if isMale persona && alive persona
          then persona
          else tryList $ children persona
            where tryList [] = failCont
                  tryList (eldest:others) = findHeir1 eldest $ tryList others

Mais ce code comporte un bug : si un roi meurt sans descendance en ayant reçu la couronne par sa mère, l'algorithme ci-dessus va chercher du côté de son père et potentiellement donner la couronne à des cousins paternels qui a priori ne viennent pas du tout du sang royal et ne sont là que par alliance. Pour écrire du code correct, il faut remplacer father par predecessor. Peut-être est-ce pour éviter le risque de ce bug que les juristes français ont inventé la loi salique. :-)

La ligne de succession britannique, elle, accepte que la couronne échoie à des femmes, mais elles sont déclassées par rapport aux hommes dans l'ordre de naissance. En revanche, elle écarte les catholiques et leur descendance. Cela donne :

findHeir :: Persona -> Persona
findHeir persona =
  findHeir1 persona $ findHeir $ predecessor persona
  where findHeir1 persona failCont =
          if isCatholic persona
          then failCont
          else if alive persona
               then persona
               else tryList $ (filter isMale $ children persona) ++ (children persona)
            where tryList [] = failCont
                  tryList (first:others) = findHeir1 first $ tryList others

(Il est question de changer ça et de traiter tous les enfants à égalité, mais ceci demande l'unanimité parmi les royaumes du Commonwealth, qui partagent la même couronne.)

Mais ceci laisse entrevoir les innombrables variations possibles : rien que pour ce qui est de la misogynie, on pourrait imaginer de déclasser les femmes parmi tous les successeurs vivants et pas seulement dans une fratrie. Même dans un système de succession qui ne différencie pas hommes et femmes, on pourrait faire un parcours en largeur plutôt qu'en profondeur (c'est-à-dire, si le fils aîné est mort avec descendance et que le fils cadet est encore en vie, privilégier le fils cadet par rapport à la succession du fils aîné) ; ou encore prendre l'ensemble de tous les descendants du roi défunt et chercher le plus âgé parmi eux (et s'il n'en a pas, revenir à son prédécesseur, et ainsi de suite) (ceci revient généralement au même qu'un parcours en largeur, mais pourrait différer s'il y a un gros écart d'âge entre deux frères). La règle de succession de l'Arabie saoudite (qui, évidemment, est patrilinéaire) suit apparemment un parcours en largeur, et apparemment en remontant toujours à Muhammad bin Saʿūd, même si les choses ne sont pas claires et de toute façon sujettes à interprétation ; mais cela explique que ce soient de vieux croutons qui arrivent sur le trône.

(dimanche)

Comment enseigner les rudiments de la géométrie algébrique ?

Je donne (pour la deuxième année) un petit cours de géométrie algébrique à Télécom Paris ; c'est un élément d'un cours appelé Techniques mathématiques avancées pour la cryptographie et le codage, donc il faut comprendre ça comme : éléments de géométrie algébrique pour la cryptographie et le codage. C'est un certain défi, parce que (1) les élèves ne sont pas spécialement orientés matheux, ils veulent surtout voir des applications (malheureusement, la géométrie algébrique demande de digérer une certaine quantité de jargon avant d'arriver aux applications), (2) ils n'ont pas forcément les réflexes et les habitudes (en algèbre) qu'auraient des élèves matheux suivant un cours de géométrie algébrique (par exemple, si je dis qu'avoir un morphisme surjectifs d'anneaux AA′, ça signifie que A′ peut se voir comme un quotient de A par un idéal, c'est le genre de choses qui demande une certaine explication), (3) j'ai peu d'heures (5 séances de 2×1h½, donc 15 heures au total ; l'an dernier j'en avais plus), et je veux arriver à des choses un peu compliquées, comme énoncer le théorème de Riemann-Roch et en faire comprendre le sens (j'ai le droit d'omettre toute démonstration, mais au bout d'un certain point ça fait vraiment magique). À cela s'ajoute, cette année : (4) il n'y a que cinq élèves inscrits au cours, sur lesquels, les bons jours, trois viennent effectivement.

Les notes que j'ai écrites sont ici (mais pas encore vraiment relues, donc probablement plein de fautes).

Il y a un certain nombre de difficultés sur la façon de présenter les choses. Par exemple : faut-il se cantonner fermement aux variétés (sur un corps parfait, disons, ce que j'ai fait) ou bien parler d'infinitésimaux et de schémas ? Avantage des variétés : les morphismes sont plus faciles à définir, parce qu'on peut les voir comme des applications des points sur un corps algébriquement clos, i.e., je peux tout présenter comme des parties de l'espace projectif sur la clôture algébrique, et les choses sont vaguement concrètes. Inconvénient : tester si des polynômes donnés définissent effectivement une variété — c'est-à-dire engendrent un idéal radical — devient un préliminaire indispensable à tout exercice, et ce n'est pas évident. Ou bien, comment présenter la définition des morphismes entre variétés quasiprojectives ? Un point de vue possible serait le point de vue fonctoriel, définir les points des variétés dans une algèbre quelconque (mais c'est justement assez lourd) et invoquer l'esprit du lemme de Yoneda pour définir les morphismes de variétés comme des morphismes de foncteurs (sans forcément prononcer ce mot) : c'est plus élégant, mais pour des gens pour qui l'idée que les morphismes de k-algèbres k[t]→A sont en correspondance avec les éléments de A n'est pas du tout naturelle, ce n'est vraiment pas intuitif. La version apparemment plus simple (et que j'ai suivie) consiste à définir les morphismes comme des applications des les points sur la clôture algébrique ; mais on perd toute la fonctorialité, et si les choses sont prima facie plus élémentaires, ce n'est pas évident qu'on arrive à des notions vraiment plus maniables.

(vendredi)

Que signifie : P=NP indépendant de ZFC ?

Je vais répondre ici à une question de David Monniaux sur son blog parce que ce n'est pas la première fois que j'entends quelqu'un la poser, ça me fera un lien à fournir pour la prochaine fois :

Qu'est-ce que cela voudrait dire que PNP indépendant des axiomes de la théorie des ensembles ?

(Attention, je vais m'adresser aux gens connaissant un peu de maths. Si vous ne savez pas ce qu'est le problème P=NP, commencez par lire Wikipédia.)

La remarque cruciale à faire, c'est que l'énoncé P=NP est un énoncé Σ2 de l'arithmétique. C'est-à-dire qu'il peut se réécrire sous la forme il existe n [en l'occurrence, codant un algorithme + une borne polynomiale explicite dessus] tel que pour tout k [codant une entrée du problème SAT, disons], <énoncé à quantificateurs bornés dont algorithmiquement testable en temps borné a priori> [en l'occurrence, que le problème codé par k est résolu dans le temps annoncé par l'algorithme n]. (Je discutais de ces choses-là ici par exemple.)

Mais commençons par un cas plus simple, celui d'un énoncé Σ1. Par exemple, la négation de l'hypothèse de Riemann. L'hypothèse de Riemann (HR) peut se mettre sous la forme Π1, en disant que pour tout n, <une certaine inégalité facilement testable sur des fonctions arithmétiques est vérifiée> (du genre σ(n) < exp(γ)·n·log(log(n)) pour tout n≥5041, avec σ la fonction somme des diviseurs et γ la constante d'Euler-Mascheroni ; mais peu importe le détail de l'inégalité n'est vraiment pas passionnant, et d'ailleurs il y en a plein). La négation ¬HR de l'hypothèse de Riemann est, dualement, Σ1 : elle dit qu'il existe n telle que <telle inégalité>.

Si on dit que HR (ou ¬HR, c'est pareil) est indécidable dans ZFC, cela signifie donc deux choses : (1) HR n'est pas réfutable dans ZFC, et (2) HR n'est pas démontrable dans ZFC (i.e., ¬HR n'est pas réfutable). Or la partie (1) implique[#] que HR est vraie. Pourquoi ? Parce que si HR est fausse, il existe un n qui viole l'inégalité, et donc qui la réfute (l'inégalité est quelque chose de trivialement testable). En fait, réciproquement, comme on croit à la véracité de ZFC (ou du moins de ses conséquences arithmétiques), si HR est vraie, elle ne peut pas être réfutable dans ZFC.

Autrement dit, si on prouve l'indécidabilité (1&2) de HR dans ZFC, on prouve au moins sa vérité (l'item (1)), et on prouve des choses en plus (à savoir l'item (2)). Du coup, évidemment, ce n'est pas dans ZFC qu'on a des chances de prouver (1&2) (puisque le (2) contredit précisément le fait qu'on puisse prouver (1), i.e. HR, dans ZFC). C'est donc dans un système plus fort, typiquement quelque chose comme ZFC+<un axiome de grand cardinal> qu'on peut arriver à prouver (1&2). Prouver (1&2) dans le système ZFC+<grand cardinal> revient exactement à (1) prouver HR dans ZFC+<grand cardinal> et (2) prouver qu'on ne pouvait pas se passer d'au moins une forme d'axiome supplémentaire (à tout le moins la consistance de ZFC !).

Généralement, quand j'explique ce genre de choses, les gens prennent un air gêné et demandent ce que vrai veut dire. Je pense que quelqu'un qui commence à demander qu'est-ce que vrai veut dire a un sérieux problème et ferait mieux de faire de la peinture que des mathématiques. La seule chose que je peux faire pour dissiper une source de confusion possible, c'est de souligner que quand on dit un truc comme ¬HR n'est pas démontrable dans ZFC, on est en train de faire un énoncé arithmétique (par ailleurs Π1 : pour tout n, le nombre n ne code pas une démonstration de ¬HR dans ZFC) exactement comme quand on dit HR pour commencer (lui aussi Π1). Donc si on sait ce que vrai veut dire dans un cas, ou qu'on est prêt à l'admettre, on sait ce que ça veut dire dans l'autre cas aussi !

Maintenant, prenons P=NP et l'affirmation qu'il n'est pas décidable dans ZFC. Cela signifie de nouveau (1) qu'il n'est pas réfutable (PNP n'est pas démontrable), et (2) que P=NP n'est pas démontrable. Mais cette fois, les choses ont plus subtiles. On peut distinguer deux cas :

On peut donc imaginer que dans ZFC+<un grand cardinal> quelqu'un arrive à prouver l'indécidabilité (dans ZFC) de P=NP en montrant qu'on est dans le cas (a) (il prouve PNP et il prouve que ZFC ne suffisait pas), ou en montrant qu'on est dans le cas (b) (il prouve P=NP, peut-être en donnant explicitement un algorithme et une borne dessus et en prouvant leur correction dans le système ZFC+<grand cardinal>, puis il prouve que ZFC ne suffisait pas ; mais il pourrait aussi y arriver de façon moins constructive), ou même sans distinguer entre les deux cas (cela paraît hautement invraisemblable, mais ce n'est pas inimaginable).

[#] Pour être parfaitement précis, je devrais dire que je peux prouver dans des systèmes arithmétiques faibles que [l'énoncé arithmétique] HR n'est pas réfutable dans ZFC implique [l'énoncé arithmétique] HR. (Par systèmes arithmétiques faibles, je veux dire que l'arithmétique de Peano est bien plus qu'il n'en faut : l'induction sur les formules Σ1 suffit au moins (cf. Hájek & Pudlák, Metamathematics of First-Order Arithmetic, chapitre I, théorème 4.33), et je suppose que dans ce contexte, il faut beaucoup moins que ça. De même, on peut remplacer ZFC dans ce qui précède par des choses très très très faibles, comme l'arithmétique de Robinson, mais pour le coup c'est assez évident.) En revanche, l'implication dans l'autre sens, HR implique que HR n'est pas réfutable dans ZFC, lui, est un principe de réflexion (fût-il Σ1 et arithmétique) de ZFC, et c'est quelque chose de fort (mais cela découle trivialement de théories comme ZFC+<cardinal inaccessible>). Bref, ce genre d'énoncés qui parlent d'énoncés qui parlent d'énoncés sont souvent assez embrouillés parce qu'il faut bien préciser quelles sont les théories en jeu à chaque niveau (pis que ça : pour une théorie imbriquée, ce qui compte n'est pas seulement quelle théorie est imbriquée mais aussi comment elle est formalisée pour le niveau d'au-dessus).

(lundi)

Une expression régulière pour les multiples de 7

Écrits en base 10, les multiples de 7 sont exactement les nombres vérifiant l'expression régulière suivante (en syntaxe egrep) :

^([07]|6[29]*3|(5|6[29]*[18])(4|5[29]*[18])*(6|5[29]*3)|(4|6[29]*[07]|(5|6[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*([29]|[18][29]*3|([07]|[18][29]*[18])(4|5[29]*[18])*(6|5[29]*3))|(3|6[29]*6|(5|6[29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|(4|6[29]*[07]|(5|6[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))([18]|4[29]*6|(3|4[29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))*(5|4[29]*3|(3|4[29]*[18])(4|5[29]*[18])*(6|5[29]*3)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*([29]|[18][29]*3|([07]|[18][29]*[18])(4|5[29]*[18])*(6|5[29]*3)))|([29]|6[29]*5|(5|6[29]*[18])(4|5[29]*[18])*([18]|5[29]*5)|(4|6[29]*[07]|(5|6[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(4|[18][29]*5|([07]|[18][29]*[18])(4|5[29]*[18])*([18]|5[29]*5))|(3|6[29]*6|(5|6[29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|(4|6[29]*[07]|(5|6[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))([18]|4[29]*6|(3|4[29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))*([07]|4[29]*5|(3|4[29]*[18])(4|5[29]*[18])*([18]|5[29]*5)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(4|[18][29]*5|([07]|[18][29]*[18])(4|5[29]*[18])*([18]|5[29]*5))))(3|[07][29]*5|(6|[07][29]*[18])(4|5[29]*[18])*([18]|5[29]*5)|(5|[07][29]*[07]|(6|[07][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(4|[18][29]*5|([07]|[18][29]*[18])(4|5[29]*[18])*([18]|5[29]*5))|(4|[07][29]*6|(6|[07][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|(5|[07][29]*[07]|(6|[07][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))([18]|4[29]*6|(3|4[29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))*([07]|4[29]*5|(3|4[29]*[18])(4|5[29]*[18])*([18]|5[29]*5)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(4|[18][29]*5|([07]|[18][29]*[18])(4|5[29]*[18])*([18]|5[29]*5))))*([18]|[07][29]*3|(6|[07][29]*[18])(4|5[29]*[18])*(6|5[29]*3)|(5|[07][29]*[07]|(6|[07][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*([29]|[18][29]*3|([07]|[18][29]*[18])(4|5[29]*[18])*(6|5[29]*3))|(4|[07][29]*6|(6|[07][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|(5|[07][29]*[07]|(6|[07][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))([18]|4[29]*6|(3|4[29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))*(5|4[29]*3|(3|4[29]*[18])(4|5[29]*[18])*(6|5[29]*3)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*([29]|[18][29]*3|([07]|[18][29]*[18])(4|5[29]*[18])*(6|5[29]*3))))|([18]|6[29]*4|(5|6[29]*[18])(4|5[29]*[18])*([07]|5[29]*4)|(4|6[29]*[07]|(5|6[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(3|[18][29]*4|([07]|[18][29]*[18])(4|5[29]*[18])*([07]|5[29]*4))|(3|6[29]*6|(5|6[29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|(4|6[29]*[07]|(5|6[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))([18]|4[29]*6|(3|4[29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))*(6|4[29]*4|(3|4[29]*[18])(4|5[29]*[18])*([07]|5[29]*4)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(3|[18][29]*4|([07]|[18][29]*[18])(4|5[29]*[18])*([07]|5[29]*4)))|([29]|6[29]*5|(5|6[29]*[18])(4|5[29]*[18])*([18]|5[29]*5)|(4|6[29]*[07]|(5|6[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(4|[18][29]*5|([07]|[18][29]*[18])(4|5[29]*[18])*([18]|5[29]*5))|(3|6[29]*6|(5|6[29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|(4|6[29]*[07]|(5|6[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))([18]|4[29]*6|(3|4[29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))*([07]|4[29]*5|(3|4[29]*[18])(4|5[29]*[18])*([18]|5[29]*5)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(4|[18][29]*5|([07]|[18][29]*[18])(4|5[29]*[18])*([18]|5[29]*5))))(3|[07][29]*5|(6|[07][29]*[18])(4|5[29]*[18])*([18]|5[29]*5)|(5|[07][29]*[07]|(6|[07][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(4|[18][29]*5|([07]|[18][29]*[18])(4|5[29]*[18])*([18]|5[29]*5))|(4|[07][29]*6|(6|[07][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|(5|[07][29]*[07]|(6|[07][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))([18]|4[29]*6|(3|4[29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))*([07]|4[29]*5|(3|4[29]*[18])(4|5[29]*[18])*([18]|5[29]*5)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(4|[18][29]*5|([07]|[18][29]*[18])(4|5[29]*[18])*([18]|5[29]*5))))*([29]|[07][29]*4|(6|[07][29]*[18])(4|5[29]*[18])*([07]|5[29]*4)|(5|[07][29]*[07]|(6|[07][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(3|[18][29]*4|([07]|[18][29]*[18])(4|5[29]*[18])*([07]|5[29]*4))|(4|[07][29]*6|(6|[07][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|(5|[07][29]*[07]|(6|[07][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))([18]|4[29]*6|(3|4[29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))*(6|4[29]*4|(3|4[29]*[18])(4|5[29]*[18])*([07]|5[29]*4)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(3|[18][29]*4|([07]|[18][29]*[18])(4|5[29]*[18])*([07]|5[29]*4)))))(5|3[29]*4|([29]|3[29]*[18])(4|5[29]*[18])*([07]|5[29]*4)|([18]|3[29]*[07]|([29]|3[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(3|[18][29]*4|([07]|[18][29]*[18])(4|5[29]*[18])*([07]|5[29]*4))|([07]|3[29]*6|([29]|3[29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|([18]|3[29]*[07]|([29]|3[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))([18]|4[29]*6|(3|4[29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))*(6|4[29]*4|(3|4[29]*[18])(4|5[29]*[18])*([07]|5[29]*4)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(3|[18][29]*4|([07]|[18][29]*[18])(4|5[29]*[18])*([07]|5[29]*4)))|(6|3[29]*5|([29]|3[29]*[18])(4|5[29]*[18])*([18]|5[29]*5)|([18]|3[29]*[07]|([29]|3[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(4|[18][29]*5|([07]|[18][29]*[18])(4|5[29]*[18])*([18]|5[29]*5))|([07]|3[29]*6|([29]|3[29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|([18]|3[29]*[07]|([29]|3[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))([18]|4[29]*6|(3|4[29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))*([07]|4[29]*5|(3|4[29]*[18])(4|5[29]*[18])*([18]|5[29]*5)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(4|[18][29]*5|([07]|[18][29]*[18])(4|5[29]*[18])*([18]|5[29]*5))))(3|[07][29]*5|(6|[07][29]*[18])(4|5[29]*[18])*([18]|5[29]*5)|(5|[07][29]*[07]|(6|[07][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(4|[18][29]*5|([07]|[18][29]*[18])(4|5[29]*[18])*([18]|5[29]*5))|(4|[07][29]*6|(6|[07][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|(5|[07][29]*[07]|(6|[07][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))([18]|4[29]*6|(3|4[29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))*([07]|4[29]*5|(3|4[29]*[18])(4|5[29]*[18])*([18]|5[29]*5)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(4|[18][29]*5|([07]|[18][29]*[18])(4|5[29]*[18])*([18]|5[29]*5))))*([29]|[07][29]*4|(6|[07][29]*[18])(4|5[29]*[18])*([07]|5[29]*4)|(5|[07][29]*[07]|(6|[07][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(3|[18][29]*4|([07]|[18][29]*[18])(4|5[29]*[18])*([07]|5[29]*4))|(4|[07][29]*6|(6|[07][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|(5|[07][29]*[07]|(6|[07][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))([18]|4[29]*6|(3|4[29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))*(6|4[29]*4|(3|4[29]*[18])(4|5[29]*[18])*([07]|5[29]*4)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(3|[18][29]*4|([07]|[18][29]*[18])(4|5[29]*[18])*([07]|5[29]*4)))))*(4|3[29]*3|([29]|3[29]*[18])(4|5[29]*[18])*(6|5[29]*3)|([18]|3[29]*[07]|([29]|3[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*([29]|[18][29]*3|([07]|[18][29]*[18])(4|5[29]*[18])*(6|5[29]*3))|([07]|3[29]*6|([29]|3[29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|([18]|3[29]*[07]|([29]|3[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))([18]|4[29]*6|(3|4[29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))*(5|4[29]*3|(3|4[29]*[18])(4|5[29]*[18])*(6|5[29]*3)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*([29]|[18][29]*3|([07]|[18][29]*[18])(4|5[29]*[18])*(6|5[29]*3)))|(6|3[29]*5|([29]|3[29]*[18])(4|5[29]*[18])*([18]|5[29]*5)|([18]|3[29]*[07]|([29]|3[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(4|[18][29]*5|([07]|[18][29]*[18])(4|5[29]*[18])*([18]|5[29]*5))|([07]|3[29]*6|([29]|3[29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|([18]|3[29]*[07]|([29]|3[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))([18]|4[29]*6|(3|4[29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))*([07]|4[29]*5|(3|4[29]*[18])(4|5[29]*[18])*([18]|5[29]*5)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(4|[18][29]*5|([07]|[18][29]*[18])(4|5[29]*[18])*([18]|5[29]*5))))(3|[07][29]*5|(6|[07][29]*[18])(4|5[29]*[18])*([18]|5[29]*5)|(5|[07][29]*[07]|(6|[07][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(4|[18][29]*5|([07]|[18][29]*[18])(4|5[29]*[18])*([18]|5[29]*5))|(4|[07][29]*6|(6|[07][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|(5|[07][29]*[07]|(6|[07][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))([18]|4[29]*6|(3|4[29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))*([07]|4[29]*5|(3|4[29]*[18])(4|5[29]*[18])*([18]|5[29]*5)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(4|[18][29]*5|([07]|[18][29]*[18])(4|5[29]*[18])*([18]|5[29]*5))))*([18]|[07][29]*3|(6|[07][29]*[18])(4|5[29]*[18])*(6|5[29]*3)|(5|[07][29]*[07]|(6|[07][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*([29]|[18][29]*3|([07]|[18][29]*[18])(4|5[29]*[18])*(6|5[29]*3))|(4|[07][29]*6|(6|[07][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|(5|[07][29]*[07]|(6|[07][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))([18]|4[29]*6|(3|4[29]*[18])(4|5[29]*[18])*([29]|5[29]*6)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*(5|[18][29]*6|([07]|[18][29]*[18])(4|5[29]*[18])*([29]|5[29]*6)))*(5|4[29]*3|(3|4[29]*[18])(4|5[29]*[18])*(6|5[29]*3)|([29]|4[29]*[07]|(3|4[29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))(6|[18][29]*[07]|([07]|[18][29]*[18])(4|5[29]*[18])*(3|5[29]*[07]))*([29]|[18][29]*3|([07]|[18][29]*[18])(4|5[29]*[18])*(6|5[29]*3))))))*$

J'avoue que je trouve ça un peu magique et fascinant : j'ai beau l'avoir construite (avec une méthode tout à fait facile et standard pour convertir un automate fini en expression régulière), je n'arrive pas à bien me faire une idée de comment elle fonctionne.

Je ne sais pas non plus si on peut faire (substantiellement) plus court que ces 16233 caractères (on peut certainement gratter un peu, mais je veux dire que je ne sais pas si on peut faire quelque chose de vraiment différent) : je suppose que non, mais je ne sais pas le prouver.

(vendredi)

Quelques résultats scientifiques

J'évoquais hier le fait que je travaillais sur deux questions à la fois : voici que ces deux questions se sont reliées de façon inattendue, chacune apportant la solution de l'autre. À savoir :

L'idée-clé de la démonstration du premier fait est d'associer à chaque zéro de la fonction zêta une démonstration dans un certain système formel 魚 (un peu compliqué à définir) : si le zéro ne se trouve pas sur l'axe critique, la démonstration prouvera ⊥ (i.e., une contradiction) dans ce système formel 魚 ; a contrario, si une contradiction se trouve, alors on peut l'utiliser pour produire des zéros non situés sur l'axe critique. Donc, l'hypothèse de Riemann équivaut à la consistance du système formel en question. Encore faut-il pouvoir en dire quelque chose ! C'est là qu'intervient le second point : ce système formel peut se voir, en fait, comme lié un protocole cryptographique 𓆛 (là aussi, les détails sont un peu compliqués) tel que prouver la sécurité du protocole 𓆛 revienne exactement à prouver la contradiction du système formel 魚. Or il est relativement facile de ramener la sécurité du protocole 𓆛 à la difficulté de la factorisation des entiers. Reste la dernière pièce du puzzle : ce protocole peut se voir comme un jeu à deux joueurs et, interprété dans le cadre de la théorie des jeux à la Conway, il définit naturellement un ordinal, qui se décrit comme l'écrasement d'un certain grand cardinal que j'appelle icthy un (c'est le premier d'une famille infinie), et qui mesure précisément la force du système formel 魚. Tout tombe donc dans ZFC augmenté de l'hypothèse le cardinal icthy un existe, et si on croit à cette hypothèse, les résultats ci-dessus sont démontrés.

(mardi)

Le paradoxe du second as, et le sens du conditionnement

Voici un paradoxe célèbre des probabilités :

Je tire cinq cartes au hasard d'un jeu de cartes (ordinaire, de 52 cartes). Deux questions séparées :

  • Supposant que j'aie un as dans mon jeu, quelle est la probabilité que j'aie un second as ?
  • Supposant que j'aie l'as de pique dans mon jeu, quelle est la probabilité que j'aie un second as ?

On s'attend à ce que la réponse à ces deux questions soit la même, selon un raisonnement intuitif du genre : la probabilité que j'aie un second as ne dépend pas du fait que le premier (celui supposé exister) soit l'as de pique, cœur, carreau ou trèfle ; et si la probabilité est la même que l'on suppose avoir l'as de pique, cœur, carreau ou trèfle, cela devrait aussi être la même si on suppose juste avoir un as, sans préciser lequel. Pourtant, ce n'est pas le cas : la réponse à la première est 12.2% (exactement 2257/18472), tandis que la réponse à la seconde est 22.1% (exactement 922/4165). En revanche, c'est (évidemment) vrai que la seconde question admettrait la même réponse si on remplaçait pique par l'un de cœur, carreau ou trèfle.

Et ce n'est pas une question de probabilité. Parmi les 2598960 mains de cinq cartes, il y en a 886656 (34.1%) qui contiennent au moins un as, 249900 (9.6%) qui contiennent au moins l'as de pique, 108336 (4.2% du total, donc 12.2% de celles contenant au moins un as) qui contiennent au moins deux as, et 55320 (2.1% du total, donc 22.1% de celles contenant au moins l'as de pique) qui contiennent au moins deux as dont l'as de pique. La vérification de ces nombres devrait être du niveau du programme de maths des terminales scientifiques (à savoir : 2598960=C(52,5) ; 886656=C(52,5)−C(48,5)=4×C(48,4)+6×C(48,3)+4×C(48,2)+48 ; 249900=C(51,4)=C(48,4)+3×C(48,3)+3×C(48,2)+48 ; 108336=C(52,5)−C(48,5)−4×C(48,4)=6×C(48,3)+4×C(48,2)+48 ; 55320=C(51,4)−C(48,4)=3×C(48,3)+3×C(48,2)+48). Mais je voudrais expliquer comment on pouvait arriver sans aucun calcul à la conclusion que la réponse à la seconde question était nécessairement plus élevée que celle à la première ; et ensuite, essayer d'expliquer pourquoi ces nombres nous paraissent surprenants (et pourquoi, en fait, notre intuition avait peut-être raison).

On peut diviser l'ensemble de toutes les mains possibles en cinq ensembles exclusifs et recouvrant tous les possibles, selon que le nombre d'as dans la main vaut exactement 0 (la main n'a pas d'as du tout), exactement 1 (la main contient un unique as), exactement 2, exactement 3, ou enfin 4 (la main contient tous les as) : appelons N0 (qui ne nous intéresse pas), N1, N2, N3 et N4 les nombres de main correspondantes. (Il se trouve que ces nombres valent respectivement 1712304=C(48,5), 778320=4×C(48,4), 103776=6×C(48,3), 4512=4×C(48,2) et 48, mais peu importe. Je veux justement éviter ce genre de calculs.) La réponse à la première question, i.e., la proportion des mains ayant au moins deux as parmi celles en ayant au moins un, est donc le rapport de N2+N3+N4 sur N1+N2+N3+N4 ; ou si on préfère, le complémentaire, i.e. la proportion des mains n'ayant qu'un seul as parmi celles qui en ont au moins un, est le rapport de N1 sur N1+N2+N3+N4. Maintenant, on peut de même diviser les mains ayant l'as de pique en quatre ensembles selon que le nombre total d'as vaut 1 (il n'y a que l'as de pique), 2 (il y a l'as de pique et un seul autre), 3 ou enfin 4 (la main contient tous les as). Si on appelle P1, P2, P3 et P4 les quatre nombres de mains correspondantes, il n'est pas difficile de les relier à N1, N2, N3 et N4 : on a évidemment P4=N4 (dans les deux cas, il s'agit de l'ensemble des mains contenant tous les as) et on a P1=¼×N1 (car parmi les mains contenant exactement un as, il y en a autant pour lesquelles il s'agit de l'as de pique, de cœur, de carreau et de trèfle ; et en réfléchissant un peu on se rend compte que P2=½×N2 (parmi les six chois possibles de deux as, il y en a trois qui contiennent pique et trois qui ne le contiennent pas) et que P3=¾×N3 (si on a trois as sur quatre, il y en a un seul qui manque, donc trois chances sur quatre d'avoir le pique). La réponse à la seconde question, i.e., la proportion des mains ayant au moins deux as parmi celles ayant l'as de pique, est le rapport de P2+P3+P4 sur P1+P2+P3+P4, soit de ½×N2+¾×N3+N4 sur ¼×N1+½×N2+¾×N3+N4 ; pour y voir plus clair, son complémentaire (la proportion des mains ayant uniquement l'as de pique parmi celles ayant au moins l'as de pique) est donc le rapport de P1 sur P1+P2+P3+P4, soit ¼×N1 sur ¼×N1+½×N2+¾×N3+N4. En multipliant par 4 le numérateur et le dénominateur de cette expression, on trouve donc que c'est le rapport de N1 sur N1+2×N2+3×N3+4×N4. Or sous cette forme il est clair (puisque le dénominateur est strictement plus grand) que c'est strictement moins que le rapport de N1 sur N1+N2+N3+N4 qui était le complémentaire de la réponse à la première question. On a donc montré qu'il y a strictement moins de chances d'avoir un unique as si on a au moins l'as de pique que d'avoir un unique as si on a au moins un as.

Essayons de dire ça de façon plus simple : quand on dit ma main contient l'as de pique, on restreint d'un facteur 4 les possibilités pour les mains contenant un unique as (P1 comparé à N1), mais on restreint d'un facteur plus petit celles contenant exactement deux as, trois as, et s'agissant de celles en contenant quatre, on ne les restreint pas du tout (P4=N4, car si on a les quatre as, on a certainement l'as de pique). Par conséquent, ces possibilités deviennent relativement plus probables quand on dispose de l'hypothèse ma main contient l'as de pique que quand on dispose simplement de l'hypothèse ma main contient un as. C'est ce qui est explicité dans le calcul ci-dessus.

Toujours pas éclairé ? Alors simplifions à l'extrême : le jeu ne contient plus que trois cartes, à savoir l'as de pique, l'as de scoubidou, et le valet de patate, et j'en tire deux au hasard. Alors il y a trois mains possibles : ma main contient forcément un as, et la probabilité d'en avoir deux est de 1/3 ; en revanche, si je sais que j'ai l'as de pique, ceci exclut une des trois mains possibles (as de scoubidou et valet de patate) et il y a maintenant une probabilité de 1/2 d'avoir les deux as.

Très bien, mais quelle est la morale de l'histoire, au juste ?

Se donner une hypothèse, en probas ou en stats, et mesurer des probas ou des proportions relativement à cette hypothèse, cela s'appelle conditionner. Conditionner par l'hypothèse j'ai un as dans ma main signifie qu'on se restreint aux mains ayant au moins un as, et qu'on calcule des proportions relatives à celle-ci (avec les notations ci-dessus, ceci signifie qu'on écarte N0) ; tandis que conditionner par j'ai l'as de pique signifie qu'on se restreint aux mains contenant l'as de pique et qu'on calcule de même relativement à cette hypothèse (avec les notations ci-dessus, ceci signifie qu'on remplace les N par des P). Conditionner est une opération fondamentale en probabilités et statistiques, mais pour lui donner un sens dans la vraie vie, il faut souvent se demander pourquoi on conditionne et quelle est au juste l'hypothèse.

L'idée qu'on ait la seule information j'ai un as dans mon jeu ou j'ai l'as de pique dans mon jeu est inhabituelle. Cela correspondrait au protocole expérimental suivant : Alice pioche cinq cartes, Bob lui demande explicitement dis-moi oui si tu as au moins un as dans ton jeu (et ne fais aucun autre commentaire), respectivement dis-moi oui si tu as l'as de pique dans ton jeu (et ne fais aucun autre commentaire), Bob entend Alice faire la réponse oui, et Bob en tire les conclusions expliquées ci-dessus quant à la probabilité qu'Alice ait un second as dans son jeu. Elles sont alors correctes, et finalement peu surprenante : c'est plutôt le protocole expérimental qui est bizarre, et le fait, absolument essentiel, que Bob ait demandé à Alice d'énoncer uniquement et exactement la réponse à la question as-tu au moins un as dans ton jeu, respectivement as-tu l'as de pique dans ton jeu. En revanche, si Alice pioche cinq cartes et énonce j'ai un as dans mon jeu ou j'ai l'as de pique dans mon jeu, on ne sait pas trop quoi conclure : si Alice avait au moins deux as, elle l'aurait sans doute dit, non ? Donc peut-être doit-on conclure simplement que la probabilité qu'elle ait au moins deux as est nulle (ou du moins, très faible), car Alice n'est pas du genre à faire une affirmation de logicien.

Pour revenir à quelque chose de plus mathématique, voici le plus important : si Bob demande à Alice si tu as au moins un as dans ton jeu, dis-moi la couleur d'un des as de ton jeu (choisi aléatoirement parmi ceux qui y sont) et qu'Alice répond j'ai l'as de pique, la probabilité qu'elle ait un second as est de 12.2% et pas de 22.1% : cette fois, on ne conditionne plus par l'information il y a l'as de pique dans le jeu d'Alice mais par Alice a énoncé pique en réponse à la question de Bob, ce qui apporte l'information qu'il y a au moins un as, plus l'information totalement sans intérêt que c'est l'as de pique qui a été choisi au hasard parmi les as d'Alice. Bref, ce qui importe pour bien conditionner n'est pas seulement de savoir la réponse, mais aussi de savoir la question à laquelle on répond. Et la raison pour laquelle les probabilités annoncées plus haut nous semblent paradoxales est justement que nous avons plutôt en tête le protocole beaucoup plus naturel que je viens de décrire : quand j'ai l'information l'as de pique est dans la main, ce n'est pas qu'on cherchait spécifiquement l'as de pique avec un détecteur à as-de-pique, mais plutôt qu'on cherchait un as, et qu'il s'est trouvé que c'était l'as de pique. Dans ce cas, le raisonnement que j'ai qualifié d'intuitif plus haut est correct, et la probabilité d'avoir un second as est bien de 12.2%.

La moralité, quand on fait des stats en sciences expérimentales, en sciences sociales, ou dans n'importe quel domaine, c'est donc : qu'il faut toujours se demander non seulement quelle est l'information connue (qui conduit à un conditionnement), mais aussi par quel dispositif expérimental on aboutit à cette information. Par exemple, si je fais un sondage en demandant aux gens quel(s) as avez-vous dans votre main (réponses multiples possibles), ce n'est pas du tout pareil de me restreindre à ceux qui ont déclaré avoir l'as de pique que si je demande avez-vous un des as suivant (aucun/pique/cœur/carreau/trèfle). Dans les deux cas je saurai peut-être qu'Alice a l'as de pique, mais c'est très différent de savoir qu'elle est dans la population des gens ayant l'as de pique ou dans la population des gens ayant au moins un as et ayant déclaré l'as de pique au hasard parmi tous les as de leur main.

(mercredi)

Pierre-Papier-Ciseaux, thème et variations

Le jeu de Pierre-Papier-Ciseaux est probablement le deuxième jeu le plus simple de l'Univers. Avant d'en parler, je devrais donc commencer par décrire le premier, qui n'a pas de nom à ma connaissance, et je manque d'inspiration pour lui en trouver un. Les règles sont : l'un des deux joueurs (convenu à l'avance, disons Alice) choisit en secret le nom de l'un des deux joueurs, tandis que l'autre joueur (disons Bob) choisit soit le mot perd soit le mot gagne ; si la phrase formée des deux mots choisis est Alice gagne ou Bob perd, alors Alice gagne, tandis que si c'est Alice perd ou Bob gagne, alors Bob gagne. De façon plus abstraite : chacun des deux joueurs choisit un bit en secret, on calcule le XOR de ces bits, et s'il vaut 0 c'est Alice qui gagne tandis que s'il vaut 1 c'est Bob (ou toute autre convention équivalente choisie à l'avance). Ce jeu fait partie des jeux dits à somme nulle, c'est-à-dire que les joueurs sont exactement adversaires, les gains de l'un étant par définition les pertes de l'autre (par opposition à un jeu comme le dilemme du prisonnier, où il est possible pour que les deux joueurs gagnent ou perdent dans différentes proportions, et il y a donc un sens à chercher à coopérer) ; et à information incomplète imparfaite, parce que les deux joueurs choisissent leur option simultanément, donc dans l'ignorance du choix de l'autre (par opposition aux jeux à information parfaite, comme les échecs, qui sont l'objet de la théorie combinatoire des jeux). En pratique, le choix simultané peut se faire en écrivant sur un papier (si on est très formaliste, dans un pli scellé), ou, si on est cryptographe, en utilisant une fonction de hachage pour s'engager sur un choix sans divulguer celui-ci. Ou en montrant simultanément un choix de la main (par exemple, Alice pourrait pointer du doigt l'un des deux adversaires, tandis que Bob fait le signe du pouce vers le haut ou vers le bas).

La stratégie à suivre est tout à fait évidente : si Bob avait connaissance du nom choisi par Alice, il aurait intérêt à choisir perd lorsque Alice choisit Alice et gagne lorsque Alice choisit Bob ; donc Alice ne doit pas divulguer la moindre information sur son choix, et doit choisir aléatoirement et de façon équiprobable, indépendante des choix précédents, le nom qu'elle choisit ; Bob, évidemment, a intérêt à choisir aléatoirement entre gagne et perd. On dit qu'on a affaire là à la stratégie (mixte) optimale[#] du jeu pour l'un et l'autre joueur (qui se caractérise formellement par le fait qu'il s'agit d'une distribution de probabilité sur les options du jeu dont l'espérance de gain contre n'importe quelle option de l'adversaire est au moins aussi bonne que celle de toute autre telle distribution). Les deux stratégies optimales jouées l'une contre l'autre constituent un équilibre de Nash, mais la notion en question est un peu idiote dans le cas d'un jeu à somme nulle à cause d'un théorème de von Neumann qui assure, pour parler de façon très vague, que dans ce cas les stratégies optimales des deux joueurs se répondent bien l'une à l'autre (en maximisant le pire gain possible on maximise précisément le gain contre la stratégie optimale de l'adversaire). Le jeu très simple dont j'ai parlé est à valeur nulle, c'est-à-dire que quand les deux joueurs jouent leur stratégie optimale, aucun n'est privilégié, ce qui est le cas si, mais pas seulement si, il existe une symétrie totale entre les joueurs.

Ce jeu a beau être très simple, et sa stratégie optimale évidente, quand on y joue dans la vraie vie, tirer des valeurs au hasard n'est ni très facile ni très satisfaisant, et on se retrouve à jouer sur la psychologie de l'adversaire (comme dans la célèbre Battle of Wits de Princess Bride), surtout quand on joue plusieurs coups de suite : chacun essaie de se prévoir quel sera le choix de l'autre (en tenant compte du fait que l'autre essaie de prévoir, etc.), et de choisir le coup gagnant en fonction de cela. Je me souviens avoir joué à une variante de ce jeu contre un ami quand j'étais petit (sous la forme : mon adversaire choisit une carte dans un jeu et je dois deviner si elle est rouge ou noire), et avoir gagné une vingtaine de fois d'affilée, si bien que mon ami commençait à se dire que je lisais dans ses pensées. Mais bon, ce petit jeu n'a de sens que parce qu'on joue contre un humain qui joue aussi au même petit jeu : si l'un des deux joueurs tire son choix aléatoirement, l'autre n'a rien d'intelligent à faire, dans tous les cas son espérance de gain sera nulle. Autant jouer à pile ou face, et, bien sûr, c'est essentiellement ce qu'on est en train de faire.

Le jeu de Pierre-Papier-Ciseaux est seulement différent en ce qu'on a symétrie entre les joueurs : contrairement au jeu précédent, les deux joueurs ont les mêmes options, Pierre, Papier et Ciseaux (et on joue généralement avec des signes codifiés de la main). Les options elles-mêmes admettent une symétrie d'ordre 3 : le Papier bat la Pierre, les Ciseaux battent le Papier, et la Pierre bat les Ciseaux ; deux options identiques font match nul ; il n'y a évidemment pas une option qui batte les deux autres. La stratégie optimale, nécessairement la même pour les deux joueurs à cause de la symétrie, et qui peut donc se caractériser par le fait qu'il s'agit d'une distribution de probabilités sur les options qui assure un gain positif ou nul contre toute option de l'adversaire, est évidemment de jouer chacun de Pierre, Papier et Ciseaux avec probabilité 1/3 (et, comme toujours, indépendamment à chaque coup). Comme pour le jeu précédent, quand on y joue dans la vraie vie, il y a souvent un élément de psychologie qui intervient, on peut se rendre compte par exemple que son adversaire préfère telle ou telle option et chercher à jouer celle qui la bat, ou bien au niveau méta chercher à faire croire à son adversaire qu'on préfère telle option pour qu'il joue celle qui la bat et soi-même jouer la troisième, et ainsi de suite. Cet aspect psychologique fait l'intérêt (très relatif…) du jeu entre humains, mais pour l'analyse mathématique, il est purement parasite. Et si on n'a aucune information sur l'adversaire, il n'y a vraiment rien de mieux à faire que de jouer selon la stratégie optimale abstraite, i.e., au hasard.

[Ajouté 2011-01-20 : webcomic pertinent…]

Le jeu de Pierre-Papier-Ciseaux est rapidement très ennuyeux, et des gens ont cherché à le rendre plus intéressant. Certains essaient de le faire en renommant simplement les options : par exemple, certains enfants jouent à Papier-Ciseaux-Puits, qui est exactement le même jeu si ce n'est que Pierre s'appelle Puits. Mais rapidement, il devient tentant d'étendre l'ensemble des options. Si on a joué à Pierre-Papier-Ciseaux et à Papier-Ciseaux-Puits, il est tentant de jouer à Pierre-Papier-Ciseaux-Puits : il reste un duel à résoudre, et on le résout en disant que la Pierre tombe dans le Puits (donc perd contre lui). Quelle est la stratégie gagnante à Pierre-Papier-Ciseaux-Puits ? On peut la calculer en utilisant la théorie générale de la programmation linéaire (spécifiquement l'algorithme du simplexe), mais la solution est assez claire si on se rend compte que l'option Puits domine l'option Pierre (quelle que soit l'option choisie par l'adversaire, jouer Puits est au moins aussi bon que jouer Pierre, et dans certains cas c'est strictement meilleur) : donc la stratégie optimale ne joue jamais Pierre, et du coup il est évident qu'elle joue Papier, Ciseaux et Puits de façon équiprobable (probabilité 1/3 chacun). Si on va jouer à ce jeu contre quelqu'un d'un peu naïf, il y a de fortes chances pour qu'il ne se rende pas compte qu'il ne faut jamais choisir Pierre, et en jouant Papier, Ciseaux et Puits de façon équiprobable on obtiendra statistiquement un gain contre lui.

J'ai aussi entendu parler de la variante suivante : à côté de Pierre, Papier et Ciseaux, on rajoute une nouvelle option, disons Maman, qui bat à la fois Pierre, Papier et Ciseaux ; puis, comme il faut bien que Maman ne soit pas imbattable, on ajoute une option Chocolat, qui bat Maman ; en revanche, n'importe quoi d'autre bat Chocolat, et Maman bat tout sauf Chocolat. La stratégie optimale est évidente quand on y réfléchit un peu (ce que j'encourage le lecteur à faire avant de lire ce qui suit) : il suffit de se rendre compte qu'on a en fait affaire à un jeu de Pierre-Papier-Ciseaux sur deux niveaux, sur le premier niveau on a maman-chocolat-(pierre+papier+ciseaux), et sur le second niveau, on a Pierre-Papier-Ciseaux tels que nommés ; du coup, la stratégie optimale joue chacune des options Maman et Chocolat avec probabilité 1/3, et chacune des options Pierre, Papier et Ciseaux avec probabilité 1/9. (Pour vérifier que c'est bien une stratégie optimale, il suffit de vérifier que son gain contre n'importe quelle option fixée de l'adversaire est positif ou nul — en l'occurrence, toujours nul.) C'est intéressant, parce que les gens ne s'imaginent généralement pas trop ce résultat (ils ont tendance à prévoir une distribution plus uniforme, dans le jeu que je viens de décrire, et notamment avec trop peu de Chocolat et trop de Pierre, Papier et Ciseaux).

Mais ce qui rend Pierre-Papier-Ciseaux intellectuellement satisfaisant, ce n'est pas seulement que les deux joueurs jouent des rôles symétriques, mais que c'est aussi le cas des trois options (formellement, pour chaque paire (x,y) d'options, il existe une permutation des options, envoyant x sur y, et qui préserve la matrice du jeu ; en l'occurrence, les permutations préservant la matrice du jeu sont les permutations cycliques de Pierre-Papier-Ciseaux). Si on cherche à faire un jeu semblable avec cinq options, autrement dit si on cherche à orienter toutes les arêtes et diagonales d'un pentagone (i.e., fabriquer un tournoi sur cinq sommets) de façon à ce que tous les sommets jouent un rôle symétrique (dans le sens que je viens de définir), il y a une unique façon de faire, comme il est assez facile de s'en convaincre (il y a forcément une permutation cyclique des cinq options qui les laisse invariantes, on peut les numéroter 0,1,2,3,4 selon cet ordre cyclique, on peut supposer sans perte de généralité que 1 bat 0, donc 2 bat 1, 3 bat 2, 4 bat 3 et 0 bat 4, et il reste simplement à décider si 0 bat 2 ou 2 bat 0 ; or si on décide que 0 bat 2, disons, quitte à renuméroter 0,1,2,3,4 en 0,2,4,1,3, on se ramène à l'autre situation). Ce jeu a connu une certaine popularité nerdesque sous le nom de Pierre-Papier-Ciseaux-Lézard-Spock (décidément, Wikipédia a des articles sur n'importe quoi) ; évidemment, la stratégie optimale est, à cause de la symétrie entre les options, de toutes les jouer de façon équiprobable (c'est-à-dire avec probabilité 1/5). En revanche, si on veut 7 options, il y a deux jeux (tournois) essentiellement différents : l'un d'entre eux est assez évident et consiste à dire que 3, 2 et 1 battent 0 (donc aussi : 4, 3 et 2 battent 1 ; 5, 4 et 3 battent 2 ; 6, 5 et 4 battent 3 ; 0, 6 et 5 battent 4 ; et ainsi de suite cycliquement) ; l'autre, en revanche, où 1, 2 et 4 battent 0, est plus intéressant car il a plus de symétries (il en a 21 alors que le précédent n'a que les 7 permutations cycliques des 7 options). Reste à trouver sept noms populaires à mettre sur les options (heureusement ce n'est pas ça qui manque : les sept péchés capitaux ? les sept nains ?) de façon à justifier ces relations précises, et à populariser le jeu…

Ceux qui savent ce que ceci signifie pourront considérer plus généralement le tournoi suivant : si q est une puissance d'un nombre premier qui est congrue à 3 modulo 4, sur le corps à q éléments on peut définir la relation x bat y lorsque xy est un carré (non nul) dans ce corps ; alors ce tournoi a un multiple de q·(q−1)/2 automorphismes ; je suis sûr qu'il y a toutes sortes de choses très élégantes à en dire.

Quant à ceux qui trouvent dommage que les mathématiques arrivent pour nous dire il faut jouer au hasard à un jeu où on espérait faire preuve de psychologie, je peux proposer le jeu très simple suivant dont je ne sais absolument pas faire l'analyse mathématique : Alice et Bob disposent chacun initialement d'un certain nombre (entier, égal) de points, et à chaque tour chacun décide secrètement le nombre de points qu'il va engager pour ce tour, ce nombre de point sera forcément perdu pour lui aux tours suivants (i.e., décompté de son total), mais le gagnant du tour est celui qui a engagé strictement plus de points que l'autre ; on continue jusqu'à ce que les deux joueurs engagent tous les deux zéro points (ce qui est nécessairement le cas s'il leur reste zéro points) pendant un nombre de tours convenu à l'avance, et le gagnant est alors celui qui a gagné le plus grand nombre de tours (indépendamment du nombre de points par lesquels il les a gagnés, ou du nombre de points restants s'il y en a). Il existe de nombreuses variantes de ce jeu, toujours dans l'esprit engager des points augmente les chances de gagner un tour mais affaiblit pour les tours suivants. (En théorie ce genre de jeux serait susceptible d'être amené à l'analyse comme une matrice de gain de toutes les stratégies déterministes possibles d'Alice contre toutes les stratégies déterministes possibles de Bob, mais en pratique cette matrice serait d'une taille monstrueuse.) Je n'ai aucune idée de ce qu'il faut faire pour bien jouer (j'ai vaguement pensé essayer de faire tourner sur ordinateur un algorithme évolutif pour déterminer de bonnes stratégies, mais je n'ai jamais mis en pratique).

[#] J'écris la stratégie optimale, mais elle peut très bien ne pas être unique dans un jeu à somme nulle général (l'ensemble des stratégies optimales forme un convexe). Ceci étant, dans les jeux en tournoi, comme je les suppose implicitement, à l'exemple de Pierre-Papier-Ciseaux (formellement : les deux joueurs ont le même ensemble d'options, et le gain d'une option sur une autre vaut toujours ±1, sauf quand les deux options sont la même auquel cas il vaut 0), la stratégie optimale est effectivement unique, cf. le théorème 1.4 page 21 de ce papier (Fundamentals of Social Choice Theory, de Roger Myerson).

(dimanche)

Les centres (points remarquables) d'un triangle

[Un triangle et dix points remarquables]Quand j'étais petit, j'ai appris la chose suivante : si A, B et C sont trois points (ce qui s'appelle un triangle), alors les trois droites (appelées médianes) qui relient chacun de ces trois points au milieu des deux autres, ces trois droites concourent en un point (appelé centre de gravité du triangle, noté G dans la figure[#] ci-contre), qui a la propriété d'être le centre de gravité de la surface du triangle (ou aussi de ses trois sommets avec une masse égale en chacun) ; les trois droites (les bissectrices) qui bissectent les trois angles du triangle sont également concourantes en un point (appelé centre du cercle inscrit, noté I dans la figure ci-contre), qui a la propriété d'être le centre du cercle intérieurement tangent aux trois côtés du triangle ; les trois droites (les médiatrices) perpendiculaires aux côtés et passant par leurs milieux sont également concourantes en un point (appelé centre du cercle circonscrit, noté O dans la figure ci-contre), qui a la propriété d'être le centre du cercle passant par les trois sommets du triangle ; et les trois droites (les hauteurs) perpendiculaires aux côtés et passant par le sommet opposé respectif sont également concourantes en un point (appelé orthocentre, noté H dans la figure ci-contre) ; et qu'en plus, le centre de gravité, le centre du cercle circonscrit et l'orthocentre sont eux-mêmes alignés sur une droite (appelée droite d'Euler). J'étais fasciné d'apprendre qu'à n'importe quel triangle on pouvait associer des points aussi naturels et possédant des propriétés aussi élégantes, et même si j'étais un peu déçu pour la symétrie des choses que le centre du cercle inscrit ne fût pas aligné avec les autres, c'était pour moi une découverte profonde.

Je pense que ces faits sont un test intéressant pour savoir si quelqu'un aimera les maths : ils sont assez faciles à présenter (et ne font intervenir aucun calcul, même si on veut en présenter une démonstration ou du moins une ébauche d'explication), et même si on peut tout à fait les trouver sans grand intérêt et avoir quand même goût pour les maths, je pense que si on est fasciné c'est le signe d'un certain esprit géométrique et qu'il faudrait chercher à en savoir plus. La tendance qu'ont trois droites naturellement définies dans un triangle a vouloir toujours concourir a quelque chose d'assez magique, il faut le reconnaître.

Maintenant, la folie des points remarquables dans les triangles a atteint un niveau un peu extrême, il faut le reconnaître : la célèbre encyclopédie de Kimberling des centres des triangles recense (actuellement ?) 3597 points remarquables ; il est assez facile de se convaincre qu'on peut en produire une infinité si on décide que (1) la droite reliant deux points remarquables dans un triangle est une droite remarquable, et (2) l'intersection de deux droites remarquables dans un triangle est un point remarquable.

Néanmoins, les six points suivants dans l'encyclopédie de Kimberling sont encore assez remarquables, à savoir le centre du cercle de Feuerbach (des « neuf points ») (noté X5 sur ma figure), le point de Lemoine (intersection des symmédianes, c'est-à-dire des symétriques des médianes par rapport aux bissectrices, noté X6 sur ma figure), le point de Gergonne (intersection des droites reliant chaque sommet au point de tangence du cercle inscrit avec le côté opposé, noté X7 sur ma figure), le point de Nagel (idem mais avec les points de tangence des cercles exinscrits, noté X8 sur ma figure), le Mittenpunkt (point de Lemoine du triangle des centres des cercles exinscrits, ou bien intersection des droites (GX7) et (HX10), noté X9 sur ma figure) et le centre de Spieker (centre du cercle inscrit du triangle formé par les milieux des côtés, noté X10 sur ma figure). Concernant le point de Spieker, je trouve assez remarquable le fait que c'est le centre de gravité du périmètre du triangle : c'est assez frappant que le centre de gravité de la surface du triangle coïncide avec celui de ses trois sommets, mais que pour le périmètre on trouve un point différent. Les quelques points de Kimberling suivants sont encore assez remarquable, mais ma patience ne va pas jusque là.

Mais voilà, je suis géomètre algébriste, alors je me suis demandé : ne peut-on pas présenter ce petit zoo des centres d'un triangle d'une façon un peu plus systématique, quitte à être plus sophistiqué (et moins géométrie-élémentaire-à-la-façon-des-Grecs) ? Voici ce à quoi je suis arrivé (attention, ce qui suit demande pour être compris quelques connaissances d'algèbre et de géométrie projective) :

(dimanche)

Affichage de l'hémisphère « trans » de la 3-sphère

Petit complément à l'entrée précédente : j'ai refait des vidéos qui me semblent meilleures. (Disponible à la même adresse que les précédentes, lesquelles ont été reléguées au sous-répertoire old/ ; et aussi sur la même playlist YouTube.) Outre que j'ai corrigé un problème d'orientation entre les vues avant et les vues de côté (décidément, POVray m'embrouille complètement avec son système de coordonnées), la principale différence avec les précédentes est que je montre maintenant aussi ce qui se passe dans l'hémisphère éloigné de l'observateur (l'hémisphère « trans »). Par une combinaison de décision éclairée et de fainéantise, j'ai choisi de rendre ces choses-là comme de simples lignes rouges sans texture ni épaisseur (bon, rouges, elles ne le sont plus tellement après l'encodage vidéo, mais je pense qu'on devinera bien de quoi je parle). Normalement, dans cet hémisphère, plus les objets sont lointains (c'est-à-dire, proches des antipodes), plus ils devraient paraître épais : j'ai trouvé que ça rendait les choses vraiment trop incompréhensibles, alors j'ai préféré une vue en fil de fer. (De toute façon, comme un commentateur me faisait remarquer sur l'entrée précédente, l'épaisseur des tubes n'est pas exacte quand ils sont lointains.) C'est déjà intéressant de voir les polyèdres rapetisser quand on se rapproche d'eux (pour ensuite passer dans l'hémisphère « cis » en se matérialisant pour grandir de nouveau).

Cela vaut notamment la peine de regarder les vues de côté : il est amusant de constater que bien qu'en regardant en face on avance manifestement tout droit, quand on regarde sur le côté, on se trouve en train de tourner autour d'un axe (regardez ce qui se passe du côté du polyèdre qui est au centre de la vue et à la frontière entre l'hémisphère cis/gris et l'hémisphère trans/rouge). C'est ça, aussi, vivre dans une 3-sphère : suivre un grand cercle c'est tourner autour d'un axe (qui est lui-même un grand cercle, et il y a une jolie autodualité des grands cercles dans la 3-sphère). Finalement, je crois que réaliser ces vidéos m'a permis de mieux comprendre la 3-sphère mais pas vraiment de mieux comprendre les polytopes réguliers en dimension 4.

Ah, et à la demande de quelqu'un, j'ai fait le 24-cellule. Comme je le disais, il est totalement sans intérêt car vraiment trop vide (et les autres solides réguliers le sont encore plus).

Le programme Perl qui a servi à générer toutes ces vidéos est disponible depuis ici.

(vendredi)

Naviguons dans des pavages de la 3-sphère

J'avais évoqué autrefois la question suivante : comment vaut-il mieux visualiser les solides réguliers en dimension 4 ? (Je rappelle qu'ils sont au nombre de 6, contre 5 en dimension 3 : le 4-simplexe ou pentachore, qui est l'analogue du tétraèdre et qui est son propre dual ; le tesseract ou hypercube, qui est l'analogue du cube ; le 16-cellule ou hyperoctaèdre ou 4-orthoplexe, qui est l'analogue de l'octaèdre et le dual du précédent ; le 24-cellule ou icosatétrachore, qui n'a pas d'analogue en dimension 3 et qui est son propre dual ; le 120-cellule ou hécatonicosachore, qui est l'analogue du dodécaèdre ; et le 600-cellule ou hexacosichore, qui est l'analogue de l'icosaèdre.) Comme les solides réguliers sont très populaires (même ma maman sait qu'il y en a cinq en dimension 3, parce que j'avais un mobile au-dessus de mon lit qui les représentait, quand j'étais petit — une œuvre de mon papa), il y a beaucoup de gens qui ont essayé de représenter ces 4-polytopes réguliers (voyez par exemple sur Google images) : les façons populaires d'essayer consistent par exemple à projeter orthogonalement (en faisant éventuellement tourner en même temps), à utiliser une projection stéréographique, à faire des patrons, ou encore à utiliser le temps comme 4e dimension.

Mais il y a une autre façon de faire, que je n'ai encore jamais vue employée, et qui consiste à se rappeler qu'une autre façon de considérer les solides réguliers est de les voir comme des pavages de la sphère. Pour expliquer dans le cadre plus familier de la 2-sphère en dimension 3, le dodécaèdre, par exemple, peut être considéré comme un solide convexe en dimension 3, mais il peut aussi être considéré comme vivant sur la sphère (imaginez qu'au lieu d'inscrire votre dodécaèdre dans la sphère vous le gonfliez jusqu'à ce qu'il coïncide avec elle, mais en gardant le souvenir des limites des faces ; un peu comme un ballon de football traditionnel est cousu de pentagones et d'hexagones) : le dodécaèdre est alors une façon de paver la sphère avec 12 pentagones réguliers. Pour mémoire, les pentagones réguliers ne pavent pas le plan, et c'est bien le signe que la sphère a une courbure positive qu'on peut la paver avec des pentagones réguliers de sorte que trois se touchent à chaque sommet. De même, l'icosaèdre peut être vu comme une façon de paver la sphère avec 20 triangles équilatéraux (certes les triangles équilatéraux pavent déjà le plan, mais là on en met cinq autour de chaque sommet, alors que pour paver le plan on en met six : de nouveau, on voit que la courbure est positive), le cube comme une façon de paver la sphère avec six carrés, etc.

[Vue du 120-cellule dans la 3-sphère]Exactement la même chose fonctionne une dimension au-dessus : chacun des six solides réguliers de la dimension 4 correspond à un pavage régulier de la 3-sphère. Pour le 120-cellule, par exemple, c'est avec 120 dodécaèdres réguliers : les dodécaèdres réguliers ne pavent pas l'espace euclidien, mais grâce à la courbure de la 3-sphère ils arrivent à la paver, elle. Vous allez me dire que ça n'aide pas vraiment à visualiser les choses, mais en fait si : la 3-sphère étant un espace de dimension 3, fût-il courbe, on peut espérer l'appréhender. L'idée, donc, est de représenter ce que verrait d'un 120-cellule (par exemple) quelqu'un qui vivrait sur (ou faut-il dire dans ?) une 3-sphère : un pavage régulier de tout son univers par 120 dodécaèdres réguliers.

Quand j'ai proposé ça, je me disais que ce serait vraiment fastidieux à calculer : aucun programme de raytracing n'est prévu pour faire des calculs dans des espaces courbes, après tout. Mais j'avais une idée confusément à l'arrière de la tête, qui a fini par ressortir quand un ami s'est proposé d'essayer de réaliser ces calculs : la projection gnomonique.

La projection gnomonique est une façon de projeter une sphère sur un plan (ou les objets analogues en dimension supérieure). Elle consiste à projeter depuis le centre de la sphère sur un plan tangent à elle en un point (qu'on appelle le centre de la projection) ; c'est donc quelque chose de très facile à calculer, mais elle est bizarrement beaucoup moins populaire et moins connue que la projection stéréographique (avec laquelle il ne faut pas confondre) qui, elle, projette depuis le point de la sphère opposé au centre de projection. Alors que la projection stéréographique conserve les angles (on dit qu'elle est conforme), la projection gnomonique conserve l'alignement : les grands cercles de la sphère (c'est-à-dire ses géodésique, ou « droites », ce que les navigateurs appellent des orthodromies) deviennent des droites dans la projection gnomonique (c'est assez évident sur la description géométrique). Autrement dit, le plus court chemin pour aller de A à B (au moins s'ils sont dans le même hémisphère que le centre de projection) s'obtient juste en traçant une droite sur la projection gnomonique. La plupart des gens (et même pas mal de mathématiciens) sont intimement persuadés que c'est impossible : comme la sphère est courbe, on ne peut pas envoyer les droites sur des droites entend-on parfois dire. Pourtant, la projection gnomonique fait bien ça (et c'est la seule), et elle mériterait d'être plus connue même si elle a des défauts qui la rendent peu utilisable en cartographie. Pour les géomètres : alors que la projection stéréographique identifie naturellement la sphère à la droite projective complexe (on parle de sphère de Riemann), la projection gnomonique, elle, identifie naturellement la sphère modulo antipodie au plan projectif réel.

Quel rapport avec mon problème ? Le point important est que la projection gnomonique fonctionne aussi bien de la 3-sphère vers l'espace euclidien de dimension 3, et ce que voit de la 3-sphère quelqu'un qui vit dessus est donné justement par la projection gnomonique centré au point où se trouve cet observateur. Voici la façon dont je justifiais ce fait dans un mail à un ami :

Le truc c'est le suivant : (1) pour quelqu'un qui vit dans S³ (en un point P, disons), les grands cercles de S³ apparaissent comme des droites, et (2) plus précisément, ce qu'il voit d'une configuration de droites (=grands cercles) de S³ est exactement la même chose que verrait quelqu'un dans ℝ³ qui verrait la projection gnomonique de ces droites à condition que cette projection gnomonique soit centrée en P.

La projection gnomonique d'une sphère centrée en un point P de celle-ci, c'est la projection centrale depuis le centre de la sphère (et pas depuis le point antipodal à P qui serait la projection stéréographique, bien plus connue) et sur l'hyperplan tangent à la sphère en P. En fait, c'est bêtement l'identification de la sphère quotientée par l'antipodie avec l'espace projectif de même dimension. L'intérêt, c'est que (a) la projection gnomonique préserve les droites (parce que les droites sont les intersections de la sphère avec des plans passant par l'origine). Par ailleurs, (b) au point P (mais seulement lui), la projection gnomonique préserve les angles (parce que c'est clair que la différentielle en ce point est l'identité, vu qu'on a justement pris le plan tangent). Ces deux propriétés (a) et (b) prouvent mon point (2) (puisque ce que voit un observateur en P sur S³ est déterminé par les angles des grands cercles passant par P et des points de la configuration de grands cercles proposée). Et mon point (2) implique notamment mon point (1).

Bon, je m'explique sans doute comme un pied, mais en tout cas la morale est que pour représenter ce que voit d'un solide régulier dans S³ un observateur P dans S³, on peut faire la chose suivante : déterminer l'image (dans ℝ³) par projection gnomonique centrée en P de tous les sommets et toutes les arêtes, et filer ça à un raytracer. L'avantage, c'est qu'on n'a pas à raytracer soi-même.

Sauf qu'il y a quand même un problème […] : pour les points qui sont dans l'hémisphère « cis » (celui qui contient P et qui est centré en P), tout se passe bien, mais pour les points qui sont dans l'hémisphère « trans », ils devraient apparaître au-delà de l'infini et on ne peut pas demander ça à un raytracer. (Concrètement, un mec qui vit dans ℝ³ et qui regarde une droite ne voit qu'une demi-droite qui se termine à un « point de fuite » ; alors qu'un mec qui vit dans S³ et qui regarde un grand cercle va vraiment voir le truc se prolonger tout à travers son champ de vision.)

J'ai quand même fait l'expérience de filer les choses à un raytracer (POVray), en me limitant aux points de l'hémisphère « cis » (et lorsqu'un segment relie les deux hémisphères, je le fais partir à l'infini) : pour les solides un peu remplis (le 120-cellule (« hécatonicosachore ») et le 600-cellule (« hexacosichore »)), c'est très joli. On voit qu'il manque l'hémisphère trans, mais le fait que les rayons partent à l'infini donne l'impression qu'il est noyé dans une brume noire impénétrable. Pour les autres solides réguliers, par contre, ça n'a aucun intérêt : ça donne juste un grand truc essentiellement vide.

Et pour faire une vidéo, je fais tourner la 3-sphère, ça n'apporte aucune difficulté supplémentaire.

[Vue du 600-cellule dans la 3-sphère]Bref, j'ai réalisé des petites vidéos de tout ça : une visite du 120-cellule (qui pave la 3-sphère par 120 dodécaèdres réguliers, donc), et une visite du 600-cellule (qui la pave par 600 tétraèdres réguliers). Elles sont en basse qualité sur YouTube et téléchargeables en plus haute qualité ici (pour une fois elles sont assez petites pour que je ne m'embête pas à fabriquer des torrents pour le téléchargement). Si on regarde attentivement, on se rend bien compte que l'espace dans lequel on évolue est courbe : les polyèdres et polygones censés être réguliers ne le sont pas vraiment (ce qui est normal, vu que réguliers dans un espace plat ils ne peuvent pas paver), et les angles semblent se modifier subtilement quand la caméra se déplace. Et comme je l'explique ci-dessus, je ne montre malheureusement que ce qui se passe dans l'hémisphère « cis » de la 3-sphère (l'hémisphère proche de l'observateur). Mise à jour (2010-11-14) : je montre maintenant aussi l'hémisphère « trans » avec des lignes rouges, cf. l'entrée suivante.

Je fournirai prochainement ici le programme Perl qui a servi à générer (les fichiers POVray de) ces animations. Mise à jour : voir ici.

Par ailleurs, il serait intéressant de faire des animations semblables pour des pavages de l'espace hyperbolique : la géométrie hyperbolique est en quelque sorte le pendant à courbure négative de la géométrie sphérique, par exemple on peut y faire des pentagones réguliers à angles de 90° alors que les pentagones réguliers du 120-cellule ont des angles de 120° et en géométrie euclidienne bien sûr c'est 108°. (Par ailleurs, les « vrais » géomètres nous apprennent que la courbure négative est beaucoup plus intéressant que la courbure positive.) Il y a une image de ce genre ici, mais j'aimerais faire mieux. La projection gnomonique existe aussi pour l'espace projectif, donc la même approche fonctionne (avec la difficulté des deux hémisphères en moins, remplacée par la difficulté que les pavages sont infinis).

(mardi)

Encore des petites conventions de matheux

Addendum à l'entrée précédente : on me fait remarquer que le maître de cérémonies d'un séminaire a, ou en tout cas devrait avoir, d'autres rôles : par exemple, quand le séminaire vise un certain public (et notamment si ce public est large), s'assurer que l'orateur reste compréhensible par ce public en interrompant, si besoin est, pour demander de rappeler la définition de tel ou tel concept, ou l'énoncé de tel ou tel théorème (même si le maître de cérémonies lui-même les connaît, probablement : le but est d'éviter aux gens qui ne connaissent pas d'être trop timides pour demander). Malheureusement, ce rôle-là est rarement tenu. De façon plus pragmatique, l'intérêt de la phrase d'introduction est aussi de demander à l'assistance de faire silence (dans la pratique, j'ai rarement l'impression que ce soit nécessaire, sauf dans de très grosses conférences), et de pousser un orateur peut-être un peu timide à se lancer.

Tant que j'y suis, je signale un autre aspect du « savoir-vivre » mathématique que je trouve amusant : quand dans un exposé de séminaire on cite un résultat, on écrit quelque chose comme Théorème (Duschnock, 1995) en donnant l'année de publication de l'article quand c'est effectivement publié ; mais si on cite un théorème qu'on a soi-même découvert, on met juste son initiale (ou ses initiales si on a l'habitude d'écrire les prénoms) et la date éventuelle. Il m'a fallu un certain temps pour comprendre ça.

Il y a sans doute quantité de règles comme ça que j'ai apprises et qui me semblent maintenant assez évidentes. Mais c'est un problème pour les gens qui débutent dans le métier : ce genre de règles n'est écrit nulle part — normalement ce devrait être le directeur de thèse qui les fait remarquer, mais il n'y pense pas toujours, ou parfois il n'est pas là. Ne pas les respecter peut être embarrassant (je me souviens avoir commis un impair une fois, mais je ne me rappelle plus de quoi il s'agissait).

(vendredi)

Le petit rituel des séminaires

Cet après-midi, j'ai assisté à trois heures d'exposés : une d'un groupe de travail géo.alg/crypto à Télécom (dont je suis vaguement un co-organisateur) et deux du séminaire Variétés rationnelles (qui pourrait s'appeler séminaire-des-élèves-de-Colliot-Thélène). Les séminaires de mathématiques (et probablement de beaucoup d'autres disciplines, mais je n'en ai pas vu assez pour pouvoir conclure de façon ferme) obéissent à un petit rituel qui m'agace (et que j'ai insisté pour éliminer à notre groupe de travail à Télécom) : ce rituel fait qu'il y a dans un exposé de séminaire deux personnes jouant un rôle distingué : l'orateur (ou conférencier), évidemment, qui est celui qui parle l'essentiel du temps, mais aussi quelqu'un qui est normalement un des organisateurs du séminaire et que j'appellerai (faute de connaître un nom plus standard à ce rôle) le maître de cérémonie (on pourrait aussi dire : le présentateur). Quand il y a plusieurs organisateurs d'un séminaire, ils exercent généralement la fonction de maître de cérémonie à tour de rôle, car ce rôle ne peut pas être collégial. Le maître de cérémonie doit impérativement être distinct de l'orateur : aujourd'hui, au séminaire Variétés rationnelles, comme un des organisateurs du séminaire était absent et que l'autre était un des exposants, il a fallu qu'une autre personne (en l'occurrence, Colliot-Thélène) joue ce rôle.

Le rôle en question, donc, est tout à fait rituel : lorsque le séminaire va commencer, le maître de cérémonie prononce l'incantation propitiatoire (quasiment verbatim) : Nous écoutons maintenant $nom_du_conférencier, qui va nous parler de $titre_de_l_exposé. Lorsque l'orateur a fini de parler, le maître de cérémonie dit sobrement merci, et l'assistance peut applaudir (cependant, au séminaire Variétés rationnelles, quand Colliot-Thélène était un des organisateurs, on n'applaudissait pas, selon le principe, avec lequel je suis plutôt d'accord, qu'un exposé de mathématiques n'est pas un tour de magie et qu'il n'y a pas spécialement lieu de manifester son émerveillement). Ensuite, le maître de cérémonie demande à l'assistance y a-t-il des questions ?, les gens les posent (sans attendre qu'on les invite individuellement à parler), et quand les questions sont taries, le maître de cérémonie a le droit d'en poser lui-même (ce qui est bien vu si l'assistance n'en a pas posé du tout, histoire qu'il y en ait au moins une), et enfin il invite l'assistance à remercier de nouveau l'orateur (on applaudit donc deux fois, y compris s'il n'y a eu aucune question). Tout ceci est extrêmement codifié.

Il y a, bien sûr, des variantes nationales. En anglais (langue dans laquelle se font la plupart des séminaires hors des mathématiques, et même en mathématiques un grand nombre de séminaires et la majorité des conférences), le maître de cérémonies annoncera : Our ${if_first_speaker?first:next} speaker for today is $speakers_name, who will talk about $title_of_talk ; et à la fin : Let us thank the speaker (on remarquera qu'en anglais le maître de cérémonie invite l'assistance à remercier l'orateur alors qu'en français il le remercie lui-même et l'assistance se joint spontanément à ces remerciements), et enfin : Let us thank the speaker again. En allemagne, on n'applaudit pas, on cogne la table avec l'articulation des doigts (la main étant repliée en poing) — cela surprend la première fois. (D'un autre côté, j'ai un ami qui m'a fait remarquer que si une seule fois on regarde des gens en train d'applaudir en se disant mentalement, mais qu'est-ce que c'est que ce rituel idiot ?, il est ensuite impossible de s'enlever cette idée de la tête et on a à tout jamais du mal à se retenir de rire quand on se trouve dans un groupe de gens en train d'applaudir.)

Bref. Je reconnais que le maître de cérémonie joue un rôle important, qui est justement celui que je n'ai pas décrit : il fait comprendre à un orateur qui déborderait son temps qu'il faut songer à arrêter. (Ou il répond à la semi-question s'il me reste $n minutes…? soulevée par l'orateur.) En revanche, le rôle de prononciateur de la phrase magique qui ouvre le séminaire, je trouve ça vraiment idiot. Je ne dis pas ça que par iconoclasme : cette façon de procéder (qui est essentiellement celle des soutenances de thèse) donne aux séminaires un côté plus formel, plus rigide, donc aussi plus intimidant (notamment pour les jeunes orateurs) que si l'orateur se contentait de sonder vaguement le premier rang pour savoir s'il peut commencer (et pareil quand il s'agit de savoir s'il reste du temps). Le nom de l'orateur n'a pas besoin d'être répété, a priori tout le monde l'a lu sur l'affiche ou l'annonce du séminaire (et il vaut mieux le voir écrit de toute façon, parce que sinon on va se tromper en l'écrivant), et quant au titre, l'orateur peut très bien l'écrire au tableau. De même, je préfère que l'orateur demande lui-même s'il y a des questions : c'est lui, après tout, qui vient de faire une communication, il est normal que ce soit lui qui veuille savoir si on veut lui en demander plus. Bref, je préfère qu'un exposé ressemble à une discussion informelle entre collègues (et égaux) qu'à une soutenance de thèse ou je ne sais quel cérémonial codifié.

Il y a d'ailleurs au moins un séminaire prestigieux où les choses se passent sans cérémonial, c'est le séminaire Bourbaki. Je suppose que la logique est que le maître de cérémonie serait logiquement Bourbaki, mais que bizarrement il n'est pas présent. Je regrette d'ailleurs qu'il n'y ait pas une petite blague récurrente qui consisterait à ce qu'à chaque séminaire Bourbaki quelqu'un aléatoirement se lève pour annoncer à l'assistance : Monsieur Nicolas Bourbaki, organisateur de ce séminaire, vous prie de bien vouloir l'excuser pour son absence, due à $raison_inventée_rigolote_et_différente_à_chaque_fois. L'humour mathématicien français a l'air d'avoir un peu décliné depuis les années 30. Au demeurant, j'ai entendu des gens se plaindre du séminaire Bourbaki du fait de son extrême opacité (on ne sait pas comment les orateurs sont choisis, ni d'où vient l'argent), donc je ne sais pas si c'est un modèle à suivre : mais j'apprécie l'absence du cérémonial religieux qui commence la grande majorité des autres séminaires.

(jeudi)

Onze vues du graphe de Higman-Sims

[Le graphe de Higman-Sims]Je continue dans mon exploration graphique un peu aléatoire d'objets mathématiques exceptionnels et mysérieux avec le graphe de Higman-Sims, dont je viens de produire cinq onze vues.

(Mise à jour (2010-10-29T17:15+0200) : J'avais initialement écrit cinq, alors que j'avais produit six vues, je ne sais pas pourquoi ce lapsus. Mais de toute façon, je me suis rendu compte entre temps que j'avais mal regardé les symétries et que ma méthode produit non pas cinq ou six vues différentes mais onze. Pour me faire pardonner, voici une jolie animation (également en mauvaise qualité sur YouTube) de ce graphe, qui passe par toutes ces différentes vues (comme d'habitude, si vous n'arrivez pas à télécharger par BitTorrent, vous pouvez retirer l'extension .torrent à la fin de l'URL pour accéder directement au fichier).

Le graphe de Higman-Sims est l'unique graphe ayant 100 sommets, chacun étant adjacent à 22 autres (ce qui fait donc 1100 arêtes au total), de sorte que deux sommets adjacents n'ont jamais de voisin commun (i.e., le graphe n'a aucun triangle) et que deux sommets non adjacents ont exactement 6 voisins en commun. Comme tout objet mathématique exceptionnel qui se respecte, il admet quantité de définitions ou de constructions équivalentes. Son groupe d'automorphismes (d'ordre 88704000), c'est-à-dire l'ensemble des façons dont on peut permuter les sommets en préservant la relation d'adjacence entre eux, est, à une extension d'ordre 2 près, le groupe du même nom, l'unique groupe simple fini d'ordre 44352000 et un des vingt-six groupes sporadiques. Si on fixe un sommet quelconque, le groupe restant (le stabilisateur d'un sommet, donc) est, de nouveau à une extension d'ordre 2 près, le groupe M22 de Mathieu (qu'on rencontre régulièrement sur ce blog) — ce qui explique que l'ordre du groupe de Higman-Sims soit 100 fois celui du groupe M22.

Il y a une autre façon de décrire le groupe de Higman-Sims, c'est comme les automorphismes d'un certaine structure combinatoire appelée la géométrie de Higman (qui comporte 176 « points » et 176 « quadriques », chaque quadrique comportant 50 points et chaque point étant sur 50 quadriques — et l'automorphisme extérieur du groupe de Higman-Sims correspondant à échanger points et qudratiques). Cette description a été trouvée indépendamment, et on ne s'est pas rendu compte immédiatement qu'il s'agissait du même groupe. Là où le Club Contexte est très content, c'est que le Higman du groupe et du graphe Higman-Sims (Donald G. Higman, un Américain) n'est pas le même que le Higman de la géométrie de Higman (Graham Higman, un Britannique) ; il semble qu'ils n'aient même pas de lien de parenté évident, c'est tout de même très fort. (Les blagueurs les appelaient les Higmen.)

En fait, mes dessins représentent le graphe de Higman-Sims pas seulement comme un graphe abstrait mais comme un minuscule petit bout d'un autre objet mathématique exceptionnel et extraordinaire, le réseau de Leech.

Le réseau de Leech est réseau régulier de points en 24 dimensions qui a des propriétés absolument mirobolantes ; on peut par exemple le décrire comme la (seule) façon d'empiler des sphères de même rayon, en 24 dimensions, de façon que chaque sphère en touche 196560 autres (les sphères sont centrées sur les points du réseau de Leech) ; il est assez apparenté au réseau engendré par le système de racines E8 dont je parlais récemment (et qui permet d'empiler des sphères en 8 dimensions, de façon que chaque sphère en touche 240 autres), si ce n'est que le réseau de Leech n'est pas associé à un système de racines. Les isométries laissant invariant le réseau de Leech (et fixant l'origine) forment un autre groupe remarquable, le groupe ·0 (lire dot-oh) de Conway, qui est une extension par 2 de l'unique groupe simple fini (appelé ·1 par Conway) d'ordre 4157776806543360000, encore un sporadique. Malheureusement, il n'est pas question de représenter le réseau de Leech (ou même sa première couche), parce que déjà un polyèdre ayant 240 sommets en dimension 8 ayant 696729600 symétries, on n'y voit rien, alors représenter un polyèdre ayant 196560 sommets en dimension 24 et ayant 8315553613086720000 symétries c'est un peu désespéré.

Néanmoins, on peut au moins représenter des tout petits bouts du réseau de Leech. Il se trouve que le graphe de Higman-Sims (comme la géométrie de Higman, d'ailleurs) apparaît naturellement comme un tout petit bout du réseau de Leech : si on choisit trois points quelconques du réseau dont les distances entre eux valent 3, 3 et 2, alors il y a exactement 100 points du réseau qui sont à distance 2 de chacun des trois points choisis, et si on relie par une arête ceux qui sont à distance 3, on obtient le graphe de Higman-Sims ; ceci plonge le groupe de Higman-Sims dans le groupe ·1 de Conway comme le groupe des isométries du réseau de Leech fixant le triangle choisi. Les dessins que j'ai fait sont des projections orthogonales du graphe de Higman-Sims tel que je viens d'expliquer qu'il apparaît dans le réseau de Leech, en choisissant une projection qui révèle la symétrie d'ordre 11 (il n'y a qu'une seule classe de conjugaison d'ordre 11 dans ·0, et elle est dans le groupe de Higman-Sims et, en fait, dans M22). Les 100 points sont organisés en un point au centre et 9 endécagones réguliers autour de lui ; et comme il restait un peu de liberté j'ai fait en sorte que les deux endécagones formés des points directement reliés au point central soient symétriques l'un de l'autre (formant donc un 22-gone régulier) — ce qui ne laisse plus, je crois, que les six projections que j'ai tracées.

Ça ne rend pas très joliment sur l'écran, mais imprimé sur du papier A3 c'est vraiment très esthétique. Ce n'est qu'un minuscule aspect des élégantes symétriques du réseau de Leech, mais c'est déjà inspirant.

(samedi)

Jouons avec le système de racines E8

Comme j'étais déçu de ne pas avoir gagné la même célébrité et fortune avec mes taquins de Mathieu (244823040 = 210×33×5×7×11×23 combinaisons possibles) qu'Ernő Rubik avec son fameux cube (43252003274489856000 = 227×314×53×72×11 combinaisons), voici une nouvelle tentative de puzzle mathématique à 696729600 = 214×35×52×7 combinaisons, sur cette page-ci (qui ne marchera que sur un navigateur assez récent gérant l'élément <canvas>). On peut voir ça comme un petit jeu (appuyer sur scramble et cliquer sur les points jusqu'à réussir à tout remettre à sa place) ou comme un outil pour essayer de comprendre le groupe de Weyl de E8 (à ne pas confondre avec le groupe de Weyl de E6 dont je parlais récemment). Les explications mathématiques et le mode d'emploi sont au bout du lien. C'est plus simple que le Rubik's cube parce que finalement on ne fait que bouger l'objet en bloc sans le déformer, mais c'est plus compliqué parce que l'objet en question vit en huit dimensions.

Et c'est frustrant, décidément, quoi que je fasse, je n'arrive pas à visualiser huit dimensions (il faut dire que je n'arrive déjà pas à en visualiser trois, alors…). Le système de racines E8 est un de ces objets mathématiques exceptionnels et un peu mystérieux que je trouve complètement fascinants et qui devraient être d'une beauté insoutenable si on arrivait à les voir proprement à défaut de seulement les comprendre. En l'occurrence, celui-ci est un peu comme un solide régulier (même s'il n'est pas régulier avec la définition usuelle du terme, c'est-à-dire si on demande que le groupe de symétries soit transitif sur les drapeaux : il n'y a que trois solides réguliers en toute dimension à partir de 5), mais il a quantité d'autres propriétés remarquables.

Le système de racines E8 est le point de départ pour construire un autre objet remarquable qui en découle naturellement, et qui est E8 lui-même. Encore plus compliqué à visualiser, puisque lui a 248 dimensions (comme 8+240, où 8 est le nombre de dimensions dans lequel vit le système de racines E8 et 240 est le nombre de racines de ce dernier). Et un jour où je serai vraiment en forme, je ferai un puzzle basé sur E8(𝔽2), qui a, pour sa part, 337804753143634806261388190614085595079991692242467651576160959909068800000 = 2120×313×55×74×112×132×172×19×312×41×43×73×127×151×241×331 éléments[#].

[#] C'est beaucoup plus que les malheureux 808017424794512875886459904961710757005754368000000000 = 246×320×59×76×112×133×17×19×23×29×31×41×47×59×71 du Monstre, même si le Monstre est en fait beaucoup plus difficile à réaliser parce que pour E8(𝔽2) on peut utiliser des matrices de taille 248×248 alors que pour le Monstre il faut a priori des matrices de taille 196883×196883, ou peut-être 196882×196882 si on travaille sur 𝔽2 mais en tout cas c'est énorme. Par contre, c'est toujours moins que le nombre de protons de l'Univers, qui vaut notoirement exactement 15747724136275002577605653961181555468044717914527116709366231425076185631031296.

(mardi)

Powers of Ten

Beaucoup connaissent sans doute déjà le célèbre film scientifique Powers of Ten de Ray et Charles Eames, qui présente la taille relative des choses dans l'Univers, et des puissances de dix, par un zoom à travers le cosmos, entre un panorama qui englobe de nombreuses galaxies et l'intérieur d'un proton dans la peau d'un homme qui dort après un pique-nique à Chicago (ce pique-nique constituant la scène initiale du film, et le milieu du zoom). Sinon, je vous encourage à le voir (cf. aussi ici).

Je l'ai vu pour la première fois en 1984 au Ontario Science Centre (quand mes parents et moi habitions Toronto) — ce même musée des sciences dont je me plaignais il y a trois ans qu'il était devenu juste une attraction ludique pour gamins. Il y avait une petite salle où il passait en boucle, et mon père et moi (mon père surtout, mais moi aussi) en étions fans et nous l'avons vu de nombreuses fois.

Sauf que c'est un peu plus subtil : il y a deux versions du film. Celle que j'ai vue et revue en 1984, c'est la version de 1968, qui est en noir et blanc si je me rappelle bien. Plus tard, le Science Centre a changé et a mis la version de 1977, en couleur (je crois que je l'ai vue en 1988 quand nous sommes retournés à Toronto pour un été), et c'est cette version-là qu'on voit maintenant partout (y compris sur le lien vers YouTube que je donne plus haut). La différence notable entre la version de 1968 et son remake, c'est que la version ancienne, dans la partie du voyage des puissances de dix qui zoome vers l'extérieur et vers le cosmos, affichait les effets relativistes (le temps qui s'écoule pour le voyageur et le temps qui s'écoule sur Terre, notamment, au fur et à mesure que la vitesse s'approche de celle de la lumière). Cela a probablement été jugé trop difficile à comprendre et un peu hors sujet, et éliminé de la version suivante. Mais mon père aimait beaucoup mieux cette première version, et a été déçu quand le film a changé.

Toujours est-il que la version de 1968 est apparemment introuvable sur le Web. C'est dommage. Il y a cependant un DVD, trouvable sur Amazon (mais uniquement d'occasion), qui contient apparemment les deux versions : du moins si j'en crois un commentaire qui confirme mon souvenir à ce sujet :

The primary difference between the two versions is that in the first version, there is a side window kept running throughout the movie, which shows the effect of relativity on the time-keeping of ten seconds per order of magnitude of meters travelled. Around the time the "camera" pulls back from 10-to-the-13th to 10-to-the-14th meters, the subjective time-sense of the camera operator would start to be strongly affected by relativity, because the "camera" would start to be travelling at a significant fraction of the speed of light. Gradually, subjective and Earthly time-sense gets so far out of whack that ten seconds for the cameraman would be 100,000,000 years on Earth. This might have the effect of prompting the philosophically-inclined viewer to get the screaming meemies, but it's better not to sweat the phiosophical details too much. Just ride with it, baby. Anyway, evidently, the producers decided that the additional feature of the relativistic clock was too distracting, and they pulled it from the final version. Here in this video, we get to see both versions of the film, which is a pretty tremendous experience.

J'hésite un peu à l'acheter, mais bon, c'est quand même un peu cher (et généralement acheter un article d'occasion chez Amazon.com quand on n'habite pas aux États-Unis signifie passer par plein d'étapes très compliquées pour finalement s'entendre dire que ce n'est pas possible de livrer là où on est).

(mercredi)

Jouons avec le problème de Galois inverse

Le fait inutile du jour : le polynôme

27·x27 + 21·x26 − 484·x25 − 3228·x24 − 16572·x23 − 68675·x22 − 222360·x21 − 572820·x20 − 1173331·x19 − 1869830·x18 − 2244571·x17 − 1849271·x16 − 462819·x15 + 1776007·x14 + 4159041·x13 + 5483063·x12 + 4692322·x11 + 1636621·x10 − 2304856·x9 − 4629308·x8 − 3932160·x7 − 1462752·x6 + 471744·x5 + 948800·x4 + 591872·x3 + 205056·x2 + 38912·x + 3072

a pour groupe de Galois sur ℚ le groupe de Weyl de E6, d'ordre 51840 qui peut être décrit comme SO6(𝔽2) ou SO5(𝔽3) ou encore comme groupe des automorphismes de l'unique groupe simple d'ordre 25920 (qui peut lui-même être décrit comme n'importe lequel de : SU4(𝔽2), SΩ6(𝔽2), PSp4(𝔽3) ou SΩ5(𝔽3).

[Figure géométrique]Ci-contre, la figure de ses racines dans le plan complexe (j'ai cadré pour qu'on les voie toutes sauf une, la racine réelle valant environ 7.2113675276, qui déborde). Le graphe que j'ai représenté en reliant chacune des racines à 10 autres, et qui est isomorphe au graphe du polytope 221 de Gosset, est préservé par le groupe de Galois : ce dernier est justement l'ensemble des permutations des racines qui laissent connectées les racines qui l'étaient.

Le polynôme est scindé modulo 1564741, 2506421, 2842537, 2848051, 3116447, 3331217, 3728393…

Les mathématiques expérimentales, c'est rigolo ! (Mais non, je n'ai pas pêché ce polynôme en essayant au hasard jusqu'à en trouver un qui marche.)

(vendredi)

Oubliez millard, billion, trillion… dites giga, téra, exa

En français, en principe, un milliard désigne le nombre 109 (ou 1e9 dans la version informatique de la notation scientifique), c'est-à-dire 1000000000 (un un suivi de neuf zéros), ou mille millions ; un billion désigne 1012 (=1e12), c'est-à-dire 1000000000000, soit mille milliards ou un million de millions ; et un trillion désigne 1018 (=1e18), c'est-à-dire 1000000000000000000, soit un million de billions, ou un milliard de milliards. Il n'y a pas de mots pour désigner 1015 (=1e15), on doit juste dire mille billions (quand j'étais petit, je m'imaginais fort logiquement que c'était un billiard, qui a même une entrée sur Wikipédia en français, mais ce n'est pas très sérieux). De façon générale, un N-llion, c'est 106N (par exemple, un septillion, c'est 1042), ou, si on préfère parler en puissances de 1000, c'est 10002N : on dit donc que le français utilise la convention 2N. Les puissances de mille sont appelées, dans cette convention : mille, million, millard, billion, « billiard », trillion, « trilliard », quadrillion, « quadrilliard », quintillion, etc.

En anglais, le mot million a le même sens que son homologue français ; le mot milliard n'existe pas trop ; et un billion désigne le nombre 109 (ou 1e9 dans la version informatique de la notation scientifique), c'est-à-dire 1000000000 (un un suivi de neuf zéros), ou mille millions, ce qu'en français on nomme un milliard. Un trillion désigne 1012 (=1e12), c'est-à-dire 1000000000000, ce qu'en français on nomme un billion ; et un quadrillion désigne 1015 (=1e15), c'est-à-dire 1000000000000000, ce qui se nomme en français mille billions, ou un billiard si on consent à utiliser ce mot. Quant à 1018 (=1e18), le trillion du français, en anglais il se dit quintillion. De façon générale, un N-llion, c'est 103(N+1) (par exemple, un septillion, c'est 1024, ce qu'en français on appellerait quadrillion), ou, si on préfère parler en puissances de 1000, c'est 1000N+1 : on dit donc que l'anglais utilise la convention N+1. Les puissances de mille sont appelées, dans cette convention : thousand, million, billion, trillion, quadrillion, quintillion, sextillion, etc.

Pour que ce soit bien clair :

Notation scientifique10310610910121015101810211024
Notation informatique1e31e61e91e121e151e181e211e24
Convention 2N
(français)
millemillionmilliardbillion« billiard »trillion« trilliard »quadrillion
Convention N+1
(anglais)
thousandmillionbilliontrillionquadrillionquintillionsextillionseptillion
Préfixe SIkilomégagigatérapétaexazettayotta
Périphrasemilleun millionun milliardmille milliards
ou : un million de millions
un million de milliardsun milliard de milliardsmille milliards de milliardsun million de milliards de milliards

La convention 2N (celle du français) a l'avantage pour elle d'être un peu plus simple pour les calculs : un trillion de trillions est un sextillion comme trois et trois font six, et un quadrillion de quadrillions est un octillion comme quatre et quatre font huit.

Bon, ça c'est la théorie.

La pratique, c'est que c'est le bordel complet. D'abord, parce que le français eut utilisé (au moins partiellement) la convention N+1 : le Littré définit le billion comme : Terme d'arithmétique. Dix fois cent millions ou mille millions, un milliard, qui [le mot milliard] est plus particulièrement usité dans le langage de la finance et dans le langage ordinaire. Et trillion : Terme d'arithmétique. Mille billions, ou mille fois mille billions. (le Club Contexte vous remercie, Monsieur Littré ! Dans la première définition, ou veut dire c'est-à-dire, et dans la seconde il veut dire ou bien au contraire.) Je pense qu'il y a toujours eu confusion.

A contrario, l'anglais eut utilisé la convention 2N : voici ce que dit l'OED à ce sujet :

billion (ˈbɪljən). [a. F. billion, purposely formed in 16th c. to denote the second power of a million (by substituting bi- pref. for the initial letters), trillion and quadrillion being similarly formed to denote its 3rd and 4th powers. The name appears not to have been adopted in Eng. before the end of the 17th c.: see quot. from Locke. Subsequently the application of the word was changed by French arithmeticians, figures being divided in numeration into groups of threes, instead of sixes, so that F. billion, trillion, denoted not the second and third powers of a million, but a thousand millions and a thousand thousand millions. In the 19th century, the U.S. adopted the French convention, but Britain retained the original and etymological use (to which France reverted in 1948).]

Je ne sais pas ce qui a pu être décidé en 1948[#0] ou comment ça a pu se passer, mais au moins ça a le mérite d'être clair : d'après l'OED, la convention initiale est la convention 2N, et elle date du 16e siècle en France, puis a été adoptée en anglais au 17e siècle ; au 19e siècle la France est passée à la convention N+1 (d'où les définitions données par Littré), les États-Unis ont suivi, puis au 20e siècle la France est revenue à la convention d'origine 2N. Bon, en fait, mon édition de l'OED date des années '80 (c'est la dernière édition imprimée), et j'imagine qu'une édition plus récente signalerait que les Britanniques se sont maintenant plus ou moins pliés à l'impérialisme américain (donc N+1) et que billion désigne maintenant vraiment un milliard même en Angleterre.

La confusion était déjà bien grande, et l'inventeur de la convention N+1 (un Français, donc, si j'en crois la petite remarque de l'OED) mériterait d'être pendu haut et court s'il n'était pas déjà mort depuis bien longtemps. Mais voilà qu'elle est rendue encore pire par l'apparition d'une engeance qui tente sans cesse de nous faire sombrer plus bas dans la nullité intellectuelle : les journalistes. Les journalistes français reçoivent quantité d'informations en anglais et, dès qu'ils voient un mot comme trillion figurer dans l'original, ils ne se font pas chier, ils traduisent par trillion. De toute façon, ils ne savent pas compter, pour eux un trillion est quelque chose de complètement incompréhensible, alors peu importe. On les entend donc régulièrement dire, par exemple, que la dette des États-Unis est de treize trillions de dollars (pour traduire thirteen trillion), sans se rendre compte de l'énormité du chiffre qu'ils avancent[#]. Non, elle est de treize billions de dollars, ça suffit largement, merci. Certains ajoutent l'insulte à l'injure, pardon, ajoutent l'injure à la blessure, en précisant qu'un trillion c'est un milliard de milliards, ce qui est juste, mais ce qui n'est pas l'usage qu'ils ont fait de ce mot. Tiens, je parie qu'il y a au moins un journaliste français qui a été assez con pour prétendre qu'on aurait calculé pi à cinq trillions de chiffres (remarquez que déjà l'article que je cite est en anglais censément britannique et utilise la convention N+1).

Bref, c'est vraiment la confusion la plus complète.

Bon, eh bien j'ai une proposition simple pour éviter toute cette confusion : ne plus utiliser ces mots.

Pour utiliser quoi à la place ? Une idée serait la notation scientifique. Mais celle-ci souffre de ses propres problèmes : d'abord, j'ai souligné que 1012 s'écrit aussi 1e12, donc il y aura toujours des journalistes assez cons pour dire que 1012 c'est 10 suivi de douze zéros ou a contrario pour lire 1e12 comme 1 puissance 12 ou ce genre de choses ; ensuite, il y a quelque chose dans la façon dont fonctionne la mémoire humaine qui fait qu'on retient plus facilement la mantisse que l'exposant, alors que c'est l'exposant qui est le plus important, et parfois il n'est pas si facile que ça de retrouver l'ordre de grandeur à un facteur 10 près ; enfin, c'est pénible à lire de toute façon, et c'est peu littéraire.

J'ai donc une autre solution : utilisons les préfixes SI comme si c'étaient des noms de nombres. On peut évidemment garder mille et le million, et éventuellement en français le milliard, mais à partir de là, disons sans hésiter : un téra (=1e12), un péta (=1e15), un exa (=1e18) et un zetta (=1e21) ; voire, un yotta (=1e24), mais cela prête à confusion pour d'autres raisons et de toute façon on a rarement besoin de nombres aussi grands. Le téra (=1e12, un million de millions) est de toute façon le plus important dans cette histoire : c'est lui qui se dit en principe billion en français et trillion en anglais, et qui cause le plus de confusion parmi les choses qu'on rencontre vaguement. La dette des États-Unis est de treize téra [de] dollars (ou treize téradollars), un japonais vient de calculer cinq téra [de] décimales de pi, le corps humain compte environ dix téra [de] cellules humaines (et cent téra [de] cellules dans la flore intestinale), et ça se dira exactement de la même façon en anglais. Et n'importe quelle personne ayant un minimum de culture scientifique comprendra tout de suite ce que cette convention signifie, sans avoir besoin d'être informée à l'avance (quant aux autres, ils ne savent de toute façon pas ce que billion veut dire, donc ils ne seront pas plus embêtés).

Faites circuler le mème ! (Après tout, la façon dont les journalistes utilisent ce genre de mots, c'est en reprenant ce que des scientifiques leur disent. Donc s'il faut inséminer l'idée, c'est bien chez des scientifiques — et j'imagine qu'il y en a qui lisent mon blog.)

(Il faudra que je traduise cette entrée en anglais, puisque c'est notamment par là que la confusion vient.)

[#0] Ajout : Il s'agirait apparemment de la 9e Conférence générale des Poids et Mesures, mais je ne trouve rien à ce sujet dans les résolutions de cette dernière. Par ailleurs, cette page en dit un peu plus sur la façon dont le bordel est apparu. Mais elle prétend que l'usage de la convention 2N est (re?)devenu légal en France par le décret 61-501 du 3 mai 1961 (relatif aux unites de mesure et au controle des instruments de mesure), et je ne vois rien dans ce décret qui mentionne le nommage des grands nombres pas plus que dans les résolutions de la 9e CGPM.

[#] Faut-il une preuve de ce que j'avance ? Chercher "trillions de dollars" sur Google : toutes les réponses (sauf celles qui dénoncent justement le phénomène dont je parle) sont forcément des erreurs, parce qu'un vrai trillions de dollars (1018, un milliard de milliards, un exa de dollars, quoi) c'est tellement gigantesque que ça ne peut rien désigner de correct.

(mercredi)

Pourquoi la physique utilise-t-elle des mathématiques ?

Puisque mes quelques dernières entrées étaient décidément dans le mode « métaphysique et science », j'en fais encore une :

La filosofia è scritta in questo grandissimo libro che continuamente ci sta aperto innanzi a gli occhi (io dico l'universo), ma non si può intendere se prima non s'impara a intender la lingua, e conoscer i caratteri, ne' quali è scritto. Egli è scritto in lingua matematica. (La philosophie [c'est-à-dire : la physique] est écrite dans ce grand livre qui est continûment ouvert à nos yeux (je veux dire l'univers), mais on ne peut le comprendre que si d'abord on apprend à en comprendre la langue et à reconnaître les caractères dans lesquels il est écrit. Il est écrit en langue mathématique.) — Galileo Galilei, Il Saggiatore (1623), chap. VI

Voilà encore une question qui me fascine : pourquoi la physique fait-elle appel aux mathématiques ? Et les questions que cela sous-entend : est-ce un fait profond sur notre Univers (comme Galilée le suggère dans le passage que je cite ci-dessus), ou est-ce simplement lié à la façon dont nous comprenons la physique ? Est-ce un fait fondamental de la physique ou simplement lié à l'utilité des mathématiques pour comprendre n'importe quel phénomène émergent ? Pourquoi les autres sciences[#] n'utilisent-elles pas autant les mathématiques, ou pas de la même façon ou (pour reprendre la description un peu élitiste et provocatrice que Hardy fait dans l'Apologie d'un mathématicien) pas des mathématiques élégantes ? Est-ce parce que ces sciences sont plus complexes que la physique, trop pour être mathématisées ? Parce que nous ne les comprenons pas assez bien ? (Dans la vision comtéenne, elles n'auraient pas encore atteint le stade positiviste.) Ou parce qu'intrinsèquement elles ne se plient pas autant à l'analyse mathématique ? Parce que ce ne sont pas des sciences exactes ?

Et voici une question apparentée, et pas forcément plus facile : pourquoi la physique n'utilise-t-elle qu'un petit sous-ensemble des mathématiques, et celui-ci admet-il une description plus simple que la partie des mathématiques à laquelle la physique fait appel ?

Par exemple, la physique fait — au moins apparemment — abondamment appel à la notion de nombre réel. Le monde qui nous entoure a l'air de dépendre lourdement de la notion de nombre réel. Même ma maman a une idée de ce qu'est un nombre réel : pour le non-mathématicien, c'est un nombre à virgule, qui pourrait s'écrire en théorie avec une précision aussi grande que voulue (et plus on ajoute de décimales, plus on est précis). Toutes les grandeurs qui nous entourent, les tailles des objets, les durées dans le temps, les vitesses, les masses, les grandeurs électriques, etc., semblent mesurées par des nombres réels.

Pourtant, mathématiquement, il existe plein d'autres sortes de nombres sur lesquels on aurait pu imaginer a priori que la physique reposât. Les nombres p-adiques semblent le candidat le plus évident : les nombres p-adiques partagent beaucoup de propriétés en commun avec les nombres réels, il y a de très importantes et élégantes symétries entre eux (les nombres réels prenant essentiellement la place des nombres ∞-adiques, et je n'utilise pas le mot place au hasard). Mais, pour autant que je sache, les nombres p-adiques n'ont aucune application en physique (malgré des tentatives pour leur en donner, qui ressemblent plus à une volonté de les rechercher à tout prix qu'à une théorie basée sur l'expérience). Non seulement cela, mais même dans des sciences basées très indirectement sur la physique, les nombres p-adiques ne jouent aucun rôle alors que les nombres réels sont omniprésents : la somme d'argent présente sur mon compte en banque est peut-être un rationnel (de dénominateur divisant 100), mais il faut clairement le considérer comme un nombre réel et non comme un p-adique quel que soit p (par exemple, si c'était un 7-adique, il serait presque pareil d'avoir 403536.07€ sur son compte que d'avoir 0€ ce qui, de toute évidence, n'est pas le cas). Bizarrement, même l'informatique semble avoir très peu besoin de nombres 2-adiques alors qu'elle est intrinsèquement binaire (et les calculs avec débordements dans les nombres en représentation binaire sont exactement des calculs approchés dans les entiers 2-adiques).

Je peux imaginer plusieurs raisons pour lesquelles les nombres p-adiques ne semblent pas exister dans la nature, dont au moins les suivantes :

J'avoue avoir énormément de mal à imaginer à quoi pourrait ressembler un univers où (disons) les 2-adiques joueraient un rôle important (et ce n'est pas faute de bien comprendre ce qu'est un nombre 2-adique, je pense). Il est donc aussi possible que la question soit aussi stupide que de demander pourquoi je ne vois jamais −42 moutons dans un pré, chose également difficile à imaginer. Mais je préfère prendre le risque de poser des questions stupides que celui de ne pas en poser d'intelligentes. :-)

Les p-adiques ne sont qu'un exemple : pourquoi la physique n'utilise-t-elle jamais de nombres ordinaux ? (D'ailleurs, pour commencer, pourquoi les mathématiques en-dehors de la logique n'utilisent-elles quasiment jamais de nombres ordinaux ?) Utilise-t-elle E8 ou les tentatives de le voir apparaître sont-elles du wishful thinking ? Je ne sais pas si la physique gagne à se poser ce genre de questions, mais j'ai du mal à concevoir qu'on puisse ne pas se les poser.

[#] Enfin, ce n'est pas vrai : il y a une autre science qui utilise aussi lourdement les mathématiques, c'est l'informatique. Mais il y a quelque chose à dire sur le fait que si la physique est vraiment une branche à part car elle étudie le monde matériel, l'informatique, elle, est finalement une branche des mathématiques — celle que les mathématiciens sont trop snobs pour reconnaître comme telle. — Comme le disait éloquemment Dijkstra : Computer science is no more about computers than astronomy is about telescopes.

(samedi)

Les mathématiques pourraient-elles être différentes ?

C'est l'exemple type de la question (archi-rabachée) sur laquelle on ne fera pas de progrès, mais qui ne cesse de me fasciner : les mathématiques sont-elles découvertes ou inventées ? — ou, pour poser la question différemment (ou peut-être pour poser une autre question plus provocatrice), les mathématiques pourraiennt-elles être différentes ?

On peut certainement imaginer un Univers parallèle où les lois de la physique sont différentes, d'ailleurs des physiciens apparemment tout à fait sérieux le font (les deux articles vers lesquels je viens de faire un lien ont été vulgarisés récemment de façon assez intéressante, c'est pour ça que je les ai choisis, mais les exemples ne manquent pas). Mais les mathématiques ? Peut-on imaginer un Univers où, sans aller jusqu'à demander que 2+2=5, les mathématiques seraient subtilement différentes ? Si on peut l'imaginer, peut-on imaginer communiquer avec un tel Univers ? (De toute évidence, il y a un problème : si on fait une démonstration dans notre Univers d'un fait mathématique vrai dans le nôtre et qu'on l'envoie dans l'autre, faut-il croire que la réalité cesse d'exister ?) Pourrait-on imaginer que, demain, les mathématiques soient différentes ? (Bon, ça, ça m'arrive souvent : je me couche le soir en ayant démontré un théorème, et le matin il n'est plus vrai.)

Avec des lunettes de logicien formaliste, on pourrait dire : oui, des univers mathématiques alternatifs existent, ça s'appelle des modèles de la théorie mathématique en train d'être considérée, et tout ce qui n'est ni démontrable ni réfutable, en fait, est vrai dans certains univers et faux dans d'autres. Mais c'est une fausse réponse : ce n'est pas de ça qu'on veut parler — quand on pense aux mathématiques, on ne pense pas aux conséquences d'un système d'axiome, et notamment quand on pense aux entiers naturels on ne pense pas à toute implémentation des axiomes de Peano mais bien à quelque chose de plus précis que ça, que les axiomes de Peano ne capturent qu'imparfaitement. La question de savoir dans quelle mesure ces entiers naturels sont intriqués dans la structure de l'Univers physique est d'ailleurs très subtile et très délicate, et liée à la question de l'existence de l'infini (un commentateur de ce blog qui se reconnaîtra, pense par exemple qu'ils ne le sont pas puisque l'entier naturel Ackermann(100,100) n'a apparemment pas d'existence physique) ; par exemple, on peut imaginer des Univers basés sur des lois de physique semblables à celles que nous croyons être les nôtres, mais construites à partir d'un modèle non-standard de l'arithmétique de Peano et se demander dans quelle mesure des êtres vivants dans un tel Univers pourraient se rendre compte qu'ils ne sont pas dans le modèle standard [pas au sens de la physique] — c'est une question provocatrice et difficile. Mais ce n'est pas vraiment de ça que je veux parler : même les modèles des logiciens ont l'air de vivre dans une sorte de grand tout des mathématiques (et, de fait, la théorie des modèles est une branche des mathématiques, qui s'étudie avec des méthodes et outils des mathématiques et qui utilise donc un Univers mathématique ambiant, qui peut lui-même être un modèle d'une autre théorie puisqu'il est habituel de regarder des modèles dans des modèles).

La pratique mathématique donne indubitablement l'impression qu'on ne contrôle pas complètement ce qu'on fait : on peut être surpris par ce qu'on trouve, émerveillé ou parfois frustré, l'impression produite n'est pas du tout celle d'un architecte, d'un maçon ou d'un artiste qui construit quelque chose, mais d'un aventurier qui explore un terrain complexe, un labyrinthe, un palais. Je crois que la grande majorité des mathématiciens penchent plutôt pour la solution les mathématiques sont découvertes, même si tous n'adoptent pas un point de vue religieusement platoniste, loin de là. Le fait que les mathématiciens le pensent ne signifie cependant pas qu'ils aient raison : ils pourraient souffrir d'une <anglicisme>délusion</anglicisme> collective (soit qu'elle soit la conséquence de leur travail soit qu'elle soit un prérequis pour devenir mathématicien). La question pourrait aussi très bien ne pas avoir de sens, ou ne pas être tout d'un côté ou de l'autre : s'il est impossible de dire que j'ai inventé les formes dans les vidéos de l'ensemble de Mandelbrot que j'ai faites, il est néanmoins vrai que je les contrôlais un peu, puisque je savais comment choisir le point de zoom pour obtenir tel ou tel type de forme. (Et à l'extrême, quand un romancien écrit un roman, il ne fait que choisir un point dans l'ensemble de toutes les suites finies de caractères Unicode, il serait absurde de dire que le roman est découvert pour autant.)

Parfois les mathématiques donnent l'impression de contenir des « coïncidences » ; il y a d'ailleurs des objets mathématiques dont l'existence même a l'air de reposer sur des coïncidences — soit des coïncidences qui donnent l'impression d'être complètement fortuites et locales, soit une sorte de connexion bizarre entre des objets mathématiques éloignés qui, si j'étais religieux, me semblerait être la marque directe de la main de Dieu. Est-ce une impression complètement naïve qui ne fait que montrer l'insuffisance de notre recul ? Sans doute.

On peut néanmoins se livrer à des expériences de pensée. La première imagine une civilisation complètement indépendante de la nôtre, par exemple extra-terrestre (mais pas forcément : cela pourrait être la civilisation qui apparaîtra sur Terre quand les poulpes seront devenus l'espèce intelligente une fois que nous nous serons détruits ;-)). J'écris le nombre 808017424794512875886459904961710757005754368000000000 (en binaire, disons, codé avec des bosses et des creux sur un objet physique, pour rendre la chose aussi abstraite que possible), ou bien j'écris un autre nombre, à peu près de la même taille et vaguement aussi divisible, mais sans propriété remarquable (comme 808192228876161778520554895458069891466133504000000000). Je dépose cet objet où la civilisation va le trouver, et j'observe ce qui se passe. Bien sûr, très souvent il ne se passe rien (la civilisation n'est pas intéressée par les mathématiques, ou ne décode pas l'objet). Le test de pensée que je fais est : y a-t-il avec le « bon » nombre une réaction plus souvent différente qu'avec n'importe que autre nombre comparable mais non remarquable ? Si oui, je peux considérer que notre civilisation a découvert un phénomène préexistant. Alors que si tous les nombres provoquent des réactions comparables auprès des civilisations extra-terrestres, c'était purement une invention liée, d'une façon inexplicable, à notre cerveau ou à notre culture, ou à je ne sais quoi.

Deuxième expérience de pensée. Je rencontre Dieu, qui se prétend omnipotent. Je lui demande une preuve de son omnipotence (je sais, je sais, οὐκ ἐκπειράσεις κύριον τὸν θεόν σου) : je lance un défi qui me semble un peu plus intéressant à relever que de me donner des bijoux en caoutchouc qui brillent comme des vrais ou un rameau de macaronis en fleurs : je veux qu'il fasse en sorte que si je calcule les 1000000000 premières décimales de la racine carrée de 7 en binaire (je choisis ça parce que probablement personne ne s'est amusé à faire ce calcul pour l'instant) et que je les interprète comme une chaîne d'octets (encodés en UTF-8), alors quelque part dedans doit apparaître la phrase eh oui, j'ai relevé ton défi, David, et comme tu peux le voir, je contrôle même les mathématiques, et tu ne peux pas mettre en doute mon omnipotence (bien sûr, cette chaîne était de tous temps présents dans les décimales de ce nombre, mais personne ne l'a remarqué) (cette chaîne de caractères apparaît « très probablement » quelque part dans les décimales de la racine carrée de 7, mais il serait plus qu'un peu surprenant qu'elle apparût dans les un milliard premières). Dieu peut-Il faire cela ? (Sans tricher, bien sûr, c'est-à-dire sans faire faire juste l'erreur de calcul qui va bien à mes ordinateurs pour me le faire croire.) Ou est-Il limité à l'Univers physique ? Ou qui, des mathématiques et de Dieu, est le plus fort ? Je suis tenté de faire le calcul pour voir s'il a relevé mon défi. :-) (Je lui accorde des points de style si à la place de la phrase demandée il a écrit le verset 7 du chapitre 4 de l'évangile de Matthieu.)

On peut pousser plus loin cette dernière expérience de pensée et imaginer un certain calcul qui, quand on le fait, permet d'écrire dans les décimales de pi (à condition que personne ne les ait jamais calculées ou écrites jusqu'à présent). Et qu'ensuite les gens s'amusent à vandaliser les décimales de pi, à y mettre des photos pornos. Mais je garde ça pour un fragment littéraire gratuit ultérieur.

(jeudi)

Fragment littéraire gratuit #131 (divagations métaphysiques redux)

— Je vais essayer, mais ce n'est pas facile ! Alors, postulat numéro 1 : il existe une identité de notre conscience, qui est hors de ce monde.

— Ça part mal, pour ce qui est de l'approche scientifique… Le fantasme du dualisme, depuis qu'il a quitté la glande pinéale, on l'a cherché un peu partout, sans jamais le trouver : aucune expérience ne laisse ne serait-ce qu'un commencement de début de raison de penser que la conscience se loge ailleurs que dans le cerveau, ou que les lois de la physique seraient différentes dans celui-ci, ou qu'il existe une « âme », un ghost in the machine.

— D'accord : je me suis mal exprimé. Il n'y a pas de fantôme qui contrôle nos actions à travers notre cerveau, nous sommes d'accord sur ce point. La thèse serait plutôt qu'il existe un fantôme qui les observe, et qui observe ce monde à travers notre cerveau. Une sorte d'aperception transcendentale qui relie notre expérience du monde.

— Alors ce n'est pas un concept détectable ni vérifiable, et c'est à peine s'il est définissable. Quel intérêt ?

— L'intérêt est de se demander pourquoi le monde est tel qu'il est. Le fantôme n'est pas plus détectable que ne l'est le lecteur d'un roman pour un personnage de ce dernier, mais il peut pourtant faire des déductions à son sujet : si je suis un héros de roman policier, je peux en déduire que mon lecteur aime probablement les romans policiers.

— On doit pouvoir en déduire que ton lecteur aime la philosophie absconse ! Ou plutôt, vu l'éclectisme de notre Univers, qu'il aime tout et n'importe quoi, et si possible changer de sujet sans raison, peut-être des fragments de littérature gratuite et inutile. Toujours est-il que ce fantôme devrait passer au filtre du rasoir d'Ockham : si nous ressentons une unité de la conscience, c'est parce que le cerveau a besoin de cette illusion pour maintenir l'intégrité de nos perceptions ou la cohérence de nos raisonnements, ou, probablement, l'intériorisation de la préservation de soi, toutes choses favorisées par l'évolution naturelle d'un être intelligent. Pas besoin de faire intervenir le surnaturel.

— C'est une raison interne parfaitement valable, et nul doute qu'elle soit vraie : le cerveau a été sélectionné pour être conscient, parce que c'est soit une conséquence inévitable de la représentation de soi, soit le moyen le plus simple pour l'atteindre. Mais le fantôme que j'evoque ne pouvait percevoir le monde à travers lui qu'à cette condition. Son rôle n'est pas d'expliquer pourquoi nous sommes conscients mais de qui nous sommes conscients : pourquoi le monde est tel qu'il est, pourquoi je suis qui je suis. De tous les mondes possibles, mathématiquement possibles, réalisant les contraintes des lois de la physique ou peut-être d'autres lois de la physique, pourquoi est-ce celui-ci que nous appelons « réalité » ? Et pourquoi ici et maintenant ce que nous appelons le présent ?

— Je ne suis pas sûr que la question ait un sens. Dans la mesure où elle en a un, je ne suis pas sûr qu'elle mérite une réponse, et même si elle en mérite une, je ne suis pas sûr qu'elle en admette une. Et même si elle a un sens, mérite et admet une réponse, je ne suis pas sûr que la réponse aille plus profondément ou soit plus intéressante que : L'Univers est tel qu'il est, et c'est tout. À la rigueur, qu'on explique que l'Univers ne pourrait pas être trop différent, sans quoi nous ne serions pas là pour nous poser la question…

— Voilà ! c'est exactement ça. Il fallait un Univers où existassent des êtres conscients pour que nos fantômes pussent l'observer.

— Tu pousses plus loin que je ne l'ai dit, et quand bien même j'admets tout cela, tu n'expliques toujours rien. Ces fantômes eux-mêmes, on va se demander où ils vivent, ou pourquoi ou comment ils sont conscients…

— C'est justement là que j'en viens à un nouveau postulat. Le monde que nous observons, que j'ai comparé à un livre, mais qui devrait plutôt être comparé à un programme dans un ordinateur (un programme sans interaction, qui suit ses propres règles et où le programmeur ne fait qu'observer ce qui se passe), est une expérience menée depuis un monde supérieur. Nous sommes le résultat de cette expérience : notre existence ou notre conscience en est le but, et nous sommes à la fois les fantômes qui observons ce monde, et ce qu'ils en voient.

— Ouhlà ! Très beau délire pour donner la réponse à la vie, l'Univers, et tout le reste.

— Bon, tu me demandes de t'expliquer, je le fais. Tu veux que je continue, oui ou non ?

— Pardon. C'est amusant, continue. Mais j'ai du mal à imaginer qu'on puisse croire à quelque chose comme ça. L'Univers, une sorte expérience de pensée de fantômes qui vivent dans un monde supérieur ? Et puis quoi encore ? Je suppose qu'ils ont contrôlé l'apparition de l'homme par intelligent design ?

— Excuse-moi si je vais paraître direct, mais il y a des millions de gens qui croient que le créateur de l'Univers se fait manger par ses adorateurs sous l'apparence de petits morceaux de pain circulaire : à moins de penser que c'est leur nombre qui leur donne raison, je ne vois pas ce qu'il y a de ridicule à croire quelque chose de métaphysiquement plus vague, et qui ne postule même pas l'existence d'un Dieu. Non, les fantômes dont je parle ne contrôlent pas l'évolution : ce serait plutôt qu'ils auraient cherché, à travers les milliards de planètes dans un nombre incalculable d'Univers possibles, celles qui leur convenaient. Il y a tout de même peut-être quelque chose dans l'idée que Dieu a créé l'homme à Son image, mais ce serait plutôt qu'il a choisi ou préféré celui qui Lui ressemble.

— Tu as prononcé le mot D***, je devrais dire que tu as perdu. Mais continue : tout ceci ne fait-il que remonter le problème d'un niveau ? D'ailleurs, si nous sommes ces fantômes-dieux, pourquoi ne sommes-nous pas parfaitement conscients de tout cela ?

— Le problème est bien le même un niveau plus haut, c'est là toute la beauté de la chose. Nous vivons dans le monde de niveau zéro. Les fantômes qui nous observent et que nous sommes vivent dans le monde de niveau un. Mais ce monde-là lui-même est observé par des fantômes qui vivent dans le monde de niveau deux… et ainsi de suite.

— …Ou comment repousser à l'infini la solution des problèmes qu'on ne sait pas résoudre. À quoi ils ressemblent, ces mondes empilés ?

— Ils ne ressemblent à rien. Ou plutôt, le monde de niveau un nous est déjà incompréhensible parce qu'il est formé, justement, d'une sorte de collection ou un enchaînement de mondes de niveau zéro. Toute notre existence ici n'est qu'un minuscule fragment de notre existence dans le monde d'au-dessus, qui lui-même, et ainsi de suite. Voilà pourquoi nous ne sommes pas directement conscients des mondes d'au-dessus.

— Je suis scié par un tel niveau de mysticisme… Je suppose que tout ceci implique une croyance en une forme de métempsycose ?

— C'est une description possible, mais il faudrait plutôt la présenter comme une infinités de réveils successifs vers des mondes de plus en plus riches et complexes.

— Des paradis emboîtés, donc ? Avec des jardins délicieux, du nectar et de l'ambroisie ?

— De nouveau, tu te moques. Mais tu sais très bien que ce n'est pas ça l'idée. Le niveau zéro est caractérisé par la thèse de Church-Turing.

— La… thèse de Church-Turing ? Tu as trouvé une interprétation religieuse de la thèse de Church-Turing ? Dis-moi que c'est une blague !

— La thèse de Church-Turing exprime l'idée (qu'il est peut-être abusif d'attribuer sous cette forme à Alonzo Church ou Alan Turing) que tout calcul qui, dans cet Univers, peut être mené par un moyen physique quelconque, est réalisable par une certaine abstraction mathématique des calculs mécaniques et codifiée sous la forme de machine de Turing, ou de lambda-calcul.

— Je sais bien. Quel rapport avec la philosophie mystique dont on parlait ?

— Tout : la première chose qu'une machine de Turing (donc un ordinateur de cet Univers physique) ne peut pas faire, c'est décider du résultat du calcul d'une autre machine de Turing si celui-ci est continué jusqu'à l'infini, à commencer par savoir si le calcul va terminer, ce qu'on appelle le problème de l'arrêt. Le niveau un des Univers transcende le niveau zéro exactement de la façon dont le problème de l'arrêt transcende les machines de Turing : dans le monde de niveau un, il est possible de connaître le résultat d'un calcul infini dans un Univers tel que celui-ci, et cela est possible justement en le menant puisque le monde de niveau un est formé de mondes de niveau zéro. L'opération mathématique en question porte le nom de saut de Turing.

— J'ai peur de deviner ce qui va suivre… L'infinité de mondes dont tu parlais ne s'arrête pas là ?

— Précisément. Le saut de Turing peut être transfiniment itéré. Le monde de niveau omega serait constitué de l'emboîtement de tous les mondes de niveau 0, 1, 2, 3 et ainsi de suite, et il est, techniquement, le monde dans lequel tout problème arithmétique devient immédiatement décidable, mais la chaîne ne s'arrête pas là. Il existe un monde omega plus un, puis omega plus deux, et après tout ceux-là un omega fois deux, puis omega fois deux plus un… Après omega, omega fois deux, omega fois trois et ainsi de suite vient omega carré…

— Quousque tandem ?

— Au moins jusqu'à l'ordinal de Church-Kleene, qui permet de décider toutes les questions hyperarithmétiques ; il s'agirait du niveau à partir duquel on ne peut même plus décrire ou représenter la numérotation des niveaux dans cet Univers-ci. Mais il n'y a pas de raison de ne pas aller beaucoup plus loin : mathématiquement, on sait que le saut de Turing se prolonge au moins jusqu'à l'ordinal de l'analyse ramifiée, qui représente le monde auquel on obtient une réponse à toute question d'analyse classique, et même jusqu'au plus petit ordinal indénombrable dans l'univers constructible. Bon, j'ai gagné mon pari, à ce stade-là ?

— Haut la main.

Finalement, j'aime bien ce mode d'écriture sous forme de dialogues pour présenter des idées que je trouve amusantes ou provocatrices (dialogue sur deux systèmes du monde ? à vous de décider qui est Simplicio et qui est Salviati). Et puis j'aime bien l'eschatologie. Quant au pari dont il est question, on peut imaginer qu'il s'agisse d'inventer une religion qui repose sur la science au lieu d'avoir du mal à ne pas la contredire (même si sur ce sujet-là j'en ai déjà dit assez).

Si vous voulez en savoir plus sur la partie mathématique (qui n'a rien de pipo, elle), j'avais gribouillé quelques explications sur la calculabilité supérieure il y a quelque temps, et il y a l'excellent livre de Peter Hinman, Recursion-Theoretic Hierarchies (mais pour la description précise de l'itération transfinie maximale du saut de Turing, il faut aller voir dans des articles de recherche assez pointus, notamment les suivants : George Boolos & Hilary Putnam, “Degrees of Unsolvability of Constructible Sets of Integers”, J. Symbolic Logic 33 (1968), 497–513 ; Carl G. Josckusch Jr. & Stephen G. Simpson, “A Degree-Theoretic Definition of the Ramified Analytical Hierarchy”, Ann. Math. Logic 10 (1975), 1–32 ; Harold T. Hodes, “Jumping through the Transfinite: the Master Code Hierarchy of Turing Degrees”, J. Symbolic Logic 45 (1980), 204–220).

(mercredi)

Le groupe de Galois de x^5−5x+12

J'ai beau connaître la théorie de Galois depuis longtemps, et l'avoir enseignée pendant trois ans à l'ENS, je continue à trouver ça assez magique. Il y a quelque chose de vraiment difficile à admettre, intuitivement, dans le fait que certaines équations ont des groupes de Galois plus petits que ce qu'ils pourraient être : et même quand on connaît bien la théorie, et qu'on sait calculer les groupes de Galois en pratique, on a l'impression de ne pas vraiment avoir de réponse satisfaisante à la question, mais pourquoi, au juste, cette équation décide-t-elle de ne pas faire comme ses petites copines ? Ça n'arrange pas, en plus, que la majorité des cours sur la théorie de Galois vous laissent sans la moindre idée de comment au juste on peut calculer un groupe de Galois en pratique (surtout quand il est petit).

Je peux essayer d'illustrer ça par l'exemple du polynôme f=x5−5x+12 (sur ℚ), que j'ai commencé à utiliser comme exemple dans un texte que j'écrivais aujourd'hui : qu'est-ce qui peut bien faire que ses racines décident de ne pas être rigoureusement interchangeables comme dans les équations les plus générales (car c'est ça que signifie le fait d'avoir un groupe de Galois maximal — tout le groupe symétrique sur les racines) ?

On peut en avoir une mesure expérimentale en regardant ce qui se passe si on réduit ce polynôme modulo différents nombres premiers p (c'est-à-dire qu'on le regarde comme un polynôme à coefficients dans 𝔽p=ℤ/pℤ) et qu'on cherche à le factoriser : modulo les 10000 premiers nombres premiers, si on excepte p=2 (le polynôme f devient x·(x+1)4) et p=5 (le polynôme devient (x+2)5) où le polynôme a des facteurs multiples (ce sont les nombres premiers dits ramifiés), il y a 4016 nombres premiers (7, 11, 13, 19, 23, 37…) modulo lesquels f est irréductible, il y en a 5021 (3, 17, 29, 31, 43, 61…) tels qu'il se factorise en un facteur linéaire et deux de degré 2 (par exemple, modulo 3, le polynôme f devient x·(x²+x+2)·(x²+2x+2)), et enfin il y a 961 nombres premiers (127, 157, 197, 223, 251, 331…) tels que le polynôme f se décompose totalement en cinq facteurs linéaires (par exemple, modulo 127, le polynôme f devient (x+19)·(x+65)·(x+81)·(x+93)·(x+123)). Autrement dit, il y a en gros 40%, 50% et 10% des nombres premiers modulo lesquels on a des degrés de factorisations 5, 1+2+2 et 1+1+1+1+1 respectivement ; et aucune autre factorisation ne se produit (ou en tout cas, ne semble se produire si on regarde les petits nombres premiers). On est censé trouver ça surprenant, parce qu'un polynôme général de degré 5 (qui a pour groupe de Galois le groupe symétrique 𝔖5, par exemple x5−5x+11), il a ces trois factorisations modulo p dans des proportions respectives 20%, 12.5% et ~0.83%, mais surtout, il y a d'autres factorisations possibles (1+4 modulo 25% des nombres premiers, 2+3 et 1+1+3 modulo ~16.7% chacun, et 1+1+1+2 dans ~8.3% des cas) : donc la conséquence, ou la détection, expérimentale du petit groupe de Galois de f=x5−5x+12, c'est que sa réduction modulo p n'admet pas toutes les factorisations possibles, ou avec des proportions inattendues pour celles qui sont possibles (et notamment, le scindage complet en facteurs linéaires a lieu beaucoup plus souvent que dans le cas général). Le théorème qui sous-tend ces statistiques, c'est le théorème de Čebotarëv (qui implique que les proportions des différentes partitions en degrés pour la factorisation des réductions d'un polynôme sur ℚ sont, asymptotiquement, les proportions des différentes répartitions en cycles des éléments de son groupe de Galois agissant sur les racines) ; les proportions observées pour f doivent faire soupçonner comme groupe de Galois le groupe diédral du pentagone, car on cherche un groupe de permutations sur 5 éléments, dont le nombre d'éléments est multiple de 5 et approximativement 10 (l'inverse de la proportion de p modulo lesquels f se décompose complètement), et qui a 40% d'éléments sans points fixes et 50% d'éléments avec exactement un point fixe. Mais tout ceci ne permet de conclure qu'heuristiquement.

Comme f=x5−5x+12 est irréductible (par exemple parce qu'il l'est modulo 7), ses racines sont au moins une fois interchangeables (=le groupe de Galois opère transitivement dessus) : on peut appeler a une de ses racines. On peut se fixer les idées en disant que a est l'unique racine réelle (celle qui vaut environ −1.842085). Le polynôme s'écrit alors f=(xa)·(x4+ax3+a2x2+a3x+a4−5). Là où ce polynôme est surprenant, c'est que le second facteur se décompose plus loin : f=(xa(x2+¼(−a4a3a2+3a+4)x+¼(−a4a3a2−5a+8))·(x2+¼(a4+a3+a2+a−4)x+½(−a3a−2)). On peut vérifier cette expression en développant patiemment le produit (et en utilisant de façon répétée le fait que f(a)=0) ; la présence des deux facteurs quadratiques garantit d'ores et déjà que f vu modulo n'importe quel nombre premier p ne pourra jamais avoir de factorisation dont les facteurs auraient degrés 1+1+3, par exemple (i.e., deux facteurs linéaires et un de degré 3), et l'existence de nombres premiers modulo lesquels ces facteurs quadratiques sont irréductibles (3, par exemple) garantit qu'ils sont irréductibles tout court. Mais ce n'est pas tout : on voit qu'une fois qu'on a choisi (identifié, nommé, distingué) une racine a de f, les quatre autres ne sont plus interchangeables — elles viennent en deux paires différenciées, à savoir, celles qui sont racines de x2+¼(−a4a3a2+3a+4)x+¼(−a4a3a2−5a+8), et celles qui sont racines de x2+¼(a4+a3+a2+a−4)x+½(−a3a−2). Par exemple, dans les complexes, si j'ai choisi a≈−1.842085, alors les racines du premier facteur quadratique seront environ 1.272897+0.719799i et 1.272897−0.719799i, que je voudrai noter respectivement a1 et a4 pour des raisons qui apparaîtront plus tard, et les racines du second facteur quadratique seront environ −0.351854+1.709561i et −0.351854−1.709561i, que je voudrai noter a2 et a3 respectivement.

Cette fois, on a bien prouvé les choses suivantes sur le groupe de Galois : qu'il opère transitivement sur les 5 racines, et que le sous-groupe fixant une racine a quelconque opère sur les 4 autres en les séparant en deux orbites de 2 éléments chacune. On peut se convaincre en examinant toutes sortes de cas que le groupe diédral du pentagone est le seul groupe de permutations sur cinq objets qui réponde à ces conditions. On peut cependant être plus explicite : si je note a0=a une des cinq racines de f, et a1 une des deux racines de x2+¼(−a4a3a2+3a+4)x+¼(−a4a3a2−5a+8), alors en posant a2=[(a04a03+a02a0−4)a1+(−a04+a03a02+a0−4)]/8, on peut vérifier (de nouveau, en développant de façon fastidieuse, si on ne trouve pas mieux) que a2 est aussi racine de f (et plus précisément de x2+¼(a4+a3+a2+a−4)x+½(−a3a−2)) ; et il en va de même de a3=[(−a04+a03a02+a0+4)a1+(−a04−3a03a02−3a0+12)]/8 ; enfin, la dernière racine de f est alors a4=−a1+¼(a04+a03+a02−3a0−4) d'après l'équation vérifiée par a1 : ceci montre qu'une fois choisies les racines a0 (une parmi cinq) et a1 (une parmi deux), toutes les autres sont complètement déterminées, donc le groupe de Galois a dix éléments. Et avec ces conventions, si on permute cycliquement les cinq racines a0, a1, a2, a3, a4, alors les mêmes relations sont satisfaite, de même que si, à a0 fixé, on échange a1 et a4 et a2 et a3 : on s'est donc convaincu que le groupe de Galois de f est le groupe diédral du pentagone, le pentagone en question étant celui formé par les aj (abstraitement, car dans ℂ ce n'est pas du tout un pentagone régulier).

Pour résumer, donc, si j'essaie de jouer à bouger les racines de f entre elles, je peux en mettre une première n'importe où, je peux mettre une seconde parmi deux possibles (si les racines étaient adjacentes sur le pentagone abstrait a0, a1, a2, a3, a4, elles doivent le rester), et une fois que c'est fait toutes les autres tombent forcément en place.

Parmi les petites identités remarquables qui tombent de la théorie de Galois, on peut remarquer que comme le groupe diédral du pentagone a un sous-groupe d'indice 2 (les rotations du pentagone), il doit y avoir une extension quadratique de ℚ dans celle engendrée par les racines de f : c'est bien le cas, et spécifiquement, √−10=(a02+1)a1+¼(−a04+a03a02+5a0+8) est laissé invariant par les éléments du groupe de Galois qui permutent cycliquement les cinq racines, et envoyé en son opposé par les éléments qui laissent fixe une racine. Du coup, si on veut, toutes les racines de f peuvent s'exprimer à partir d'une seule racine a et de cette quantité √−10. On pourrait aussi jouer à exprimer explicitement toutes les racines de f avec des radicaux : on va dire que je laisse ça en exercice au lecteur, qui pourra s'inspirer de l'exercice 5 de cette feuille d'exercices.

PS (2010-03-04T15:25+0100) : D'autres exemples de groupes de Galois un peu rigolos qui ne soient ni trop petits ni trop gros pour être intéressants : x7−7x+3 (groupe simple à 168 éléments, PGL2(𝔽7)≅PGL3(𝔽2)) ; x8−16x+28 (groupe d'ordre 1344 extension du précédent par (ℤ/2ℤ)3) ; x8−5x−5 (groupe d'ordre 1152 extension de (ℤ/2ℤ) par le produit de deux copies de 𝔖4) ; x9−9x2+9x−10 (groupe d'ordre 1296 produit en couronne de 3 copies de 𝔖3 avec action de 𝔖3, i.e., stabilisateur d'un système de 3 blocs de 3).

(lundi)

Logicomix, et faut-il 350 pages pour prouver 1+1=2 ?

[Couverture de Logicomix]Bertrand Russell est un de mes héros (ou quelque chose de ce genre), et comme je m'intéresse à l'épistémologie des mathématiques, il était logique que je sois au moins intrigué par l'idée d'une bande dessinée dont le principal personnage est Bertrand Russell et dont le thème est la quête des fondements des mathématiques. C'est peut-être surprenant, mais cette BD existe (pour l'instant seulement en anglais) : elle s'appelle Logicomix ; ses auteurs sont grecs, et l'un d'entre eux, Christos Papadimitriou (enfin, Χριστος Παπαδημητριου), chercheur en informatique à Berkeley, m'était d'ailleurs connu comme auteur de plusieurs bons ouvrages sur la théorie de la complexité algorithmique : j'ai été assez étonné de le savoir co-scénariste de cette BD. (Un autre des auteurs est connu pour un roman intitulé Oncle Petros et la Conjecture de Goldbach dans sa traduction française.) Bref, comme un effet Zahir assez peu surprenant fait que j'ai entendu parler plusieurs fois de Logicomix (et en bien !) ces dernières semaines je l'ai achetée.

On aura compris que je la recommande, mais il faut que je précise bien quelque chose : ce n'est pas une BD sur les mathématiques, et ce n'est donc pas en tant que mathématicien que je la recommande (d'ailleurs, en tant que mathématicien, j'ai plutôt quelques reproches à lui faire). Je la recommanderais aussi bien à ma maman, si ma maman aimait les BD. Il ne s'agit pas d'un livre portant sur la logique, donc, mais sur l'histoire de la logique ou plutôt, un chapitre particulier de l'histoire de la logique qui est celui des fondements des mathématiques. Les héros s'appellent Russell, Whitehead, Frege, Cantor, Hilbert, Poincaré, Wittgenstein et Gödel : même si de très brefs passages sont employés à expliquer sommairement une ou deux idées essentielles de logique, de mathématiques ou — comme on se l'imagine avec l'apparition de Wittgenstein dans la liste des personnages — de philosophie, ce n'est pas du tout le propos. Le propos est plutôt d'expliquer ce qui a motivé cette quête des fondements, comment Russell l'a personnellement vécue, et en particulier comment les Principia Mathematica ont été écrits (et le Tractatus Logico-Philosophicus). La dimension humaine est essentielle, par exemple sur l'opposition de Russell à la guerre ou la perte de sa foi, mais surtout dans deux idées : la logique comme façon d'éviter la folie, et la quête des fondements sous forme de mythe de Sisyphe avec quoi les protagonistes n'en ont jamais fini. Ce n'est pas non plus une biographie de Russell (ne serait-ce que parce que ça s'arrête, comme ça commence, en fait, en 1939, donc son engagement contre la guerre du Vietnam n'est pas mentionné). Et évidemment, on pourrait redire des choses sur l'exactitude historique (notamment de la thèse sur la folie des logiciens : par exemple, le fait que Cantor soit devenu fou est d'une part un peu exagéré, et d'autre part sans rapport avec son activité mathématique). Mais assez parlé de la BD elle-même.

[Page des *Principia Mathematica*] Les Principia Mathematica sont peut-être bien le livre le plus abscons[#] de l'univers. Non seulement c'est de la logique formelle aride au possible, mais en plus les notations ne sont plus du tout celles qu'on utilise de nos jours (par exemple, l'ensemble vide — enfin, la classe vide — est noté par un lambda majuscule, un système de points est utilisé là où nous mettrions des parenthèses, le et logique est aussi noté par un point et l'implication par un symbole ⊃), sans même compter les notations spécifiques de l'ouvrage, les abréviations qu'ils utilisent pour « alléger » les démonstrations ou la numérotation un peu déroutante ; et, évidemment, les fondements des mathématiques ont évolué depuis cette première tentative. Que le lecteur non-mathématicien s'imagine donc que la page reproduite ci-contre (et on pourrait en trouver de bien pires) est aussi imperméable à 99% des mathématiciens qu'elle l'est à lui. Il est suggéré dans la BD (je ne sais pas si Russell a vraiment émis cette opinion) que la seule personne qui ait lu le texte était Kurt Gödel ; et, de fait, les Principia sont sans doute autant célèbres pour le fait que c'est sur ce système que Gödel a initialement fondé son théorème d'incomplétude que pour être la première axiomatisation parfaitement rigoureuse de ce qui pourrait en théorie englober l'ensemble des mathématiques.

Par contre, il est vrai que la proposition énoncée sous le numéro *110·643 en haut de la page que je reproduis signifie bien ce qu'elle semble signifier : 1+1=2 (et le commentaire qui suit la démonstration est succulent : the above proposition is occasionally useful). Cette proposition intervient à la page 83 du second tome des Principia (dans la seconde édition), sachant que le premier tome comporte lui-même quelque chose comme 680 pages[#2]. Cela a valu aux Principia une renommée particulière, celle d'être le livre qui prend énormément de pages pour montrer 1+1=2 ; le énormément est parfois placé dans les 350, parce que la proposition *54·43, qui dit essentiellement que si deux ensembles ont chacun un élément et sont disjoints, alors leur union a deux éléments, est située page 362 du premier tome — ou 360 ou 379 selon les éditions — et suivie du commentaire : From this proposition it will follow, when arithmetical addition has been defined, that 1+1=2.

Ceci a malheureusement donné naissance au mythe selon lequel, en logique formelle, pour prouver quelque chose d'aussi évident que 1+1=2, il faut des centaines et des centaines de pages. C'est faux pour plusieurs raisons. D'abord parce que Whitehead et Russell n'avaient pas pour but d'arriver à cette proposition de la façon la plus rapide possible (même dans leur système on aurait pu faire ça de façon beaucoup plus économique). Ensuite, parce que leur système semble impossiblement compliqué aux yeux d'un logicien mathématique moderne[#3] : il est vrai qu'on ne cherche plus tellement à produire des systèmes qui fondent « toutes les mathématiques », mais même dans la mesure où on en choisit un, on peut espérer que la démonstation de 1+1=2 ne sera pas immensément compliquée (s'agissant de ZFC, le système orthodoxe pour fonder les mathématiques, la difficulté sera surtout d'écrire 1+1=2, c'est-à-dire, de définir qui sont ce ‘1’, ce ‘2’ et ce ‘+’ qui interviennent dans cette affirmation ; une fois cela fait, l'énoncé devrait sans doute être assez évident). J'avais lu quelque part un texte qui se voulait un peu sensationnaliste sur la longueur des démonstrations en logique formelle (où il concluait qu'il faudrait des quadrilliards de symboles pour démontrer le théorème des nombres premiers ou je ne sais quoi de ce genre) ; mais j'avais fini par me convaincre que l'auteur parlait probablement de démonstrations dites sans coupures (ce qui signifie, en très très gros, sans utiliser de lemme ou proposition intermédiaire ou quoi que ce soit de ce genre, mais en réécrivant à chaque fois la démonstration complète de ce qui aurait tenu lieu de lemme) : s'il y a des moyens d'éliminer les coupures dans une démonstration, ce moyen fait exploser la taille des démonstrations, c'est même un fait essentiel de la logique, et personne ne veut lire une démonstration sans coupures du théorème des nombres premiers ou même de 1+1=2.

[#] D'accord, on peut toujours trouver pire. Finnegan's Wake, par exemple ? Alors, pour lancer un petit troll, disons que les Principia sont peut-être bien le livre le plus abscons parmi ceux qui ont un sens. :-) (Plusieurs trolls, d'ailleurs : sur le fait de savoir si Joyce écrivait du pur charabia, et sur celui de savoir si de la logique peut avoir un sens ou autres questions qui auraient irrité Wittgenstein.)

[#2] Enfin, la proposition de loi sur la réforme du healthcare aux États-Unis fait autour de 2000 pages : je ne sais pas ce qui est le plus impressionnant, en fait.

[#3] La théorie ramifiée des types de Russell est assez éloignée de la façon dont on conçoit, de nos jours, les fondements des mathématiques (depuis que Zermelo a convaincu tout le monde de l'opportunité d'une théorie purement du premier ordre, avec une seule sorte d'objets — les ensembles). Pour un point de vue moderne sur la théorie de Russell (et son rapport avec les théories modernes), voir ce texte de Harvey Friedman ; cet article n'est pas mal non plus, pour remettre les choses dans le contexte et expliquer ce qu'est l'axiome de réductibilité.

(lundi)

De quoi parlent les mathématiques ?

Mathematics may be defined as the subject in which we never know what we are talking about, nor whether what we are saying is true. (Les mathématiques peuvent être définies comme la discipline dans laquelle on ne sait jamais de quoi on parle, ni si ce qu'on dit est vrai.) — Bertrand Russell (Recent Work on the Principles of Mathematics)

Je vais peut-être décevoir (ou au contraire rassurer ?) mon lecteur en avouant que je n'ai aucune intention d'essayer de répondre à la question qui sert de titre à cette entrée ; je vais tout au plus essayer de vulgariser un élément de réponse à une minuscule partie de cette question (ou d'une question proche), sur laquelle on peut dire des choses « techniquement » (c'est-à-dire : logiquement) précises. C'est déjà tout un programme.

La plupart des mathématiciens (et même si ce n'est pas vraiment mon avis, je dois reconnaître qu'il est très répandu) conviendront que l'activité d'un mathématicien est de produire des théorèmes et des démonstrations. Par opposition, disons, aux définitions, exemples ou conjectures, qui forment certainement aussi une partie importante de l'activité en question, mais à laquelle l'opinion dont je parle attribue moins d'importance ou de dignité. Une démonstration est un argument logique plus ou moins formel qui suit certaines règles codifiées pour partir d'axiomes ou d'hypothèses et arriver à une conclusion : un énoncé qui est la conclusion d'une démonstration (connue !) est un théorème (ou une proposition, un lemme, un corollaire, selon sa difficulté, son importance et sa relation logique ou didactique à d'autres énoncés du sujet en cours de développement). Les règles du raisonnement, un peu comme celles des scolastiques d'autrefois (barbara, celarent, darii, ferio), sont supposées assez évidentes pour qu'on doute assez peu qu'elles préservent la vérité lorsqu'elles sont correctement appliquées : si les hypothèses de la démonstration sont vraies alors la conclusion l'est aussi ; donc, tout théorème produit à partir d'axiomes vrais est également vrai.

Mais quels sont les axiomes ? Un certain consensus, apparu au cours du XXe siècle, et maintenant assez fermement enraciné dans, disons, le dogme officiel des mathématiques, est que les axiomes qui fondent les mathématiques sont ceux de la théorie des ensembles de Zermelo-Fraenkel (en abrégé ZFC : le ‘C’ précise l'inclusion de l'axiome du choix, qui n'est pas du tout ce dont j'ai envie de parler à présent), les règles de raisonnement étant celles de la logique du premier ordre. Autrement dit, sauf mention explicite du contraire, ce qu'un mathématicien appelle théorème est un théorème de ZFC, et sa démonstration pourrait être rendue complètement formelle (une manipulation syntaxique fondée sur des règles de réécritures à partir des axiomes de ZFC pour arriver à ce théorème comme conclusion). C'est du moins le dogme officiel parce que, dans la pratique, beaucoup de mathématiciens non logiciens seraient probablement incapables de citer les axiomes de ZFC (ou de d'expliciter les règles de raisonnement de façon formelle et automatique) ; et la tâche d'expliciter complètement la démonstration de n'importe quel théorème modérément compliqué à partir des axiomes fondamentaux et en suivant les règles mécaniques est au mieux titanesque (même si les progrès de la vérification formelle ont montré qu'on pouvait arriver à des choses). Mais le dogme a le bon goût d'éviter des discussions sur les fondements des mathématiques que beaucoup de mathématiciens trouvent oiseuses ; il asseoit les mathématiques sur des bases solides et non dénuées d'élégance (et où, par exemple, la notion d'infini n'a plus rien de mystérieux ou de précaire) :

Aus dem Paradies, das Cantor uns geschaffen, soll uns niemand vertreiben können. (Du paradis que Cantor nous a créé, nul ne doit nous chasser.) — David Hilbert (Über das Unendliche)

(mercredi)

Élections à la proportionnelle : illustrations

Quelques illustrations pour rendre plus claire mon entrée précédente : dans chacun des diagrammes suivants, on a 12 sièges à répartir à la proportionnelle entre 3 listes ; le triangle représente les différentes proportions de voix possibles entre ces trois listes (les sommets représentent l'unanimité pour une des listes et 0 voix pour les deux autres, les côtés du triangle représentent les répartitions où une liste a 0 voix, et plus généralement les nombre de voix recueillies par les trois listes sont proportionnels aux distances aux trois côtés). Les (centres des) 78 gros points de couleur claire marquent les endroits où on a une représentation proportionnelle exacte (par exemple, le point jaune au milieu de la 3e ligne de points en partant du haut — celle qui a trois points — représente une répartition où une liste a exactement 10/12=5/6 des voix et les deux autres chacune 1/12 ; tandis que le point blanc au centre exact du triangle représente la répartition où chaque liste a exactement 4/12=1/3 des voix). Enfin, les régions de couleur qui divisent le triangle représentent chacun une configuration possible des sièges dans l'assemblée : la région marque donc l'ensemble des répartition de votes pour lesquelles le mode de scrutin considéré attribue cette configuration des sièges à l'assemblée. Par exemple, la région jaunâtre vers le sommet supérieur du triangle (celle qui contient le point jaune précédemment mentionné) représente les répartitions possibles des voix pour lesquelles le mode de scrutin représenté attribuera 10 sièges sur 12 à une liste et 1 siège à chacune des deux autres. Comme a priori on veut que la représentation proportionnelle donne à l'assemblée le nombre de sièges entiers exact évident si les voix sont dans des proportions exactes en 12e, évidemment, chaque région contient un et exactement un des points marqués (les exceptions étant si on ne permet pas à une liste d'obtenir zéro sièges, dans la méthode de Huntington-Hill).

[Diagramme méthode de Hare-Niemeyer]Dans le cas de la méthode du plus fort reste de Hare-Niemeyer/Hamilton, les régions sont de bêtes hexagones réguliers, centrés sur les points de représentation exacte, chaque répartition de votes étant envoyée sur la configuration de l'assemblée correspondant au point de représentation exacte métriquement le plus proche (ou, si l'on veut, il s'agit du diagramme de Voronoï des points de représentation exacte). C'est pour cette raison que la méthode est assez naturelle et intuitive. Notons que les hexagones au bord du triangle sont tronqués (ils n'ont donc pas la même aire que les autres) : si on tire uniformément au hasard la répartition des votes, on a moins de chances de tomber sur une situation où la configuration de l'assemblée ne donnera aucun siège à une liste que pour les autres configurations.

Le paradoxe de l'Alabama ne se voit pas sur un seul dessin comme ça : pour le voir, il faut en imaginer deux superposés. Je ne vais pas montrer cette superposition, parce que c'est un peu bordélique, mais ça s'imagine très bien. Considérez par exemple l'hexagone cyan situé autour du milieu du côté gauche du triangle, et prenez un point P très proche du sommet de cet hexagone le plus éloigné du côté en question du triangle : cet hexagone représente une configuration de l'assemblée où deux listes ont 6 sièges chacune et la troisième n'en a aucun. La ligne brisée (en dents de scie) formée par les bords des hexagones tronqués par le bord du triangle représente la ligne à partir de laquelle cette troisième liste obtient un siège : notre point P (qui serait typiquement : 47.3% et 47.2% des voix pour deux des listes et 5.5% pour la troisième) est près d'une bosse de cette ligne brisée, c'est-à-dire dans une situation à peu près aussi éloignée que possible du bord du triangle (i.e. : avec le plus grand nombre possible de voix pour la troisième liste) sans qu'elle obtienne pourtant de siège. Maintenant, si au lieu d'avoir 12 sièges à l'assemblée on en a seulement 11, alors le milieu du côté est à cheval entre deux hexagones, donc le point P passe de l'autre côté de la ligne brisée puisque maintenant elle a un creux à cet endroit-là : les deux listes majoritaires obtiennent 5 sièges chacune, et la troisième en obtient 1 (l'idée étant en quelque sorte qu'on n'arrive pas à le partager entre deux listes très proches, donc on le donne à la troisième !).

Petit exercice : en dimension 3, quel genre de solide obtient-on à la place d'hexagones ?

[Diagramme méthode de Hagenbach-Bischoff]Dans le cas de la méthode du plus fort reste de Hagenbach-Bischoff/Droop, les régions sont toujours des hexagones réguliers, mais cette fois ils ne sont plus centrés sur les points à représentation exacte — ils sont placés de sorte que les côtés du triangle, au lieu de les couper en deux par le milieu, passe par deux sommets (donc les hexagones du bord sont aussi près que possible de l'intérieur, si on veut, sans pour autant qu'un nouvel hexagone ne menace de rentrer dans la figure : cela rétablit un peu le rapport de proportions entre les régions, et on se rapproche beaucoup plus de la méthode de D'Hondt).

[Diagramme méthode de D'Hondt]Dans le cas de la méthode de plus forte moyenne de D'Hondt, les hexagones sont d'autant plus déformés qu'on est proche du bord, et au bord ce sont presque des parallélogrammes : c'est en quelque sorte ce qui permet d'éviter le paradoxe de l'Alabama, car la ligne brisée à partir de laquelle une liste obtient 1 siège n'est presque pas brisée, donc il n'est pas surprenant que la ligne brisée pour 1 siège de plus au total dans l'assemblée, qui sera un peu plus en retrait vers le bord du triangle, ne la coupe jamais. En fait, si cette figure titille vos neurones à 3D, c'est normal : les régions sont bien des cubes vus en perspective (dont les points de représentation exacte sont un des sommets, le plus proche de l'œil), cela résulte d'une des descriptions que j'avais faites de la méthode de D'Hondt. Il faut aussi remarquer que toutes les régions ont la même aire : c'est la propriété de non-biais de la méthode de D'Hondt.

Le fait qu'une liste puisse obtenir, avec la méthode de D'Hondt, plus de sièges que l'arrondi supérieur de sa proportion des sièges se voit bien sur ce diagramme : par exemple, le parallélogramme bleu qui contient le sommet supérieur du triangle (la région des situations où la méthode attribue la totalité des sièges à une des listes) passe largement en-dessous de la ligne horizontale, presque la diagonale de ce parallélogramme, qui relie les deux points à répartition exacte (le rouge et le magenta) juste en-dessous du sommet en question — cette ligne représentant les répartitions où la liste majoritaire obtient 11/12 des voix : donc on peut obtenir moins de 11/12 des voix (presque jusqu'à 10/12, en fait) et tout de même avoir 12 sièges sur 12, si les voix sont à peu près également divisées entre les deux autres listes.

[Diagramme méthode de Sainte-Laguë]La méthode de Sainte-Laguë n'est pas très différente : maintenant les points sont au centre des cubes (et ceux qui sont sur le bord sont tronqués).

[Diagramme méthode de Huntington-Hill]La méthode de Huntington-Hill, enfin, diffère sérieusement au niveau des bords du triangle car, cette fois, elle ne permet pas qu'une liste n'obtienne aucun siège (si elle a ne serait-ce que ε voix).

(mardi)

Comment faire une élection à la proportionnelle

Si on a N sièges d'une assemblée à répartir de façon proportionnelle entre r listes qui ont obtenu des proportions p1,…,pr des suffrages exprimées dans une élection, il y a plusieurs façons de procéder. (Je parle de sièges à répartir entre des listes dans une élection, mais c'est un problème tout à fait général : on peut vouloir attribuer n'importe quoi de non fractionnable entre n'importe quelle sorte d'entités de façon proportionnelle à n'importe quelles grandeurs pi.) Évidemment, lorsque N a le bon goût d'être un diviseur commun de p1,…,pr (c'est-à-dire que chaque N·pi soit un entier), les choses sont faciles : on attribue N·pi sièges à la liste i, et c'est tout (ensuite, il y a éventuellement la question de savoir quels sièges on attribue ou à qui sur la liste, mais je ne veux pas parler de ça ici : normalement les sièges sont interchangeables et on choisit juste les premiers de la liste). Évidemment, cette coïncidence numérique n'arrive jamais. On peut au moins commencer par attribuer à chaque liste la partie entière (c'est-à-dire, l'arrondi à l'inférieur, noté :) ⌊N·pi⌋, du nombre en question, mais il reste ensuite des sièges à répartir. Comment fait-on pour choisir à qui les donner ? Il y a différentes méthodes pour ça, qui ont des propriétés mathématiques et/ou politiques différentes, et qui sont employées dans divers contextes. (Je ne m'intéresse ici qu'aux situations où on répartit effectivement les sièges de façon proportionnelle : s'il y a, par exemple, une prime à la majorité, alors je parle des sièges en plus de cette prime — j'en avais déjà parlé dans le cas des municipales. De même, je fais abstraction des règles qui imposent une barrière minimale pour être représenté à la proportionnel : s'il y en a on suppose qu'on ne considère que les listes qui ont dépassé cette barrière.)

Méthodes de plus fort reste

La méthode la plus naïve est celle du plus fort reste (ou plus exactement, une de celles de ce type), parfois plus précisément appelée méthode de Hare-Niemeyer ou de Hamilton : une fois attribuées les parties entières ⌊N·pi⌋, on compare les parties fractionnaires N·pi−⌊N·pi⌋, c'est-à-dire en quelque sorte les surplus de voix (les restes) par rapport au nombre nécessaire pour avoir le nombre de sièges qu'on vient d'attribuer, et on attribue un siège supplémentaire (jamais plus) aux listes ayant le plus fort reste, jusqu'à avoir attribué tous les sièges restants. Cette méthode peut sembler intuitive, et c'est celle qu'on invente généralement quand on veut faire une répartition à la proportionnelle et qu'on n'est pas matheux ; mais elle souffre d'un grave défaut : elle n'est pas monotone — il se peut très bien qu'en augmentant le nombre N de sièges disponibles, à proportions pi constantes, on diminue le nombre de sièges obtenu par telle ou telle liste. C'est le fameux Alabama paradox, découvert en 1880 parce que les Américains utilisaient cette méthode pour attribuer le nombre de sièges à la chambre des Représentants entre les états de l'Union proportionnellement à la population de ces états : on s'est aperçu que si le nombre de représentants au total passait de 299 à 300, alors l'Alabama en obtenait un de moins. À cause de ce paradoxe, ou parce qu'elle a tendance à trop favoriser les petites listes, cette méthode du plus fort reste est assez peu utilisée en pratique (elle sert cependant en Russie, par exemple).

(vendredi)

Comment un mathématicien ouvre une infinité de boîtes

Les remarques faites en commentaire sur mon entrée récente me semblent mériter quelques précisions d'ordre mathématique, auxquelles je vais consacrer cette entrée. Les deux parties suivantes, et même leurs différentes sous-parties, sont indépendantes (et au moins formellement indépendantes de l'entrée précédente). Vue la longueur de ce post, ce n'est pas une mauvaise chose, d'ailleurs.

Sur la calculabilité, et l'utilisation de l'axiome du choix

Plutôt que discuter sur le problème d'origine, je vais utiliser celui-ci, qui est légèrement plus simple :

Le cruel Docteur No a capturé une infinité dénombrable de mathématiciens pour les soumettre à une épreuve pernicieuse. Il a créé des chapeaux de plusieurs couleurs différentes. Après avoir permis aux mathématiciens de se concerter, il va les soumettre à son épreuve dont il leur communique les termes : il empêchera toute communication entre eux, puis rangera les mathématiciens en file indienne dans un certain ordre (indexé par les entiers naturels), et mettra sur la tête de chacun un chapeau d'une certaine couleur (les couleurs possibles sont connues à l'avance), de sorte que chaque mathématicien puisse voir les couleurs des chapeaux de tous ceux situés devant lui (une infinité), mais pas de ceux (en nombre fini) situés derrière lui ni du sien propre. Chaque mathématicien devra noter sur un papier (et toujours sans aucune communication avec les autres) ce qu'il croit être la couleur de son chapeau. Le Docteur No tolérera un nombre fini d'erreurs, mais pas plus : si une infinité de mathématiciens s'est trompée en annonçant la couleur de leur chapeau, tous seront tués avec des tortures particulièrement raffinées — à l'inverse, si tous sauf un nombre fini avaient raison, ils seront tous libérés. Comment les mathématiciens se tirent-ils de ce mauvais pas (de façon certaine) ?

De façon mathématique, on demande de construire une fonction φ:XX (où X est l'ensemble des couleurs et ℕ l'ensemble des naturels) qui à une suite de couleurs de chapeau associe la suite des réponses des mathématiciens, telle que si u et v ne diffèrent que sur les n premiers termes alors φ(u) et φ(v) ne diffèrent que sur les n−1 premiers termes (car, pour tout n, seuls les n−1 premiers mathématiciens peuvent pas voir certains des n premiers chapeaux), et telle que pour tout u les suites u et φ(u) coïncident sauf en un nombre fini de termes (seuls un nombre fini des mathématiciens a le droit d'avoir tort). Dispensons-nous des généralités vaseuses et mettons que X={0,1} (il n'y a que deux couleurs de chapeau : noir et blanc).

Peut-on avoir une stratégie calculable ?

Supposons un instant que nos mathématiciens soient, en fait, des informaticiens : ils ne peuvent calculer que les fonctions calculables effectivement par une machine de Turing ; plus exactement, il doit exister une machine de Turing T qui, quand on l'exécute en lui fournissant un entier naturel n et un oracle u (dont elle peut interroger librement les valeurs mais seulement celles qui sont au moins égales à n+1) doit terminer et renvoyer φ(u)(n). (On souligne qu'une machine de Turing ne peut évidemment, au cours de son exécution, interroger qu'un nombre fini de valeurs de l'oracle.) Or, dans ces conditions, les informaticiens ne peuvent pas être certains d'être libérés : en effet, si le Docteur No a connaissance[#] de la machine de Turing T qui sera utilisée par les informaticiens, il peut lancer l'exécution de T sur le nombre n0=0 en fixant arbitrairement la valeur de u(k) lorsque la machine T interroge l'oracle en k (forcément différent de 0 par hypothèse), puis choisir une couleur de chapeau u(0) pour l'informaticien 0 qui soit différente de la valeur retournée par T pour ce calcul (qui se fait en temps fini puisque T est censée toujours terminer) ; puis il lance l'exécution de T sur le premier nombre n1 pour lequel la valeur de u n'a pas encore été fixée, et de nouveau, à chaque fois que la machine T interroge l'oracle sur une valeur non encore déterminée de u, elle est fixée arbitrairement, et à la fin u(n1) est choisi différent du nombre renvoyé par T. Et ainsi de suite : alors les informaticiens n0, n1, n2, etc., se tromperont tous, donc le Docteur No aura réussi son plan diabolique.

(samedi)

Le Docteur No continue ses méfaits

Dans l'esprit des énigmes de combinatoire cybernétique que j'avais déjà posées, celle-ci est particulièrement étrange et étonnante (je la décris donc de façon très détaillée et verbeuse, pour qu'il n'y ait aucun doute sur les termes de l'épreuve) :

Le cruel Docteur No a capturé 100 mathématiciens pour les soumettre à une épreuve démoniaque. Il dispose dans une pièce de son bateau d'une infinité (dénombrable) de boîtes, étiquetées par les entiers naturels (0,1,2,3,…), contenant chacune un nombre (disons un nombre réel pour fixer les idées, même si des naturels marcheraient tout aussi bien : en tout cas, il n'y a aucune contrainte sur la suite de nombres ainsi formée) ; il est évidemment impossible de connaître le contenu d'une boîte sans l'ouvrir. Après avoir permis aux mathématiciens de se concerter, il va les soumettre à son épreuve dont il leur communique les termes : il empêchera toute communication entre eux et les emmènera chacun, dans un certain ordre, dans la pièce où se trouvent les boîtes.

Lorsqu'un mathématicien est dans la pièce, il pourra ouvrir les boîtes qu'il souhaite pour en examiner le contenu, y compris une infinité d'entre elles (en fonction éventuellement des nombres lus dans les boîtes déjà ouvertes) ; il devra cependant laisser au moins une boîte sans l'ouvrir, et faire une prédiction sur le contenu exact d'une boîte qu'il n'aura pas ouverte. (Entre les passages de deux mathématiciens, les boîtes sont bien sûr refermées, puisque les mathématiciens ne doivent disposer d'aucun moyen de communication ; ou, si on préfère, on peut imaginer qu'il y a 100 pièces différentes contenant chacune une copie identique de la même suite de nombres, et que tous les passages ont lieu simultanément : c'est équivalent.)

Au final, les 100 mathématiciens auront chacun fait une prédiction sur le contenu d'une boîte sans en avoir regardé le contenu. (Les mathématiciens ont le droit de faire des prédictions sur des boîtes différentes les uns des autres, ou sur la même.) Le Docteur No tolérera une seule erreur parmi ces prédictions : si au moins 99 des 100 mathématiciens ont donné exactement le bon nombre pour la boîte qu'ils ont désignée, alors le Docteur No les libérera tous. Si deux mathématiciens ou plus se sont trompés, alors le Docteur No tuera tous les mathématiciens avec ses tortures particulièrement raffinées.

Comment les mathématiciens font-ils pour être certains d'être tous libérés ?

La raison pour laquelle l'énigme semble (si on essaie d'y réfléchir) impossible à résoudre, c'est bien sûr qu'ouvrir des boîtes autres que celle sur laquelle on va faire la prédiction n'apporte aucune information sur cette dernière (puisque le Docteur No a le droit d'avoir rempli les boîtes absolumnet comme il le veut !), et on ne voit pas ce que peut apporter le fait qu'il y ait 100 mathématiciens, puisqu'ils ne communiquent pas du tout entre eux ; certes, on a droit à une erreur, mais on voit mal comment exploiter ce droit.

Je vais donc donner trois indications (cachées ci-dessous : cliquez sur les liens qui suivent pour les dévoiler) : la première est mathématique et devrait clarifier ce qu'on s'autorise à faire d'une infinité de nombres. La seconde indication est une nouvelle énigme, beaucoup plus simple (mais qui peut éventuellement être intéressante en elle-même, notamment pour les gens qui n'aiment pas les infinis), censée démystifier comment utiliser le droit à faire une erreur. Les deux ensemble devraient rendre claire la façon dont on peut prédire quelque chose sur une boîte sans l'avoir ouverte. (Attention cependant, il est possible que ma seconde indication, prise seule, mette sur une fausse piste.) Enfin, la troisième indication propose le mode opératoire. Les trois indications mises ensemble devraient rendre la solution assez évidente. Au lecteur de choisir quelle(s) indication(s) il souhaite ouvrir pour en lire le contenu !

(vendredi)

Encore un taquin de Mathieu

J'avais déjà proposé (deux fois) des petits jeux comme ça : celui qui se trouve en bas de cette entrée (cliquez ici s'il n'apparaît pas bien ci-dessous, et maudissez avec moi la norme HTML qui ne permet pas d'inclure un document dans un autre en l'insérant à sa taille naturelle) est donc ma troisième tentative, et j'en suis un peu plus content parce que, contrairement aux deux précédents qui étaient sérieusement trop durs, je crois qu'il est vraiment jouable (et construit de façon un peu moins ad hoc). Par contre, je ne suis pas du tout content de l'interface, comme je vais l'expliquer.

Le but du jeu, donc, est de mélanger les nombres de 1 à 24 puis d'arriver à les remettre dans l'ordre évident dans lequel ils sont présentés initialement. La commande ¿ (un point d'interrogation à l'envers, ne me demandez pas pourquoi) mélange complètement le taquin, et la commande (une croix) le réinitialise à sa position de départ ; quant à ¡ (un point d'exclamation à l'envers), elle effectue un mélange partiel, que j'appelle un m12lange pour une raison que je vais expliquer, qui n'échange pas de nombres entre les deux moitiés (dodécades), et qui peut donc servir de puzzle plus simple pour s'entraîner avant de passer au problème complet. Bref, votre mission est de mélanger — ou au moins de m12langer — le puzzle, puis d'arriver à le remettre dans son état initial en n'utilisant que les commandes de mouvement que je vais expliquer (mais peut-être que le mieux est d'expérimenter avec plutôt que de lire les instructions). Avant que quelqu'un n'exprime sa déception à ce sujet : non, il n'y a pas de message de félicitation quand on arrive à remettre le puzzle en ordre.

Expliquons donc quels sont les mouvements autorisés. Tout d'abord, les nombres sont placés en deux tableaux de 3 lignes × 4 colonnes (qu'on pourrait appeler dodécades), le tableau d'en haut contenant initialement les nombres de 1 à 12 et celui d'en bas de 13 à 24. Parmi les mouvements possibles, on peut faire n'importe quelle permutation des trois lignes d'un tableau, à condition de faire la même sur l'autre tableau : pour concrétiser ça, j'ai mis des commandes et , qui permutent cycliquement les trois lignes de chaque tableau, et qui échange les deux lignes d'en bas de chaque tableau : avec ça, on arrive assez facilement à faire n'importe quelle permutation des lignes (la même sur les deux tableaux). Pour ce qui est des colonnes, on à le droit à ce qu'on appelle une permutation paire (toujours la même sur les deux tableaux) : concrètement, j'autorise à faire une permutation cyclique des trois colonnes de gauche, ou des trois colonnes de droite, avec les commandes et situées de part et d'autre du losange central — celles à gauche permutent cycliquement les trois colonnes de gauche et celles à droite les trois colonnes de droite. Ensuite, on a l'opération la plus importante, le flip de Mathieu, commandée par le losange  : elle échange huit paires de nombres (quatre en haut et quatre en bas, mais pas organisées de la même façon), rappelées par des couleurs sur les cases en question — le contenu de chaque case coloriée est échangé avec celui de la case de même couleur. (Chaque paire est composée de deux cases adjacentes en diagonale — du moins, pour le tableau du bas, si on regarde les colonnes cycliquement.)

Aucune des opérations qu'on vient de décrire n'échange des nombres entre les deux tableaux : les nombres qui étaient en haut restent en haut et ceux d'en bas restent en bas ; je dirai que tout mélange effectué avec les différentes opérations que je viens de décrire est un m12lange du tableau : mais pour avoir un mélange complet, il me faut une dernière opération. Celle-ci est représentée par (flèche haut-bas avec une base horizontale), et elle échange deux des trois lignes du tableau supérieur (les deux lignes d'en bas, en l'occurrence) avec les deux mêmes lignes du tableau inférieur (en combinant avec des permutations cycliques, on voit bien sûr qu'on peut facilement faire échanger n'importe quel nombre pair de lignes entre les deux tableaux).

Ces règles étant décrites, que peut-on en dire mathématiquement ? Il y a 244823040 façons de mélanger le puzzle, c'est-à-dire seulement la fraction 1/2534272925184000 des 620448401733239439360000 manières en tout dont on peut permuter 24 objets. Néanmoins, ces 244823040 permutations, qui forment le groupe M24 de Mathieu, suffisent à permettre de placer cinq nombres quelconques (parmi les 24) à cinq emplacements quelconques : on dit qu'il est cinq fois transitif — et c'est assez remarquable, parce que tout puzzle consistant en des permutations, arbitrairement composables, sur n objets et qui permettrait d'en placer six quelconques à six emplacement quelconques (i.e., qui serait six fois transitif), ou a fortiori plus que six, réaliserait obligatoirement[#] toutes les permutations de ces n objets, sauf peut-être à un échange près (autrement dit, les permutations paires : tout le monde sait sans doute que le taquin habituel ne permet de réaliser que la moitié des permutations imaginables). En particulier, si on ajoutait n'importe quelle nouvelle opération (qui ne soit pas déjà réalisable avec celles proposées), on pourrait obtenir n'importe quel arrangement des 24 nombres ou au moins tous les arrangements pairs.

Quant aux façons de m12langer le puzzle, il en existe 95040 (là, ce n'est vraiment pas énorme !), c'est-à-dire 1/5040 des 479001600 manières de permuter 12 objets, et, de nouveau, le groupe des permutations ainsi formées, qui est le groupe M12 de Mathieu, opère cinq fois transitivement, c'est-à-dire que sans échanger de nombres entre les deux tableaux on peut arriver à placer cinq quelconques d'un tableau donné à un emplacement quelconque dans ce tableau. Donc ce puzzle, contrairement aux précédentes tentatives que j'avais faites pour présenter le groupe M24 sous forme de jeu de taquin, montre clairement comment le sous-groupe M12 apparaît, et permet de s'en servir comme d'un mini-puzzle à l'intérieur du puzzle complet, si on s'interdit simplement d'utiliser l'opération qui échange des lignes entre les deux tableaux (et si on m12lange avec ¡). Ce mini-puzzle, d'ailleurs, est tout à fait jouable tout en étant loin d'être évident ! Et puis, il y a quelque chose d'un peu magique, quand on arrive à remettre en ordre le tableau du haut après l'avoir m12langé, à constater que celui du bas se remet aussi magiquement[#2] dans l'ordre.

Mes opérations ne sont pas tout à fait irredondantes : par exemple, il n'est pas nécessaire de disposer d'une opération échangeant les deux lignes inférieures (de chaque tableau), et il n'est pas non plus nécessaire de pouvoir faire une rotation cyclique des trois colonnes de droite — on peut engendrer tout M12 avec juste une rotation cyclique des lignes, une rotation cyclique des trois colonnes de gauche, et le flip, et M24 avec l'opération en plus. (Mais ça me semblait tout de même pertinent de tout autoriser, pour que le puzzle ne soit pas injouable, et aussi parce que ça me semble plus logique avec toutes les opérations. Si on est téméraire, on peut cependant essayer de jouer avec seulement les opération que je viens de dire.) En revanche, le flip est évidemment indispensable : sans lui, deux nombres situés sur la même ligne ou colonne resteront toujours sur la même ligne ou colonne, et on n'obtient que 288 permutations en tout.

J'ai expliqué que M24 ne contient qu'une toute petite fraction des 24!≈6×1023 permutations possibles de 24 objets : les joueurs de Rubik's cube auront peut-être tendance à rigoler de la taille de ce groupe, qu'est-ce que 245 millions d'éléments par rapport aux 4×1019 configurations du cube 3×3×3 ? Pourtant, je pense que c'est justement le fait que le groupe de Mathieu soit petit (donc très contraint) dans le groupe symétrique qui fait que le puzzle n'est pas très facile : on ne peut pas espérer trouver de façon d'échanger juste deux nombres, ou juste deux paires, ou quelque chose comme ça — le plus grand nombre d'éléments qu'on peut simultanément laisser fixe par une opération quelconque est huit (ou, si vous préférez, si neuf nombres quelconques sont à leur bonne place, le puzzle est forcément résolu ; et dans M12 c'est même cinq). En même temps, le fait que M24 soit quand même cinq fois transitifs signifie que le problème a énormément de symétries, on ne peut pas toutes les « voir » à la fois. Par rapport à mes présentations précédentes de M24 comme puzzle (ici et ), on a peine à croire que c'est le même groupe (à conjugaison près dans 𝔖24, c'est-à-dire à réétiquetage près), mais avec des générateurs différents : je pense que ce nouveau puzzle est à la fois plus simple à résoudre (je n'y arrive pas non plus sans aide de l'ordinateur, mais je n'y ai pas passé un temps fou, et j'arrive au moins à faire le mini-puzzle de M12) et moins artificiel (les mouvements proposés ne sont pas atrocement compliqués, et notamment j'arriverais à retenir toutes les règle, notamment les cases échangées par le flip de Mathieu, alors que dans mes précédentes descriptions c'était vraiment sorti d'un chapeau. Là, je crois que je vais retenir cette description des groupes de Mathieu.

Par contre, je ne suis vraiment pas content de mon interface en HTML+JavaScript : c'est atrocement peu maniable, et fort peu intuitif. Donc si quelqu'un trouve une autre façon de faire ça, une interface montrant facilement qu'on peut faire une permutation quelconque des lignes, une permutation paire des colonnes, l'échange d'un nombre pair de lignes entre les deux tableaux, plus le flip magique, ça m'intéresse. (Enfin, ça m'intéresse surtout si quelqu'un réalise cette interface, parce que donner des conseils c'est toujours facile…)

Trêve de blabla, voici le puzzle : jouez-y, c'est addictif !

[#] Techniquement : tout groupe de permutations sur n objets qui est six fois transitif est égal au groupe symétrique 𝔖n ou au groupe alterné 𝔄n ; et à part eux, les seuls qui soient cinq fois transitifs sont les groupes M12 et M24 de Mathieu, opérant naturellement sur 12 ou 24 objets. (J'en avais déjà parlé.) On peut aussi donner des listes de groupes opérant fidèlement de façon deux à quatre fois transitive, mais il y en a plus que ça.

[#2] En fait, si on fait correspondre le tableau du haut avec le tableau du bas dans lequel on a permuté cycliquement les colonnes d'un cran (dans un sens quelconque), on obtient une application qui associe à chaque élément de M12 un autre élément de ce même groupe, et qui préserve la composition : il se trouve que cette correspondance constitue l'unique (à conjugaison près) automorphisme extérieur de M12. Quant à M24, lui, il ne possède pas d'automorphisme extérieur : c'est un groupe complet.

(mardi)

Traces de matrices nilpotentes

La trace de la matrice générique[#] d×d nilpotente d'ordre n est elle-même nilpotente d'ordre d·nd+1.

(C'est-à-dire : le plus petit k tel que sur n'importe quel anneau (commutatif) A, si t est la trace d'une matrice d×d nilpotente d'ordre n alors t est elle-même nilpotente d'ordre k, ce plus petit k vaut exactement[#2] d·nd+1.)

Ça ne vous fait peut-être pas des masses d'effet, mais moralement, une affirmation comme ça ne devrait pas être difficile à démontrer (sur un corps, le fait qu'une matrice nilpotente soit de trace nulle, c'est de niveau math. sup.). Il devrait juste s'agir de développer (x1,1+⋯+xd,d)k, réorganiser les termes pour faire apparaître des xi,j de façon à mettre en évidence les entrées de la matrice puissance n-ième, et conclure que pour k assez grand tout s'annule. Eh bien non, bizarrement, il semble qu'on ne sache pas faire comme ça (en tout cas, moi, je ne sais certainement pas), pour n et d quelconques.

Il semble que Bernard Mourrain ait une démonstration (les deux endroits où j'ai trouvé une référence à ce problème, ce Monsieur était nommément cité comme ayant expliqué la solution), et que ça utilise des bases SAGBI (Subalgebra Analog of Gröbner Bases for Ideals), je n'en sais pas plus : mais c'est scandaleux que quelque chose comme ça ne soit pas plus facile.

Où est-ce qu'on envoie les pétitions pour réformer les mathématiques ?

[#] Précision (2009-04-01T20:00+0200) : Le terme générique n'est sans doute pas approprié : il faudrait plutôt dire universel, en fait. (La matrice universelle d×d nilpotente d'ordre n, c'est celle dont les d² entrées sont les images des indéterminées de l'anneau des polynômes à d² variables dans son quotient A par les relations algébriques qui expriment le fait que la matrice puissance n vaut zéro ; la matrice générique correspondante, ce serait la même matrice vue sur le corps des fractions au lieu de l'anneau quotient A — mais cet anneau n'est pas intègre, donc on ne peut pas vraiment parler de matrice générique ; on peut cependant réduire l'anneau A et ensuite passer au corps des fractions — mais évidemment, à ce moment-là, la trace est nulle, comme celle de n'importe quelle matrice nilpotente sur un corps.)

[#2] Plus exactement : montrer que tout exposant de nilpotence k de la trace vaut au moins d·nd+1 est facile en considérant une matrice diagonale de coefficients diagonaux nilpotents d'ordre n ; montrer que la trace est nilpotente (sans déterminer k) est également facile en utilisant le cas des corps : ce qui est difficile, c'est de voir que l'exposant d·nd+1 annule effectivement la trace.

(vendredi)

Calculs sur ordinateur : Sage et compagnie

Pfiou, déjà quinze jours que je n'ai rien posté ici ? Mais — outre qu'à chaque fois que je commence à écrire une entrée mon poussinet m'appelle pour faire dodo — j'ai un alibi : j'étais occupé à m'arracher les cheveux pour faire marcher des programmes de calcul pour faire un peu de géométrie algébrique effective, notamment Sage et Macaulay2.

En l'occurrence il s'agissait de vérifier des calculs dans un article que je référais rapportais, mais le prétexte était aussi d'apprendre à mieux me servir de ces programmes. Sage, en fait, est une sorte de méta-programme : il ne fait pas énormément lui-même, il a surtout pour fonction de rassembler sous une interface commune divers autres programmes auxquels il délègue les calculs difficiles (notamment Singular, qui devait faire tout le boulot sérieux sur les bases de Gröbner que je confiais à Sage), et j'espère d'ailleurs que Macaulay2 arrivera lui aussi prochainement sous l'ombrelle Sage, de sorte que je n'aurai plus qu'un programme à utiliser pour ce genre de choses (parce que c'est un peu fastidieux, entre les Sage, Macaulay2, Singular, mais aussi parfois GP/Pari, Gap4, Maxima, Axiom et quelques autres, de se rappeler qui a besoin d'un ; à la fin de la ligne, qui utilise % pour rappeler le résultat précédent, qui utilise = ou := ou : pour l'affectation, et ainsi de suite). Sage est basé sur Python, sans doute pas mon langage de programmation préféré, mais, du moins, un vrai langage de programmation, ce qui est toujours plus agréable que les succédanés que certains logiciels nous servent.

Tous les programmes que j'ai cités ci-dessus ont la vertu d'être des logiciels libres. Malheureusement ce n'est pas du tout le cas de celui qui fait aujourd'hui référence en matière de calculs informatiques en algèbre et géométrie algébrique (et qui, même si Sage fait des progrès très rapides et très spectaculaires, domine tous les autres à peu près autant qu'un moine Shaolin m'éclaterait en combat singulier), à savoir Magma. Celui-ci, non seulement il n'est pas libre, mais il est même vendu très cher (neither Free as in Free Speech nor Free as in Free Beer—more like Free as in Free Tibet!, comme on dit). Je trouve ça d'ailleurs plus qu'un peu choquant, vu que le coup bas ne vient pas d'une compagnie à but très lucratif (on a sinon la résignation du moins l'habitude que les Springer, les Elsevier et d'autres, ou dans un autre genre les Wolfram Research, se fassent de l'argent à partir des subventions à la recherche en mathématiques) mais d'une université, en l'occurrence celle de Sydney[#].

En l'occurrence, ce n'est pas qu'une préférence abstraite pour le logiciel libre ni un souci d'argent qui me font m'agacer de Magma, c'est aussi une troisième raison, une inquiétude scientifique pour la reproductibilité des calculs. Car si un théorème dépend du résultat d'un calcul (comme c'était le cas dans l'article que je rapportais), et si ce calcul n'est faisable qu'avec un unique logiciel dont, de plus, le code source n'est pas visible, peut-on avoir complètement confiance en l'exactitude du théorème ? Il ne suffit pas que les algorithmes annoncés être utilisés par le logiciel soient publiés et validés, encore faut-il qu'ils soient correctement implémentés et exempts de bugs, et cela on ne peut pas s'en assurer même en théorie. Je proposerais donc comme critère pour qu'un calcul puisse être considéré comme tenant lieu de démonstration inconditionnelle (lorsqu'il repose, évidemment, sur des algorithmes garantis et qui prouvent effectivement la conclusion annoncée) qu'il puisse être reproduit sur au moins deux logiciels développés de façon complètement indépendante, dont au moins un ait un code source publié. Certes je n'irai pas relire le code complet du logiciel, mais je n'ai pas non plus lu la démonstration du théorème de Hironaka, je fais confiance à des spécialistes pour ça, et je ne me prive pas de l'utiliser : il m'importe cependant de pouvoir lire au moins en théorie tout ce sur quoi mes démonstrations reposent, que ce soit d'autres démonstrations ou des logiciels ; la vérification par un second logiciel tiendrait, dans cette analogie, lieu de vérification d'une démonstration par un rapporteur — cela ne valide pas les logiciels tout entiers, mais ça valide au moins le calcul précis qu'on a fait refaire.

(Dans l'article que je rapportais, fort heureusement, j'ai pu refaire dans Sage et Macaulay2 la totalité des calculs que les auteurs prétendaient avoir effectués avec Magma : ce fut au prix de pas tout à fait du sang mais du moins beaucoup de larmes et de sueur.)

Comme exemple de calcul qu'on peut faire avec ce genre de programmes, voici un exemple dont je ne suis pas peu fier : l'équation cartésienne du bord des composantes hyperboliques de période 3 dans l'ensemble de Mandelbrot (c'est-à-dire la cardioïde du plus gros « ensemble satellite », celui qui est situé autour de −1.755 sur l'axe réel, plus les deux plus gros bulbes symétriques sur la cardioïde mère, situés autour de −0.123±0.745i). Il s'agit de la courbe d'équation suivante (où x désigne la partie réelle et y la partie imaginaire du paramètre) :

x12 + 6x10y2 + 15x8y4 + 20x6y6 + 15x4y8 + 6x2y10 + y12 + 8x11 + 40x9y2 + 80x7y4 + 80x5y6 + 40x3y8 + 8xy10 + 28x10 + 116x8y2 + 184x6y4 + 136x4y6 + 44x2y8 + 4y10 + 60x9 + 192x7y2 + 216x5y4 + 96x3y6 + 12xy8 + (6015/64)x8 + (3199/16)x6y2 + (3709/32)x4y4 + (127/16)x2y6 − (129/64)y8 + (927/8)x7 + (1117/8)x5y2 − (35/8)x3y4 − (225/8)xy6 + (232639/2048)x6 + (116925/2048)x4y2 − (5315/2048)x2y4 − (20673/2048)y6 + (186941/2048)x5 − (9283/1024)x3y2 + (56637/2048)xy4 + (3851/64)x4 − (11473/512)x2y2 + (6615/512)y4 + (64071/2048)x3 − (32193/2048)xy2 + (3552255/262144)x2 − (1528065/262144)y2 + (250047/65536)x + (15752961/16777216) = 0

Si vous croyez que c'est facile de calculer ça, même avec un ordinateur, trouvez-moi la courbe limite correspondante pour les points de période 4 — je serai très impressionné.

[#] Remarquez, si je commence à dire du mal des universités qui ont des politiques honteuses quand il s'agit de se servir de leur droit d'auteur pour éviter que quelque chose d'utile au public ou à la recherche puisse leur échapper, j'en aurais un rayon à sortir… j'ai déjà parlé du OED ?

(dimanche)

Petite histoire du « gras de tableau noir »

Puisque je parlais de notations mathématiques dans la dernière entrée, je vais raconter un autre petite histoire à ce sujet : celle de la police qu'on appelle le gras de tableau noir (enfin, je ne sais pas ce qu'on est censé dire en français : je sais juste que les lettres se disent double barre — c'est en anglais qu'on parle de blackboard bold).

Il s'agit des caractères qui ressemblent à ceci :

ℤ

(en l'occurrence le Z double barre, qui désigne l'ensemble des entiers relatifs {…, −3, −2, −1, 0, 1, 2, 3, …}, et qui pour Unicode se nomme U+2124 DOUBLE-STRUCK CAPITAL Z, soit ℤ si vous avez donné des polices correctes à votre navigateur). Il s'agit d'une désignation maintenant assez standardisée pour les ensembles de nombres (les plus communs étant : ℕ soit N double barre pour les entiers naturels, ℤ soit Z double barre pour les entiers relatifs, ℚ soit Q double barre pour les rationnels, ℝ soit R double barre pour les nombres réels, ℂ soit C double barre pour les nombres complexes). Quelle est leur histoire ?

La désignation des ensembles de nombres était assez fluctuante jusque dans la première moitié du XXe siècle : l'utilisation du N pour les entiers naturels remonte au moins à Peano, celle du Z pour les entiers — sans doute comme initiale du mot allemand Zahl — est sans doute due à Landau dans ses Grundlagen der Analysis vers 1930 (mais l'écrivait en gothique fraktur, ℨ, avec une barre au-dessus), celle du R pour les réels a été faite par plusieurs personnes indépendamment (mais le R était aussi souvent utilisé au début du XXe pour désigner les rationnels).

C'est Bourbaki qui a fixé, à la fin des années '40, au moins les lettres suivantes : le N pour les entiers naturels, le Z pour les entiers relatifs, le Q pour les rationnels (qu'il semble avoir été le premier à introduire), le R pour les réels et C pour les complexes (ainsi que H pour les quaternions — par contre, il n'utilise pas O pour les octonions, et il est sans doute difficile d'attribuer à quelqu'un de précis une notation aussi évidente). Il semble que ces conventions se soient imposées très rapidement. Cependant, si Bourbaki a fixé les lettres, il utilise une police grasse normale pour les désigner.

L'histoire du « gras tableau noir » est complètement contenue dans son nom : pour simuler du gras au tableau noir, le plus simple est de doubler les traits. La façon dont cette habitude est passée du tableau noir au papier n'est pas évidente à retracer : il semble que le vecteur ait été les textes imprimés à la machine à écrire, où on graissait une lettre en la frappant deux fois légèrement décalée. (Le premier texte comme ça est peut-être le Lectures on Riemann Surfaces de Gunning, publié en 1966 à Princeton, Gunning lui-même ayant tiré cette idée de l'habitude prise dans le séminaire Kodaira-Spencer à Princeton au début des années '60 ; mais ce n'est pas sûr.)

Je ne sais pas non plus quel est le premier document imprimé de façon plus sérieuse qu'à la machine qui a eu ces caractères, mais il y a eu plusieurs styles de polices « gras tableau noir » dans TeX, essentiellement développées par l'AMS :

[ℤ sans sérif] (msym10) est devenu [ℤ avec sérifs] (msbm10) vers 1991

(mais ce ne sont pas les seules formes possibles).

Ce qui est amusant, c'est que cette police est apparue par accident (du gras de Bourbaki au gras « tableau noir » en passant par le doublement des traits sur un vrai tableau noir et le doublement des caractères sur la machine à écrire), mais que c'est une invention vraiment géniale (et maintenant entérinée par son introduction dans Unicode) : alors qu'en maths on manque souvent de lettres et de symboles pour désigner les objets, voici une police complètement unique et très facilement reconnaissable pour désigner des objets uniques. Car il n'y a pas que les ensembles de nombres : le gars « tableau noir » semble servir généralement à désigner des objets mathématiques qui n'est pas seulement particulier au problème, mais plus généralement bien reconnu dans l'ensemble de la branche des mathématiques où on se place, voire l'ensemble de toutes les mathématiques — en probabilités on utilisera 𝔼 soit E double barre pour l'espérance, en géométrie ℙ soit P double barre pour l'espace projectif, etc. (tiens, le μ double barre n'est pas dans Unicode : il faudra sans doute que je propose celui-là aussi — il sert à désigner le groupe des racines de l'unité).

Un peu de polémique maintenant : les membres de Bourbaki, notamment Serre, et un certain nombre de matheux français qui s'en sentent proches, n'aiment pas cette police et refusent de l'utiliser dans les textes imprimés, arguänt que Bourbaki avait choisi le gras, pas le doublement des barres. Je trouve que ce refus est une obstination d'orgueil bien malheureuse, car même si le gras « tableau noir » est le fruit du hasard, il est vraiment utile, et il a l'avantage de libérer le gras pour d'autres usages (par exemple pour désigner des catégories, des foncteurs, que sais-je encore) ; en tout cas, l'explication c'est un malentendu, le doublement des barres n'est qu'une façon de faire du gras au tableau noir ne vaut rien (on est conscient que c'est un malentendu, mais beaucoup d'inventions utiles sont nées d'une erreur, ce n'est pas une raison pour ne pas s'en servir !), pas plus que Bourbaki a choisi le gras (comme Landau a choisi la fraktur avec une barre dessus, mais on ne s'en sert plus). Heureusement, je crois qu'ils ont complètement perdu cette bataille (les notations pour les ensembles de nombres en « gras tableau noir » s'enseignent maintenant au collège/lycée, en France et dans beaucoup d'autres pays, et l'immense majorité des mathématiciens les considèrent maintenant comme acquises).

PS : Si quelqu'un veut bien faire à ma place l'effort de rendre un peu plus corrects les articles de Wikipédia (It is frequently claimed that the symbols were first introduced by the group of mathematicians known as Nicolas Bourbaki. There are several reasons to doubt this claim…), ce serait bien. L'ennui, c'est qu'il est à peu près impossible de donner une référence pour tout ce que je viens de raconter.

(vendredi)

Je propose un N-ARY RESTRICTED PRODUCT

Aujourd'hui j'ai fait une tentative pour augmenter mon karma geek : j'ai soumis un caractère à Unicode. Il s'agit d'un caractère qui ressemble à ça :

[symbole produit restreint] — c'est-à-dire une combinaison de ça : [symbole produit] et ça : [symbole coproduit]

Les deux symboles de droite existent déjà dans Unicode : il s'agit du symbole du produit de suites ou familles (U+220F N-ARY PRODUCT) ∏ (le glyphe est juste un grand pi majuscule) et du symbole du coproduit de suites ou familles (U+2210 N-ARY COPRODUCT) ∐ (le glyphe est le même mais inversé). Le symbole que j'ai proposé d'ajouter (et qui pourrait recevoir le nom de N-ARY RESTRICTED PRODUCT) a un glyphe sont la partie supérieure est celle du symbole du produit et la partie inférieure est celle du symbole du coproduit (donc le même à l'envers). Il dénote le produit restreint (toujours de suites ou familles) et apparaît en théorie des nombres — dans un contexte où le coproduit d'une famille infinie d'objets (qui, en général, est une opération duale du produit) serait le sous-ensemble du produit dont toutes les coordonnées sont nulles sauf un nombre fini, le produit restreint est intermédiaire entre le coproduit et le produit, il correspond au sous-ensemble du produit dont toutes les coordonnées sauf un nombre fini appartiennent à un sous-ensemble des facteurs compris implicitement ; cela apparaît par exemple, dans la définition de l'anneau des adèles ou du groupe des idèles d'un corps de nombres. Ce produit restreint est souvent noté ∏′ (pi-prime, quoi) par les auteurs qui n'aiment pas ou ne savent pas typographier le symbole ci-dessus, mais cette notation, proposée par John Tate, est occasionnellement utilisée, graphiquement élégante, et il me semble important de l'ajouter à Unicode.

Ça faisait longtemps que je pensais soumettre ce caractère (depuis un exposé au séminaire Variétés rationnelles, il y a un an, où il était apparu sous la craie de David Harari). Mais pour cela, il me fallait trouver des exemples de son utilisation : c'est là qu'était la difficulté, parce que pour convaincre que le symbole existe vraiment, il faut des exemples imprimés, or il sert surtout au tableau noir où ce n'est pas difficile de le faire et où le prime dans ∏′ (pi-prime) risquerait de ne pas être vu — alors que dans un texte imprimé, c'est le contraire, écrire ∏′ est plus facile (le symbole inventé par Tate, non seulement il n'est pas dans Unicode, mais il n'est pas non plus dans les jeux de macros LaTeX usuels). Je savais que je l'avais vu quelque part dans un livre, mais encore fallait-il retrouver où. Un ami m'a rapidement trouvé un spécimen dans Galois Cohomology de Serre, et ce n'est que récemment que je suis retombé sur un autre exemple que j'avais oublié, dans Algebraic Number Theory de Neukirch. Avec ces deux références (de deux auteurs différents et imprimées par un éditeur connu), je pense qu'il y a de bonnes chances que le caractère soit inséré : plutôt que m'adresser directement au working group, sur la suggestion d'un ami j'ai confié le combat à une experte en typographie mathématique qui m'a répondu que : the unicode technical committee has accepted the principle that math notation is open-ended, so they are receptive to well-documented submissions of new symbols. your informants are correct that, at present, i'm the "fast track" entry point to the system, and that will probably continue for several more years.

Nous allons donc maintenant voir combien de temps il faudra pour que ce caractère apparaisse dans une version ultérieure du standard. (Il ne faut jamais perdre espoir, avec Unicode : la première proposition d'encoder les hiéroglyphes date de 1999, maintenant c'est quasiment acquis, au moins pour la partie la plus basique, mais il faut encore attendre la sortie de la prochaine version, donc ça aura pris environ dix ans.)

(samedi)

Comment tirer des bosons d'une urne ?

Un classique des cours élémentaires de probabilités : on a trois cartes de même forme, l'une ayant deux faces noires, la deuxième ayant une face noire et une rouge, la troisième ayant deux faces rouges. (Les trois cartes, et les deux faces d'une carte, sont indiscernables sauf par leur couleur.) On mélange les cartes sans les regarder, on en tire une au hasard et, toujours sans la regarder, on la pose sur la table (une face aléatoire étant visible, donc, l'autre étant cachée). On observe que la face visible est rouge (pour que ce soit bien clair : si ce n'est pas le cas, on recommence le mélange depuis le début, et on répète autant de fois que nécessaire jusqu'à ce que ça soit le cas). Quelle est la probabilité que la face opposée soit également rouge ?

Autrement dit, si on tire une carte et une face au hasard et qu'on sait que cette face est rouge, quelle est la probabilité que la carte tirée soit la carte rouge-rouge ?

La plupart des gens (enfin, ceux qui ont une réponse à la question) répondent 1/2 suivant le raisonnement suivant : la carte noire-noire est exclue, il ne reste que deux possibilités, la carte rouge-noire et la carte rouge-rouge, et comme tout ce qu'on sait est qu'il y a une face rouge, ces deux prossibilités sont équiprobables, donc la probabilité d'avoir affaire à la carte rouge-rouge est 1/2. Ce raisonnement est faux, parce que l'événement connu n'est pas la carte a une face rouge mais bien la face que j'ai tirée au hasard est rouge : la probabilité recherchée n'est pas 1/2.

L'avantage de cette présentation avec trois cartes (sur d'autres avec des jeux télévisés et des portes au trésor, ou variantes du même acabit) est qu'on peut facilement mener l'expérience soi-même, ce que le lecteur incrédule est donc invité à faire : prendre trois papiers symétriques et indiscernables au toucher, marquer l'un d'un signe noir sur chaque côté, le deuxième d'un rouge sur un côté et d'un noir sur l'autre, et le troisième d'un rouge sur chaque côté, mélanger les papiers dans le dos et en tirer un au hasard dont on regardera seulement un côté choisi au hasard — si ce côté n'est pas rouge, recommencer complètement le mélange des trois papiers — s'il est rouge, regarder l'autre côté et en noter la couleur pour faire des statistiques dessus ; au bout de quelque chose comme 100 couleurs enregistrées, on devrait s'apercevoir assez nettement que le rouge pour la face opposée est nettement plus probable, deux fois plus probable même, que le noir.

La bonne réponse est 2/3 (on s'en sera convaincu soit par l'expérience proposée ci-dessus, soit par un raisonnement correct, qui est de dire que sur les six faces tirables au hasard on en autorisé les trois rouges, et que deux d'entre elles ont une face rouge de l'autre côté).

Ce qui est étonnant, donc, c'est que si je sais la face que j'ai tirée est rouge alors j'ai deux chances sur trois d'avoir affaire à la carte rouge-rouge, et par symétrie, si je sais (seulement) l'autre face est rouge j'ai aussi deux chances sur trois d'avoir affaire à la carte rouge-rouge, en revanche si je sais l'une des deux faces est rouge (i.e., ma carte n'est pas la carte noire-noire), alors j'ai seulement une chance sur deux d'avoir affaire à la carte rouge-rouge (là aussi, on peut facilement faire l'expérience : si on rejette la carte noire-noire, on tombe une fois sur deux sur la carte noire-rouge et une fois sur deux sur la carte rouge-rouge, mais bon, c'est tout à fait évident).


Ce grand classique étant rappelé, je peux le voir à l'envers. Imaginons que je cherche à réaliser une carte à jouer dont chacune des deux faces puisse être soit noire soit rouge, de sorte que chacue face prise individuellement ait une chance sur deux d'être rouge et une chance sur deux d'être noire, et qu'au final la carte ait une chance sur trois d'être noire-noire, une chance sur trois d'être rouge-noire, et une chance sur trois d'etre rouge-rouge (au lieux de une chance sur deux d'être rouge-noire et une chance sur quatre pour chacun de rouge-rouge et noir-noir, ce qui arriverait si on tirait la couleur de chaque face aléatoirement et uniformément). D'après ce que je viens de dire, c'est facile : il suffit de choisir au hasard la couleur de la première face (rouge ou noir, une chance sur deux pour chaque couleur), puis choisir la couleur de la seconde face en lui donnant deux fois plus de chances d'être de la même couleur que la première face.

Ce procédé se généralise. Imaginons que j'aie à choisir 1000 nombres entre 1 et 2000 (pensez 1000 particules à mettre dans 2000 boîtes, ou quelque chose comme ça). Il y a trois façons très naturelles de faire le tirage (si, si, croyez-moi, elles sont naturelles et elles apparaissent à plein d'endroits en maths, en physique, ou même dans d'autres domaines comme la crypto) :

Si vous n'aimez pas ma description du tirage de Bose-Einstein, il existe une autre façon de faire la même chose. Pour tirer 1000 nombres entre 1 et 2000 façon Bose-Einstein, je commence par tirer 1000 nombres entre 1 et 2999 façon Fermi-Dirac (donc tous distincts !), et je les trie par ordre croissant ; le plus petit nombre bosonique sera égal au plus petit nombre fermionique, le second nombre bosonique sera égal au deuxième plus petit fermionique moins un (il peut très bien être égal au précédent, du coup), le troisième nombre bosonique sera égal au troisième plus petit fermionique moins deux, et ainsi de suite jusqu'au plus grand nombre bosonique, qui sera égal au plus grand nombre fermionique moins 999.

Si vous voulez voir les choses différemment, vous avez une urne avec 2000 boules numérotées entre 1 et 2000. Dans le tirage de Maxwell-Boltzmann, vous tirez une boule au hasard, vous notez son numéro et vous la remettez dans l'urne, puis vous recommencez un tirage. Dans le tirage de Fermi-Dirac, vous tirez une boule au hasard et vous ne la remettez pas dans l'urne (donc tous les numéros tirés seront différents, évidemment, et on ne peut pas tirer plus de boules qu'il y en a dans l'urne). Dans le tirage de Bose-Einstein, c'est un peu étrange, dès qu'on tire une boule, non seulement on la remet dans l'urne, mais même on y ajoute encore une autre copie identique de la même boule.

Qu'est-ce que ces systèmes de tirage ont d'intéressant ?

Le tirage de Maxwell-Boltzmann est sans doute le plus naturel, mais supposons qu'on regarde juste la répartition des nombres tirés (c'est-à-dire non pas quel nombre a été tiré en premier, lequel en second, etc., mais plutôt combien de fois le nombre 1 a été tiré, combien de fois le 2, combien de fois le 3, etc.), cette répartition suit une distribution multinomiale (équilibrée), donc en moyenne si on tire k nombres parmi N, chaque nombre va être tiré k/N fois (dans mon exemple avec k=1000 et N=2000, cela va faire 1/2 fois), et il serait beaucoup plus improbable que, par exemple, le nombre 1729 fût choisi 2000 fois (et les 1999 autres nombres jamais) que, par exemple, chaque nombre impair fût choisi exactement une fois (je ne dis pas que ce serait très probable non plus que les nombres choisis fussent exactement les nombres pairs !, il y a environ une chance sur 3×10733 que ça arrive, mais ce serait tout de même 4×102567 fois plus probable que d'avoir 2000 fois le nombre 1729, cette dernière occurrence ayant une probabilité de un sur 103301).

Le tirage de Fermi-Dirac, je n'ai pas grand-chose à en dire : il tire un sous-ensemble de k nombres (c'est-à-dire, tous distincts) parmi les N, et chacun des sous-ensembles possibles sont également probables (dans mon exemple de k=1000 et N=2000, il y a par exemple une chance sur 2×10600 de tirer exactement les nombres impairs). Dans le cas où le tirage de Maxwell-Boltzmann a le bon goût de tirer des nombres tous différents, il n'y a pas de différence avec un tirage de Fermi-Dirac (mais c'est une hypothèse audacieuse si k n'est pas petit par apport à √N : dans mon exemple de k=1000 et N=2000, il y a une chance sur 1.3×10133 pour que les 1000 nombres tirés au hasard entre 1 et 2000 soient tous distincts).

Le tirage de Bose-Einstein, il a, lui, pour propriété que chacune des distributions de nombres est également probable. Donc, si vous tirez k=1000 nombres entre 1 et N=2000, vous avez exactement autant de chances (une chance sur 2×10827) d'avoir tiré 1000 fois le nombre 1729 que d'avoir tiré précisément tous les nombres impairs. Pour en revenir avec mes cartes, donc, si vous voulez avoir une chance sur trois d'avoir une carte noire-noire, une chance sur trois d'avoir une rouge-noire, et une chance sur trois d'avoir une rouge-rouge, vous tirez, de fait, les couleurs des deux faces de la carte selon un tirage de Bose-Einstein et nom de Maxwell-Boltzmann (d'où le « paradoxe » du début de cette entrée).

Par exemple, le tirage de Bose-Einstein pourrait être utile pour réaliser des QCM : si vous voulez donner à des étudiants un QCM avec 200 questions étiquetées A, B, C ou D, et que vous comptez noter le test en demandant juste combien de A, de B, de C et de D l'étudiant a choisi, on ne veut certainement pas tirer la permutation (donc la lettre correcte) à chaque question selon un tirage de Maxwell-Boltzmann (ce qui serait le plus naturel), sinon il serait trop tentant de répondre 50 réponses A, 50 B, 50 C et 50 D pour espérer ne pas être loin de la vérité — il faut tirer 200 lettres justes parmi {A,B,C,D} avec un tirage de Bose-Einstein, comme ça toutes les répartitions des décomptes des quatre lettres seront équiprobables.

Le rapport avec la physique, maintenant ? Si vous avez 2000 boîtes et que vous balancez 1000 particules distinctes/discernables dedans (en admettant qu'il existe 1000 particules discernables…), vous obtenez une distribution de Maxwell-Boltzmann (chaque particule, indépendamment des autres, va dans une des 2000 boîtes possibles). Par contre, si les particules sont identiques et interchangeables au sens de la mécanique quantique, cela dépend du type de particules : si ce sont des fermions comme des électrons ou des atomes d'hélium 3, alors on obtient un tirage de Fermi-Dirac (et en particulier, deux particules n'iront jamais dans la même boîte, cela s'appelle le principe d'exclusion de Pauli), tandis que si ce sont des bosons comme des photons ou des atomes d'hélium 4, alors on obtient un tirage de Bose-Einstein. Évidemment, mon explication avec des boîtes est foireux (une boîte est une mauvaise façon d'expliquer un état quantique), mais l'idée est là, et le phénomène physique est très important, la condensation de Bose-Einstein et la répulsion par phénomène d'exclusion de Pauli s'observant tous deux à l'échelle macroscopique (par exemple par la superfluidité de l'hélium 4 à basse température et par le fait que les naines blanches se soutiennent par pression de dégénérescence des électrons).

(mardi)

Ensemble de Mandelbrot : programme, images fixes, vidéo nº2

Pour satisfaire la promesse que j'avais faite la semaine dernière, le programme que j'ai écrit pour calculer des vues de l'ensemble de Mandelbrot est maintenant disponible ici (j'en ai profité pour rafraîchir très sérieusement cette page listant mes programmes : peut-être qu'il y aura d'autres choses qui intéresseront les gens). Pour ceux qui veulent juste voir des jolies images, j'ai mis quelques vues fixes sur flickr, et j'ai créé une deuxième vidéo (de nouveau, il y en a une version de haute qualité, de 44Mo, téléchargeable par BitTorrent[#] en suivant ce lien — où vous pouvez retirer le .torrent final si BitTorrent ne vous est pas possible — et une version exécrable sur YouTube ; par ailleurs, comme je le disais dimanche, j'ai réencodé les vidéos pour avoir quelque chose que j'espère de meilleure qualité et d'ailleurs légèrement plus petit).

[#] J'ai d'ailleurs peut-être un problème avec mes torrents : il est censé y avoir deux seeds (semences ? graines ?), mais certains clients BitTorrent n'en voient qu'une, ou prennent un certain temps à voir la seconde. Je ne sais pas ce qui se passe.

(mardi)

Zoom dans l'ensemble de Mandelbrot

[Zoom dans l'ensemble de Mandelbrot]Ça faisait longtemps que je rêvais de faire une belle vidéo de zoom dans l'ensemble de Mandelbrot[#], mon poussinet m'a redonné cette envie en jouant avec Fraqtive (j'en parlais la semaine dernière) : me voilà enfin satisfait à ce sujet. Pour l'instant, vous ne pourrez voir de la vidéo en question que la version sur YouTube (ma première vidéo YouTube !), qui est d'une qualité épouvantablement exécrable[#2] (enfin, vous avez le choix entre la qualité normale, qui est épouvantablement exécrable, et la « haute » qualité, qui est seulement lamentablement exécrable), mais je promets de publier prochainement (1) la vidéo en haute qualité (ou en tout cas, beaucoup plus haute que ça), (2) le programme qui a servi à la calculer et peut-être (3) quelques petites notes de vulgarisation sur ce qu'est l'ensemble de Mandelbrot. Mais là je n'ai pas le temps.

Mise à jour (2008-12-16T17:35+0100) : J'ai uploadé la vidéo de haute qualité (64Mo pour 4′14″ en 640×480, 25fps) : vous pouvez la télécharger (en utilisant BitTorrent, BitTornado, Azureus ou un autre client de ce genre) en suivant ce lien (il s'aggit d'un petit fichier .torrent que vous passez ensuite à votre client BitTorrent pour qu'il récupère le tout). Pour ceux qui n'arrivent pas à utiliser BitTorrent ou équivalent (par exemple parce que vous êtes à la merci d'un administrateur réseau crétin qui croit que ça ne sert qu'à diffuser des contenus « piratés »), vous pouvez récupérer directement le .avi en effaçant l'extension .torrent du lien précédent (je fais exprès de ne pas faire un lien direct, parce que je veux m'assurer que les gens ne cliquent pas sans réfléchir).

[#] Vous me direz que ça manque pathétiquement d'originalité (il suffit de regarder le nombre de vidéos de ce genre déjà sur YouTube). Je dois bien reconnaître que c'est vrai ; mais mon amour-propre me poussera à prétendre, avec un tantinet de mauvaise foi, que ma vidéo à moi elle est — aux artefacts de compression près — beaucoup plus belle que toutes les autres : certes, elle ne vas pas aussi loin que certaines (il y en a une sur YouTube qui va à une magnification de 101000, et qui est d'ailleurs rigoureusement sans intérêt), mais elle montre plus de variété dans l'ensemble puisque j'ai judicieusement choisi le point autour duquel zoomer. (Par exemple, pour trouver des points intéressants, il faut résister à la tentation de descendre dans les spirales de ce qu'on appelle les points de Misiurewicz, qui n'apportent aucun motif nouveau mais seulement des itérations en plus dans les calculs.) Sinon, pour ce qui est de la musique, ce n'est peut-être pas ce que j'aurais mis idéalement, mais je voulais un enregistrement dans le domaine public (l'ensemble de Mandelbrot l'est forcément, puisqu'il est une pure construction mathématique, et ç'aurait été dommage que la seule musique apporte un copyright à la vidéo), et ce n'est pas évident à trouver.

[#2] J'en suis d'ailleurs un peu contrarié : YouTube fournit des explications sur les formats à utiliser, que j'ai suivies scrupuleusement (codec H.264, résolution 640×360, audio MP3, 30 images par seconde), en me disant que peut-être comme ça ils n'auraient pas à réencoder la vidéo, et évidemment, ça n'a pas manqué… Ils m'auraient donné une borne sur le débit, j'aurais peut-être pu produire un truc de meilleur qualité qu'eux avec cette contrainte !

(vendredi)

Une nouvelle soumission au Sloane

Je viens de soumettre à l'encyclopédie des suites d'entiers la séquence :

0, 0, 1, 1, 3, 2, 9, 9, 23, 29, 89, 72, 315, 375, 899, 1031, 3855, 3886

Pour ceux qui s'amuseraient à chercher ce que ça peut être avant que Sloane la valide (ou la rejette s'il trouve ça sans intérêt), voici trois indications : corps fini à 2n éléments • éléments primitifs • trace.

(samedi)

Solides réguliers en quatre dimensions

On me signale un magnifique film de vulgarisation mathématique, en neuf parties : Dimensions, par Jos Leys, Étienne Ghys et Aurélien Alvarez[#] (téléchargeable[#2] et redistribuable sous licence Creative Commons by-nc-nd 3.0, et également commandable en DVD) ; il s'agit, notamment, d'essayer de donner une idée compréhensible par le grand public de ce à quoi la quatrième dimension (et les solides réguliers en dimension 4) preuvent ressembler, ainsi que d'autres choses (comme les transformations conformes du plan, les fractales…). C'est tellement rare de voir de la bonne vulgarisation mathématique qu'il faut vraiment signaler celui-ci.

Il y a six solides réguliers en dimension 4[#3] : c'est d'autant plus remarquable que pour toutes les dimensions à partir de 5 il n'y en a plus que trois (le simplexe, l'hypercube et le dual de ce dernier), et que si chacun des solides réguliers en dimension 3 a une généralisation naturelle en dimension 4 (tétraèdre→simplexe=5-cellule ; cube→hypercube=tesseract ; octaèdre→16-cellule ; dodécaèdre→120-cellule ; icosaèdre→600-cellule), il y en a un supplémentaire, le 24-cellule (formé de 24 octaèdres assemblés de façon complètement régulière), véritablement exceptionnel[#4], qui n'a pas d'analogue en dimension 3. Bref, la dimension 4 est la plus fertile en solides réguliers.

Je pense que la meilleure façon[#5] de visualiser les solides réguliers en dimension 4 — qui est proche[#6] mais pas identique à une de celles utilisée dans le film, à savoir la projection stéréographique — consiste à les mettre sur la 3-sphère (S3), et à voir celle-ci comme un espace courbe de dimension 3, et à faire du raytracing dans cet espace courbe. J'avais proposé ça il y a longtemps, mais je n'ai jamais eu la patience de faire. D'ailleurs, la raison pour laquelle ils n'ont pas fait ce que je propose dans le film, c'est probablement que ça oblige à mettre à la poubelle les outils comme Povray.

Quoi qu'il en soit, j'espère que ce film aura une large diffusion : si ça peut susciter des vocations, notamment.

[#] Je ne connais pas les autres auteurs, mais Étienne Ghys, qui semble avoir écrit le scénario de la partie proprement mathématique, est quelqu'un d'absolument impressionnant par sa culture mathématique (le genre qui est capable d'écouter parler un mathématicien de n'importe quel domaine et de poser des questions intelligentes après).

[#2] Enfin, si ce n'est qu'au moment où j'écris (2008-06-21T21:45+0200) le site est indisponible pour le téléchargement. (C'est de nouveau disponible.) Si on ne s'était pas tellement occupé de faire interdire autant que possible les protocoles de torrent ou de pair-à-pair (par exemple dans les universités et lieux de recherche), on se serait rendu compte qu'ils sont aussi drôlement utiles dans ce genre de cas pour distribuer des contenus légaux sans avoir un point d'échec systématique à cause des capacités des serveurs. En l'occurrence, je pressens que la vidéo va certainement fasciner les joyeux mutants de BoingBoing et les foules nerdesques de Slashdot quand ces deux sites s'en seront emparés, ce qui ne manquera pas d'arriver, donc il serait bon d'avoir un bittorrent d'ici là. (J'en aurais bien lancé un, mais malheureusement j'ai bêtement effacé les fichiers .zip une fois téléchargés.)

[#3] Le film dont je parle ne mentionne que cinq d'entre eux (sans doute par manque de temps ou de patience et parce que celui qu'ils ont omis — le 16-cellule qui généralise l'octaèdre — n'est ni le plus simple à comprendre ni le plus impressionnant ni le plus beau).

[#4] Il est fortement lié au système de racines exceptionnel de type F4, un de ces bijoux de symétrie qui existent dans le paradis mathématique, qu'on sait prédire et démontrer mais dont je ne pense pas qu'on puisse vraiment les expliquer. On peut cependant faire remarquer que le centre d'un hypercube (en dimension 4) est à la même distance des sommets que les sommets sont entre eux, ce qui laisse soupçonner que si on prend seize hypercubes se touchant en un sommet, les seize centres des hypercubes et les huit sommets adjacents dans les huit directions vont, tous ensemble, former quelque chose de joli : de fait…

[#5] Ce qui est certain est que la moins bonne façon de visualiser les solides réguliers est par sections successives, comme c'est d'ailleurs bien expliqué dans le film : c'est joli, mais ça n'aide vraiment pas à se faire une idée de l'objet. D'ailleurs, c'est un test terrible pour se rendre compte si on voit en quatre dimensions : Y a-t-il une section (hyperplane) de l'hypercube qui soit une pyramide à base quadrilatérale ?

[#6] La différence essentielle avec la projection stéréographique, c'est que les rayons de lumière qu'on utilise pour la projection, ils suivent eux-mêmes des géodésiques (i.e., des grands cercles sur S3) : du coup, on a beaucoup moins de degrés de liberté pour montrer l'objet, on peut seulement se balader dedans et tourner, c'est la même chose que de faire tourner l'objet en 4D, alors que si on prend la projection stéréographique comme ils font dans le film ça donne deux effets différents, du coup c'est un peu plus dur à visualiser. Par contre, la vision en espace courbe dont je parle a la propriété que le solide paraît infini dans toutes les directions (en fait c'est simplement qu'il y a des rayons qui reviennent après avoir fait le tour de la sphère) : il convient donc d'ajouter des marqueurs pour différencier une (ou un certain nombre de) face.

(mercredi)

Platonisme et mathématiques

Une assez longue réflexion en philosophie des mathématiques, que j'ai écrite dans un mail à un ami, et qui me semble suffisamment intéressante pour reproduire ici : il s'agit d'éclaircir un peu la question de savoir quel sens est-ce que ça a de qualifier un énoncé mathématique de vrai ou faux ?, i.e., dans quelle mesure les objets mathématiques existent-ils ? Et notamment : pourquoi est-ce qu'on sera généralement d'accord pour attribuer la valeur de vérité vraie à l'énoncé 252097800623 est un nombre premier mais qu'on sera beaucoup plus sceptique quant au fait que l'hypothèse du continu ait vraiment un sens dans le monde réel ?

On peut établir une hiérarchie dans laquelle s'inscrivent un certain nombre d'énoncés mathématiques (mais pas tous !) en fonction de la complexité de leurs quantificateurs. (Je crois que cette hiérarchie est due, sous une forme ou une autre, à Stephen Kleene et Azriel Lévy, mais je ne sais pas exactement quelles sont les contributions de l'un et de l'autre. Il en existe un certain nombre de variantes, arithmétiques ou ensemblistes : la variante qui suit est clairement du côté arithmétique d'ordre supérieur si on doit la qualifier plus précisément : ce que j'appellerai un énoncé Πn c'est précisément un énoncé arithmétique Πn.)

Tout en bas de la hiérarchie, il y a les énoncés et prédicats qu'on peut indifféremment appeler Σ0, Π0 ou Δ0. Il s'agit des affirmations dont tous les quantificateurs portent sur les entiers naturels et sont, de surcroît, bornés, ou gardés, c'est-à-dire sont de la forme il existe un n inférieur à t ou pour tout n inférieur à t avec t un terme en les variables libres à ce point-là (disons que le terme peut faire intervenir l'addition, la multiplication et l'exponentiation des entiers, ou peut-être n'importe quelle fonction primitive récursive, pour ce que je vais dire ce n'est pas important).

Par exemple, l'entier formé par les 10000000000 premières décimales de pi en base 10 est un nombre premier peut s'écrire sous la forme d'un énoncé Δ0 (modulo un tout petit peu de travail sur les écritures, i.e., l'implémentation d'un algorithme qui calcule pi). L'essentiel est que quand on a affaire à une telle affirmation, on peut la tester, de façon algorithmique, en temps fini, avec terminaison garantie (pour chaque valeur des variables libres, s'il y en a) : pour les connecteurs propositionnels c'est clair, et pour les quantificateurs, comme ils sont bornés, on n'a jamais qu'un nombre fini de cas à tester ; pour la même raison, un énoncé Δ0 n'est jamais indécidable. Ça c'est ce qui est censé justifier que, philosophiquement, à peu près tout le monde conviendra qu'il y a bien un sens à dire si un tel énoncé est vrai ou faux — il suffit d'essayer. Évidemment, comme les opinions philosophiques des gens sont très variés, il y aura des ultra-finitistes purs et durs pour me dire que d'après eux, non, ça n'a pas de sens de se demander si l'entier formé par les 10↑(10↑(10↑(10↑10))) premières décimales de pi est premier ou non, s'il est complètement inconcevable de tester aussi loin : j'appellerai ces gens des (0,0)-platoniciens (i.e., pas du tout platoniciens) ; les autres sont au moins (0,1)-platoniciens.

Juste au-delà des énoncés (et prédicats) Δ0, il y a les énoncés (et prédicats) Σ1 et Π1. Les premiers sont formés en ajoutant devant un prédicat Δ0 un quantificateur existentiel portant sur les entiers naturels, alors que les seconds ajoutent un quantificateur universel. En fait, il est assez facile de voir (en utilisant un codage des k-uplets d'entiers par des entiers) qu'on peut se permettre d'ajouter un nombre fini de quantificateurs de même nature pour le même prix. Bien sûr, la négation d'un énoncé Σ1 est Π1, donc pour ce qui est de donner une valeur de vérité on peut ne regarder qu'un d'entre eux.

Un énoncé Π1 peut être réfuté par la donnée d'un contre-exemple ; en revanche, il risque de ne jamais pouvoir être confirmé de façon certaine : en effet, il y a des énoncés Π1 qui sont indécidables (l'exemple typique étant le système T [le système qui m'intéresse et dans lequel je travaille : Peano, ZFC, que sais-je encore…] est consistant, i.e., il n'existe pas de preuve de Faux dedans, ce qui est un énoncé arithmétique Π1 comme on s'en convainc facilement, et dont Gödel nous dit qu'il n'est pas démontrable s'il est vrai). En fait, ils sont tous équivalents à un énoncé du type la machine de Turing explicitement donnée par le programme suivant <…> va tourner sans jamais s'arrêter (par exemple une machine de Turing qui cherche une démonstration de 0=1). Pourtant, philosophiquement, on peut être d'accord qu'ils ont une valeur de vérité (dans le vrai monde, je veux dire) sur la base d'une hypothèse de pensée du genre je laisse tourner indéfiniment la machine de Turing, ce qui a un sens, et ça a donc bien un sens de se demander si elle s'arrêtera un jour, ou pas. (Tout le monde ne sera pas d'accord, évidemment.)

Beaucoup d'énoncés mathématiques importants sont arithmétiques Π1 comme je viens de le décrire : la conjecture de Goldbach, par exemple, ou le théorème de Fermat, ou encore l'hypothèse de Riemann (c'est moins évident pour cette dernière, mais on peut encore la mettre sous cette forme). Un énoncé de la forme telle variété algébrique (définie explicitement sur ℤ) a un point entier/rationnel est Σ1 (et Matiyasevich a montré, en gros, qu'on peut toujours ramener un énoncé Σ1 à cette forme dans le cas entier). De façon importante, aussi, tous les énoncés du type telle affirmation est démontrable ou telle affirmation est réfutable sont Σ1 ; et, du coup, Peano est consistant ou ZFC est consistant sont Π1 : il est important de souligner que, même si ZFC parle d'ensembles, l'affirmation de sa consistance est un énoncé purement arithmétique, et Π1 de surcroît. Et par ailleurs on peut aussi souligner que, en parlant d'ensembles, ZFC permet de démontrer des énoncés arithmétiques Π1 (du style Peano est consistant) que des systèmes plus faibles (Peano, en l'occurrence) ne démontrent pas. Comme beaucoup de mathématiciens seront d'accord que la question de savoir si <truc> est un théorème a un sens, on peut en conclure qu'ils sont au moins d'accord que les énoncés arithmétiques Σ1 et Π1 ont une valeur de vérité : on peut donc les qualifier de (0,2)-platoniciens.

Il y a aussi les Δ1 dans l'histoire : ce sont ceux qui peuvent s'écrire à la fois comme un Π1 et comme un Σ1, avec une démonstration de l'équivalence (il faut considérer que cette démonstration fait partie de la donnée de l'énoncé, pour pouvoir le qualifier de Δ1, parce que sinon il existe une démonstration… ça va rendre le truc Σ1, ce qui n'est pas bien). De beaucoup de points de vue, on peut considérer qu'un Δ1 c'est aussi bien qu'un Δ0 : en tout cas c'est finiment testable, puisqu'on essaie en parallèle de démontrer le Σ1 et de réfuter le Π1 et on est sûr que l'un d'entre eux terminera en temps fini.

Un énoncé ou prédicat Πn+1 en général se forme en ajoutant un quantificateur universel (ou un nombre fini d'entre eux) devant un prédicat Σn, et un énoncé ou prédicat Σn+1 avec un quantificateur existentiel devant un prédicat Πn. Tous ces quantificateurs portent toujours sur les entiers, pour l'instant : il s'agit d'affirmations arithmétiques du premier ordre. Bien sûr, un énoncé Δn c'est un énoncé qui peut se mettre sous la forme Πn et Σn à la fois ; et je dirai qu'un mathématicien est au moins (0,n+1)-platonicien s'il admet que les énoncés Πn ont une valeur de vérité bien définie.

Par exemple, un Π2, il va dire que pour tout x il existe y tel que (une certaine propriété testable de x et de y) : c'est difficile à réfuter (il faut exhiber un x avec une démonstration du fait que pour chaque y ça ne marche pas) et encore plus difficile à prouver ; donc là j'ai encore plus de mal à justifier philosophiquement que ça a bien un sens de dire si c'est vrai ou faux. Néanmoins, si on a concédé que les énoncés Π1 et Σ1 sont toujours soit vrais soit faux, on peut encore admettre quelque chose sur les Π2 (et Σ2), avec une expérience de pensée du style : je lance une machine qui va tester tous les x et, pour chaque x, examiner tous les y — et à la fin des temps je verrai bien si elle a parcouru tous les x (auquel cas mon énoncé Π2 est vrai) ou si elle est restée bloquée indéfiniment sur l'un d'entre eux (auquel cas l'énoncé est faux, cet x donnant un contre-exemple pour lequel il n'existe pas de y).

Exemples d'énoncés mathématiques Π2 : toute suite finie de chiffres se trouve quelque part dans l'écriture décimale de pi ; ou encore : P n'est pas égal à NP (qu'on peut voir sous la forme il n'existe pas un algorithme et une borne polynomiale telle que l'algorithme résolve tout instance de SAT en temps donné par cette borne). Si on convient qu'un tel énoncé a un sens, on est au moins (0,3)-platoniciens (j'ai décalé les indices de 1 pour convenir qu'un (0,0)-platonicien est quelqu'un qui n'admet même pas les énoncés Δ0). Je pense que beaucoup de mathématiciens seront encore dans ce cas. Quant à l'énoncé il n'existe pas d'algorithme permettant de dire si une variété algébrique (définie sur ℚ) admet ou non un point ℚ-rationnel, il est Π3 si je ne m'abuse (pour toute algorithme il existe une variété telle que pour tout M l'algorithme ne finit pas en temps M et la variété n'a pas non plus de point de hauteur <M).

Une façon de voir la valeur de vérité d'un énoncé Πn, c'est de considérer le jeu suivant à deux joueur : Forall cherche à réfuter l'énoncé, et Exists cherche à le confirmer. Le jeu n'a que n coups (c'est un jeu fini), Forall joue en premier en donnant un entier naturel, Exists réplique avec un entier naturel, et ainsi de suite sur n coups ; à la fin, on substitue ces entiers naturels aux n variables alternativement quantifiées par l'énoncé, et si le résultat (qui est finiment testable car Δ0) est faux, Forall a gagné, sinon c'est Exists. La vérité de l'énoncé est équivalente à l'affirmation que Exists possède une stratégie gagnante, et sa fausseté au fait que Forall en a une. Donc si on admet le principe que tout jeu fini de la sorte a une stratégie gagnante, alors on admet l'idée que tout énoncé arithmétique du premier ordre a une valeur de vérité.

Une autre façon de voir les choses est de dire : si j'ai un Oracle qui me permet de décider si une machine de Turing s'arrête (donc si j'admets la possibilité conceptuelle d'un tel Oracle) alors je peux réfuter un énoncé Π2 en utilisant cet Oracle dans une machine de Turing ; si j'ai un Oracle, encore plus puissant, qui me permet de décider si une machine de Turing pouvant faire appel au premier Oracle s'arrête, alors je peux réfuter un énoncé Π3, etc. Si j'admets que tous ces Oracles ont un sens, alors j'admets que tout énoncé arithmétique du premier ordre a une valeur de vérité.

Quelqu'un qui admet que tout énoncé arithmétique du premier ordre (i.e., Πn pour n'importe quel n) a une valeur de vérité, je vais le qualifier de (1,0)-platonicien (ou (1,1)-platonicien, ma numérotation étant un peu malheureuse). Personnellement je crois être (1,0)-platonicien et je ne suis pas persuadé d'être plus. Mais je vais expliquer ce que ce plus signifie.

Pour ça, il faut passer aux énoncés d'ordre supérieur, c'est-à-dire, admettant des quantificateurs non plus seulement sur les entiers naturels mais aussi sur les parties de ℕ. Je dirai qu'un énoncé est Δ10 s'il est Πn (=Π0n) ou Σn (=Σ0n) pour un certain n ; je dirai qu'un énoncé est Σ11 s'il s'obtient à partir d'un énoncé Δ10 (resp. Π10) par ajout d'un quantificateur existentiel (resp. universel) portant sur les parties de ℕ (ou sur les nombres réels, ou sur les suites d'entiers, ça revient au même). On aura deviné ce qu'est un énoncé Σ1n ou Π1n en général : quelqu'un qui croît que de tels énoncés sont vrais ou faux sera dit (1,n+1)-platonicien. Tous ces énoncés s'appellent énoncés arithmétiques du second ordre (par opposition à ceux qui n'avaient que des quantifications sur les entiers naturels et qui sont dits arithmétiques du premier ordre).

Exemple d'énoncé mathématique Π13 : si B est un borélien de ℝ, alors le jeu à deux joueurs où chaque joueur choisit tour à tour une décimale d'un réel, et où (au bout d'un temps infini) le premier joueur gagne si le réel ainsi formé appartient à B et l'autre joueur s'il n'y appartient pas, [ce jeu] admet forcément une stratégie gagnante pour un des deux joueurs. (Il s'agit du théorème de détermination borélienne : c'est un théorème de ZFC, par ailleurs difficile. La raison pour laquelle c'est bien un énoncé Π13 c'est qu'on peut coder les boréliens de ℝ comme des suites d'entiers, ainsi que les stratégies gagnantes, ou la suite des coups joués par un des deux joueurs.) Si on remplace borélien par analytique (i.e., image d'un ensemble borélien par une fonction continue, ce qui peut toujours se coder avec des suites d'entiers), alors l'énoncé résulte d'hypothèses de grands cardinaux qui dépassent ZFC (l'existence de x pour tout réel x). Un (1,4)-platonicien devra penser que cet énoncé est soit vrai soit faux : pour ma part, je commence à être sceptique sur le fait que ça ait vraiment un sens.

Le problème avec les parties de ℕ, c'est qu'on ne sait pas exactement ce qu'elles sont, on ne peut pas les déterminer complètement comme un entier naturel. (Kronecker : Die ganzen Zahlen hat der liebe Gott gemacht, alles andere ist Menschenwerk.) Je peux certes imaginer de reprendre mon jeu à deux joueur (Forall et Exists) et imaginer que ces joueurs échangent non plus des entiers naturels mais des Oracles qui permettent de savoir si un entier naturel est ou n'est pas dans la partie en question, mais je trouve que ça devient philosophiquement fumeux dans la mesure où chacun doit avoir le droit de poser un nombre infini de questions à n'importe quel Oracle choisi antérieurement, et de se décider en fonction de ça. Or peut-être qu'il y a dans l'univers une certaine limitation sur ce qu'un Oracle peut dire ou sur la façon dont on peut l'interroger, et cette limitation va affecter la notion de vérité pour les énoncés d'ordre supérieur.

En fait, voici un énoncé Σ11, qui est un théorème de ZFC, et qui commence déjà à montrer la subtilité : il existe une partie de ℕ qui code la vérité des énoncés arithmétiques du premier ordre (tel quel ce n'est pas un énoncé mathématique correctement formalisé, mais il le devient si on le code comme ceci : il existe une partie de qui contient les codes de tous les énoncés Δ0 vrais [ça ça ne pose pas de problème à définir, il y a même une définition Δ1 uniforme] et aucun code d'un énoncé Δ0 faux, et elle contient le code d'un énoncé pour tout x <machin> ssi elle contient le code de <machin> avec n remplacé pour x, pour tout n, et pareil pour il existe). On voit qu'admettre la vérité d'un tel énoncé c'est non seulement admettre qu'un énoncé arithmétique du premier ordre a toujours une valeur de vérité bien définie, mais aussi qu'on puisse s'en servir pour former une partie de ℕ : comme la verité des énoncés arithmétiques du premier ordre n'est certainement pas définissable par un prédicat arithmétique du premier ordre (il n'existe pas de prédicat P arithmétique du premier ordre tel que P(‹Q›) ⇒ Q dès que ‹Q› est le code d'un énoncé Q arithmétique du premier ordre), admettre l'existence d'une telle partie c'est déjà dépasser substantiellement ce que permet l'arithmétique du premier ordre. Maintenant, dans ZFC c'est un théorème (à peu près évident), mais il y a des théories suffisantes pour faire à peu près toutes les maths envisageables et dans lesquelles un tel énoncé est inaccessible. Bref, si je suis (1,0)-platonicien (ce qui est pareil que (1,1), en fait, avec ma convention), je ne suis pas certain d'être (1,2)-platonicien.

Évidemment, on peut aller au-delà et admettre des quantifications sur les parties de parties de ℕ (i.e., les parties de ℝ). Un énoncé Σ21 admet un quantificateur existentiel portant sur les parties de parties de ℕ devant n'importel quel énoncé Π1n (pour un n quelconque). L'hypothèse du continu, par exemple, est un énoncé Π22. Pour ma part, je ne pense pas que ça ait beaucoup de sens de se demander si elle est vraie ou fausse : je pense que c'est plus une question de convention sur ce qu'on veut admettre comme ensembles. (Et on est généralement d'accord que pour les ensembles les plus sympathiques et/ou naturels, l'hypothèse du continu est violemment fausse.) Enfin, il y a des énoncés de ZFC qui ne se laissent pas réécrire comme des énoncés de l'arithmétique d'ordre supérieur (ce que j'ai défini) : par exemple, il existe un cardinal inaccessible ne peut pas se décrire[#] comme Σrn pour aucun r et n.

En revanche, ce qu'il faut souligner, c'est que même s'il faut un niveau de platonisme très élevé pour accepter de discuter de la vérité ou non de il existe un cardinal inaccessible et autres notions exotiques de la théorie des ensembles, en revanche, l'idée qu'un cardinal inaccessible puisse exister, c'est-à-dire soit consistante avec ZFC, ça c'est quelque chose de purement arithmétique, c'est même un énoncé simplement Π01. Et je suis pour ma part persuadé que c'est vrai : c'est là, d'ailleurs, que ma position philosophique se casse la gueule, parce que si je suis prêt à admettre qu'un cardinal inaccessible puisse exister mais pas que ça ait un sens de se demander s'il existe, on se demande un peu d'où je tire la conviction qu'il puisse exister (ce n'est pas un théorème de ZFC si ZFC est consistant, donc la croyance en une telle chose ne peut venir que d'une idée de grands cardinaux, quelque part). Du coup je ne sais pas bien ce que je crois. :-)

En fait, j'ai l'impression que les théoriciens des ensembles sont souvent beaucoup plus platoniciens que les autres mathématiciens (ils avouent souvent publiquement être persuadés que l'hypothèse du continu est fausse, qu'un cardinal mesurable ou supercompact existe, etc.). Je pense que c'est lié au fait que les autres matheux peuvent tout à fait travailler sans avoir besoin de considérer de tels énoncés, alors que si on veut faire de la théorie des ensembles il est un peu malheureux de se dire qu'on ne manipule que des symboles qui ne veulent rien dire… Peut-être que les théoriciens des ensembles ont accès à un paradis platonicien plus vaste que le reste des matheux ? (Hilbert : Aus dem Paradies, das Cantor uns geschaffen, soll uns niemand vertreiben können.)

[#] Ça c'est dans la hiérarchie arithmétique (d'ordre supérieur), que j'ai décrite, bien sûr : parce que comme énoncé ensembliste, il existe un cardinal inaccessible est quelque chose comme Σ2.

(jeudi)

Qu'est-ce qu'un nombre aléatoire ?

Voici une question un peu provocante : qu'est-ce qu'un nombre aléatoire ? Pour un probabiliste, elle n'a pas de sens : un nombre n'est pas aléatoire (le nombre π, par exemple, ça n'a pas de sens de dire qu'il est aléatoire), ce qui a un sens, c'est de tirer aléatoirement un nombre, disons, dans l'intervalle [0;1]. Pourtant, il y des branches des mathématiques où cela a bien un sens, de façon abolue, de dire qu'un nombre réel bien défini est — ou n'est pas — aléatoire (et, pour gâcher le suspens, le nombre π n'est pas aléatoire, en aucun sens qu'on sache définir à ma connaissance, ce qui est bien dommage parce que ça permettrait de prouver plein de choses merveilleuses à son sujet, mais c'est tout à fait intuitif parce qu'on arrive à le calculer — donc il n'est certainement pas tiré au hasard !). Je vais tâcher d'expliquer simplement de quoi il retourne, sans entrer dans trop de technicité mais en donnant tout de même des définitions complètes. L'idée qu'on cherche à développer est que :

L'aléatoire est ce qu'on ne peut prévoir (de façon non triviale) par le calcul.

Plutôt que de travailler sur des nombres réels, je travaillerai sur des suites infinies de 0 et de 1, ce qui est presque pareil (comme aucun rationnel dyadique, ou aucun rationnel tout court, d'ailleurs, n'est aléatoire en aucun sens, on peut considérer qu'une suite infinie de 0 et de 1 est la même chose que le nombre réel entre 0 et 1 qui a cette écriture binaire). Appelons Ξ (j'allais l'appeler 𝔠, mais je pense que si je fais ça beaucoup de gens ne vont rien voir d'utile) l'ensemble des suites infinies de 0 et de 1. On aura besoin de la notion d'ouvert de Ξ: un ensemble U de suites est dit ouvert lorsque c'est une réunion d'ensembles de la forme toutes les suites commençant par <un nombre fini de symboles> ; ou, de façon équivalente, lorsque pour toute suite de U il existe un rang à partir duquel on peut modifier n'importe comment la suite et rester dans U. Autrement dit, l'ensemble de toutes les suites commençant par 0, ou par 01101001, ou par 11111111, sont des ouverts, ainsi que n'importe quelle réunion — même infinie — de telles choses (par exemple, l'ensemble des suites commençant par 0 ou 11 ou 100 ou 1011 ou…), et ce sont là tous les ouverts de Ξ. (La notion d'ouvert de Ξ ne coïncide pas avec la notion plus habituelle d'ouvert de [0;1], par exemple parce que Ξ n'est pas connexe, mais la différence n'est pas importante pour ce que je vais dire.)

On dira qu'un ouvert (ou, d'ailleurs, n'importe quel ensemble) est dense lorsque son complémentaire (i.e., l'ensemble des suites qui ne sont pas dedans) ne contient aucun ouvert autre que ∅ (le vide, qui est un ouvert). Voici un exemple d'ouvert dense : l'ensemble de toutes les suites sauf la suite 000000… (ou sauf n'importe quelle suite donnée, d'ailleurs) : il est facile de vérifier que c'est un ouvert (c'est l'ensemble des suites commençant par 1, ou par 01, ou par 001, ou par 0001, autc.), et il est encore plus facile de se convaincre que son complémentaire (qui ne contient qu'une seule suite, la suite nulle) ne contient aucun ouvert non vide. L'idée est qu'un ouvert dense contient « quasiment toutes » les suites ; mais ça, ça va servir à définir les suites génériques, qui ne sont pas pareilles que les suites aléatoires.

Pour définir ce que c'est qu'une suite aléatoire j'ai besoin d'une autre notion, celle de mesure d'un ouvert (moralement, la probabilité qu'une suite de 0 et de 1 tirés au hasard indépendamment avec probabilité ½ pour chacun, tombe dans l'ouvert). J'ai dit qu'un ouvert pouvait s'écrire comme une réunion de machins qui sont toutes les suites commençant par <bla bla bla>, où <bla bla bla> ne comporte qu'un nombre fini de 0 et de 1 (on appelle de tels machins des ouverts élémentaires) : avec un petit peu d'efforts on peut s'arranger pour que la réunion soit disjointe (il suffit de retirer ce qui est redondant dans la description : l'ensemble des suites commençant par 0 ou 01, c'est juste l'ensemble des suites commençant par 0). On attribue à chacun de ces ouverts élémentaires une mesure qui est ½n (un demi puissance n) avec n le nombre de symboles imposés au début, et on ajoute toutes ces mesures pour calculer la mesure de la réunion disjointe. Par exemple, l'ouvert des suites commençant soit par 0 soit par 111, a pour mesure 5/8 (= 1/2 + 1/8) ; l'ensemble des suites autres que la suite 000000… (j'ai expliqué plus haut que c'était un ouvert) a pour mesure 1, comme l'ensemble Ξ de toutes les suites : un tel ouvert est dit de mesure pleine. Il s'avère qu'un ouvert de mesure pleine est forcément dense (pourquoi ?), mais la réciproque n'est pas vraie — si ça ne vous saute pas aux yeux, c'est sans doute normal, mais ça vaut le coup d'y réfléchir.

J'en viens à la notion de suite aléatoire et de suite générique. Mais avant ça j'aurai besoin d'une notion de calculabilité ; pourtant, je ne vais pas définir ce que c'est : ce qui est intéressant, c'est que pour chaque notion de calculabilité, je vais avoir une notion de suite aléatoire et de suite générique, qui sera d'autant plus contraignante que la notion de calculabilité est puissante. La notion la plus naturelle, c'est la calculabilité habituelle de Church-Turing (les fonctions récursives, qui sont en gros celles que peut calculer un ordinateur idéalisé), mais plein d'autres notions pourraient convenir : soit plus fortes (fonctions récursives sous un oracle quelconque, fonctions Σn de l'arithmétique, fonctions arithmétiques, fonctions hyperarithmétiques, fonctions analytiques-au-sens-de-la-calculabilité, fonctions constructibles-au-sens-de-l'univers-de-Gödel), soit plus faibles (fonctions primitives récursives, et sans doute même fonctions calculables en temps polynomial même si quand la calculabilité devient trop faible j'ai peur que les notions que je vais définir ne soient plus très bonnes).

Le but de ces fonctions calculables sera juste de pouvoir dire que certains ouverts de Ξ sont calculables : un ouvert calculable U sera juste un ouvert tel qu'une fonction calculable (donc un programme informatique idéalisé, si vous prenez la calculabilité au sens de Church-Turing) qui quand on lui présente un mot fini de 0 et de 1 décide si l'ouvert élémentaire des suites commençant par ce préfixe sera mis dans la réunion constituant U. Autrement dit, on lui demande veux-tu mettre dans l'ouvert toutes les suites commençant par 0 ?, veux-tu mettre dans l'ouvert toutes les suites commençant par 1 ?, veux-tu mettre dans l'ouvert toutes les suites commençant par 00 ?, etc., et elle prend à chaque fois une décision[#]. À titre d'exemple, tant que votre notion de calculabilité n'est pas démesurément faible, l'ensemble des suites qui ne sont pas la suite nulle — ensemble dont j'ai déjà dit que c'était un ouvert par ailleurs dense et de mesure pleine — est calculable, puisque c'est très facile de reconnaître les mots 1, 01, 001 et de répondre oui sur chacun d'entre eux. On peut aussi demander qu'une suite d'ouverts soit calculable : cela signifie que la fonction calculable prend en outre en entrée un entier (n) qui est le rang dans la suite. On définit enfin une suite décroissante calculable d'ouverts de Ξ : cela signifie simplement que la suite est décroissante pour l'inclusion (i.e., chaque ouvert est inclus dans tous les précédents), ou, si on préfère, quand la fonction calculable a décidé d'exclure un ouvert élémentaire d'un terme de la suite, elle exclut automatiquement de tous les suivants.

Quel est maintenant l'esprit de la définition ? Une suite aléatoire/générique est, en gros, une suite sur laquelle on ne puisse pas faire une prévision calculatoire non-triviale. Évidemment, on pourra toujours dire elle commence par 010100 (disons), puisque c'est une suite bien définie (je rappelle que je suis en train de définir une notion d'aléatoire qui s'applique pour une suite bien définie !) ; mais l'idée est qu'on ne peut pas faire une prévision vraiment intéressante.

Voici enfin les deux notions en question :

Une suite est dite générique lorsqu'elle appartient à tout ouvert dense calculable.

Une suite x est dite aléatoire lorsque pour toute suite décroissante calculable (Un) d'ouverts de Ξ telle que le n-ième soit de mesure au plus 1/n, la suite x n'appartient qu'à un nombre fini d'entre eux.

La définition d'une suite générique est sans doute plus simple à comprendre : si vous arrivez à faire une prévision calculable du type la suite n'est pas dans l'ouvert U que voici, alors cet ouvert ne peut pas être dense, c'est-à-dire qu'il y a quelque part un gros bout (toutes les suites commençant par un certain préfixe) qu'on a omis dans la prévision — qui n'a donc rien de remarquable (je peux bien faire la prévision la suite commence par 0101010, et il y a bien certaines suites aléatoires qui vont y coller). Dit autrement, un ouvert dense calculable contient toutes les suites génériques. Donc j'ai déjà prouvé que la suite 000000… n'est pas générique : il existe un ouvert dense (toutes les suites sauf elle !) qui est calculable et qui ne la contient pas.

La définition d'une suite aléatoire est un chouïa plus compliquée, parce que cette fois-ci on demande de faire des prévisions du type la suite est dans l'ouvert U que voici ; or on peut certainement faire des prévisions de ce style (de nouveau, je peux faire la prévision la suite commence par 0101010, et il y a bien certaines suites aléatoires qui vont y coller), on peut même certainement faire des prévisions aussi bonnes qu'on veut, mais le point important est qu'on ne peut pas le faire uniformément : si on a une suite décroissante calculable d'ouverts dont le n-ième a une mesure au plus 1/n[#2], son intersection ne contient aucune suite aléatoire. Ceci étant, on se convainc facilement que, par exemple, la suite nulle 000000… n'est pas aléatoire (de nouveau, dès que la notion de calculabilité n'est pas démesurément faible) : il suffit de considérer la suite décroissante d'ouverts donnée par les suites dont les n premiers termes sont nuls — cela donne une mesure de 1/2n.

J'ai donc prouvé que la suite nulle n'était ni aléatoire ni générique. C'est la moindre des choses. En fait, pour la même raison, n'importe quelle suite calculable au sens qu'on s'est fixé n'est ni aléatoire ni générique. En revanche, si je prends une suite aléatoire (resp. générique) et que je remplace un sur deux de ses chiffres par un 0, j'obtiens une suite qui n'est plus aléatoire (resp. générique) et qui n'est pourtant pas calculable : donc aléatoire et génériques ne sont pas synonymes de pas calculables — ils sont bien plus forts que ça.

Le fait qu'il existe des suites aléatoires et des suites génériques résulte, si la notion de calculabilité est dénombrable (i.e., s'il n'existe qu'une infinité dénombrable de fonctions calculables ℕ→ℕ, ce qui est le cas pour la calculabilité au sens de Church-Turing), résulte du théorème de Baire dans un cas (l'intersection de tous les ouverts denses calculables est non vide) et de l'additivité de la mesure dans l'autre (la réunion de toutes les intersections de suites décroissantes calculables d'ouverts dont la mesure tend vers zéro est de mesure nulle). Pour d'autres notions, cela peut être plus difficile ou impossible (si on déclare que toutes les fonctions ℕ→ℕ sont calculables, il n'y a plus aucun nombre aléatoire ou générique : pour un être omniscient, il n'y a pas de hasard).

Voici maintenant un résultat que j'ai toujours trouvé remarquable : on s'imagine que générique et aléatoire veulent tous les deux dire, de manière vague qu'on ne peut pas calculer de prévision aléatoire non triviale dessus ; pourtant, pour toute notion (un tant soit peu raisonnable) de calculabilité,

Aucune suite n'est simultanément générique et aléatoire.

La démonstration n'est pas compliquée ! Considérons, pour chaque n, l'ouvert Un de Ξ ainsi défini : il s'agit de l'ensemble des suites de 0 et de 1 qui commencent par k signes quelconques (pour un certain k fini) qui sont immédiatement suivis de 2k+n fois 0 (et ensuite n'importe quoi) : cette description montre immédiatement qu'il s'agit d'un ouvert, il est assez clair qu'il est calculable (il est très facile de reconnaître les mots formés de k signes quelconques puis 2k+n fois 0), et même, que la suite (Un) d'ouverts de Ξ est décroissante calculable. Maintenant, chacun des ouverts Un est dense (car vous aurez beau prescrire comme vous voudrez les N premiers termes d'une suite, vous n'éviterez jamais à qu'elle puisse être dans Un), et pourtant sa mesure est majorée par 1/2n ou quelque chose de ce goût-là (c'est une réponse à la question que j'avais posée plus haut : montrer qu'il existe des ouverts denses qui ne sont pas de mesure pleine). Du coup, une suite générique doit appartenir à chacun des Un, alors qu'une suite aléatoire ne peut appartenir qu'à un nombre fini d'entre eux. Cela empêche qu'une suite aléatoire soit générique.

Ce résultat est difficile à comprendre intuitivement : je pense que les suites génériques sont plus élusives que les suites aléatoires — elles donnent l'impression d'avoir des motifs dedans, ce qui est faux, bien sûr, mais elles ne se comportent pas du tout comme les suites aléatoires. Philosophiquement parlant, la suite de 0 et de 1 qu'on obtiendrait en tirant infiniment à pile ou face est assurément aléatoire, mais je ne sais pas d'où on pourrait sortir une suite générique : notre monde a l'air beaucoup plus naturellement orienté vers l'aléatoire que vers le générique[#3] — pourtant, mathématiquement, il existe une grande similarité entre ces deux notions (voir à ce sujet le livre d'Oxtoby fort justement intitulé Measure and Category).

Les suites (ou nombres réels) aléatoires et surtout génériques ont une grande importance en théorie des ensembles : par exemple, la façon dont Paul Cohen a montré l'indémontrabilité de l'hypothèse du continu c'est de fabriquer (par la technique du forcing) énormément de suites de 0 et de 1 (ou nombres réels) qui soient génériques (en fait, aléatoire marcherait aussi) en prenant pour notion de calculabilité la constructibilité au sens de l'univers de Gödel, qui est à peu près la plus forte qu'on puisse imaginer (très très grossièrement, c'est la puissance qu'aurait en quelque sorte un ordinateur capable de calculer directement sur les ensembles et sur des temps transfinis). À l'autre bout du spectre de la calculablité, on pourrait placer la cryptographie, où la notion d'oracle aléatoire sert de modèle pour des preuves de sécurité de cryptosystèmes et où on est bien forcé de constater que ce n'est pas une notion si atteignable. Je me demande s'il y aurait lieu de considérer des oracles génériques (le terme a été utilisé, mais je crois que c'est pour quelque chose se très différent).

[#] Pour la calculabilité au sens de Church-Turing, on peut prendre l'absence de réponse, i.e., la non-terminaison du programme, comme une réponse négative, ou bien l'interdire, ça ne changera rien à la notion d'ouvert calculable.

[#2] Ça fait partie des choix pas forcément évidents à faire quand on prend une notion de calculabilité trop faible… déjà, pour la calculabilité au sens de Church-Turing, il faut se convaincre que le bon choix est bien d'imposer explicitement une vitesse de convergence et pas juste de dire la mesure de Un tend vers 0 : un des critères qui me poussent à faire ce choix, c'est que, si je ne me trompe pas, il permet alors avec l'oracle de l'arrêt des machines de Turing de construire un réel aléatoire (de même qu'on peut en construire un générique), ce qui ne serait pas possible si on demandait juste que la mesure tende vers zéro. Mais je ne suis pas totalement sûr de moi, et je le suis encore moins pour des notions de calculabilité très faibles comme la calculabilité en temps polynomial (où ça fait une différence de demander que la mesure soit bornée par 1/n ou 1/2n), et même pour la calculabilité de Church-Turing il faudrait calibrer les choses par rapport à une autre définition habituelle (mais à mon avis moins agréable) qui fait intervenir la complexité de Kolmogorov. Enfin bon, l'esprit est quand même raisonnable dans tous les cas, et pour les notions de calculabilité assez fortes (du genre être arithmétique), ça ne fait pas de différence.

[#3] Voici un autre fait digne d'intérêt : un nombre réel générique est un nombre de Liouville, c'est-à-dire qu'il s'approche très bien par les nombres rationnels, alors qu'un nombre réel aléatoire est approché par les rationnels exactement à l'ordre 2 (c'est-à-dire qu'il est à une distance d'un rationnel de l'ordre de la puissance −2 du dénominateur de celui-ci) ; or il se trouve que les nombres qui interviennent « naturellement » en analyse, en tout cas le nombre e, sont ou ont l'air d'être, approchés exactement à l'ordre 2. Du coup, en un sens qui semble malheureusement impossible à rendre précis, les décimales de e ou π sont plus proches d'être aléatoires que génériques (en vérité, elles ne sont ni l'un ni l'autre : il faudrait une notion furieusement faible de calculabilité pour que π soit aléatoire !).

(dimanche)

J'apprends à compter jusqu'à ψ(εΩ+1) et à dompter les hydres

Si j'ai été silencieux pendant deux semaines c'est qu'aussitôt abandonné le nim épicé j'ai été saisi d'une autre obnubilation intellectuelle (et qui me revient périodiquement[#]), c'est celle des ordinaux dénombrables : j'avais déjà écrit des articles de vulgarisation à ce sujet (celui-ci il y a très longtemps et celui-ci il y a un peu moins longtemps, le premier ayant même été traduit en chinois[#2] ; et j'ai beaucoup contribué à l'article de Wikipédia en anglais), cette fois je me suis intéressé aux notations ordinales — c'est-à-dire, en gros, la façon de donner un nom aux (plus petits des) ordinaux dénombrables, en essayant d'aller le plus loin possible, tout en sachant très bien qu'on ne pourra pas atteindre tous les ordinaux dénombrables (ni même tous les ordinaux récursifs). Et j'ai produit les jolis dessins que voici[#3] et surtout ce texte explicatif dont je vais dire un peu plus.

Quand on entend parler des ordinaux pour la première fois, on entend parler de ω, de ωω, de ωωω, et souvent de la limite de tout ça, qui est ε0 (qui le plus petit ordinal vérifiant ωξ = ξ, c'est-à-dire le plus petit point fixe de ξ↦ωξ). Manipuler les ordinaux jusqu'à ε0 (pour les ajouter, les multiplier ou les exponentier) est facile si on travaille en forme normale de Cantor (c'est-à-dire, informellement, en base ω) itérée pour les exposants ; à partir de ε0 ça devient un chouïa plus compliqué parce qu'il y a des égalités qui ne sautent pas immédiatement aux yeux (comme le fait que ωε0+1 = ε0·ω), mais on finit par s'y habituer. Le problème est plutôt de monter aussi loin que possible : si ε1 est la prochaine solution de ωξ = ξ, et ainsi de suite, jusqu'où ira-t-on ? On pourrait appeller ζ0 la limite de la suite ε0, εε0, εεε0, c'est-à-dire le premier point fixe de ξ↦εξ, on peut continuer à jouer ainsi avec les lettres grecques qui énumèrent les points fixes les unes des autres, si bien qu'on finit par avoir besoin d'un alphabet grec transfini : c'est ce qu'on appelle le schéma φ de Veblen (à deux variables, pour commencer), chaque rang énumérant les points fixes du rang précédent. Seulement, on arrive à court de ce schéma aussi lorsqu'on tombe sur la première lettre grecque qui est, pour ainsi dire, son propre rang dans l'alphabet. C'est cet ordinal (toujours dénombrable, bien sûr) qu'on appelle l'ordinal de Feferman-Schütte (et c'est la limite des ordinaux pour lesquels le schéma de Veblen à deux variables fournit des notations).

Car certains grands ordinaux dénombrables, comme ça, ont des noms de gens associés : l'ordinal de Feferman-Schütte, l'ordinal d'Ackermann, les petit et grand ordinaux de Veblen, l'ordinal de Bachmann-Howard, l'ordinal de Takeuti-Feferman-Buchholz (c'est moi qui l'appelle comme ça) et peut-être plus encore. En gros, il y a deux approches possibles pour donner des noms systématiques à de grands ordinaux dénombrables :

Les jolis petits dessins mentionnés ci-dessus représentent les ordinaux (enfin, un petit échantillon d'ordinaux !) jusqu'au petit ordinal de Veblen, c'est-à-dire à peu près l'étendue de l'approche prédicative, en leur donnant si possible deux noms, l'un utilisant l'approche prédicative (avec les fonctions φ de Veblen) et l'autre utilisant une fonction écrasante ψ. Pour les arbres, je vais en dire plus dans une minute. Concernant la fonction écrasante, j'ai écrit ce texte explicatif : reste à savoir où l'insérer dans Wikipédia (si possible sans qu'on m'accuse de faire de la original research). Peut-être que ce n'était pas la meilleure place pour ça, en fait. Mais quelles que soient ses vertus pédagogiques (ou pas), il m'aura au moins permis de bien comprendre ces choses-là, et donc, en quelque sorte, d'apprendre à « compter » jusqu'à l'ordinal de Bachmann-Howard (sans doute même au-delà).

Ce qui est étrange, c'est qu'on a parfois l'impression que les ordinaux (dénombrables, au moins, car les autres sont juste inimaginables) sont « tous pareils » : quand j'essaie d'expliquer comment on grimpe jusqu'à tel ou tel ordinal, on se retrouve souvent à prononcer des phrases comme et on recommence tout ce truc, et ainsi de suite jusqu'à, etc. Pourtant, au contraire, il n'y a pas de structure mathématique plus rigide[#4] que les ordinaux.

L'autre chose étrange, c'est que les ordinaux apparaissent très peu dans les mathématiques standards, hors théorie des ensembles (au point que la plupart des mathématiciens considèrent que c'est un peu un gros mot). Pourtant, on pourrait dire qu'à chaque fois qu'il y a un processus dont la terminaison est garantie en temps fini (et c'est chose fort courante en mathématiques ou en informatique), il y a un ordinal qui se cache[#5]. Seulement, en pratique, cet ordinal n'est jamais bien grand (très souvent c'est simplement un entier naturel, en fait, quand il y a une borne universelle sur la longueur du processus, ou bien ω quand il y a une borne qui dépend d'un unique premier choix), donc les mathématiciens n'ont pas trop besoin de savoir compter loin.

Parmi les processus qui terminent forcément et auxquels sont associés des ordinaux pas trop petits, il y en a qui sont souvent donnés en exemple parce qu'ils sont récréatifs et faciles à comprendre : ce sont les jeux de l'hydre. En gros il s'agit de partir d'une structure finie, typiquement un arbre, censé symboliser l'hydre. Un joueur, censé symboliser Hercule, réduit la structure par petites étapes (du genre, couper une branche de l'arbre, parfois avec des contraintes sur la branche) : mais dès qu'on la réduit, la structure grandit de façon apparemment démesurée (l'hydre repousse des nouvelles têtes), selon des règles plus ou moins compliquées. Selon toute apparence, Hercule n'a aucune chance de gagner, et le nombre de têtes de l'hydre croît de façon vertigineuse ; en réalité, les règles sont faites en sorte qu'à chaque configuration de l'hydre est associé un ordinal et que cet ordinal décroît forcément, de sorte que le jeu termine toujours en temps fini. Le cas le plus classique est l'hydre de Kirby-Paris, dont il y a par exemple une description ici (avec même une petite applet pour jouer) : dans ce cas, l'ordinal est ε0 (au sens où chaque arbre fini encode un ordinal inférieur à ε0 de façon à décroître à chaque coup d'Hercule, ce qui garantit la terminaison, et les ordinaux). Mais il y a d'autres variantes (parfois compliquées) du jeu de l'hydre, qui doivent être associées à d'autres ordinaux éventuellement plus grands : par exemple, l'hydre de Kirby-Paris ne croît jamais en hauteur, seulement en largeur, mais on doit pouvoir en faire une qui croît en hauteur aussi. J'aimerais définir une hydre de Veblen mais je n'ai pas trouvé de description simple ou qui me satisfaisse.

L'ordre sur les arbres finis enracinés (et à descendants ordonnés) qui leur donne la taille du petit ordinal de Veblen est défini récursivement comme suit :

Un arbre (fini enraciné) A est strictement inférieur à B lorsque soit il existe une branche (i.e., un sous-arbre immédiat, i.e., un fils) B′ de B qui soit supérieur ou égal à A, soit les deux conditions suivantes sont vérifiées : d'une part toute branche A′ de A est strictement inférieur à B et, d'autre part la liste des branches de A est lexicographiquement strictement inférieure à celle des branches de B (en donnant le plus de poids aux branches les plus à gauche et en convenant que s'il y a moins de branches dans A alors la liste est lexicographiquement inférieure).

— c'est un peu long à dire, mais ce n'est pas vraiment compliqué[#6]. En gros ça dit qu'on compare les branches lexicographiquement mais avec l'exception évidemment nécessaire que l'arbre tout entier doit être supérieur à chacune de ses branches. Ce qui n'est pas totalement évident, c'est que c'est bien un bon ordre (et que la relation d'égalité associée est bien l'égalité à laquelle on s'attend sur les arbres finis enracinés !), et la longueur de ce bon ordre est précisément le petit ordinal de Veblen. Donc à tout arbre fini enraciné est associé, de cette façon, un ordinal inférieur au petit ordinal de Veblen et c'est ça que j'ai représenté dans mes pages de petits dessins. Et il doit y avoir un jeu d'hydre associé à cet ordre, mais je n'arrive pas à décrire de façon générale quelle en serait la règle[#7].

[#] En l'occurrence, c'est quand même parti du jeu de nim, puisqu'il y a un problème — à ma connaissance encore ouvert — posé par Conway en 1976 qui est de déterminer le deuxième ordinal qui soit un transcendant pour la multiplication de nim (sachant que le premier est ωωω).

[#2] Il va de soi que tous les liens que je donnais en 2005 sont cassés. <soupir> La traduction chinoise en question, parue dans 三思科学, existe cependant encore, elle est trouvable par son titre, 不同寻常的数.

[#3] Produits par ce programme Perl et qui font ensuite beaucoup souffrir TeX (j'ai dû augmenter la mémoire qu'il peut prendre, et ça compile en plus de 20s sur ma machine qui n'est pourtant pas minable). J'espère ne décevoir personne en avouant que les noms n'ont pas été générés automatiquement…

[#4] Par rigide, j'entends, techniquement, qu'ils n'ont pas d'automorphismes : lorsque deux ensembles bien ordonnés sont isomorphes, l'isomorphisme est unique — c'est-à-dire, avec les mains, qu'il n'y a qu'une seule façon de les faire se correspondre. Donc si on peut se poser la question philosophique complètement oiseuse de savoir si le ℂ auquel je pense est bien le même que celui de mon voisin (a-t-on l'un et l'autre le même i ? ou sont-ils conjugués complexes ?), cette question ne peut pas se poser pour les ordinaux.

[#5] On pourrait le caractériser ainsi : soit P un processus dont un théorème nous assure qu'il termine toujours, quels que soient certains choix effectués ; on considère un jeu à deux joueurs où un joueur applique le processus P, à raison d'une étape à chaque tour, en effectuant les choix qu'il veut, et l'autre joueur part d'un certain ordinal α et peut à chaque étape le décroître comme il lui plaît. Le premier joueur qui termine a perdu (c'est-à-dire le joueur-processus si le processus termine, et le joueur-ordinal si l'ordinal tombe à zéro) : à partir d'un certain ordinal, c'est le joueur-ordinal qui a une stratégie gagnante — et cet ordinal mesure la longueur de terminaison du processus P.

[#6] Pour comparaison, l'ordre sur les arbres finis enracinés (sans distinction des descendants) qui conduit à l'hydre de Kirby-Paris est le suivant : un arbre A est inférieur à un arbre B lorsque, en triant les branches de A et celles de B pour l'ordre en question et en regardant le nombre d'occurrence de chacune, le nombre pour A est lexicographiquement inférieur au nombre pour B en donnant au nombre des branches les plus grandes le plus de poids. Cette fois-ci l'ordinal est ε0 (beaucoup plus petit, donc), et, pour ainsi dire, les arbres grandissent en largeur avant de grandir en profondeur (pour l'ordre de Veblen, c'est le contraire).

[#7] Ça devrait ressembler à ceci : quand on coupe une tête, toutes les têtes situées à sa droite s'énervent, et ça leur fait pousser sur chacune une copie du sous-arbre complet qui les relie au chemin de coupe (têtes énervées comprises) et on recommence ça aussi souvent que l'hydre le veut. Malheureusement, sous cette forme, ça ne marche pas.

(dimanche)

Le jeu de nim épicé

Je disais récemment que les idées scientifiques ont tendance à ressembler aux tamagotchis : on commence à les élever et rapidement elles vous accaparent l'esprit en demandant sans arrêt votre attention.

Je réfléchissais à la théorie combinatoire[#] des jeux quand je suis tombé sur l'idée du jeu suivant (qui a certainement déjà été décrit et étudié, mais il est difficile de trouver sous quel nom), que j'appellerai le jeu de nim épicé.

Tout d'abord je rappelle ce qu'est le jeu de nim usuel : il s'agit d'un jeu (impartial, à connaissance complète, à deux joueurs) extrêmement simple, dans lequel l'état du jeu est donné par un certain nombre de lignes de bâtonnets (ou quelconques autres jetons : tas de pièces, rangées d'alumettes, ce que vous voudrez ; il en existe aussi des avatars un petit peu moins évidents où, par exemple, on avance des pions sur un échiquier sans avoir le droit de les reculer). Seul compte le nombre de bâtonnets présent sur chaque ligne (il n'y a pas d'ordre, pas de structure supplémentaire). La règle du jeu est simplissime : les joueurs jouent tour à tour et chacun, quand c'est son tour, peut et doit retirer des bâtonnets situés sur une ligne — il doit en retirer au moins un et peut en retirer autant qu'il veut, y compris vider (et donc supprimer) la ligne, mais il ne peut en un tour retirer des bâtonnets que d'une seule ligne (de son choix). Normalement, le joueur qui ne peut plus jouer a perdu (i.e., celui qui retire le dernier bâtonnet a gagné, puisque son adversaire est dans l'impossibilité de jouer) : en fait, la version misère, où celui qui retire le dernier bâtonnet perd, est peut-être plus commune pour le jeu de nim, mais elle est en fait très semblable[#2] et moins intéressante mathématiquement.

Dans n'importe quel jeu de ce genre (i.e., un jeu impartial, à connaissance complète, à deux joueurs, et qui termine toujours en temps fini sur le gain d'un des joueurs avec par convention perte du joueur qui ne peut plus jouer), l'un des deux joueurs a forcément une stratégie gagnante. En fait, on peut définir deux sortes de positions du jeu : les positions dites nulles[#3] — qui sont celles à partir desquelles le second joueur a une stratégie gagnante —, et les autres (généralement les plus nombreuses). La définition (récursive !) est qu'une position nulle est une position qui ne conduit qu'à des positions non nulles (y compris si elle ne conduit à rien du tout, car alors le joueur qui vient de jouer à gagné) et, a contrario, une position non nulle est une position qui conduit à au moins une position nulle. La stratégie gagnante consiste à jouer, autant que c'est possible, pour mettre le jeu dans une position nulle (auquel cas le joueur adverse sera obligé de jouer pour aller dans une position non nulle, donc on sera assuré de pouvoir jouer vers une position nulle, et ainsi de suite : comme on peut toujours gagner, on ne peut pas perdre). Connaître la stratégie gagnante revient donc à identifier les positions nulles (pour pouvoir jouer vers elles).

Dans le cas du jeu de nim, elles ont une description mathématiquement simple : sont nulles les positions telles que le « ou exclusif » du nombre de bâtonnets de chaque ligne (écrits en binaire) soit nul. Par exemple, la position de départ habituelle, (1,3,5,7) (ce qui signifie : un bâtonnet sur une ligne, trois sur une autre, cinq sur une troisième, et sept sur la dernière ligne) est nulle car 001⊕011⊕101⊕111=000 : cela signifie qu'au jeu de nim usuel, à partir de cette position, le joueur qui ne commence pas peut gagner le jeu à coup sûr (par exemple, si le premier joueur retire deux bâtonnets de la dernière ligne, c'est-à-dire joue vers (1,3,5,5), position non nulle, on répondra vers (1,1,5,5), position nulle, et il est d'ailleurs clair qu'on a alors une stratégie gagnante en reproduisant les coups d'une paire de lignes (1,5) sur l'autre).

J'en viens donc au jeu de nim épicé : la différence avec le jeu nim normal est qu'il existe deux sortes de lignes, des lignes épicées et des lignes normales (ou fades). La règle du jeu est la même (on peut retirer autant de bâtonnets qu'on veut, mais d'une ligne seulement) avec la seule différence que lorsqu'un joueur retire des bâtonnets d'une ligne épicée, son adversaire ne peut pas en faire autant au coup immédiatement après (il doit retirer des bâtonnets d'une ligne fade — et s'il n'en reste aucun, il a perdu). Autrement dit, on ne peut consommer deux coups de suite des bâtonnets épicés. Une position du jeu est déterminée par le nombre de bâtonnets dans les lignes de chaque sorte (je les écrirai en commençant par les lignes fades) et par le fait que le coup immédiatement précédet ait été épicé ou non.

Exemple : en commençant sur (1,2,11;4;4), c'est-à-dire qu'il y a trois lignes fades avec 1, 2 et 11 bâtonnets, et deux lignes épicées avec 4 bâtonnets chacune, le premier joueur pourrait jouer vers (1,2,5;4;4), le second joueur répliquerait avec (1,2,5;4,2)H (le H, comme hot signifiant qu'on vient de jouer épicé, donc que le coup suivant sera forcément fade), le premier joueur tenterait maladroitement (1,2,3;4,2), ce à quoi on rétorquera (1,2,3;2,2)H, et une tentative désespérée vers (1,2,1;2,2) provoquera inévitablement la réplique (1,2,1;2)H, et il n'y a plus de doute sur qui a gagné.

La question à cent zorkmids est donc : quelles sont les positions nulles du jeu de nim épicé ? Peut-on les décrire de façon synthétique comme pour le jeu de nim usuel ?

Je n'ai que des réponses partielles à cette question. Je peux facilement faire produire à mon ordinateur des tables gigantesques de positions nulles, mais ensuite trouver la logique ressemble à un test d'intelligence. Et si c'est un test d'intelligence, j'ai échoué : j'ai trouvé beaucoup de motifs partiels, mais aucune decription complète.

Il est clair que si le nombre total de bâtonnets épicés est strictement supérieur au nombre total de bâtonnets fades (et que la position n'est pas chaude, i.e., qu'on peut jouer épicé), alors la position est non nulle : en effet, le premier joueur a la stratégie gagnante consistant à manger les épices, c'est-à-dire retirer un quelconque bâtonnet épicé, auquel cas son adversaire devra en retirer un fade, puis le premier joueur retire de nouveau un épicé, et ainsi de suite jusqu'à épuisement des fades auquel moment le second joueur perd. Dans « beaucoup » de cas, une position nulle s'obtient en complétant une telle position jusqu'à ce que le nombre total de bâtonnets fades égale le nombre total d'épicés : notamment, s'il y a une seule ligne fade, il est facile de voir que la condition de nullité est précisément que le nombre de bâtonnets de cette ligne soit égal au nombre total de bâtonnets épicés ; il en va de même si les épicés sont dans des lignes d'un seul bâtonnet chacune (i.e., de nouveau, quelle que soit la répartition des fades, la condition de nullité sera que les fades soient aussi nombreux que les épicés). Mais parfois, il faut plus de fades : par exemple, s'il y a exactement deux lignes de fades dont une avec un seul bâtonnet, la condition de nullité est que le nombre total de fades soit deux de plus que le nombre total d'épicés si toutes les lignes épicées ont un nombre pair de bâtonnets (alors que c'est égalité s'il y a une ligne épicée avec un nombre impair de bâtonnets) — je sais le démontrer, mais je ne sais pas le généraliser correctement. Je ne sais pas « expliquer » de façon satisfaisante le fait que (2,9;6,4) ou (3,8;6,4) ou (1,2,8;6,4) (et pas (2,8;6,4) ou (2,n;6,4) pour un quelconque autre n) soient des positions nulles. C'est mystérieux : je cherche encore le motif, mais je commence à douter de son existence…

Évidemment, le jeu de nim se prête à quantité d'autres variations (on pourrait interdire de reprendre des bâtonnets de la ligne qui vient d'être diminuée, ou bien seulement pour certaines lignes, ou avoir plusieurs sortes d'épices, que sais-je encore…). Mais celle-ci m'est venue à l'esprit dans le cours d'une réflexion plus générale, alors maintenant elle m'obsède.

[#] Le terme combinatoire est là pour insister sur le fait qu'il ne s'agit pas de la théorie des jeux dans le sens où on l'entend d'habitude (jeux à la von Neumann, équilibres de Nash, tout ça) mais de jeux à information complète. Pour la bible sur le sujet, voir le très exotique Winning Ways de Berlekamp, Conway et Guy. On peut dire que c'est Conway qui a inventé la théorie combinatoire des jeux partiaux, la théorie combinatoire des jeux impartiaux — théorie de Sprague-Grundy, par exemple — est plus ancienne.

[#2] Pour jouer à la version misère, si on connaît la stratégie optimale de la version normale du nim décrite plus loin, il suffit de jouer comme pour la version normale sauf lorsqu'on ne va laisser que des lignes avec (zéro ou) un bâtonnet : à ce moment-là on en laisse un de moins (ou un de plus).

[#3] Le choix du mot nul, pour les jeux où le second joueur a une stratégie gagnante, pourra sembler bizarre. L'explication est que si on fait la somme d'un tel jeu et d'un jeu G quelconque — la somme étant à comprendre au sens où chaque joueur peut jouer dans une composante quelconque de la somme — alors la somme en question a la même caractéristique que le jeu G. Ou encore, les positions nulles sont celles dont la fonction de Grundy est nulle.

(samedi)

Fragment littéraire gratuit #107 (la Contradiction)

Au mur figurait l'inscription énigmatique suivante :

…945497946690011303871870040893554688 = 2∞−1

(Les chiffres sur la gauche devenaient de plus en plus petits et rapidement illisibles.)

L'homme resta silencieux pendant qu'Ack et Bel s'assirent dans les chaises qu'il leur désigna. Il ne parla qu'après les avoir longuement dévisagé comme s'il cherchait à lire dans leur visage la clé d'un mystère ancien.

Venons-en au fait, Messieurs, car la menace est terrible. Vous avez combattu des ennemis terrifiants qui mettaient en danger la reine, le royaume ou l'humanité tout entière… L'agent Bel voulut protester mais l'homme ne lui en laissa pas le temps. Vous et vos collègues avec combattu des ennemis terrifiants, mais aucun tel que celui-ci.

Voyant que l'autre attendait une question, Ack demanda poliment : Que compte-t-il faire ? Expliquez-nous donc.

Il ne veut pas seulement devenir maître du monde, ou de l'univers tout entier, mais de tous les univers possibles. Notre savant fou n'est pas un vulgaire biologiste qui menacerait de dominer l'humanité, ni un chimiste prêt à faire sauter la Terre ; ni même un physicien qui aurait découvert comment repolariser le vide et transformer ainsi le cosmos en une mer de bébé-univers. Non, il est bien plus dangereux que tout ça !

Venez-en au fait, je vous en prie. Que projette-t-il ?

Notre mathématicien s'apprête à modifier la logique même du monde. Son pouvoir serait alors sans limites.

Vous voulez dire, si je comprends bien, demanda 006, cachant avec peine son incrédulité, qu'il veut devenir une sorte de dieu ?

Au moins un dieu, oui : un dieu absolument omnipotent. Je ne parle pas seulement de voyager dans le temps, de vaincre la mort ou de ce genre de choses. Bien plus que ça. Car le Dieu chrétien lui-même, si on en croit Thomas d'Aquin, ne peut pas faire ce qui est logiquement impossible — ea vero quæ contradictionem implicant sub divina omnipotentia non continentur (Somme théologique, première partie, question XXV). Néanmoins, Descartes, dans sa première Méditation

Toutes passionnantes que sont ces considérations théologiques, interrompit 007, elles ne sont pas ce qui nous amène aujourd'hui. Est-il possible que notre savant fou atteigne son but ?

Non, bien sûr : c'est logiquement impossible. Mais son but est précisément d'y arriver bien que ce soit logiquement impossible, puisqu'il cherche à s'affranchir de la logique. Après une pause : Notre avis est que l'arme qu'il construit — la Contradiction — amènera une destruction complète dans laquelle périront non seulement l'univers et tout ce qu'il contient, mais aussi l'idée de l'univers, les triangles équilatéraux et le nombre 42.

Si je comprends, vous dites que c'est impossible mais qu'il y a tout de même un risque qu'il y parvienne. Comment va-t-il s'y prendre ?

L'homme plaça sur la table devant lui un jeu de cartes, le coupa, en retourna la première carte et la montra aux agents secrets : elle représentait un vieil homme s'appuyant sur un bâton et tenant dans l'autre main un objet qui pouvait être une lanterne ou un sablier ; au-dessus de la carte, le chiffre IX. Le neuvième arcane majeur.

En 1873, expliqua-t-il, Charles Hermite — le mathématicien — déposa un pli cacheté à l'Académie des sciences, contenant un lemme essentiel pour atteindre la Contradiction. Ce pli a été détruit sans être ouvert à la mort de Hermite, suivant des instructions qu'il avait laissées dans son testament. Mais nous savons aussi que, profondément troublé par le résultat qu'il avait découvert, il l'avait communiqué à son élève Jules Tannery ; et que celui-ci laissa à sa mort une copie de la démonstration au jeune Albert Châtelet. La piste se perd alors.

Ce papier est ce que cherche notre savant ?

Ce papier est ce qu'il vous faut détruire, ainsi que toute trace, tout souvenir, de ce lemme. Car réunir cette démonstration avec les résultats que notre ennemi possède déjà, cela lui donnerait la Contradiction. La logique du monde dépend de vous, Messieurs !

(Tuesday)

Converting latitude+longitude to Universal Transverse Mercator

[The following is a highly technical note (i.e, odds are you don't want to read it at all), which I'm writing in the form of a blog post mainly because I'm too lazy to start another Web page—but it might get copied elsewhere eventually (if someone wants to dump it on Wikipedia, feel free to).]

I've long been intrigued by the oft-used (especially in conjunction with GPS units) UTM coordinates: explanations as to how UTM coordinates are defined exactly is very hard to find (the spherical case is simple enough, but the ellipsoidal one is a much tougher nut), and although there are many online tools (such as this one) to convert from latitude+longitude to UTM and back, they use black box formulæ, converging power series, and looking at the source will give you very little insight on what is going on. So here is an attempt at a mathematically precise definition (it took me a whole day of angry formula-crunching before I came up with something entirely correct, so I won't spare the details).

First of all, what is a transverse mercator projection? It can be defined by starting from a central meridian (UTM uses 60 possible central meridians, one for each UTM zone) and constructing the mathematically unique projection from a spheroid (= rotation of an ellipse about one of its axes) to a plane which is conformal (= preserves angles) and maps the central meridian to a straight line with constant scale. So here are the defining features of Universal Transverse Mercator:

  • It divides the Earth in 60 longitude zones, each 6° wide: zone 1 ranges from 180° to 174°W, zone 2 from 174°W to 168°W and so on through zone 30 from 6°W to 0°, zone 31 from 0° to 6°E, up to zone 60 from 174°E to 180°. Each zone's central meridian is halfway between the limiting longitudes (e.g., zone 33's central meridian is 15°E). UTM coordinates are given relative to a longitude zone and a hemisphere (North or South).
  • In each zone, UTM is strictly conformal (= preserves angles). In practice, this means that it does not distort shapes anywhere, or that the UTM grid is a square grid everywhere, and it appears square when displayed on any conformal map projection. (Note that this does not imply that the lines of the grid are aligned north-south and east-west! But they are always perpendicular.)
  • Each zone's central meridian (which receives an easting coordinate of 500000, see below) is mapped to a vertical line along which the vertical (northing) coordinate is simply proportional to distance (on the ellipsoid) along that meridian; however,
  • the scale along the central meridian is not 1:1, it is 9996:10000. In other words, two points lying at 10km's distance from one another on the central meridian will have vertical (northing) coordinates differing by only 9996. The reason for this is that the map scale increases on either side of the meridian (as is unavoidable when mapping a curve surface) and the 0.04% decrease at the center is chosen to make the average scale on a 6°-wide zone roughly 1:1.
  • The two UTM coordinates, easting (given first) and northing (given second) are orthogonal and measured in meters (after the transverse mercator projection and the 9996:10000 scale are applied). Easting is measured horizontally, with the central meridian having value 500000 (in practice, it can take values from 166021 to 833979 at the equator, the range being more narrow at higher latitudes). Northing is measured vertically, with the equator having value 0 in the northern hemisphere and 10000000 in the southern hemisphere; in the northern hemisphere, it ranges from 0 at the equator to 9328094 at 84°N on the central meridian, or even 9997965 if used all the way to the pole (but this normally isn't supposed to happen: beyond 84°N, and beyond 80°S Universal Polar Stereographic coordinates should be used instead of UTM).
  • UTM is (nowadays) almost exclusively used with the WGS84 ellipsoid: this has a semimajor axis of a = 6378137m (exactly) and a flattening of f = 1 − b/a = 1/298.257223563 (exactly).

This is a complete definition, however it isn't a very usable one because it lacks a description of how to use the conformal part of the definition to actually convert geodetic coordinates to Universal Transverse Mercator. If we were to use a spherical Earth model, computations would be easy enough:

(Transverse Mercator computations, spherical Earth:)

  1. Start with latitude χ and longitude ϖ, and let ϖ0 be the central meridian's longitude;
  2. if we rotate the Earth to make the central meridian become the new (transverse) equator and the old equator become the new (transverse) reference meridian, then simple spheric trigonometry shows that the given point's transverse (i.e., new, i.e., rotated) longitude is ϖ = arctan[tan(χ)/cos(ϖϖ0)] and its transverse latitude is χ = arcsin[sin(ϖϖ0)·cos(χ)];
  3. now if we apply the formula for Mercator projection to these transverse coordinates (namely: longitude in radians gives one coordinate and the other is given by log(tan(π/4+χ/2)) where χ is longitude), we get the transverse Mercator x = log(tan(π/4+χ/2)) = arctanh[sin(ϖϖ0)·cos(χ)] and y = ϖ = arctan[tan(χ)/cos(ϖϖ0)] (in radians).
  4. It is then a simple matter of scaling (multiply x and y by the Earth's radius and by the 0.9996 scale factor) and translating (add 500000 meters to the easting coordinate and possibly 10000000 to the northing if in the southern hemisphere) to obtain UTM coordinates.

Here is a numerical example: consider the point with latitude χ=45° and longitude ϖ=0° and refer it to UTM zone 31's central meridian of ϖ0=3°. We find x = −0.037024017523 and y = 0.786083865778. If we convert these in meters by taking the Earth's radius to be such that the meridian's length is the same as for the WGS84 model (10001965.7293m), and taking into accound the 0.9996 scale factor, then we get an easting coordinate of 264345.75067 and a northing of 5003346.90008. As we shall see below, these coordinates differ quite sensibly (by about 16km) from the correct values obtained for an ellipsoidal Earth.

For future reference, the complex number z = y − i·x will be called the complex latitude (this is my terminology: but it makes sense since when the point is on the central meridian ϖ=ϖ0 then z is real and equals the latitude χ; so in the spherical Earth case, computing the transverse Mercator coordinates is basically just the same as computing this complex latitude).

Now in the case of a spheroidal Earth, things are much more complicated. For one thing, whereas longitude remains a simple concept (since we are assuming the ellipsoid in question has equal equatorial axes), the simple spherical latitude gives rise to half a dozen different concepts on a spheroid. The usual (geodetic) latitude, φ, is the angle which a line perpendicular to the ellipsoid at a given point forms with the equatorial plane. This is what the unqualified word latitude almost always means. But there are two other latitudes which are of importance:

Obviously conformal latitude is of importance to us because we are trying to define a conformal map. If we simply apply the spherical-Earth formulæ with conformal latitude instead of (geodetic) latitude we get a conformal map but it is not the transverse Mercator we are looking for because coordinates along the central meridian will not be proportional to distance as they are supposed to be: for that, rectifying latitude needs to play a role. In fact, rectifying latitude is exactly what we need (up to proportionality and a trivial additive constant in the southern hemisphere) to get the vertical (northing) coordinate along the central meridian. So somehow we need to use both the conformal and the rectifying latitudes. How?

The trick is to consider the function M which takes a conformal latitude χ to the corresponding rectifying latitude μ=M(χ). That function is very difficult to write down explicitly, because it involves taking the reciprocal of a horrendous formula and then yet applying an (incomplete) elliptic integral. Nevertheless, it exists conceptually, and it is an analytic real function: so it has a locally unique holomorphic extension to a complex neighborhood of its real domain of definition; the reason we care is that holomorphic complex functions are conformal mappings. In practice, M can be approached by various power series techniques.

So the procedure to compute UTM coordinates on an elliptic Earth is this:

(Transverse Mercator computations, ellipsoidal Earth:)

  1. Start with latitude φ and longitude ϖ: compute the conformal latitude χ corresponding to φ (there is a closed-form expression for this, so we are happy);
  2. apply the spherical-Earth computations, using χ as latitude: let z = y − i·x be what we have previously called the complex latitude (here the complex conformal latitude, of course): at this point, we have defined a conformal map, but the central meridian is parametrized by conformal latitude, not rectifying latitude as we would like it to be;
  3. compute z = M(z), where M is the (complex holomorphic extension of the) function taking a conformal latitude to the corresponding rectifying latitude: then z = y − i·x where x and y are the desired UTM coordinates
    {proof: since M is holomorphic, we have defined a conformal map, and since M takes a real conformal latitude to the corresponding rectifying latitude, it is what it should be on the real axis, but since real values suffice to identify an analytic function we are done}.

Here is a numerical example: consider the point with latitude φ=45° and longitude ϖ=0° and refer it to UTM zone 31's central meridian of ϖ0=3°. We find a conformal latitude of χ=44°48′27.662601″. Now applying the spherical-Earth transverse Mercator formulæ, we find x = −0.037148195538 and y = 0.782727307059. Then M(y−i·x) = y−i·x where x = −0.037148414843 and y = 0.783567347070. If we convert these in meters by taking into account the meridian's length for the WGS84 model (10001965.7293m), and taking into accound the 0.9996 scale factor, then we get an easting coordinate of 263553.97390 and a northing of 4987329.50469. This is the correct conversion: the point (45°N,0°) has UTM coordinates (263553.974,4987329.505) in zone 31 North.
Note that if we had naïvely applied the spherical-Earth transverse Mercator formulæ to the conformal latitude we would have found the incorrect value (263555.370,4981982.732), off by 5km; if we had applied the same formulæ to the rectifying latitude immediately, we would have found (263752.383,4987314.788), still off by 200m: so even for GPS-precision computations we can't simply forget about the complexity.

If we are aiming at a precision of slightly better than 1 metre, then the following numerical series expansions for M(z) (with the constants of WGS84) can be used: the first is around z=0 (to be used for latitudes less than 40°, say) and the second is around z=π/2 (to be used for latitudes above 40°):

I'm not sure how well these power series expansions compare with other classical approaches to computing UTM coordinates (e.g., pages 60–64 of this book).

(lundi)

Le taquin de Mathieu : le retour du fils de la vengeance

Bon, le taquin proposé dans l'entrée précédente était assez infaisable. Celui qui suit a le même groupe (toujours le groupe M24 de Mathieu) mais il est sans doute beaucoup plus faisable (et en tout cas plus amusant à essayer) :

Je ne propose pas une configuration précise à atteindre : je propose plutôt de mélanger le taquin (ce qui se fait en choisissant le lien « point d'interrogation à l'envers ») et de chercher ensuite à le remettre en ordre. Cette fois-ci le taquin a la forme de 7+1 colonnes sur 3 lignes : on peut cycler les lignes avec les flèches vers le haut et le bas, cycler les 7 colonnes principales (celle qui est séparée des autres reste alors fixe) avec les flèches vers la gauche et la droite, ou enfin appliquer un flip de Mathieu qui échange huit paires de cases coloriées de la même façon (cinq de ces huit paires sont contiguës : 02–03, 08–09, 11–14, 12–15 et 13–16 ; et les trois cases 22, 23, 24 de la colonne spéciale sont échangées avec 07, 21 et 20 respectivement). Cette présentation n'est peut-être pas encore totalement satisfaisante, mais elle n'a pas l'air complètement folle et on peut vaguement la retenir et même développer quelques techniques de jeu comme l'utilisation judicieuse de la colonne séparée et des deux cases échangeant en diagonale. Avant de jouer avec le taquin tout entier, on peut se familiariser avec le sous-groupe d'ordre 21 engendré par les flèches (ça c'est vraiment très facile), avec le sous-groupe d'ordre 54 envendré par les flèches verticales et le flip (c'est encore plutôt facile), et enfin avec le sous-groupe d'ordre 21504 engendré par les flèches horizontales et le flip (il permet par exemple d'échanger exactement les deux lignes d'en bas sans toucher à celle d'en haut, ce qui n'était pas évident a priori : voyez-vous comment ?). Quant aux 244823040 états du puzzle complet, j'arrive pour ma part à placer en gros deux cases où je veux, parfois trois, mais pas plus (le groupe M24 de Mathieu, je l'ai déjà expliqué, permet de placer cinq cases où on veut).

J'ai aussi essayé de rajouter la possibilité de jouer au clavier (avec les flèches et la touche insertion pour appliquer le flip), mais c'était probablement une mauvaise idée vu que la possibilité de capturer les touches en JavaScript est complètement bizarre et dépend horriblement du navigateur et marche mal même sur un navigateur bien connu comme Firefox (il y a plein de problèmes de focus).

(samedi)

Le taquin de Mathieu

À force de méditer sur les groupes simples finis, j'ai imaginé le puzzle suivant, que j'appelle le Taquin de Mathieu :

Votre but est d'inverser complètement les nombres, c'est-à-dire de mettre le 24 là où est le 01 initialement et vice versa, le 23 à la place du 02, le 22 à la place du 03, etc. Pour ça, on dispose d'essentiellement deux opérations : l'une consiste à décaler cycliquement les douze colonnes du puzzle (vers la droite ou la gauche), l'autre — que j'appellerai le flip de Mathieu — réalise simultanément huit échanges entre deux cases (chaque paire étant coloriée d'une même couleur pour qu'on les voie facilement), les huit autres cases (marquées en gris) restant fixes. Les trois symboles immédiatement en-dessous du tableau sont cliquables, et réalisent ces opérations (et celui encore en-dessous remet le puzzle à son état de départ). Arriver à la situation inverse demandée est faisable — mais ce n'est pas très facile.

Le puzzle a 244823040 états possibles — c'est considérablement moins qu'un Rubik's cube, pourtant il me semble possible qu'il soit, d'une certaine manière, plus difficile à résoudre : en effet, pour résoudre le Rubik's cube on va chercher à trouver certaines combinaisons qui font des opérations faciles à comprendre, alors que dans le groupe de Mathieu, en un certain sens, ces opérations n'existent pas (aucune opération ne peut laisser plus de huit points fixes, par exemple). Peut-être que je me trompe. Si vous y arrivez sans l'aide d'un ordinateur, dites-le-moi !

En tout cas, il s'agit d'une illustration d'une des choses que j'affirmais dans ma précédente entrée : si on cherche des puzzles de ce genre qui ne permettent pas de réaliser toutes les permutations possibles des pièces, ou au moins toutes les permutations paires, alors il n'y a en gros que celui-ci et un analogue sur douze pièces qui offrent une certaine liberté dans le mouvement des pièces (vous pouvez placer cinq pièces quelconques aux endroits que vous voulez, et c'est le maximum).

(dimanche)

Numérologie mathématique monstrueuse

Je l'ai mentionné il y a quelque temps, nous avons eu il y a un deux semaines à l'ENS un séminaire du mathématicien John McKay sur un phénomène paranormal mathématique appelé le Monstrous Moonshine : même si ce n'est pas ma spécialité, je voudrais dire un mot de ce qui tourne autour. (En fait, je viens de finir la lecture d'un petit livre de vulgarisation sur le sujet, Symmetry and the Monster de Mark Ronan, qui n'est pas mal du tout — même si c'est très insatisfaisant pour un mathématicien de lire des livres de vulgarisation adressés au grand public vu qu'on veut toujours en savoir plus.)

Il y a un débat récurrent autour de la question de savoir si les mathématiques sont découvertes ou inventées : même si la réponse n'a pas à être complètement d'un côté ou de l'autre, je pense que la plupart des mathématiciens eux-mêmes sont d'avis qu'elles sont découvertes, et assurément la théorie des groupes finis est un des domaines où la réponse découvertes s'impose le plus naturellement. Après une tentative (sans doute assez lamentable) pour expliquer à ma mère ce qu'est le Monstre, elle a commenté : les mathématiciens sont vraiment doués pour inventer des choses complètement farfelues — mais à mes yeux c'est une mésinterprétation complète de la réalité : personne n'a inventé le Monstre, il a été découvert par des gens qui ont été stupéfiés de le voir s'imposer à eux de cette façon. (Un des termes qui revient parfois dans la description du sentiment qu'ils ont eu en le découvrant est qu'il y avait something out there ; je ne saurais pas rendre ça en français, mais je trouve que c'est très fort.)

Il y a certainement quelque chose dans certaines branches des mathématiques, et notamment dans la théorie des groupes finis qui rappelle la fascination que les hommes ont pu avoir pour des pseudo-sciences comme la numérologie ou l'astrologie : je pense que c'est ça qui peut donner à des gens (y compris certains mathématiciens de branches plus éloignées, d'ailleurs !) l'impression qu'il s'agit de mathématiques un peu suspectes, où l'on étudie les propriétés magiques des nombres tels que 196883 ou 244823040. Je crois que des matheux un peu joueurs comme Conway s'en amusent beaucoup, en fait. La différence, c'est que les douze signes du zodiaque sont le résultat du hasard de configurations d'étoiles interprétées par les yeux d'astronomes anciens et qui auraient très bien pu être autrement alors que la table des caractères de M24 est quelque chose qui s'imposerait de la même façon à tous extra-terrestres ayant la curiosité de s'intéresser aux façons de réordonner des objets.

(mardi)

Une page se tourne

Maintenant c'est officiel :

Monsieur et Cher Collègue,

Suite à votre audition le 26 juin 2007 par la Commission de recrutement pour un emploi d'enseignant-chercheur à l'ENST en « Cryptographie », j'ai le plaisir de vous faire savoir que vous avez été classé premier.

Vous voudrez bien prendre contact avec […] afin de mettre en œuvre votre recrutement.

En vous félicitant pour ce succès, je vous prie de croire, Monsieur et Cher Collègue, en l'expression de mes salutations les meilleures.

Je quitte donc l'ENS l'an prochain pour devenir maître de conférences à l'ENST (je gagne une lettre de plus, quoi, et je me rapproche un peu de chez moi).

Avec un double défi : celui de faire de la recherche qui soit intéressante et de haut niveau à la fois mathématiquement et informatiquement. Informatiquement parce qu'on m'a recruté pour faire de la crypto et que je compte bien honorer ce devoir. Et mathématiquement parce qu'être mathématicien est mon rêve d'enfant et que je ne le lâcherai pas.

Mais on ne quitte pas sans une larme à l'œil un endroit qu'on a fréquenté assidûment pendant onze ans. Madame notre Directrice organisait justement aujourd'hui un pot pour le départ de ceux qui s'en vont (principalement des élèves, bien sûr, ceux de la promotion 2003, et j'en connais aussi beaucoup de cette année-là, qui commencent une thèse ou deviennent enseignants du secondaire), l'occasion de nous dire que nous serions toujours les bienvenus. Ça tombe bien, j'ai un copain dans cette École et il y a une bibliothèque de maths extrêmement bien fournie donc j'y serai sans doute encore souvent.


Comme une bonne nouvelle ne vient pas seule, j'apprends que le Bulletin de la Société Mathématique de France engage enfin la publication d'un article que j'y avais soumis en août 2004, et qui avait été accepté en janvier 2005. Les mathématiques ne sont pas trop pressées, mais trois ans c'est tout de même exceptionnellement long : la raison en est apparemment des difficultés techniques liées à une réorganisation de la chaîne de production du journal. J'espère tout de même que la revue sera datée de 2006, parce que sinon on risque de dire que le résultat de Madore (2007) a été ultérieurement généralisé par Hassett et Tschinkel (2006), ce qui me rend quand même un peu ridicule dans l'affaire.


Sinon, cela n'a pas de rapport, mais je viens de tomber sur une jolie suite d'entiers assez naturelle qui ne figurait pas encore dans l'encyclopédie des suites d'entiers de Sloane : j'ai donc proposé son ajout. J'espère qu'elle sera acceptée, parce que c'est quelque chose dont je suis assez fier que d'avoir fait rajouter quelques suites dans cette fabuleuse mine de numérologie scientifique (en l'occurrence, A033623, A046873, A051917 et A100002[#]).

Je propose donc cette nouvelle suite comme une énigme mathématique du jour (mais je serais vraiment très impressionné si quelqu'un la résolvait avant que la suite passe dans le Sloane) :

1, 1, 2, 10, 64, 596, 8056, 130432, 2534960, 59822884, 1718480368, 56754444440

Deux indications, tout de même, pour que ce ne soit pas complètement infaisable : premièrement, ça a un rapport avec les tableaux de Young (ou avec les représentations du groupe symétrique 𝔖n sur n objets), deuxièmement on peut considérer que c'est la continuation logique de A000041, A000085 et A000142.

Pour savoir la réponse, il suffira d'attendre que la suite soit ajoutée à l'encyclopédie…

[#] La A100002, d'ailleurs, malgré sa très grande simplicité (son mode de construction est tout à fait explicable à un enfant), a eu l'honneur d'attirer un peu sérieusement l'attention de Neil Sloane lui-même : je suppose que c'est pour ça qu'elle a eu droit à un numéro aussi spécial. Et par ailleurs elle produit une musique vraiment très intéressante.

(mercredi)

Séries de Hahn, théorèmes de Kedlaya et algébricité

La série annuelle des exposés de maîtrise (d'initiation à la recherche) des normaliens de première année vient de commencer, donc cette année encore je vais assister à un grand nombre d'exposés mathématiques (pour la plupart très intéressants) sur des sujets très variés. Aujourd'hui il y en a un qui a particulièrement retenu mon attention puisqu'il était question d'une de ces constructions mathématiques que je trouve particulièrement remarquables. Et qui m'est très chère puisque je l'avais redécouverte il y a quelques années sans savoir que c'était un objet classique (j'étais allé, tout excité, en parler à mon directeur de thèse qui m'avait aussitôt sorti un préprint qui expliquait ça et qui répondait à certains des problèmes que je m'étais posés à ce sujet) : il s'agit des séries de Hahn, ou de Mal'cev-Neumann (les deux noms se trouvent, et je ne sais pas si l'un est plus correct). Même si j'ai pour habitude de ne pas parler de maths sur ce blog[#] je vais tout de même essayer de décrire de quoi il s'agit et pourquoi je trouve ça remarquable. En supposant que le lecteur est un peu familier avec des notions de base d'algèbre (disons, séries formelles et extensions de corps).

Pour introduire cette notion je pourrais commencer par partir de l'anneau F[t] des polynômes en une indéterminée t à coefficients dans un corps F (qui sera, pour l'essentiel, un corps fini). Il s'agit de généraliser cette notion : une première généralisation, puisque les polynômes s'écrivent comme des sommes formelles de termes ci·ti pour i parcourant un nombre fini d'entiers naturels, serait d'autoriser les sommes infinies de cette forme, c'est-à-dire que i parcourt tous les entiers naturels ; on obtient ainsi l'anneau F[[t]] des séries formelles en l'indéterminée t. Par exemple, 1+t+t²+t³+⋯ (somme de tous les ti avec tous les coefficients ci égaux à 1) est une série formelle, qui est l'inverse de 1−t [#2]. Une nouvelle intéressante, c'est que F[[t]] est un anneau de valuation discrète : sans chercher à définir cette notion, disons qu'il n'y a en gros qu'une seule série formelle qui n'est pas inversible, c'est t elle-même, au sens où si on lui donne un inverse alors toute série formelle (non nulle) en aura un.

On introduit donc l'anneau F((t)) des séries de Laurent : il s'agit toujours des sommes formelles de termes de la forme ci·ti, sauf que cette fois-ci on permet à l'exposant i de prendre des valeurs négatives (puisqu'on veut inverser t, il faut bien introduire un t à la puissance −1). Bien sûr, toute somme de cette forme n'est pas légitime : par exemple, il n'y a pas de sens à donner[#3] à la somme des ti sur tous les entiers relatifs i. La bonne condition est de demander que les i qui supportent la somme (c'est-à-dire ceux pour lesquels le coefficient ci est non nul) soient bornés inférieurement, ou de façon équivalente qu'il n'y ait qu'un nombre fini de termes à exposants négatifs. Il se trouve qu'on obtient ainsi un corps (toute série de Laurent non nulle est inversible), qui est le corps des fractions de l'anneau des séries formelles.

Pour aller plus loin, on cherche à résoudre certaines équations algébriques. Par exemple, dans le corps des séries de Laurent, la série 1+t a une racine carrée (si F est de caractéristique différente de 2), solution de l'équation algébrique f²−(1+t)=0, à savoir f = 1 + (1/2)t − (1/8)t² + (1/16)t³ − (5/128)t4 + ⋯ (bref, le développement asymptotique connu). Une autre nouvelle intéressante, c'est que F[[t]] est un anneau (local) hensélien : sans chercher à définir cette notion, disons qu'il n'y a en gros qu'une série de Laurent qui n'a pas de racine carrée, cubique ou je ne sais quoi, c'est t elle-même.

On introduit donc l'anneau F((t1/∞)) des séries de Puiseux : il s'agit toujours des sommes formelles de termes de la forme ci·ti, sauf que cette fois-ci on permet à l'exposant i de prendre des valeurs rationnelles (puisqu'on donner des racines à t, il faut bien introduire un t à la puissance ½ ou autres). Bien sûr, toute somme de cette forme n'est pas légitime : de même que pour définir les séries de Laurent on avait imposé aux exposants supportant la série (c'est-à-dire intervenant effectivement dedans) d'être bornés inférieurement, de même, cette fois, on demandera qu'ils aient un dénominateur borné (ou, de façon équivalente, qu'il y ait un même dénominateur qui convienne pour tous les exposants) — on continue bien sûr d'imposer que les exposants soient eux-mêmes minorés. C'est-à-dire, si on préfère, qu'une série de Puiseux est une série de Laurent en t1/k pour un certain k (qui dépend de la série, mais qui doit convenir pour tous les coefficients de celle-ci). Il est trivial que la somme de deux séries de Puiseux est encore une série de Puiseux, et il est facile de vérifier que cela vaut aussi pour le produit (qui s'écrit formellement comme on le devine), et que les séries de Puiseux forment un corps.

(mercredi)

Devinette mathématique du jour

Quelle est la logique derrière les suites binaires :

…101000001100011110110111010111100010001001110011100010010011010100001001100010110110100010101000101100100001000101011001

et

001111100001011011010000100100011010010101011110001110000101000110011000101100010011001100100010100110010001000100000110…

? (Précisons que j'aurais pu poser la question pour chacune séparément : il y a une certaine beauté à les mettre ensemble, mais elle n'est pas du tout évidente.) Ce n'est pas la peine de chercher dans le Sloane, aucune des deux n'y est (et c'est tout à fait normal).

(mercredi)

Célébrité de la semaine

Ciel ! Mon voisin de bureau (pour quelques jours) est Pierre Deligne ! je ne vais vraiment pas oser lui parler.

(samedi)

Géométrie plane : I. Géométrie projective

Comme promis, je vais tenter, en une série de posts dans ce blog, de faire un peu de vulgarisation de la géométrie plane, et je commence par parler de la géométrie projective.

Alors, qu'est-ce que c'est que la géométrie projective ? C'est un terme qui fait souvent peur (par exemple à mes agrégatifs ;-)), et je n'arrive pas à comprendre pourquoi : la géométrie projective, au contraire, c'est la plus simple qui soit, parce qu'il n'y est question ni d'angles ni de distances, ni même de droites parallèles, mais uniquement de droites qui se rencontrent et de points alignés. La géométrie projective, donc, c'est celle que vous faites si vous avez pour seul instrument une règle non graduée (et un papier et un crayon, d'accord) : vous pouvez relier deux points par une droite, vous pouvez trouver le point d'intersection de deux droites, mais vous ne pouvez rien faire d'autre. Cela semble très facile ? Pourtant, on entre déjà dans un monde assez riche.

Avant d'en dire plus, il faut que je torde le coup à un des trucs qu'on associe typiquement à la géométrie projective : les points à l'infini. Si vous voulez faire de la géométrie projective, disons, sur une feuille de papier (qui est plutôt un modèle de la géométrie euclidienne), vous allez régulièrement tomber sur des droites qui se coupent loin hors de votre feuille de papier : ça ce n'est pas grave, vous savez qu'elles se coupent quand même (enfin, ce sera peut-être pénible pour faire la figure si vous devez relier ce point d'intersection à un autre, mais il y a des astuces pour y arriver quand même) ; et parfois les droites seront carrément parallèles, c'est-à-dire qu'elles ne se coupent pas dans le monde euclidien. Mais en géométrie projective (plane, bien sûr), deux droites sont censées toujours se rencontrer : alors pour faire quand même de la géométrie projective à partir d'un truc euclidien, on rajoute un point fictif, qu'on appelle point à l'infini, dans chaque direction de droite possible, et c'est le point où se coupent toutes les droites parallèles ayant cette direction. Vous pouvez l'imaginer très très loin dans un sens, ou aussi bien dans l'autre puisque, après tout, seule la direction de la droite compte, pas son sens. Et on regroupe tous ces points à l'infini sur une droite fictive, la droite à l'infini. Mais notez bien que la notion d'être à l'infini n'existe pas en géométrie projective : pour celle-ci, ces points à l'infini ou cette droite à l'infini n'ont rien d'inhabituel ou de différent des autres, c'est uniquement parce qu'on cherche à représenter la géométrie projective dans un contexte euclidien (ou, plus exactement, affine) qu'il y a des choses qui partent à l'infini.

[Figure géométrique] [Figure géométrique] [Figure géométrique]Pour essayer de donner une première image de la géométrie projective, je commence par les trois figures ci-contre (à gauche). La première est une figure euclidienne typique : une grille régulière, avec cinq droites parallèles horizontales (rouges) régulièrement espacées, cinq droites parallèles verticales (vertes) qui leur sont perpendiculaires et qui sont aussi régulièrement espacées, et neuf droites diagonales (bleues) toujours régulièrement espacées. Mais, je répète, aucune de ces notions (parallèles, régulièrement espacées, perpendiculaires) n'est une notion projective. La figure de droite est, pourrait-on dire, la vision qu'a la géométrie projective de la figure de gauche : projectivement c'est exactement la même figure (cinq droites rouges qui concourent, cinq droites vertes qui concourent, et neuf droites bleues, correspondant aux diagonales des 25 intersections, qui concourent aussi). Pour passer d'une figure à l'autre, on a appliqué ce qu'on appelle une transformation projective ; simplement, le point de rencontre des droites vertes, ou des droites rouges, ou des droites bleues, qui étaient à l'infini sur la figure de gauche, a été ramené à distance finie (je répète que projectivement ceci n'a pas de sens, j'explique simplement en quoi diffèrent les représentations de la même figure projective) ; la droite en pointillés est celle qui était à la droite à l'infini sur la première figure : on a la confirmation que les points de rencontre des droites rouges, des droites vertes et des droites bleues sont bien alignés (ceci confirme qu'on a raison de décréter que les points à l'infini constituaient collectivement une droite à l'infini). Et la figure du milieu, alors ? Je l'ai mise là pour comparaison, c'est la vision qu'a de la figure de gauche la géométrie affine, dont je ne parle pas plus aujourd'hui. (Pour résumer, en géométrie euclidienne, les trois figures sont distinctes ; en géométrie affine, les deux de gauche sont la même et la troisième est distincte ; et en géométrie projective les trois sont la même.)

Peut-être les figures ci-dessus vous évoquent-elles un dessin en perspective, avec des points de fuite. C'est tout à fait normal : la géométrie projective est le cadre naturel pour tout ce qui concerne la perspective (à ceci près qu'ici je parle de géométrie plane alors que la perspective est l'opération — projective — qui consiste à effectuer une projection de trois vers deux dimensions). D'ailleurs, si la géométrie projective a été développée au XIXe siècle à l'instigation de Jean-Victor Poncelet, elle avait été en quelque sorte préfigurée par les travaux de Gérard Desargues, au XVIIe siècle, qui cherchait à mathématiser les règles de la perspective (telles que dégagées à la renaissance).

La géométrie projective peut être présentée de façon axiomatique : on a deux types d'objets, les points et les droites, et une relation possible entre eux, l'incidence (l'incidence d'un point avec une droit veut dire, tout simplement, que le point est sur la droite — ou que la droite passe par le point, si on préfère ; soit dit en passant, il n'y a pas spécialement plus de raison de considérer qu'une droite est l'ensemble de ces points que de considérer qu'un point serait l'ensemble des droites passant par lui : on suppose juste qu'on a cette relation d'incidence). Les axiomes, donc, affirment (1) que par deux points passe toujours une droite, qui est unique si les points sont distincts, (2) que deux droites se rencontrent toujours [et si elles sont distinctes, le point par lequel elles passent toutes deux est unique, d'après l'axiome précédent], (3) qu'il existe quatre points dont trois quelconques ne sont pas alignés (ça ce n'est pas bien passionnant). Est-ce tout ? Ça dépend.

[Figure géométrique]Dans la géométrie projective qu'on considère normalement (celle qui se lie avec la géométrie euclidienne, par exemple), il y a une autre propriété fondamentale, qui ne découle pas des axiomes (1), (2) et (3) ci-dessus, et qu'on va donc prendre pour axiome (4) : le théorème de Pappus (ça s'appelle théorème de Pappus même si on le prend pour axiome, parce que dans d'autres cadres, par exemple en géométrie euclidienne, ça pourrait être un théorème). Le théorème de Pappus est illustré par la figure ci-contre, constituée de neuf droites et de neuf points marqués, avec toutes sortes de symétries remarquables. Que dit-il au juste ? En fait, il dit à peu près tout ce que vous voudrez lire sur cette figure : prenez un quelconque parmi les neuf points de la figure, ou une quelconque parmi les neuf droites, et retirez-le mentalement de la figure, faites pour hypothèses tout ce que vous avez comme incidence parmi les points et les droites restantes, et la conclusion du théorème c'est celle qui correspond au point ou à la droite que vous avez retiré, autrement dit, c'est que les trois droites qui ont l'air d'y passer sont bien concourantes (si vous avez choisi un point) ou que les trois points qui ont l'air de s'y situer sont bien alignés (si vous avez choisi une droite). Si cette explication n'est pas claire, voici un énoncé précis : si u, v et w sont trois points alignés, et si u′, v′ et w′ en sont trois autres, alors le point u″ d'incidence de (vw′) et (wv′), le point v″ d'incidence de (wu′) et (uw′), et le point w″ d'incidence de (uv′) et (vu′), sont alignés. Avec les axiomes (1), (2), (3) et (4), vous avez ce qu'on considère le plus usuellement comme (le fondement axiomatique de) la géométrie projective : ou, si on veut être précis, la géométrie projective pappienne.

[Figure géométrique]Une des conséquences des axiomes (1), (2), (3) et (4) est le théorème de Desargues, qu'on va appeler (4†), qui assure que si uvw et uvw′ sont deux triangles tels que les droites (uu′), (vv′) et (ww′) (droites vertes sur la figure ci-contre) soient concourantes en un point o, alors le point w″ d'incidence de (uv) et (uv′), le point u″ d'incidence de (vw) et (vw′), et le point v″ d'incidence de (wu) et (wu′), sont alignés (sur la droite bleue sur la figure ci-contre). Le théorème de Desargues (4†) a lui-même pour conséquence le petit théorème de Desargues[Figure géométrique], (4‡), qui est le même énoncé en supposant, en plus, que u″ et v″ sont alignés avec o (et la conclusion, c'est que w″ est aligné avec tout ce beau monde) — autrement dit, le petit théorème de Desargues affirme la même chose que le grand mais dans le cas particulier où la droite d'alignement passe par le point de concours.

Pour résumer, en plus des axiomes (1), (2) et (3), on peut prendre un quatrième axiome, qui peut être (4) (le théorème de Pappus), ou des choses plus faibles : (4†) (le théorème de Desargues), (4‡) (le petit théorème de Desargues), ou rien du tout. On définit ainsi la géométrie projective pappienne, desarguienne, petite-desarguienne, ou sans hypothèse desarguienne, en allant du plus particulier au plus général (tout ce qui est vrai en géométrie desarguienne l'est en géométrie pappienne, tout ce qui est vrai en géométrie petite-desarguienne l'est en géométrie desarguienne, etc.) ; je ne peux pas vous montrer des figures dans une géométrie qui ne soit pas pappienne, parce que dans le plan projectif réel le théorème de Pappus est vrai ; cependant, on sait qu'il existe des modèles de la géométrie desarguienne non pappienne (comme le plan projectif quaternionique), petite-desarguienne non desarguienne (comme le plan projectif octonionique) ou complètement non desarguienne (comme le plan de Hughes). Les géométries pappiennes, desarguiennes et petites-desarguiennes, sont fortement liées à des structures algébriques qui sont les corps (commutatifs), les algèbres associatives à divisions, et les algèbres alternatives à divisions ; la géométrie non desarguienne, elle, relève sans doute plutôt de la combinatoire et elle est encore assez mal comprise.

Chose intéressante, à partir de la dimension 3, le théorème de Desargues est automatique (c'est-à-dire qu'il découle des axiomes analogues de (1), (2) et (3) et que je ne chercherai pas à énoncer précisément. C'est donc uniquement en géométrie plane qu'on peut considérer des structures moins que desarguiennes.

Mais si on a dans l'idée de s'intéresser à la géométrie plane réelle, alors le théorème de Pappus est bien l'axiome à prendre, donc je referme cette parenthèse (et j'adopte l'axiome (4)).

[Figure géométrique][Figure géométrique]Cette note est déjà bien trop longue, mais avant de la conclure je voudrais évoquer la dualité points↔droites : car il n'aura pas échappé au lecteur attentif que, en géométrie projective (plane !), points et droites jouent des rôles remarquablement symétriques. C'est tellement vrai que tout théorème de géométrie projective se dualise, c'est-à-dire que lorsque vous avez un théorème vous avez automatiquement un théorème dual obtenu en remplaçant les points par des droites et les droites par des points (l'affirmation qu'une droite passe par un point devient celle qu'un point soit sur une droite ; l'affirmation trois points sont alignés devient celle que trois droites concourent ; etc.) : c'est le cas, tout simplement, parce que tous les axiomes se dualisent. C'est d'ailleurs cette idée de dualité points↔droites qui a mis Poncelet sur la piste de la géométrie projective. En fait, il s'avère que non seulement les théorèmes se dualisent mais même les figures individuelles le peuvent : à droite ci-contre, par exemple, j'ai représenté la figure duale de celle de gauche : chaque droite de la figure de gauche correspond à un point de celle de droite (si ce n'est que certains sont hors du cadre du dessin) et vice versa. Je laisse le soin au lecteur de retrouver ce qui est associé à quoi ; et dans une prochaine note je parlerai des coniques (qui permettent, justement, cette merveille).

(mercredi)

Géométrie plane

On m'a fait remarquer que je n'essaie quasiment jamais, sur ce blog, et c'est dommage, de faire de la vulgarisation mathématique : il y a à cela toutes sortes de raisons, comme le fait idiot qu'il est très fastidieux d'écrire des formules mathématiques, même très simples, dans une page HTML (donc je préfère encore le format PDF dès qu'il s'agit de faire quelque chose d'un minimum sérieux) ; et puis il y a le fait fondamental que la vulgarisation du savoir scientifique est un art très difficile, surtout quand on sait qu'on sera lu aussi bien par des experts et par des gens qui n'y connaissent rien, et qu'on doit s'arranger pour présenter les choses de façon que les uns ne trouvent rien à redire (voire, trouvent ça intéressant) et que les autres comprennent quand même ! Je me contente donc le plus souvent de remarques rapides (et pas forcément très compréhensibles) lorsque je tombe sur quelque chose qui m'excite mathématiquement et qui soit vaguement communicable au profane.

Il y a cependant un sujet dont j'aimerais parler — mais je ne sais pas encore sous quelle forme, parce que je risque d'avoir nettement trop à en dire pour faire juste une entrée de blog, alors ce serait peut-être un feuilleton, que je rassemblerais plus tard dans une unique page HTML (avec encouragements à recopier ce qu'on veut sur Wikipédia). Il s'agit de la géométrie plane.

Pourquoi la géométrie ? Parce que d'une part c'est un sujet qui parle à tout le monde, qui ne rebute pas d'emblée, même les plus réfractaires aux mathématiques : c'est généralement là que la notion de démonstration passe le mieux. Mais d'autre part parce qu'on peut quand même trouver énormément de choses mathématiquement intéressantes à dire, autour de la méthode axiomatique, de la géométrie projective (vue à la Artin et Coxeter), autour de la géométrie algébrique, même. Et, tout simplement, parce que je suis géomètre (c'est mon métier de chercheur, et c'est aussi quelque chose sur quoi j'interviens comme enseignant dans le cadre de la prépa agreg à l'ENS).

[Figure géométrique]Malheureusement, qui dit géométrie dit jolies figures à regarder. Et, mine de rien, c'est bigrement pénible à réaliser correctement avec un ordinateur, des figures de géométrie. À titre d'exemple, prenez la figure ci-contre, censée illustrer le théorème de Desargues (qui assure que si deux triangles, coloriés sur la figure, ont les sommets portés par trois droites concourantes, vertes sur la figure, alors les points de rencontre des côtés correspondants, en bleu sur la figure, sont alignés — enfin, il y a plein de façons de lire la même figure, bien sûr, notamment comme la réciproque de la même chose), un des théorèmes fondamentaux de la géométrie projective. Ça n'a l'air de rien, mais ça a été un boulot important de la produire (surtout que je voulais à la fois satisfaire mon idée de comment les points devaient être placés et l'exactitude des relations mathématiques d'incidence).

Et il n'y a pas que ça : il y a aussi la question quel format graphique utiliser ?. En l'occurrence, cette image est à l'origine un fichier SVG, un format d'images vectoriel : seulement, je ne sais pas dans quelle mesure ce format est nativement compris par les navigateurs Web typiques, donc, ci-contre, j'ai utilisé une image PNG plutôt que de mettre directement le SVG. Mais si vous cliquez sur l'image (faites-le !), vous obtiendrez le SVG, ce qui permettra de savoir si votre navigateur gère ce format (normalement l'image devrait être la même).

Voilà que je n'ai encore rien dit et qu'il faut déjà que je m'arrête. Mais je précise déjà quel serait mon but : il ne s'agirait pas vraiment de parler d'un sujet précis en géométrie, mais plutôt d'expliquer de façon compréhensible au non-mathématicien quels sont, dans l'esprit du programme d'Erlangen de Klein, les différents niveaux d'étude qu'on peut faire de la géométrie plane et des structures qui l'enrichissent, que je pourrais résumer par le tableau suivant :

Géométrie projective
d=8
Géométrie elliptique
d=3
Géométrie affine
d=6
Géométrie hyperbolique
d=3
Géométrie euclidienne
d=3 (voire 4)

Pour dire les choses très succinctement, plus on descend dans ce tableau plus on rajoute de la structure : alors que la géométrie projective ne connaît que les droites et les points et une relation d'incidence (un point est sur une droite, une droite passe par un point), la géométrie affine a une notion de droites parallèles, et la géométrie euclidienne a une notion de distances et d'angles. Du coup, cela diminue les transformations qui préservent cette structure : le nombre d que j'ai indiqué dans le tableau mesure le nombre de degrés de liberté dont on dispose encore, compte tenu de la structure imposée. Et de gauche à droite, très grossièrement, on passe de la géométrie elliptique où deux droites ne sont jamais parallèles, à la géométrie affine/euclidienne où c'est un cas possible mais limite, et à la géométrie hyperbolique où deux droites peuvent être, en quelque sorte, plus que parallèles.

(mardi)

Encore une curiosité mathématique

Comme je l'ai signalé à bien des reprises, mes goûts mathématiques sont assez portés vers les objets élégants et insolites qui pourraient figurer dans un musée des curiosités du paradis platonique. Parmi mes préférés, vu mon domaine de recherche, figure évidemment le( graphe de)s vingt-sept droites sur la surface cubique : c'est en effet quelque chose d'assez frappant que, même si les surfaces cubiques ne sont pas toutes identiques, toutes (enfin, toutes celles qui sont lisses) ont 27 droites géométriques tracées dessus et que la relation d'incidence sur ces droites (c'est-à-dire lesquelles coupent lesquelles) et toujours la même ; elles définissent donc une structure combinatoire (un graphe à 27 sommets, chacun étant relié à 10 autres) unique et remarquable[#]. Mais j'ai appris qu'il existe un polyèdre (le polyèdre 221 de Schoute) qui code de façon extrêmement élégante la structure de ces 27 droites : il s'agit d'un polyèdre (convexe) à faces carrées, ayant 27 sommets, correspondant aux 27 droites sur la surface cubique, de sorte que deux sommets sont à distance 1 si les droites correspondantes ne se coupent pas, et √2 si elles se coupent, et que les 45 triangles équilatéraux de côté √2 définis par trois droites deux à deux sécantes ont tous le même centre ; je ne peux malheureusement pas le tracer puisqu'il vit dans un espace euclidien de dimension 6. Il est toutefois très facile de donner les coordonnées de ses sommets : en représentant des points de l'espace euclidien de dimension 6 comme des triplets de nombres complexes, ce sont les (0,ωa,−ωb), les (−ωb,0,ωa) et les (ωa,−ωb,0), où a et b varient entre 1 et 3 et où ω est une racine cubique primitive de l'unité.

[#] Rien que son groupe d'automorphismes, le groupe de Weyl d'un système de racines de type E6, à 51840 éléments, est un objet remarquable en lui-même, et qui apparaît à des endroits inattendus des mathématiques.

(lundi)

De quelle science relèvent ces énigmes ?

On m'a posé aujourd'hui l'énigme suivante :

Le cruel Docteur No a capturé 100 mathématiciens pour les soumettre à une épreuve démoniaque. Il a placé (dans un ordre connu de lui seul) le nom de chacun des 100 mathématiciens dans autant de boîtes numérotées de 1 à 100. Après avoir permis aux mathématiciens de se concerter, il va les soumettre à son épreuve dont il leur communique les termes : il empêchera toute communication entre eux et les emmènera, dans un certain ordre, dans la pièce où se trouvent les 100 boîtes. Lorsqu'un mathématicien est dans la pièce, il pourra ouvrir une boîte de son choix pour lire le nom qui y figure, puis, s'il le souhaite, en ouvrir une autre, puis éventuellement une autre, et ainsi de suite jusqu'à 50 boîtes au maximum. (Les boîtes sont, bien entendu, refermées avant le passage du prochain mathématicien, puisque toute communication est interdite après la concertation initiale.) Le but de chaque mathématicien, lorsqu'il passe dans la pièce contenant les boîtes, est d'ouvrir la boîte contenant son nom (parmi les ≤50 boîtes qu'il peut ouvrir). Si chaque mathématicien a réussi à ouvrir la boîte contenant son nom, alors le Docteur No les libérera tous. Si ne serait-ce qu'un seul n'a pas réussi, alors le Docteur No tuera tous les mathématiciens avec ses tortures particulièrement raffinées.

Si chaque mathématicien ouvrait bêtement 50 boîtes au hasard, il aurait une chance sur deux de voir son nom dans l'une d'elles, et la probabilité que tous les mathématiciens réussissent le test (donc soient libérés) serait d'une chance sur 2 puissance 100 (en gros une chance sur un quintillion, ce qui ne pèse pas très lourd). Mais comme ce sont des mathématiciens, ils vont trouver une solution bien plus intelligente. 8-) En fait, ils élaborent une stratégie qui leur permet d'avoir plus de 30% de chances de s'en sortir. Comment font-ils ?

Mon propos n'est pas de donner la réponse à cette énigme (qui m'a demandé un bon moment de réflexion, d'ailleurs), je le ferai éventuellement plus tard (mais sans doute quelqu'un se dévouera-t-il dans les commentaires), mais de faire le parallèle avec d'autres. Il y a en effet toutes sortes d'énigmes bien connues dans ce genre, et qui font souvent appel au Docteur No et à nombre variable de mathématiciens.

En voici une autre :

Le cruel Docteur No a capturé 50 mathématiciens pour les soumettre à une épreuve diabolique. Il a créé sur son île une pièce vide à l'exception d'une lampe et d'un interrupteur qui sert à l'allumer ou l'éteindre. Après avoir permis aux mathématiciens de se concerter, il va les soumettre à son épreuve dont il leur communique les termes : il empêchera toute communication entre eux (autre que celle qui va être décrite) et emmènera chaque jour un mathématicien tiré au hasard dans la pièce où se trouve l'interrupteur. La lumière est initialement éteinte. Chaque fois qu'un mathématicien passe dans la pièce, il constate si le précédent avait laissé la lumière allumée ou éteinte (c'est la seule forme de communication possible), et peut lui-même choisir de la laisser dans son état précédent ou de l'allumer ou de l'éteindre. Le but des mathématiciens est de savoir à quel moment tous les mathématiciens sont passés par la pièce : si un mathématicien en acquiert la certitude, il peut l'annoncer au Docteur No. Il est hors de question de se tromper, bien sûr, car cela serait puni de la mort avec des tortures particulièrement raffinées pour tous les mathématiciens ; en revanche, si l'affirmation est juste, tous les mathématiciens sont libérés. Quelle stratégie les mathématiciens peuvent-il élaborer pour être (« presque ») certains, un jour, d'être tous libérés ?

Les chapeaux sont aussi une source populaire d'énigmes de ce style : les deux suivantes peuvent paraître particulièrement surprenantes à première vue, mais sont sans doute plus simples que celles qui précèdent.

Le cruel Docteur No a capturé 20 mathématiciens pour les soumettre à une épreuve pernicieuse. Il a créé des chapeaux de plusieurs couleurs différentes. Après avoir permis aux mathématiciens de se concerter, il va les soumettre à son épreuve dont il leur communique les termes : il empêchera toute communication entre eux (sauf comme on va le dire), puis rangera les mathématiciens en file indienne dans un certain ordre, et mettra sur la tête de chacun un chapeau d'une certaine couleur (les couleurs possibles sont connues à l'avance), de sorte que chaque mathématicien puisse voir les couleurs des chapeaux de tous ceux situés devant lui, mais pas de ceux situés derrière lui ni du sien propre. Dans l'ordre qui leur plaira, les mathématiciens devront annoncer la couleur de leur propre chapeau (c'est la seule forme de communication permise entre eux) ; le Docteur No tolérera un échec (car il faut bien admettre que personne ne peut voir la couleur chapeau du mathématicien situé tout derrière), mais pas plus : si plus d'un mathématicien s'est trompé en annonçant la couleur de son chapeau, tous seront tués avec des tortures particulièrement raffinées — à l'inverse, si tous ou tous sauf un avaient raison, ils seront libérés. Comment les mathématiciens se tirent-ils de ce mauvais pas (de façon certaine) ?

et

Le cruel Docteur No a capturé trois mathématiciens (il n'est pas en forme, aujourd'hui) pour les soumettre à une épreuve maléfique. Il a créé des chapeaux de deux couleurs différentes (là non plus, il n'est pas en forme). Après avoir permis aux mathématiciens de se concerter, il va les soumettre à son épreuve dont il leur communique les termes : il empêchera toute communication entre eux, puis mettra sur la tête de chacun un chapeau d'une certaine couleur, tirée au hasard parmi les deux couleurs possibles (les deux couleurs possibles sont connues à l'avance), de sorte que chaque mathématicien puisse voir les couleurs des chapeaux des deux autres, mais pas du sien propre. Chaque mathématicien sera ensuite amené devant le Docteur No où il pourra annoncer (sans que les autres l'entendent) quelle était la couleur de son propre chapeau. Si un mathématicien a fait une annonce erronée, le Docteur No les tuera tous avec des tortures particulièrement raffinées ; de même si aucun ne fait d'annonce ; en revanche, si au moins un mathématicien fait une annonce correcte et qu'aucun ne fait d'annonce incorrecte, le Docteur No les libérerera. Comment les mathématiciens font-ils pour avoir trois chances sur quatre d'être libérés ?

La réaction commune, par exemple pour ce dernier problème, est quelque chose comme c'est impossible : si on ne peut pas voir son chapeau, on ne peut déduire aucune information en voyant celui des autres, et comme on ne peut pas communiquer, on ne peut rien faire. Pourtant, ces problèmes admettent bien des solutions, pas spécialement difficiles (et ne nécessitant essentiellement pas de connaissances mathématiques, comme quoi le Docteur No aurait aussi bien pu capturer des agents secrets). On pourrait aussi chercher à généraliser ces problèmes de toutes sortes de façons (que se passe-t-il, pour le dernier, si on prend plus de trois mathématiciens ? et pour le deuxième, celui avec l'interrupteur, quelles stratégies permettent de s'en sortir relativement rapidement ?).

Le problème suivant a plus d'intérêt théorique que les précédents, mais il est aussi assez pénible à formuler :

Problème des généraux byzantins : Le Docteur No a capturé une dizaine de mathématiciens pour les soumettre à une épreuve byzantine. Il a créé des cellules dans lesquelles la lumière peut être allumée ou éteinte. Après avoir permis aux mathématiciens de se concerter, il va les soumettre à son épreuve dont il leur communique les termes : chacun va être placé dans une cellule, et ils pourront communiquer par des lignes téléphoniques reliant deux cellules quelconques (mais les conversations ne sont que d'une personne à une autre, jamais plus). Le Docteur No va envoyer à chaque mathématicien un message qui peut être soit les lumières doivent être allumées soit les lumières doivent être éteintes. Il n'envoie pas forcément le même message à tous les mathématiciens : néanmoins, tous devront faire la même action (tous doivent allumer leur lumière ou tous doivent l'éteindre) ; il n'y a que si tous ont reçu le même message que l'état de la lumière est impératif (autrement dit, si le Docteur No demande à tout le monde d'éteindre sa lumière, alors tout le monde doit l'éteindre ; s'il demande à tout le monde de l'allumer, alors tout le monde doit l'allumer ; s'il envoie des messages différents à des mathématiciens différents, alors les lumières peuvent être allumées ou éteintes, mais toutes doivent etre dans le même état). Jusque là, il n'y a aucune difficulté, il suffit que chacun communique à tous les autres le message qu'il a reçu du Docteur No et qu'on suive une stratégie décidée à l'avance. Le problème, c'est qu'un petit nombre de mathématiciens (un ou deux, peut-être trois, mais certainement pas plus) sont vendus au Docteur No : ce qu'ils feront (allumer ou éteindre les lumières) n'est évidemment d'aucune importance, mais on ne sait pas qui sont les traîtres et ils peuvent mentir effrontément au téléphone (ils peuvent dire à un mathématicien qu'ils ont reçu tel message et à un autre qu'ils ont reçu tel autre, par exemple). Le Docteur No exige, sous peine de tuer tous les mathématiciens loyaux avec des tortures particulièrement raffinées, que tous ces mathématiciens (loyaux) fassent la même chose (allumer ou éteindre la lumière) et que, s'ils ont tous reçu le même message, ils le suivent. Comment les mathématiciens loyaux peuvent-ils s'en sortir, malgré la présence des traîtres ?

Bon, je crois que ça suffit comme ça. Je préfère ne pas poser l'archi-classique problème des amazones qui tuent leurs maris quand elles savent qu'ils sont infidèles, parce qu'il est vraiment trop délicat à énoncer correctement, et son intérêt mathématique ou logique est assez douteux (et je ne vois pas comment le formuler à la manière d'une épreuve infligée par le cruel Docteur No).

Le fait est, en tout cas, que ces problèmes ont quelque chose en commun (pas juste ma façon de les raconter ;-)) : mais je ne saurais pas dire exactement quoi. Ils sont plus ou moins mathématiques ou, en tout cas, mathématiquement formulables, mais je serais incapable de dire à quelle branche des mathématiques il faudrait les rattacher. Or je voudrais bien pouvoir mettre un nom sur cette discipline et, surtout, en savoir plus, avoir une vraie théorie sous-jacente et pas juste des exemples épars de situations anecdotiques : je suis vraiment curieux de ce à quoi ça pourrait ressembler (en fait, avoir une théorie unificatrice me semble impossible mais, finalement, les problèmes eux-mêmes ont pu me paraître impossible et ça ne les empêche pas d'avoir une solution ; par ailleurs).

J'ai envie d'appeler ça la combinatoire cybernétique, car je range ça dans la combinatoire mais que, plutôt que d'énumérations ou d'étude de structures, il s'agit de problèmes de communication entre agents selon des stratégies pré-établies, ce qui peut se regrouper dans la cybernétique (si tant est que j'aie compris ce que ce mot veut dire).

(jeudi)

Nouvelles mathématiques

OK, ça fait une semaine que je n'ai rien écrit, et pourtant je me me suis pas pendu. Je plaide coupable, tout ça tout ça… J'ai fait des maths. :-)

La situation de ma recherche n'est pas ce que je croyais : j'ai réussi à contourner les problèmes (1) et (2), et à démontrer un résultat vaguement intéressant en utilisant un théorème un peu différent et en considérant une situation un peu plus générale pour laquelle le problème n'est pas trivial. Tout est pour le mieux ? Pas tant que ça : le lemme technique que j'avais démontré, lui, s'avère être déjà connu (un lemme essentiellement équivalent est démontré dans un article de 1986, au moins, que mon directeur de thèse a déniché). Certes, c'est satisfaisant d'avoir redémontré indépendamment quelque chose de déjà connu (cela veut dire que je suis, d'une certaine manière, « sur la bonne piste »), mais cela fait aussi que mon résultat final, même s'il est vaguement intéressant, est quand même trop simple pour en faire un article (malheureusement, on ne juge pas les résultats uniquement à leur énoncé mais aussi à la longueur de leur démonstration). Solution possible : le généraliser, en utilisant une version plus forte du lemme qui a été démontrée depuis ; mais ça risque d'être extrêmement difficile, et en tout cas je vais devoir potasser beaucoup de grothendieckeries (la cohomologie étale de variétés singulières) avant d'avoir la moindre chance d'y arriver.

En attendant, je dis un mot d'un résultat (« classique », si j'ose dire) sur lequel je suis tombé par hasard dans un livre, qui a un rapport lointain avec ce sur quoi je réfléchis en ce moment, et que je trouve extrêmement joli. J'ai déjà dû raconter que j'éprouvais une fascination particulière, en mathématiques, non tant pour les théorèmes que pour certains objets remarquables et particulièrement élégants que l'on peut admirer dans, pour ainsi dire, le musée des curiosités du paradis platonique. En l'occurrence :

La variété sécante de la surface de Veronese dans P5 est une hypersurface cubique.

Alors j'essaie d'expliquer ce que ce charabia veut-dire. D'abord, Veronese, ce n'est pas le peintre, c'est le mathématicien. La surface de Veronese (dans P5, i.e., dans l'espace (projectif) de dimension 5) est un très joli objet mathématique, dont il est malheureusement difficile de donner une image vu qu'elle habite un espace à cinq dimensions (on peut cependant en représenter une projection, ou surface de Steiner) : il s'agit de la surface définie paramétriquement par les équations (v,w)↦(v²,w²,vw,w,v), autrement dit, l'image du plan par le système complet de degré deux, (sauf qu'il est plus commode et plus élégant de travailler dans l'espace projectif, c'est-à-dire en rajoutant les points à l'infini, auquel cas le paramétrage devient (U:V:W)↦(U²:V²:W²:VW:UW:UV) en coordonnées homogènes, et on voit bien apparaître tous les monômes de degré 2). Elle a notamment la propriété remarquable que n'importe quelle conique du plan en est une section hyperplane (i.e. : si vous coupez la surface de Veronese, qui vit dans l'espace de dimension 5, par un hyperplan de dimension 4, vous obtenez l'image — par le paramétrage ci-dessus — d'une conique plane, et toute conique s'obtient de la sorte) ; et si vous l'intersectez avec un espace linéaire de dimension 3, il reste quatre points dans l'espace (on dit donc que la surface de Veronese en question est de degré 4).

Maintenant, la variété sécante (de la surface de Veronese), c'est la réunion de toutes les droites passant par deux points de la surface (et les limites de telles droites). Comme on part d'une surface, donc d'un objet de dimension 2, et que pour chaque couple de points sur cette surface on prend la droite qui les relie, qui est de dimension 1, on s'attend à ce qu'en réunissant ces droites on obtienne un truc de dimension 2+2+1=5, donc tout l'espace. Eh bien non ! En fait on n'obtient qu'un truc de dimension 4, parce que n'importe quel point de la réunion est situé, en fait, sur une famille à un paramètre de telles droites (donc il y a une dimension qui tombe). Si vous voyez dans l'espace à cinq dimensions (ce qui n'est pas mon cas, hélas) ça vous fait une configuration géométrique extrêmement jolie. Et ce truc de dimension 4, cette variété sécante à la surface de Veronese, a le bon goût d'être une hypersurface cubique (une droite générale de P5 rencontre en trois points des droites reliant deux points de la surface de Veronese) ! Algébriquement, cela correspond à la relation cubique remarquable suivante : (AU²+BU′²)·(AV²+BV′²)·(AW²+BW′²) + 2(AVW+BVW′)·(AUW+BUW′)·(AUV+BUV′) = (AU²+BU′²)·(AVW+BVW′)² + (AV²+BV′²)·(AUW+BUW′)² + (AW²+BW′²)·(AUV+BUV′)², entre les six quantités AU²+BU′², AV²+BV′², AW²+BW′², AVW+BVW′, AUW+BUW′ et AUV+BUV′. Cette hypersurface cubique a pour points singuliers exactement les points de la surface de Veronese. Si on la coupe par un hyperplan général, on obtient une hypersurface cubique qui est la variété sécante d'une courbe rationnelle normale de degré 4 (qui sont ses points singuliers). Si on la coupe par un espace linéaire de dimension 3 général, on obtient une surface cubique de Cayley, la seule surface cubique ayant quatre points singuliers (donc si on veut, l'hypersurface de dimension 4 dont on parle est la réunion de toutes les surfaces de Cayley ayant pour quatre points singuliers n'importe quels quatre points sur la surface de Veronese).

Bref, voilà de la très jolie géométrie, où mes « yeux » de géomètre algébriste me permettent de voir quelque chose qui, vivant en dimension 5, n'est pas évident à visualiser, mais dont je perçois quand même la beauté.

(mercredi)

Les maths, c'est trop zinjuste

J'ai passé des semaines à réfléchir sur un problème, à élaborer une stratégie de démonstration, à commencer à la rédiger, à me rendre compte d'erreurs, à les corriger, à trouver des erreurs dans ma façon de corriger les erreurs, à contourner ces erreurs, à croire que je touchais au but, pour finalement m'apercevoir aujourd'hui que (1) le résultat principal sur lequel je comptais appuyer toute ma démonstration est faux (je m'étais trompé en croyant me souvenir d'un théorème censément bien connu) et (2) de toute façon, le problème sur lequel je réfléchissais admet une réponse en deux lignes complètement évidente (i.e., le problème lui-même est sans intérêt). Je ne sais pas ce qui est le plus frustrant, entre (1) et (2), d'ailleurs.

Je me retrouve avec sur les bras un lemme technique qui m'a coûté très cher et qui a l'air de ne pouvoir servir dans aucun autre contexte que celui qui s'avère sans objet.

Quelqu'un a une corde, pour que je puisse me pendre ?

(lundi)

Le DVD Surfaces cubiques est arrivé !

J'en avais déjà dit un mot, le voici arrivé : le DVD Surfaces cubiques, avec plein de jolies animations, est prêt à être téléchargé.

Malheureusement, je n'ai pas encore réussi à mettre les mains sur un lecteur de DVD de salon (avec une vraie télévision dessus, et tout et tout) pour le tester… (Enfin, plus exactement, j'ai pu faire un essai et ça n'a pas marché, mais c'était très vraisemblablement un problème de support, i.e., un DVD+R mal finalisé, et pas un problème avec l'image elle-même, donc ça ne me dit rien.) Je serais donc reconnaissant à quelqu'un qui pourrait faire l'essai et me confirmer qu'il marche bien : d'ici là, je m'abstiens de faire trop de publicité pour ce truc, puisque s'il s'avère qu'il ne marche pas bien sur les lecteurs de salon je devrai le refaire.

(mercredi)

Un DVD artistico-mathématique

J'ai eu une idée saugrenue : à force de faire des vidéos de surfaces cubiques, je vais en réaliser un DVD. En effet, je n'arrête pas, en ce moment, de calculer des vidéos de ce genre : pas seulement des surfaces cubiques qui tournent, mais aussi qui se déforment les unes en les autres, des singularités qui se créent ou qui fusionnent, etc. Au début, c'était pour m'aider à me faire une représentation mentale des singularités possibles, mais il y aussi un aspect artistique parce que certaines de ces vidéos sont extrêmement jolies. À vrai dire, même en ayant fait une thèse sur le sujet, je ne me rendais pas compte à quel point ces surfaces de degré trois admettaient une incroyable richesse de formes, donc je m'émerveille de voir tout ce que j'arrive à faire voir.

Bon, la réalisation technique risque de poser encore quelques problèmes. Pour l'instant, je calcule des animations de 300 images que je fais répéter 5 fois, ce qui fait une vidéo d'une minute chacune, qui met autour d'une demi-heure à calculer — enfin, je peux facilement en faire deux en parallèle puisque mon ordinateur est un dual-core, et je pourrais faire plus en faisant appel à d'autres machines, donc ce n'est pas vraiment ça le facteur limitant. Ce qui sera plus délicat, si je veux faire un « vrai » DVD (lisible sur un lecteur de salon) ce sera de faire une structure de menus, de rajouter des explications, et de trouver les foutues options à utiliser (dans mencoder) pour faire une vidéo lisible partout.

Ensuite il faudra voir comment distribuer le résultat, aussi : j'ouvrirai un torrent, mais ce serait bien de pouvoir proposer à des gens intéressés d'en avoir une version gravée.

(jeudi)

Encore des jolies images de surfaces cubiques

[Surface cubique de Clebsch]J'avais déjà réalisé des images de surfaces cubiques lisses, comme celle qui décore cette entrée ou les deux que j'ai mises au frontispice de ma thèse ; mais cette fois, pour m'aider à lire le texte de Cayley dont je parlais hier j'ai fait quelques vidéos de surfaces cubiques ayant des singularités. Vous pouvez donc admirer :

Ces vidéos sont au format AVI contenant du codec DivX;-). Si vous ne trouvez pas mieux, utilisez VLC pour les lire.

(mercredi)

Un peu d'archéologie mathématique

On raconte souvent que les mathématiques sont des choses qui sont éternellement vraies et que les textes mathématiques ne vieillisent donc pas… c'est un peu exagéré.

J'avais besoin de résultats sur les types de singularités possibles pour une surface cubique. De fil en aiguille, j'ai remonté des références jusqu'à un mémoire d'Arthur Cayley de 1869 où il classifie complètement (en vingt-trois cas) les lieux singuliers possibles d'une surface cubique, et je me suis dit que j'allais essayer de regarder ça (après tout, 1869, ai-je pensé, ce n'est pas si vieux). Premier souci, je n'avais pas le titre exact du mémoire en question (seulement une référence à Cayley's famous memoir on cubic surfaces ; de fait, il s'avère que le titre exact est bien : A Memoir on Cubic Surfaces, comme quoi M. Cayley n'avait pas énormément d'originalité dans les choix de ses titres). Je rentre juste le nom d'auteur dans le catalogue de notre bibliothèque, et il me renvoie sur les œuvres complètes du Monsieur, lesquelles sont en réserve, en 13 volumes plus un volume d'index. Je demande donc à la bibliothécaire si je peux consulter le volume d'index, mais au début elle ne le trouvait pas (probablement parce que c'est un volume un peu plus petit que les autres et qu'on vient de déménager récemment donc peut-être la réserve n'est-elle pas encore bien rangée) : elle m'a donc suggéré quelques pistes pour trouver une version numérisée sur Internet. De fait, on en a trouvé une, dans les collections mathématiques historiques de l'Université du Michigan ; mais, de toute manière, en cherchant un peu plus, on a fini par me retrouver l'index dans la réserve, et j'ai pu faire sortir le bon volume (le VI, pour être précis). Qui, bien sûr, n'était même pas coupé : donc j'ai dû déranger de nouveau les bibliothécaires pour qu'on me trouve un coupe-papier (et ça non plus, ça n'a pas été facile).

Bon, comme ça n'a pas été facile, je vais moi-même mettre ce « fameux » mémoire sur Internet (puisque Cayley est mort il y a nettement plus de 70 ans, ça devrait être bon, et je doute que l'Université du Michigan m'ennuie au sujet de la façon dont les pages sont scanées) : voici donc A Memoir on Cubic Surfaces, by Arthur Cayley (Phil. Trans. R. Soc. London, 159 (1869), 231–326) [PDF, 6.1Mo], et une version réduite à 2 pages sur 1 plus commode à imprimer sur du papier A4. (J'aurais voulu mettre une version DjVu plutôt que PDF, parce que c'est quand même plus adapté pour un document scané, mais je ne trouve rien pour convertir l'un en l'autre de façon propre.)

Mais bon, une fois qu'on a l'article, les difficultés ne sont pas finies : les notations et la terminologie mathématique utilisées par Cayley sont, pour une bonne part, incompréhensibles pour un géomètre algébriste moderne : par exemple, ce qu'il appelle un point de type C2 s'appellerait aujourd'hui une singularité de type A1, je ne suis pas sûr de comprendre ce qu'il appelle un bord torsal d'un point biplanaire, ni ce qu'est la courbe spinodale (même si je devine vaguement que c'est la courbe des points dont le plan tangent intersecte la cubique en une courbe ayant un cusp en ce point). Je ne sais pas si je vais vraiment pouvoir en tirer quelque chose, de cet article.

Je me disais que je pourrais peut-être faire des graphismes de ces différents types de singularités, mais, évidemment, quelqu'un y a pensé avant : il y a même un site Web consacré aux surfaces singulières, avec visualisation en Java. Et pour quelque chose de plus traditionnel, je suis sûr qu'en cherchant un peu à l'IHP ou au Palais de la Découverte on pourrait me trouver des jolis modèles poussiéreux comme on en faisait autrefois représentant « en dur » toutes sortes de surfaces cubiques singulières.

Pour en savoir plus sur l'histoire des surfaces cubiques, voyez ici.

(Sunday)

A counterexample to the Hodge conjecture?

I can't tell from a superficial inspection whether this is correct (such spectacular claims require a great deal of prudence, although superficially it seems to make sense, and the authors obviously aren't crackpots); but if it is, (a) its authors might be eligible for a $1000000 prize and (b) a number of people I know will be quite disappointed.

Update: The authors just posted a revised version of the article, with the following comment: We no longer claim to have disproved the Hodge conjecture. Section 5 is deleted except for 5.3, and Theorems 6.2,6.3 are deleted.

(mercredi)

Conformations du cyclohexane

Petit exercice de géométrie dans l'espace (a priori compréhensible, et pourquoi pas résoluble, par n'importe quel lycéen) qui me semble particulièrement joli :

Soient a et b deux longueurs. On considère (dans l'espace euclidien de dimension 3, donc) un triangle équilatéral P0 P2 P4 de côté 2a. On appelle respectivement C1, C3 et C5 les cercles de rayon b ayant pour centres respectifs les milieux de [P0 P2], [P2 P4] et [P4 P0] et pour axes respecifs les droites portant ces mêmes segments. (Ainsi, si P1 est un point quelconque de C1, par exemple, alors les distances P0 P1 et P1 P2 valent toutes les deux ca²+b²=c².)

Supposons maintenant que P1 soit un point de C1 tel qu'il existe deux points distincts sur C3 (et donc aussi sur C5) à distance 2a de lui. Appelons P3 un de ces points, et P5 le point de C5 qui n'est pas « le même » (j'espère qu'on me comprend[#]).

Montrer que P1 P3 P5 est équilatéral (c'est-à-dire que la distance de P3 à P5 est elle aussi 2a).

J'ai une solution purement calculatoire (que je ne présenterai[#2] pas ici, parce qu'elle est assez fastidieuse). Je félicite d'avance celui qui me trouvera une démonstration courte, élégante et purement géométrique (sans calcul) de ce fait.

J'ai trouvé ce truc en digérant un oral d'agreg auquel j'ai assisté hier. Je laisse donc en question subsidiaire le problème de savoir quel est le rapport entre cet exercice et le titre de l'entrée (les conformations du cyclohexane, et notamment la question de la rigidité d'une conformation : pour fixer les idées, on appellera cyclohexane un hexagone pas nécessairement plan, dans l'espace, dont tous les côtés valent c et dont tous les angles valent un certain angle φ, avec mettons cos(φ/2)=b/c et sin(φ/2)=a/c).

Il faut essayer d'imaginer la cinématique de la chose : on fixe le triangle équilatéral P0 P2 P4 et le triangle équilatéral P1 P3 P5, de même côté, bouge en gardant constantes toutes les distances P0 P1, P1 P2, P2 P3 jusqu'à P5 P0. J'ai vaguement montré, aussi, qu'on peut passer continûment de l'une à l'autre des deux configurations possibles pour P1 donné (le mouvement du triangle P1 P3 P5 suit un cycle que j'aimerais bien voir illustré graphiquement).

Selon toute probabilité, ce truc porte le nom d'un illustre mathématicien d'un siècle passé, mais je ne sais pas lequel.

PS : J'ai posé la question sur Usenet, on verra bien si quelqu'un trouve une réponse.

Mise à jour (2006-07-21) : Pierre Dehornoy a trouvé une solution, que je reproduis ici :

Soit r la rotation autour de l'axe (P1 P4) qui envoie P0 en P2. Elle envoie alors le milieu de [P0 P4] sur celui de [P2 P4], donc elle envoie C5 sur C3. Comme P1 est sur l'axe de r, et que P1 P5 = P1 P3, r envoie P5 sur P3 (et non sur l'autre point qu'on a pas choisit, ca ca se voit en regardant l'ordre des points sur leur cercle). r envoie donc P0 en P2 et P5 en P3.

Or ce qu'on veut montrer c'est P3 P5 = P0 P2, il suffit donc de montrer que la distance de P5 à l'axe de r est la même que celle de P0 à ce même axe.

Comme P1 P5 = P4 P0 = 2a, et que P1 et P4 sont sur l'axe, il suffit de montrer que l'angle P4 P1 P5 est égal à l'angle P1 P4 P0. Et pour cela une condition suffisante est que les triangles P4 P1 P5 et P1 P4 P0 soient isométriques dans cet ordre. Or on a P4 P1 = P1 P4, P1 P5 = P4 P0 = 2a et P5 P4 = P0 P1 = c.

[#] S'il y a vraiment besoin d'explication : P3 et P5 sont deux points de C3 et C5 respectivement situés chacun à distance 2a de P1, et on suppose que P5 n'est pas le point de C5 obtenu à partir de P3 par symétrie par rapport au plan contenant C1.

[#2] Voici cependant le principe : on écrit le paramétrage rationnel standard (c'est-à-dire du style ((1-u²)/(1+u²), (2u)/(1+u²))), en fonction d'une variable u disons, du point P1 décrivant le cercle C1, et pareil avec des variables v et w pour les points P3 et P5. On appelle P(u,v) le polynôme, de degré 2 en chacune de ses variables, tel que P(u,v)=0 exprime le fait que la distance P1 P3 vaille 2a, et bien sûr P(u,w)=0 exprime de même le fait que P1 P5 vaille 2a. Il s'agit donc de vérifier que si v et w sont les deux racines (à u fixé) de l'équation quadratique P(u,t)=0 (en t), alors automatiquement P(v,w)=0. Or le polynôme P est symétrique en ses deux variables, donc le fait que P(v,w)=0 se vérifie en connaissant la somme et le produit de v et w, et ces deux quantités sont connues, si v et w sont les deux racines de P(u,t)=0, en fonction des coefficients de cette équation, qui sont des polynômes de u. Il y a donc simplement un calcul facile, quoique fastidieux, à mener pour arriver au bout.

(mardi)

Oraux d'agreg

Je reviens du lycée Marcelin Berthelot de Saint-Maur des Fossés où se déroulent (pour encore un jour) les oraux de l'agreg de maths. Il y a cette année une nouvelle option à l'agreg de maths, algèbre et calcul formel (il s'agit d'une épreuve de modélisation, c'est-à-dire en gros de commentaire de texte avec simulation sur ordinateur), et comme je m'occupe de la préparation à celle-ci pour l'ENS, je joue l'espion en assistant à quelques oraux pour apprendre un peu les sujets des textes proposés par le jury (on ne peut pas voir les textes eux-mêmes, et les candidats doivent les rendre, mais les oraux sont publics et quand on y assiste on a une bonne idée de quoi ça parle — même s'il est interdit de prendre des notes, on a évidemment le droit de retenir tout ce qu'on veut dans sa tête).

Certains textes ont manifestement été préparés à la hâte. D'autres, en revanche, renferment des petites surprises : un de nos agrégatifs, par exemple, est tombé sur un texte sur les canons en musique (je crois que je devine d'où il est sorti, celui-là, il va falloir que je ré-épluche quelques numéros de la Gazette des mathématiciens) ; et un oral auquel j'ai assisté parlait des conformations de la molécule de cyclohexane (ça peut surprendre pour un texte de maths et surtout d'algèbre, mais en fait il s'agit d'un prétexte pour regarder la géométrie, sous l'angle de la géométrie algébrique, des hexagones dans l'espace dont tous les côtés ont la même longueur et tous les angles la même valeur). Le jury en question était celui présidé par Jean-François Mestre, un mathématicien qui est aussi très bon pédagogue (je le sais parce que c'est lui qui donnait les cours d'algèbre quand j'étais en première année à l'ENS) et qui aime parfois jouer au mathémagicien, si j'ose dire, c'est-à-dire montrer un phénomène mathématique sous forme un peu surprenante — voire ludique — et demander de l'expliquer, et là ça n'a pas manqué (et là votre résultant, numériquement, vous pensez qu'il est nul ? vous sauriez l'expliquer ?). D'ailleurs, sur le coup, j'ai été assez stupéfait de son tour de magie (j'attends de l'avoir mieux compris pour en dire plus).

Il y a aussi des moments un peu embarrassants. J'ai assisté à un oral (une leçon) d'informatique fondamentale (autre option nouvelle cette année, l'informatique), où le candidat a été tellement mauvais, et il s'en rendait compte, que j'en avais mal pour lui. Il y aussi un Monsieur gentil et tout timide, qui ne devait pas être bien loin de la retraite, qui passait l'agreg, et qui venait assister à d'autres oraux (souvent le public est, ainsi, formé d'autres candidats) : il m'a demandé si moi aussi je passais l'agreg, et j'ai répondu sans trop réfléchir que, non, moi je l'avais passée huit ans plus tôt ; à la réflexion, j'aurais sans doute dû mentir plutôt que de faire cette réponse.

(mardi)

Des maths : résultats, décision, exposé

Here is wisdom. Let him that hath understanding count the number of the beast: for it is the number of a man; and his number is Six hundred threescore and six. (Rev 13:18)

Une des bonnes nouvelles de la journée, pour moi, c'est la liste d'admissibilité de l'Agreg de maths, puisque nous avons eu 100% d'admissibles. Ce n'est pas comme si c'était une surprise énorme, certes, mais j'avais tout de même un peu d'inquiétude — notamment parce que le ministère a beaucoup baissé le nombre de places cette année — concernant un ou deux élèves[#]. Pour la suite j'ai par ailleurs quand même des doutes sur la possibilité de battre le record de l'an dernier (entre autres, la façon dont seront notées les nouvelles options reste un grand mystère).

Indépendamment de ça, j'ai pris une décision, qui est de rester à Paris l'an prochain (de ne pas partir à Lyon, donc). La proposition qu'on m'avait faite était très intéressante mais, tout bien considéré, pour probablement seulement un an le déplacement n'en valait pas la peine. Bon, me connaissant, je vais probablement le regretter, mais il fallait faire un choix, alors voilà, il est fait.

Tant que j'y suis à parler boulot : je donne un exposé vendredi en quinze (le 23, donc) au séminaire Variétés rationnelles sur un très beau résultat de Kollár. Non seulement le théorème est joli, mais la démonstration a été l'occasion pour moi de comprendre à quoi pouvait servir le théorème d'annulation de Kawamata-Viehweg (dont l'énoncé me semblait, a priori, assez sibyllin[#2]).

Hors de ça, j'ai l'impression de passer un temps dingue à écrire des mails. Pas que j'en écrive tant que ça, mais je peux passer des heures à écrire trois lignes, parfois, pour trouver exactement les mots qui conviennent.

[#] Inquiétudes tout à fait injustes, n'est-il pas : personne n'oserait suggérer que certains agrégatifs passent en fait leurs journées à jouer à WoW… quand même ? ;-) Mais bon, à tout hasard, si quelqu'un a une suggestion pour faire apparaître l'agreg comme un jeu vidéo en ligne où on dégomme des développements et quand on arrive au niveau 60 on est admis, je suis preneur…

[#2] Le mieux que j'aie entendu est : Kawamata-Viehweg, c'est Kodaira pour les log-structures ; mais bon, je ne trouve pas que ça Éclaire tant que ça, en fait.

(mercredi)

Conversations de matheux, corps à un élément, apprentissage et petits gâteaux

Le mercredi après-midi, au département de maths de l'ENS, nous avons notre thé hebdomadaire : tout le monde (enseignants, chercheurs, invités de passage, étudiants… et quelques informaticiens déçus qu'il n'y ait rien de tel dans leur département), enfin, tous ceux qui veulent venir, se retrouve en salle Jean-Louis Verdier[#] pour partager thé[#2], jus d'orange et petits gâteaux achetés sur les fonds secrets du département (enfin, aujourd'hui, on était à court de petits gâteaux, mais normalement il y en a). Et c'est décidément un moment très convivial.

La conversation, naturellement, outre les sujets récurrents chez les normaliens[#3], tourne autour de potins et de ragots mathématiques[#4], mais aussi autour de mathématiques proprement dites, souvent de façon plus ou moins ludique. Par exemple on évoque régulièrement des résultats mathématiques qui nous semblent particulièrement surprenants, ou choquants : le fait que la somme de deux convexes du plan de frontière C a une frontière C6 mais pas C7 en général ; le fait que toute variété différentiable homéomorphe à Rn est difféomorphe à Rn sauf pour n=4 ; le fait qu'une série de distributions delta, en des points tous distincts, pondérées par des coefficients tous non nuls peut converger vers la distribution nulle ; etc. Nous avons également débattu de savoir quel style de rédaction mathématique offre la plus grande clarté (vaut-il mieux une démonstration compréhensible ligne à ligne et dont la rigueur est inattaquable mais dont on ne parvient pas à dégager les idées directrices générales, ou au contraire une démonstration qui fasse clairement ressortir les idées sous-jacentes mais demeure perfectible dans beaucoup de détails parfois fastidieux à compléter ? et comment parvenir à allier les qualités de ceux styles tout en évitant leurs défauts ?).

Aujourd'hui, nous[#5] nous sommes mis à papoter sur le corps à un élément et sur le corps résiduel des réels. Cela va sembler complètement sibyllin aux non-mathématiciens, mais il s'agit (surtout pour le premier) d'une fantaisie récurrente des algébristes (dont le statut varie, selon les circonstances, entre de la recherche sérieuse et une blague de matheux) ; la plupart des personnes ayant fait des maths au niveau du second cycle savent bien qu'un corps doit avoir au moins deux éléments (à savoir 0 et 1, qui ne coïncident que dans l'anneau nul, ce dernier n'étant pas un corps) : mais il se trouve qu'un nombre important de résultats d'algèbre ou de théorie des nombres semblent pouvoir s'expliquer, par analogie, comme si elles provenaient de l'existence d'un objet que, à l'heure actuelle, personne ne sait définir correctement (et qui n'est certainement pas un corps au sens usuel, et qui n'a probablement pas non plus un élément en aucun sens naïf[#6]) mais que suite à ces analogies on appelle corps à un élément (sur lequel, notamment, l'anneau des entiers serait une algèbre), F1. Là où il s'agit d'une blague, c'est quand on se met à explorer les analogies les plus fumeuses sur le corps à un élément, du style : comme tout corps fini, le corps à un élément à une extension de degré n, qui est le corps à 1n éléments, qui n'est bien sûr pas la même chose que le corps à un élément ; et il a un frobenius, qui est l'élévation à la puissance 1, qui n'est bien sûr pas l'identité… si vous êtes un être humain normal, donc pas un algébriste, il est sans doute naturel que vous ne trouviez pas ça drôle. %-) Là où c'est plus sérieux, c'est quand on espère qu'une définition rigoureuse de cet objet mystérieux permettrait de tirer correctement des analogies : notamment, l'hypothèse de Riemann (dont la tête est mise à prix) aurait des chances de pouvoir être abordée comme l'analogue des conjectures de Weil (qui, comme leur nom ne l'indique pas, sont maintenant des théorèmes) pour le spectre des entiers vu comme variété sur le corps à un élément. Malheureusement, si des définitions partielles ont été proposées pour le corps à un élément (ici et par exemple), non seulement aucune n'est complète (aucune, notamment, ne permet de donner un sens intelligent au produit tensoriel de Z avec lui-même au-dessus de F1) mais en plus elles ne sont pas d'accord entre elles. Quant au corps résiduel des réels, c'est quelque chose dans le même style… ce serait un corps fini qui aurait la bizarre propriété d'avoir une unique extension, de degré deux (le corps résiduel des complexes) qui soit algébriquement close ; là, personne n'a trop d'idée de combien d'éléments il serait censé avoir (on peut donner des arguments pour 0, 1, 2, 3, ou même 2.718… ou une infinité ; personnellement, j'ai tendance à croire qu'il a un seul élément mais dont deux sont non nuls !).

Bon, heureusement, pendant que certains mathématiciens se demandent combien d'éléments a un corps à un élément, d'autres font des choses utiles, comme se pencher sur les manières de construire un filtre à spam efficace : mes collègues statisticiens organisent à l'ENS un colloque sur les fondements mathématiques de l'apprentissage, ou comment apprendre (à un ordinateur, disons), à partir d'un échantillon de données et de réponses associées (du style, ceci est un spam, ceci n'est pas un spam — mais je ne voudrais pas donner l'idée que l'apprentissage ne sert qu'à trier le spam !), à tirer des réponses correctes sur d'autres données. Par exemple, le filtre à spam que j'utilise, qui est essentiellement un filtre bayesien avec quelques améliorations (comme je ne suis pas statisticien, je ne comprends pas grand-chose, là), a tendance à se faire avoir à cause du problème suivant : quasiment tous les mails que je reçois en anglais sont du spam, contre très peu des mails en français — du coup, au lieu d'apprendre à reconnaître le spam et le ham (= non-spam), il a surtout appris à reconnaître l'anglais du français, et quand on m'envoie un mail en anglais, très souvent il passe à la poubelle… alors je me sens assez concerné par ce genre de questions !

[#] Note mentale : il faudra créer un article Wikipédia sur Verdier.

[#2] Il est vrai que c'est plutôt le café que les matheux sont censés transformer en théorèmes, mais il faut un peu de tout : avec du thé on produit des conjectures, l'espresso donne des lemmes, le capuccino des corollaires, le jus d'orange des définitions, etc. En revanche, il faut éviter le déca : avec ça, on produit des contre-exemples — ça a la saveur d'un théorème, mais on send bien qu'il manque quelque chose. Et évidemment, le Coca-Cola, lui, donne des programmes informatiques.

[#3] Comme l'incompréhension totale devant les dernières mesures prises par les responsables hygiène et sécurité de l'établissement, ou la difficulté de trouver un quatrième partenaire pour jouer au bridge.

[#4] En cette saison de l'année, ce genre de potins prennent assurément une tournure la vie est dure, mais ce n'est pas toujours le cas. Un de mes collègues soutient bientôt sa thèse, alors on discutait de comment il faut décoder les phrases dans les rapports du jury : si c'est écrit a prouvé de bonnes qualités d'enseignant, ça veut dire qu'ils pensent que tu es un mauvais chercheur…

[#5] Nous, en l'occurrence, c'est surtout Xavier Caruso et moi. Il peut tout nier mais des gens l'ont vu.

[#6] D'ailleurs, on remarquait justement que, selon les auteurs, le corps a un élément semble avoir (au sens du nombre de points de le droite affine sur ce corps…) deux ou trois éléments. ;-) Mais si on tient absolument à avoir une réponse intuitive, l'idée serait que le corps à un élément a un 1 mais n'a pas de 0 — explication à ne pas prendre très au sérieux, cependant !

(mardi)

Field Arithmetic

J'ai encore fait une folie en achetant (à plus de 150€ — argh !) le volumineux Field Arithmetic[#] de Michael Fried et Moshe Jarden (2e édition). Une folie, certes, mais un rapide coup d'œil à la table des matières a suffi à me convaincre que je devais acheter ce livre, et après avoir examiné un peu plus longuement le contenu je suis conforté dans cette conclusion : je ne vais pas le regretter.

Quand j'étais petit, je pensais naïvement que la structure mathématique de corps était une structure si rigide qu'il n'y avait pas grand-chose à dire (ou que la théorie de Galois nous disait à peu près tout ce qu'il y avait à savoir, puisque les corps sont construits à partir des rationnels ou des corps finis en prenant des extensions algébriques — qui sont bien comprises — et des extensions transcendantes « sur lesquelles il ne doit pas y avoir grand-chose à dire »). Ha ! S'il y avait besoin de montrer que ce raisonnement était idiot, le fait que ce livre fasse plus de 700 pages, et densément peuplées, est significatif.

Ce qui est fascinant, c'est comme le sujet — l'arithmétique des corps — dresse un pont entre l'arithmétique, la géométrie algébrique, la théorie des groupes, et la logique (la théorie des modèles), en passant évidemment par la question centrale du problème de Galois inverse (j'en ai dit un mot récemment). Il y a là ce qui suscite mon intérêt mathématique le plus profond : et ce n'est pas une coïncidence ; d'ailleurs, un résultat récent de Kollár, dont j'ai déjà parlé ici (et que j'exposerai à la séance de juin du séminaire Variétés rationnelles), s'inscrit complètement dans ce cadre. Beaucoup des résultats énoncés dans ce livre me sont déjà familiers, bien sûr, mais parfois seulement comme « folklore », et ce qui est certainement remarquable c'est de les trouver aussi commodément rassemblés dans un seul tome.

(Il faut dire que j'ai un faible pour les livres d'exposition mathématique qui se veulent aussi complets et encyclopédiques que possible : qui tentent de faire le tour d'un sujet donné, et dont on apprend vite à savoir, quand on cherche un résultat sur ce sujet, qu'on l'y trouvera. Celui-ci a l'air de correspondre assez bien à cette idée.)

[#] Field Arithmetic ne signifiant pas — comme un ami me l'a suggéré en plaisantant — arithmétique de terrain. ;-)

(mardi)

Mathématiques et compétition

Les résultats du concours du CNRS seront probablement connus d'ici un ou deux jours. Je n'ai que très peu d'espoir pour moi-même (ne serait-ce que parce que, comme m'a averti un jour mon directeur de thèse : votre thèse ne contient pas de cohomologie, et donc n'impressionnera jamais les Français), donc je ne suis pas trop stressé[#], mais cela m'offre l'occasion de réfléchir à ce système bizarre de recrutement des mathématiciens par concours.

Outre que le nombre de places est ridiculement faible eu égard au nombre de candidats (12 places pour autour de 260 candidats), je vois au moins deux problèmes graves à recruter par concours. Le premier, c'est que concours implique classement et qu'il est impossible de comparer deux candidats, étant donné qu'ils ne passent pas une épreuve mais présentent un dossier, et que le jury en est donc réduit à l'absurdité de savoir s'il vaut mieux avoir démontré le théorème foo ou le théorème bar[#2], sachant qu'en général l'un n'implique pas trivialement l'autre donc un classement ne correspond pas à un ordre logique, bref, de faire un tri plus entre les domaines de recherche qu'entre les candidats. Le second problème, encore plus grave, c'est que c'est fondamentalement contraire à l'esprit de la recherche, telle que je la conçois, que de placer les chercheurs dans une situation de compétition : le principe même de la science est d'être une collaboration entre les hommes contre, disons, globalement, l'adversité (les forces de la nature ou, dans le cas des mathématiques, la difficulté à mettre de l'ordre dans le paradis platonique). Et même si le métier du mathématicien est largement solitaire (ce en quoi il diffère radicalement de celui qui travaille dans les sciences expérimentales), il n'en demeure pas moins que nous travaillons pour une cause commune et que nous mettre en concurrence les uns avec les autres est exactement opposé à ce que nous voudrions faire.

J'ai néanmoins l'impression, pour ce que je vois d'autres branches de la science, que les mathématiques sont très gentlemanly, c'est-à-dire qu'on ne se tire pas dans les pattes (en refusant de communiquer des résultats, ou ce genre de choses), du moins beaucoup moins qu'ailleurs. C'est sans doute une des raisons qui m'ont poussé dans cette direction (après mon inclination naturelle, bien entendu) : je m'en réjouis donc. Mais même : personnellement j'ai découvert que je travaillais bien plus efficacement lorsque j'ai l'impression que ma réflexion est dénuée de tout enjeu — et surtout celui de ma carrière — lorsque je travaille, donc, gratis pro amore arithmeticæ[#3] ; je suppose que je suis loin d'être le seul dans ce cas, et, par conséquent, cela doit faire beaucoup de productivités qui sont réduites par le simple fait de placer les gens en situation de concurrence.

Je n'irais pas jusqu'à honnir celui qui travaillerait pour la gloire : je comprends que, pour certains, c'est un stimulant utile, voire nécessaire. Ce n'est pas mon cas, et je trouve que la satisfaction d'avoir démontré un théorème prime sur toute réputation qu'il peut vous valoir. (Ou, pour dire les choses autrement, si un génie pervers m'offrait le choix entre réussir par moi-même à démontrer l'hypothèse de Riemann mais devoir n'en tirer aucune gloire, ou bien en trouver une démonstration toute cuite par magie dans mon tiroir et pouvoir la publier à mon nom, je n'hésiterais pas une seconde à choisir le premier.) Je suis donc partagé quant au bon goût de nommer les théorèmes d'après les mathématiciens qui les ont trouvés — c'est une chose, d'ailleurs, que Bourbaki a toujours refusée. Et si un jour j'estime ma carrière suffisamment avancée, je pense que je ferai publiquement savoir que toutes mes publications seront désormais anonymes (ce qui ne veut pas dire que l'auteur soit totalement secret[#4], mais qu'il ne figure pas sur l'article et qu'on doive donc citer ce dernier par son simple titre) et j'inciterai d'autres à en faire de même : l'idéal étant même d'être complètement oublié sauf dans la mesure où cela aide à la recherche[#5] (par exemple, pour savoir qui est compétent pour répondre à telle ou telle question).

J'allais dire que la compétition devrait être laissée à l'esprit combatif des plus jeunes, mais même dans ce cas c'est douteux. Plutôt qu'organiser des olympiades de mathématiques, ne devrait-on pas concevoir des défis où des groupes de jeunes reçoivent des problèmes à résoudre collectivement, se les répartissent comme ils veulent, partagent leurs idées pour arriver à une solution, et sont collectivement récompensés s'ils parviennent au bout d'un nombre important de problèmes ? Car l'idée du concours, une fois qu'elle rentre dans les esprits, n'est pas si facilement délogée (ma maman, par exemple, n'a toujours pas compris que c'est une bêtise dangereuse que sa fierté maternelle d'avoir eu un petit garçon qui réussissait bien).

Hélas, mille fois hélas ! Si je dis que le concours est gravement délétère pour les mathématiques (et sans doute pour les autres sciences, même si je ne peux pas vraiment parler pour elles), je ne sais pas quoi proposer à la place. Je me suis dit un moment que ce serait peut-être un moindre mal d'avoir un examen avec un numerus clausus roulant sur plusieurs années, mais au mieux cela reviendrait au même et au pire cela conduirait à des spéculations malsaines sur qui pourrait venir les années suivantes. Je reste du moins persuadé que tant qu'à avoir des concours, il faut qu'ils soient placés relativement en amont dans la carrière (donc, si possible, avant la thèse), pour éviter que des jeunes se retrouvent devant la situation où, ah, vous avez passé dix ans de votre vie à travailler pour ça ? merci d'avoir joué, nous n'avons pas de place pour vous

[#] Ce qui m'inquiète plus, en fait, est de savoir combien de places de maîtres de conférences seront libérées par le fait que les candidats déjà admis au CNRS sont essentiellement rayés des listes.

[#2] Déjà, il est douteux que la qualité d'un mathématicien (c'est-à-dire sa capacité à faire avancer la recherche) se réduise à sa production de théorèmes (qui mesure sans doute, plutôt sa consommation de café) : c'est faire l'impasse sur sa capacité à reformuler des démonstrations qui existent déjà, à discuter avec d'autres mathématiciens pour les aider à éclaircir leurs propres idées ou leur proposer des pistes intéressantes, etc. Et bien sûr, à poser les bonnes questions : car la recherche, c'est au moins autant de poser les bonnes questions que d'y trouver la réponse.

[#3] Certains pourraient être tentés de me rétorquer que j'ai bien réussi des concours, dans ma jeunesse. En vérité, je n'ai jamais travaillé pour eux : j'ai travaillé avant, et j'ai passé ces concours pour voir ce qu'ils donnaient.

[#4] Je ne veux pas priver les historiens des mathématiques de leur travail, en le rendant impossible !

[#5] Ou à l'enseignement, d'ailleurs… un effet positif inattendu de sa relative déconsidération dans le système français est qu'il n'y a pas de compétition à ce niveau-là : enseigner, c'est vraiment se mettre dans le même camp que les autres enseignants et aussi que ceux à qui on enseigne.

(vendredi)

Séminaire, pas séminaire…

J'ai très mal dormi la nuit dernière (m'étant couché vers 2h je n'ai réussi à m'endormir que vers 5h30, pour me lever à 9h30), ce qui fait que je n'étais pas trop en forme en TD ce matin. J'ai quand même rassemblé ma motivation[#] pour assister au séminaire Variétés rationnelles, parce que les sujets me semblaient vraiment beaux et intéressants[#2]. Donc je m'élance de l'ENS à 14h, et lorsque mon RER arrive à Cité universitaire, on nous apprend que des manifestants sur les voies à Arcueil font que les trains n'iront pas plus loin que Laplace. Du coup, je n'ai plus eu qu'à faire demi-tour, et je suis revenu à mon point de départ après avoir perdu une heure (plus le prix d'un ticket de RER jusqu'à Orsay) ainsi que l'occasion d'assister à un exposé auquel je tenais vraiment. Quelle plaie.

Les deux exposés tournaient autour du problème de Galois inverse (ou, donné un groupe fini, comment construire une extension galoisienne des rationnels ayant ce groupe de Galois — ou au moins prouver qu'il en existe), un sujet qui me fascine assez en ce moment (surtout que mes TD concernent justement la th'eorie de Galois), et qui fait converger des approches très différentes, dont les intrigants dessins d'enfants[#3] mais aussi des techniques apparentées aux variétés rationnelles comme l'approximation faible.

[#] Assister à un exposé mathématique quand on a du sommeil en retard est assez pénible, il faut bien le dire : même quand on est sincèrement intéressé par ce que raconte l'orateur, il est difficile de se retenir de somnoler, et à plus forte raison de prêter une attention convenable !

[#2] Évidemment, c'est un séminaire qui correspond bien à mes centres d'intérêts mathématiques en général, mais il faut avouer que parfois — c'est-à-dire essentiellement quand il y a le mot motif dans le titre ou dans le résumé — je me demande vraiment ce que je fais là.

[#3] Un dessin d'enfant au sens de Grothendieck est (la structure combinatoire plongée de) l'image réciproque du segment [0;1] par un revêtement de la sphère de Riemann ramifié en au plus 0, 1 et ∞. D'après la réciproque du théorème de Belyj, un tel revêtement peut toujours être défini par un polynôme à coefficients algébriques : le groupe de Galois absolu opère sur les dessins d'enfants en opérant sur les coefficients, et les orbites pour cette action sont quelque chose d'encore très mal compris.

(jeudi)

Feuilles de TD

Je rédige intégralement (énoncés et corrections) les feuilles des TD que je donne à l'ENS : outre que ça rend service aux élèves (enfin, j'espère…), c'est important pour moi, parce que je ne veux pas me pointer en me disant que je sais faire tel ou tel exercice et en me rendant compte finalement que non, il y a un détail qui m'a échappé ou que j'ai oublié ou un petit problème dans l'énoncé. (En DEUG je n'avais pas ce souci, mais là, le niveau est quand même un petit peu plus élevé…) Ça prend tout de même beaucoup de temps.

Je comptais cette année réutiliser les mêmes feuilles que l'an dernier. Mais voilà que je ne suis pas content des exercices que j'ai donnés, et j'en cherche de nouveaux… Je n'en suis toujours pas très content, en fait : là, pour illustrer les concepts d'algèbre tensorielle, symétrique et extérieure, qui ont beau être des notions excessivement classiques et importantes, je n'ai pas vraiment réussi à trouver des choses qui me satisfassent, ni par moi-même ni en fouillant dans des livres. (La solution de facilité, c'est, comme toujours, d'aller chercher dans les sorites au niveau n+1 les exercices du niveau n : mais je pense que pédagogiquement ce n'est pas bon.)

(mardi)

Les ordinaux dénombrables

De même qu'il m'arrive d'avoir des lubies dans d'autres domaines, j'en ai parfois en mathématiques. J'ai déjà mentionné il y a longtemps trois objets mathématiques (parmi de nombreux autres) me fascinent pour leur beauté et leur élégance : les ordinaux (encore que ce n'est pas clair si les ordinaux sont un objet mathématique) méritent aussi d'y figurer. Je suis en train de faire plein d'éditions à l'article Wikipédia à ce sujet (j'ai même fabriqué une image de ω² pour illustrer).

Il y a fort longtemps j'avais écrit un texte de vulgarisation à ce sujet, puis un autre. C'est quelque chose qu'on a vraiment envie de vulgariser parce que l'idée est excessivement simple : dès lors qu'on ordonne un ensemble (éventuellement infini) de choses de façon à ce qu'il ne soit pas possible de décroître indéfiniment, on a défini un ordinal. Ou encore : décrire un ordinal, c'est exactement décrire tous les ordinaux plus petits que lui (et comment les comparer). Tout le jeu, ensuite, consiste à se demander jusqu'où on peut monter — sachant que, quelle que soit l'intelligence avec laquelle on s'y prendra, il y aura toujours un plus petit ordinal qu'on n'atteindra pas (c'est ça qui fait que les ordinaux donnent une vision terrifiante de l'infini — un infini plus grand, si j'ose dire, que tout ce que vous pouvez construire par n'importe quelle méthode).

Si on veut, les ordinaux sont le défi que se lancent les petits enfants, tu sais compter jusqu'à combien ?, prolongé dans le transfini, et appliqué aux mathématiques.

Tout le monde connaît, a priori, l'ordinal ω, celui des entiers naturels : même si on ignore la terminologie “entiers naturels” (et même si on ignore le zéro, ce qui, du point de vue de l'ordinal, ne change rien du tout), à part quelques peuplades perdues qui n'ont pas la notion de nombre, tout le monde sait compter : 0, 1, 2, 3… jusqu'à l'infini, peut-être pas effectivement jusqu'à l'infini, mais au moins potentiellement, et ceci définit justement l'ordinal ω.

Tout le monde peut encore comprendre ω2, soit deux copies successives de ω : il suffit de prendre les entiers naturels, et, après tous les entiers naturels n, mettre les ω+n, en décrétant que les ω+n se comparent comme les n et que les ω+n sont toujours supérieurs aux n :

0, 1, 2, 3, 4, … ω, ω+1, ω+2, ω+3, …

Une fois qu'on a compris ω, ω2, ω3 et ainsi de suite, on a logiquement compris ω², qui n'en est que la limite. De même, ω³ ne pose pas de problème conceptuel particulier. Les choses deviennent compliquées, a priori, avec ωω, mais on ne peut pas vraiment capituler puisque le truc génial avec les ordinaux, c'est que dès qu'on a compris tous les ordinaux inférieurs à un ordinal donné, on a compris celui-là (et ceci permet de conclure qu'on a compris tous les ordinaux…). Ainsi, ωω c'est l'ordre de toutes les expressions du genre ω³·42 + ω·1729 + 18. Mais ensuite, ce n'est pas un pas conceptuel si compliqué d'imaginer ωω2, voire ωω², et ainsi de suite jusqu'à ωωω. En empilant les ω on arrive jusqu'à l'ordinal où les problèmes de visualisation commencent sérieusement : ε0. Avant ε0, la forme normale de Cantor (« écriture en base ω ») résout tous les problèmes, après lui, trouver une écriture n'est plus aussi facile. (D'ailleurs, quand le petit enfant demande : tu sais compter jusqu'à combien ?, Monsieur Peano est forcé de reconnaître qu'il ne sait pas compter jusqu'à ε0.) Pourtant, dans la mesure où on a compris cette forme normale de Cantor, on a compris ε0. En faisant un petit effort, on comprend aussi ε1, qui correspond à l'ordre de toutes les expressions du même type que la forme de Cantor pour les ordinaux avant ε0 mais en ajoutant ε0 comme un nouveau symbole.

Après tous les ε0, ε1, εω, εε0, η0εε et autres lettres de l'alphabet grec (transfini) il vient un ordinal appelé l'ordinal de Feferman-Schütte, parfois noté Γ0. Là il se passe quelque chose de significativement nouveau, parce que c'est, dans un sens difficile à préciser mais très important, le plus petit ordinal qui ne peut pas se décrire en utilisant des ordinaux plus petits que lui. C'est l'ordinal que Feferman décrit comme mesurant la puissance de la prédicativité, et certains systèmes mathématiques importants cessent de savoir compter à partir de là. Au-delà il y a pourtant encore des ordinaux qu'on peut décrire : j'avoue que je n'y vois plus grand-chose, mais l'ordinal de Bachmann-Howard, par exemple, est très important, il mesure la force d'un système axiomatique notable, la théorie des ensembles de Kripke-Platek. Encore au-delà il y aurait un ordinal qui mesurerait la force de la théorie des ensembles de Zermelo-Fraenkel (mais personne ne sait le décrire précisément, autrement que par une arnaque qui ne nous apprend rien). Tout ceci a un sens difficile à expliquer mais très précis (et notamment, lorsqu'un énoncé arithmétique, bien que vrai, n'est pas démontrable, c'est parce qu'on ne sait pas « compter assez loin », au sens des ordinaux, pour arriver jusqu'à lui).

Tout ceci n'est rien, cependant, par rapport à l'ordinal de Church-Kleene (c'est amusant, tous les noms sont doubles, dans ce domaine) : il représente le plus petit ordinal à partir duquel il devient théoriquement impossible de représenter les ordinaux de façon informatisée, par exemple, ou de façon arithmétique. Malgré cela, on reste dans les ordinaux dénombrables, c'est-à-dire représentables, en théorie, par des petits dessins comme j'ai fait pour ω². Personne ne pourrait donner un sens à une représentation de ce genre pour l'ordinal de Church-Kleene (déjà, il faudrait pouvoir voir les détails infiniment fins), mais en principe il existe (et aucun ordinateur ne peut le produire). Alors que dire de ω1, le plus petit ordinal indénombrable, celui qui renferme tous les ordinaux dénombrables ? Le plus petit qui a la propriété — totalement démentielle — que toute suite dedans est bornée.

Comme les théologiens hindous qui, émerveillés d'avoir le système décimal à leur disposition, s'amusaient à écrire de (passablement) grands entiers et à raconter des choses avec, j'éprouve une fascination semblable pour les ordinaux, cette échelle du monde mathématique.

(samedi)

Un théorème de János Kollár

Ceci n'est pas censé être un blog mathématique, mais je veux quand même prendre la peine de signaler ce résultat récent (annoncé il y a un mois) de János Kollár : tout corps pseudo-algébriquement clos de caractéristique zéro est C1 (et même C′1).

On dit qu'un corps K est pseudo-algébriquement clos lorsque, pour tout polynôme f à deux varibles sur K qui est irréductible sur la clôture algébrique de K, il existe une infinité de (x,y)∈K² pour lesquels f(x,y)=0. (En termes plus sophistiqués : toute variété algébrique géométriquement intègre sur K a un K-point ; et il suffit, comme je viens de le faire, de le postuler pour une courbe.)

Par ailleurs, un corps K est dit C1 lorsque tout polynôme f homogène de degré n en >n variables possède un zéro non trivial (non trivial signifiant autre que (0,…,0)). (Quant à la condition C′1, elle énonce le même fait pour une famille de polynômes homogènes dont la somme des degrés est n. On conjecture que c'est équivalent, mais on ne sait pas le prouver.)

Ce résultat était conjecturé depuis longtemps (moralement, si j'ose dire, la propriété C1 est beaucoup plus faible que celle d'être pseudo-algébriquement clos). Néanmoins, arriver le démontrer, surtout de façon aussi courte, est un tour de force de Kollár, qui fait beaucoup avancer notre compréhension de ces propriétés importantes, à la définition simple, mais sur lesquelles on sait encore, somme toute, très peu (et le fait qu'on ne sache toujours pas prouver C1⇔C′1 est assez symptomatique).

Le principe est extrêmement joli : Kollár démontre que sur un corps K de caractéristique zéro si X dans Pn est une hypersurface de degré ≤n, ou plus généralement une intersection (schématique) d'hypersurfaces de somme des degrés ≤n, alors X contient une sous-variété Y définie sur K et qui est géométriquement irréductible. Cela se fait en écrivant (trivialement) X comme fibre d'un morphisme dont la fibre générale est une variété de Fano lisse et en étudiant (c'est là tout le travail) la dégénérescence des variétés de Fano. Je n'ai pas encore regardé les détails de la démonstration, mais c'est assez court et ça a l'air plutôt simple (et bien rédigé).

(vendredi)

Séminaires mathématiques

Le séminaire Variétés rationnelles (le séminaire mathématique où je suis le plus assidu[#]) a repris ses activités, mais il a maintenant[#2] lieu à Orsay et non plus à l'ENS. J'espère que cela n'entraînera pas un changement de style pour converger vers le SAGA (Séminaire d'Arithmétique et de Géométrie Algébrique) d'Orsay, un séminaire très prestigieux mais où le commun des mortels ne comprend souvent pas grand-chose aux exposés ; parce que le séminaire Variétés rationnelles, lui, est beaucoup plus compréhensible pour quelqu'un comme moi (évidemment, j'ai fait ma thèse dans le domaine).

Les deux exposés de cet après-midi étaient d'ailleurs tous les deux d'une clarté remarquable. Le second, notamment, m'a beaucoup impressionné : l'orateur (Arnaud Beauville) a réussi, tout en tenant les temps (c'est assez rare pour être mentionné…) à expliquer avec à la fois une grande précision et une grande simplicité un résultat[#3] qui n'avait rien d'évident. Il a fait le modeste en disant que son résultat n'avait pas d'autre intérêt que de répondre à une question que Serre lui avait posée. Serre étant dans l'assistance, d'ailleurs.

C'est bien quand il y a quelques grands mathématiciens dans l'assistance : je ne parle pas pour le prestige du séminaire, mais simplement parce qu'ils osent poser des questions parfois tout à fait terre-à-terre. Je veux dire, quand un petit jeune comme moi a une question dans un séminaire, il ose rarement la poser, par peur que ce soit une bêtise, et pour ne pas passer pour un idiot devant l'assemblée de pontes (même quand il n'y a pas deux médailles Fields dans la salle, il y a toujours des gens devant qui on ne veut pas avoir l'air plus bête que nécessaire…). Serre, lui, il sait que la question n'est pas idiote, et quand bien même elle le serait il n'aurait pas peur de demander. Il y a une certaine satisfaction, quand on pense très fort mais pourquoi est-ce que machin ? et que quelqu'un d'autre (dont la compétence mathématique n'est pas à remettre en cause) demande à haute voix mais pourquoi est-ce que machin ?, à se dire qu'on avait au moins une question qui montre qu'on a suivi. (Il ne s'agit pas forcément de questions qui impliqueraient un manque de clarté de la part de l'orateur, d'ailleurs : souvent, en fait, ça porte sur un énoncé adjacent à celui qui vient d'être affirmé.) Enfin, c'est encore plus satisfaisant quand on trouve soi-même la réponse avant que quelqu'un d'autre pose la question, évidemment.

Mais globalement je me rends compte qu'il y a quelque chose de vraiment commun entre l'entrée dans le monde de la recherche mathématique et l'apprentissage d'une langue étrangère : au début, quand les gens parlent, ça a l'air d'être du charabia, ils vont beaucoup trop vite, etc. Puis progressivement des automatismes se mettent en place comme des règles de grammaire, on voit venir les choses, on sait que telle situation doit inciter à se poser tel type de question, à rechercher tel type de méthode… Et à force, on arrive à s'efforcer à mentalement précéder un peu ce que les gens vont dire.

Il y a une personne extraordinaire dans l'assistance (à la fois au séminaire Variétés rationnelles et au SAGA), c'est le génial Ofer Gabber, sans doute le mathématicien le plus vif d'esprit que je connaisse. Il est du genre, quand un orateur énonce un théorème, à lever immédiatement la main pour dire quelque chose comme : là, vous allez démontrer ce théorème en passant par cette étape-ci, puis celle-là, puis celle-là, mais je ne comprends pas comment, dans votre conclusion, vous allez faire pour traiter le cas suivant… (Modulo la formulation ; en fait, il pose généralement la question en anglais.) Bref, il n'a souvent même pas besoin qu'on lui donne la démonstration pour voir immédiatement quels sont les points difficiles ; parfois c'est ce sur quoi l'orateur voulait insister (et alors il arrive qu'il s'agace parce qu'il voulait y venir en temps utile), parfois c'est ce qu'il voulait cacher sur le tapis (et alors il s'excuse de devoir admettre ce point ou ne faire qu'esquisser la technique), et parfois il n'avait pas vu du tout la difficulté. Depuis que j'assiste à ce séminaire, j'ai vu au moins deux fois Gabber démolir en direct une démonstration (trouver une erreur dedans, je veux dire), et une fois réfuter du tac au tac une conjecture que l'orateur énonçait. Tout à fait impressionnant (et du coup, on tremble à l'idée de faire un exposé devant lui). Un ami me disait même qu'il y avait une notion plus forte que le « vrai », en mathématique, il y avait « Gabber-vrai » (autrement dit, le résultat a été suggéré à lui et il a répondu que ça marchait). Au cours du premier exposé de cet après-midi, le monde mathématique a tremblé, donc, parce que Gabber a plaisanté : but then there's a contradiction in mathematics, puisqu'il avait émis une objection à un énoncé formulé par l'orateur, et que l'orateur a répondu à l'objection, et les deux semblaient avoir raison. Toute l'assistance a bien ri. Il faut dire que l'exposé tournait autour du fait que 240 n'est pas égal à 248, ce qui est déjà original.

Et ce week-end, je vais à (certains exposés du) séminaire Bourbaki.

[#] Il est vrai qu'il est mensuel : ça doit aider.

[#2] La raison est qu'un des trois organisateurs, auparavant chargé de recherche au CNRS en poste à l'École, a été recruté professeur à Paris XI — où sont déjà les deux autres. Il n'y a donc plus de prétexte pour que ça ait lieu rue d'Ulm.

[#3] Si p est un nombre premier ≥7 alors tout sous-groupe abélien de p-torsion du groupe de Crémona du plan (sur un corps algébriquement clos de caractéristique ≠p), i.e. tout groupe de la forme (Z/pZ)r d'automorphismes birationnels du plan projectif, est de rang r≤2 et contenu dans un tore standard. (Et il y a des résultats un petit peu plus techniques pour p valant 2, 3 ou 5.) Bon, la formulation peut paraître effrayante au non mathématicien, il me faudrait un petit peu de temps pour expliquer les termes, mais cet énoncé n'est pas très compliqué : c'est de la « vraie » géométrie (il s'agit d'un énoncé sur les transformations du plan, après tout ; d'ailleurs, j'ai déjà décrit ici ce qu'était le groupe de Crémona — dans le cas de R, certes), d'une façon que l'école italienne n'aurait pas reniée, et je trouve ça très beau.

(lundi)

Exposition mathématique

Aujourd'hui j'assistais à un exposé (dans le cadre du séminaire de théorie des nombres de Chevaleret) sur Model Theory of the Witt Frobenius, with Emphasis on an Ax-Kochen-Eršov Principle : le titre peut paraître barbare, mais en fait c'était remarquablement clair et bien présenté. Peut-être justement parce que c'était de la logique (de la théorie des modèles, comme le titre de l'exposé le dit) exposée à des non-logiciens (des théoriciens des nombres, comme le titre du séminaire le dit) : je soupçonne que quand un mathématicien s'adresse à des spécialistes d'autres disciplines que la sienne il fait un effort particulier dans la clarté de sa présentation, il ne s'embarrasse pas de détails techniques encombrants (et là, apparemment, la démonstration en regorge, même si l'énoncé final — ou bien un corollaire fondamental — est tout à fait simple et beau).

(jeudi)

Un peu de masturbation (intellectuelle)

Apparemment la question suivante (on peut appeler ça des maths, je suppose) est un problème ouvert (j'aime collectionner les problèmes ouverts dont l'énoncé est aussi simple que possible, et celui-là sera bien placé dans ma collection) : partez d'un mot (fini, quelconque) sur l'alphabet de trois lettres a, b et c, par exemple baacabbabc, et, aussi souvent que vous voulez, remplacez deux lettres identiques consécutives (par exemple aa), s'il y en a, par les deux autres dans l'ordre alphabétique (donc aabc, bbac et ccab) ; la question est : peut-on, en suivant ces règles, revenir sur le mot de départ (peut-on faire une boucle, quoi, sachant qu'on choisit comme on veut le mot initial et qu'on applique les règles comme on veut) ? Il semble que non, on ne boucle jamais, on se retrouve toujours coincé dans une situation où il n'y a plus deux lettres consécutives identiques (exemple : baacabbabcbbccabbabcacccabbabcaabcabbabcaabcaacabcaabcbccabcbcbcbccabcbcbcbababc), mais allez le prouver… (En termes d'informatique théorique, la question est de savoir si la grammaire de réécritures {aabc, bbac, ccab} est fortement normalisante.)

Mise à jour (2005-11-22) : En fait, c'est démontré. Mais on notera que c'est très récent !

Avec la règle bbca à la place de bbac (le reste étant identique), j'arrive à le prouver, mais c'est très différent. Je laisse ça en exercice au lecteur intéressé (ce n'est pas complètement trivial, mais ce n'est pas non plus excessivement difficile, et ça ne demande aucune connaissance mathématique particulière, seulement une certaine habitude du raisonnement mathématique et un certain pouvoir d'abstraction).


Je fais un coq-à-l'âne, mais toujours dans le domaine de la masturbation intellectuelle, pour évoquer le droit théorique (le terme n'est pas terrible : je devrais plutôt dire méta-droit parce que c'est au droit ce que la métaphysique est à la physique, sauf que méta-droit ça pourrait évoquer le droit du droit, ce qui serait autre chose). Comme la conservation de l'information, c'est quelque chose qui plait souvent aux geeks : il s'agit, en gros, de se demander comment le droit juridique répond à des situations qu'il suppose impossible, ou qui sont totalement farfelues ou bizarres. Voici quelques exemples de problèmes sur lesquels on pourra plancher :

C'est une sorte de test de geekitude, en fait : si ces questions vous amusent ou vous intriguent, vous avez probablement une mentalité au moins un peu geek. Si vous vous dites simplement je ne comprends pas, ce n'est pas possible, alors non.

(Et encore, je n'ai pas parlé du droit international théorique, qui est encore plus rigolo.)

(lundi)

Devinette mathématique

On m'a posé cette question assez récemment, et je la trouve assez jolie ; en plus, elle est compréhensible par tout le monde :

On vous donne une règle (non graduée) d'environ 30cm (et un crayon, quand même), et deux points distants d'environ 35cm : comment faire pour tracer la droite qui les relie ? Et si les points sont très éloignés, peut-on toujours s'en sortir ?

Corrigé (2005-09-06T21:30+0200) : Voici la solution que j'avais à l'esprit.

Soient A et B les points à relier, distants d'à peu près 35cm. On trace une droite dà peu près parallèle à (AB) et distante d'elle de quelques centimètres (au maximum), et sur cette droite on marque deux points A′ et B′ tels que B′ soit à peu près aussi loin que possible de A, et A′ à peu près aussi loin que possible de B, mais pour que les droites AB′ et BA′ soient quand même traçables. Soit C′ un point sur la droite d′=(AB′) à peu près au milieu de [AB′]. On appelle C″ le point où AB′ et BA′ se rencontrent. On trace une droite d″ passant par C″ et à peu près parallèle à (AB) et (AB′) : soit B″ l'intersection de cette droite d″ et de (AC′) et A″ l'intersection de d″ et (BC′). Soit C le point d'intersection de (AB″) et (BA″) (si on a bien choisi C′, ça doit être faisable). Alors le théorème de Pappus assure que A, C et B sont alignés, et C est à peu près au milieu de [AB], donc on trace (AC) (c'est assez court) et (CB) et on a notre droite (AB) recherchée.

Cette solution doit marcher lorsque le rapport entre la distance à tracer et la longueur de la règle n'excède pas quelque chose comme 4/3 (je n'ai pas vérifié, mais c'est de ce genre-là). Mais du coup, on peut faire comme si on disposait d'une règle, disons, 30% plus longue, et en itérant la construction on peut faire comme si on disposait d'une règle arbitrairement longue. (Sauf que ça devient complètement théorique parce que la perte de précision est rapidement énorme.)

(dimanche)

Un tour de cartes (mathématique)

Le tour de cartes suivant est très facile à réaliser, puisqu'il ne demande aucune adresse et aucune manipulation (c'est une propriété purement mathématique), et pourtant il arrive à surprendre certains.

Utiliser un jeu de 104 cartes (c'est-à-dire deux jeux de 52 cartes identiques) ; ça marche déjà plutôt bien avec un seul jeu de 52, mais la probabilité d'échec est quand même relativement importante, alors qu'avec 104 ça marche beaucoup mieux. Donner le jeu à quelqu'un, qui devra les battre soigneusement, puis choisir (sans le révéler) un nombre entre 1 et 13. Il retire alors le nombre correspondant de cartes du dessus du paquet (mais en les gardant dans l'ordre) et regarde la dernière de celles-ci. Puis, selon la valeur de cette dernière carte (en interprétant un valet comme 11, une dame comme 12, un roi comme 13), il retire de nouveau le nombre en question de cartes du dessus du paquet. Encore une fois, il regarde la dernière carte pour savoir de combien avancer. Il répète ainsi l'opération jusqu'à ce que, vers la fin du paquet, il reste moins de cartes que la valeur de la dernière regardée. Cette dernière carte regardée (où on ne peut plus avancer) sera la carte qu'il devra retenir. Tout ceci est fait sans que le magicien voie, ou même, soit présent. (Il faut juste prendre garde au fait que beaucoup de gens ne savent pas compter, se trompent parfois de ±1 carte, regardent la suivante au lieu de la dernière retirée, mélangent les valeurs des figures, ou ne remettent pas les cartes rigoureusement dans l'ordre où ils les ont prises ; le mieux est sans doute de montrer la manipulation une fois, puis de battre le paquet pour que le cobaye la fasse tout seul.) Ensuite, le paquet est rendu au magicien, qui l'examine attentivement et annonce quelle était la dernière carte regardée.

C'est bien sûr un non-tour de magie, puisqu'il n'y a aucun truc : c'est juste que, avec une bonne probabilité, la dernière carte ne dépend pas du nombre initial choisi. Le magicien a donc simplement à refaire mentalement l'opération en regardant les cartes (peut-être avec plusieurs choix initiaux, pour vérifier que ça n'en dépend pas ou pour prendre la carte finale la plus probable si par malchance il y en a plusieurs en concurrence), et il annonce la bonne carte. Évidemment, il y a des gens qui ne seront pas impressionnés, parce que la propriété leur paraît évidente, mais généralement, quand on n'y a pas réfléchi, ça ne saute pas aux yeux.

Voici un exemple : supposons que les valeurs des cartes soient dans l'ordre suivant, que je viens de tirer au hasard (je note ‘A’ pour un as, ‘X’ pour un dix, ‘V’ pour un valet, ‘D’ pour une dame et ‘R’ pour un roi) :

64AD4V9436952A8DRA86R562X8AR76XVD7684RR3AV258XD6V97X952A84R2VV937D552XD7R37D384VV4X28XAA4729R96X53373D59

—on pourra vérifier que, quelle que soit la carte initiale choisie parmi les trente premières au moins, on atteint forcément le valet que j'ai marqué en vert (la carte précédente pouvant être soit le 2 deux cartes avant soit le 9 neuf cartes avant), et ensuite la succession roi, dix, dix est automatique. Tous les jeux ne sont pas aussi chanceux : dans le suivant

5273X6A92A937653A4XD8R483AADD4A7858D4927D27V66V59DD5D356A294X8VARVVX42R932V78V2X38369945R7R5XXRXR8R467V6

—on pourra vérifier que, si on part d'une des treize premières, on a quatre chances sur treize de tomber sur la séquence (en rouge) as-4-roi-8-7-dame-8-2-9-3-6-7-roi et neuf sur treize de tomber sur (en vert) dame-7-2-dame-dame-roi-valet-roi-7. Cela donne tout de même mieux de deux chance sur trois de réussir le tour même dans ce cas-là qui est malchanceux (et si on se trompe on pourra annoncer une deuxième carte qui sera la bonne).

Comme je suis mauvais en probabilités (et aussi, flemmard), je n'essaierai pas de faire de calcul précis (j'imagine que si on veut trouver la probabilité que deux valeurs initiales convergent, et en supposant qu'au lieu d'avoir un battage des cartes chacune a une valeur indépendante de toutes les autres, ça doit se faire). Mais le principe heuristique, au moins, c'est que si on prend deux valeurs initiales et qu'on itère l'algorithme, l'écart va varier aléatoirement jusqu'au moment où par hasard on tombe sur la même carte, et alors on est sûr d'y rester jusqu'au bout — et si on fait assez d'étapes, c'est-à-dire si le jeu est assez long, ça a une grande chance de se produire. Expérimentalement, la probabilité de tomber sur la même carte finale entre deux cartes initiales tirées au hasard a l'air d'être 2/3 pour un jeu de 52 cartes, et 8/9 pour un jeu de 104 (je ne pense pas que ce soient des valeurs exactes, mais en tout cas ça doit être très proche).

(mercredi)

Écriture mathématique

Comme j'ai appris ces derniers temps un certain nombre de choses (que j'étais censé savoir déjà, mais passons) sur la cohomologie des faisceaux, je me suis dit que j'allais essayer de les coucher par écrit, pour ne pas les oublier ensuite. Grave erreur ! Car au lieu de prendre de rapides notes précises, j'ai voulu remonter trop en amont, j'ai commencé à écrire un texte qui débute avec la définition d'un faisceau : avec ça, évidemment, j'ai de quoi pondre des pages et des pages avant d'en venir à ce que je voulais surtout écrire (et, sans doute, l'oublier entre temps si c'était ça le risque) — car sur les faisceaux il y a de quoi écrire des livres (d'ailleurs, des gens l'ont déjà fait, mais il faut dire qu'aucun ne me satisfait vraiment).

Je me suis donc mis en mode « écriture automatique ». Car c'est bien de ça qu'il est question : pisser du texte mathématique presque sans réfléchir (pour l'instant, car je connais trop bien ce que je raconte). Sans doute encore un projet à la David Madore, qui commence en fanfare et qui terminera en queue de poisson, c'est-à-dire qu'il restera moribond, puis sera définitivement abandonné, sans avoir jamais été achevé. Peut-être dès demain, si demain j'ai le bon sens de ne pas continuer cette insensée tentative. Enfin, toujours est-il que j'ai pondu dix pages aujourd'hui, en lesquelles je n'ai d'ailleurs même pas encore trouvé moyen de définir le germe d'un faisceau en un point, comme quoi ça ne va pas très vite.

(lundi)

Tétraèdres et miroirs (réponse au mystère)

L'image de l'entrée d'avant-hier est la vue de l'intérieur d'un tétraèdre (régulier) dont les faces sont des miroirs (et, pour qu'on voie quand même quelque chose, ils sont aussi intrinsèquement lumineux : en rouge, vert, bleu et blanc pour les quatre faces). La caméra est positionnée en un sommet du tétraèdre et regarde la face opposée, ce qui explique que la figure soit aussi symétrique. Peut-être qu'elle devient plus claire si je rajoute une boule au centre du tétraèdre et que je décale légèrement la caméra (la réflectivité des miroirs a également été un peu augmentée) :

[Image de l'intérieur d'un tétraèdre]

J'ai également un petit film (format DivX;-)-dans-AVI, je crois — j'ai laissé l'encodeur prendre ses options par défaut —, une douzaine d'images, six-sept secondes) où la caméra se déplace un peu, ce qui aide à visualiser la géométrie de la chose. Personnellement, j'ai du mal, mais je vois intrinsèquement très mal en trois dimensions (ce n'est apparemment pas rédhibitoire pour passer une thèse en géométrie).

On peut imaginer que sur chaque face du tétraèdre initial on a posé un tétraèdre qui lui est identique (son image par le miroir, juste légèrement teinté), puis sur chaque face de chaque nouveau tétraèdre (exceptées celles qui reviennent au tétraèdre initial) encore un tétraèdre et ainsi de suite à l'infini. Mais les tétraèdres réguliers ne pavent pas l'espace — loin de là : les volumes vont se chevaucher bizarrement. Mais imaginons que (et c'est justement le propre des miroirs que de multiplier les tétraèdres, les boules et le nombre des hommes) l'espace ne se chevauche pas : on obtient cette étrange vue.

La propriété mathématique intéressante, c'est que les réflexions autour des quatre faces du tétraèdre sont en produit libre : autrement dit, si je pars du tétraèdre initial et que j'empile comme je veux des nouveaux tétraèdres sur les faces des précédents, je ne vais jamais revenir à un tétraèdre translaté du tétraèdre initial (sauf à être revenu à lui, justement, ce qui ne peut se faire qu'en parcourant exactement le chemin inverse de celui qu'on a pris). Hum, je ne sais pas si c'est très clair, malheureusement.

Quoi qu'il en soit, l'apparence de la figure m'a un peu surpris. Évidemment, les choses s'expliquent. Par exemple, on remarque facilement deux boules très proches mais pas tout à fait confondues. Cela vient du fait que l'angle diédral entre deux faces adjacentes d'un tétraèdre est 70°32′, très près, donc, de l'angle au centre d'un pentagone régulier (71°) : donc en alternant les symétries par rapport à deux faces jusqu'à en faire cinq au total, on revient presque au point de départ (notamment, et c'est ce qui se voit le mieux, la symétrique de la boule centrale par rapport aux faces bleue puis blanche puis bleue est très proche de celle par rapport aux faces blanche puis bleue). Si au lieu de prendre un espace plat j'avais rajouté un peu de courbure (isotrope positive), pour qu'on puisse mettre exactement cinq tétraèdres autour de chaque arète, en pentagone régulier, alors on obtiendrait un joli pavage, un des six polytopes réguliers en quatre dimension, le 600-cellules ou « hypericosaèdre », qui, comme son nom l'indique, a 600 hyperfaces qui sont des tétraèdres réguliers. (Si j'ai la patience, un des jours, je tenterai de faire une représentation du 600-cellules, et peut-être des autres polytopes réguliers en quatre dimensions, inscrits dans l'hypersphère vue comme un espace 3D courbe.)

Je ne suis pas sûr de bien comprendre, en revanche, les espèces de pentagones clairs qui sont clairement visibles sur ma figure initiale (et pas sur la nouvelle, donc ça dépend de la position de vue) autour des trois sommets visibles du tétraèdre. Ce que j'explique encore moins, c'est pourquoi, si on augmente considérablement la réflectivité des miroirs, on obtient quelque chose comme ceci :

[Kaléidoscope de couleurs]

Décidément psychédélique.

(samedi)

Encore des figures psychédéliques

[Motif coloré]

[English translation follows.] Encore une image mathématique calculée sur ordinateur : qui saura reconnaître ce dont il s'agit (il n'y a pas besoin de notions mathématiques très poussées pour décrire la chose — en tout cas nettement moins que pour la précédente) ? J'avoue que je ne pensais pas trop que ça ressemblerait à ça, et je ne sais pas si je peux expliquer toutes les propriétés de l'image.

[Traduction anglaise de ci-dessus.] Another mathematical image drawn by computer : who can recognized what it is (one doesn't need very sophisticated mathematical notions to describe it — at least not nearly as much as the previous one) ? I must admit I didn't think it would look like that, and I'm not sure I can explain all of the features.

(jeudi)

C'est terrifiant, les maths

J'avais décidé de passer l'été à colmater un peu l'immensité de mon ignorance mathématique : pour l'instant, le résultat est assez catastrophique. Pas que je n'apprenne pas des choses, au contraire[#] : mais dès que j'apprends une chose il se pose cinq questions à moi, et elles se rajoutent aux questions que d'autres me posent incidemment. Du coup, je n'arrive pas à lire des livres systématiquement, je les parcours à la recherche d'informations sur ceci ou cela, je m'énerve souvent de ne pas les trouver, je perds un temps fou à essayer de résoudre le problème moi-même avant de me rendre compte qu'il est conséquence évidente d'un résultat que je devrais savoir.

Bon, c'est peut-être normal, diront certains : la science, c'est toujours comme ça, toute réponse doit déboucher sur au moins cinq questions. Mais bon, d'une part c'est un peu un cliché, d'autre part je ne fais pas avancer la science, là, juste mon savoir personnel (ou en tout cas la prise de conscience de mon ignorance).

C'est vraiment déprimant, tout ça.

[#] Je me fais par exemple, maintenant, une certaine idée de ce qu'est une classe de Chern (je n'oserais pas aller jusqu'à dire j'ai compris ce que c'est, parce que je suis toujours persuadé qu'il y a un plan de compréhension bien supérieur qui est accessible aux gens comme mon ami Joël Riou, mais j'ai réussi à faire quelques calculs sur ces bébêtes qui me semblaient si opaques à un moment) ; certes, il n'y a pas de quoi s'en vanter : ça fait bien longtemps que je suis censé avoir assimilé ce que ce sont. Je plaide néanmoins que c'est remarquablement mal expliqué dans tous les livres existant (et aucun ne prend la peine d'expliquer gentiment par quelques exemples comment on manipule ces machins). Les classes de Chern ne sont qu'un exemple parmi plein d'autres.

(Thursday)

David A. Cox's Galois Theory

[Traduction française ci-dessous.]

David A. Cox is renowned (besides for having been one of the “discoverers” of toric varieties, one of the most elegant objects in algebraic geometry) for the clarity of his mathematical writing: his Primes of the form x²+ny² is an excellent prolegomenon to algebraic number theory and class field theory. In a recent book-buying compulsion, I got a copy of his latest book, a teatise on Galois theory (ISBN 0-471-43419-1), and I wish to mention how remarkably good I find it—even after I've done hardly more than glance through it. True, there isn't much for me to learn in it (I should hope so!), but the book is so well written and full of interesting notes, both historical and mathematical, that it is very enjoyable even for those who think they don't have any more to discover about Galois theory. Among the features found in this treatise which are not common in similar presentations, let me mention his account of geometric constructions by origami (not every algebraist knows that the regular heptagon or enneadecagon can be constructed by paper folding!) or his very nice chapter on the division of the lemniscate (hinting at Kronecker's Jugendtraum for Q(i) and class field theory); his explanations on how to compute Galois groups also appear quite excellent. I merely regret that he didn't write a little something on Galois cohomology, but I guess that would have been beyond the intended scope of the book; and for those looking for a Bourbakist treatment of the Galois correspondance—as an equivalence of category between étale algebras and actions of the Galois group—Douady & Douady's also excellent (but utterly different in style and approach) Algèbre et Théories galoisiennes exists.

Anyway, I would heartily recommend Cox's book to anyone who knows basic algebra and wishes to learn about this fascinating and beautiful subject, Galois theory, and some of its nice applications (in elementary geometry and elsewhere): not just to students, but also to math hobbyists, mathematicians from other domains with a leisurely interest in algebra, etc.

[French translation of the above.]

David A. Cox est renommé (à part pour avoir été un des « découvreurs » des variétés toriques, un des objets les plus élégants de la géométrie algébrique) pour la clarté de son écriture mathématique : son Primes of the form x²+ny² est un excellent prolégomène à la théorie algébrique des nombres et la théorie du corps de classes. Dans une récente frénésie d'achat de livres, je me suis procuré une copie de son dernier livre, un traité de théorie de Galois (ISBN 0-471-43419-1), et je voudrais mentionner à quel point je le trouve remarquable — même si je ne l'ai pas parcouru beaucoup plus qu'en diagonale. Vrai, je n'ai pas énormément à y apprendre (il faut espérer !), mais le livre est tellement bien écrit et plein de notes intéressantes, tant historiques que mathématiques, qu'il est très appréciable même pour ceux qui croient qu'ils n'ont rien de plus à découvrir en théorie de Galois. Parmi les choses qu'on trouve dans ce traité qui ne sont pas communes dans des présentations semblables, signalons son compte-rendu des constructions géométriques à l'origami (tous les algébristes ne savent pas que l'heptagone ou l'ennéadécagone réguliers peuvent être construits en pliant du papier !) ou son chapitre très agréable sur la division de la lemniscate (en tirant vers le Jugendtraum de Kronecker pour Q(i) et la théorie du corps de classes) ; ses explications sur la manière de calculer les groupes de Galois semblent également excellentes. Je regrette simplement qu'il n'a pas écrit un petit quelque chose sur la cohomologie galoisienne, mais je suppose que ç'aurait été au-delà de la portée désirée de son livre ; et pour ceux qui cherchent un traitement bourbachique de la correspondance de Galois — comme une équivalence de catégorie entre les algèbres étales et les actions du groupe de Galois — l'également excellent (mais totalement différent par le style et l'approche) Algèbre et Théories galoisiennes de Douady & Douady existe.

Quoi qu'il en soit, je recommanderais chaleureusement le livre de Cox à quiconque connaît l'algèbre de base et souhaite apprendre ce sujet fascinant et beau, la théorie de Galois, et certaines de ses applications plaisantes (en géométrie élémentaire et ailleurs) : pas seulement aux étudiants, mais aussi aux mathématiciens amateurs, mathématiciens d'autres domaines avec un intérêt de dilettante pour l'algèbre, etc.

(samedi)

Blues du mathématicien

Une remarque (d'un de ces courageux commentateurs qui ne daignent pas signer de leur nom) sur une entrée précédente m'a fait réagir d'abord par un autre commentaire, mais je pense que le sujet mérite une entrée : la remarque était

La lecture de ce blog laisse un peu sceptique. On a plus l'impression d'avoir affaire à un amateur amusé par les mathématiques qu'à un mathématicien. Il serait temps de grandir un peu. La Mathématique apporte nettement plus de plaisir si on veut bien lui consacrer une relation suivie que si on vient tirer son coup de temps en temps…

Je réponds donc, d'abord, que ce n'est pas trop l'intérêt de ce blog — d'une part parce que les maths sont mon travail (et j'écris a priori pour parler de ma vie extra-professionnelle) et d'autre part parce que l'idée est qu'il (mon blog) soit généralement lisible par tous : je ne parle donc de maths que quand je me sens une envie soudaine de vulgariser ce que je fais ou lorsque j'ai appris quelque chose d'exceptionnellement frappant. Il est certainement vrai, aussi, que mon intérêt est trop dispersé dans des milliers de domaines différents, et même à l'intérieur des mathématiques dans des milliers de problématiques, et que ceci tend à être problématique pour faire de la recherche : mais qu'y puis-je ? on ne choisit pas ses goûts, et je reste persuadé que les mathématiques arrivent à progresser en se servant de toutes sortes de types de cerveaux, aussi bien les « panoramiques » que les « focalisés ».

Mais il y a une autre réponse, plus importante. Le « système » dans lequel on rentre, actuellement (en France au moins, mais je soupçonne que c'est pareil ou pire partout dans le monde) en voulant devenir chercheur en maths (et encore, les maths sont une des disciplines les moins atteintes par ce fléau) est une véritable machine à broyer l'individu. On parle des ravages de la prépa, mais pour avoir vécu les deux j'affirme que la prépa n'est rien par rapport à ce qui vient ensuite pour ceux qui ont la folie de vouloir consacrer leur vie à la Science. Ce système vous répète à l'envi que vous êtes insignifiant et mauvais, que vous devez faire vos preuves (encore, et toujours, et encore, et toujours), que vous n'avez aucun droit, et surtout pas celui de (prendre le temps de) vivre, et que vous n'avez aucune place nulle part. Alors il y a plusieurs réactions possibles : régresser en enfance, ignorer/refuser le système (voire, le quitter complètement), sombrer dans la frénésie du travail (et je conteste que ça soit plus sain ou même plus productif mathématiquement)… Ceux qui survivent ne sont pas forcément les meilleurs ou les plus utiles à la Science (même ceux qui passent en mode « frénétique »), ce sont les plus chanceux ou les plus résistants.

Moi je n'ai pas été broyé — pour l'instant — parce que la chance m'a souri (la chance, par exemple, dans les qualités remarquables de mon directeur de thèse, la chance d'avoir la place que j'ai, etc.) — pour l'instant. Mais je témoigne quand même de l'anxiété ressentie. À tel point que je me demande parfois, quand je vois des jeunes prêts à s'engager dans les maths, si je ne dois pas les en décourager : les maths sont quelque chose d'incontestablement magnifique, mais tout sera fait pour vous mettre des bâtons dans les roues.

Le fait est que mon parcours m'a donné l'occasion de rencontrer des jeunes incroyablement brillants, et aussi d'être témoin d'un incroyable gâchis de cerveaux. Je n'en dirai pas plus parce que je ne veux pas citer de noms, mais quand je pense à ce que sont devenus, ou ce que s'apprêtent à devenir, certains qui ne rentrent pas vraiment « dans le moule », j'ai envie de pleurer.

(vendredi)

L'arbre de Stern-Brocot

Ce que je trouve fascinant dans les mathématiques, ce sont les objets infiniment élégants qu'on peut y rencontrer : je ne m'enthousiasme pas tant pour les démonstrations que pour les créatures qui peuplent le paradis platonique et dont on a vraiment l'impression qu'elles existent et qu'on ne fait que les découvrir et non les inventer. La créature que j'ai rencontrée en l'occurrence (pas aujourd'hui, mais c'est aujourd'hui que j'ai appris son nom), c'est l'arbre de Stern-Brocot : il se trouve que je l'ai redécouvert (et je suppose que je ne suis pas le premier ; déjà, il porte un double nom en l'honneur de deux personnes — Moris Stern et Achille Brocot — qui l'ont découvert indépendamment) dans ma thèse (voyez page 26 de mon manuscrit) en étudiant la résolution par éclatement des morphismes depuis la droite projective, mais je suppose que j'aurais pu le rencontrer en mille et une circonstances tellement il est naturel. J'en discutais avec un ami (Arthur), qui m'a fait remarquer que cet arbre était déjà connu et signalé dans Concrete Mathematics (le livre de Graham, Knuth et Patashnik), et c'est là que j'en ai appris le nom.

Il s'agit d'un arbre binaire dont les feuilles sont exactement les nombres rationnels (du moins tel que je le conçois, avec zéro pour racine ; d'autres présentations prennent des sous-arbres de ce que j'évoque) : il a pour racine le nombre 0, dont partent deux feuilles étiquetées −1 (à gauche) et 1 (à droite) ; au niveau suivant, les feuilles sont −2 et −½ (filles de la feuille −1), ½ et 2 (filles de la feuille 1) ; au niveau suivant ce sont −3, −3/2, −2/3, −1/3, 1/3, 2/3, 3/2 et 3. À chaque niveau, la règle de construction est de placer entre deux fractions déjà formées la fraction dont le numérateur et le dénominateur sont chacun somme de ceux des deux fractions gauche et droite entre lesquelles on intercale la nouvelle (par exemple, entre 1/2 et 2/3 on mettra 3/5, qui sera fils gauche de 2/3). Peut-être que les explications de PlanetMath ou celles de MathWorld, avec dessin, seront plus claires. Cet arbre contient une et une seule fois chaque rationnel, qui apparaît sous forme réduite, et les irrationnels correspondent à des branches dans l'arbre de Stern-Brocot ; de plus, il a des propriétés miraculeuses liées à l'algorithme d'Euclide (d'écriture des réels en fractions continuées) : si on suit une branche de l'arbre, les fractions qui apparaissent sont exactement les meilleures approximations rationnelles du réel limite, et les changements de direction (de la gauche vers la droite ou vice versa) se font exactement aux réduites de l'écriture du réel en fraction continuée. Par exemple, si on part de 1 et qu'on alterne branche droite et branche gauche, on trouve les rapports successifs des nombres de Fibonacci (2, 3/2, 5/3, 8/5, 13/8…) qui sont les approximants d'Euclide convergeant vers le nombre d'or.

[Graphe de la fonction de Stern-Brocot]Je ne m'arrête pas là : supposons que je mette en correspondance l'arbre de Stern-Brocot (mettons le sous-arbre qui a pour sommet ½, entre 0 et 1) avec l'arbre dyadique de même intervalle (qui a pour sommet ½ dont partent deux branches vers ¼ et ¾ et ensuite vers les huitièmes et ainsi de suite). On obtient une fonction continue croissante (représentée ci-contre) qui à tout rationnel (entre 0 et 1) associe un nombre dyadique (c'est-à-dire un rationnel dont le dénominateur est une puissance de 2) : elle envoie par exemple 1/2 sur 1/2, 1/3 sur 1/4, 2/3 sur 3/4, 3/5 sur 5/8 et 5/8 sur 11/16. Cette fonction se prolonge (de façon unique) en une fonction croissante continue φ de l'intervalle [0;1] sur lui-même, qui fait correspondre exactement non seulement les rationnels avec les dyadiques mais aussi — par une propriété bien connue des développements en fractions continuées — les réels algébriques quadratiques avec les rationnels (par exemple, l'inverse du nombre d'or, (√5−1)/2, ou 0.61803…, s'envoie sur 2/3 exactement, car ils s'obtiennent en alternant branche droite et branche gauche dans un cas sur l'arbre de Stern-Brocot et dans l'autre sur l'arbre dyadique). Ceci suggère toutes sortes de questions. Que peut-on dire, par exemple, du nombre dont l'image par φ est (√5−1)/2 (et donc l'image par φ² — l'itérée double de φ — est 2/3) ? Que peut-on dire des nombres dont l'image par un nombre fini d'application de φ (à la partie fractionnaire) donne un rationnel (ou, de façon équivalente, un dyadique) ? Sont-ils stables par addition et multiplication ? Peut-on les caractériser ? L'image d'un algébrique par φ est-elle un algébrique ? Le nombre 0.42037… qui est un des deux points fixes irrationnels de φ (autrement dit, son parcours dans l'arbre de Stern-Brocot est le même que son parcours dans l'arbre dyadique, c'est-à-dire que son développement en fraction continuée et son écriture binaire sont directement liés) a-t-il des propriétés remarquables ? Est-il transcendant ? Bon, je n'ai pas réfléchi à tout ça, et sans doute beaucoup de ces questions sont-elles stupides (soit parce que leur réponse est évidente soit — ce qui me semble plus probable — parce qu'elle est hors de portée et peu intéressante), mais je suis sûr qu'il y a tout de même quantité de choses fascinantes à dire sur cette fonction φ (tiens, sa dérivée s'annule en tous les dyadiques, mais que peut-on dire de φ′ ailleurs).

(dimanche)

Les affres du nilradical inférieur

C'est un sentiment vraiment horrible de se retrouver un dimanche à onze heures du soir passées à vouloir savoir ce que c'est que le nilradical inférieur (d'un anneau non commutatif) et de n'avoir aucun moyen d'accéder à cette information. Je suis très sérieux — enfin presque.

J'ai la fâcheuse manie de travailler hors des heures d'ouverture de la bibliothèque de maths à laquelle j'ai accès ; j'ai une petite collection de livres de maths dans mon bureau (et une collection bien plus importante chez mes parents à Orsay, mais je n'y suis plus trop), qui souvent ne suffit pas à fournir les réponses que je cherche. Reste le Web : mais ce qui est frustrant, avec le Web, c'est qu'on y trouve des articles de recherche (et un article de recherche en algèbre non commutative ne va jamais prendre la peine de rappeler quelque chose censément aussi connu que la définition du nilradical), des cours de niveau vraiment basique, et quelques informations éparses au niveau intermédiaire, mais rien de cohérent.

Alors voilà, pris dans un méandre de ma pensée j'ai voulu retrouver la définition du nilradical inférieur d'un anneau non commutatif. (Plus exactement, il y a un nilradical supérieur et un nilradical inférieur qui généralisent la notion de nilradical d'un anneau commutatif — l'ensemble des éléments nilpotents. Je connais une définition possible, parfois appelée nilradical tout court, à savoir la somme des idéaux bilatères nils — c'est-à-dire dont tous les éléments sont nilpotents — mais je ne sais pas si c'est le supérieur ou l'inférieur : je penche plutôt pour le supérieur, et j'aimerais bien savoir quel est l'autre définition — peut-être la somme des idéaux bilatères nilpotents mais ça pourrait être tout autre chose.) Impossible : tous les livres que j'avais sous la main traitent essentiellement (ou uniquement) d'algèbre commutative, et personne sur le Web ni sur Usenet n'a jamais écrit noir sur blanc la définition du nilradical inférieur. Je sais que la réponse est dans le livre de Lam sur les anneaux non commutatifs, qui se trouve chez mes parents, mais je ne l'ai pas avec moi.

C'est absolument affreux. Pas pour le nilradical lui-même, mais ce sentiment que l'information est là, quelque part, mais inaccessible.

(Tuesday)

The twenty-seven lines on the cubic surface

[Clebsch Cubic surface]I spent a good part of the afternoon creating this image (click to enlarge) of one of the remarkable inhabitants of the platonic heaven: the Clebsch cubic surface; specifically, this is the Euclidean form of the latter which has the greatest possible group of symmetries (24 of the 120 symmetries of the Clebsch cubic are realized as Euclidean isometries).

Every smooth cubic surface has twenty-seven lines on it (sometimes poetically known as Solomon's seal; I do not know who coined the term or whether it is related to the plant Polygonatum biflorum, which also goes by that name). But in general they exist only as complex lines and might not all be realized: the number of real lines can be three, seven, fifteen or twenty-seven, and on the Clebsch cubic all twenty-seven lines exist in a real sense. You can only see twenty-four lines in the picture (can you?), however, because the last three lines are away at infinity.

Furthermore, it is possible for three lines on a cubic surface to all meet in a single point, in which case the point in question is known as an Eckardt point (this is a remarkable feature, and while all cubic surfaces have lines on them, not all have Eckardt points, even in the complex sens): the Clebsch cubic surface is unique in that it has ten Eckardt points, and all are real (on my particular Euclidean realization, four are the vertices of a regular tetrahedron, two of which can be clearly seen, and six are at infinity).

Another way to represent a smooth cubic surface (at least one which has all twenty-seven lines real) is as a set of six points in the (projective) plane (in general position, that is, such that no three are aligned and all six do not line on a common conic). It is not easy to describe precisely the relation between the six marked (or blown up) points and the cubic surface[#], but it is quite easy to explain how the twenty-seven exceptional lines are seen: consider the six marked points, the fifteen lines connecting any two of them, and the six conics going through five of the marked points — now 6+15+6=27, and they correspond exactly to the exceptional lines on the cubic surface; and even intersection is preserved if we agree that intersection at the marked points in the plane is only taken into account when it is tangential[#2]. Eckardt points are also easily seen that way: when three lines defined by three pairs of marked points meet in a common point, that point is an Eckardt point; also when the conic through five of the six marked points has a tangent at one of said marked points which goes through the sixth, then that tangent direction is an Eckardt “point”. Under this correspondance, the Clebsch cubic is the most remarkable configuration of six points in the plane, namely, a regular pentagon and its center. The ten Eckardt points are then obvious.

So one of the answers I might give when asked what my thesis is about is: six points in the plane.

[#] Each point on the cubic surface corresponds to a point on the plane and, if it is one of the six marked points, a line direction throught that point. (This is what is meant by blowing up: replacing a marked point by the set of all directions through that point.)

[#2] For example, given three of the six marked points, the three lines connecting them are thought not to intersect; however, each of them intersects the two marked points which it joins. This is in accordance with the idea that the marked points have been replaced by the set of directions through them.

(lundi)

Encore quelques petites nouvelles mathématiques

Mon premier TD s'est plutôt bien passé. Ou alors, s'ils ont trouvé que j'étais décidément nul, ils ont été trop timides pour me le faire savoir (mais j'y crois assez peu ; en revanche, bouh hou hou, il y en a qui trouvent moyen de me vouvoyer). Mais je n'ai fait que moins de la moitié de ce que je pensais faire (donc moins du quart de la feuille, vu que j'avais prévu large dans l'autre sens).

Sinon, je me suis (stupidement ?) engagé à faire un exposé jeudi après-midi au séminaire des doctorants de géométrie algébrique à Paris XIII (Villetaneuse) sur quelques questions autour de l'arithmétique des variétés rationnellement connexes. Je n'ai encore aucune idée de ce que je vais bien pouvoir raconter.

J'ai eu un premier écho du rapporteur américain de ma thèse, qui ne dit pas grand-chose (il pose quelques questions qui n'ont pas l'air d'être une façon diplomatique de signaler une erreur) mais qui finit par une appréciation positive. Je vais sans doute bientôt sortir une version revue et corrigée de mon manuscrit. Avec tout ça je n'ai pas vraiment le temps de faire de la recherche… je me sens un peu débordé, en fait.

Je tiens toujours à apprendre comment on résout le problème de Post (exhiber des degrés de calculabilité récursivement énumérables strictement intermédiaires entre le degré récursif et celui du problème de l'arrêt — voir l'article sur Wikipédia que j'ai un peu complété). Je trouve ce problème absolument fascinant. Je viens d'avoir une discussion sur la question de savoir où il pourrait être enseigné, d'ailleurs, discussion d'où il résulte que peut-être il n'existe aucun cours de calculabilité (niveau master, en gros) en région parisienne dans le cadre duquel ce problème serait traité. Si c'est bien le cas je trouve ça vraiment dommage.

Une conjecture fumée qu'on pourrait imaginer est que le dixième problème de Hilbert pour l'existence d'une solution rationnelle à des équations diophantiennes serait, justement, indécidable mais non ramenable au problème semi-décidable universel (le problème de l'arrêt). Ce serait surprenant, et, pourtant, ça ne contredit rien de ce qu'on sait (ou en tout cas, de ce que je sais) sur la question, notamment le fait qu'on ne sache pas trouver un algorithme mais qu'on n'arrive pas non plus à ramener le problème à la décision sur les entiers en définissant un Z de façon diophantienne dans les rationnels.

(Friday)

Reverse Mathematics

Reverse mathematics is a strange subject (AMS Mathematics Subject Classification: 03B30, 03F35) that I didn't even know existed until I stumbled upon it by chance a few days ago. It was founded by Harvey Friedman and one of its leading experts is Stephen G. Simpson. Let me try to explain briefly what it is about.

Ordinary (“forward”?) mathematics, at least from the formalist's point of view, consists essentially of the following: start with a set of axioms, which is usually the Zermelo-Fraenkel set theory (although one of the things reverse mathematics teaches us is that in fact there is no need to make such incredibly strong assumptions), and try to derive theorems from them. Reverse mathematics goes the other way around, it tries to assess the “strength” of each theorem by seeing how much of the axioms has been captured in it and can be derived back from its content. Perhaps this is a big too vague to make much sense, so I'll try to be clearer.

No mathematical proof ever makes use of the full strength of the axioms[#]. Now what happens if we restrict the system—either by omitting some axioms or by weakening them in various ways? Some theorems will cease to be theorems, and if we continue that way we lose more and more theorems until the system becomes so weak that it is essentially useless and uninteresting and the irrelevant becomes a barrier (for example, irrelevant differences in the formulation of this or that axiom might cease to be irrelevant if the other axioms are weakened too much, because the equivalence between the formulations is no longer provable). Stop somewhere before you get to that point where the system is unmanageably weak, and call the resulting set of axioms the “core system”. So far this is not rigorous, we're just setting up the framework. Everything will then be done over that core system. Many results which “used to be” theorems (they are so in the full axiom system) are no longer so in the core system. A first step toward reverse mathematics would be to show that this or that theorem (of the full system) is indeed unprovable in the core system (the fact that the usual proof requires strong axioms doesn't mean that there doesn't exist a smarter proof which could do with weaker ones).

But reverse mathematics goes farther than this: one isn't content with giving bounds on the “logical strength” of a theorem over the core system (such as: the core system cannot prove statement T, but the full system can— or even this-or-that weakened system, intermediate between the core and full systems, cannot prove statement T, whereas this-or-that weakened system can), one seeks to determine the strength exactly. Indeed, it turns out, rather surprisingly, that over reasonable core systems, many theorems (of stronger systems) are in fact equivalent to one another, and equivalent to a certain reasonably formulated logical statement (an axiom or axiom scheme which is a weakening or a subset of some axioms of the full system omitted in the core one). When one can show that statement T not only follows from a certain natural set of axioms intermediate between the core and full systems, but also, conversely, implies (together with the core) the axioms in question, then one can be satisfied that one has precisely assessed the logical strength of T.

A priori I would have very much doubted this enterprise to be feasible. It doesn't seem to make much sense to say that, for example, the Cantor-Bendixson theorem (every closed subset of the reals is the union of a perfect set and a countable one) and the statement that every countable abelian group is direct sum of a divisible group and a reduced group (one which doesn't have any non-trivial divisible subgroup) are equivalent—or does it?—let alone equivalent to some logical principle. True, when one looks closely at their classical proof, they both make a similar use of strong transfinite recursion (the Cantor-Bendixson theorem, in fact, was what let Cantor to discover ordinal numbers, by transfinitely iterating the operation of taking accumulation points). Yet reverse mathematics teaches us that these theorems are, in fact, equivalent in some sense (over a very reasonable core theory), being both equivalent to the so-called “principle of Π11-comprehension”.

Another exciting feature of reverse mathematics is that it gives rise to natural undecidability statements. We know from Gödel's theorem that there will always be undecidables (even arithmetical ones) in a useful mathematical theory, but the canonical examples are very contrived: Gödel's sentence, written directly, is entirely unnatural to the mathematician, examples within set theory appeal to large cardinal hypotheses (this is no surprise: set theory was so designed to be powerful enough—and indeed far more powerful than necessary—to contain all of classical mathematics, so undecidable statements in set theory must be non-classical in some sense; nor is the continuum hypothesis a good example), and standard examples for Peano arithmetic make use of other bizarre[#2] constructions. Now reverse mathematics gives us undecidability results where the statements are quite natural (they are classical mathematical theorems) and only the axioms are weakened somewhat (and not in an unnatural way).

Another strange fact is that the logical systems which appear naturally in reverse mathematics are very few in number (compared to the body of theorems being studied) and, for the most part, totally ordered in strength. To start with, we need to fix a theory and core axiom system: unfortunately, it is not really feasible[#3] to use the usual language of set theory and some weakened form of ZF, because ZF, as I have noted several times, is far too strong a system, and it cannot be conveniently weakened. Harvey Friedman has suggested using second-order arithmetic as working language (this means that some theorems might require a little effort to code, but it is not wholly unnatural either), and a core system called “recursive comprehension” (RCA in short)—weaker even than Peano's axioms (basically, as far as arithmetic goes, it is Peano's axioms restricted to Σ1-induction) but already sufficient for making a whole lot of sense. The full system would be “classical analysis”, or second-order arithmetic with unrestricted comprehension, a system much weaker than ZF but far more than sufficient to prove just about every standard theorem that can be formulated in the language.

It turns out that, starting with a body of theorems of all sorts of domains of classical mathematics, from both algebra and analysis, reverse mathematicians have found nearly all of them to fit in a sequence of five system: from weakest to strongest, “recursive comprehension” (the core system, in other words, those theorems that can be proved even from that weak system of axioms), “weak König's lemma” (a weak form of the classical lemma by Dènes König, namely: every infinite binary tree has an infinite path), “arithmetical comprehension” (a system essentially of the same strength as Peano's axioms—it has the same first-order consequences; it is also equivalent, over the core system, to the full König's lemma), “(autonomous) arithmetical transfinite recursion” and “Π11-comprehension” (all five systems are weaker than classical analysis). To my mind, this is the sign that reverse mathematics is actually hitting on something very profound: that a great variety of theorems from very different domains of mathematics all reduce neatly to five systems in increasing order of strength is a significant discovery.

For the sake of completeness, I should also say a word of what happens in the other direction: if, instead of seeking to weaken the axioms, we strengthen them. It turns out that there is essentially one very natural way of doing so, starting from usual (ZF) set theory, namely, adding large cardinal hypotheses. I will not attempt to explain what these are, let's just say that they are certain (very large, indeed quite monstrous) sets whose existence cannot be proven using standard axioms and which must be postulated. Now it so happens that they also form a quite orderly hierarchy (that the cardinals themselves are well-ordered is a triviality, but the logical principles behind their assumptions might not be). Here, it must be understood that a hypothesis such as there exists a Mahlo cardinal is not so much interesting as the arithmetical consequences that it implies: the important fact is that it a Mahlo cardinal can exist, and the consistency of the existence of a Mahlo cardinal is an arithmetical statement, one that deals with the ordinary integers, even though the Mahlo cardinal is some monstrous object living in the remote recesses of the platonic heaven, but the arithmetical statement can somehow capture and conjure the strength of the Mahlo cardinal itself—that is a strange philosophical idea. Of course, these axioms of unreasonable strength, there exists (can exist) a Mahlo cardinal, there exists (can exist) a measurable cardinal, let alone there exists (can exist) a supercompact cardinal are of no use whatsoever in ordinary mathematics (they are far to strong, we might say), so there is no reverse mathematics to deal with them. But they somehow lie on the same scale (I'm sure there should be a way to make precise the statement that the consistency of Peano's axioms lies at the level of ε0 and that of Zermelo-Fraenkel set theory at the level of the first inaccessible cardinal).

To learn more about reverse mathematics, with prerequisites even lower than the little overview I have given, I recommend Simpson's Subsystems of Second Order Arithmetic, which is wonderfully written. Anyone with a basic (first-year graduate, perhaps) course in mathematical logic should be able to read the first chapter, which gives a beautiful account of what the game is all about. Sadly, as is too often the case with specialized mathematical textbooks, it is out of print.

[#] In the case of Zermelo-Fraenkel set theory, this is not just a vague idea: the axioms of (first order) ZF are infinite in number (because of the replacement scheme) and a proof, being finite in length, can only appeal to a finite number of them. And this fact is not anecdotal: a well-known result is that ZF is “reflexive” in the sense that the full system proves the consistency of any given finite subset of the axioms—whereas Gödel's incompleteness theorem implies that it cannot prove the consistency of all of them.

[#2] One of the all-time favorite examples is the “Kirby-Paris Hydra theorem”. It says the following. Start with a finite tree (the “Hydra”). At each step of the game, “Heracles” is allowed at each step to chop off one of the Hydra's heads, i.e., a leaf (= terminal node) from the tree. But, when he does so, the Hydra might grow some more heads. Specifically: from the parent node on the tree to that (neck?) where Heracles has chopped off a head (that is, the late head's grandparent, if I may call it that way), every subbranch (including the one from which a head was cut of) is multiplied a certain number of times, and from the parent of that head, every subbranch (including that which has already multiplied) is also multiplied a certain number of times, and so on down to the root. The Hydra is allowed to reproduce itself in that way an arbitrary number of times at each step (but only starting from the parent node of that from which Heracles has cut a head, and straight down to the root, not on any other node—for example, if Heracles cuts off a head that is directly attached to the root, the Hydra cannot grow any head back, and if he chops off a head two steps from the root, the Hydra can only grow subtrees on the root which are identical to the severed branch). The statement is then that no matter how (that is, in which order) Heracles chooses to chop heads off the Hydra and no matter how many subtrees the Hydra grows back at every step (even if that number increases dramatically), Heracles will chop every head off in finite time. This statement is true, but is not provable from (first order) Peano's axioms; as a matter of fact, it is equivalent, over them, to the statement of transfinite recursion over ε0, which, as we know from Gentzen, is sufficient to prove the consistency of Peano's axioms. Another classical example is that of Goodstein sequences, which I will not describe here. From the reverse mathematics point of view, both the Hydra theorem and that on Goodstein sequences are equivalent to ε0-recursion.

[#3] For those that do not like second-order arithmetic, however, there are also some results of reverse mathematics in the language of set theory. They are quite parallel to the results in second-order arithmetic, only they don't have access to the very weakest systems, so they are considered less interesting.

(Saturday)

Gödel was here

I've just learned of this mathematical result which I guess I could nominate as the most elegant theorem of all times (though probably the most useless ever). Actually, I had already read the statement in Douglas Hofstadter's Gödel, Escher, Bach a long time ago, but I hadn't paid much attention to it then; and now (in the course of thinking carefully about Gödel's incompleteness theorem, Löb's theorem, iterated Gödelization and self-consistency statements) I figured out how to prove it, and the proof is simply wonderful. I can't remember at the time whose name is associated to it (it is not Gödel), but here goes the theorem:

Theorem: This statement is a theorem.

That's all. Statement T merely states that T is a theorem (say, of first-order Peano arithmetic); and T is, in fact, true (and is a theorem: for once, we don't have to distinguish T being true and T being a theorem, because the two are exactly identical, by definition of T!). This sound provokingly much like the famous riddle:

Q: What is the ultimate question in the Universe, and what is its answer?

A: The ultimate question is that which you have just asked and its answer is that which I have just given.

So maybe we can try proving statement T by saying something like this is the proof of statement T — but any mathematician will see that this is a fraud (error 42: attempting to apply a fixed point operator on proofs!). Yet the proof that works is not entirely different either, but it is more intricate, a cleverly crafted jewel.

I won't give that proof here, though. I believe any mathematician who correctly understands Gödel's theorem (not just in the handwaving way it is sometimes — and to much damage — explained to laymen) should be able to have the pleasure of figuring the proof by himself, and anyone who does not understand Gödel's theorem sufficiently well would miss the point entirely. But maybe I'll write a little survey on the incompleteness theorem(s) sometime soon, which would try to go through all the subtleties and intricacies of how it works (e.g., do we need the set of axioms to be Σ1, or does arithmetically definable suffice? why?) and what happens when we try to push it to its limits (iterating Gödelization and reflexions to transfinite heights as Solomon Feferman has done in the most brilliant way); in which case I would also, as a matter of course, give a proof of the above-mentioned theorem. Just so people can't accuse me of lacking the appropriate rigor, here is the (“Quine-unfolding”) mathematically precise way of stating T:

Fix a usual Gödel numbering scheme (of the language of first-order arithmetic). Let P(n) be the predicate such that, for any predicate Q(n) with Gödel number ⌜Q⌝, P(⌜Q⌝) asserts the existence of a proof, in the first-order theory of Peano's axioms, of “Q(⌜Q⌝)” (that is, of the statement obtained by substituting Q's Gödel number, ⌜Q⌝, in place of the free variable). Then we have P(⌜P⌝) [and the proof works in first-order Peano arithmetic].

As an extra bonus, we can do everything in intuitionist logic (that the proof of the above statement can be given in intuitionist logic is trivial, since in the end we exhibit a proof; but actually we can replace the statement by the stronger statement that this statement is provable in intuitionist logic and the statement is again true — and indeed provable in intuitionist logic).

(mardi)

Deux exposés mathématiques

J'ai assisté à deux exposés à Orsay, aujourd'hui. Le premier, par Pierre Cartier (auquel j'avais fait référence déjà) concernait Bourbaki. Cartier raconte toujours de façon très intéressante, il a juste le défaut de partir parfois dans un peu trop de digressions (même si ses anecdotes sont amusantes). Je n'essaierai pas de résumer tout ce que j'ai appris, parce que ce sont plutôt une multitude de petits faits isolés que des grandes idées. De façon très succincte, son propos était : le bilan strictement scientifique de Bourbaki est globalement positif, mais son influence sur l'enseignement (dont il n'est d'ailleurs pas directement responsable), c'est-à-dire les maths modernes, a été catastrophique. Cela pose d'ailleurs la question tout à fait générale de comment on doit au mieux enseigner les mathématiques (entre autres — j'en discutais tout à l'heure avec une amie qui est prof en collège — comment présenter la notion de démonstration et faire ressentir son intérêt ? cela me semble très délicat), question dont je ne pense malheureusement pas qu'elle admette de réponse satisfaisante, en fait. J'y reviendrai peut-être un jour.

Le second était un exposé scientifique (par Bjorn Poonen, un des mathématiciens qui donne les séminaires les plus clairs que je connaisse) et concernait le dixième problème de Hilbert.

Sous sa forme originale, le dixième problème de Hilbert est quelque chose comme ceci : considérons un polynôme f à N variables et à coefficients entiers, on cherche à savoir s'il existe des entiers x1,…,xN tels que f(x1,…,xN)=0 (autrement dit, à savoir si l'équation diophantienne f=0 est résoluble), et on cherche à le faire de façon algorithmique : autrement dit, on demande s'il est possible de trouver un programme informatique (peu importent les détails, si on croit à la thèse de Church-Turing) qui, quand on lui fournit le polynôme f, va déterminer si l'équation est résoluble. La réponse apportée par Yuri Matiyasevič est négative : il n'existe pas de tel algorithme (il démontre même que, quel que soit l'ensemble d'entiers E récursivement énumérable, il existe f à 1+N variables pour un certain N — qui peut être choisi uniformément — tel que aE si et seulement si f(a, x1,…,xN) = 0 admet une solution dans les variables x1,…,xN ; et comme on sait qu'on peut trouver des ensembles récursivement énumérables et non récursifs, il ne peut pas y avoir d'algorithme — en fait, on atteint le niveau maximal de non-récursivité au sens de Post, et par ailleurs, ce qui est peut-être encore plus frappant, on peut trouver des f tels que l'existence d'une solution soit indécidable au sens de Gödel, dans n'importe quel système formel récursif contenant au moins l'arithmétique).

Ce qui est remarquable, en revanche, c'est que si on remplace la recherche de solutions entières par des solutions rationnelles (on peut aussi permettre aux coefficients de f d'être rationnels, ça ne change rien dans un cas comme dans l'autre car on peut toujours chasser les dénominateur), on ignore si la question est décidable ou non. La plupart des mathématiciens pensent que la réponse est négative comme sur les entiers, mais certains sont d'un avis différent (comme Swinnerton-Dyer, notamment, ou, semble-t-il, Mazur : ce ne sont pas de petits noms), et d'ailleurs un exposé récent du même Poonen au séminaire Variétés rationnelles laissait entrevoir un espoir possible de réponse positive ; cependant, l'exposé d'aujourd'hui laissait plutôt penser à une réponse négative. En tout cas, c'est une situation un peu analogue au fameux problème P=NP : la plupart des gens pensent qu'il n'y a pas d'algorithme, ce qui est sans doute dommage, mais on ne sait pas le démontrer, ce qui est également dommage. Sur les complexes ou les réels (ou les p-adiques), c'est-à-dire si on cherche des solutions dans un de ces corps-là, il existe bien un algorithme. L'exposé d'aujourd'hui portait sur le résultat suivant : il existe un ensemble S de nombres premiers de densité naturelle 1 (c'est-à-dire que pour x grand, le nombre de nombres premiers inférieurs à x qui sont dans S est asymptotiquement équivalent au nombre de nombres premiers inférieurs à x tout court) tel qu'il n'existe pas d'algorithme pour détecter l'existence de solutions rationnelles dont le dénominateur n'a que des facteurs premiers dans S ; si on pouvait dans cette affirmation prendre pour S l'ensemble de tous les nombres premiers (ou même, en fait, tous sauf un nombre fini), ce serait la réponse négative sur les rationnels, mais obtenir un ensemble de densité naturelle 1 est déjà une indication importante dans cette direction.

Clarification (2004-12-18T01:30+0100) : Yann Ollivier me fait remarquer que le résultat tel que je l'annonce est trivial si S n'est pas supposé récursif. Confirmation prise auprès de Bjorn Poonen, l'ensemble S qu'il construit est bien récursif : donc, rajouter cette précision dans les énoncés ci-dessus.

(vendredi)

Comment je fais des maths (ou pas)

C'est quelque chose qui me fascine assez, comment j'arrive à « faire des maths » pendant des heures d'affilée et ne pas avancer d'un pouce — mais pas parce que je butte sur une difficulté, simplement, je m'égare, je pense à autre chose (des mathématiques toujours, mais pas la question sur laquelle je suis censé réfléchir), je me pose des questions sans importance et je tiens obstinément à les résoudre avant de continuer. J'ai déjà signalé que j'ai tendance à me laisser trop facilement piéger par les petits problèmes à l'apparence élégante : je me demande dans quelle mesure c'est le cas des autres matheux. La rédaction d'une introduction de thèse est particulièrement redoutable pour ce qui est de tomber dans ce genre de pièges : quand on veut dresser un panorama de ce qu'on sait, c'est le moment de se poser énormément de Questions À La Con® et de passer un temps fou à les résoudre. J'ai noirci des pages et des pages de calculs pour appliquer des concepts abstraits à des situations triviales (vous serez tous ravis de savoir, par exemple, qu'une courbe cubique plane singulière irréductible tracée sur une surface cubique lisse est très libre si et seulement si sa singularité est un point double ordinaire : c'est ce qui résulte d'un calcul bovin et sans subtilité, et ça ne sert absolument à rien, même dans ma thèse).

Bref, alors que le temps commence à me manquer vraiment sévèrement, je le perds allègrement. Mais le pire, c'est que c'est en faisant des maths ! (Simplement, pas comme il le faudrait.)

(Friday)

Math is hard

One of the reason I didn't study computer science is that it is a pit of despair: as far as practical problems are concerned, nobody has yet come up with a programming language that is really usable (so everyone writes stuff in C, which is the moral equivalent of writing in English in iambic pentameters without the letter ‘e’—that is, sheer masochism—,or C++, which is worse; and high-level languages simply don't work); as for theoretical problems, they are sitting in a kind of limbo between mathematics and theology. Anyway.

But math is also a source of despair, when one reflects on how little one can prove and how many simple questions are left open and probably will remain so for a long time.

It is easy to concoct a math problem which is understandable by anyone and which is probably bound to remain unsolved for a really long time. Perhaps the simplest example is the so-called Syracuse problem (on the Collatz sequence), namely: start with a positive integer n, and, so long as it is not equal to 1, repeat the following: if it is even, divide it by two, and if it is odd, multiply it by three and add one (for example: 7 → 22 → 11 → 34 → 17 → 52 → 26 → 13 → 40 → 20 → 10 → 5 → 16 → 8 → 4 → 2 → 1); the conjecture states that, whatever the starting integer, the sequence will eventually reach 1 (after which it would go into the loop 1 → 4 → 2 → 1 if it is continued; the question is essentially whether there exist other loops than that which starts from 1). It has been verified experimentally for a huge number of starting values, but so far as I know, nobody has been able to come up with a proof (or, at least, a published proof which has passed peer-review: because there are certainly hundreds of crackpot-generated proofs on the Web). Of course, nobody (almost no real mathematician, I mean) is seriously interested in this particular problem, so it isn't a surprise that no progress is being made; all the same, it is probably a very hard problem.

Here's one, however, that is of much greater theoretical interest, which is “probably not false” (as I heard Swinnerton-Dyer call it), and which is hopelessly out of reach of the present techniques of mathematics. Let F1,…,Fk be k polynomials (in one variable x) with integer coefficients and positive leading coefficient, and assume the product F1·…·Fk of all the Fi is not constantly divisible by some prime p (for example, x²+x is always even—assume that sort of thing doesn't happen): then [the conjecture states that] there are infinitely many integer values of x such that the Fi(x) are all simultaneously prime. This is called Schinzel's (H) hypothesis (or sometimes the Schinzel-Sierpiński hypothesis). Even in the simple case where one takes the two polynomials x and x+2, the Schinzel hypothesis implies the twin primes conjecture, which is far from proven. Similarly, Schinzel's hypothesis implies that there are infinitely many primes of the form 6q²+1 where q itself is prime, and many other things of the same form.

Here is another conjecture, which is about of the order of difficulty of Schinzel's hypothesis (i.e., probably not false, but unattainable): assume t1,…,tr are r complex numbers that are linearly independent over the rationals, meaning that if c1,…,cr are r rationals such that c1·t1 + … + cr·tr = 0, then all the ci are zero (for example, 1, √2 and 2iπ are linearly independent over the rationals); then [the conjecture states that] out of the 2r complex numbers t1,…,tr,et1,…etr (in other words, add the exponentials of the ti to the list), there are at least r which are algebraically independent (over the rationals), meaning that if some polynomial with rational coefficients in r variables vanishes when applied to the r quantities in question, the polynomial is identically zero. This is known as Schanuel's conjecture. If applied in the particular case of 1, √2 and 2iπ, Schanuel's conjecture implies that the three quantities e, e√2 and π are algebraically independent, which in turn implies the transcendence of such quantities as e+π which is still an open problem. Schanuel's conjecture is a kind of holy grail in transcendental number theory.

In comparison to Schinzel's hypothesis or Schanuel's conjecture, the seven problems whose head is at stake for $1000000 are presumably quite easy (in fact, at least one—namely the Poincaré conjecture—can now be considered as good as solved, thanks to Perelman).

It is not unthinkable that these problems should be undecidable; however, the tools available for proving the undecidability of a mathematical statement are even more inadequate, in this case, than those that might attempt to prove the statement… (I let those with some knowledge in logic reflect upon what happens when one iterates the construction is undecidable to transfinite heights).

(mardi) · Dernier Quartier

Comment piéger un David Madore

Une façon de piéger un David Madore, c'est de lui poser une question de maths qui a l'air parfaitement innocente et qu'il va avoir envie de résoudre rapidement et élégamment, et qui en fait s'avère être un piège redoutable. Je suis capable de passer un temps invraisemblable sur certains problèmes de ce genre : en fait, c'est quasi obsessionnel — je n'arrive plus à penser à autre chose tant que je n'ai pas résolu la question ou que je ne me suis pas convaincu (parfois avec une certaine mauvaise foi, heureusement, sinon je pourrais y rester bloqué indéfiniment) que le problème n'a pas autant d'intérêt que je le pensais.

Un exemple de tel problème qui m'a bien eu il y a quelque temps était celui-ci :

Considérons un polyèdre (convexe, pas forcément régulier). Sur chaque face du polyèdre il y a une fourmi, qui parcourt les arêtes de la face en question (au rythme qu'elle veut, mais de façon continue, bien sûr ; elle a le droit de s'arrêter, de ralentir ou d'accélérer, mais pas de revenir en arrière) toujours en tournant dans le sens trigonométrique (le sens contraire des aiguilles d'une montre). On suppose qu'entre deux instants donnés, chaque fourmi a accompli un nombre entier non nul de tours (autrement dit, chaque fourmi a fait au moins un tour, dans le sens trigonométrique, de la face dont elle parcourt les arêtes, et est revenue à son point de départ, qui est quelconque). Il faut montrer que, pendant ce laps de temps entre les instants considérés, deux fourmis (au moins) se sont croisées.

Cela a l'air parfaitement innocent, mais c'est absolument diabolique. Je me suis torturé pendant des heures sans rien trouver (pourtant, ce n'étaient pas les pistes qui manquaient). Un ami a fini par trouver une démonstration, mais elle est sophistiquée et peu intuitive, et utilise le théorème de l'indice[#] de Hopf. C'est décevant, parce que le problème est compréhensible par ma maman et je voudrais une solution qui le soit aussi. Et c'est décevant parce je n'ai pas trouvé, moi. :-( Notons au passage que l'hypothèse que le nombre de tour de chaque fourmi est entier est indispensable.

Mais récemment, on m'a posé un problème qui me semble encore pire : son énoncé n'est peut-être pas aussi élémentaire que celui des fourmis, mais il est extrêmement naturel et semble très joli :

Trouver la dimension maximale (si elle existe, ou même simplement un majorant de la dimension) d'un espace vectoriel de matrices réelles (je veux dire, un sous-espace vectoriel des matrices n×n réelles, pour n non précisé) dans lequel la seule matrice singulière (de déterminant nul) soit la matrice nulle.

Je sèche complètement. Je suis arrivé à la conclusion, et plusieurs autres ayant réfléchi au même problème y sont parvenus indépendamment, que la dimension 8 est possible (consulter n'importe quelle introduction aux octonions pour en savoir plus), mais quant à savoir si c'est ou non le mieux possible… Je ne trouve vraiment rien. Et j'y ai passé déjà un certain nombre d'heures.

C'est dur, les maths !

(Bon, là, on va voir si les lecteurs de mon blog sont des torscheurs. À chaque fois que je parle de quelque chose, il se trouve un commentateur qui connaît parfaitement le sujet pour intervenir avec une expertise impressionnante. Voyons donc si je vais me faire ridiculiser par une résolution en trois lignes de ces deux problèmes ! En vérité, ça me plairait bien.)

[#] Il est certain, au moins, qu'il faut employer quelque part une propriété topologique de la sphère, parce que le résultat n'est pas vrai si le polyèdre a la forme d'un tore, comme on le voit assez facilement. Donc l'hypothèse de genre zéro est cruciale. Ceci étant, il devrait y avoir des façons plus simples de caractériser ce fait que le théorème de l'indice de Hopf.

(Saturday)

On a theorem by Max Noether

Today I feel like explaining a little bit of algebraic geometry, namely a theorem by Max Noether and Castelnuovo on the so-called Cremona group of the plane. (My intention is to explain what the theorem states, not to prove it, which would take far more space than an entry here would allow. I hope I can make what follows clear to people with a relatively modest knowledge of mathematics—perhaps an undergraduate level.) Incidentally, let me mention that Max Noether is the father of Emmy Noether, who was certainly the most remarkable woman mathematician ever (and far more important to mathematics than Max Noether).

We concern ourselves with birational transformations of the plane, so let us first explain what this means. A rational map of the plane to itself is given, by definition, by two expressions, (x′,y′), giving the coordinates of an image point in function of those, (x, y), of the original point, in which we impose that x′ and y′ be rational functions of x and y, in other words quotients of two polynomials in these two variables (which we can assume, after elimination, to have no common factor), say, with real coefficients, the denominator being—of course—not identically zero. For example, letting x′=0 and y′=0 maps the entire point to the origin (0,0); letting x′=−x and y′=y defines the symmetry with respect to the vertical axis; letting x′=x and y′=x² gives a rational map that projects the entire plane onto the parabola with equation y=x², and so on. Note that a rational map is not always defined everywhere, since we have allowed polynomials in the denominator: for example letting x′=1/x and y′=1/y gives a rational map that is defined only so long as x and y are both nonzero (i.e. away from the coordinate axes), but we still call this a rational map of the plane to itself; since the denominator cannot be identically zero, there are always some points in the plane (many points, in fact: in a topological sense they are “dense”) for which the mapping is defined. Now we can generally compose two rational maps of the plane to itself, merely by replacing the x and y variables in the “outer” map by the x′ and y′ given by the “inner” map; for example, composing the former map (x′=1/x and y′=1/y) with itself gives the identity map (x′=x and y′=y), simply because 1/(1/t)=t. (Note that we cannot always compose two rational maps, because the composition might make sense nowhere, in other words it might end up giving an identically zero denominator, something we have excluded.)

When a rational map of the plane to itself is such that there exists another map which, when composed with it, (makes sense and) gives the identity map (viz. x′=x and y′=y), we say that the map (either of the two maps, actually) are birational transformations of the plane. For example, our previous example (x′=1/x and y′=1/y) is a birational transformation of the plane, since, as we have explained, when composed with itself, it gives the identity map. On the other hand, the constant rational map (x′=0 and y′=0) is not a birational transformation of the plane, since composing it with anything (in any order) gives a constant map if it makes sense at all. In perhaps more intuitive terms, a birational transformation of the plane is a rational map of the plane to itself which can be inverted by another rational map. (It is not exactly a bijection in the function sense, because it might not be defined everywhere. However, it is “mostly” a bijection.) The misfortune of composition not always being defined does not happen for birational transformations: the composition of two birational transformations of the plane always exists (makes sense) and is always itself a birational transformation; and, of course, by definition, any birational tarnsformation has an inverse which is also a birational transformation. (For those who know what that means, birational transformation of the plane form a group, the Cremona group of the plane. Note that it does not suffice for a rational map to be bijective in order for it to be a birational transformation: for example, x′=x³ and y′=y³ defines a rational map which is bijective because cube roots always exist and are unique, but which is not a birational transformation because cube roots are not rational functions.)

Now let us consider some particular birational transformatins. First of all, we have those of the following form: x′ = (a1·x+b1·y+c1) / (a0·x+b0·y+c0) and y′ = (a2·x+b2·y+c2) / (a0·x+b0·y+c0), in which the ai, bi and ci are real numbers: in other words, x′ and y′ can be expressed as quotients of first degree (aka affine) polynomials, with equal denominator; I'm not claiming that any such form defines a birational transformation, but it turns out that almost all do (all one needs to impose is the nonvanishing of the determinant of the 3×3 matrix of coefficients, and then the inverse transformation is given in the same form by the inverse matrix); those that are of this form are called projective transformations of the plane. For example, all plane symetries, rotations, translations, and much else, are all projective transformations. The composition of two projective transformations of the plane is a projective transformation, and the inverse of a projective transformation is a projective transformation (in technical terms, this means that projective transformations form a subgroup of the Cremona group). Basically, the projective transformations are the “uninteresting” birational transformations: they take lines into lines, so they are geometrically boring. (Another fact worthy of note is that given four distinct points in the plane, no three of which are aligned, and given another quadruplet of points satisfying the same condition, there is a unique projective transformation taking one set in the other in the prescribed order.)

Now let us consider two very simple examples of birational transformations which are not projective transformations: the first one, which has x′=1/x and y′=1/y, we have already mentioned; the second one is x′ = x/(x²+y²) and y′ = y/(x²+y²). Both give the identity when composed with themselves, as is easily checked, so both are, indeed, birational transformations of the plane. The first one corresponds to inverting the two (cartesian) coordinates independently, and the second corresponds to inverting the radial coordinate of polar coordinates (in other words, the distance to the origin) while keeping the angular coordinate fixed. Call these two transformations the basic Cremona transformations of the plane.

Well, the remarkable fact, which is the statement of Max Noether's transformation theorem, is that these two basic Cremona transformations are essentially the “only” ones we can form, or, rather, they are the building blocks for all other birational transformations; the precise statement is: any birational transformation of the plane can be written as the composition of projective transformations and the two basic Cremona transformations which we have given (of course it may be necessary to use either of them multiple times in the composition). So any birational plane transformation, no matter how complex, can be reduced to these basic transformations. (In reality, the theorem is somewhat simpler if we work over the complex numbers instead of the reals as we have done: then we need only one basic Cremona transformation, and either one will do. Over the reals we need two. But I did not want to make this entry more complicated by considering the plane with complex coordinates.)

To give an idea of why this is remarkable, we can consider the situation in other dimensions: is is straightforward to define birational transformations of the line, of three-dimensional space, and in fact, of n-dimensional space for any n, and among these are the obviously defined projective transformations. Now it turns out that in dimension one, the only birational transformations are the projective transformations (also called homographies): there are simply no others (and there is no Cremona transformation). In dimension three or more, it is not possible to find a finite number of particular birational transformations which, when composed with the projective transformations, will span all other birational transformations: the Cremona group is simply too complicated, and it is hardly possible to say anything useful about it.

Well, I don't know whether this is all very enlightening; at least, it is a little but elegant bit of algebraic geometry.

(Friday) · Last Quarter

Math on the Web

One thing which regularly annoys me is how difficult it is to find mathematics on the Web at the level I'm interested in. One can easily find a lot of undergraduate-level stuff, and a lot of research papers, but there seems to be a gap between the two at which there is little available material online. For example, just now, I wanted the precise definition of a Gorenstein ring (or a Gorenstein singularity, or whatever: it's the word Gorenstein which interests me, in any context). Now there are tons of research papers which deal with resolution of Gorenstein singularities or classifications of them, or whatever: but they never bother to recall what a Gorenstein singularity is, because everyone is supposed to know that (in order to make any sense of the paper or to have any interest in it). And on the other hand, this is way too advanced for most online courses: what I would need is a general treatise on Cohen-Macaulay rings (such as this book by Bruns and Herzog, of which I have a copy at my parents' house but none where I am now).

Of course, there is MathWorld, which is often useful (especially when it comes to formulæ of kinds): here it gives a definition of a Gorenstein ring (I won't link to it because I don't wish to Google-feed it), but I can't make heads or tails of it — I'm sure they omitted something. And this isn't just bad luck in this particular case: it's really quite typical of their definitions in relatively high-brow domains. When there is an entry in the Wikipedia, it's usually more useful, but, unfortunately, the word Gorenstein doesn't appear in the Wikipedia (I guess I'll have to write the entry when I find out precisely). In general, the Wikipedia isn't very good when it comes to mathematics because there isn't a convenient way to typeset mathematical formulæ in it.

(That's what research libraries are for, you say? Yes, but it is presently 4AM, and all research libraries I have access to are closed. And how can I go to sleep without knowing the correct definition of a Gorenstein ring? Now you understand my dilemma!)

(Tuesday) · Premier Quartier

Popularizing mathematical concepts

Some time ago I got into my mind that I should try to write a little text (perhaps entries into this 'blog, perhaps a standalone document) explaining something about the meaning of three mathematical objects, in a way understandable to the layman (whose a priori level of mathematical culture remains to specify: it should include a basic understanding of natural numbers and plane geometry but no knowledge of ordinals).

The three mathematical objects, which I chose because they fascinate me, because I think there is genuine beauty in them, and I would like to share with others the vision of that beauty, and because of their tantalizing relation to “infinity” (in a broad sense) are: the Long Line, the Stone-Čech compactification of the natural numbers (also known as beta-omega), and Zariski's Ciel Étoilé (Starry Vault). These objects all convey a geometrical, almost graphical, intuition: yet they defy us (in a way akin to the bewilderment caused by Escher's prints, but much stronger) as they cannot be represented accurately by any pictorial representation, they cannot be “embedded” in our Universe.

For the benefit of my colleagues I can define these three objects (and describe some basic properties of them) assuming a certain knowledge of mathematics:

To define the Long Line, first define the (closed) Long Ray: as a totally ordered set, this is the product of ω1 (the first uncountable ordinal) by the half-closed real interval [0;1[ (closed in 0 and open in 1), totally ordered lexicographically (giving the greater weight to the first component); as a topological space, it is that totally ordered set with the order topology: and this topological space is actually a (non-metrizable) topological manifold (with boundary). The Long Line is simply obtained by glueing two copies of the Long Ray, in opposite directions, at their origin. So it is a one-dimensional topological manifold (without boundary), and it has the remarkable property that any continuous real-valued function upon it is bounded; in fact, any one-dimensional manifold (without boundary) is homeomorphic to either the circle, or the real line, or the open Long Ray (the closed Long Ray minus its origin) or the Long Line, so the latter is the only noncompact boundaryless one-dimensional manifold with this property. There exist an infinite number of pairwise non-diffeomorphic differentiable structures on the Long Line.

The Stone-Čech compactification of the natural numbers is the set of ultrafilters over the set of naturals numbers. (Recall that a filter over a given set is a non-empty collection of subsets of it, not containing the empty set, closed under enlargement and intersection. And an ultrafilter is a filter which is properly contained in no other filter, or which, in other words, for any given subset of the given set contains either that subset or its complement. The set of all subsets containing a given element is an ultrafilter: such ultrafilters are called principal ultrafilters.) It is made into a topological space by declaring that, for any given subset of the naturals, the set of ultrafilters containing that subset is closed (and any closed set is an intersection of such basic closed sets). Alternatively, we can give a general characterization of the Stone-Čech compactification of a (completely regular) topological space: it is the initial object in the category of continuous maps of that space to a (Hausdorff) compact space, in the sense that any continuous map from the given space to a (Hausdorff) compact space factors, in a unique way, through the Stone-Čech compactification; and here we are interested in the Stone-Čech compactification of the discrete space of natural numbers. The naturals themselves embed in this space as the principal ultrafilters; but the cardinal number of the space is the cardinal of the power set of the real line. (Ironically enough, the Long Line, although conceptually much more “difficult” than the set of integers, has a Stone-Čech compactification which is much more simple: just add one point at infinity in each direction.)

To define Zariski's Ciel Étoilé, we first recall what the blowup of a differentiable manifold at a point is: it is a manifold which is locally diffeomorphic to the original manifold everywhere save at the point which has been blown up, the latter being replaced by the set of all possible tangent directions at this point (technically, the projective space of the tangent space at this point, i.e. the set of all lines through the origin in the tangent space). Topology and differentiable structure on the blowup are defined in the more or less straightforward way: for example, neighborhoods of a direction in the blowup contain wedges around that direction, and the latter are claimed to be diffeomorphic with the suitable open subset of real affine space. Now consider the projective plane, and blow up various points on it, then points on these blowups, and so on: this lattice of blowups forms a projective system, and the projective limit, as a (compact) topological space (which is not a manifold) is Zariski's Ciel Étoilé. In other words, a point of the Ciel Étoilé is given by a point of the projective plane, then a point of the blowup of it at that point, then a point of the blowup of that at that point, and so on.

Assuming I have made no error, and if my description is sufficiently accurate, all mathematicians should now agree on the demonstrable properties of the three objects under consideration. So even if we do not believe in the platonic heaven in which these objects should “live”, at least their existence is guaranteed, in a certain way, by a common understanding between mathematicians as to what their properties are. Intuition is another thing altogether. Intuition is what convinces a mathematician that this-or-that property should hold, before he sets out to prove it; now mathematical books and treatises do not endeavor to dictate how mathematical intuition should be formed, and each mathematician is left to build his own, which may or may not agree with his peers' on this or that subject. In other words, mathematical truth (or at least, provability) is a common understanding between mathematicians; intuition is not necessarily so. Making a mathematical concept popular is difficult because it requires to work at the level of intuition (since we are not proposing to give rigorous definitions and properties), which is slippery.

Certainly some intuition is shared. Presumably all mathematicians will agree that the Long Line somehow “looks like” a line, only longer, much longer, and qualitatively longer: somehow it stretches beyond infinity in the usual sense (assuming there is a usual sense for infinity). But this is very vague: saying that a line is long is essentially meaningless. Here's another attempt to convey the main properties of the Long Line in a way that mostly anyone should be able to understand:

First of all, the Long Line is “locally like a line”: this means that if you stand at a given point on the Long Line, what you see around you, in your neighborhood, is exactly what you would see while standing on an ordinary line.

Next, the Long Line, like the ordinary line, has an order: some points are to the left of others and some are to the right (or you may prefer to call them up and down, or front and back, or whatever: this is of no importance, but let's stick to left and right). Like in the ordinary line, there is no leftmost point and no rightmost point: if you pick any point on the Long Line, there are more points to the left, and more points to the right.

Furthermore, just as for the ordinary line, all points on the Long Line are essentially worth the same: none of them is distinguished in any way, they all look the same, if you will. There is no “midpoint” or anything like that (though nothing prevents you from choosing a point and calling it the midpoint if you will).

Given two points on the Long Line, there is only one path leading from one to the other, just as for the ordinary line: to get from A to B, assuming, say, that A is to the left of B, you have to go through all points which are between A and B, that is, to the right of A and to the left of B. Furthermore, the part of the Long Line which is between A and B (whatever A and B are!) looks exactly like the part of any ordinary line between any two of its points. So the Long Line really looks a lot like an ordinary line.

There is no “distance” or “uniformity” on the Long Line. Let us be a little more precise than this. It makes no sense to say that A is closer to B than C is to D, because distance can be stretched or shrinked as one will. The only case in which it does makes sense is to say that A is closer to B than A is to C, when B and C are on the same side of A: then it means that B is between A and C, in other words that one must go through B to get from A to C (so certainly B is closer to A than C is). This may appear to be a difference with the ordinary line, but that is simply because we conceive the ordinary line with a distance on it; it need not be so: we can forget about this distance, and allow to stretch and shrink arbitrary parts of the line, as if it were made of (infinitely stretchable) rubber; the Long Line is not different (except that it cannot be given a distance, it is simply too long for that).

So far the Long Line looks exactly like the ordinary line. Now let us try to describe in what way it differs from it.

The ordinary line is “infinitely long” in both directions. However, it can be “exhausted” in the following way: pick a point on the line, then pick a point one foot to the right (assuming we have a distance on the line, and a “foot” of some kind), then a point one foot further to the right, and so on to infinity. Then in infinitely many steps we exhaust the line: there is no point which stands to the right of all the chosen points. Now this simple-minded attempt fails for the Long Line: it cannot be exhausted in this way. Specifically: take an infinite number of points on the Long Line, one for each integer (take a point 0, any one you will, then a point 1, then a point 2, then a point 3, and so on to infinity, exactly as you like them, as far or as close to the previous ones as you will), then there are still points on the Long Line which are to the right of all the chosen points, and points which are to the left of all the chosen points. Let's make this a little more picturesque and a little less precise: assume you can travel instantaneously from any point to any point on the line; then on the ordinary line you can move out of bounds (“out to infinity”) by making such hops, but on the Long Line you cannot—no matter what large hops you make and no matter if you make them until the end of time, there are still points which are further than all the distance you traveled (and you could choose to get there immediately, but there would still be points which are even further).

In short: no matter how long you travel, and no matter how fast you travel, you cannot come to the end of the Long Line, you cannot speed out to infinity, you must remain within bounds.

Lastly, here's another remarkable property of the Long Line. Assume we are given a continuously varying quantity on it (that is, at every point of the Long Line we have a value for this quantity, and it varies steadily in neighboring points). Then, no matter how this quantity is defined, it is eventually constant: in other words, there is a point on the Long Line such that, to the right of that point, the quantity always takes exactly the same value, and there is a point such that to the left of that point the quantity always takes the same value. Certainly this shows that there cannot be a definable distance on the Long Line, because if there were, the distance to a certain point O would be a continuously varying quantity that could not be eventually constant, an absurdity.

I am afraid I have failed miserably in making the intuition behind the Long Line accessible to non-mathematicians (and I'm not even sure that mathematicians would agree on all these “intuitive” properties, although of course the theorems behind them are unquestionable). But my attempt fails in an even more basic way, really: it fails to explain why and in what way this mysterious object, the Long Line, should exist (even assuming the above properties are understood); or even, really, what it means for it to exist. Certainly it doesn't exist in any physical sense: our Universe is far too small to contain a copy of the Long Line in any sense whatsoever (assuming even that it should contain a copy of the ordinary line, which is far from obvious). Mathematically, we have a precise theorem:

There exists one, and only one up to (non-unique) homeomorphism, topological manifold which is a (non-empty) totally ordered set with the order topology, in which any countable subset is bounded. (This manifold is exactly the Long Line.)

Only a layman need not know what a topological manifold is, and, even if he knew, need not agree that it coincides with the intuition afforded by the above description.

So have I failed utterly in trying to make non-mathematicians grasp this elusive “Long Line”? Probably. Can it be done? I don't know.

I'm afraid the situation is similar for the other two objects. Certainly I have not given myself an easy task.

(Friday) · Halloween

Freakish intellectual masturbation

[Traduction française ci-dessous.]

Don't try to solve this one without a computer:

Mr Magic says, I'll secretly choose two integers between 2 and 3000, and I'll tell their sum to Steven and their product to Peter, and, of course, does so. Peter comments, I don't know what the two integers are. Steven remarks, yeah, I knew that. Whereupon Peter says, oh? well now I know what they are. And immediately Steven says, now so do I. Mr Magic then asks Alice (who was also listening to the conversation), do you know what the two numbers are?, and Alice answers, of course not. So Mr Magic tells Alice the smaller of the two integers. And Alice replies, now I know what the other one is.

What are the two numbers?

This is a sick—pervert—problem if I ever heard one. (I'm not sure I should call this mathematics, either, though there is certainly some mathematical ground here, and it requires logical reasoning; but there is no theory behind it, as far as I can see.) Yet it can be solved (by brute force, as it were). In case you'd like to know, the answer (click here to reveal it if it is invisible) is . But the problem itself isn't so much interesting as the pattern. For example, the following problem is much clearer (and you definitely don't need a computer to solve this one):

Mr Magic announces, I'll roll two (ordinary, six-sided) dice in secret, and tell the smaller of the two figures (between one and six) to Minnie and the larger to Max, and he does so. The sum of the two numbers is neither six nor eight, he also says. Max remarks, I don't know what Minnie's number is. Minnie replies, I knew that. Then she adds: now do you know my number?; to which Max replies, yes. And Minnie says, then I know yours.

What are the two numbers?

Just follow the reasoning with pencil and paper: when it is done right, it is child's play. The answer (click here) is . I find much more elegance in this simpler problem than in the original one. But the basic logic is the same. (On the other hand, I did spend a tremendous amount of time coming up with a situation where every reaction would be more or less natural, which wasn't too gory to explain or too trivial to solve, etc. If you think it's easy, just try it for yourself!)

[French translation of the above.]

N'essayez pas de résoudre ce truc sans ordinateur :

M. Magie dit, je vais secrètement choisir deux entiers entre 2 et 3000, et j'en dirai la somme à Stéphane et le produit à Pierre, et, bien sûr, il le fait. Pierre observe, je ne sais pas quels sont les deurs entiers. Stéphane remarque, ouais, je le savais. Sur quoi Pierre dit, ah ? eh bien maintenant je sais ce qu'ils sont. Et immédiatement Stéphane dit, maintenant moi aussi. M. Magie demande alors à Alice (qui écoutait aussi la conversation), savez-vous quels sont les deux nombres ?, et Alice répond bien sûr que non. Alors M. Magie donne à Alice le plus petit des deux entiers. Et Alice répond, maintenant je sais quel est l'autre.

Quels sont les deux nombres ?

Voilà un problème cinglé — pervers — si j'en ai jamais vu. (Je ne suis pas certain que j'appellerais ça des maths, non plus, même s'il y a assurément des bases mathématiques là, et cela exige un raisonnement logique ; mais il n'y a pas de théorie derrière, pour autant que je voie.) Pourtant, il peut être résolu (par force brute, en tout état de cause). Si vous voulez savoir, la réponse (cliquez ici pour la révéler si elle est invisible) est . Mais le problème en lui-même n'est pas aussi intéressant que le motif. Par exemple, le problème suivant est beaucoup plus clair (et vous n'avez assurément pas besoin d'un ordinateur pour résoudre celui-ci) :

M. Magie annonce, je vais jeter deux dés (ordinaires, à six faces) en secret, et dire le plus petit des deux chiffres (entre un et six) à Minnie et le plus grand à Max, et il le fait. La somme des deux nombres n'est ni six ni huit, dit-il encore. Max observe, je ne sais pas quel est le nombre de Minnie. Minnie réplique, je le savais. Puis elle ajoute : maintenant, sais-tu quel est mon nombre ? ; ce à quoi Max répond, oui. Et Minnie dit, alors je sais le tien.

Quels sont les deux nombres ?

Suivez juste le raisonnement avec papier et crayon : quand on le fait correctement, c'est un jeu d'enfant. La réponse (cliquez ici) est . Je trouve beaucoup plus d'élégance dans ce problème plus simple que dans l'original. Mais la logique de base est la même. (D'un autre côté, j'ai effectivement perdu un temps fou pour trouver une situation où chaque réaction serait plus ou moins naturelle, qui ne soit ni trop pénible à décrire ni trop triviale à résoudre, etc. Si vous croyez que c'est facile, essayez par vous-mêmes !)

(Thursday)

On the beauty of the Steiner system of index (5,8,24)

If there were a beauty prize for mathematical objects, I think the Steiner system of index (5,8,24) (I will describe what this means in a moment) would be one of the most serious candidates. It is something extremely easy to define (but not so easy to exhibit or represent!) but of breathtaking intellectual elegance and having absolutely unique and “magical” properties. This is the sort of mathematical objects that holds (for me) all the fascination that numerology can have for some people, except that there is “really something” there (when I get mystical, I think: some deep insight into the fabric of reality).

To define naïvely what a Steiner system of index (5,8,24) means is, as I just said, very easy: it is a set of 24 “points” (objects, elements, whatever) together with 759 “blocks”, each consisting of 8 points, having the property that any 5 of the 24 points lie in one and only one of the 759 blocks. I know this doesn't sound impressive when said like that.

Maybe to give the feel of things I should explicitly describe the Steiner system of index (2,3,7) (the projective plane over F2, to be precise, also called the “Fano plane”). Consider 7 objects (“points”) which will be labeled (1:0:0), (0:1:0), (1:1:0), (0:0:1), (1:0:1), (0:1:1) and (1:1:1) (the labels are unimportant: I could just as well be calling these objects “red”, “green”, “yellow”, “blue”, “magenta”, “cyan” and “white”, or “Valor”, “Compassion”, “Sacrifice”, “Honesty”, “Honor”, “Justice” and “Spirituality” or whatever I wanted); and define the following seven blocks of three objects each: {(0:1:0), (0:0:1), (0:1:1)}, {(1:0:0), (0:0:1), (1:0:1)}, {(1:1:0), (0:0:1), (1:1:1)}, {(1:0:0), (0:1:0), (1:1:0)}, {(0:1:0), (1:0:1), (1:1:1)}, {(1:0:0), (0:1:1), (1:1:1)} and {(1:1:0), (1:0:1), (0:1:1)}. Then any choice of two of the seven points belongs to one, and only one, of the seven blocks. Try it!

The previous example has a classical geometric representation: draw an equilateral triangle, label its vertices (1:0:0), (0:1:0) and (0:0:1); label (1:1:0) the middle of the edge joining (1:0:0) and (0:1:0), label (0:1:1) the middle of the edge joining (0:1:0) and (0:0:1) and label (1:0:1) the middle of the third edge of the triangle; finally, label (1:1:1) the center of the triangle, and draw the inscribed center of the triangle as well as the three medians (which are also at once mediators, heights and bisectors since the triangle is equilateral). This defines seven points in the plane, and seven “lines” between them (the three sides of the triangles, the three medians and the seventh “line” is the inscribed circle), each of them joining exactly three points, and it is easily seen that any two points are joined by exactly one line.

Now the Steiner system of index (5,8,24) does the same with different numbers: there are 24 points and blocks of 8 points (“octads”) are defined such that any set of 5 different points belongs to exactly one of the octads. The first remarkable, and by no means obvious fact, is that there is only one Steiner system of index (5,8,24): if you find two of them, then there is some way of reordering the 24 points so that in fact they agree exactly. So it is justified to speak of the such Steiner system. (There is also a unique Steiner system of index (2,3,7); however not all Steiner systems are unique for their index: for example, there are exactly 2 Steiner systems of index (2,3,13), 18 of index (2,4,25). Also, not all Steiner systems exist even if there is no evident impossibility; for example, there is no Steiner system of index (2,7,43); it is not known whether there exists one of index (2,13,157), although it is conjectured that there is none. But very elementary knowledge of combinatorics suffices to prove that there is no Steiner system of index (6,9,25), say: the number of blocks could not be an integer.)

The Steiner system of index (5,8,24) has a large number of automorphisms, in other words, manners of permuting the 24 points in such a way that if eight points formed a block before the permutation, the new eight points which take their place after permutation still form a block. As a matter of fact, there are 244823040 automorphisms of the system: these constitute what is known as the Mathieu group M24. This group is five times transitive, meaning that if you take any five of the twenty-four points and place them in any five new places, there is a way (in fact, exactly 48 ways) to complete this choice into an automorphism of the system. Now this property is remarkable in the highest extent: indeed, apart from the full group of permutations on n objects (which is n times transitive) and the so-called “alternating group” of even permutations (which is n-2 times transitive), there are only two (permutation) groups which are 5-transitive: the Mathieu groups M24 (automorphisms of a Steiner system of index (5,8,24), as explained) and M12 (automorphisms of a Steiner system of index (5,6,12)), and neither is 6-transitive or more. And also, the Mathieu groups are among the twenty-six sporadic simple groups; but describing what this means (even by removing the word “sporadic”) would take just a bit too long for me to try it now.

Furthermore, I mention that the Steiner system (5,8,24) can be used to construct the (binary) Golay code, the most remarkable (and “powerful”!) error-correcting code ever, in the following way. Consider the 759 blocks (octads) of the Steiner system (5,8,24) as words of 24 bits, by putting a ‘1’ in a given place if the corresponding point is in the octad, and ‘0’ otherwise (so each of these blocks will have exactly 8 bits to ‘1’ and the others to ‘0’). Now combine these words in every possible way using (bitwise) XOR (eXclusive OR). This gives a total of 4096 words (a vector space of dimension 12 over the finite field with 2 elements), the words of the Golay code, none of which (except the entirely zero word) has fewer than 8 bits with value ‘1’; it is then possible to judiciously choose twelve columns out of the twenty-four in such a way that every combination of ‘0’'s and ‘1’'s in these columns matches one and exactly one of the 4096 words of the code. So we can code any word of 12 bits by a word of 24 bits in the Golay list: this code can correct an arbitrary error on 3 bits out of 24, and detect an arbitrary error on 4 bits. Out of the 4096 words of the Golay code, 759 have 8 bits with value ‘1’, 2576 have 12 bits with value ‘1’, 759 have 16 bits with value ‘1’ (and are the complements of the 759 with weight 8) and the last two are the fully zero and fully set words.

So far I have described some properties of the Steiner system (5,8,24) or the Golay code, but I have not described them explicitely. There is a plethora of ways to construct them, more or less intuitively understandable and more or less pleasant; however, there is at least one way I find truly remarkable: the dodecahedron construction of the Golay code, which works as follows. Take a (regular) dodecahedron and two colors of ink (say, black and red). Using the black ink, write ‘0’'s and ‘1’'s arbitrarily on the dodecahedron, one bit per face. Now using the red ink visit each of the dodecahedron's faces in turn, and compute the parity of all the black bits except those on the five faces immediately adjacent to the one on which the red bit is being written; in other words, each red bit on a given face of the dodecahedron indicates the parity of the black bits for the seven faces of the dodecahedron which are not immediately ajacent to the face in question: the red bit is ‘1’ when there are an odd number of black bits at ‘1’ among the seven faces in question, or ‘0’ when there are an even number of them. Thus, starting from twelve arbitrary black bits we get twelve red bits, to a total of twenty-four bits, two on each face of the dodecahedron: well, this is exactly the Golay code: the 4096 twenty-four bits words obtained by trying all possible combinations of black bits give exactly the 4096 words of the Golay code; and to construct the Steiner system of index (5,8,24), just take those 759 words having eight bits at ‘1’.

One of my bizarre dreams would be to find some way to construct a puzzle similar to Ernő Rubik's famous cube—only it would probably be shaped more like a dodecahedron—that has the Mathieu group M24 as group of transformations.

(Saturday) · Last Quarter

My mathematical diary

[300th entry in this 'blog! Hurray, hurray, hurray!]

At the end of 2001, I had started a mathematical diary, which I kept active through most of 2002. The idea is not to write down ideas that are important for my current mathematical research activity (writing my thesis, that is), but, on the contrary, to evacuate by committing them on paper various side ideas that I have from time to time. It's the same sort of force that drives me to write this 'blog: once I become infected with a meme, say a mathematical problem, it will keep haunting me until I either solve the problem or save it on paper (electronic paper will do as well, of course) for later. So this is how this diary should be regarded: as a meme pool of weird ideas. There is nothing that could be called “mainstream mathematics” in it, I guess. Some of these memes are “abstract nonsense” as mathematicians call it, embryos of theories that are trivial to work through the basic definitions, which produce pages and pages of easy writing. Some are (presumably hard) questions.

In a way, this diary could be shown as evidence of my mathematical angst: probably nothing it contains would be deemed of any interest by any other mathematician, and I guess the questions which obsess me are very much alien to mainstream mathematical culture. This is one of the reasons why I have solid doubts as to whether I should pursue the academic career in mathematics.

Anyway, whatever it's good for, I've decided to start writing in this diary again. Probably not nearly as actively as this 'blog, but it'd be nice to hold a one-entry-a-week minimum average. There are lots of goofy thoughts that I won't be rid of until I've written them down.

(Sunday)

Behold the cubic surface!

[Cubic surface]Here on the left (click to enlarge) you can see—to contradict an earlier statement I made that they are difficult to picture—a (nonsingular) cubic surface, one of the beasts that I've spent a good part of my thesis studing (the arithmetic of). Specifically, this is the surface with (affine) equation y³-3x²y+z³-3z=0. The white rods (fifteen of them, if you count well) are not part of the surface itself—or rather, they are, but they've been emphasized for clarity: they represent the straight lines lying on the surface. There are always twenty-seven straight lines on a nonsingular cubic surface, but all might not be “real” in the sense that some are actually pairs of complex conjugate lines; and this particular surface has fifteen real lines and six pairs of complex conjugate lines. Sometimes three lines on the surface (necessarily in the same plane) meet in one point: then that point is called an Eckardt point; this surface happens to have six Eckardt points (all real), three of which have been shown on the picture as small bright pink spheres (the other three are at infinity so you cannot see them); one of them (namely (0,0,0)) is at the center of the image. I've already mentioned Eckardt points on this 'blog; they have many remarkable properties, but they make the arithmetic of the surface rather harder to study when they exist. The sort of question one might ask is this: given that the surface has one point with rational coordinates (namely (0,0,0)), and since its equation has rational coefficients, is it true that there are points with rational coordinates arbitrarily close to any real point? (And the answer, for this surface, is yes.)

The image was made with the Persistance of Vision (“POV-ray”) raytracer. I don't deserve much credit since POV-ray has a primitive (quite appropriately called cubic!) which draws a cubic surface. My work as a mathematician in composing this image was limited to finding the equation of a nice cubic surface having some Eckardt points and then computing the equation of all the lines on it (a horrendous task in general, but relatively easy for this one surface since it has a very simple equation in which variables are separated). Note incidentally that the colors are not on the surface but come from three colored light sources.

I've also made a little animation of the rotation of the cubic surface (984kbyte AVI file) from the images computed by POV-ray. (Don't ask me how to read it or what codec it uses, I don't know anything about this stuff: I just fiddled around with MPlayer/MEncoder, randomly tweaking the command line options until it produced something that seemed like it was an animation.)

Would you believe it? Cubic surfaces have their own Web site!

(Saturday)

Seven colors

[Plane coloring]This image represents a periodic tiling of the plane with hexagons colored with seven colors, having plenty of nice mathematical properties. One of them is this: if you take any two points the distance between which is given by the little black rod shown on the upper left, then these two points cannot have the same color. In other words, no matter how you move the rod in the picture, so long as you don't change its size, the two ends will fall on different colors.

Can this be done with fewer than seven colors? In other words, is there a way to color the plane (not necessarily perodically) using six colors or less, in such a way that any two points separated by a certain distance d fixed a priori are always of different colors? Interestingly enough, the answer to this problem is not known: I believe this is still an open problem. (I don't know who asked the question in the first place. It sounds typical of Pál Erdős, but that's mere guessing.)

Probably this is the mathematical problem with the simplest formulation which is still open.

It can be shown, however, that no plane coloring with three or less colors can do the trick: if you color the plane, in any way whatsoever, using three colors or less, and you fix an arbitrary distance d, then there are always, somewhere, two points separated by that distance d that are of the same color. This is a very nice mathematical exercise, because it requires almost no knowledge of geometry (let alone of any other domain of mathematics), and yet it is not at all obvious—almost an exercise of pure reasoning. I remember hitting my head against the walls for quite some time before I found the trick; and I occasionally gave it to students to try, nearly driving some of them mad. The problem with two colors (showing that two colors or fewer cannot suffice to color the plane in such a way that two points at distance d are not of the same color), however, is very simple, and anyone should be able to solve that; and it holds the key to solving the case of three colors.

So I can't be held responsible for people banging their head against walls, I'll provide the answer to the two- and three-color problems now. (Click here to reveal the following text if it is invisible.) which completes the proof.

Perhaps this is a nice test to determine whether a person is mathematically inclined, or could be, even if that person has no knowledge of mathematics: anyone so inclined will not resist thinking about such a simple and elegant problem for some time.

(Sunday) · My Birthday

I have defeated the Eckardt points!

(The title is mostly a joke, because Eckardt points really weren't the main difficulty.) Well, after another bunch of hours rewriting this proof in all aspects, I seem to have come to a final-so-far version of it: the statement is that weak approximation holds in places of good reduction for smooth cubic surfaces over the function field of a curve over an algebraically closed field. If that's Chinese to you, here's a slightly more understandable version of the same: consider a homogeneous cubic equation in four unknowns (say, X, Y, Z and T) whose coefficients are rational functions of one indeterminate (say, λ) having themselves complex coefficients: something like c3000(λX³ + c2100(λX²·Y + c2010(λX²·Z + … + c0003(λT³ = 0 where the cijkl are rational functions in λ with complex coefficients, and we are trying to solve for the variables X, Y, Z and T also as rational functions in λ; well, the idea is that if you fix a finite number of λ and for each one choose a solution of the corresponding equation (when specialized to that value), then there should be a parametric solution (one where X, Y, Z and T are rational functions in λ; I insist, rational) which interpolates them all, and actually, in a way I won't try to describe, one can fix the derivatives to any order of the variables X, Y, Z and T, not just their values at certain points; now actually this doesn't work for all λ: there are a certain finite number of them which can't be handled (places of “bad reduction”), essentially those in which the specialized equation becomes too degenerate in certain ways.

Now that I've finished that, I can perhaps start working on the piles and piles of emails that I still have to reply to.

(Sunday)

Some mathematics

I've mentioned several times in this 'blog my joint paper with Jean-Louis Colliot-Thélène on Del Pezzo surfaces over fields of cohomological dimension one, paper which I presented in Besançon. I would now like to try to explain something of what it is about for the benefit of non-experts. Unfortunately, I won't make my explanations accessible to all laymen, because that would either take too much space or require to remain at a level of generality such that it wouldn't be interesting to anyone; but I have plans for writing a general introduction to arithmetical geometry, at some point, that would be understandable by everyone and his dog. For the moment, I'll assume that the reader has undergraduate (math major) knowledge of algebra, including knowing what a field is (though I'll recall it in a minute), and also a polynomial in several indeterminates and a vector space. I guess that excludes a lot of people, but at least I'm not assuming that you know what an étale cohomology group (and, therefore, a field of cohomological dimension one) is. Anyway, here we go.

A (commutative) field (I recall just to make sure everyone agrees, but I assume the reader knows this already) is a domain E with two operations, addition and multiplication, so that addition puts an abelian group structure on E (in other words, addition is associative and commutative and has a neutral element written 0 (zero), and for every element x of E there exists an element written -x and called the negative of x, such that x+(-x) = (-x)+x = 0), multiplication distributes over addition, multiplication is associative and commutative and has a neutral element written 1 (one), and for every element x of E other than 0 there exists an element x-1 such that x·x-1 = x-1·x = 1. Examples of fields are the set R of real numbers or that, C, of complex numbers; or the set Q of rational numbers, or the set R(t) of rational functions in one indeterminate t with real coefficients; we also have the set Z/pZ of integer (residues) modulo a prime number p, or, for those who know what that is, the set of p-adics Qp.

If we take this definition of a (commutative) field and remove just the assumption that multiplication is commutative, leaving everything else as it is, we get the definition of a division algebra, or skew-field (some people just say “field”). The simplest example is probably the skew-field of quaternions, H: it is obtained by adjoining three symbols, i, j and k to the real numbers subject to the relations that i² = j² = k² = ijk = -1 (this implies, for example, that ij = k whereas ji = -k). It is a famous theorem of Wedderburn that every finite division algebra (in the sense that it has only finitely many elements) is, in fact, commutative (in other words, is a field). In any division algebra D, the set of elements x which commute with every other element y, that is, so that xy=yx for every y, forms a commutative field (a subfield of D) called the center of D (for example, the center of H is just R).

Recall that a field E is said to be algebraically closed iff every non-constant polynomial equation (with coefficients in E) in one indeterminate has a solution. For example, the equation x²-2=0 (in the indeterminate x) should have a solution (“the square root of two” up to a sign) in any algebraically closed field: this shows that the field Q of rational numbers is not algebraically closed, and neither is the field R of real numbers (because the equation x²+1=0 has no root in R, that is, -1 has no real square root); on the other hand, the field C of complex numbers is algebraically closed, a theorem due to Gauß (based on preliminary work by D'Alembert) and often referred to as the “fundamental theorem of algebra”.

A mere matter of notation: rather than considering polynomial equations in one indeterminate such as x²-2=0, algebraic geometers prefer to consider polynomial equations in two indeterminates which are homogeneous, meaning that the total degree (sum of the degree in each indeterminate) of each monomial es the same, such as X²-2T²=0: this can be arranged by the procedure (homogenizing the equation) consisting of adding a new indeterminate (here T) and multiplying each monomial by the appropriate power of it so that the total degree is the same everywhere. Now we look for non-trivial solutions of the homogeneous equation, that is, solutions in which all indeterminates are not simultaneously zero: it will readily be seen that (X,T) is a solution to the homogeneous equation X²-2T²=0 if and only if the ratio x=X/T is a solution of the initial equation x²-2=0. So it is the same to ask that every homogeneous polynomial equation in two indeterminates of (strictly) positive degree have a non-trivial solution as to ask that every non-constant polynomial equation in one indeterminate has a solution: both mean that the working field is algebraically closed. Actually it turns out that the restriction on the number of variables is irrelevant: over an algebraically closed field, any (one) homogeneous polynomial equation of (strictly) positive degree has a non-trivial solution so long as there are at least two indeterminates (and any (one) non-constant polynomial equation has a solution as long as there is at least one indeterminate). In fact, we can do better: over an algebraically closed field, if we consider at least m homogeneous equations of (strictly) positive degrees in n indeterminates, then so long as n-m is at least 1, they have a common non-trivial zero.

Homogeneous polynomials of degree two are called quadratic forms, and of degree three, cubic forms. When they have a non-trivial zero (in a given field) they are called isotropic, otherwise anisotropic. So the above paragraph tells us, in particular, that a form (quadratic, cubic or whatever) in at least two variables over an algebraically closed field is always isotropic. For quadratic forms, this is not true over the field of real numbers: in fact, there are quadratic forms with arbitrarily many variables over the real numbers that are not isotropic, for example X²+Y²+Z²+T² cannot be zero over the reals unless all of X, Y, Z and T are zero (the trivial solution), for reasons of positivity; on the other hand, any cubic form over the reals in at least two variables is always isotropic.

Now let us come to the definition of fields of cohomological dimension one: we say that E (a (commutative) field) is of cohomological dimension at most one iff every division algebra D which contains E in its center (in the sense that its addition and multiplication extend those of E and that any element of D commutes with any element of E) and is of finite dimension as a vector space over E, is actually commutative (is a field). The requirement that D be of finite dimension over E means that there exist a finite number of elements, x1 through xn of D such that every element of D can be written as t1x1 + … + tnxn for certain elements t1 through tn of E. For example, the division algebra H of quaternions contains the field R of real numbers in its center (it is its center), and H is a vector space over R of dimension four (with basis 1, i, j, k): but since H is not commutative, we know that R is not of cohomological dimension at most one (actually, it is of cohomological dimension infinity, if you want to know). On the other hand, any algebraically closed field is of cohomological dimension at most one; the proof, with some details omitted, goes like this: if D is a division algebra whose center contains a field E and is of finite dimension over it, then any element x of D must satisfy a polynomial equation over E (otherwise the powers of x would span an infinite-dimensional vector space over E in D and this cannot be) — but if E is algebraically closed this means that x is in E, and since this is true for every x we conclude that D is E, therefore D is, indeed, a commutative field (namely E). Furthermore, the result of Wedderburn which has already been mentioned (viz., all finite division algebras are commutative) means essentially that finite fields are of cohomological dimension at most one (because any finite dimensional division algebra over a finite field is itself finite, so Frobenius's theorem states that it is a (commutative) field).

We shall say that the fields of cohomological dimension zero are precisely the algebraically closed fields. The fields of cohomological dimension at most one (as defined in the previous paragraph) which are not of cohomological dimension zero will be said to have cohomological dimension (exactly) one. So the finite fields are of cohomological dimension (exactly) one.

Following Lang, we can define the C1 fields: a field E is said to be C1 iff every homogeneous polynomial equation over E of degree d (with d>0) in n indeterminates, such that d<n, has a non-trivial solution. (More generally, Cr fields can be defined by replacing the inequality d<n by dr<n.) For example, over a C1 field, a quadratic form in at least three variables is always isotropic, and a cubic form in at least four variables is always isotropic, and so on; furthermore, it can be proved that if we take two quadratic forms (note that 2+2=4) over a C1 field in at least five variables then they have a common non-trivial zero. A theorem by Warning and Chevalley states (essentially) that finite fields are C1 fields. And it can be shown that all C1 fields are of cohomological dimension at most one (the C0 fields are precisely the algebraically closed fields, and quite generally a Cr field is of cohomological dimension at most r).

Over a field E of cohomological dimension one (just as over any C1 field by the very definition), any quadratic form in three variables has a non-trivial zero. I won't give the full proof of that, but the basic idea is to write the quadratic form in the form aX²+bY²-Z²=0 and to note that if this has no zero then we can construct a quaternion(-like) algebra over E by adding three symbols i, j and k with the relations that i²=a, j²=b, and k²=ijk=-1: this defines a division algebra so long as the quadratic form is anisotropic. (At least this proof works when the characteristic of the field is not two, that is, when 2 is not equal to 0 in E. Otherwise the equation for the quadratic form is a bit different.)

To summarize:

The natural question to ask is then whether a cubic form in four variables over a field of cohomological dimension (at most) one is necessarily isotropic, or whether two quadratic forms in five variables necessarily have a common non-trivial zero over such a field. And the answer is no: this is essentially what the joint paper proves.

A Del Pezzo surface of degree three is exactly a cubic surface, that is, the surface defined in projective space by a cubic form in four variable—if you don't know what projective space is, just take a polynomial equation in three variables with degree at most three and you'll miss only the points at infinity. A Del Pezzo surface of degree four is the complete intersection of two quadrics in projective four-space, that is, the locus defined by the cancellation of two non-proportional quadratic forms. This is why the result is phrased by geometers as: there exist (smooth) Del Pezzo surfaces of degrees three and four over fields of cohomological dimension one having no rational points. I wish I could give a general definition of Del Pezzo surfaces of all degrees that is more or less understandable, but I wasn't able to find one. This note is already long enough as it is, anyway.

(Thursday) · Corpus Christi

Sociology and mathematics

Some is trying to make mathematical sense of a formula by Claude Levi-Strauss. Amusing.

(Sunday)

A mathematical amusement: bidecimal numbers

Here's a little mathematical fact that may amuse the reader. I thought about this some time ago, and was reminded of it while proving some statements about “weak approximation” today.

Start with a concrete case: on 2002-01-01, various European countries switched to a new currency, the euro. Exchange rates had been fixed several months earlier, by defining the euro's value as an exact number of the various earlier currencies (deutschemarks, liras, French francs and so on), these numbers being the then market exchange rate with six significant digits. For example, the euro was defined as (exactly) 6.55957 French francs. Naturally, this makes the French franc equal to approximately 0.152449 euro(s); however, in that direction, the ratio is not exact, because it is even more precisely 0.15244902 euro(s), and even that is not exact (though at that point, the further decimals become quite meaningless, but we are interested in mathematics, so we can't call it exact).

Call a number decimal iff it can be written with a finite (that is, ending) number of digits after the decimal point; in other words, it can be written as the quotient of an integer by some power of ten (as in: 6.55957 = 655957/100000). For example, 1/2 (one half) is a decimal number because it is 0.5 (or 5/10), and so is 1/5, but 1/3 and 1/7 are not decimal numbers (although they are, of course, rational numbers). So the value of the euro in all of the former European currencies was defined exactly as a decimal number (the euro's value in French francs, 6.55957, is decimal); on the other hand, the value of the currencies in euro(s) is not decimal (for example, 1/6.55957 is not decimal, because 0.152449 or 0.15244902 are only approximations, and no finite number of digits will give an exact value). This can be annoying (in practice it never is, or was, a problem, but assume for the sake of argument that it is).

Now call a number bidecimal iff it is decimal and its reciprocal (or “inverse”, that is, one divided by that number) also is a decimal number. There exist bidecimal numbers: for example, 4 is a bidecimal number, because 4 is decimal (as are all integers) and 1/4=0.25 is also decimal. Similarly, 1.25 is bidecimal (its reciprocal is 0.8). Now assume we had wanted the currency rates in both directions (the euro's value in the former currencies and the former currencies' value in euro(s)) to be decimal: in other words, for the currency rates to be bidecimal. Could we have done this? Of course, it is not the matter of picking an arbitrary bidecimal number: the fixed chosen currency rates need to be very close to the market rates at fixation time. The question, then, is: is it possible to find bidecimal numbers that are arbitrarily close to any given number? Or, in mathematical terminology: are the bidecimals dense in the real numbers? And the answer is yes. If it had been desirable to make the currency rates bidecimal, that could have been done while keeping adequation to an arbitrary precision with the market rates of the day. For instance, one can find a bidecimal number which is between 6.559565 and 6.559575, thus being close to 6.55957; or between 6.5595695 and 6.5596705; or to any desirable precision. I'm not claiming, though, that to fix the rate's approximation of market rates to six significant figures we need only six digits in the bidecimals! Actually, a bidecimal number between 6.559565 and 6.559575 needs quite an impressive number of digits to be written exactly (or its inverse); but it can be done.

As for why that wasn't done in practice, the last sentence above is the answer. But it is an amusing mathematical curiosity. I'll let the mathematically inclined reader figure out the proof.

Note that it doesn't work in binary, for instance: can you explain why that is?