David Madore's WebLog: Quelques sujets mathématiques en vrac sous forme de MIGHTDO

[Index of all entries / Index de toutes les entréesLatest entries / Dernières entréesXML (RSS 1.0) • Recent comments / Commentaires récents]

↓Entry #2656 [older| permalink|newer] / ↓Entrée #2656 [précédente| permalien|suivante] ↓

(samedi)

Quelques sujets mathématiques en vrac sous forme de MIGHTDO

Pendant que j'étais occupé à ne pas écrire dans ce blog, les sujets sur lesquels j'aurais pu écrire quelque chose se sont accumulés. Je veux dire, les sujets sur lesquels soit j'ai appris quelque chose et j'aurais pu/dû le braindumper ici pour me simplifier la vie quand j'aurais plus tard oublié et voulu réapprendre, soit je me suis simplement dit que c'était quelque chose de potentiellement intéressant dans quoi je devrais me plonger si j'avais le temps. Bref, voici une liste de quelques choses sur lesquels je n'ai rien écrit, et il n'est pas impossible que j'y revienne, mais il ne faut pas compter dessus non plus. Pas un TODO, mais un MIGHTDO, si on veut.

(Les différentes parties qui suivent n'ont généralement aucun rapport entre elles. C'est bien le problème, si j'ose dire, de trop aimer l'éclectisme. Par ailleurs, elles mélangent des sujets où j'ai quelques trucs à expliquer (mais je ne le fais pas vraiment ici) et d'autres où j'ai simplement des questions à poser, ou encore où je n'ai rien à dire mais que j'utilise simplement comme memento pour me rappeler que c'est quelque chose d'intéressant à visiter ou revisiter un jour. Les explications, ou les absences d'explications, qui suivent, se placent aussi à des niveaux très variés de prérequis mathématiques.)

Liens vers les sous-parties de cette entrée : • Mandelbrot • inégalités de Bell • topologie sans points • axiome de Scott • topos effectif • complexité au-delà du calculable • algèbres de Jordan • problème du secrétaire • mécanique sphérique • surface de Bring • Cayley-Bacharach • le spectre des polynômes à valeurs entières

D'abord, l'ensemble de Mandelbrot. Avant que le Covid-19 ne vienne squatter mon encéphale, j'avais entrepris d'apprendre ou de comprendre un certain nombre de choses (« bien connues ») sur l'ensemble de Mandelbrot : il en est resté un certain nombre de fils Twitter où j'explique deux ou trois trucs à ce sujet : , , , , , , ,  ; ainsi qu'une série de vidéos YouTube avec de jolies animations d'ensembles de Julia.

Une des choses qui me fascine avec l'ensemble de Mandelbrot, au-delà de sa richesse et sa complexité, est qu'en-dessous de la structure « numérique » (l'endroit précis où se trouve tel ou tel bout de l'ensemble), il y a une structure « combinatoire » : c'est-à-dire qu'on peut déterminer énormément de choses sur l'ensemble de Mandelbrot (la manière dont les composantes sont agencées et reliées les unes aux autres) sans faire le moindre calcul numérique, uniquement avec des données discrètes. Par exemple, supposons que nous voulions étiqueter toutes les composantes hyperboliques (une « composante hyperbolique » est un bulbe de l'ensemble de Mandelbrot : soit la cardioïde d'un bébé ensemble de Mandelbrot, soit un bulbe rattaché à une autre composante hyperbolique ; chaque composante a une « période » associée, qui est la période de l'unique cycle attractif pour la dynamique donnée par un paramètre dans cette composante). Une possibilité d'étiquetage serait d'utiliser les coordonnées numériques (parties réelle et imaginaire) du centre, par exemple −0.27210246148893889 +0.84236469029412815·i, ou d'ailleurs d'un point quelconque, de la composante. Mais il y a une autre description possible, l'« adresse interne angulée » qui consiste (très grossièrement parlant) à expliquer comment on arrive à cette composante en partant de la cardioïde principale et en sautant de composante en composante en augmentant la période, par exemple cela pourrait ressembler à 1[1/3] → 3[2/3] → 7 pour la même composante dont je viens de donner les coordonnées du centre, et cela veut dire que partant de la cardioïde principale (l'unique composante de période 1) on passe au bulbe de période 3 attaché à l'angle interne de 1/3 de tours sur cette composante, puis on cherche le bébé ensemble de Mandelbrot dont la cardioïde est de période 7 dans la « limbe » attachée à l'angle interne de 2/3 du bulbe précédent : cette description-là est purement combinatoire, et on peut se poser toutes sortes de questions à son sujet, comme reconnaître les descriptions valides, ou prédire toutes sortes de choses sur la composante sans faire de calculs numériques. Un autre étiquetage « combinatoire » possible, et il se pose la question de convertir une description en l'autre de manière algorithmique, consiste à utiliser les « arguments externes » qui atterrissent à la racine de la composante qu'on veut étiqueter (c'est-à-dire les directions à l'infini des rayons du champ électrostatique qui serait causé par l'ensemble de Mandelbrot s'il était électriquement chargé : il y a bien sûr moyen de dire ça sans faire référence à la physique) : ainsi, la composante que je viens d'évoquer correspond aux angles de 35/127 et 36/127, et un problème algorithmique intéressant consiste à convertir l'un de ces nombres en la description 1[1/3] → 3[2/3] → 7 ou inversement retrouver ces deux nombres à partir de cette description, sans jamais passer par des calculs numériques.

Bref, j'avais commencé à essayer de comprendre un peu tout ça, et la crise du Covid-19 m'a fait complètement perdre le fil de mes pensées, et j'ai oublié à peu près tout ce que j'avais commencé à comprendre (à part le résumé très grossier que je viens de faire dans le paragraphe précédent). J'avais commencé à écrire un petit texte pour blog, mais il ne contient que des définitions très basiques, je ne sais pas si ça a un intérêt que j'en fasse autre chose que l'archiver. [Diagrammes d'algorithmes concernant l'ensemble de Mandelbrot]En revanche, j'ai quand même gardé les références de quelques textes que j'avais commencé à lire (ou à noter que je devrais lire) :

Bref, je n'ai pas eu le temps de me plonger autant que je voudrais dans tout ça, mais ça semble rigolo.

Question au passage : est-ce que la conjecture MLC peut se reformuler comme un problème purement combinatoire ? Ou est-ce qu'elle est indispensable pour justifier la validité numérique de la description combinatoire mais ne peut pas se tester au niveau purement combinatoire ? À défaut : est-ce que MLC peut se reformuler comme un énoncé arithmétique Π₁ ?

Rien à voir avec l'ensemble de Mandelbrot (mais j'ai commencé à y réfléchir en voyant cette vidéo de vulgarisation) : les inégalités de Bell et la mécanique quantique. Voici quelque chose que je me dis depuis longtemps que je dois essayer de comprendre (je me suis approché de ce sujet dans cette entrée passée, par exemple), mais je n'ai jamais vraiment pris le temps. Deux fils Twitter: et (mais ne pas oublier de lire les réponses à ⓐ et à ⓑ).

Je pars de la description suivante : si 0≤p≤1, j'appelle p-gadget (et si p=1, simplement gadget) un appareil qui fonctionne de la manière suivante. Quand on tourne une manivelle, le p-gadget fabrique une paire de bidules (qu'on pourra qualifier de jumeaux). Chaque bidule a trois boutons, étiquetés X, Y et Z. Quand on appuie sur un des boutons, le bidule se met à clignoter, soit en bleu pour dire oui, soit en rouge pour dire non : après ça, il est bon à jeter ; chaque bidule ne peut servir qu'une fois (qu'un seul appui de bouton), donc, mais rappelons que les bidules sont toujours fabriqués par paires. Les règles de fonctionnement des bidules sont les suivantes : ① quand on appuie sur le même bouton sur les deux bidules d'une paire, on obtient (toujours) la même réponse, et ② quand on appuie sur des boutons différents sur les deux bidules d'une paire, on a une probabilité ≥p (pour p=1 : toujours) d'obtenir des réponses différentes (donc une probabilité ≤(1−p) d'obtenir la même réponse). Ce sont les seules contraintes. Par ailleurs, les bidules doivent fonctionner dans absolument n'importe quelle circonstance : même s'ils sont séparés l'un de l'autre par des millions d'années-lumières ou enfermés dans une cage ; en particulier, ils n'ont pas le droit de communiquer entre eux. S'ils pouvaient communiquer, ce serait facile : le premier bidule activé répondrait toujours oui (disons), et le second répondrait oui ou non selon qu'on a appuyé sur le même bouton ou un bouton différent du premier ; mais ce mode de fonctionnement n'est pas possible.

Ajout : j'aurais sans doute dû préciser que les probabilités dont je parle doivent être réalisées contre tout choix d'appui sur les boutons des bidules (imaginez que le choix est adversarial : il faut néanmoins garantir la probabilité annoncée ; je ne sais pas quelle est la manière la plus claire ou élégante de dire ça).

Manifestement, plus p est élevé, plus il est difficile de réaliser un p-gadget. Il s'avère que :

  • La mécanique classique (ou plus exactement, le réalisme local) permet de réaliser un (⅔)-gadget mais pas mieux, i.e., on peut monter jusqu'à une probabilité p=⅔ de réponses différentes en cas de questions différentes. C'est facile : au moment de fabriquer les bidules, il suffit que le (⅔-)gadget tire au hasard la réponse (oui ou non) à chacune des questions X, Y et Z, de façon uniforme sur les six possibilités où les réponses ne sont pas toutes les trois la même, et enregistre la réponse dans chaque bidule (la même pour les deux) : si on pose la même question aux deux bidules, on a toujours la même réponse, tandis que si on pose des questions différentes, on a une probabilité ⅔ d'avoir des réponses différentes. Mais on ne peut pas faire mieux que ⅔ (sur ce setup, ce n'est pas difficile de s'en convaincre), ça fait partie des inégalités de Bell. [Correction () : j'avais initialement écrit ½ ici ; merci à jonas dans les commentaires de m'avoir signalé cette erreur. Voir aussi l'ajout ci-dessous pour plus d'explications.]
  • La mécanique quantique permet d'arriver jusqu'à p=¾, i.e., de fabriquer un ¾-gadget, mais pas mieux. La manière de procéder (bon, c'est très théorique et très simplifié, hein) est la suivante : quand on active le (¾-)gadget, on réalise un état intriqué, disons de deux particules de spin ½ avec la description (|↑↓⟩−|↓↑⟩)/√2, chaque bidule embarque une des particules de l'état intriqué, et quand on appuie sur le bouton X, Y ou Z, il réalise la lecture selon des axes séparés de 2π/3 l'un de l'autre (et de π par rapport à l'autre bidule, avec la description que j'ai faite, pour compenser le fait que les spins reçus par les deux gadgets sont opposés). On obtient ainsi le ¾ promis ; or apparemment on ne peut pas faire mieux : ceci résulte d'un autre jeu d'inégalités, pour la mécanique quantique cette fois, qui limite aussi les possibilités de celle-ci.
  • Mais il n'y a pas d'objection fondamentale évidente à l'existence d'un 1-gadget, même si ce n'est pas possible avec les lois de la mécanique quantique (ou a fortiori, classique), et un tel gadget ne permettrait pas de communiquer de manière instantanée (il ne violerait pas la causalité), si on en croit un troisième jeu d'inégalités.

Ajout () : pour plus d'explications, voir ce fil Twitter (30 tweets ; ici sur ThreadReaderApp) et surtout celui-ci (25 tweets ; ici sur ThreadReaderApp) qui le corrige (suite à l'erreur signalée en commentaire de cette entrée), et donne plus de détails, notamment une preuve de la réalisabilité et de l'optimalité des gadgets affirmées.

Ce qui m'intéresse particulièrement, disons, ce que je voudrais comprendre, c'est les relations entre ces différents jeux d'inégalités : il semble qu'on puisse décrire naturellement trois convexes (dans quoi exactement, je ne sais pas) qui leur corresponde : le domaine accessible au réalisme local, le domaine accessible quantiquement, et le domaine accessible sans permettre de communication, le premier et le troisième étant des polytopes (i.e., définis par un nombre fini d'inégalités linéaires), tandis que le second est un convexe plus général (défini par des inégalité de type semidéfinies).

Par ailleurs, ce type de problème peut être généralisé en un problème de coloriage de graphes : chacun des deux bidules (qu'on pourrait appeler Alice et Bob), toujours sans avoir le droit de communiquer, seront interrogés sur un sommet d'un (même !) graphe fixé à l'avance, et devront faire une réponse parmi un ensemble de n couleurs (prédéfinies) : si on les interroge sur le même sommet ils doivent répondre la même couleur, tandis que si on les interroge sur des sommets adjacents dans le graphe ils doivent, avec probabilité ≥p, faire des réponses différentes : selon le graphe et selon la valeur de p (qui peut éventuellement être considérée comme décorant l'arête), on peut se demander combien de couleurs il faut pour remplir le défi dans chacun des trois cadres que je viens d'évoquer (classique/réalisme-local, quantique, et non-communiquant). La situation que je considérais précédemment est celle du graphe triangle (de sommets X, Y et Z, avec une arête entre chaque paire de sommets distincts) et n=2.

Je n'ai rien à dire sur tout ça, mais je peux braindumper les références que j'ai prévu de lire (et que je n'ai pas pu lire encore, faute d'accès à mon bureau pour les imprimer) :

(ça fait beaucoup à lire, et je ne sais pas dans quel ordre m'y prendre ; par ailleurs, il y a peut-être plus à trouver dans les références, mais malheureusement certaines sont inexploitables à cause de ce style de citation complètement con parfois utilisé en physique qui fait que je ne sais pas trouver en ligne le papier quand je vois quelque chose comme H.-K. Lo and H. F. Chau, Phys. Rev. Lett. 78, 3410 (1997)).

Ajout : voir aussi ce billet ultérieur.

Rien à voir avec ce qui précède : la topologie sans points. Il y a environ un an, j'avais écrit ici une petite synthèse au sujet des fonctions réelles continues et du compactifié de Stone-Čech des espaces topologiques. Je ne suis pas mécontent de cette entrée de blog, mais je me suis rendu compte, quelque temps après, que quasiment tout ce que j'écrivais se généralisait très bien, et prenait même plus de sens, dans le contexte de la topologie sans points. J'ai donc commencé à écrire une entrée sur le sujet qui, comme tant d'autres choses que j'ai commencées, n'a jamais été finie parce que je me suis rendu compte que tout était immensément plus long à raconter que ce que je pensais. Je pourrais peut-être la publier inachevée, même si c'est assez rébarbatif à ce stade parce qu'il s'agit juste de définitions générales sans vraiment rentrer dans le sujet que je voulais évoquer (les fonctions réelles continues dans le cadre de la topologie sans points), mais voici au moins le petit bout où j'expliqu(er)ais très informellement de quoi il s'agit :

Brièvement, de quoi s'agit-il ? On introduit une structure mathématique appelée une locale : il s'agit d'une sorte de généralisation d'un espace topologique (je donne les détails ci-dessous ; ce n'est pas exactement une généralisation, mais c'est au moins une généralisation, disons, des espaces topologiques séparés), qui s'obtient en partant de la structure algébrique des ouverts sur un espace topologique et en jetant l'espace topologique lui-même (i.e., ses points) pour ne garder que la structure abstraite (les cadres), et en « inversant les flèches » (là aussi, j'expliquerai ci-dessous) pour pouvoir faire comme si c'étaient des sortes d'espaces. Quel est l'intérêt de cette « topologie sans points » (en anglais pointfree topology ou, si on est farceur, pointless topology, ce qui suggère de ne pas se poser cette question) ? Cela permet de poser un regard différent sur un certain nombre de notions topologiques et de faire des preuves différemment, parfois plus simplement ou plus clairement ; cela permet de généraliser un certain nombre de théorèmes à ce nouveau contexte (et de nouveau, parfois avec des preuves plus simples, ou plus générales par exemple parce qu'elles se passent de l'axiome du choix ou fonctionnent en logique intuitionniste) ; cela permet d'unifier assez naturellement des constructions sur les espaces topologiques et sur les algèbres de Boole ; et la notion de locale est une sorte d'intermédiaire naturel entre la notion d'espace topologique et celle de topos.

— et pour donner quand même quelques bouts de définitions afin de ne pas parler dans le vide, que j'extrais toujours de ce texte commencé et jamais publié :

Un cadre (frame en anglais) est un ensemble partiellement ordonné dans lequel

  • toute partie S possède une borne supérieure, appelée aussi jointure, notée ⋁S (ou ⋁iI ui si S = {ui : iI} ; et on notera uv pour la jointure de deux éléments) ;
  • il est alors automatiquement le cas que toute partie, et notamment toute partie finie, possède une borne inférieure, appelée aussi rencontre, et notée ⋀S (ou ⋀iI ui si S = {ui : iI} ; et on notera uv pour la rencontre de deux éléments) ;
  • les rencontres finies se distribuent sur les jointures quelconques, c'est-à-dire que v∧(⋁jJ uj) = ⋁jJ (vuj) si v est un élément du cadre et (uj)jJ une famille de tels éléments (et on peut en déduire que, plus généralement, ⋀iI ⋁jJi ui,j = ⋁k∈∏iIJi ⋀iI uk(i) lorsque I est fini).

C'est le cas de l'ensemble 𝒪(X) des ouverts d'un espace topologique partiellement ordonnés par l'inclusion, et c'est l'archétype qu'on gardera à l'esprit, l'idée étant de se demander maintenant ce qu'on peut faire avec uniquement cette structure. Un cadre est une version abstraite des ouverts d'un espace topologique, et les opérations de jointure (quelconque) et de rencontre (finie) sont des versions abstraites des opérations de réunion (quelconque) et d'intersection (finie) des ouverts.

En particulier, un cadre a un plus petit élément, qu'on notera ⊥ (la jointure de la famille vide ; il faut y penser comme la version abstraite de ∅), et un plus grand élément, qu'on notera ⊤ (la rencontre de la famille vide ; il faut y penser comme la version abstraite du plein).

Mais pour qu'une structure ait vraiment un sens, il faut se demander ce que sont ses morphismes. L'archétype qu'on aura en tête est l'image réciproque des ouverts par une application continue : si f:XY est une application continue entre espaces topologiques (rappelons que cela signifie que l'image réciproque d'un ouvert est un ouvert), on a une application Vf−1[V] de l'ensemble 𝒪(Y) des ouverts de Y vers l'ensemble 𝒪(X) des ouverts de X, et cette application préserve à la fois les réunions quelconques et les intersections finies (en fait les intersections quelconques, mais comme celles-ci ne sont pas des ouverts on n'a pas le droit d'en parler ; en revanche, les bornes inférieures quelconques de familles d'ouverts ne sont pas préservées en général). Donc :

On définit un morphisme de cadres comme une application entre cadres qui préserve les jointures quelconques et les rencontres finies.

(C'est vraiment important d'avoir la bonne notion de morphisme : à isomorphisme près, les cadres sont la même chose que les algèbres de Heyting, par exemple — cf. aussi cette entrée — mais les morphismes de cadres ne sont pas les mêmes que les morphismes d'algèbres de Heyting.)

Bon, alors maintenant il y a une étape qui est mathématiquement complètement triviale, mais conceptuellement géniale : celle d'inverser les flèches (ou, ensemblistement, passer à la catégorie opposée). On va définir un nouveau type d'objets, les locales, qui sont exactement la même chose que les cadres, sauf que les morphismes vont dans la direction opposée (pour rétablir, pour ainsi dire, la direction dans laquelle les flèches allaient entre espaces topologiques). Cette idée est triviale mais extrêmement féconde : c'est grâce à ça qu'on va avoir une vraie intuition géométrique.

Bref, je définis une locale comme un objet formellement noté Loc(L) où L est un cadre (cette notation Loc(L) sert uniquement à différencier le même objet quand il est une locale ou quand il est un cadre) ; inversement, si X est une locale, on notera 𝒪(X) le cadre correspondant (c'est-à-dire le même objet mais considéré comme un cadre : dire que L=𝒪(X) revient à dire que X=Loc(L) ; s'il y a des gens qui trouvent perturbant que je note L le cadre et X la locale, la lettre ‘L’ est l'initiale du mot anglais lattice, car les cadres sont, en particulier, des treillis). Comme pour un espace topologique, les éléments du cadre 𝒪(X) correspondant à une locale X seront appelés les ouverts de X (et le cadre lui-même peut donc s'appeler le cadre des ouverts ou l'ensemble des ouverts de la locale) : la différence essentielle avec un espace topologique, je le répète, est que quand X est une locale, les ouverts de X ne sont pas des parties de X (puisque X n'a pas de sens en tant qu'ensemble, ou en tout cas pas en tant qu'ensemble de points), ce sont juste des éléments d'un cadre abstrait.

Enfin, un morphisme XY de locales est simplement défini par un morphisme 𝒪(Y)→𝒪(X) dans le sens contraire des cadres correspondants (i.e., un morphisme ML si X=Loc(L) et Y=Loc(Y)). Quand on aura besoin de nommer les morphismes, si f:XY est un morphisme de locales, on notera f*:𝒪(Y)→𝒪(X) (avec un astérisque en exposant, donc) le morphisme correspondant entre les cadres : on dit parfois que le morphisme de cadres f* est l'image inverse ou image réciproque associée au morphisme de locales f:XY. La composition des morphismes de locales s'obtient en composant (évidemment dans le sens contraire) les morphismes de cadres : c'est-à-dire que si f:XY et g:YZ sont des morphismes de locales (définis par des morphismes de cadres f*:𝒪(Y)→𝒪(X) et g*:𝒪(Z)→𝒪(Y)) alors on définit gf:XZ par le fait que (gf)* = f*g* (morphisme de cadres 𝒪(Z)→𝒪(X)).

L'exemple qui s'impose, et pour lequel on a fait tout ça, c'est que si X est un espace topologique, alors on a une locale Loc(𝒪(X)) définie par l'ensemble 𝒪(X) des ouverts de X vu comme un cadre (ainsi qu'on l'a expliqué ci-dessus) : cette locale sera notée Pointfree(X) (elle est donc définie par le fait qu'elle a le même cadre d'ouverts 𝒪(Pointfree(X)) = 𝒪(X) que X ; il faut y penser comme X mais où j'oublie les points). Parfois, quand ça ne cause pas de confusion, on notera même simplement X pour la locale définie par l'espace topologique X, et on identifiera les deux objets (j'expliquerai plus loin que c'est légitime si X est « sobre » et notamment si X est séparé).

Si f:XY est une application continue entre espaces topologiques, j'ai expliqué que l'application « image réciproque » Vf−1[V] (de l'ensemble 𝒪(Y) des ouverts de Y vers l'ensemble 𝒪(X) des ouverts de X) définissait un morphisme de cadres 𝒪(Y)→𝒪(X), et elle définit donc un morphisme de locales dans le sens inverse, c'est-à-dire Pointfree(X)→Pointfree(Y), qu'on pourra noter Pointfree(f) : formellement, donc, Pointfree(f)* est Vf−1[V]. Parfois, quand ça ne cause pas de confusion, on la notera même simplement f pour Pointfree(f) et on l'identifiera avec l'application de ce nom (j'expliquerai plus loin que c'est légitime si Y est T₀ et notamment s'il est sobre ou, à plus forte raison, séparée).

Une locale de la forme Pointfree(X), où X est un espace topologique, est appelée une locale spatiale. Formellement, on a défini un foncteur (covariant) Pointfree, de la catégorie des espaces topologiques vers la catégorie des locales (laquelle est définie comme la catégorie opposée de la catégorie des cadres) : le fait que Pointfree soit un foncteur (covariant) signifie simplement que si f:XY et g:YZ alors Pointfree(gf) = Pointfree(g)∘Pointfree(f).

Pour l'instant je n'ai pas donné d'exemple de locale qui ne soit pas spatiale, mais je mentionne en passant que si B est une algèbre de Boole complète (c'est-à-dire un cadre dans lequel chaque élément u a un élément ¬u, automatiquement unique, tel que u∧¬u=⊥ et u∨¬u=⊤, et qu'on appelle complémentaire de u), qu'on peut considérer comme un cadre particulier, la locale Loc(B) n'est presque jamais spatiale (elle l'est exactement lorsque B est « atomique », ce qui dans ce contexte revient à dire qu'il s'agit de l'ensemble 𝒫(X) des parties d'un ensemble X, autrement dit, lorsque Loc(B)=Pointfree(X) où X est un ensemble considéré comme espace topologique discret).

Bon, j'en ai encore des pages et des pages, comme ça, de définitions un peu arides avec des foncteurs adjoints dans tous les sens, mais je vous les épargne (pour l'instant). Ce qui m'intéressait est qu'on peut définir la compactification de Stone-Čech (et éventuellement la réelcompatification) pour les locales de façon exactement analogue aux espaces topologiques : si C(X) est l'ensemble des morphismes de locales X→ℝ où ℝ, ou plus exactement Pointfree(ℝ), est la locale définie par le cadre des ouverts de la droite réelle au sens usuel, et C*(X) est l'ensemble de ceux qui sont bornés dans un sens assez évident, ceci permet de définir βX comme l'espace topologique compact, et X→βX comme le morphisme de locales, tels que C*(βX)→C*(X) soit un isomorphisme, c'est-à-dire que βX est l'espace des idéaux maximaux de C*(X). On peut par exemple définir la notion de locale complètement régulière, à savoir celles pour lesquelles la flèche X→βX définit une sous-locale (c'est-à-dire que la flèche sur les cadres 𝒪(βX)→𝒪(X) est surjective), ce qui peut se caractériser de différentes autres manières.

Même si, in fine, on décide qu'on ne s'intéresse qu'aux espaces topologiques, ce point de vue a de l'intérêt : par exemple, il existe une opération de booléanisation X↦𝐁(X) sur les locales (remplacer le cadre correspondant par l'algèbre de Boole de ses éléments réguliers, ceux pour lesquels v = (v⇛⊥)⇛⊥, où l'opération de Heyting ‘⇛’ est définie par (vu) := ⋁{w : (vw)≤u} ; pour un espace topologique, ce sont justement les ouverts réguliers), la booléanisation d'une locale n'est essentiellement jamais un espace topologique (i.e., une locale spatiale), mais si on prend son compactifié de Stone-Čech on revient dans le cadre des espaces topologiques. Et là, il peut être intéressant de comparer le compactifié de Stone-Čech βX d'un espace topologique X et celui β𝐁(X) de sa booléanisation (en tant que locale) : on obtient ainsi un nouveau point de vue sur l'opération X↦β𝐁(X) qui revient à prendre l'espace de Stone (= des idéaux maximaux) de l'algèbre de Boole des ouverts réguliers de X, une construction classique en topologie appelée espace de Gleason de X (cf. aussi cette question sur MathOverflow). Par exemple, si je ne m'abuse, l'espace L(ℝ;ℝ) de l'analyse (fonctions réelles ℝ→ℝ mesurables et essentiellement bornées, modulo égalité presque partout) coïncide avec l'anneau des (vraies !) fonctions réelles continues (automatiquement bornées) sur l'espace de Gleason de la topologie de la densitéd sur ℝ (cf. aussi ce fil Twitter), donc on peut les voir comme des fonctions réelles bornées sur la locale 𝐁(ℝd). Il y aurait aussi des connexions à faire avec le forcing et l'analyse à valeurs booléennes (cf. le livre de Kusraev & Kutateladze, Bolean Valued Analysis, hum, pardon, le livre de Кусраев & Кутателадзе, Булевозначный анализ).

Bref, il s'agit là de choses « bien connues », mais écrites de façon dispersée dans la littérature, sur lesquelles j'aurais des choses à écrire mais ça prend simplement trop de temps, et c'est peut-être un peu technique même pour ce blog. Je note quelques références :

  • Peter T. Johnstone, Stone Spaces (1982), (chapitres I–IV),
  • Jorge Picardo & Aleš Pultr, Frames and Locales: Topology without points (2012),
  • trois articles de Bernard Banaschewski & Christopher J. Mulvey, Stone-Čech Compactification of Locales (I : 1980 ; II : 1984 ; III : 2003),
  • Bernard Banaschewski & Aleš Pultr, Booleanization (1996), ainsi éventuellement que la suite appelée Booleanization of Uniform Frames (1996 toujours),
  • John Isbell, Atomless Parts of Spaces (1972),
  • Richard N. Ball & Joanne Walters-Wayland, C- and C*-quotients in pointfree topology.

(Liste extraite un peu au pif d'une longue liste d'articles que j'ai sauvegardés sur des sujets plus ou moins connexes : je pense qu'ils font partie des plus pertinents par rapport à ce que je viens de dire, mais il y en a certainement d'autres.)

Il y a des questions de recherche attenantes à tout ça. Par exemple, je crois comprendre que plein de questions consistant à caractériser, de façon intrinsèque, les anneaux (ou les anneaux ordonnés, ou quelque autre variation sur la structure) qui sont l'anneau des fonctions rélles continues sur un espace topologique, ou bien sur une locale, sont encore largement ouvertes.

Ajout : j'aurais sans doute dû mentionner le fait qu'un regard intéressant que les locales permettent de poser est que les sous-locales d'un espace topologique sont subtilement différents de ses sous-espaces topologiques, notamment par le fait qu'il existe une plus petite sous-locale dense, justement donnée par l'opération de booléanisation que j'évoque ci-dessus et, en particulier, deux sous-locales denses s'intersectent toujours (si X est un espace topologique et AX est une partie quelconque vue comme sous-espace topologique, on lui associe la sous-locale donnée par la flèche Pointfree(A)→Pointfree(X) définie par le morphisme de cadres 𝒪(X)→𝒪(A) qui est simplement UUA ; mais la notion d'intersection de sous-locales demande un petit peu de doigté : toujours est-il que la plus petite sous-locale dense de Pointfree(X) est justement celle associée au cadre des ouverts réguliers (qui est une algèbre de Boole)). Évidemment c'est un peu surprenant de dire que, par exemple, les rationnels et les irrationnels de ℝ s'intersectent (mais cette intersection n'a, justement, pas de point !), mais comme on me le signale en commentaire, cela ouvre la porte à une façon originale de repenser la mesure de Lebesgue, et de lever le paradoxe de Banach-Tarski (Olivier Leroy, Théorie de la mesure dans les lieux réguliers).

Disons maintenant un mot de l'axiome de Scott ((¬¬pp) ⇒ (p∨¬p)) ⇒ (¬¬p∨¬p). Je me place bien sûr ici dans le cadre de la logique intuitionniste (cf. aussi ce fil Twitter). Il fait partie d'une infinité de choses qui sont des tautologies en logique classique mais qui n'en sont pas en logique intuitionniste, mais qui sont néanmoins moins fortes que de supposer la loi du tiers exclu (p∨¬p ou, ce qui à condition de le postuler pour tout p, revient au même, ¬¬pp), c'est même, en une seule variable propositionnelle, un des postulats les plus simples qu'on puisse formuler après la loi du tiers exclu et la loi faible du tiers exclu (¬¬p∨¬p), cf. le treillis de Rieger-Nishimura. Donné un topos (je n'ai pas envie d'expliquer ce qu'est un topos, mais faites semblant une seconde), on peut se demander s'il vérifie tel ou tel de ces axiomes intermédiaires : par exemple, le topos des ensembles simpliciaux (ou la logique de Medvedev, cf. l'entrée de blog liée ci-dessus) vérifie l'axiome de Scott ou l'axiome de Kreisel-Putnam (¬p⇒(q₁∨q₂)) ⇒ ((¬pq₁) ∨ (¬pq₂)), cf. cette question sur MathOverflow.

L'axiome de Scott peut paraître assez arbitraire, et son sens intuitif n'est pas franchement clair, mais il y a des raisons de s'y intéresser quand même (et pas seulement parce qu'il est vérifié dans un topos particulier, comme je viens de le dire), ne serait-ce que parce que c'est un des plus simples sur lesquels on puisse dire des choses intéressantes. Et de fait, des choses ont été prouvées à son sujet. La logique (intermédiaire entre la logique intuitionniste et la logique classique) obtenue en postulant l'axiome de Scott (pour tout énoncé p) est décidable, ce qui n'est pas du tout évident a priori, et vérifie la proposition de la disjonction (c'est-à-dire que si elle démontre uv alors elle démontre soit u soit v) ; et il en va de même pour l'axiome de Kreisel-Putnam évoqué ci-dessus, ou pour la conjonction de ces deux axiomes. (Je donne les références parce que sinon je ne les retrouverai pas :: pour l'axiome de Scott : J. G. Anderson, Superconstructive propositional calculi with extra axiom schemes containing one variable (1972) ; pour l'axiome de Kreisel-Putnam : Dov M. Gabbay, The decidability of the Kreisel-Putnam system (1970) ; pour la conjonction des deux, Perluigi Minari, On the extension of intuitionistic propositional logic with Kreisel-Putnam and Scott's schemes (1986) ; voir aussi le survey par Alexander Chagrov & Michael Zakharyashchev, The disjunction proprty of intermediate propositional logics (1991)).

Maintenant, un problème qui me semble assez naturel, c'est de se demander ce que cet axiome signifie dans le cadre d'un espace topologique (voire, pour faire le lien avec la partie précédente de cette entrée, une locale) : on dit qu'un espace topologique X vérifie un certain énoncé du calcul propositionnel intuitionniste (comme l'axiome de Scott ((¬¬pp) ⇒ (p∨¬p)) ⇒ (¬¬p∨¬p) ou l'axiome de Kreisel-Putnam (¬p⇒(q₁∨q₂)) ⇒ ((¬pq₁) ∨ (¬pq₂))) lorsque pour toute façon de choisir un ouvert de X pour chacune des variables propositionnelles de l'énoncé en question, la valeur de l'énoncé est l'ouvert plein X, où les opérations ∨, ∧ et ⇒ sur les ouverts sont définies comme respectivement la réunion, l'intersection, et l'opération de Heyting (VU) := ⋃{W : (VW)⊆U} = int(U∪(XV)) (et le pseudocomplément ¬V est défini comme (V⇛∅) c'est-à-dire int(XV) = X∖adh(V), le plus grand ouvert disjoint de V). À titre d'exemple, un espace topologique vérifie la loi du tiers exclu p∨¬p lorsque tous les ouverts sont fermés, ce qui n'est pas très intéressant (mais pour une locale, cela signifie qu'elle est booléenne, ce qui est évidemment plus intéressant dans ce contexte), et il vérifie la loi faible du tiers exclu, ¬¬p∨¬p, lorsqu'il est extrêmement discontinu (c'est-à-dire que l'adhérence d'un ouvert est encore un ouvert ; cf. Gleason, Projective Topological Spaces (1958)). Donc l'axiome de Scott devrait correspondre à une condition un peu moins drastique que ça : on peut le formuler en disant que si U est un ouvert, alors le bord ∂ro(U) de ro(U) := int(adh(U)) (plus petit ouvert régulier contenant U) est inclus dans l'adhérence de l'ensemble des points du bord ∂U de U au voisinage desquels U est régulier (c'est-à-dire ayant un voisinage W tel que UW = ro(U)∩W), i.e., on peut arbitrairement approcher tout point du bord de ro(U) par des points du bord de U au voisinage desquels ro(U) et U coïncident ; c'est un peu moins chinois comme ça, mais ça ne m'aide pas vraiment à trouver des exemples intéressants (voir aussi ce fil Twitter). J'avais déjà posé sur MathOverflow la question analogue pour l'axiome de Kreisel-Putnam, la réponse que j'ai reçue avait été très intéressante (et m'a permis d'apprendre l'existence d'une expansion maximale connexe de la droite réelle), même si je demeure assez perplexe quant à la signification topologique de cet axiome, il faut sans doute y réfléchir plus s'agissant de l'axiome de Scott. On peut aussi s'interroger sur les autres étages du treillis de Rieger-Nishimura.

Bon, je n'ai rien d'intelligent à dire sur tout ça, que des questions à poser, mais sait-on jamais, peut-être que poser ces questions sur ce blog incitera quelqu'un à y réfléchir, je ne pense pas que ce soient des bits perdus.

Ajout : cette entrée ultérieure (et spécifiquement ce passage) discute de ce que la formule de Scott nous apprend en calculabilité.

Dans ma TODO-list, il y a aussi toujours d'écrire quelque chose sur le topos effectif. (Ce qui est bien, c'est qu'il est suffisamment simple à décrire pour qu'on n'ait pas besoin de décrire au préalable ce que c'est qu'un topos en général.) Ou au moins sur la réalisabilité de Kleene (pour la définition de la réalisabilité de Kleene, ce qui n'est pas très difficile, je peux renvoyer au début de cette question ; le topos effectif est une sorte de catégorification de cette notion pour la généraliser de façon assez naturelle). Je n'ai rien à ajouter sur ce sujet à ce moment, à part que j'ai un bout d'entrée déjà écrit et qu'il faudrait me motiver à la finir, mais je le mentionner surtout parce que ça fait une sorte de transition entre ce qui précède (j'avais déjà mentionné que le topos effectif / la réalisabilité de Kleene, ne valide ni l'axiome de Scott ni celui de Kreisel-Putnam, mais qu'il valide des choses pas franchement super intuitives comme (¬(p₁∧p₂) ∧ (¬p₁⇒(q₁∨q₂)) ∧ (¬p₂⇒(q₁∨q₂))) ⇒ ((¬p₁⇒q₁) ∨ (¬p₁⇒q₂) ∨ (¬p₂⇒q₁) ∨ (¬p₂⇒q₂)) ou ((¬¬p₁⇔(¬p₂∧¬p₃)) ∧ (¬¬p₂⇔(¬p₃∧¬p₁)) ∧ (¬¬p₃⇔(¬p₁∧¬p₂)) ∧ ((¬p₁⇒(¬p₂∨¬p₃)) ⇒ (¬p₂∨¬p₃)) ∧ ((¬p₂⇒(¬p₃∨¬p₁)) ⇒ (¬p₃∨¬p₁)) ∧ ((¬p₃⇒(¬p₁∨¬p₂)) ⇒ (¬p₁∨¬p₂))) ⇒ (¬p₁ ∨ ¬p₂ ∨ ¬p₃) ; à ce sujet voir le survey de Valery Plisko, A survey of propositional realizability logic (2009) ; je n'ose pas, cependant, essayer d'imaginer ce que ces formules peuvent signifier sur un espace topologique), mais aussi avec ce qui suit, puisqu'il est question de calculabilité.

Ajout : finalement, j'ai écrit un billet sur la réalisabilité de Kleene, il est ici, et un sur le topos effectif, il est là (les deux peuvent être lus indépendamment) ; voir aussi celui-ci sur la réalisabilité propositionnelle (et aussi ce billet sous forme d'énigme) pour une explication sur ces formules « pas franchement super intuitives ».

Je me plains régulièrement que l'informatique théorique consacre un travail démesuré à l'étude de la complexité (avec le développement de tout un zoo dont je ne suis même pas persuadé qu'on sache prouver qu'il y a une douzaine de classes (non paramétriques) distinctes dans le tas) au détriment de questions plus orientées vers la calculabilité, par exemple, ou ne serait-ce que les hiérarchies sous-récursives : j'avais déjà écrit sur ce blog que personne n'aimait les fonctions primitives récursives, et un symptôme intéressant est que le zoo de complexité que je viens de mentionner ne semble pas recenser une seule classe intermédiaire entre les problèmes primitifs récursifs et les problèmes calculables (= général récursifs), alors que les fonctions ε₀-récursives (= fonctions calculables démontrablement totales dans l'arithmétique de Peano ; cf. P. G. Odifreddi, Classical Recursion Theory (1999), vol. 2, VIII.9) ou plus généralement les niveaux de la hiérarchie de Grzegorczyk étendue (ou de Löb-Wainer) sont des classes de complexité parfaitement légitimes. Mais un autre point que je peux souligner est que toute cette zoologie de la complexité concerne le degré de Turing 0, c'est-à-dire ce qui est calculable par une machine de Turing ordinaire : où est donc la théorie de la complexité pour les autres degrés de Turing et pourquoi personne ne se penche sur ces questions-là ?

Le problème de l'arrêt (c'est-à-dire la fonction H qui à une machine de Turing associe 1 ou 0 selon que son exécution s'arrête en temps fini ou non), la fonction « castor affairé » (disons la fonction qui à un entier n associe le nombre maximal BB(n) d'étapes d'exécution que peut effectuer une machine de Turing ayant n états et qui s'arrête effectivement en temps fini), ou encore le graphe (resp. l'épigraphe) de cette fonction (c'est-à-dire la fonction qui à (n,v), associe 1 ou 0 selon que v=BB(n) ou v≠BB(n), resp. v≥BB(n) ou v<BB(n)), toutes ces fonctions sont dans le même degré de Turing, qu'on appelle 0′, c'est-à-dire que si on donne à une machine de Turing le pouvoir d'interroger un oracle qui lui renvoie la valeur d'une de ces fonctions, elle peut calculer n'importe laquelle des autres. Mais ce calcul peut prendre énormément de temps : l'algorithme évident pour calculer le problème de l'arrêt en disposant du graphe de la fonction BB consiste à exécuter pas à pas la machine de Turing à laquelle on s'intéresse (ayant, disons, n états) et, après chaque étape v, interroger le graphe de la fonction BB pour savoir si v=BB(n), jusqu'à soit voir la machine s'arrêter soit avoir la garantie qu'elle ne s'arrêtera jamais ; cet algorithme a une complexité comparable à la fonction BB elle-même (ce qui n'est pas possible pour une fonction calculable par une machine de Turing sans oracle !).

J'ai posé la question sur le stackexchange d'informatique théorique (pour changer un peu de MathOverflow, même s'il y aurait aussi bien eu sa place) de savoir si (1) on pouvait calculer le problème de l'arrêt en temps polynomial, exponentiel ou primitif récursif avec pour oracle le graphe de la fonction BB (est-ce que H ∈ PΓBB ?), ce qui impliquerait notamment que tout problème calculable le serait aussi (i.e., on aurait RPΓBB parce que RPH), ou (2) si, au contraire, tout problème calculable en temps polynomial avec pour oracle le graphe de la fonction BB et qui est aussi calculable sans oracle (sans contrainte de complexité) est encore calculable en temps polynomial sans oracle (est-ce que PΓBBR = P). Laurent Bienvenu m'a fait une réponse très intéressante expliquant que la réponse est non au deux (ce qui est le plus intéressant !) : ou plus précisément, que le graphe de la fonction BB ne permet pas de calculer le problème de l'arrêt en une complexité qui soit elle-même calculable, mais que, à l'inverse, il doit exister certains problèmes calculables que le graphe de la fonction BB permet de calculer plus que polynomialement plus rapidement que sans elle. (J'apprends au passage le concept de problèmes low for speed, c'est-à-dire d'oracles qui ne font pas gagner une accélération plus que polynomiale de la complexité.)

Il faut encore que je digère cette réponse pour bien comprendre comment elle fonctionne, mais elle suggère au moins qu'il y a possiblement un intérêt réel à étudier la complexité au sein du degré de Turing 0′, et qu'une classe de complexité possiblement intéressante dans ce degré serait les fonctions calculables en temps calculable (je veux dire, calculable par une machine de Turing ordinaire, sans oracle) par une machine disposant du graphe de la fonction BB comme oracle.

Mais la réponse que j'ai reçue suggère aussi quantité d'autres questions. Par exemple, du coup, je ne sais toujours pas quoi penser des problèmes calculables en temps polynomial avec pour oracle le graphe de la fonction BB et qui sont aussi calculables sans oracle (sans contrainte de complexité) : est-ce que ça inclut peut-être tous les problèmes calculables (i.e. a-t-on RPΓBB) ? Il faudrait aussi déconfuser ce qui se passe pour les fonctions primitives récursives, parce que si sans oracle il revient au même de dire qu'une fonction est primitive récursive ou calculable en temps donné par une fonction primitive récursive, en revanche, avec un oracle (tel que ΓBB) il y a deux ou trois notions à bien distinguer.

Bref, je ne sais pas dire grand-chose sur tout ça, là aussi je n'ai que des questions à poser, mais ceci me conforte dans l'idée qu'il y a plein de sujets de recherche potentiels qui ne demandent qu'à être explorés.

Je voulais dire quelque chose sur les algèbres de Jordan, aussi. C'est aussi motivé par une question sur MathOverflow, mais pour une fois c'est moi qui ai répondu à la question (posée par John Baez), ce qui n'est pas un exploit parce que la réponse était, en fait, déjà sur Wikipédia (je l'ai vu après). Mais ceci m'amène à faire une remarque sur quelque chose qui depuis longtemps me semble (et, je crois, semble à tout le monde) assez mystérieux.

Une algèbre associative (sur un corps de caractéristique 0 pour simplifier), rappelons-le, est un espace vectoriel A muni d'une opération bilinéaire (c'est-à-dire linéraire en chaque variable séparément) A×AA, notée (x,y)↦xy, qui est associative (et j'ai peut-être aussi envie de demander l'existence d'un élément neutre, mais peu importe). À partir d'une telle structure, on peut définir deux autres opérations bilinéaires A×AA, à savoir le crochet de Lie [x,y] := xyyx, et le produit de Jordan xy := ½(xy+yx), soit en gros la partie antisymétrique et la partie symétrique du produit de départ (on a [y,x] = −[x,y] tandis que yx = xy). On peut se demander quelle structure définissent ces deux opérations.

S'agissant du crochet de Lie [—,—], c'est clair : c'est une algèbre de Lie, c'est-à-dire que [—,—], outre l'antisymétrie ([y,x] = −[x,y]), vérifie l'identité dite de Jacobi, [x,[y,z]] + [y,[z,x]] + [z,[x,y]] = 0, et c'est tout : toute identité universellement vérifiée par le crochet de Lie [—,—] d'une algèbre associative découle de ces uniques identité. En fait, il y a même mieux : toute algèbre de Lie se plonge dans l'algèbre de Lie définie par le crochet de Lie sur une algèbre associative (c'est une conséquence du théorème de Poincaré-Birkhoff-Witt), ce qui implique évidemment qu'elle doit en vérifier toutes les identités.

S'agissant du produit de Jordan ∙, en revanche, les choses sont plus confuses : outre la symétrie (commutativité : yx = xy), il vérifie l'identité de Jordan (xx)∙(xy) = x∙((xx)∙y), mais ce n'est pas tout : une algèbre vérifiant ces identités est appelée algèbre de Jordan, mais, à la différence du crochet de Lie, il existe des identités, appelées s-identités, vérifiées par le produit de Jordan de toute algèbre associative et qui ne sont pas vérifiées dans toute algèbre de Jordan (i.e., ne découlent pas de la commutativité et l'identité de Jordan), et je crois comprendre qu'on ignore si on peut dresser une liste finie de s-identités d'où elles découleraient toutes. Encore plus bizarrement, les quelques s-identités connues sont longues, compliquées, moches, et impossibles à mémoriser. (Voir par exemple celle-ci. Ou encore celle-ci, due à Armin Thedy : UU[x,y](z)(t) = U[x,y](Uz(U[x,y](t))) où Ua(c) := 2a∙(ac) − (aa)∙c et U[a,b](c) := 4Uab(c) − 2Ua(Ub(c)) − 2Ub(Ua(c)) ; on peut noter que Ua(c) = aca et U[a,b](c) = (abba)c(abba) dans une algèbre associative munie de son produit de Jordan, et que par ailleurs UUx(z)(t) = Ux(Uz(Ux(t))) vaut dans n'importe quelle algèbre de Jordan, i.e., ceci découle de l'identité de Jordan, ce qui rend l'identité de Thedy un petit peu moins mystérieuse. Mais écrite complètement en terme du produit de Jordan, elle reste passablement cryptique.) Et par ailleurs, même une algèbre de Jordan vérifiant toutes les s-identités (parfois appelée i-spéciale) ne se plonge pas forcément dans une algèbre associative munie de son produit de Jordan (une algèbre de Jordan qui se plonge ainsi est dite spéciale).

Toutes ces choses sont bien connues. Mais ce à quoi je n'ai aucune sorte de réponse, et je ne sais pas si quelqu'un en a ou si c'est un mystère pour tout le monde, c'est : pourquoi une telle différence ? Qu'est-ce qui, fondamentalement, fait que du côté des algèbres de Lie les identités se passent très bien, et que du côté de des algèbres de Jordan c'est un épouvantable chaos ? On peut lire des démonstrations, mais je ne trouve pas qu'elles constituent une explication satisfaisante.

Je note par ailleurs, en écrivant tout ça, que le caractère Unicode U+2219 BULLET OPERATOR (‘∙’), que j'ai utilisé pour le produit de Jordan, ressemble quand même furieusement beaucoup à U+22C5 DOT OPERATOR (‘⋅’) voire U+00B7 MIDDLE DOT (‘·’) dans la police que j'ai, alors que je m'attendais à ce qu'il ressemblât à U+2022 BULLET (‘•’).

Le fait de chercher à vendre un appartement (et donc de devoir décider, quand je reçois une offre, si je l'accepte ou pas, sachant que je n'ai qu'une idée très floue de la valeur marché réelle de l'appartement, surtout sur un marché aussi étroit que celui des appartements avec un jardin à Paris) m'a amené à me remémorer le problème du secrétaire, un problème classique de probas. (Résumé : on va recevoir n offres tour à tour pour quelque chose — par exemple pour remplir un emploi de secrétaire — ces offres n'ont pas de valeur numérique, juste un ordre total de la meilleure à la pire, et à chaque fois on ne peut que comparer la valeur de l'offre avec celles précédemment reçues, on ne sait pas ce qui va suivre, et on ne peut qu'accepter l'offre définitivement, ce qui arrête le processus, ou la refuser définitivement et passer à la suivante ; et le but est de maximiser la probabilité d'accepter la meilleure offre. De façon un peu étonnante, la solution — pour n grand — consiste à rejeter les n/e premières offres, puis prendre la prochaine qui soit meilleure que toutes celles rencontrées jusqu'à présent.) Ce problème admet, bien sûr, énormément de variantes.

En voici une : on va recevoir n offres qui sont, cette fois, des variables aléatoires indépendantes distribuées selon une loi normale (disons de moyenne 0 et d'écart-type 1 pour fixer les idées) ; à chaque fois on doit décider si on accepte l'offre, auquel cas on gagne la valeur de celle-ci, ou si on la rejette et qu'on continue le processus. Quelle est l'espérance de gain qu'on peut atteindre, et comment faire ? (C'est deux fois la même question, bien sûr, car la stratégie consiste simplement à accepter une offre si sa valeur dépasse l'espérance de gain du processus pour les offres restantes.) Autrement dit, si (Zn) est une suite de variables aléatoires indépendantes gaussiennes (de moyenne 0 et d'écart-type 1) et qu'on définit simultanément une suite de variables aléatoires (Xn) et une suite de réels (En) par En = 𝔼(Xn) (espérance de Xn) et par X₁ = Z₁ et Xn = (ZnEn−1) ? Zn : Xn−1 (autrement dit, Xn vaut Zn si celle-ci dépasse En−1, et vaut Xn−1 sinon ; notamment, X₂ = (Z₂≥0) ? Z₂ : Z₁), que peut-on dire de la suite (En) des espérances, et comment se compare-t-elle avec la suite plus simple (𝔼(max(Z₁,…,Zn))) de l'espérance du maximum de n variables aléatoires gaussiennes indépendantes dont j'avais dit un mot il y a longtemps.

Mais on peut aussi s'interroger sur la stratégie à suivre si on reçoit toujours des variables aléatoires gaussiennes indépendantes (Zn) mais cette fois on n'a pas la connaissance de la valeur de celles-ci, uniquement de leur ordre total (c'est plus proche du problème classique, et il y a une variante assez proche évoquée sur Wikipédia avec des variables uniformes plutôt que gaussiennes) ; ou encore, si on a connaissance des (Zn) modulo affinités (c'est-à-dire des (ZnZ₁)/(Z₂−Z₁)), ce qui doit revenir (plus ou moins ?) au même que d'ignorer la moyenne et l'écart-type.

Au rayon des amusements, j'avais essayé de distraire mes pensées de la pandémie en programmant une petite animation en JavaScript de points se déplaçant sur une sphère en se repoussant selon une interaction de Coulomb (force en 1/r² dans l'espace euclidien ambiant) : ça donne ceci (source ici — j'en profite au passage pour tester l'utilisation de rawgit.org pour servir un fichier HTML). Sur cette variante il n'y a pas de dissipation de l'énergie, il est facile d'en ajouter, les points finissent alors généralement (toujours ?) par se stabiliser sur les sommets d'un icosaèdre, cf. le problème de Thomson.

Outre que c'est joli à regarder, ça m'a fait prendre conscience d'un fait pourtant simple de mécanique classique auquel je n'avais pas fait attention : la notion de centre de gravité, et surtout, le fait que (quand le système considéré ne subit aucune force extérieure) celui-ci suive la trajectoire d'un point en mouvement uniforme, ou en fait surtout, l'idée qu'on peut effectuer un changement de référentiel en mouvement uniforme sur un système physique, tout ça est spécifique à l'espace euclidien et ne fonctionne plus même sur un espace à courbure uniforme et isotrope. Il est facile mais éclairant de donner des exemples sur la sphère. Pour la notion de centre de gravité, considérons simplement deux points, de même masse, et sans aucune force s'exerçant ni sur l'un ni sur l'autre, l'un au repos (appelons-le A), l'autre (B) en mouvement uniforme sur le grand cercle polaire du point où se trouve le premier point A : autrement dit, B va en ligne droite (suit un grand cercle) à vitesse constante, et A est au repos à distance π/2 de ce grand cercle (= sur son point polaire) ; mais alors le centre de gravité, même si on ne sait pas exactement comment le définir, sera certainement au milieu du segment [AB], or ce milieu parcourt (à vitesse uniforme) un cercle de rayon π/4, ce qui n'est certainement pas une géodésique. Pour la possibilité (ou plutôt, justement, l'impossibilité) de faire un changement de référentiel uniforme, il suffit de se rappeler que sur la sphère, une translation uniforme ou une rotation uniforme, c'est la même chose, et si on considère deux points au repos (de nouveau sans force s'exerçant sur eux) à une distance strictement comprise entre 0 et π, une rotation=translation uniforme les transforme en deux points orbitant l'un autour de l'autre alors qu'ils n'exercent aucune force l'un sur l'autre, ce qui n'est pas physiquement possible.

Bref, sur la sphère ou le plan hyperbolique, contrairement à l'espace euclidien, il y a un référentiel privilégié. Ceci est possiblement pertinent pour l'univers dans lequel nous vivons et qui, s'il n'est pas précisément plat au niveau cosmologique (en l'état actuel des connaissances ce n'est pas bien clair, il faut l'avouer), a un référentiel privilégié à cause de la courbure ; mais bon, j'ai déjà dit ça : en fait, il y a déjà un référentiel privilégié à cause, disons, du rayonnement cosmologique fossile ; ce dont je ne m'étais pas bien rendu compte, c'est que la courbure elle-même en impose un.

Une référence sur ce sujet, mais je l'ai trouvée franchement décevante (beaucoup de calculs pour peu d'intuition à en tirer) : A. V. Shchepetilov, Calculus and Mechanics on Two-Point Homogeneous Riemannian Spaces.

Un petit mot maintenant sur la surface de Bring (qui est un quotient du plan hyperbolique, compatible avec mon pavage préféré par des carrés d'angle 2π/5 à chaque sommet ; on peut la qualifier de courbe ou de surface, parce que c'est une courbe algébrique complexe donc une surface de Riemann, mais ici je veux plutôt la voir comme une courbe). J'avais déjà parlé d'elle sur ce blog, c'est une surface très jolie (au moins aussi intéressante à mes yeux que la probablement plus célèbre quartique de Klein ou la surface de Bolza), et j'aime bien aussi le fait qu'elle puisse se voir en tant que courbe algébrique comme l'intersection d'une quadrique avec la surface de Clebsch, bon, peu importe. Aussi pour chercher des choses jolies à illustrer, j'ai fait cette animation (source ici) cherchant à illustrer la surface en question (il s'agit simplement de douze cercles de couleur qui se déplacent à vitesse constante et en ligne droite sur la surface de Bring). Du coup je suis retombé sur différents articles que j'avais archivés à son sujet en me disant que je devais les lire (et je ne les ai toujours pas vraiment lus, en fait) : notamment : W. L. Edge, Bring's Curve (1978) ; Gonzalo Riera & Rubí E. Rodríguez, The Period Matrix of Bring's Curve (1992) ; et Mattthias Weber, Kepler's Small Stellated Dodecahedron as a Riemann Surface (2005).

Et là-dessus je suis tombé sur cette question sur MathOverflow qui prétend que la surface de Bring s'envoie sur (ou s'identifie avec ? ce n'est pas clair) l'espace des formes possibles de pentagones équilatères dans le plan euclidien. J'aimerais bien comprendre comment et pourquoi, parce que ça semble très joli, et je n'ai jamais entendu ça, mais comme la phrase n'est pas très claire (je ne sais pas exactement de quel espace des formes il est question, c'est-à-dire modulo quoi au juste) et que je n'arrive pas à deviner comment les points remarquables de la surface de Bring (les sommets, milieux des arêtes et centres des faces, du pavage par des carrés d'angle 2π/5 que j'ai évoqué), je reste ignorant.

Un peu de géométrie classique pour finir. Donnés huit points dans le plan, en position suffisamment générale, la famille des courbes cubiques passant par ces huit points passe aussi par un unique neuvième point, et de plus, ce neuvième point peut être construit par une construction à la règle seule à partir des huit premiers. (En gros, la première affirmation résulte d'un comptage de dimensions : les courbes cubiques planes ont 9 paramètres parce qu'un polynôme homogène de degré 3 en 3 variables a 10 coefficients, la condition de passer par chaque point imposer fait tomber de 1 la dimension, si bien qu'il reste une famille à 1 paramètre, or deux cubiques se coupent en 9 points, donc notamment deux de la famille, et alors toute la famille passe par ce neuvième point puisqu'elle est combinaison des deux cubiques choisies ; quant à la deuxième affirmation, elle vient de ce que le neuvième point en question est fonction rationnelle des huit premiers puisque l'argument qu'on vient de donner fonctionne pour des points à coordonnées indéterminées sur un corps de fractions rationnelles.) Tout ça est bien classique. Les méthodes pour construire effectivement ce neuvième point à la règle seule se trouvent, cependant, uniquement dans des textes bien poussiéreux comme un article d'Arthur Cayley, On the construction of the ninth point of intersection of the cubics which pass through eight given points (1862), ou de A. S. Hart, Construction by the Ruler alone to determine the ninth Point of Intersection of two Curves of the third Degree (1851) ; une version plus moderne de cette histoire, et très bien expliquée (mais qui n'explicite pas une construction) se trouve dans l'article de Ren, Richter-Gebert et Sturmfels, Cayley-Bacharach Formulas.

Ce que je viens de dire est très bien connu. Un petit peu moins connu est le fait analogue suivant : donnés sept points dans l'espace, en position suffisamment générale, la famille des quadriques passant par ces sept points passe aussi par un unique huitième point, et de plus, ce huitième point peut être construit par une construction à la règle seule à partir des sept premiers (où à la règle seule, dans l'espace, signifie qu'on peut tracer et intersecter des plans et des droites comme on l'imagine ; l'argument est le même que ci-dessus, mutatis mutandis). Cette construction étant sans doute plus simple, il serait intéressant de l'expliciter à la manière des articles poussiéreux que je viens de citer.

Bon, je ne sais plus très bien pourquoi je parlais de ça, mais cette entrée étant déjà assez longue, je vais l'arrêter là.

Ajout : Allez, pour faire une bonne douzaine, j'ajoute encore un sujet rapide : je suis tombé sur ce tweet qui demande à quoi ressemble le spectre de l'anneau des fonctions polynomiales ℤ→ℤ (c'est-à-dire des polynômes en une variable, automatiquement à coefficients rationnels, i.e., éléments de ℚ[t], qui sont entiers sur les entiers) ; ça semble être un problème rigolo de visualiser ça et de le comparer à Spec(ℤ[t]) : il semble y avoir des réponses dans l'article de Paul-Jean Cahen & Jean-Luc Chabert, What You Should Know About Integer-Valued Polynomials (2016).

↑Entry #2656 [older| permalink|newer] / ↑Entrée #2656 [précédente| permalien|suivante] ↑

[Index of all entries / Index de toutes les entréesLatest entries / Dernières entréesXML (RSS 1.0) • Recent comments / Commentaires récents]