David Madore's WebLog: Introduction aux mathématiques constructives : 4. suites de réels et principes analytiques d'omniscience

[Index of all entries / Index de toutes les entréesLatest entries / Dernières entréesXML (RSS 1.0) • Recent comments / Commentaires récents]

↓Entry #2841 [older| permalink|newer] / ↓Entrée #2841 [précédente| permalien|suivante] ↓

(vendredi)

Introduction aux mathématiques constructives : 4. suites de réels et principes analytiques d'omniscience

Je continue (et termine ?) ma série d'introduction aux mathématiques constructives en parlant maintenant de suites de réels et de principes analytique d'omniscience. Ce billet (partie 4) est la continuation directe de celui d'il y a trois jours, et contrairement à ceux d'avant qui étaient un peu indépendants, celui-ci fait directement suite à la partie 3 puisque, en fait, j'ai coupé un texte extrêmement long en deux. Néanmoins, j'ai quand même ajouté un bref récapitulatif au début avec les choses les plus importantes à retenir de la partie 3.

Table des matières (de toute la série)

Récapitulatif des points essentiels de l'épisode précédent

Pour la commodité du lecteur, je recopie ici les points qui me semblent les plus importants du billet précédent.

‣ Un nombre réel ou coupure de Dedekind est un couple (S,T) de parties de ℚ, vérifiant :

  1. S et T sont habités : ∃r∈ℚ.(rS) et ∃r∈ℚ.(rT) ;
  2. S est un ensemble inférieur et T est un ensemble supérieur : ∀r∈ℚ.∀r′∈ℚ.((r′<rrS) ⇒ r′∈S) et ∀r∈ℚ.∀r′∈ℚ.((r′>rrT) ⇒ r′∈T) ;
  3. S est ouvert vers le haut, et T est ouvert vers le bas : ∀r∈ℚ.(rS ⇒ ∃r′∈ℚ.(r′>rr′∈S)) et ∀r∈ℚ.(rT ⇒ ∃r′∈ℚ.(r′<rr′∈T)) ;
  4. tout élément de S est strictement plus petit que tout élément de T : soit ∀s∈ℚ.∀t∈ℚ.((sStT) ⇒ (s<t)) ;
  5. si un rationnel est strictement plus petit qu'un autre, alors soit le plus petit est dans S, soit le plus grand est dans T : soit ∀s∈ℚ.∀t∈ℚ.((s<t) ⇒ (sStT)).

‣ On définit deux relations binaires sur l'ensemble ℝ des nombres réels, appelées ‘≤’ (l'ordre large) et ‘<’ (l'ordre strict), de la façon suivante :

  • on pose (S,T) ≤ (S′,T′) (ou, de façon synonyme, (S′,T′) ≥ (S,T)) lorsque SS′, ou, ce qui revient au même, TT′ ;
  • on pose (S,T) < (S′,T′) (ou, de façon synonyme, (S′,T′) > (S,T)) lorsqu'il existe d>0 rationnel tel que S+dS′, ou, ce qui revient au même, lorsque TS′ est habité.

Ces relations généralisent celles du même nom sur ℚ. La relation stricte ‘<’ implique la relation large ‘≤’. Les deux relations ‘<’ et ‘≤’ sont transitives ; ‘<’ est irréflexive et strictement antisymétrique, tandis que ‘≤’ est réflexive et antisymétrique au sens large ; on a aussi la transitivité mixte (si x<yz, ou si xy<z, alors on a x<z). Par ailleurs, si x = (x, x) où x := {s∈ℚ : s<x} et x := {t∈ℚ : t>x}.

‣ L'ensemble ℚ est dense et cofinal dans ℝ, c'est-à-dire que si x<x′ sont des réels, il r rationnel tel que x<r<x′, et si si x est un réel, il existe r et r′ rationnels tels que r<x<r′.

‣ L'ordre large est la négation de l'ordre strict de sens contraire, c'est-à-dire que xy équivaut à ¬(x>y). Notamment, x=y équivaut à ¬(xy) où ‘⋕’, défini par xy :⇔ (x<yx>y), s'appelle le discernement standard sur ℝ.

On ne peut pas affirmer que pour tous réels x,y on ait xy ou bien xy. Néanmoins, on a la propriété essentielle suivante :

(❀) : Si x<x′ et y sont des réels, on a soit x<y soit y<x′.

‣ On note xy pour ¬(xy) ou, ce qui est équivalent, xy ∧ ¬(x=y) (cette relation xy est impliquée par x<y, mais on ne peut pas affirmer que ce soit équivalent).

‣ Deux réels x,y ont toujours une borne supérieure xy caractérisée par le fait que xyz si et seulement si xz et yz. Elle vérifie de plus les propriétés que ① xy < z si et seulement si x<z et y<z, et ② z < xy si et seulement si z<x ou bien z<y. (En revanche, on ne peut pas affirmer qu'on ait zxy si et seulement si zx ou bien zy.) Les propriétés duales valent pour la borne inférieure xy.

‣ On définit une addition sur les réels qui prolonge celle de ℚ et fait d'eux un ℚ-espace vectoriel, avec de plus la compatibilité à l'ordre : on a xy si et seulement si yx ≥ 0 et x<y si et seulement si yx > 0 ; si x≥0 et y≥0 alors x+y ≥ 0 ; si x>0 et y>0 (ou même seulement x>0 et y≥0) alors x+y > 0 ; si x>0 alors r·x > 0 pour tout r>0 rationnel, et −x < 0.

‣ On définit aussi une multiplication sur les réels qui prolonge celle de ℚ et fait d'eux une ℚ-algèbre commutative, avec de plus la compatibilité à l'ordre : si x≥0 et y≥0 alors x·y ≥ 0 ; si x>0 et y>0 alors x+y > 0.

‣ La valeur absolue d'un réel se définit par |z| := z⊔(−z). Ainsi, on a toujours |z|≥0. On a |xy| = (xy) − (xy). On a l'inégalité triangulaire habituelle |x+y| ≤ |x| + |y|. On a de plus : |x·y| = |x|·|y|.

La propriété |z|>0 équivaut à z>0 ∨ z<0 (ce qu'on a par ailleurs noté z⋕0). Cela équivaut aussi à l'inversibilité de z pour la multiplication.

Infima et suprema sur les réels

☞ Quelques difficultés

Classiquement, toute partie A⊆ℝ non vide et minorée admet une borne inférieure (une borne inférieure de A est un plus grand minorant, s'il existe, autrement dit, z est une borne inférieure de A signifie d'une part que z minore A, i.e. ∀tA.(zt), et d'autre part que si x minore A alors xz, i.e. ∀x∈ℝ.((∀tA.(xt)) ⇒ xz)). On a vu que, constructivement, toute partie finiment énumérée et habitée {z1,…,zk} (avec k≥1) de ℝ admet une borne inférieure z1⊓⋯⊓zk et une borne supérieure z1⊔⋯⊔zk. Néanmoins, constructivement, on ne peut pas affirmer que toute partie non vide et minorée, ni même toute partie habitée et minorée, possède une borne inférieure. Un contre-exemple brouwérien est vite trouvé :

Contre-exemple brouwérien : Si toute partie habitée et minoré de ℝ possède une borne inférieure, alors pour tout p∈Ω on a ¬p ∨ ¬¬p (la loi faible du tiers exclu).

(Notamment, on ne peut pas affirmer que toute partie habitée et minoré de ℝ possède une borne inférieure, puisqu'on ne peut pas affirmer la loi faible du tiers exclu, cf. ci-dessous)

Démonstration : Si p est une valeur de vérité, considérons la partie A := {0 : p} ∪ {1} de ℝ, c'est-à-dire {t∈ℝ : (t=0 ∧ p) ∨ (t=1)}. Supposons que A ait une borne inférieure z. D'après la proposition (❀) on doit avoir soit z>0 soit z<1. Dans le premier cas (z>0), comme z est un minorant de A, on a ¬(0∈A), c'est-à-dire qu'on a ¬p. Dans le second cas (z<1), 1 n'est pas un minorant de A, donc ¬p est impossible (car ¬p implique que A={1}) : c'est donc que ¬¬p. Bref, on a montré ¬p ∨ ¬¬p. ∎

La loi faible du tiers exclu n'est pas la même chose que la loi du tiers exclu (elle ne l'implique pas), mais c'est néanmoins, comme les différents principes d'omniscience évoqués plus hauts, un « tabou » constructif, et il est donc standard de s'en servir pour des contre-exemples brouwériens.

On remarquera que la démonstration ci-dessus montre même que si toute partie habitée de ℕ possède une borne inférieure, la loi faible du tiers exclu vaut (et j'avais déjà fait remarquer qu'exactement le même contre-exemple montre que si toute partie habitée de ℕ possède un plus petit élément, la loi du tiers exclu vaut).

Pour ce qui est des réels étendus bornés (définis, je le rappelle, par les coupures de MacNeille, c'est-à-dire en affaiblissant (e) en (e⁻)), j'ai déjà expliqué dans la section les concernant que le principe de la borne inférieure vaut pour eux, et d'ailleurs on peut même les définir comme le complété des rationnels — ou, du coup, des réels de Dedekind — pour la propriété de la borne inférieure. Le contre-exemple brouwérien donné ci-dessus montre du coup que l'égalité des coupures de MacNeille et de Dedekind implique la loi faible du tiers exclu, et je l'ai déjà commenté.

Cet exemple montre essentiellement qu'on doit décider de sacrifier soit la propriété de la borne inférieure soit la propriété (❀) (sauf à avoir la loi faible du tiers exclu, ce qui est un tabou) : les coupures de Dedekind font le choix de sacrifier la première (tandis que les coupures de MacNeille font le choix de sacrifier la seconde, mais elles sont beaucoup moins utiles). Maintenant, il est quand même bien pratique de pouvoir prendre des bornes inférieures : je vais chercher à donner une propriété d'une partie A⊆ℝ qui assure son existence.

☞ Borne inférieure (faible) versus infimum (fort)

Mais tout d'abord, il faut revoir la définition, et introduire une distinction :

  • Si A⊆ℝ, on dit que z est la borne inférieure ou inf faible de A lorsque z est le plus grand minorant de A, c'est-à-dire [je recopie la définition ci-dessus] que z minore A, i.e. ∀tA.(zt), et d'autre part que si x minore A alors xz, i.e. ∀x∈ℝ.((∀tA.(xt)) ⇒ xz).

  • Si A⊆ℝ, on dit que z est l'infimum ou inf (fort) de A lorsque z minore A, i.e. ∀tA.(zt), et d'autre part que si x>z alors il existe un élément de A entre les deux, i.e. ∀x∈ℝ.(z<x ⇒ ∃tA.(t<x)).

On fait évidemment les définitions duales de borne supérieure (ou sup faible) et de supremum (ou sup (fort)) en inversant toutes les inégalités.

La terminologie est de moi. En anglais on utilise généralement (mais pas systématiquement) greatest lower bound pour la première notion, et infimum pour la seconde. J'ai essayé de dire quelque chose de cohérent et pas trop idiot.

Classiquement, ces notions sont équivalentes, puisque la première condition (minorer A) est la même, et que la seconde est juste écrite sous forme contraposée.

Constructivement, la borne inférieure, si elle existe, est forcément unique (c'est évident), et d'autre part, l'inf, s'il existe, est la borne inférieure (car la condition (∀tA.(xt)) ⇒ xz est exactement (¬∃tA.(t<x)) ⇒ ¬(z<x), qui est logiquement impliquée par z<x ⇒ ∃tA.(t<x)). Mais on ne peut pas affirmer que la borne inférieure, même si elle existe, est forcément l'inf, à cause de la proposition suivante :

Proposition : Si toute partie de ℝ possédant une borne inférieure possède un infimum (fort !), alors la loi du tiers exclu vaut.

Démonstration : Si p est une valeur de vérité, considérons la partie A := {0 : p∨¬p} ∪ {1} de ℝ, c'est-à-dire {t∈ℝ : (t=0 ∧ (p∨¬p)) ∨ (t=1)}.

Montrons que la borne inférieure (inf faible !) de A existe et vaut 0. Il est évident que 0 minore A. Maintenant, supposons que x minore A ; mais x>0 est alors impossible : car cela impliquerait ¬(0∈A), c'est-à-dire ¬(p∨¬p), qui est faux ; on a ainsi prouvé ¬(x>0), c'est-à-dire x≤0. Ceci montre bien que 0 est le plus grand minorant de A, c'est-à-dire sa borne inférieure.

Supposons maintenant que A ait un infimum, qui d'après ce qui a été dit, est forcément égal à 0. On aurait donc : ∀x∈ℝ.(0<x ⇒ ∃tA.(t<x)). Appliquant ce fait à x=½ et en utilisant le fait que tout élément <½ de A est égal à 0, on aurait 0∈A, c'est-à-dire p∨¬p. ∎

Bref, la notion d'inf (fort) est effectivement constructivement plus forte que celle de borne inférieure, et elle sera généralement plus utile, au moins dans les réels. (En gros, la notion de borne supérieure ou borne inférieure est la notion générale dans les structures ordonnées — par exemple c'est celle qui sert pour définir la structure de treillis — tandis que la notion de supremum on d'infimum est pertinente pour des structures qui ont en plus une propriété de densité, comme les réels.)

Si A⊆ℝ a un minimum (c'est-à-dire un élément, forcément unique, qui minore A au sens large), alors ce minimum z est aussi l'infimum de A (puisque pour tout x>z on a l'élément z lui-même de A qui est <x). Bref, on a les implications minimum ⇒ infimum (fort) ⇒ borne inférieure (faible).

☞ Parties localisées inférieurement, et existence d'infima

Voici une propriété qui peut aider à prouver l'existence d'un infimum :

On dit qu'une partie A⊆ℝ est localisée inférieurement lorsque quand u<v sont deux réels, soit u minore A, soit il existe un élément dans A qui est <v. Autrement dit : ∀u∈ℝ.∀v∈ℝ.((u<v) ⇒ ((∀tA.(ut)) ∨ (∃tA.(t<v)))).

Classiquement, bien sûr, la propriété d'être localisée inférieurement évoquée dans cette proposition est tautologiquement vraie pour n'importe quelle partie. Constructivement, il faut y penser comme une capacité à placer l'infimum recherché dans un intervalle [u,v[ arbitrairement petit. Si vous voulez un exemple simple de partie dont on ne puisse pas affirmer constructivement qu'elle soit localisée inférieurement, l'exemple de {0 : p} ∪ {1}, où p est une valeur de vérité, est assez parlant (même classiquement, quel est l'inf de l'ensemble formé des réels qui valent soit 1, soit 0 à condition que l'hypothèse de Riemann soit vraie ? classiquement cet inf a un sens, mais on ne sait même pas l'approximer numériquement). Cet exemple est habité et borné, mais bien sûr si on veut un exemple encore plus simple d'un ensemble dont on ne puisse pas affirmer qu'il soit localisé inférieurement, on pourra prendre {x∈ℝ : p} où p est une valeur de vérité indépendante de x (s'il est localisé inférieurement, alors p∨¬p).

Proposition : Supposons A⊆ℝ habitée, minorée, et localisée inférieurement. Alors A admet un infimum (fort !).

Démonstration : On définit S := {r∈ℚ : ∃z>r.∀tA.(zt)} l'ensemble des rationnels strictement plus petits qu'un minorant de A, et d'autre part T := {r∈ℚ : ∃xA.(x<r)} l'ensemble des rationnels strictement supérieurs à un élément de A.

Vérifions que (S,T) est une coupure de Dedekind. Re (a) : l'hypothèse que A est habité assure que T est habité, et l'hypothèse que A est minoré assure que S est habité. Re (b) : il est évident qu'un rationnel plus petit qu'un élément de S est encore dans S et qu'un rationnel plus grand qu'un élément de T est encore dans T. Re (c) : il est aussi facile de voir que si rS on peut trouver r′>r encore dans S (utiliser la densité de ℚ pour trouver r′ strictement entre r et le minorant z>r de A dont on affirme l'existence), et de même que si rT on peut trouver r′<r encore dans T (utiliser la densité de ℚ pour trouver r′ strictement entre r et l'élément x<r de A dont on affirme l'existence). Re (d) : si sS et tT, il existe z>s qui minore A et x<t qui est dans A, donc s<zx<t et notamment s<t.

Enfin, re (e) : si s<v sont deux rationnels, en appelant u := (s+v)/2 leur milieu, si bien que s<u<v, la propriété de localisation inférieure supposée sur A assure que soit u minore A, auquel cas sS, soit A a un élément <v, ce qui signifie vT.

Tout ça mis ensemble signifie exactement que (S,T) est une coupure de Dedekind, c'est-à-dire définit un réel a.

Si xA, alors tout rationnel r>x est dans T par définition de celui-ci, c'est-à-dire que la coupure supérieure définissant x est incluse dans la coupure supérieure (T) définissant a, ce qui est exactement la définition de ax. Ceci montre que a minore A.

Enfin, si x>a, par densité des rationnels il existe r∈ℚ tel que a<r<x, donc rT, ce qui assure l'existence d'un yA qui soit <r et en particulier <x. Ceci montre bien que a est l'infimum de A. ∎

Cette proposition était facile parce qu'on a, en gros, mis dans la notion de partie localisée inférieurement exactement ce qu'il fallait pour obtenir la conclusion (c'est-à-dire surtout le propriété (e) des coupures de Dedekind — en fait, de la coupure de MacNeille qu'on obtient automatiquement).

Si on y repense, la proposition (❀) vue plus haut signifie exactement que tout singleton {z} est localisé inférieurement (puisqu'elle nous dit que si u<v alors soit u<z soit z<v, ces deux dernières inégalités étant indifféremment strictes ou larges). Bien sûr, l'infimum de {z} est simplement z.

☞ Les parties habitées finiment énumérées ont un infimum

J'ai déjà dit plus haut que toute partie {z1,…,zk} (avec k≥1) de ℝ (c'est-à-dire finiment énumérée et habitée) admet une borne inférieure z1⊓⋯⊓zk. En fait, cette borne inférieure est même un infimum (fort) : ceci résulte de la proposition précédente et de celle qui suit :

Proposition : Si A,B sont deux parties localisée inférieurement, alors AB est localisée inférieurement. Par conséquence, quel que soit l'entier k≥0 et les réels z1,…,zk, la partie {z1,…,zk} est localisée inférieurement.

Démonstration : Montrons la première affirmation. Supposons donc A,B localisées inférieurement. On veut montrer que AB est localisée inférieurement. Pour cela, soient u<v. Comme A est localisée inférieurement, soit u minore A, soit A a un élément <v. De même, soit u minore B, soit B a un élément <v. Si u minore à la fois A et B, alors il minore AB ; et dans chacun des trois autres cas, AB a un élément <v : donc on a bien prouvé que AB est localisé inférieurement.

Comme on a déjà expliqué que les singletons sont localisés inférieurement par la propriété (❀), ceci montre que si A est localisée inférieurement et que z∈ℝ, alors A∪{z} est localisée inférieurement.

Comme il est trivial que ∅ est localisé inférieurement (tout réel en est un minorant), une récurrence immédiate sur k montre que toute partie finiment énumérée {z1,…,zk} est localisée inférieurement. ∎

Il va de soi que tout ce que j'ai dit se dualise sans problème : on dira qu'une partie A⊆ℝ est localisée supérieurement lorsque quand u<v sont deux réels, soit v minore A, soit il existe un élément dans A qui est >u ; autrement dit : ∀u∈ℝ.∀v∈ℝ.((u<v) ⇒ ((∀tA.(tv)) ∨ (∃tA.(u<t)))). Et on a alors les faits analogues de ce que j'ai dit sur l'infimum, notamment : toute partie de ℝ habitée, majorée et localisée supérieurement admet un supremum (fort) ; et les parties finiment énumérées de ℝ sont localisées supérieurement, donc les parties finiment énumérées et habitées de ℝ admettent un supremum (fort).

Il existe toutes sortes de variations autour de la notion de partie localisée. La suivante, assez naturelle, doit convenir pour assurer l'existence d'infima et de suprema (combinée, bien sûr, au fait d'être habitée et bornée) : ∀δ>0.∃η>0.∀x∈ℝ.((∃yA.(|xy|<δ)) ∨ ¬(∃yA.(|xy|<η))). En revanche, on ne peut pas affirmer que la variation suivante, même pour une partie habitée de [0,1], suffise à garantir l'existence d'un infimum : ∀x∈ℝ.∀δ>0.((∃yA.(|xy|<δ)) ∨ (∃η>0.¬∃yA.(|xy|<η))). Voir ici pour plus de détails et des références à ce sujet.

Suites de nombres réels

Suites convergentes et suites de Cauchy

☞ Convergence et convergence modulée

Une suite de réels est, bien sûr, une fonction ℕ→ℝ (et on note généralement quelque chose comme xi l'image de n par la fonction) : rien de nouveau ici.

On dit qu'une suite (xi) de réels tend ou converge (ou, pour insister, converge simplement) vers x, ou qu'elle a x comme limite, lorsque, comme en maths classiques : ∀ε>0.∃n∈ℕ.∀in.(|xix|<ε). Bien sûr, grâce à la densité de ℚ dans ℝ, il ne change rien ici d'imposer à ε d'être rationnel, ou même d'être de la forme, disons, 2m (puisque tout rationnel strictement positif majore un rationnel de cette forme) ; on peut aussi remplacer la dernière inégalité stricte par une inégalité large sans rien changer.

On dira qu'une suite (xi) converge de façon modulée vers x (ou qu'elle tend de façon modulée, ou modulément si on me pardonne ce néologisme ; ou encore, que la convergence est modulée) lorsque ∃ν:ℕ→ℕ.∀m∈ℕ.∀iν(m).(|xix|<2m). D'après ce qui a été dit sur le fait de pouvoir prendre ε de la forme 2m, la convergence modulée implique la convergence au sens du paragraphe précédent (convergence non supposée modulée s'il y a besoin de souligner).

Classiquement ou bien en présence de l'axiome du choix dénombrable, toute convergence est automatiquement modulée : en effet, en présence de l'axiome du choix dénombrable, on peut, pour chaque m, choisir un n tel que ∀in.(|xix|<2m), et définir ν(m) comme le n choisi ; en fait, l'axiome du choix dénombrable pour les parties habitées de ℕ suffit, et en maths classiques cette forme de choix est démontrable car on peut prendre le plus petit élément. Mais dans les maths constructives sans choix, on ne peut pas affirmer que toute suite de réels qui tend vers zéro (disons) tende vers zéro de façon modulée.

Digression : Si on a une idée de ce que sont les topos de faisceaux, ou même si on veut simplement se faire une intuition de la différence entre la convergence et la convergence modulée, une suite de réels (ui) est représentée (de façon externe dans un topos de faisceaux) par une suite de fonctions continues, disons X→ℝ pour simplifier. Le fait que (ui) converge vers u se traduit de façon externe par : pour tout ε>0 il existe un recouvrement ouvert (Vj)jJ de X tel que pour tout jJ il existe n∈ℕ tel que si ξVj et in on ait |ui(ξ) − u(ξ)| ≤ ε. En revanche, le fait que (ui) converge modulément vers u se traduit de façon externe par : il existe un recouvrement ouvert (Vj)jJ de X tel que pour tout ε>0 et pour tout jJ il existe n∈ℕ tel que si ξVj et in on ait |ui(ξ) − u(ξ)| ≤ ε (donc en permutant le quantificateur universel sur le ε>0 et le quantificateur existentiel sur le recouvrement ouvert). Ces deux notions de convergence, que je suis tenté de qualifier respectivement de convergence locale et de convergence localement uniforme, sont strictement intermédiaires entre la convergence ponctuelle (ou convergence simple) et la convergence uniforme : je renvoie à cette question MathOverflow pour une discussion un peu plus longue et des contre-exemples à toutes les implications : notamment, la réponse que j'ai reçue, réinterprétée de façon interne, montre que la convergence n'entraîne pas en général la convergence modulée.

☞ On ne peut pas affirmer qu'une suite croissante majorée ait une limite

Mais je ne veux pas trop insister ici sur la convergence modulée : je l'ai mentionnée juste parce que c'est un point qui peut être source de confusion (certains auteurs appellent convergence ce que j'appelle convergence modulée). Le problème suivant est plus sérieux et ne repose pas sur des questions de choix :

Classiquement, une suite de réels qui est décroissante et minorée, ou bien croissante et majorée, admet une limite. Constructivement, on ne peut pas l'affirmer. En effet :

Contre-exemple brouwérien : Soit (ui) une suite binaire (c'est-à-dire à valeurs dans {0,1}) croissante. Si elle a une limite b, alors : soit b=0 et la suite vaut constamment 0, soit b=1 et la suite prend la valeur 1 (et bien sûr elle est alors constamment égale à 1).

En particulier, si toute suite de réels croissante et majorée a une limite, alors le principe limité d'omniscience LPO vaut (je rappelle que LPO affirme que toute suite binaire est soit nulle soit a un terme égal à 1).

Démonstration : On a ¼<¾, donc par (❀), soit b<¾ soit b>¼. Si b<¾, (en prenant ε=¼ dans la définition de la convergence) on voit qu'il existe n tel que pour in on ait ui<1, c'est-à-dire ui=0 puisqu'on a affaire à une suite binaire ; et comme elle est croissante, elle vaut en fait constamment 0. De même b>¼, (en prenant ε=¼ dans la définition de la convergence) on voit qu'il existe n tel que pour in on ait ui>0, c'est-à-dire ui=1 puisqu'on a affaire à une suite binaire. ∎

☞ Le critère de Cauchy

On dit qu'une suite (xi) de réels est (simplement) de Cauchy lorsque, comme en maths classiques : ∀ε>0.∃n∈ℕ.∀i,jn.(|xixj|<ε). C'est évidemment le cas des suites convergentes. Comme précédemment, grâce à la densité de ℚ dans ℝ, il ne change rien ici d'imposer à ε d'être rationnel, ou même d'être de la forme, disons, 2m ; on peut aussi remplacer la dernière inégalité stricte par une inégalité large sans rien changer. On dira que (xi) est modulément de Cauchy ou que sa cauchyïtude est modulée (désolé pour tous les néologismes) lorsque ∃ν:ℕ→ℕ.∀m∈ℕ.∀i,jν(m).(|xixj|<2m) : là aussi, les suites modulément de Cauchy sont de Cauchy, et les suites modulément convergentes sont modulément de Cauchy.

Les suites de Cauchy sont-elles convergentes ? Oui ! On va le prouver en commençant par le :

Lemme : L'image d'une suite de Cauchy (i.e., l'ensemble de ses valeurs) est une partie localisée inférieurement (et, bien sûr, supérieurement).

Démonstration : Considérons u<v deux réels, d'écart ε := vu et de moyenne z := ½(u+v). La propriété de Cauchy permet de trouver un rang n à partir duquel deux termes xi,xj quelconques de la suite sont à distance <¼·ε. Posons B := {xi : in}.

Comme z − ¼·ε < z + ¼·ε, par (❀), on a soit xn > z − ¼·ε soit xn < z + ¼·ε. Dans le premier cas, on en déduit xi > z − ½·ε = u pour tout in, c'est-à-dire que u minore B ; dans le second cas, l'élément xi de B est <v. On vient donc de prouver que soit u minore B soit B a un élément <v.

Comme par ailleurs A := {x0,…,xn−1} est localisé inférieurement (on l'a vu plus haut), soit u minore A soit il existe un élément de A qui est <v. En mettant ces faits ensemble, sur AB on voit (comme on l'a fait pour montrer que la réunion de deux ensembles localisé inférieurement est localisée inférieurement) que soit u minore AB soit il existe un élément de AB qui est <v. Or AB est l'ensemble {xi : i∈ℕ} des termes de la suite. ∎

Théorème : Dans les réels de Dedekind, toute suite de Cauchy admet une limite.

Démonstration : Si (xi) est une suite de Cauchy, l'ensemble {xi} de ses valeurs est habité (trivialement), minoré (par la propriété de Cauchy) et localisée inférieurement (d'après le lemme). Comme on a vu qu'une partie habitée, minorée et localisée inférieurement a un infimum, inf {xi} a bien un sens, et plus généralement inf {xi : in} en a un quel que soit n (retirer des termes au début d'une suite de Cauchy donne évidemment encore une suite de Cauchy). Symétriquement, sup {xi : in} existe. Les inf {xi : in} forment une suite croissante en n, et les sup {xi : in} une suite décroissante. Ces suites sont elles-mêmes de Cauchy (car si |xixj|≤ε pour i,jm, alors |(inf {xi : in}) − xm| ≤ ε pour tout nm, donc |(inf {xi : ip}) − (inf {xi : iq})| ≤ 2·ε pour tous p,qm). On peut donc prendre le sup de la première et l'inf de la seconde. On peut donc poser liminfi (xi) := supn infin xi, et symétriquement limsupi (xi) := infn supin xi. Mais la propriété de Cauchy permet facilement de voir qu'elles sont égales (leur écart est ≤ε pour tout ε>0).

Si z est cette valeur commune, et si ε>0, alors comme zε < liminfi (xi) = supn infin xi, par définition du supremum, il existe n tel que infin xi > zε, ce qui (comme l'infimum est un minorant) assure xi > zε pour tout in. Symétriquement, on peut trouver un (autre) n tel que xi < z+ε pour tout in ; et en prenant le plus grand de ces deux n, on a trouvé un n tel que |xiz|<ε pour tout in. ∎

On peut aussi se convaincre, par le caractère explicite du dernier paragraphe de cette démonstration, que toute suite modulément de Cauchy converge modulément. (C'est d'ailleurs également facile à déduire du théorème qui précède sans aller fouiller dans sa démonstration.)

Donc en fait convergent équivaut à de Cauchy, et l'équivalence analogue vaut pour les propriétés modulées.

☞ Un mot sur les séries

On peut bien sûr développer une théorie des séries de nombres réels en définissant simplement la série (Σxi) comme la suite de ses sommes partielles (∑i<n xi), comme d'habitude. On dit que la série est convergente, resp. modulément convergente, resp. de Cauchy, resp. modulément de Cauchy, lorsque la suite de ses sommes partielles a la même propriété. On dit que la série est absolument convergente lorsque la série des valeurs absolues est convergentes, et on peut faire la même définition sous forme modulée. Comme en maths classiques, l'inégalité triangulaire permet de montrer :

Corollaire : Dans les réels de Dedekind, toute série absolument convergente est convergente.

À titre d'exemple, si (bi) est une suite binaire, c'est-à-dire à valeurs dans {0,1}, on peut définir le nombre réel ∑i bi·2−(i+1) (compris entre 0 et 1) dit défini par ce développement binaire.

⚠ Attention : Je dois souligner qu'en maths constructives on ne peut pas l'affirmer qu'un réel (entre 0 et 1, disons), même si je le suppose de Cauchy ou de Cauchy modulé (ce terme sera défini ci-dessous), ou même si je suppose l'axiome du choix dénombrable, ait nécessairement un développement binaire, c'est-à-dire s'écrive sous la forme ∑i bi·2−(i+1) avec bi∈{0,1}. Ce n'est pas un problème de choix ici : c'est que l'existence d'un tel développement assure (en regardant la valeur de b0) qu'on a soit x≥½ soit x≤½, chose qu'on ne peut pas affirmer en général, on verra ci-dessous le lien avec LLPO analytique. (Cf. le problème à la fin de ce contrôle où je demandais en quelque sorte de prouver — évidemment sans le dire comme ça — que dans le topos effectif l'affirmation tous les réels entre 0 et 1 ont un développement binaire n'est pas valable, et que les réels ayant un développement binaire ne sont même pas stables par addition.) En revanche, tout réel de Cauchy modulé (entre −1 et 1, disons) peut au moins s'écrire ∑i bi·2−(i+1) avec bi∈{−1,0,1} : cf. cet article pour les explications.

[Optionnel] Et les réels de Cauchy ?

☡ Guide de lecture : Hic sunt leones ! On peut survoler ou sauter cette section, qui n'est là en gros que parce que des gens insistent pour parler de réels de Cauchy.

☞ Réels de Cauchy et réels de Cauchy modulés

On dit qu'un réel de Dedekind est (simplement) de Cauchy lorsqu'il est la limite d'une suite de rationnels. On dit qu'il est modulément de Cauchy (ou que c'est un réel de Cauchy modulé voire un réel modulé tout court) lorsqu'il est la limite modulée d'une suite de rationnels. Attention car la terminologie fluctue pas mal : beaucoup d'auteurs disent juste de Cauchy pour demander l'existence d'une suite modulément de Cauchy de rationnels ; d'autres appellent ça un nombre réel régulier.

Notons qu'on peut simplifier un peu la définition d'un réel de Cauchy modulé : quitte à remplacer le module ν(n) par max(ν(0),…,ν(n)) et ensuite ri par rν(i), on peut supposer que |rix| < 2i ; c'est-à-dire que x est un réel de Cauchy modulé lorsqu'il existe une suite (ri) de rationnels telle que ∀i∈ℕ.(|rix|<2i).

Classiquement ou bien en présence de l'axiome du choix dénombrable, ces distinctions sont sans objet : tous les réels sont modulément de Cauchy. En effet, en présence de l'axiome du choix dénombrable, si x est un réel, on peut choisir un rationnel rn tel que x − 2n < rn < x + 2n, et alors la suite rn est modulément de Cauchy et converge vers x ; et classiquement, on peut prendre le premier rationnel (pour une énumération explicite quelconque de ℚ) dans l'intervalle qu'on vient de dire.

Mais constructivement et sans choix… c'est un peu le chaos. Bien que ℚ soit dense dans ℝ, on ne peut pas affirmer que tout réel soit de Cauchy, et on ne peut pas affirmer que tout réel de Cauchy soit modulément de Cauchy.

Par ailleurs, on ne peut même pas affirmer que la limite d'une suite de Cauchy de réels de Cauchy soit un réel de Cauchy, et même en saupoudrant le mot modulé un peu partout ça ne marche toujours pas : le problème est double, d'une part se donner une suite de Cauchy de réels de Cauchy n'est pas la même chose que se donner une suite double (parce que chaque réel de Cauchy est limite d'une suite de Cauchy de rationnels, mais on n'a pas le moyen de les choisir), et même si on se donne la suite double, une suite de Cauchy de suites de Cauchy de rationnels ne permet pas forcément de fabriquer une suite de Cauchy de rationnels ; les explications sont dans ce papier, qu'on peut compléter par cette petite note de ma part (source LaTeX ici), dont j'extrais notamment (en l'adaptant un peu) l'énoncé positif un peu surprenant et subtil suivant (il partie du folklore) :

☞ Modulation automatique

Proposition : Si x est un réel modulément de Cauchy, et si (si) est une suite de rationnels qui tend (sans hypothèse de modulation !) vers x, alors en fait cette convergence est automatiquement modulée.

(Autrement dit, si un réel est limite d'une suite de rationnels modulément convergente, alors toute suite de rationnels qui converge vers lui le fait de façon modulée. Dit de façon encore différente : si deux suites de rationnels ont la même limite et que la convergence de l'une est modulée, alors la convergence de l'autre est aussi modulée.)

Démonstration : Par hypothèse, il existe une suite de rationnels (ri) qui converge modulément vers x ; et comme expliqué ci-dessus, on peut supposer que |rix| < 2i. On suppose que (si) est une suite de rationnels qui tend vers x et on veut montrer qu'elle le fait de façon modulée.

Soit n∈ℕ. Comme (si) tend vers x, il existe m, dont on peut certainement supposer mn+2, tel que im implique |six| < 2−(n+2) ; par ailleurs, pour im on a aussi |rix| < 2−(n+2) (puisque in+2), et ces deux inégalités ensemble impliquent |siri| < 2−(n+1). On vient de montrer : (†) pour tout n∈ℕ il existe mn+2 tel que im implique |siri| < 2−(n+1).

Maintenant, posons En := {m∈ℕ : mn+2 ∧ ∀im.(|siri| < 2−(n+1))}. On vient de montrer que (†) En est habité pour tout n. Par ailleurs, j'affirme que En est décidable (je rappelle que ça signifie que pour tout m∈ℕ on a mEn ou bien ¬(mEn)). En effet, une fois qu'on a un m₀∈En, tout mm₀ est trivialement encore dans En, et pour ce qui est des m<m₀, on procède par récurrence décroissante sur m : d'une part si ¬(mEn) alors certainement ¬((m−1)∈En), et d'autre part si mEn alors on a (m−1)∈En si et seulement si (m−1)≥n+2 et |sm−1rm−1| < 2−(n+1), et toutes ces conditions sont décidables (booléennes, si on veut : elle sont soit vraies soit fausses), parce que les inégalités entre entiers ou entre rationnels sont décidables. Bref, l'ensemble En est une partie habitée et décidable de ℕ.

Or on a vu au début du volet précédent que toute partie habitée et décidable de ℕ a un plus petit élément. On peut donc appeler μ(n) := min(En) son plus petit élément, c'est-à-dire le plus petit mn+2 tel que im implique |siri| < 2−(n+1).

Maintenant, si iμ(n), on a d'une part |siri| < 2−(n+1) et d'autre part |rix| < 2−(n+2). Ces deux inégalités ensemble impliquent |six| < 2n. La convergence de (si) vers x est donc bien modulée par la fonction μ qu'on a construite. ∎

En particulier, on peut garder à l'esprit qu'une suite de rationnels qui tend vers 0 tend vers zéro de façon automatiquement modulée.

Le point crucial dans la proposition ci-dessus était la décidabilité des inégalités entre rationnels. On ne peut certainement pas affirmer que si deux suites de réels ont la même limite et que la convergence de l'une est modulée, alors la convergence de l'autre est aussi modulée.

Bon, la notion de nombres réels de Cauchy est assez pourrie si la limite d'une suite de Cauchy de nombres réels de Cauchy n'est pas forcément de Cauchy. Dans mon esprit cela suggère qu'il faut laisser tomber cette notion, mais il est vrai qu'ils sont utiles du point de vue computationnel (noter cependant que dans le topos effectif, les réels de Cauchy et de Dedekind coïncident, donc on n'a pas trop à se poser la question).

Une notion potentiellement intéressante serait la clôture de Cauchy des rationnels : c'est la plus petite partie de l'ensemble ℝ des réels de Dedekind qui contienne les rationnels et qui soit stable par limites de suites de Cauchy (et on peut bien sûr aussi définir une version modulée de la même chose), c'est-à-dire l'intersection de toutes les parties de ℝ contenant ℚ et stables par limites de suites de Cauchy (ou, si on veut, l'« adhérence séquentielle » de ℚ). Mais je ne sais pas si on sait en dire grand-chose d'intéressant.

L'ensemble ℕ vu dans les réels

☞ Rappels sur ℕ

Je rappelle que dans le volet précédent de cette série de billets, j'avais introduit l'ensemble ℕ, qu'on peut notamment voir comme l'ensemble des suites binaires (bi) croissantes en leur indice, c'est-à-dire telles que ∀i∈ℕ.∀j∈ℕ.(ijbibj) ; et j'avais dit qu'on identifiait ℕ à une partie de ℕ en identifiant un entier n avec la suite binaire croissante (notée ι(n) s'il y a besoin de distinguer) dont les termes d'indice 0,…,n−1 valent 0 et dont les termes d'indice ≥n valent 1, et qu'on définissait aussi un élément ∞ de ℕ comme la suite constamment nulle (que je vais aussi noter 0, en espérant que ça ne cause pas trop de confusion). Classiquement, les ι(n) et ∞ sont les seuls éléments de ℕ, mais constructivement on ne peut pas l'affirmer (c'est exactement le principe limité d'omniscience LPO, plus exactement LPO séquentiel, je reviendrai là-dessus).

Cet ensemble ℕ a énormément d'importance en maths constructives, parce que, comme je l'ai dit au chapitre précédent, plein de phrases naturelles en mathématiques définissent un élément de ℕ (classiquement : soit un entier naturel soit ‘∞’ ; mais constructivement c'est naturellement dans ℕ qu'ils vivent), par exemple la première occurrence de 42 fois le chiffre ‘7’ consécutivement dans l'écriture décimale de π, le plus petit entier pair qui n'est pas la somme de deux nombres premiers, la plus petite longueur d'une contradiction dans ZFC ou (plus généralement) le temps d'exécution de la machine de Turing <machin>. Ce qui va m'intéresser présentement est d'expliquer le rapport entre ℕ et les nombres réels, et notamment comment on peut plonger ℕ dans les réels (de Dedekind, ou même de Cauchy modulés).

☞ Extension à ℕ d'une suite convergente

Supposons présentement que (xi) soit une suite de réels qui converge (i.e., qui soit de Cauchy), et que b soit un élément de ℕ vu comme une suite binaire croissante ; on définit alors une suite de réels bx de la façon suivante :

  • si bi=0 alors (bx)i = xi ;
  • si bi=1 alors (bx)i = xj, où j est le plus petit j tel que bj=1 (qui existe parce que {j∈ℕ : bj=1} est décidable et habité).

Concrètement, donc, la suite ((bx)i) reste égale à (xi) tant que bi vaut 0, et si bi passe à 1, alors ((bx)i) s'arrête à la valeur xj pour laquelle ça s'est produit.

Cette définition fait que ((ι(n)⊙x)i) tend vers xn (puisqu'elle est constante de valeur xn à partir du rang n), et que ((∞⊙x)i) est la suite (xi) elle-même, qui tend vers une limite qu'on peut avoir envie de noter x. Classiquement, ce sont les seuls cas possibles, donc ((bx)i) a toujours une limite. On peut donc être tenté de se demander si cette affirmation reste vraie constructivement. C'est bien le cas :

Proposition : Si (xi) est une suite de réels de Cauchy, et que b est un élément de ℕ ; on alors la suite de réels bx est encore de Cauchy. (De plus, si la cauchyïtude de x est modulée, celle de bx l'est aussi.)

Démonstration : Il suffit de montrer que si |xixj| < ε pour tous i,jn, alors |(bx)i − (bx)j| < ε aussi pour tous i,jn. Mettons sans perte de généralité que ij. On a soit bi=0 soit bi=1. Dans le premier cas, (bx)i = xi, et quant à (bx)j il est égal à un xk pour un certain i<kj, donc |(bx)i − (bx)j| = |xixk| < ε. Dans le second cas, on a (bx)i = (bx)j donc l'inégalité est triviale. Ceci montre la cauchyïtude de ((bx)i), et si on a un module de cauchyïtude de (xi) il vaut encore pour ((bx)i). ∎

Une variante de cette construction consiste à définir la suite bx qui vaut la même chose que bx quand bi=1 mais qui vaut la limite x de la suite x (plutôt que xi) tant que bi=0. Il n'est pas difficile de montrer que la différence entre les deux suites bx et bx tend vers 0, donc elles ont la même limite. L'inconvénient de la construction bx est qu'elle fait référence à la limite x de la suite x ; mais son avantage est qu'elle a la propriété supplémentaire que bi = bj implique (bx)i = (bx)j. Je tire ces définitions de cet article.

Pour (xi) une suite de nombres réels qui converge, et u∈ℕ (je change la notation parce que j'y pense maintenant plutôt comme un indice), on peut donc définir xu comme la limite de la suite ux dont je viens de montrer qu'elle était de Cauchy : d'après les remarques faites au-dessus, si u est dans ℕ (c'est-à-dire de la forme ι(n)), ceci redonne bien le xn qu'on attend ; et pour la valeur ∞, on trouve bien la limite x de la suite (xi). Mais ce qui est intéressant est qu'on a maintenant donné un sens à xu pour tout u∈ℕ, i.e., on a étendu n'importe quelle suite convergente ℕ→ℝ en une fonction ℕ→ℝ. (On pourrait montrer que c'est l'unique extension continue, à condition d'avoir donné un sens à continu, ce que je n'ai pas envie de faire ici.)

☞ La notation 2u pour u∈ℕ

En particulier, comme (2i) est une suite de nombres réels qui converge (vers 0), tout ce fourbi donne un sens à l'expression 2u pour u∈ℕ (je rappelle la construction : on considère la suite qui vaut 2i tant que ui=0 et qui si uj passe à 1 stationne à 2j pour le j pour lequel ça se produit, et on appelle 2u sa limite, qui existe parce que la suite est de Cauchy). Comme la suite (2i) est décroissante au sens large, cette limite est une borne inférieure (qui existe !), donc on peut décrire 2u comme la borne inférieure de 1 et des 2i pour les i tels que ui=0 (l'ensemble {1} ∪ {2i : ui=0} est habité, minoré par 0, et localisé inférieurement, donc il a bien un infimum).

L'avantage supplémentaire de la suite (2i) est qu'on peut faire un peu plus concret : 2u est aussi simplement le réel 0.uuu₂… dont l'écriture binaire est donnée par u, autrement dit ∑i ui·2−(i+1) (j'ai dit plus haut qu'on ne peut pas affirmer que tout réel ait une écriture binaire, mais ceux-ci en ont une par définition ; ce sont, notamment, des réels de Cauchy modulés).

Proposition : Si u∈ℕ, et si 2u désigne le réel défini ci-dessus (celui dont l'écriture binaire est donnée par u) alors 2u ⋕ 0 (ou bien sûr, si on préfère, 2u > 0) équivaut à u0 (où 0, également noté ∞, est la suite nulle ; c'est-à-dire : ∃i∈ℕ.(ui=1)). Plus généralement, si u∈ℕ, alors 2u ⋕ 2v équivaut à uv.

Démonstration : Si ui=1 alors 2u ≥ 2i > 0 (et comme 2u est clairement positif au sens large, être ⋕0 équivaut à être >0). Dans l'autre sens : si 2u > 0, il existe un rationnel, donc un 2i, tel que 2u ≥ 2i > 0, et alors ui=1 (car sinon ui=0, ce qui donnerait 2u ≤ 2−(i+1)). Ceci démontre la première affirmation. La seconde n'est guère plus difficile. ∎

⚠ Attention : Vu qu'en maths classiques, 2u vaut soit 0 (lorsque u=∞) soit 2n pour un certain n∈ℕ (lorsque, justement, u=ι(n)), bref, 2u est toujours dans ℚ, on peut être tenté de croire que c'est le cas constructivement. Mais on ne peut pas l'affirmer : car tout rationnel est soit égal à zéro soit discerné de zéro, donc la proposition ci-dessus assure que si {2u : u∈ℕ} ⊆ ℚ alors LPO vaut (je parle de LPO séquentiel, c'est-à-dire que tout élément de ℕ est soit ∞ soit discerné de ∞). Néanmoins, je peux mentionner la proposition amusante suivante :

Proposition : Si x est un réel qui est discerné de tous les rationnels, c'est-à-dire ∀r∈ℚ.(xr), alors on a aussi x ⋕ 2u pour tout u∈ℕ.

Démonstration : Comme x est discerné de tous les rationnels, en particulier x⋕0, donc |x|>0, donc il existe un m tel que |x|>2m. Mais par ailleurs, u vérifie uι(m) ou bien uι(m−1) selon que le terme um de u (vue comme suite binaire croissante) vaut 0 ou 1 : dans le premier cas, 2u ≤ 2m et on a bien x ⋕ 2u ; et dans le second cas, 2u est un rationnel 2k avec km−1 entier, donc on a aussi x ⋕ 2u par notre hypothèse sur x. ∎

Si on veut, on peut noter ℚ := {x∈ℝ : ∀r∈ℚ.(xr)} l'ensemble des nombres discernés de tous les rationnels (ces nombres sont parfois appelés positivement irrationnels) et ℚ⋕⋕ := {z∈ℝ : ∀x∈ℚ.(xz)} l'ensemble des nombres discernés de tous les nombres positivement irrationnels ; alors la proposition affirme que {2u : u∈ℕ} ⊆ ℚ⋕⋕ (et en particulier, si ℚ⋕⋕ = ℚ alors LPO vaut). Il y a toutes sortes de choses intéressantes à dire sur ce genre d'ensembles, mais ça m'écarterait trop de ce que je cherche à raconter dans ce billet donc je vais m'en tenir là. (Voir cette réponse que j'ai faite sur MathOverflow pour quelques remarques supplémentaires, cependant.)

Principes analytiques d'omniscience

Redite des principes (séquentiels) d'omniscience

☞ Redite des principes séquentiels

Dans le volet précédent de cette série de billets, j'avais introduit divers principes d'omniscience, dont je reproduis un énoncé possible ici (je rappelle à toutes fins utiles que ℕ désigne l'ensemble des suites binaires croissantes et que, dedans, la suite identiquement nulle peut être notée soit 0 soit — cette dernière notation étant commode pour comparer ℕ à ℕ mais qu'il vaut mieux éviter quand, comme ici, je préfère le voir comme une partie de 2) :

  • Le principe limité d'omniscience ou LPO affirme qu'une suite binaire (qu'on peut supposer croissante si on veut) est soit nulle soit a un terme non-nul : ∀u∈ℕ.(u=0u0).

  • Le principe limité faible d'omniscience ou WLPO affirme qu'une suite binaire (qu'on peut supposer croissante si on veut) est soit nulle soit n'est pas nulle : ∀u∈ℕ.(u=0 ∨ ¬(u=0)).

  • Le principe de Markov ou MP affirme qu'une suite binaire (qu'on peut supposer croissante si on veut) qui n'est pas nulle a un terme non-nul : ∀u∈ℕ.((¬(u=0)) ⇒ (u0)).

  • Le moindre principe limité d'omniscience ou LLPO affirme à propos de deux suites binaires (qu'on peut supposer croissantes si on veut) que s'il n'est pas vrai que toutes les deux ont un terme non-nul, alors l'une des deux est nulle : ∀u∈ℕ.∀v∈ℕ.((¬((u0) ∧ (v0))) ⇒ ((u=0) ∨ (v=0))).

  • Le moindre principe limité faible d'omniscience ou WLLPO (peut-être plus souvent appelé principe de Markov disjonctif ou MP) affirme à propos de deux suites binaires (qu'on peut supposer croissantes si on veut) que s'il n'est pas vrai que toutes les deux ont un terme non-nul [cf. remarque ci-dessous] et s'il n'est pas non plus vrai que toutes les deux sont nulles, alors l'une des deux n'est pas nulle : ∀u∈ℕ.∀v∈ℕ.(((¬((u0) ∧ (v0))) ∧ (¬((u=0) ∧ (v=0)))) ⇒ ((¬(u=0)) ∨ (¬(v=0)))).

Pour distinguer ces principes de ceux qui vont suivre, on peut les qualifier de principes séquentiels d'omniscience (ou principes d'omniscience séquentiels pour réussir à caser les autres adjectifs, étant bien entendu que c'est le principe qui est séquentiel, pas l'omniscience ; i.e., on peut parler de LLPO séquentiel, par exemple).

Les formulations ne sont pas exactement celles que j'avais données précédemment, mais elles sont équivalentes. D'abord, le fait qu'on puisse supposer les suites binaires croissantes si on veut vient du fait qu'à toute suite binaire b∈{0,1} on peut associer une suite binaire croissante μ(b)∈ℕ dont le n-ième terme est le maximum des termes ≤n de la suite b, de sorte que μ(b) a un terme non-nul si et seulement si b en a un (i.e. μ(b)⋕0 ssi b0), et par ailleurs μ(b) = b si b est déjà croissante, ce qui permet de mettre comme on veut {0,1} (l'ensemble des suites binaires) ou ℕ (l'ensemble des suites croissantes) dans les quantificateurs.

☞ Sur les hypothèses de WLLPO séquentiel

Ma formulation de WLLPO peut sembler plus surprenante : par rapport à ma formulation dans le billet précédent, j'ai ajouté une hypothèse demandant qu'il ne soit pas vrai que les deux suites ont un terme non-nul, en plus de l'hypothèse (que j'avais déjà écrite) qu'il n'est pas non plus vrai que toutes les deux sont nulles. La raison pour laquelle je veux mettre cette hypothèse supplémentaire est qu'elle sera importante pour avoir un parallèle parfait avec les principes analytiques que je vais dire. La raison pour laquelle elle ne change rien est la remarque suivante.

Remarque : L'affirmation pour deux suites binaires, s'il n'est pas vrai que toutes les deux sont nulles, alors l'une des deux n'est pas nulle (∀u∈ℕ.∀v∈ℕ.((¬((u=0) ∧ (v=0))) ⇒ ((¬(u=0)) ∨ (¬(v=0))))) équivaut à la même affirmation à laquelle on ajoute l'hypothèse Ⓗ qu'il ne soit pas vrai que les deux suites ont un terme non-nul (l'hypothèse Ⓗ est donc ¬((u0) ∧ (v0)), et l'affirmation complète avec elle est ∀u∈ℕ.∀v∈ℕ.(((¬((u0) ∧ (v0))) ∧ (¬((u=0) ∧ (v=0)))) ⇒ ((¬(u=0)) ∨ (¬(v=0))))). Autrement dit, cette hypothèse supplémentaire ne ne change rien dans la formulation de WLLPO séquentiel ; de plus, ceci est orthogonal à la possibilité d'ajouter l'hypothèse que les suites soient croissantes.

Démonstration : Je reprends une construction et en gros le raisonnement que j'ai utilisés pour prouver que LLPO ⇒ WLPO (où WLPO avait été formulé sans l'hypothèse Ⓗ) : si u,v sont deux suites binaires, je peux définir deux suites binaires a,b en décrétant que an vaut 1 lorsque un=1 et que pour tout k<n on a uk=0 et vk=0, et 0 sinon, et (pas tout à fait symétriquement) que bn vaut 1 lorsque vn=1 et un=0, et que pour tout k<n on a uk=0 et vk=0, et 0 sinon. (En plus clair, on entrelace les suites u,v dans l'ordre u0,v0,u1,v1,u2,… on garde le premier 1 éventuel, et tous les autres termes valent 0, et ceci définit les suites a,b entrelacées dans l'ordre a0,b0,a1,b1,a2,….)

Sur cette construction, il est facile de voir qu'on ne peut pas avoir simultanément a0 et b0 (autrement dit, a,b vérifient toujours Ⓗ). D'autre part, a=b=0 implique u=v=0 (donc si on suppose que ce dernier ne vaut pas, le premier ne vaut pas non plus). Et enfin, u=0 implique a=0 (donc ¬(a=0) implique ¬(u=0)) et bien sûr v=0 implique b=0 (donc ¬(b=0) implique ¬(v=0)).

Bref, en appliquant ma formulation de WLLPO avec l'hypothèse Ⓗ aux suites a,b, on obtient la formulation d'origine sur les suites u,v. (Et si on veut en outre pouvoir supposer les suites croissantes, on applique à a,b la même construction μ discutée plus haut, qui ne modifie pas la validité de toutes les égalités ou discernements.) ∎

Énoncés analogues des principes analytiques

☞ Formulation des principes analytiques

Voici maintenant des principes analogues portant sur les réels, et qu'on peut collectivement qualifier de principes analytiques d'omniscience :

  • Le principe limité d'omniscience analytique ou LPO analytique affirme qu'un réel est soit nul soit discerné de zéro : ∀x∈ℝ.(x=0 ∨ x⋕0).

  • Le principe limité faible d'omniscience analytique ou WLPO analytique affirme qu'un réel est soit nul soit n'est pas nul : ∀x∈ℝ.(x=0 ∨ ¬(x=0)).

  • Le principe de Markov analytique ou MP analytique affirme qu'un réel qui n'est pas nul est discerné de zéro : ∀x∈ℝ.((¬(x=0)) ⇒ (x⋕0)).

  • Le moindre principe limité d'omniscience analytique ou LLPO analytique affirme à propos de deux réels que s'il n'est pas vrai que toutes les deux sont discernés de zéro, alors l'un des deux est nul : ∀x∈ℝ.∀y∈ℝ.((¬((x⋕0) ∧ (y⋕0))) ⇒ ((x=0) ∨ (y=0))).

  • Le moindre principe limité faible d'omniscience analytique ou WLLPO analytique affirme à propos de deux réels que s'il n'est pas vrai que tous les deux sont discernés de zéro et s'il n'est pas non plus vrai que tous les deux sont nuls, alors l'un des deux n'est pas nul : ∀x∈ℝ.∀y∈ℝ.(((¬((x⋕0) ∧ (y⋕0))) ∧ (¬((x=0) ∧ (y=0)))) ⇒ ((¬(x=0)) ∨ (¬(y=0)))).

On note souvent LPO, WLPO, MP, LLPO, WLLPO (respectivement) pour les principes analytiques que je viens d'énoncer. (Et pour insister, les principes séquentiels peuvent se noter : LPOséq, WLPOséq, MPséq, LLPOséq, WLLPO respectivement.)

Je vais donner des formulations équivalentes plus agréables ci-dessous, mais celles-ci sont destinées à maximiser le parallélisme entre la version séquentielle et la version analytique.

☞ Chaque principe analytique impliquent le principe séquentiel correspondant…

Chaque principe analytique implique le principe séquentiel de même nom : tels que je les ai formulés (de façon complètement parallèle), c'est facile, donnée une suite binaire croissante u (et éventuellement une autre v), il suffit d'appliquer le principe analytique à 2u (et éventuellement 2v) que j'ai défini plus haut comme le réel dont l'écriture binaire est donnée par u, et faire usage du fait vu précédemment que 2u ⋕ 0 équivaut à u0 (et se rappeler que, sur les réels comme sur les suites binaires, x=0 est la négation de x⋕0).

☞ …et réciproquement avec le Choix dénombrable

Les réciproques (c'est-à-dire les implications dans le sens principe d'omniscience séquentiel ⇒ principe d'omniscience analytique) valent en présence de l'axiome du choix dénombrable, mais ne peuvent pas être affirmées en général. Voici qui justifie les réciproques en présence de l'axiome du choix dénombrable, et qui est par ailleurs une construction par ailleurs assez intéressante et instructive pour être signalée :

Proposition : En supposant l'axiome du choix dénombrable, si x est un réel, il existe une suite binaire croissante (bi) (i.e., un élément de ℕ) telle que x⋕0 équivaille à b0.

Démonstration : Pour chaque i∈ℕ, comme 2i>0, d'après (❀), on a soit |x|<2i soit |x|>0 (ce dernier étant équivalent à x⋕0). Si on veut, cela se traduit en disant que la partie Bi := {0 : |x|<2i} ∪ {1 : |x|>0} de {0,1}, c'est-à-dire la partie contenant 0 si |x|<2i et 1 si |x|>0, est habitée pour chaque i. L'axiome du choix dénombrable permet de choisir un élément bi de chaque Bi : on a alors |x|<2i si bi=0 et |x|>0 si bi=1 ; par ailleurs, quitte à modifier la suite binaire (bi) pour remplacer chaque terme par le maximum de toutes les valeurs jusqu'à lui, on peut avoir (bi) croissante.

Si b0, cela signifie qu'il existe i tel que bi=1, ce qui implique |x|>0 (i.e., x⋕0) d'après ce qui a été dit. Réciproquement, si x⋕0, c'est-à-dire |x|>0, il existe i tel que |x|≥2i, donc bi≠0, mais comme bi est une suite binaire, bi=1, et on a bien b0. On a donc prouvé l'équivalence. ∎

En appliquant cette proposition aux différents réels dont parlent les principes d'omniscience analytique, on voit que l'axiome du choix dénombrable donne les réciproques annoncées.

En fait, même en maths constructives sans choix, on a une réciproque partielle : chaque principe d'omniscience séquentiel implique le principe d'omniscience analytique de même nom si on le restreint aux réels de Cauchy modulés. (Et comme la preuve que j'ai donnée dans le sens principe d'omniscience analytique ⇒ principe d'omniscience séquentiel construit des réels de Cauchy modulés 2u, on a du coup une équivalence.) En effet, si x est un réel de Cauchy modulé, c'est-à-dire s'il existe une suite (ri) de rationnels telle que |rix|<2i pour tout i, alors on peut définir une suite binaire (bi) par bi=0 si |ri|≤2i et bi=1 si |ri|>2i (cette définition a bien un sens car l'inégalité sur les rationnels est décidable : c'est ce qui fait qu'on n'a pas besoin de choix ici — enfin, on utilise le choix unique) : alors il n'est pas difficile de vérifier que x⋕0 vaut si et seulement si la suite b a un terme égal à 1, i.e. b0. Je crois avoir montré que, au moins pour LPO, on a même l'implication de LPO séquentiel vers LPO analytique pour les réels de Cauchy (non supposés modulés cette fois), mais c'est plus technique et il faut utiliser trois fois LPO : je n'ai pas eu le courage d'essayer de savoir si on a quelque chose d'analogue pour les autres principes d'omniscience.

☞ Implications entre principes analytiques

Pour ce qui est des implications entre les principes analytiques que j'ai évoqués, on a (exactement comme entre les principes séquentiels) :

LEM (le tiers exclu) ⇒ LPOWLPOLLPOWLLPO,
et LPOMPWLLPO,

Celles qui ne sont pas complètement évidentes sur les définitions sont le fait que WLPOLLPO (pour ça on peut soit reprendre la démonstration que j'ai donnée dans le cas séquentiel, soit utiliser l'équivalence que je donne plus bas de WLPO et LLPO avec ∀x∈ℝ.(x⋖0 ∨ x=0 ∨ x⋗0) et ∀x∈ℝ.(x≤0 ∨ x≥0) respectivement), et MPWLLPO (pour ça on peut utiliser l'équivalence que je donne plus bas de WLLPO avec ∀x∈ℝ.((¬(x=0)) ⇒ (x⋖0 ∨ x⋗0)) en se rappelant que x⋕0 équivaut à x<0 ∨ x>0).

À part ça, il y a plein de choses que personne ne semble savoir. Par exemple, j'ignore (et je pense que tout le monde ignore) si la conjonction de WLLPO et de LLPOséq implique LLPO.

Divers équivalents des principes analytiques

☞ Reformulations de LPO analytique

Les formulations que j'ai données de certains des principes d'omniscience analytique ne sont pas les plus heureuses. Mais il y a des équivalents plus agréables :

Proposition : LPO analytique admet les équivalents suivants :

  • x∈ℝ.(x=0 ∨ x⋕0) : tout réel est soit nul soit discerné de zéro.
  • x∈ℝ.(x<0 ∨ x=0 ∨ x>0) : tout réel est soit nul soit strictement négatif soit strictement positif.
  • x≥0.(x=0 ∨ x>0) : tout réel positif au sens large est soit nul soit strictement positif.
  • x∈ℝ.(x>0 ∨ x≤0) : tout réel est soit strictement positif soit négatif au sens large.

Démonstration : La première formulation est celle que j'ai prise comme définition. L'équivalence entre les deux premières formulations résulte du fait que x⋕0 équivaut à x<0 ∨ x>0. La seconde formulation implique trivialement la troisième, et pour ce qui est de la réciproque il suffit d'appliquer la troisième à |x| et se rappeler que |x|>0 équivaut à x⋕0. La quatrième formulation découle évidemment de la seconde, et pour la réciproque il suffit d'appliquer la quatrième à x et −x séparément et d'écarter le cas manifestement impossible. ∎

☞ Reformulations de WLPO analytique

Proposition : WLPO analytique admet les équivalents suivants :

  • x∈ℝ.(x=0 ∨ ¬(x=0)) : tout réel est soit nul soit n'est pas égal à zéro.
  • x∈ℝ.(x⋖0 ∨ x=0 ∨ x⋗0) (où je rappelle que x⋗0 désigne la négation de x≤0) : tout réel est soit nul soit n'est pas positif au sens large soit n'est pas négatif au sens large.
  • x≥0.(x=0 ∨ x⋗0) : tout réel positif au sens large est soit nul soit n'est pas négatif au sens large.
  • x∈ℝ.(x⋗0 ∨ x≤0) : tout réel soit n'est pas négatif au sens large soit est négatif au sens large.

Démonstration : Pour voir que la première formulation implique la seconde, on l'applique successivement à 0⊔x et 0⊔(−x) : d'abord, comme x<0 implique 0⊔x > 0 donc 0⊔x ⋕ 0, on en déduit que 0⊔x = 0 implique x≤0, et symétriquement 0⊔(−x) = 0 implique x≥0 ; ensuite, comme x≤0 implique 0⊔x = 0, on en déduit que ¬(0⊔x = 0) implique x⋗0, et symétriquement ¬(0⊔(−x) = 0) implique x⋖0 ; en mettant tout ça ensemble, on a l'implication souhaitée. Tout le reste est complètement analogue à la proposition précédente. ∎

☞ Reformulations de MP analytique

Proposition : MP analytique admet les équivalents suivants :

  • x∈ℝ.((¬(x=0)) ⇒ (x⋕0)) : tout réel qui n'est pas nul est discerné de zéro (et bien sûr, la réciproque vaut trivialement).
  • x∈ℝ.((x⋗0) ⇒ (x>0)) : tout réel qui n'est pas négatif au sens large est strictement positif (et bien sûr, la réciproque vaut trivialement).

Démonstration : Le premier, qui est ma formulation de référence, implique à peu près trivialement le second ; et pour l'autre sens on applique le second à |x|. ∎

☞ Reformulations de LLPO et WLLPO analytiques

Avant de passer à LLPO, je vais avoir besoin du fait suivant, qui peut être utile en lui-même :

Lemme : Si H := {(x,y)∈ℝ² : x≥0 ∧ y≥0 ∧ ¬(x>0 ∧ y>0)} désigne l'ensemble des couples de réels positifs au sens large et qui ne sont pas tous les deux strictement positifs, alors la fonction H→ℝ donnée par (x,y) ↦ xy, et la fonction ℝ→H donnée par z ↦ (z+,z) := (0⊔z, 0⊔(−z)), sont des bijections réciproques.

Démonstration : Appelons f:H→ℝ donnée par (x,y) ↦ xy, et d'autre part g:ℝ→ℝ² donnée par z ↦ (0⊔z, 0⊔(−z)). D'abord, l'image de g est bien dans H : en effet, 0⊔t≥0 pour n'importe quel t, et d'autre part on a vu que 0⊔t > 0 équivaut à 0>0 (impossible !) ou bien t>0, c'est-à-dire juste à t>0, et on ne peut pas avoir simultanément z>0 et −z>0.

Ensuite, on a (0⊔z) − (0⊔(−z)) = (0⊔z) − (z⊔0) + z = z en utilisant pour la première égalité le fait que (xy)+t = (x+t) ⊔ (y+t) (qui découle de l'invariance par translation de l'ordre). Ceci montre que fg est l'identité sur ℝ.

Montrons enfin que gf est l'identité sur H : soient x,y deux réels positifs au sens large et qui ne sont pas tous les deux strictement positifs. Comme x≥0 et que xxy, on a x ≥ 0⊔(xy). On veut montrer l'inégalité de sens contraire : mais c'est la négation de x > 0⊔(xy), donc il suffit d'arriver à une contradiction à partir de ça. Or x > 0⊔(xy) équivaut à la conjonction de x>0 et de x > xy, ce dernier étant équivalent à y>0 : et on a justement supposé que la conjonction de x>0 et de y>0 était absurde. Bref, on n'a pas x > 0⊔(xy), c'est-à-dire qu'on a x ≤ 0⊔(xy), et finalement x = 0⊔(xy). Symétriquement y = 0⊔(xy). On a bien montré que gf est l'identité sur H, et finalement que f et g sont des bijections réciproques. ∎

Proposition : LLPO analytique équivaut à l'affirmation :

  • x∈ℝ.(x≤0 ∨ x≥0) : tout réel est soit positif au sens large soit négatif au sens large.

Démonstration : Montrons que ma formulation de référence implique z≤0 ∨ z≥0 pour tout réel z (je change la lettre de x en z par rapport à l'énoncé, ce sera plus commode pour la preuve). D'après le lemme, les deux composantes du couple (x,y) := (0⊔z, 0⊔(−z)) sont positifs et ne sont pas simultanément strictement positifs (donc pas simultanément discernés de 0), donc la formulation de référence du LPO analytique montre que l'un des deux est nul, et comme le lemme assure aussi que z = xy, on obtient z≤0 ou bien zy.

Réciproquement, montrons que l'affirmation que z≤0 ∨ z≥0 pour tout réel z implique la formulation de référence du LPO analytique. Si x,y sont deux réels qui ne sont pas simultanément discernés de 0, remplaçons les par |x| et |y| pour pouvoir les supposer positifs au sens large (donc pas simultanément strictement positifs) : le lemme assure que z := xy permet de retrouver x,y par (x,y) = (0⊔z, 0⊔(−z)) ; du coup, si z≤0 ou z≥0 on obtient bien x=0 ou y=0. ∎

Proposition : WLLPO analytique équivaut aux affirmations :

  • x∈ℝ.((¬(x=0)) ⇒ (x≤0 ∨ x≥0)) : tout réel qui n'est pas nul est soit positif au sens large soit négatif au sens large.
  • x∈ℝ.((¬(x=0)) ⇒ (x⋖0 ∨ x⋗0))

Démonstration : Comme on a déjà remarqué que x⋗0 équivaut à la conjonction de x≥0 et ¬(x=0), les deux énoncés énumérés sont équivalents. La preuve de l'équivalence avec la formulation initiale est complètement analogue à la preuve précédente, et repose simplement sur le lemme, avec l'observation triviale supplémentaire que les bijections réciproques f et g mettent (0,0) en correspondance avec 0. ∎

[Optionnel] Un principe entre LLPO et WLLPO : MLLPO

☡ Guide de lecture : Cette section doit être considérée comme étant en petits caractères parce que c'est vraiment une digression, ou un développement sur un sujet que je n'avais pas anticipé : je suis tombé sur ce principe MLLPO en écrivant ce texte et en essayant d'avoir un parallélisme parfait entre principes séquentiels et analytiques d'omniscience, et en me rendant compte que quelque chose clochait. Si on n'est pas intéressé par ce développement, on peut le sauter.

Pour appliquer le lemme de manière à démontrer que ∀z∈ℝ.((¬(z=0)) ⇒ (z≤0 ∨ z≥0)) implique ma formulation de référence de WLLPO analytique, on a eu besoin de l'hypothèse que x,y ne sont pas tous les deux discernés de 0. Comme je l'ai démontré plus haut, cette hypothèse (que j'ai notée Ⓗ dans ce contexte) est gratuite dans le cas séquentiel, c'est-à-dire que WLLPO est équivalent qu'il soit formulé avec ou sans elle. Pour le cas analytique, en revanche, je soupçonne qu'elle n'est pas gratuite. Ceci amène à considérer l'énoncé analogue à WLLPO mais sans cette hypothèse, à savoir :

  • donnés deux réels, s'il n'est pas vrai que tous les deux sont nuls, alors l'un des deux n'est pas nul, soit en symboles : ∀x∈ℝ.∀y∈ℝ.((¬((x=0) ∧ (y=0))) ⇒ ((¬(x=0)) ∨ (¬(y=0)))))

Je ne sais pas quel nom donner au principe ci-dessus : peut-être Mild Lesser Limited Principle of Omniscience ? appelons-le donc MLLPO analytique (ou MLLPO, sachant que le MLLPO séquentiel est de toute façon pareil que WLLPO) pour les besoins de la discussion qui va suivre. Sous ces conditions, je peux au moins dire :

Proposition : LLPO implique MLLPO (défini ci-dessus), qui à son tour implique WLLPO. Par ailleurs, MP implique lui aussi MLLPO.

Démonstration : Le fait que MLLPO analytique implique WLLPO analytique est logiquement trivial (ce dernier a une hypothèse de plus). Expliquons pourquoi LLPO analytique implique MLLPO analytique. Soient x,y deux réels dont il n'est pas vrai que tous les deux sont nuls, et on veut montrer que l'un d'entre eux n'est pas nul. Quitte à remplacer x,y par |x|,|y|, on peut supposer sans perte de généralité que x,y sont positifs au sens large. Comme on l'a vu, LLPO analytique (qu'on suppose) équivaut à l'énoncé que tout réel est positif ou négatif au sens large : en appliquant ce fait à xy, on a soit xy≥0 soit yx≥0. Dans le premier cas, x=0 est impossible car il entraîne y=0 alors qu'il n'est pas vrai que x=y=0 : on a donc prouvé ¬(x=0). Le second cas est analogue et aboutit à la conclusion ¬(y=0).

La démonstration du fait que MP analytique implique MLLPO analytique est extrêmement semblable. Soient x,y deux réels dont il n'est pas vrai que tous les deux sont nuls, et on veut montrer que l'un d'entre eux n'est pas nul. Quitte à remplacer x,y par |x|,|y|, on peut supposer sans perte de généralité que x,y sont positifs au sens large. Comme on l'a vu, MP analytique (qu'on suppose) équivaut à l'énoncé que tout réel positif au sens large et non-nul est strictement positif : en appliquant ce fait à x+y, vu que x+y=0 est impossible (car cela entraînerait x=y=0, qui n'est pas vrai), on a x+y>0. Par (❀), on a lors soit x>0 soit x<x+y, ce second cas étant équivalent à y>0. On a donc prouvé x>0 ou y>0, et à plus forte raison ¬(x=0) ou ¬(y=0). ∎

En commençant à rédiger ce bout de ce texte, je pensais que MLLPO serait équivalent à WLLPO (i.e., je pensais juste avoir deux formulations équivalentes de WLLPO dans le cas analytique comme il y en a deux dans le cas séquentiel. Je me suis rendu compte que je n'arrivais pas à démontrer leur équivalence, et je soupçonne maintenant que les deux implications ci-dessus sont strictes en général. Mais je n'y ai pas vraiment réfléchi (de toute façon, rien dans ce billet ne donne les outils pour construire des contre-modèles permettant de montrer que tel ou tel énoncé n'en implique pas un autre) : peut-être bien que WLLPO et MLLPO sont en fait équivalents et que toute cette section est sans objet. Je remarque cependant que LLPO et MLLPO semblent porter en eux une forme de Choix (au sens où la disjonction dans la conclusion n'est pas exclusive), alors que WLLPO ne l'a pas (la conclusion est une disjonction exclusive).

Je finis cette digresson par une observation qui peut justifier l'intérêt porté à MLLPO :

Observation : MLLPO équivaut à l'affirmation que la non-égalité sur les réels est cotransitive (ou ce qui revient au même, est un discernement) : ∀x∈ℝ.∀y∈ℝ.∀z∈ℝ.((¬(x=z)) ⇒ ((¬(x=y)) ∨ (¬(y=z)))).

Démonstration : Montrons d'abord que MLLPO analytique implique la cotransitivité de la non-égalité : on veut donc prouver (¬(x=y)) ∨ (¬(y=z)) sous l'hypothèse ¬(x=z). Or les réels xy et yz ne peuvent pas être tous les deux nuls sous cette hypothèse (car leur somme xz n'est pas nulle) : alors MLLPO analytique (qu'on suppose) entraîne que l'un des deux n'est pas nul, ce qui signifie bien (¬(x=y)) ∨ (¬(y=z)).

Réciproquement, supposons la cotransitivité de la non-égalité, et soient x,y deux réels dont il n'est pas vrai que tous les deux sont nuls, et on veut montrer que l'un d'entre eux n'est pas nul. Quitte à remplacer x,y par |x|,|y|, on peut supposer sans perte de généralité que x,y sont positifs au sens large. Maintenant, x+y=0 entraîne x=y=0, ce qui n'est pas le cas : c'est-à-dire qu'on a ¬(x+y=0), et la cotransitivité assure donc ¬(x+y=y) ou bien ¬(y=0). Le premier cas est équivalent à ¬(x=0), et on a bien la conclusion recherchée. ∎

[Optionnel] Le principe de Markov faible

☡ Guide de lecture : Là aussi, toute cette section est moralement en petits caractères, et doit être considérée comme optionnelle : je n'avais pas vraiment prévu d'en parler, et je me suis un peu laissé entraîner par une sorte de scrupule à laisser ce pauvre principe de Markov faible abandonné sur le bord de la route.

☞ Équivalents de WMP séquentiel

L'idée du principe de Markov faible est, en quelque sorte, de prendre la conclusion de la cotransitivité de la non-égalité comme hypothèse pour affirmer un discernement.

Proposition : les affirmations suivantes sont équivalentes :

  1. u∈2.((∀w∈2.((¬(w=0)) ∨ (¬(w=u)))) ⇒ (u0))
  2. u∈ℕ.((∀w∈2.((¬(w=0)) ∨ (¬(w=u)))) ⇒ (u0))
  3. u∈ℕ.((∀w∈ℕ.((¬(w=0)) ∨ (¬(w=u)))) ⇒ (u0))

— En revanche, le principe

  1. u∈2.((∀w∈ℕ.((¬(w=0)) ∨ (¬(w=u)))) ⇒ (u0))

les implique toutes et équivaut au principe de Markov (séquentiel).

Démonstration : L'implication (1)⇒(2) est logiquement triviale. Montrons (2)⇒(3). Pour cela, on se donne u∈ℕ dont on suppose qu'il vérifie ∀w′∈ℕ.((¬(w′=0)) ∨ (¬(w′=u))), et on souhaite (de manière à pouvoir appliquer (2)) prouver qu'il satisfait aussi ∀w∈2.((¬(w=0)) ∨ (¬(w=u))). Or donné w∈2, on définit comme précédemment la suite binaire croissante μ(w)∈ℕ dont le n-ième terme est le maximum des termes ≤n de la suite w. D'après notre hypothèse appliquée à w′ := μ(w), on a (¬(μ(w)=0)) ∨ (¬(μ(w)=u)). Mais comme w=0 entraîne μ(w)=0 et que w=u entraîne μ(w)=u (puisque μ(u)=u), et comme l'une de ces deux choses est exclue, on a (¬(w=0)) ∨ (¬(w=u)), comme voulu. Alors (2) donne la conclusion u0 souhaitée. Ceci achève de prouver (2)⇒(3).

Montrons enfin (3)⇒(1). Pour cela, on se donne u∈2 dont on suppose qu'il vérifie ∀w′∈2.((¬(w′=0)) ∨ (¬(w′=u))). On définit μ(u) comme au paragraphe précédent, et on veut lui appliquer (3). Pour ça, on souhaite prouver ∀w∈ℕ.((¬(w=0)) ∨ (¬(w=μ(u)))). Donné un w∈ℕ (vu comme une suite binaire croissante), on définit w′ := wu, c'est-à-dire la suite dont le n-ième terme est le minimum entre les termes correspondants de w et u. Notre hypothèse assure que (¬(w′=0)) ∨ (¬(w′=u)). Or w=0 entraîne w′=0, et w=μ(u) entraîne w′=u (vu que μ(u) est en chaque point supérieur ou égal à u) : comme l'une de ces deux choses est exclue, on a donc (¬(w=0)) ∨ (¬(w=μ(u))), ce qui permet bien d'appliquer (3) à μ(u) pour conclure μ(u)⋕0, qui équivaut à u0. Ceci achève de prouver (3)⇒(1).

Le fait que (4)⇒(1) est logiquement trivial. Prouvons enfin l'équivalence (MP)⇔(4). L'implication (MP)⇒(4) est logiquement triviale (appliquer l'hypothèse de (4) à w=0). Reste donc à prouver (4)⇒(MP). Soit donc v∈2 dont on suppose qu'il vérifie ¬(v=0), et on souhaite montrer qu'il vérifie v0. Appelons u la suite obtenue en intercalant des 0 et termes de v (c'est-à-dire, disons, u2i=vi et u2i+1=0). On va montrer que u vérifie ∀w∈ℕ.((¬(w=0)) ∨ (¬(w=u))) de manière à pouvoir appliquer (4). Or w=u entraîne que la moitié des termes de w sont nuls, si bien que w=0 (c'est-à-dire ∞) puisque w∈ℕ, et du coup u=0 ; mais comme on a supposé ¬(v=0), on a ¬(u=0), c'est-à-dire que w=u entraîne une absurdité : on a donc prouvé ¬(w=u), et a fortiori (¬(w=0)) ∨ (¬(w=u)), pour tout w∈ℕ. Ceci nous permet d'appliquer (4) et de conclure u0, qui entraîne évidemment v0. Ceci achève de prouver (4)⇒(MP). ∎

Les énoncés équivalents (1)–(3) de la proposition ci-dessus portent le nom de principe de Markov faible (séquentiel) ou WMP (séquentiel).

☞ Le lien entre MP et WMP séquentiels

Proposition : MP séquentiel équivaut à la conjonction de WLLPO séquentiel et de WMP séquentiel.

Démonstration : Rappelons pourquoi MP implique WLLPO : si u,v sont deux suites binaires et s'il n'est pas vrai que toutes les deux sont nulles, alors la suite w obtenue en entrelaçant les termes de u et v n'est pas nulle, donc par MP elle a un terme non-nul, ce qui montre que l'une des deux suites de départ a un terme non-nul : on a donc montré WLLPO. Pour ce qui est du fait que MP implique WMP, il suffit d'appliquer l'hypothèse ∀w∈2.((¬(w=0)) ∨ (¬(w=u))) de WMP à w=0 pour obtenir ¬(u=0), c'est-à-dire que l'hypothèse de WMP est plus forte que celle de MP, et ils ont la même conclusion, donc (MP)⇒(WMP).

Dans l'autre sens, si on a à la fois WLLPO et WMP, on veut montrer MP. Or WLLPO entraîne la cotransitivité de la non-égalité sur 2 (on l'a déjà vu au billet précédent) : donc si ¬(u=0), pour tout w on a (¬(w=0)) ∨ (¬(w=u)), ce qui est exactement l'hypothèse demandée par WMP et qui permet de conclure u0. ∎

☞ Équivalents de WMP analytique

Passons maintenant à la variante analytique de WMP.

Proposition : Les affirmations suivantes sont équivalentes (où je rappelle que ab signifie ¬(ab), ou, ce qui revient au même, ab et ¬(a=b)) :

  1. x∈ℝ.((∀t∈ℝ.((¬(t=0)) ∨ (¬(t=x)))) ⇒ (x⋕0))
  2. x∈ℝ.((∀t∈ℝ.(t⋗0 ∨ xt)) ⇒ (x>0))
  3. x≥0.((∀t∈ℝ.(t⋗0 ∨ xt)) ⇒ (x>0))
  4. x≥0.((∀t≥0.(t⋗0 ∨ xt)) ⇒ (x>0))

Démonstration : Montrons que (1)⇒(2). Supposons donc d'un réel x qu'il vérifie ∀t∈ℝ.(t⋗0 ∨ xt) et on souhaite montrer x>0. En appliquant l'hypothèse à t=0, on obtient x⋗0 et en particulier x≥0. On souhaite montrer que x vérifie ∀t∈ℝ.((¬(t=0)) ∨ (¬(t=x))) pour pouvoir appliquer (1) ; soit donc t∈ℝ arbitraire. Notre hypothèse assure t⋗0 ∨ xt. Or t=0 entraîne t≤0, et t=x entraîne xt ; comme l'une de ces deux choses est exclue, on a on a donc bien montré (¬(t=0)) ∨ (¬(t=x)), comme voulu. Alors (1) donne x⋕0. Comme on a montré à la fois x≥0 et x⋕0, on a bien x>0, comme souhaité.

Le fait que (2)⇒(3) est logiquement trivial. Montrons que (3)⇒(4). Supposons donc d'un réel x≥0 qu'il vérifie ∀t′≥0.(t′⋗0 ∨ xt′) et on souhaite montrer x>0. On souhaite (de manière à pouvoir appliquer (3)) prouver que x vérifie ∀t∈ℝ.(t⋗0 ∨ xt) : soit donc t∈ℝ arbitraire. Posons t′ := 0⊔t (il est bien ≥0). Notre hypothèse assure t′⋗0 ∨ xt′. Or t≤0 entraîne t′≤0 (même t′=0 mais peu importe), et xt entraîne xt′, et comme l'une de ces deux choses est exclue, on a t⋗0 ∨ xt, comme voulu. Alors (3) donne la conclusion x>0 souhaitée.

Montrons enfin que (4)⇒(1). Supposons donc d'un réel x qu'il vérifie ∀t′∈ℝ.((¬(t′=0)) ∨ (¬(t′=x))) et on souhaite montrer x⋕0. Appliquons d'abord notre hypothèse à t′ := 0⊔x : on a (¬(t′=0)) ∨ (¬(t′=x)). Comme x≤0 entraîne t′=0, et x≥0 implique t′=x, et comme l'une de ces deux choses est exclue, on a x⋖0 ∨ x⋗0. On va raisonner dans chacun des deux cas x⋖0 et x⋗0. Commençons par nous placer dans le cas x⋗0, qui entraîne notamment x≥0. On souhaite (de manière à pouvoir appliquer (4)) prouver que x vérifie ∀t≥0.(t⋗0 ∨ xt). Soit donc t≥0 quelconque. Posons t′ := xt : d'après notre hypothèse, on a (¬(t′=0)) ∨ (¬(t′=x)). Or t≤0 (c'est-à-dire en fait t=0) entraîne t′=0 (car on a x≥0), et tx entraîne t′=x : l'une de ces deux choses étant exclue, on a donc t⋗0 ∨ xt. Par (4), on en déduit x>0, et en particulier x⋕0. Dans le cas x⋖0, on raisonne de façon analogue sur −x (qui est ≥0), pour arriver à la même conclusion. Ceci achève la preuve de notre implication. ∎

Les énoncés équivalents de la proposition ci-dessus portent le nom de principe de Markov faible analytique ou WMP analytique (qu'on peut bien sûr noter : WMP).

☞ Le lien entre MP et WMP analytiques

Proposition : MP équivaut à la conjonction de MLLPO (c'est-à-dire : ∀x∈ℝ.∀y∈ℝ.((¬((x=0) ∧ (y=0))) ⇒ ((¬(x=0)) ∨ (¬(y=0)))))) et de WMP.

Démonstration : Rappelons pourquoi MP analytique implique MLLPO analytique : si x,y sont deux réels et s'il n'est pas vrai que tous les deux sont nuls, alors z := |x| ⊓ |y| n'est pas nul (car clairement z=0 entraîne x=y=0), donc z⋕0 par MP analytique, c'est-à-dire z>0, ce qui équivaut à |x|>0 ∨ |y|>0 soit x⋕0 ∨ y⋕0, et en particulier (¬(x=0)) ∨ (¬(y=0)). On a donc bien montré MLLPO analytique.

Toutes les autres parties de la preuve se démontrent de façon analogue mutatis mutandis, au cas séquentiel : je rappelle qu'on a vu plus haut que MLLPO analytique équivaut à la cotransitivité de la non-égalité sur ℝ. ∎

☞ Le lien entre WMP analytique et WMP séquentiel

Pour relier la version analytique avec la version séquentielle de WMP, on a besoin d'un raffinement d'un résultat déjà vu :

Lemme : En supposant l'axiome du choix dénombrable, si 0≤x≤1 est un réel compris entre 0 et 1 au sens large, il existe une suite binaire croissante b∈ℕ telle que :

  • on a b0 si et seulement si x>0 (et en particulier, on a b=0 si et seulement si x=0) ;
  • si x=2u pour u∈ℕ, alors b=u ;
  • et dans tous les cas, x ≤ 2b.

(Intuitivement, on va définir bi comme prenant la valeur 0 si x ≤ (5/8)×2i, la valeur 1 si x ≥ (7/8)×2i, et un choix arbitraire entre les deux ; mais il faut rédiger soigneusement, et utiliser le choix dénombrable, pour expliquer que ceci a bien un sens.)

Démonstration : Pour chaque i∈ℕ, comme 5×2−(i+3) < 7×2−(i+3), d'après (❀), on a soit x < 7×2−(i+3), soit x > 5×2−(i+3). Si on veut, cela équivaut à dire que la partie Bi de {0,1} contenant 0 si x < 7×2−(i+3), et 1 si x > 5×2−(i+3), est habitée pour chaque i. L'axiome du choix dénombrable permet de choisir un élément bi de chaque Bi : on a alors, pour chaque i :

  • bi=0 ⇒ x < 7×2−(i+3)
  • bi=1 ⇒ x > 5×2−(i+3)

Il s'ensuit, par contraposées (même en logique intuitionniste, pq entraîne (¬q)⇒(¬p)) :

  • x ≤ 5×2−(i+3)bi=0
  • x ≥ 7×2−(i+3)bi=1

La suite (bi) est croissante, car bi=1 implique x > 5×2−(i+3) qui implique x ≥ 7×2−(i+4) (vu que 5 > 7/2) qui implique bi+1=1. On a donc bien défini un élément de ℕ.

Si b0, c'est-à-dire s'il existe i tel que bi=1, alors x > 5×2−(i+3) et en particulier x>0. Réciproquement, si x>0, par densité de ℚ dans ℝ il existe i tel que x ≥ 7×2−(i+3), ce qui entraîne bi=1, et en particulier b0.

Ensuite, si x=2u, on veut montrer que bi=ui pour tout i. En notant abusivement ui la suite obtenue en décalant de i crans la suite u (en supprimant les i premiers termes et en numérotant les suivants), on a 2u ≥ 7×2−(i+3) si et seulement si 2−(ui) ≥ 7/8, et par ailleurs 2u ≤ 5×2−(i+3) si et seulement si 2−(ui) ≤ 5/8. Mais un 2v pour v∈ℕ est soit =1 soit ≤ 1/2 selon que v0 vaut 1 ou 0 : en appliquant ce fait à ui, on voit que si ui=1 on a 2−(ui) ≥ 7/8 donc bi=1 et que si ui=0 on a 2−(ui) ≤ 5/8 donc bi=0. Bref, bi=ui comme annoncé.

Enfin, il reste à montrer que x ≤ 2b dans tous les cas. Comme 2b est la borne inférieure (qui existe !) de 1 et des 2i pour les i tels que bi=0, il s'agit de prouver x ≤ 2i pour tout i tel que bi=0. Or on a vu ci-dessus que bi=0 entraîne x < (7/8)×2i, ce qui entraîne bien ce qu'on a dit. ∎

Proposition : En supposant l'axiome du choix dénombrable, WMP séquentiel est équivalent à WMP analytique.

Démonstration : (Toute la démonstration suppose l'axiome du choix dénombrable.) Montrons d'abord que WMP séquentiel, sous la forme ∀u∈ℕ.((∀w∈ℕ.((¬(w=0)) ∨ (¬(w=u)))) ⇒ (u0)), implique WMP analytique, sous la forme ∀x≥0.((∀t≥0.(t⋗0 ∨ xt)) ⇒ (x>0)). Soit x≥0 dont on suppose qu'il vérifie ∀t≥0.(t⋗0 ∨ xt), et on veut montrer x>0. Rappelons tout d'abord que d'après (❀) on a soit x>0 soit x<1 : le premier cas est exactement notre conclusion souhaitée, donc on peut se placer dans le second. Soit b∈ℕ une suite binaire croissante telle que donnée par le lemme appliqué à x (qui est bien au sens large entre 0 et 1) : comme x>0 équivaut à x⋕0 (car on suppose x≥0), et que x⋕0 équivaut à b0 (d'après le lemme), il nous suffit de montrer cette dernière affirmation. D'après notre formulation de WMP séquentiel (qu'on suppose), il suffit de montrer ∀w∈ℕ.((¬(w=0)) ∨ (¬(w=b))) pour pouvoir conclure. Soit donc w∈ℕ, et considérons le réel t := x ⊓ 2w : d'une part, w=0 (qui, rappelons, est la même chose que ∞ dans ℕ) entraîne t=0 donc t≤0, et d'autre part w=b entraîne 2w = 2bx (d'après le lemme), donc t=x donc xt ; l'une de ces deux choses étant exclue, on a donc (¬(w=0)) ∨ (¬(w=b)), comme on voulait, ce qui conclut notre preuve.

Dans l'autre sens, montrons que WMP analytique, sous la forme ∀x≥0.((∀t≥0.(t⋗0 ∨ xt)) ⇒ (x>0)), implique WMP séquentiel, sous la forme ∀u∈ℕ.((∀w∈ℕ.((¬(w=0)) ∨ (¬(w=u)))) ⇒ (u0)). Soit u∈ℕ dont on suppose qu'il vérifie ∀w∈ℕ.((¬(w=0)) ∨ (¬(w=u))), et on veut montrer u0. Posons x := 2u : on a 0≤x≤1 ; et comme u0 équivaut à x⋕0 qui est impliqué par x>0, il nous suffit de montrer cette dernière affirmation. D'après notre formulation de WMP analytique (qu'on suppose), il suffit de montrer ∀t≥0.(t⋗0 ∨ xt). Soit donc t≥0, appelons y := tx, et soit w∈ℕ une suite binaire croissante telle que donnée par le lemme appliqué à ce y (qui est bien au sens large entre 0 et 1). Alors t≤0 (c'est-à-dire en fait t=0) entraîne y=0 donc w=0 ; et d'autre part, xt entraîne y=x donc y = 2u, donc (d'après le lemme) w=u ; l'une de ces deux choses étant exclue, on a donc bien t⋗0 ∨ xt, comme on voulait, ce qui conclut notre preuve. ∎

À cause de l'apparition d'un quantificateur dans l'hypothèse, ce qui nécessite une « conversion » dans les deux sens, il semble qu'on ait besoin de l'axiome du choix dénombrable pour chacune des deux implications (à la différence de tous les autres principes d'omniscience que j'ai énoncés, pour lesquels la version analytique entraînait toujours la version séquentielle). J'ignore si cette utilisation de l'axiome du choix dénombrable dans les deux sens est vraiment essentielle.

☞ La méta-recette de cette section

Méta-recette : Beaucoup des démonstrations de la section qui précède sont plus ou moins du type WMPS ⇒ WMPT où, si S est un ensemble muni d'un élément distingué ‘0’ et d'une relation de discernement ‘⋕’, l'affirmation WMPS est la suivante : uS.((∀wS.((¬(w=0)) ∨ (¬(w=u)))) ⇒ (u⋕0)). Si on analyse un peu le mécanisme de preuve qui a été utilisé, il est essentiellement le même (à de toutes petites variations) à chaque fois, et il prouve en fait que les hypothèses suivantes permettent de conclure WMPS ⇒ WMPT : ⓐ on se donne fonction ou même une multifonction φ:TS (une multifonction est une relation dont la première projection surjecte l'ensemble de départ), ⓑ on se donne une fonction ou même une multifonction ψ:T×ST, ⓒ on a ψ(x,0)=0 pour xT, ⓓ on a ψ(x,φ(x))=x pour xT, et ⓔ φ(x)⋕0 implique x⋕0. Voici le schéma général de preuve. On suppose WMPS et on veut prouver WMPT. Pour cela, on se donne xT dont on suppose qu'il vérifie ∀tT.((¬(t=0)) ∨ (¬(t=x))). Par ⓐ, on considère u := φ(x) (ceci voulant dire, une valeur quelconque de la multifonction) et on souhaite (de manière à pouvoir appliquer WMPS) prouver qu'il satisfait ∀wS.((¬(w=0)) ∨ (¬(w=u))). Or donné wS, par ⓑ, on considère t := ψ(x,w). D'après notre hypothèse appliquée à t, on a (¬(t=0)) ∨ (¬(t=x)). Mais comme w=0 entraîne t=0 par ⓒ, et que w=u entraîne t=x par ⓓ, et comme l'une de ces deux choses est exclue, on a (¬(w=0)) ∨ (¬(w=u)), comme voulu. Alors WMPS donne la conclusion u⋕0 souhaitée. Par ⓔ, on en déduit w⋕0. On a ainsi bien prouvé WMPT. ∎

Valeurs de vérité et principes d'omniscience

Méta : Je comptais écrire ici une courte section finale, mais elle a gonflé démesurément et s'est transformée en labyrinthe de principes tordus, tous semblables. (Il aurait vraiment fallu que je fisse un diagramme représentant les différentes parties de Ω que je définis ci-dessous, et les inclusions entre elles, parce qu'on ne s'y retrouve pas.) Je pense néanmoins que ça vaut la peine de la survoler, parce que si les détails sont pénibles, l'idée générale de ce qu'on fait est, il me semble, assez intéressante, et fournit un point de vue différent sur les principes d'omniscience. Les réels disparaissent au début, et ne vont réapparaître que plus bas.

☞ Valeurs de vérité définies par pure logique

Je rappelle que dans une section du premier volet de cette série de billets, j'avais introduit l'ensemble Ω des valeurs de vérité, qu'on peut considérer comme l'ensemble des parties du singleton 1 := {•}. Classiquement, c'est juste un ensemble à deux éléments, et il n'est pas très intéressant, c'est juste un ensemble à deux éléments ; mais constructivement, c'est un ensemble extrêmement riche et potentiellement énorme (cf. cette réponse que j'ai faite sur Math StackExchange où je discute dans quelle mesure on peut essayer d'évaluer sa « taille »). Notamment, il peut avoir un sens de chercher à définir des parties de Ω correspondant à des valeurs de vérité vérifiant telle ou telle propriété.

Notamment, du point de vue purement logique, on peut définir :

  • l'ensemble Ωbool := {⊥,⊤} = {p∈Ω : p∨¬p} des valeurs de vérités booléennes ou décidables (c'est-à-dire, le vrai et le faux) ;
  • l'ensemble Ωclass := {p∈Ω : ¬¬p ⇒ p} = ¬[Ω] := {¬q : q∈Ω} = ¬¬[Ω] := {¬¬r : r∈Ω} des valeurs de vérités classiques ou (¬¬)-stables ou négatives ;
  • l'ensemble Ωwbool := {p∈Ω : ¬p∨¬¬p} =: ¬−1bool] des valeurs de vérités faiblement booléennes (ou dont la négation est booléenne).

(La terminologie est, malheureusement, mal standardisée, et un peu incohérente.)

Ainsi, Ωbool et Ωclass sont respectivement les classificateurs des parties que j'ai précédemment qualifiées de décidables et (¬¬)-stables respectivement : c'est-à-dire qu'une partie décidable (resp. (¬¬)-stables) d'un ensemble X est la même chose qu'une partie dont la fonction indicatrice prend des valeurs dans Ωbool (resp. Ωclass), c'est immédiat sur les définitions ; autrement dit, se donner une partie décidable (resp. (¬¬)-stables) d'un ensemble X revient exactement à se donner une fonction X→Ωbool (resp. X→Ωclass) ; et bien sûr rien ne nous interdit d'inventer un terme pour les parties dont la fonction indicatrice prend ses valeurs dans Ωwbool (quelque chose comme faiblement décidable peut-être ?).

On pourra remarquer que Ωbool = Ωclass ∩ Ωwbool : cela revient à démontrer l'équivalence entre p∨¬p et (¬¬p ⇒ p) ∧ (¬p∨¬¬p), qui est essentiellement évidente.

Je vais aussi définir :

  • l'ensemble (Ω²)DM := {(p,q)∈Ω² : ¬(pq) ⇒ (¬p∨¬q)} des couples de valeurs de vérité vérifiant la loi de De Morgan (enfin, celle des lois de De Morgan qui n'est pas un théorème du calcul propositionnel intuitionniste).

(On pourra remarquer, si on veut, que (Ωwbool)² ⊆ (Ω²)DM : en effet, si on a ¬p∨¬¬p d'une part et ¬q∨¬¬q de l'autre, trois des quatre cas évidents vérifient ¬p∨¬q, et le quatrième vérifie ¬¬(pq).)

☞ Valeurs de vérité définies par des suites binaires

Mais on peut aussi définir des ensembles de valeurs de vérités à partir de suites, et c'est là que ça devient intéressant. Ci-dessous, je note ⟦φ⟧ la valeur de vérité de l'énoncé φ (c'est-à-dire {• : φ} si on a décidé d'identifier Ω à 𝒫(1) où 1={•}, mais je pense que ce n'est pas plus clair comme ça) :

  • L'ensemble ΩΣ₁(séq) := {p∈Ω : ∃u∈{0,1}.(p ⇔ ∃i∈ℕ.(ui=1))} = {⟦∃i∈ℕ.(ui=1)⟧ : u∈{0,1}} = {⟦u0⟧ : u∈{0,1}} sera l'ensemble des valeurs de vérité d'énoncés du type la suite binaire u a un terme non-nul.

    (Si on préfère, on peut aussi dire que c'est l'ensemble des ⋁{ui : i∈ℕ} pour u une suite à valeurs dans Ωbool, mais je ne sais pas si ça éclaircit les choses ou si ça les rend plus confuses.)

  • L'ensemble ΩΠ₁(séq) := {p∈Ω : ∃u∈{0,1}.(p ⇔ ∀i∈ℕ.(ui=0))} = {⟦∀i∈ℕ.(ui=0)⟧ : u∈{0,1}} = {⟦u=0⟧ : u∈{0,1}} sera l'ensemble des valeurs de vérité d'énoncés du type la suite binaire u est nulle.

    Comme u=0 est la négation de u0, on peut aussi dire que ΩΠ₁(séq) = ¬[ΩΣ₁(séq)] := {¬q : q∈ΩΣ₁(séq)}. En particulier, on a ΩΠ₁(séq) ⊆ Ωclass (puisque Ωclass est l'ensemble des ¬q pour tous les q∈Ω).

    (Si on préfère, on peut aussi dire que ΩΠ₁(séq) est l'ensemble des ⋀{ui : i∈ℕ} pour u une suite à valeurs dans Ωbool, mais de nouveau, je ne sais pas si ça éclaircit les choses.)

  • L'ensemble ΩΔ₁(séq) := ΩΣ₁(séq) ∩ ΩΠ₁(séq) sera l'intersection des deux précédents.

  • L'ensemble Ω¬¬Σ₁(séq) := {p∈Ω : ∃u∈{0,1}.(p ⇔ ¬∀i∈ℕ.(ui=0))} = {⟦¬∀i∈ℕ.(ui=0)⟧ : u∈{0,1}} = {⟦¬(u=0)⟧ : u∈{0,1}} sera l'ensemble des valeurs de vérité d'énoncés du type la suite binaire u n'est pas nulle.

    On peut aussi dire que Ω¬¬Σ₁(séq) = ¬[ΩΠ₁(séq)] := {¬q : q∈ΩΠ₁(séq)}, ou encore que Ω¬¬Σ₁(séq) = ¬¬[ΩΣ₁(séq)] := {¬¬r : r∈ΩΣ₁(séq)} (ce qui justifie la notation).

  • L'ensemble Ω¬¬Δ₁(séq) := Ω¬¬Σ₁(séq) ∩ ΩΠ₁(séq) sera l'intersection des deux précédents. C'est aussi ¬¬[ΩΔ₁(séq)] (comme je vais le rappeler plus bas).

Le truc est que classiquement, toute valeur de vérité peut trivialement s'écrire sous la forme la suite u prend la valeur 1 pour une certaine suite binaire, et on peut même prendre une suite constante (juste la suite valant identiquement 1 si ma valeur de vérité est vraie, et 0 si elle est fausse). Mais constructivement, rien ne garantit que toute valeur de vérité soit de cette forme. On a quand même Ωbool ⊆ ΩΣ₁(séq) et Ωbool ⊆ ΩΠ₁(séq) parce qu'on peut, justement, prendre des suites constantes (une valeur de vérité booléenne est la même chose qu'un élément de {0,1}, et on peut former la suite constante de cette valeur, ou de la valeur complémentaire) : autrement dit, Ωbool ⊆ ΩΔ₁(séq).

On a aussi : ΩΔ₁(séq) ⊆ Ω¬¬Δ₁(séq) : en effet, si p ∈ ΩΔ₁(séq), elle est notamment dans ΩΠ₁(séq) donc dans Ωclass, c'est-à-dire que ¬¬p ⇔ p, et par conséquent le fait que ¬¬p soit dans Ω¬¬Σ₁(séq) nous donne le fait que p (qui lui est égal) y est aussi.

Bref : Ωbool ⊆ ΩΔ₁(séq) ⊆ Ω¬¬Δ₁(séq) ⊆ Ωclass.

Puisque ΩΠ₁(séq) ⊆ Ωclass, il n'y a pas lieu de définir Ω¬¬Π₁(séq) comme ¬¬[ΩΠ₁(séq)] (enfin, on peut le définir si on veut, mais c'est égal à ΩΠ₁(séq)).

Les parties d'un ensemble X dont la fonction indicatrice tombe dans ΩΣ₁(séq), resp. ΩΠ₁(séq), resp. ΩΔ₁(séq), peuvent se dire semi-décidables, resp. co-semi-décidables, resp. bi-semi-décidables (pour le dernier, voire les deux derniers, c'est vraiment moi qui invente). Une partie co-semi-décidable est juste le complémentaire d'une partie semi-décidable, et une partie bi-semi-décidable est une partie à la fois semi-décidable et co-semi-décidable.

⚠ Attention : Cette terminologie entre en conflit avec celle de la calculabilité (classiquement, les trois ensembles ΩΣ₁(séq), ΩΠ₁(séq) et ΩΔ₁(séq) sont juste Ω, qui est aussi pareil que Ωbool = {⊥,⊤}, donc toute partie de n'importe quel ensemble vérifie toutes les notions que je viens de définir, alors qu'une partie de ℕ n'est pas forcément semi-décidable au sens de la calculabilité classique) ; mais il y a une certaine analogie, et c'est même plus qu'une analogie, puisque dans le topos effectif (si on sait ce que c'est), une partie semi-décidable ou co-semi-décidable de l'objet N des entiers naturels est bien la même chose qu'une partie semi-décidable ou de complémentaire semi-décidable au sens de la calculabilité classique (et par ailleurs, dans le topos effectif, ΩΔ₁(séq) = Ωbool). C'est aussi ce qui explique que j'ai utilisé la notation Σ₁ et Π₁, évocatrice d'une notation standard en logique classique, la hiérarchie arithmétique (cf. par exemple ce bout de ce vieux billet, ou cet article Wikipédia) ; néanmoins, ce n'est généralement pas la même chose, parce que je ne demande pas, ici, que ma suite binaire u soit définie de façon arithmétique, et je peux considérer des parties de n'importe quel ensemble, pas juste ℕ (et comme je viens de le dire, avec la terminologie que je viens de définir, classiquement, n'importe quelle partie est semi-décidable).

Digression : Ma notation suggère qu'on aurait envie de définir toute une hiérarchie avec ΩΣ₂(séq) et compagnie, mais là le fait de ne pas avoir l'axiome du choix même dénombrable commence à devenir sérieusement handicapant pour trouver les bonnes définitions. Je suis tenté de poser ΩΣ₂(séq) := {⟦∃i∈ℕ.∀j∈ℕ.(ui,j=1)⟧ : u∈{0,1}ℕ×ℕ}, mais peut-être qu'il faudrait plutôt le définir comme l'ensemble des ⋁{ui : i∈ℕ} pour u une suite à valeurs dans ΩΠ₁(séq), qui est a priori possiblement plus grand.

En tout cas, l'exemple archétypique d'une partie semi-décidable est la partie ℕ de ℕ (puisque c'est justement {u∈ℕ : u⋕∞}, où je rappelle que ∞, dans le contexte de ℕ, désigne la suite nulle) ; et l'exemple archétypique d'une partie co-semi-décidable est la partie {∞}, qui est son complémentaire.

☞ Reformulation des principes séquentiels d'omniscience

Quel rapport avec les principes d'omniscience ?

  • LPO séquentiel équivaut à l'affirmation que ΩΣ₁(séq) = Ωbool (i.e, l'inclusion Ωbool ⊆ ΩΣ₁(séq) qui a de toute façon lieu est, en fait, une égalité).

  • WLPO séquentiel équivaut à l'affirmation que ΩΣ₁(séq) ⊆ Ωwbool, ou, si on préfère, que ΩΠ₁(séq) = Ωbool (i.e, l'inclusion Ωbool ⊆ ΩΠ₁(séq) qui a de toute façon lieu est, en fait, une égalité), ou d'ailleurs, que ΩΠ₁(séq) ⊆ Ωwbool.

  • MP séquentiel équivaut à l'affirmation que ΩΣ₁(séq) ⊆ Ωclass.

  • LLPO séquentiel équivaut à l'affirmation que (ΩΣ₁(séq))² ⊆ (Ω²)DM.

  • WLLPO séquentiel équivaut à l'affirmation que (ΩΠ₁(séq))² ⊆ (Ω²)DM.

    WLLPO séquentiel est aussi équivalent à l'affirmation que Ω¬¬Δ₁(séq) = Ωbool (i.e, l'inclusion Ωbool ⊆ Ω¬¬Δ₁(séq) qui a de toute façon lieu est, en fait, une égalité), ou d'ailleurs, que Ω¬¬Δ₁(séq) ⊆ Ωwbool.

Démonstration des équivalences :

L'équivalence de LPO avec ΩΣ₁(séq) ⊆ Ωbool est essentiellement notre définition de LPO sur les suites binaires : dire que pour toute suite binaire on a u0u=0 signifie exactement que la valeur de vérité p := ⟦u0⟧ de u0 vérifie p∨¬p (en se rappelant que u=0 est la négation de u0).

L'équivalence de WLPO avec ΩΣ₁(séq) ⊆ Ωwbool est analogue ; pour son équivalence avec ΩΠ₁(séq) ⊆ Ωbool, il suffit de prendre cette fois p := ⟦u=0⟧ ; et l'équivalence avec ΩΠ₁(séq) ⊆ Ωwbool s'obtient en se rappelant que ¬¬(u=0) équivaut à ¬¬¬(u0) soit ¬(u0) soit u=0, ou si on préfère que Ωbool = Ωclass ∩ Ωwbool.

Le cas de MP est tout aussi simple.

Pour LLPO, dire que (¬((u0) ∧ (v0))) ⇒ ((u=0) ∨ (v=0)) signifie que les valeurs de vérité p := ⟦u0⟧ et q := ⟦v0⟧ vérifient (¬(pq)) ⇒ (¬p ∨ ¬q), c'est-à-dire (p,q) ∈ (Ω²)DM, d'où l'équivalence de LLPO avec (ΩΣ₁(séq))² ⊆ (Ω²)DM.

Pour WLLPO, on se rappelle qu'on en a vu deux formulations (équivalentes dans le cas séquentiel mais pas dans le cas analytique). Une formulation (qui mérite peut-être le nom de MLLPO), sans l'hypothèse Ⓗ, affirme que (¬((u=0) ∧ (v=0))) ⇒ ((¬(u=0)) ∨ (¬(v=0))) (pour toutes suites binaires u,v), ce qui signifie que les valeurs de vérité p := ⟦u=0⟧ et q := ⟦v=0⟧ vérifient (¬(pq)) ⇒ (¬p ∨ ¬q), c'est-à-dire (p,q) ∈ (Ω²)DM, d'où l'équivalence de WLLPO (dans sa formulation « MLLPO ») avec (ΩΠ₁(séq))² ⊆ (Ω²)DM.

L'autre formulation de WLLPO, avec cette hypothèse Ⓗ, affirme que ((¬((u0) ∧ (v0))) ∧ (¬((u=0) ∧ (v=0)))) ⇒ ((¬(u=0)) ∨ (¬(v=0))). Mais l'hypothèse (¬((u0) ∧ (v0))) ∧ (¬((u=0) ∧ (v=0))), sur les valeurs de vérité p := ⟦u0⟧ et q := ⟦v0⟧, s'écrit (¬(pq)) ∧ (¬(¬p ∧ ¬q)), qui équivaut à ¬q ⇔ ¬¬p par pure logique. La formulation dit donc que si p ∈ ΩΣ₁(séq) et que ¬¬p ∈ ΩΠ₁(séq) alors on a p ∈ Ωwbool, ce qui revient à dire, sur ¬¬p, que Ω¬¬Δ₁(séq) ⊆ Ωbool, ce qui revient encore à Ω¬¬Δ₁(séq) ⊆ Ωwbool puisque Ωbool = Ωclass ∩ Ωwbool. ∎

Tout ceci suggère plein d'autres principes d'omniscience potentiellement intéressant. Par exemple le principe ΩΔ₁(séq) = Ωbool (qui est impliqué par WLLPO), qu'on peut reformuler ainsi : si on a deux suites binaires (qu'on peut supposer croissantes) u,v telles que v soit nulle si et seulement si u a un terme non nul, alors soit u est nulle soit elle a un terme non nul : ∀u∈ℕ.∀v∈ℕ.((u0v=0) ⇒ (u=0u0)).

☞ Des « principes d'ignorance » ?

On peut aussi être tenté de considérer des principes d'ignorance : au lieu d'affirmer que les ΩΣ₁(séq)Π₁(séq)Δ₁(séq) sont petits, on peut au contraire postuler qu'ils sont gros : par exemple, le schéma de Kripke (évoqué ici) postule que ΩΣ₁(séq) = Ω tout entier (donc si on combine ça avec LPO ça nous donne immédiatement le tiers exclu Ωbool = Ω) ; mais peut-être que Ωclass ⊆ Ω¬¬Σ₁(séq) ou bien Ωclass ⊆ ΩΠ₁(séq), ou encore Ωclass ⊆ Ω¬¬Δ₁(séq) (la conjonction des deux) sont des principes plus raisonnables, des sortes d'anti-Markov. La même page que je viens de lier propose aussi un principe faible des possibilités finies (?) qui, dans le langage que j'ai utilisé ci-dessus, affirme que Ω¬¬Σ₁(séq) = ΩΠ₁(séq).

Bon, ça n'a pas énormément de sens de multiplier les principes comme ça si je ne propose aucun moyen de montrer leur indémontrabilité relative, i.e., de construire des modèles qui en vérifient certains et pas d'autres, et comme rien dans ce billet ne parle de contre-modèles, et que je n'ai pas du tout réfléchi aux principes évoqués aux deux paragraphes précédents, il vaut mieux que je m'arrête ici pour les principes séquentiels.

☞ Valeurs de vérité définies par des réels

L'idée, ensuite, c'est qu'on peut refaire presque exactement la même pour les principes analytiques. On définit :

  • L'ensemble ΩΣ₁(anal) := {p∈Ω : ∃x∈ℝ.(px⋕0)} = {⟦x⋕0⟧ : x∈ℝ} sera l'ensemble des valeurs de vérité d'énoncés du type le réel x est discerné de 0.

    Vu que x⋕0 équivaut à |x|>0 et que, inversement, x>0 équivaut à (0⊔x)⋕0, on peut aussi décrire ΩΣ₁(anal) comme l'ensemble {⟦x>0⟧ : x∈ℝ} des valeurs de vérité d'énoncés du type le réel x est strictement positif (et bien sûr ça marche aussi avec strictement négatif).

  • L'ensemble ΩΠ₁(anal) := {p∈Ω : ∃x∈ℝ.(px=0)} = {⟦x=0⟧ : x∈ℝ} sera l'ensemble des valeurs de vérité d'énoncés du type le réel x est nul.

    Vu que x=0 équivaut à (-|x|)≥0 et que, inversement, x≥0 équivaut à (0⊔(-x))=0, on peut aussi décrire ΩΠ₁(anal) comme l'ensemble {⟦x≥0⟧ : x∈ℝ} des valeurs de vérité d'énoncés du type le réel x est positif au sens large (et bien sûr ça marche aussi avec négatif au sens large).

    Comme x=0 est la négation de x⋕0, on peut aussi dire que ΩΠ₁(anal) = ¬[ΩΣ₁(anal)] := {¬q : q∈ΩΣ₁(anal)}. En particulier, on a ΩΠ₁(anal) ⊆ Ωclass (puisque Ωclass est l'ensemble des ¬q pour tous les q∈Ω).

  • L'ensemble ΩΔ₁(anal) := ΩΣ₁(anal) ∩ ΩΠ₁(anal) sera l'intersection des deux précédents.

  • L'ensemble Ω¬¬Σ₁(anal) := {p∈Ω : ∃x∈ℝ.(p ⇔ ¬(x=0))} = {⟦¬(x=0)⟧ : x∈ℝ} sera l'ensemble des valeurs de vérité d'énoncés du type le réel x n'est pas nulle.

    On peut aussi dire que Ω¬¬Σ₁(anal) = ¬[ΩΠ₁(anal)] := {¬q : q∈ΩΠ₁(anal)}, ou encore que Ω¬¬Σ₁(anal) = ¬¬[ΩΣ₁(anal)] := {¬¬r : r∈ΩΣ₁(anal)}.

  • L'ensemble Ω¬¬Δ₁(anal) := Ω¬¬Σ₁(anal) ∩ ΩΠ₁(anal) sera l'intersection des deux précédents. C'est aussi ¬¬[ΩΔ₁(anal)] (comme je vais le rappeler plus bas).

De nouveau, on a : Ωbool ⊆ ΩΔ₁(anal) ⊆ Ω¬¬Δ₁(anal) ⊆ Ωclass.

Par ailleurs, ΩΣ₁(séq) ⊆ ΩΣ₁(anal) (puisque donné u∈ℕ on a u⋕∞ si et seulement si (2u)⋕0) ; il s'ensuit que ΩΠ₁(séq) ⊆ ΩΠ₁(anal) et ΩΔ₁(séq) ⊆ ΩΔ₁(anal) et Ω¬¬Σ₁(séq) ⊆ Ω¬¬Σ₁(anal) et Ω¬¬Δ₁(séq) ⊆ Ω¬¬Δ₁(anal).

Les parties d'un ensemble X dont la fonction indicatrice tombe dans ΩΣ₁(anal), resp. ΩΠ₁(anal), resp. ΩΔ₁(anal), peuvent se dire analytiquement semi-décidables, resp. analytiquement co-semi-décidables, resp. analytiquement bi-semi-décidables. (Et de nouveau, cette terminologie pose plein de problèmes, donc en fait ce n'est peut-être pas une super idée.) L'exemple archétypique d'une partie analytiquement semi-décidable est l'ensemble des réels strictement positifs ; et l'exemple archétypique d'une partie analytiquement co-semi-décidable est le singleton {0}.

☞ Reformulation des principes analytiques d'omniscience

De nouveau, on peut faire le lien avec les principes d'omniscience, analytiques cette fois, en recopiant presque verbatim ce que j'ai dit pour les principes séquentiels, sauf pour WLLPO où il faut faire un petit peu attention :

  • LPO analytique équivaut à l'affirmation que ΩΣ₁(anal) = Ωbool (i.e, l'inclusion Ωbool ⊆ ΩΣ₁(anal) qui a de toute façon lieu est, en fait, une égalité).

  • WLPO analytique équivaut à l'affirmation que ΩΣ₁(anal) ⊆ Ωwbool, ou, si on préfère, que ΩΠ₁(anal) = Ωbool (i.e, l'inclusion Ωbool ⊆ ΩΠ₁(anal) qui a de toute façon lieu est, en fait, une égalité), ou d'ailleurs, que ΩΠ₁(anal) ⊆ Ωwbool.

  • MP analytique équivaut à l'affirmation que ΩΣ₁(anal) ⊆ Ωclass.

  • LLPO analytique équivaut à l'affirmation que (ΩΣ₁(anal))² ⊆ (Ω²)DM.

  • Ce que j'ai appelé MLLPO analytique ci-dessus (qui équivaut, par exemple, à l'affirmation que la non-égalité sur ℝ est cotransitive) équivaut à l'affirmation que (ΩΠ₁(anal))² ⊆ (Ω²)DM.

  • WLLPO analytique est équivalent à l'affirmation que Ω¬¬Δ₁(anal) = Ωbool (i.e, l'inclusion Ωbool ⊆ Ω¬¬Δ₁(anal) qui a de toute façon lieu est, en fait, une égalité), ou d'ailleurs, que Ω¬¬Δ₁(anal) ⊆ Ωwbool.

Le parallélisme entre les principes analytiques et les principes séquentiels est assez satisfaisant, mais je note quand même que je suis un peu contrarié de n'avoir aucune idée de comment définir un ΩΣ₂(anal), par exemple.

Je n'ai pas non plus eu le courage d'essayer de donner une traduction sur les valeurs de vérité principe de Markov faible (WMP) dont j'ai parlé dans une section optionnelle ci-dessus.

Voilà, je vais arrêter là ce billet, et probablement cette série. Si je devais continuer cette série de billet, le suivant devrait probablement être consacré à la topologie générale (et à certaines des notions qui n'ont d'intérêt qu'en maths constructives, par exemple celle de partie « topologiquement localisée » ou « relativement sobre »), mais je doute d'avoir le courage de me lancer là-dedans, au moins sous forme de billet de blog : si vous voulez en savoir plus, consultez l'article de Grayson en deux parties sur le sujet, ici et . L'autre chose dont je pourrais éventuellement parler, ce sont les topologies de Lawvere-Tierney et des faisceaux pour elles (tout ça peut se définir de façon complètement interne, sans jamais parler de topos ; je renvoie à ici pour des bribes d'explications, et pour un rapport avec d'autres sujets dont j'ai parlé).

↑Entry #2841 [older| permalink|newer] / ↑Entrée #2841 [précédente| permalien|suivante] ↑

[Index of all entries / Index de toutes les entréesLatest entries / Dernières entréesXML (RSS 1.0) • Recent comments / Commentaires récents]