Je continue (et termine ?) ma série d'introduction aux mathématiques constructives en parlant maintenant de suites de réels et de principes analytique d'omniscience. Ce billet (partie 4) est la continuation directe de celui d'il y a trois jours, et contrairement à ceux d'avant qui étaient un peu indépendants, celui-ci fait directement suite à la partie 3 puisque, en fait, j'ai coupé un texte extrêmement long en deux. Néanmoins, j'ai quand même ajouté un bref récapitulatif au début avec les choses les plus importantes à retenir de la partie 3.
Table des matières (de toute la série)
Partie 0 (histoire, motivations et principes) :
Partie 1 (un peu de théorie des ensembles) :
- Avant-propos
- Rappel du contexte et quelques notations
- Ensembles vides et habités, singletons, sous-terminaux, valeurs de vérité
- Produits, fonctions, injections, surjections, bijections
- L'ensemble Ω des valeurs de vérité
- Quelques notions constructives sans intérêt en maths classiques
- L'axiome du choix (ne sera pas admis)
Partie 2 (entiers naturels et principes d'omniscience) :
Partie 3 (les nombres réels et leur ordre) :
Partie 4 (suites de réels et principes analytiques d'omniscience) :
Récapitulatif des points essentiels de l'épisode précédent
Pour la commodité du lecteur, je recopie ici les points qui me semblent les plus importants du billet précédent.
‣ Un nombre réel ou coupure de Dedekind est un couple (S,T) de parties de ℚ, vérifiant :
- S et T sont habités : ∃r∈ℚ.(r∈S) et ∃r∈ℚ.(r∈T) ;
- S est un ensemble inférieur et T est un ensemble supérieur : ∀r∈ℚ.∀r′∈ℚ.((r′<r ∧ r∈S) ⇒ r′∈S) et ∀r∈ℚ.∀r′∈ℚ.((r′>r ∧ r∈T) ⇒ r′∈T) ;
- S est ouvert vers le haut, et T est ouvert vers le bas : ∀r∈ℚ.(r∈S ⇒ ∃r′∈ℚ.(r′>r ∧ r′∈S)) et ∀r∈ℚ.(r∈T ⇒ ∃r′∈ℚ.(r′<r ∧ r′∈T)) ;
- tout élément de S est strictement plus petit que tout élément de T : soit ∀s∈ℚ.∀t∈ℚ.((s∈S ∧ t∈T) ⇒ (s<t)) ;
- si un rationnel est strictement plus petit qu'un autre, alors soit le plus petit est dans S, soit le plus grand est dans T : soit ∀s∈ℚ.∀t∈ℚ.((s<t) ⇒ (s∈S ∨ t∈T)).
‣ On définit deux relations binaires sur l'ensemble ℝ des nombres réels, appelées ‘≤’ (l'ordre large) et ‘<’ (l'ordre strict), de la façon suivante :
- on pose (S,T) ≤ (S′,T′) (ou, de façon synonyme, (S′,T′) ≥ (S,T)) lorsque S⊆S′, ou, ce qui revient au même, T⊇T′ ;
- on pose (S,T) < (S′,T′) (ou, de façon synonyme, (S′,T′) > (S,T)) lorsqu'il existe d>0 rationnel tel que S+d ⊆ S′, ou, ce qui revient au même, lorsque T∩S′ est habité.
Ces relations généralisent celles du même nom sur ℚ. La relation stricte ‘<’ implique la relation large ‘≤’. Les deux relations ‘<’ et ‘≤’ sont transitives ; ‘<’ est irréflexive et strictement antisymétrique, tandis que ‘≤’ est réflexive et antisymétrique au sens large ; on a aussi la transitivité mixte (si x<y≤z, ou si x≤y<z, alors on a x<z). Par ailleurs, si x = (x←, x→) où x← := {s∈ℚ : s<x} et x→ := {t∈ℚ : t>x}.
‣ L'ensemble ℚ est dense et cofinal dans ℝ, c'est-à-dire que si x<x′ sont des réels, il r rationnel tel que x<r<x′, et si si x est un réel, il existe r et r′ rationnels tels que r<x<r′.
‣ L'ordre large est la négation de l'ordre strict de sens contraire, c'est-à-dire que x≤y équivaut à ¬(x>y). Notamment, x=y équivaut à ¬(x⋕y) où ‘⋕’, défini par x⋕y :⇔ (x<y ∨ x>y), s'appelle le discernement standard sur ℝ.
‣ On ne peut pas affirmer que pour tous réels x,y on ait x≤y ou bien x≥y. Néanmoins, on a la propriété essentielle suivante :
(❀) : Si x<x′ et y sont des réels, on a soit x<y soit y<x′.
‣ On note x⋖y pour ¬(x≥y) ou, ce qui est équivalent, x≤y ∧ ¬(x=y) (cette relation x⋖y est impliquée par x<y, mais on ne peut pas affirmer que ce soit équivalent).
‣ Deux réels x,y ont toujours une borne supérieure x⊔y caractérisée par le fait que x⊔y ≤ z si et seulement si x≤z et y≤z. Elle vérifie de plus les propriétés que ① x⊔y < z si et seulement si x<z et y<z, et ② z < x⊔y si et seulement si z<x ou bien z<y. (En revanche, on ne peut pas affirmer qu'on ait z ≤ x⊔y si et seulement si z≤x ou bien z≤y.) Les propriétés duales valent pour la borne inférieure x⊓y.
‣ On définit une addition sur les réels qui prolonge celle de ℚ et fait d'eux un ℚ-espace vectoriel, avec de plus la compatibilité à l'ordre : on a x≤y si et seulement si y−x ≥ 0 et x<y si et seulement si y−x > 0 ; si x≥0 et y≥0 alors x+y ≥ 0 ; si x>0 et y>0 (ou même seulement x>0 et y≥0) alors x+y > 0 ; si x>0 alors r·x > 0 pour tout r>0 rationnel, et −x < 0.
‣ On définit aussi une multiplication sur les réels qui prolonge celle de ℚ et fait d'eux une ℚ-algèbre commutative, avec de plus la compatibilité à l'ordre : si x≥0 et y≥0 alors x·y ≥ 0 ; si x>0 et y>0 alors x+y > 0.
‣ La valeur absolue d'un réel se définit par |z| := z⊔(−z). Ainsi, on a toujours |z|≥0. On a |x−y| = (x⊔y) − (x⊓y). On a l'inégalité triangulaire habituelle |x+y| ≤ |x| + |y|. On a de plus : |x·y| = |x|·|y|.
La propriété |z|>0 équivaut à z>0 ∨ z<0 (ce qu'on a par ailleurs noté z⋕0). Cela équivaut aussi à l'inversibilité de z pour la multiplication.
Infima et suprema sur les réels
☞ Quelques difficultés
Classiquement, toute partie A⊆ℝ
non vide et minorée admet une borne inférieure (une borne
inférieure de A est un plus grand minorant, s'il
existe, autrement dit, z est une borne inférieure
de A
signifie d'une part
que z minore A,
i.e. ∀t∈A.(z≤t), et
d'autre part que si x minore A
alors x≤z, i.e.
∀x∈ℝ.((∀t∈A.(x≤t))
⇒ x≤z)). On a vu que, constructivement, toute
partie finiment énumérée et habitée
{z1,…,zk}
(avec k≥1) de ℝ admet une borne
inférieure z1⊓⋯⊓zk
et une borne
supérieure z1⊔⋯⊔zk.
Néanmoins, constructivement, on ne peut pas
affirmer que toute partie non vide et minorée, ni même toute
partie habitée et minorée, possède une borne inférieure. Un
contre-exemple brouwérien est vite trouvé :
Contre-exemple brouwérien : Si toute partie habitée et minoré de ℝ possède une borne inférieure, alors pour tout p∈Ω on a ¬p ∨ ¬¬p (la loi faible du tiers exclu).
(Notamment, on ne peut pas affirmer que toute partie habitée et minoré de ℝ possède une borne inférieure, puisqu'on ne peut pas affirmer la loi faible du tiers exclu, cf. ci-dessous)
Démonstration : Si p est une valeur de vérité, considérons la partie A := {0 : p} ∪ {1} de ℝ, c'est-à-dire {t∈ℝ : (t=0 ∧ p) ∨ (t=1)}. Supposons que A ait une borne inférieure z. D'après la proposition (❀) on doit avoir soit z>0 soit z<1. Dans le premier cas (z>0), comme z est un minorant de A, on a ¬(0∈A), c'est-à-dire qu'on a ¬p. Dans le second cas (z<1), 1 n'est pas un minorant de A, donc ¬p est impossible (car ¬p implique que A={1}) : c'est donc que ¬¬p. Bref, on a montré ¬p ∨ ¬¬p. ∎
La loi faible du tiers exclu n'est pas la même chose que la loi du tiers exclu (elle ne l'implique pas), mais c'est néanmoins, comme les différents principes d'omniscience évoqués plus hauts, un « tabou » constructif, et il est donc standard de s'en servir pour des contre-exemples brouwériens.
On remarquera que la démonstration ci-dessus montre même que si toute partie habitée de ℕ possède une borne inférieure, la loi faible du tiers exclu vaut (et j'avais déjà fait remarquer qu'exactement le même contre-exemple montre que si toute partie habitée de ℕ possède un plus petit élément, la loi du tiers exclu vaut).
Pour ce qui est des réels étendus bornés (définis, je le rappelle, par les coupures de MacNeille, c'est-à-dire en affaiblissant (e) en (e⁻)), j'ai déjà expliqué dans la section les concernant que le principe de la borne inférieure vaut pour eux, et d'ailleurs on peut même les définir comme le complété des rationnels — ou, du coup, des réels de Dedekind — pour la propriété de la borne inférieure. Le contre-exemple brouwérien donné ci-dessus montre du coup que l'égalité des coupures de MacNeille et de Dedekind implique la loi faible du tiers exclu, et je l'ai déjà commenté.
Cet exemple montre essentiellement qu'on doit décider de sacrifier soit la propriété de la borne inférieure soit la propriété (❀) (sauf à avoir la loi faible du tiers exclu, ce qui est un tabou) : les coupures de Dedekind font le choix de sacrifier la première (tandis que les coupures de MacNeille font le choix de sacrifier la seconde, mais elles sont beaucoup moins utiles). Maintenant, il est quand même bien pratique de pouvoir prendre des bornes inférieures : je vais chercher à donner une propriété d'une partie A⊆ℝ qui assure son existence.
☞ Borne inférieure (faible) versus infimum (fort)
Mais tout d'abord, il faut revoir la définition, et introduire une distinction :
Si A⊆ℝ, on dit que z est la borne inférieure ou inf faible de A lorsque z est le plus grand minorant de A, c'est-à-dire [je recopie la définition ci-dessus] que z minore A, i.e. ∀t∈A.(z≤t), et d'autre part que si x minore A alors x≤z, i.e. ∀x∈ℝ.((∀t∈A.(x≤t)) ⇒ x≤z).
Si A⊆ℝ, on dit que z est l'infimum ou inf (fort) de A lorsque z minore A, i.e. ∀t∈A.(z≤t), et d'autre part que si x>z alors il existe un élément de A entre les deux, i.e. ∀x∈ℝ.(z<x ⇒ ∃t∈A.(t<x)).
On fait évidemment les définitions duales de borne supérieure (ou sup faible) et de supremum (ou sup (fort)) en inversant toutes les inégalités.
La terminologie est de moi. En anglais on utilise
généralement (mais pas systématiquement) greatest
lower bound
pour la première notion,
et infimum
pour la seconde. J'ai essayé de dire
quelque chose de cohérent et pas trop idiot.
Classiquement, ces notions sont équivalentes, puisque la première condition (minorer A) est la même, et que la seconde est juste écrite sous forme contraposée.
Constructivement, la borne inférieure, si elle existe, est
forcément unique (c'est évident), et d'autre part, l'inf, s'il
existe, est la borne inférieure (car la
condition (∀t∈A.(x≤t))
⇒ x≤z
est
exactement (¬∃t∈A.(t<x))
⇒ ¬(z<x)
, qui est logiquement impliquée
par z<x ⇒
∃t∈A.(t<x)
).
Mais on ne peut pas affirmer que la borne
inférieure, même si elle existe, est forcément l'inf, à cause de la
proposition suivante :
Proposition : Si toute partie de ℝ possédant une borne inférieure possède un infimum (fort !), alors la loi du tiers exclu vaut.
Démonstration : Si p est une valeur de vérité, considérons la partie A := {0 : p∨¬p} ∪ {1} de ℝ, c'est-à-dire {t∈ℝ : (t=0 ∧ (p∨¬p)) ∨ (t=1)}.
Montrons que la borne inférieure (inf faible !) de A existe et vaut 0. Il est évident que 0 minore A. Maintenant, supposons que x minore A ; mais x>0 est alors impossible : car cela impliquerait ¬(0∈A), c'est-à-dire ¬(p∨¬p), qui est faux ; on a ainsi prouvé ¬(x>0), c'est-à-dire x≤0. Ceci montre bien que 0 est le plus grand minorant de A, c'est-à-dire sa borne inférieure.
Supposons maintenant que A ait un infimum, qui d'après ce qui a été dit, est forcément égal à 0. On aurait donc : ∀x∈ℝ.(0<x ⇒ ∃t∈A.(t<x)). Appliquant ce fait à x=½ et en utilisant le fait que tout élément <½ de A est égal à 0, on aurait 0∈A, c'est-à-dire p∨¬p. ∎
Bref, la notion d'inf (fort) est effectivement constructivement plus forte que celle de borne inférieure, et elle sera généralement plus utile, au moins dans les réels. (En gros, la notion de borne supérieure ou borne inférieure est la notion générale dans les structures ordonnées — par exemple c'est celle qui sert pour définir la structure de treillis — tandis que la notion de supremum on d'infimum est pertinente pour des structures qui ont en plus une propriété de densité, comme les réels.)
Si A⊆ℝ a un minimum (c'est-à-dire un élément, forcément unique, qui minore A au sens large), alors ce minimum z est aussi l'infimum de A (puisque pour tout x>z on a l'élément z lui-même de A qui est <x). Bref, on a les implications minimum ⇒ infimum (fort) ⇒ borne inférieure (faible).
☞ Parties localisées inférieurement, et existence d'infima
Voici une propriété qui peut aider à prouver l'existence d'un infimum :
On dit qu'une partie A⊆ℝ est localisée inférieurement lorsque quand u<v sont deux réels, soit u minore A, soit il existe un élément dans A qui est <v. Autrement dit : ∀u∈ℝ.∀v∈ℝ.((u<v) ⇒ ((∀t∈A.(u≤t)) ∨ (∃t∈A.(t<v)))).
Classiquement, bien sûr, la propriété d'être localisée inférieurement évoquée dans cette proposition est tautologiquement vraie pour n'importe quelle partie. Constructivement, il faut y penser comme une capacité à placer l'infimum recherché dans un intervalle [u,v[ arbitrairement petit. Si vous voulez un exemple simple de partie dont on ne puisse pas affirmer constructivement qu'elle soit localisée inférieurement, l'exemple de {0 : p} ∪ {1}, où p est une valeur de vérité, est assez parlant (même classiquement, quel est l'inf de l'ensemble formé des réels qui valent soit 1, soit 0 à condition que l'hypothèse de Riemann soit vraie ? classiquement cet inf a un sens, mais on ne sait même pas l'approximer numériquement). Cet exemple est habité et borné, mais bien sûr si on veut un exemple encore plus simple d'un ensemble dont on ne puisse pas affirmer qu'il soit localisé inférieurement, on pourra prendre {x∈ℝ : p} où p est une valeur de vérité indépendante de x (s'il est localisé inférieurement, alors p∨¬p).
Proposition : Supposons A⊆ℝ habitée, minorée, et localisée inférieurement. Alors A admet un infimum (fort !).
Démonstration : On définit S := {r∈ℚ : ∃z>r.∀t∈A.(z≤t)} l'ensemble des rationnels strictement plus petits qu'un minorant de A, et d'autre part T := {r∈ℚ : ∃x∈A.(x<r)} l'ensemble des rationnels strictement supérieurs à un élément de A.
Vérifions que (S,T) est une coupure de Dedekind. Re (a) : l'hypothèse que A est habité assure que T est habité, et l'hypothèse que A est minoré assure que S est habité. Re (b) : il est évident qu'un rationnel plus petit qu'un élément de S est encore dans S et qu'un rationnel plus grand qu'un élément de T est encore dans T. Re (c) : il est aussi facile de voir que si r∈S on peut trouver r′>r encore dans S (utiliser la densité de ℚ pour trouver r′ strictement entre r et le minorant z>r de A dont on affirme l'existence), et de même que si r∈T on peut trouver r′<r encore dans T (utiliser la densité de ℚ pour trouver r′ strictement entre r et l'élément x<r de A dont on affirme l'existence). Re (d) : si s∈S et t∈T, il existe z>s qui minore A et x<t qui est dans A, donc s<z≤x<t et notamment s<t.
Enfin, re (e) : si s<v sont deux rationnels, en appelant u := (s+v)/2 leur milieu, si bien que s<u<v, la propriété de localisation inférieure supposée sur A assure que soit u minore A, auquel cas s∈S, soit A a un élément <v, ce qui signifie v∈T.
Tout ça mis ensemble signifie exactement que (S,T) est une coupure de Dedekind, c'est-à-dire définit un réel a.
Si x∈A, alors tout rationnel r>x est dans T par définition de celui-ci, c'est-à-dire que la coupure supérieure définissant x est incluse dans la coupure supérieure (T) définissant a, ce qui est exactement la définition de a≤x. Ceci montre que a minore A.
Enfin, si x>a, par densité des rationnels il existe r∈ℚ tel que a<r<x, donc r∈T, ce qui assure l'existence d'un y∈A qui soit <r et en particulier <x. Ceci montre bien que a est l'infimum de A. ∎
Cette proposition était facile parce qu'on a, en gros, mis dans la
notion de partie localisée inférieurement
exactement ce qu'il
fallait pour obtenir la conclusion (c'est-à-dire surtout le
propriété (e) des coupures de Dedekind — en fait, de la coupure de
MacNeille qu'on obtient automatiquement).
Si on y repense, la proposition (❀) vue plus haut signifie exactement que tout singleton {z} est localisé inférieurement (puisqu'elle nous dit que si u<v alors soit u<z soit z<v, ces deux dernières inégalités étant indifféremment strictes ou larges). Bien sûr, l'infimum de {z} est simplement z.
☞ Les parties habitées finiment énumérées ont un infimum
J'ai déjà dit plus haut que toute partie {z1,…,zk} (avec k≥1) de ℝ (c'est-à-dire finiment énumérée et habitée) admet une borne inférieure z1⊓⋯⊓zk. En fait, cette borne inférieure est même un infimum (fort) : ceci résulte de la proposition précédente et de celle qui suit :
Proposition : Si A,B sont deux parties localisée inférieurement, alors A∪B est localisée inférieurement. Par conséquence, quel que soit l'entier k≥0 et les réels z1,…,zk, la partie {z1,…,zk} est localisée inférieurement.
Démonstration : Montrons la première affirmation. Supposons donc A,B localisées inférieurement. On veut montrer que A∪B est localisée inférieurement. Pour cela, soient u<v. Comme A est localisée inférieurement, soit u minore A, soit A a un élément <v. De même, soit u minore B, soit B a un élément <v. Si u minore à la fois A et B, alors il minore A∪B ; et dans chacun des trois autres cas, A∪B a un élément <v : donc on a bien prouvé que A∪B est localisé inférieurement.
Comme on a déjà expliqué que les singletons sont localisés inférieurement par la propriété (❀), ceci montre que si A est localisée inférieurement et que z∈ℝ, alors A∪{z} est localisée inférieurement.
Comme il est trivial que ∅ est localisé inférieurement (tout réel en est un minorant), une récurrence immédiate sur k montre que toute partie finiment énumérée {z1,…,zk} est localisée inférieurement. ∎
Il va de soi que tout ce que j'ai dit se dualise sans problème : on dira qu'une partie A⊆ℝ est localisée supérieurement lorsque quand u<v sont deux réels, soit v minore A, soit il existe un élément dans A qui est >u ; autrement dit : ∀u∈ℝ.∀v∈ℝ.((u<v) ⇒ ((∀t∈A.(t≤v)) ∨ (∃t∈A.(u<t)))). Et on a alors les faits analogues de ce que j'ai dit sur l'infimum, notamment : toute partie de ℝ habitée, majorée et localisée supérieurement admet un supremum (fort) ; et les parties finiment énumérées de ℝ sont localisées supérieurement, donc les parties finiment énumérées et habitées de ℝ admettent un supremum (fort).
Il existe toutes sortes de variations autour de la notion de partie localisée. La suivante, assez naturelle, doit convenir pour assurer l'existence d'infima et de suprema (combinée, bien sûr, au fait d'être habitée et bornée) : ∀δ>0.∃η>0.∀x∈ℝ.((∃y∈A.(|x−y|<δ)) ∨ ¬(∃y∈A.(|x−y|<η))). En revanche, on ne peut pas affirmer que la variation suivante, même pour une partie habitée de [0,1], suffise à garantir l'existence d'un infimum : ∀x∈ℝ.∀δ>0.((∃y∈A.(|x−y|<δ)) ∨ (∃η>0.¬∃y∈A.(|x−y|<η))). Voir ici pour plus de détails et des références à ce sujet.
Suites de nombres réels
Suites convergentes et suites de Cauchy
☞ Convergence et convergence modulée
Une suite de réels est, bien sûr, une fonction ℕ→ℝ (et on note généralement quelque chose comme xi l'image de n par la fonction) : rien de nouveau ici.
On dit qu'une suite (xi) de
réels tend ou converge (ou, pour
insister, converge simplement
)
vers x∞, ou qu'elle a x∞
comme limite, lorsque, comme en maths classiques :
∀ε>0.∃n∈ℕ.∀i≥n.(|xi−x∞|<ε).
Bien sûr, grâce à la densité de ℚ dans ℝ, il ne change rien ici
d'imposer à ε d'être rationnel, ou même d'être de la forme,
disons, 2−m (puisque tout rationnel strictement
positif majore un rationnel de cette forme) ; on peut aussi remplacer
la dernière inégalité stricte par une inégalité large sans rien
changer.
On dira qu'une suite
(xi) converge de façon
modulée vers x∞ (ou qu'elle tend de façon
modulée, ou modulément
si on me pardonne ce néologisme ; ou
encore, que la convergence est modulée) lorsque
∃ν:ℕ→ℕ.∀m∈ℕ.∀i≥ν(m).(|xi−x∞|<2−m).
D'après ce qui a été dit sur le fait de pouvoir prendre ε
de la forme 2−m, la convergence modulée implique
la convergence au sens du paragraphe précédent (convergence non
supposée modulée
s'il y a besoin de souligner).
Classiquement ou bien en présence de l'axiome du choix dénombrable, toute convergence est automatiquement modulée : en effet, en présence de l'axiome du choix dénombrable, on peut, pour chaque m, choisir un n tel que ∀i≥n.(|xi−x∞|<2−m), et définir ν(m) comme le n choisi ; en fait, l'axiome du choix dénombrable pour les parties habitées de ℕ suffit, et en maths classiques cette forme de choix est démontrable car on peut prendre le plus petit élément. Mais dans les maths constructives sans choix, on ne peut pas affirmer que toute suite de réels qui tend vers zéro (disons) tende vers zéro de façon modulée.
Digression : Si on a une idée de
ce que sont les topos de faisceaux, ou même si on veut simplement se
faire une intuition de la différence entre la convergence et la
convergence modulée, une suite de réels
(ui) est représentée (de façon
externe dans un topos de faisceaux) par une suite de fonctions
continues, disons X→ℝ pour simplifier. Le fait que
(ui) converge
vers u∞ se traduit de façon externe
par : pour tout ε>0 il existe un recouvrement ouvert
(Vj)j∈J
de X tel que pour tout j∈J il
existe n∈ℕ tel que
si ξ∈Vj
et i≥n on ait
|ui(ξ) − u∞(ξ)| ≤ ε
.
En revanche, le fait que (ui)
converge modulément vers u∞ se traduit de façon
externe par : il existe un recouvrement ouvert
(Vj)j∈J
de X tel que pour tout ε>0 et pour
tout j∈J il existe n∈ℕ tel que
si ξ∈Vj
et i≥n on ait
|ui(ξ) − u∞(ξ)| ≤ ε
(donc en permutant le quantificateur universel sur
le ε>0 et le quantificateur existentiel sur le
recouvrement ouvert). Ces deux notions de convergence, que je suis
tenté de qualifier respectivement de convergence locale
et de
convergence localement uniforme
, sont strictement
intermédiaires entre la convergence ponctuelle (ou
convergence simple
) et la convergence uniforme : je renvoie
à cette
question MathOverflow pour une discussion un peu plus longue et
des contre-exemples à toutes les implications : notamment, la réponse
que j'ai reçue, réinterprétée de façon interne, montre que la
convergence n'entraîne pas en général la
convergence modulée.
☞ On ne peut pas affirmer qu'une suite croissante majorée ait une limite
Mais je ne veux pas trop insister ici sur la convergence modulée :
je l'ai mentionnée juste parce que c'est un point qui peut être source
de confusion (certains auteurs appellent convergence
ce que
j'appelle convergence modulée
). Le problème suivant est plus
sérieux et ne repose pas sur des questions de choix :
Classiquement, une suite de réels qui est décroissante et minorée, ou bien croissante et majorée, admet une limite. Constructivement, on ne peut pas l'affirmer. En effet :
Contre-exemple brouwérien : Soit (ui) une suite binaire (c'est-à-dire à valeurs dans {0,1}) croissante. Si elle a une limite b, alors : soit b=0 et la suite vaut constamment 0, soit b=1 et la suite prend la valeur 1 (et bien sûr elle est alors constamment égale à 1).
En particulier, si toute suite de réels croissante et majorée a une limite, alors le principe limité d'omniscience LPO vaut (je rappelle que LPO affirme que toute suite binaire est soit nulle soit a un terme égal à 1).
Démonstration : On a ¼<¾, donc par (❀), soit b<¾ soit b>¼. Si b<¾, (en prenant ε=¼ dans la définition de la convergence) on voit qu'il existe n tel que pour i≥n on ait ui<1, c'est-à-dire ui=0 puisqu'on a affaire à une suite binaire ; et comme elle est croissante, elle vaut en fait constamment 0. De même b>¼, (en prenant ε=¼ dans la définition de la convergence) on voit qu'il existe n tel que pour i≥n on ait ui>0, c'est-à-dire ui=1 puisqu'on a affaire à une suite binaire. ∎
☞ Le critère de Cauchy
On dit qu'une suite (xi) de réels est (simplement) de Cauchy lorsque, comme en maths classiques : ∀ε>0.∃n∈ℕ.∀i,j≥n.(|xi−xj|<ε). C'est évidemment le cas des suites convergentes. Comme précédemment, grâce à la densité de ℚ dans ℝ, il ne change rien ici d'imposer à ε d'être rationnel, ou même d'être de la forme, disons, 2−m ; on peut aussi remplacer la dernière inégalité stricte par une inégalité large sans rien changer. On dira que (xi) est modulément de Cauchy ou que sa cauchyïtude est modulée (désolé pour tous les néologismes) lorsque ∃ν:ℕ→ℕ.∀m∈ℕ.∀i,j≥ν(m).(|xi−xj|<2−m) : là aussi, les suites modulément de Cauchy sont de Cauchy, et les suites modulément convergentes sont modulément de Cauchy.
Les suites de Cauchy sont-elles convergentes ? Oui ! On va le prouver en commençant par le :
Lemme : L'image d'une suite de Cauchy (i.e., l'ensemble de ses valeurs) est une partie localisée inférieurement (et, bien sûr, supérieurement).
Démonstration : Considérons u<v deux réels, d'écart ε := v−u et de moyenne z := ½(u+v). La propriété de Cauchy permet de trouver un rang n à partir duquel deux termes xi,xj quelconques de la suite sont à distance <¼·ε. Posons B := {xi : i≥n}.
Comme z − ¼·ε < z + ¼·ε, par (❀), on a soit xn > z − ¼·ε soit xn < z + ¼·ε. Dans le premier cas, on en déduit xi > z − ½·ε = u pour tout i≥n, c'est-à-dire que u minore B ; dans le second cas, l'élément xi de B est <v. On vient donc de prouver que soit u minore B soit B a un élément <v.
Comme par ailleurs A := {x0,…,xn−1} est localisé inférieurement (on l'a vu plus haut), soit u minore A soit il existe un élément de A qui est <v. En mettant ces faits ensemble, sur A∪B on voit (comme on l'a fait pour montrer que la réunion de deux ensembles localisé inférieurement est localisée inférieurement) que soit u minore A∪B soit il existe un élément de A∪B qui est <v. Or A∪B est l'ensemble {xi : i∈ℕ} des termes de la suite. ∎
Théorème : Dans les réels de Dedekind, toute suite de Cauchy admet une limite.
Démonstration : Si (xi) est une suite de Cauchy, l'ensemble {xi} de ses valeurs est habité (trivialement), minoré (par la propriété de Cauchy) et localisée inférieurement (d'après le lemme). Comme on a vu qu'une partie habitée, minorée et localisée inférieurement a un infimum, inf {xi} a bien un sens, et plus généralement inf {xi : i≥n} en a un quel que soit n (retirer des termes au début d'une suite de Cauchy donne évidemment encore une suite de Cauchy). Symétriquement, sup {xi : i≥n} existe. Les inf {xi : i≥n} forment une suite croissante en n, et les sup {xi : i≥n} une suite décroissante. Ces suites sont elles-mêmes de Cauchy (car si |xi−xj|≤ε pour i,j≥m, alors |(inf {xi : i≥n}) − xm| ≤ ε pour tout n≥m, donc |(inf {xi : i≥p}) − (inf {xi : i≥q})| ≤ 2·ε pour tous p,q≥m). On peut donc prendre le sup de la première et l'inf de la seconde. On peut donc poser liminfi (xi) := supn infi≥n xi, et symétriquement limsupi (xi) := infn supi≥n xi. Mais la propriété de Cauchy permet facilement de voir qu'elles sont égales (leur écart est ≤ε pour tout ε>0).
Si z est cette valeur commune, et si ε>0, alors comme z−ε < liminfi (xi) = supn infi≥n xi, par définition du supremum, il existe n tel que infi≥n xi > z−ε, ce qui (comme l'infimum est un minorant) assure xi > z−ε pour tout i≥n. Symétriquement, on peut trouver un (autre) n tel que xi < z+ε pour tout i≥n ; et en prenant le plus grand de ces deux n, on a trouvé un n tel que |xi−z|<ε pour tout i≥n. ∎
On peut aussi se convaincre, par le caractère explicite du dernier paragraphe de cette démonstration, que toute suite modulément de Cauchy converge modulément. (C'est d'ailleurs également facile à déduire du théorème qui précède sans aller fouiller dans sa démonstration.)
Donc en fait convergent
équivaut à de Cauchy
, et
l'équivalence analogue vaut pour les propriétés modulées.
☞ Un mot sur les séries
On peut bien sûr développer une théorie des séries de nombres réels en définissant simplement la série (Σxi) comme la suite de ses sommes partielles (∑i<n xi), comme d'habitude. On dit que la série est convergente, resp. modulément convergente, resp. de Cauchy, resp. modulément de Cauchy, lorsque la suite de ses sommes partielles a la même propriété. On dit que la série est absolument convergente lorsque la série des valeurs absolues est convergentes, et on peut faire la même définition sous forme modulée. Comme en maths classiques, l'inégalité triangulaire permet de montrer :
Corollaire : Dans les réels de Dedekind, toute série absolument convergente est convergente.
À titre d'exemple, si (bi) est une suite binaire, c'est-à-dire à valeurs dans {0,1}, on peut définir le nombre réel ∑i bi·2−(i+1) (compris entre 0 et 1) dit défini par ce développement binaire.
⚠ Attention : Je dois souligner qu'en maths
constructives on ne peut pas l'affirmer qu'un
réel (entre 0 et 1, disons), même si je le suppose de Cauchy ou de
Cauchy modulé (ce terme sera défini ci-dessous), ou même si je suppose
l'axiome du choix dénombrable, ait nécessairement un développement
binaire, c'est-à-dire s'écrive sous la forme
∑i bi·2−(i+1)
avec bi∈{0,1}. Ce n'est pas un
problème de choix ici : c'est que l'existence d'un tel développement
assure (en regardant la valeur de b0) qu'on
a soit x≥½ soit x≤½, chose qu'on
ne peut pas affirmer en général, on verra ci-dessous le lien
avec LLPO analytique. (Cf. le problème à la fin
de ce
contrôle où je demandais en quelque sorte de prouver — évidemment
sans le dire comme ça — que dans le topos effectif
l'affirmation tous les réels entre 0 et 1 ont un développement
binaire
n'est pas valable, et que les réels ayant un développement
binaire ne sont même pas stables par addition.) En revanche, tout
réel de Cauchy modulé (entre −1 et 1, disons) peut au moins s'écrire
∑i bi·2−(i+1)
avec bi∈{−1,0,1} :
cf. cet
article pour les explications.
[Optionnel] Et les réels de Cauchy ?
☡ Guide de lecture : Hic sunt leones ! On peut survoler ou sauter cette section, qui n'est là en gros que parce que des gens insistent pour parler de réels de Cauchy.
☞ Réels de Cauchy et réels de Cauchy modulés
On dit qu'un réel de Dedekind est (simplement) de
Cauchy lorsqu'il est la limite d'une suite de rationnels. On
dit qu'il est modulément de Cauchy (ou que c'est
un réel de Cauchy modulé
voire un réel modulé
tout
court) lorsqu'il est la limite modulée d'une suite de rationnels.
Attention car la terminologie fluctue pas mal : beaucoup d'auteurs
disent juste de Cauchy
pour demander l'existence d'une suite
modulément de Cauchy de rationnels ; d'autres appellent ça un nombre
réel régulier
.
Notons qu'on peut simplifier un peu la définition d'un réel de Cauchy modulé : quitte à remplacer le module ν(n) par max(ν(0),…,ν(n)) et ensuite ri par rν(i), on peut supposer que |ri−x| < 2−i ; c'est-à-dire que x est un réel de Cauchy modulé lorsqu'il existe une suite (ri) de rationnels telle que ∀i∈ℕ.(|ri−x|<2−i).
Classiquement ou bien en présence de l'axiome du choix dénombrable, ces distinctions sont sans objet : tous les réels sont modulément de Cauchy. En effet, en présence de l'axiome du choix dénombrable, si x est un réel, on peut choisir un rationnel rn tel que x − 2−n < rn < x + 2−n, et alors la suite rn est modulément de Cauchy et converge vers x ; et classiquement, on peut prendre le premier rationnel (pour une énumération explicite quelconque de ℚ) dans l'intervalle qu'on vient de dire.
Mais constructivement et sans choix… c'est un peu le chaos. Bien que ℚ soit dense dans ℝ, on ne peut pas affirmer que tout réel soit de Cauchy, et on ne peut pas affirmer que tout réel de Cauchy soit modulément de Cauchy.
Par ailleurs, on ne peut même pas affirmer
que la limite d'une suite de Cauchy de réels de Cauchy soit un réel de
Cauchy, et même en saupoudrant le mot modulé
un peu partout ça
ne marche toujours pas : le problème est double, d'une part se donner
une suite de Cauchy de réels de Cauchy n'est pas la même chose que se
donner une suite double (parce que chaque réel de Cauchy est limite
d'une suite de Cauchy de rationnels, mais on n'a pas le moyen de les
choisir), et même si on se donne la suite double, une suite de Cauchy
de suites de Cauchy de rationnels ne permet pas forcément de fabriquer
une suite de Cauchy de rationnels ; les explications sont
dans ce
papier, qu'on peut compléter
par cette
petite note de ma part
(source
LaTeX ici), dont j'extrais notamment (en l'adaptant un peu)
l'énoncé positif un peu surprenant et subtil suivant (il partie du
folklore) :
☞ Modulation automatique
Proposition : Si x est un réel modulément de Cauchy, et si (si) est une suite de rationnels qui tend (sans hypothèse de modulation !) vers x, alors en fait cette convergence est automatiquement modulée.
(Autrement dit, si un réel est limite d'une suite de rationnels modulément convergente, alors toute suite de rationnels qui converge vers lui le fait de façon modulée. Dit de façon encore différente : si deux suites de rationnels ont la même limite et que la convergence de l'une est modulée, alors la convergence de l'autre est aussi modulée.)
Démonstration : Par hypothèse, il existe une suite de rationnels (ri) qui converge modulément vers x ; et comme expliqué ci-dessus, on peut supposer que |ri−x| < 2−i. On suppose que (si) est une suite de rationnels qui tend vers x et on veut montrer qu'elle le fait de façon modulée.
Soit n∈ℕ. Comme (si) tend vers x, il existe m, dont on peut certainement supposer m≥n+2, tel que i≥m implique |si−x| < 2−(n+2) ; par ailleurs, pour i≥m on a aussi |ri−x| < 2−(n+2) (puisque i≥n+2), et ces deux inégalités ensemble impliquent |si−ri| < 2−(n+1). On vient de montrer : (†) pour tout n∈ℕ il existe m≥n+2 tel que i≥m implique |si−ri| < 2−(n+1).
Maintenant, posons En := {m∈ℕ : m≥n+2 ∧ ∀i≥m.(|si−ri| < 2−(n+1))}. On vient de montrer que (†) En est habité pour tout n. Par ailleurs, j'affirme que En est décidable (je rappelle que ça signifie que pour tout m∈ℕ on a m∈En ou bien ¬(m∈En)). En effet, une fois qu'on a un m₀∈En, tout m≥m₀ est trivialement encore dans En, et pour ce qui est des m<m₀, on procède par récurrence décroissante sur m : d'une part si ¬(m∈En) alors certainement ¬((m−1)∈En), et d'autre part si m∈En alors on a (m−1)∈En si et seulement si (m−1)≥n+2 et |sm−1−rm−1| < 2−(n+1), et toutes ces conditions sont décidables (booléennes, si on veut : elle sont soit vraies soit fausses), parce que les inégalités entre entiers ou entre rationnels sont décidables. Bref, l'ensemble En est une partie habitée et décidable de ℕ.
Or on a vu au début du volet précédent que toute partie habitée et décidable de ℕ a un plus petit élément. On peut donc appeler μ(n) := min(En) son plus petit élément, c'est-à-dire le plus petit m≥n+2 tel que i≥m implique |si−ri| < 2−(n+1).
Maintenant, si i≥μ(n), on a d'une part |si−ri| < 2−(n+1) et d'autre part |ri−x| < 2−(n+2). Ces deux inégalités ensemble impliquent |si−x| < 2−n. La convergence de (si) vers x est donc bien modulée par la fonction μ qu'on a construite. ∎
En particulier, on peut garder à l'esprit qu'une suite de rationnels qui tend vers 0 tend vers zéro de façon automatiquement modulée.
Le point crucial dans la proposition ci-dessus était la décidabilité des inégalités entre rationnels. On ne peut certainement pas affirmer que si deux suites de réels ont la même limite et que la convergence de l'une est modulée, alors la convergence de l'autre est aussi modulée.
Bon, la notion de nombres réels de Cauchy est assez pourrie si la limite d'une suite de Cauchy de nombres réels de Cauchy n'est pas forcément de Cauchy. Dans mon esprit cela suggère qu'il faut laisser tomber cette notion, mais il est vrai qu'ils sont utiles du point de vue computationnel (noter cependant que dans le topos effectif, les réels de Cauchy et de Dedekind coïncident, donc on n'a pas trop à se poser la question).
Une notion potentiellement intéressante serait la clôture de Cauchy des rationnels : c'est la plus petite partie de l'ensemble ℝ des réels de Dedekind qui contienne les rationnels et qui soit stable par limites de suites de Cauchy (et on peut bien sûr aussi définir une version modulée de la même chose), c'est-à-dire l'intersection de toutes les parties de ℝ contenant ℚ et stables par limites de suites de Cauchy (ou, si on veut, l'« adhérence séquentielle » de ℚ). Mais je ne sais pas si on sait en dire grand-chose d'intéressant.
L'ensemble ℕ∞ vu dans les réels
☞ Rappels sur ℕ∞
Je rappelle que dans le volet
précédent de cette série de billets,
j'avais introduit
l'ensemble ℕ∞, qu'on peut notamment voir comme l'ensemble
des suites binaires (bi) croissantes
en leur indice, c'est-à-dire telles que
∀i∈ℕ.∀j∈ℕ.(i≤j
⇒ bi≤bj) ;
et j'avais dit qu'on identifiait ℕ à une partie de ℕ∞ en
identifiant un entier n avec la suite binaire croissante
(notée ι(n) s'il y a besoin de distinguer) dont
les termes d'indice 0,…,n−1 valent 0 et dont les termes
d'indice ≥n valent 1, et qu'on définissait aussi un élément
∞ de ℕ∞ comme la suite constamment nulle (que je vais aussi
noter 0, en espérant que ça ne cause pas trop de
confusion). Classiquement,
les ι(n) et ∞ sont les seuls éléments
de ℕ∞, mais constructivement on ne peut
pas l'affirmer (c'est exactement le principe limité
d'omniscience
LPO, plus exactement LPO
séquentiel, je reviendrai là-dessus).
Cet ensemble ℕ∞ a énormément d'importance en maths
constructives, parce que, comme je l'ai dit au chapitre précédent,
plein de phrases naturelles en mathématiques définissent un élément de
ℕ∞ (classiquement : soit un entier
naturel soit ‘∞’ ; mais constructivement c'est naturellement dans
ℕ∞ qu'ils vivent), par exemple la première occurrence de
42 fois le chiffre ‘7’ consécutivement dans l'écriture décimale
de π
, le plus petit entier pair qui n'est pas la
somme de deux nombres premiers
, la plus petite longueur d'une
contradiction dans ZFC
ou (plus généralement) le
temps d'exécution de la machine de Turing <machin>
. Ce qui
va m'intéresser présentement est d'expliquer le rapport entre
ℕ∞ et les nombres réels, et notamment comment on peut
plonger ℕ∞ dans les réels (de Dedekind, ou même de Cauchy
modulés).
☞ Extension à ℕ∞ d'une suite convergente
Supposons présentement que (xi) soit une suite de réels qui converge (i.e., qui soit de Cauchy), et que b soit un élément de ℕ∞ vu comme une suite binaire croissante ; on définit alors une suite de réels b⊙x de la façon suivante :
- si bi=0 alors (b⊙x)i = xi ;
- si bi=1 alors (b⊙x)i = xj, où j est le plus petit j tel que bj=1 (qui existe parce que {j∈ℕ : bj=1} est décidable et habité).
Concrètement, donc, la suite ((b⊙x)i) reste égale à (xi) tant que bi vaut 0, et si bi passe à 1, alors ((b⊙x)i) s'arrête à la valeur xj pour laquelle ça s'est produit.
Cette définition fait que ((ι(n)⊙x)i) tend vers xn (puisqu'elle est constante de valeur xn à partir du rang n), et que ((∞⊙x)i) est la suite (xi) elle-même, qui tend vers une limite qu'on peut avoir envie de noter x∞. Classiquement, ce sont les seuls cas possibles, donc ((b⊙x)i) a toujours une limite. On peut donc être tenté de se demander si cette affirmation reste vraie constructivement. C'est bien le cas :
Proposition : Si (xi) est une suite de réels de Cauchy, et que b est un élément de ℕ∞ ; on alors la suite de réels b⊙x est encore de Cauchy. (De plus, si la cauchyïtude de x est modulée, celle de b⊙x l'est aussi.)
Démonstration : Il suffit de montrer que si |xi − xj| < ε pour tous i,j≥n, alors |(b⊙x)i − (b⊙x)j| < ε aussi pour tous i,j≥n. Mettons sans perte de généralité que i≤j. On a soit bi=0 soit bi=1. Dans le premier cas, (b⊙x)i = xi, et quant à (b⊙x)j il est égal à un xk pour un certain i<k≤j, donc |(b⊙x)i − (b⊙x)j| = |xi − xk| < ε. Dans le second cas, on a (b⊙x)i = (b⊙x)j donc l'inégalité est triviale. Ceci montre la cauchyïtude de ((b⊙x)i), et si on a un module de cauchyïtude de (xi) il vaut encore pour ((b⊙x)i). ∎
Une variante de cette construction consiste à définir la suite b⊛x qui vaut la même chose que b⊙x quand bi=1 mais qui vaut la limite x∞ de la suite x (plutôt que xi) tant que bi=0. Il n'est pas difficile de montrer que la différence entre les deux suites b⊛x et b⊙x tend vers 0, donc elles ont la même limite. L'inconvénient de la construction b⊛x est qu'elle fait référence à la limite x∞ de la suite x ; mais son avantage est qu'elle a la propriété supplémentaire que bi = bj implique (b⊛x)i = (b⊛x)j. Je tire ces définitions de cet article.
Pour (xi) une suite de nombres
réels qui converge, et u∈ℕ∞ (je change la
notation parce que j'y pense maintenant plutôt comme un indice), on
peut donc définir xu comme la limite
de la suite u⊙x dont je viens de montrer qu'elle
était de Cauchy : d'après les remarques faites au-dessus,
si u est dans ℕ (c'est-à-dire de la
forme ι(n)), ceci redonne bien
le xn qu'on attend ; et pour la
valeur ∞, on trouve bien la limite x∞ de la
suite (xi). Mais ce qui est
intéressant est qu'on a maintenant donné un sens
à xu pour
tout u∈ℕ∞, i.e., on a étendu n'importe quelle
suite convergente ℕ→ℝ en une fonction ℕ∞→ℝ. (On pourrait
montrer que c'est l'unique extension continue, à condition d'avoir
donné un sens à continu
, ce que je n'ai pas envie de faire
ici.)
☞ La notation 2−u pour u∈ℕ∞
En particulier, comme (2−i) est une suite de
nombres réels qui converge (vers 0), tout ce fourbi donne un sens à
l'expression 2−u
pour u∈ℕ∞ (je rappelle la construction : on
considère la suite qui vaut 2−i tant
que ui=0 et qui
si uj passe à 1 stationne à
2−j pour le j pour lequel ça se
produit, et on appelle 2−u sa limite, qui existe
parce que la suite est de Cauchy). Comme la suite
(2−i) est décroissante au sens large, cette
limite est une borne inférieure (qui existe !), donc on peut décrire
2−u comme la borne inférieure de 1 et des
2−i pour les i tels
que ui=0 (l'ensemble {1} ∪
{2−i : ui=0}
est habité, minoré par 0, et localisé inférieurement, donc il a bien
un infimum).
L'avantage supplémentaire de la suite (2−i) est qu'on peut faire un peu plus concret : 2−u est aussi simplement le réel 0.u₀u₁u₂… dont l'écriture binaire est donnée par u, autrement dit ∑i ui·2−(i+1) (j'ai dit plus haut qu'on ne peut pas affirmer que tout réel ait une écriture binaire, mais ceux-ci en ont une par définition ; ce sont, notamment, des réels de Cauchy modulés).
Proposition : Si u∈ℕ∞, et si 2−u désigne le réel défini ci-dessus (celui dont l'écriture binaire est donnée par u) alors 2−u ⋕ 0 (ou bien sûr, si on préfère, 2−u > 0) équivaut à u⋕0 (où 0, également noté ∞, est la suite nulle ; c'est-à-dire : ∃i∈ℕ.(ui=1)). Plus généralement, si u∈ℕ∞, alors 2−u ⋕ 2−v équivaut à u⋕v.
Démonstration : Si ui=1 alors 2−u ≥ 2−i > 0 (et comme 2−u est clairement positif au sens large, être ⋕0 équivaut à être >0). Dans l'autre sens : si 2−u > 0, il existe un rationnel, donc un 2−i, tel que 2−u ≥ 2−i > 0, et alors ui=1 (car sinon ui=0, ce qui donnerait 2−u ≤ 2−(i+1)). Ceci démontre la première affirmation. La seconde n'est guère plus difficile. ∎
⚠ Attention : Vu qu'en maths classiques, 2−u vaut soit 0 (lorsque u=∞) soit 2−n pour un certain n∈ℕ (lorsque, justement, u=ι(n)), bref, 2−u est toujours dans ℚ, on peut être tenté de croire que c'est le cas constructivement. Mais on ne peut pas l'affirmer : car tout rationnel est soit égal à zéro soit discerné de zéro, donc la proposition ci-dessus assure que si {2−u : u∈ℕ∞} ⊆ ℚ alors LPO vaut (je parle de LPO séquentiel, c'est-à-dire que tout élément de ℕ∞ est soit ∞ soit discerné de ∞). Néanmoins, je peux mentionner la proposition amusante suivante :
Proposition : Si x est un réel qui est discerné de tous les rationnels, c'est-à-dire ∀r∈ℚ.(x⋕r), alors on a aussi x ⋕ 2−u pour tout u∈ℕ∞.
Démonstration : Comme x est discerné de tous les rationnels, en particulier x⋕0, donc |x|>0, donc il existe un m tel que |x|>2−m. Mais par ailleurs, u vérifie u≥ι(m) ou bien u≤ι(m−1) selon que le terme um de u (vue comme suite binaire croissante) vaut 0 ou 1 : dans le premier cas, 2−u ≤ 2−m et on a bien x ⋕ 2−u ; et dans le second cas, 2−u est un rationnel 2−k avec k≤m−1 entier, donc on a aussi x ⋕ 2−u par notre hypothèse sur x. ∎
Si on veut, on peut noter ℚ⋕ := {x∈ℝ : ∀r∈ℚ.(x⋕r)} l'ensemble des nombres discernés de tous les rationnels (ces nombres sont parfois appelés positivement irrationnels) et ℚ⋕⋕ := {z∈ℝ : ∀x∈ℚ⋕.(x⋕z)} l'ensemble des nombres discernés de tous les nombres positivement irrationnels ; alors la proposition affirme que {2−u : u∈ℕ∞} ⊆ ℚ⋕⋕ (et en particulier, si ℚ⋕⋕ = ℚ alors LPO vaut). Il y a toutes sortes de choses intéressantes à dire sur ce genre d'ensembles, mais ça m'écarterait trop de ce que je cherche à raconter dans ce billet donc je vais m'en tenir là. (Voir cette réponse que j'ai faite sur MathOverflow pour quelques remarques supplémentaires, cependant.)
Principes analytiques d'omniscience
Redite des principes (séquentiels) d'omniscience
☞ Redite des principes séquentiels
Dans le volet précédent de cette
série de billets, j'avais
introduit divers principes d'omniscience
, dont je reproduis
un énoncé possible ici (je rappelle à toutes fins utiles que
ℕ∞ désigne l'ensemble des suites binaires croissantes et
que, dedans, la suite identiquement nulle peut être notée
soit 0
soit ∞
— cette dernière notation étant
commode pour comparer ℕ∞ à ℕ mais qu'il vaut mieux éviter
quand, comme ici, je préfère le voir comme une partie
de 2ℕ) :
Le principe limité d'omniscience ou LPO affirme qu'une suite binaire (qu'on peut supposer croissante si on veut) est soit nulle soit a un terme non-nul : ∀u∈ℕ∞.(u=0 ∨ u⋕0).
Le principe limité faible d'omniscience ou WLPO affirme qu'une suite binaire (qu'on peut supposer croissante si on veut) est soit nulle soit n'est pas nulle : ∀u∈ℕ∞.(u=0 ∨ ¬(u=0)).
Le principe de Markov ou MP affirme qu'une suite binaire (qu'on peut supposer croissante si on veut) qui n'est pas nulle a un terme non-nul : ∀u∈ℕ∞.((¬(u=0)) ⇒ (u⋕0)).
Le moindre principe limité d'omniscience ou LLPO affirme à propos de deux suites binaires (qu'on peut supposer croissantes si on veut) que s'il n'est pas vrai que toutes les deux ont un terme non-nul, alors l'une des deux est nulle : ∀u∈ℕ∞.∀v∈ℕ∞.((¬((u⋕0) ∧ (v⋕0))) ⇒ ((u=0) ∨ (v=0))).
Le moindre principe limité faible d'omniscience ou WLLPO (peut-être plus souvent appelé principe de Markov disjonctif ou MP∨) affirme à propos de deux suites binaires (qu'on peut supposer croissantes si on veut) que s'il n'est pas vrai que toutes les deux ont un terme non-nul [cf. remarque ci-dessous] et s'il n'est pas non plus vrai que toutes les deux sont nulles, alors l'une des deux n'est pas nulle : ∀u∈ℕ∞.∀v∈ℕ∞.(((¬((u⋕0) ∧ (v⋕0))) ∧ (¬((u=0) ∧ (v=0)))) ⇒ ((¬(u=0)) ∨ (¬(v=0)))).
Pour distinguer ces principes de ceux qui vont suivre, on peut les
qualifier de principes séquentiels d'omniscience
(ou principes d'omniscience séquentiels
pour réussir à caser
les autres adjectifs, étant bien entendu que c'est le principe qui est
séquentiel, pas l'omniscience ; i.e., on peut parler
de LLPO séquentiel
, par exemple).
Les formulations ne sont pas exactement celles que j'avais données précédemment, mais elles sont équivalentes. D'abord, le fait qu'on puisse supposer les suites binaires croissantes si on veut vient du fait qu'à toute suite binaire b∈{0,1}ℕ on peut associer une suite binaire croissante μ(b)∈ℕ∞ dont le n-ième terme est le maximum des termes ≤n de la suite b, de sorte que μ(b) a un terme non-nul si et seulement si b en a un (i.e. μ(b)⋕0 ssi b⋕0), et par ailleurs μ(b) = b si b est déjà croissante, ce qui permet de mettre comme on veut {0,1}ℕ (l'ensemble des suites binaires) ou ℕ∞ (l'ensemble des suites croissantes) dans les quantificateurs.
☞ Sur les hypothèses de WLLPO séquentiel
Ma formulation de WLLPO peut sembler plus surprenante : par rapport à ma formulation dans le billet précédent, j'ai ajouté une hypothèse demandant qu'il ne soit pas vrai que les deux suites ont un terme non-nul, en plus de l'hypothèse (que j'avais déjà écrite) qu'il n'est pas non plus vrai que toutes les deux sont nulles. La raison pour laquelle je veux mettre cette hypothèse supplémentaire est qu'elle sera importante pour avoir un parallèle parfait avec les principes analytiques que je vais dire. La raison pour laquelle elle ne change rien est la remarque suivante.
Remarque : L'affirmation pour deux suites
binaires, s'il n'est pas vrai que toutes les deux sont nulles, alors
l'une des deux n'est pas nulle
(∀u∈ℕ∞.∀v∈ℕ∞.((¬((u=0)
∧ (v=0))) ⇒ ((¬(u=0)) ∨
(¬(v=0))))) équivaut à la même affirmation à
laquelle on ajoute l'hypothèse Ⓗ qu'il ne soit pas vrai que les deux
suites ont un terme non-nul (l'hypothèse Ⓗ est donc
¬((u⋕0) ∧ (v⋕0)), et l'affirmation
complète avec elle est
∀u∈ℕ∞.∀v∈ℕ∞.(((¬((u⋕0)
∧ (v⋕0))) ∧ (¬((u=0) ∧
(v=0)))) ⇒ ((¬(u=0)) ∨
(¬(v=0))))). Autrement dit, cette hypothèse
supplémentaire ne ne change rien dans la formulation
de WLLPO séquentiel ; de plus, ceci est orthogonal à la
possibilité d'ajouter l'hypothèse que les suites soient
croissantes.
Démonstration : Je reprends une construction et en gros le raisonnement que j'ai utilisés pour prouver que LLPO ⇒ WLPO (où WLPO avait été formulé sans l'hypothèse Ⓗ) : si u,v sont deux suites binaires, je peux définir deux suites binaires a,b en décrétant que an vaut 1 lorsque un=1 et que pour tout k<n on a uk=0 et vk=0, et 0 sinon, et (pas tout à fait symétriquement) que bn vaut 1 lorsque vn=1 et un=0, et que pour tout k<n on a uk=0 et vk=0, et 0 sinon. (En plus clair, on entrelace les suites u,v dans l'ordre u0,v0,u1,v1,u2,… on garde le premier 1 éventuel, et tous les autres termes valent 0, et ceci définit les suites a,b entrelacées dans l'ordre a0,b0,a1,b1,a2,….)
Sur cette construction, il est facile de voir qu'on ne peut pas avoir simultanément a⋕0 et b⋕0 (autrement dit, a,b vérifient toujours Ⓗ). D'autre part, a=b=0 implique u=v=0 (donc si on suppose que ce dernier ne vaut pas, le premier ne vaut pas non plus). Et enfin, u=0 implique a=0 (donc ¬(a=0) implique ¬(u=0)) et bien sûr v=0 implique b=0 (donc ¬(b=0) implique ¬(v=0)).
Bref, en appliquant ma formulation de WLLPO avec l'hypothèse Ⓗ aux suites a,b, on obtient la formulation d'origine sur les suites u,v. (Et si on veut en outre pouvoir supposer les suites croissantes, on applique à a,b la même construction μ discutée plus haut, qui ne modifie pas la validité de toutes les égalités ou discernements.) ∎
Énoncés analogues des principes analytiques
☞ Formulation des principes analytiques
Voici maintenant des principes analogues portant sur les réels, et
qu'on peut collectivement qualifier de principes analytiques
d'omniscience
:
Le principe limité d'omniscience analytique ou LPO analytique affirme qu'un réel est soit nul soit discerné de zéro : ∀x∈ℝ.(x=0 ∨ x⋕0).
Le principe limité faible d'omniscience analytique ou WLPO analytique affirme qu'un réel est soit nul soit n'est pas nul : ∀x∈ℝ.(x=0 ∨ ¬(x=0)).
Le principe de Markov analytique ou MP analytique affirme qu'un réel qui n'est pas nul est discerné de zéro : ∀x∈ℝ.((¬(x=0)) ⇒ (x⋕0)).
Le moindre principe limité d'omniscience analytique ou LLPO analytique affirme à propos de deux réels que s'il n'est pas vrai que toutes les deux sont discernés de zéro, alors l'un des deux est nul : ∀x∈ℝ.∀y∈ℝ.((¬((x⋕0) ∧ (y⋕0))) ⇒ ((x=0) ∨ (y=0))).
Le moindre principe limité faible d'omniscience analytique ou WLLPO analytique affirme à propos de deux réels que s'il n'est pas vrai que tous les deux sont discernés de zéro et s'il n'est pas non plus vrai que tous les deux sont nuls, alors l'un des deux n'est pas nul : ∀x∈ℝ.∀y∈ℝ.(((¬((x⋕0) ∧ (y⋕0))) ∧ (¬((x=0) ∧ (y=0)))) ⇒ ((¬(x=0)) ∨ (¬(y=0)))).
On note souvent LPOℝ, WLPOℝ, MPℝ, LLPOℝ, WLLPOℝ (respectivement) pour les principes analytiques que je viens d'énoncer. (Et pour insister, les principes séquentiels peuvent se noter : LPOséq, WLPOséq, MPséq, LLPOséq, WLLPOℝ respectivement.)
Je vais donner des formulations équivalentes plus agréables ci-dessous, mais celles-ci sont destinées à maximiser le parallélisme entre la version séquentielle et la version analytique.
☞ Chaque principe analytique impliquent le principe séquentiel correspondant…
Chaque principe analytique implique le principe séquentiel de même nom : tels que je les ai formulés (de façon complètement parallèle), c'est facile, donnée une suite binaire croissante u (et éventuellement une autre v), il suffit d'appliquer le principe analytique à 2−u (et éventuellement 2−v) que j'ai défini plus haut comme le réel dont l'écriture binaire est donnée par u, et faire usage du fait vu précédemment que 2−u ⋕ 0 équivaut à u⋕0 (et se rappeler que, sur les réels comme sur les suites binaires, x=0 est la négation de x⋕0).
☞ …et réciproquement avec le Choix dénombrable
Les réciproques (c'est-à-dire les implications dans le sens principe d'omniscience séquentiel ⇒ principe d'omniscience analytique) valent en présence de l'axiome du choix dénombrable, mais ne peuvent pas être affirmées en général. Voici qui justifie les réciproques en présence de l'axiome du choix dénombrable, et qui est par ailleurs une construction par ailleurs assez intéressante et instructive pour être signalée :
Proposition : En supposant l'axiome du choix dénombrable, si x est un réel, il existe une suite binaire croissante (bi) (i.e., un élément de ℕ∞) telle que x⋕0 équivaille à b⋕0.
Démonstration : Pour chaque i∈ℕ, comme 2−i>0, d'après (❀), on a soit |x|<2−i soit |x|>0 (ce dernier étant équivalent à x⋕0). Si on veut, cela se traduit en disant que la partie Bi := {0 : |x|<2−i} ∪ {1 : |x|>0} de {0,1}, c'est-à-dire la partie contenant 0 si |x|<2−i et 1 si |x|>0, est habitée pour chaque i. L'axiome du choix dénombrable permet de choisir un élément bi de chaque Bi : on a alors |x|<2−i si bi=0 et |x|>0 si bi=1 ; par ailleurs, quitte à modifier la suite binaire (bi) pour remplacer chaque terme par le maximum de toutes les valeurs jusqu'à lui, on peut avoir (bi) croissante.
Si b⋕0, cela signifie qu'il existe i tel que bi=1, ce qui implique |x|>0 (i.e., x⋕0) d'après ce qui a été dit. Réciproquement, si x⋕0, c'est-à-dire |x|>0, il existe i tel que |x|≥2−i, donc bi≠0, mais comme bi est une suite binaire, bi=1, et on a bien b⋕0. On a donc prouvé l'équivalence. ∎
En appliquant cette proposition aux différents réels dont parlent les principes d'omniscience analytique, on voit que l'axiome du choix dénombrable donne les réciproques annoncées.
En fait, même en maths constructives sans choix, on a une réciproque partielle : chaque principe d'omniscience séquentiel implique le principe d'omniscience analytique de même nom si on le restreint aux réels de Cauchy modulés. (Et comme la preuve que j'ai donnée dans le sens principe d'omniscience analytique ⇒ principe d'omniscience séquentiel construit des réels de Cauchy modulés 2−u, on a du coup une équivalence.) En effet, si x est un réel de Cauchy modulé, c'est-à-dire s'il existe une suite (ri) de rationnels telle que |ri−x|<2−i pour tout i, alors on peut définir une suite binaire (bi) par bi=0 si |ri|≤2−i et bi=1 si |ri|>2−i (cette définition a bien un sens car l'inégalité sur les rationnels est décidable : c'est ce qui fait qu'on n'a pas besoin de choix ici — enfin, on utilise le choix unique) : alors il n'est pas difficile de vérifier que x⋕0 vaut si et seulement si la suite b a un terme égal à 1, i.e. b⋕0. Je crois avoir montré que, au moins pour LPO, on a même l'implication de LPO séquentiel vers LPO analytique pour les réels de Cauchy (non supposés modulés cette fois), mais c'est plus technique et il faut utiliser trois fois LPO : je n'ai pas eu le courage d'essayer de savoir si on a quelque chose d'analogue pour les autres principes d'omniscience.
☞ Implications entre principes analytiques
Pour ce qui est des implications entre les principes analytiques que j'ai évoqués, on a (exactement comme entre les principes séquentiels) :
LEM (le tiers exclu)
⇒ LPOℝ ⇒ WLPOℝ
⇒ LLPOℝ
⇒ WLLPOℝ,
et LPOℝ
⇒ MPℝ ⇒ WLLPOℝ,
Celles qui ne sont pas complètement évidentes sur les définitions sont le fait que WLPOℝ ⇒ LLPOℝ (pour ça on peut soit reprendre la démonstration que j'ai donnée dans le cas séquentiel, soit utiliser l'équivalence que je donne plus bas de WLPOℝ et LLPOℝ avec ∀x∈ℝ.(x⋖0 ∨ x=0 ∨ x⋗0) et ∀x∈ℝ.(x≤0 ∨ x≥0) respectivement), et MPℝ ⇒ WLLPOℝ (pour ça on peut utiliser l'équivalence que je donne plus bas de WLLPOℝ avec ∀x∈ℝ.((¬(x=0)) ⇒ (x⋖0 ∨ x⋗0)) en se rappelant que x⋕0 équivaut à x<0 ∨ x>0).
À part ça, il y a plein de choses que personne ne semble savoir. Par exemple, j'ignore (et je pense que tout le monde ignore) si la conjonction de WLLPOℝ et de LLPOséq implique LLPOℝ.
Divers équivalents des principes analytiques
☞ Reformulations de LPO analytique
Les formulations que j'ai données de certains des principes d'omniscience analytique ne sont pas les plus heureuses. Mais il y a des équivalents plus agréables :
Proposition : LPO analytique admet les équivalents suivants :
- ∀x∈ℝ.(x=0 ∨ x⋕0) : tout réel est soit nul soit discerné de zéro.
- ∀x∈ℝ.(x<0 ∨ x=0 ∨ x>0) : tout réel est soit nul soit strictement négatif soit strictement positif.
- ∀x≥0.(x=0 ∨ x>0) : tout réel positif au sens large est soit nul soit strictement positif.
- ∀x∈ℝ.(x>0 ∨ x≤0) : tout réel est soit strictement positif soit négatif au sens large.
Démonstration : La première formulation est celle que j'ai prise comme définition. L'équivalence entre les deux premières formulations résulte du fait que x⋕0 équivaut à x<0 ∨ x>0. La seconde formulation implique trivialement la troisième, et pour ce qui est de la réciproque il suffit d'appliquer la troisième à |x| et se rappeler que |x|>0 équivaut à x⋕0. La quatrième formulation découle évidemment de la seconde, et pour la réciproque il suffit d'appliquer la quatrième à x et −x séparément et d'écarter le cas manifestement impossible. ∎
☞ Reformulations de WLPO analytique
Proposition : WLPO analytique admet les équivalents suivants :
- ∀x∈ℝ.(x=0 ∨ ¬(x=0)) : tout réel est soit nul soit n'est pas égal à zéro.
- ∀x∈ℝ.(x⋖0 ∨ x=0 ∨ x⋗0)
(où je rappelle que
x⋗0
désigne la négation de x≤0) : tout réel est soit nul soit n'est pas positif au sens large soit n'est pas négatif au sens large. - ∀x≥0.(x=0 ∨ x⋗0) : tout réel positif au sens large est soit nul soit n'est pas négatif au sens large.
- ∀x∈ℝ.(x⋗0 ∨ x≤0) : tout réel soit n'est pas négatif au sens large soit est négatif au sens large.
Démonstration : Pour voir que la première formulation implique la seconde, on l'applique successivement à 0⊔x et 0⊔(−x) : d'abord, comme x<0 implique 0⊔x > 0 donc 0⊔x ⋕ 0, on en déduit que 0⊔x = 0 implique x≤0, et symétriquement 0⊔(−x) = 0 implique x≥0 ; ensuite, comme x≤0 implique 0⊔x = 0, on en déduit que ¬(0⊔x = 0) implique x⋗0, et symétriquement ¬(0⊔(−x) = 0) implique x⋖0 ; en mettant tout ça ensemble, on a l'implication souhaitée. Tout le reste est complètement analogue à la proposition précédente. ∎
☞ Reformulations de MP analytique
Proposition : MP analytique admet les équivalents suivants :
- ∀x∈ℝ.((¬(x=0)) ⇒ (x⋕0)) : tout réel qui n'est pas nul est discerné de zéro (et bien sûr, la réciproque vaut trivialement).
- ∀x∈ℝ.((x⋗0) ⇒ (x>0)) : tout réel qui n'est pas négatif au sens large est strictement positif (et bien sûr, la réciproque vaut trivialement).
Démonstration : Le premier, qui est ma formulation de référence, implique à peu près trivialement le second ; et pour l'autre sens on applique le second à |x|. ∎
☞ Reformulations de LLPO et WLLPO analytiques
Avant de passer à LLPO, je vais avoir besoin du fait suivant, qui peut être utile en lui-même :
Lemme : Si H := {(x,y)∈ℝ² : x≥0 ∧ y≥0 ∧ ¬(x>0 ∧ y>0)} désigne l'ensemble des couples de réels positifs au sens large et qui ne sont pas tous les deux strictement positifs, alors la fonction H→ℝ donnée par (x,y) ↦ x−y, et la fonction ℝ→H donnée par z ↦ (z+,z−) := (0⊔z, 0⊔(−z)), sont des bijections réciproques.
Démonstration : Appelons f:H→ℝ donnée par (x,y) ↦ x−y, et d'autre part g:ℝ→ℝ² donnée par z ↦ (0⊔z, 0⊔(−z)). D'abord, l'image de g est bien dans H : en effet, 0⊔t≥0 pour n'importe quel t, et d'autre part on a vu que 0⊔t > 0 équivaut à 0>0 (impossible !) ou bien t>0, c'est-à-dire juste à t>0, et on ne peut pas avoir simultanément z>0 et −z>0.
Ensuite, on a (0⊔z) − (0⊔(−z)) = (0⊔z) − (z⊔0) + z = z en utilisant pour la première égalité le fait que (x⊔y)+t = (x+t) ⊔ (y+t) (qui découle de l'invariance par translation de l'ordre). Ceci montre que f∘g est l'identité sur ℝ.
Montrons enfin que g∘f est l'identité sur H : soient x,y deux réels positifs au sens large et qui ne sont pas tous les deux strictement positifs. Comme x≥0 et que x ≥ x−y, on a x ≥ 0⊔(x−y). On veut montrer l'inégalité de sens contraire : mais c'est la négation de x > 0⊔(x−y), donc il suffit d'arriver à une contradiction à partir de ça. Or x > 0⊔(x−y) équivaut à la conjonction de x>0 et de x > x−y, ce dernier étant équivalent à y>0 : et on a justement supposé que la conjonction de x>0 et de y>0 était absurde. Bref, on n'a pas x > 0⊔(x−y), c'est-à-dire qu'on a x ≤ 0⊔(x−y), et finalement x = 0⊔(x−y). Symétriquement y = 0⊔(x−y). On a bien montré que g∘f est l'identité sur H, et finalement que f et g sont des bijections réciproques. ∎
Proposition : LLPO analytique équivaut à l'affirmation :
- ∀x∈ℝ.(x≤0 ∨ x≥0) : tout réel est soit positif au sens large soit négatif au sens large.
Démonstration : Montrons que ma formulation de référence implique z≤0 ∨ z≥0 pour tout réel z (je change la lettre de x en z par rapport à l'énoncé, ce sera plus commode pour la preuve). D'après le lemme, les deux composantes du couple (x,y) := (0⊔z, 0⊔(−z)) sont positifs et ne sont pas simultanément strictement positifs (donc pas simultanément discernés de 0), donc la formulation de référence du LPO analytique montre que l'un des deux est nul, et comme le lemme assure aussi que z = x−y, on obtient z≤0 ou bien z≥y.
Réciproquement, montrons que l'affirmation que z≤0 ∨ z≥0 pour tout réel z implique la formulation de référence du LPO analytique. Si x,y sont deux réels qui ne sont pas simultanément discernés de 0, remplaçons les par |x| et |y| pour pouvoir les supposer positifs au sens large (donc pas simultanément strictement positifs) : le lemme assure que z := x−y permet de retrouver x,y par (x,y) = (0⊔z, 0⊔(−z)) ; du coup, si z≤0 ou z≥0 on obtient bien x=0 ou y=0. ∎
Proposition : WLLPO analytique équivaut aux affirmations :
- ∀x∈ℝ.((¬(x=0)) ⇒ (x≤0 ∨ x≥0)) : tout réel qui n'est pas nul est soit positif au sens large soit négatif au sens large.
- ∀x∈ℝ.((¬(x=0)) ⇒ (x⋖0 ∨ x⋗0))
Démonstration : Comme on a déjà remarqué que x⋗0 équivaut à la conjonction de x≥0 et ¬(x=0), les deux énoncés énumérés sont équivalents. La preuve de l'équivalence avec la formulation initiale est complètement analogue à la preuve précédente, et repose simplement sur le lemme, avec l'observation triviale supplémentaire que les bijections réciproques f et g mettent (0,0) en correspondance avec 0. ∎
[Optionnel] Un principe entre LLPO et WLLPO : MLLPO
☡ Guide de lecture : Cette section doit être
considérée comme étant en petits caractères parce que c'est vraiment
une digression, ou un développement sur un sujet que je n'avais pas
anticipé : je suis tombé sur ce principe MLLPO
en
écrivant ce texte et en essayant d'avoir un parallélisme parfait entre
principes séquentiels et analytiques d'omniscience, et en me rendant
compte que quelque chose clochait. Si on n'est pas intéressé par ce
développement, on peut le sauter.
Pour appliquer le lemme de manière à démontrer que ∀z∈ℝ.((¬(z=0)) ⇒ (z≤0 ∨ z≥0)) implique ma formulation de référence de WLLPO analytique, on a eu besoin de l'hypothèse que x,y ne sont pas tous les deux discernés de 0. Comme je l'ai démontré plus haut, cette hypothèse (que j'ai notée Ⓗ dans ce contexte) est gratuite dans le cas séquentiel, c'est-à-dire que WLLPO est équivalent qu'il soit formulé avec ou sans elle. Pour le cas analytique, en revanche, je soupçonne qu'elle n'est pas gratuite. Ceci amène à considérer l'énoncé analogue à WLLPO mais sans cette hypothèse, à savoir :
donnés deux réels, s'il n'est pas vrai que tous les deux sont nuls, alors l'un des deux n'est pas nul
, soit en symboles : ∀x∈ℝ.∀y∈ℝ.((¬((x=0) ∧ (y=0))) ⇒ ((¬(x=0)) ∨ (¬(y=0)))))
Je ne sais pas quel nom donner au principe ci-dessus :
peut-être Mild Lesser Limited Principle of
Omniscience
? appelons-le donc MLLPO
analytique (ou MLLPOℝ, sachant que
le MLLPO séquentiel est de toute façon pareil
que WLLPO) pour les besoins de la discussion qui va
suivre. Sous ces conditions, je peux au moins dire :
Proposition : LLPOℝ implique MLLPOℝ (défini ci-dessus), qui à son tour implique WLLPOℝ. Par ailleurs, MPℝ implique lui aussi MLLPOℝ.
Démonstration : Le fait que MLLPO analytique implique WLLPO analytique est logiquement trivial (ce dernier a une hypothèse de plus). Expliquons pourquoi LLPO analytique implique MLLPO analytique. Soient x,y deux réels dont il n'est pas vrai que tous les deux sont nuls, et on veut montrer que l'un d'entre eux n'est pas nul. Quitte à remplacer x,y par |x|,|y|, on peut supposer sans perte de généralité que x,y sont positifs au sens large. Comme on l'a vu, LLPO analytique (qu'on suppose) équivaut à l'énoncé que tout réel est positif ou négatif au sens large : en appliquant ce fait à x−y, on a soit x≥y≥0 soit y≥x≥0. Dans le premier cas, x=0 est impossible car il entraîne y=0 alors qu'il n'est pas vrai que x=y=0 : on a donc prouvé ¬(x=0). Le second cas est analogue et aboutit à la conclusion ¬(y=0).
La démonstration du fait que MP analytique implique MLLPO analytique est extrêmement semblable. Soient x,y deux réels dont il n'est pas vrai que tous les deux sont nuls, et on veut montrer que l'un d'entre eux n'est pas nul. Quitte à remplacer x,y par |x|,|y|, on peut supposer sans perte de généralité que x,y sont positifs au sens large. Comme on l'a vu, MP analytique (qu'on suppose) équivaut à l'énoncé que tout réel positif au sens large et non-nul est strictement positif : en appliquant ce fait à x+y, vu que x+y=0 est impossible (car cela entraînerait x=y=0, qui n'est pas vrai), on a x+y>0. Par (❀), on a lors soit x>0 soit x<x+y, ce second cas étant équivalent à y>0. On a donc prouvé x>0 ou y>0, et à plus forte raison ¬(x=0) ou ¬(y=0). ∎
En commençant à rédiger ce bout de ce texte, je pensais que MLLPOℝ serait équivalent à WLLPOℝ (i.e., je pensais juste avoir deux formulations équivalentes de WLLPO dans le cas analytique comme il y en a deux dans le cas séquentiel. Je me suis rendu compte que je n'arrivais pas à démontrer leur équivalence, et je soupçonne maintenant que les deux implications ci-dessus sont strictes en général. Mais je n'y ai pas vraiment réfléchi (de toute façon, rien dans ce billet ne donne les outils pour construire des contre-modèles permettant de montrer que tel ou tel énoncé n'en implique pas un autre) : peut-être bien que WLLPOℝ et MLLPOℝ sont en fait équivalents et que toute cette section est sans objet. Je remarque cependant que LLPOℝ et MLLPOℝ semblent porter en eux une forme de Choix (au sens où la disjonction dans la conclusion n'est pas exclusive), alors que WLLPOℝ ne l'a pas (la conclusion est une disjonction exclusive).
Je finis cette digresson par une observation qui peut justifier l'intérêt porté à MLLPO :
Observation : MLLPOℝ équivaut à l'affirmation que la non-égalité sur les réels est cotransitive (ou ce qui revient au même, est un discernement) : ∀x∈ℝ.∀y∈ℝ.∀z∈ℝ.((¬(x=z)) ⇒ ((¬(x=y)) ∨ (¬(y=z)))).
Démonstration : Montrons d'abord que MLLPO analytique implique la cotransitivité de la non-égalité : on veut donc prouver (¬(x=y)) ∨ (¬(y=z)) sous l'hypothèse ¬(x=z). Or les réels x−y et y−z ne peuvent pas être tous les deux nuls sous cette hypothèse (car leur somme x−z n'est pas nulle) : alors MLLPO analytique (qu'on suppose) entraîne que l'un des deux n'est pas nul, ce qui signifie bien (¬(x=y)) ∨ (¬(y=z)).
Réciproquement, supposons la cotransitivité de la non-égalité, et soient x,y deux réels dont il n'est pas vrai que tous les deux sont nuls, et on veut montrer que l'un d'entre eux n'est pas nul. Quitte à remplacer x,y par |x|,|y|, on peut supposer sans perte de généralité que x,y sont positifs au sens large. Maintenant, x+y=0 entraîne x=y=0, ce qui n'est pas le cas : c'est-à-dire qu'on a ¬(x+y=0), et la cotransitivité assure donc ¬(x+y=y) ou bien ¬(y=0). Le premier cas est équivalent à ¬(x=0), et on a bien la conclusion recherchée. ∎
[Optionnel] Le principe de Markov faible
☡ Guide de lecture : Là aussi, toute cette section est moralement en petits caractères, et doit être considérée comme optionnelle : je n'avais pas vraiment prévu d'en parler, et je me suis un peu laissé entraîner par une sorte de scrupule à laisser ce pauvre principe de Markov faible abandonné sur le bord de la route.
☞ Équivalents de WMP séquentiel
L'idée du principe de Markov faible
est, en quelque sorte,
de prendre la conclusion de la cotransitivité de la non-égalité comme
hypothèse pour affirmer un discernement.
Proposition : les affirmations suivantes sont équivalentes :
- ∀u∈2ℕ.((∀w∈2ℕ.((¬(w=0)) ∨ (¬(w=u)))) ⇒ (u⋕0))
- ∀u∈ℕ∞.((∀w∈2ℕ.((¬(w=0)) ∨ (¬(w=u)))) ⇒ (u⋕0))
- ∀u∈ℕ∞.((∀w∈ℕ∞.((¬(w=0)) ∨ (¬(w=u)))) ⇒ (u⋕0))
— En revanche, le principe
- ∀u∈2ℕ.((∀w∈ℕ∞.((¬(w=0)) ∨ (¬(w=u)))) ⇒ (u⋕0))
les implique toutes et équivaut au principe de Markov (séquentiel).
Démonstration : L'implication (1)⇒(2) est logiquement triviale. Montrons (2)⇒(3). Pour cela, on se donne u∈ℕ∞ dont on suppose qu'il vérifie ∀w′∈ℕ∞.((¬(w′=0)) ∨ (¬(w′=u))), et on souhaite (de manière à pouvoir appliquer (2)) prouver qu'il satisfait aussi ∀w∈2ℕ.((¬(w=0)) ∨ (¬(w=u))). Or donné w∈2ℕ, on définit comme précédemment la suite binaire croissante μ(w)∈ℕ∞ dont le n-ième terme est le maximum des termes ≤n de la suite w. D'après notre hypothèse appliquée à w′ := μ(w), on a (¬(μ(w)=0)) ∨ (¬(μ(w)=u)). Mais comme w=0 entraîne μ(w)=0 et que w=u entraîne μ(w)=u (puisque μ(u)=u), et comme l'une de ces deux choses est exclue, on a (¬(w=0)) ∨ (¬(w=u)), comme voulu. Alors (2) donne la conclusion u⋕0 souhaitée. Ceci achève de prouver (2)⇒(3).
Montrons enfin (3)⇒(1). Pour cela, on se donne u∈2ℕ dont on suppose qu'il vérifie ∀w′∈2ℕ.((¬(w′=0)) ∨ (¬(w′=u))). On définit μ(u) comme au paragraphe précédent, et on veut lui appliquer (3). Pour ça, on souhaite prouver ∀w∈ℕ∞.((¬(w=0)) ∨ (¬(w=μ(u)))). Donné un w∈ℕ∞ (vu comme une suite binaire croissante), on définit w′ := w ⊓ u, c'est-à-dire la suite dont le n-ième terme est le minimum entre les termes correspondants de w et u. Notre hypothèse assure que (¬(w′=0)) ∨ (¬(w′=u)). Or w=0 entraîne w′=0, et w=μ(u) entraîne w′=u (vu que μ(u) est en chaque point supérieur ou égal à u) : comme l'une de ces deux choses est exclue, on a donc (¬(w=0)) ∨ (¬(w=μ(u))), ce qui permet bien d'appliquer (3) à μ(u) pour conclure μ(u)⋕0, qui équivaut à u⋕0. Ceci achève de prouver (3)⇒(1).
Le fait que (4)⇒(1) est logiquement trivial. Prouvons enfin l'équivalence (MP)⇔(4). L'implication (MP)⇒(4) est logiquement triviale (appliquer l'hypothèse de (4) à w=0). Reste donc à prouver (4)⇒(MP). Soit donc v∈2ℕ dont on suppose qu'il vérifie ¬(v=0), et on souhaite montrer qu'il vérifie v⋕0. Appelons u la suite obtenue en intercalant des 0 et termes de v (c'est-à-dire, disons, u2i=vi et u2i+1=0). On va montrer que u vérifie ∀w∈ℕ∞.((¬(w=0)) ∨ (¬(w=u))) de manière à pouvoir appliquer (4). Or w=u entraîne que la moitié des termes de w sont nuls, si bien que w=0 (c'est-à-dire ∞) puisque w∈ℕ∞, et du coup u=0 ; mais comme on a supposé ¬(v=0), on a ¬(u=0), c'est-à-dire que w=u entraîne une absurdité : on a donc prouvé ¬(w=u), et a fortiori (¬(w=0)) ∨ (¬(w=u)), pour tout w∈ℕ∞. Ceci nous permet d'appliquer (4) et de conclure u⋕0, qui entraîne évidemment v⋕0. Ceci achève de prouver (4)⇒(MP). ∎
Les énoncés équivalents (1)–(3) de la proposition ci-dessus portent le nom de principe de Markov faible (séquentiel) ou WMP (séquentiel).
☞ Le lien entre MP et WMP séquentiels
Proposition : MP séquentiel équivaut à la conjonction de WLLPO séquentiel et de WMP séquentiel.
Démonstration : Rappelons pourquoi MP implique WLLPO : si u,v sont deux suites binaires et s'il n'est pas vrai que toutes les deux sont nulles, alors la suite w obtenue en entrelaçant les termes de u et v n'est pas nulle, donc par MP elle a un terme non-nul, ce qui montre que l'une des deux suites de départ a un terme non-nul : on a donc montré WLLPO. Pour ce qui est du fait que MP implique WMP, il suffit d'appliquer l'hypothèse ∀w∈2ℕ.((¬(w=0)) ∨ (¬(w=u))) de WMP à w=0 pour obtenir ¬(u=0), c'est-à-dire que l'hypothèse de WMP est plus forte que celle de MP, et ils ont la même conclusion, donc (MP)⇒(WMP).
Dans l'autre sens, si on a à la fois WLLPO et WMP, on veut montrer MP. Or WLLPO entraîne la cotransitivité de la non-égalité sur 2ℕ (on l'a déjà vu au billet précédent) : donc si ¬(u=0), pour tout w on a (¬(w=0)) ∨ (¬(w=u)), ce qui est exactement l'hypothèse demandée par WMP et qui permet de conclure u⋕0. ∎
☞ Équivalents de WMP analytique
Passons maintenant à la variante analytique de WMP.
Proposition : Les affirmations suivantes sont
équivalentes (où je rappelle que a⋗b
signifie ¬(a≤b)
, ou, ce qui revient au
même, a≥b et
¬(a=b)
) :
- ∀x∈ℝ.((∀t∈ℝ.((¬(t=0)) ∨ (¬(t=x)))) ⇒ (x⋕0))
- ∀x∈ℝ.((∀t∈ℝ.(t⋗0 ∨ x⋗t)) ⇒ (x>0))
- ∀x≥0.((∀t∈ℝ.(t⋗0 ∨ x⋗t)) ⇒ (x>0))
- ∀x≥0.((∀t≥0.(t⋗0 ∨ x⋗t)) ⇒ (x>0))
Démonstration : Montrons que (1)⇒(2). Supposons donc d'un réel x qu'il vérifie ∀t∈ℝ.(t⋗0 ∨ x⋗t) et on souhaite montrer x>0. En appliquant l'hypothèse à t=0, on obtient x⋗0 et en particulier x≥0. On souhaite montrer que x vérifie ∀t∈ℝ.((¬(t=0)) ∨ (¬(t=x))) pour pouvoir appliquer (1) ; soit donc t∈ℝ arbitraire. Notre hypothèse assure t⋗0 ∨ x⋗t. Or t=0 entraîne t≤0, et t=x entraîne x≤t ; comme l'une de ces deux choses est exclue, on a on a donc bien montré (¬(t=0)) ∨ (¬(t=x)), comme voulu. Alors (1) donne x⋕0. Comme on a montré à la fois x≥0 et x⋕0, on a bien x>0, comme souhaité.
Le fait que (2)⇒(3) est logiquement trivial. Montrons que (3)⇒(4). Supposons donc d'un réel x≥0 qu'il vérifie ∀t′≥0.(t′⋗0 ∨ x⋗t′) et on souhaite montrer x>0. On souhaite (de manière à pouvoir appliquer (3)) prouver que x vérifie ∀t∈ℝ.(t⋗0 ∨ x⋗t) : soit donc t∈ℝ arbitraire. Posons t′ := 0⊔t (il est bien ≥0). Notre hypothèse assure t′⋗0 ∨ x⋗t′. Or t≤0 entraîne t′≤0 (même t′=0 mais peu importe), et x≤t entraîne x≤t′, et comme l'une de ces deux choses est exclue, on a t⋗0 ∨ x⋗t, comme voulu. Alors (3) donne la conclusion x>0 souhaitée.
Montrons enfin que (4)⇒(1). Supposons donc d'un réel x qu'il vérifie ∀t′∈ℝ.((¬(t′=0)) ∨ (¬(t′=x))) et on souhaite montrer x⋕0. Appliquons d'abord notre hypothèse à t′ := 0⊔x : on a (¬(t′=0)) ∨ (¬(t′=x)). Comme x≤0 entraîne t′=0, et x≥0 implique t′=x, et comme l'une de ces deux choses est exclue, on a x⋖0 ∨ x⋗0. On va raisonner dans chacun des deux cas x⋖0 et x⋗0. Commençons par nous placer dans le cas x⋗0, qui entraîne notamment x≥0. On souhaite (de manière à pouvoir appliquer (4)) prouver que x vérifie ∀t≥0.(t⋗0 ∨ x⋗t). Soit donc t≥0 quelconque. Posons t′ := x⊓t : d'après notre hypothèse, on a (¬(t′=0)) ∨ (¬(t′=x)). Or t≤0 (c'est-à-dire en fait t=0) entraîne t′=0 (car on a x≥0), et t≥x entraîne t′=x : l'une de ces deux choses étant exclue, on a donc t⋗0 ∨ x⋗t. Par (4), on en déduit x>0, et en particulier x⋕0. Dans le cas x⋖0, on raisonne de façon analogue sur −x (qui est ≥0), pour arriver à la même conclusion. Ceci achève la preuve de notre implication. ∎
Les énoncés équivalents de la proposition ci-dessus portent le nom de principe de Markov faible analytique ou WMP analytique (qu'on peut bien sûr noter : WMPℝ).
☞ Le lien entre MP et WMP analytiques
Proposition : MPℝ équivaut à la conjonction de MLLPOℝ (c'est-à-dire : ∀x∈ℝ.∀y∈ℝ.((¬((x=0) ∧ (y=0))) ⇒ ((¬(x=0)) ∨ (¬(y=0)))))) et de WMPℝ.
Démonstration : Rappelons pourquoi MP analytique implique MLLPO analytique : si x,y sont deux réels et s'il n'est pas vrai que tous les deux sont nuls, alors z := |x| ⊓ |y| n'est pas nul (car clairement z=0 entraîne x=y=0), donc z⋕0 par MP analytique, c'est-à-dire z>0, ce qui équivaut à |x|>0 ∨ |y|>0 soit x⋕0 ∨ y⋕0, et en particulier (¬(x=0)) ∨ (¬(y=0)). On a donc bien montré MLLPO analytique.
Toutes les autres parties de la preuve se démontrent de façon analogue mutatis mutandis, au cas séquentiel : je rappelle qu'on a vu plus haut que MLLPO analytique équivaut à la cotransitivité de la non-égalité sur ℝ. ∎
☞ Le lien entre WMP analytique et WMP séquentiel
Pour relier la version analytique avec la version séquentielle de WMP, on a besoin d'un raffinement d'un résultat déjà vu :
Lemme : En supposant l'axiome du choix dénombrable, si 0≤x≤1 est un réel compris entre 0 et 1 au sens large, il existe une suite binaire croissante b∈ℕ∞ telle que :
- on a b⋕0 si et seulement si x>0 (et en particulier, on a b=0 si et seulement si x=0) ;
- si x=2−u pour u∈ℕ∞, alors b=u ;
- et dans tous les cas, x ≤ 2−b.
(Intuitivement, on va définir bi comme prenant la valeur 0 si x ≤ (5/8)×2−i, la valeur 1 si x ≥ (7/8)×2−i, et un choix arbitraire entre les deux ; mais il faut rédiger soigneusement, et utiliser le choix dénombrable, pour expliquer que ceci a bien un sens.)
Démonstration : Pour chaque i∈ℕ, comme 5×2−(i+3) < 7×2−(i+3), d'après (❀), on a soit x < 7×2−(i+3), soit x > 5×2−(i+3). Si on veut, cela équivaut à dire que la partie Bi de {0,1} contenant 0 si x < 7×2−(i+3), et 1 si x > 5×2−(i+3), est habitée pour chaque i. L'axiome du choix dénombrable permet de choisir un élément bi de chaque Bi : on a alors, pour chaque i :
- bi=0 ⇒ x < 7×2−(i+3)
- bi=1 ⇒ x > 5×2−(i+3)
Il s'ensuit, par contraposées (même en logique intuitionniste, p⇒q entraîne (¬q)⇒(¬p)) :
- x ≤ 5×2−(i+3) ⇒ bi=0
- x ≥ 7×2−(i+3) ⇒ bi=1
La suite (bi) est croissante, car bi=1 implique x > 5×2−(i+3) qui implique x ≥ 7×2−(i+4) (vu que 5 > 7/2) qui implique bi+1=1. On a donc bien défini un élément de ℕ∞.
Si b⋕0, c'est-à-dire s'il existe i tel que bi=1, alors x > 5×2−(i+3) et en particulier x>0. Réciproquement, si x>0, par densité de ℚ dans ℝ il existe i tel que x ≥ 7×2−(i+3), ce qui entraîne bi=1, et en particulier b⋕0.
Ensuite, si x=2−u, on veut montrer que bi=ui pour tout i. En notant abusivement u−i la suite obtenue en décalant de i crans la suite u (en supprimant les i premiers termes et en numérotant les suivants), on a 2−u ≥ 7×2−(i+3) si et seulement si 2−(u−i) ≥ 7/8, et par ailleurs 2−u ≤ 5×2−(i+3) si et seulement si 2−(u−i) ≤ 5/8. Mais un 2−v pour v∈ℕ∞ est soit =1 soit ≤ 1/2 selon que v0 vaut 1 ou 0 : en appliquant ce fait à u−i, on voit que si ui=1 on a 2−(u−i) ≥ 7/8 donc bi=1 et que si ui=0 on a 2−(u−i) ≤ 5/8 donc bi=0. Bref, bi=ui comme annoncé.
Enfin, il reste à montrer que x ≤ 2−b dans tous les cas. Comme 2−b est la borne inférieure (qui existe !) de 1 et des 2−i pour les i tels que bi=0, il s'agit de prouver x ≤ 2−i pour tout i tel que bi=0. Or on a vu ci-dessus que bi=0 entraîne x < (7/8)×2−i, ce qui entraîne bien ce qu'on a dit. ∎
Proposition : En supposant l'axiome du choix dénombrable, WMP séquentiel est équivalent à WMP analytique.
Démonstration : (Toute la démonstration suppose l'axiome du choix dénombrable.) Montrons d'abord que WMP séquentiel, sous la forme ∀u∈ℕ∞.((∀w∈ℕ∞.((¬(w=0)) ∨ (¬(w=u)))) ⇒ (u⋕0)), implique WMP analytique, sous la forme ∀x≥0.((∀t≥0.(t⋗0 ∨ x⋗t)) ⇒ (x>0)). Soit x≥0 dont on suppose qu'il vérifie ∀t≥0.(t⋗0 ∨ x⋗t), et on veut montrer x>0. Rappelons tout d'abord que d'après (❀) on a soit x>0 soit x<1 : le premier cas est exactement notre conclusion souhaitée, donc on peut se placer dans le second. Soit b∈ℕ∞ une suite binaire croissante telle que donnée par le lemme appliqué à x (qui est bien au sens large entre 0 et 1) : comme x>0 équivaut à x⋕0 (car on suppose x≥0), et que x⋕0 équivaut à b⋕0 (d'après le lemme), il nous suffit de montrer cette dernière affirmation. D'après notre formulation de WMP séquentiel (qu'on suppose), il suffit de montrer ∀w∈ℕ∞.((¬(w=0)) ∨ (¬(w=b))) pour pouvoir conclure. Soit donc w∈ℕ∞, et considérons le réel t := x ⊓ 2−w : d'une part, w=0 (qui, rappelons, est la même chose que ∞ dans ℕ∞) entraîne t=0 donc t≤0, et d'autre part w=b entraîne 2−w = 2−b ≥ x (d'après le lemme), donc t=x donc x≤t ; l'une de ces deux choses étant exclue, on a donc (¬(w=0)) ∨ (¬(w=b)), comme on voulait, ce qui conclut notre preuve.
Dans l'autre sens, montrons que WMP analytique, sous la forme ∀x≥0.((∀t≥0.(t⋗0 ∨ x⋗t)) ⇒ (x>0)), implique WMP séquentiel, sous la forme ∀u∈ℕ∞.((∀w∈ℕ∞.((¬(w=0)) ∨ (¬(w=u)))) ⇒ (u⋕0)). Soit u∈ℕ∞ dont on suppose qu'il vérifie ∀w∈ℕ∞.((¬(w=0)) ∨ (¬(w=u))), et on veut montrer u⋕0. Posons x := 2−u : on a 0≤x≤1 ; et comme u⋕0 équivaut à x⋕0 qui est impliqué par x>0, il nous suffit de montrer cette dernière affirmation. D'après notre formulation de WMP analytique (qu'on suppose), il suffit de montrer ∀t≥0.(t⋗0 ∨ x⋗t). Soit donc t≥0, appelons y := t⊓x, et soit w∈ℕ∞ une suite binaire croissante telle que donnée par le lemme appliqué à ce y (qui est bien au sens large entre 0 et 1). Alors t≤0 (c'est-à-dire en fait t=0) entraîne y=0 donc w=0 ; et d'autre part, x≤t entraîne y=x donc y = 2−u, donc (d'après le lemme) w=u ; l'une de ces deux choses étant exclue, on a donc bien t⋗0 ∨ x⋗t, comme on voulait, ce qui conclut notre preuve. ∎
À cause de l'apparition d'un quantificateur dans l'hypothèse, ce qui nécessite une « conversion » dans les deux sens, il semble qu'on ait besoin de l'axiome du choix dénombrable pour chacune des deux implications (à la différence de tous les autres principes d'omniscience que j'ai énoncés, pour lesquels la version analytique entraînait toujours la version séquentielle). J'ignore si cette utilisation de l'axiome du choix dénombrable dans les deux sens est vraiment essentielle.
☞ La méta-recette de cette section
Méta-recette : Beaucoup des
démonstrations de la section qui précède sont plus ou moins du
type WMPS ⇒ WMPT
où, si S est un ensemble muni d'un élément distingué ‘0’ et
d'une relation de discernement ‘⋕’,
l'affirmation WMPS est la
suivante : ∀u∈S.((∀w∈S.((¬(w=0))
∨ (¬(w=u)))) ⇒ (u⋕0))
. Si on
analyse un peu le mécanisme de preuve qui a été utilisé, il est
essentiellement le même (à de toutes petites variations) à chaque
fois, et il prouve en fait que les hypothèses suivantes permettent de
conclure WMPS ⇒ WMPT :
ⓐ on se donne fonction ou même une
multifonction φ:T⇉S (une
multifonction est une relation dont la première projection surjecte
l'ensemble de départ), ⓑ on se donne une fonction ou même une
multifonction ψ:T×S⇉T,
ⓒ on a ψ(x,0)=0 pour x∈T,
ⓓ on
a ψ(x,φ(x))=x
pour x∈T, et ⓔ φ(x)⋕0
implique x⋕0. Voici le schéma général de preuve. On
suppose WMPS et on veut
prouver WMPT. Pour cela, on se
donne x∈T dont on suppose qu'il vérifie
∀t∈T.((¬(t=0)) ∨
(¬(t=x))). Par ⓐ, on considère u
:= φ(x) (ceci voulant dire, une valeur
quelconque de la multifonction) et on souhaite (de manière à pouvoir
appliquer WMPS) prouver qu'il
satisfait ∀w∈S.((¬(w=0)) ∨
(¬(w=u))). Or donné w∈S,
par ⓑ, on considère t
:= ψ(x,w). D'après notre hypothèse
appliquée à t, on a (¬(t=0)) ∨
(¬(t=x)). Mais comme w=0
entraîne t=0 par ⓒ, et que w=u
entraîne t=x par ⓓ, et comme l'une de ces deux
choses est exclue, on a (¬(w=0)) ∨
(¬(w=u)), comme voulu.
Alors WMPS donne la
conclusion u⋕0 souhaitée. Par ⓔ, on en
déduit w⋕0. On a ainsi bien
prouvé WMPT. ∎
Valeurs de vérité et principes d'omniscience
Méta : Je comptais écrire ici une courte section finale, mais elle a gonflé démesurément et s'est transformée en labyrinthe de principes tordus, tous semblables. (Il aurait vraiment fallu que je fisse un diagramme représentant les différentes parties de Ω que je définis ci-dessous, et les inclusions entre elles, parce qu'on ne s'y retrouve pas.) Je pense néanmoins que ça vaut la peine de la survoler, parce que si les détails sont pénibles, l'idée générale de ce qu'on fait est, il me semble, assez intéressante, et fournit un point de vue différent sur les principes d'omniscience. Les réels disparaissent au début, et ne vont réapparaître que plus bas.
☞ Valeurs de vérité définies par pure logique
Je rappelle que dans une section du premier volet de cette série de billets, j'avais introduit l'ensemble Ω des valeurs de vérité, qu'on peut considérer comme l'ensemble des parties du singleton 1 := {•}. Classiquement, c'est juste un ensemble à deux éléments, et il n'est pas très intéressant, c'est juste un ensemble à deux éléments ; mais constructivement, c'est un ensemble extrêmement riche et potentiellement énorme (cf. cette réponse que j'ai faite sur Math StackExchange où je discute dans quelle mesure on peut essayer d'évaluer sa « taille »). Notamment, il peut avoir un sens de chercher à définir des parties de Ω correspondant à des valeurs de vérité vérifiant telle ou telle propriété.
Notamment, du point de vue purement logique, on peut définir :
- l'ensemble Ωbool := {⊥,⊤} = {p∈Ω : p∨¬p} des valeurs de vérités booléennes ou décidables (c'est-à-dire, le vrai et le faux) ;
- l'ensemble Ωclass := {p∈Ω : ¬¬p ⇒ p} = ¬[Ω] := {¬q : q∈Ω} = ¬¬[Ω] := {¬¬r : r∈Ω} des valeurs de vérités classiques ou (¬¬)-stables ou négatives ;
- l'ensemble Ωwbool := {p∈Ω :
¬p∨¬¬p} =: ¬−1[Ωbool] des
valeurs de vérités faiblement booléennes (ou
dont la négation est booléenne
).
(La terminologie est, malheureusement, mal standardisée, et un peu incohérente.)
Ainsi, Ωbool et Ωclass sont respectivement
les classificateurs des parties que
j'ai précédemment
qualifiées de décidables
et (¬¬)-stables
respectivement : c'est-à-dire qu'une partie décidable
(resp. (¬¬)-stables) d'un ensemble X est la même chose
qu'une partie dont la fonction indicatrice prend des valeurs dans
Ωbool (resp. Ωclass), c'est immédiat sur les
définitions ; autrement dit, se donner une partie décidable
(resp. (¬¬)-stables) d'un ensemble X revient exactement à
se donner une fonction X→Ωbool
(resp. X→Ωclass) ; et bien sûr rien ne nous
interdit d'inventer un terme pour les parties dont la fonction
indicatrice prend ses valeurs dans Ωwbool (quelque chose
comme faiblement décidable
peut-être ?).
On pourra remarquer que Ωbool = Ωclass ∩ Ωwbool : cela revient à démontrer l'équivalence entre p∨¬p et (¬¬p ⇒ p) ∧ (¬p∨¬¬p), qui est essentiellement évidente.
Je vais aussi définir :
- l'ensemble (Ω²)DM := {(p,q)∈Ω² : ¬(p∧q) ⇒ (¬p∨¬q)} des couples de valeurs de vérité vérifiant la loi de De Morgan (enfin, celle des lois de De Morgan qui n'est pas un théorème du calcul propositionnel intuitionniste).
(On pourra remarquer, si on veut, que (Ωwbool)² ⊆ (Ω²)DM : en effet, si on a ¬p∨¬¬p d'une part et ¬q∨¬¬q de l'autre, trois des quatre cas évidents vérifient ¬p∨¬q, et le quatrième vérifie ¬¬(p∧q).)
❇
☞ Valeurs de vérité définies par des suites binaires
Mais on peut aussi définir des ensembles de valeurs de vérités à partir de suites, et c'est là que ça devient intéressant. Ci-dessous, je note ⟦φ⟧ la valeur de vérité de l'énoncé φ (c'est-à-dire {• : φ} si on a décidé d'identifier Ω à 𝒫(1) où 1={•}, mais je pense que ce n'est pas plus clair comme ça) :
-
L'ensemble ΩΣ₁(séq) := {p∈Ω : ∃u∈{0,1}ℕ.(p ⇔ ∃i∈ℕ.(ui=1))} = {⟦∃i∈ℕ.(ui=1)⟧ : u∈{0,1}ℕ} = {⟦u⋕0⟧ : u∈{0,1}ℕ} sera l'ensemble des valeurs de vérité d'énoncés du type
la suite binaire u a un terme non-nul
.(Si on préfère, on peut aussi dire que c'est l'ensemble des ⋁{ui : i∈ℕ} pour u une suite à valeurs dans Ωbool, mais je ne sais pas si ça éclaircit les choses ou si ça les rend plus confuses.)
-
L'ensemble ΩΠ₁(séq) := {p∈Ω : ∃u∈{0,1}ℕ.(p ⇔ ∀i∈ℕ.(ui=0))} = {⟦∀i∈ℕ.(ui=0)⟧ : u∈{0,1}ℕ} = {⟦u=0⟧ : u∈{0,1}ℕ} sera l'ensemble des valeurs de vérité d'énoncés du type
la suite binaire u est nulle
.Comme u=0 est la négation de u⋕0, on peut aussi dire que ΩΠ₁(séq) = ¬[ΩΣ₁(séq)] := {¬q : q∈ΩΣ₁(séq)}. En particulier, on a ΩΠ₁(séq) ⊆ Ωclass (puisque Ωclass est l'ensemble des ¬q pour tous les q∈Ω).
(Si on préfère, on peut aussi dire que ΩΠ₁(séq) est l'ensemble des ⋀{ui : i∈ℕ} pour u une suite à valeurs dans Ωbool, mais de nouveau, je ne sais pas si ça éclaircit les choses.)
L'ensemble ΩΔ₁(séq) := ΩΣ₁(séq) ∩ ΩΠ₁(séq) sera l'intersection des deux précédents.
-
L'ensemble Ω¬¬Σ₁(séq) := {p∈Ω : ∃u∈{0,1}ℕ.(p ⇔ ¬∀i∈ℕ.(ui=0))} = {⟦¬∀i∈ℕ.(ui=0)⟧ : u∈{0,1}ℕ} = {⟦¬(u=0)⟧ : u∈{0,1}ℕ} sera l'ensemble des valeurs de vérité d'énoncés du type
la suite binaire u n'est pas nulle
.On peut aussi dire que Ω¬¬Σ₁(séq) = ¬[ΩΠ₁(séq)] := {¬q : q∈ΩΠ₁(séq)}, ou encore que Ω¬¬Σ₁(séq) = ¬¬[ΩΣ₁(séq)] := {¬¬r : r∈ΩΣ₁(séq)} (ce qui justifie la notation).
L'ensemble Ω¬¬Δ₁(séq) := Ω¬¬Σ₁(séq) ∩ ΩΠ₁(séq) sera l'intersection des deux précédents. C'est aussi ¬¬[ΩΔ₁(séq)] (comme je vais le rappeler plus bas).
Le truc est que classiquement, toute
valeur de vérité peut trivialement s'écrire sous la forme la
suite u prend la valeur 1
pour une certaine suite
binaire, et on peut même prendre une suite constante (juste la suite
valant identiquement 1 si ma valeur de vérité est vraie, et 0 si elle
est fausse). Mais constructivement, rien ne
garantit que toute valeur de vérité soit de cette forme. On a
quand même Ωbool ⊆ ΩΣ₁(séq) et Ωbool
⊆ ΩΠ₁(séq) parce qu'on peut, justement, prendre des suites
constantes (une valeur de vérité booléenne est la même chose qu'un
élément de {0,1}, et on peut former la suite constante de cette
valeur, ou de la valeur complémentaire) : autrement dit,
Ωbool ⊆ ΩΔ₁(séq).
On a aussi : ΩΔ₁(séq) ⊆ Ω¬¬Δ₁(séq) : en effet, si p ∈ ΩΔ₁(séq), elle est notamment dans ΩΠ₁(séq) donc dans Ωclass, c'est-à-dire que ¬¬p ⇔ p, et par conséquent le fait que ¬¬p soit dans Ω¬¬Σ₁(séq) nous donne le fait que p (qui lui est égal) y est aussi.
Bref : Ωbool ⊆ ΩΔ₁(séq) ⊆ Ω¬¬Δ₁(séq) ⊆ Ωclass.
Puisque ΩΠ₁(séq) ⊆ Ωclass, il n'y a pas lieu de définir Ω¬¬Π₁(séq) comme ¬¬[ΩΠ₁(séq)] (enfin, on peut le définir si on veut, mais c'est égal à ΩΠ₁(séq)).
Les parties d'un ensemble X dont la fonction indicatrice tombe dans ΩΣ₁(séq), resp. ΩΠ₁(séq), resp. ΩΔ₁(séq), peuvent se dire semi-décidables, resp. co-semi-décidables, resp. bi-semi-décidables (pour le dernier, voire les deux derniers, c'est vraiment moi qui invente). Une partie co-semi-décidable est juste le complémentaire d'une partie semi-décidable, et une partie bi-semi-décidable est une partie à la fois semi-décidable et co-semi-décidable.
⚠ Attention : Cette terminologie entre en conflit
avec celle de la calculabilité
(classiquement, les trois ensembles
ΩΣ₁(séq), ΩΠ₁(séq) et ΩΔ₁(séq) sont
juste Ω, qui est aussi pareil que Ωbool = {⊥,⊤}, donc toute
partie de n'importe quel ensemble vérifie toutes les notions que je
viens de définir, alors qu'une partie de ℕ n'est pas forcément
semi-décidable au sens de la calculabilité classique) ; mais il y a
une certaine analogie, et c'est même plus qu'une analogie, puisque
dans le topos effectif (si on sait ce
que c'est), une partie semi-décidable ou co-semi-décidable de
l'objet N des entiers naturels est bien la même chose qu'une
partie semi-décidable ou de complémentaire semi-décidable au sens de
la calculabilité classique (et par ailleurs, dans le topos effectif,
ΩΔ₁(séq) = Ωbool). C'est aussi ce qui explique
que j'ai utilisé la notation Σ₁ et Π₁, évocatrice d'une notation
standard en logique classique, la hiérarchie arithmétique
(cf. par
exemple ce
bout de ce vieux billet,
ou cet
article Wikipédia) ; néanmoins, ce n'est généralement pas la même
chose, parce que je ne demande pas, ici, que ma suite
binaire u soit définie de façon arithmétique, et je peux
considérer des parties de n'importe quel ensemble, pas juste ℕ (et
comme je viens de le dire, avec la terminologie que je viens de
définir, classiquement, n'importe quelle partie est
semi-décidable).
Digression : Ma notation suggère qu'on aurait envie de définir toute une hiérarchie avec ΩΣ₂(séq) et compagnie, mais là le fait de ne pas avoir l'axiome du choix même dénombrable commence à devenir sérieusement handicapant pour trouver les bonnes définitions. Je suis tenté de poser ΩΣ₂(séq) := {⟦∃i∈ℕ.∀j∈ℕ.(ui,j=1)⟧ : u∈{0,1}ℕ×ℕ}, mais peut-être qu'il faudrait plutôt le définir comme l'ensemble des ⋁{ui : i∈ℕ} pour u une suite à valeurs dans ΩΠ₁(séq), qui est a priori possiblement plus grand.
En tout cas, l'exemple archétypique d'une partie semi-décidable est la partie ℕ de ℕ∞ (puisque c'est justement {u∈ℕ∞ : u⋕∞}, où je rappelle que ∞, dans le contexte de ℕ∞, désigne la suite nulle) ; et l'exemple archétypique d'une partie co-semi-décidable est la partie {∞}, qui est son complémentaire.
☞ Reformulation des principes séquentiels d'omniscience
Quel rapport avec les principes d'omniscience ?
LPO séquentiel équivaut à l'affirmation que ΩΣ₁(séq) = Ωbool (i.e, l'inclusion Ωbool ⊆ ΩΣ₁(séq) qui a de toute façon lieu est, en fait, une égalité).
WLPO séquentiel équivaut à l'affirmation que ΩΣ₁(séq) ⊆ Ωwbool, ou, si on préfère, que ΩΠ₁(séq) = Ωbool (i.e, l'inclusion Ωbool ⊆ ΩΠ₁(séq) qui a de toute façon lieu est, en fait, une égalité), ou d'ailleurs, que ΩΠ₁(séq) ⊆ Ωwbool.
MP séquentiel équivaut à l'affirmation que ΩΣ₁(séq) ⊆ Ωclass.
LLPO séquentiel équivaut à l'affirmation que (ΩΣ₁(séq))² ⊆ (Ω²)DM.
-
WLLPO séquentiel équivaut à l'affirmation que (ΩΠ₁(séq))² ⊆ (Ω²)DM.
WLLPO séquentiel est aussi équivalent à l'affirmation que Ω¬¬Δ₁(séq) = Ωbool (i.e, l'inclusion Ωbool ⊆ Ω¬¬Δ₁(séq) qui a de toute façon lieu est, en fait, une égalité), ou d'ailleurs, que Ω¬¬Δ₁(séq) ⊆ Ωwbool.
Démonstration des équivalences :
L'équivalence de LPO avec ΩΣ₁(séq) ⊆ Ωbool est essentiellement notre définition de LPO sur les suites binaires : dire que pour toute suite binaire on a u⋕0 ∨ u=0 signifie exactement que la valeur de vérité p := ⟦u⋕0⟧ de u⋕0 vérifie p∨¬p (en se rappelant que u=0 est la négation de u⋕0).
L'équivalence de WLPO avec ΩΣ₁(séq) ⊆ Ωwbool est analogue ; pour son équivalence avec ΩΠ₁(séq) ⊆ Ωbool, il suffit de prendre cette fois p := ⟦u=0⟧ ; et l'équivalence avec ΩΠ₁(séq) ⊆ Ωwbool s'obtient en se rappelant que ¬¬(u=0) équivaut à ¬¬¬(u⋕0) soit ¬(u⋕0) soit u=0, ou si on préfère que Ωbool = Ωclass ∩ Ωwbool.
Le cas de MP est tout aussi simple.
Pour LLPO, dire que (¬((u⋕0) ∧ (v⋕0))) ⇒ ((u=0) ∨ (v=0)) signifie que les valeurs de vérité p := ⟦u⋕0⟧ et q := ⟦v⋕0⟧ vérifient (¬(p ∧ q)) ⇒ (¬p ∨ ¬q), c'est-à-dire (p,q) ∈ (Ω²)DM, d'où l'équivalence de LLPO avec (ΩΣ₁(séq))² ⊆ (Ω²)DM.
Pour WLLPO, on se rappelle qu'on en a vu deux formulations (équivalentes dans le cas séquentiel mais pas dans le cas analytique). Une formulation (qui mérite peut-être le nom de
MLLPO), sans l'hypothèse Ⓗ, affirme que (¬((u=0) ∧ (v=0))) ⇒ ((¬(u=0)) ∨ (¬(v=0))) (pour toutes suites binaires u,v), ce qui signifie que les valeurs de vérité p := ⟦u=0⟧ et q := ⟦v=0⟧ vérifient (¬(p ∧ q)) ⇒ (¬p ∨ ¬q), c'est-à-dire (p,q) ∈ (Ω²)DM, d'où l'équivalence de WLLPO (dans sa formulation « MLLPO ») avec (ΩΠ₁(séq))² ⊆ (Ω²)DM.L'autre formulation de WLLPO, avec cette hypothèse Ⓗ, affirme que ((¬((u⋕0) ∧ (v⋕0))) ∧ (¬((u=0) ∧ (v=0)))) ⇒ ((¬(u=0)) ∨ (¬(v=0))). Mais l'hypothèse (¬((u⋕0) ∧ (v⋕0))) ∧ (¬((u=0) ∧ (v=0))), sur les valeurs de vérité p := ⟦u⋕0⟧ et q := ⟦v⋕0⟧, s'écrit (¬(p ∧ q)) ∧ (¬(¬p ∧ ¬q)), qui équivaut à ¬q ⇔ ¬¬p par pure logique. La formulation dit donc que si p ∈ ΩΣ₁(séq) et que ¬¬p ∈ ΩΠ₁(séq) alors on a p ∈ Ωwbool, ce qui revient à dire, sur ¬¬p, que Ω¬¬Δ₁(séq) ⊆ Ωbool, ce qui revient encore à Ω¬¬Δ₁(séq) ⊆ Ωwbool puisque Ωbool = Ωclass ∩ Ωwbool. ∎
Tout ceci suggère plein d'autres principes d'omniscience potentiellement intéressant. Par exemple le principe ΩΔ₁(séq) = Ωbool (qui est impliqué par WLLPO), qu'on peut reformuler ainsi : si on a deux suites binaires (qu'on peut supposer croissantes) u,v telles que v soit nulle si et seulement si u a un terme non nul, alors soit u est nulle soit elle a un terme non nul : ∀u∈ℕ∞.∀v∈ℕ∞.((u⋕0 ⇔ v=0) ⇒ (u=0 ∨ u⋕0)).
☞ Des « principes d'ignorance » ?
On peut aussi être tenté de considérer des principes
d'ignorance
: au lieu d'affirmer que les
ΩΣ₁(séq),ΩΠ₁(séq),ΩΔ₁(séq) sont
petits, on peut au contraire postuler qu'ils sont gros : par exemple,
le schéma de Kripke
(évoqué ici)
postule que ΩΣ₁(séq) = Ω tout entier (donc si on combine ça
avec LPO ça nous donne immédiatement le tiers exclu
Ωbool = Ω) ; mais peut-être que Ωclass ⊆
Ω¬¬Σ₁(séq) ou bien Ωclass ⊆ ΩΠ₁(séq),
ou encore Ωclass ⊆ Ω¬¬Δ₁(séq) (la conjonction
des deux) sont des principes plus raisonnables, des sortes
d'anti-Markov
. La même page que je viens de lier propose aussi
un principe faible des possibilités finies
(?) qui, dans le
langage que j'ai utilisé ci-dessus, affirme que Ω¬¬Σ₁(séq)
= ΩΠ₁(séq).
Bon, ça n'a pas énormément de sens de multiplier les principes comme ça si je ne propose aucun moyen de montrer leur indémontrabilité relative, i.e., de construire des modèles qui en vérifient certains et pas d'autres, et comme rien dans ce billet ne parle de contre-modèles, et que je n'ai pas du tout réfléchi aux principes évoqués aux deux paragraphes précédents, il vaut mieux que je m'arrête ici pour les principes séquentiels.
❇
☞ Valeurs de vérité définies par des réels
L'idée, ensuite, c'est qu'on peut refaire presque exactement la même pour les principes analytiques. On définit :
-
L'ensemble ΩΣ₁(anal) := {p∈Ω : ∃x∈ℝ.(p ⇔ x⋕0)} = {⟦x⋕0⟧ : x∈ℝ} sera l'ensemble des valeurs de vérité d'énoncés du type
le réel x est discerné de 0
.Vu que x⋕0 équivaut à |x|>0 et que, inversement, x>0 équivaut à (0⊔x)⋕0, on peut aussi décrire ΩΣ₁(anal) comme l'ensemble {⟦x>0⟧ : x∈ℝ} des valeurs de vérité d'énoncés du type
le réel x est strictement positif
(et bien sûr ça marche aussi avecstrictement négatif
). -
L'ensemble ΩΠ₁(anal) := {p∈Ω : ∃x∈ℝ.(p ⇔ x=0)} = {⟦x=0⟧ : x∈ℝ} sera l'ensemble des valeurs de vérité d'énoncés du type
le réel x est nul
.Vu que x=0 équivaut à (-|x|)≥0 et que, inversement, x≥0 équivaut à (0⊔(-x))=0, on peut aussi décrire ΩΠ₁(anal) comme l'ensemble {⟦x≥0⟧ : x∈ℝ} des valeurs de vérité d'énoncés du type
le réel x est positif au sens large
(et bien sûr ça marche aussi avecnégatif au sens large
).Comme x=0 est la négation de x⋕0, on peut aussi dire que ΩΠ₁(anal) = ¬[ΩΣ₁(anal)] := {¬q : q∈ΩΣ₁(anal)}. En particulier, on a ΩΠ₁(anal) ⊆ Ωclass (puisque Ωclass est l'ensemble des ¬q pour tous les q∈Ω).
L'ensemble ΩΔ₁(anal) := ΩΣ₁(anal) ∩ ΩΠ₁(anal) sera l'intersection des deux précédents.
-
L'ensemble Ω¬¬Σ₁(anal) := {p∈Ω : ∃x∈ℝ.(p ⇔ ¬(x=0))} = {⟦¬(x=0)⟧ : x∈ℝ} sera l'ensemble des valeurs de vérité d'énoncés du type
le réel x n'est pas nulle
.On peut aussi dire que Ω¬¬Σ₁(anal) = ¬[ΩΠ₁(anal)] := {¬q : q∈ΩΠ₁(anal)}, ou encore que Ω¬¬Σ₁(anal) = ¬¬[ΩΣ₁(anal)] := {¬¬r : r∈ΩΣ₁(anal)}.
L'ensemble Ω¬¬Δ₁(anal) := Ω¬¬Σ₁(anal) ∩ ΩΠ₁(anal) sera l'intersection des deux précédents. C'est aussi ¬¬[ΩΔ₁(anal)] (comme je vais le rappeler plus bas).
De nouveau, on a : Ωbool ⊆ ΩΔ₁(anal) ⊆ Ω¬¬Δ₁(anal) ⊆ Ωclass.
Par ailleurs, ΩΣ₁(séq) ⊆ ΩΣ₁(anal) (puisque donné u∈ℕ∞ on a u⋕∞ si et seulement si (2−u)⋕0) ; il s'ensuit que ΩΠ₁(séq) ⊆ ΩΠ₁(anal) et ΩΔ₁(séq) ⊆ ΩΔ₁(anal) et Ω¬¬Σ₁(séq) ⊆ Ω¬¬Σ₁(anal) et Ω¬¬Δ₁(séq) ⊆ Ω¬¬Δ₁(anal).
Les parties d'un ensemble X dont la fonction indicatrice tombe dans ΩΣ₁(anal), resp. ΩΠ₁(anal), resp. ΩΔ₁(anal), peuvent se dire analytiquement semi-décidables, resp. analytiquement co-semi-décidables, resp. analytiquement bi-semi-décidables. (Et de nouveau, cette terminologie pose plein de problèmes, donc en fait ce n'est peut-être pas une super idée.) L'exemple archétypique d'une partie analytiquement semi-décidable est l'ensemble des réels strictement positifs ; et l'exemple archétypique d'une partie analytiquement co-semi-décidable est le singleton {0}.
☞ Reformulation des principes analytiques d'omniscience
De nouveau, on peut faire le lien avec les principes d'omniscience, analytiques cette fois, en recopiant presque verbatim ce que j'ai dit pour les principes séquentiels, sauf pour WLLPO où il faut faire un petit peu attention :
LPO analytique équivaut à l'affirmation que ΩΣ₁(anal) = Ωbool (i.e, l'inclusion Ωbool ⊆ ΩΣ₁(anal) qui a de toute façon lieu est, en fait, une égalité).
WLPO analytique équivaut à l'affirmation que ΩΣ₁(anal) ⊆ Ωwbool, ou, si on préfère, que ΩΠ₁(anal) = Ωbool (i.e, l'inclusion Ωbool ⊆ ΩΠ₁(anal) qui a de toute façon lieu est, en fait, une égalité), ou d'ailleurs, que ΩΠ₁(anal) ⊆ Ωwbool.
MP analytique équivaut à l'affirmation que ΩΣ₁(anal) ⊆ Ωclass.
LLPO analytique équivaut à l'affirmation que (ΩΣ₁(anal))² ⊆ (Ω²)DM.
Ce que j'ai appelé
MLLPO analytique
ci-dessus (qui équivaut, par exemple, à l'affirmation que la non-égalité sur ℝ est cotransitive) équivaut à l'affirmation que (ΩΠ₁(anal))² ⊆ (Ω²)DM.WLLPO analytique est équivalent à l'affirmation que Ω¬¬Δ₁(anal) = Ωbool (i.e, l'inclusion Ωbool ⊆ Ω¬¬Δ₁(anal) qui a de toute façon lieu est, en fait, une égalité), ou d'ailleurs, que Ω¬¬Δ₁(anal) ⊆ Ωwbool.
Le parallélisme entre les principes analytiques et les principes séquentiels est assez satisfaisant, mais je note quand même que je suis un peu contrarié de n'avoir aucune idée de comment définir un ΩΣ₂(anal), par exemple.
Je n'ai pas non plus eu le courage d'essayer de donner une traduction sur les valeurs de vérité principe de Markov faible (WMP) dont j'ai parlé dans une section optionnelle ci-dessus.
❦
Voilà, je vais arrêter là ce billet, et probablement cette série. Si je devais continuer cette série de billet, le suivant devrait probablement être consacré à la topologie générale (et à certaines des notions qui n'ont d'intérêt qu'en maths constructives, par exemple celle de partie « topologiquement localisée » ou « relativement sobre »), mais je doute d'avoir le courage de me lancer là-dedans, au moins sous forme de billet de blog : si vous voulez en savoir plus, consultez l'article de Grayson en deux parties sur le sujet, ici et là. L'autre chose dont je pourrais éventuellement parler, ce sont les topologies de Lawvere-Tierney et des faisceaux pour elles (tout ça peut se définir de façon complètement interne, sans jamais parler de topos ; je renvoie à ici pour des bribes d'explications, et là pour un rapport avec d'autres sujets dont j'ai parlé).