J'ai commencé à écrire ce billet en me disant que j'allais poster des versions condensées de divers trucs dont j'ai envisagé de faire des billets plus longs mais je n'ai pas eu le temps. Sauf qu'en fait j'ai écrit quelque chose d'un peu long pour chacun, et que j'en ai eu marre à chaque fois, donc j'aurais vraiment mieux fait de faire des billets séparés plutôt qu'un seul billet six-en-un. (Il y aurait aussi sans doute une auto-analyse psychologique intéressante à mener sur pourquoi j'arrive à me convaincre d'essayer poster des choses plus courtes — enfin, tout est relatif — à condition d'en mettre plusieurs dans un billet, mais je n'ai pas le temps pour ça maintenant non plus.)
- Pas de progrès du côté de l'archivage de ce site
- Activation du HTTPS ?
- Gmail traite mon mail comme du spam
- Je m'achète une voiture
- Construction projective d'un point à partir de n points
- Deux remarques sur l'approximation diophantienne
❦
Pas de progrès du côté de l'archivage de ce site
Je commence par ce qui n'est pas une nouvelle du tout, c'est même le contraire : j'avais raconté il y a un an que la Wayback Machine de l'Internet Archive n'arrive plus à archiver ce site (or s'il y a une chose à quoi je tiens beaucoup, c'est la préservation de l'information). Deux choses sont maintenant certaines : ① ce n'est pas volontaire (c'est un bug), et ② c'est lié au fait que ce site est (pour les raisons que j'ai expliquées ici) servi en HTTP et pas en HTTPS, même si le problème est sans doute causé par une conjonction de facteurs et j'ignore quels peuvent être les autres. Je soupçonne qu'il s'agit d'une sorte de firewall trop agressif qu'ils ont mis en place suite à des attaques diverses qu'ils ont subies, et qui est probablement mal calibré pour le HTTP parce que l'immense majorité des sites sont maintenant en HTTPS et que les HTTP sert donc essentiellement à renvoyer des redirections vers HTTPS. Je soupçonne quand même qu'il y a des conditions où HTTP marche encore sur l'Archive, parce que sinon ils se seraient rendu compte du problème plus tôt, mais je n'en sais pas plus. (Si des gens qui me lisent ont la possibilité de mener tes tests, je vous en supplie, faites-le, je suis preneur de tous renseignements.)
En attendant j'ai pris l'habitude de faire une copie de sauvegarde de mes billets de blog sur Archive.today (un site qui a plein de noms alternatifs : Archive.is, Archive.ph et d'autres). Le problème est qu'on ne sait pas qui est derrière ce truc, et que ses intentions ne sont pas claires : au minimum, on sait qu'il en profite pour faire résoudre des captchas aux gens qui s'en servent, et qu'il a lancé des attaques denial-of-service ; et j'ai aussi entendu passer l'information selon laquelle il aurait truqué des archives, bref, ce n'est pas une solution de repli raisonnable, sauf à court terme. J'aimerais vraiment pouvoir revenir à l'Internet Archive.
Le problème est qu'il est quasi impossible de contacter l'Internet
Archive pour essayer d'attirer l'attention sur le problème qui me
concerne. J'ai essayé de leur écrire plusieurs fois, ça tombe dans un
trou noir. J'ai essayé d'envoyer un courrier papier (vous savez, le
truc du siècle dernier, ou on met un timbre sur une enveloppe), c'est
aussi tombé dans un trou noir. Puis un jour ()
j'ai eu une réponse surgie de l'espace disant qu'ils avaient identifié
un problème et allaient le régler (We have identified
an issue and are working on a fix. I will update you when we have
implemented it.
), du coup j'ai eu de l'espoir… sauf qu'en fait
rien ne s'est passé, et le problème n'a pas changé. Puis, il y a deux
mois, nouvel espoir : j'ai
eu une
conversation sur Bluesky
avec Jason
Scott, qui est un des personnages importants de l'Internet
Archive, qui m'a assuré qu'ils n'étaient pas au bord de la faillite
comme je le pensais, qui m'a dit qu'ils pouvaient tout à fait
s'occuper de ce genre de choses, et et qui m'a dit de signaler mon
problème par mail en le mettant en copie… ce que j'ai fait, il m'a dit
avoir transmis à qui de droit, et… deux mois plus tard, toujours pas
le moindre signe de changement.
Bref, j'ai bien peur qu'il faille que j'admette que ce problème ne sera jamais réglé et que la seule option qui s'offre à moi est de rendre mon site accessible en HTTPS (enfin, encore faudrait-il être bien certain que ça réglera le problème, ce dont je ne suis pas sûr du tout). Je passe donc à l'item suivant de ce billet.
❦
Activation du HTTPS ?
Il va falloir que j'envisage (à reculons et à contrecœur, donc) de rendre mon site accessible en HTTPS. Puisque j'évoque le sujet, il faut d'ailleurs que je signale cette vidéo (que plusieurs contacts m'ont envoyée tant elle semble faite pour moi) de quelqu'un qui, pour en gros exactement les mêmes raisons que moi n'a pas envie de passer son site en HTTPS et qui le fait quand même en faisant exprès, pour protester, de rendre le HTTPS aussi peu sûr que possible : c'est rigolo, et surtout, en fait, on en apprend pas mal au passage sur le fonctionnement de HTTPS.
Je n'irai pas jusque là, même s'il est probable que je
publie[#] la partie « privée »
du certificat du site, juste pour me simplifier sa distribution d'une
machine à l'autre. Ma question à moi est surtout comment je peux
faire ce passage en minimisant les emmerdes que je vais devoir subir
en conséquence de ces conneries. À commencer par le fait de devoir
remettre en place tout le setup dès qu'un de mes
serveurs claque entre mes doigts,
ce qui arrive tous les quelques mois. (Exemple de problème :
actuellement, je pare le problème des serveurs qui meurent tout le
temps en ayant un serveur prêt à prendre le relais à tout instant, et
j'ai simplement à changer le DNS pour faire
pointer www.madore.org de l'un vers l'autre ; mais s'il y
a un certificat à fournir, le serveur de secours ne peut pas obtenir
lui-même par des canaux comme Lets Encrypt le certificat
pour www.madore.org puisqu'il n'est, justement, pas
accessible sous ce nom en temps normal ; donc il faut que je trouve un
moyen de transférer le certificat vers le serveur de secours, et c'est
d'ailleurs une des raisons pour lesquelles j'envisage de publier la
partie privée du certificat pour simplifier la démarche.)
[#] Étant bien entendu que comme ce HTTPS ne sert rigoureusement à rien question sécurité vu que mon site ne contient rien de non-public, l'aspect « privé » de ce certificat est bidon, et il peut parfaitement être rendu public.
Une possibilité serait que j'utilise un certificat auto-signé, ce qui me permet d'avoir un unique certificat pour toutes mes machines et de m'affranchir de la limitation de durée de validité sur les certificats. Ce serait même plus raisonnable en termes de sécurité (si la sécurité était un enjeu, ce qu'elle n'est pas) parce que comme ça les gens qui veulent vraiment vérifier l'authenticité du site pourraient s'assurer que le certificat ne change jamais, alors que si on passe par Lets Encrypt il faut vérifier que la clé de signature ne change pas, et c'est beaucoup plus technique. Une chose est que l'usage d'un certificat auto-signé cause un message d'erreur pénible, mais bon, ça je m'en fous, c'est le problème des gens qui tiennent à utiliser HTTPS alors que ça ne sert à rien sur un site public. En revanche, ce n'est pas clair du tout ce que fait l'Internet Archive quand ils tombent sur un site en HTTPS dont le certificat est auto-signé, parce que l'Internet Archive est quand meme toute la raison de la manœuvre. Et je n'en ai aucune idée.
Mais la grosse grosse source de maux de tête, c'est ce que fait Google et ce qui se passe avec la canonisation des URL.
Le problème fondamental, c'est que les versions HTTP
et HTTPS d'un site Web sont, du point de vue des
standards, deux sites totalement séparés. Et Google n'aime pas que
deux sites séparés dupliquent la même information : c'est pénalisant.
Et pour ajouter l'injure à la blessure, par défaut il va considérer
que HTTPS est le site principal (à renvoyer en priorité),
alors que moi je veux exactement le contraire (je veux bien que le
site soit accessible en HTTPS, mais je ne veux pas que
Google renvoie des liens en HTTPS, qui seront
probablement cassés la moitié du temps vu combien le système est
compliqué et fragile). Je peux mettre un robots.txt
interdisant à Google le parcours de la version en HTTPS,
mais je ne suis pas certain que ça fonctionne, ni que ça suffise, ni
que ça ne soit pas pénalisant. Et je ne sais pas non plus ce que fait
Google quand il rencontre un certificat auto-signé si je choisis cette
solution (s'il refuse d'accéder à la version HTTPS dans
ces conditions, c'est parfait pour moi, mais encore faut-il être sûr
qu'il n'en profite pas pour désindexer ou pénaliser la
version HTTP).
Et puis il y a la question de comment persuader les gens qui
partagent des liens vers mon site d'utiliser uniquement le lien
en HTTP, même si le site est aussi accessible
en HTTPS (par exemple, si je mets
un robots.txt qui interdit la version HTTPS
à Google, c'est indispensable sinon les liens HTTPS
seront en quelque sorte perdus ; et à l'inverse, si je ne le fais pas,
je vais me retrouver avec du crawling en double, par exemple toutes
les IA avides de texte vont probablement tout récupérer
deux fois). Je peux mettre un bandeau en tête de page avec du
JavaScript, mais c'est chiant pour tout le monde.
À un moment je m'étais dit que je créerais un domaine spécial
appelé quelque chose
comme www-https-sucks-please-do-not-use-this-url.madore.org
et que le HTTPS soit accessible uniquement via ce
domaine, mais alors ça ne règle rien côté Internet Archive parce que
personne ne va penser à interroger les archives pour ce domaine
spécial. Ou alors il faut que je mette en place une redirection
de HTTP vers HTTPS uniquement si la requête
vient de l'Internet
Archive[#2].
[#2] Si je ne trouve pas de solution raisonnable sur comment faire cohabiter HTTP et HTTPS, peut-être que je choisirai le pis-aller qui est de n'ouvrir le port HTTPS que pour les IP de l'Internet Archive, et, pour elles et pour elles seulement, de faire une redirection de HTTP vers HTTPS. Donc tout le monde continuera à n'avoir que du HTTP sauf l'Internet Archive (ou peut-être les gens super motivés qui m'en feraient une demande exprès). Je n'aime pas trop cette solution (c'est une forme de géolocalisation, et je déteste le principe), mais elle a le mérite d'éviter les tracas liés à la question de ce que fera Google.
Bref, on voit le genre de questions sans fin auxquelles je suis confronté, et dont personne ne parle jamais quand on essaie de vous faire la propagande pour le HTTPS. Je ne peux même pas vraiment faire de tests, parce que le simple fait d'ouvrir le port HTTPS sur mon serveur n'est pas du tout anodin. Tout ça me prend vraiment la tête, et j'ai franchement autre chose à faire de mon temps que de devoir m'occuper de telles conneries. (Et j'ai bien peur que ça finisse en demande de conseils à des IA.)
❦
Gmail traite mon mail comme du spam
Continuons avec le chapitre Google m'emmerde
avec une autre
source de tracas dont je me serais bien passé :
En gros tous les mails que j'envoie vers Gmail sont considérés comme du spam.
Le problème est que j'ai un serveur mail
personnel. OK, mais ce n'est pas nouveau, et
franchement, ils abusent : j'ai publié des
enregistrements SPF, tous mes mails sont signés
par DKIM, il y a une politique DMARC, mon
serveur a des enregistrements DNS valides, avant et
arrière, il n'a jamais envoyé un seul spam (forcément, il ne sert qu'à
mon courrier personnel, et je ne forwarde rien), absolument tous les
champs concernant mon domaine sur postmaster.google.com
sont verts, et pourtant le résultat est là : en gros, tous les mails
que j'envoie vers n'importe quelle adresse Gmail
atterrissent directement dans la boîte à
spam[#3].
[#3] Peut-être que si
le destinataire classifie pas du spam
suffisamment souvent,
alors le mail finit par arriver à être considéré comme non-spam. Mais
je crois que même ça ne dure pas longtemps. (Malheureusement, mes
interlocuteurs ne me donnent pas trop de feedback sur ce qui se passe.
J'ai moi-même une adresse Gmail avec laquelle j'ai fait
quelques tests, mais ce que j'observe n'est pas forcément
universel.)
Même quand quelqu'un m'écrit à une adresse
sur madore.org et que je réponds depuis exactement cette
adresse-là, ça tombe (parfois ? toujours ? pas totalement clair) dans
la boîte à spam. Google est vraiment nul, là : un mail qui répond,
avec un message-ID valable, à un mail expédié
depuis Gmail à cette adresse, et surtout si le mail est
signé par DKIM, ça n'a juste aucun sens de
considérer que ça peut être du spam.
Bon, le problème n'a pas que des inconvénients :
généralement, quand j'envoie des mails, c'est plutôt qu'on m'a demandé
quelque chose. Donc parfois ah ben j'aurais bien voulu te répondre
[voire :
peut être une
excuse pratique pour ne pas répondre. Mais parfois je veux quand même
contacter des gens sur Gmail. Ma solution temporaire est
d'écrire depuis mon adresse mail professionnelle en mettant mon
adresse personnelle en copie et les deux en reply-to ; ou bien
d'envoyer un message par un autre canal (SMS, Signal,
message privé sur un réseau social) pour dire je t'ai répondu
], mais ce n'est pas ma faute
si Gmail ne veut pas de mes messagesje t'ai répondu,
regarde dans ta boîte à spam
. C'est quand même lourdingue.
Qu'est-ce qui se passe ? Je n'en sais rien. Comme je le dis plus
haut, sur postmaster.google.com on me dit que tout va
bien, que mon domaine n'a rien à se reprocher. Les
rapports DMARC que Google m'envoie ne disent rien non
plus. Le mail n'est pas rejeté : il est marqué comme spam.
Je ne sais pas exactement depuis quand ça date, parce que je n'écris pas si souvent que ça à des gens chez Gmail, et je ne sais pas forcément si mon mail s'est perdu ou que la personne a juste décidé de ne pas répondre. J'ai toujours eu quelques problèmes à écrire à des adresses Gmail, mais c'est bien pire maintenant qu'il y a quelques années.
![[Magnolias en fleurs devant un bâtiment style fin XIXe]](../images/2025-03-22-magnolias-ecole-estienne-small.jpg)
![[Pommiers en fleurs dans une rue à Paris]](../images/2025-03-25-pommiers-en-fleurs-small.jpg)
![[Buisson de prunelliers en fleurs (blanches)]](../images/2026-03-04-prunellier-a-chevreloup-small.jpg)
![[Pruniers-cerises en fleurs (blanches)]](../images/2026-03-04-pruniers-cerise-a-chevreloup-small.jpg)
![[Cerisier du Japon en fleurs (blanches), avec des gens devant en train de l'admirer]](../images/2025-03-27-shirotae-jardin-des-plantes-small.jpg)
![[Cerisiers du Japon en fleurs (blanches) le long d'une route]](../images/2025-03-29-cerisiers-route-de-damiette-small.jpg)
![[Cerisiers du Japon en fleurs (blanches) sur un parking]](../images/2025-03-29-cerisiers-parking-de-courcelles-small.jpg)
![[Cerisiers du Japon en fleurs (roses) dans un parc, avec des gens dessous en train de pique-niquer]](../images/2025-04-12-hanami-parc-de-sceaux-small.jpg)
![[Tableau des particules élémentaires]](../images/particules.png)