David Madore's WebLog: 2026-06

Bon, c'est bien ma veine que ce qui est selon certaines métriques la pire canicule jamais enregistrée en France tombe au moment où notre clim principale est en semi-panne (elle doit produire quelque chose comme 1000W–1500W de froid, ce qui n'est pas rien, mais ce qui suffit tout juste à maintenir une seule pièce tempérée pendant la nuit[#]). Du coup, mon poussinet a fui à la montagne, et moi je survis grâce à trois clims d'appoint monobloc qui doivent totaliser quelque chose comme 6000W–6500W de puissance frigorifique (en consommant environ 2000W d'électricité[#2]). Ça tient à peu près, mais ça fait un boucan terrible (je coupe une des trois clims d'appoint, la nuit, dans la pièce où je dors, en laissant notre clim principale anémique faire le boulot de la maintenir à une température supportable).

[#] La nuit dernière, la température minimale à Paris a dépassé 26°C, ce qui est supérieur à la « normale saisonnière » de la maximale. Autrement dit, il fait plus chaud au plus froid du petit matin qu'il ne fait normalement au plus chaud de la journée. Donc si la clim arrive quand même à maintenir une température de 24°C dans la pièce (surtout que l'immeuble a emmagasiné énormément de chaleur), c'est qu'elle fait quand même un peu de froid. Mais vu comme elle est dimensionnée elle devrait pouvoir maintenir notre appartement tout entier à 20°C même par une canicule pareille sans difficulté majeure si on le voulait.

[#2] Heureusement, nous avons une formule Tempo donc ça ne nous coûte que quelques euros par jour. Heureusement aussi, la France est fortement exportatrice en ce moment (malgré l'arrêt de quelques centrales nucléaires pour éviter de trop réchauffer les rivières qui leur servent de source froide) : le jour où j'écris, les exports nets varient entre 5GW et 12GW.

☞ Problèmes de clim, toujours

Pour résumer le problème de notre clim principale (plus de détails ici) : quand on la redémarre, elle tourne normalement pendant une petite heure, puis baisse progressivement en régime jusqu'à une valeur minimale de quelque chose comme 500W (de consommation électrique mesurée). Selon notre analyse (au poussinet et à moi), c'est clairement le symptôme d'une fuite de gaz : pas vraiment que le manque de gaz l'empêche de faire du froid (d'ailleurs, en production de chaud, elle marche très bien), mais plutôt qu'elle ne peut pas le transporter efficacement du compresseur vers les unités intérieures, si bien qu'elle doit se mettre en sécurité en baissant sa puissance. Il y a un code d'erreur qui apparaît sur les LEDs du module de contrôle qui semble le confirmer. Et surtout, mon poussinet a promené un détecteur de gaz fluorés à proximité du compresseur, qui a détecté quelque chose. En plus de ça, l'an dernier nous avons eu exactement les mêmes symptômes, et c'était bien une fuite (qui nous a obligés à changer l'unité extérieure, c'est-à-dire quasiment toute la clim). Bref, normalement, la marche à suivre devrait être facile : faire venir un techicien pour détecter la fuite, la réparer si elle est réparable[#3], puis remettre du gaz. Seulement, il faut réussir à faire venir un technicien, et qu'il ne soit pas trop incompétent.

[#3] L'an dernier, la fuite venait de la « batterie » du compresseur, élément qui n'est pas réparable : d'où la nécessité de changer l'unité. (Et elle n'était plus sous garantie, donc vraiment pas de chance pour nous.) Rien ne dit que l'endroit de la fuite soit le même cette fois-ci, ça pourrait être un raccord, ce qui serait alors un problème mineur et facile à régler (si on arrive à faire venir quelqu'un pour le régler !). Le poussinet semble croire que c'est exactement la même chose que l'an dernier, c'est-à-dire une fuite dans la batterie du compresseur et qu'il faudra de nouveau changer l'unité (heureusement, en principe elle est sous garantie, cette fois) ; moi je ne crois pas à la loi des séries donc je penche plutôt pour une fuite dans un raccord (ce qui est un emplacement beaucoup plus courant que la batterie). En tout état de cause, que ce soit ou non au même endroit, avoir un problème de ce type, normalement rare, deux ans d'affilée, est troublant quant à notre manque de chance (surtout que nous entretenons correctement le matériel), et nous sommes perplexes.

☞ De la difficulté à faire venir quelqu'un

Les techniciens et installateurs de clims de France sont évidemment noyés sous le travail en ce moment, et ça ne va pas s'arranger avant septembre. Mais même hors canicule exceptionnelle, ce n'est pas évident de faire venir quelqu'un.

Le type qui nous l'a posée initialement (et qui a remplacé l'unité extérieure l'an dernier), est basé à Bouffémont, au nord de Paris. Venir de Bouffémont jusque dans le 13e arrondissement de Paris, c'est quelque chose comme 1h à 2h de route. Beaucoup d'artisans refusent d'ailleurs maintenant tout simplement de travailler à Paris parce que la circulation à Paris est impossible. Lui acceptait de venir… mais il ne cessait de nous poser des lapins : il nous disait qu'il viendrait tel jour, nous nous organisions pour l'attendre, nous passions la journée à l'attendre, et le soir il nous appelait pour nous dire qu'il ne viendrait pas ; et il nous a fait le coup jusqu'à trois ou quatre fois d'affilée, ce qui est d'un manque de professionnalisme vraiment affolant[#4]. Comme en plus on se demande quelle est sa part de responsabilité dans nos problèmes[#5], nous avons décidé que nous ne voulions plus le voir.

[#4] Je comprends qu'on prévoie une petite marge d'overcommit des rendez-vous ; mais la moindre des choses, c'est que si on a fait sauter le rendez-vous d'un client, ce client devient ultra-prioritaire au rendez-vous suivant. Faire sauter trois fois d'affilée le rendez-vous du même client, c'est vraiment se moquer du monde.

[#5] Il n'est probablement pour rien dans la fuite (mais le fait que nous ayons exactement le même problème que l'an dernier nous laisse quand même perplexe : se peut-il qu'il stocke son matériel dans des circonstances qui donne naissance à des fuites ? l'unité pouvait-elle déjà avoir fui du gaz quand il nous l'a posée ?). Ce qui est sûr, c'est qu'il nous a au moins fait perdre notre garantie en nous persuadant que notre unité fonctionnait très bien à un moment où, en fait, elle avait déjà des symptômes.

Mais qui faire venir à la place ? Comme je le dis plus haut, pas mal de gens refusent de venir dans Paris, et encore d'autres refusent de travailler sur du matériel Mitsubishi (qui n'est pas le plus répandu en France).

L'an dernier (quand nous avions les mêmes problèmes, donc), nous avions trouvé un apporteur d'affaires qui nous avait envoyé un technicien très bien. Le terme d'apporteur d'affaire mérite peut-être quelque explication. Si je comprends bien, beaucoup de techniciens de clim sont auto-entrepreneurs, mais ils n'ont pas l'envie (et/ou pas la compétence) de démarcher eux-mêmes les clients, ou peut-être pas de faire la paperasse administrative, les factures, etc. : il y a donc des apporteurs d'affaires qui s'en chargent, facturent les interventions aux clients, et sous-traitent tout aux techniciens. C'est peut-être aussi l'apporteur d'affaires qui commande le matériel. Je ne sais pas bien pourquoi, ils ne veulent pas vraiment que les clients soient au courant[#6] de cette organisation, donc ils font semblant que les techniciens sont leurs employés. Tout ça est un peu bizarre et agaçant (mais pas vraiment suspect). Quoi qu'il en soit, nous avions trouvé l'an dernier un apporteur d'affaires qui nous avait à la fois semblé aimable et lui-même compétent (nous avions longuement discuté au téléphone du problème), et qui nous avait envoyé quelqu'un de bien, lequel a diagnostiqué notre fuite et nous a dit qu'elle n'était pas réparable[#7].

[#6] Les deux types que l'apporteur d'affaire nous a envoyés se présentaient comme travaillant pour lui. Mon poussinet demande en fait, vous êtes auto-entrepreneur, n'est-ce pas ? et ils réagissent comme si nous étions au courant d'un truc un peu secret.

[#7] Nous aurions voulu faire appel à eux pour changer l'unité, mais comme ils n'en avaient pas, nous avons fait appel à notre installateur d'origine (celui de Bouffémont), qui avait la pièce en stock. Rétrospectivement, c'était peut-être une erreur, et le poussinet me reproche de l'avoir poussé dans ce sens (parce que je voulais une clim qui marche le plus vite possible).

☞ Un technicien qui nous a pris pour des guignols

Cette année (peu avant la présente canicule) nous avons donc recontacté le même apporteur d'affaires pour diagnostic et recherche de fuite. Mais il nous a envoyé quelqu'un de beaucoup moins satisfaisant.

En gros, le technicien qui est venu avait l'air de nous prendre pour des affabulateurs, il a essayé de nous gaslighter que notre clim marche très bien. Il ne l'a pas dit explicitement, mais c'était très clair qu'il nous prenait pour des guignols.

Primo, il a déclaré d'emblée que ça ne pouvait pas être une fuite, parce que (selon lui, si je résume) s'il y a une fuite, tout le gaz part et la clim ne marche plus du tout. Bon, peut-être que les petites fuites telles que tout le gaz ne sorte pas rapidement, et qui n'empêchent pas totalement la clim de fonctionner sont rares, mais nous savons certainement que c'est possible puisque nous en avons eu une l'an dernier, avec, encore une fois, exactement les mêmes symptômes, et qu'un autre technicien (envoyé par le même apporteur d'affaires) a diagnostiqué ça comme une fuite, qu'il a localisée[#8].

[#8] Le détecteur de gaz bippait à la folie à l'endroit qu'il a trouvé, donc il n'y avait vraiment aucun doute.

Secundo, le type nous a expliqué que le fait que notre détecteur de gaz bippe à proximité de la clim ne voulait rien dire du tout parce que ces trucs peuvent détecter plein d'autres choses, par exemple de la peinture ou un solvant de colle. Alors oui, c'est vrai, il y a des faux positifs ; mais quand le truc bippe justement à proximité d'un bloc de clim qui dysfonctionne et qu'il n'y a eu aucun travaux de peinture ou rien de la sorte, il faudrait quand même prendre ça au sérieux.

Tertio, le type a mesuré la température de l'air qui sortait de nos unités intérieures et l'a trouvée tout à fait normale (quelque chose comme 9°C). Certes, mais il est venu un jour où il devait faire 24°C dehors et où la clim même avec la puissance rachitique à laquelle est réduite arrivait bien à tenir sa consigne : pas étonnant qu'elle arrive à sortir encore de l'air froid. (Au moment où j'écris, ce n'est plus du tout le cas : il est plutôt autour de 15°C en sortie.) Forcément, quand il ne fait pas très chaud dehors, notre clim semble marcher normalement.

Quarto, il a sorti son manomètre pour mesurer la pression de gaz, et a constaté qu'elle était normale. Le truc, c'est que ça ne dit rien du tout : le gaz dont on parle — et je devrais plutôt écrire le fluide tout du long — passe entre l'état liquide et l'état gazeux au cours du cycle thermodynamique ; et tant qu'il en reste assez pour pouvoir produire du liquide, la présence du liquide assure que la pression sera forcément égale à la pression de vapeur saturante à la température considérée. C'est le B-A-BA de la thermodynamique : mesurer la pression au manomètre n'a de sens que si elle est trop faible pour permettre la condensation comme liquide, et en l'occurrence il doit nous en rester encore assez[#9] pour ça.

[#9] Peut-être que ça explique que le type croie qu'une fuite ne peut pas conduire à ce que la clim marche seulement à moitié : s'il ne compte comme fuite qu'une circonstance où son manomètre mesure moins que la pression de vapeur saturante, quand il y a fuite il n'y a plus de liquide, donc la clim ne doit plus fonctionner du tout.

Bref, pour toutes ces raisons (la certitude qu'une fuite cause forcément la perte de tout le gaz, l'idée que notre détecteur de gaz peut bipper à tort, et les constatations que l'air sortait bien froid et que les pressions étaient bonnes), le type avait l'air convaincu que notre clim marchait très bien, et il était clair qu'il nous prenait pour des guignols. Et ça ne s'est pas arrangé.

On peut dire que mon poussinet s'y connaît raisonnablement bien en clims : il a fait un master de physique spécialisé en climatisation (ça c'était avant qu'il fasse un deuxième master — puis une thèse — en informatique). Je lui avais conseillé de mentionner ce fait discrètement et en passant[#10] aux techniciens qui passent pour s'occuper de notre clim, histoire d'envoyer le signal que nous ne sommes pas des incompétents faciles à arnaquer[#11].

[#10] Plutôt en mode ah vous savez, la clim, c'est un sujet qui me passionne, d'ailleurs j'ai fait un master de physique là-dessus avant de me tourner vers l'informatique.

[#11] Des artisans peu scrupuleux aiment parfois profiter de l'ignorance de leurs clients dans le domaine de leur spécialité, même si ça semble surtout concerner les plombiers et les électriciens dont on trouve le numéro sur des affichettes numéros d'urgence à garder chez soi, j'ai des connaissances indirectes qui ont payé fort cher — littéralement — leur manque d'expertise dans tel ou tel domaine.

Mais ça peut aussi avoir l'effet inverse : braquer les gens qui se sentent pris de haut. Je crois que notre type s'est senti pris de haut parce que nous avons réfuté les quatre points que j'ai listés ci-dessus (nous avons essayé de le faire diplomatiquement, mais je ne vois pas trop comment nous pouvions éviter de le faire). Il nous a expliqué que ça faisait quinze ans qu'il travaillait dans la clim, et là c'était mal parti.

☞ …et qui est venu sans bouteille pour la pesée

Bon, on peut dire : OK, il n'est peut-être pas super au courant des aspects théoriques du domaine, il n'a pas fait un master en clim, il ne sait peut-être pas ce qu'est une pression de vapeur saturante, mais il peut quand même connaître son métier. Mais pas vraiment non plus.

[Lire la suite…]

Méta : Le billet qui suit est une adaptation d'un long fil Bluesky dont je me suis dit après l'avoir écrit que, finalement, il aurait plus sa place sous forme de billet de blog. (J'ai surtout ajouté quelques notes explicatives, et parfois un peu reformulé les phrases.) Je reprends un certain nombre de choses que je disais dans mon autre billet récent sur le même sujet, parfois en les disant un peu différemment, et j'ajoute d'autres idées que j'avais oublié d'exprimer, en revanche je ne m'appesantis pas sur le unit distance problem en particulier. Bref, le présent billet peut être lu indépendamment de l'autre. Il peut aussi être lu indépendamment de la vidéo qui sert de point de départ à toutes ces réflexions (et à laquelle je reproche globalement de présenter un point de vue très restrictif). Et j'espère qu'il est largement compréhensible pour les non-mathématiciens (c'est quand même le but !), d'autant que la vidéo commentée est faite par un philosophe.

Comme d'habitude, ce texte est 100% écrit par mon petit cerveau de mathématicien humain : ce n'est pas pour me vanter, c'est plutôt pour justifier les fautes de frappe ou d'orthographe certainement nombreuses et qu'une IA n'aurait pas faites.

Le point de départ, donc, c'est qu'on m'a demandé de regarder cette vidéo du philosophe vulgarisateur Monsieur Phi sur les progrès des LLM[#] en maths et de donner mon avis.

[#] Je rappelle que les LLM (Large Language Models) sont le principal type d'IA génératrices de texte (p.ex., ChatGPT, Claude, Gemini, DeepSeek, sont essentiellement des LLM, même s'ils ont des passerelles vers d'autres types d'IA, par exemple pour produire ou analyser des images). J'essaie, sans forcément être parfaitement cohérent, d'utiliser le terme IA (qui ne veut pas dire grand-chose, en tout cas scientifiquement) pour le domaine en général, et LLM pour celles dont il est question ici.

Bon alors d'abord, j'ai bien regardé la vidéo, et je dois commencer par dire que tout ce que j'y ai entendu me semble juste, et plutôt bien expliqué. En revanche, il y a un certain nombre de choses qui auraient pu être dites et qui ne l'ont pas été, et pour certaines je le regrette. Voici donc ce que je peux ajouter à titre personnel. (Et oui, bien sûr, je ne m'attends pas à ce qu'une vidéo YouTube dise tout ce que je raconte ci-dessous, mais je trouve quand même que le message se résume pas mal à les IA sont devenues très fortes très vite, sur lequel il y a beaucoup de mise en perspective à faire.)

(Plan :)

☞ Les preuves erronées

D'abord, ça me semble important de souligner que les LLM actuels continuent à l'heure actuelle à produire énormément de démonstrations fausses (théorèmes hallucinés, appliqués avec les mauvaises hypothèses, confusions quand un terme a plusieurs sens, etc.). Même les « bons » modèles. (Oui, les bons en font moins, mais on leur demande des choses plus compliquées, et là ils en font encore beaucoup.) On peut parfois détecter ces erreurs, certainement les réduire, en demandant au LLM de vérifier sa propre preuve, mais même ainsi, la confiance n'est pas terrible. Du coup, si on veut quelque certitude, soit il faut formaliser la preuve en Lean[#2], ce qui n'est possible qu'avec un tout petit bout de la recherche en maths (dont beaucoup de problèmes d'Erdős[#3], qui ont la spécificité d'être très élémentaires), soit la faire vérifier par un expert humain, et là on a un bottleneck, parce que les experts ont autre chose à foutre que vérifier N preuves générées par IA dont beaucoup sont du bullshit.

[#2] Comme je l'explique dans un bout de mon précédent billet sur le sujet, Lean est un outil informatique dans lequel on peut exprimer des preuves mathématiques de façon formelle, et qui vont alors la vérifier (de façon complètement automatisée, et fiable). On peut demander à un LLM d'écrire ou de convertir la preuve en Lean. Mais pour que la preuve soit effectivement formalisable en Lean, il faut que tous les outils qu'elle utilise aient été eux-mêmes préalablement formalisés en Lean, ce qui, à l'heure actuelle, est loin de couvrir la totalité du spectre des mathématiques connues.

[#3] Paul Erdős était grand collectionneur de problèmes mathématiques, et ses problèmes sont devenus une sorte de défi pour les boîtes d'IA (je me demande ce qu'Erdős lui-même aurait pensé de cette situation, d'ailleurs). Mais il faut souligner que les problèmes d'Erdős représentent les intérêts du collectionneur, et qu'ils ont notamment un biais très important en faveur des énoncés élémentaires, souvent sans grande théorie derrière, et de certains domaines particuliers des maths (grosso modo : la combinatoire, la théorie des graphes, la théorie des nombres « élémentaire » / combinatoire / additive, éventuellement la théorie descriptive des ensembles).

En fait, c'est complètement con : on a automatisé une partie intéressante de la résolution de problèmes mathématiques (trouver une preuve), mais pas vraiment la partie chiante (vérifier les preuves), qui est pourtant, du point de vue théorique, parfaitement automatisable. (Un peu comme on préférerait que les IA nous débarrassent des choses chiantes de la vie, comme le ménage, et pas des choses créatives et intéressantes.)

☞ La difficulté de vérifier

Et en pratique, ce qui est en train de se passer en ce moment en maths, ce n'est pas tant que les problèmes ouverts tombent les uns après les autres (à part les problèmes d'Erdős), c'est que tout le monde est noyé par les preuves bidon produites par IA : avant, pour reconnaître un crackpot en maths c'était très facile (juste au style), maintenant, comme les preuves bidon produites par IA sont superficiellement hyper plausibles, c'est devenu extrêmement difficile de savoir sauf à tout lire en détails. Là on a un vrai problème.

(Et à moins de tout formaliser, ce n'est pas clair que le progrès des LLM nous tire d'affaire, parce que ce qui compte est le rapport entre leur capacité à générer du bullshit avancé et leur capacité à en détecter, et c'est pas évident comment il évolue.)

☞ Le positif et le négatif

C'est pour ça que je souligne que, à l'heure actuelle, il n'est pas du tout clair que la contribution des IA aux maths soit positive (même en ignorant totalement leurs coûts !). Il y a des termes >0 et des termes <0, et j'ai personnellement tendance à penser que la somme est <0.

Je peux aussi mentionner l'impact négatif qu'ont les LLM sur le site MathOverflow (une sorte de réseau social des mathématiciens, sous forme de questions-réponses); on peut toujours rêver qu'elles vont remplacer ça en mieux, mais pour l'instant ce n'est pas clair (ni gratuit !).

Donc je trouve assez fallacieux de ne parler que des progrès que les LLM ont apportés pour certains problèmes et de taire complètement tous les aspects négatifs sur la discipline. Peut-être que les contributions >0 vont augmenter à l'avenir, mais les <0 risquent d'empirer aussi ! Bref, bien malin qui saura dire à quoi ressemblera la somme.

L'enthousiasme (d'ailleurs assez relatif) de gens comme Terry Tao[#4] n'engage qu'eux : ce n'est pas parce qu'il est très fort que son avis est plus important que n'importe quel autre mathématicien. Et je trouve d'ailleurs significatif que la vidéo ne retienne, des commentaires de 9 mathématiciens sur la preuve d'OpenAI du unit distance problem, que les plus positifs : j'encourage beaucoup à lire ceux de Melanie Matchett Wood, avec lesquels je me sens très en phase.

[#4] Terence Tao est professeur à UCLA, médaillé Fields, et considéré par beaucoup comme un des plus brillants mathématiciens vivant actuellement (voire le plus brillant, parce qu'il a un fan-club franchement pénible ; mais indiscutablement il est très fort pour résoudre des problèmes, et aussi capable de comprendre un nombre impressionnant de domaines différents des mathématiques). Il fait preuve d'un certain enthousiasme pour le rôle que les IA vont jouer dans l'avenir des mathématiques, ce qui agace parfois certains collègues, surtout que ses propos sont pas mal utilisés par les zélotes de l'IA. (Mais bon, il est aussi signataire de la déclaration de Leiden, donc ce n'est certainement pas un enthousiasme sans réserves.)

☞ La difficulté n'est pas une grandeur unique

Beaucoup de spéculations (notamment dans la vidéo de Monsieur Phi) se fondent sur l'idée implicite que la difficulté d'un problème mathématique est une sorte de valeur objective, et notamment qu'elle serait la même pour les LLM et pour les humains. Vu qu'elle est déjà hyper différente d'un humain à l'autre, ça me semble particulièrement audacieux, comme hypothèse. Mais en tout cas, l'idée que les LLM deviennent très bons pour certains problèmes très durs pour les humains donc ils vont dépasser les humains en tout (je ne dis pas que la conclusion est fausse), elle repose sur une hypothèse très douteuse sur la nature linéaire de la difficulté mathématique.

Évidemment, c'est difficile de tester l'hypothèse il y a des problèmes de maths faciles pour les humains et difficiles pour les LLM parce que tout ce qui a jamais été écrit par un humain est connu des LLM (donc par définition elles savent faire), et qu'on ne sait même pas dans quelle direction chercher. Mais le fait est que certains collègues trouvent les LLM vraiment mauvais et d'autres spectaculairement bons, et on ne comprend pas bien la raison de ces différences (nature des problèmes ? qualité des modèles ? capacité à prompter efficacement ? effet placebo/nocebo dû aux préjugés sur les IA ?), mais pour l'instant on n'a vraiment aucune mesure scientifique sérieuse, juste plein d'anecdotes. En tout cas il est probable que les problèmes d'Erdős ne soient pas hyper représentatifs.

Je résumerais un peu la situation actuelle à celle où une boîte pharmaceutique aurait un produit à vendre et on mettrait en avant plein de témoignages de gens qui ont été guéris par ce médicament : je ne dis pas que ça ne dit rien, mais ça ne remplace pas une étude scientifique.

☞ Le problème de l'arrêt des exponentielles

La spéculation puisque les progrès sont très rapides, ils vont forcément aller extrêmement loin me semble particulièrement infondée : je ne sais pas quel mur les LLM peuvent risquer de heurter (économique ? énergétique ? technologique ? du processus d'entraînement ? de la nature même du modèle ?) mais je ne vois aucune raison particulière de penser que la position de telle ou telle barrière (si elle existe) est corrélée à la vitesse à laquelle on fonce dessus. Comme je le dis tout le temps (et comme j'ai passé toute la pandémie de covid à expliquer) : observer une exponentielle ne dit rien sur la manière dont elle s'arrêtera.

☞ Les maths comme benchmark

En tout état de cause, les développements ultra-rapides de ces derniers mois me semblent largement dus à une décision stratégique : OpenAI et les autres boîtes d'IA ont décidé d'utiliser les maths comme « benchmark »[#5] censément objectif pour montrer leur supériorité les unes sur les autres (notamment dans le contexte de l'introduction en bourse d'OpenAI). Évidemment, ce qui les intéresse n'est pas de faire des maths ni d'aider la science ou les mathématiciens, mais de vendre leurs produits. OpenAI a clairement décidé d'investir massivement pour une annonce spectaculaire, en ciblant les problèmes d'Erdős spécifiquement. Je ne dis pas que les LLM ne peuvent pas progresser plus généralement, mais il faut une certaine naïveté pour s'imaginer que ce développement est représentatif de quelque chose qui pourra être soutenu, ou qu'il est représentatif des maths en général, pire, de l'intelligence en général.

[#5] Comprendre : comme moyen d'évaluation, comme test pour se comparer les unes aux autres.

(Et là je me dois de citer la loi de Goodhart comme je le fais souvent : utiliser les maths / problèmes d'Erdős comme benchmark pour les IA avait peut-être un sens, mais dès que les boîtes s'en sont aperçu, ça a cessé d'être un bon benchmark.)

C'est donc notamment à cause de ça que beaucoup de mathématiciens sont exaspérés de la manière dont les boîtes d'IA font leur pub sur leur dos et leur donnent un rôle quasiment de prospectus publicitaire, au détriment de la discipline.

[Lire la suite…]

2026	Jan 2026	Feb 2026	Mar 2026	Apr 2026	May 2026	Jun 2026
2025	Jan 2025	Feb 2025	Mar 2025	Apr 2025	May 2025	Jun 2025	Jul 2025	Aug 2025	Sep 2025	Oct 2025	Nov 2025	Dec 2025
2024	Jan 2024	Feb 2024	Mar 2024	Apr 2024	May 2024	Jun 2024	Jul 2024	Aug 2024	Sep 2024	Oct 2024	Nov 2024	Dec 2024
2023	Jan 2023	Feb 2023	Mar 2023	Apr 2023	May 2023	Jun 2023	Jul 2023	Aug 2023	Sep 2023	Oct 2023	Nov 2023	Dec 2023
2022	Jan 2022	Feb 2022	Mar 2022	Apr 2022	May 2022	Jun 2022	Jul 2022	Aug 2022	Sep 2022	Oct 2022	Nov 2022	Dec 2022
2021	Jan 2021	Feb 2021	Mar 2021	Apr 2021	May 2021	Jun 2021	Jul 2021	Aug 2021	Sep 2021	Oct 2021	Nov 2021	Dec 2021
2020	Jan 2020	Feb 2020	Mar 2020	Apr 2020	May 2020	Jun 2020	Jul 2020	Aug 2020	Sep 2020	Oct 2020	Nov 2020	Dec 2020
2019	Jan 2019	Feb 2019	Mar 2019	Apr 2019	May 2019	Jun 2019	Jul 2019	Aug 2019	Sep 2019	Oct 2019	Nov 2019	Dec 2019
2018	Jan 2018	Feb 2018	Mar 2018	Apr 2018	May 2018	Jun 2018	Jul 2018	Aug 2018	Sep 2018	Oct 2018	Nov 2018	Dec 2018
2017	Jan 2017	Feb 2017	Mar 2017	Apr 2017	May 2017	Jun 2017	Jul 2017	Aug 2017	Sep 2017	Oct 2017	Nov 2017	Dec 2017
2016	Jan 2016	Feb 2016	Mar 2016	Apr 2016	May 2016	Jun 2016	Jul 2016	Aug 2016	Sep 2016	Oct 2016	Nov 2016	Dec 2016
2015	Jan 2015	Feb 2015	Mar 2015	Apr 2015	May 2015	Jun 2015	Jul 2015	Aug 2015	Sep 2015	Oct 2015	Nov 2015	Dec 2015
2014	Jan 2014	Feb 2014	Mar 2014	Apr 2014	May 2014	Jun 2014	Jul 2014	Aug 2014	Sep 2014	Oct 2014	Nov 2014	Dec 2014
2013	Jan 2013	Feb 2013	Mar 2013	Apr 2013	May 2013	Jun 2013	Jul 2013	Aug 2013	Sep 2013	Oct 2013	Nov 2013	Dec 2013
2012	Jan 2012	Feb 2012	Mar 2012	Apr 2012	May 2012	Jun 2012	Jul 2012	Aug 2012	Sep 2012	Oct 2012	Nov 2012	Dec 2012
2011	Jan 2011	Feb 2011	Mar 2011	Apr 2011	May 2011	Jun 2011	Jul 2011	Aug 2011	Sep 2011	Oct 2011	Nov 2011	Dec 2011
2010	Jan 2010	Feb 2010	Mar 2010	Apr 2010	May 2010	Jun 2010	Jul 2010	Aug 2010	Sep 2010	Oct 2010	Nov 2010	Dec 2010
2009	Jan 2009	Feb 2009	Mar 2009	Apr 2009	May 2009	Jun 2009	Jul 2009	Aug 2009	Sep 2009	Oct 2009	Nov 2009	Dec 2009
2008	Jan 2008	Feb 2008	Mar 2008	Apr 2008	May 2008	Jun 2008	Jul 2008	Aug 2008	Sep 2008	Oct 2008	Nov 2008	Dec 2008
2007	Jan 2007	Feb 2007	Mar 2007	Apr 2007	May 2007	Jun 2007	Jul 2007	Aug 2007	Sep 2007	Oct 2007	Nov 2007	Dec 2007
2006	Jan 2006	Feb 2006	Mar 2006	Apr 2006	May 2006	Jun 2006	Jul 2006	Aug 2006	Sep 2006	Oct 2006	Nov 2006	Dec 2006
2005	Jan 2005	Feb 2005	Mar 2005	Apr 2005	May 2005	Jun 2005	Jul 2005	Aug 2005	Sep 2005	Oct 2005	Nov 2005	Dec 2005
2004	Jan 2004	Feb 2004	Mar 2004	Apr 2004	May 2004	Jun 2004	Jul 2004	Aug 2004	Sep 2004	Oct 2004	Nov 2004	Dec 2004
2003		May 2003	Jun 2003	Jul 2003	Aug 2003	Sep 2003	Oct 2003	Nov 2003	Dec 2003

2026

2025