Ce billet s'adresse au grand public et se veut donc compréhensible par tous[#]. Je vais parler de maths, pour une fois il ne s'agit pas de faire de la vulgarisation mathématique[#2] au sens où je ne vais pas expliquer du contenu mathématique, mais plutôt tenter de parler de « ce que ça fait de faire des maths », i.e., essayer de dire un mot sur comment les mathématiciens « pensent » les maths et en quoi consiste notre métier. Et peut-être en profiter pour dissiper quelques malentendus ou quelques idées reçues sur les mathématiciens ou la recherche en mathématiques.
[#] À l'exception de quelques brefs passages essentiellement limités aux notes en bas de paragraphe (où je ferai parfois référence à un concept technique), passages que je pense qu'on n'aura aucune difficulté à identifier et à ignorer si on ne les comprend pas.
[#2] Ni même de la méta-vulgarisation comme j'ai pu le faire ici, mais ça va rejoindre un peu certaines choses que je raconte dans ce billet.
Il va de soi que ce but est trop ambitieux pour que je puisse le mener avec succès. D'abord parce que tenter de parler de comment on fait des maths sans parler de maths revient, forcément, à brasser de l'air en agitant les mains. Ensuite, parce qu'il n'y a pas vraiment de pratique « typique » du métier de mathématicien (comme il n'y a pas de pratique « typique » de celui d'écrivain), donc je peux au mieux parler de la mienne (donc celle d'un mathématicien possiblement médiocre) en essayant de faire remarquer ce que je crois être plus ou moins partagé par mes collègues. Enfin, parce que j'avais de toute façon trop de choses à dire et que j'ai arrêté un peu quand j'en avais marre d'écrire, donc je relègue plein de choses (sur la communauté mathématicienne, notamment) à un éventuel billet ultérieur.
(Plan :)
- Quelques idées reçues
- L'abstraction et la généralité
- La beauté des mathématiques
- Les mathématiques existent-elles ?
- L'exploration d'un palais
- L'efficacité des mathématiques
- Que fait donc le mathématicien ?
- Comment trouver les questions
- La fabrique des théorèmes
- Formes et fonctions de la preuve
- Rigueur et intuition
- Deux exemples de raisonnements mathématiques
- Comment trouve-t-on des démonstrations ?
- La rédaction
- Fragmentation disciplinaire
- Fin (provisoire ?)
☞ Quelques idées reçues
Peut-être que je devrais commencer par dissiper des idées reçues courantes[#3] sur les mathématiciens ou les mathématiques, même si j'imagine que le lectorat de ce blog, quand bien même il n'est pas lui-même scientifique, a au moins des idées un peu moins approximatives que le grand public moyen à ce sujet.
[#3] Enfin, des idées reçues que je crois que le grand public a sur les mathématiciens. Parce que, honnêtement, je ne suis pas le mieux informé à ce sujet (même si j'ai pu en discuter de temps en temps avec des gens croisés au hasard — un chauffeur de taxi, un coiffeur, un moniteur d'auto-école, un médecin, un voisin dans le RER, etc. ; et bien sûr je vois l'image que toutes sortes de fictions donnent du mathématicien, qui doivent bien refléter une forme d'imaginaire collectif, au moins tel qu'il se manifeste dans l'esprit des écrivains ou scénaristes). Mais il n'est pas exclu que j'aie des idées reçues au sujet des idées reçues des gens sur les mathématiciens.
D'abord, je soupçonne que l'idée reçue la plus courante au sujet de
notre métier est que nous faisons des calculs très difficiles, et que
nous passons notre temps à écrire des formules très compliqués.
Or la plupart des mathématiciens ne font pas des
calculs[#4]. Il peut
certes tout à fait arriver qu'il y ait des calculs, même des calculs
compliqués, en mathématiques : selon les branches des maths, c'est
plus ou moins fréquent (même si tout dépend de ce qu'on appelle,
exactement, un calcul
), mais ce n'est généralement pas
l'activité principale. On ne peut pas non plus dire que le
mathématicien ait particulièrement souvent affaire à des nombres, ni,
en fait, à des formules (pour une acception assez large
de formule
, on peut convenir qu'il y en a beaucoup, mais même
là, on aurait tort de s'imaginer le chercheur en mathématiques comme
une sorte de chercheur de formules, comme je soupçonne que beaucoup de
gens se l'imaginent).
[#4] S'il y a des scientifiques qui font des calculs compliqués, c'est plutôt les physiciens (même si, là aussi, c'est un cliché, qui a forcément ses limites, il est sans doute plus juste à propos des physiciens que des mathématiciens).
Ajout () : J'aurais sans doute dû mentionner ceci quelque part dans ce billet, et je ne sais pas bien où l'ajouter, alors on va le mettre ici : les maths que la plupart des non-mathématiciens rencontrent dans leurs études (disons au moins jusqu'au baccalauréat, et même un peu après) n'ont qu'un rapport assez distant avec la recherche en mathématiques. Ce sont des maths qui eurent été fraîches il y a environ 150 ans, mais qui ne le sont plus du tout (ce qui ne veut pas dire qu'elles ne soient pas correctes, bien sûr), et surtout, ce sont des maths globalement ternes et inintéressantes (même par rapport à ce qui se faisait à l'époque). Pour faire une comparaison un peu gratuite, disons que si on a fait des maths jusqu'au lycée, on a rencontré quelque chose qui est à la recherche mathématiques un peu comme si l'enseignement de l'histoire se limitait à apprendre par cœur la liste des rois de France et leurs dates : ce ne sont pas des informations fausses, mais ce n'est vraiment pas très intéressant. Il n'est pas surprenant, dans ces conditions, que des gens en retirent l'impression que les maths sont un sujet profondément ennuyeux se limitant à peu près à faire des calculs pénibles sur des situations sans intérêt, qu'ils n'arrivent pas à comprendre qu'il puisse y avoir de la beauté dedans, qu'ils se fassent une image tout à fait fausse du métier de mathématicien, ou même qu'ils pensent qu'il n'y a plus de recherche sur le sujet. (D'un autre côté, je ne sais vraiment pas comment on pourrait présenter les maths autrement au niveau lycée. L'expérience des « maths modernes » en a échaudé plus d'un ; voir aussi la note #41 plus bas à ce sujet.)
Pour le reste, je dois mentionner que je ne crois pas que les mathématiciens soient particulièrement distraits, particulièrement asociaux[#5], ou particulièrement intelligents[#6] : je ne sais même pas si ce sont des choses que les gens s'imaginent vraiment, mais c'est certainement ainsi que nous avons tendance à être présentés dans les rares films où apparaît un mathématicien.
[#5] Le cliché du mathématicien dans les films ou séries télé (et, pour le coup, j'espère quand même qu'il n'est pas si répandu dans la tête des gens), c'est quelqu'un de froid, déconnecté de la réalité, presque dénué d'émotions et d'empathie (comme s'il voyait le monde comme une série de chiffres), et d'ailleurs généralement privé de sens de l'humour. (En fait, ce sont largement les mêmes clichés que ceux qui concernent les personnes autistes, donc on peut aussi ajouter le cliché de la proximité entre ces deux catégories.) Tout ça est juste complètement con. Le manque de sens de l'humour est même particulièrement faux, les mathématiciens sont plutôt farceurs, au contraire. (Et amateurs de canulars, cf. par exemple ceci.) Ce qui est peut-être vrai, en revanche, mais je ne sais pas si c'est un cliché que les gens ont, c'est que beaucoup de mathématiciens sont mauvais en calcul mental. Disons qu'il y a trois types de mathématiciens : ceux qui savent compter, et ceux qui ne savent pas.
[#6] Il faut que j'écrive un billet sur ce que je pense au sujet de l'intelligence, mais en attendant je peux renvoyer à celui-ci qui en parle un peu. Il y a énormément de formes différentes d'intelligence, c'est un terme qui veut tout et rien dire, et si les mathématiciens sont, forcément, doués pour les raisonnements mathématiques et ce qui s'y approche (détecter les erreurs de logique, par exemple), ce qu'on peut considérer comme une forme particulière d'intelligence, il serait à la fois faux et prétentieux (et, en fait, dénué de sens) d'affirmer que nous sommes plus intelligents en général.
Ce qui est sans doute plus vrai (même si ça reste, évidemment,
extrêmement simplifié), c'est que les mathématiciens ont tendance à
être assez précis et pointilleux, par exemple, dans le choix des
termes avec lesquels ils s'expriment (et souvent ça déteint sur
d'autres choses, comme la typographie) : parce que dans un énoncé
mathématique, on ne peut pas se permettre d'approximation sur ce qu'on
dit, et cette habitude de ne pas dire une chose pour une autre va
facilement déteindre sur l'ensemble de ce qu'on dit. (À titre
d'exemple, j'avais fait remarquer que quelqu'un qui prétendait
discuter de politique et de démocratie semblait confondre les
affirmations toute décision devrait être approuvée par une majorité
de citoyens
et tout citoyen devrait approuver une majorité de
décisions
: c'est exactement le genre de distinction, et aussi
d'ailleurs le pli de discuter l'une ou l'autre dans l'abstrait et sans
prendre position sur sa véracité, qui est typique du raisonnement
mathématique et essentiel pour lui, et qui déteint facilement quand on
parle d'autres domaines.)
☞ L'abstraction et la généralité
Si les maths ne sont pas la science des nombres ni celle des formules, j'aurais tendance à dire que c'est celle du raisonnement précis sur les structures abstraites, mais il faut admettre que cette définition est exaspérément vague et pourrait ressembler à une définition de la philosophie. Je n'ai pas vraiment mieux (cf. aussi ce billet où j'essayais de définir l'informatique, et son intersection avec les maths). Mais ce n'est pas vraiment mon but ici de discuter de la question de ce que sont les maths sub specia æternitatis : je veux juste dire que la pratique des maths par les mathématiciens se caractérise surtout par des raisonnements plus que par des calculs, et que ces raisonnements portent plutôt sur des abstractions (plus ou moins reculées par rapport à une situation concrète) que sur des quantités.
Pour ce qui est des abstractions, je pense qu'une bonne explication[#7] à fournir au grand public est la suivante : un mathématicien est quelqu'un qui pense que l'abstraction, au lieu de compliquer les problèmes, les simplifie, car elle consiste justement à ne garder que l'essentiel du problème en jetant tout ce qui est une circonstance particulière distrayante. Le mathématicien cherche typiquement à détacher un problème ou raisonnement des particularités de telle ou telle instance spécifique, pour retrouver sa forme la plus abstraite et universellement applicable.
[#7] Je vole cette remarque à Nalini Anantharaman dans cette vidéo, qui est d'ailleurs intéressante en rapport avec le sujet de ce billet. Mais je la développe ici à ma sauce, donc je ne prétends pas que Nalini Anantharaman sera forcément d'accord avec ce que j'écris.
C'est la raison pour laquelle nous avons un tropisme à la
généralisation : même si l'instance spécifique qui a donné naissance à
une question de maths comporte un paramètre qui a une valeur numérique
précise, le mathématicien va typiquement chercher à savoir si cette
valeur est vraiment importante — et, si elle ne l'est pas, généraliser
le problème à tout n
pour éviter de se laisser
distraire par le n particulier qui n'a pas d'importance —
tandis que si la valeur est importante (et bien sûr parfois elle
l'est) on cherchera à savoir ce qui fait qu'elle l'est,
Par exemple, si je pose le problème de la tablette de chocolat (que je vais énoncer plus bas) en évoquant une tablette de chocolat 3×5, c'est peut-être plus parlant pour le grand public que si j'évoque une tablette de chocolat m×n, mais pour le mathématicien, le problème avec la tablette de chocolat m×n est à la fois plus général et plus simple, parce qu'il nous dit que ce n'est pas la peine de chercher des particularités des nombres 3 et 5 qui feraient marcher le problème dans ce cas et dans ce cas seulement.
Bien sûr, tout le monde n'a pas le même amour pour la généralité
pour elle-même : car de la même manière qu'on peut remplacer un entier
particulier (comme 42) par l'abstraction un entier quelconque
(et lui donner un nom de variable, n), on peut aussi
chercher à généraliser plus loin, et remplacer
l'hypothèse entier
(i.e., élément de ℤ
) par quelque
chose de plus général (remplacer ℤ par, disons, un anneau
commutatif
) et se demander si la question a encore un sens, et le
cas échéant admet la même réponse. On peut toujours généraliser plus
loin, et il faut bien décider un jour de s'arrêter : certains trouvent
plaisir à généraliser autant qu'ils peuvent, d'autres s'arrêtent dès
qu'ils estiment avoir retiré ce qui est purement superflu, et il
serait faux de dire que les mathématiciens recherchent
systématiquement l'abstraction maximale. Il y a une branche des
mathématiques qui s'attache plus que toute autre aux généralisations,
et qu'on pourrait presque qualifier de spécialiste de l'abstraction
pour le plaisir de l'abstraction, qui est un peu au reste des
mathématiques ce que les mathématiques sont à des problèmes concrets :
il s'agit de la théorie des
catégories[#8] ; mais tout le
monde n'aime pas forcément cette approche consistant à trouver la
version la plus abstraite et générale possible de n'importe quel
énoncé. Au moins pour la pédagogie, les mathématiciens peuvent aimer
énoncer un résultat dans un cas particulier, pour dire ensuite en
fait, ceci se généralise de la façon suivante
plutôt que de
commencer par la version la plus générale.
[#8] Pour caricaturer
un peu, disons que si le mathématicien va avoir tendance à
remplacer 42
dans un problème par n,
où n est un entier
, et l'algébriste l'ensemble ℤ des
entiers par un anneau commutatif A quelconque, le
théoricien des catégories va, à son tour, remplacer la catégorie des
anneaux commutatifs par une catégorie d'algèbres sur une monade, puis
la 2-catégorie des catégories par une 2-catégorie vérifiant ceci ou
cela, bref, on n'en finit jamais de généraliser. De même qu'il y a
une blague standard sur les jésuites selon laquelle quand on a fini de
leur poser une question on ne comprend plus la question qu'on a posée,
il y a son équivalent avec les théoriciens des catégories au sein des
mathématiques (ils vont vous expliquer que votre problème consiste à
définir une structure d'∞-groupoïde enrichi cocomplet sur certaines
computades globulaires, et quand vous cherchez à comprendre n'importe
lequel de ces mots vous vous rendez compte qu'il est défini
par le nLab au
moyen de 12 autres mots que vous ne comprenez pas non plus).
Il y aurait sans doute lieu ici de faire une distinction entre maths pures et maths appliquées, même si je pense que cette distinction n'est pas aussi pertinente qu'on veut bien le faire croire[#9] (et certainement c'est une frontière floue, qui souffre d'ailleurs d'être discrétisée par la gestion administrative des sections du Conseil National des Universités) : pour simplifier à outrance, le mathématicien appliqué apprécie l'abstraction en ce qu'elle aide à résoudre un problème en le débarrassant de ce qui est superflu, tandis que le mathématicien pur apprécie l'abstraction en ce qu'il aide à dégager un concept plus général et plus élégant. Mais dans les deux cas, on aime ne pas se compliquer de détails sans pertinence.
[#9] Je pense que la
majorité des mathématiciens sont convaincus de la
profonde unité des mathématiques (ou, comme le disent
certains pour insister sur cette unité, de la mathématique
comme on peut dire de la physique
), les mathématiques pures et
appliquées n'étant que des tendances au sein d'un tout
fondamentalement uni. Je vais revenir plus loin sur cette unité.
☞ La beauté des mathématiques
Je pense qu'une chose sur laquelle quasiment tous les mathématiciens seront d'accord, c'est que les mathématiques ont une très grande beauté interne. C'est quelque chose qu'il est difficile de faire comprendre au grand public, et qui est à la fois une motivation et un défi pour la vulgarisation (cf. ici) : même si on peut parfois en tirer certaines jolies images visibles avec les yeux (comme ici ou là ou là ou encore là pour certaines que j'ai moi-même mis sur YouTube), l'essentiel de la beauté des mathématiques n'est perceptible que par l'intellect, et l'essentiel des objets mathématiques n'admettent aucune sorte d'image qu'on puisse représenter sous forme graphique. Donc parler au grand public de la beauté des mathématiques, comme j'aime bien le dire, c'est un peu comme vivre dans un monde où tout le monde est sourd et d'essayer d'expliquer la beauté d'une symphonie de Beethoven alors que personne ne l'a jamais entendue jouer, on ne peut qu'en lire la partition.
Pour ce qui est de la recherche, cette beauté des mathématiques est à la fois une motivation et un fil conducteur. C'est une motivation, parce que je pense que tous les mathématiciens ont, à un certain niveau, le plaisir de faire des mathématiques parce que c'est beau[#9b] et c'est satisfaisant pour l'esprit (je ne prétends pas que ce soit la seule, ni même la plus importante pour tout le monde, mais elle doit être au moins un élément important chez quasiment tous les mathématiciens professionnels, peut-être même plus que la curiosité commune à tous les scientifiques). Beaucoup de mathématiciens (« purs » comme « appliqués ») trouveront un problème intéressant et « naturel » en ce qu'il éveille leur sens esthétique. Mais c'est aussi un fil conducteur dans la recherche, en ce sens que les constructions et les techniques de démonstrations les plus puissantes sont souvent, quoique pas toujours (et ça dépend fortement des domaines), les plus élégantes : du coup, on peut, dans une certaine mesure, se laisser guider dans ses recherches par son sens de l'esthétique.
[#9b] Ajout
() : Pour illustrer le fait que ce n'est pas
que moi qui pense ça, Hermann Weyl a dit quelque chose comme
ceci : dans mon travail, j'ai toujours tenté d'unifier le beau et
le vrai ; mais quand j'ai dû choisir entre les deux, j'ai généralement
choisi le beau
. Et G. H. Hardy écrit dans A
Mathematician's Apology : The mathematician's
patterns, like the painter's or the poet's must be beautiful;
the ideas like the colours or the words, must fit together in a
harmonious way. Beauty is the first test: there is no permanent place
in the world for ugly mathematics.
☞ Les mathématiques existent-elles ?
Cette constatation de la beauté intrinsèque, et souvent ineffable,
des structures mathématiques, conduit beaucoup de mathématiciens (mais
je ne prétends pas que ce soit le cas de tous !) à être convaincus
qu'elle a une existence indépendante de nous.
C'est-à-dire : que les objets mathématiques « vivent » dans un
monde d'idées abstraites, un monde généralement qualifié
de platonicien
, et que nous ne faisons qu'explorer des concepts
préexistants et découvrir des vérités sur ces concepts
préexistants[#10], plutôt que
de les créer[#11]. Divers
arguments empiriques peuvent être avancés dans ce sens, comme le fait
que le même concept est souvent découvert indépendamment par plusieurs
personnes, ou que les mathématiciens n'aient pas l'impression
d'exercer de choix ou de pouvoir créateur en dégageant des
mathématiques, autrement que dans la formulation de définitions sur
les concepts définis par lesquelles des vérités s'enchaînent
indépendamment de notre volonté, et parfois sans que nous les
comprenions vraiment[#12] ;
mais un argument peut-être plus affectif est simplement qu'aucun
humain n'a la capacité de créer pareille beauté. (Pour dire les
choses de façon peut-être plus percutante : Benoît Mandelbrot n'était
pas un grand artiste, il n'a pas choisi comment il allait arranger,
jusque dans les profondeurs infinies de sa complexité, l'ensemble qui
porte son nom.)
[#10] Je ne peux pas
m'empêcher de penser à cette fameuse réplique (j'imagine qu'elle est
apocryphe parce que toutes les bonnes citations sont apocryphes) de
l'alpiniste George Mallory qui, quand on lui a demandé pourquoi il
voulait escalader l'Everest, aurait répondu parce qu'il est là
.
Il est difficile de faire des maths, ou au moins certains bouts des
maths, sans avoir l'impression de tomber sur des choses qui sont
là
, autant que l'Everest (comme le groupe Monstre que
j'évoque deux notes plus
bas).
[#11] Évidemment, il y a plein de variations autour de cette position (dont il n'est donc pas vraiment possible de dire combien elle est répandue), selon qu'on parle de la création des définitions, des concepts, des théorèmes, de la vérité mathématique elle-même. Tout le monde n'est pas forcément d'accord même concernant le fait que la physique ou les lois de la nature soient découvertes (tant il y a, au moins, une part humaine dans leur formulation), donc peut-être que le débat doit se poser sous la forme de savoir si la mathématique est au moins autant découverte et objective que la physique. Mais là-dessus vient s'ajouter un débat philosophique supplémentaire qui est de savoir si la vérité mathématique est subordonnée à la physique (de cet univers) ou, au contraire, plus générale qu'elle.
[#12] Je renvoie par
exemple à cette vidéo de
vulgarisation sur
le groupe
Monstre (pour simplifier, c'est un objet mathématique extrêmement
symétrique, vivant en 196 883 dimensions et possédant
808 017 424 794 512 875 886 459 904 961 710 757 005 754 368 000 000 000
symétries, découvert en tentant de classifier toutes les formes
possibles de symétries finies — j'avais tenté d'en dire un mot par
exemple ici). Dans cette vidéo,
John Conway, qui a beaucoup contribué à la découverte du Monstre, se
lamente (voir à partir de 14′00″ et de 15′09″ dans la vidéo si vous ne
voulez pas tout regarder) the one thing I'd really
like to know before I die is why the Monster group
exists
, ce qui reflète très bien cette sensation du fait que nous
ne créons pas les mathématiques, nous découvrons des choses qui sont
souvent très surprenantes, même aux yeux de ceux qui les découvrent.
Personne n'a « décidé » de prendre 196 883 dimensions et
808 017 424 794 512 875 886 459 904 961 710 757 005 754 368 000 000 000
symétries : ces nombres se sont imposés à nous, et même si on a une
preuve que ce sont ceux-là qui donnent un phénomène remarquable, on ne
peut pas dire qu'on sache vraiment pourquoi. (Cf. aussi la
discussion
dans cette
question MathOverflow.)
Je sais que cette position peut paraître religieuse (si ce ne sont
pas les humains qui ont créé les mathématiques, alors d'où
sortent-elles ?, est-on tenté de demander ; mais aussi, la
suggestion qu'il existe dans une sorte de paradis platonique quelque
chose d'absolument parfait dont nous ne pouvons entrevoir qu'un
microscopique fragment ressemble éminemment à une croyance
mystique/gnostique). J'avais été vraiment frappé, un jour que je
discutais avec un chauffeur de taxi qui m'a demandé ce que je faisais
dans la vie, et que je lui ai dit que j'étais
mathématicien[#13], qu'il m'a
dit qu'il pensait que faire des mathématiques était comme lire dans
l'esprit de Dieu
, et cette réaction très inhabituelle, venant de
quelqu'un qui n'était pas lui-même spécialement formé aux maths, m'a
beaucoup marqué. Mais la plupart des mathématiciens ne sont pas
religieux (moi-même je ne le suis pas), ou ne croient pas en un Dieu
personnel, et même ceux qui le sont ont peut-être plutôt tendance à
penser les mathématiques comme les lois auxquelles même Dieu doit se
soumettre[#14].
[#13] Normalement quand on dit ça, les gens réagissent plutôt en vous disant soit qu'ils aimaient bien les maths au lycée, soit (plus souvent) qu'ils détestaient ça. Honnêtement, ces réactions, certes sans doute sincères et dites sans aucune intention d'être désagréable, sont un chouïa pénibles : quand je rencontre un avocat, un peintre, un sportif ou un banquier, je ne me sens pas obligé de lui dire ce que je pense du droit, de l'art graphique, du sport ou de la finance, et je pense qu'il n'en aurait rien à faire. Soit je lui parle d'autre chose, soit je lui demande des précisions sur ce qu'il fait et comment lui fait les choses, mais je ne me sens pas obligé de rapporter ça à ma perception de son champ d'activité.
[#14] C'est un débat
classique en théologie de savoir si Dieu ne peut faire que ce qui est
logiquement possible. Thomas d'Aquin (Somme Théologique,
première
partie, question XXV, article 3,
cf. aussi ceci) pense que oui : les
choses qui impliquent une contradiction ne tombent pas sous
l'omnipotence divine
. Mais René Descartes
(Méditations, Réponses aux sixièmes objections)
pense le contraire : Dieu eût pu faire de toute éternité que deux
fois quatre n'eussent pas été huit
. Je renvoie aussi
à ce petit fragment littéraire de
ma part.
Tout ça est de la philosophie, et je ne pense pas que les mathématiciens soient spécialement enclins à réfléchir en ces termes, ni qu'ils soient particulièrement amateurs de philosophie : on peut trouver que les mathématiques sont profondément belles sans se prendre la tête sur la raison du pourquoi de cette beauté.
☞ L'exploration d'un palais
La comparaison que j'aime bien faire pour essayer de décrire ce que je ressens, c'est que les mathématiques sont comme un palais à la fois incomparablement élégant, incompréhensiblement gigantesque, et incroyablement labyrinthique[#15]. Ce palais ne peut se visiter qu'avec l'esprit, et faire des mathématiques, c'est comme un jeu d'exploration de ce palais infini. Les parties les plus proches de l'entrée sont bien cartographiées, et ce sont celles qu'on fait visiter aux touristes (c'est ce qui s'appelle l'enseignement des mathématiques), mais d'autres sont moins fréquentées, et on est sans cesse en train d'en répertorier de nouvelles : on peut bien sûr partir soi-même à l'aventure dans n'importe quelle direction, même si c'est plus difficile de trouver de très belles pièces que si on a un guide qui connaît bien le chemin, ou au moins, a une certaine familiarité avec cette région du palais. Il y a une certaine fierté à avoir trouvé le chemin d'une pièce que personne n'avait encore jamais explorée, mais il y a aussi de la satisfaction à simplement contempler les endroits les plus beaux, fussent-ils bien connus, et à les montrer au public, ou encore à trouver un chemin plus court vers une pièce déjà connue : certains apprécient plus ou moins telle ou telle de ces activités mathématiques (découvrir de nouvelles théories ou théorèmes, en apprendre et en enseigner qui soient déjà connues, ou encore reformuler et polir des théories existantes).
[#15] Peu surprenant que le roman Piranesi m'ait beaucoup plu.
☞ L'efficacité des mathématiques
Mais je ne veux pas donner l'impression que les mathématiciens,
même « purs », ne font que des « maths pour les maths » (pour leur
beauté, ou pour l'honneur de l'esprit
humain). Les mathématiques sont aussi utiles à toutes
sortes de titres. D'abord, aux autres sciences : Galilée
écrivait en 1623 (Il Saggiatore, chap. 6)
que la philosophie [naturelle …] est écrite en langue
mathématique
, et le physicien Eugène Wigner s'étonnait encore dans
un célèbre
article publié en 1960 de l'efficacité déraisonnable des
mathématiques dans les sciences naturelles
. Là aussi, c'est un
mystère dont on peut s'interroger sur la signification philosophique :
il n'y avait pas forcément de raison a priori que les lois de
la nature fussent compréhensibles par l'esprit humain et/ou qu'elles
fussent exprimables en termes mathématiques, et pourtant on constate
que les mathématiques y trouvent une application étonnamment
efficace[#16] et souvent
élégante ; et, de façon encore plus étonnante, cette élégance est
occasionnellement prédictive, c'est-à-dire que la recherche d'une
théorie mathématiquement belle peut (même si c'est loin d'être
toujours le cas) conduire à une théorie expérimentalement
vérifiée[#17].
[#16] Y compris, dans de nombreux cas, de concepts mathématiques qui avaient été dégagés bien avant les applications qu'ils trouvent (par exemple, la géométrie riemannienne avant la relativité générale, la transformée de Fourier avant ses applications à la mécanique quantique ou au traitement du signal, divers aspects de la théorie des nombres avant leurs applications à la cryptographie).
[#17] Je pense par exemple aux théories de jauge en physique fondamentale,
Mais les mathématiques (souvent couplées à la physique, et pas
toujours bien séparables de celle-ci) sont aussi utiles,
simplement, comme grille de lecture pour comprendre le
monde (pas forcément au niveau primordial comme dans la
physique fondamentale, mais aussi à toutes sortes de niveaux de
simplification ou de phénoménologie) : trouver un ordre de grandeur,
modéliser de façon simple (à « l'ordre 0 », à « l'ordre 1 », voire
au-delà), raisonner par invariance, par symétrie, éviter les pièges
des probabilités et des statistiques, mais aussi simplement utiliser
les lois de la logique pour détecter une faille dans un raisonnement
ou se lamenter d'une imprécision de langage, se rendre compte que
quelque chose ne sera pas possible pour des raisons de topologie ou de
symétrie, il y a énormément de manières dont les maths peuvent dire
quelque chose d'intéressant sur la vie qui nous entoure. Je ne sais
pas si j'ai vraiment besoin de donner des exemples, tant ce blog
pourrait être tout entier baptisé comment un mathématicien voit le
monde
[#17b], et mes lecteurs réguliers doivent savoir que je trouve des
connexions avec les maths dans toutes sortes de choses. Ce n'est pas
forcé : c'est juste comme ça que je pense le monde. Et je pense que
toute personne ayant atteint un certain degré de maîtrise des maths
(ce qui ne signifie pas forcément d'être un mathématicien
professionnel : je parle aussi, par exemple, des ingénieurs, des
scientifiques de diverses disciplines scientifiques) va se mettre à
penser en ces termes.
[#17b] Ajout : Je repense par exemple à ce billet sur la syntaxe des subordonnées relatives en français : il n'y a pas à proprement parler de maths dedans (tout au plus l'usage des variables x), mais je pense que ce billet est extrêmement typique de la manière dont un mathématicien peut penser (en l'occurrence, la grammaire française).
Quand j'écris penser en ces termes
, ça ne veut pas
dire ne penser qu'en ces termes
: il n'y a aucune
incompatibilité entre penser le monde en termes mathématiques et le
voir aussi autrement, par exemple avec poésie, affection, humour,
fantaisie, ou que sais-je encore. D'abord parce qu'on peut
parfaitement utiliser plusieurs lunettes différentes pour observer la
même chose et s'en faire une vision plus complète (insérer ici
la parabole
des aveugles et de l'éléphant). Ensuite parce que c'est vraiment
un des clichés les plus faux, stupides et énervants sur les
mathématiciens que se dire que nous voyons le monde uniquement comme
un tas de chiffres froids, alors qu'il y a dans les mathématiques non
seulement de la beauté, mais aussi de la
poésie[#18][#19]
et de l'émerveillement.
[#18] Voir aussi ce que j'écrivais dans ce billet au sujet de la beauté de la symétrie et des formes de symétrie, et de leur utilisation comme inspiration artistique. Mais je pourrais aussi évoquer le célèbre groupe littéraire Oulipo dont plus d'un membre était, sinon mathématicien, au moins intéressé par, et raisonnablement compétent en, mathématiques.
[#19] Je peux aussi
évoquer cette anecdote (peut-être apocryphe ?) selon laquelle, quand
le grand mathématicien David Hilbert a appris qu'un de ses anciens
étudiants avait arrêté les maths pour se consacrer à la poésie, il
aurait dit quelque chose comme bien : j'ai toujours trouvé qu'il
n'avait pas assez d'imagination pour les mathématiques
.
☞ Que fait donc le mathématicien ?
Bon, ayant dit tout ça, je n'ai toujours pas vraiment parlé de l'activité quotidienne du mathématicien. J'ai dit qu'il ne s'agit pas, enfin généralement pas, ou pas principalement, de faire des gros calculs. Mais de quoi s'agit-il alors ? Faire des raisonnements précis, mais à quel sujet ?
L'idée générale est que la recherche mathématiques cherche à résoudre des questions sur la nature ou le comportement (ou souvent simplement, l'existence) d'objets mathématiques — ces question peuvent être endogènes (venues des mathématiques elles-mêmes) ou exogènes (venues d'autres disciplines). Dans le cas des maths dites « pures » (mais je répète que cette distinction me semble un peu surfaite), la motivation de la question est de comprendre le monde mathématique, tandis que dans le cas des maths « appliquées », il s'agit d'exploiter l'« efficacité déraisonnable » évoquée plus haut.
L'origine des questions est sans doute un peu plus libre que dans d'autres sciences : même si je suis moi-même assez persuadé que les objets mathématiques préexistent à l'homme qui les explore, au moins autant que les phénomènes physiques ou les entités biologiques, il y a sans doute plus de directions où on puisse diriger l'exploration, plus de choix à faire dans les questions, que dans d'autres sciences. Parfois la question a été posée par un collègue, parfois on la pose en même temps qu'on y répond, et toute la difficulté est de trouver des questions qui soient à la fois suffisamment remarquables ou naturelles pour être jugées dignes d'intérêt, suffisamment complexes pour que la réponse ne soit pas évidente, et néanmoins suffisamment simples pour qu'on puisse espérer y arriver en moins d'une vie humaine (car les questions mathématiques ont tendance à être soit trop faciles soit trop difficiles, si bien qu'il faut une certaine expérience pour toucher le sweet spot). Et l'activité consistant à trouver la question n'est pas toujours bien séparée de celle consistant à y répondre.
Il ne faut pas trop avoir à l'esprit l'activité typique du mathématicien comme consistant à prendre un problème dans une longue liste de problèmes ouverts, y réfléchir très longtemps, et finir par produire une réponse. Ces cas existent, c'est indéniable, comme quand Andrew Wiles s'est en quelque sorte retiré dans sa tour d'ivoire pour n'en ressortir qu'une fois démontré le théorème de Fermat, mais ils sont rares.
Bref, il y a trois principales étapes dans l'activité du chercheur
en mathématiques : trouver une question intéressante, y
répondre, et rédiger ou présenter sa réponse ; mais ces trois étapes
ont tendance à se mélanger : car toute réponse trouvée a
tendance à suggérer d'autres questions (ne serait-ce que est-ce que
je peux généraliser ce que je viens de faire ?
), qu'on modifie la
question à la mesure de ce qu'on arrive à faire, que rédiger une
preuve peut donner des idées de nouvelles techniques de preuve, que
reformuler une question peut donner toutes sortes de pistes pour la
résoudre, bref, la communication se fait dans tous les sens.
☞ Comment trouver les questions
Les questions peuvent venir de toutes sortes de manières.
Certaines sont en effet des « problèmes ouverts »
plus ou moins célèbres : la définition de ce qu'est un problème
ouvert
, bien sûr, n'est pas claire (si c'est juste une question à
laquelle personne ne connaît la réponse, alors la multiplication de
deux nombres de 20 chiffres aléatoires est un problème ouvert jusqu'à
ce que je sorte mon ordinateur pour la faire), mais disons qu'il y a
toute une hiérarchie entre les problèmes tellement célèbres qu'ils ont
reçu un nom et/ou un prix attaché (comme l'hypothèse de Riemann) et
les questions posées par un autre chercheur du domaine dans un article
publié (nous n'avons pas réussi à savoir si…
) ; de nos jours,
on pourrait aussi attacher à cette hiérarchie les questions posées sur
MathOverflow et ayant reçu beaucoup de votes et aucune réponse (par
exemple celle-ci
qui semble avoir attiré beaucoup d'attention). Disons grosso
modo qu'un problème ouvert est un problème qui intéresse au moins
un mathématicien raisonnablement compétent, et qu'au moins un
mathématicien raisonnablement compétent dans le domaine a essayé un
peu sérieusement de résoudre sans y parvenir, et plus ou augmente le
nombre et le niveau de mathématiciens impliqués et le temps qu'ils y
ont passé, plus le problème devient prestigieux et intéressant.
Mais parfois la question naît simplement d'une discussion entre collègues ou en réfléchissant soi-même. De nombreuses questions viennent spontanément quand on se met à s'interroger sur les propriétés de tel ou tel objet mathématique ou de telle ou telle construction, ou les rapports entre ceci et cela. Évidemment, si personne n'a posé la question avant, cela la rend potentiellement moins intéressante, et, concrètement, ça signifie que pour publier un article sur le sujet il faudra persuader le rapporteur non seulement que la réponse est correcte mais aussi que la question méritait qu'on y réfléchît (alors que pour un problème ouvert déjà formulé, l'intérêt est, disons, déjà établi), mais ce n'est pas du tout exceptionnel qu'on publie un article qui répond à une question que personne n'avait explicitement formulée avant. (Un des intérêts du site MathOverflow est aussi de pouvoir soumettre la question à la sagacité de la communauté : d'une part on verra si quelqu'un sait déjà y répondre, et d'autre part, on saura si elle est jugée intéressante.)
Il est, évidemment, difficile de définir ce qui fait qu'une
question mathématique est jugée intéressante par les
mathématiciens. Le mot naturel
revient souvent pour qualifier (favorablement) une question : une
question « naturelle », grosso modo, c'est une question dont on
peut soupçonner qu'elle viendra à l'esprit de beaucoup de
mathématiciens quand ils réfléchissent autour de ce sujet. Souvent
c'est tout bêtement parce que la question est simple à formuler. (Si
dans le même périmètre de sujet j'ai défini un type d'objets, les
foobars, et une propriété, cromulent, qui pourrait s'appliquer à eux,
il est probablement naturel de se demander si tous les foobars sont
cromulents, ou si certains foobars sont cromulents : le plus souvent
la réponse sera absolument évidente ou fera partie des exemples de
base du domaine. Mais parfois, ça ne l'est pas du tout, et cela
fournit alors probablement une question « naturelle » et
intéressante.)
Les mathématiciens ont tendance à bien aimer les questions
dont l'énoncé est simple, simple
, ou peut-être
plutôt concis
signifiant évidemment simple une fois acquis
les concepts du domaine dont on parle
; ou peut-être plutôt : dont
l'énoncé tient en peu de mots ou peu de symboles. Un problème ouvert
emblématique à ce titre est certainement la question de savoir
si P=NP (peu importe ce que sont P et NP
ici, ce sont des classes de complexité définis dans l'étude de la
complexité algorithmique, mais ce qui importe est que ce sont des
objets standards de la théorie, et extrêmement étudiés, donc se
demander s'ils sont égaux — ou plutôt, chercher à prouver qu'ils ne le
sont pas, parce que c'est ça qu'on pense — est une question évidemment
et éminemment naturelle). A contrario, chercher à calculer une
intégrale extrêmement compliquée avec plein de symboles dedans n'est
pas une question qui intéressera grand-monde, sauf si on peut
justifier pourquoi cette intégrale apparaît, d'où elle sort, bref,
pourquoi on s'y intéresserait.
Un autre critère de naturalité, à part la simplicité, est que la question survient sur plusieurs pistes de réflexions indépendantes : par exemple, si on peut montrer qu'une même question admet toutes sortes de reformulations équivalentes (c'est-à-dire qu'on sait montrer qu'elles sont équivalentes, mais on ne sait décider aucune d'entre elles), surtout si ces reformulations sont très différentes et concernent des domaines (ou au moins des sous-domaines) différents des maths, alors cela aide à rendre la question naturelle. Évidemment, si deux personnes se sont posé indépendamment la même question, c'est un signe empirique qu'elle est naturelle ; si deux personnes se sont posé indépendamment deux questions dont on peut montrer qu'elles sont équivalentes, c'est aussi un signe (et la preuve de l'équivalence peut être considérée comme un résultat mathématique en soi).
On peut aussi mentionner la possibilité pour le grand public de
comprendre le problème : ce n'est pas un facteur essentiel, mais
disons que ça augmente un peu la motivation. (Quelques exemples de
problèmes ouverts de ce type : existe-t-il un parallélépipède
rectangle dont les côtés, les diagonales des faces et les diagonales
de volume ont tous une longueur entière ?
,
cf. ici ; combien
de couleurs faut-il pour colorier le plan de manière à ce que deux
points à distance 1 ne soient jamais de la même couleur ?
,
cf. ici ; si
je pars d'un entier ≥1 et que je répète le processus de le diviser par
2 quand il est pair (p.ex. 8 ↦ 4) et de le multiplier par 3 puis
ajouter 1 quand il est impair (p.ex. 5 ↦ 16), est-ce que je finis
toujours par tomber sur 1 (p.ex. 3 ↦ 10 ↦ 5 ↦ 16 ↦ 8 ↦ 4 ↦ 2 ↦
1) ?
,
cf. ici ; est-il
vrai que tout entier pair peut s'écrire comme la somme de deux nombres
premiers ?
,
cf. ici ;
ou encore, e+π est-il rationnel (i.e., est-il égal au
rapport entre deux entiers) ?
.) Cependant, ces problèmes
compréhensibles par le grand public sont souvent considérés comme un
peu isolés (au sens où il n'y a pas toute une théorie fertile autour
dont on pourrait tirer des résultats partiels), soit sont en fait des
versions simplifiées de conjectures plus larges et plus naturelles.
(Par exemple, plutôt que se demander si e+π est rationnel,
le mathématicien préfère voir ça comme un cas particulier d'une
conjecture plus large, comme de savoir si e et π sont
algébriquement indépendants, elle-même comme un cas particulier
d'une conjecture
encore plus vaste : évidemment, plus on généralise plus ça tend à
être difficile, mais ce qu'on veut dire par là c'est aussi qu'on a peu
de chances d'arriver à résoudre la version particulière sans avoir un
programme pour attaquer la version générale.)
Une autre raison très importante pour justifier l'intérêt d'une question est celle des conséquences qu'elle entraîne : s'agissant des maths appliquées (mais ce n'est absolument limité aux maths appliquées, et ce n'est pas non plus le seul critère pertinent pour les maths appliquées), il peut s'agir de conséquences pour une autre science ou technique, ou pour un problème concret (par exemple d'ingénierie) ; mais les conséquences sont aussi les conséquences internes[#20] aux mathématiques : si une affirmation semble au moins plausible aux yeux du spécialiste, et entraîne des conséquences très souhaitables sur toutes sortes d'autres questions mathématiques, cela justifie certainement de se poser la question de savoir si elle est effectivement vraie.
[#20] J'en
ai déjà parlé plus d'une fois, mais
c'est impossible de ne pas en redire au moins brièvement un mot
quelque part dans ce billet. On essaie souvent de vendre l'utilité
des maths pures en disant qu'on ne sait jamais quelles applications
pourront avoir telle ou telle théorie à l'avenir (par exemple,
beaucoup de la cryptographie actuelle vient de la théorie des nombres
ou de la géométrie arithmétique — comme les courbes elliptiques — ou
plus récemment la théorie des réseaux euclidiens pour la cryptographie
post-quantique, qui semblait n'avoir aucune application pratique) ;
c'est partiellement vrai, mais je pense que c'est un mauvais argument,
parce ça admet le principe qu'une science n'est utile que tant qu'elle
a des applications, ce qui est une idée stupide. (Et, honnêtement, le
jour où la théorie des grands cardinaux trouvera des applications, je
serai assez scié.) Ce n'est pas non plus une bonne idée de se draper
dans sa dignité et de dire qu'on fait des maths pour l'honneur de
l'esprit humain
. C'est plutôt qu'il faut se rendre compte que
l'utilité est quelque chose qui dépasse largement les applications
directes et immédiates : l'utilité c'est aussi de fournir des idées,
des cadres de pensée, des cadres de pensée, des analogies, des
intuitions, des modèles, des formalismes, et plus généralement
une culture scientifique qui pourra
ensuite inspirer, guider ou orienter
d'autres parties de la recherche plus appliquée. Bref, d'irriguer
intellectuellement le domaine. Les maths sont comme un organisme
vivant ou comme un cerveau (c'est aussi ça que j'évoque quand je parle
de leur unité) : s'imaginer qu'on pourrait ne garder que les maths
appliquées et se passer des maths pures qui ne produisent pas de
résultats applicables, c'est comme se dire qu'on puisse se passer des
racines d'un pommier parce qu'il n'y a pas de pommes qui poussent
dessus, ou pratiquer une lobotomie de toutes les parties du cerveau
qui ne semblent pas directement utiles alors qu'elles consomment du
glucose.
Et puis, bien sûr, il y a la question de la beauté : j'ai mentionné plus haut que les mathématiciens sont très largement convaincus de la beauté des mathématiques, et cette considération esthétique démarre dès la formulation des questions.
In fine, la seule chose qui définit vraiment un problème
mathématique intéressant ou important, c'est quelque chose qu'un
nombre suffisant d'autres mathématiciens considèrent comme un problème
mathématique intéressant ou important. On peut théoriser sur les
problèmes simples ou naturels comme on veut, mais au bout du compte
c'est un jugement subjectif par la communauté. Jugement collectif qui
cache, évidemment, bien des désaccords (il y a plein de problèmes
célèbres dont plein de mathématiciens diront je ne comprends pas en
quoi ce problème est considéré comme intéressant
). Je renvoie
aussi
à ce
fil MathOverflow pour divers points de vue sur ce qui fait qu'un
problème mathématique est important.
Enfin, je dois mentionner que certains travaux mathématiques ne cherchent pas à résoudre une question précise (ou disons, il peut y avoir toutes sortes de petites questions liées les unes aux autres) : un article peut très bien présenter une construction ou un objet intéressant sans qu'on puisse dire qu'il répond à une question formulée dans des termes rigoureux. Évidemment, pour justifier l'intérêt de la construction ou de l'objet présenté, il est de bon ton qu'il réponde au moins à une question mineure qu'on pourra donner en exemple ; mais disons que ce n'est pas forcément le point focal de l'article que de répondre à cette question, qui servira juste à illustrer ce qu'on peut faire avec la technique présentée.
☞ La fabrique des théorèmes
Mais admettons maintenant qu'on ait une question sur laquelle on veut travailler. Comment ensuite la résoudre ?
La production la plus emblématique du mathématicien est de fabriquer des théorèmes[#21]. Je pense, en fait, que l'accent mis sur les théorèmes est un peu exagéré au détriment des autres éléments de ce qui constitue la littérature mathématique (définitions, constructions, exemples et contre-exemples, algorithmes, discussions informelles, questions, conjectures, constatations expérimentales[#22], et même, pourquoi pas, schémas explicatifs), mais tournons-nous vers les théorèmes. Un théorème (comme ses variantes techniques que sont les propositions, lemmes et corollaires) est constitué de deux parties très inégales : l'énoncé du théorème, qui est une affirmation mathématique précise, et la démonstration ou preuve, qui est un raisonnement rigoureux qui permet, dans le cadre des règles du jeu (logiques mais aussi sociales) des mathématiques, de conclure que l'énoncé affirmé est bien correct. Une démonstration, c'est une succession d'étapes logiques suffisamment petites pour que le lecteur puisse être absolument convaincu par chacune et qui, partant des hypothèses de l'énoncé, aboutit à sa conclusion.
[#21] Alfred Rényi est censé avoir dit qu'un mathématicien était un dispositif à transformer du café en théorèmes.
[#22] Car, oui, il existe des mathématiques expérimentales. Il s'agit généralement d'utiliser un ordinateur pour observer des phénomènes intéressants qui peuvent alors mériter d'être qualifiés de conjectures ou, au moins, être ouverts à la question.
La démonstration est, donc, au mathématicien, ce que la
méthode expérimentale est au chercheurs en sciences
expérimentales. À ceci près qu'une fois une vérité
mathématique établie elle est, en principe, valable pour toute
l'éternité n'a jamais plus à être remise en question (j'écris en
principe
, parce qu'il arrive qu'on trouve des erreurs dans des
démonstrations publiées, et même s'il est très rare qu'elles vicient
jusqu'à la conclusion, cette possibilité ne peut jamais être
complètement exclue) alors qu'une théorie dégagée à partir de données
expérimentales peut toujours être remise en question par des
expériences ultérieures (disons que ça fait partie de l'hygiène
mentale des sciences expérimentales que d'être ouvert à cette
possibilité, alors qu'en mathématiques on ne se tracasse pas trop du
risque théorique que des résultats bien acceptés soient invalidés
parce que personne n'aurait vu une erreur dans la preuve).
☞ Formes et fonctions de la preuve
La preuve mathématique est à la fois un objet mathématique et un objet social.
Elle est un objet mathématique parce que la notion même de théorème et de démonstration mathématique est l'objet d'étude d'une branche des mathématiques (la logique, et notamment la théorie de la démonstration) : c'est peut-être une des grandes révolutions conceptuelles des mathématiques du début du XXe siècle que d'avoir compris que les mathématiques pouvaient aussi s'intéresser aux métamathématiques, c'est-à-dire devenir un objet d'étude pour elles-mêmes. (Voir par exemple ce que j'écris dans la partie historique au tout début de ce billet au sujet du formalisme.) Un résultat emblématique à ce sujet (et largement connu même auprès du grand public, mais malheureusement souvent détourné) est, par exemple, le théorème de Gödel, qui, sous certaines conditions techniques, affirme qu'il existe des énoncés mathématiques que, dans le cadre d'un système formel donné, on ne pourra ni démontrer ni réfuter (c'est-à-dire qu'on ne pourra prouver ni une chose ni son contraire ; voir ce billet et/ou celui-là pour des explications plus précises, parce que j'ai promis de ne pas parler de maths dans celui-ci). Les preuves dont on parle ici sont des objets mathématiques formels, c'est-à-dire des suites de symboles dans un langage tout à fait abscons mais codifié de façon parfaitement précise, ce qui permet, justement, de raisonner mathématiquement à leur sujet y compris pour dire qu'il n'en existe pas vérifiant telle ou telle condition.
Mais cette version formelle de la démonstration n'est pas
vraiment celle qui intéresse la pratique courante du
mathématicien. Son activité quotidienne consiste plutôt à
écrire des preuves écrites en langue naturelle (anglais, ou
plus rarement, français ou autre chose), dont on pense informellement
qu'elles pourraient, avec suffisamment de patience être transformées
en preuves formelles, mais qui ne sont pas, en elles-mêmes, des
preuves formelles. C'est pour ça que je dis que les preuves sont
aussi un objet social. Dans une preuve formelle il est indispensable
d'écrire les moindres détails du raisonnement jusqu'au niveau des
règles de la pure logique : dans une preuve sociale, il est admis
d'écrire il est évident
ou même c'est un exercice facile de
vérifier que
pour ne pas gâcher des pages de papier (fût-il
virtuel) à démontrer quelque chose qui est effectivement évident pour
tout mathématicien raisonnablement compétent, et surtout, pour ne pas
se laisser distraire de la partie importante de la preuve ; mais bien
sûr, dès lors qu'on autorise ce genre de pointillés, cela ouvre le
risque d'erreurs ou, sinon, d'erreurs, de difficultés à comprendre la
preuve, tant certains en abusent. (Probablement tous les
mathématiciens se sont, au moins une fois, arraché les cheveux à
essayer de comprendre en quoi un passage que l'auteur de la preuve
qualifiait d'évident
était censé être évident. Parfois c'est
effectivement évident et on est simplement trop fatigué pour le voir ;
parfois c'est évident seulement si on a la bonne façon de penser ;
parfois ce n'est pas du tout évident et l'auteur abuse franchement ;
et parfois — heureusement rarement — c'est carrément faux.)
La preuve mathématique est un objet
social[#23], donc, parce que
le but est de convaincre les autres mathématiciens de sa validité, et
donc celle de l'énoncé qu'elle porte comme conclusion. Néanmoins, si
ces deux natures de la preuve — formelle et sociale — que je viens
d'évoquer sont distinctes, je ne veux pas non plus exagérer leur
différence. Car faisant le pont entre les deux, il existe un
troisième type de preuve, sans doute destinée à jouer un plus grand
rôle à l'avenir : la preuve informatisée, c'est-à-dire celle
qu'on fournit à un logiciel spécialisé (un assistant de preuve
)
qui s'occupe de compléter et de contrôler les étapes microscopiques de
la logique, et donc de certifier la correction de l'ensemble du
raisonnement. La preuve informatisée peut être transformée en preuve
formelle, ou peut en être considérée comme une représentation, si on
le désire (c'est un travail informatique simple), mais en même temps
l'interface de l'assistant de preuve permet de la manipuler de façon
presque aussi commode qu'une preuve en langage naturel. Différents
projets[#24] ont visé à
transformer des preuves publiées en langage naturel (ce que j'ai
appelé des preuves « sociales ») en preuves informatisées, et
suggèrent fortement que l'écart n'est pas aussi important que ce qu'on
pouvait craindre[#25], ce qui
valide la croyance que les mathématiciens produisent bien des preuves
pouvant « en principe » (et avec un effort pas totalement délirant) se
formaliser dans un système parfaitement rigoureux, et tout cela est
rassurant pour la santé épistémologique des mathématiques. Ou du
moins, de certaines branches des mathématiques, parce qu'elles ne sont
pas toutes égales du point de vue de la distance qui sépare la preuve
formelle et la preuve sociale.
[#23] Et, bien sûr,
historique, parce que ce qui a été considéré comme « preuve » a varié
selon les périodes et les endroits. Si la rigueur logique
des Éléments d'Euclide n'est pas très éloignée de ce
qu'on considère maintenant comme une preuve rigoureuse en Géométrie,
il en va tout autrement des démonstrations qui ont pu être écrites en
Analyse avant que soient proprement dégagées les notions de nombre
réel, de fonction continue, et ce qu'on peut appeler les
démonstrations en ε,δ
.
[#24] Pour en savoir plus, je renvoie à cet exposé au Congrès international des mathématiciens 2022 sur divers efforts de formalisation informatique de preuves de théorèmes importants.
[#25] Bien sûr, des petites erreurs dans les preuves ont été découvertes à cette occasion, mais on constate qu'elles peuvent facilement se corriger et n'ont pas tendance à contaminer toute la démonstration.
Il faut que j'ajoute que la preuve mathématique n'a pas pour unique objet de certifier la vérité de l'énoncé qui en est la conclusion. On donne souvent des exemples de diverses affirmations qui peuvent expérimentalement sembler vraies mais qui se révèlent fausses bien au-delà de ce qui est informatiquement testable pour justifier l'affirmation que les mathématiques ont besoin de preuves. Et je ne vais certainement pas nier l'intérêt de produire des démonstrations pour être certain que ce qu'on dit est vrai. Mais je pense que c'est très réducteur de limiter l'intérêt de la démonstration à une simple certification de vérité. Une preuve qui serait purement formelle, donc aisément vérifiable de ligne à ligne mais franchement illisible et largement incompréhensible « à haut niveau » permettrait bien de certifier la vérité (surtout si un ordinateur la contrôle) mais n'aurait à peu près aucun intérêt scientifique.
Car la preuve d'un théorème doit nous aider aussi à comprendre ce théorème : à nous faire une idée de « pourquoi » il est vrai (si tant est que ceci ait un sens), à savoir quelles hypothèses précises le font marcher et donc comment on pourrait le généraliser ou le transposer, à découvrir de nouvelles constructions ou techniques qui pourront s'appliquer à d'autres questions adjacentes, et bien sûr, à nous former une intuition sur les objets impliqués.
Ajout () : On me fait remarquer que je pourrais ajouter quelque part qu'il ni interdit ni dénué d'intérêt de trouver des démonstrations nouvelles de théorèmes déjà connus. Cela peut être intéressant notamment si la démonstration est nettement plus simple que celle qui était déjà connue, ou passe par une technique complètement différente (par exemple susceptible d'être généralisée dans d'autres contextes), ou pour toutes sortes de raisons pouvant faire qu'elles nous éclaire différemment sur le résultat. Évidemment c'est plus difficile (quoique pas impossible) de publier un article qui ne fait que redémontrer un résultat déjà connu, parce qu'il va falloir motiver l'intérêt autonome de cette preuve et pas juste l'intérêt du résultat, mais il faut néanmoins considérer que ça peut être une contribution non négligeable à la recherche.
☞ Rigueur et intuition
Les mathématiques reposent sur deux jambes : la rigueur et l'intuition.
La rigueur nous empêche de tomber dans l'erreur, elle empêche l'édifice tout entier des mathématiques de s'effondrer : la rigueur est celle qui s'assure que les affirmations ont un sens et que les preuves sont correctes (et pourraient, en principe, être converties en preuves formelles comme je l'évoque ci-dessus). Dans la métaphore du palais que j'ai évoqué plus haut, la rigueur est, si on veut, celle qui nous empêche de nous cogner dans les murs. L'intuition, elle, est notre sens de l'orientation dans le monde mathématique : elle est celle qui guide les raisonnements, suggère la direction dans laquelle aller pour relier les hypothèses et la conclusion.
L'intuition sans rigueur conduit à des affirmations fausses et des démonstrations qui n'en sont pas : ce n'est donc pas des mathématiques. Mais la rigueur sans intuition est tout aussi stérile, car sans avoir un sens général d'où on veut aller, on ne peut qu'aligner les théorèmes corrects mais triviaux.
Forcément, il existe toujours une certaine tension entre ces deux
moteurs de l'activité mathématique : tout mathématicien a sur ses
épaules un petit ange et un petit démon (je ne me prononce pas sur
lequel est lequel)[#26] :
l'intuition lui souffle des choses comme ceci est sûrement vrai
voire oui, c'est évident, ça ne peut pas être autrement
, tandis
que l'autre n'a de cesse de lui faire peur : mais es-tu bien sûr
de toi ?
, as-tu bien vérifié ?
.
[#26] S'il faut
attribuer des rôles, l'intuition peut certainement être incarnée par
un physicien et son fameux sens physique
qui lui permet souvent
de savoir ce qui va se passer sans avoir besoin de mener une analyse
mathématiquement rigoureuse des phénomènes. Le physicien Richard
Feynman, notamment (dont l'enseignement est à juste titre considéré
comme exceptionnel par sa clarté et sa profondeur) fait la part belle
à ce sens physique, et on peut penser que cela correspond aussi assez
bien à l'intuition mathématique. Mais Feynman avait aussi un mépris
assez marqué pour les mathématiciens (pas pour les mathématiques, mais
pour les mathématiciens), cf. par
exemple cette vidéo, et notamment pour leur insistance sur la
rigueur, qu'il semble qu'il a qualifiée quelque part
de rigor mortis (citation peut-être apocryphe
parce que je n'en retrouve pas de source précise, mais tout à fait
dans l'esprit du personnage).
Apprendre la rigueur est un exercice de patience et de méticulosité : il s'agit de faire des pas logiques suffisamment petits pour qu'on n'ait pas le moindre doute sur leur validité (avec l'entraînement, bien sûr, on apprend à en faire de plus en plus grands en étant toujours parfaitement sûr de soi, et la rigueur cesse d'être un trop grand handicap). Mais l'origine de l'intuition est plus difficile à cerner, et il est délicat de l'enseigner.
L'intuition s'acquiert avec l'habitude[#26b] du maniement des objets mathématiques, et notamment en multipliant exemples et contre-exemples. L'intuition consiste à se faire une représentation mentale imagée ou opérationnelle de concepts parfois extrêmement techniques, et de comment ils se comportent. Parfois elle prend littéralement la forme d'une image qui permet de se représenter mentalement les choses au moyen du cortex visuel. Parfois c'est une analogie entre deux situations (analogie qui peut elle-même être plus ou moins rigoureuse ou approximative), permettant de soupçonner certains comportements d'un côté de l'analogie en s'inspirant de ceux de l'autre. Parfois c'est un « slogan », c'est-à-dire une affirmation très approximative (du style « plus une variété algébrique est proche d'être géométriquement rationnelle, plus elle a tendance à voir des points rationnels ») qu'on va ensuite chercher à raffiner : même si ce slogan est faux, on peut chercher à retenir dans quel genre de cas il est faux. Et parfois c'est tout simplement une collection d'exemples et de contre-exemples, l'idée étant que si une affirmation est valable sur toute la collection d'exemples et de contre-exemples qu'on a sur le sujet, on peut au moins sérieusement commencer à se demander si elle est universellement vraie (et si on trouve qu'elle ne l'est pas, on ajoutera le contre-exemple à la liste). Dans tous les cas, l'intuition se forge au contact des mathématiques, et plus exactement du domaine dans lequel on travaille, notamment à mesure qu'en lisant des preuves ou en assimilant des théorèmes, on raffine les images mentales qu'on peut avoir et on élargit son stock d'exemples et de contre-exemples.
[#26b] Ajout
() : John von Neumann aurait dit un jour (à un
physicien qui se plaignait de ne pas comprendre quelque
chose) : Young man, in mathematics you don't
understand things. You just get used to them.
Il y a toutes
sortes de façons de comprendre cette citation (ou peut-être qu'on ne
la comprend pas, et qu'on finit juste par s'y habituer…), mais ce qui
est sûr c'est que la meilleure manière d'acquérir de l'intuition sur
les objets mathématiques est de s'exercer à les manier.
L'intuition s'utilise principalement pour savoir si une affirmation « a des chances » d'être vraie plus rapidement qu'en en trouvant une démonstration (ou réfutation) précise. Parce que pour élaborer un plan d'attaque dans la démonstration d'un théorème, on va certainement poser des jalons intermédiaires : pour que ce plan ait une chance d'aboutir, il est bon que chacun des jalons intermédiaires soit effectivement sensé. Bien sûr, la démonstration finale devrait le confirmer, mais l'intuition réduit les chances qu'en ayant posé les jalons 1, 2 et 3 (typiquement, sous forme de lemmes), et en ayant vérifié rigoureusement qu'ils sont corrects, on se rende compte que la dernière étape est, finalement infranchissable. Donc même si au final on doit fournir une démonstration rigoureuse, avoir une bonne approximation de la vérité est phénoménalement utile pour pouvoir trouver un chemin dans le palais labyrinthique que sont les mathématiques.
L'intuition est malheureusement difficile à communiquer ou à enseigner. Enseigner la rigueur est un peu comme enseigner les règles du jeu d'échecs : ça je sais faire[#27] ; enseigner l'intuition est comme expliquer comment bien jouer aux échecs : on peut donner quelques conseils, mais, in fine, il s'agit surtout de pratique, de pratique et encore de pratique. En plus de ça, les représentations mentales intuitives qu'un mathématicien se fait d'un domaine donné peuvent être tout à fait différentes de celles de son voisin, i.e., la rigueur est largement partagée, mais l'intuition ne l'est pas.
[#27] Ma comparaison a ses limites car, s'agissant des mathématiques, on ne revient que très rarement aux règles les plus fondamentales que sont les axiomes de ZFC et principes de la logique du premier ordre, donc les règles effectives des mathématiques sont bien plus complexes que celles du jeu d'échecs (c'est plutôt un peu comme les échecs dans lesquels on s'autoriserait de temps en temps à jouer deux ou trois coups en une fois parce qu'il est bien entendu que l'adversaire ne peut répondre que de telle ou telle façon).
Néanmoins, il me semble que les mathématiciens ont tendance à être
excessivement pudiques dans la communication de leur intuition : quand
ils écrivent un article contenant un théorème et sa preuve, ils ont
tendance à passer complètement sous silence les processus mentaux qui
ont permis la découverte de cette preuve, considérant que la
démonstration se suffit à elle-même (ce qui est certes correct si on
ne s'intéresse qu'au développement formel du corpus des théorèmes
prouvés). Au mieux on peut s'attendre à ce que la preuve soit
précédée d'une idée de la démonstration
et que les objets
nouveaux construits soient accompagnés d'un petit commentaire sur la
manière dont on peut les visualiser. Mais très peu d'auteurs
consentent à en dire plus. Il y a sans doute de nombreuses raisons à
ça : la difficulté de l'introspection, évidemment, en fait partie (si
j'arrive à prouver un théorème, je ne sais pas forcément expliquer
comment je suis parvenu à cette preuve) ; mais je pense qu'il y a
aussi une crainte que ça ne fasse pas « sérieux » ou que ce ne soit
pas considéré comme la partie « noble » des mathématiques ; et
peut-être une crainte de laisser fuite ses propres secrets de
fabrication, ou même l'idée que ça gâcherait la beauté de l'objet
final (un peu comme un artiste n'a pas forcément envie de montrer plus
qu'une image achevée).
A fortiori, quand il s'agit d'enseigner, on est souvent assez démuni pour — et réticent à — donner aux élèves au moins une forme rudimentaire d'intuition des objets qu'on leur présente. C'est d'autant plus dommage que les concepts présentés sont anciens et donc polis par des générations de mathématiciens ayant travaillé dessus (et s'étant forgé une intuition dessus !), et cette forme polie elle peut être excessivement difficile à transformer en une représentation mentale adéquate[#28][#29]. On a rarement le temps de donner assez d'exemples et de contre-exemples et on a peur d'embrouiller les élèves avec des slogans vagues et parfois approximatifs, donc on en est réduit à conseiller d'essayer de faire des exercices (et certainement les exercices jouent un rôle crucial pour se familiariser avec les concepts mathématiques, mais ils gagneraient sans doute à être accompagnés d'indications intuitives expliquant comment on pouvait arriver à la solution).
[#28] Un exemple d'un
concept extrêmement important dont la définition formelle est
particulièrement éloignée de la représentation mentale est celle
d'espace topologique « compact ». Si on le définit
formellement comme un espace topologique [séparé] dont tout
recouvrement par des ouverts admet un sous-recouvrement fini
ou
bien un espace dans lequel tout ultrafiltre a une limite
[unique]
, je ne pense pas que ça aide à comprendre quoi que ce
soit. Voici quelques idées intuitives, plus ou moins vagues,
que j'ai moi-même dans la tête quand je pense à un espace compact, et
qui peuvent peut-être aider à imaginer la notion, ou à illustrer le
genre d'intuition qu'on peut se former d'un concept
mathématique : la notion d'espace compact est une généralisation de
la notion d'ensemble fini, et qui tente de répercuter les propriétés
de la finitude
; de façon générale, la compacité, en
mathématiques, est une façon de dire
; tout ce qui se produit se
produira à niveau fini
, donc le fini contrôle toute la
situation
un espace topologique compact est un espace
dont on ne peut fuir dans aucune direction : il n'y a ni trou dans
lequel tomber ni infini vers lequel s'en aller
; les
ultrafiltres représentent toutes les manières dont on peut imaginer
compléter un espace topologique, et le fait qu'ils aient tous une
limite donne l'idée que tous les trous imaginables ont été
bouchés
; compact équivaut au fait que si une famille de fermés
a des intersections finies non-vides alors l'intersection de tous est
non-vide : cela correspond à l'intuition que si j'ai des contraintes
et que je peux en imposer un nombre fini quelconque, alors je peux
toutes les imposer en même temps (et c'est souvent cette façon de
procéder qui permet d'utiliser la notion de compacité)
; pour
des espaces assez sympas (disons, métriques), la compacité équivaut à
la propriété que toute suite a une valeur d'adhérence, ce qui reflète
l'idée intuitive que si la suite essaie de s'enfuir, elle va forcément
laisser une marque quelque part
; pour des espaces assez sympas
(disons, métriques), la compacité équivaut à la propriété que toute
fonction continue est bornée (et, du coup, atteint ses bornes), ce qui
reflète l'idée intuitive qu'il n'y a aucune sorte d'infini caché dans
l'espace en question
.
[#29] Un autre exemple, beaucoup plus technique, d'un concept très important, dont la définition formelle est particulièrement éloignée de toute représentation mentale est celle de morphisme « plat » en géométrie algébrique. La définition rigoureuse (voir par exemple ici) est exprimée en termes d'algèbre linéaire et de produits tensoriels et, même si on comprend parfaitement ce qu'elle dit formellement, elle ne laisse absolument aucune image mentale sur ce que cette notion représente géométriquement. Tous les géomètres algébristes ont bien dû s'en créer une image mentale un peu plus utilisable, parce que c'est un concept vraiment central dans le sujet : malheureusement, très peu essaient de communiquer cette intuition (et encore moins y parviennent) : voir par exemple ici, là, ou encore là et là. À peu près le mieux que je sache dire est que la platitude traduit à peu près le fait que les fibres du morphisme « ne varient pas trop brutalement », avec de gros guillemets (au minimum, leur dimension doit être semicontinue inférieurement ; mais par exemple le polynôme de Hilbert-Samuel restera constant sur les fibres d'un morphisme plat projectif, ce qui est une autre façon pour les fibres de ne pas trop varier). Cette explication peut être accompagnée de divers exemples de morphismes qui sont plats ou ne le sont pas.
☞ Deux exemples de raisonnements mathématiques
Bref, il est très difficile d'expliquer les processus mentaux qui font qu'on arrive à résoudre un problème de maths. Et je me suis de plus promis de ne pas parler de contenu mathématique dans ce billet. Je voudrais cependant donner deux exemples de problèmes qui ne nécessitent aucune connaissance mathématique au-delà de l'école primaire, qui sont, à mon avis, résolubles par tout le monde qui voudra bien prendre la peine d'y réfléchir un peu, et qui donneront au moins une petite idée du type de raisonnement qu'un mathématicien peut faire.
Premier problème : Alice et Bob jouent à un jeu. Ils ont devant eux un tas de 20 jetons. Chaque joueur, quand vient son tour, peut retirer 1 ou 2 jetons du tas. Les joueurs jouent à tour de rôle (on ne peut pas passer son tour), et c'est Alice qui commence. Le joueur qui retire le dernier jeton gagne (ou, ce qui revient au même, le joueur qui ne peut plus jouer parce qu'il ne reste plus aucun jeton perd). Comment Alice fait-elle pour être sûre de gagner ?
(On peut d'ailleurs véritablement jouer à ce jeu avec des enfants, ça peut être amusant et ça peut être une façon de voir s'ils sont potentiellement réceptifs aux idées mathématiques.)
J'encourage vraiment à y réfléchir si on ne voit pas immédiatement la réponse, parce que je pense vraiment que c'est un problème qui d'une part est résoluble par n'importe qui et d'autre part donne une petite idée de ce que « ça fait » de réfléchir à un problème de maths, et du genre de réflexions qu'un chercheur en maths peut se faire.
Si on n'y arrive pas, voici quelques indications possibles, que je donne aussi pour montrer comment on peut aborder ce type de problème. Le nombre 20 est suspicieusement arbitraire : on peut donc se demander, pour y voir plus clair, ce qui se passe si on commence avec 1 jeton (là, Alice gagne évidemment en retirant cet unique jeton), puis 2 jetons (idem, Alice gagne évidemment), puis 3 (cette fois c'est Bob qui gagne : pourquoi ?), puis 4 (Alice gagne de nouveau, mais que doit-elle faire ?), puis 5, et ainsi de suite jusqu'à ce qu'on voie un motif émerger. Ceci illustrera, justement, la manière dont généraliser un problème aide à le résoudre : en fait, c'est en quelque sorte plus facile de résoudre la question de qui gagne et comment quand on commence avec n jetons que le cas particulier n=20. Voici une autre indication possible : supposons qu'à chaque fois que Bob retire 1 jeton Alice réponde en en retirant 2 et qu'à chaque fois que Bob en retire 2 Alice en retire 1 — quel est l'effet quand les deux joueurs jouent successivement, et que va-t-il se passer si Alice joue systématiquement de la sorte ?
La réponse est la suivante (cliquez ici pour la faire apparaître) : Alice commence par retirer 2 jetons, si bien qu'il en reste 18, un nombre multiple de 3, et ensuite, à chaque fois que Bob retire 1 jeton elle en retire 2 et à chaque fois qu'il en retire 2 elle en retire 1, si bien qu'à eux deux ils retirent toujours 3 jetons, et le nombre de jetons restant après son coup à elle (Alice) sera successivement de 15, 12, 9, 6, 3 et 0, si bien qu'Alice aura retiré le dernier jeton et gagne.
Ce qui m'intéresse dans cet exemple n'est pas le fond de la réponse (qui peut certes servir d'exemple introductif à la branche des maths qu'est la théorie combinatoire des jeux), c'est surtout que c'est un exemple, que tout le monde pourra comprendre (enfin, j'espère !) de ce qu'est une démonstration mathématique : une preuve que, quoi que fasse Bob, Alice peut s'assurer la victoire. Ce n'est pas complètement évident de la trouver (enfin, certainement beaucoup de lecteurs ont trouvé ça complètement évident, mais ces lecteurs savent déjà de quoi je parle et ce n'est pas à eux que je m'adresse), et on a ici quelques uns des ingrédients de ce qui peut servir dans une démonstration mathématique (la notion d'invariant, notamment — ici le fait que le nombre de jetons soit multiple de 3 sous certaines conditions), et on a aussi une illustration de la manière dont on peut rechercher une telle démonstration (je ne sais pas résoudre le problème particulier de 20 jetons ? je le généralise à n jetons, et je recherche un motif général, je constate que si le nombre de jetons est multiple de 3 alors le second joueur gagne tandis que s'il n'est pas multiple de 3 alors c'est le premier joueur qui gagne).
Je ne veux pas multiplier les exemples, mais en voici un deuxième, lui aussi compréhensible par tout le monde, qui devrait illustrer le fait qu'une démonstration extrêmement simple peut ne pas être si évidente que ça à trouver :
Deuxième problème : Charlie a une tablette de chocolat 3×5 (donc avec 3×5=15 carrés de chocolat). Il veut la découper en ses 15 carrés individuels. Pour ça, il va la découper selon les lignes prédéfinies de la tablette (qui sont, bien sûr, parallèles aux côtés du rectangle).
Il pourrait, par exemple, commencer par la découper en lignes (ce qui va prendre 4 opérations de découpe pour 5 lignes), puis découper chaque ligne en ses carrés individuels (ce qui va prendre 2 opérations de découpe pour chaque ligne pour la couper en ses 3 carrés) ; ou commencer par la découper en colonnes, puis découper chaque colonne en carrés ; ou encore, couper en deux dans un sens, puis couper chaque bout en deux dans l'autre, et ainsi de suite tant qu'il reste un bout de plus qu'un seul carré.
Combien d'opérations de découpe faut-il au minimum, et au maximum, pour arriver à couper la tablette en ses 15 carrés individuels ?
La solution(cliquez ici pour la faire apparaître) est extrêmement simple et la morale (enfin, une morale), justement, est que parfois les problèmes deviennent extrêmement simples quand on les débarrasse de tout ce qui est superflu (par exemple, ici, la taille de la tablette, ou même sa forme et les histoires de lignes et de colonnes) pour ne garder que l'essentiel. L'essentiel, en l'occurrence, c'est qu'à chaque fois qu'on fait une découpe, le nombre total de morceaux augmente exactement de 1, et dès qu'on a vu ça c'est évident que le nombre d'opérations de découpe sera toujours de 14, quelle que soit la manière dont on s'y prend.
Si vous voulez plein d'autres exemples de raisonnements mathématiques tout à fait compréhensibles par le grand public sans (ou quasiment sans) notion préalable de maths, je recommande le livre Proofs and the Art of Mathematics de Joel D. Hamkins.
☞ Comment trouve-t-on des démonstrations ?
Je ne vais pas essayer d'expliquer les différentes approches qu'un mathématicien peut exploiter pour résoudre un problème de maths (souvent : élaborer une démonstration) : il y en a un certain nombre, sans doute les plus importantes, expliquées dans l'excellent petit livre de George Pólya, How to Solve It (et même si on n'a pas ce livre, l'article Wikipédia résume au moins rapidement ce que sont les différentes techniques évoquées). Si le problème semble trop difficile, on commence souvent par voir si on peut le simplifier et, le cas échéant, trouver l'instance ou instance le plus simple possible qui présente quelque difficulté, et on voit si on sait résoudre ça (et si oui, on passe à la suivante et ainsi de suite en cherchant un motif général). Si le problème semble trop arbitraire, on cherche souvent à le généraliser pour y voir plus clair. Si on trouve les termes du problème trop confus, on peut essayer de les reformuler dans un autre langage, de trouver un problème équivalent qui parlera plus à l'intuition. Si les exemples suggèrent une propriété particulière, on peut essayer de démontrer celle-ci en premier, et voir si elle aide à résoudre le problème. On peut aussi partir des hypothèses (comment est-ce que je pourrais utiliser une telle hypothèse ?) ou à rebours de la conclusion (quel genre d'outil permettent de conclure ce type de chose ?) et essayer de rapprocher les unes de l'autre. Et on peut chercher à se faire un plan d'ensemble de démonstration en exploitant une analogie (mon problème ressemble à tel autre problème qui se résout de telle et telle manière, peut-être que je peux chercher une piste analogue à la piste qui marche pour cet autre problème ?).
Évidemment, beaucoup d'approches ne sont pas très systématiques : on fait appel à son intuition, qui prend par exemple parfois une forme graphique, pour comprendre « ce qui se passe ». Souvent, par exemple, j'essaie d'imaginer un contre-exemple à l'affirmation que je cherche à démontrer, j'essaie de visualiser à quoi il ressemblerait, et de comprendre « ce qui cloche », ce qui le rend impossible.
Mais il ne faut pas s'imaginer que le mathématicien aborde chaque
problème comme quelque chose de frais. Souvent la question
n'est pas comment est-ce que je peux démontrer ceci ?
mais
plutôt qu'est-ce que je peux démontrer de nouveau et d'intéressant
avec les outils à ma disposition ?
, i.e., on ne se fixe
pas une conclusion mais un type de conclusion, un domaine
approximatif, et on voit ce qu'on sait faire
d'intéressant[#29b]. (C'est
notamment pour ça que je disais plus haut que les étapes de trouver
une question intéressante et d'y répondre se mélangent souvent, ou au
moins communiquent entre elles.) Quand on a assez travaillé dans un
domaine, on commence à savoir repérer les pistes encore inexplorées
qui pourront mener à des endroits intéressants dans le palais, les
types d'outils ou de construction qui s'avèrent féconds en conclusions
intéressantes. Quand on aborde un nouveau domaine, on va plutôt
regarder ce que font les gens qui y travaillent déjà, quels styles
d'outils ils utilisent, s'approprier ceux qui reviennent souvent, et
parfois tenter de les réemployer de manière un petit peu
différente.
[#29b] Ajout () : J'oubliais de dire, et c'est très important : ceci fonctionne aussi dans le sens négatif. Beaucoup de questions me semblent très intéressantes mais je vois tout de suite que je serai incapable de faire le moindre progrès dessus, donc je ne vais pas essayer de m'y attaquer. Même quand je décide d'attaquer un problème, si je vois que je suis, au bout d'un moment, complètement sec (je veux dire, que je n'ai plus de piste qui peut plausiblement marcher, ce qui est différent d'avoir des pistes qui ne marchent pas tout à fait), je vais arrêter au lieu de m'obstiner à réfléchir dans le vide. Donc la sélection des problèmes sur lesquels on réfléchit (individuellement, ou en tant que communauté) se fait aussi très largement par ce qu'on sait faire[#29c].
[#29c] Ajout
() : David Hilbert a fait une adresse
le devant le
congrès de la société des scientifiques et médecins allemands réuni à
Königsberg, adresse dont une partie a été diffusée à la radio et
l'enregistrement nous est parvenu
(voir ici
pour la transcription et la traduction
et ici
pour l'enregistrement lui-même), et qui
est devenu
célèbre. (J'aurais d'ailleurs dû prendre ce discours comme une
sorte de Leitmotiv de ce billet, parce qu'il
évoque divers sujets que j'ai discutés ici, comme le fait que la
nature est « écrite » en langue mathématique, le sens de la science
pour la science, et l'honneur de l'esprit humain. Tant pis.) Ce
texte finit ainsi : Für uns [Mathematiker] gibt es
kein Ignorabimus, und meiner Meinung nach auch
für die Naturwissenschaft überhaupt nicht. Statt des
törichten Ignorabimus heisse im Gegenteil unsere
Losung:
(Wir müssen wissen, wir werden wissen !
Pour
nous [mathématiciens] il n'y a pas
d'ignorabimus. et à mon avis il n'y en a pas du
tout non plus dans les sciences naturelles. Au lieu du
stupide ignorabimus, que notre maxime
soit :
)
J'apprécie l'optimisme de Hilbert (ainsi que son accent délicat et
subtilement prussien), et j'aime bien ce slogan, mais il faut quand
même rester réaliste : même pas tant pour les raisons profondes
découvertes ultérieurement par Gödel et Turing et limitant notre
capacité à approcher la vérité mathématique, mais simplement pour des
raisons pratiques des limitations tant de nos cerveaux que de nos
ordinateurs, il y a quantité de choses mathématiques dont nous
resterons éternellement ignorants.Nous devons savoir, nous allons savoir !
.
Notamment, une approche très importante pour faire ses premières
armes est de prendre un travail déjà existant, et de se
demander est-ce que je peux le généraliser un petit peu ?
ou est-ce que je peux le transposer dans un contexte un petit peu
différent ?
. Une autre approche très importante consiste à se
demander est-ce que je peux traduire ce problème dans un problème
d'un langage ou d'un domaine qui m'est plus familier et chercher à le
résoudre (voire, me demander s'il n'est pas déjà résolu) ?
(car,
oui, il arrive qu'un problème ouvert dans une branche des
mathématiques soit réglé en se rendant simplement compte qu'un simple
changement de langage ou l'application d'un « dictionnaire » standard
le transforme en un théorème connu d'un autre domaine).
Accessoirement, une partie non négligeable du travail mathématique consiste simplement à réécrire[#30] les définitions (ou les énoncés ou preuves), c'est-à-dire qu'on prend une définition (ou un énoncé ou preuve) générale, et on l'applique (ou instancie) dans un cas particulier en remplaçant toutes les notions générales par leur valeur dans le cas particulier qu'on considère, ce qui souvent débloque toutes sortes de simplifications. Pour le coup, il s'agit d'un travail essentiellement mécanique, ne nécessitant ni intelligence ni intuition[#31], mais une certaine patience et une certaine clarté mentale tant on peut avoir empilé des couches très complexes de définitions.
[#30] J'écris réécrire
, mais il
s'agit plutôt, si on veut être précis, d'un travail
de β-reduction.
[#31] Au contraire, c'est l'occasion de gagner de l'intuition sur la définition générale de voir ce qu'elle « donne » dans tel ou tel cas particulier. C'est aussi parfois l'occasion de découvrir une erreur dans un raisonnement, qu'on n'avait pas détectée dans le cas général parce qu'on se perd dans la complexité des définitions, mais qui devient frappante quand on l'instancie sur un cas où on comprend plus concrètement les choses.
Ceci est l'occasion de dire en passant que les définitions ont, en mathématiques, un très grand pouvoir (et c'est aussi la partie des mathématiques dont il est le plus facile de défendre qu'elles sont inventées et non découvertes) : le travail emblématique et reconnu du mathématicien consiste à apporter des preuves de théorèmes, mais une partie de son talent se voit dans les concepts qu'il définit[#32]. La bonne définition sert à la fois à dégager la notion et à ouvrir la voie à son étude, mais aussi à simplifier son maniement en permettant qu'on étudie ses propriétés sous une formulation simple.
[#32] Par exemple, les
contributions de Grothendieck à la géométrie algébrique sont
nombreuses et profondes, mais une d'entre elles qui ne doit pas être
négligée est simplement la définition de la notion de schéma
.
(À ce sujet, cf. ce billet ; même
si la définition que j'y donne n'est pas celle de Grothendieck, le
concept défini est bien le même, enfin, il est équivalent.) De même,
on peut dire qu'une partie non négligeable du progrès de la géométrie
différentielle à travers les contributions de (notamment) Riemann,
Poincaré, Weyl et Whitney a consisté simplement à aboutir à une
définition satisfaisante des objets considérés :
les variétés. Je pourrais donner toutes sortes d'exemples de
concepts mathématiques que la discipline tient maintenant pour acquis
mais qui, simplement par leur formulation, ont apporté énormément de
clarté et ouvert énormément de portes : la notion de relation
d'équivalence et de classes d'équivalence
(voir ici
pour son histoire), la notion de groupe ou celle d'anneau, la notion
de topologie et d'espace topologique, la notion de compacité (voir
notamment ici
et là
pour son histoire), et encore plein d'autres.
☞ La rédaction
Bon, une fois la démonstration mathématique trouvée (exercice
impliquant avant tout l'intuition), il faut encore la
rédiger (exercice impliquant avant tout la rigueur).
Sa première forme est généralement une esquisse sur un brouillon, où
subsiste souvent des annotations du style à vérifier
soigneusement
pour des passages qu'on croit mais qui ne sont pas
sûrs à 100% (car personne ne produit dès le départ une définition dont
il soit sûr à 100%), et d'ailleurs il arrive souvent que la
démonstration qu'on croit avoir trouvée la veille s'évanouisse le
lendemain. Mais la manière dont la plupart des démonstrations fausses
s'évanouissent c'est quand on fait l'effort de les rédiger
soigneusement, ce qui permet de se rendre compte de ses propres
erreurs (une faute de logique sautera bien plus facilement aux yeux
quand on s'efforce d'expliquer clairement chaque étape du raisonnement
que quand on en saute allègrement) : la rédaction est donc en
même temps un exercice de
vérification[#33] qu'il
en est un de communication.
[#33] Tout récemment, j'ai écrit une réponse à cette question sur MathOverflow montrant l'équivalence en maths constructives entre deux affirmations (la décomposabilité de ℝ, c'est-à-dire l'affirmation que ℝ soit la réunion disjointe de deux parties habitées, d'une part, et d'autre part la version analytique du principe limité faible d'omniscience, c'est-à-dire l'affirmation que tout réel est soit égal à zéro soit non égal à zéro — affirmations triviales en maths classiques mais qu'on ne peut plus tenir généralement en maths constructives). Mais en fait, ma première tentative a été de montrer le contraire : donner un contre-exemple (enfin, un modèle) qui visait à montrer que la décomposabilité de ℝ puisse valoir sans que le principe limité faible d'omniscience analytique vaille. Je pensais avoir trouvé une preuve de de ce contre-exemple, mais en la rédigeant pour MathOverflow je me suis rendu compte qu'elle était fausse, j'ai passé un certain temps à essayer de la corriger en me rendant compte de plus en plus fermement qu'elle était impossible à sauver, j'ai fini par me dire que finalement l'équivalence était peut-être vraie, et c'est elle que j'ai fini par prouver. ((Digression pour ceux qui peuvent comprendre de quoi il s'agit : le contre-exemple voulait être la suivant. Je considère l'espace topologique P des fonctions ℝ → {0,1} valant 0 en 0 et 1 en 1, muni de la topologie produit — qui intuitivement représente toutes les façons de décomposer ℝ en deux parties disjointes l'une contenant 0 et l'autre 1 — et je considère le topos des faisceaux sur P ; les nombres réels dans ce topos sont alors les foncions continues P → ℝ. Le fait que ce topos invalide le moindre principe limité d'omniscience analytique n'est pas difficile à voir. Le hic, c'est que j'avais tort de penser qu'en ayant construit P comme je l'avais fait ça allait automatiquement assurer la décomposabilité de ℝ dans le topos en question. J'ai commencé à écrire : donnée une fonction continue f:U→ℝ sur un ouvert U de P, on définit χ(f) par χ(f)(p) := p(f(p)) si p∈U, ce qui est naturellement la manière dont il faut « utiliser » ce P, et là j'ai vu que ceci n'a aucune raison d'être continu car p ne l'est pas, donc que ma démonstration se cassait la gueule.))
Quand on se rend compte d'une erreur dans une démonstration, bien sûr, la démonstration tombe à l'eau. Mais ce n'est pas pour autant qu'on a travaillé pour rien. Car beaucoup d'erreurs sont malgré tout réparables : l'argument qu'on a cru pouvoir utiliser pour aller de tel point à tel point ne marche pas, mais ça ne veut pas dire qu'on ne puisse pas aller de tel point à tel point ; et si l'idée générale, l'intuition, derrière la démonstration, est correcte, alors probablement on va pouvoir s'en sortir de manière un peu différente et il n'y aura qu'un petit détour supplémentaire à faire. En tout cas le fait d'avoir produit une fausse démonstration ne signifie pas que la conclusion est fausse[#34] ! Même si, bien sûr, ça arrive que la conclusion soit fausse, la grande majorité des erreurs qu'on trouve dans les preuves publiées dans la littérature mathématique[#35] sont aisément corrigeables, ou, en tout cas, sont corrigeables.
[#34] Il y a une œuvre célèbre d'Agatha Christie dont le ressort est le biais cognitif consistant à se dire, essentiellement, que si une preuve est révélée fausse alors cela rend notre confiance en la conclusion qui aurait été prouvée moindre que si on n'avais pas eu cette fausse preuve. Je ne dis pas son nom pour ne pas divulgâcher, mais il en a été tiré un excellent film par Billy Wilder.
[#35] Car malgré tout le soin des auteurs et des relecteurs, il en subsiste inévitablement çà et là.
Je pense que la plus grande peur[#36] du mathématicien est de se rendre compte qu'une de ses preuves est fausse (le pire étant quand l'article est déjà publié car il s'ajoute alors à l'agacement de s'être trompé et à l'anxiété de se demander si on saura réparer le problème l'embarras[#37] public que tout le monde le verra). D'où le soin qu'on met à écrire les preuves, à les relire, à demander à d'autres de bien vouloir prendre le temps de les relire, à les exposer oralement, etc., dans l'espoir de trouver les erreurs avant qu'elles soient trop embarrassantes.
[#36] Je dirais (mais ce n'est que mon opinion personnelle) qu'après la peur de se rendre compte qu'une preuve est fausse, les craintes suivantes sont de se rendre compte qu'elle est juste mais déjà bien connue, ou qu'elle est juste mais que la conclusion peut s'obtenir par un argument absolument trivial.
[#37] En vérité il ne
faut pas s'en faire une montagne, car tout le monde fait des erreurs,
même les meilleurs, et ces erreurs sont parfois fécondes en ce
qu'elles ouvrent la voie à de nouvelles découvertes. (Par exemple, la
fameuse erreur de Lebesgue
, lequel avait cru que la projection
d'un borélien de ℝ² est un borélien de ℝ, a en quelque sorte ouvert la
voie à la découverte de
la hiérarchie
analytique en théorie descriptive des ensembles.) ❧ Néanmoins, il
est vrai que l'erreur est un fait inévitablement moins bien accepté en
mathématiques que dans les sciences expérimentales : dans les sciences
expérimentales, il fait partie du fonctionnement normal de la
science que des résultats antérieurs soient corrigés par une théorie
plus précise, tandis qu'en mathématiques c'est un rappel du fait que
nous sommes humains et faillibles et que nos preuves « sociales » ne
sont pas les objets abstraits et formels étudiés par les
métamathématiques.
Il y a vraiment autant de styles de rédaction des mathématiques
qu'il y a de mathématiciens. (Et la qualité du style est bien peu
corrélée avec le talent comme trouveur-de-preuves.) Sur les arguments
eux-mêmes, certains auteurs sont extrêmement précis et ne laissent pas
le lecteur devoir deviner les étapes, tandis que d'autres laissent
toutes sortes de trous si bien que la lecture de leur démonstration
ressemble un peu à un jeu de piste ou un exercice dont on ne nous
aurait fourni que les indications. Certains n'écrivent pas la moindre
phrase qui ne soit pas parfaitement juste, d'autres écrivent des
choses truffées d'approximations qu'il s'agira de corriger. Certains
essaient de donner quelques idées de l'intuition qui sous-tend leur
preuve, d'autres se contentent d'aligner les arguments rigoureux sans
aucune explication d'où ils sortent. Certains font de belles phrases
en langue naturelle, parfois presque
poétique[#38], d'autres
privilégient les symboles et un rédaction sans originalité
essentiellement tenue par des alignements de donc
. Même pour
la forme, on a toutes sortes de variations : certains découpent leurs
arguments en petit lemmes, d'autres écrivent des preuves qui prennent
des pages. Certains ont une numérotation très systématique de tous
les items de l'article, peu importe qu'il s'agisse de théorèmes,
définitions, lemmes, corollaires, exemples ou quoi que ce soit
d'autre, voire de chaque paragraphe
(ahem), d'autres rendent leurs
articles difficiles à citer précisément parce que rien n'y est
numéroté. Certains ont un usage extrêmement pointilleux de la
typographie, d'autres utilisent, par exemple, ‘<’ et ‘>’ comme
si c'étaient les parenthèses angulaires ‘⟨’ et ‘⟩’ (argh !).
[#38] Ce qui n'est d'ailleurs pas forcément très sympa pour les lecteurs dont l'anglais (ou le français ou autre langue de l'article) n'est pas la langue maternelle !
Pourtant, il semble exister des sortes de styles nationaux en maths. Il y a de nombreuses exceptions, bien sûr, mais les maths soviétiques, par exemple, avaient tendance à présenter une rigueur très approximative (pas juste que les preuves soient très elliptiques et exigent qu'on interpole beaucoup de choses, mais les énoncés eux-mêmes ont souvent besoin d'être corrigés de diverses approximations[#39]).
[#39] Voir par exemple cette question sur MathOverflow pour un exemple précis de confusion résultant d'un traitement assez approximatifs d'énoncés combinatoires par, notamment, I. M. Gel'fand.
S'agissant de la France, on peut dire un mot pour évoquer
l'influence du
groupe Nicolas
Bourbaki. (Pour résumer, il s'agit d'un groupe de jeunes
mathématiciens francophones qui, à partir des années 1930, agacé du
manque de précision des cours de maths dispensés par l'Université, a
entrepris l'écriture de ce qui devait initialement être un cours
d'analyse de premier cycle universitaire et a rapidement débordé en un
traité couvrant de grandes parties du spectre des mathématiques,
les Éléments de mathématique, notez le singulier au
second mot.) Bourbaki, avec l'accent qu'il a mis sur la rigueur et la
généralité dans les rédactions (mais aussi sur une certaine forme
d'élégance stylistique), a certainement eu un impact important sur le
développement, mais plus encore sur le style, des
mathématiques en France et en français, même si je ne prétends pas
avoir les compétences pour en faire une histoire précise. Ce style ou
cette approche bourbachique, parfois qualifié de bourbakisme
,
est tantôt admiré (par exemple s'agissant de la manière dont
Jean-Pierre Serre écrit les maths) ou tantôt décrié (V. I. Arnol'd,
notamment, en a dit énormément de mal ;
voyez ici
si vous voulez en savoir plus sur cette polémique ; mais on peut
reprocher d'autres biais à Bourbaki, comme son mépris pour la
logique[#40], au moins jusque
vers les années 1970). Il faut néanmoins mentionner qu'il y a une
certaine confusion entre le style ou l'approche de Bourbaki et les
« mathématiques
modernes », un style d'enseignement des mathématiques mettant
l'accent sur le formalisme et les généralité, dès l'école primaire
(voire maternelle), et qui a été largement considéré comme un
échec[#41] ayant conduit à
dégoûter des générations des mathématiques ; or si les maths modernes
(dans leur version française, car ce n'est pas un phénomène
exclusivement français) ont été en partie inspirées par des
admirateurs de Bourbaki (comme André Lichnerowicz), le groupe Bourbaki
n'en est pas pour autant responsable et n'a jamais été directement
impliqué dans des choix d'enseignement par l'Éducation nationale.
[#40] Pièce à
conviction nº1 la présentation absolument lamentable de la théorie des
ensembles dans les Éléments de mathématique (visiblement
destinée à avoir juste le minimum pour pouvoir faire les parties
considérées comme intéressantes et surtout pas développer le sujet
pour lui-même). Pièce à conviction nº2, Dieudonné qui étale son
mépris pour la logique
(cf. ici,
et plus haut dans le fil pour la citation d'origine, ou
bien ce livre, page 199) : quand on vient nous
parler de la logique du premier et du deuxième ordre, de fonctions
récursives et de modèles, théories très gentilles et très belles qui
ont obtenu des résultats remarquables, nous, mathématiciens, nous ne
voyons aucune objection à ce qu'on s'en occupe, mais cela nous laisse
entièrement froids
. Pièce à conviction nº3, la réaction de
Jean-Pierre Serre à peu près à 28′04″
dans cette vidéo (au demeurant intéressante) sur
Bourbaki, où quand on lui signale que les ultrafiltres ont trouvé des
applications importantes en logique, il hausse les épaules d'un
air dédaigneux : ah oui, en logique
.
[#41] Jugement peut-être un peu catégorique. Il est permis de penser que l'erreur des maths modernes avait pu être de vouloir aller à la fois trop vite (sans impliquer suffisamment les enseignants) et trop loin, et qu'il aurait été possible de procéder à un inventaire après l'échec qui soit un peu plus fin que de considérer que c'était un désastre absolu.
☞ Fragmentation disciplinaire
Bon, j'avais encore plein de choses à raconter, mais l'écriture de ce billet commence à me fatiguer sérieusement. Mais il faut quand même que j'évoque au moins brièvement la fragmentation disciplinaire des mathématiques.
Je ne sais pas si le grand public a la moindre conscience des sous-domaines[#42] qui peuvent exister au sein des mathématiques. Mais, et c'est d'autant plus triste que la plupart des mathématiciens sont sans doute assez fermement convaincus de la profonde unité[#43][#44] des mathématiques ou, comme j'ai signalé qu'on pouvait dire pour souligner ce fait, de la mathématique, n'importe quelle branche des maths devient très rapidement opaque pour le spécialiste d'une autre branche, si bien qu'il y a un effort à faire pour rester compréhensible par quelqu'un d'un domaine même légèrement différent, et que cet effort n'est pas toujours pris au sérieux.
[#42] Une idée à ce sujet peut être fournie en consultant la classification de l'AMS : 224 pages rien que pour lister les sous-domaines des mathématiques. (Il est vrai que la plupart des mathématiciens vont maîtriser un peu plus qu'un seul item de cette liste.)
[#43] Ce que je veux
dire par unité
est que non seulement, à un niveau
philosophique, on explore le même monde platonique — le même palais —
et qu'à un niveau un peu plus pragmatique on peut rejoindre n'importe
quel bout des maths à n'importe quel autre bout par une succession de
connexions, dictionnaires ou interprétations, et, de fait, on ne cesse
de trouver des applications surprenantes d'une branche dans une
autre ; mais aussi, tout simplement, que c'est le même type de
raisonnements, la même démarche déductive (pour reprendre les mots de
Bourbaki, une certaine habitude du raisonnement mathématique et un
certain pouvoir d'abstraction
), qui sert partout, et, in
fine, on produit des théorèmes qui s'écrivent certes dans des
chapitres différents mais dans le même langage et dans le même grand
livre de la mathématique.
[#44] J'avais déjà dû
raconter ça quelque part, mais quand j'avais candidaté
au CNRS, les jurys avaient des noms (probablement pour
une raison administrative), et pour insister sur le fait que chacun
représentait la totalité des mathématiques, ils avaient reçu des noms
comme mathématiques pures et appliquées
, mathématiques
discrètes et continues
, mathématiques déterministes et
aléatoires
et encore d'autres — chacun choisi pour recouvrir
toutes les mathématiques mais selon une dichotomie différente.
Giancarlo Rota se plaignait notamment que les spécialistes de la théorie des équations aux dérivées partielles pseudo-paraboliques dans les domaines quasi-convexes ne s'abaissent pas à être compréhensibles par les spécialistes des équations aux dérivées partielles quasi-paraboliques dans les domaines pseudo-convexes. (Je précise que ces termes sont une blague, ces domaines n'existent pas, mais ils sont au moins vaguement plausibles, et ce genre de compartimentation existe.) C'est un peu exagéré, mais la tendance est réelle.
Les concepts mathématiques connus par tous les mathématiciens (ou
quasiment tous, parce qu'il ne faut jamais dire tous
) sont
probablement assez
limités[#45] : sans doute la
notion de nombre réel, de fonction continue, de groupe, de probabilité
discrète, des choses comme ça, mais pas beaucoup plus ; j'hésiterais
beaucoup plus à y mettre des choses comme une variété différentiable,
un espace de Hilbert ou un anneau intègre. Disons, plus ou moins
quelque chose comme le programme de l'Agrégation de mathématiques en
France. Je ne sais pas comment ça se compare à d'autres sciences (le
programme de l'Agrégation de physique, resp. biologie correspond-il
vaguement à un socle commun de connaissances des physiciens,
resp. biologistes, par exemple ?), mais ce qui est quand même
probablement plus prononcé en maths qu'ailleurs, c'est que ce socle
commun ne permet pas de comprendre grand-chose à un article de
recherche typique. (Même si c'est difficile de généraliser, disons
que je comprends aussi peu, voire encore moins, si je prends un
article de recherche de maths dans un domaine que je ne connais pas
que si je prends un article de recherche en chimie ou en
biologie.)
[#45] Ce que j'ai écrit dans ce billet sur la culture générale en général (pardon) s'applique tout à fait, comme je le signalais déjà dans le billet en question, à la culture générale mathématique : tout le monde a tendance à considérer que les concepts qu'il maîtrise lui-même sont basiques, évidents, et devraient être connus de tous, tandis que ceux du collègue d'une branche un peu différente des maths sont vraiment bizarres et ésotériques. (La réaction de Serre, liée quelques notes plus haut, qui semble considérer les filtres et ultrafiltres comme un concept vraiment marginal, est assez caractéristique à ce titre.) Cf. aussi ici sur MathOverflow.
Ce ne sont pas juste les définitions qui vont manquer (celles-là, on peut généralement s'arranger pour les trouver) : c'est aussi l'intuition derrière ces définitions ; ce ne sont pas les résultats majeurs (ceux-là vont être cités si l'article est bien écrit), ce sont plutôt les petits résultats considérés comme complètement évidents par les spécialistes du domaine, ou encore les techniques de preuves tellement habituelles qu'on ne se fatigue pas à les détailler[#46].
[#46] Voici un
exemple. Une preuve en géométrie algébrique pourrait commencer par la
phrase le problème étant local, on peut supposer le
schéma X affine
(peu importe ici ce qu'est un schéma ou
ce qu'affine
signifie, ce n'est pas mon propos), ou même
parfois juste — et c'est assez abusé — la deuxième partie de cette
phrase. Ce que ça veut dire est : le schéma X est la
réunion d'ouverts affines (← ça c'est un résultat basique de la
géométrie algébrique,
presque la
définition d'un schéma
[cf. aussi ici pour une tentative
d'explication de ma part], donc c'est considéré comme complètement
évident et on ne citera pas référence à ce propos, mais déjà le non
spécialiste de géométrie algébrique risque de ne pas le savoir, ou de
ne pas voir que c'est ce à quoi il est fait référence ici), et de
plus, le résultat qu'on cherche à démontrer est tel que si on le
démontre pour des ouverts qui recouvrent X alors on peut
l'en déduire pour X (← ça ça dépend du résultat visé, et ça
peut être plus ou moins évident selon la propriété dont on parle).
Beaucoup de branches des maths ont ce genre de techniques de preuve
tellement habituelles qu'on les invoque par une phrase lapidaire qui
se passe de toute autre précision.
Ce qui ne veut pas dire qu'on ne puisse pas rédiger un article
exposant certains des résultats les plus importants d'un domaine des
mathématiques à destination des spécialistes des autres domaines : ça
existe et ça s'appelle un survey (en français on
dit parfois un survol
). Il y a aussi des séminaires qui se
donnent plus ou moins ce but, comme le séminaire
Bourbaki[#47] en France. Et
bien entendu, il est toujours possible d'apprendre ce qu'il faut pour
travailler, avec plus ou moins de compétence, dans une autre branche
des maths (il y a des livres pour ça), ce sera toujours plus facile
pour quelqu'un qui est déjà mathématicien que pour le proverbial homme
de la rue, ou même, vraisemblablement, pour l'agrégé de maths de la
rue. Mais sans effort important, la grande majorité des articles de
recherche en maths sont très largement
impénétrables[#48] à la grande
majorité des chercheurs en maths : on comprend généralement
le genre de sujet dont il est question, parfois on comprend
formellement les énoncés, mais on ne saurait pas vraiment dire quoi
que ce soit sur leur contenu intuitif, et s'agissant des preuves on
n'a le plus souvent qu'une très vague idée de ce qui se passe.
[#47] Je ne sais pas s'il réussit vraiment dans ce but, cependant. Je crois comprendre que l'intention est d'être accessible à tous les mathématiciens et de permettre d'exposer des résultats récents de toutes les branches des mathématiques (avec une contrainte additionnelle qui me paraît très saine et qui devrait d'ailleurs être élargie à toutes sortes d'autres séminaires : que l'orateur ne présente jamais ses propres travaux mais ceux d'un autre), mais en pratique l'effort d'accessibilité semble très différent selon les disciplines, ou, pour dire les choses autrement, les prérequis attendus par le séminaire ne me semblent pas correspondre à ce que (disons) 95% des mathématiciens francophones connaissent : un logicien qui vient assister à un exposé de géométrie algébrique comprendra certainement moins ce qui se dit qu'un géomètre algébristes venant assister à un exposé de logique (quand il y en a, d'ailleurs).
[#48] Il est vrai que cette inaccessibilité est inégale d'un domaine à l'autre. La géométrie algébrique est réputée faire partie des domaines les plus techniquement impénétrables aux extérieurs (j'ai l'impression que ce n'est pas spécialement pire que la géométrie différentielle ou la topologie algébrique, mais peut-être que c'est ma propre formation qui me donne cette impression), tandis qu'à l'autre extrême… hum, je ne sais pas, certaines branches de la combinatoire, peut-être ? Mais une telle classification est forcément trompeuse, parce qu'il y a toutes sortes de façons d'être difficile à comprendre : il peut y avoir des constructions très techniques, mais aussi une intuition très difficile à acquérir, ce qui est différent, et les constructions techniques peuvent l'être parce qu'elles sont très sophistiquées ou juste parce qu'elles sont longues à écrire, donc finalement tout le monde aura un avis différent sur ces questions.
☞ Fin (provisoire ?)
Je vais m'arrêter là parce que je commence à fatiguer d'écrire ce billet. Il y a encore quantité de choses que j'avais imaginé évoquer, notamment tout ce qui est plus « externe » dans la recherche mathématiques : sur les séminaires et conférences, sur le processus de publication des articles, sur le recrutement des mathématiciens et la structuration du monde académique en général, sur les relations des mathématiciens entre eux (notamment sur leur consommation de café comme un prétexte pour se parler de maths), bref, sur la communauté des mathématiciens. Je me réserve le droit d'en parler dans un billet ultérieur, comme celui d'avoir la flemme de jamais écrire celui-ci.
Ajout : il y a une sorte de suite à ce billet ici sous forme d'une « autobiographie mathématique ».