Avant de parler du sujet de ce billet, je commence par une longue
digression pour revenir sur la question des données météo (ouvertes)
dont j'ai parlé récemment (si ceci
ne vous intéresse pas, sautez
directement après le
symbole ‘♠’ ci-dessous). Comme je le dit dans une mise à jour
(écrite il y a quelques jours) que j'ai ajoutée à la fin du bilet que
je viens de lier, la meilleure source de données météo ouvertes de
stations météorologiques individuelles que j'ai trouvée jusqu'à
présent est celle distribuée par
le European Climate
Assessment & Dataset (ECAD) : en allant
dans l'onglet Daily data
, on trouve des données
météorologiques à fréquence quotidienne pour toutes sortes de
variables et toutes sortes de stations météo en Europe. Voilà qui est
très bien, et exactement le genre de choses que je voulais.
Mais pas exactement non plus.
Parce qu'il y a une chose qui demeure curieuse : pour la France, on
y trouve seulement une poignée de stations, dont la plus proche de
Paris est la station d'Orly
(ici,
techniquement sur la commune d'Athis-Mons, mais on dit Orly
parce que c'est celle de l'aéroport de ce nom). Or la
station météo de référence pour Paris (peut-être pas la seule, mais
sans doute la plus ancienne), c'est celle située dans le parc
Montsouris
(ici).
Pas que je tienne spécialement à avoir les données ici plutôt que là,
mais la station de Paris-Montsouris a des relevés qui remontent au
moins à 1900, alors que celle d'Orly n'en a que depuis 1947, et comme
je voudrais avoir une série aussi longue que possible et aussi
homogène que possible, je veux celle de Montsouris. Et puis je
voudrais comprendre ce qui se passe : je trouvais bizarre que
l'ECAD ait accès aux données d'Orly mais pas de
Paris-Montsouris et encore plus bizarre parce que (comme je le disais
aussi dans l'addendum à la fin de cette
même entrée) on trouve en téléchargement
depuis cette
page Meteo-Paris.com de vieux fichiers de données qui
manifestement viennent de l'ECAD et qui sont pour la
station de Paris-Montsouris (mais ils ne vont que jusqu'à fin
septembre 2008). Quelle est cette diablerie ?
J'ai donc écrit à l'équipe du KNMI qui gère l'ECAD
pour leur demander des explications, et ils m'ont répondu que Météo
France ne leur communiquait initialement les données que pour un
nombre restreint de stations (dont celle de Paris-Montsouris), et que
les fichiers trouvables chez Meteo-Paris.com datent de cette époque,
mais qu'ils (Météo France) ont ensuite beaucoup augmenté ce nombre de
stations transmises, et en « contrepartie » ont explicitement demandé
que seul une poignée de ces stations soient marquées
comme téléchargeables
, c'est-à-dire pour lesquelles on peut
télécharger les données quotidiennes, et ce petit ensemble n'inclut
pas celle de Paris-Montsouris. Bref, l'ECAD les a, mais
on n'y a plus accès. (Et du coup, je me retrouve avec les données de
Paris-Montsouris seulement jusqu'à 2008, et celles d'Orly depuis 1947,
ce qui n'est pas mal, mais ça ne fait quand même pas une série longue
et complète.)
Tout ceci n'a aucun sens. D'abord, il est à la fois absurde, mesquin et contraire à leur mission d'information pour Météo France de restreindre l'accès à des données d'observation collectées avec l'argent du contribuable français. (En plus, c'est particulièrement mesquin de ne pas avoir mis la station de Paris-Montsouris dans la liste des stations téléchargeables alors qu'elle l'était auparavant.) Je ne sais pas pourquoi ils font ça (peut-être espèrent-ils vendre les données ? mais qui voudrait acheter des vieux relevés météo ?), je ne sais pas qui est le connard qui a pris cette décision, mais je constate qu'en Allemagne, (quasiment) toutes les stations météo sont marquées comme téléchargeables. Mais en fait, rien ne tient vraiment debout dans cette histoire, parce que plein de gens semblent quand même avoir accès à ces données de Paris-Montsouris et qui les diffusent (sous des formats peu exploitables) : Infoclimat.fr, par exemple, ou Meteociel.fr ou même un compte Twitter pour cette foutue station : d'où ces gens tirent-ils ces données, à la fin, si elles ne sont pas diffusées publiquement par Météo France ? Quelles sont leurs sources ? Quels sont leurs réseaux ? Je n'y compris rien.
De toute façon, si je comprends bien le droit d'accès aux documents administratifs (et que j'ai raison de penser que Météo France, pour l'accès aux documents administratifs est assimilé à une administration), ils ont l'obligation de communiquer ces données à qui en fait la demande (et gratuitement ; et il y a même une exigence renforcée en matière de données environnementales dont l'état de l'atmosphère fait partie), donc ne pas permettre à l'ECAD de rediffuser ces données qu'ils (Météo France) doit légalement fournir à qui les demande est simplement absurde.
J'ai vraiment envie de foutre des baffes à des gens chez Météo France, là.
Mais faute de baffes, je vais leur envoyer une demande d'accès aux
données, dont
voici un brouillon que vous êtes encouragés à relire avant que je
l'envoie, surtout si vous avez des connaissances juridiques. (Je
pense notamment au long paragraphe qui dit en creux vous êtes des
sales connards de ne pas avoir autorisé l'ECAD à
republier ces données, alors je vais vous emmerder en vous les
demandant tous les six mois jusqu'à ce que vous changiez de politique
à ce sujet
, mais j'essaie de le dire de façon un peu plus
conciliante que ce que je pense très fort : je ne sais pas si c'est
optimal pour maximiser la probabilité que j'obtienne ce que je veux.)
Il faut aussi voir s'ils peuvent m'empêcher de les rediffuser ensuite,
mais manifestement ils ne sont même pas très cohérents dans leur désir
de non-rediffusion vu qu'il y a ce compte sur Twitter (lié ci-dessus)
qui les obtient je ne sais comment et les diffuse en temps réel.
Mise à jour
() : Pour la suite de cette histoire, je
recopie un bout d'une entrée
ultérieure à laquelle je renvoie pour plus de
précisions : J'avais imaginé qu'il suffirait de faire une demande
d'accès aux documents administratifs pour les forcer à les
communiquer, parce que Météo France est un établissement public à
caractère administratif, et que le principe général est celui de la
gratuité ; mais j'ai ensuite découvert qu'ils
ont une
exception taillée sur mesure pour percevoir des redevances,
exception qui n'est d'ailleurs elle-même peut-être pas conforme à la
Loi, mais je n'ai pas les compétences légales ni les moyens juridiques
pour la contester devant les juridictions administratives, donc mon
espoir d'obtenir ces données s'arrête là. Ce qui ne m'empêche pas de
trouver complètement délirant de garder secrète la température
qu'il fait à Paris, et secondairement de m'interroger sur la
manière dont des sites
comme Infoclimat.fr
ou Meteociel.fr
les obtiennent quand même : je me demande comment ces sites amateurs
ont les moyens de payer 200 000€/an.
✱ Nouvelle mise à jour concernant les données météo : Météo France a fini par ouvrir l'accès à énormément de ses données au : voir l'annonce ici. Les données elles-même sont sur ce site.
Bref.
Bref, c'est en fouillant pour trouver ces données météo, et notamment du côté du KNMI que j'ai découvert l'existence de ce gadget fabuleux qu'est le Climate Explorer and Climate Change Atlas, qui est un site interactif permettant de calculer des cartes et des graphes (ou d'extraire des données) pour représenter le changement climatique (soit à partir d'observations soit à partir de modèles) : voir ce fil Twitter et celui-ci, mais aussi la suite de cette entrée, pour quelques exemples de ce qu'il permet de faire.
(Les cartes et graphes des tweets que je viens de lier, ainsi que ceux ci-dessous, sont tirés du modèle ERA5 du European Centre for Medium-Range Weather Forecasts, qui est une réanalyse du climat passé, c'est-à-dire qu'on fait tourner des modèles sur les observations réelles pour obtenir quelque chose de cohérent à l'échelle de la Terre entière, avec une résolution de quelque chose comme 30km en surface et 1h dans le temps, en l'occurrence depuis 1950 ou 1959 ou 1978 je n'ai pas bien compris ce qui change à ces dates. En un certain sens, c'est mieux que des observations locales, parce qu'on peut demander des valeurs n'importe où, et ce sera beaucoup moins bruité ; en revanche, c'est plus limité dans le temps, ce qui explique que je veux quand même me battre pour obtenir mes relevés à Paris-Montsouris.)
Tout ceci m'a amené à me poser la question suivante (j'en viens enfin au sujet de cette entrée) :
♠
La France et les pays voisins connaissent actuellement une sécheresse exceptionnelle en même temps qu'une série de canicules. J'entends beaucoup de gens dire que « c'est » le changement climatique, qu'« un cap » a été franchi (ou « un point de non-retour »). Mais est-ce vraiment le cas ? Autrement dit, cette sécheresse 2022 et plus généralement le caractère exceptionnel de cette année doit-elle se concevoir comme une étape de plus dans un changement climatique, ou comme une anomalie, ou comme une combinaison des deux ? D'ailleurs, est-ce vraiment une année si exceptionnelle ? J'ai voulu essayer d'y voir plus clair : je ne prétends pas avoir réussi, mais j'ai au moins fait joujou avec des graphiques.
Ce qui est sûr (et peut-être justement ce qui est dramatique, comme
dans l'histoire —
largement inventée — de la grenouille qu'on fait bouillir
progressivement) c'est que le changement climatique est quelque
chose de graduel. Malgré l'existence de points de bascule
où
le changement s'accélère si certains mécanismes de rétroaction
positive se mettent en route, il n'y a pas de discontinuité à
prévoir : il reste un phénomène graduel. (Enfin, graduel à l'échelle
de quelques années ou décennies, entendons-nous bien : à l'échelle
géologique, ça reste inimaginablement
rapide, j'avais déjà évoqué le fait
que le changement actuel est entre dix et cent fois plus rapide que
celui déjà très soudain qui s'est opéré à la frontière
paléocène-éocène.) Il peut y avoir accélération, mais il est évident
qu'il ne peut pas y avoir eu un changement climatique important entre
2021 et 2022. En même temps, tous ces phénomènes sont extrêmement
bruités : le climat, c'est une tendance à long terme à laquelle
s'additionnent des variations météo aléatoires extrêmement importantes
au niveau de l'heure, de la journée et de la saison, ce qui rend la
lecture de la tendance à long terme très difficile : il faut faire des
statistiques sur des intervalles très longs, et ce n'est pas toujours
possible (d'autant que le phénomène peut lui-même changer dans
l'intervalle).
Évidemment, un changement à long terme peut avoir rendu seulement improbable un événement qui était quasi-impossible, et probable un événement qui était improbable. (Toutefois, ces probabilités évolueront tout de même graduellement.) En outre, la distribution de n'importe quelle variable météo n'évolue pas forcément comme une simple translation : le changement à long terme peut concevablement aussi affecter la distribution, c'est-à-dire augmenter la variance ou la forme de la queue de la distribution, c'est ce que j'avais essayé de dire dans mon billet sur les événements extrêmes sans pour autant arriver à y voir clair (ni à m'exprimer clairement).
Mais on peut malgré tout essayer de séparer une tendance à long terme, dont l'expression la plus simple est une régression linéaire dans le temps sur un intervalle assez long, et des écarts par rapport à cette tendance (et se demander si l'écart 2022 est particulièrement remarquable). C'est ce que j'ai tenté de faire ci-dessous.
Rappelons en tout cas que si l'impact du changement climatique sur la température est indiscutable (et se traduit par une augmentation presque partout sur la Terre, pas à la même vitesse partout, mais l'Europe est, après l'Arctique, un des endroits qui se réchauffe le plus vite), celui sur les précipitations (et autres aspects du cycle de l'eau, comme la sécheresse) est plus complexe. J'avais mentionné dans mon entrée sur les événements extrêmes (lien précédent) le rapport du projet DRIAS pour la France métropolitaine (bâti au-dessus des modélisations du GIEC pour le monde) qui conclut pour la France à plus de pluies en hiver et plus de sécheresse en été, mais avec une incertitude considérable sur tous ces phénomènes (beaucoup plus que sur les températures), si bien qu'on ne peut même pas vraiment conclure si le total de précipitation sur l'année sera augmenté ou diminué (le modèle est plutôt favorable à une augmentation du total, mais les marges d'erreur sont énormes) ; et ces évolutions ne doivent, selon ce modèle, être vraiment sensibles qu'à l'horizon fin de siècle (voir notamment pages 60–63 du rapport). Bon, ça c'est pour les modèles : maintenant, qu'en est-il des observations ?
Pour essayer de préciser un peu les choses, et espérer à séparer tendance à long terme et anomalie de l'année, j'ai calculé les cinq graphes suivants (cliquer sur chacun pour le zoomer), qui représentent cinq variables météorologiques importantes moyennées de janvier à juillet, et que je vais à présent commenter et expliquer :
Il y a cinq graphiques, tous construits selon le même système, pour
cinq variables météorologiques. Le premier est celui de la
température moyenne de l'air au niveau du sol, le second celui du
cumul de précipitations, le troisième (très semblable) est celui de la
différence précipitation moins évaporation, le quatrième celui du
rayonnement solaire reçu au niveau du sol, et le cinquième celui de la
pression atmosphérique ramenée au niveau de la mer. (Les variables
font partie de la réanalyse ERA5, cf. plus haut, et je ne sais pas
exactement leur définition, par exemple je ne sais pas exactement ce
qui est compté comme rayonnement solaire
, par exemple.) À
chaque fois, il s'agit de moyennes prises sur la France
métropolitaine, et sur les mois de janvier à juillet (uniquement ; je
vais y revenir), pour les années représentées en abscisses.
Sur chaque graphique, la courbe brisée en marron représente les valeurs réelles observées (pour la variable en question) de 1950 à 2022. La droite médiane en tirets bleus représente la régression linéaire de ces valeurs sur cet intervalle (i.e., la droite qui approche le mieux les observations réelles). Les deux lignes en pointillés bleus de part et d'autre de cette droite de régression donnent l'intervalle d'un écart-type des écarts résiduel : c'est-à-dire concrètement que, si on fait l'hypothèse que la variable se modélise par une tendance linéaire à long terme plus un bruit gaussien, alors 68% des valeurs devraient être entre ces deux droites pointillées.
La valeur pour 2022 a été représentée par un gros point à droite, à la fois de l'observation réelle (point marron) et pour la régression (point bleu) : si on veut, le point marron est la valeur réelle de la variable pour cette année, et le point bleu est la valeur moyenne attendue selon la tendance à long terme tracée. Les valeurs de ces deux points, ainsi que l'équation de la régression sont indiquées en bas. Pour simplifier les comparaisons d'année en année, j'ai aussi tracé une droite en pointillés gris de même pente que la régression linéaire, mais passant par la valeur réelle pour 2022 (i.e., toute valeur située au-delà de cette droite en pointillés gris est « plus exceptionnelle » que 2022 pour la variable considérée).
L'idée est donc que la droite bleue donne la tendance à long terme (le changement climatique observé en moyenne sur 1950–2022), et l'écart à celle-ci permet de voir le caractère plus ou moins exceptionnel d'une année ponctuelle ; le point bleu indique ce que serait une année normale pour 2022 compte tenu du changement climatique, et le point marron indique ce qui a vraiment été observé.
Pourquoi ai-je moyenné seulement les mois de janvier à juillet ? On peut m'accuser de faire du cherry-picking de mes données, là, donc je m'explique un peu. Évidemment, je n'ai pas encore les données pour août 2022 ; j'aurais pu prendre des années allant d'août à juillet pour avoir des années complètes (et l'année d'août 2021 à juillet 2022 apparaît alors comme nettement plus normale), mais ça me semblait tout aussi discutable de regrouper la fin de l'été 2021 avec le début de l'été 2022 juste pour avoir des années complètes : on cherche à étudier un phénomène particulier qui est en cours, pas un intervalle d'un an se terminant maintenant. J'ai choisi de prendre janvier à juillet parce que j'ai vu des météorologistes le faire, et affirmer que c'est vers janvier que l'anomalie a commencé. (Et après tout, pourquoi pas : en plus de coller avec le début de l'année civile, ça regroupe deux mois d'hiver météorologique et deux mois d'été météorologique autour du printemps.) J'insiste sur le fait que tous les points de données sur ces graphiques sont, à chaque fois, de janvier à juillet, ce qui permet les comparaisons entre années (mais bien sûr, ça veut dire que s'il y a eu un mois de novembre exceptionnel une année, il n'apparaîtra nulle part).
Pour ceux qui veulent reproduire mes graphiques,
voici comment s'y prendre : aller sur
le Climate
Change Atlas, et choisir les réglages suivants dans le
formulaire : type = countries ; country = France
metropolitan ; season = jan + 7 months ; dataset = ERA5 reanalysis ;
variable ∈ {near-surface temperature, precipitation, P−E, net solar
radiation at the surface, air pressure at sealevel} ; output = time
series. Il va tracer et montrer un graphique sur l'intervalle
1979–2022, mais si on clique ensuite sur all data
en petits caractères au-dessus du graphique, on télécharge un zip
contenant un fichier de données qui, lui, remonte à 1950. Ces
fichiers zip s'appellent : time_era5_msl_France_metropolitan_mon1_ave7_dump0.txt
, time_era5_pme_France_metropolitan_mon1_ave7_dump0.txt
, time_era5_ssr_France_metropolitan_mon1_ave7_dump0.txt
, time_era5_t2m_France_metropolitan_mon1_ave7_dump0.txt
, time_era5_tp_France_metropolitan_mon1_ave7_dump0.txt
.
Une fois qu'on les a sauvegardés quelque part, on peut utiliser le
script shell (faisant appel à Gnuplot) que
j'ai mis
ici pour générer les fichiers (oui, tout ça est assez
dégueulasse). C'est Gnuplot qui fait le calcul des régressions
linéaires.
Maintenant, que faut-il en conclure ? Ce n'est pas terriblement
clair, et j'ai rerédigé à peu près douze fois ce qui suit, donc
peut-être que je devrais juste dire je n'en sais rien <U+1F937
SHRUG>
et laisser la personne qui me lit conclure d'elle-même.
Mais essayons quand même un peu.
Clairement, toutes les variables représentées ci-dessus ne sont pas au même niveau. Sur la température, il y a un changement qui se voit très nettement. La tendance observée sur l'intervalle 1950–2022 (janvier à juillet, donc) est même de 2.65° par siècle, ce qui est plus rapide que la valeur globale, mais c'est un fait connu que les terres émergées se réchauffent plus vite que le reste, et l'Europe particulièrement vite. (Voir la première carte de ce tweet ; voir aussi les graphes de ce tweet [màj : ici] pour des régressions saison par saison. Noter qu'il y a une accélération de la tendance, et sur la période 1979–2022, ma régression donne carrément 4.80° par siècle pour les mois de janvier à juillet. Mais je vais me contenter d'une régression linéaire.)
Il y a aussi une tendance à long terme significative sur l'ensoleillement (représenté ici par le rayonnement solaire reçu), de 11.3W/m²/siècle. Si je me restreins à la période 1979–2022 (voir la troisième carte du même tweet que ci-dessus), la tendance est même extrêmement forte et significative, avec 32.8W/m²/siècle. Sur la pression, les choses sont moins claires. Et sur les précipitations, il n'y a essentiellement aucune variation à long terme détectée par régression linéaire.
Une façon d'évaluer le caractère statistiquement significatif d'une une évolution à long terme représentée par une régression linéaire est de faire le rapport entre la pente de la régression linéaire et l'erreur standard σ sur cette dernière (voir sur Wikipédia pour le calcul de celle-ci) : en faisant ce calcul, je trouve une pente de 6.6σ sur la température, 0.35σ et 0.25σ sur les précipitations et la différence P−E, ainsi que 3.1σ sur le rayonnement solaire, et 2.0σ sur la pression. Il y a donc une évolution statistiquement significative de la température et du rayonnement solaire, c'est moins clair pour la pression. et on n'observe pas de changement climatique significatif sur les précipitations (de janvier à juillet, encore une fois). Ça ne veut pas dire qu'il n'y en a pas, encore moins qu'il n'y en aura pas, mais ça signifie qu'à l'heure actuelle le signal est trop bruité pour qu'on puisse conclure. (Bon, en raffinant géographiquement on peut peut-être trouver une évolution vers plus de sécheresse dans l'Est de la France : voir la deuxième carte de ce tweet.)
Maintenant que ces tendances à long terme sont dégagées, on peut chercher à juger le caractère exceptionnel du début d'année 2022 en comparant la valeur des différentes variables à la régression linéaire, i.e., en comparant les points marron et bleu de mes graphiques ; ou en cherchant combien il y a d'autres années aussi exceptionnelles par rapport à la tendance, i.e., qui dépassent de la ligne grise pointillée. Par exemple, au niveau température, le début de 2022 apparaît comme chaud, mais moins exceptionnel que celui de 1961, et autant que celui de 1990, bien que dans l'absolu il soit nettement plus chaud, mais ça c'est la tendance générale au réchauffement.
Au niveau des précipitations (telles quelles ou après soustraction de l'évaporation), comme je l'ai fait observer, de toute façon, la tendance observée depuis 1950 est essentiellement nulle (enfin, constante), donc comparer les écarts à la tendance ou les valeurs elles-mêmes ne change rien. La faiblesse des précipitations est notable, mais comparable à 2011, 2003 et 1953 et 1952, et moins importante qu'en 1976. Il est difficile de savoir quoi penser de l'ensoleillement tant la tendance générale est confuse. Finalement, c'est peut-être par la pression que l'année 2022 est la plus remarquable (la France a connu des blocages anticycloniques répétés qui ont conduit à un temps particulièrement stable), mais si on croit la régression, ça reste moins remarquable que 1990 ou 1992.
Finalement, ce n'est pas si clair ce qui rend l'année 2022 remarquable, ni si on doit vraiment la considérer comme telle. On peut aussi chercher à quantifier le caractère statistiquement exceptionnel en nombre d'écarts-types (résiduels) au-dessus de la droite de régression (i.e., le rapport entre l'écart à la droite de régression de ma droite grise pointillée et des droites bleues pointillées) : je trouve 1.4σ sur la température, 1.5σ et 1.4σ sur les précipitations et la différence P−E, ainsi que 1.7σ sur le rayonnement solaire, et 1.5σ sur la pression. Un écart-type et demi, ce n'est pas une déviation normalement considérée comme exceptionnelle (après tout, 13% des valeurs d'une loi normale soit à ≥1.5σ de distance de sa moyenne). Peut-être que ce qui rend 2022 remarquable, c'est la combinaison d'une anomalie sur chacune de ces variables, mais ce ne sont pas non plus des quantités indépendantes, donc il est difficile de chiffrer ce caractère remarquable.
Bref, il y a bien un effet de changement climatique sur la température et l'ensoleillement (et peut-être la pression), mais il est aussi vrai que cette année est aussi exceptionnelle d'une manière qui ne semble pas vraiment liée au changement climatique, et ce caractère exceptionnel n'est finalement pas statistiquement si remarquable : par rapport à la tendance à long terme, c'est quelque chose comme une année remarquable au sens décennal, mais pas au sens séculaire.
Évidemment la combinaison du réchauffement climatique, d'une année plus chaude que cette tendance (même si ce n'est pas si remarquable), d'une combinaison de hautes pressions et (du coup ? en plus ?) d'un déficit de précipitations peut expliquer une sécheresse particulièrement grave, et c'est bien un des effets du réchauffement climatique que d'aggraver des choses qui ne sont pas forcément liées à lui.
Néanmoins je pense qu'il ne faut pas laisser dire que c'est
le changement climatique : au moins, cette affirmation est à nuancer
par l'écart de cette année eu égard à ce qu'on attend pour le climat
actuel. Le problème si on laisse passer l'idée que voilà, c'est
comme ça, on a passé un cap irréversible, maintenant les étés seront
tels
ou même simplement vous voyez, vous vous moquiez des
scientifiques, voyez maintenant la preuve qu'ils avaient raison
,
c'est que cela donne une fausse image à la fois du changement
climatique et de la prévisibilité météorologique, et si les prochains
étés sont moins remarquables (et il y a de bonnes chances pour qu'ils
le soient), cela peut encourager à penser que le changement ne
continue pas, ou qu'on l'a surestimé, ou je ne sais quoi.
Mise à jour () : ce fil Twitter est intéressant et suggère que, du point de vue de la sécheresse hydrologique au moins, c'est vraiment 2022 qui est anormale et pas un effet du changement climatique.