David Madore's WebLog: Petite note technique sur la différence entre seuil d'immunité grégaire et taux d'attaque final

[Index of all entries / Index de toutes les entréesLatest entries / Dernières entréesXML (RSS 1.0) • Recent comments / Commentaires récents]

↓Entry #2664 [older| permalink|newer] / ↓Entrée #2664 [précédente| permalien|suivante] ↓

(lundi)

Petite note technique sur la différence entre seuil d'immunité grégaire et taux d'attaque final

Je veux écrire ici une petite note sur un point que je pense avoir mal expliqué par le passé, et autour duquel il existe une certaine confusion. Il s'agit du rapport entre le seuil d'immunité grégaire d'une part et le taux d'attaque final d'une épidémie d'autre part : quelle est la différence entre ces deux concepts, que penser de l'écart, ou overshoot entre ces deux quantités, et laquelle est la plus pertinente en pratique. Il faudra bien distinguer le cas du modèle théorique SIR et le cas d'une épidémie réelle (et pour faire la transition de l'un à l'autre, j'évoquerai rapidement un modèle SIR « en deux phases »).

Le seuil d'immunité grégaire (ou …collective, peut-être un meilleur terme parce qu'il évoque moins l'image déplaisante d'un troupeau, mais comme j'ai commencé avec grégaire je préfère maintenant rester dessus) est la proportion d'immuns qu'il faut atteindre dans la population pour que le nombre de reproduction effectif de l'épidémie devienne <1. Autrement dit :

  • soit on considère une épidémie naissante, c'est-à-dire qu'il n'y a que très peu d'infectés, mais pour laquelle un certain nombre d'individus sont préalablement immunisés (par exemple par un vaccin) : alors le seuil d'immunité grégaire est le nombre d'immunisés nécessaires pour que l'épidémie ne démarre pas (son nombre de reproduction est <1 donc le petit nombre d'infectés disparaît simplement) ;
  • soit on considère une épidémie déjà en cours, et dans ce cas le fait qu'on atteigne le seuil d'immunité grégaire se voit au fait que le nombre d'infectés commence à décroître, c'est-à-dire qu'il y en a de moins en moins (le nombre de reproduction est <1 donc ce nombre diminue progressivement).

Par contraste, le taux d'attaque final (qui n'a de sens qu'en considérant le cours d'une épidémie particulière) est la proportion d'individus qui seront atteints par l'épidémie pendant toute sa durée.

Même si on suppose que l'immunité est parfaitement stérilisante et dure indéfiniment (ce que je ferai pour simplifier, ce n'est pas le propos ici de discuter de ces questions), ces deux quantités sont différentes : la raison est simple, c'est que même une fois que le seuil d'immunité grégaire est atteint, le nombre d'infectés commence certes à diminuer, mais il n'est pas nul pour autant, donc il y a de l'inertie : ce nombre d'infectés en infecte un plus petit nombre, qui en infecte à son tour un encore plus petit nombre, et ainsi de suite, mais la somme de tout ça n'est pas nulle.

La différence entre ces deux quantités s'appelle l'overshoot de l'épidémie : i.e., l'overshoot est la proportion qu'elle attaque en plus du seuil d'immunité grégaire.

[Graphes des courbes de taux d'attaque et de seuil d'immunité grégaire]Dans le cas du modèle théorique (ultra-simpliste) SIR, on peut calculer explicitement ces deux quantités. Je l'ai fait dans l'entrée que j'ai écrite à ce sujet, mais je n'ai pas été clair parce que je n'avais pas la bonne terminologie (j'ai parlé de modèle extrêmement simpliste pour une description qui calcule, en fait, le seuil d'immunité grégaire, ce qui a pu augmenter la confusion), je redis donc les choses un peu autrement : en notant κ le nombre basique de reproduction (lettre que je préfère à R parce que le R de SIR a un sens différent), c'est-à-dire le nombre de reproduction pour une population immunologiquement (et sociologiquement) naïve :

  • le seuil d'immunité grégaire rherd dans le modèle SIR se calcule à partir du nombre basique de reproduction κ par la formule rherd = 1 − 1/κ (la démonstration est facile : lorsqu'une proportion s des individus est susceptible, le nombre de reproduction effectif tombe de κ à κ·s simplement parce que chaque contact possiblement infectieux a cette probabilité de donner effectivement une infection, du coup pour avoir κ·s = 1 on doit avoir s = 1/κ et cela correspond à la proportion complémentaire r = 1 − 1/κ d'immuns au final) ;
  • le taux d'attaque final r dans le modèle SIR se calcule à partir du nombre basique de reproduction κ par la formule r = 1 + W(−κ·exp(−κ))/κ où W désigne la fonction transcendante W de Lambert (j'ai déjà démontré cette formule dans mon entrée passée sur le sujet).

J'ai tracé ces deux courbes ci-contre en fonction du nombre de reproduction κ : en rouge le seuil d'immunité grégaire, et en bleu le taux d'attaque final. Rappelons en outre, pour ce qui est du comportement asymptotique que [encore une fois, tout ça je l'ai déjà dit, mais avec une terminologie qui n'était pas claire] :

  • si le nombre basique de reproduction κ est juste un peu au-delà de 1, disons 1 + h avec h>0 petit, alors le seuil d'immunité grégaire rherd vaut hh² + O(h³) tandis que le taux d'attaque final r vaut 2·h − (8/3)·h² + O(h³), donc en gros le double (ce qui se conçoit grosso modo par le fait que les deux périodes de l'épidémie sont alors symétriques, celle où elle est croissante jusqu'au seuil d'immunité grégaire, et celle d'overshoot où elle est décroissante jusqu'à tendre vers son taux d'attaque final),
  • si le nombre basique de reproduction κ est grand, alors le seuil d'immunité grégaire rherd vaut 1 − 1/κ (il n'y a rien à simplifier) tandis que le taux d'attaque final r vaut 1 − exp(−κ) − κ·exp(−2κ) + O(κ²·exp(−3κ)), qui devient vite extrêmement proche de 1.

Ça c'est la théorie, donc. Sur la base de cette théorie, certains sont enclins à dire : voyez, non seulement l'immunité grégaire demande un nombre énorme d'individus immuns, mais même quand ce nombre d'immuns est atteint, l'épidémie ne s'arrête pas net, elle continue de progresser, elle overshoote ce point d'immunité grégaire, et finit par infecter presque tout le monde ! <insérer ici le refrain habituel sur le fait que l'immunité grégaire c'est horrible et inatteignable et ne marche pas etc.>.

Dans le modèle théorique SIR, certes, il y a un écart important, mais en fait, maintenant que j'ai expliqué la différence, il faut que j'explique aussi pourquoi, en fait, la différence n'est pas tellement pertinente, pourquoi le seuil d'immunité grégaire est la quantité qui importe vraiment et pourquoi généralement on doit s'attendre à ce qu'il n'y ait pas d'overshoot épidémique mais peut-être même un undershoot qui se manifeste par de multiples vagues épidémiques.

(Tout ça pose vraiment un problème pour la présentation. Je suis parfaitement conscient de la différence entre les deux concepts puisque j'ai déjà tracé ces courbes en mars à part que je n'étais pas clair sur la terminologie ; mais comme je pense qu'elle n'est généralement pas pertinente dans la pratique j'ai tendance à la glisser sous le tapis, et il y a toujours quelqu'un pour me le faire remarquer, parfois de façon fort peu agréable. La présente entrée est destinée à pouvoir servir de lien la prochaine fois qu'on me dira ça.)

Le modèle SIR basique suppose toutes sortes de choses : pas seulement que la population est homogène, mais aussi que son comportement n'est pas modifié par l'épidémie, elle continue à avoir le même nombre de contacts quel que soit le statut infectieux des individus en son sein — une hypothèse qui fait peut-être sens pour une épizootie ou une maladie extrêmement bénigne, mais certainement pas pour quelque chose comme la covid. Ce qui se passe dans une épidémie réelle, c'est que les individus changent leur comportement pendant les pics épidémiques, ils ont moins de contacts et, de facto, ils « aplatissent la courbe » : et ce, même quand il n'y a pas de décision dans ce sens venant d'en haut (i.e., par les pouvoirs publics : confinement ou autres règles préventives strictes). Ces modifications de comportement sont plus ou moins durables, et c'est évidemment la question à un trillion de zorkmids de décider dans quelle mesure la chute du nombre de reproduction de la covid est due à telle ou telle part d'immunité, telle ou telle part de changement de comportement (moins de contacts, port du masque, etc.), telle ou telle part de facteurs externes (saisonnalité notamment).

Or ce changement temporaire de comportement, bien qu'il ne change pas le seuil d'immunité grégaire (il sera toujours impossible de stabiliser durablement l'épidémie avec moins de rherd(κ) = 1 − 1/κ immuns), conduit en revanche à une diminution du taux d'attaque (i.e., de l'overshoot) qui peut être drastique. Pour expliquer ce fait un peu en détails, je vais prendre un modèle SIR en deux phases temporelles (une phase « supprimée » puis une phase basale) :

Je suppose une population qui commence à être infectée par une maladie dont le nombre de reproduction dans l'état épidémiologiquement et sociologiquement naïf vaut κ (nombre de reproduction de base, donc). Maintenant, quelque part après le début de l'épidémie (le moment exact n'est pas important pour l'analyse qui va suivre, je laisse en exercice de déterminer jusque quel point ça peut être), la population prend conscience de l'épidémie et change temporairement son comportement pour réduire ses contacts (phase « supprimée »). Ceci diminue le nombre de reproduction à une valeur κ′<κ (non comptée la part d'immunité mais comptés les changements comportementaux que je viens de dire). Dans cette première phase « supprimée », l'épidémie va donc se stabiliser sur le taux d'attaque, appelons-le r′, attendu pour le nombre de reproduction κ′ (taux d'attaque intermédiaire). Dans une seconde phase, les comportements reviennent à leur état basal, donc on revient au nombre de reproduction κ (moins l'immunité déjà acquise lors de la première phase, c'est-à-dire en fait κ·(1−r′)), ce qui peut causer une seconde vague épidémique. Je veux montrer que ce phénomène en deux phases diminue l'overshoot (sans altérer le seuil d'immunité grégaire). Pour être plus précis : dans le cadre du modèle SIR où on aurait ainsi une première phase avec nombre de reproduction κ′ puis une seconde avec κ :

  • si le taux d'attaque intermédiaire r′ := r(κ′) pour la première phase (à nombre de reproduction κ′) dépasse le seuil d'immunité grégaire rherd(κ) = 1 − 1/κ pour le nombre de reproduction κ, alors on a un overshoot, mais il est diminué (par rapport à la situation basique) du fait que κ′<κ (on a rherd(κ) < r(κ′) < r(κ)), et l'épidémie ne redémarre pas dans la seconde phase où comportements reviennent au mode basal (puisqu'on a déjà dépassé le seuil d'immunité grégaire) ;
  • si le taux d'attaque intermédiaire r′ := r(κ′) pour la première phase (à nombre de reproduction κ′) est en-deçà du seuil d'immunité grégaire rherd(κ) = 1 − 1/κ pour le nombre de reproduction κ, alors on a un « undershoot » (temporaire) : l'épidémie repart (i.e., fait une seconde vague) dans la phase où le comportement repasse au mode basal κ, mais comme on a déjà une proportion r′ d'immuns, le nombre de reproduction effectif au début de cette seconde phase vaut κ·(1−r′) (strictement supérieur à 1 par hypothèse, mais néanmoins strictement inférieur à κ), et on arrive à un taux d'attaque final de r′ + (1−r′) · r(κ·(1−r′)) (le premier terme est le nombre d'infectés pendant la première phase, le second est le nombre d'infectés pendant la seconde) : pour se convaincre qu'il est strictement inférieur à r := r(κ) il suffit d'observer que c'est le taux d'attaque d'un modèle SIR où, au moment où le nombre total d'infectés+rétablis atteint la valeur r′ on transformerait magiquement tous les infectés (sauf un nombre infinitésimal) en rétablis, or manifestement cette opération ne peut que diminuer le taux d'attaque, d'où un overshoot plus petit ;
  • enfin, si le taux d'attaque intermédiaire r′ := r(κ′) pour la première phase (à nombre de reproduction κ′) est exactement égal au seuil d'immunité grégaire rherd(κ) = 1 − 1/κ pour le nombre de reproduction κ, alors on n'a ni overshoot ni seconde vague épidémique, il ne se passe rien dans la seconde phase, c'est la situation « idéale ».

[Graphe du taux d'attaque du modèle en deux phases en fonction de κ′]J'ai tracé ci-contre le taux d'attaque, explicité ci-dessus, qu'on obtient avec ce modèle en deux phases, en fonction du nombre de reproduction κ′ de la première phase : à droite du point anguleux on a le cas d'overshoot (la suppression épidémique de κ à κ′ est insuffisante pour éviter l'overshoot, mais elle le diminue), à gauche du point anguleux on a le cas avec deux vagues épidémiques (la ligne en pointillés montre le taux d'attaque r(κ′) pour la première vague), et le point anguleux correspond au κ′ « idéal » pour lequel on n'a ni overshoot ni undershoot ; la hauteur par rapport à ce point anguleux est l'overshoot, les cas extrêmes au bord du graphe sont l'overshoot maximal qu'on obtient soit (à droite) quand il n'y a aucun aplatissement de la courbe soit (à gauche) quand il y a suppression complète dans un premier temps ce qui ne fait que retarder la vague.

[Graphe du nombre de reproduction donnant la suppression « idéale »]J'ai par ailleurs tracé, en-dessous, la courbe donnant le κ′ de suppression « idéale » (à savoir log(κ)/(1−1/κ)) en fonction du nombre de reproduction κ de base, celle qui évite à la fois un overshoot et (un undershoot, donc) une seconde vague épidémique. À titre d'exemple, pour κ=2.5, on devrait viser κ′≈1.2 et laisser complètement filer l'épidémie avec ce nombre de reproduction-là, de façon à atteindre l'immunité grégaire de κ=2.5 sans overshoot.

Évidemment, c'était là un modèle très simpliste, mais on voit l'idée : ⓐ la suppression épidémique diminue l'overshoot (phénomène dynamique) et peut le faire totalement disparaître, en revanche, l'immunité grégaire (phénomène d'équilibre) ne peut pas être modifié par des mesures temporaires, et ⓑ l'apparition d'une rebond épidémique trahit le fait qu'on n'a pas eu d'overshoot. Un modèle plus complexe en trois phases ou plus, ou, mieux, où la réaction à l'épidémie varierait de façon continue avec le nombre d'infectés, pourrait supprimer encore plus l'overshoot, et il est sans doute assez facile de le faire disparaître complètement (en tout cas plus facilement qu'avec un système à deux phases où il faut viser pile le κ′ « idéal »).

Dans une épidémie réelle, je pense que le phénomène d'overshoot est une fausse inquiétude : un overshoot significatif se traduirait par le fait qu'on a largement dépassé le seuil d'immunité grégaire, donc l'agent infectieux disparaîtrait de la planète — ce genre de choses ne s'observe pas du tout, au contraire, on a plutôt tendance (même en l'absence de mesures brutales comme un confinement) à avoir des rebonds plus ou moins importants, qui montrent qu'on est encore en-dessous du seuil d'immunité grégaire. Il est donc pertinent de baser les calculs sur le seuil d'immunité grégaire, qui est robuste aux changements de la dynamique de l'épidémie, plutôt que sur le taux d'attaque final prédit par le modèle SIR, qui dépend crucialement de cette dynamique.

(Par ailleurs, aussi bien le taux d'attaque que le seuil d'immunité grégaire doivent être abaissés, même s'il est très difficile de préciser combien, par les phénomènes d'hétérogénéité dont j'ai parlé dans différentes notes passées comme celle-ci, ne serait-ce que la très simple hétérogénéité ville-campagne qui fait qu'on observe principalement le nombre de reproduction des villes mais qu'en l'extrapolant à la population du pays tout entier on est forcément pessimiste. Ce qui m'embête, malheureusement, c'est que les modèles de graphes aléatoires que j'ai présentés dans ce billet, ne fournissent aucun moyen de faire des calculs de seuils d'immunité grégaire, uniquement des calculs de taux d'attaque.)

Addendum : Il y a néanmoins des circonstances où je m'attends quand même à avoir un important overshoot. Une de ces circonstances est un bateau, où non seulement le nombre de reproduction sera important, mais il y aura peu de moyen de modifier les comportements puisqu'un bateau impose des contraintes assez étroites sur les contacts. Un cas particulièrement extrême serait, disons, un bateau militaire : les marins sur un tel bateau sont très peu libres de leurs mouvements, et je m'attends donc à ce que l'épidémie se passe presque idéalement selon le modèle SIR, avec un overshoot important (surtout que le nombre de reproduction sera lui-même beaucoup plus élevé que dans des conditions « normales » à cause de l'entassement à bord). Par exemple, je m'attends à un taux d'attaque de 98% pour R=4. Si, sur un tel bateau, il y avait strictement moins que 95% de marins qui étaient infectés par l'épidémie, je prendrais ça pour un signe à explorer du fait que la proportion restante est peut-être, en fait, non susceptible. Il y a sans doute d'autre explications possibles, mais en tout cas un taux d'attaque extrêmement élevé dans de telles circonstances est attendu et n'est pas du tout le signe que l'immunité grégaire ne fonctionne pas ou n'est pas abaissée par tel ou tel phénomène dans des circonstances plus normales. Si quelqu'un devait affirmer, disons, qu'un taux d'attaque de 70% dans de telles circonstances serait le signe qu'il n'y a pas d'immunité préexistante parce qu'on a dépassé le seuil d'immunité grégaire, je me dirais que ce quelqu'un est vraiment incompétent en épidémiologie ou est profondément de mauvaise foi. Ah zut.

↑Entry #2664 [older| permalink|newer] / ↑Entrée #2664 [précédente| permalien|suivante] ↑

[Index of all entries / Index de toutes les entréesLatest entries / Dernières entréesXML (RSS 1.0) • Recent comments / Commentaires récents]