David Madore's WebLog: Calculs de distances entre virus de la grippe

[Index of all entries / Index de toutes les entréesLatest entries / Dernières entréesXML (RSS 1.0) • Recent comments / Commentaires récents]

↓Entry #1639 [older| permalink|newer] / ↓Entrée #1639 [précédente| permalien|suivante] ↓

(mardi)

Calculs de distances entre virus de la grippe

Quand tout le monde parle de la même chose, il devient souvent d'autant plus dur d'extraire des informations vraiment pertinentes d'une masse de blabla sans intérêt. Et en l'occurrence, pour ce qui me concerne, trouver des informations factuelles et un peu geek-compatibles.

On trouve facilement, sur Wikipédia et ailleurs sur les virus de la grippe : en se rappelant qu'il y a probablement un certain nombre d'erreurs, l'essentiel doit quand même être à peu près juste : que les grippes de type A (celles qui causent vraiment du souci) sont classifiés par des numéros affectés aux différentes grandes variantes de deux protéines, l'hémagglutinine (suivant la lettre H, parmi 16 variantes connues) et la neuraminidase (suivant la lettre N, parmi 9 variantes connues). Maintenant, le geek ne se satisfait pas de ça, il veut savoir au juste en quoi les différents H1N1 (exemple choisi complètement au hasard…) diffèrent, justement. Et, s'il est juste que le vaccin contre la grippe fonctionne en sensibilisant le système immunitaire à l'hémagglutinine, on veut savoir en quoi ces différentes sous-variantes de l'hémagglutinine (à l'intérieur de la variante H1) diffèrent, parce que, tout de même, les formules de vaccins contre la grippe saisonnière usuelle incluent une composante ciblant une souche de variante H1N1 (donc on se demande s'il conférerait une immunité au moins partielle contre des autres souches de cette même variante), et aussi parce que le H1N1 est la variante de la plus célèbre de toutes les grippes, celle de 1918.

Heureusement, parmi les merveilles de l'Internet, il y a cette base de données de séquences de nucléotides qui est capable de vous cracher le contenu du génome de plein de choses, entre un humain et un virus du SIDA en passant par l'incontournable Drosophila melanogaster. En particulier, cette base contient les gènes séquencés de toutes sortes de souches de virus de grippe H1N1.

J'ai comparé les séquences des hémagglutinines de quatre exemples de virus de grippe H1N1 : celui de la grippe « espagnole » de 1918, A/Brevig_Mission/1/18(H1N1) tel qu'isolé à Brevig Mission en Alaska, celui de l'épidémie russe de 1977, A/USSR/90/77(H1N1) (peut-être l'épidémie de H1N1 la plus mortelle depuis celle de 1918), celui qui fait parler de lui en ce moment, A/California/04/2009(H1N1) (tel que séquencé en Californie, si tant est que ce soit le même qu'au Mexique), et enfin celui utilisé dans la formule de vaccin préconisée par l'OMS contre la grippe saisonnière pour les saisons 2008–2009 et 2009–2010 dans l'hémisphère nord, A/Brisbane/59/2007(H1N1). Pour les 317 acides aminés formant le peptide HA1[#], les distances sont les suivantes :

Grippe espagnole 1918Épidémie russe 1977Grippe mexicaine 2009Souche vaccin 2008
Grippe espagnole 19180565668
Épidémie russe 19775608846
Grippe mexicaine 20095688093
Souche vaccin 20086846930

En clair, au niveau de la partie HA1 de l'hémagglutinine, la grippe dont on parle actuellement dans les médias est notablement plus proche de celle de 1918 que de celle contre laquelle on vaccine. Après, est-ce significatif, je n'en sais rien (pour commencer, il est évident que les mutations sur chaque emplacement dans la molécule n'ont pas le même poids !, mais je n'ai aucun moyen de tenir compte de ça).

Mais ce qui m'énerve, c'est que ça soit à moi de faire ce genre de mesures, alors que je n'ai aucune compétence pour ça : je n'y connais rien en biologie ou en médecine — pourquoi, alors que tout le monde ne parle que de grippe, n'y a-t-il pas des vrais spécialistes de la grippe qui aient fait des commentaires publics intelligents sur la différence entre les différentes souches de H1N1 ?

[#] Pour être précis quant à ce que j'ai calculé, j'ai pris, dans la transcription des gènes en question, la sous-séquence d'acides aminées qui commence par DTXCIGY… (où X est L ou I) et qui finit par …NIPSIQS, qui devient donc HA1 ; dans la variante A/Brisbane/59/2007(H1N1) j'ai inséré un blanc après le 132e acide aminé de cette séquence pour le porter à une longueur de 317 alignée aussi bien que possible avec les autres ; et j'ai calculé le nombre d'emplacements qui diffèrent, entre chaque paire de possibles, sur cette suite d'acides aminés (+blanc). J'aurais pu utiliser la distance d'insertion-suppression-remplacement, mais elle est fastidieuse à calculer, et j'ai constaté heuristiquement (avec le programme Unix diff), sans la calculer exactement, qu'elle devait être très peu différente de la distance de Hamming que j'ai donnée.

↑Entry #1639 [older| permalink|newer] / ↑Entrée #1639 [précédente| permalien|suivante] ↑

[Index of all entries / Index de toutes les entréesLatest entries / Dernières entréesXML (RSS 1.0) • Recent comments / Commentaires récents]