La question titulaire de ce billet, suis-je un descendant direct
de Charlemagne ?
mérite sans doute quelques explications. Ce
n'est pas l'aspect personnel qui m'intéresse ici : je prends
Charlemagne comme référence non pas parce qu'il est historiquement
important mais parce qu'il est quelqu'un ayant vécu à peu près à
l'époque où la question posée est pertinente et ayant une descendance
probablement nombreuse et
documentée[#] jusqu'à ce jour,
et je prends « moi » comme instance de « essentiellement n'importe
quelle personne vivant en Europe (voire : sur Terre) actuellement »,
c'est-à-dire que la question est de savoir si nous descendons tous de
Charlemagne et plus généralement de n'importe quelle personne ayant
vécu autour de l'an 800 et ayant eu au moins un descendant
direct à l'époque actuelle.
[#] Précisément, j'ai trouvé ça sur Wikipédia : 0. Charlemagne (748–814) ➤ 1. Louis le Pieux (778–840) ➤ 2. Charles II le Chauve (823–877) ➤ 3. Judith de Flandre (c.843–c.870+) ➤ 4. Baudouin II de Flandre (c.865–918) ➤ 5. Adalolphe de Boulogne (†933) ➤ 6. Arnoul II de Boulogne (†971) ➤ 7. Arnoul III de Boulogne (†990) ➤ 8. Baudouin II de Boulogne (†c.1030) ➤ 9. Eustache Ier de Boulogne (1010–1047) ➤ 10. Eustache II de Boulogne (†c.1087) ➤ 11. Eustache III de Boulogne (c.1050–c.1125) ➤ 12. Mathilde de Boulogne (c.1130–1152) ➤ 13. Marie de Boulogne (1136–1182) ➤ 14. Mathilde de Boulogne (1170–1210) ➤ 15. Henri II de Brabant (1207–1248) ➤ 16. Henri III de Brabant (1231–1261) ➤ 17. Marie de Brabant (1254–1322) ➤ 18. Louis d'Évreux (1276–1319) ➤ 19. Philippe III de Navarre (1306–1343) ➤ 20. Charles II de Navarre (1332–1387) ➤ 21. Charles III de Navarre (1361–1425) ➤ 22. Blanche Ire de Navarre (1387–1441) ➤ 23. Éléonore de Navarre (1426–1479) ➤ 24. Gaston de Foix (1444–1470) ➤ 25. Catherine de Navarre (1468–1517) ➤ 26. Henri II de Navarre (1503–1555) ➤ 27. Jeanne d'Albret (1528–1572) ➤ 28. Henri IV de France (1553–1610) ➤ 29. Louis XIII (1601–1643) ➤ 30. Philippe d'Orléans (1640–1701) ➤ 31. Philippe d'Orléans, le Régent (1674–1723) ➤ 32. Louis d'Orléans (1703–1752) ➤ 33. Louis-Philippe d'Orléans (1725–1785) ➤ 34. Louis-Philippe d'Orléans (1747–1793) ➤ 35. Louis-Philippe Ier (1773–1850) ➤ 36. Ferdinand-Philippe d'Orléans ➤ 37. Robert d'Orléans (1840–1910) ➤ 38. Jean d'Orléans, duc de Guise (1874–1940) ➤ 39. Henri d'Orléans (1908–1999) ➤ 40. Henri d'Orléans (1933–2019) ➤ 41. Jean d'Orléans (1965–)
Je précise aussi, et c'est important, que les mots descendant
(direct) de
dans ce billet ne font pas de différence entre hommes
et femmes : on parle parfois de descendance cognatique
(ou bilatérale
) ; ceci est au contraire de ce qu'on appelle la
lignée agnatique
(ou patrilinéaire
[#2])
laquelle considère que les femmes n'existent pas : il est certain que
ni moi ni personne ne descend de Charlemagne en lignée agnatique parce
que la lignée agnatique légitime des capétiens est éteinte, et même
s'il y a évidemment plein de
bâtards[#3], la tendance des
lignés agnatiques à s'éteindre (je vais y revenir), surtout s'il n'y a
pas la pression incroyable de maintenir la continuité d'un royaume ou
d'un fief, fait qu'il est assez invraisemblable qu'il existe un
descendant agnatique direct de Charlemagne vivant à l'heure
actuelle.
[#2] J'utilise dans
tout ce billet les mots agnatique
(dans lignée
agnatique
), patrilinéaire
ou (purement) paternel
de
façon essentiellement interchangeable. Ce n'est peut-être pas
vraiment correct : pas que ces mots diffèrent par leur sens mais
plutôt par leur emploi : agnatique
semble s'utiliser en
généalogie à l'échelle individuelle (p.ex., pour une famille royale ou
noble), patrilinéaire
dans l'étude des populations. Mais bon,
je ne vais quand même pas rater l'occasion de frimer en montrant que
je connais le mot agnat
! Ce qui me gêne plus est qu'il n'y a
pas de terme symétrique pour matrilinéaire
. (Le
mot cognat
ou l'adjectif cognatique
s'utilise pour
souligner qu'on inclut les femmes, mais il n'y a évidemment rien pour
dire qu'on exclut les hommes.)
[#3] Le dernier carolingien agnatique direct documenté que je trouve en fouillant sur Wikipédia est Herbert IV de Vermandois (c.1032–c.1080) ou plutôt son fils déshérité qui n'a même pas de page Wikipédia : Herbert IV est descendant agnatique de Charlemagne sur 9 générations.
Cette question suis-je (sommes-nous tous) un descendant direct
de Charlemagne ?
m'amuse parce, que, au-delà de son côté
anecdotique, elle soulève des questions intéressantes à la fois de
mathématiques et d'histoire, et aussi, au niveau méta, d'épistémologie
(comment saurions-nous une telle chose ? quel degré de certitude
peut-on espérer ?). Mais aussi parce qu'elle suscite chez certains
des réactions assez étonnantes : beaucoup de gens réagissent à cette
affirmation comme si c'était l'idée la plus invraisemblable et
saugrenue qui soit (du style mais tu le saurais évidemment
si tu descendais de Charlemagne !
).
Je peux dire d'emblée mon opinion complètement spéculative sur cette question : il me semble assez plausible que la réponse soit positive, non seulement pour moi mais même pour une grande partie de la population mondiale actuelle, même si je dois reconnaître que je l'affirme avec beaucoup moins de certitude pour, disons, le président chinois[#4] Xí Jìnpíng, que pour un européen typique. (Mais ça me paraît quand même crédible : c'est juste qu'il y a probablement beaucoup plus de lignées dans mon arbre généalogique qui remontent à Charlemagne qu'il n'y en a dans celui de Xí Jìnpíng.) Tout ceci, cependant, n'est que spéculation de ma part s'agissant des nombres précis (essentiellement : est-ce que les 40 générations qui nous séparent de Charlemagne suffisent pour qu'il soit l'ancêtre d'une énorme proportion de la population mondiale ?) ; mais je peux donner un cadre conceptuel aux arguments qui, lui, n'est pas spéculatif, et qui a aussi l'intérêt de faire le lien avec l'épidémiologie.
[#4] Bon, je reconnais que je suis un peu trompeur en prenant cet exemple, parce que, l'Eurasie étant connexe par voie de terre, il est certainement beaucoup plus facile de trouver un ancêtre européen d'un Chinois typique ou vice versa, que pour des populations séparées par des barrières géographiques qui eurent été infranchissables.
L'argument sous sa forme la plus basique est le suivant :
Nous avons tous 2 parents, 4 grands-parents, 8 arrière-grands-parents, 16 arrière-arrière-grands-parents, et, si on remonte 40 générations pour retomber à peu près à l'époque de Charlemagne, cela donne 1 099 511 627 776 ancêtres à ce niveau — mille milliards, soit quelque chose comme 4000 fois la population mondiale de l'époque (à la louche, 250 millions). Évidemment, cela veut dire que beaucoup de lignées retombent sur la même personne (il y a eu des mariages entre cousins plus ou moins éloignés), mais, pour dire les choses autrement, si je retraçait mes 1 099 511 627 776 ancêtres potentiels à 40 générations, chaque personne vivante à l'époque s'y retrouverait en moyenne 4000 fois. Tout le monde n'y est pas (ne serait-ce que parce que beaucoup de gens sont morts sans enfants, ou sans descendance directe à quelques générations), et tout le monde ne s'y retrouve pas avec la même multiplicité, mais si le nombre moyen d'occurrences est de 4000, il est assez difficile pour une personne donnée d'y échapper sauf à ne pas, justement, avoir de descendance du tout — or il est certain que Charlemagne en a.
Cet argument n'est pas correct, parce que les lignées ne sont pas
indépendantes, elles ont tendance à rester dans un même milieu
(surtout à une époque où on se déplaçait peu — aussi bien
géographiquement que socialement), et dès lors qu'on a deux ancêtres
identiques à la génération n, ils seront communs à toutes
les générations au-dessus[#5].
Néanmoins, cet argument basique répond assez bien à l'incrédulité que
beaucoup de gens manifestent devant la proposition tu descends de
Charlemagne
: les gens oublient
facilement[#6] que les branches
d'un arbre généalogique se multiplient exponentiellement quand on
remonte dans le temps.
[#5] Mais bon, pour répondre rapidement à cette dernière objection, si on suppose que la consanguinité est assez faible pour que, en moyenne, chacun ait au moins 7 arrière-grands-parents distincts en moyenne (ce qui semble quand même raisonnable), au lieu d'avoir une croissance géométrique de raison 2 du nombre d'ancêtres, il est de raison ∛7 ≈ 1.913, et on a encore quelque chose comme 750 fois la population mondiale sur 40 générations. Autrement dit, même en supposant qu'on se marie très fréquemment entre cousins issus de germains, cela ne change vraiment pas grand-chose à l'argument.
[#6] Je veux dire que
les gens aiment bien parler de ma famille
et de ce qu'elle
faisait il y a plein d'années, en oubliant qu'ils n'ont
pas une famille mais 2n familles si on
remonte sur n générations. Si on leur demande de préciser,
ils consentent à dire s'ils parlent de la famille de leur père ou de
leur mère. Ensuite, il faut insister un peu
plus : OK, mais la famille du père de ton père ou de
la mère de ton père ? OK, mais la famille du père du
père de ton père ou de la mère du père de ton père ? OK,
mais la famille du père de la mère du père de ton père ou de la mère
de la mère du père de ton père ? (etc.)
Bref, les gens sans formation scientifique ont tendance à ne pas comprendre la croissance exponentielle.
Ça vous rappelle quelque chose, les gens ne comprennent pas les
exponentielles !
? Oui, il y a quelques années, plein de gens se
sont lamentés de ce fait. Eh bien la comparaison avec l'épidémiologie
n'est pas purement fortuite.
Imaginons que nous regardions l'histoire de l'Humanité à
l'envers (je veux dire, en faisant couler le temps en sens
inverse). J'imagine conceptuellement que je suis porteur d'une
infection (l'infection avoir David Madore dans sa descendance
)
et que cette infection se transmet (en remontant le temps, donc) à mes
deux parents, qui la transmettent eux-mêmes à leurs parents, etc.
Nous avons là un modèle épidémiologique dont le nombre de
reproduction R₀ (ou, comme j'aimais bien le noter dans mes
articles de vulgarisation à ce sujet, κ) vaut 2. (Pour
être un peu plus précis sur la comparaison, les individus sont
considérés comme « susceptibles » à partir de leur mort — je rappelle
que je joue le temps à l'envers, donc on commence par mourir —, ils
sont « infectés » à partir de la naissance d'un enfant infecté, et ils
le restent jusqu'à leur propre naissance, laquelle transmet
l'infection à leurs propres parents.)
Dès lors, si je raisonne à population constante, on peut appliquer la théorie classique de l'épidémiologie à cette situation analogique. Selon le très simple et très classique modèle SIR (que j'ai présenté dans ce billet au début de la pandémie de covid), une épidémie ayant un nombre de reproduction de 2 va toucher une proportion de la population égale à la solution de l'équation r = 1 − exp(−2·r), à savoir r = 1 + W(−2·exp(−2))/2 ≈ 80%. Ce 80%, c'est la proportion de la population qui est mon ancêtre si on remonte suffisamment dans le temps : mais « moi » n'a pas d'importance dans l'histoire — c'est simplement la proportion de la population dont la descendance ne s'est pas éteinte[#7][#8]. Si on rejoue le temps dans le sens habituel, en partant d'un de ces hypothétiques ancêtres et en allant vers les descendants, c'est la « probabilité de non-extinction d'un processus de Galton-Watson avec une descendance distribuée selon une loi de Poisson de moyenne 2 ». Cette dualité entre jouer le temps dans un sens (je pars d'une personne dans le présent, je considère comme « infectés » tous ses ancêtres, et je me demande combien de gens seront « infectés ») et dans l'autre (je pars d'une personne dans le passé, je considère comme « infectés » tous ses descendants, et je me demande quelle est la probabilité qu'il y ait des infectés au présent) est classique en épidémiologie, elle explique l'égalité entre calcul du taux d'attaque d'une épidémie et probabilité de démarrage d'une épidémie, j'avais expliqué ça dans ce billet au sujet du graphe des contacts infectieux. (Cf. aussi la discussion qui passe par ici sur Twitter.)
[#7] Ce raisonnement est fait à population constante, c'est-à-dire en supposant que chaque individu a, en moyenne, 2 descendants pour assurer une constance de la population : en réalité la proportion de la population d'il y a 40 générations qui a des descendants maintenant est plus élevée que 80% parce que la population a augmenté. Mais ce n'est pas tellement ça qui importe ici : ce que je veux surtout souligner, c'est que la proportion de la population d'il y a 40 générations qui a x comme descendant 40 générations plus tard, ou qui a y comme descendant, est la même et, si tant est que « 40 » est assez grand, ce sont les mêmes pour x que pour y, parce que ce sont juste ceux qui ont eu de la descendance.
[#8] Bon, OK, je me suis mal exprimé. Comme j'ai la flemme de réécrire les choses, j'ajoute juste une note explicative en reformulant un peu ce que je cherche à dire. Si je regarde la proportion de la population il y a n générations qui est mon ancêtre, et que je fais grandir n (i.e., je remonte dans le temps), cette proportion commence par croître exponentiellement (avec un nombre de reproduction de 2), puis elle se stabilise jusqu'à un taux d'attaque final qui, dans un modèle de population constante, est autour de 80%. Il y a deux phénomènes différents, mais équivalents, qui se produisent pour n assez grand : d'une part la stabilisation du taux d'attaque et d'autre part l'indépendance de la source (c'est-à-dire que ça ne dépend plus de la personne — « moi » — qu'on a utilisé dans le présent pour remonter à ses ancêtres : les ancêtres de x à n générations finissent par être les mêmes que les ancêtres de y à n générations) ; l'équivalence de ces deux phénomènes se voit au fait que, justement, on trouve la même valeur comme proportion atteinte en remontant en arrière à partir de « moi » ou comme probabilité de non-extinction en procédant en avant à partir d'un ancêtre putatif (donc la probabilité d'avoir « moi » comme descendant est égale à la probabilité d'avoir un descendant quelconque). Si quelqu'un trouve un moyen plus clair pour vulgariser la chose, qu'il me le fasse savoir !
Cette comparaison entre généalogie et épidémiologie n'est pas qu'intéressante conceptuellement : elle fournit également un moyen pour réfléchir aux limites de l'argument basique que j'ai présenté ci-dessus.
Je continue à jouer le temps à l'envers et à penser à « être mon ancêtre » comme une sorte d'épidémie qui se propage avec un nombre de reproduction de 2 et dont je me demande si elle va finir par infecter Charlemagne. La limitation qui fait que le nombre de personnes infectées ne double pas à chaque génération est que certaines sont déjà infectées (elles se retrouvent donc à être mon ancêtre de façon multiple, mais cela ne fait pas d'avantage progresser l'épidémie). Le modèle SIR simpliste, c'est sa principale limitation, suppose que les la population est en état de mélange parfait (c'est-à-dire que tous les contacts sont également probables), chose qui n'est évidemment pas réalisée dans la vraie vie. L'épidémie d'« être mon ancêtre » va avoir tendance à saturer des sous-populations (géographiques ou sociologiques) et se propager moins rapidement entre elles parce qu'il faut attendre une migration (sortante dans le cas d'une épidémie, donc entrante puisque j'ai inversé le temps) pour ça. Néanmoins, même si l'épidémie se propage plus lentement d'un village à l'autre (c'est-à-dire avec une constante de temps d'exponentielle plus faible entre villages qu'entre individus), elle va quand même le faire : la question n'est pas de savoir si, en remontant assez dans le temps, tout le monde ayant eu des descendants finit par être mon ancêtre, c'est juste de savoir combien de temps il faut pour ça, et si 40 générations suffisent ou s'il en faut 60, 80, 100, 200, 300, que sais-je encore.
En principe, le modèle épidémiologique devrait nous renseigner sur la cinétique de la propagation de l'épidémie (et pas juste son état final), c'est-à-dire combien de générations il faut remonter pour avoir une grande proportion de la Terre qui soit mon ancêtre. Les choses sont un peu confuses (cf. ce travail que j'avais fait sur l'impact de la distribution du temps de rétablissement dans la cinétique d'une épidémie), mais l'ordre de grandeur du nombre de générations nécessaire est, en tout cas, donné le log base 2 (parce que la constante de l'exponentielle est 2) de la population, donc une trentaine de générations. Comme expliqué au paragraphe précédent, il ne faut pas prendre ce chiffre trop au sérieux parce que la propagation va être plus lente à cause de la stratification géographique et sociale de la population, et je ne peux pas calculer combien : 30 générations est un minimum, mais ça devrait aussi être un ordre de grandeur raisonnable (ce ne sera certainement pas 600 générations).
La prédiction de 80% comme taux d'attaque final de l'épidémie, c'est-à-dire « pourcentage de la population d'il y a n générations qui est mon ancêtre lorsque n→+∞ » ne doit pas être prise très exactement non plus. Elle a été faite dans un modèle de population constante (ce qui, de toute évidence, n'est pas le cas) mais aussi, d'indépendance des naissances, c'est-à-dire que chaque individu a un nombre de descendants qui suit une loi de Poisson. Cette distribution du nombre de descendants se traduit dans l'épidémie en temps inversée comme une distribution du nombre de contacts infectieux : or j'avais expliqué à mainte reprise sur ce blog que, s'agissant des épidémies réelles, l'hétérogénéité de la susceptibilité est un paramètre essentiel pour calculer le taux d'attaque d'une épidémie (les détails mathématiques à ce sujet sont ici), et va avoir tendance à le réduire. Ce n'est pas vraiment pertinent pour le propos, cependant : dès lors qu'on sait que Charlemagne a eu de la descendance jusqu'à nos jours, plus la proportion qui a de la descendance est faible, moins grand sera le nombre de générations à attendre pour que ce soit la même population qui sera obtenue comme ancêtres de n'importe quel individu du présent.
Mais la comparaison entre cette épidémie de pensée « être mon ancêtre » en temps inversé, et les épidémies réelles, suggère quand même aussi qu'on a tort de croire les groupes sociaux trop isolés les uns des autres : le fait que la covid soit devenue une pandémie en si peu de temps est, évidemment, un reflet de notre mode de vie moderne plus que de d'une vérité historique sur l'humanité, mais on sait qu'une infection historique comme celle par Yersinia pestis a très bien réussi à se propager au monde entier (bon, la peste noire est peut-être un mauvais exemple épidémiologique parce que c'est une maladie à vecteur animal, et même à vecteurs multiples vu que les puces et les rats jouent un rôle dynamique compliqué ; mais je veux juste souligner ici qu'on aurait tort de croire l'Europe et la Chine — par exemple — comme isolées même au Moyen-Âge, et de toute évidence il y avait des voyageurs pour la transporter).
Voici un autre argument pour dire sensiblement la même chose : si on se demande si Xí Jìnpíng est descendant de Charlemagne, c'est évidemment un peu moins clair que pour un Européen, mais s'il suffit par exemple de 30 générations pour que la grande majorité des Européens soient descendants de Charlemagne (et comme 230 est encore bien supérieur à la population européenne à l'époque de Charlemagne, c'est plausible), cela nous laisse 10 générations pour trouver un Européen quelconque parmi les ancêtres de Xí Jìnpíng, i.e., pour se demander s'il y a au moins 2−10 ≈ 0.1% de la population chinoise sur les quelques derniers siècles qui a un parent européen. N'ayant aucune connaissance précise sur la démographie chinoise, je ne sais pas si c'est plausible : 40 est peut-être une valeur trop faible ici ; mais si au lieu de 40 générations on s'en donne, disons, 60 ou 80 (évidemment, il faut trouver quelqu'un d'autre pour jouer le rôle de Charlemagne, et c'est plus compliqué de proposer un nom précis[#9]), il me semble ça devient vraiment plus crédible (disons 10 générations de plus pour trouver un ancêtre quelconque en-dehors de Chine, et encore 10 pour lui trouver un ancêtre en Europe).
[#9] Question apparentée : quelle est la personne la plus reculée dans le temps dont on puisse trouver un descendant actuellement vivant complètement documenté ? (Ou disons, dont on puisse trouver un descendant documenté sur quelque chose comme 10 générations — parce que si la descendance ne s'est pas éteinte sur 10 générations, il est quasi certain qu'elle ne s'éteindra pas.)
La stratification de la population, bien sûr, n'est pas que géographique, elle est aussi sociale : là aussi, on ne peut que spéculer (enfin, moi je ne peux que spéculer) sur la constante de temps impliquée par la nécessité de franchir la barrière des classes sociales (ou socioethnique : certainement, un Juif européen contemporain a moins de chances de descendre de Charlemagne qu'un non-Juif, parce qu'on va passer un certain nombre de générations à franchir une barrière sociale qui, à certaines époques était très hermétique). Dès lors, on a affaire à un phénomène de diffusion qui pourrait être lent. Mais là aussi, la comparaison avec les épidémies réelles fait que je soupçonne fortement que les barrières sont beaucoup moins hermétiques que les gens se l'imaginent spontanément (or dès qu'une naissance franchit la barrière, la lignée se développe exponentiellement de l'autre côté de la barrière). S'agissant des classes sociales, spécifiquement, il faut se rappeler qu'une proportion pas du tout négligeable des naissances sont « socialement illégitimes » (i.e., hors mariage ou mal attribuées), ou carrément le résultat d'un viol, et en remontant en arrière dans le temps pour retrouver les ancêtres, ces filiations vont avoir tendance à attirer les branches ascendantes vers les classes dirigeantes. Bref, je parle de descendre de Charlemagne par n'importe quel lien de filiation biologique, certainement pas de descendre de Charlemagne de façon légitime.
On peut s'imaginer qu'il suffit de faire des tests génétiques pour avoir la réponse à ces questions, mais il est faux de s'imaginer (cf. cette vidéo) que nous héritons une part de notre génome de chacun de nos ancêtres : ceci est certainement vrai sur quelques générations, mais certainement pas sur plus qu'une quinzaine : je ne sais pas quelle est l'unité minimale de découpe du génome humain, mais nous n'avons que quelques dizaines de milliers de gènes, ce qui est à peu près le nombre d'ancêtres théoriques à 15 générations, donc au-delà de cette distance, certains ancêtres ne contribuent même pas un seul gène. L'étude du génome pourra renseigner à propos d'un ancêtre typique sur un grand nombre de générations, mais absolument pas à savoir si on trouve une personne donnée parmi les 1 099 511 627 776 lignées à 40 générations. (En revanche, des études en bloc sur la génétique des populations peuvent aider à savoir quelle est la dynamique de dispersion et de mélange à différents niveaux, donc les temps typiques pour se trouver un ancêtre hors du village, du pays, du continent ou de la classe sociale.) À plus forte raison, on ne peut pas utiliser la génétique du chromosome Y qui, par définition, ne concerne que la lignée agnatique (ni celle de l'ADN mitochondrial, qui concerne la lignée maternelle) : ceci donnera des informations sur un ancêtre particulier (purement paternel ou purement maternel), ce qui est très différent de rechercher parmi tous les 2n ancêtres sur n générations.
La lignée agnatique (ou, symétriquement, la lignée maternelle) ne
se comporte pas du tout comme une épidémie : chaque individu a un
seul ancêtre en lignée agnatique à n générations. Il
reste vrai même dans ce cadre-là que, si on remonte suffisamment loin
dans le temps, tout le monde vivant actuellement sur Terre aura le
même ancêtre purement paternel, tout simplement parce que les
descendances agnatiques de tous les autres se seront éteintes : au
moins en raisonnant à population constante, les descendances
agnatiques ont fortement tendance à s'éteindre (parce que si la
population est constante, chaque homme a 2 enfants en moyenne, donc 1
fils en moyenne, ce qui est juste la limite d'extinction d'un
processus de Galton-Watson) ; en population non constante, elles
peuvent ne pas s'éteindre, mais elles sont toujours juste à peine
au-dessus de la limite, et on voit d'ailleurs que même les grandes
familles royales qui avaient une pression incroyable pour produire des
héritiers mâles y parvenaient à peine. Bref, il est vrai qu'en
remontant assez loin dans le temps nous descendons tous du même
individu en lignée agnatique, celui qu'on appelle
l'Adam du
chromosome Y ou plus récent ancêtre patrilinéaire commun
(et symétriquement, pour la lignée maternelle, on parle
d'Ève
mitochondriale), mais ces individus sont estimés remonter à des
dizaines de milliers d'années, i.e., des milliers de
générations. J'insiste une fois de plus sur le fait que c'est là une
question complètement
différente[#10] de celle de la
généalogie bilatérale que j'évoque dans le reste de ce billet, à
savoir la recherche des ancêtres dans les 2n
lignées de l'arbre généalogique sur n générations.
[#10] Elle peut quand même nous éclairer à son sujet. Il y a notamment un débat intéressant autour de la descendance de Gengis Khan et de la possibilité qu'une proportion significative de l'humanité actuelle fasse partie de la descendance agnatique du chef mongol (cf. cette vidéo), spéculativement identifiée comme un haplogroupe particulier du chromosome Y. Encore une fois, la descendance agnatique n'est pas du tout la même chose que la descendance générale, mais s'il est ne serait-ce que vaguement plausible que sur la distance qui nous sépare de Gengis Khan (soit n≈25 générations) une proportion non-négligeable de l'humanité soit ses descendants agnatiques, cela suggère que sa descendance bilatérale doit être absolument colossale (prima facie, 225 fois plus nombreuse, or 33 millions de fois quelques pour cent de l'humanité ça fait… ben plein de fois tout le monde ; évidemment, c'est un calcul simpliste, mais ça suggère en tout cas que ce n'est pas la peine de remonter très loin).
Plus généralement, il y a toute une série de questions proches mais différentes (et que les non scientifiques auront peut-être tendance à confondre), du style :
Combien d'années, ou combien de générations, faut-il remonter dans le temps pour trouver une personne qui soit l'ancêtre direct de la majorité de la population mondiale actuelle ? De l'écrasante majorité[#11] ? De la totalité ? [Ça fait six questions, et d'ailleurs, les générations n'ayant pas une durée tout à fait constante, il n'est pas clair qu'on tombe sur la même personne en cherchant la plus récente en temps que la plus récente en générations.]
Combien d'années, ou combien de générations, faut-il remonter dans le temps pour que la majorité de la population de l'époque ayant eu au moins un descendant à l'heure actuelle soit l'ancêtre direct de la majorité de la population mondiale actuelle ? De l'écrasante majorité ? De la totalité ? [Ça fait encore six questions.]
Idem en remplaçant
majorité de la population de l'époque ayant eu (etc.)
parécrasante majorité de la population de l'époque ayant eu (etc.)
. [Ça fait encore six questions.]Idem avec
totalité majorité de la population de l'époque ayant eu (etc.)
. [Ça fait encore six questions.]On peut aussi inverser les quantificateurs, par exemple :
Combien d'années, ou combien de générations, faut-il remonter dans le temps pour que la majorité de la population mondiale actuelle descende de la majorité de la population de l'époque ayant eu au moins un descendant à l'heure actuelle ?
[C'est presque pareil que
Combien d'années, ou combien de générations, faut-il remonter dans le temps pour que la majorité de la population de l'époque ayant eu au moins un descendant à l'heure actuelle soit l'ancêtre direct de la majorité de la population mondiale actuelle ?
— mais pas forcément identique parce que les quantificateursmajorité de
ne commutent pas entre eux : dire qu'il existe une majorité de x tel qu'il existe une majorité de u tels que u soit l'ancêtre de x n'est pas pareil que de dire dire qu'il existe une majorité de u tel qu'il existe une majorité de x tels que u soit l'ancêtre de x.]Et puis maintenant vous reprenez toutes les questions ci-dessus qui ont un sens, mais avec
ancêtre
parancêtre agnatique
. Et encore une fois[#12] avecancêtre matrilinéaire
. (Mais certaines questions n'ont plus de sens comme ça : notamment, si vous avez trouvé un ancêtre agnatique à toute la population actuellement vivante sur n générations, c'est forcément le seul puisque chaque individu n'a qu'un seul ancêtre agnatique à n générations.)
[#11] Mettons pour
fixer les idées qu'écrasante majorité
signifie 95%.
[#12] Il y aurait sans doute aussi des questions à poser où on s'interroge sur les ancêtres par toutes les branches mais on demande combien il faut remonter pour trouver un ancêtre avec un multiplicité comparable chez tous les descendants potentiels.
J'avoue ne pas avoir été super clair sur la distinction entre ces questions (à part pour séparer le dernier point des précédents), et je n'ai même pas envie de compter exactement combien je peux en écrire, donc je ne peux pas vraiment reprocher à qui que ce soit de les confondre, mais elles sont potentiellement distinctes. Je pense cependant que toutes les questions qui ne restreignent pas la lignée à la lignée agnatique ou matrilinéaire doivent donner plus ou moins la même réponse, sauf éventuellement celles qui insistent sur la totalité (parce qu'alors il suffit qu'il y ait eu un petit clan complètement coupé du reste du monde pour repousser les énoncés sur la totalité de pas mal de générations[#13]) : comme je l'ai dit plus haut, je pense que dans tous ces cas, il s'agit de remonter de quelque part entre 30 et 300 générations, et mon pifomètre mettrait plutôt la valeur correcte à autour de 40, i.e., de l'époque de Charlemagne.
[#13] Juste
l'existence
des Sentinelles
qui, pour le coup, ne descendent très certainement pas de
Charlemagne, oblige à faire une différence entre atteindre une
grosse partie de l'humanité
et atteindre absolument tout le
monde
.
Des travaux ont bien sûr été écrits sur ces questions, de façon plus sérieuse que ce billet de blog où je ne prétends que poser les problèmes et proposer quelques pistes de réflexion. La question de l'ascendance bilatérale reste quand même, il me semble, une question moins étudiée que celles pour lesquelles on peut utiliser des marqueurs génétiques, donc notamment les lignées paternelle et maternelle ; mais il y a quelques études. Je pense notamment à ce texte dont une version un peu différente est parue comme lettre dans Nature qui a fait tourner une simulation pour tenter de situer le plus récent ancêtre commun de l'humanité. Ils arrivent à une conclusion beaucoup plus conservatrice que mon pifomètre, plaçant le plus récent ancêtre commun de toute l'humanité à environ 3000 ans dans le passé, i.e., environ 100 générations (mais je note que c'est de toute l'humanité alors que dans ce billet je parle de la grosse majorité). Malheureusement, le code de leur simulation ne semble pas disponible, donc c'est un peu difficile de savoir quelles hypothèses expliquent la lenteur de la percolation dans leur modèle, et à quel point la conclusion est sensible aux paramètres. On a vu lors de la pandémie que ce genre de simulation apportait une information finalement assez limitée sur le monde réel, mais je trouve néanmoins l'idée intéressante. Si quelqu'un veut s'amuser à refabriquer leur modèle et à répondre séparément à chacune des questions que j'énumère ci-dessus, ça pourrait être rigolo.
Ajout () : cette vidéo explique à sa façon un certain nombre des points évoqués dans ce billet.