*Comparaison de signatures ADN-mt

L’ADN mitochondrial (ADN-Mt) est transmis par la lignée des mères.

Deux signatures ADN-mt sont comparées dans le but de savoir si elles descendent d’une même matriarche. Dans l’affirmative, il peut alors s’avérer utile de documenter l’une ou l’autre des lignées des mères si ce travail n’a pas été fait et de tenter d’identifier une ancêtre commune la plus rapprochée (ACPR).

Cette comparaison de signatures ADN-mt pourra aussi servir à vérifier un lien de descendance utérin entre, par ex. une mère et un fils ou fille et répondre à des énigmes familiales. Une autre application consistera à valider d’une seule traite toute une lignée de mères dans une généalogie. Dans ce dernier cas on procèdera par triangulation.

Voici quelques principes à suivre lorsque l’on procède à la comparaison de deux signatures ADN-mt.

  1. Utiliser le même système de référence pour les deux signatures à comparer.
    C’est une erreur souvent commise que d’utiliser le mode rCRS dans un cas et RSRS dans l’autre cas. Les mutations ADN-mt peuvent être exprimées comme des différences depuis le référent rCRS ou depuis le référent RSRS. Bien s’assurer que les signatures à comparer reposent sur le même système de référence. Par défaut, dans nos pages personnelles, FTDNA exprime nos mutations en mode RSRS. PhyloTree.org présente la taxonomie dans les deux modes.
  2. Avoir recours à la notation explicite.
    Utiliser autant que possible la notation explicite qui est préfixée et suffixée. Ainsi A263G au lieu de 263G ou 263. Cette notation permet de plus facilement identifier les transversions qui sont des mutations plus rares, pouvant donc jouer un rôle idiosyncratique plus fort que les simples transitions/substitutions.
  3. Comparer des signatures FMS.
    Pour un travail définitif, il est important de comparer des signatures venant d’un mtFull mitochondrial sequencing ou FMS. Ce test couvre les 16,569 paires de bases de la mitochondrie, réparties en région de contrôle (avec ses régions hypervariables 1 HVR1 et 2 HVR2) et en région d’encodage (CR). Les mutations des régions hypervariables des signatures peuvent être comparées entre elles mais le résultat ne pourra qu’être provisoire et indicatif. Il faudra éventuellement obtenir les mutations contenues dans la région d’encodage en refaisant séquencer entièrement le génome mitochondrial par un test FMS.
  4. Comparer les résultats d’une même compagnie, testés à la même époque.
    Comparer des signatures récentes produites par une même compagnie de séquençage. Il existe en effet des différences entre les compagnies en ce qui regarde les techniques d’identification des mutations, de même qu’eb ce qui regarde les paires de base comprises dans les régions hypervariables testées. Les techniques de séquençage ont aussi évoluées rapidement depuis les années 2000, de telle sorte que les résultats dégagés il y a 10 ans pour une signature ne sont pas nécessairement les mêmes cette année.
  5. Ne pas comparer le résultat d’un séquençage FMS avec celui d’un sondage.
    Les résultats de comparaisons entre d’une part une signature FMS (FTDNA) et d’autre part une signature résultant d’un lancement de sondes (par ex. Geno2, 23andMe) peuvent être utiles mais ne peuvent qu’être indicatifs et suggestifs. Le lancement de sondes ne se substitue pas à un séquençage complet. Il sert à établir l’haplogroupe et le sousclade d’ordre 1 et parfois d’ordre 2 de manière systématique mais en minimisant le nombre de sondes utlisées. Uniquement les mutations qui correspondent à des sondes sont donc décelables. Pour déterminer la présence de toutes les mutations, un test FMS s’avère essentiel.
  6. Aligner les mutations des signatures.
    Prendre la peine d’aligner les mutations des signatures à comparer. Cela peut se faire grâce à un chiffrier Excel. Le nombre de mutations d’une signature est moins élevé en mode rCRS pour une d’origine européenne. Les signatures rCRS sont donc plus faciles à comparer. L’alignement permet de reconnaître visuellement les différences, les incohérences et les erreurs.
  7. Ignorer les mutations insignifiantes.
    Les mutations suivantes peuvent être ignorées lors d’une comparaison: 309.1C, 309.2C, 315.1C; les insertions ou délétions de A ou C aux positions 515 à 522; 16182C, 16183C; l’insertion de C et la répétion d’insertion à 16193; 16519C. Ces mutations ne sont pas utilisées par la taxonomie à PhyloTree.org
  8. Parmi les mutations restantes, identifier celles qui servent au classement taxonomique et celles qui sont excédentaires. Pour ce faire, référer à la classification PhyloTree.org et dresser le sentier des mutations qui conduisent à l’haplogroupe partagé par les deux signatures. Une mutation qui fait partie du sentier de classement et qui est présente dans l’une des signatures mais absente dans l’autre représente une mutation moins importante qu’une nouvelle mutation hors sentier.
  9. Tenir compte de l’hétéroplasmie. Il faut toujours considérer la présence d’hétéroplasmie. Les compagnies qui pratiquent les tests ne la détectent pas toujours dans un même prélèvement. Lorsque l’hétéroplasmie est détectée, elle est notée à l’aide de symboles listés dans le tableau suivant.

    Tableau 1. Liste des symboles servant à noter les types d’hétéroplasmie et les bases impliquées dans chacun des cas.
    heteroplasmytable

    Si l’une ou l’autre des signatures à comparer présente une mutation suffixée par un Y, M, R, W, H … c’est que la compagnie de test a détecté la présence de bases différentes pour un même locus d’ADN-mt chez au moins 25% des mitochondries du porteur qui ont été analysées.
    Ainsi T16093Y signifie que certaines mitochondries possédaient le locus 16093 conforme au référent (T16093T) alors que pour d’autres le locus 16093 était muté par rapport au référent.  Or, c’est parfois aussi en comparant plusieurs signatures des allégués descendants utérins d’une même matriarche que l’on constate de l’hétéroplasmie chez certains des descendants et non chez d’autres. Il faut tenir compte de l’hétéroplasmie au moment des comparaisons. C’est une tâche assez complexe. Ainsi, une signature hétéroplasmique peut concorder parfaitement avec une autre signature qui l’est aussi à la même position. Or, si l’on fait abstraction de la position hétéroplasmique, la signature hétéroplasmique concorde aussi parfaitement avec celle qui ne présente pas de signes d’hétéroplasmie à cette même position. Je donnerai un exemple du traitement plus loin.

  10. Garder en tête qu’une mutation est un accident aléatoire qui peut se produire n’importe quand. Lors d’une transmission générationnelle de l’ADN-mt, toutes les mutations sont transmises intégralement mais il peut se produire accidentellement une ou plusieurs mutations. Une mutation prend la forme d’un changement de base s’écartant ainsi du système de référence ou, au contraire, consister en un retour d’une base vers la valeur trouvée chez le référent, annulant ainsi une mutation. On parle alors de réversion. Un retour à la valeur du référent compte pour une mutation dans le système classificatoire.

Voyons maintenant les résultats de la comparaison elle-même. On établit la différence entre les deux signatures à comparer et dénombre les différences. Ne pas tenir compte des mutations insignifiantes déjà mentionnées. Déterminer si la présence d’hétéroplasmie a été détectée dans l’une ou l’autre des signatures. Si aucun symbole signalant de l’hétéroplasmie n’a été utilisé dans la notation par la compagnie de test, examiner les signatures dans les bases-de-données qui sont du même haplogroupe et qui revendiquent descendre de la même matriarche. Si aucune hétéroplasmie n’est inférable à partir de ces cas, assumer qu’il n’y a pas d’hétéroplasmie de présente.

  1. Aucune différence n’est détectée entre les deux signatures FMS.
    Il s’agit d’une concordance parfaite qui implique l’appartenance au même haplogroupe (et sousclade), de même que le partage d’un ancêtre commun. Impossible de savoir exactement quand cette matriarche a vécu.  Elle a peut-être vécu il y a quelques générations à peine ou au contraire il y a fort longtemps, jusqu’à 25,000 ans passés, voire davantage. Comment le savoir? C’est la recherche documentaire qui fournira une réponse. Il s’agit donc de documenter très rigoureusement les lignées des mères des deux signatures concordantes jusqu’à la première arrivante qui, très souvent pour les Laurentiens et leurs descendants aux États-Unis, fonda notre lignée utérine en sol d’Amérique. La fondatrice de notre lignée utérine ou l’une de ses filles pourra s’avérer être l’ancêtre à l’intersection des matrilignages respectifs des porteurs dont les signatures concordent. La découverte d’un ancêtre commun le plus récent (ACPR, MRCA pour Most Recent Common Ancestor en anglais) de deux personnes dont les signatures concordent parfaitement permet de trianguler validement la signature de cet ACPR. En effet, la probabilité est extrêmement grande que la signature que les deux porteurs partagent en commun soit celle de cet ACPR, signature transmise de génération de mère en génération de mère jusqu’à chacun des porteurs testés pour son ADN-mt. De plus, la probabilité que leurs lignées des mères respectives soient valides,  i.e. soient conformes à la réalité biologique, est extrêmement grande.
  2. Une différence de 1 ou 2.
    Vérifier s’il ne s’agit pas d’un cas d’hétéroplasmie.
    Le Tableau 2 présente un cas d’hétéroplasmie chez les descendants utérins de Jeanne THERRIAULT, fille de Perrine RAU.

    Tableau 2. Mutations en HVR1 et HVR2 de descendants utérins de Jeanne THERRIAULT fille de Perrine RAU.mtDNARAUperrine

    Pour les deux premiers cas, 250272 et N109286, FTDNA n’a pas détecté d’hétéroplasmie au locus 16093. Une mutation de type transition T16093C a été rapportée pour le cas 250272 mais aucune mutation pour N109286.  L’examen d’autres cas de descendance utérine alléguée sur le plan documentaire depuis la matriarche Perrine RAU révèle la présence d’hétéroplasmie à T16093Y, c’est à dire la présence chez les mêmes porteurs à la fois de mitochndries conformes au référent rCRS ou RSRS (T16093T) et d’autres qui sont T16093C.  Évidemment, les cas illustrés au Tableau 2 présentent des différences, sauf les deux derniers entre eux. Or, c’est le fait que nous sachions que leurs porteurs descendent tous de la même ancêtre qui nous permet de les utiliser, par exemple dans le cadre d’une triangulation. Ces différences s’expliquent par de l’hétéroplasmie, détectée dans certains cas et non dans d’autres.Or, sans cette connaissance à propos de la matriarche utérine avérée au documentaire, ces haplotypes devraient être déclarés d’origines récentes différentes ou dans le doute.

  3. Une différence >2.
    Les cas qui présentent une différence de plus de deux mutations doivent nous laisser dans l’incertitude même si les signatures appartiennent au même haplogroupe et sousclade à la lumière de la taxonomie courante. Pour acquérir la conviction que ces cas descendent malgré tout d’une même ancêtre utérine qui a vécu relativement récemment, il faut en fournir des évidences documentaires. Bien vérifier si les résultats des tests sont de la même époque et ont été réalisés par la même compagnie et par les mêmes techniques. S’il y a des doutes à ce niveau, commander à nouveau des tests FMS.
    Il y a toujours des exceptions qui nous font réaliser que les mutations sont des événements aléatoires.