*Vérification du classement d’une signature ADN-mt

Vous venez de recevoir vos résultats d’un test ADN-mt. La compagnie FTDNA qui a procédé aux analyses indique que votre ADN-mt appartient à un haplogroupe donné. Vous aimeriez vérifier si le classement fait par FTDNA de votre ADN-mt est le bon en comparant les mutations trouvées dans votre signature à celles qui sont requises par la classification officielle la plus récente de l’ADN mitochondrial humain qui se trouve à www.PhyloTree.org Au moment d’écrire la présente rubrique, la version 16 datée du 18 février 2014 était la plus récente.

Pour trouver la section de la taxonomie appropriée, il faut visiter le site de PhyloTree.org et ouvrir la classification. La Figure 1 devrait apparaître sur votre écran.

gadn005pic1

Figure 1. Écran d’arrivée à PhyloTree.org. Ossature de la classification de l’ADN mitochondrial humain.

Cette figure représente graphiquement la structure générale ou l’ossature de la classification ADN-mt chez l’humain. Il s’agit d’un arbre inversé. Tout au haut se trouve le tronc mt-MRCA pour, en anglais, mitochondrial (mt) Most Recent Common Ancestor. Ce concept MRCA est traduit en français par ACPR pour représenter les premières lettres des mots de l’expression, *Ancêtre Commun le Plus Récent*. Il s’agit en fait de la classe d’êtres humains féminins la plus ancienne, formant le premier haplogroupe tronc, regroupant nos tout premiers ancêtres. De cet haplogroupe initial s’est différencié l’haplogroupe L0 comme une première branche. La différenciation s’est faite par l’accumulation de plusieurs mutations. Puis l’haplogroupe L1 s’est différencié à son tour de L0 par de nouvelles mutations. Puis ce fut le tour de l’haplogroupe L5, et ainsi de suite comme l’illustre la Figure 1. La séquence de différenciations, chacune représentée par le signe de dérivation >, se serait donc produite en Afrique selon la théorie reçue et serait la suivante: Ève mitochondriale > L0 > L1 > L5 > L2 > L6 > L4 > L3.
Des femmes appartenant à l’haplogroupe L3 furent les premières à sortir d’Afrique. On estime que cela s’est produit il y a environ 60-80,000 ans. Tel que l’illustre la Figure 1, les autres haplogroupes humains dériveraient tous de l’haplogroupe ancestral L3. L’haplogroupe H le plus commun chez les européens est dans la dérivation L3 > N > R > R0 > H. L’haplogroupe H7a1a, concerné par le prochain exemple, constitue un sousclade dérivé de l’haplogroupe H, d’où le sentier phylogénétique complet suivant pour ce sousclade:
Ève ADN-mt > L0 > L1 > L5 > L2 > L6 > L4 > L3 > N > R > R0 > H > H7 > H7a > H7a1 > H7a1a.

Mutations banales.
Il est important de savoir que toutes les mutations rencontrées dans une signatures ne sont pas significatives. En premier lieu, il s’en trouve qui ne servent pas encore dans le classement d’un ADN-mt. Deuxièmement, il en existe qui sont inconstantes et varient trop pour que la taxonomie puisse les utiliser lors d’un classement.
Les mutations banales connues et non utilisées dans la taxonomie à ce jour sont les suivantes:
309.1C(C), 315.1C, les INDELS A ou C entre 515 et 522, 16182C, 16183C, 16193.1C ou 16193.2C et 16519.

Il faut donc faire abstraction des différences que ces mutations peuvent générer lorsque l’on compare deux signatures.

Exemple 1. Haplogroupe H7a1a
Pour examiner la structure de H7 il faut choisir et cliquer l’hyperlien R0 dans la page d’arrivée à PhyloTree.org Une fois dans cette page, cherchons H7 (Sous WS: faire CTRL-F ou encore sous MacOS X: Cmd-F et entrer H7 dans la fenêtre de recherche). Notre fureteur (IE ou Chrome ou Safari) nous montre alors la section de la taxonomie qui concerne l’haplogroupe H7, tel qu’illustré à la Figure 2.
Le travail de vérification peut commencer. Voici les mutations RSRS, placées en ordre numérique, que FTDNA a identifiées dans un ADN-mt par une séquençage complet (test FMS):
G73A, A93G, C146T, C152T, C195T, A247G, 315.1C, A769G, A825t, A1018G, G1719A, G2706A, A2758G, C2885T, T3594C, C3613T, G4104A, T4312C, A4793G, G5417A, T7028C, G7146A, T7256C, A7521G, T8022C, T8468C, T8655C, G8701A, C9540T, G10398A, T10664C, A10688G, C10810T, C10873T, C10915T, G11016A, A11167G, A11719G, A11914G, T12705C, G13105A, G13276A, T13506C, T13650C, T13896C, T14766C, A16129G, T16187C, C16189T, T16223C, G16230A, C16261T, T16278C, T16304C, C16311T

La tâche consiste à parcourir la section de l’haplogroupe H7 à PhyloTree.org et à vérifier si le sentier de mutations révélé par la taxonomie se trouve reproduit parmi la liste des mutations de la signature étudiée. Sur cette figure, les mutations présentes dans la signature et qui servent de critère d’entrée dans un sousclade sont signalées par la présence d’un point rouge. Ainsi, la présence de la mutation A4793G conditionne l’entrée en H7. Cette mutation est présente dans la signature à classer. Il faut ensuite vérifier la présence d’une des clés du niveau hiérarchique suivant plus en aval. La mutation G1719A est présente et elle permet d’entrer dans le sousclade H7a. Au niveau hiérarchique suivant, C16261T ouvre sur le sousclade H7a1. Puis, les deux mutations A93G et A11167G servent de critères pour entrer dans le sousclade H7a1a. La signature appartient donc à l’haplogroupe H7a1a. Le sentier de mutations pour H7a1a, partant de son inclusion en H7 est donc : A4793G > G1719A > C16261T > A93G > A11167G.
Un sentier de mutations est une structure phylogénétique. Les mutations s’y trouvent dans un ordre particulier, un ordre phylogénétique qui, dans le présent cas, suit l’ordre des dans lesquelles se sont produites les mutations. Un groupe de femmes A4793G est d’abord apparu; puis, la mutation G1719A est apparue chez une descendante de A4793G, et ainsi de suite. Lors du classement d’un haplotype (signature), en règle générale, toutes les mutations du sentier phylogénétique doivent être retrouvées présentes dans la signature à classer. Il y a parfois des exceptions puisque certaines mutations se défont spontanément; la taxonomie utilisera ces réversions qui seront indiquée par un point d’exclamation, ainsi par ex. T195C!
Certaines mutations, comme A4793G pour H7, jouent le rôle de clé pour entrer dans un haplogroupe. On dit qu’elles jouent un rôle ‘canonique’. Or ce rôle canonique disparaîtra si la même mutation est découverte dans un autre haplogroupe. Le véritable critère pour entrer dans un sousclade ou dans un haplogroupe c’est la satisfaction d’un sentier phylogénétiquement ordonné de mutations.

h7taxo
Figure 2. Section de la taxonomie ADN-mt rCRS qui porte sur le taxon H7. Cet extrait est emprunté à PhyloTree.org, Build 16, 2014. La version RSRS est identique à ce niveau.

Exemple 2. Haplogroupe A
Votre haplogroupe d’appartenance est A selon FTDNA qui a fait le test. Voici les mutations identifiées en HVR1+HVR2:
(ordre numérique des positions RSRS)
C146T, C152T, C195T, A235G, A247G, 315.1C, C544T, A16129G, T16187C, C16189T, A16227c, G16230A, T16278C, C16290T, G16319A
Sur la Figure 1, l’haplogroupe A est un sousclade de l’haplogroupe N. On trouvera donc le taxon dans la page N à PhyloTree.org
Puisqu’uniquement la région contrôle (HVR1 et HVR2) a été séquencée, il faudra se fier aux mutations indiquées en bleu dans la taxonomie de la page N à PhyloTree.org. Les mutations en noir proviennent de la région d’encodage (CR) qui n’a pas été séquençée dans le présent cas.
Pour repérer l’entrée de l’haplogroupe A sur la page de l’embranchement N àPhyloTree.org, chercher la mutation A235G. Cette mutation est présente parmi celles de la signature et la fait entrer en A. Plus bas, l’embranchement T152C! ne peut pas être emprunté étant donné que la mutation C152T est présente dans la signature. T152C! est une réversion. On poursuit la descente par la grande ligne. Il nous est impossible de savoir si la signature peut se qualifier pour le sousclade A5. Continuons plus bas. La mutation 16242T n’est pas présente dans la signature. On poursuit la descente. Le transversion A16227c et l’absence de T16311C! permettent de faire entrer la signature en A10 puisque ces deux mutations font partie de celles de la signature. Nous sommes donc en présence d’une signature appartenant à l’haplogroupe A10. En effet, il s’agit de la signature HVR1+HVR2 des descendants de la Fille du Roi Catherine PILLARD (épouse de Pierre CHARRON).

Exemple 3. Haplogroupe inconnu, à trouver.
La compagnie n’a pas fourni l’haplogroupe d’appartenance mais uniquement les mutations RSRS. Il faut en découvrir l’haplogroupe.
(ordre numérique des positions en mode RSRS)
C146T, C150T, C152T, C198T, A247G, 522.1A, 522.2C, 315.1C, A769G, A825t, A1018G, T2352C, A2758G, C2885T, T3594C, G4104A, T4312C, T4823C, T6413C, A6647G, G7146A, T7256C, A7521G, T8468C, T8655C, A9667G, T10664C, A10688G, C10810T, A10819G, C10915T, A11914G, G13276A, T13506C, T13650C, T14212C, G14869A, G14905A, G15301A, A16129G, C16148T, T16187C, C16189T, C16221T, G16230A, T16278C, C16311T, C16320T
Procéder ainsi:

  1. Déterminer en premier lieu si les mutations permettant de sortir d’Afrique sont présentes dans la signature. Aller à PhyloTree.org et examiner les mutations qui permettent d’entrer en M* ou N*. Aucune de ces mutations n’est trouvée. Le généalogiste doit alors inférer que l’haplogroupe d’appartenance se trouve parmi les haplogroupes africains L.
  2. Tester chacun des haplogroupes L. Les mutations A769G A1018G C16311T sont présentes dans la signature qui se qualifie pour entrer dans le sousclade L3.
  3. Plus en aval, elle ne se qualifie pas pour entrer en L3a, ni en L3b, ni en L3c. Par contre, elle possède C150T A10819G et entre en L3e’i’k’x, puis en L3e grâce aux mutations T2352C et T14212C. La signature possède G14905A et C16320T et ne possède pas T195C (noté par la réversion T195C!) et se qualifie ainsi pour entrer en L3e2. La signature présente les mutations T4823C et G14869A alors que A13105G est absente; elle peut entrer dans le sousclade L3e2a. Puis, la mutation C198T la fait entrer en L3e2a1. Plus en aval, elle entre en L3e2a1b avec T6413C. La signature occupe le sousclade L3e2a1b qui une feuille terminale dans la classification courante version 16 dePhyloTree.org

Cette signature appartient à une lignée utérine d’origine africaine.

Exemple 4. Haplogroupe T2b selon 23andMe
Vous avez fait tester votre ADN auprès de la compagnie 23andMe et cette dernière indique que votre ADN-mt appartient à l’haplogroupe H7. La compagnie 23andMe ne procède pas par un séquençage du génome ADN-mt entier. Il ne s’agit pas d’un test FMS. Il s’agit d’un sondage à l’aide de sondes examinant l’état de certaines bases jouant un critère pour l’entrée dans certains clades.
Il est possible que l’haplogroupe fourni par 23andMe puisse être précisé davantage si l’on soumet les résultats bruts du test au programme mtHAP développé par James LICK [http://dna.jameslick.com/mthap/ ]

Les directives pour soumettre les données sont les suivantes:

  1. Aller dans votre compte 23andMe et cliquer sur « Account » ; choisir l’option « Browse Raw Data ».
  2. Sur l’écran qui s’ouvre, cliquer sur « download raw data ».
  3. Saisir votre mot-de-passe et la réponse secrète.
  4. Choisir le profil dont vous voulez obtenir les données.
  5. IMPORTANT: Choisir l’ensemble « Mitochondrial DNA. »
  6. Cliquer « Download Data ».
  7. Sauver le fichier zippé sur votre machine à un endroit ou vous pourrez facilement le retrouver.
  8. Ouvrir le fichier zippé et extraire le fichier texte qu’il contient.
  9. Sur la page mtHAP, cliquer sur ‘Choisissez un fichier’. Choisissez le fichier .TXT sur votre machine et une fois qu’il apparaîtra cliquer sur Upload. Note: le fichier zippé ne fonctionnera pas.

Voici à quoi ressemble le début du fichier des données brutes ADN-mt:

gadn005pic3
Les données sont fournies à mtHAP et le programme élabore la réponse qui suit et que je traduis.

jameslick1
jameslick2

 

Le même ADN-mt fut aussi entièrement séquencé par FTDNA. Les variations sont ici exprimées en mode rCRS.

Elles conduisent à l’haplogroupe T2b13, le même que celui qui avait été prédit en partie par 23andMe par sondage et complété par mtHAP.

gadn005pic4
Figure 3. Liste des variations rCRS pour un haplotype T2b13 selon les régions HVR1, HVR2 et d’encodage. Cette signature T2b13 est fort probablement celle de Marie FERRA, née en 1641 à Crèvecoeur-le-Grand, Beauvais, Picardie, France (épouse de Jacques JAHAN dit LAVIOLETTE).

Exemple 5. S’agit-il d’une signature appartenant à l’haplogroupe H1 ou H7?
Voici une signature qui demeure d’un classement difficile. FTDNA la classe dans l’haplogroupe H1 bien qu’elle présente la mutation A4793G qui, dans l’exemple 1 plus haut, jouait un rôle canonique, faisant entrer une signature la possédant dans l’haplogroupe H7.

Voici les mutations mises en ordre numérique (RSRS):
G73A, C146T, C152T, C195T, A247G, 522.1A, 522.2C, 309.1C, 315.1C A769G, A825t, A1018G, G2706A, A2758G, C2885T, G3010A, T3594C, G4104A, T4312C, A4793G, T7028C, G7146A, T7256C, A7521G, T8468C, T8655C, G8701A, C9540T, G10398A, T10664C, A10688G, C10810T, C10873T, C10915T, A11719G, A11914G, T12705C, G13105A, G13276A, T13506C, T13650C, T14766C, A15874G A16129G, T16187C, C16189T, T16223C, G16230A, T16278C, C16311T

Je vous invite à consulter PhyloTree.org en ligne pour être en mesure de suivre l’exercice de classification.

  1. Entrée en H. Conformément à PhyloTree.org, les mutations G2706A T7028C servent de critère double pour faire entrer cette signature en H.
  2. Entrée en H1. La mutation G3010A permet ensuite de la faire entrer en H1. Par contre, aucune des autres mutations ne satisfait son entrée dans un sousclade plus en aval dand l’haplogroupe H1.
  3. Entrée en H7. Une fois en H, la mutation A4793G peut faire entrer la signature en H7. Or, cette signature ne possède aucune mutation qui permettrait de la classer dans un sousclade de H7.

Le classement de cette signature demeure donc pour l’instant incertain. Les chemins critiques peuvent conduire tout autant à H1 qu’en H7.