*La notation utilisée pour l’ADN mitochondrial

Chacune de nos mitochondries comprend plus ou moins 16,569 paires de bases. Pour rappel, les quatre bases sont Adénine, Cytosine, Guanine et Thymine, d’ou l’alphabet de base de  l’ADN reposant sur première lettre de ces 4 bases: A, C, G, T. Les paires de bases sont toujours assemblées A-T et C-G l’une en face de l’autre sur les deux filaments de la molécule d’ADN.  Or, un seul filament est examiné, l’autre étant composé de la base complémentaire.  Si une base A est présente  d’un côté, T sera présent en face sur le filament opposé.

Le génome de la mitochondrie a été divisé en 3 régions:

HVR1: La région hypervariable #1 qui va de l’adresse de la base 16,001 à la 16,569 ième.
HVR2: La région hypervariable # 2 qui va de l’adresse de base 1 à la 570 ième.
CR: La région d’encodage qui va de l’adresse de base 571 à 16,000 ième.

Chacune de ces régions peut être examinée par le laboratoire afin de déterminer quelle base occupe quelle adresse, cette adresse étant appelée aussi un locus ou, parfois,  une position. Le test le plus instructif et complet comprend ces trois régions. Il s’agit du test Full mitogenome Sequence à FTDNA.

Pour savoir si la base révélée à un locus donné constitue une mutation ou non, cette base est comparée à un étalon de référence qui, par définition, ne comprend pas de mutation.  Le référent utilisé par défaut par FTDNA est le RSRS qui est assumé être le plus ancien ADN-mt qui existait chez la «première» femme Homo sapiens. Ce système de référence est appelé le * Reconstructed Sapiens Référence Sequence * (RSRS). On trouvera plus d’informations sur les RSRS à http://bit.ly/1K0abIv
Il existe un autre système de référence plus ancien mais qui est encore celui utilisé dans les sciences médicales, biologiques, médico-légales et anthropologiques. Il est appelé les rCRS pour  ‘revised Cambridge Reference Sequence’. Il est expliqué à http://bit.ly/1K0au5S
La notation utilisée pour représenter une mutation à un locus ADN-mt donné est simple. Certaines mutations sont présentées dans le tableau suivant. Elles ont été prises à partir d’une page personnelle à FTDNA.

Tableau 1. Liste des mutations RSRS trouvées dans l’ADN-mt d’un des membres du projet H7 mtgenome à FTDNA.

Dans ce tableau, les mutations sont exprimées comme des différences par rapport au système de référence RSRS, celui utilisé par FTDNA.

Ainsi, la mutation A16129G a été trouvée dans  la région HVR1. Le chiffre 16129 correspond à l’adresse du locus sur le brin mitochondrial considéré. La lettre A qui est placée en préfixe à l’adresse du locus correspond à la base rencontrée dans le système de référence à ce même locus. Le préfixe A représente la base Adénine. La lettre G placée en suffixe après le chiffre du locus est la valeur trouvée au même locus dans l’ADN-mt qui a été examiné par le laboratoire. Puisque le locus 16129 de l’ADN-mt examiné présente une base G différente de celle du système de référence, cette condition est déclarée être une *mutation* et elle est notée A16129G.
Ce type de substitution de base à un locus est appelé une transition si elle se produit au sein de la même catégorie de bases.  Il y a deux catégories de bases. Les purines (A, G) et les pyrimidines (C, T). Ainsi, une transition pourra consister à un remplacement d’une purine par la purine complémentaire (A par G, G par A)  ou  encore, le remplacement d’une pyrimidine par l’autre pyrimidine. Les mutations sont la plupart du temps, du type de transition. Plus rarement, la substitution impliquera une base du groupe opposé. Ainsi, une pyrimidine pourra remplacer une purine. Ce type de substitution est appelé *transversion*. Par exemple, A16129c exprimera la présence d’un transversion au locus 16129. Une purine A y a été remplacée par une pyrimidine C. Pour mettre l’emphase sur cet événement rare, la lettre c est inscrite en minuscule.

La notation est différente pour les mutations de type INDEL produites par des insertions de bases ou au contraire par la suppression ou délétion de bases. Comme leur nom l’indique les insertions sont des mutations introduites par l’apparition d’une d’une base supplémentaire après l’adresse d’un locus donné. Ainsi l’expression 522.1A dans l’exemple ci-dessus signifie qu’une base supplémentaire adénine (A) a été trouvée une adresse plus loin que le locus 522. De même, 522.2C signifie qu’une autre insertion a été trouvée 2 bases après locus 522. Or, cette fois, il s’agit d’une base cytosine (C).

Les suppressions de bases constituent une autre forme de mutation. À un locus donné, la base qui devait y être présente suivant le système de référence ne s’y trouve pas en raison de sa délétion. La notation employée pour indiquer cette délétion est exprimée par l’adresse de locus où la suppression s’est produite, suivie par le signe moins ou par les trois lettres DEL. Ainsi 552- ou 522DEL indique une délétion de la base qui, selon le modèle de référence, aurait dû se trouver au locus 552.
D’autres lettres que A, C, G, T sont utilisées pour exprimer une condition spéciale appelée * hétéroplasmie *. L’hétéroplasmie est la présence dans le même organisme de mitochondries présentant une mutation à un locus donné, alors que d’autres mitochondries du même organisme s’avèrent conformes au système de référence (RSRS ou rCRS).

Ainsi, la présence d’une hétéroplasmie au locus 73 au mitogénome d’une personne testée pourra dans les résultats être exprimée G73R. Nous référant au Tableau 2, la lettre R représente les bases A ou G, ce qui signifie que certains mitochondries sont G73A alors que d’autres sont G73G, ce qui représente la condition normale. D’autres possibilités hétéroplasmiques sont présentées dans ce tableau.

 

heteroplasmy

Tableau 2. Liste des symboles utilisés pour dénoter la présence d’hétéroplasmie dans un ADN mitochondrial.

 

On comprendra que l’ADN mitochondrial d’une personne montrant de l’hétéroplasmie à un locus donné pourra très bien concorder sur le plan ancestral avec celui d’une personne qui ne montre pas cette condition au même locus. Or, les compagnies de test ne détectent pas toujours l’hétéroplasmie lorsqu’elle est présente chez une personne testée. Ainsi les anciens tests à FTDNA y étaient insensibles.  De plus, il n’est pas certain que les programmes mis au point par les compagnies à la recherche de concordances (les *matches*) entre haplotypes tiennent compte de la présence d’hétéroplasmie lors des comparaisons entre haplotypes.

Or, un expert en ADN-mt pourra trouver une concordance entre un haplotype hétéroplasmique et un autre qui ne l’est pas.

Jacques P. Beaugrand 2016-SEP-19