Search Results for: microsatellites

*Tests portant sur l’ADN-Y: les microsatellites STR

Le chromosome Y est possédé uniquement par les mâles chez les mammifères, y compris notre espèce. Le chromosome Y se transmet de père en fils. On dit qu’il suit le patrilignage. Or, plusieurs cultures humaines transmettent le nom du père comme nom de famille, de telle sorte que les hommes porteurs d’un même patronyme ou encore d’une variante de ce nom de famille auront tendance à présenter la même signature au niveau de l’ADN du chromosome Y (ADN-Y).
La généalogie par ADN et l’anthrogénétique se fient à deux types de polymorphismes pour décrire et comparer des lignées d’ADN-Y. Ces polymorphismes permettent de différencier les signatures ou encore de les regrouper pour former des lignées d’hommes qui descendent phylogénétiquement d’un même ancêtre commun. Le terme polymorphisme (étymologiquement, de poly: plusieurs, et morphen: formes) réfère aux variations trouvées naturellement dans la granularité de l’ADN-Y, granularité qui lui confère ses particularismes, sa singularité.

Un marqueur génétique est une séquence d’ADN aisément détectable de par son emplacement sur le filament d’ADN du chromosome. Il s’agit d’une variation à soit à un locus unique précis ou à des loci consécutifs ou adjacents particuliers, ces variations pouvant être lues. voire dénombrées par le laboratoire qui effectue des tests d’ADN. Il peut s’agir d’une séquence d’ADN courte concernant (1) un seul nucléotide ou paire de bases (Single Nucleotide Polymorphism, SNP) ou (2) de séquences répétées courtes, comme les minisatellites VNTR, et microsatellites STR, impliquant plusieurs nucléotides adjacents en succession.

Ces deux types de polymorphismes véhiculent des information à la fois complémentaires et redondantes. La cladistique utilisera les SNP pour construire ses taxonomies phylogénétiques qui serviront par la suite au généalogiste pour classer l’ADN dans un haplogroupe particulier sur la base de son polymorphisme profond.

Cette section s’intéresse au polymorphisme de répétition introduit par les microsatellites STR.

Le polymorphisme de répétition constitue un polymorphisme de surface. Il est étudié en dégageant une signature, aussi appelée haplotype, reposant sur des marqueurs de type STR. Elle est composée d’une suite de valeurs numériques qui correspondent à des mesures lues à des endroits stratégiques le long du filament d’ADN-Y. Les endroits ou sont lues ces valeurs sont appelés des *marqueurs*. La Figure 1 illustre approximativement les endroits qui fournissent certains des marqueurs. Ceux en bleu font partie du Jeu #1 de FTDNA ou Alpha de Yseq.net. Ce premier jeu comprend 12 marqueurs. Ceux en noir participent aux jeux #2 et #3. Il est possible de commander jusqu’à 111 marqueurs et même d’avantage si on les commande à la pièce.

gadn019pic1

Figure 1. Représentation schématique du chromosome Y avec localisation de divers marqueurs STR.

Chacun de ces marqueurs prend une valeur numérique qui est obtenue de la manière suivante: chaque marqueur STR occupe une plage d’ADN-Y bien déterminée sur le filament entre deux paires de bases connues. Le laboratoire lit le nombre de fois qu’un motif particulier s’y trouve répété. Ces motifs sont appelés minisatellites, mais sont davantage connus sous le terme de STR, acronyme pour  »Short Tandem Repeats ». En français, nous pouvons traduire par  »Répétitions courtes en tandem ». Appelons-les tout simplement des STR.

Nous rapportant à la Figure 1, le premier marqueur situé au tout début du segment p du chromosome Y est le DYS393. Le motif qui est dénombré à ce marqueur est AGAT, à savoir, une nucléobase Adénine, suivie d’une Guanine, suivie d’une Adénine et enfin d’une Thymine. Le laboratoire compte le nombre de fois que le motif AGAT est rencontré parmi les 119 bases entre l’adresse 3,131,128 et 3,131,246 sur le chromosome Y. Ce nombre de répétitions du motif AGAT varie selon les individus. On peut trouver normalement de 9 à 17 répétitions du motif AGAT au marqueur DYS393. Pour connaître les paramètres des marqueurs STR, référer au fureteur Y de l’ISOGG à l’URL http://bit.ly/1uSvMBM [URL alternatif http://ybrowse.y-chromosome.org]. Une prise de mesure semblable est répétée pour les autres marqueurs, en utilisant chaque fois un motif STR qui est approprié à ce marqueur qui est lu. Ainsi au marqueur DYS390, le motif double (TCTA) (TCTG) sera dénombré. Pour obtenir la liste des motifs qui correspondent aux divers marqueurs, référer aux pages Wikipedia à http://bit.ly/1xCr6ze
Pour rappel, le chromosome Y est transmis de père en fils. Grâce aux caractéristiques STR de l’ADN-Y, il est possible de suivre les lignées d’hommes qui possèdent alors la même signature à quelques variantes minimes près. Cette même signature STR permet aussi de distinguer diverses lignées d’hommes les unes des autres.

Le Tableau 1 illustre les valeurs prises par les 12 premiers marqueurs qui font partie de la signature des hommes qui possèdent le fils de Jean Beaugrand-dit-Champagne à l’origine de leur lignée des pères établie en Nouvelle France en 1667.

Tableau 1. Valeurs prises par les 12 premiers marqueurs chez les hommes qui possèdent Jean Beaugrand-Champagne dans leur patrilignage. Le SNP terminal indique l’haplogroupe d’appartenance R-L2.

gadn019pic2

Comme l’illustre ce tableau, les descendants présentent une signature identique sur ces premiers marqueurs. Or, lors d’un événement générationnel, il pourra se produire une mutation dans le nombre de répétitions si l’on compare un père et son fils. Cette modification sera ensuite transmise héréditairement par le fils à ses descendants masculins, permettant au généalogiste de suivre sa lignée. Il est donc possible grâce à la présence de certaines mutations STR de reconnaître les descendants d’une lignée particulière parmi le lot des descendants originaux et de suivre ainsi les lignées de descendants. Le taux de mutation varie d’un marqueur à l’autre. Ainsi, le marqueur DYS393 est l’objet en moyenne de 76 mutations par 100,000 engendrements (0,00076). C’est donc un marqueur stable, à mutation improbable. Il existe des marqueurs qui sont susceptibles de muter plus fréquemment. Ainsi le DYS390 présente un taux de mutation de 311 par 100,000 événements générationnels et celui du DYS458 est de 814 pour 100,000. Référer au Wikipedia à http://bit.ly/1xCr6ze pour les taux de mutation des marqueurs STR.

Le Tableau 2 illustre des signatures sur 12 marqueurs pour des hommes porteurs de patronymes québécois. Avec uniquement 12 marqueurs, un examen attentif permet de voir que ces signatures diffèrent les unes des autres sur certains marqueurs. Ce sont ces différences qui permettent de distinguer les lignées d’hommes les unes des autres. Puisque dans nos sociétés occidentales, les patronymes sont *héréditaires*, leur corrélation sera forte avec les signatures ADN-Y. Ainsi, tous les hommes les BEAUGRAND-CHAMPAGNE testés pour leur ADN-Y à ce jour montrent la même signature ADN-Y illustrée au Tableau 1.

Tableau 2. Signatures STR du chromosome Y d’hommes dont les patronymes sont bien représentés au Québec.

gadn019pic3

Si votre nom de famille apparaît dans ce tableau, en vous faisant tester sur 12, ou préférablement sur davantage de marqueurs (e.g., 37), vous obtiendrez une signature que vous pourrez comparer à celles déjà dans la base de données à FTDNA. Il faut savoir que les ancêtres fondateurs des divers haplogroupes en Europe occidentale (dont nous descendons majoritairement) étaient très peu nombreux et représentaient un sous-ensemble restreint d’hommes venant d’Asie. De ces premiers fondateurs descendent tous les hommes qui appartiennent au même haplogroupe majeur.

Ainsi, chez les hommes appartenant à l’haplogroupe majeur R1b (R-M269, R-P310/P312), l’haplotype de base de l’ancêtre ou des ancêtres R1b comprenait les 8 valeurs suivantes:

gadn019pic4

Il faut faire abstraction des valeurs non indiquées qui pouvaient varier. Ces huit marqueurs présentent des taux de mutation lents ou très lents. La différenciation depuis les fondateurs s’est faite très lentement et graduellement par une marche aléatoire (random walk) les écartant des valeurs fondatrices. Il y aura donc beaucoup d’hommes dans une population qui possèderont des valeurs semblables ou très proches de celles du modèle fondateur. Il sera parfois difficile de départager les uns des autres des hommes portant des hommes de divers patronymes en comparant uniquement leurs 12 premiers marqueurs. Il faudra alors échantillonner un nombre accru de marqueurs, à savoir passer de 12 à 25, puis à 37 ou même davantage. Le pouvoir de discrimination et de résolution s’accroît et se stabilise en augmentant le nombre de marqueurs. Nous verrons plus loin comment procéder pour comparer des signatures STR.
Une femme ne possède pas de chromosome Y. Elle peut néanmoins demander à son père, à son frère ou à un oncle ou cousin paternel, de fournir les prélèvements qui serviront au test ADN-Y portant sur sa lignée d’hommes.

Où commander un test sur les STR

Deux compagnies vendent des tests ADN révélant les valeurs de nos marqueurs STR.
(1) Family Tree DNA à https://www.familytreedna.com/products/y-dna Le test sur 37 marqueurs coûte 119$ USD. Ajouter 20$ pour la trousse de collection, la manutention et l’expédition.
(2) YSeq.net Le test sur 116 marqueurs coûte 270.00$ USD incluant la trousse de collection et l’expédition.

?Haplotype

Haplotype; synomyme de signature
angl.: Haplotype

Série de valeurs microsatellites STR ou de SNP qui fournissent une «signature» individuelle.
Un haplotype peut être classé dans un haplogroupe et dans un sousclade, subdivision de l’haplogroupe.

Pour l’ADN-mt, les signatures reposent sur des variations depuis le CRS ou le RSRS:

HVR1: 16390A 16519C
HVR2: 73G 150T 263G 309.1C 309.2C 315.1C

La région codante (CR) demeure par convention soustraite à une connaissance publique.

*Comment procéder pour obtenir l’haplotype de personnes depuis longtemps décédées?

Deux techniques peuvent être utilisées.

Le plus souvent c’est par *triangulation* (expliquée sous une autre rubrique.  Supposons que 2 ou plusieurs personnes ont exactement la même signature ADN (Y ou mt) et que leurs généalogies qui ont été rigoureusement documentées montrent qu’elles descendent toutes d’un même ancêtre ciblé, et de lignées différentes de cet ancêtre (fils différents ou filles différentes) ; alors on est en droit d’inférer que leur signature commune (celle des descendant-es) est celle de l’ancêtre ciblé.

Se rappeler que l’ADN du chromosome Y se transmet intégralement (ou presque) de père en fils et que l’ADN mitochondrial se transmet intégralement (ou presque) de mère en fille de génération en génération.

La signature que possèdent les descendants qui ont cet ancêtre en matrilignage (ADN-mt) ou en patrilignage (ADN-Y) est alors celle que possèdait cet ancêtre.

L’autre moyen, de plus en plus employé, c’est de faire des tests d’ADN (-ancient) sur des ossements (ou encore sur des vestiges genre relique comme des dents, des cheveux, &c). Par ex. dans le cas de Louis XVI on avait conservé un mouchoir qui avait essuyé la guillotine après sa décapitation et on en a analysé l’ADN. Le cœur du fils de Louis avait aussi été conservé et des analyses ont montré que tous deux étaient G2.

Il est possible de déterminer l’haplogroupe d’appartenance d’un ADN sans examiner la signature. Une signature ADN-Y repose sur les valeurs STR (microsatellites ou motifs répétés en tandem courts) qui ont été trouvées dans des zones particulières du chromosome. Ces valeurs sont appelées *marqueurs*. Or, l’haplogroupe repose sur le polymorphisme profond appelé SNP; c’est l’état des allèles (ici les bases) à des loci particuliers dans l’ADN du chromosome. Lorsque l’allèle est trouvé dans un état significatif pour classer cet ADN il est alors appelé SNP.

La détermination de l’haplogroupe de l’ADN mitochondrial repose quant à elle sur des différences lorsqu’il est comparé à un standard appelé rCRS (Cambridge Reference Sequence). C’est l’équivalent de SNP mais pour l’ADN-mt. Parmi les différences notées dans un ADN-mt, certaines d’entre elles servent à le classer dans un haplogroupe particulier.

Il est donc possible de mettre au point des tests qui déterminent l’état d’un certain nombre de SNP bien choisis pour obtenir une lecture de l’haplogroupe d’appartenance.

Un des principaux objectifs de la généalogie par ADN appliquée dans un horizon récent est d’établir validement les signatures de certains ancêtres qui furent importants pour une société ou culture (Fille du Roi, Soldats de Carignan, &c) et d’utiliser cette information pour valider certaines lignées des généalogies documentaires. Évidemment, un tel travail de validation des structures de descendance n’a de pertinence que si les généalogistes recherchent la vérité biologique sousjaçente (réelle) et ne se contentent pas de décrire les couplages et filiations suggérées par les documents et archives.

*Validation généalogique

En complétant un arbre généalogique, le généalogiste*) construit une structure conforme à son interprétation des enregistrements de baptêmes, de mariages et de sépultures (BMS) qu’il rencontre au cours de ses recherches documentaires. Il lui arrive même d’emprunter des segments de généalogies déjà rassemblés par d’autres généalogistes; il les incorpore alors à son arbre sans nécessairement toujours rigoureusement les vérifier par une conciliation aux actes BMS originaux correspondants. Les informations aussi consciencieusement colligées peuvent néanmoins ne pas s’avérer parfaitement conformes à la réalité documentaire. De plus, même si le sens révélé par la documentation se trouve parfaitement respecté par la structure de descendance ainsi érigée, rien n’indique que cette dernière respecte la réalité biologique. Une toute petite erreur introduite dans une lignée près du de-cujus pourra fausser tout un pan d’une généalogie.

Pour plusieurs généalogistes, construire une généalogie se résume à reproduire très fidèlement ce que révèlent les actes BMS. Or, ces actes ne peuvent refléter qu’une réalité culturelle, cachant ce qui s’est vraiment passé sur le plan de la transmission biologique. En effet, des événements dits « non parentaux » (ÉNP) se produisent, auxquels les enregistrements BMS ne furent pas « sensibles » à certaines époques. C’est le cas de certaines adoptions, des cas d’assimilation silencieuse, de naissances illégitimes, de changements de nom de famille, de la confusion par les chercheurs de couples homonymes ou paronymes, &c.

Une démarche généalogique qui se veut rigoureuse doit viser l’objectivité et le réalisme, à l’instar des sciences qui doivent servir ici de modèle. Le généalogiste doit prendre les moyens de s’assurer que les structures généalogiques inférées à partir des enregistrements BMS sont valides sur le plan biologique. Ce test de validité peut être fait par des tests d’ADN. Ainsi, la découverte d’une discontinuité dans la transmission de l’ADN dans une descendance oblige le chercheur à remettre en question le résultat de la recherche documentaire, aussi méticuleuse et rigoureuse fut-elle. Par ailleurs, le résultat d’un test d’ADN pourra souvent suggérer une réorientation de la recherche documentaire, indiquant là où la recherche devra dorénavant se poursuivre. Dans d’autres cas, le résultat justifiera la fin d’une recherche incessante. Quant aux ÉNP révélés, une fois conciliés ou interprétés à la lumière des données fournie par la recherche documentaire, ils peuvent alimenter l’histoire familiale.

Il serait irréalisable de tester par l’ADN chacun des liens de filiation dans une généalogie. Cependant, en principe, il est possible de mettre à l’épreuve plusieurs lignages d’une généalogie et de les valider par quelques tests d’ADN. En effet, une généalogie est essentiellement composée de lignées des mères et de lignées des pères. Un test de validité consistera à comparer la signature d’un ancêtre matrilinéaire ou patrilinéaire à celle de son descendant avéré sur le plan documentaire. En découvrant que la signature du descendant allégué concorde avec la signature ADN de son ancêtre en matrilignage ou en patrilignage, la chaîne de transmission de cet ADN et donc la séquence d’ancêtres révélés par la recherche documentaire se trouvent ainsi supportées, validées. Une validation n’est cependant pas une preuve irréfutable. La validité vient à divers degrés et elle résulte d’une concordance entre signatures ADN que le hasard ne peut pas expliquer.

Le présent texte explique comment procéder à une telle validation par l’ADN.

Principes de transmission de l’ADN

La structure d’ensemble que forme une généalogie peut être représentée comme un éventail, tel que l’illustre la Figure 1. Cette figure classique suit le système de numérotation Sosa. La numérotation débute avec la personne dont on construit la généalogie, aussi appelée le « De-cujus ». Il est le #1. On numérote ensuite les ascendants du #1 en suivant le sens horaire et en migrant vers la périphérie à chaque génération une fois complétée. Ainsi, le père du #1 est le #2 et sa mère, le #3. Les nombres pairs correspondent à des hommes et les nombres impairs à des femmes.

gadn009pic1

Figure 1. Éventail illustrant les différents lignages qui peuvent être validés par des tests d’ADN. Les cellules en bleu correspondent à des hommes et les rose à des femmes. Les ancêtres en matrilignage et en patrilignage se trouvent à l’apex de chaque rayon.

Le matrilignage du #1 conduit en apex à m1, sa matriarche. Son patrilignage conduit en apex à p1, son patriarche. La lignée des pères du De-cujus (#1) est composée des hommes #2, #4, #8, #16, #32, #64, …, p1. Sa lignée des mères se compose des femmes #3 (sa mère), #7, #15, #31, #63, #127, …., m1.

Sur cette figure, chaque rayon qui se rend en périphérie de l’éventail est constitué soit d’un matrilignage, indiqué en rose, ou d’un patrilignage, indiqué en bleu. Rappelons qu’un matrilignage est une lignée utérine ou lignée des mères. Le patrilignage quant à lui est formé d’une lignée des pères. Nous désignerons par m1 la matriarche qui se trouve à l’apex de la lignée directe des mères du #1. Elle est aussi la matriarche de toutes les femmes qui composent le matrilignage du #1, débutant avec sa propre mère, la #3. C’est par convention que la mère à l’apex est déclarée « matriarche ». Il s’agit de la femme la plus lointainement connue du matrilignage. Sur la Figure 1, la matriarche du #2, à savoir le père du #1, est notée m2. Il en est de même pour les lignées patrilinéaires. Le patriarche de #1 sera noté p1. Le patriarche du #6 est p6. Il se trouve à l’apex du patrilignage du #6. Et ainsi de suite pour les autres matrilignages et patrilignages de la généalogie. La Figure 1 porte uniquement sur huit générations, et se termine à l’ancêtre situé en apex de chacun des lignages. Cependant, ce nombre de générations pourra varier d’un lignage à un autre et selon les généalogies. Chez les québécois, la matriarche correspond le plus souvent à la première femme du matrilignage qui s’est établie en Nouvelle France ou en Acadie il y a 10 à 13 générations. Ce sont souvent des Filles du Roi ou des Filles à marier. Dans environ 6% des cas de québécois de souche, la matriarche sera une autochtone (VÉZINA et al., 2012) et il sera possible de l’affirmer à partir de l’haplogroupe d’appartenance de l’ADN mitochondrial étudié.

Les principes de transmission de l’ADN mitochondrial et de l’ADN du chromosome Y sont simples et la validation des divers matrilignages ou patrilignages se fera grâce à leur mode de transmission biologique.

Le premier principe concerne la transmission de l’ADN mitochondrial (noté ADN-mt) qui suit la lignée utérine ou matrilinéaire. La signature ADN-mt d’une personne dans une généalogie est celle des femmes qui font partie de sa lignée maternelle et qui furent impliquées dans la transmission de cet ADN-mt de génération en génération jusqu’à elle. Dans le cas de l’ADN-mt et d’un matrilignage, la personne dont on étudie le matrilignage pourra être indifféremment un homme ou une femme. Les hommes et les femmes reçoivent intégralement leur signature mitochondriale de leur mère biologique. Cependant, uniquement les femmes sont en mesure biologiquement de la transmettre à leur tour à leurs enfants. Ainsi, sur la Figure 1, le #1 possède la signature ADN-mt de sa mère #3 et de toutes les femmes de sa lignée des mères jusqu’à la matriarche m1.

Le deuxième principe concerne la transmission de l’ADN du chromosome Y (noté ADN-Y) qui n’est possédé que par les hommes, pris dans le sens restrictif de « mâles » de notre espèce. Cette transmission de la signature ADN-Y se produit intégralement (ou presque) de père en fils, suivant en cela la lignée des pères. Ainsi, le #1 possède la signature du #2, son père, du #4, son grand-père et de tous les hommes qui font partie du patrilignage du #1, jusqu’au patriarche p1.

De ces deux principes découlent logiquement et biologiquement deux conséquences pour la généalogie par ADN :

1. Toute femme ou tout homme dans une généalogie devrait montrer la même signature ADN-mt que sa matriarche en matrilignage.

2. Tout homme dans une généalogie devrait montrer la même signature ADN-Y que son patriarche en patrilignage.

Procédure de mise à l’épreuve d’un lignage

Appelons « personne ciblée » le descendant dont la signature ADN-mt ou ADN-Y sera comparée à celle de la matriarche ou du patriarche qui se trouve en apex du lignage concerné. Ainsi, nous rapportant à la Figure 1, prenons l’individu #1 comme personne ciblée. La signature ADN-mt du #1 sera comparée à celle de m1, sa matriarche située en apex de son matrilignage. De même, la signature ADN-mt du #2 qui est le père de #1 sera comparée à celle de sa propre matriarche m2. Il en est de même pour l’ADN-Y. La signature ADN-Y du #1 sera comparée à celle de p1, son patriarche en patrilignage. La signature ADN-Y du #6, le grand-père du #1 du côté maternel, sera comparée à la signature ADN-Y du patriarche p6. Et ainsi de suite pour tous les matrilignages et patrilignages d’une généalogie. Voilà pour les principes. En pratique la situation se complique par l’impossibilité de tester directement l’ADN des personnes ciblées et des ancêtres en apex. Dans le premier cas, il faudra avoir recours à des substituts. Leur choix doit s’inscrire dans la logique de la transmission d’ADN énoncée plus haut. Ainsi, le fils ou la fille avérée d’une femme ciblée disparue (ou ne voulant pas participer à la validation) ont hérité leur signature ADN-mt de cette dernière et pourront servir pour la remplacer afin de tester par ADN-mt un lignage maternel. Le fils ou le petit-fils avéré d’un homme disparu pourront agir comme substitut de remplacement pour ce dernier et fournir l’ADN-Y qui servira à la comparaison avec la signature du patriarche en apex du patrilignage dont ils sont aussi issus. Le fils et le petit-fils ont hérité de la signature ADN du chromosome Y du père qui ne peut participer. Or, plus le nombre de générations séparant un proxy de la personne à remplacer est grand, plus il y a de chances qu’un ÉNP se soit produit entre ce proxy et la personne qu’il ou elle remplace. La non concordance entre les signatures n’impliquera pas obligatoirement que la personne ciblée ne descend pas de l’ancêtre en apex. Des explications rivales sont possibles. Par contre, dans le cas d’une concordance parfaite trouvée entre la signature du substitut et celle de l’ancêtre en apex, le test aura autant de validité que si la personne ciblée avait elle-même fourni l’ADN. Afin d’éviter d’avoir recours à des substituts, la validation d’une généalogie procédera d’abord en testant les lignages qui touchent le #1 ou qui concernent l’une des trois générations plus en amont, à savoir ses parents, ses grands-parents et ses arrières grands-parents.

Tester un lignage consistera à comparer la signature ADN de la personne ciblée (ou de son « proxy ») à celle de l’ancêtre qui se trouve en apex de ce lignage maternel ou paternel, selon qu’il s’agit d’un matrilignage ou d’un patrilignage. Pour ce faire, il faut connaître la signature de la personne ciblée et de son ancêtre en apex. Si le lignage est un matrilignage, il faudra commander un test décrivant les caractéristiques de l’ADN des mitochondries de la personne ciblée dans l’arbre. S’il s’agit d’un patrilignage, il faudra commander pour l’homme ciblé un test décrivant l’ADN de son chromosome Y. Or, comment connaître la signature de l’ancêtre en apex puisque cette personne est décédée il y fort longtemps? Sa signature ne peut pas être lue directement en excavant ses vieux os ou en ou en prenant l’ADN sur des objets lui ayant appartenu. Il est possible que cette signature ait été inscrite dans un catalogue de signatures ancestrales validées. Il existe un début de catalogue pour les signatures ancestrales des Laurentiens (Nouvelle-France, Acadie, Amérindiens) à http://bit.ly/XhSQFq

Si la signature n’est pas déjà cataloguée, il faudra alors procéder à la caractérisation de cette signature par triangulation.

Identifier et valider la signature ancestrale par triangulation

La triangulation est abordée plus à fond à http://bit.ly/YKJ9hO. Pour rappel, une triangulation procède par le choix de descendants qui sont avérés sur le plan documentaire depuis un ancêtre commun le plus rapproché (ACPR). Comme le nom l’indique, l’ACPR est l’ancêtre le plus récent que les deux généalogies partagent en commun. Les participants qui sont choisis – au minimum deux – doivent posséder cet ACPR en matrilignage ou en patrilignage selon le cas. On compare ensuite les signatures ADN-mt ou ADN-Y respectives des participants. Si leurs signatures ADN concordent, c’est qu’ils possèdent la signature de leur ACPR. La triangulation est réussie. La triangulation de la signature ancestrale peut être réalisée indépendamment de la personne ciblée dans une généalogie en utilisant des personnes qui sont descendants avérés de l’ACPR dont on veut établir la signature mais qui ne font pas partie du lignage à valider. Le plus souvent cependant, la personne ciblée dans une généalogie participera à la triangulation avec une autre personne externe au lignage que l’on s’apprête à valider.
Lorsque la personne ciblée participe à la triangulation de la signature de l’ancêtre en apex, une triangulation réussie vient valider la lignée de transmission de l’ADN-mt ou ADN-Y, selon le cas, entre l’ancêtre en apex et la personne ciblée. Lorsque la signature de l’ancêtre a été indépendamment triangulée, le généalogiste compare alors la signature obtenue pour la personne ciblée à celle maintenant validée de l’ancêtre en apex du lignage à valider. En général, deux signatures ADN seront considérées tout à fait concordantes si elles présentent les mêmes mutations et si elles appartiennent au même haplogroupe. Or, cette décision n’est pas toujours simple si des différences minimes existent entre les signatures ou si les haplogroupes n’ont pas été déterminés à même profondeur.

La généalogie par ADN emprunte à la science sa démarche qui se veut critique et publique. Ses énoncés doivent demeurer hypothétiques, c’est-à-dire confirmables ou infirmables par d’autres généalogistes. Il faudra donc que le chercheur rende public le cas de (non-) concordance et le soumette à une communauté de généalogistes pour obtenir des avis. Cela peut se faire sur une plateforme comme le www.Forum-ADN.org, par exemple. Il en est de même pour la signature de l’ancêtre qui aura été nouvellement validée par triangulation. En l’inscrivant au catalogue des signatures ancestrales validées, en joignant les éléments qui servirent à la validation, à savoir les signatures ADN des participants avec leur haplogroupe, les listes des mères ou des pères dont chacun descend, leur ACPR, le généalogiste fournit la possibilité à d’autres généalogistes de la communauté de vérifier si le travail a été rigoureusement fait et les place dans une position ou il leur est possible de détecter, le cas échéant, des erreurs méthodologiques ou documentaires qui viendraient entacher, voire invalider le travail de validation.

Si le descendant ciblé possède la signature de l’ancêtre en apex, ce constat viendra:
(1) confirmer la validité biologique de la transmission de l’ADN depuis l’ancêtre en apex, via chacun des ancêtres faisant partie de la chaîne de transmission de cet ADN, jusqu’au descendant ciblé;
(2) établira la validité de l’engendrement entre chacune des générations faisant partie du lignage validé;
(3) confirmer la validité de la recherche documentaire qui aura présidé à la construction de ce lignage à partir d’actes BMS.

Dans le cas contraire, le fait que le descendant testé ne possède pas la signature ADN de son ancêtre en apex signalera une discontinuité dans la transmission de l’ADN entre l’ancêtre allégué et son descendant ciblé. Cette discontinuité peut être attribuée à divers facteurs. En premier lieu, il peut s’agir d’une erreur documentaire ou cléricale. Il faudra donc toujours rigoureusement réviser la preuve documentaire et surveiller la possibilité de confusion entre couples homo ou paronymes. Si la preuve documentaire révisée s’avère robuste, la discontinuité pourra suggérer qu’un Événement Non Parental ou ÉNP biologique s’est produit dans le lignage concerné. C’est une invitation à retracer là où cet ÉNP aurait pu se produire. Par ailleurs, s’il s’agit d’un ÉNP paternel, il est parfois possible de connaître le patronyme du père véritable. En effet, une forte concordance de la signature de la personne ciblée avec d’autres signatures d’hommes trouvées dans une base de données publique pourra parfois autoriser des hypothèses sur le nom de famille du parent véritable, un pensionnaire, un voisin, confirmable en examinant par ex. les relevés d’un recensement. Plusieurs opérations de triangulation pourront permettre de cerner la génération où s’est vraisemblablement produit l’ÉNP. De plus, la non-concordance au niveau de l’ADN-mt ou de l’ADN-y pourra suggérer qu’une adoption s’est produite. Ainsi, les hommes dans une généalogie se situent à l’intersection d’un matrilignage et d’un patrilignage. Si leur ADN-mt et leur ADN-Y ne concordent pas respectivement avec celui de leur ancêtre en matrilignage et en patrilignage, cela pourra suggérer qu’une adoption s’est produite à leur niveau ou en amont.

Par ailleurs, il arrivera lors d’une non-concordance que l’haplogroupe d’appartenance de l’ADN du descendant donne des indications sur là où devrait être poursuivie la recherche documentaire ou, au contraire, suggérer l’abandon pur et simple de la recherche documentaire. C’est le cas, par exemple, lorsque l’ADN d’une lignée supposée européenne révèle des origines ancestrales amérindiennes et que les registres BMS n’existent plus.

Tests d’ADN appropriés

Pour valider un matrilignage, commander des tests ADN-mt

Valider un matrilinéaire appelle des tests d’ADN portant sur l’ADN mitochondrial possédé autant par les hommes que les femmes. La mitochondrie comprend une région contrôle subdivisée en deux zones hypervariables (HVR-I et HVR-II) et une région codante (CR). Pour tester un lignage matrilinéaire, il faut commander des tests ADN-mt couvrant les régions HVR-I et HVR-II. Si les tests sont commandés auprès de la compagnie Family Tree DNA (FTDNA), les résultats comprendront, en plus d’une description des bases mutées de la région contrôle (HVR1 et HVR2), un diagnostique assez précis sur l’haplogroupe d’appartenance. Cet haplogroupe aura été obtenu par le lancement de 22 sondes différentes dont plusieurs interrogent la région codante même si elle n’a pas été commandée explicitement. Il existe aussi un test appelé « Full Mitochondrial Sequence » (FMS) qui décrit l’ensemble du génome de la mitochondrie, donc HVR-I, HVR-II et CR. Ce test est idéal pour décider de l’haplogroupe auquel appartient un ADN-mt et pour établir le degré de concordance entre des génomes mitochondriaux. Les signatures ADN-mt seront considérées parfaitement concordantes si elles possèdent exactement les mêmes mutations (variations depuis le CRS ou depuis le RSRS), exception faite de certaines mutations considérées banales en raison de leur inconstance ou volatilité. Un test comprenant HVR-I et HVR-II (le test mtDNAplus) coûte 50$. Le test FMS (mtFullSequence) coûte 200$ mais porte sur 16 fois plus de bases. Pour commander dans le cadre du projet ADN Héritage Français, visiter notre page à http://bit.ly/XC6LpM

Pour valider un patrilignage, commander des tests ADN-Y

Valider un patrilinéaire appelle des tests d’ADN portant sur l’ADN du chromosome Y qui est possédé uniquement par les hommes. Une femme pourra connaître l’ADN-Y de son patrilignage en demandant à son père, à son frère ou à un oncle paternel de fournir les prélèvements qui serviront aux analyses. Pour bien connaître l’ADN du chromosome Y d’un homme, il faut décrire le polymorphisme de répétition (les STR) et le polymorphisme d’état (les SNP). Deux tests distincts fourniront ces informations. Le premier établira une signature reposant sur un minimum de 25 marqueurs de type « Short Tandem Repeat » (STR). Les STR contribuent au polymorphisme de répétition et forment ce qu’on appelle parfois les microsatellites. Un second test examinera le polymorphisme d’état de l’ADN-Y et révélera la présence de mutations SNP singulières. Ces SNP permettent d’identifier l’haplogroupe et le sousclade (une subdivision de l’haplogroupe) d’appartenance de cet ADN-Y. Ce test est appelé « Deepclade ». Jusqu’en 2015 les résultats d’un test Geno2 fourniront la même information que le test « Deepclade » et pourront donc avantageusement le remplacer. Ultérieurement, d’autres tests plus avancés deviendront sûrement disponibles.

Deux signatures ADN-Y fournies par des hommes de même patronyme ou de variantes seront dites parfaitement concordantes si (1) l’ensemble des valeurs des marqueurs STR correspondants sur les deux signatures ne sont pas différentes de plus de 15%, et si (2) les deux signatures possèdent les mêmes SNP, appartenant ainsi au même haplogroupe ADN-Y et au même sousclade. La compagnie FTDNA estime par régression statistique l’haplogroupe d’appartenance lorsqu’un test portant sur 25 marqueurs est commandé. C’est un point de départ uniquement. Le diagnostique s’avère beaucoup plus précis (et valide) lorsqu’un test « Deepclade » distinct est commandé (ou le Geno2). L’haplogroupe et le sousclade sont alors déterminés en examinant le polymorphisme d’état révélé par les SNP, au lieu d’être estimé par régression. Il faut garder en tête que deux signatures peuvent concorder et être très semblables quant à leurs valeurs STR mais appartenir à des haplogroupes différents. Un test portant sur 25 marqueurs STR coûte environ 125$.

Avant de commander un test, il est important de parcourir les bases de données publiques comme YSearch.org ou MitoSearch.org pour s’assurer qu’une personne cadrant avec notre projet de triangulation n’aurait pas déjà passé un tel test. Dans le cas de l’ADN-Y, il s’agira d’un homme de même patronyme ou d’une variante. L’intérêt est évidemment de diminuer les coûts de la recherche généalogique par ADN. Le cas échéant, il s’agira alors de contacter ce généalogiste et de vérifier avec lui ou elle sa généalogie afin de déterminer si vous possédez un ACPR commun; et d’inviter ce cousin à participer à votre recherche.

Pour réaliser une triangulation valide

Les principes pour obtenir une triangulation valide sont les mêmes pour l’ADN-mt et l’ADN-Y. Prenons comme exemple la triangulation de la signature ADN-mt de m1, la matriarche en matrilignage du De-cujus #1. La signature du #1, de même que celle d’une autre personne avérée descendre de la même matriarche m1 sont requises. Évidemment cette autre personne doit posséder m1 dans son matrilignage. Leur ancêtre commune la plus rapprochée (ACPR) est alors déterminée à partir de leurs généalogies documentaires respectives. Pour que la triangulation soit parfaitement réussie, il faut que cet ACPR soit l’ancêtre m1, à l’apex du matrilignage de chacun. Autrement dit, il faut que le #1 et cette personne descendent de deux filles distinctes de m1, chacune donnant lieu à une lignée de femmes.

Une triangulation sera parfaitement réussie sur m1 si les trois concordances suivantes sont réalisées:
(1) les deux personnes présentent des signatures ADN-mt qui sont identiques; (2) les deux personnes sont descendantes avérées de m1 sur le plan documentaire et m1 fait partie de leur matrilinéage respectif; (3) leur ACPR en matrilignage est m1.

Si les concordances (1) ou (2) ne sont pas obtenues la triangulation échoue. Ainsi, si les signatures des personnes fournissant l’ADN ne correspondent pas, ou si leur ascendance matrilinéaire ou patrilinéaire respective ne convergent pas sur un ACPR, la triangulation échoue. Si uniquement (3) ne se trouve pas satisfait et que l’ACPR n’est pas la matriarche mais une de ses filles, alors la triangulation est réussie jusqu’à l’ACPR concerné. Il arrivera que l’ACPR ne soit pas m1 mais une de ses filles. C’est le cas lorsque m1 n’a eu qu’une seule fille ayant de la descendance jusqu’à ce jour. Rappelons que les deux personnes fournissant l’ADN-mt servant à la validation de la signature ancestrale matrilinéaire doivent descendre de deux filles distinctes de la matriarche. Une triangulation réussie sur la fille m1-1 de m1 ne valide le matrilignage que jusqu’à cette fille et non jusqu’à m1 en apex. Cette triangulation présente moins de validité que si m1 était l’ACPR. En effet, il est toujours possible qu’un ÉNP ou une erreur documentaire se soit produit entre la fille et m1. La validité d’une triangulation sur m1 correspondra donc à jusqu’à quel point la signature ADN-mt des personnes servant à la triangulation est bien celle de m1, l’ancêtre ciblé. Par rapport à m1, une triangulation ayant comme ACPR m1+1 est moins valide qu’une triangulation ayant m1 comme ACPR. Or, une validation partielle réussie sur un ACPR plus récent que l’ancêtre en apex est déjà bien mieux qu’aucune validation.

Les mêmes précautions méthodologiques s’appliquent lors de la validation de la signature ancestrale d’un patriarche. Ainsi, le patriarche p1 doit être l’ACPR des deux hommes qui fourniront la signature ADN-Y. Cette triangulation sur p1 ne sera réussie à 100% que si les signatures correspondent à celles de fils distincts de p1. Ces fils peuvent provenir de différents lits mais avoir le même père. Autrement, la triangulation ne pourra se faire que sur l’ACPR qui sera un des descendants plus en aval de p1.

Propective

Si suite aux triangulations réussies les signatures des ancêtres sont systématiquement cataloguées et enregistrées dans les bases de données accessibles au public, elles pourront par la suite servir de balises pour la recherche généalogique et seront disponibles pour la validation d’autres lignages dans la même généalogie ou dans d’autres ayant ces mêmes ancêtres en apex. Un homme ou une femme faisant partie d’une chaîne de descendance validée par triangulation peut aussi servir à la validation d’autres lignages dans la même généalogie ou dans une autre généalogie. En effet, le même ancêtre peut revenir comme géniteur dans divers lignages d’une même généalogie. Or si nous connaissons d’une précédente validation la signature ADN que cet ancêtre a transmise à sa descendance, cette connaissance pourra être utilisée par le généalogiste pour prédire l’ADN d’une série de descendants participant à d’autres lignages. Ainsi les signatures ADN-mt et ADN-Y et les haplogroupes des couples faisant partie de lignages validés devraient être consignées dans des bases de données et servir à la validation de lignées nouvelles.

En ce qui regarde les fondateurs du Canada français et de l’Acadie, le catalogage a débuté dans le cadre du projet ADN Héritage français (http://bit.ly/1bh9HmM). En outre, cette information sur l’ADN-mt et l’ADN-Y pourra éventuellement être incorporée à des bases-de-données généalogiques en tant que composante transmise héréditairement aux descendants, suivant le matrilignage ou le patrilignage respectif chacun. Une telle base-de-données généalogique sera en mesure de prédire la signature ADN-mt d’un descendant et, dans le cas d’un descendant masculin, de prédire par surcroît sa signature ADN-Y.

Ce travail de fondation de nos généalogies dans l’ADN prendra plusieurs années à se réaliser et donnera sans doute lieu à des débats captivants, voire controversés, à propos de la nature même de la généalogie, tantôt vue comme une entreprise essentiellement culturelle ou comme le résultat d’une articulation des données culturelles à celles fournies par l’analyse scientifique de la transmission de l’ADN.

Version du 2013-OCT-20

RÉFÉRENCES

VÉZINA, H., JOMPHE, M., LAVOIE, E, MOREAU, C. & LABUDA, D. (2012). L’apport des données génétiques à la mesure généalogique des origines amérindiennes des Canadiens français. Cahiers québécois de démographie, 41, 87-105.

Catalogue des signatures ancestrales validées se trouve à  http://signatures-ADN.org  et à  http://triangulations.ca

 

 

*L’ADN amérindien fondateur

La plupart des québécois de souche et des acadiens, et bien entendu leurs descendants, ont parmi leurs ancêtres des amérindiens. Il en est de même pour plusieurs descendants de premiers colons de l’Ouest et du Nord-Ouest américain. En effet, aux touts débuts de la colonie américaine, plusieurs colons fondèrent famille en prenant pour compagne une amérindienne. Des enfants amérindiens, souvent des esclaves *panis*, ont aussi été adoptés, ou encore ont été affranchis et se sont mêlés à la population d’origine européenne. Au cours du brassage génétique qui se fit jusqu’à nous, l’ADN amérindien des chromosomes autosomes et du chromosome X a graduellement été remplacé par des segments européens qui devinrent grandement majoritaires dans la population avec l’arrivée de nouveaux arrivants européens. Il est néanmoins parfois encore possible de retrouver dans notre ADN-Au et ADN-X des traces qui attestent d’origines amérindiennes. Par contre, l’ADN mitochondrial et l’ADN du chromosome Y des amérindiens se sont transmis intégralement jusqu’à aujourd’hui, de telle sorte qu’ils peuvent attester d’origines amérindiennes pour autant que cette contribution se soit produite par l’un ou l’autre de ces modes de transmission. Pour rappel, l’ADN-mt se transmet par la lignée utérine, suivant en cela notre matrilignage, et l’ADN-Y se transmet de père à fils, suivant en cela notre patrilignage.

Utilisation de l’ADN-Y

Le mode de transmission de l’ADN du chromosome Y autorise son utilisation pour retracer des origines amérindiennes en patrilignage, c’est-à-dire suivant la lignée des pères.

Or, décider si un ADN-Y (ou ADN-mt) est d’origine amérindienne ou non n’est pas une décision dont les critères sont nets et précis et cela pour trois raisons.

La première est que l’ADN amérindien fondateur constitue un sous-ensemble de l’ADN asiatique ou eurasien dont il est dérivé à l’origine. Les connaissances anthropogénétiques ne permettent pas toujours de les distinguer l’un de l’autre par leurs polymorphismes spécifiques. Les études se poursuivent à ce niveau.

La seconde est que l’ADN amérindien fondateur n’a pas définitivement été circonscrit. L’échantillonnage des populations amérindiennes se poursuit et la possibilité que de nouveaux haplogroupes amérindiens soient reconnus existe toujours, bien que très improbable.

La troisième raison est que l’ADN échantillonné dans les populations amérindiennes contemporaines n’est pas le reflet fidèle de l’ADN des fondateurs. En effet, environ 48% des hommes amérindiens de l’Est de l’Amérique Nord possèdent un chromosome Y d’origine européenne (Bolnick et al., 2006; Zegura et al., 2004). Cette *substitution* de l’ADN-Y fondateur par celui du colonisateur ne s’est pas produite dans le cas de l’ADN mitochondrial.

La Figure 1 illustre les proportions occupées par les divers haplogroupes rencontrés dans la population des hommes amérindiens d’après l’étude de Bolnick et al. (2006).

gadn001pic1

Figure 1. Proportions des haplogroupes ADN-Y rencontrés dans la population amérindienne (d’après Bolnick et al., 2006).

Les haplogroupes Q, C et P qui forment les pointes de l’hémicercle de droite seraient de l’ADN-Y fondateur. Les autres seraient des apports européens.

En effet, les spécialistes de l’ADN amérindien s’entendent pour reconnaître comme fondateur l’ADN-Y précolombien, celui qui existait en Amériques avant l’arrivée de Christophe Colomb et donc avant l’arrivée du colonisateur européen. Uniquement les trois haplogroupes suivants apparaissent dorénavant clairement comme amérindiens fondateurs:

P-M45*

C-P39 (ancien C-M130, et sousclades)

Q1a et plus en aval (Q-L53, Q-L54, Q-L55, Q-L213)

Un homme de la tribu des *Suqqaq*, un paléo-Eskimo du Groenland, dont les restes avaient été préservés par le froid depuis plus de 4,000 ans, ont été testés par Rasmussen et al. (2010). L’étude montre que son ADN-Y était Q1a*. Sa position par rapport aux amérindiens du même haplogroupe majeur est illustrée à la Figure 2.

gadn001pic2
Figure 2. Sousclades de l’haplogroupe majeur Q reconnus comme amérindiens.

La figure 2 peut être vue comme s’il s’agissait d’un arbre inversé dont les feuilles terminales se situent en bas de la figure. Le tronc a d’abord existé, sur lequel sont apparues des branches, puis des rameaux sont apparus sur ces branches. Sur cette figure, les branches situées après la mutation M346 seraient amérindiennes. Quant aux autres branches prenant leur origine avant le nœud M346, soit à partir de M242, elles seraient eurasiennes.
Il en est de même pour les haplogroupes P et C. Les recherches qui sont en cours pourront éventuellement ajouter d’autres branches amérindiennes aux classifications Q, P et C. Mais pour l’heure, les hommes amérindiens, québécois, acadiens ou américains dont l’ADN-Y appartient à P-M45, Q-M346 ou C-P39 et aux sousclades plus en aval de ces nœuds peuvent légitimement prétendre avoir un ancêtre amérindien en patrilignage. Ceux par contre qui appartiennent à d’autres branches de ces arbres doivent pour l’instant demeurer dans l’incertitude.

Quant aux hommes dont l’ADN-Y appartient à un autre haplogroupe majeur, par exemple à R, I, J, E, ils peuvent être certains que leur patrilignage n’est pas d’origine amérindienne. Leur ADN-Y a probablement été introduit suite à la colonisation par les européens. Et cet ADN n’est pas toujours européen puisque les européens entraînaient avec eux des hommes d’origines biogéographiques fort diverses, par exemple des africains.

La substitution de gènes européens à ceux des autochtones peut être considérée comme une forme de génocide (au sens littéral du terme). Or, paradoxalement, l’ADN européen a pu procurer un avantage sélectif à ceux qui le possédaient une fois que les épidémies de maladies de l’ancien monde se soient installées en terre d’Amérique. Ainsi, les amérindiens possédant des gènes européens ont pu davantage résister et survivre aux maladies introduites par les européens.

Utilisation de l’ADN-mt

L’ADN contenu par nos mitochondries peut aussi révéler des origines amérindiennes. Cet ADN-mt est transmis par les mères. Les haplogroupes ADN-mt suivants sont considérés amérindiens fondateurs selon Guardado-Estrada et al. (2009):

A2
B2
C1 (et ses sousclades)
D1
X2a (?)

Contrairement à ce qu’indiquent certaines compagnies de tests, il ne suffit pas qu’un ADN-mt appartienne à l’haplogroupe A, B, C ou D pour relever d’origines amérindiennes. Et encore moins à X2. Tous ces haplogroupes majeurs sont aussi rencontrés en Asie et, à un moindre degré, en Europe. À ce compte, la plupart des coréens seraient déclarés amérindiens.

La recherche montre que certains sousclades des haplogroupes majeurs A, B, C et D sont amérindiens. Cependant, pour connaître le sousclade d’un ADN, il faut le plus souvent le soumettre à un test qui examine en détail les variations polymorphiques de tout le génome de la mitochondrie et non uniquement ses régions hypervariables HVR1 et HVR2. C’est souvent la présence de variations ailleurs dans le génome qui permet de classer un ADN dans un sousclade particulier de son haplogroupe. On trouvera la classification à jour pour l’ADN mitochondrial à PhyloTree.org

Dans le cas de l’haplogroupe A, ce sont les cas appartenant à son sousclade A2 qui sont reconnus amérindiens de souche. C’est souvent la présence de la variation C16111T dans la région HVR1 qui justifie le classement dans le sousclade A2.
Cette variation est très rarement trouvée dans l’ADN de l’haplogroupe A des asiatiques. Chez les amérindiens et métis A2, on retrouve très souvent aussi les variations A153G et A235G (Guardado-Estrada et al., 2009).

Or, la variation C16111T n’est pas toujours présente. Ainsi, chez les mexicains elle est absente de l’ADN du sousclade A2 dans environ 17% des cas. C’est qu’elle est retournée à un état ancestral. Un examen des variations qui lui sont phylogénétiquement antérieures s’avère alors requis. Si les autres variations faisant partie de la phylogénèse vers C16111T sont aussi présentes, alors c’est que nous sommes en présence d’une réversion. Par contre, si toutes les variations phylogénétiquement antérieures sont aussi absentes, c’est qu’il n’y a pas eu de réversion de C16111T; il faut alors considérer que cette variation C16111T n’a jamais été présente dans cet ADN-mt. Il est en effet hautement improbable, pour ne pas dire *impossible*, que toutes les variations qui définissent un chemin phylogénétique se renversent toutes.

L’ADN-mt de la Fille du Roi Catherine Pillard appartient à l’haplogroupe A. Cependant, la variation C16111T, de même que les variations qui lui auraient été phylogénétiquement antérieures sont aussi absentes chez ses descendantes utérines. La conclusion qui s’impose est que cet ADN-mt n’appartient pas au sousclade A2, amérindien. La classification de PhyloTree.org le placera dans le sousclade A10 en 2009.

Le statut de l’haplogroupe X comme amérindien *fondateur* est de plus en plus précaire, relié en partie à un problème de définition de ce qui est *fondateur*. En effet, X serait arrivé d’Europe mais avant l’arrivée de la colonisation *officielle*. En effet, l’haplogroupe X serait arrivé en Amérique du Nord depuis l’Europe par le Nord-est, avant la grande colonisation européenne. Une possibilité est que cet haplogroupe ait été introduit il y a fort longtemps par des Solutréens, passés par la banquise ou en cabotage. Une autre possibilité est qu’il ait été apporté plus récemment par des Vikings partis d’Islande s’établir au Groenland, puis sur la côte du Labrador (Terre-Neuve; Vineland). Il est aussi admis que des européens ont fréquenté la côte Est du Canada et s’y sont établis au moins temporairement pour la chasse à la baleine avant même sa *découverte* par Jacques Cartier en 1534. L’hypothèse que X2b soit arrivé par l’Est n’est pas supportée par les travaux de Kashani et al. (2012). Ils suggèrent plutôt que X2b soit arrivé par l’Ouest, via la Béringie. Il est difficile d’expliquer pourquoi X2b n’a pas pénétré davantage les Amériques, comme les autres haplogroupes. Une question de nombre de fondateurs peut-être. Ainsi l’étude de Guardado-Estrada et al. (2009) a porté sur un échantillonnage représentatif de 270 femmes mexicaines et aucun cas appartenant à l’haplogroupe X n’a été rencontré. Par contre, les haplogroupes A2, B2, C1 et D1 ont été dénombrés dans des proportions semblables à celles rencontrées dans les populations amérindiennes de l’Est des États-Unis et du Canada. Ces proportions sont illustrées à la Figure 3.
gadn001pic3

Figure 3. Proportions des haplogroupes ADN-mt échantillonnés par Guardado-Estrada et al. (2009).

Les ossements du chef Nonosabasut de la tribu amérindienne des Béothuks du Labrador s’avèrent appartenir à l’haplogroupe ADN-mt X2a (www.ISOGG.ORG, Rubrique « Ancient DNA »). Bien que son haplogroupe ADN-Y fut Q-M3 et donc clairement amérindien, son ADN mitochondrial pourrait être d’origine européenne. Nonosabasut et sa femme furent assassinés par des blancs en Mars 1819 et leurs restes examinés par Kuch et al. (2006).

Bandelt et al. (2003) suggèrent que pour qu’un ADN-mt de l’haplogroupe X soit considéré amérindien, il faut qu’il présente les variations 8913, 12397 et 14502. Leur présence ne peut être vérifiée que par un séquençage complet du génome de la mitochondrie, test appelé *FMS* pour Full Mitochondrial Sequencing. Dans l’ensemble, nous pouvons dire qu’appartenir à l’haplogroupe X n’est pas un signe clair d’origines amérindiennes. L’appartenance au sousclade X2a le serait par contre (Kashani et al., 2012). X2b serait européen. D’autres recherches se poursuivent sur l’haplogroupe X.

Utilisation de l’ADN autosome et de celui du chromosome sexuel X

L’ADN des chromosomes autosomes 1 à 22, de même que celui du chromosome X peut servir à supporter ou à invalider une hypothèse quant à des origines amérindiennes du porteur. Cependant, le généalogiste devra se fier au pronostic posé par la compagnie qui effectuera un test biogéographique sur son ADN autosome.

Chacun de nous est un mélange d’ADN provenant d’ancêtres d’origines biogéographiques différentes. Par exemple, un personne peut présenter des origines à la fois indo-européennes par un parent et amérindiennes par l’autre parent. Les tests d’ADN-mt et ADN-Y pourront détecter de tels métissages en autant que le mélange s’est produit ou est reflété par le matrilignage et le patrilignage.
La situation la plus simple consistera à établir que l’haplogroupe ADN-Y d’un homme est R1b1c, eurasien, alors que son ADN-mt appartiendrait à l’haplogroupe A2, amérindien. Cet homme sera vraisemblablement le résultat d’un métissage, même lointain, entre un père d’origine ancestrale européenne et une mère d’origine ancestrale amérindienne. Or, ces deux lignages attesteront le plus souvent d’origines homogènes, soit celles qui correspondent à celles de la majorité dans la population.

Les tests biogéographiques pourront utiliser divers types d’ADN et les résultats de tests monoparentaux ou biparentaux. Ainsi, les résultats de tests CODIS, un test biparental, pourront servir à cette fin. Le CODIS est un test surtout utilisé par la médecine légale, à des fins d’identification judiciaire ou encore de confirmation de paternité ou de maternité. Le CODIS 13 est le plus couramment utilisé et repose sur 13 paires de valeurs dont les 12 premières sont des lectures de répétitions courtes en tandem (STR) notées sur 11 paires de chromosomes différents. La 13e lecture est prise sur chacun des chromosomes de la paire sexuelle et fournit le sexe du porteur.

Or, il s’avère que les valeurs des 12 microsatellites corrèlent assez bien avec les origines *raciales* ou ethniques des porteurs. Ce sont donc ces corrélations qui servent à établissent des profils qui serviront ensuite à *profiler* statistiquement des cas individuels qu’il faut situer sur le plan biogéographique.
La seconde approche combine l’information obtenue à propos de l’ADN monoparental et de l’ADN-A et X. Ainsi, les haplogroupes respectifs de l’ADN-mt et ADN-Y (s’il s’agit d’un homme) sont déterminés. En plus, l’ADN est examiné pour la présence d’une batterie de polymorphismes SNP dont la fréquence relative est connue dans les diverses populations ethniques ou localisées géographiquement.

Certains tests biogéographiques, en plus d’utiliser l’ADN-mt et ADN-Y, utiliseront l’ADN-A et ADN-X pour déceler le dosage approximatif des multiples origines d’une personne. La lecture des polymorphismes rencontrés dans les autres types d’ADN-A et ADN-X d’une personne sera comparée à celle de profils préétablis. Des techniques statistiques classificatoires seront appliquées pour situer l’individu dans un espace biogéographique multidimensionnel. Ainsi, la compagnie *DNA Tribes* (www.dnatribes.com) procède à de telles analyses sans révéler quels polymorphismes servent à classer les individus. Cela demeure un secret commercial.

Les résultats illustrés à la Figure 4 sont ceux que l’auteur a obtenus suite à des analyses auprès de la compagnie *DNA Print genomics*, devenue depuis *Ancestry by DNA* (www.ancestrybydna.com/index.php).

gadn001pic4

Figure 4. Sommaire des résultats d’un test biogéographique passé en 2005 auprès de la compagnie DNA-print Genomics. Référer au texte pour des explications.

Les résultats sont représentés sur une pyramide dont chacune des pointes correspond à l’un de quatre sous-groupes biogéographiques. Pour bien visualiser, il faut en imagination plier la figure aux lignes démarquant le triangle interne de cette figure et rabattre les trois triangles des côtés pour former la pyramide dont le sommet devient «East Asian». Le point rouge indique l’estimé du maximum de vraisemblance (MLE). Ce point peut être situé en principe n’importe où dans le volume de la pyramide. Dans le cas présent, il est situé près de l’apex «Européen» et sur l’arrête entre «Européen» et «Amérindien». La projection de ce point sur la dimension amérindienne (une ligne imaginaire partant de l’apex «Amérindien» et qui descend perpendiculairement à la ligne «Européen»-«Africain subsaharien») équivaut à environ 5%, alors que la projection de ce même point sur la dimension «Européen» est approximativement de 95%. Une fois les triangle de côté repliés pour former la pyramide, les cernes autour du point forment des intervalles de confiance. Ainsi, il y a une chance sur mille de se tromper en affirmant que le point se trouve dans la zone délimitée par le cercle bordé de jaune qui est le plus grand; 1 chance sur 100 de se tromper qu’il se trouve dans le cercle bordé de bleu; 5 chances sur 100 de se tromper en disant qu’il se trouve dans le cercle délimité par la ligne noire.

La détection de SNP asiatiques, européens et africains pourra aussi être réalisée lors d’un séquençage partiel du génome. Les compagnies 23andMe (www.23andme.org) et DecodeMe (www.decodeme.com) réalisent de tels séquençages partiels pour le grand public. À l’aide d’une BDD préétablies, elles sont en mesure d’identifier les motifs caractéristiques de trois grands régions biogéographiques, soit l’Afrique, l’Asie et l’Europe. Pour l’instant, les motifs amérindiens et asiatiques sont confondus. Mais, pour une personne à la recherche de ses racines amérindiennes et qui a des raisons de croire ne pas avoir d’ancêtres asiatiques, les segments asiatiques peuvent être considérés comme des segments amérindiens.

La Figure 5 illustre les résultats picturaux fournis par 23andMe pour illustrer les origines biogéographiques des segments d’ADN. Chaque représentation porte sur les 22 paires de chromosomes de l’ADN autosome. À gauche, l’ADN-A de l’auteur et à droite une représentation de celui d’une femme amérindienne contemporaine. Les segments asiatiques y apparaissent peints orange, les segments noirs sont, selon la compagnie, européens. Les gris n’ont pas été testés. Les origines amérindiennes de l’auteur qui sont documentées sont relativement lointaines. Elles remontent à Olive Silvestre Manitouabeouich qui a épousé Martin Prévost en la ville de Québec le 3 Novembre 1644 (PRDH #66353 ). Cette amérindienne fait partie de la généalogie de nombreux descendants des fondateurs de la Nouvelle France. Comme on pourra le constater, après 9 générations et autant de brassages, la dérive génétique conduit à un tout petit segment sur bras court du chromosome 8, vestige susceptible d’attester de cette contribution amérindienne.

gadn001pic5

Figure 5. Caractérisation biogéographique de l’ADN autosome par la compagnie 23andMe. À gauche, ADN-A de l’auteur; à droite, celui d’une femme amérindienne.

Il est aussi possible de faire tester individuellement le microsatellite D9S919 situé sur le chromosome 9. Ce microsatellite est présent sous une forme courte chez plusieurs amérindiens (environ 33%) et peut, s’il est présent dans votre ADN-A, attester d’origines amérindiennes récentes.

Conclusions

Il est possible de trouver dans l’ADN des traces attestant d’origines amérindiennes. À ce jour, les indices les plus fiables sont ceux fournis par un examen des sousclades respectifs de l’ADN mitochondrial et de l’ADN du chromosome Y. Puisque l’ADN monoparental ne se recombine pas et est transmis intégralement ou presque au descendant, il peut servir d’indicateur pour des origines amérindiennes fort anciennes. Quant à l’ADN autosome, il peut aussi fournir des indices sur un apport amérindien mais ceux-ci seront difficiles à distinguer d’un apport asiatique. De plus, l’ADN-A étant soumis à une recombinaison à chacune des générations, à moins d’une réalimentation régulière en ADN amérindien, la dérive génétique aura vite fait de remplacer l’apport génétique spécifiquement amérindien par celui dominant dans la population; cela contribuera donc à le faire disparaître graduellement de cette population. Son absence dans l’ADN-A ou X d’une personne pourra donc être fort trompeuse.

Références

Bandelt, H.-J. et al. (2003). Identification of Native American Founder mtDNAs Through the Analysis of Complete mtDNA Sequences: Some Caveats Annals of Human Genetics, 67, 512–524.

Bolnick, D.A. et al. (2006). Asymmetric Male and Female GeneticHistories among Native Americans from Eastern North America Mol.Biol. Evol., 23, 2161–2174.
Guardado-Estrada M. et al. (2009). A great diversity of Amerindian mitochondrial DNA ancestry is present in the Mexican mestizo population. J. Hum. Genet., 54, 695-705.

Kashani et al. (2012). Mitochondrial Haplogroup C4c: A Rare Lineage Entering America Through the Ice-Free Corridor? Am. J. Phys. Anthropol., 147, 35–39.

Kuch M. et al. (2006). A preliminary analysis of the DNA and diet of the extinct Beothuk: A systematic approach to ancient human DNA. Am. J. Phys. Anthropol., 132, 594–694.

Rasmussen et al. (2010). Ancient humangenome sequence of an extinct Palaeo-Eskimo. Nature, 463,757-762.

Tamm E, Kivisild T, Reidla M, Metspalu M, Smith DG, et al. (2007) Beringian Standstill and Spread of Native American Founders. PLoS ONE 2(9): e829. doi:10.1371/journal.pone.0000829

Zegura S.L. et al., (2004). High-resolution SNPs and microsatellite haplotypes point to a single, recent entry of Native American Y chromosomes into the Americas. Mol. Biol. Evol., 2004, 21, 164–175.

gadn001pic6