Haplotyp - Haplotype

DNA-Molekül 1 unterscheidet sich von DNA-Molekül 2 an einer einzigen Basenpaarstelle (ein C/A-Polymorphismus).

Ein Haplotyp ( haploider Genotyp ) ist eine Gruppe von Allelen in einem Organismus , die gemeinsam von einem einzigen Elternteil vererbt werden.

Viele Organismen enthalten genetisches Material ( DNA ), das von zwei Elternteilen vererbt wird. Normalerweise ist die DNA dieser Organismen in zwei Sätzen von paarweise ähnlichen Chromosomen organisiert . Die Nachkommen erhalten von jedem Elternteil ein Chromosom in jedem Paar. Ein Satz von Chromosomenpaaren wird als diploid bezeichnet und ein Satz von nur einer Hälfte jedes Paares wird als haploid bezeichnet. Der haploide Genotyp (Haplotyp) ist ein Genotyp, der die einzelnen Chromosomen und nicht die Chromosomenpaare berücksichtigt. Es können alle Chromosomen eines Elternteils oder ein kleiner Teil eines Chromosoms sein, zum Beispiel eine Sequenz von 9000 Basenpaaren .

Es gibt jedoch andere Verwendungen dieses Begriffs. Erstens wird es verwendet, um eine Sammlung spezifischer Allele (d. h. spezifischer DNA- Sequenzen) in einem Cluster eng verbundener Gene auf einem Chromosom zu bezeichnen , die wahrscheinlich zusammen vererbt werden – d. h., sie sind wahrscheinlich als Sequenz konserviert die die Abstammung vieler Generationen der Fortpflanzung überlebt. Eine zweite Verwendung ist, einen Satz von verknüpften Einzelnukleotidpolymorphismus (SNP)-Allelen zu meinen , die dazu neigen, immer zusammen aufzutreten (dh die statistisch assoziiert sind ). Es wird angenommen, dass die Identifizierung dieser statistischen Assoziationen und einiger weniger Allele einer spezifischen Haplotypsequenz die Identifizierung aller anderen solchen polymorphen Stellen erleichtern kann, die sich in der Nähe des Chromosoms befinden. Solche Informationen sind entscheidend für die Erforschung der Genetik von Volkskrankheiten ; die tatsächlich vom International HapMap Project am Menschen untersucht wurden . Drittens verwenden viele Unternehmen für humangenetische Tests den Begriff auf eine dritte Art: um sich auf eine individuelle Sammlung spezifischer Mutationen innerhalb eines bestimmten genetischen Segments zu beziehen; (siehe kurze Tandem-Repeat- Mutation).

Der Begriff „ Haplogruppe “ bezieht sich auf die SNP/ Unique-Event-Polymorphismus (UEP)-Mutationen, die die Klade darstellen, zu der eine Sammlung bestimmter menschlicher Haplotypen gehört. (Klade bezieht sich hier auf eine Reihe von Haplotypen, die einen gemeinsamen Vorfahren teilen.) Eine Haplogruppe ist eine Gruppe ähnlicher Haplotypen, die einen gemeinsamen Vorfahren mit einer Einzelnukleotid-Polymorphismus- Mutation teilen . Mitochondriale DNA geht entlang einer mütterlichen Abstammungslinie weiter , die Tausende von Jahren zurückreichen kann.

Haplotyp-Auflösung

Der Genotyp eines Organismus definiert seinen Haplotyp möglicherweise nicht eindeutig. Betrachten Sie beispielsweise einen diploiden Organismus und zwei biallelische Loci (wie SNPs ) auf demselben Chromosom. Es sei angenommen , der erste Locus weist Allele A oder T , und die zweite Locus G oder C . Beide Loci haben dann drei mögliche Genotypen : ( AA , AT und TT ) bzw. ( GG , GC und CC ). Für ein bestimmtes Individuum gibt es neun mögliche Konfigurationen (Haplotypen) an diesen beiden Loci (im Punnett-Quadrat unten gezeigt). Bei Individuen, die an einem oder beiden Loci homozygot sind, sind die Haplotypen eindeutig – was bedeutet, dass es keine Unterscheidung zwischen Haplotyp T1T2 und Haplotyp T2T1 gibt; wobei T1 und T2 beschriftet sind, um zu zeigen, dass sie der gleiche Locus sind, aber als solche beschriftet sind, um zu zeigen, dass es egal ist, in welcher Reihenfolge Sie sie betrachten, das Endergebnis sind zwei T-Loci. Für Personen heterozygot an beiden Loci, die Gameten Phase ist nicht eindeutig - in diesen Fällen Sie nicht wissen , welche Haplotyp Sie haben, zB TA vs AT.

AA BEIM TT
GG EIN GAG AG TG TG TG
GC AG AC AG TC
oder
AC TG
TG TC
CC Wechselstrom Wechselstrom AC TC TC TC

Die einzige eindeutige Methode zur Auflösung der Phasenmehrdeutigkeit ist die Sequenzierung . Es ist jedoch möglich, die Wahrscheinlichkeit eines bestimmten Haplotyps zu schätzen, wenn die Phase mehrdeutig ist, indem eine Stichprobe von Individuen verwendet wird.

Angesichts der Genotypen für eine Reihe von Individuen können die Haplotypen durch Haplotyp-Auflösung oder Haplotyp-Phasen-Techniken abgeleitet werden. Diese Methoden funktionieren, indem sie die Beobachtung anwenden, dass bestimmte Haplotypen in bestimmten Genomregionen üblich sind. Daher wählen diese Methoden bei einer Reihe möglicher Haplotypauflösungen diejenigen aus, die insgesamt weniger verschiedene Haplotypen verwenden. Die Besonderheiten dieser Methoden variieren – einige basieren auf kombinatorischen Ansätzen (z. B. Sparsamkeit ), während andere Likelihood-Funktionen basierend auf verschiedenen Modellen und Annahmen wie dem Hardy-Weinberg-Prinzip , dem Koaleszenztheoriemodell oder der perfekten Phylogenie verwenden. Die Parameter in diesen Modellen werden dann unter Verwendung von Algorithmen wie dem Erwartungsmaximierungsalgorithmus (EM), der Markov-Kette Monte Carlo (MCMC) oder Hidden-Markov-Modellen (HMM) geschätzt .

Die mikrofluidische Haplotypisierung des gesamten Genoms ist eine Technik zur physikalischen Trennung einzelner Chromosomen aus einer Metaphase- Zelle, gefolgt von einer direkten Auflösung des Haplotyps für jedes Allel.

Y-DNA-Haplotypen aus genealogischen DNA-Tests

Im Gegensatz zu anderen Chromosomen kommen Y-Chromosomen im Allgemeinen nicht paarweise vor. Jeder männliche Mensch (außer denen mit XYY-Syndrom ) hat nur eine Kopie dieses Chromosoms. Dies bedeutet, dass es keine zufällige Variation der Kopie gibt, die vererbt wird, und auch (für den größten Teil des Chromosoms) kein Mischen zwischen Kopien durch Rekombination ; Im Gegensatz zu autosomalen Haplotypen gibt es also effektiv keine Randomisierung des Y-Chromosom-Haplotyps zwischen den Generationen. Ein männlicher Mensch sollte weitgehend das gleiche Y-Chromosom wie sein Vater haben, einige Mutationen geben oder nehmen; Daher neigen Y-Chromosomen dazu, weitgehend intakt vom Vater auf den Sohn zu übertragen, mit einer kleinen, aber sich ansammelnden Anzahl von Mutationen, die dazu dienen können, männliche Abstammungslinien zu unterscheiden. Insbesondere sollte die Y-DNA, die als nummerierte Ergebnisse eines genealogischen DNA-Tests der Y-DNA dargestellt wird , mit Ausnahme von Mutationen übereinstimmen.

UEP-Ergebnisse (SNP-Ergebnisse)

Unique-Event-Polymorphismen (UEPs) wie SNPs repräsentieren Haplogruppen . STRs repräsentieren Haplotypen. Die Ergebnisse, die den vollen Y-DNA - Haplotyp von dem Y-Chromosom - DNA - Test umfassen , können in zwei Teile aufgeteilt werden: Die Ergebnisse für UEPs, manchmal losen die SNP Ergebnisse genannt , da die meisten UEPs sind single-nucleotide polymorphisms , und die Ergebnisse für die Mikrosatelliten - short tandem Wiederholungssequenzen ( Y-STRs ).

Die UEP-Ergebnisse stellen die Vererbung von Ereignissen dar, von denen angenommen wird, dass sie nur einmal in der gesamten Menschheitsgeschichte stattgefunden haben. Diese können verwendet werden, um die Y-DNA-Haplogruppe des Individuums zu identifizieren , seinen Platz im "Stammbaum" der gesamten Menschheit. Verschiedene Y-DNA-Haplogruppen identifizieren genetische Populationen, die oft eindeutig mit bestimmten geographischen Regionen assoziiert sind; ihr Auftreten in neueren Populationen in verschiedenen Regionen repräsentiert die Wanderungen der direkten patrilinearen Vorfahren heutiger Individuen vor Zehntausenden von Jahren .

Y-STR-Haplotypen

Genetische Ergebnisse umfassen auch den Y-STR-Haplotyp , den Satz von Ergebnissen aus den getesteten Y-STR-Markern.

Im Gegensatz zu den UEPs mutieren die Y-STRs viel leichter, was es ihnen ermöglicht, die neuere Genealogie zu unterscheiden. Es bedeutet aber auch, dass sich die Y-STR-Haplotypen wahrscheinlich auseinander gestreut haben , anstatt die Population der Nachkommen eines genetischen Ereignisses, die alle das gleiche Ergebnis teilen , zu einem Cluster von mehr oder weniger ähnlichen Ergebnissen zu bilden. Typischerweise hat dieser Cluster ein definitives wahrscheinlichstes Zentrum, den modalen Haplotyp (vermutlich ähnlich dem Haplotyp des ursprünglichen Gründungsereignisses) und auch eine Haplotyp-Diversität – den Grad, in dem er sich ausgebreitet hat. Je weiter in der Vergangenheit das bestimmende Ereignis stattfand und je früher das nachfolgende Populationswachstum eintrat, desto größer wird die Haplotyp-Diversität für eine bestimmte Anzahl von Nachkommen sein. Wenn jedoch die Haplotyp-Diversität für eine bestimmte Anzahl von Nachkommen geringer ist, kann dies auf einen jüngeren gemeinsamen Vorfahren oder eine kürzliche Populationsexpansion hindeuten.

Es ist wichtig zu beachten, dass im Gegensatz zu UEPs zwei Individuen mit einem ähnlichen Y-STR-Haplotyp nicht unbedingt eine ähnliche Abstammung haben. Y-STR-Ereignisse sind nicht eindeutig. Stattdessen neigen die Cluster von Y-STR-Haplotyp-Ergebnissen, die von unterschiedlichen Ereignissen und unterschiedlichen Geschichten geerbt wurden, dazu, sich zu überlappen.

In den meisten Fällen ist es lange her, dass die Haplogruppen die Ereignisse definieren, so dass typischerweise die Gruppe von Y-STR-Haplotyp-Ergebnissen, die mit Nachkommen dieses Ereignisses verbunden sind, ziemlich breit geworden ist. Diese Ergebnisse neigen dazu, die (ähnlich breiten) Cluster von Y-STR-Haplotypen, die mit anderen Haplogruppen assoziiert sind, signifikant zu überlappen. Dies macht es für Forscher unmöglich, mit absoluter Sicherheit vorherzusagen, auf welche Y-DNA-Haplogruppe ein Y-STR-Haplotyp hinweisen würde. Wenn die UEPs nicht getestet werden, können die Y-STRs nur verwendet werden, um Wahrscheinlichkeiten für die Abstammung der Haplogruppe vorherzusagen, nicht aber Gewissheiten.

Ein ähnliches Szenario besteht bei dem Versuch zu bewerten, ob gemeinsame Nachnamen auf eine gemeinsame genetische Abstammung hinweisen. Ein Cluster ähnlicher Y-STR-Haplotypen kann auf einen gemeinsamen gemeinsamen Vorfahren mit einem identifizierbaren modalen Haplotyp hinweisen, jedoch nur, wenn sich der Cluster ausreichend von dem unterscheidet, was zufällig von verschiedenen Individuen passiert sein könnte, die historisch gesehen unabhängig voneinander denselben Namen angenommen haben. Viele Namen wurden beispielsweise von gängigen Berufen übernommen oder mit der Besiedlung bestimmter Stätten in Verbindung gebracht. Eine umfassendere Haplotyp-Typisierung ist erforderlich, um eine genetische Genealogie zu etablieren. Kommerzielle DNA-Testunternehmen bieten ihren Kunden jetzt das Testen zahlreicherer Sets von Markern an, um die Definition ihrer genetischen Abstammung zu verbessern. Die Anzahl der getesteten Markersätze ist von 12 in den Anfangsjahren auf 111 in letzter Zeit gestiegen.

Es ist deutlich schwieriger, eine plausible Verwandtschaft zwischen verschiedenen Nachnamen herzustellen, die aus einer Datenbank gewonnen wurden. Der Forscher muss feststellen, dass es unwahrscheinlich ist, dass das nächstgelegene Mitglied der fraglichen Population, das aus diesem Grund absichtlich aus der Population ausgewählt wurde, zufällig zusammenpasst. Dies ist mehr als die Feststellung, dass es unwahrscheinlich ist, dass ein zufällig ausgewähltes Mitglied der Bevölkerung zufällig eine so enge Übereinstimmung hat. Aufgrund der Schwierigkeit ist es wahrscheinlich unmöglich, die Verwandtschaft zwischen verschiedenen Nachnamen wie in einem solchen Szenario festzustellen, außer in besonderen Fällen, in denen spezifische Informationen vorliegen, um die Größe der untersuchten Kandidatenpopulation drastisch zu begrenzen.

Vielfalt

Die Haplotyp-Diversität ist ein Maß für die Einzigartigkeit eines bestimmten Haplotyps in einer bestimmten Population. Die Haplotyp-Diversität (H) wird berechnet als: wobei die (relative) Haplotyp-Häufigkeit jedes Haplotyps in der Stichprobe und die Stichprobengröße ist. Die Haplotyp-Diversität ist für jede Probe angegeben.

Siehe auch

Software

  • FAMHAP — FAMHAP ist eine Software zur Einzelmarker-Analyse und insbesondere zur gemeinsamen Analyse von nicht phasengesteuerten Genotypdaten von eng verknüpften Markern (Haplotyp-Analyse).
  • FugueEM- basierte Haplotypschätzung und Assoziationstests in nicht verwandten und Kernfamilien.
  • HPlus — Ein Softwarepaket zur Imputation und Prüfung von Haplotypen in Assoziationsstudien unter Verwendung einer modifizierten Methode, die den Erwartungsmaximierungsalgorithmus und eine Bayessche Methode, die als progressive Ligation bekannt ist, enthält.
  • HaploBlockFinder — Ein Softwarepaket zur Analyse der Haplotyp-Blockstruktur.
  • Haploscribe – Rekonstruktion von Haplotypen mit ganzen Chromosomen basierend auf allen genotypisierten Positionen in einer Kernfamilie, einschließlich seltener Varianten.
  • Haploview – Visualisierung des Kopplungsungleichgewichts , Haplotyp-Schätzung und Haplotyp-Tagging ( Homepage ).
  • HelixTree — Haplotyp-Analysesoftware - Haplotyp- Trendregression (HTR), haplotypische Assoziationstests und Haplotyp-Häufigkeitsschätzung unter Verwendung des Erwartungsmaximierungs-Algorithmus (EM) und der zusammengesetzten Haplotyp-Methode (CHM).
  • PHASE – Eine Software für die Rekonstruktion von Haplotypen und die Schätzung der Rekombinationsrate aus Populationsdaten.
  • SHAPEIT — SHAPEIT2 ist ein Programm zur Haplotypschätzung von SNP-Genotypen in großen Kohorten über das gesamte Chromosom.
  • SNPHAPEM- basierte Software zur Schätzung der Haplotyphäufigkeit von nicht phasengesteuerten Genotypen.
  • WHAPHaplotyp- basierte Assoziationsanalyse.

Verweise

Externe Links