Internationales HapMap-Projekt - International HapMap Project

Die International HapMap Project war eine Organisation , dass das Ziel der Entwicklung eines Haplotyp Karte ( HapMap ) des menschlichen Genoms , die gemeinsamen Muster menschlicher zu beschreiben genetischer Variation . HapMap wird verwendet, um genetische Varianten zu finden, die sich auf Gesundheit, Krankheit und Reaktionen auf Medikamente und Umweltfaktoren auswirken. Die vom Projekt erzeugten Informationen werden für Forschungszwecke frei zur Verfügung gestellt.

Das International HapMap Project ist eine Zusammenarbeit von Forschern an akademischen Zentren, gemeinnützigen biomedizinischen Forschungsgruppen und privaten Unternehmen in Kanada , China (einschließlich Hongkong ), Japan , Nigeria , Großbritannien und den USA . Es begann offiziell mit einem Treffen vom 27. bis 29. Oktober 2002 und sollte etwa drei Jahre dauern. Es besteht aus zwei Phasen; Die vollständigen Daten aus Phase I wurden am 27. Oktober 2005 veröffentlicht. Die Analyse des Phase-II-Datensatzes wurde im Oktober 2007 veröffentlicht. Der Phase-III-Datensatz wurde im Frühjahr 2009 veröffentlicht und die Veröffentlichung mit den endgültigen Ergebnissen im September 2010 veröffentlicht.

Hintergrund

Anders als bei den selteneren Mendelschen Krankheiten spielen Kombinationen verschiedener Gene und der Umwelt eine Rolle bei der Entwicklung und dem Fortschreiten häufiger Krankheiten (wie Diabetes , Krebs , Herzerkrankungen , Schlaganfall , Depression und Asthma ) oder bei der individuellen Reaktion auf pharmakologische Erkrankungen Agenten. Um die genetischen Faktoren zu finden, die an diesen Krankheiten beteiligt sind, könnte man im Prinzip eine genomweite Assoziationsstudie durchführen : Ermitteln Sie die vollständige genetische Sequenz mehrerer Individuen, einige mit und andere ohne Krankheit, und suchen Sie dann nach Unterschieden zwischen den beiden Genomsätzen . Zu diesem Zeitpunkt war dieser Ansatz aufgrund der Kosten für die vollständige Genomsequenzierung nicht durchführbar . Das HapMap-Projekt schlug eine Verknüpfung vor.

Obwohl zwei nicht verwandte Personen etwa 99,5% ihrer DNA- Sequenz gemeinsam haben, unterscheiden sich ihre Genome an bestimmten Nukleotidstellen . Solche Stellen sind als Einzelnukleotidpolymorphismen (SNPs) bekannt, und jede der möglichen resultierenden Genformen wird als Allel bezeichnet . Das HapMap-Projekt konzentriert sich nur auf gemeinsame SNPs, bei denen jedes Allel in mindestens 1% der Bevölkerung vorkommt.

Jede Person hat zwei Kopien aller Chromosomen mit Ausnahme der Geschlechtschromosomen bei Männern . Für jedes SNP wird die Kombination von Allelen einer Person als Genotyp bezeichnet . Genotypisierung bezieht sich auf das Aufdecken des Genotyps einer Person an einem bestimmten Ort. Das HapMap-Projekt wählte eine Stichprobe von 269 Personen aus und wählte mehrere Millionen genau definierte SNPs aus, genotypisierte die Personen für diese SNPs und veröffentlichte die Ergebnisse.

Die Allele benachbarter SNPs auf einem einzelnen Chromosom sind korreliert. Insbesondere wenn das Allel eines SNP für ein bestimmtes Individuum bekannt ist, können die Allele benachbarter SNPs häufig vorhergesagt werden. Dies liegt daran , jede SNP in der Evolutionsgeschichte als eine einzelnen Punkt entstand Mutation und wurde dann auf dem Chromosom von anderen, früher, Punktmutationen umgibt weitergegeben. SNPs, die auf dem Chromosom durch einen großen Abstand voneinander getrennt sind, sind typischerweise nicht sehr gut korreliert, da die Rekombination in jeder Generation auftritt und die Allelsequenzen der beiden Chromosomen mischt. Eine Sequenz aufeinanderfolgender Allele auf einem bestimmten Chromosom ist als Haplotyp bekannt .

Um die genetischen Faktoren zu finden, die an einer bestimmten Krankheit beteiligt sind, kann man wie folgt vorgehen. Zunächst wird eine bestimmte Region von Interesse im Genom identifiziert, möglicherweise aus früheren Vererbungsstudien. In dieser Region findet man einen Satz von Tag-SNPs aus den HapMap-Daten; Dies sind SNPs, die sehr gut mit allen anderen SNPs in der Region korrelieren. Das Lernen der Allele der Tag-SNPs in einem Individuum bestimmt somit den Haplotyp des Individuums mit hoher Wahrscheinlichkeit. Als nächstes bestimmt man den Genotyp für diese Tag-SNPs bei mehreren Individuen, einige mit der Krankheit und einige ohne. Durch Vergleichen der beiden Gruppen werden die wahrscheinlichen Orte und Haplotypen bestimmt, die an der Krankheit beteiligt sind.

Verwendete Proben

Haplotypen werden im Allgemeinen zwischen Populationen geteilt, aber ihre Häufigkeit kann sehr unterschiedlich sein. Vier Populationen wurden für die Aufnahme in die HapMap ausgewählt: 30 Yoruba- Trios für Erwachsene und beide Elternteile aus Ibadan , Nigeria (YRI), 30 Trios von Bewohnern nord- und westeuropäischer Abstammung (CEU) in Utah , 44 nicht verwandte japanische Personen aus Tokio ; Japan (JPT) und 45 nicht verwandte Han-Chinesen aus Peking , China (CHB). Obwohl die aus diesen Populationen gewonnenen Haplotypen für die Untersuchung vieler anderer Populationen nützlich sein sollten, untersuchen parallele Studien derzeit die Nützlichkeit der Einbeziehung zusätzlicher Populationen in das Projekt.

Alle Proben wurden im Rahmen eines Community-Engagement-Prozesses mit entsprechender Einverständniserklärung gesammelt. Der Community-Engagement-Prozess wurde entwickelt, um kulturspezifische Bedenken zu identifizieren und darauf zu reagieren und den teilnehmenden Communities einen Beitrag zu den Prozessen der Einwilligung nach Aufklärung und der Probenentnahme zu leisten.

In Phase III wurden 11 globale Ahnengruppen zusammengestellt: ASW (afrikanische Ahnen im Südwesten der USA); CEU (Einwohner von Utah mit nord- und westeuropäischer Abstammung aus der CEPH-Sammlung); CHB (Han-Chinese in Peking, China); KHK (Chinesisch in Metropolitan Denver, Colorado); GIH (Gujarati-Indianer in Houston, Texas); JPT (Japanisch in Tokio, Japan); LWK (Luhya in Webuye, Kenia); MEX (mexikanische Abstammung in Los Angeles, Kalifornien); MKK (Massai in Kinyawa, Kenia); TSI (Toskaner in Italien); YRI (Yoruba in Ibadan, Nigeria).

Phase ICH WÜRDE Platz Population Detail
I / II CEU Vereinigte Staaten Einwohner von Utah mit nord- und westeuropäischer Abstammung aus der CEPH- Sammlung Detail
I / II CHB China Han-Chinesen in Peking , China Detail
I / II JPT Japan Japanisch in Tokio , Japan Detail
I / II YRI Nigeria Yoruba in Ibadan , Nigeria Detail
III ASW Vereinigte Staaten Afrikanische Abstammung im Südwesten der USA Detail
III CHD Vereinigte Staaten Chinesisch in der Metropole Denver , CO , USA Detail
III GIH Vereinigte Staaten Gujarati- Indianer in Houston , TX , Vereinigte Staaten Detail
III LWK Kenia Luhya in Webuye , Kenia Detail
III MKK Kenia Massai in Kinyawa , Kenia Detail
III MXL Vereinigte Staaten Mexikanische Abstammung in Los Angeles , CA , USA Detail
III TSI Italien Toscani in Italien Detail

Es wurden auch drei kombinierte Panels erstellt, die eine bessere Identifizierung von SNPs in Gruppen außerhalb der neun homogenen Proben ermöglichen: CEU + TSI (kombiniertes Panel von Bewohnern Utahs mit nord- und westeuropäischer Abstammung aus der CEPH-Sammlung und Toskanern in Italien); JPT + CHB (Kombiniertes Panel aus Japanern in Tokio, Japan und Han-Chinesen in Peking, China) und JPT + CHB + CHD (Kombiniertes Panel aus Japanern in Tokio, Japan, Han-Chinesen in Peking, China und Chinesen in der Metropole Denver, Colorado) . CEU + TSI zum Beispiel ist ein besseres Modell für britische Briten als CEU allein.

Wissenschaftliche Strategie

In den neunziger Jahren war es teuer, das gesamte Genom des Patienten zu sequenzieren. Die National Institutes of Health befürworteten daher die Idee einer "Abkürzung", bei der nur Stellen im Genom untersucht werden sollten, an denen viele Menschen eine DNA-Variante haben. Die Theorie hinter der Abkürzung war, dass, da die Hauptkrankheiten häufig sind, auch die genetischen Varianten, die sie verursacht haben, häufig sind. Natürliche Selektion hält das menschliche Genom frei von Varianten, die die Gesundheit schädigen, bevor Kinder erwachsen werden, so die Theorie, scheitert jedoch an Varianten, die später im Leben auftreten und es ihnen ermöglichen, weit verbreitet zu werden (2002 starteten die National Institutes of Health ein 138-Millionen-Dollar-Projekt die HapMap genannt , um die gängigen Varianten im europäischen, ostasiatischen und afrikanischen Genom zu katalogisieren).

Für die Phase I wurde alle 5.000 Basen ein gemeinsames SNP genotypisiert. Insgesamt wurden mehr als eine Million SNPs genotypisiert. Die Genotypisierung wurde von 10 Zentren unter Verwendung von fünf verschiedenen Genotypisierungstechnologien durchgeführt. Die Genotypisierungsqualität wurde unter Verwendung von doppelten oder verwandten Proben und durch regelmäßige Qualitätsprüfungen bewertet, bei denen die Zentren gemeinsame Sätze von SNPs genotypisieren mussten.

Das kanadische Team wurde von Thomas J. Hudson an der McGill University in Montreal geleitet und konzentrierte sich auf die Chromosomen 2 und 4p. Das chinesische Team wurde von Huanming Yang in Peking und Shanghai und Lap-Chee Tsui in Hongkong geführt und konzentrierte sich auf die Chromosomen 3, 8p und 21. Das japanische Team wurde von Yusuke Nakamura an der Universität Tokio geführt und konzentrierte sich auf die Chromosomen 5, 11, 14, 15, 16, 17 und 19. Das britische Team wurde von David R. Bentley am Sanger Institute geleitet und konzentrierte sich auf die Chromosomen 1, 6, 10, 13 und 20. Es gab vier Genotypisierungszentren in den USA: a Team unter der Leitung von Mark Chee und Arnold Oliphant bei Illumina Inc. in San Diego (Untersuchung der Chromosomen 8q, 9, 18q, 22 und X), Team unter der Leitung von David Altshuler und Mark Daly am Broad Institute in Cambridge, USA (Chromosomen 4q, 7q, 18p, Y und Mitochondrion ), ein Team unter der Leitung von Richard Gibbs am Baylor College of Medicine in Houston (Chromosom 12) und ein Team unter der Leitung von Pui-Yan Kwok an der University of California in San Francisco (Chromosom 7p).

Um genügend SNPs für die Erstellung der Karte zu erhalten, finanzierte das Konsortium ein großes Projekt zur erneuten Sequenzierung, um Millionen zusätzlicher SNPs zu entdecken. Diese wurden an die öffentliche dbSNP- Datenbank übermittelt . Infolgedessen umfasste die Datenbank bis August 2006 mehr als zehn Millionen SNPs, von denen mehr als 40% als polymorph bekannt waren . Zum Vergleich: Zu Beginn des Projekts wurden weniger als 3 Millionen SNPs identifiziert, von denen nicht mehr als 10% als polymorph bekannt waren.

Während der Phase II wurden mehr als zwei Millionen zusätzliche SNPs im gesamten Genom von David R. Cox, Kelly A. Frazer und anderen bei Perlegen Sciences und 500.000 von der Firma Affymetrix genotypisiert .

Datenzugriff

Alle vom Projekt generierten Daten, einschließlich SNP-Frequenzen, Genotypen und Haplotypen , wurden öffentlich zugänglich gemacht und stehen zum Download zur Verfügung. Diese Website enthält auch einen Genombrowser, mit dem SNPs in jeder Region von Interesse, ihre Allelfrequenzen und ihre Zuordnung zu nahe gelegenen SNPs gefunden werden können. Ein Tool zum Bestimmen von Tag-SNPs für eine bestimmte Region von Interesse wird ebenfalls bereitgestellt. Auf diese Daten kann auch direkt über das weit verbreitete Haploview- Programm zugegriffen werden.

Veröffentlichungen

Siehe auch

Verweise

Externe Links