Vergleichende Genomik - Comparative genomics

Whole Genome Alignment ist eine typische Methode in der vergleichenden Genomik. Diese Anordnung von acht Yersinia- Bakteriengenomen zeigt 78 lokal kollineare Blöcke, die unter allen acht Taxa konserviert sind . Jedes Chromosom wurde horizontal angeordnet und homologe Blöcke in jedem Genom werden als identisch gefärbte Regionen dargestellt, die über Genome hinweg verbunden sind. Regionen, die relativ zu Y. pestis KIM invertiert sind, sind unter die Mittelachse eines Genoms verschoben.

Die vergleichende Genomik ist ein Gebiet der biologischen Forschung, in dem die genomischen Merkmale verschiedener Organismen verglichen werden. Die genomischen Merkmale können die DNA-Sequenz , Gene , Genreihenfolge , regulatorische Sequenzen und andere genomische strukturelle Orientierungspunkte umfassen. In diesem Zweig der Genomik werden ganze oder große Teile von Genomen aus Genomprojekten verglichen, um grundlegende biologische Ähnlichkeiten und Unterschiede sowie evolutionäre Beziehungen zwischen Organismen zu untersuchen. Das Hauptprinzip der vergleichenden Genomik besteht darin, dass gemeinsame Merkmale zweier Organismen oft in der DNA kodiert werden, die zwischen ihnen evolutionär konserviert ist . Daher beginnen vergleichende genomische Ansätze damit, eine Form des Alignments von Genomsequenzen vorzunehmen und nach orthologen Sequenzen (Sequenzen mit einer gemeinsamen Abstammung ) in den ausgerichteten Genomen zu suchen und zu prüfen, inwieweit diese Sequenzen konserviert sind. Daraus wird auf Genom- und Molekularevolution geschlossen, die wiederum in den Kontext beispielsweise der phänotypischen Evolution oder der Populationsgenetik gestellt werden kann .

Praktisch begonnen, als 1995 die gesamten Genome zweier Organismen (also die Genome der Bakterien Haemophilus influenzae und Mycoplasma genitalium ) zur Verfügung standen, ist die vergleichende Genomik heute ein Standardbestandteil der Analyse jeder neuen Genomsequenz. Mit der explosionsartigen Zunahme von Genomprojekten aufgrund der Fortschritte in den DNA-Sequenzierungstechnologien , insbesondere der Sequenzierungsmethoden der nächsten Generation Ende der 2000er Jahre, wurde dieses Gebiet komplexer und ermöglicht es, viele Genome in einer einzigen Studie zu behandeln. Vergleichende Genomik hat ein hohes Maß an Ähnlichkeit zwischen eng verwandten Organismen, wie Menschen und Schimpansen , und überraschenderweise Ähnlichkeit zwischen scheinbar entfernt verwandten Organismen, wie Menschen und der Hefe Saccharomyces cerevisiae, gezeigt . Es hat auch die extreme Diversität der Genzusammensetzung in verschiedenen evolutionären Linien gezeigt.

Geschichte

Siehe auch : Geschichte der Genomik

Vergleichende Genomik haben eine Wurzel im Vergleich von Virus - Genome in den frühen 1980er Jahren. Zum Beispiel wurden kleine RNA-Viren , die Tiere infizieren ( Picornaviren ) und solche, die Pflanzen infizieren ( Cowpea-Mosaikvirus ), verglichen und es stellte sich heraus, dass sie eine signifikante Sequenzähnlichkeit und teilweise die Reihenfolge ihrer Gene aufwiesen . 1986 wurde die erste vergleichende Genomstudie in größerem Maßstab veröffentlicht, in der die Genome des Varicella-Zoster-Virus und des Epstein-Barr-Virus verglichen wurden , die jeweils mehr als 100 Gene enthielten.

Die erste vollständige Genomsequenz eines zellulären Organismus, die von Haemophilus influenzae Rd, wurde 1995 veröffentlicht. Die zweite Genomsequenzierungsarbeit stammte von dem kleinen parasitären Bakterium Mycoplasma genitalium, das im selben Jahr veröffentlicht wurde. Ausgehend von dieser Arbeit wurden Berichte über neue Genome unweigerlich zu vergleichenden Genomstudien.

Das erste hochauflösende Gesamtgenom-Vergleichssystem wurde 1998 von Art Delcher, Simon Kasif und Steven Salzberg entwickelt und auf den Vergleich ganzer hoch verwandter mikrobieller Organismen mit ihren Mitarbeitern am Institut für Genomforschung (TIGR) angewendet. Das System heißt MUMMER und wurde 1999 in einer Veröffentlichung in Nucleic Acids Research beschrieben. Das System hilft Forschern, große Umlagerungen, Einzelbasenmutationen, Umkehrungen, Tandem-Repeat-Erweiterungen und andere Polymorphismen zu identifizieren. In Bakterien ermöglicht MUMMER die Identifizierung von Polymorphismen, die für Virulenz, Pathogenität und Antibiotikaresistenz verantwortlich sind. Das System wurde auch auf das Minimal Organism Project am TIGR und anschließend auf viele andere vergleichende Genomikprojekte angewendet.

Saccharomyces cerevisiae , die Bäckerhefe, das erste wurde Eukaryoten seine komplette Genomsequenz im Jahr 1996. Nach der Veröffentlichung der Spulwurm veröffentlicht hat Caenorhabditis elegans Genom mit der Frucht inJahren 1998 und zusammen fliegt melanogaster Drosophila - Genom im Jahr 2000, Gerald M. Rubin und sein Das Team veröffentlichte eine Arbeit mit dem Titel "Comparative Genomics of the Eukaryotes", in der sie die Genome der Eukaryoten D. melanogaster , C. elegans und S. cerevisiae sowie des Prokaryoten H. influenzae verglichen. Zur gleichen Zeit veröffentlichten Bonnie Berger , Eric Lander und ihr Team eine Arbeit zum Vergleich des gesamten Genoms von Mensch und Maus.

Mit der Veröffentlichung der großen Genome von Wirbeltieren in den 2000er Jahren, einschließlich Menschen , der japanischen Kugelfisches Takifugu rubripes und Maus , vorberechnet Ergebnisse von großen Genomvergleichen wurden zum Download oder zur Visualisierungen in einem freigegebenen Genom - Browser . Anstatt eigene Analysen durchzuführen, können die meisten Biologen auf diese großen artenübergreifenden Vergleiche zugreifen und die Unpraktikabilität aufgrund der Größe der Genome vermeiden.

Sequenzierungsmethoden der nächsten Generation , die erstmals 2007 eingeführt wurden, haben eine enorme Menge an Genomdaten produziert und es Forschern ermöglicht, mehrere (prokaryontische) Entwurfsgenomsequenzen gleichzeitig zu generieren. Diese Methoden können auch Einzelnukleotid-Polymorphismen , Insertionen und Deletionen schnell aufdecken , indem sie unassemblierte Reads gegen ein gut annotiertes Referenzgenom abbilden und so eine Liste möglicher Genunterschiede bereitstellen, die die Grundlage für jede funktionelle Variation zwischen Stämmen sein können.

Evolutionäre Prinzipien

Ein Charakter der Biologie ist die Evolution, die Evolutionstheorie ist auch die theoretische Grundlage der vergleichenden Genomik, und gleichzeitig haben die Ergebnisse der vergleichenden Genomik die Evolutionstheorie beispiellos bereichert und weiterentwickelt. Wenn zwei oder mehr Genomsequenzen verglichen werden, kann man die evolutionären Beziehungen der Sequenzen in einem phylogenetischen Baum ableiten. Basierend auf einer Vielzahl biologischer Genomdaten und der Untersuchung vertikaler und horizontaler Evolutionsprozesse kann man wichtige Teile der Genstruktur und ihre regulatorische Funktion verstehen.

Die Ähnlichkeit verwandter Genome ist die Grundlage der vergleichenden Genomik. Wenn zwei Lebewesen kürzlich einen gemeinsamen Vorfahren haben, werden die Unterschiede zwischen den Genomen der beiden Arten aus dem Genom der Vorfahren entwickelt. Je enger die Beziehung zwischen zwei Organismen ist, desto größer sind die Ähnlichkeiten zwischen ihren Genomen. Besteht zwischen ihnen eine enge Verwandtschaft, dann zeigt ihr Genom ein lineares Verhalten ( Syntenie ), dh einige oder alle genetischen Sequenzen bleiben erhalten. Somit können die Genomsequenzen verwendet werden, um die Genfunktion zu identifizieren, indem ihre Homologie (Sequenzähnlichkeit) zu Genen bekannter Funktion analysiert wird.

Orthologe Sequenzen sind verwandte Sequenzen in verschiedenen Arten: Ein Gen existiert in der ursprünglichen Art, die Art ist in zwei Arten unterteilt, sodass Gene in neuen Arten zur Sequenz in der ursprünglichen Art ortholog sind. Paraloge Sequenzen werden durch Genklonierung (Genduplikation) getrennt: Wird ein bestimmtes Gen im Genom kopiert, dann ist die Kopie der beiden Sequenzen paralog zum Originalgen. Ein Paar von orthologen Sequenzen wird als orthologe Paare (Orthologe) bezeichnet, ein Paar von paralogen Sequenzen wird als Kollateralpaare (Paralogs) bezeichnet. Orthologe Paare haben meist die gleiche oder ähnliche Funktion, was bei Kollateralpaaren nicht unbedingt der Fall ist. In Kollateralpaaren neigen die Sequenzen dazu, unterschiedliche Funktionen zu haben.

Das menschliche FOXP2- Gen und die evolutionäre Konservierung sind in diesem Bild aus dem UCSC Genome Browser in einem multiplen Alignment (unten in der Abbildung) gezeigt . Beachten Sie, dass die Konservierung dazu neigt, sich um kodierende Regionen (Exons) zu gruppieren.

Vergleichende Genomik nutzt sowohl Ähnlichkeiten als auch Unterschiede in den Proteinen , RNA und regulatorischen Regionen verschiedener Organismen aus, um abzuleiten, wie die Selektion auf diese Elemente gewirkt hat. Diejenigen Elemente, die für Ähnlichkeiten zwischen verschiedenen Arten verantwortlich sind, sollten im Laufe der Zeit erhalten bleiben ( stabilisierende Selektion ), während diejenigen Elemente, die für die Unterschiede zwischen den Arten verantwortlich sind, divergieren ( positive Selektion ). Schließlich werden diejenigen Elemente, die für den evolutionären Erfolg des Organismus unwichtig sind, unkonserviert (Auswahl ist neutral).

Eines der wichtigen Ziele des Forschungsgebiets ist die Identifizierung der Mechanismen der eukaryotischen Genom-Evolution. Es wird jedoch oft durch die Vielzahl von Ereignissen kompliziert, die in der Geschichte der einzelnen Abstammungslinien stattgefunden haben und nur verzerrte und überlagerte Spuren im Genom jedes lebenden Organismus hinterlassen haben. Aus diesem Grund sind vergleichende genomische Studien an kleinen Modellorganismen (zum Beispiel dem Modell Caenorhabditis elegans und nahe verwandter Caenorhabditis briggsae ) von großer Bedeutung, um unser Verständnis allgemeiner Mechanismen der Evolution voranzutreiben.

Methoden

Computergestützte Ansätze zum Genomvergleich sind in letzter Zeit zu einem gängigen Forschungsthema in der Informatik geworden. Eine öffentliche Sammlung von Fallstudien und Demonstrationen wächst und reicht von Gesamtgenomvergleichen bis hin zu Genexpressionsanalysen . Dies hat die Einführung verschiedener Ideen erhöht, darunter Konzepte aus den Bereichen Systeme und Steuerung, Informationstheorie, Stringanalyse und Data Mining. Es wird erwartet, dass computergestützte Ansätze zu einem Standardthema für Forschung und Lehre werden und bleiben, während mehrere Kurse beginnen werden, die Studierenden zu üben, beide Themen fließend zu beherrschen.

Werkzeuge

Computerwerkzeuge zur Analyse von Sequenzen und vollständigen Genomen entwickeln sich aufgrund der Verfügbarkeit großer Mengen an Genomdaten schnell. Gleichzeitig werden vergleichende Analysetools weiterentwickelt und verbessert. Bei den Herausforderungen dieser Analysen ist es sehr wichtig, die vergleichenden Ergebnisse zu visualisieren.

Die Visualisierung der Sequenzerhaltung ist eine schwierige Aufgabe der vergleichenden Sequenzanalyse. Wie wir wissen, ist es höchst ineffizient, die Ausrichtung langer Genomregionen manuell zu untersuchen. Internetbasierte Genombrowser bieten viele nützliche Werkzeuge zur Untersuchung genomischer Sequenzen, da alle sequenzbasierten biologischen Informationen über Genomregionen integriert werden. Wenn wir große Mengen relevanter biologischer Daten extrahieren, können sie sehr einfach zu verwenden und weniger zeitaufwändig sein.

  • UCSC-Browser : Diese Site enthält die Referenzsequenz und Arbeitsentwürfe für eine große Sammlung von Genomen.
  • Ensembl : Das Projekt Ensembl erstellt Genomdatenbanken für Wirbeltiere und andere eukaryotische Arten und stellt diese Informationen online frei zur Verfügung.
  • MapView : Der Map Viewer bietet eine Vielzahl von Genomkartierungs- und Sequenzierungsdaten.
  • VISTA ist eine umfassende Suite von Programmen und Datenbanken für die vergleichende Analyse genomischer Sequenzen. Es wurde entwickelt, um die Ergebnisse vergleichender Analysen basierend auf DNA-Alignments zu visualisieren. Die Präsentation von Vergleichsdaten, die von VISTA generiert werden, kann sowohl kleinen als auch großen Datenmengen problemlos gerecht werden.
  • BlueJay Genome Browser : ein eigenständiges Visualisierungstool für die Anzeige von annotierten Genomen und anderen genomischen Elementen in mehreren Maßstäben.

Ein Vorteil der Verwendung von Online-Tools besteht darin, dass diese Websites ständig weiterentwickelt und aktualisiert werden. Es gibt viele neue Einstellungen und Inhalte, die online verwendet werden können, um die Effizienz zu verbessern.

Anwendungen

Landwirtschaft

Die Landwirtschaft ist ein Bereich, der von den Vorteilen der vergleichenden Genomik profitiert. Die Identifizierung der Loci vorteilhafter Gene ist ein wichtiger Schritt bei der Züchtung von Nutzpflanzen, die auf mehr Ertrag, Kosteneffizienz, Qualität und Krankheitsresistenz optimiert sind. Eine genomweite Assoziationsstudie, die an 517 Reis- Landrassen durchgeführt wurde, zeigte beispielsweise 80 Loci, die mit verschiedenen Kategorien agronomischer Leistung assoziiert sind, wie zum Beispiel Korngewicht, Amylosegehalt und Trockenheitstoleranz. Viele der Loci waren zuvor nicht charakterisiert. Diese Methodik ist nicht nur leistungsstark, sondern auch schnell. Frühere Methoden zur Identifizierung von Loci, die mit agronomischer Leistung assoziiert sind, erforderten mehrere Generationen sorgfältig überwachter Züchtung von Elternstämmen, eine zeitaufwendige Anstrengung, die für vergleichende Genomstudien unnötig ist.

Medizin

Auch der medizinische Bereich profitiert vom Studium der vergleichenden Genomik. Insbesondere die Vakzinologie hat aufgrund genomischer Problemlösungen nützliche technologische Fortschritte gemacht. In einem als Reverse Vakzinologie bekannten Ansatz können Forscher Kandidatenantigene für die Impfstoffentwicklung entdecken, indem sie das Genom eines Krankheitserregers oder einer Krankheitserregerfamilie analysieren. Die Anwendung eines vergleichenden Genomik-Ansatzes durch Analyse der Genome mehrerer verwandter Krankheitserreger kann zur Entwicklung multiprotektiver Impfstoffe führen. Ein Forscherteam wandte einen solchen Ansatz an, um einen universellen Impfstoff gegen Streptokokken der Gruppe B zu entwickeln , eine Gruppe von Bakterien, die für schwere Infektionen bei Neugeborenen verantwortlich sind. Vergleichende Genomik kann auch verwendet werden, um Spezifität für Impfstoffe gegen Pathogene zu erzeugen, die mit kommensalen Mikroorganismen eng verwandt sind. Beispielsweise verwendeten die Forscher eine vergleichende Genomanalyse von kommensalen und pathogenen Stämmen von E. coli, um pathogenspezifische Gene zu identifizieren, um Antigene zu finden, die zu einer Immunantwort gegen pathogene Stämme, aber nicht gegen kommensale führen. Im Mai 2019 sequenzierte ein Team in Großbritannien und Australien mit dem Global Genome Set Tausende von weltweit gesammelten Isolaten von Streptokokken der Gruppe A und lieferte potenzielle Angriffspunkte für die Entwicklung eines Impfstoffs gegen den auch als S. pyogenes bekannten Erreger.

Forschung

Die vergleichende Genomik eröffnet auch in anderen Forschungsbereichen neue Wege. Da die DNA-Sequenzierungstechnologie zugänglicher geworden ist, ist die Zahl der sequenzierten Genome gewachsen. Mit dem wachsenden Reservoir an verfügbaren Genomdaten ist auch die Potenz der vergleichenden genomischen Inferenz gewachsen.

Ein bemerkenswerter Fall dieser erhöhten Potenz ist in der neueren Primatenforschung zu finden. Vergleichende genomische Methoden haben es Forschern ermöglicht, Informationen über genetische Variation, unterschiedliche Genexpression und evolutionäre Dynamik bei Primaten zu sammeln, die mit früheren Daten und Methoden nicht erkennbar waren.

Genomprojekt des großen Affen

Das Great Ape Genome Project verwendete vergleichende genomische Methoden, um die genetische Variation in Bezug auf die sechs Menschenaffenarten zu untersuchen und trotz der schrumpfenden Populationsgröße ein gesundes Maß an Variation in ihrem Genpool zu finden. Eine andere Studie zeigte, dass sich Muster der DNA-Methylierung, die ein bekannter Regulationsmechanismus für die Genexpression sind, im präfrontalen Kortex von Menschen und Schimpansen unterscheiden, und implizierte diesen Unterschied in der evolutionären Divergenz der beiden Arten.

Siehe auch

Verweise

Weiterlesen

Externe Links