Illumina-Farbstoffsequenzierung - Illumina dye sequencing

Die Illumina-Farbstoff-Sequenzierung ist eine Technik, die verwendet wird, um die Reihe von Basenpaaren in der DNA zu bestimmen , auch bekannt als DNA-Sequenzierung . Das Konzept der reversiblen terminierten Chemie wurde von Bruno Canard und Simon Sarfati am Pasteur-Institut in Paris erfunden. Es wurde von Shankar Balasubramanian und David Klenerman von der Cambridge University entwickelt, die später Solexa gründeten, ein Unternehmen, das später von Illumina übernommen wurde . Diese Sequenzierungsmethode basiert auf reversiblen Farbstoffterminatoren, die die Identifizierung einzelner Nukleotide ermöglichen, während sie über DNA-Stränge gewaschen werden. Es kann auch für Whole verwendet wird Genoms und Region Sequenzierung Transkriptom - Analyse, Metagenom , kleine RNA Entdeckung, Methylierung Profilierung und genomweite Protein - Nukleinsäureinteraktionsanalyse.

Die DNA bindet über komplementäre Sequenzen an die Durchflusszelle. Der Strang biegt sich um und verbindet sich mit einem zweiten Oligo, das eine Brücke bildet. Eine Polymerase synthetisiert den Umkehrstrang. Die beiden Stränge lösen sich und richten sich auf. Jedes bildet eine neue Brücke (Brückenverstärkung). Das Ergebnis ist ein Cluster von DNA-Vorwärts- und Rückwärtsstrang-Klonen.

Überblick

Die Sequenzierungstechnologie von Illumina funktioniert in drei grundlegenden Schritten: Amplifizieren, Sequenzieren und Analysieren. Der Prozess beginnt mit gereinigter DNA. Die DNA wird fragmentiert und Adapter hinzugefügt, die Segmente enthalten, die als Referenzpunkte während der Amplifikation, Sequenzierung und Analyse dienen. Die modifizierte DNA wird auf eine Fließzelle geladen, wo Amplifikation und Sequenzierung stattfinden. Die Durchflusszelle enthält Nanowells, die Fragmente verteilen und bei Überfüllung helfen. Jedes Nanowell enthält Oligonukleotide, die einen Verankerungspunkt für die Anheftung der Adapter bieten. Sobald die Fragmente angefügt sind, beginnt eine Phase namens Cluster-Generierung. Dieser Schritt macht etwa tausend Kopien jedes DNA-Fragments und wird durch Brückenamplifikations-PCR durchgeführt. Als nächstes werden Primer und modifizierte Nukleotide auf den Chip gewaschen. Diese Nukleotide haben einen reversiblen 3'-Fluoreszenzblocker, sodass die DNA-Polymerase jeweils nur ein Nukleotid an das DNA-Fragment anfügen kann. Nach jeder Syntheserunde nimmt eine Kamera ein Bild des Chips auf. Ein Computer ermittelt anhand der Wellenlänge des fluoreszierenden Tags, welche Base hinzugefügt wurde und zeichnet sie für jeden Fleck auf dem Chip auf. Nach jeder Runde werden nicht eingebaute Moleküle weggespült. Ein chemischer Deblockierungsschritt wird dann verwendet, um die 3'-fluoreszierende terminale Blockierungsgruppe zu entfernen. Der Prozess wird fortgesetzt, bis das vollständige DNA-Molekül sequenziert ist. Mit dieser Technologie werden Tausende von Stellen im gesamten Genom gleichzeitig durch massive parallele Sequenzierung sequenziert .

Verfahren

Genomische Bibliothek

Nachdem die DNA gereinigt wurde, muss eine DNA-Bibliothek, eine genomische Bibliothek, erzeugt werden. Es gibt zwei Möglichkeiten, eine genomische Bibliothek zu erstellen: Sonifikation und Tagmentation. Bei der Tagmentation schneiden Transposasen die DNA zufällig in Fragmente zwischen 50 und 500 bp und fügen gleichzeitig Adapter hinzu. Eine genetische Bibliothek kann auch erzeugt werden, indem man Sonifikation verwendet, um genomische DNA zu fragmentieren. Bei der Sonifikation wird die DNA mithilfe von Ultraschallwellen in ähnliche Größen fragmentiert. Rechte und linke Adapter müssen nach der Beschallung durch T7-DNA-Polymerase und T4-DNA-Ligase angebracht werden. Stränge, die keine ligierten Adapter aufweisen, werden weggespült.

Doppelsträngige DNA wird durch Transposomen gespalten. Die abgeschnittenen Enden werden repariert und Adapter, Indizes, Primer-Bindungsstellen und Endstellen werden zu jedem DNA-Strang hinzugefügt. Bild basiert teilweise auf dem Sequenzierungsvideo von illumina

Adapter

Adapter enthalten drei verschiedene Segmente: die zum festen Träger komplementäre Sequenz (Oligonukleotide auf der Fließzelle), die Strichcodesequenz (Indizes) und die Bindungsstelle für den Sequenzierungsprimer. Indizes sind normalerweise sechs Basenpaare lang und werden während der DNA-Sequenzanalyse verwendet, um Proben zu identifizieren. Indizes ermöglichen die gemeinsame Bearbeitung von bis zu 96 verschiedenen Proben, dies wird auch als Multiplexing bezeichnet. Während der Analyse gruppiert der Computer alle Lesevorgänge mit demselben Index. Illumina verwendet einen "Sequenz durch Synthese"-Ansatz. Dieser Prozess findet in einer acrylamidbeschichteten Glasdurchflusszelle statt. Die Durchflusszelle hat Oligonukleotide (kurze Nukleotidsequenzen), die den Boden der Zelle bedecken, und sie dienen als fester Träger, um die DNA-Stränge während der Sequenzierung an Ort und Stelle zu halten. Beim Waschen der fragmentierten DNA über die Fließzelle bindet der geeignete Adapter an den komplementären festen Träger.

Millionen von Oligos säumen den Boden jeder Fließzellenspur.

Brückenverstärkung

Nach dem Anhängen kann die Cluster-Generierung beginnen. Das Ziel ist es, Hunderte von identischen DNA-Strängen zu erzeugen. Einige werden der vordere Strang sein; der Rest, umgekehrt. Aus diesem Grund werden rechte und linke Adapter verwendet. Cluster werden durch Brückenverstärkung erzeugt. DNA-Polymerase bewegt sich entlang eines DNA-Strangs und erzeugt seinen komplementären Strang. Der ursprüngliche Strang wird weggewaschen, sodass nur der umgekehrte Strang übrig bleibt. An der Spitze des reversen Strangs befindet sich eine Adaptersequenz. Der DNA-Strang biegt sich und bindet an das Oligo, das komplementär zur oberen Adaptersequenz ist. Polymerasen heften sich an den Rückwärtsstrang, und sein komplementärer Strang (der mit dem Original identisch ist) wird hergestellt. Die nun doppelsträngige DNA wird denaturiert, so dass jeder Strang separat an eine an der Fließzelle verankerte Oligonukleotidsequenz anlagern kann. Einer wird der umgekehrte Strang sein; der andere, der vorwärts. Dieser Prozess wird Brückenverstärkung genannt und findet gleichzeitig für Tausende von Clustern in der gesamten Fließzelle statt.

Klonale Amplifikation

Immer wieder verbiegen sich DNA-Stränge und heften sich an den festen Träger. DNA-Polymerase synthetisiert einen neuen Strang, um ein doppelsträngiges Segment zu erzeugen, das denaturiert wird, so dass alle DNA-Stränge in einem Bereich aus einer einzigen Quelle stammen (klonale Amplifikation). Die klonale Amplifikation ist für die Qualitätskontrolle wichtig. Wenn sich herausstellt, dass ein Strang eine ungerade Sequenz hat, können Wissenschaftler den umgekehrten Strang überprüfen, um sicherzustellen, dass er das Komplement der gleichen Kuriosität hat. Die Vorwärts- und Rückwärtsstränge dienen als Kontrollen zum Schutz vor Artefakten. Da die Illumina-Sequenzierung DNA-Polymerase verwendet, wurden Basensubstitutionsfehler insbesondere am 3'-Ende beobachtet. Gepaarte Endlesevorgänge in Kombination mit der Clustergenerierung können bestätigen, dass ein Fehler aufgetreten ist. Die Reverse- und Forward-Stränge sollten zueinander komplementär sein, alle Reverse-Reads sollten zueinander passen und alle Forward-Reads sollten zueinander passen. Wenn ein Lesevorgang seinen Gegenstücken (mit denen es ein Klon sein sollte) nicht ähnlich genug ist, ist möglicherweise ein Fehler aufgetreten. In einigen Laboranalysen wurde ein Mindestschwellenwert von 97% Ähnlichkeit verwendet.

Sequenz durch Synthese

Am Ende der klonalen Amplifikation werden alle Rückwärtsstränge aus der Fließzelle gewaschen, so dass nur Vorwärtsstränge übrig bleiben. Ein Primer bindet an die Adaptor-Primer-Bindungsstelle des Vorwärtsstrangs, und eine Polymerase fügt dem DNA-Strang ein fluoreszenzmarkiertes dNTP hinzu. Aufgrund des Fluorophors als Blockierungsgruppe kann pro Runde nur eine Base hinzugefügt werden; jedoch ist die Blockierungsgruppe reversibel. Mit der Vierfarbenchemie hat jede der vier Basen eine einzigartige Emission, und nach jeder Runde zeichnet die Maschine auf, welche Base hinzugefügt wurde. Sobald die Farbe aufgezeichnet ist, wird das Fluorophor weggewaschen und ein weiteres dNTP wird über die Fließzelle gespült und der Vorgang wird wiederholt.

Beginnend mit der Einführung des NextSeq und später des MiniSeq führte Illumina eine neue Zweifarben-Sequenzierungschemie ein. Nukleotide werden entweder durch eine von zwei Farben (rot oder grün), keine Farbe ("schwarz") oder durch die Kombination beider Farben (erscheinend orange als Mischung aus Rot und Grün) unterschieden.

Markierte Nukleotide werden der Reihe nach an den DNA-Strang angefügt. Jedes der vier Nukleotide hat eine identifizierende Markierung, die angeregt werden kann, eine charakteristische Wellenlänge zu emittieren. Ein Computer zeichnet alle Emissionen auf und aus diesen Daten werden Basisrufe getätigt.

Nachdem der DNA-Strang gelesen wurde, wird der gerade hinzugefügte Strang weggewaschen. Dann bindet der Index-1-Primer, polymerisiert die Index-1-Sequenz und wird weggewaschen. Der Strang bildet wieder eine Brücke und das 3'-Ende des DNA-Strangs heftet sich an ein Oligo auf der Fließzelle. Der Index-2-Primer bindet, polymerisiert die Sequenz und wird weggewaschen.

Eine Polymerase sequenziert den komplementären Strang oben auf den gewölbten Strang. Sie trennen sich und das 3'-Ende jedes Strangs wird blockiert. Der Vorwärtsstrang wird weggewaschen, und der Prozess der Sequenzierung durch Synthese wiederholt sich für den Rückwärtsstrang.

Datenanalyse

Die Sequenzierung erfolgt für Millionen von Clustern gleichzeitig, und jeder Cluster hat ~1000 identische Kopien eines DNA-Inserts. Die Sequenzdaten werden analysiert, indem Fragmente mit überlappenden Bereichen, sogenannte Contigs , gefunden und aneinander gereiht werden. Wenn eine Referenzsequenz bekannt ist, werden die Contigs dann zur Variantenidentifikation mit dieser verglichen.

Dieser stückweise Prozess ermöglicht es Wissenschaftlern, die vollständige Sequenz zu sehen, obwohl nie eine unfragmentierte Sequenz ausgeführt wurde; Da die Leselängen von Illumina jedoch nicht sehr lang sind (HiSeq-Sequenzierung kann Leselängen von etwa 90 bp erzeugen), kann es schwierig sein, kurze Tandem-Wiederholungsbereiche aufzulösen. Auch wenn die Sequenz de novo ist und keine Referenz vorhanden ist, können sich wiederholende Bereiche bei der Sequenzzusammenstellung zu großen Schwierigkeiten führen. Zusätzliche Schwierigkeiten umfassen Basensubstitutionen (insbesondere am 3'-Ende von Reads) durch ungenaue Polymerasen, chimäre Sequenzen und PCR-Bias, die alle dazu beitragen können, eine falsche Sequenz zu erzeugen.

Vergleich mit anderen Sequenzierungsmethoden

Diese Technik bietet gegenüber herkömmlichen Sequenzierungsmethoden wie der Sanger-Sequenzierung mehrere Vorteile . Die Sanger-Sequenzierung erfordert zwei Reaktionen, eine für den Vorwärtsprimer und eine andere für den Rückwärtsprimer. Im Gegensatz zu Illumina verwendet die Sanger-Sequenzierung fluoreszenzmarkierte Didesoxynukleosidtriphosphate (ddNTPs), um die Sequenz des DNA-Fragments zu bestimmen. ddNTPs fehlt die 3'-OH-Gruppe und beendet die DNA-Synthese dauerhaft. In jedem Reaktionsröhrchen werden dNTPs und ddNTPs zusammen mit DNA-Polymerase und Primern hinzugefügt. Das Verhältnis von ddNTPs zu dNTPs ist von Bedeutung, da die Matrizen-DNA vollständig synthetisiert werden muss und ein Überschuss an ddNTPs mehrere Fragmente der gleichen Größe und Position der DNA-Matrize erzeugt. Wenn die DNA-Polymerase ein ddNTP hinzufügt, wird das Fragment terminiert und ein neues Fragment synthetisiert. Jedes synthetisierte Fragment ist ein Nukleotid länger als das letzte. Nach vollständiger Synthese der DNA-Matrize werden die Fragmente durch Kapillarelektrophorese getrennt. Am Boden des Kapillarröhrchens regt ein Laser die fluoreszenzmarkierten ddNTPs an und eine Kamera erfasst die emittierte Farbe.

Aufgrund des automatisierten Charakters der Illumina-Farbstoffsequenzierung ist es möglich, mehrere Stränge gleichzeitig zu sequenzieren und schnelle Sequenzierungsdaten zu erhalten. Bei der Sanger-Sequenzierung kann jeweils nur ein Strang sequenziert werden und ist relativ langsam. Illumina verwendet nur DNA-Polymerase im Gegensatz zu mehreren teuren Enzymen, die für andere Sequenzierungstechniken (dh Pyrosequenzierung ) erforderlich sind .

Anwendungsbeispiele

Illumina - Sequenzierung wird verwendet, um die Forschung Transkriptomen der Süßkartoffel und die gymnosperm Gattung Taxus .

Verweise