DNA digitale Datenspeicherung - DNA digital data storage

Die digitale DNA-Datenspeicherung ist der Prozess der Kodierung und Dekodierung binärer Daten zu und von synthetisierten DNA- Strängen .

Während DNA als Speichermedium aufgrund ihrer hohen Speicherdichte ein enormes Potenzial besitzt, ist ihr praktischer Einsatz derzeit aufgrund ihrer hohen Kosten und sehr langsamen Lese- und Schreibzeiten stark eingeschränkt.

Im Juni 2019 berichteten Wissenschaftler, dass alle 16 GB Text aus der englischsprachigen Wikipedia -Version in synthetische DNA kodiert wurden .

Handy frei

Die derzeit am weitesten verbreitete DNA-Sequenzierungstechnologie wird von Illumina entwickelt und umfasst die Immobilisierung einzelsträngiger DNA auf einem festen Träger, die Amplifikation der Sequenzen durch Polymerase-Kettenreaktion (PCR) und die Markierung der einzelnen DNA-Basen mit komplementären Basen, die mit . markiert sind Fluoreszenzmarker (siehe Illumina-Farbstoffsequenzierung ). Das Fluoreszenzmuster (eine andere Farbe für jede der vier DNA-Basen) kann dann in einem Bild erfasst und verarbeitet werden, um die DNA-Sequenz zu bestimmen. Eine kürzlich entwickelte Alternative ist die Nanoporen- Technologie, bei der DNA-Moleküle unter der Kontrolle eines Ratcheting-Enzyms durch eine nanoskalige Pore geleitet werden. Der Durchgang der DNA-Moleküle verursacht eine kleine Änderung des elektrischen Stroms, die gemessen werden kann. Der Hauptvorteil der Nanoporen-Technologie besteht darin, dass sie in Echtzeit ausgelesen werden kann. Allerdings reicht die Lesegenauigkeit dieser Technologie derzeit für die Datenspeicherung nicht aus.

In vivo

Der genetische Code in lebenden Organismen kann möglicherweise dazu verwendet werden, Informationen zu speichern. Darüber hinaus kann die synthetische Biologie verwendet werden, um Zellen mit "molekularen Rekordern" zu entwickeln, um die Speicherung und den Abruf von Informationen, die im genetischen Material der Zelle gespeichert sind, zu ermöglichen. CRISPR-Genediting kann auch verwendet werden, um künstliche DNA-Sequenzen in das Genom der Zelle einzufügen.

Geschichte

Die Idee der digitalen DNA-Datenspeicherung geht auf das Jahr 1959 zurück, als der Physiker Richard P. Feynman in "There's Plenty of Room at the Bottom: An Invitation to Enter a New Field of Physics" die allgemeinen Aussichten für die Herstellung künstlicher Objekte skizzierte ähnlich Objekten des Mikrokosmos (einschließlich biologischer) und mit ähnlichen oder sogar noch umfassenderen Fähigkeiten. 1964-65 veröffentlichte der sowjetische Physiker Mikhail Samoilovich Neiman 3 Artikel über die Mikrominiaturisierung in der Elektronik auf molekular-atomarer Ebene, die unabhängig allgemeine Überlegungen und einige Berechnungen zur Möglichkeit der Aufzeichnung, Speicherung und Wiedergewinnung von Informationen über synthetisierte DNA und RNA-Moleküle. Nach der Veröffentlichung des ersten Artikels von MS Neiman und nach Erhalt des Manuskripts seines zweiten Artikels (8. Januar 1964, wie in diesem Artikel angegeben) durch den Herausgeber wurde das Interview mit dem Kybernetiker Norbert Wiener veröffentlicht. N. Wiener äußerte Ideen zur Miniaturisierung des Computerspeichers, die den Ideen nahe kamen, die von MS Neiman unabhängig vorgeschlagen wurden. Diese Wiener Ideen erwähnt MS Neiman im dritten seiner Aufsätze. Diese Geschichte wird ausführlich beschrieben.

Eine der frühesten Anwendungen der DNA-Speicherung fand 1988 in einer Zusammenarbeit zwischen dem Künstler Joe Davis und Forschern aus Harvard statt. Das Bild, das in einer DNA-Sequenz in E.coli gespeichert ist , war in einer 5 x 7-Matrix organisiert, die nach der Entschlüsselung ein Bild einer alten germanischen Rune bildete, die das Leben und die weibliche Erde darstellt. In der Matrix entsprachen Einsen dunklen Pixeln, während Nullen hellen Pixeln entsprachen.

Im Jahr 2007 wurde an der University of Arizona ein Gerät entwickelt, das Adressierungsmoleküle verwendet, um Fehlpaarungsstellen innerhalb eines DNA-Strangs zu codieren. Diese Nichtübereinstimmungen konnten dann ausgelesen werden, indem ein Restriktions-Digest durchgeführt wurde, wodurch die Daten wiederhergestellt wurden.

Im Jahr 2011 führten George Church, Sri Kosuri und Yuan Gao ein Experiment durch, das ein 659-kb-Buch kodieren würde, das von Church mitverfasst wurde. Dazu führte das Forschungsteam eine Zwei-zu-Eins-Korrespondenz durch, bei der eine binäre Null entweder durch ein Adenin oder Cytosin und eine binäre Eins durch ein Guanin oder Thymin repräsentiert wurde. Nach der Untersuchung wurden 22 Fehler in der DNA gefunden.

Im Jahr 2012 veröffentlichten George Church und Kollegen an der Harvard University einen Artikel, in dem DNA mit digitalen Informationen codiert wurde, die einen HTML-Entwurf eines 53.400-Wörter-Buches des leitenden Forschers, elf JPG-Bilder und ein JavaScript-Programm enthielten. Mehrere Kopien für Redundanz wurden hinzugefügt und 5,5 Petabit können in jedem Kubikmillimeter DNA gespeichert werden. Die Forscher verwendeten einen einfachen Code, bei dem Bits eins zu eins mit Basen abgebildet wurden, was den Nachteil hatte, dass es zu langen Läufen derselben Base führte, deren Sequenzierung fehleranfällig ist. Dieses Ergebnis zeigte, dass DNA neben seinen anderen Funktionen auch ein anderes Speichermedium wie Festplatten und Magnetbänder sein kann.

Im Jahr 2013 wurde in einem von Forschern des European Bioinformatics Institute (EBI) geleiteten und etwa zeitgleich mit dem Papier von Church und Kollegen eingereichten Artikel die Speicherung, der Abruf und die Reproduktion von über fünf Millionen Datenbits detailliert beschrieben. Alle DNA-Dateien reproduzierten die Informationen mit einer Genauigkeit von 99,99 % bis 100 %. Die wichtigsten Neuerungen in dieser Forschung waren die Verwendung eines fehlerkorrigierenden Kodierungsschemas, um die extrem niedrige Datenverlustrate zu gewährleisten, sowie die Idee, die Daten in eine Reihe von überlappenden kurzen Oligonukleotiden zu kodieren, die durch ein sequenzbasiertes Indexierungsschema identifizierbar sind . Außerdem überlappten sich die Sequenzen der einzelnen DNA-Stränge so, dass jeder Datenbereich viermal wiederholt wurde, um Fehler zu vermeiden. Zwei dieser vier Stränge wurden rückwärts aufgebaut, ebenfalls mit dem Ziel, Fehler zu eliminieren. Die Kosten pro Megabyte wurden auf 12.400 US-Dollar für die Verschlüsselung von Daten und 220 US-Dollar für den Abruf geschätzt. Es wurde jedoch festgestellt, dass der exponentielle Rückgang der DNA-Synthese- und Sequenzierungskosten, wenn er in Zukunft anhält, die Technologie für die langfristige Datenspeicherung bis 2023 kosteneffektiv machen sollte.

Im Jahr 2013 wurde eine Software namens DNACloud von Manish K. Gupta und Mitarbeitern entwickelt, um Computerdateien in ihre DNA-Darstellung zu codieren. Es implementiert eine Speichereffizienzversion des von Goldman et al. vorgeschlagenen Algorithmus. um Daten in DNA (.dnac-Dateien) zu verschlüsseln (und zu decodieren).

Über die Langzeitstabilität von in der DNA kodierten Daten wurde im Februar 2015 in einem Artikel von Forschenden der ETH Zürich berichtet . Das Team fügte Redundanz durch Reed-Solomon-Fehlerkorrekturcodierung und durch Einkapseln der DNA in Kieselglaskugeln mittels Sol-Gel- Chemie hinzu.

Im Jahr 2016 wurde eine Studie von Church and Technicolor Research and Innovation veröffentlicht, in der 22 MB einer MPEG-komprimierten Filmsequenz gespeichert und aus der DNA wiederhergestellt wurden. Es wurde festgestellt, dass die Wiederherstellung der Sequenz null Fehler aufwies.

Im März 2017 veröffentlichten Yaniv Erlich und Dina Zielinski von der Columbia University und dem New York Genome Center eine Methode namens DNA Fountain, die Daten mit einer Dichte von 215 Petabyte pro Gramm DNA speicherte. Die Technik nähert sich der Shannon-Kapazität der DNA-Speicherung und erreicht 85% der theoretischen Grenze. Die Methode war noch nicht für den groß angelegten Einsatz geeignet, da es 7000 US-Dollar kostet, 2 Megabyte an Daten zu synthetisieren und weitere 2000 US-Dollar, um sie zu lesen.

Im März 2018 veröffentlichten die University of Washington und Microsoft Ergebnisse, die das Speichern und Abrufen von etwa 200 MB Daten belegen. Die Forschung schlug auch eine Methode für den wahlfreien Zugriff auf in der DNA gespeicherte Datenelemente vor und bewertete sie . Im März 2019 gab dasselbe Team bekannt, dass es ein vollautomatisches System zum Kodieren und Dekodieren von Daten in DNA demonstriert hat.

Im Januar 2019 von Eurecom und Imperial College veröffentlichte Forschungsergebnisse haben die Fähigkeit gezeigt, strukturierte Daten in synthetischer DNA zu speichern. Die Forschung zeigte, wie strukturierte oder genauer relationale Daten in synthetischer DNA kodiert werden können und wie man Datenverarbeitungsoperationen (ähnlich wie SQL ) direkt an der DNA als chemische Prozesse durchführt.

Im Juni 2019 berichteten Wissenschaftler, dass alle 16 GB von Wikipedia in synthetische DNA kodiert wurden .

Der erste Artikel, der die Datenspeicherung auf nativen DNA-Sequenzen durch enzymatisches Nicking beschreibt, wurde im April 2020 veröffentlicht. In dem Artikel demonstrieren Wissenschaftler eine neue Methode zur Aufzeichnung von Informationen im DNA-Backbone, die bitweisen Direktzugriff und In-Memory-Computing ermöglicht.

Davos Bitcoin-Herausforderung

Am 21. Januar 2015 kündigte Nick Goldman vom European Bioinformatics Institute (EBI), einer der ursprünglichen Autoren des Nature Papers von 2013 , die Davos Bitcoin Challenge auf der Jahrestagung des Weltwirtschaftsforums in Davos an. Während seiner Präsentation wurden DNA-Röhren an das Publikum verteilt, mit der Nachricht, dass jede Röhre den privaten Schlüssel von genau einem Bitcoin enthielt , alle in DNA kodiert. Der erste , der die DNA sequenziert und entschlüsselt, könnte die Bitcoin beanspruchen und die Herausforderung gewinnen. Die Challenge war auf drei Jahre angelegt und endete, wenn niemand den Preis vor dem 21. Januar 2018 beanspruchte.

Fast drei Jahre später, am 19. Januar 2018, gab das EBI bekannt, dass der belgische Doktorand Sander Wuyts von der Universität Antwerpen und der Vrije Universiteit Brussel als erster die Herausforderung gemeistert hat. Neben den Anweisungen zur Inanspruchnahme des Bitcoins (als Klartext- und PDF-Datei gespeichert ) wurden das Logo des EBI, das Logo des Unternehmens, das die DNA gedruckt hat (CustomArray), und eine Skizze von James Joyce aus dem DNA.

DNA der Dinge

Das Konzept der DNA of Things (DoT) wurde 2019 von einem Forscherteam aus Israel und der Schweiz eingeführt, darunter Yaniv Erlich und Robert Grass. DoT kodiert digitale Daten in DNA-Moleküle, die dann in Objekte eingebettet werden. Dies gibt die Möglichkeit, Objekte zu erstellen, die ihren eigenen Bauplan tragen, ähnlich wie bei biologischen Organismen. Im Gegensatz zum Internet der Dinge , das ein System miteinander verbundener Computergeräte ist, erstellt DoT Objekte, die unabhängige Speicherobjekte sind, völlig netzunabhängig .

Als Proof of Concept für DoT druckte der Forscher einen Stanford-Hasen in 3D, der seinen Bauplan in dem zum Drucken verwendeten Kunststofffilament enthält. Durch das Abschneiden eines winzigen Stücks vom Ohr des Hasen konnten sie den Bauplan auslesen, ihn vervielfachen und eine nächste Generation von Hasen produzieren. Darüber hinaus wurde die Fähigkeit von DoT für steganographische Zwecke gezeigt, indem nicht unterscheidbare Linsen hergestellt wurden, die ein in das Material integriertes YouTube- Video enthalten .

Siehe auch

Verweise

Weiterlesen