Gen - Gene

Das obige Bild enthält anklickbare Links
Ein Gen ist eine DNA- Region , die für die Funktion kodiert. Ein Chromosom besteht aus einem langen DNA-Strang, der viele Gene enthält. Ein menschliches Chromosom kann bis zu 500 Millionen Basenpaare DNA mit Tausenden von Genen haben.

In der Biologie , ein Gen (von genos ( griechisch ) bedeutet Generation oder Geburt oder gender ) ist eine Grundeinheit der Vererbung und eine Sequenz von Nukleotiden in DNA , die codiert für die Synthese eines Genprodukts , entweder RNA oder Protein .

Bei der Genexpression wird die DNA zunächst in RNA kopiert . Die RNA kann direkt funktionelle oder die Zwischen seiner Vorlage für ein Protein , das eine Funktion durchführt. Die Übertragung von Genen auf die Nachkommen eines Organismus ist die Grundlage für die Vererbung phänotypischer Merkmale . Diese Gene bilden verschiedene DNA-Sequenzen, die Genotypen genannt werden . Genotypen zusammen mit Umwelt- und Entwicklungsfaktoren bestimmen, was die Phänotypen sein werden. Die meisten biologischen Merkmale stehen unter dem Einfluss von Polygenen (viele verschiedene Gene) sowie Gen-Umwelt-Interaktionen . Einige genetische Merkmale sind sofort sichtbar, wie die Augenfarbe oder die Anzahl der Gliedmaßen, andere nicht, wie die Blutgruppe , das Risiko für bestimmte Krankheiten oder die Tausenden von grundlegenden biochemischen Prozessen, die das Leben ausmachen .

Gene können in ihrer Sequenz Mutationen erwerben , die in der Population zu verschiedenen Varianten, den sogenannten Allelen , führen . Diese Allele kodieren leicht unterschiedliche Versionen eines Proteins, die unterschiedliche phänotypische Merkmale verursachen. Die Verwendung des Begriffs "ein Gen haben" (zB "gute Gene", "Haarfarbengen") bezieht sich typischerweise auf das Enthalten eines anderen Allels desselben gemeinsamen Gens. Gene entwickeln sich aufgrund der natürlichen Selektion / des Überlebens der Stärksten und der genetischen Drift der Allele.

Das Konzept des Gens wird immer weiter verfeinert, wenn neue Phänomene entdeckt werden. Beispielsweise können regulatorische Regionen eines Gens weit von seinen kodierenden Regionen entfernt sein , und kodierende Regionen können in mehrere Exons aufgeteilt werden . Einige Viren speichern ihr Genom in RNA statt in DNA und einige Genprodukte sind funktionelle nicht-kodierende RNAs . Daher ist eine breite, moderne Arbeitsdefinition eines Gens jeder diskrete Ort einer erblichen, genomischen Sequenz, der die Merkmale eines Organismus beeinflusst, indem er als funktionelles Produkt exprimiert oder die Genexpression reguliert wird .

Der Begriff Gen wurde 1909 vom dänischen Botaniker , Pflanzenphysiologen und Genetiker Wilhelm Johannsen eingeführt . Er ist inspiriert vom Altgriechischen : γόνος, gonos , das bedeutet Nachkommen und Fortpflanzung.

Geschichte

Foto von Gregor Mendel
Gregor Mendel

Entdeckung diskreter vererbter Einheiten

Die Existenz diskreter vererbbarer Einheiten wurde erstmals von Gregor Mendel (1822–1884) vorgeschlagen. Von 1857 bis 1864 untersuchte er in Brünn im österreichischen Kaiserreich (heute Tschechien) die Vererbungsmuster von 8000 gewöhnlichen essbaren Erbsenpflanzen und verfolgte verschiedene Merkmale von den Eltern bis zu den Nachkommen. Er beschrieb diese mathematisch als 2 n  Kombinationen, wobei n die Anzahl der unterschiedlichen Merkmale der ursprünglichen Erbsen ist. Obwohl er den Begriff Gen nicht benutzte , erklärte er seine Ergebnisse mit diskreten vererbten Einheiten, die zu beobachtbaren physikalischen Eigenschaften führen. Diese Beschreibung nahm Wilhelm Johannsens Unterscheidung zwischen Genotyp (das genetische Material eines Organismus) und Phänotyp (die beobachtbaren Merkmale dieses Organismus) vorweg. Mendel war auch der erste, der ein unabhängiges Sortiment , die Unterscheidung zwischen dominanten und rezessiven Merkmalen, die Unterscheidung zwischen Heterozygoten und Homozygoten und das Phänomen der diskontinuierlichen Vererbung demonstrierte .

Vor Mendels Arbeit war die vorherrschende Vererbungstheorie eine Vermischungsvererbung , die darauf hindeutete, dass jeder Elternteil Flüssigkeiten zum Befruchtungsprozess beisteuerte und dass sich die Merkmale der Eltern vermischten und vermischten, um die Nachkommen hervorzubringen. Charles Darwin entwickelte eine Vererbungstheorie, die er Pangenesis nannte , von griechisch pan ("alles, ganz") und Genesis ("Geburt") / Genos ("Ursprung"). Darwin verwendete den Begriff Gemmule , um hypothetische Partikel zu beschreiben, die sich während der Reproduktion vermischen würden.

Mendels Arbeit ging weitgehend unbemerkt nach seiner ersten Veröffentlichung im Jahr 1866, wurde aber im späten 19. Jahrhundert von neu entdeckt Hugo de Vries , Carl Correns und Erich von Tschermak , der (angeblich hat) erreicht ähnliche Schlussfolgerungen in ihrer eigenen Forschung. Insbesondere veröffentlichte Hugo de Vries 1889 sein Buch Intracellular Pangenesis , in dem er postulierte, dass verschiedene Charaktere individuelle erbliche Träger haben und dass die Vererbung bestimmter Merkmale in Organismen in Partikeln erfolgt. De Vries nannte diese Einheiten "pangenes" ( Pangens auf Deutsch), nach Darwins Pangenese-Theorie von 1868.

Zwanzig Jahre später, 1909, führte Wilhelm Johannsen den Begriff „Gen“ ein und 1906 William Bateson den der „ Genetik “, während unter anderem Eduard Strasburger noch den Begriff „Pangene“ für die grundlegende physikalische und funktionelle Einheit der Vererbung verwendete .

Entdeckung der DNA

Die Fortschritte beim Verständnis von Genen und Vererbung wurden während des gesamten 20. Jahrhunderts fortgesetzt. Desoxyribonukleinsäure (DNA) wurde durch Experimente in den 1940er bis 1950er Jahren als der molekulare Speicher für genetische Informationen nachgewiesen. Die Struktur der DNA wurde von Rosalind Franklin und Maurice Wilkins mittels Röntgenkristallographie untersucht , was James D. Watson und Francis Crick veranlasste , ein Modell des doppelsträngigen DNA-Moleküls zu veröffentlichen, dessen gepaarte Nukleotidbasen eine zwingende Hypothese für den Mechanismus von genetische Replikation.

In den frühen 1950er Jahren herrschte die Ansicht vor, dass die Gene in einem Chromosom wie getrennte Einheiten agierten, durch Rekombination unteilbar und wie Perlen an einer Schnur angeordnet. Die Experimente von Benzer mit Mutanten, die in der rII-Region des Bakteriophagen T4 (1955–1959) defekt waren, zeigten, dass einzelne Gene eine einfache lineare Struktur haben und wahrscheinlich einem linearen Abschnitt der DNA entsprechen.

Zusammen hat diese Forschungsgruppe das zentrale Dogma der Molekularbiologie etabliert , das besagt, dass Proteine von RNA translatiert werden , die von DNA transkribiert wird . Es hat sich seitdem gezeigt, dass dieses Dogma Ausnahmen hat, wie die reverse Transkription in Retroviren . Die moderne Erforschung der Genetik auf DNA-Ebene wird als Molekulargenetik bezeichnet .

1972 konnten Walter Fiers und sein Team erstmals die Sequenz eines Gens bestimmen: die des Hüllproteins des Bakteriophagen MS2 . Die anschließende Entwicklung der Kettenabbruch- DNA-Sequenzierung im Jahr 1977 durch Frederick Sanger verbesserte die Effizienz der Sequenzierung und machte sie zu einem routinemäßigen Laborwerkzeug. In frühen Phasen des Humangenomprojekts wurde eine automatisierte Version der Sanger-Methode verwendet .

Moderne Synthese und ihre Nachfolger

Die im frühen 20. Jahrhundert entwickelten Theorien zur Integration der Mendelschen Genetik in die Darwinsche Evolution werden als moderne Synthese bezeichnet , ein Begriff, der von Julian Huxley eingeführt wurde .

Evolutionsbiologen haben dieses Konzept in der Folge modifiziert, wie zum Beispiel George C. Williams ' genzentrische Sicht der Evolution . Er schlug ein evolutionäres Konzept des Gens als Einheit der natürlichen Auslese mit der Definition vor: "das, was sich mit beträchtlicher Häufigkeit segregiert und rekombiniert." Aus dieser Sicht transkribiert das molekulare Gen als Einheit, und das evolutionäre Gen erbt als Einheit. Verwandte Ideen, die die zentrale Bedeutung von Genen in der Evolution betonen, wurden von Richard Dawkins populär gemacht .

Molekulare Basis

Chemisches DNA-Strukturdiagramm, das zeigt, wie die Doppelhelix aus zwei Ketten des Zucker-Phosphat-Rückgrats besteht, deren Basen nach innen zeigen und insbesondere Basenpaare A zu T und C zu G mit Wasserstoffbrückenbindungen bilden.
Die chemische Struktur eines aus vier Basenpaaren bestehenden Fragments einer DNA -Doppelhelix . Die Zucker - Phosphatrückgratketten laufen in entgegengesetzten Richtungen mit den Basen nach innen zeigen, basenpaar A bis T und C bis G mit Wasserstoffbrücken .

DNA

Die überwiegende Mehrheit der Organismen kodiert ihre Gene in langen DNA- Strängen (Desoxyribonukleinsäure). Die DNA besteht aus einer Kette aus vier Arten von Nukleotid- Untereinheiten, die jeweils aus einem Zucker mit fünf Kohlenstoffatomen ( 2-Desoxyribose ), einer Phosphatgruppe und einer der vier Basen Adenin , Cytosin , Guanin und Thymin bestehen .

Zwei DNA-Ketten verdrehen sich umeinander, um eine DNA -Doppelhelix zu bilden, wobei sich das Phosphat-Zucker-Rückgrat spiralförmig um die Außenseite windet und die Basen nach innen zeigen, wobei Adenin- Basen zu Thymin und Guanin zu Cytosin gepaart sind. Die Spezifität der Basenpaarung tritt auf, weil Adenin und Thymin sich ausrichten, um zwei Wasserstoffbrücken zu bilden , während Cytosin und Guanin drei Wasserstoffbrücken bilden. Die beiden Stränge in einer Doppelhelix müssen daher komplementär sein , wobei ihre Basensequenz so übereinstimmt, dass die Adenine des einen Strangs mit den Thyminen des anderen Strangs gepaart werden und so weiter.

Aufgrund der chemischen Zusammensetzung der Pentosereste der Basen haben DNA-Stränge Direktionalität. Ein Ende eines DNA-Polymers enthält eine exponierte Hydroxylgruppe an der Desoxyribose ; dies ist als 3'-Ende des Moleküls bekannt. Das andere Ende enthält eine exponierte Phosphatgruppe ; Dies ist das 5'-Ende . Die beiden Stränge einer Doppelhelix verlaufen in entgegengesetzte Richtungen. Die Nukleinsäuresynthese, einschließlich der DNA-Replikation und -Transkription, erfolgt in 5'→3'-Richtung, weil neue Nukleotide über eine Dehydratisierungsreaktion hinzugefügt werden , die das exponierte 3'-Hydroxyl als Nukleophil verwendet .

Die Expression von Genen, die in der DNA kodiert sind, beginnt mit der Transkription des Gens in RNA , eine zweite Art von Nukleinsäure, die der DNA sehr ähnlich ist, aber deren Monomere eher den Zucker Ribose als Desoxyribose enthalten . RNA enthält auch die Base Uracil anstelle von Thymin . RNA-Moleküle sind weniger stabil als DNA und sind typischerweise einzelsträngig. Gene, die Proteine ​​kodieren, bestehen aus einer Reihe von Drei- Nukleotid- Sequenzen, die als Codons bezeichnet werden und als „Wörter“ in der genetischen „Sprache“ dienen. Der genetische Code spezifiziert die Entsprechung bei der Proteintranslation zwischen Codons und Aminosäuren . Der genetische Code ist bei allen bekannten Organismen nahezu gleich.

Chromosomen

Mikroskopische Aufnahme von 46 Chromosomen mit roten und grünen Streifen
Fluoreszenzmikroskopische Aufnahme eines menschlichen weiblichen Karyotyps mit 23 Chromosomenpaaren. Die DNA ist rot gefärbt , wobei Regionen, die reich an Housekeeping-Genen sind, weiter grün gefärbt sind. Die größten Chromosomen sind etwa zehnmal so groß wie die kleinsten.

Die Gesamtheit der Gene in einem Organismus oder einer Zelle wird als Genom bezeichnet , das auf einem oder mehreren Chromosomen gespeichert sein kann . Ein Chromosom besteht aus einer einzigen, sehr langen DNA-Helix, auf der Tausende von Genen kodiert sind. Die Region des Chromosoms, an der sich ein bestimmtes Gen befindet, wird als Locus bezeichnet . Jeder Locus enthält ein Allel eines Gens; jedoch können Mitglieder einer Population unterschiedliche Allele am Locus haben, jedes mit einer leicht unterschiedlichen Gensequenz.

Die meisten eukaryotischen Gene sind auf einem Satz großer, linearer Chromosomen gespeichert. Die Chromosomen sind im Kern im Komplex mit Speicherproteinen, den Histonen , verpackt , um eine Einheit namens Nukleosom zu bilden . Auf diese Weise verpackte und kondensierte DNA wird als Chromatin bezeichnet . Die Art und Weise, in der DNA auf den Histonen gespeichert wird, sowie chemische Modifikationen des Histons selbst regulieren, ob eine bestimmte DNA-Region für die Genexpression zugänglich ist . Neben Genen enthalten eukaryotische Chromosomen Sequenzen, die dafür sorgen, dass die DNA ohne Abbau von Endbereichen kopiert und bei der Zellteilung in Tochterzellen einsortiert wird: Replikationsstartpunkte , Telomere und das Zentromer . Replikationsstartpunkte sind die Sequenzregionen, in denen die DNA-Replikation initiiert wird, um zwei Kopien des Chromosoms herzustellen. Telomere sind lange Abschnitte repetitiver Sequenzen, die die Enden der linearen Chromosomen abdecken und den Abbau von kodierenden und regulatorischen Regionen während der DNA-Replikation verhindern . Die Länge der Telomere nimmt mit jeder Replikation des Genoms ab und wird mit dem Alterungsprozess in Verbindung gebracht . Das Zentromer wird für die Bindung von Spindelfasern benötigt, um während der Zellteilung Schwesterchromatiden in Tochterzellen zu trennen .

Prokaryoten ( Bakterien und Archaeen ) speichern ihre Genome typischerweise auf einem einzigen großen, kreisförmigen Chromosom . In ähnlicher Weise enthalten einige eukaryotische Organellen ein verbleibendes zirkuläres Chromosom mit einer kleinen Anzahl von Genen. Prokaryoten ergänzen ihr Chromosom manchmal durch zusätzliche kleine DNA-Kreise , die Plasmide genannt werden , die normalerweise nur wenige Gene kodieren und zwischen Individuen übertragbar sind. Beispielsweise sind die Gene für Antibiotikaresistenzen in der Regel auf bakteriellen Plasmiden kodiert und können über horizontalen Gentransfer zwischen einzelnen Zellen, auch unterschiedlichen Spezies, weitergegeben werden .

Während die Chromosomen von Prokaryoten relativ gendicht sind, enthalten die von Eukaryoten oft DNA-Bereiche, die keine offensichtliche Funktion erfüllen. Einfache einzellige Eukaryoten haben relativ geringe Mengen solcher DNA, während die Genome komplexer vielzelliger Organismen , einschließlich des Menschen, einen absoluten Großteil der DNA ohne identifizierte Funktion enthalten. Diese DNA wurde oft als „ Junk-DNA “ bezeichnet. Neuere Analysen deuten jedoch darauf hin, dass, obwohl proteinkodierende DNA kaum 2% des menschlichen Genoms ausmacht , etwa 80% der Basen im Genom exprimiert werden können, sodass der Begriff "Junk-DNA" möglicherweise eine falsche Bezeichnung ist.

Struktur und Funktion

Struktur

Das obige Bild enthält anklickbare Links
Die Struktur eines eukaryotischen Protein-kodierenden Gens. Die regulatorische Sequenz kontrolliert, wann und wo die Expression für die proteinkodierende Region (rot) auftritt . Promotor- und Enhancer- Regionen (gelb) regulieren die Transkription des Gens in eine Prä-mRNA, die modifiziert wird , um Introns (hellgrau) zu entfernen und eine 5'-Kappe und einen Poly-A-Schwanz (dunkelgrau) hinzuzufügen. Die mRNA 5' und 3' untranslatierten Regionen (blau) regulieren Übersetzung in das endgültige Proteinprodukt.

Die Struktur eines Gens besteht aus vielen Elementen, von denen die eigentliche Proteinkodierungssequenz oft nur ein kleiner Teil ist. Dazu gehören DNA-Regionen, die nicht transkribiert werden, sowie untranslatierte Regionen der RNA.

Flankierend zum offenen Leseraster enthalten Gene eine regulatorische Sequenz , die für ihre Expression erforderlich ist. Erstens benötigen Gene eine Promotorsequenz . Der Promotor wird von Transkriptionsfaktoren erkannt und gebunden , die die RNA-Polymerase rekrutieren und dabei helfen , an die Region zu binden, um die Transkription zu initiieren. Die Erkennung erfolgt typischerweise als Konsensussequenz wie die TATA-Box . Ein Gen kann mehr als einen Promotor haben, was zu Boten-RNAs ( mRNA ) führt, die sich darin unterscheiden, wie weit sie am 5'-Ende reichen. Hoch transkribierte Gene haben "starke" Promotorsequenzen, die starke Assoziationen mit Transkriptionsfaktoren bilden, wodurch die Transkription mit hoher Rate initiiert wird. Andere Gene haben "schwache" Promotoren, die schwache Assoziationen mit Transkriptionsfaktoren eingehen und die Transkription seltener initiieren. Eukaryontische Promotorregionen sind viel komplexer und schwieriger zu identifizieren als prokaryontische Promotoren.

Außerdem können Gene regulatorische Regionen viele Kilobasen stromaufwärts oder stromabwärts des offenen Leserasters aufweisen, die die Expression verändern. Diese wirken durch Bindung an Transkriptionsfaktoren, die dann eine Schleife der DNA bewirken, so dass die regulatorische Sequenz (und der gebundene Transkriptionsfaktor) nahe an die RNA-Polymerase-Bindungsstelle gelangen. Zum Beispiel erhöhen Enhancer die Transkription, indem sie ein Aktivatorprotein binden, das dann hilft, die RNA-Polymerase an den Promotor zu rekrutieren; Umgekehrt binden Silencer Repressorproteine und machen die DNA für die RNA-Polymerase weniger verfügbar.

Die transkribierte prä-mRNA enthält an beiden Enden untranslatierte Regionen , die Bindungsstellen für Ribosomen , RNA-bindende Proteine , miRNA sowie Terminator und Start- und Stoppcodons enthalten . Darüber hinaus enthalten die meisten eukaryotischen offenen Leserahmen untranslatierte Introns , die entfernt werden, und Exons , die in einem als RNA-Spleißen bekannten Prozess miteinander verbunden werden . Schließlich werden die Enden von Gentranskripten durch Spaltungs- und Polyadenylierungsstellen (CPA) definiert , an denen neu produzierte prä-mRNA gespalten und eine Kette von ~200 Adenosinmonophosphaten am 3'-Ende hinzugefügt wird. Der Poly(A) -Schwanz schützt reife mRNA vor Abbau und hat andere Funktionen, die die Translation, Lokalisierung und den Transport des Transkripts aus dem Zellkern beeinflussen. Spleißen, gefolgt von CPA, erzeugt die endgültige reife mRNA , die das Protein oder RNA-Produkt kodiert. Obwohl die allgemeinen Mechanismen, die die Lokalisation menschlicher Gene definieren, bekannt sind, ist die Identifizierung der genauen Faktoren, die diese zellulären Prozesse regulieren, ein Bereich aktiver Forschung. Beispielsweise können bekannte Sequenzmerkmale in der 3'-UTR nur die Hälfte aller menschlichen Genenden erklären.

Viele prokaryontische Gene sind in Operons organisiert , mit mehreren Protein-kodierenden Sequenzen, die als eine Einheit transkribiert werden. Die Gene in einem Operon werden als kontinuierliche Boten-RNA transkribiert , die als polycistronische mRNA bezeichnet wird . Der Begriff Cistron ist in diesem Zusammenhang gleichbedeutend mit Gen. Die Transkription der mRNA eines Operons wird oft durch einen Repressor kontrolliert, der je nach Anwesenheit spezifischer Metaboliten in einem aktiven oder inaktiven Zustand auftreten kann. Wenn er aktiv ist, bindet der Repressor an eine DNA-Sequenz am Anfang des Operons, die als Operatorregion bezeichnet wird , und unterdrückt die Transkription des Operons ; wenn der Repressor inaktiv ist, kann eine Transkription des Operons erfolgen (siehe zB Lac-Operon ). Die Produkte von Operon-Genen haben typischerweise verwandte Funktionen und sind in dasselbe regulatorische Netzwerk eingebunden .

Funktionsdefinitionen

Es ist schwierig, genau zu definieren, welcher Abschnitt einer DNA-Sequenz ein Gen umfasst. Regulatorische Regionen eines Gens, wie Enhancer, müssen nicht unbedingt in der Nähe der kodierenden Sequenz auf dem linearen Molekül liegen, da die dazwischenliegende DNA ausgeschleift werden kann, um das Gen und seine regulatorische Region in die Nähe zu bringen. Ebenso können die Introns eines Gens viel größer sein als seine Exons. Regulatorische Regionen können sich sogar auf völlig unterschiedlichen Chromosomen befinden und in trans arbeiten , um zu ermöglichen, dass regulatorische Regionen auf einem Chromosom mit Zielgenen auf einem anderen Chromosom in Kontakt kommen.

Frühe Arbeiten in der Molekulargenetik legten das Konzept nahe, dass ein Gen ein Protein macht . Dieses Konzept (ursprünglich als Ein-Gen-Ein-Enzym-Hypothese bezeichnet ) ging aus einer einflussreichen Arbeit von 1941 von George Beadle und Edward Tatum über Experimente mit Mutanten des Pilzes Neurospora crassa hervor . Norman Horowitz , ein früher Kollege in der Neurospora- Forschung, erinnerte sich 2004 daran, dass „diese Experimente die Wissenschaft dessen begründeten, was Beadle und Tatum biochemische Genetik nannten . Tatsächlich erwiesen sie sich als die erste Waffe in der Molekulargenetik und allen daraus folgenden Entwicklungen.“ Das Ein-Gen-eins-Protein-Konzept wurde seit der Entdeckung von Genen verfeinert, die mehrere Proteine ​​durch alternatives Spleißen und kodierende Sequenzen kodieren können, die in kurzen Abschnitten über das Genom aufgespalten werden und deren mRNAs durch Trans-Spleißen verkettet werden .

Manchmal wird eine breite operative Definition verwendet, um die Komplexität dieser unterschiedlichen Phänomene zu erfassen, wobei ein Gen als eine Vereinigung genomischer Sequenzen definiert wird, die für einen kohärenten Satz potenziell überlappender funktioneller Produkte kodieren. Diese Definition kategorisiert Gene nach ihren funktionellen Produkten (Proteine ​​oder RNA) und nicht nach ihren spezifischen DNA-Loci, wobei regulatorische Elemente als Gen-assoziierte Regionen klassifiziert werden.

Überlappung zwischen den Genen

Es ist auch möglich, dass Gene mit derselben DNA-Sequenz überlappen und als unterschiedliche, aber überlappende Gene betrachtet werden . Die derzeitige Definition eines überlappenden Gens ist bei Eukaryoten, Prokaryoten und Viren unterschiedlich. Bei Eukaryoten wurden sie kürzlich definiert als "wenn mindestens ein Nukleotid zwischen den äußersten Grenzen der Primärtranskripte von zwei oder mehr Genen geteilt wird, so dass eine DNA-Basenmutation am Überlappungspunkt die Transkripte aller an der Überlappung." In Prokaryoten und Viren wurden sie kürzlich definiert als "wenn die kodierenden Sequenzen von zwei Genen ein Nukleotid entweder auf demselben oder entgegengesetzten Strängen teilen".

Genexpression

In allen Organismen sind zwei Schritte erforderlich, um die in der DNA eines Gens kodierten Informationen zu lesen und das angegebene Protein zu produzieren. Zunächst wird die DNA des Gens transkribiert , um Boten - RNA ( mRNA ). Zweitens wird diese mRNA in Protein übersetzt . RNA-kodierende Gene müssen noch den ersten Schritt durchlaufen, werden aber nicht in Protein übersetzt. Der Prozess der Herstellung eines biologisch funktionellen Moleküls aus entweder RNA oder Protein wird Genexpression genannt , und das resultierende Molekül wird Genprodukt genannt .

Genetischer Code

Ein RNA-Molekül, das aus Nukleotiden besteht.  Gruppen von drei Nukleotiden sind als Codons angegeben, wobei jedes einer spezifischen Aminosäure entspricht.
Schema eines einzelsträngigen RNA-Moleküls, das eine Reihe von Dreibasen- Codons veranschaulicht . Jedes Codon aus drei Nukleotiden entspricht einer Aminosäure, wenn es in Protein übersetzt wird

Die Nukleotidsequenz der DNA eines Gens spezifiziert die Aminosäuresequenz eines Proteins durch den genetischen Code . Sätze von drei Nukleotiden, bekannt als Codons , entsprechen jeweils einer bestimmten Aminosäure. Das Prinzip, dass drei aufeinanderfolgende DNA-Basen für jede Aminosäure kodieren, wurde 1961 unter Verwendung von Rasterverschiebungsmutationen im rIIB-Gen des Bakteriophagen T4 demonstriert (siehe Crick, Brenner et al. Experiment ).

Zusätzlich zeigen ein " Startcodon " und drei " Stopcodons " den Anfang und das Ende der proteinkodierenden Region an . Es gibt 64 mögliche Codons (vier mögliche Nukleotide an jeder der drei Positionen, also 4 3  mögliche Codons) und nur 20 Standardaminosäuren; daher ist der Code redundant und mehrere Codons können dieselbe Aminosäure spezifizieren. Die Entsprechung zwischen Codons und Aminosäuren ist bei allen bekannten lebenden Organismen nahezu universell.

Transkription

Die Transkription erzeugt ein einzelsträngiges RNA- Molekül, bekannt als Messenger-RNA , dessen Nukleotidsequenz komplementär zu der DNA ist, von der es transkribiert wurde. Die mRNA fungiert als Zwischenprodukt zwischen dem DNA-Gen und seinem endgültigen Proteinprodukt. Die DNA des Gens wird als Matrize verwendet, um eine komplementäre mRNA zu erzeugen . Die mRNA stimmt mit der Sequenz des DNA- Kodierungsstrangs des Gens überein, da sie als Komplement des Matrizenstrangs synthetisiert wird . Die Transkription wird von einem Enzym namens RNA-Polymerase durchgeführt , das den Matrizenstrang in 3'- zu- 5'-  Richtung liest und die RNA von 5' nach 3' synthetisiert . Um die Transkription zu initiieren, erkennt und bindet die Polymerase zunächst eine Promotorregion des Gens. Somit ist ein Hauptmechanismus der Genregulation das Blockieren oder Sequestrieren der Promotorregion, entweder durch enge Bindung durch Repressormoleküle , die die Polymerase physikalisch blockieren, oder indem die DNA so organisiert wird, dass die Promotorregion nicht zugänglich ist.

Bei Prokaryoten erfolgt die Transkription im Zytoplasma ; bei sehr langen Transkripten kann die Translation am 5'-Ende der RNA beginnen, während das 3'-Ende noch transkribiert wird. Bei Eukaryoten erfolgt die Transkription im Zellkern, wo die DNA der Zelle gespeichert wird. Das von der Polymerase produzierte RNA-Molekül ist als primäres Transkript bekannt und unterliegt posttranskriptionellen Modifikationen, bevor es zur Translation in das Zytoplasma exportiert wird. Eine der durchgeführten Modifikationen ist das Spleißen von Introns, die Sequenzen in der transkribierten Region sind, die kein Protein kodieren. Alternative Spleißmechanismen können dazu führen, dass reife Transkripte desselben Gens unterschiedliche Sequenzen aufweisen und somit für unterschiedliche Proteine ​​kodieren. Dies ist eine wichtige Regulationsform in eukaryontischen Zellen und kommt auch in einigen Prokaryonten vor.

Übersetzung

Ein proteinkodierendes Gen in DNA, das in ein funktionelles Protein transkribiert und translatiert wird, oder ein nicht-proteinkodierendes Gen, das in eine funktionelle RNA transkribiert wird
Proteinkodierende Gene werden in ein mRNA- Zwischenprodukt transkribiert und dann in ein funktionelles Protein translatiert . RNA-kodierende Gene werden in eine funktionelle nicht-kodierende RNA transkribiert . ( PDB : 3BSE , 1OBB , 3TRA ​)

Translation ist der Vorgang, bei dem ein reifes mRNA- Molekül als Matrize für die Synthese eines neuen Proteins verwendet wird . Die Translation erfolgt durch Ribosomen , große Komplexe aus RNA und Protein, die für die Durchführung der chemischen Reaktionen verantwortlich sind, um einer wachsenden Polypeptidkette durch Bildung von Peptidbindungen neue Aminosäuren hinzuzufügen . Der genetische Code wird über Interaktionen mit spezialisierten RNA-Molekülen, der sogenannten Transfer-RNA (tRNA), aus drei Nukleotiden gleichzeitig in Einheiten, die als Codons bezeichnet werden , gelesen . Jede tRNA hat drei ungepaarte Basen, die als Anticodon bekannt sind und komplementär zu dem Codon sind, das sie auf der mRNA liest. Die tRNA ist auch kovalent an die durch das komplementäre Codon spezifizierte Aminosäure gebunden . Wenn die tRNA an ihr komplementäres Codon in einem mRNA-Strang bindet, bindet das Ribosom seine Aminosäurefracht an die neue Polypeptidkette, die vom Aminoterminus zum Carboxylterminus synthetisiert wird . Während und nach der Synthese müssen sich die meisten neuen Proteine zu ihrer aktiven dreidimensionalen Struktur falten , bevor sie ihre zellulären Funktionen erfüllen können.

Verordnung

Gene sind so reguliert , dass sie nur dann exprimiert werden , wenn das Produkt benötigt wird, da die Expression begrenzte Ressourcen benötigt. Eine Zelle reguliert ihre Genexpression in Abhängigkeit von ihrer äußeren Umgebung (zB verfügbare Nährstoffe , Temperatur und andere Belastungen ), ihrer inneren Umgebung (zB Zellteilungszyklus , Stoffwechsel , Infektionsstatus ) und ihrer spezifischen Rolle in einem vielzelligen Organismus. Die Genexpression kann in jedem Schritt reguliert werden: von der Transkriptionsinitiation über die RNA-Prozessierung bis hin zur posttranslationalen Modifikation des Proteins. Die Regulation von Lactose- Stoffwechselgenen in E. coli ( lac- Operon ) war der erste derartige Mechanismus, der 1961 beschrieben wurde.

RNA-Gene

Ein typisches proteinkodierendes Gen wird zunächst als Zwischenprodukt bei der Herstellung des fertigen Proteinprodukts in RNA kopiert . In anderen Fällen sind die RNA-Moleküle die eigentlichen Funktionsprodukte, wie bei der Synthese von ribosomaler RNA und Transfer-RNA . Einige RNAs, die als Ribozyme bekannt sind, haben eine enzymatische Funktion und microRNA hat eine regulatorische Funktion. Die DNA- Sequenzen, aus denen solche RNAs transkribiert werden, sind als nicht-kodierende RNA-Gene bekannt .

Manche Viren speichern ihr gesamtes Genom in Form von RNA und enthalten überhaupt keine DNA. Da sie RNA verwenden, um Gene zu speichern, können ihre zellulären Wirte ihre Proteine ​​synthetisieren, sobald sie infiziert sind und ohne Verzögerung auf die Transkription warten müssen. Andererseits erfordern RNA- Retroviren wie HIV die reverse Transkription ihres Genoms von RNA in DNA, bevor ihre Proteine ​​synthetisiert werden können. Eine RNA-vermittelte epigenetische Vererbung wurde auch bei Pflanzen und sehr selten bei Tieren beobachtet.

Nachlass

Illustration der autosomal-rezessiven Vererbung.  Jeder Elternteil hat ein blaues Allel und ein weißes Allel.  Jedes ihrer 4 Kinder erbt ein Allel von jedem Elternteil, so dass ein Kind am Ende zwei blaue Allele hat, ein Kind zwei weiße Allele hat und zwei Kinder eines von jedem Allel haben.  Nur das Kind mit beiden blauen Allelen zeigt das Merkmal, da das Merkmal rezessiv ist.
Vererbung eines Gens mit zwei verschiedenen Allelen (blau und weiß). Das Gen befindet sich auf einem autosomalen Chromosom . Das weiße Allel ist gegenüber dem blauen Allel rezessiv . Die Wahrscheinlichkeit für jedes Ergebnis in der Generation der Kinder beträgt ein Viertel oder 25 Prozent.

Organismen erben ihre Gene von ihren Eltern. Asexuelle Organismen erben einfach eine vollständige Kopie des Genoms ihrer Eltern. Sexualorganismen haben zwei Kopien jedes Chromosoms, weil sie von jedem Elternteil einen vollständigen Satz erben.

Mendelsches Erbe

Gemäß der Mendelschen Vererbung sind Variationen im Phänotyp eines Organismus (beobachtbare physische und Verhaltensmerkmale) teilweise auf Variationen in seinem Genotyp (besonderer Satz von Genen) zurückzuführen. Jedes Gen spezifiziert ein bestimmtes Merkmal mit einer anderen Sequenz eines Gens ( Allele ), was zu unterschiedlichen Phänotypen führt. Die meisten eukaryotischen Organismen (wie die Erbsenpflanzen, an denen Mendel arbeitete) haben zwei Allele für jedes Merkmal, eines von jedem Elternteil geerbt.

Allele an einem Locus können dominant oder rezessiv sein ; dominante Allele führen zu ihren entsprechenden Phänotypen, wenn sie mit einem anderen Allel für das gleiche Merkmal gepaart werden, während rezessive Allele ihren entsprechenden Phänotyp nur dann hervorbringen, wenn sie mit einer anderen Kopie desselben Allels gepaart werden. Wenn Sie die Genotypen der Organismen kennen, können Sie feststellen, welche Allele dominant und welche rezessiv sind. Wenn beispielsweise das Allel, das hohe Stängel bei Erbsenpflanzen spezifiziert, gegenüber dem Allel, das kurze Stängel spezifiziert, dominant ist, dann haben Erbsenpflanzen, die ein hohes Allel von einem Elternteil und ein kurzes Allel von dem anderen Elternteil erben, auch hohe Stängel. Mendels Arbeit zeigte, dass sich Allele bei der Produktion von Gameten oder Keimzellen unabhängig anordnen und so Variation in der nächsten Generation sicherstellen. Obwohl die Mendelsche Vererbung ein gutes Modell für viele Merkmale bleibt, die durch einzelne Gene bestimmt werden (einschließlich einer Reihe bekannter genetischer Störungen ), umfasst sie nicht die physikalischen Prozesse der DNA-Replikation und Zellteilung.

DNA-Replikation und Zellteilung

Das Wachstum, die Entwicklung und die Fortpflanzung von Organismen beruht auf der Zellteilung ; der Prozess, bei dem sich eine einzelne Zelle in zwei meist identische Tochterzellen teilt . Dies erfordert zunächst die Herstellung einer Duplikatkopie jedes Gens im Genom in einem Prozess, der als DNA-Replikation bezeichnet wird . Die Kopien werden von spezialisierten Enzymen hergestellt, die als DNA-Polymerasen bekannt sind , die einen Strang der doppelhelikalen DNA, den sogenannten Matrizenstrang, "lesen" und einen neuen komplementären Strang synthetisieren. Da die DNA-Doppelhelix durch Basenpaarung zusammengehalten wird , spezifiziert die Sequenz eines Strangs vollständig die Sequenz seines Komplements; daher muss nur ein Strang vom Enzym gelesen werden, um eine originalgetreue Kopie zu erzeugen. Der Prozess der DNA-Replikation ist semikonservativ ; das heißt, die von jeder Tochterzelle geerbte Kopie des Genoms enthält einen ursprünglichen und einen neu synthetisierten DNA-Strang.

Die DNA-Replikationsrate in lebenden Zellen wurde zuerst als die Rate der Phagen-T4-DNA-Verlängerung in Phagen-infizierten E. coli gemessen und erwies sich als beeindruckend schnell. Während des exponentiellen DNA-Anstiegs bei 37 °C betrug die Elongationsrate 749 Nukleotide pro Sekunde.

Nachdem die DNA-Replikation abgeschlossen ist, muss die Zelle die beiden Kopien des Genoms physisch trennen und sich in zwei verschiedene membrangebundene Zellen teilen. Bei Prokaryoten  ( Bakterien und Archaeen ) geschieht dies normalerweise über einen relativ einfachen Prozess, der als binäre Spaltung bezeichnet wird , bei dem sich jedes zirkuläre Genom an die Zellmembran anheftet und beim Einstülpen der Membran in die Tochterzellen getrennt wird , um das Zytoplasma in zwei membrangebundene Teile aufzuspalten . Die binäre Spaltung ist im Vergleich zu den Zellteilungsraten bei Eukaryoten extrem schnell . Die eukaryotische Zellteilung ist ein komplexerer Prozess, der als Zellzyklus bekannt ist ; Die DNA-Replikation erfolgt während einer Phase dieses Zyklus, die als S-Phase bekannt ist , während der Prozess der Chromosomentrennung und Aufspaltung des Zytoplasmas während der M-Phase stattfindet .

Molekulare Vererbung

Die Vervielfältigung und Weitergabe genetischen Materials von einer Zellgeneration zur nächsten ist die Grundlage für die molekulare Vererbung und die Verbindung zwischen dem klassischen und dem molekularen Bild von Genen. Organismen erben die Eigenschaften ihrer Eltern, weil die Zellen der Nachkommen Kopien der Gene in den Zellen ihrer Eltern enthalten. Bei sich ungeschlechtlich fortpflanzenden Organismen sind die Nachkommen eine genetische Kopie oder ein Klon des Elternorganismus. Bei sich sexuell fortpflanzenden Organismen produziert eine spezialisierte Form der Zellteilung, die Meiose genannt wird, Zellen, die Gameten oder Keimzellen genannt werden , die haploid sind oder nur eine Kopie jedes Gens enthalten. Die von Weibchen produzierten Gameten werden als Eier oder Eizellen bezeichnet, und diejenigen, die von Männern produziert werden, werden als Spermien bezeichnet . Zwei Gameten verschmelzen zu einer diploiden befruchteten Eizelle , einer einzelnen Zelle mit zwei Gensätzen, mit einer Kopie jedes Gens von der Mutter und einer vom Vater.

Während des Prozesses der meiotischen Zellteilung kann manchmal ein Ereignis auftreten, das als genetische Rekombination oder Crossing-over bezeichnet wird , bei dem ein DNA-Stück auf einem Chromatid mit einem DNA-Stück auf dem entsprechenden homologen Nicht-Schwesterchromatid ausgetauscht wird. Dies kann zu einer Neuordnung von ansonsten verknüpften Allelen führen. Das Mendelsche Prinzip der unabhängigen Sortierung besagt, dass jedes der beiden Gene eines Elternteils für jedes Merkmal unabhängig in Gameten sortiert wird; Welches Allel ein Organismus für ein Merkmal erbt, ist unabhängig davon, welches Allel er für ein anderes Merkmal erbt. Dies gilt tatsächlich nur für Gene, die nicht auf demselben Chromosom oder sehr weit voneinander entfernt auf demselben Chromosom liegen. Je näher zwei Gene auf demselben Chromosom liegen, desto enger sind sie in Gameten verbunden und desto häufiger treten sie zusammen auf ( genetische Verknüpfung ). Gene, die sehr nahe beieinander liegen, werden im Wesentlichen nie getrennt, da es äußerst unwahrscheinlich ist, dass zwischen ihnen ein Kreuzungspunkt auftritt.

Molekulare Evolution

Mutation

Die DNA-Replikation ist zum größten Teil äußerst genau, jedoch treten Fehler ( Mutationen ) auf. Die Fehlerrate in eukaryontischen Zellen kann nur 10 –8 pro Nukleotid pro Replikation betragen, während sie bei einigen RNA-Viren bis zu 10 –3 betragen kann . Das bedeutet, dass jede Generation, jedes menschliche Genom 1–2 neue Mutationen anhäuft. Kleine Mutationen können durch DNA-Replikation und die Nachwirkungen von DNA-Schäden verursacht werden und umfassen Punktmutationen, bei denen eine einzelne Base verändert ist, und Rasterverschiebungsmutationen, bei denen eine einzelne Base eingefügt oder deletiert wird. Jede dieser Mutationen kann das Gen durch Missense (Änderung eines Codons , um eine andere Aminosäure zu codieren) oder Nonsense (ein vorzeitiges Stoppcodon ) verändern. Größere Mutationen können durch Rekombinationsfehler verursacht werden, die zu Chromosomenanomalien führen, einschließlich der Duplikation , Deletion, Neuanordnung oder Inversion großer Abschnitte eines Chromosoms. Darüber hinaus können DNA-Reparaturmechanismen Mutationsfehler einführen, wenn physische Schäden am Molekül repariert werden. Die Reparatur, auch bei Mutation, ist überlebenswichtiger als die Wiederherstellung einer exakten Kopie, beispielsweise bei der Reparatur von Doppelstrangbrüchen .

Wenn mehrere verschiedene Allele für ein Gen in der Population einer Spezies vorhanden sind, wird es als polymorph bezeichnet . Die meisten verschiedenen Allele sind funktionell äquivalent, jedoch können einige Allele zu unterschiedlichen phänotypischen Merkmalen führen . Das häufigste Allel eines Gens wird Wildtyp genannt , seltene Allele werden Mutanten genannt . Die genetische Variation der relativen Häufigkeiten verschiedener Allele in einer Population ist sowohl auf natürliche Selektion als auch auf genetische Drift zurückzuführen . Das Wildtyp-Allel ist nicht unbedingt der Vorfahre weniger verbreiteter Allele, noch ist es notwendigerweise fitter .

Die meisten Mutationen innerhalb von Genen sind neutral und haben keinen Einfluss auf den Phänotyp des Organismus ( stille Mutationen ). Einige Mutationen ändern die Aminosäuresequenz nicht, da mehrere Codons dieselbe Aminosäure kodieren ( synonyme Mutationen ). Andere Mutationen können neutral sein, wenn sie zu Veränderungen der Aminosäuresequenz führen, das Protein funktioniert aber mit der neuen Aminosäure immer noch ähnlich (zB konservative Mutationen ). Viele Mutationen sind jedoch schädlich oder sogar tödlich und werden durch natürliche Selektion aus Populationen entfernt. Genetische Störungen sind das Ergebnis schädlicher Mutationen und können auf eine spontane Mutation bei der betroffenen Person zurückzuführen sein oder vererbt werden. Schließlich ist ein kleiner Bruchteil der Mutationen von Vorteil , verbessert die Fitness des Organismus und ist für die Evolution extrem wichtig, da ihre Richtungsselektion zu einer adaptiven Evolution führt .

Sequenzhomologie

Ein Sequenz - Alignment, hergestellt durch ClustalO , von Säugetier - Histon - Proteinen

Gene mit einem jüngsten gemeinsamen Vorfahren und damit einer gemeinsamen evolutionären Abstammung werden als Homologe bezeichnet . Diese Gene entstehen entweder durch Genduplikation innerhalb des Genoms eines Organismus, wo sie als paraloge Gene bekannt sind, oder sind das Ergebnis einer Divergenz der Gene nach einem Artbildungsereignis , wo sie als orthologe Gene bekannt sind und oft die gleichen oder ähnliche Funktionen erfüllen bei verwandten Organismen. Es wird oft angenommen, dass die Funktionen orthologer Gene ähnlicher sind als die paraloger Gene, obwohl der Unterschied minimal ist.

Die Beziehung zwischen den Genen kann gemessen werden, indem die Sequenzausrichtung ihrer DNA verglichen wird . Der Grad der Sequenzähnlichkeit zwischen homologen Genen wird als konservierte Sequenz bezeichnet . Die meisten Änderungen an der Sequenz eines Gens haben keinen Einfluss auf seine Funktion und so akkumulieren Gene im Laufe der Zeit durch neutrale molekulare Evolution Mutationen . Darüber hinaus führt jede Selektion auf ein Gen dazu, dass seine Sequenz mit einer anderen Geschwindigkeit divergiert. Gene unter stabilisierender Selektion sind eingeschränkt und ändern sich daher langsamer, während Gene unter gerichteter Selektion die Sequenz schneller ändern. Die Sequenzunterschiede zwischen den Genen können für phylogenetische Analysen verwendet werden, um zu untersuchen, wie sich diese Gene entwickelt haben und wie die Organismen, aus denen sie stammen, miteinander verwandt sind.

Ursprünge neuer Gene

Evolutionäres Schicksal doppelter Gene.

Die häufigste Quelle für neue Gene in eukaryotischen Abstammungslinien ist die Genduplikation , die eine Variation der Kopienzahl eines bestehenden Gens im Genom erzeugt. Die resultierenden Gene (Paraloge) können dann in Sequenz und Funktion divergieren. Auf diese Weise gebildete Gensätze bilden eine Genfamilie . Genduplikationen und -verluste innerhalb einer Familie sind weit verbreitet und stellen eine Hauptquelle der evolutionären Biodiversität dar . Manchmal kann eine Genduplikation zu einer nicht funktionsfähigen Kopie eines Gens führen oder eine funktionale Kopie kann Mutationen unterliegen, die zu einem Funktionsverlust führen; solche nicht-funktionellen Gene werden Pseudogene genannt .

"Orphan"-Gene , deren Sequenz keine Ähnlichkeit mit bestehenden Genen aufweist, sind seltener als Genduplikate. Das menschliche Genom enthält schätzungsweise 18 bis 60 Gene ohne identifizierbare Homologe außerhalb des Menschen. Orphan-Gene entstehen in erster Linie entweder aus einer de novo- Entstehung aus einer zuvor nicht kodierenden Sequenz oder einer Genduplikation, gefolgt von einer so schnellen Sequenzänderung, dass die ursprüngliche Beziehung nicht mehr nachweisbar wird. De-novo- Gene sind typischerweise kürzer und einfacher in der Struktur als die meisten eukaryotischen Gene, mit wenigen oder gar keinen Introns. Über lange evolutionäre Zeiträume kann die De-novo- Gengeburt für einen erheblichen Teil der taxonomisch eingeschränkten Genfamilien verantwortlich sein.

Horizontaler Gentransfer bezieht sich auf die Übertragung von genetischem Material durch einen anderen Mechanismus als die Reproduktion . Dieser Mechanismus ist eine häufige Quelle für neue Gene in Prokaryonten , von denen manchmal angenommen wird, dass sie mehr zur genetischen Variation beitragen als zur Genduplikation. Es ist ein verbreitetes Mittel zur Verbreitung von Antibiotikaresistenz , Virulenz und adaptiven Stoffwechselfunktionen . Obwohl horizontale Genübertragung in Eukaryonten selten ist, haben wahrscheinlich Beispiele identifiziert Protisten und Alge Genomen Gene bakteriellen Ursprungs enthält.

Genom

Das Genom ist das gesamte genetische Material eines Organismus und umfasst sowohl die Gene als auch nicht-kodierende Sequenzen . Mit FINDER können eukaryotische Gene annotiert werden.

Anzahl der Gene

Darstellung von Genzahlen für repräsentative Pflanzen (grün), Wirbeltiere (blau), Wirbellose (orange), Pilze (gelb), Bakterien (lila) und Viren (grau). Ein Einschub rechts zeigt die kleineren Genome 100-fach flächenmäßig erweitert.

Die Genomgröße und die Anzahl der Gene, die es kodiert, variieren stark zwischen den Organismen. Die kleinsten Genome kommen in Viren und Viroiden (die als einzelnes nicht-kodierendes RNA-Gen fungieren) vor. Umgekehrt können Pflanzen extrem große Genome haben, wobei Reis > 46.000 proteinkodierende Gene enthält. Die Gesamtzahl der proteinkodierenden Gene (das Proteom der Erde ) wird auf 5 Millionen Sequenzen geschätzt.

Obwohl die Anzahl der Basenpaare der DNA im menschlichen Genom seit den 1960er Jahren bekannt ist, hat sich die geschätzte Anzahl von Genen im Laufe der Zeit als Definition von Genen geändert und die Methoden zu ihrem Nachweis wurden verfeinert. Anfängliche theoretische Vorhersagen über die Zahl der menschlichen Gene waren so hoch wie 2.000.000. Frühe experimentelle Messungen zeigten, dass es 50.000–100.000 transkribierte Gene ( exprimierte Sequenz-Tags ) gibt. Anschließend zeigte die Sequenzierung im Human Genome Project , dass viele dieser Transkripte alternative Varianten derselben Gene waren, und die Gesamtzahl der proteinkodierenden Gene wurde auf ~20.000 reduziert, wobei 13 Gene im mitochondrialen Genom kodiert sind. Mit dem GENCODE- Annotationsprojekt ist diese Schätzung weiter auf 19.000 gesunken . Nur 1-2% des menschlichen Genoms bestehen aus proteinkodierenden Sequenzen, der Rest ist „nichtkodierende“ DNA wie Introns , Retrotransposons und nichtkodierende RNAs . Jeder vielzellige Organismus hat alle seine Gene in jeder Zelle seines Körpers, aber nicht jedes Gen funktioniert in jeder Zelle.

Essentielle Gene

Genfunktionen im Minimalgenom des synthetischen Organismus , Syn 3 .

Essentielle Gene sind die Gruppe von Genen, von denen angenommen wird, dass sie für das Überleben eines Organismus entscheidend sind. Diese Definition setzt die reichliche Verfügbarkeit aller relevanten Nährstoffe und das Fehlen von Umweltstress voraus . Nur ein kleiner Teil der Gene eines Organismus ist essentiell. In Bakterien sind schätzungsweise 250–400 Gene für Escherichia coli und Bacillus subtilis essentiell , was weniger als 10 % ihrer Gene ausmacht. Die Hälfte dieser Gene sind Orthologe in beiden Organismen und sind hauptsächlich an der Proteinsynthese beteiligt . Bei der Keimhefe Saccharomyces cerevisiae ist die Zahl der essentiellen Gene mit 1000 Genen (~20% ihrer Gene) etwas höher. Obwohl die Zahl bei höheren Eukaryoten schwieriger zu messen ist, werden Mäuse und Menschen auf etwa 2000 essentielle Gene (~10% ihrer Gene) geschätzt. Der synthetische Organismus Syn 3 hat ein minimales Genom von 473 essentiellen Genen und quasi-essentiellen Genen (notwendig für schnelles Wachstum), obwohl 149 eine unbekannte Funktion haben.

Zu den essentiellen Genen gehören Housekeeping-Gene (entscheidend für grundlegende Zellfunktionen) sowie Gene, die zu unterschiedlichen Zeiten in der Entwicklung oder im Lebenszyklus des Organismus exprimiert werden . Housekeeping-Gene werden als experimentelle Kontrollen bei der Analyse der Genexpression verwendet , da sie auf einem relativ konstanten Niveau konstitutiv exprimiert werden.

Genetische und genomische Nomenklatur

Gene Nomenklatur wurde von der etablierten HUGO Gene Nomenclature Committee (HGNC), einem Ausschuss des Human Genome Organisation , für jede bekannte menschliche Gen in Form eines zugelassenen Gen Namen und Symbol (Kurzform Abkürzung ), die durch zugegriffen werden kann eine von HGNC verwaltete Datenbank. Symbole werden so gewählt, dass sie einzigartig sind, und jedes Gen hat nur ein Symbol (obwohl sich genehmigte Symbole manchmal ändern). Symbole werden aufgrund ihrer Rolle als üblicher Modellorganismus vorzugsweise mit anderen Mitgliedern einer Genfamilie und mit Homologen in anderen Spezies, insbesondere der Maus, konsistent gehalten .

Gentechnik

Vergleich konventioneller Pflanzenzüchtung mit transgener und cisgener genetischer Veränderung.

Gentechnik ist die Modifikation des Genoms eines Organismus durch Biotechnologie . Seit den 1970er Jahren wurde eine Vielzahl von Techniken entwickelt, um gezielt Gene in einem Organismus hinzuzufügen, zu entfernen und zu bearbeiten. Kürzlich entwickelte Genomtechnik Techniken entwickelten Nuklease - Enzym , um gezielte zu erstellen DNA - Reparatur in einem Chromosom entweder stören oder zu bearbeiten , ein Gen , wenn der Bruch repariert wird. Der verwandte Begriff synthetische Biologie wird manchmal verwendet, um sich auf umfangreiche Gentechnik eines Organismus zu beziehen.

Gentechnik ist heute ein routinemäßiges Forschungswerkzeug mit Modellorganismen . Zum Beispiel werden Gene leicht zu Bakterien hinzugefügt und Stämme von Knockout-Mäusen, bei denen die Funktion eines bestimmten Gens gestört ist, werden verwendet, um die Funktion dieses Gens zu untersuchen. Viele Organismen wurden für Anwendungen in der Landwirtschaft , der industriellen Biotechnologie und der Medizin gentechnisch verändert .

Bei mehrzelligen Organismen wird typischerweise der Embryo manipuliert, der in den erwachsenen genetisch veränderten Organismus hineinwächst . Die Genome von Zellen in einem erwachsenen Organismus können jedoch mit gentherapeutischen Techniken bearbeitet werden , um genetische Krankheiten zu behandeln.

Siehe auch

Verweise

Zitate

Quellen

Hauptlehrbuch

Weiterlesen

Externe Links