Folding@home - Folding@home

Falten@home
FAH Logo.svg
Originalautor(en) Vijay Pande
Entwickler Pande Laboratory, Sony , Nvidia , ATI Technologies, Joseph Coffland, Cauldron Development
Erstveröffentlichung 1. Oktober 2000 ; Vor 21 Jahren ( 2000-10-01 )
Stabile Version
7.6.21 / 23. Oktober 2020 ; vor 11 Monaten ( 2020-10-23 )
Betriebssystem Microsoft Windows , macOS , Linux , PlayStation 3 (ab Firmware-Version 4.30 eingestellt)
Plattform IA-32 , x86-64
Verfügbar in Englisch
Typ Verteiltes Rechnen
Lizenz Proprietäre Software
Webseite Foldathome .org

Folding@home ( FAH oder F@h ) ist ein verteiltes Computerprojekt , das Wissenschaftlern helfen soll, durch Simulation der Proteindynamik neue Therapeutika für eine Vielzahl von Krankheiten zu entwickeln. Dies umfasst den Prozess der Proteinfaltung und die Bewegung von Proteinen und ist auf Simulationen angewiesen, die auf den PCs der Freiwilligen laufen. Folding@home ist derzeit an der Washington University in St. Louis ansässig und wird von Greg Bowman, einem ehemaligen Schüler von Vijay Pande, geleitet .

Das Projekt nutzt Grafikprozessoren (GPUs), Zentralprozessoren (CPUs) und ARM- Prozessoren wie die auf dem Raspberry Pi für verteiltes Rechnen und wissenschaftliche Forschung. Das Projekt verwendet eine statistische Simulationsmethodik , die einen Paradigmenwechsel gegenüber herkömmlichen Computermethoden darstellt. Als Teil der Client-Server-Modell- Netzwerkarchitektur erhalten die freiwilligen Maschinen jeweils Teile einer Simulation (Arbeitseinheiten), vervollständigen sie und geben sie an die Datenbankserver des Projekts zurück , wo die Einheiten zu einer Gesamtsimulation kompiliert werden. Freiwillige können ihre Beiträge auf der Folding@home-Website verfolgen, was die Teilnahme von Freiwilligen wettbewerbsfähig macht und ein langfristiges Engagement fördert.

Folding@home ist eines der schnellsten Computersysteme der Welt. Mit erhöhtem Interesse an dem Projekt infolge der COVID-19-Pandemie erreichte das System bis Ende März 2020 eine Geschwindigkeit von ca. 1,22 Exaflops und erreichte bis zum 12. April 2020 2,43 Exaflops und ist damit das weltweit erste Exaflop-Rechensystem . Dieses Leistungsniveau seines groß angelegten Computernetzwerks hat es den Forschern ermöglicht, rechenintensive Simulationen der Proteinfaltung auf atomarer Ebene tausendmal länger als früher durchzuführen. Seit seinem Start am 1. Oktober 2000 hat das Pande Lab 225 wissenschaftliche Forschungsarbeiten als direktes Ergebnis von Folding@home erstellt. Ergebnisse aus den Simulationen des Projekts stimmen gut mit Experimenten überein.

Hintergrund

Ein Protein vor und nach der Faltung. Es beginnt in einem instabilen Random-Coil- Zustand und endet in seiner nativen Zustandskonformation.

Proteine sind ein wesentlicher Bestandteil vieler biologischer Funktionen und nehmen an praktisch allen Prozessen innerhalb biologischer Zellen teil . Sie fungieren oft als Enzyme und führen biochemische Reaktionen durch, einschließlich Zellsignalen , molekularem Transport und zellulärer Regulation . Als Strukturelemente fungieren einige Proteine ​​als eine Art Skelett für Zellen und als Antikörper , während andere Proteine ​​am Immunsystem beteiligt sind . Bevor ein Protein diese Rollen übernehmen kann, muss es sich zu einer funktionellen dreidimensionalen Struktur falten , ein Prozess, der oft spontan abläuft und von Wechselwirkungen innerhalb seiner Aminosäuresequenz und Wechselwirkungen der Aminosäuren mit ihrer Umgebung abhängt . Die Proteinfaltung wird angetrieben von der Suche nach der energetisch günstigsten Konformation des Proteins, dh seinem nativen Zustand . Daher ist das Verständnis der Proteinfaltung entscheidend, um zu verstehen, was ein Protein tut und wie es funktioniert, und gilt als heiliger Gral der Computerbiologie . Obwohl die Faltung innerhalb einer überfüllten zellulären Umgebung auftritt , verläuft sie typischerweise reibungslos. Aufgrund der chemischen Eigenschaften eines Proteins oder anderer Faktoren können sich Proteine ​​jedoch falsch falten , d. Sofern zelluläre Mechanismen nicht in der Lage sind, falsch gefaltete Proteine ​​zu zerstören oder neu zu falten, können sie anschließend aggregieren und eine Vielzahl von schwächenden Krankheiten verursachen. Laborexperimente, die diese Prozesse untersuchen, können im Umfang und im atomaren Detail begrenzt sein, was Wissenschaftler dazu veranlasst, physikbasierte Computermodelle zu verwenden, die, wenn sie Experimente ergänzen, versuchen, ein vollständigeres Bild der Proteinfaltung, Fehlfaltung und Aggregation zu liefern.

Aufgrund der Komplexität der Konformation oder des Konfigurationsraums von Proteinen (der Menge möglicher Formen, die ein Protein annehmen kann) und der begrenzten Rechenleistung waren die molekulardynamischen Simulationen aller Atome in den Zeitskalen, die sie untersuchen können, stark eingeschränkt. Während sich die meisten Proteine ​​normalerweise in der Größenordnung von Millisekunden falten, konnten Simulationen vor 2010 nur Zeitskalen von Nanosekunden bis Mikrosekunden erreichen. Allzweck- Supercomputer wurden verwendet, um die Proteinfaltung zu simulieren, aber solche Systeme sind an sich kostspielig und werden typischerweise von vielen Forschungsgruppen geteilt. Da die Berechnungen in kinetischen Modellen seriell erfolgen, ist außerdem eine starke Skalierung herkömmlicher Molekülsimulationen auf diese Architekturen außergewöhnlich schwierig. Da die Proteinfaltung außerdem ein stochastischer Prozess (dh zufällig) ist und sich im Laufe der Zeit statistisch ändern kann, ist es rechnerisch eine Herausforderung, lange Simulationen für umfassende Ansichten des Faltungsprozesses zu verwenden.

Folding@home verwendet Markov-Zustandsmodelle , wie das hier dargestellte, um die möglichen Formen und Faltungswege eines Proteins zu modellieren, wenn es von seinem anfänglich zufällig gewundenen Zustand (links) zu seiner nativen 3D-Struktur (rechts) kondensiert.

Die Proteinfaltung erfolgt nicht in einem Schritt. Stattdessen verbringen Proteine ​​die meiste Zeit ihrer Faltung, in einigen Fällen fast 96 %, damit , in verschiedenen Konformationszwischenzuständen zu warten , von denen jeder ein lokales thermodynamisches Minimum der freien Energie in der Energielandschaft des Proteins ist . Durch einen Prozess, der als adaptives Sampling bekannt ist , werden diese Konformationen von Folding@home als Ausgangspunkte für eine Reihe von Simulationstrajektorien verwendet. Wenn die Simulationen weitere Konformationen entdecken, werden die Trajektorien von ihnen aus neu gestartet, und aus diesem zyklischen Prozess wird nach und nach ein Markov-Zustandsmodell (MSM) erstellt. MSMs sind zeitdiskrete Mastergleichungsmodelle , die die Konformations- und Energielandschaft eines Biomoleküls als eine Reihe unterschiedlicher Strukturen und die kurzen Übergänge zwischen ihnen beschreiben. Das adaptive Sampling-Markov-Zustandsmodellverfahren erhöht die Effizienz der Simulation erheblich, da es die Berechnung innerhalb des lokalen Energieminimums selbst vermeidet und für verteiltes Rechnen (einschließlich GPUGRID ) geeignet ist, da es die statistische Aggregation kurzer, unabhängiger Simulationstrajektorien ermöglicht. Die Zeit, die zum Aufbau eines Markov-Zustandsmodells benötigt wird, ist umgekehrt proportional zur Anzahl der parallel laufenden Simulationen, dh der Anzahl der verfügbaren Prozessoren. Mit anderen Worten, es erreicht eine lineare Parallelisierung , was zu einer Reduzierung der gesamten seriellen Berechnungszeit um ungefähr vier Größenordnungen führt . Ein fertiges MSM kann Zehntausende von Probenzuständen aus dem Phasenraum des Proteins (alle Konformationen, die ein Protein annehmen kann) und die Übergänge zwischen ihnen enthalten. Das Modell veranschaulicht Faltungsereignisse und -wege (dh Routen) und Forscher können später kinetisches Clustering verwenden, um eine grobkörnige Darstellung des ansonsten sehr detaillierten Modells anzuzeigen. Mit diesen MSMs können sie die Fehlfaltung von Proteinen aufdecken und Simulationen mit Experimenten quantitativ vergleichen.

Zwischen 2000 und 2010 hat sich die Länge der von Folding@home untersuchten Proteine ​​vervierfacht, während die Zeitskalen für Proteinfaltungssimulationen um sechs Größenordnungen zugenommen haben. Im Jahr 2002 verwendete Folding@home Markov-Zustandsmodelle, um über mehrere Monate ungefähr eine Million CPU- Tage von Simulationen durchzuführen, und im Jahr 2011 parallelisierten MSMs eine weitere Simulation, die insgesamt 10 Millionen CPU-Rechenstunden erforderte. Im Januar 2010 verwendete Folding@home MSMs, um die Dynamik des langsam faltenden 32- Reste- NTL9-Proteins auf 1,52 Millisekunden zu simulieren , eine Zeitskala, die mit experimentellen Vorhersagen der Faltungsrate übereinstimmt, aber tausendmal länger als früher erreicht wurde. Das Modell bestand aus vielen einzelnen Trajektorien, die jeweils zwei Größenordnungen kürzer waren, und lieferte einen beispiellosen Detaillierungsgrad der Energielandschaft des Proteins. Für die Entwicklung der Open-Source- Software MSMBuilder und die quantitative Übereinstimmung zwischen Theorie und Experiment wurde der Folding@home-Forscher Gregory Bowman 2010 mit dem Thomas Kuhn Paradigm Shift Award der American Chemical Society ausgezeichnet . Für seine Arbeit wurde Pande 2012 mit dem Michael and Kate Bárány Award for Young Investigators für "developing field-defining and field-changing computing methods to produzieren führende theoretische Modelle für Protein- und RNA- Faltung" und 2006 mit dem Irving Sigal Young Investigator Award ausgezeichnet seine Simulationsergebnisse, die "eine erneute Überprüfung der Bedeutung von Ensemble- und Einzelmolekül-Messungen angeregt haben und Pandes Bemühungen zu bahnbrechenden Beiträgen zur Simulationsmethodik gemacht haben."

Anwendungsbeispiele in der biomedizinischen Forschung

Proteinfehlfaltung kann zu einer Vielzahl von Krankheiten führen, darunter Alzheimer, Krebs , Creutzfeldt-Jakob-Krankheit , Mukoviszidose , Chorea Huntington, Sichelzellenanämie und Typ-II-Diabetes . Zelluläre Infektionen durch Viren wie HIV und Influenza beinhalten auch Faltungsereignisse an Zellmembranen . Sobald die Proteinfehlfaltung besser verstanden ist, können Therapien entwickelt werden, die die natürliche Fähigkeit der Zellen, die Proteinfaltung zu regulieren, verbessern. Solche Therapien umfassen die Verwendung von gentechnisch veränderten Molekülen, um die Produktion eines bestimmten Proteins zu verändern, ein fehlgefaltetes Protein zu zerstören oder den Faltungsprozess zu unterstützen. Die Kombination aus computergestützter molekularer Modellierung und experimenteller Analyse bietet die Möglichkeit, die Zukunft der molekularen Medizin und das rationale Design von Therapeutika grundlegend zu gestalten , wie beispielsweise die Beschleunigung und Senkung der Kosten der Wirkstoffforschung . Das Ziel der ersten fünf Jahre von Folding@home war es, Fortschritte beim Verständnis der Faltung zu erzielen, während das aktuelle Ziel darin besteht, Fehlfaltungen und verwandte Krankheiten, insbesondere Alzheimer, zu verstehen.

Die auf Folding@home durchgeführten Simulationen werden in Verbindung mit Laborexperimenten verwendet, aber Forscher können damit untersuchen, wie sich die Faltung in vitro von der Faltung in nativen zellulären Umgebungen unterscheidet. Dies ist vorteilhaft bei der Untersuchung von Aspekten der Faltung, Fehlfaltung und ihrer Beziehungen zu Krankheiten, die experimentell schwer zu beobachten sind. Im Jahr 2011 simulierte Folding@home beispielsweise die Proteinfaltung in einem ribosomalen Austrittstunnel, um Wissenschaftlern zu helfen, besser zu verstehen, wie natürliche Enge und Enge den Faltungsprozess beeinflussen könnten. Darüber hinaus verwenden Wissenschaftler typischerweise chemische Denaturierungsmittel , um Proteine ​​aus ihrem stabilen nativen Zustand heraus zu entfalten. Es ist allgemein nicht bekannt, wie das Denaturierungsmittel die Rückfaltung des Proteins beeinflusst, und es ist schwierig experimentell zu bestimmen, ob diese denaturierten Zustände Reststrukturen enthalten, die das Faltungsverhalten beeinflussen können. Im Jahr 2010 verwendete Folding@home GPUs, um die entfalteten Zustände von Protein L zu simulieren , und sagte seine Kollapsrate in starker Übereinstimmung mit experimentellen Ergebnissen voraus.

Die großen Datensätze des Projekts stehen auf Anfrage anderen Forschern zur freien Nutzung zur Verfügung und sind teilweise über die Folding@home-Website abrufbar. Das Pande-Labor hat mit anderen Molekulardynamiksystemen wie dem Supercomputer Blue Gene zusammengearbeitet und teilt die Schlüsselsoftware von Folding@home mit anderen Forschern, damit die Algorithmen, die Folding@home zugute kamen, anderen wissenschaftlichen Bereichen helfen können. 2011 veröffentlichten sie die Open-Source-Software Copernicus, die auf dem MSM von Folding@home und anderen Parallelisierungsmethoden basiert und darauf abzielt, die Effizienz und Skalierung von molekularen Simulationen auf großen Computerclustern oder Supercomputern zu verbessern . Zusammenfassungen aller wissenschaftlichen Erkenntnisse aus Folding@home werden nach der Veröffentlichung auf der Folding@home-Website veröffentlicht.

Alzheimer-Krankheit

Die Alzheimer-Krankheit ist mit der Aggregation von Amyloid-Beta-Proteinfragmenten im Gehirn verbunden (rechts). Forscher haben Folding@home verwendet, um diesen Aggregationsprozess zu simulieren, um die Ursache der Krankheit besser zu verstehen.

Die Alzheimer-Krankheit ist eine unheilbare neurodegenerative Erkrankung, die am häufigsten ältere Menschen betrifft und mehr als die Hälfte aller Demenzfälle ausmacht . Die genaue Ursache bleibt unbekannt, aber die Krankheit wird als Protein-Fehlfaltungskrankheit identifiziert . Alzheimer ist mit toxischen Aggregationen des Amyloid Beta (Aβ) -Peptids verbunden , die durch Aβ-Fehlfaltung und Verklumpung mit anderen Aβ-Peptiden verursacht werden. Diese Aβ-Aggregate wachsen dann zu signifikant größeren senilen Plaques , einem pathologischen Marker der Alzheimer-Krankheit. Aufgrund der heterogenen Natur dieser Aggregate hatten experimentelle Methoden wie Röntgenkristallographie und Kernspinresonanz (NMR) Schwierigkeiten, ihre Strukturen zu charakterisieren. Darüber hinaus sind atomare Simulationen der Aβ-Aggregation aufgrund ihrer Größe und Komplexität rechnerisch sehr anspruchsvoll.

Die Verhinderung der Aβ-Aggregation ist eine vielversprechende Methode zur Entwicklung therapeutischer Medikamente für die Alzheimer-Krankheit, so Naeem und Fazili in einem Literaturüberblick . 2008 simulierte Folding@home die Dynamik der Aβ-Aggregation im atomaren Detail über Zeitskalen in der Größenordnung von mehreren zehn Sekunden. Frühere Studien konnten nur etwa 10 Mikrosekunden simulieren. Folding@home konnte die Aβ-Faltung sechs Größenordnungen länger simulieren als früher möglich. Die Forscher nutzten die Ergebnisse dieser Studie, um eine Beta-Haarnadel zu identifizieren , die eine Hauptquelle für molekulare Wechselwirkungen innerhalb der Struktur war. Die Studie trug dazu bei, das Pande-Labor für zukünftige Aggregationsstudien und für weitere Forschungen vorzubereiten, um ein kleines Peptid zu finden, das den Aggregationsprozess stabilisieren kann.

Im Dezember 2008 fand Folding@home mehrere kleine Wirkstoffkandidaten, die die Toxizität von Aβ-Aggregaten zu hemmen scheinen. In enger Zusammenarbeit mit dem Center for Protein Folding Machinery wurde 2010 mit der Erprobung dieser Wirkstoffe an biologischem Gewebe begonnen . Im Jahr 2011 schloss Folding@home Simulationen mehrerer Mutationen von Aβ ab, die die Aggregatbildung zu stabilisieren scheinen, was bei der Entwicklung therapeutischer Arzneimitteltherapien für die Krankheit helfen und bei experimentellen Kernspinresonanzspektroskopiestudien von Aβ- Oligomeren eine große Hilfe sein könnte . Später in diesem Jahr begann Folding@home mit Simulationen verschiedener Aβ-Fragmente, um zu bestimmen, wie verschiedene natürliche Enzyme die Struktur und Faltung von Aβ beeinflussen.

Huntington-Krankheit

Die Huntington-Krankheit ist eine neurodegenerative genetische Störung , die mit Proteinfehlfaltung und -aggregation verbunden ist. Übermäßige Wiederholungen der Glutamin- Aminosäure am N-Terminus des Huntingtin-Proteins verursachen eine Aggregation, und obwohl das Verhalten der Wiederholungen nicht vollständig verstanden ist, führt es zu dem mit der Krankheit verbundenen kognitiven Rückgang. Wie bei anderen Aggregaten ist es schwierig, seine Struktur experimentell zu bestimmen. Wissenschaftler verwenden Folding @ home die Struktur des Huntingtin - Protein Aggregats zu untersuchen und vorherzusagen , wie es bildet, mit Unterstützung Rational Drug Design Methoden , um die Aggregatbildung zu stoppen. Das N17-Fragment des Huntingtin-Proteins beschleunigt diese Aggregation, und obwohl mehrere Mechanismen vorgeschlagen wurden, ist seine genaue Rolle in diesem Prozess weitgehend unbekannt. Folding@home hat dieses und andere Fragmente simuliert, um ihre Rolle bei der Krankheit zu klären. Seit 2008 werden die Methoden des Wirkstoffdesigns für die Alzheimer-Krankheit auf die Huntington-Krankheit angewendet.

Krebs

Mehr als die Hälfte aller bekannten Krebsarten beinhalten Mutationen von p53 , ein Tumor - Suppressor - Protein , das in jeder Zelle , die die reguliert Zellzyklus und die Signale für den Zelltod im Falle von Schäden an DNA . Spezifische Mutationen in p53 können diese Funktionen stören, sodass eine abnormale Zelle ungehindert weiterwachsen kann, was zur Entwicklung von Tumoren führt . Die Analyse dieser Mutationen hilft, die Ursachen von Krebserkrankungen im Zusammenhang mit p53 zu erklären. Im Jahr 2004 wurde Folding@home verwendet, um die erste Molekulardynamikstudie der Rückfaltung des Proteindimers von p53 in einer Allatom-Simulation von Wasser durchzuführen . Die Ergebnisse der Simulation stimmten mit experimentellen Beobachtungen überein und gaben bisher nicht zugängliche Einblicke in die Rückfaltung des Dimers. Dies war die erste von Experten begutachtete Veröffentlichung über Krebs aus einem verteilten Computerprojekt. Im folgenden Jahr entwickelte Folding@home eine neue Methode zur Identifizierung der für die Stabilität eines bestimmten Proteins entscheidenden Aminosäuren, die dann verwendet wurde, um Mutationen von p53 zu untersuchen. Das Verfahren war bei der Identifizierung krebsfördernder Mutationen einigermaßen erfolgreich und bestimmte die Wirkungen spezifischer Mutationen, die sonst experimentell nicht gemessen werden könnten.

Folding@home wird auch verwendet, um Protein-Chaperone zu untersuchen , Hitzeschockproteine, die eine wesentliche Rolle für das Überleben von Zellen spielen, indem sie die Faltung anderer Proteine ​​in der überfüllten und chemisch stressigen Umgebung innerhalb einer Zelle unterstützen. Schnell wachsende Krebszellen sind auf bestimmte Chaperone angewiesen, und einige Chaperone spielen eine Schlüsselrolle bei der Chemotherapieresistenz . Hemmungen dieser spezifischen Chaperone werden als potenzielle Wirkmechanismen für wirksame Chemotherapeutika oder zur Reduzierung der Krebsausbreitung angesehen. Mithilfe von Folding@home und in enger Zusammenarbeit mit dem Center for Protein Folding Machinery hofft das Labor von Pande, ein Medikament zu finden, das die an Krebszellen beteiligten Chaperone hemmt. Die Forscher sind auch mit Folding @ home andere Moleküle an Krebs, wie das Enzym im Zusammenhang zu untersuchen Src - Kinase , und einige Formen des Engrailed Homeodomänen : ein großes Protein , das bei vielen Krankheiten beteiligt sein können, einschließlich Krebs. Im Jahr 2011 begann Folding@home mit Simulationen der Dynamik des kleinen Knottin- Proteins EETI, das Karzinome in bildgebenden Scans identifizieren kann, indem es an Oberflächenrezeptoren von Krebszellen bindet.

Interleukin 2 (IL-2) ist ein Protein, das T-Zellen des Immunsystems hilft , Krankheitserreger und Tumore anzugreifen. Seine Anwendung als Krebsbehandlung ist jedoch aufgrund schwerwiegender Nebenwirkungen wie Lungenödemen eingeschränkt . IL-2 bindet an diese Lungenzellen anders als an T-Zellen, daher beinhaltet die IL-2-Forschung das Verständnis der Unterschiede zwischen diesen Bindungsmechanismen. Im Jahr 2012 unterstützte Folding@home die Entdeckung einer mutierten Form von IL-2, die in ihrer Funktion des Immunsystems dreihundert Mal wirksamer ist, aber weniger Nebenwirkungen hat. In Experimenten übertraf diese veränderte Form natürliches IL-2 bei der Hemmung des Tumorwachstums deutlich. Pharmaunternehmen haben Interesse an dem mutierten Molekül bekundet, und die National Institutes of Health testen es mit einer Vielzahl von Tumormodellen, um seine Entwicklung als Therapeutikum zu beschleunigen.

Osteogenesis imperfecta

Osteogenesis imperfecta , bekannt als spröde Knochenkrankheit, ist eine unheilbare genetische Knochenerkrankung, die tödlich sein kann. Die Erkrankten sind nicht in der Lage, funktionsfähiges Bindegewebe zu bilden. Dies ist am häufigsten auf eine Mutation im Typ-I-Kollagen zurückzuführen , das eine Vielzahl von strukturellen Funktionen erfüllt und das am häufigsten vorkommende Protein in Säugetieren ist . Die Mutation verursacht eine Verformung der Triple-Helix-Struktur des Kollagens , die, wenn sie nicht auf natürliche Weise zerstört wird, zu abnormalem und geschwächtem Knochengewebe führt. Im Jahr 2005 testete Folding@home eine neue quantenmechanische Methode, die frühere Simulationsmethoden verbesserte und für zukünftige Computerstudien von Kollagen nützlich sein könnte. Obwohl Forscher Folding@home verwendet haben, um Kollagenfaltung und -fehlfaltung zu untersuchen, ist das Interesse ein Pilotprojekt im Vergleich zur Alzheimer- und Huntington-Forschung.

Viren

Folding@home unterstützt die Forschung, um zu verhindern, dass einige Viren , wie Grippe und HIV , biologische Zellen erkennen und in sie eindringen . Im Jahr 2011 begann Folding@home mit Simulationen der Dynamik des Enzyms RNase H , einer Schlüsselkomponente von HIV, um Medikamente zu entwickeln, um es zu deaktivieren. Folding@home wurde auch verwendet, um die Membranfusion zu untersuchen , ein wesentliches Ereignis für Virusinfektionen und ein breites Spektrum biologischer Funktionen. Diese Fusion beinhaltet Konformationsänderungen von viralen Fusionsproteinen und Protein-Docking , aber die genauen molekularen Mechanismen hinter der Fusion bleiben weitgehend unbekannt. Fusionsereignisse können aus über einer halben Million Atomen bestehen, die Hunderte von Mikrosekunden lang interagieren. Diese Komplexität begrenzt typische Computersimulationen auf etwa zehntausend Atome über zehn Nanosekunden: ein Unterschied von mehreren Größenordnungen. Die Entwicklung von Modellen zur Vorhersage der Mechanismen der Membranfusion wird zum wissenschaftlichen Verständnis beitragen, wie der Prozess mit antiviralen Medikamenten gezielt werden kann. Im Jahr 2006 wandten Wissenschaftler Markov-Zustandsmodelle und das Folding@home-Netzwerk an, um zwei Fusionswege zu entdecken und andere mechanistische Erkenntnisse zu gewinnen.

Nach detaillierten Simulationen von Folding@home von kleinen Zellen, die als Vesikel bekannt sind , führte das Pande-Labor 2007 eine neue Computermethode ein, um die Topologie ihrer Strukturänderungen während der Fusion zu messen . Im Jahr 2009 verwendeten Forscher Folding@home, um Mutationen von Influenza-Hämagglutinin zu untersuchen , einem Protein, das ein Virus an seine Wirtszelle bindet und den Viruseintritt unterstützt. Mutationen zu Hämagglutinin beeinflussen, wie gut das Protein an die Zelloberflächen-Rezeptormoleküle eines Wirts bindet , was bestimmt, wie infektiös der Virusstamm für den Wirtsorganismus ist. Das Wissen um die Wirkung von Hämagglutinin-Mutationen hilft bei der Entwicklung antiviraler Medikamente . Seit 2012 simuliert Folding@home weiterhin die Faltung und Interaktionen von Hämagglutinin und ergänzt experimentelle Studien an der University of Virginia .

Im März 2020 startete Folding@home ein Programm, um Forscher auf der ganzen Welt zu unterstützen, die daran arbeiten, ein Heilmittel zu finden und mehr über die Coronavirus-Pandemie zu erfahren . Die erste Welle von Projekten simuliert potenziell arzneimittelfähige Proteinziele des SARS-CoV-2-Virus und des verwandten SARS-CoV-Virus, zu dem deutlich mehr Daten verfügbar sind.

Arzneimitteldesign

Medikamente wirken , indem sie an spezifische Stellen auf Zielmolekülen binden und eine gewünschte Veränderung bewirken, wie beispielsweise die Deaktivierung eines Ziels oder eine Konformationsänderung . Idealerweise sollte ein Medikament sehr spezifisch wirken und nur an sein Ziel binden, ohne andere biologische Funktionen zu beeinträchtigen. Es ist jedoch schwierig, genau zu bestimmen, wo und wie fest zwei Moleküle binden. Aufgrund der begrenzten Rechenleistung müssen aktuelle in silico- Methoden normalerweise Geschwindigkeit gegen Genauigkeit eintauschen ; Verwenden Sie beispielsweise schnelle Protein-Docking- Methoden anstelle von rechenintensiven Berechnungen der freien Energie . Die Rechenleistung von Folding@home ermöglicht es Forschern, beide Methoden anzuwenden und deren Effizienz und Zuverlässigkeit zu bewerten. Computergestütztes Wirkstoffdesign hat das Potenzial, die Wirkstoffforschung zu beschleunigen und die Kosten zu senken. Im Jahr 2010 Folding @ home verwendet MSMs und Berechnungen der freien Energie des nativen Zustand des vorherzusagen Villin Proteins innerhalb 1,8 Ångström (Å) mittlere quadratische Abweichung (RMSD) von der kristallinen Struktur experimentell bestimmt durch Röntgenkristallographie . Diese Genauigkeit hat Auswirkungen auf zukünftige Methoden zur Vorhersage der Proteinstruktur , einschließlich für intrinsisch unstrukturierte Proteine . Wissenschaftler haben Folding@home verwendet, um Arzneimittelresistenzen zu erforschen, indem sie Vancomycin , ein Antibiotikum der letzten Instanz , und Beta-Lactamase , ein Protein, das Antibiotika wie Penicillin abbauen kann, untersucht haben .

Die chemische Aktivität tritt entlang des aktiven Zentrums eines Proteins auf . Herkömmliche Methoden des Wirkstoffdesigns beinhalten die enge Bindung an diese Stelle und das Blockieren ihrer Aktivität, unter der Annahme, dass das Zielprotein in einer starren Struktur existiert. Dieser Ansatz funktioniert jedoch nur bei etwa 15 % aller Proteine. Proteine ​​enthalten allosterische Stellen, die, wenn sie durch kleine Moleküle gebunden werden, die Konformation eines Proteins verändern und letztendlich die Aktivität des Proteins beeinflussen können. Diese Stellen sind attraktive Wirkstoff-Targets, aber ihre Lokalisierung ist sehr rechenintensiv . Im Jahr 2012 wurden Folding@home und MSMs verwendet, um allosterische Stellen in drei medizinisch relevanten Proteinen zu identifizieren: Beta-Lactamase, Interleukin-2 und RNase H .

Etwa die Hälfte aller bekannten Antibiotika stören die Funktionsweise eines der Bakterien Ribosom , einem großen und komplexen biochemischen Maschine führt , dass die Proteinbiosynthese durch das Übersetzen messenger RNA in Proteine. Makrolid-Antibiotika verstopfen den Austrittstunnel des Ribosoms und verhindern die Synthese essentieller bakterieller Proteine. 2007 erhielt das Pande-Labor einen Zuschuss zur Erforschung und Entwicklung neuer Antibiotika. 2008 nutzten sie Folding@home, um das Innere dieses Tunnels zu untersuchen und zu untersuchen, wie bestimmte Moleküle ihn beeinflussen können. Die vollständige Struktur des Ribosoms wurde erst ab 2011 bestimmt, und Folding@home hat auch ribosomale Proteine simuliert , da viele ihrer Funktionen noch weitgehend unbekannt sind.

Anwendungsmöglichkeiten in der biomedizinischen Forschung

Es gibt viele weitere durch Proteinfehlfaltung geförderte Krankheiten , die von Folding@home genutzt werden können, um entweder die fehlgefaltete Proteinstruktur oder die Fehlfaltungskinetik zu erkennen und in Zukunft beim Wirkstoffdesign zu helfen. Die oft tödlichen Prionenkrankheiten gehören zu den bedeutendsten.

Prionenkrankheiten

Ein Prion (PrP) ist ein zelluläres Transmembranprotein , das in eukaryontischen Zellen weit verbreitet ist . Bei Säugetieren ist es im Zentralnervensystem häufiger . Obwohl seine Funktion unbekannt ist, weist seine hohe Artenerhaltung auf eine wichtige Rolle in der Zellfunktion hin. Die Konformationsänderung vom normalen Prionprotein (PrPc, steht für zelluläre) zur krankheitserregenden Isoform PrPSc (steht für prototypische Prionenkrankheit – Scrapie ) verursacht eine Vielzahl von Krankheiten, die zusammenfassend als übertragbare spongiforme Enzephalopathien (TSE) bekannt sind, einschließlich der Bovinen spongiformen Enzephalopathie ( BSE) bei Rindern, Creutzfeldt-Jakob-Krankheit (CJK) und tödliche Schlaflosigkeit bei der humanen chronischen Auszehrungskrankheit (CWD) in der Hirschfamilie. Die Konformationsänderung wird weithin als Folge einer Proteinfehlfaltung akzeptiert . Was TSE von anderen Proteinfehlfaltungskrankheiten unterscheidet, ist ihre übertragbare Natur. Die „Aussaat“ des infektiösen PrPSc, das entweder spontan entsteht, erblich ist oder durch Kontakt mit kontaminiertem Gewebe erworben wurde, kann eine Kettenreaktion zur Umwandlung von normalem PrPc in Fibrillenaggregate oder amyloidähnliche Plaques aus PrPSc verursachen.

Die Molekülstruktur von PrPSc wurde aufgrund seiner aggregierten Natur nicht vollständig charakterisiert. Weder über den Mechanismus der Proteinfehlfaltung noch über ihre Kinetik ist viel bekannt . Unter Verwendung der bekannten Struktur von PrPc und der Ergebnisse der unten beschriebenen in vitro- und in vivo-Studien könnte Folding@home wertvoll sein, um aufzuklären, wie PrPSc gebildet wird und wie sich das infektiöse Protein anordnet, um Fibrillen und amyloidähnliche Plaques zu bilden, wobei die Anforderung umgangen wird um PrPSc zu reinigen oder die Aggregate aufzulösen.

Das PrPc wurde enzymatisch von der Membran dissoziiert und gereinigt, seine Struktur wurde unter Verwendung von Strukturcharakterisierungstechniken wie NMR-Spektroskopie und Röntgenkristallographie untersucht . Posttranslationales PrPc hat 231 Aminosäuren (aa) in Mäusen. Das Molekül besteht aus einer langen und unstrukturierten aminoterminalen Region, die sich bis zu einem Rest 121 erstreckt, und einer strukturierten carboxyterminalen Domäne. Diese globuläre Domäne beherbergt zwei kurze blattbildende antiparallele β-Stränge (aa 128 bis 130 und aa 160 bis 162 in murinem PrPc) und drei α-Helices (Helix I: aa 143 bis 153; Helix II: aa 171 bis 192 ; Helix III: aa 199 bis 226 in murinem PrPc), Helices II und III sind antiparallel orientiert und durch eine kurze Schleife verbunden. Ihre strukturelle Stabilität wird durch eine Disulfidbrücke unterstützt , die parallel zu den beiden blattbildenden β-Strängen verläuft. Diese α-Helices und das β-Faltblatt bilden den starren Kern der globulären Domäne von PrPc.

Die Krankheit, die PrPSc verursacht, ist Proteinase K- resistent und unlöslich. Versuche, es aus den Gehirnen infizierter Tiere zu reinigen, führen unweigerlich zu heterogenen Mischungen und aggregierten Zuständen, die einer Charakterisierung durch NMR-Spektroskopie oder Röntgenkristallographie nicht zugänglich sind. Es besteht jedoch allgemeiner Konsens, dass PrPSc einen hohen Prozentsatz dicht gestapelter β-Faltblätter enthält als das normale PrPc, was das Protein unlöslich und resistent gegen Proteinase macht. Unter Verwendung von Techniken der Kryoelektronenmikroskopie und Strukturmodellierung basierend auf ähnlichen gemeinsamen Proteinstrukturen wurde entdeckt, dass PrPSc ß-Faltblätter im Bereich von aa 81–95 bis aa 171 enthält, während die carboxyterminale Struktur angeblich erhalten bleibt und die Disulfid- verknüpfte α-helikale Konformation im normalen PrPc. Diese ß-Faltblätter bilden eine parallele linksgängige Beta-Helix. Es wird angenommen, dass drei PrPSc-Moleküle eine Primäreinheit bilden und somit die Grundlage für die sogenannten Scrapie-assoziierten Fibrillen bilden. Die katalytische Aktivität hängt von der Partikelgröße ab. PrPSc-Partikel, die nur aus 14-28 PrPc-Molekülen bestehen, zeigen die höchste Infektiosität und Konversionsrate.

Trotz der Schwierigkeit, PrPSc zu reinigen und zu charakterisieren, konnten aus der bekannten Molekularstruktur von PrPc und unter Verwendung transgener Mäuse und N-terminaler Deletion die potentiellen „Hot Spots“ der Proteinfehlfaltung, die zum pathogenen PrPSc führt, abgeleitet werden, und Folding@home könnte großen Wert, diese zu bestätigen. Studien haben ergeben, dass sowohl die Primär- als auch die Sekundärstruktur des Prionproteins von Bedeutung für die Umwandlung sein können.

Es gibt mehr als zwanzig Mutationen des Prion-Protein-Gens ( PRNP ), von denen bekannt ist, dass sie mit der erblichen Form menschlicher TSEs assoziiert sind oder direkt damit verbunden sind [56], was auf einzelne Aminosäuren an einer bestimmten Position, wahrscheinlich innerhalb der Carboxydomäne, hinweist , des PrPc kann die Anfälligkeit für TSE beeinflussen.

Die posttranslationale aminoterminale Region von PrPc besteht aus den Resten 23-120, die fast die Hälfte der Aminosequenz von gereiftem PrPc voller Länge ausmachen. Es gibt zwei Abschnitte in der aminoterminalen Region, die die Umwandlung beeinflussen können. Erstens enthalten die Reste 52-90 eine Octapeptid-Repeat-Region (5-fach), die wahrscheinlich die anfängliche Bindung (über die Octapeptid-Repeats) und auch die tatsächliche Umwandlung über den zweiten Abschnitt von aa 108–124 beeinflusst. Das stark hydrophobe AGAAAAGA befindet sich zwischen den Aminosäureresten 113 und 120 und wird als mutmaßliche Aggregationsstelle beschrieben, obwohl diese Sequenz seine flankierenden Teile erfordert, um fibrilläre Aggregate zu bilden.

In der carboxyglobulären Domäne, unter den drei Helices, zeigen Studien, dass Helix II eine signifikant höhere Neigung zur β-Strang-Konformation aufweist. Aufgrund der hohen konformativen Flexibilität zwischen den Resten 114-125 (Teil der unstrukturierten N-Terminus-Kette) und der hohen Neigung von Helix II zum β-Strang können nur moderate Änderungen der Umgebungsbedingungen oder Wechselwirkungen ausreichen, um eine Fehlfaltung von PrPc . zu induzieren und anschließender Fibrillenbildung.

Andere Studien der NMR-Strukturen von PrPc zeigten, dass diese Reste (~108–189) den größten Teil der gefalteten Domäne enthalten, einschließlich der beiden β-Stränge, der ersten beiden α-Helices und der sie verbindenden Loop/Turn-Regionen, aber nicht der Helix III . Auch kleine Änderungen innerhalb der Loop/Turn-Strukturen von PrPc selbst könnten bei der Konvertierung wichtig sein. In einer anderen Studie haben Riek et al. zeigten, dass die beiden kleinen Regionen des β-Strangs stromaufwärts der Loop-Regionen als Nukleationsstelle für die konformative Umwandlung der Loop/Turn- und α-helikalen Strukturen in PrPc in β-Faltblatt fungieren.

Die Energieschwellen für die Umwandlung sind nicht unbedingt hoch. Die Faltungsstabilität, dh die freie Energie eines globulären Proteins in seiner Umgebung liegt im Bereich von ein oder zwei Wasserstoffbrückenbindungen und erlaubt somit den Übergang in eine Isoform ohne dass eine hohe Übergangsenergie benötigt wird.

Von den jeweiligen Wechselwirkungen zwischen den PrPc-Molekülen spielen hydrophobe Wechselwirkungen eine entscheidende Rolle bei der Bildung von β-Faltblättern, einem Markenzeichen von PrPSc, da die Blätter Fragmente von Polypeptidketten in enge Nachbarschaft bringen. Tatsächlich zeigten Kutznetsov und Rackovsky, dass krankheitsfördernde Mutationen im humanen PrPc eine statistisch signifikante Tendenz zur Erhöhung der lokalen Hydrophobie aufweisen.

In-vitro-Experimente zeigten, dass die Kinetik der Fehlfaltung eine anfängliche Verzögerungsphase aufweist, gefolgt von einer schnellen Wachstumsphase der Fibrillenbildung. Es ist wahrscheinlich, dass PrPc einige Zwischenzustände durchläuft, wie beispielsweise zumindest teilweise entfaltet oder abgebaut, bevor es schließlich als Teil einer Amyloidfibrille endet.

Beteiligungsmuster

Wie andere verteilte Computerprojekte ist Folding@home ein Online- Citizen-Science- Projekt. In diesen Projekten bringen Laien die Rechenleistung des Computers ein oder helfen bei der Analyse von Daten professioneller Wissenschaftler. Die Teilnehmer erhalten wenig oder keine offensichtliche Belohnung.

Die Motivation von Citizen Scientists wurde erforscht und die meisten dieser Studien haben ergeben, dass die Teilnehmer aus altruistischen Gründen motiviert sind, daran teilzunehmen; das heißt, sie wollen Wissenschaftlern helfen und einen Beitrag zur Weiterentwicklung ihrer Forschung leisten. Viele Teilnehmer an Citizen Science haben ein grundlegendes Interesse am Thema der Forschung und neigen zu Projekten, die in für sie interessanten Disziplinen liegen. Folding@home ist in dieser Hinsicht nicht anders. Kürzlich durchgeführte Recherchen an über 400 aktiven Teilnehmern ergaben, dass sie einen Beitrag zur Forschung leisten wollten und viele Freunde oder Verwandte von den Krankheiten haben, die die Folding@home-Wissenschaftler untersuchen.

Folding@home zieht Teilnehmer an, die Computerhardware-Enthusiasten sind. Diese Gruppen bringen erhebliches Fachwissen in das Projekt ein und sind in der Lage, Computer mit fortschrittlicher Rechenleistung zu bauen. Andere verteilte Computerprojekte ziehen diese Art von Teilnehmern an, und Projekte werden oft verwendet, um die Leistung von modifizierten Computern zu messen, und dieser Aspekt des Hobbys wird durch den wettbewerbsorientierten Charakter des Projekts berücksichtigt. Einzelpersonen und Teams können gegeneinander antreten, um zu sehen, wer die meisten Computerprozessoren (CPUs) verarbeiten kann.

Diese neueste Forschung zu Folding@home mit Interviews und ethnografischer Beobachtung von Online-Gruppen zeigte, dass Teams von Hardware-Enthusiasten manchmal zusammenarbeiten können, um Best Practices in Bezug auf die Maximierung der Verarbeitungsleistung auszutauschen. Solche Teams können zu Communities of Practice mit einer gemeinsamen Sprache und Online-Kultur werden. Dieses Beteiligungsmuster wurde bei anderen verteilten Computerprojekten beobachtet.

Eine weitere wichtige Beobachtung der Folding@home-Teilnehmer ist, dass viele männlich sind. Dies wurde auch in anderen verteilten Projekten beobachtet. Darüber hinaus arbeiten viele Teilnehmer in computer- und technologiebasierten Berufen und Karrieren.

Nicht alle Folding@home-Teilnehmer sind Hardware-Enthusiasten. Viele Teilnehmer betreiben die Projektsoftware auf unveränderten Maschinen und nehmen an Wettbewerben teil. Über 100.000 Teilnehmer beteiligen sich an Folding@home. Der Anteil der Teilnehmer an Hardware-Enthusiasten ist jedoch schwer zu ermitteln. Allerdings ist der Beitrag der Enthusiasten-Community laut den Projektmanagern in Bezug auf die Rechenleistung wesentlich größer.

Leistung

Rechenleistung von Folding@home und schnellstem Supercomputer von April 2004 bis Oktober 2012. Folding@home (rot) übertraf zwischen Juni 2007 und Juni 2011 die Leistung des schnellsten Supercomputers von Top500 (schwarz). Es wurde jedoch im November 2011 von K Computer und im Juni 2012 von Blue Gene / Q in den Schatten gestellt.

Die FLOPS-Leistung von Supercomputern wird durch Ausführen des Legacy- LINPACK- Benchmarks bewertet . Diese kurzfristigen Tests haben Schwierigkeiten, die anhaltende Leistung bei realen Aufgaben genau widerzuspiegeln, da LINPACK effizienter auf Supercomputer-Hardware abbildet. Computersysteme unterscheiden sich in Architektur und Design, sodass ein direkter Vergleich schwierig ist. Trotzdem bleiben FLOPS die primäre Geschwindigkeitsmetrik, die im Supercomputing verwendet wird. Im Gegensatz dazu bestimmt Folding@home seine FLOPS anhand der Zeit der Wanduhr, indem es die Zeit misst, die seine Arbeitseinheiten benötigen.

Am 16. September 2007 erreichte das Folding@home-Projekt, größtenteils aufgrund der Teilnahme von PlayStation 3-Konsolen, offiziell ein dauerhaft höheres Leistungsniveau als ein natives petaFLOPS und war damit das erste Computersystem überhaupt. Der damals schnellste Supercomputer der Top500 war BlueGene/L mit 0,280 PetaFLOPS. Im darauffolgenden Jahr, am 7. Mai 2008, erreichte das Projekt ein nachhaltiges Leistungsniveau über zwei nativen petaFLOPS, gefolgt von den drei bzw. vier nativen petaFLOPS-Meilensteinen im August 2008 bzw. 28. September 2008. Am 18. Februar 2009 erreichte Folding@home fünf native petaFLOPS und war das erste Computerprojekt, das diese fünf Stufen erreichte. Im Vergleich dazu schnellste Supercomputer der November 2008 war IBM ‚s Roadrunner bei 1,105 Petaflops. Am 10. November 2011 übertraf die Leistung von Folding@home sechs native PetaFLOPS mit dem Äquivalent von fast acht x86 PetaFLOPS. Mitte Mai 2013 erreichte Folding@home über sieben native petaFLOPS, was 14,87 x86 PetaFLOPS entspricht. Am 21. Juni erreichte es dann acht native PetaFLOPS, gefolgt von neun am 9. September desselben Jahres mit 17,9 x86 PetaFLOPS. Am 11. Mai 2016 gab Folding@home bekannt, dass es sich dem Erreichen der 100 x86-petaFLOPS-Marke nähert.

Die weitere Nutzung wuchs durch die erhöhte Bekanntheit und Teilnahme am Projekt durch die Coronavirus-Pandemie im Jahr 2020. Am 20. März 2020 gab Folding@home über Twitter bekannt, dass es mit über 470 nativen PetaFLOPS läuft, was 958 x86 PetaFLOPS entspricht. Bis zum 25. März erreichte es 768 PetaFLOPS oder 1,5 x86 exaFLOPS und war damit das erste exaFLOP-Computersystem . Am 20. November 2020 hat Folding@home aufgrund eines Rechenfehlers nur noch 0,2 x86 exaFLOPS.

Punkte

Ähnlich wie bei anderen verteilten Computerprojekten bewertet Folding@home die Computerbeiträge der Benutzer zum Projekt durch ein Kreditsystem quantitativ. Alle Einheiten aus einem bestimmten Proteinprojekt haben einen einheitlichen Basiskredit, der durch Benchmarking einer oder mehrerer Arbeitseinheiten aus diesem Projekt auf einer offiziellen Referenzmaschine vor der Veröffentlichung des Projekts bestimmt wird. Jeder Benutzer erhält diese Basispunkte für das Abschließen jeder Arbeitseinheit, kann jedoch durch die Verwendung eines Passkeys zusätzliche Bonuspunkte für das zuverlässige und schnelle Abschließen von rechenintensiveren oder wissenschaftlicher priorisierten Einheiten erhalten. Benutzer können auch eine Gutschrift für ihre Arbeit von Clients auf mehreren Computern erhalten. Dieses Punktesystem versucht, die vergebenen Credits mit dem Wert der wissenschaftlichen Ergebnisse in Einklang zu bringen.

Benutzer können ihre Beiträge unter einem Team registrieren, das die Punkte aller ihrer Mitglieder zusammenfasst. Ein Benutzer kann sein eigenes Team gründen oder einem bestehenden Team beitreten. In einigen Fällen verfügt ein Team möglicherweise über eigene gemeinschaftsorientierte Hilfe- oder Rekrutierungsquellen, wie beispielsweise ein Internetforum . Die Punkte können einen freundschaftlichen Wettbewerb zwischen Einzelpersonen und Teams fördern, um das meiste für das Projekt zu berechnen, was der Faltungsgemeinschaft zugute kommen und die wissenschaftliche Forschung beschleunigen kann. Einzel- und Teamstatistiken werden auf der Folding@home-Website veröffentlicht.

Wenn ein Benutzer kein neues Team bildet oder keinem bestehenden Team beitritt, wird dieser Benutzer automatisch Teil eines "Standard"-Teams. Dieses „Standard“-Team hat die Teamnummer „0“. Für dieses "Default"-Team sowie für speziell benannte Teams werden Statistiken gesammelt.

Software

Die Folding@home-Software auf Benutzerseite umfasst drei Hauptkomponenten: Arbeitseinheiten, Kerne und einen Client.

Arbeitseinheiten

Eine Arbeitseinheit sind die Proteindaten, die der Kunde verarbeiten soll. Arbeitseinheiten sind ein Bruchteil der Simulation zwischen den Zuständen in einem Markov-Modell . Nachdem die Arbeitseinheit heruntergeladen und vom Computer der Freiwilligen vollständig bearbeitet wurde, wird sie an die Folding@home-Server zurückgesendet, die dann die Kreditpunkte an die Freiwilligen vergeben. Dieser Zyklus wiederholt sich automatisch. Alle Arbeitseinheiten haben zugehörige Fristen, und wenn diese Frist überschritten wird, erhält der Benutzer möglicherweise keine Gutschrift und die Einheit wird automatisch an einen anderen Teilnehmer neu ausgegeben. Da die Proteinfaltung seriell erfolgt und viele Arbeitseinheiten aus ihren Vorgängern generiert werden, kann der gesamte Simulationsprozess normal ablaufen, wenn eine Arbeitseinheit nach einer angemessenen Zeit nicht zurückgegeben wird. Aufgrund dieser Fristen ist die minimale Systemvoraussetzung für Folding@home eine Pentium 3 450 MHz CPU mit Streaming SIMD Extensions (SSE). Arbeitseinheiten für Hochleistungs-Clients haben jedoch eine viel kürzere Frist als diejenigen für den Uniprozessor-Client, da ein Großteil des wissenschaftlichen Nutzens vom schnellen Abschluss der Simulationen abhängt.

Vor der Veröffentlichung durchlaufen Arbeitseinheiten mehrere Schritte zur Qualitätssicherung , um zu verhindern, dass problematische Einheiten vollständig verfügbar sind. Diese Testphasen umfassen interne, Beta- und erweiterte Testphasen, bevor eine endgültige vollständige Veröffentlichung über Folding@home erfolgt. Die Arbeitseinheiten von Folding@home werden normalerweise nur einmal verarbeitet, außer in seltenen Fällen, in denen Fehler bei der Verarbeitung auftreten. Tritt dies bei drei verschiedenen Benutzern auf, wird die Einheit automatisch aus der Verteilung gezogen. Das Folding@home-Supportforum kann verwendet werden, um zwischen Problemen aufgrund von problematischer Hardware und fehlerhaften Arbeitseinheiten zu unterscheiden.

Kerne

Spezialisierte Molekulardynamik-Programme, die als „FahCores“ und oft auch als „Cores“ bezeichnet werden, führen im Hintergrund die Berechnungen auf der Arbeitseinheit durch . Ein Großteil der Kerne von Folding@home basiert auf GROMACS , einem der schnellsten und beliebtesten Molekulardynamik-Softwarepakete, das größtenteils aus manuell optimiertem Assemblercode und Hardwareoptimierungen besteht. Obwohl es sich bei GROMACS um Open-Source-Software handelt und es eine Kooperation zwischen dem Pande-Labor und den GROMACS-Entwicklern gibt, verwendet Folding@home eine Closed-Source- Lizenz, um die Datenvalidität sicherzustellen. Zu den weniger aktiven Kernen gehören ProtoMol und SHARPEN. Folding@home hat AMBER , CPMD , Desmond und TINKER verwendet , diese wurden jedoch inzwischen eingestellt und sind nicht mehr im aktiven Dienst. Einige dieser Kerne führen explizite Solvatationsrechnungen durch , bei denen das umgebende Lösungsmittel (normalerweise Wasser) Atom für Atom modelliert wird; während andere implizite Solvatationsmethoden durchführen , bei denen das Lösungsmittel als mathematisches Kontinuum behandelt wird. Der Kern ist vom Client getrennt, damit die wissenschaftlichen Methoden automatisch aktualisiert werden können, ohne dass ein Client-Update erforderlich ist. Die Kerne periodisch Berechnung erstellen Checkpoints so dass , wenn sie unterbrochen werden sie Arbeit von diesem Punkt beim Start wieder aufgenommen werden können.

Klient

Folding@home läuft auf Fedora 25

Ein Folding@home-Teilnehmer installiert ein Client- Programm auf seinem PC . Der Benutzer interagiert mit dem Client, der im Hintergrund die anderen Softwarekomponenten verwaltet. Über den Client kann der Benutzer den Faltvorgang anhalten, ein Ereignisprotokoll öffnen, den Arbeitsfortschritt überprüfen oder persönliche Statistiken anzeigen. Die Computerclients laufen kontinuierlich im Hintergrund mit sehr niedriger Priorität und verbrauchen im Leerlauf Rechenleistung, so dass die normale Computernutzung nicht beeinträchtigt wird. Die maximale CPU-Auslastung kann über die Client-Einstellungen angepasst werden. Der Client verbindet sich mit einem Folding@home- Server und ruft eine Arbeitseinheit ab und kann auch den entsprechenden Kern für die Einstellungen des Clients, das Betriebssystem und die zugrunde liegende Hardwarearchitektur herunterladen. Nach der Bearbeitung wird die Arbeitseinheit an die Folding@home-Server zurückgegeben. Computerclients sind auf Einprozessor- und Mehrkernprozessorsysteme sowie Grafikprozessoren zugeschnitten . Die Vielfalt und Leistungsfähigkeit jeder Hardwarearchitektur bietet Folding@home die Möglichkeit, viele Arten von Simulationen zeitnah (in wenigen Wochen oder Monaten statt in Jahren) effizient durchzuführen, was von erheblichem wissenschaftlichen Wert ist. Zusammen ermöglichen diese Clients Forschern, biomedizinische Fragen zu untersuchen, die früher als unpraktisch galten, um sie rechnerisch zu lösen.

Professionelle Softwareentwickler sind für den Großteil des Codes von Folding@home verantwortlich, sowohl auf der Client- als auch auf der Serverseite. Das Entwicklungsteam umfasst Programmierer von Nvidia , ATI , Sony und Cauldron Development. Clients können nur von der offiziellen Folding@home-Website oder ihren Handelspartnern heruntergeladen werden und interagieren nur mit Folding@home-Computerdateien. Sie laden Daten mit den Datenservern von Folding@home (über Port  8080, mit 80 als Alternative) hoch und herunter , und die Kommunikation wird mit digitalen 2048-Bit- Signaturen verifiziert . Während die grafische Benutzeroberfläche (GUI) des Kunden Open Source ist, handelt es sich beim Kunden um proprietäre Software, die als Gründe Sicherheit und wissenschaftliche Integrität anführt.

Diese Begründung der Verwendung proprietärer Software ist jedoch umstritten, da die Lizenz zwar nachträglich im Rechtsbereich durchsetzbar sein könnte, die Modifikation (auch als Patching bezeichnet ) der ausführbaren Binärdateien jedoch praktisch nicht verhindert . Ebenso binary-only Verteilung verhindert nicht die bösartige Veränderung von ausführbaren binären Code, entweder durch einen Man-in-the-Middle - Angriff , während über das Internet heruntergeladen werden, oder durch die Umverteilung von Binärdateien von einem Dritt das gewesen sein zuvor entweder in ihrem binären Zustand (dh gepatcht ) oder durch Dekompilieren und Neukompilieren nach der Modifikation modifiziert wurden. Diese Änderungen sind möglich, es sei denn, die Binärdateien – und der Transportkanal – sind signiert und die Person/das System des Empfängers ist in der Lage, die digitale Signatur zu überprüfen. In diesem Fall sollten ungerechtfertigte Änderungen erkennbar sein, jedoch nicht immer. Da im Fall von Folding@home die von der Client-Software verarbeiteten Eingabedaten und Ausgabeergebnisse beide digital signiert sind, kann die Integrität der Arbeit unabhängig von der Integrität der Client-Software selbst überprüft werden.

Folding@home verwendet die Cosm- Softwarebibliotheken zur Vernetzung. Folding@home wurde am 1. Oktober 2000 gestartet und war das erste verteilte Computerprojekt, das auf biomolekulare Systeme abzielte. Sein erster Client war ein Bildschirmschoner , der ausgeführt wurde, während der Computer sonst nicht verwendet wurde. Im Jahr 2004 arbeitete das Pande-Labor mit David P. Anderson zusammen , um einen zusätzlichen Client auf dem Open-Source- BOINC- Framework zu testen . Dieser Client wurde im April 2005 zur Closed Beta freigegeben; die Methode wurde jedoch unbrauchbar und wurde im Juni 2006 eingestellt.

Grafikprozessoren

Die spezielle Hardware von Grafikprozessoren (GPU) wurde entwickelt, um das Rendern von 3D-Grafikanwendungen wie Videospielen zu beschleunigen und kann CPUs bei einigen Arten von Berechnungen deutlich übertreffen. GPUs sind eine der leistungsstärksten und am schnellsten wachsenden Computerplattformen, und viele Wissenschaftler und Forscher verfolgen Allzweck-Computing auf Grafikprozessoren (GPGPU). GPU-Hardware ist jedoch für Nicht-Grafikaufgaben schwierig zu verwenden und erfordert normalerweise eine erhebliche Algorithmusumstrukturierung und ein fortgeschrittenes Verständnis der zugrunde liegenden Architektur. Eine solche Anpassung ist eine Herausforderung, vor allem für Forscher mit begrenzten Ressourcen für die Softwareentwicklung. Folding@home verwendet die Open-Source- OpenMM- Bibliothek , die ein Brückenentwurfsmuster mit zwei API-Ebenen ( Application Programming Interface ) verwendet, um molekulare Simulationssoftware mit einer zugrunde liegenden Hardwarearchitektur zu verbinden. Durch das Hinzufügen von Hardwareoptimierungen benötigen OpenMM-basierte GPU-Simulationen keine wesentlichen Änderungen, erreichen jedoch eine Leistung, die nahezu der von Hand abgestimmten GPU-Codes entspricht und CPU-Implementierungen bei weitem übertreffen.

Vor 2010 war die Rechenzuverlässigkeit von GPGPU-Hardware für Verbraucher weitgehend unbekannt, und Indizien im Zusammenhang mit dem Fehlen einer integrierten Fehlererkennung und -korrektur im GPU-Speicher gaben Anlass zu Bedenken hinsichtlich der Zuverlässigkeit. Im ersten groß angelegten Test der wissenschaftlichen Genauigkeit von GPUs entdeckte eine Studie aus dem Jahr 2010 mit über 20.000 Hosts im Folding@home-Netzwerk weiche Fehler in den Speichersubsystemen von zwei Dritteln der getesteten GPUs. Diese Fehler korrelierten stark mit der Platinenarchitektur, obwohl die Studie zu dem Schluss kam, dass zuverlässiges GPU-Computing sehr gut machbar war, solange auf die Hardwaremerkmale wie die softwareseitige Fehlererkennung geachtet wird.

Die erste Generation des GPU-Clients (GPU1) von Folding@home wurde am 2. Oktober 2006 für die Öffentlichkeit freigegeben und bietet eine 20- bis 30-fache Beschleunigung einiger Berechnungen gegenüber seinen CPU-basierten GROMACS- Gegenstücken. Es war das erste Mal, dass GPUs entweder für verteiltes Rechnen oder große Molekulardynamikberechnungen verwendet wurden. GPU1 gab den Forschern bedeutende Kenntnisse und Erfahrungen mit der Entwicklung von GPGPU- Software, aber als Reaktion auf wissenschaftliche Ungenauigkeiten bei DirectX wurde am 10. April 2008 GPU2, die zweite Generation des Clients, abgelöst. Nach der Einführung von GPU2 wurde GPU1 am 6. Juni offiziell eingestellt. Im Vergleich zu GPU1 war GPU2 wissenschaftlich zuverlässiger und produktiver, lief auf ATI- und CUDA- fähigen Nvidia- GPUs und unterstützte fortschrittlichere Algorithmen, größere Proteine ​​und Echtzeit-Visualisierung der Proteinsimulation. Im Anschluss daran wurde am 25. Mai 2010 die dritte Generation des GPU-Clients (GPU3) von Folding@home veröffentlicht. Während GPU3 abwärtskompatibel mit GPU2 war, war GPU3 stabiler, effizienter und flexibler in seinen wissenschaftlichen Fähigkeiten und verwendete OpenMM zusätzlich zu einem OpenCL- Framework. Obwohl diese GPU3-Clients die Betriebssysteme Linux und macOS nicht nativ unterstützten , konnten Linux-Benutzer mit Nvidia-Grafikkarten sie über die Wine- Softwareanwendung ausführen . GPUs bleiben die leistungsstärkste Plattform von Folding@home in FLOPS . Im November 2012 machten GPU-Clients 87% des x86-Flops-Durchsatzes des gesamten Projekts aus.

Die native Unterstützung für Nvidia- und AMD-Grafikkarten unter Linux wurde mit FahCore 17 eingeführt, das OpenCL statt CUDA verwendet.

Playstation 3

Der Life With PlayStation- Client von PlayStation 3 zeigte eine 3-D-Animation des gefalteten Proteins an

Von März 2007 bis November 2012 nutzte Folding@home die Rechenleistung der PlayStation 3s . Zum Zeitpunkt seiner Einführung lieferte sein Haupt- Streaming- Cell-Prozessor bei einigen Berechnungen eine 20-fache Geschwindigkeitssteigerung gegenüber PCs, eine Verarbeitungsleistung, die auf anderen Systemen wie der Xbox 360 nicht zu finden war . Die hohe Geschwindigkeit und Effizienz der PS3 eröffneten weitere Möglichkeiten für lohnende Optimierungen gemäß dem Amdahl-Gesetz und veränderten den Kompromiss zwischen Recheneffizienz und Gesamtgenauigkeit erheblich, sodass komplexere molekulare Modelle bei geringen zusätzlichen Rechenkosten verwendet werden können. Dies ermöglichte Folding@home, biomedizinische Berechnungen durchzuführen, die ansonsten rechnerisch nicht durchführbar gewesen wären.

Der PS3-Client wurde in Zusammenarbeit zwischen Sony und dem Pande-Labor entwickelt und am 23. März 2007 erstmals als eigenständiger Client veröffentlicht. Seine Veröffentlichung machte Folding@home zum ersten verteilten Computerprojekt, das PS3s verwendet. Am 18. September des folgenden Jahres wurde der PS3-Client bei seiner Einführung zu einem Kanal von Life mit PlayStation . Bei den Berechnungsarten, die er zum Zeitpunkt seiner Einführung durchführen kann, passte der Client zwischen die Flexibilität einer CPU und die Geschwindigkeit einer GPU. Im Gegensatz zu Clients, die auf PCs ausgeführt wurden , konnten Benutzer jedoch keine anderen Aktivitäten auf ihrer PS3 ausführen, während Folding@home ausgeführt wurde. Die einheitliche Konsolenumgebung der PS3 erleichterte den technischen Support und machte Folding@home benutzerfreundlicher . Die PS3 hatte auch die Möglichkeit, Daten schnell an ihre GPU zu streamen, die für die Echtzeit-Visualisierung der aktuellen Proteindynamik auf atomarer Ebene verwendet wurde.

Am 6. November 2012 hat Sony den Support für den Folding@home PS3-Client und andere Dienste eingestellt, die unter Life with PlayStation verfügbar sind. Während seiner Laufzeit von fünf Jahren und sieben Monaten haben mehr als 15 Millionen Benutzer über 100 Millionen Computerstunden zu Folding@home beigetragen und das Projekt bei der Erforschung von Krankheiten maßgeblich unterstützt. Nach Gesprächen mit dem Pande-Labor beschloss Sony, die Anwendung zu beenden. Pande betrachtete den PlayStation 3-Client als "Game Changer" für das Projekt.

Client für Multi-Core-Verarbeitung

Folding@home kann die parallelen Rechenfähigkeiten moderner Mehrkernprozessoren nutzen. Durch die Möglichkeit, mehrere CPU-Kerne gleichzeitig zu verwenden, kann die vollständige Simulation viel schneller abgeschlossen werden. Zusammen arbeiten diese CPU-Kerne einzelne Arbeitseinheiten proportional schneller als der Standard-Uniprozessor-Client. Dieses Verfahren ist wissenschaftlich wertvoll, da es ermöglicht, dass viel längere Simulationstrajektorien in der gleichen Zeit durchgeführt werden und die traditionellen Schwierigkeiten beim Skalieren einer großen Simulation auf viele separate Prozessoren reduziert werden. Eine Veröffentlichung aus dem Jahr 2007 im Journal of Molecular Biology stützte sich auf die Multi-Core-Verarbeitung, um die Faltung eines Teils des Villin- Proteins zu simulieren, die ungefähr 10 Mal länger dauerte, als dies mit einem Einzelprozessor-Client möglich war, in Übereinstimmung mit experimentellen Faltungsraten.

Im November 2006 wurden SMP-Clients ( Symmetric Multiprocessing ) der ersten Generation für offene Betatests veröffentlicht, die als SMP1 bezeichnet werden. Diese Clients verwendeten Message Passing Interface (MPI)-Kommunikationsprotokolle für die parallele Verarbeitung, da die GROMACS-Kerne zu dieser Zeit nicht für die Verwendung mit mehreren Threads ausgelegt waren. Dies war das erste Mal, dass ein verteiltes Computing-Projekt MPI verwendet hat. Obwohl die Clients unter Unix- basierten Betriebssystemen wie Linux und macOS gut funktionierten, waren sie unter Windows problematisch . Am 24. Januar 2010 wurde SMP2, die zweite Generation der SMP-Clients und der Nachfolger von SMP1, als offene Beta veröffentlicht und ersetzte das komplexe MPI durch eine zuverlässigere Thread- basierte Implementierung.

SMP2 unterstützt einen Versuch einer speziellen Kategorie von Bigadv- Arbeitseinheiten, die entwickelt wurden, um Proteine ​​zu simulieren, die ungewöhnlich groß und rechenintensiv sind und eine hohe wissenschaftliche Priorität haben. Diese Einheiten erforderten ursprünglich mindestens acht CPU-Kerne, die später am 7. Februar 2012 auf sechzehn erhöht wurden. Zusammen mit diesen zusätzlichen Hardwareanforderungen gegenüber Standard-SMP2-Arbeitseinheiten benötigen sie mehr Systemressourcen wie Arbeitsspeicher (RAM) und Internet-Bandbreite . Im Gegenzug werden Benutzer, die diese ausführen, mit einer 20%igen Steigerung gegenüber dem Bonuspunktesystem von SMP2 belohnt. Die Kategorie bigadv ermöglicht es Folding@home, über lange Zeit besonders anspruchsvolle Simulationen durchzuführen, die früher den Einsatz von Supercomputing- Clustern erforderten und nirgendwo anders auf Folding@home durchgeführt werden konnten. Bei vielen Benutzern mit Hardware, die Bigadv-Einheiten ausführen kann, wurde ihr Hardware-Setup später als nicht geeignet für Bigadv-Arbeitseinheiten angesehen, als die Mindestanzahl der CPU-Kerne erhöht wurde, sodass sie nur die normalen SMP-Arbeitseinheiten ausführen können. Dies frustrierte viele Benutzer, die erhebliche Geldsummen in das Programm investierten, nur um kurz darauf ihre Hardware für BigAdv-Zwecke veraltet zu haben. Infolgedessen kündigte Pande im Januar 2014 an, dass das bigadv-Programm am 31. Januar 2015 enden würde.

V7

Ein Beispielabbild des V7-Clients im Novice-Modus unter Windows 7 . Neben einer Vielzahl von Steuerelementen und Benutzerdetails präsentiert V7 Informationen zu Arbeitseinheiten wie Status, Berechnungsfortschritt, ETA, Kreditpunkte, Identifikationsnummern und Beschreibung.

Der V7-Client ist die siebte und neueste Generation der Folding@home-Client-Software und ist eine vollständige Neufassung und Vereinheitlichung der vorherigen Clients für Windows- , macOS- und Linux- Betriebssysteme. Es wurde am 22. März 2012 veröffentlicht. Wie seine Vorgänger kann V7 Folding@home im Hintergrund mit sehr niedriger Priorität ausführen , sodass andere Anwendungen CPU-Ressourcen nach Bedarf nutzen können. Es wurde entwickelt, um die Installation, Inbetriebnahme und den Betrieb für Anfänger benutzerfreundlicher zu machen und Forschern eine größere wissenschaftliche Flexibilität als frühere Kunden zu bieten. V7 verwendet Trac zum Verwalten seiner Fehlertickets, damit Benutzer den Entwicklungsprozess sehen und Feedback geben können.

V7 besteht aus vier integrierten Elementen. Der Benutzer interagiert normalerweise mit der Open-Source- GUI von V7 mit dem Namen FAHControl. Diese verfügt über die Benutzeroberflächenmodi Novice, Advanced und Expert und bietet die Möglichkeit, viele Remote-Folding-Clients von einem Computer aus zu überwachen, zu konfigurieren und zu steuern. FAHControl leitet FAHClient, eine Back-End- Anwendung, die wiederum jeden FAHSlot (oder Slot ) verwaltet. Jeder Steckplatz dient als Ersatz für die früher unterschiedlichen Folding@home v6-Uniprozessor-, SMP- oder GPU-Computerclients, da er Arbeitseinheiten unabhängig herunterladen, verarbeiten und hochladen kann. Die FAHViewer-Funktion, die dem Viewer der PS3 nachempfunden ist, zeigt, falls verfügbar, ein Echtzeit-3-D-Rendering des gerade verarbeiteten Proteins an.

Google Chrome

Im Jahr 2014 wurde ein Client für die Webbrowser Google Chrome und Chromium veröffentlicht, mit dem Benutzer Folding@home in ihrem Webbrowser ausführen können. Der Client nutzte die Funktion Native Client (NaCl) von Google in Chromium-basierten Webbrowsern, um den Folding@home-Code mit nahezu nativer Geschwindigkeit in einer Sandbox auf dem Computer des Benutzers auszuführen . Aufgrund des Auslaufens von NaCL und Änderungen bei Folding@home wurde der Webclient im Juni 2019 endgültig abgeschaltet.

Android

Im Juli 2015 wurde bei Google Play ein Client für Android -Mobiltelefone für Geräte mit Android 4.4 KitKat oder neuer veröffentlicht.

Am 16. Februar 2018 wurde der in Kooperation mit Sony angebotene Android-Client aus Google Play entfernt. Es wurden Pläne angekündigt, in Zukunft eine Open-Source-Alternative anzubieten.

Vergleich mit anderen molekularen Simulatoren

Rosetta@home ist ein verteiltes Computerprojekt zur Vorhersage der Proteinstruktur und ist einer der genauesten Vorhersager für die Tertiärstruktur . Die Konformationszustände aus Rosettas Software können verwendet werden, um ein Markov-Zustandsmodell als Ausgangspunkt für Folding@home-Simulationen zu initialisieren. Umgekehrt können Strukturvorhersagealgorithmen aus thermodynamischen und kinetischen Modellen und den Sampling-Aspekten von Proteinfaltungssimulationen verbessert werden. Da Rosetta nur versucht, den endgültigen Faltungszustand vorherzusagen und nicht, wie die Faltung abläuft, ergänzen sich Rosetta@home und Folding@home und adressieren ganz unterschiedliche molekulare Fragestellungen.

Anton ist ein spezieller Supercomputer, der für Molekulardynamiksimulationen gebaut wurde. Im Oktober 2011 waren Anton und Folding@home die beiden leistungsstärksten Molekulardynamiksysteme. Anton ist einzigartig in seiner Fähigkeit, einzelne ultralange, rechenintensive molekulare Flugbahnen zu erzeugen, wie eine im Jahr 2010, die den Millisekundenbereich erreichte. Diese langen Trajektorien können bei einigen Arten von biochemischen Problemen besonders hilfreich sein. Anton verwendet jedoch keine Markov-Zustandsmodelle (MSM) zur Analyse. Im Jahr 2011 konstruierte das Pande-Labor ein MSM aus zwei 100- µs- Anton-Simulationen und fand alternative Faltungspfade, die durch Antons traditionelle Analyse nicht sichtbar waren. Sie kamen zu dem Schluss, dass es kaum Unterschiede zwischen MSMs gibt, die aus einer begrenzten Anzahl von langen Trajektorien aufgebaut sind, oder einem, der aus vielen kürzeren Trajektorien zusammengesetzt ist. Im Juni 2011 fügte Folding@home das Sampling einer Anton-Simulation hinzu, um besser zu bestimmen, wie sich seine Methoden mit denen von Anton vergleichen lassen. Im Gegensatz zu den kürzeren Trajektorien von Folding@home, die für verteiltes Rechnen und andere parallelisierende Verfahren besser geeignet sind, erfordern längere Trajektorien jedoch keine adaptive Abtastung, um den Phasenraum des Proteins ausreichend abzutasten . Aus diesem Grund ist es möglich, dass eine Kombination der Simulationsmethoden von Anton und Folding@home eine gründlichere Abtastung dieses Raums ermöglicht.

Siehe auch

Verweise

Quellen

Externe Links

Hören Sie sich diesen Artikel an ( 1 Stunde und 13 Minuten )
Gesprochenes Wikipedia-Symbol
Diese Audiodatei wurde aus einer Überarbeitung dieses Artikels vom 7. Oktober 2014 erstellt und spiegelt keine späteren Bearbeitungen wider. ( 2014-10-07 )