In einem bedeutenden Fortschritt für die computergestützte Biologie hat Google DeepMind AlphaGenome vorgestellt – ein KI-System, das die Geheimnisse der nicht-kodierenden DNA entschlüsseln soll, oft als das 'dunkle Material' des Genoms bezeichnet.
Obwohl Wissenschaftler das Humangenomprojekt bereits 2003 abgeschlossen und damit unseren vollständigen genetischen Bauplan offengelegt haben, blieb das Verständnis der Funktion des Großteils dieser DNA eine der größten Herausforderungen der Biologie. Nur etwa 2 % der menschlichen DNA codieren direkt für Proteine, während die verbleibenden 98 % entscheidende regulatorische Aufgaben übernehmen, die bislang schwer zu interpretieren waren.
AlphaGenome stellt einen bedeutenden Schritt zur Bewältigung dieser Herausforderung dar. Das Modell kann extrem lange DNA-Sequenzen – bis zu einer Million Basenpaare – analysieren und Tausende molekularer Eigenschaften mit bisher unerreichter Genauigkeit vorhersagen. Dazu gehören unter anderem der Beginn und das Ende von Genen in verschiedenen Geweben, die Spleißung von RNA, die Menge der produzierten RNA sowie die Bindung spezifischer Proteine an bestimmte DNA-Abschnitte.
"Wir haben erstmals ein einziges Modell geschaffen, das viele verschiedene Herausforderungen bei der Genom-Interpretation vereint", sagt Pushmeet Kohli, Forschungsleiter bei DeepMind. Das System übertraf spezialisierte Modelle in 22 von 24 Benchmarks zur Sequenzvorhersage und erreichte oder übertraf andere in 24 von 26 Aufgaben zur Vorhersage von Variantenwirkungen.
Im Gegensatz zu bisherigen KI-Modellen für das Genom, die sich auf bestimmte Aufgaben oder nur auf protein-kodierende Bereiche konzentrierten, liefert AlphaGenome einen umfassenden Ansatz zur Interpretation des gesamten Genoms. Der Stanford-Genomforscher Anshul Kundaje, der früh Zugang zum System hatte, bezeichnete es als "eine echte Verbesserung gegenüber praktisch allen aktuellen State-of-the-Art-Modellen zur Sequenz-Funktions-Vorhersage".
Die potenziellen Anwendungen sind weitreichend. AlphaGenome könnte Forschern helfen, Krankheitsursachen präziser zu identifizieren, die Konstruktion synthetischer DNA mit spezifischen regulatorischen Funktionen zu steuern und unser Verständnis genetischer Erkrankungen zu beschleunigen. In einer Demonstration sagte das Modell erfolgreich voraus, wie bestimmte Mutationen ein krebsassoziiertes Gen bei Leukämie aktivieren, indem sie eine neue Protein-Bindungsstelle schaffen – ein bereits bekannter Krankheitsmechanismus.
AlphaGenome ist nun über eine API für nicht-kommerzielle Forschung verfügbar, wobei DeepMind plant, die vollständigen Modelldetails in Zukunft zu veröffentlichen. Das Unternehmen betont, dass das System zwar einen bedeutenden Durchbruch darstellt, jedoch nicht für persönliche Genomvorhersagen oder den klinischen Einsatz entwickelt oder validiert wurde.