Seit Jahrzehnten rätseln Wissenschaftler über die Funktion der 98 % der menschlichen DNA, die nicht direkt für Proteine codiert – oft als genomisches „dunkles Material“ bezeichnet. Am 25. Juni 2025 präsentierte Google DeepMind eine mögliche Lösung: AlphaGenome, ein KI-System, das speziell zur Interpretation dieser rätselhaften, nicht-kodierenden DNA entwickelt wurde.
Im Gegensatz zu bisherigen Modellen, die nur kurze DNA-Abschnitte analysieren konnten oder keine Einzelbasen-Präzision boten, verarbeitet AlphaGenome Sequenzen von bis zu einer Million Buchstaben und behält dabei die Auflösung auf Nukleotid-Ebene bei. Dieser technische Durchbruch ermöglicht es Forschern, zu untersuchen, wie weit entfernte regulatorische Elemente die Genaktivität beeinflussen – ein entscheidender Faktor für das Verständnis von Krankheitsmechanismen.
„Das ist eines der grundlegendsten Probleme, nicht nur in der Biologie, sondern in der gesamten Wissenschaft“, sagt Pushmeet Kohli, Leiter für KI in der Wissenschaft bei DeepMind. Das Modell prognostiziert Tausende molekularer Eigenschaften, darunter den Beginn und das Ende von Genen in verschiedenen Geweben, wie RNA gespleißt wird und welche Proteine an bestimmte DNA-Regionen binden.
In Vergleichstests übertraf AlphaGenome spezialisierte Werkzeuge bei 22 von 24 Aufgaben zur Sequenzvorhersage und erreichte bei 24 von 26 Bewertungen der Varianteneffekte gleichwertige oder bessere Ergebnisse. Bei der Analyse von Mutationen, die bei Leukämiepatienten gefunden wurden, sagte das Modell präzise voraus, wie nicht-kodierende Varianten das krebsrelevante TAL1-Gen aktivierten, indem sie eine neue Bindungsstelle für das MYB-Protein schufen – ein bekannter Krankheitsmechanismus, der zuvor nur durch Laborstudien bestätigt werden konnte.
„Zum ersten Mal haben wir ein einziges Modell, das weiträumigen Kontext, Basenpräzision und modernste Leistung über das gesamte Spektrum genomischer Aufgaben vereint“, sagt Dr. Caleb Lareau vom Memorial Sloan Kettering Cancer Center, der frühzeitig Zugang zum System hatte.
Trotz seiner Leistungsfähigkeit hat AlphaGenome auch Einschränkungen: Es tut sich schwer mit extrem weit entfernten regulatorischen Elementen (über 100.000 Basenpaare entfernt) und kann keine individuellen Gesundheitsprognosen oder Merkmale vorhersagen. DeepMind stellt das Modell über eine API für nicht-kommerzielle Forschung zur Verfügung und plant eine vollständige Veröffentlichung in der Zukunft. Forscher erwarten, dass es Krankheitsstudien beschleunigen wird, indem es virtuelle Experimente ermöglicht, die bislang aufwändige Laborarbeit erforderten.