Google DeepMind osiągnęło przełom w biologii obliczeniowej dzięki AlphaGenome – systemowi sztucznej inteligencji, który rozszyfrowuje najbardziej tajemnicze obszary ludzkiego genomu.
Zaprezentowany 25 czerwca 2025 roku AlphaGenome mierzy się z tzw. „ciemną materią” genetyczną – 98% naszego DNA, które nie koduje białek, lecz odgrywa kluczową rolę w regulacji ekspresji genów. Choć te niekodujące regiony były kiedyś uznawane za „śmieciowe DNA”, dziś badacze wiedzą, że zawierają one istotne instrukcje regulacyjne, których zaburzenia mogą prowadzić do chorób.
To, co wyróżnia AlphaGenome, to zdolność przetwarzania niezwykle długich sekwencji DNA – aż do miliona par zasad – przy zachowaniu rozdzielczości na poziomie pojedynczych nukleotydów. Model przewiduje tysiące właściwości molekularnych, w tym poziomy ekspresji genów, wzorce składania RNA oraz miejsca wiązania białek. Potrafi także oceniać wpływ wariantów genetycznych, porównując przewidywania dla zmutowanych i niezmutowanych sekwencji.
„Po raz pierwszy mamy jeden model, który łączy kontekst długodystansowy, precyzję na poziomie pojedynczej zasady oraz najnowocześniejszą skuteczność w szerokim zakresie zadań genomowych” – powiedział dr Caleb Lareau z Memorial Sloan Kettering Cancer Center, który miał wczesny dostęp do systemu.
AlphaGenome już wykazał niezwykłe możliwości w badaniach nad rakiem. W testach dotyczących ostrej białaczki limfoblastycznej T-komórkowej model trafnie przewidział, w jaki sposób konkretne mutacje aktywują gen TAL1 związany z nowotworem, tworząc nowe miejsce wiązania dla białka MYB – odtwarzając znany mechanizm choroby, wcześniej potwierdzony jedynie w badaniach laboratoryjnych.
Ruth Porat, prezes i dyrektor ds. inwestycji Alphabet i Google, podkreśliła znaczenie tej technologii podczas swojego wystąpienia na Amerykańskim Towarzystwie Onkologii Klinicznej. Jako osoba, która sama przeszła raka piersi, Porat zaznaczyła, że badania Google nad AI dają ogromną nadzieję na wcześniejsze wykrywanie i leczenie nowotworów.
DeepMind udostępnił AlphaGenome poprzez API do niekomercyjnych badań naukowych, a w przyszłości planuje pełną premierę systemu. Choć model nie jest jeszcze przeznaczony do interpretacji genomów indywidualnych osób ani zastosowań klinicznych, stanowi potężne narzędzie, które może przyspieszyć odkrycia w badaniach chorób, biologii syntetycznej i naukach podstawowych.