Dalam satu pencapaian besar untuk biologi komputasi, Google DeepMind telah melancarkan AlphaGenome, sistem kecerdasan buatan yang direka untuk menyahkod kawasan bukan pengekod misteri yang membentuk 98% daripada DNA manusia.
Walaupun hanya 2% genom kita secara langsung mengekod protein, baki 'jirim gelap' memainkan peranan penting dalam mengawal aktiviti gen dan sering dikaitkan dengan penyakit. AlphaGenome merupakan model AI komprehensif pertama yang mampu menganalisis kawasan regulatori kompleks ini pada skala dan resolusi yang belum pernah dicapai.
"Ini adalah salah satu masalah paling asas bukan sahaja dalam biologi — malah dalam seluruh sains," kata Pushmeet Kohli, ketua AI untuk sains di DeepMind, semasa sidang media. Model ini dibina berasaskan kejayaan DeepMind sebelum ini dengan AlphaFold, yang merevolusikan ramalan struktur protein dan berkongsi Hadiah Nobel Kimia tahun lalu.
Keupayaan teknikal AlphaGenome sangat mengagumkan. Ia boleh memproses urutan DNA sehingga satu juta pasangan bes sambil mengekalkan resolusi pada tahap satu nukleotida, membolehkannya meramalkan ribuan sifat molekul yang mencirikan regulasi gen. Dalam ujian penanda aras, ia mengatasi model khusus dalam 22 daripada 24 tugasan ramalan urutan dan menyamai atau melebihi model lain dalam 24 daripada 26 penilaian ramalan kesan varian.
Model ini telah menunjukkan aplikasi praktikal dalam penyelidikan penyakit. Ketika menganalisis mutasi yang ditemui pada pesakit leukemia, AlphaGenome berjaya meramalkan bagaimana varian bukan pengekod mengaktifkan gen pemacu kanser dengan mencipta tapak pengikatan baharu untuk protein regulatori. "Menentukan kepentingan pelbagai varian bukan pengekod boleh menjadi sangat mencabar, terutamanya pada skala besar. Alat ini menyediakan bahagian penting dalam penyelesaian teka-teki ini," jelas Profesor Marc Mansour dari University College London.
DeepMind telah menyediakan AlphaGenome melalui API untuk penyelidikan bukan komersial, dengan rancangan untuk pelancaran penuh pada masa akan datang. Walaupun model ini mempunyai batasan — ia sukar menangani interaksi DNA yang sangat jauh dan belum disahkan untuk kegunaan klinikal — ia mewakili langkah penting ke arah memahami fungsi genom kita dan boleh mempercepat penemuan dalam penyelidikan penyakit, biologi sintetik, dan perubatan peribadi.