En un avance significativo para la biología computacional, Google DeepMind ha presentado AlphaGenome, un sistema de inteligencia artificial diseñado para descifrar los misterios del ADN no codificante, conocido a menudo como la "materia oscura" del genoma.
Aunque los científicos completaron el Proyecto Genoma Humano en 2003, revelando nuestro mapa genético completo, comprender la función de la mayor parte de este ADN ha seguido siendo uno de los mayores retos de la biología. Solo alrededor del 2% del ADN humano codifica directamente proteínas, mientras que el 98% restante desempeña funciones regulatorias cruciales que han sido difíciles de interpretar.
AlphaGenome supone un gran paso adelante para abordar este desafío. El modelo puede analizar secuencias de ADN extremadamente largas—de hasta un millón de pares de bases—y predecir miles de propiedades moleculares con una precisión sin precedentes. Entre ellas se incluyen la localización de los inicios y finales de los genes en diferentes tejidos, cómo se empalman los ARN, la cantidad de ARN producido y qué proteínas se unen a regiones específicas del ADN.
"Por primera vez, hemos creado un único modelo que unifica muchos de los retos que implica comprender el genoma", afirma Pushmeet Kohli, vicepresidente de investigación en DeepMind. El sistema superó a modelos especializados en 22 de 24 pruebas de predicción de secuencias y igualó o superó a otros en 24 de 26 tareas de predicción de efectos de variantes.
A diferencia de modelos anteriores de IA genómica, que se centraban en tareas específicas o solo en regiones codificantes de proteínas, AlphaGenome ofrece un enfoque integral para interpretar todo el genoma. Anshul Kundaje, genómico computacional de la Universidad de Stanford y uno de los primeros en acceder al sistema, lo calificó como "una mejora real respecto a prácticamente todos los modelos actuales de secuencia a función".
Las aplicaciones potenciales son de gran alcance. AlphaGenome podría ayudar a los investigadores a identificar con mayor precisión las causas de enfermedades, guiar el diseño de ADN sintético con funciones regulatorias específicas y acelerar nuestra comprensión de las enfermedades genéticas. En una demostración, el modelo predijo con éxito cómo ciertas mutaciones activan un gen relacionado con el cáncer en la leucemia, creando un nuevo sitio de unión para proteínas y replicando un mecanismo de enfermedad ya conocido.
AlphaGenome ya está disponible a través de API para investigación no comercial, y DeepMind planea publicar los detalles completos del modelo en el futuro. La compañía enfatiza que, aunque el sistema representa un avance significativo, no ha sido diseñado ni validado para la predicción de genomas personales ni para uso clínico.