Durante décadas, los científicos han intentado comprender la función del 98% del ADN humano que no codifica directamente proteínas, conocido a menudo como la "materia oscura" del genoma. El 25 de junio de 2025, Google DeepMind presentó una posible solución: AlphaGenome, un sistema de inteligencia artificial diseñado para interpretar este misterioso ADN no codificante.
A diferencia de modelos anteriores, que solo podían analizar segmentos cortos de ADN o carecían de precisión a nivel de base, AlphaGenome es capaz de procesar secuencias de hasta un millón de letras manteniendo la resolución a nivel de nucleótido. Este avance técnico permite a los investigadores examinar cómo elementos reguladores distantes influyen en la actividad génica, un factor clave para comprender los mecanismos de las enfermedades.
"Este es uno de los problemas más fundamentales, no solo en biología, sino en toda la ciencia", afirmó Pushmeet Kohli, responsable de IA para ciencia en DeepMind. El modelo predice miles de propiedades moleculares, incluyendo dónde comienzan y terminan los genes en distintos tejidos, cómo se empalman los ARN y qué proteínas se unen a regiones específicas del ADN.
En pruebas comparativas, AlphaGenome superó a herramientas especializadas en 22 de 24 tareas de predicción de secuencias y igualó o superó a otros modelos en 24 de 26 evaluaciones sobre el efecto de variantes. Al analizar mutaciones encontradas en pacientes con leucemia, el modelo predijo con precisión cómo las variantes no codificantes activaban el gen TAL1, relacionado con el cáncer, al crear un nuevo sitio de unión para la proteína MYB, replicando un mecanismo de enfermedad previamente confirmado solo mediante estudios de laboratorio.
"Por primera vez, disponemos de un único modelo que unifica el contexto a larga distancia, la precisión a nivel de base y un rendimiento de vanguardia en todo el espectro de tareas genómicas", señaló el Dr. Caleb Lareau, del Memorial Sloan Kettering Cancer Center, quien tuvo acceso anticipado al sistema.
Aunque potente, AlphaGenome presenta limitaciones. Tiene dificultades con elementos reguladores extremadamente distantes (a más de 100.000 pares de bases) y no puede predecir resultados de salud o rasgos personales. DeepMind está poniendo el modelo a disposición mediante una API para investigación no comercial, con planes de un lanzamiento completo en el futuro. Los investigadores esperan que acelere los estudios sobre enfermedades al permitir experimentos virtuales que antes requerían un extenso trabajo de laboratorio.