Google está transformando su modelo de IA más avanzado, Gemini 2.5 Pro, en lo que denomina un 'modelo del mundo': un sistema capaz de comprender y simular aspectos de la realidad de formas que reflejan el funcionamiento del cerebro humano.
De acuerdo con los anuncios recientes de Google DeepMind en Google I/O 2025, esta capacidad de modelo del mundo permitirá a Gemini planificar e imaginar nuevas experiencias al comprender y simular aspectos del mundo. Esto representa una evolución importante en la capacidad de la IA para razonar sobre e interactuar con entornos complejos.
"Por eso estamos trabajando para ampliar nuestro mejor modelo fundacional multimodal, Gemini 2.5 Pro, para que se convierta en un 'modelo del mundo' que pueda planificar e imaginar nuevas experiencias al comprender y simular aspectos del mundo, tal como lo hace el cerebro", afirmó Google en su blog oficial.
El enfoque de modelo del mundo se basa en la amplia investigación de Google en el entrenamiento de agentes de IA para dominar juegos complejos y crear simulaciones interactivas. Ya se observan evidencias de estas capacidades en la habilidad de Gemini para utilizar el conocimiento del mundo y el razonamiento para representar entornos naturales, comprender la física intuitiva y enseñar a robots a seguir instrucciones y adaptarse en tiempo real.
En el centro de esta evolución se encuentra la nueva función Deep Think, un modo experimental de razonamiento mejorado para Gemini 2.5 Pro. Deep Think permite al modelo considerar múltiples hipótesis antes de responder, lo que mejora significativamente el desempeño en tareas complejas de matemáticas y programación. Esta función ya ha logrado puntuaciones impresionantes en pruebas exigentes como la competencia de matemáticas USAMO 2025 y LiveCodeBench para codificación.
Gemini 2.5 Pro con Deep Think está actualmente disponible para evaluadores de confianza a través de la API de Gemini, mientras Google realiza evaluaciones de seguridad adicionales antes de su lanzamiento general. Por su parte, se espera que el modelo estándar Gemini 2.5 Pro esté disponible de manera general a finales de junio de 2025, tras el lanzamiento previo de Gemini 2.5 Flash.
Este avance hacia la modelización del mundo forma parte de la visión más amplia de Google de crear un asistente de IA universal capaz de comprender el contexto, planificar de manera efectiva y actuar a través de diferentes dispositivos, transformando en última instancia la forma en que los humanos interactúan con los sistemas de IA.