Google se prepara para una importante expansión de sus capacidades de inteligencia artificial con el próximo lanzamiento general de Gemini 2.5 Pro en junio de 2025.
Según anuncios recientes de Google DeepMind, Gemini 2.5 Flash ya está disponible para todos en la app de Gemini, y se planea su disponibilidad general en Google AI Studio para desarrolladores y en Vertex AI para empresas a principios de junio. La versión más potente, Gemini 2.5 Pro, llegará poco después.
La característica más destacada del modelo 2.5 Pro es Deep Think, un modo experimental de razonamiento mejorado que permite al modelo considerar múltiples hipótesis antes de responder. Esta capacidad está diseñada específicamente para tareas altamente complejas de matemáticas y programación, y Google reporta resultados impresionantes en pruebas exigentes como la Olimpiada Matemática de EE. UU. 2025 y LiveCodeBench, un benchmark de programación a nivel competitivo.
"Al explorar las fronteras de las capacidades de razonamiento de Gemini, estamos comenzando a probar un modo de razonamiento mejorado llamado Deep Think, que utiliza nuevas técnicas de investigación que permiten al modelo considerar múltiples hipótesis antes de responder", señaló Google en una reciente publicación de blog.
La seguridad ha sido un enfoque principal para la familia Gemini 2.5. Google ha implementado salvaguardas de seguridad avanzadas que han incrementado sustancialmente la protección de Gemini contra ataques indirectos de inyección de instrucciones durante el uso de herramientas. Estos ataques ocurren cuando se insertan instrucciones maliciosas en los datos que recupera un modelo de IA. A través de pruebas automatizadas (red teaming) y el fortalecimiento del modelo, Google ha reducido significativamente la tasa de éxito de estos ataques, convirtiendo a la familia 2.5 en su modelo más seguro hasta la fecha.
Más allá de las mejoras en seguridad, Google está integrando las capacidades de uso de computadora de Project Mariner en la API de Gemini y Vertex AI. Empresas como Automation Anywhere, UiPath, Browserbase y otras ya están explorando su potencial para la automatización y la mejora de flujos de trabajo.
Otras funciones que llegarán tanto a 2.5 Pro como a 2.5 Flash incluyen resúmenes de razonamiento, que organizan el proceso de pensamiento del modelo en un formato claro, y capacidades nativas de audio con soporte para múltiples hablantes en más de 24 idiomas.
Mientras Google continúa compitiendo en el cada vez más competitivo panorama de la IA, estas mejoras en Gemini 2.5 Pro representan avances significativos en capacidades de razonamiento, seguridad y funcionalidad multimodal.