Google se prepara para una importante expansión de sus capacidades de inteligencia artificial con el próximo lanzamiento general de Gemini 2.5 Pro en junio de 2025.
Según los recientes anuncios de Google DeepMind, Gemini 2.5 Flash ya está disponible para todos en la aplicación Gemini, y está previsto que esté disponible de forma general en Google AI Studio para desarrolladores y en Vertex AI para empresas a principios de junio. La versión más potente, Gemini 2.5 Pro, llegará poco después.
La característica más destacada del modelo 2.5 Pro es Deep Think, un modo experimental de razonamiento mejorado que permite al modelo considerar múltiples hipótesis antes de responder. Esta capacidad está diseñada específicamente para tareas altamente complejas de matemáticas y programación, y Google informa de resultados impresionantes en pruebas exigentes como la Olimpiada Matemática de EE. UU. 2025 y LiveCodeBench, un referente de programación a nivel competitivo.
"Al explorar los límites de las capacidades de razonamiento de Gemini, hemos comenzado a probar un modo de razonamiento mejorado llamado Deep Think, que utiliza nuevas técnicas de investigación que permiten al modelo considerar varias hipótesis antes de responder", afirmó Google en una reciente entrada de su blog.
La seguridad ha sido una de las principales prioridades para la familia Gemini 2.5. Google ha implementado avanzadas medidas de protección que han incrementado sustancialmente la defensa de Gemini frente a ataques indirectos de inyección de instrucciones durante el uso de herramientas. Estos ataques se producen cuando se insertan instrucciones maliciosas en los datos que recupera un modelo de IA. Mediante pruebas automatizadas de seguridad (red teaming) y el refuerzo del modelo, Google ha reducido significativamente la tasa de éxito de estos ataques, convirtiendo a la familia 2.5 en su modelo más seguro hasta el momento.
Más allá de las mejoras en seguridad, Google está incorporando las capacidades de uso de ordenador de Project Mariner en la API de Gemini y en Vertex AI. Empresas como Automation Anywhere, UiPath, Browserbase y otras ya están explorando su potencial para la automatización y la mejora de flujos de trabajo.
Entre las funciones adicionales que llegarán tanto a 2.5 Pro como a 2.5 Flash se encuentran los resúmenes de pensamiento, que organizan el proceso de razonamiento del modelo en un formato claro, y capacidades de audio nativas con soporte para varios interlocutores en más de 24 idiomas.
A medida que Google sigue compitiendo en el cada vez más competitivo panorama de la IA, estas mejoras en Gemini 2.5 Pro representan avances significativos en capacidades de razonamiento, seguridad y funcionalidad multimodal.