Google ha implementado importantes mejoras de seguridad en su familia de modelos de IA Gemini 2.5, estableciéndolos como los modelos más seguros de la compañía hasta la fecha en respuesta a las amenazas de seguridad en IA en constante evolución.
En el núcleo de estas mejoras se encuentra un nuevo enfoque de seguridad que incrementa notablemente la protección de Gemini frente a los ataques de inyección indirecta de prompts durante el uso de herramientas. Estos ataques se producen cuando se insertan instrucciones maliciosas en los datos que recupera un modelo de IA, lo que puede llevar al modelo a ejecutar comandos dañinos o filtrar información sensible.
Las mejoras en seguridad llegan mientras Google se prepara para integrar las capacidades de uso de ordenador de Project Mariner en la API de Gemini y Vertex AI. Project Mariner permite que agentes de IA controlen navegadores web y realicen tareas específicas de forma automática, como navegar por sitios web e interactuar con elementos de la web. Varias empresas, entre ellas Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company y Cartwheel, ya están probando estas capacidades, y se espera que el acceso para desarrolladores se amplíe este verano.
La estrategia de seguridad de Google para Gemini 2.5 implica múltiples capas defensivas, incluido el red teaming automatizado (ART), que analiza continuamente posibles vulnerabilidades. Según la investigación de Google DeepMind, este enfoque ha reducido significativamente la tasa de éxito de los ataques adaptativos en comparación con versiones anteriores del modelo. La compañía ha ajustado Gemini utilizando conjuntos de datos con escenarios de ataque realistas, enseñando al modelo a ignorar instrucciones maliciosas incrustadas mientras sigue las peticiones legítimas de los usuarios.
Más allá de las mejoras en seguridad, los modelos Gemini 2.5 incorporan nuevas funciones como resúmenes de razonamiento en la API de Gemini y Vertex AI, que organizan el proceso de pensamiento del modelo en un formato estructurado para una mayor transparencia y facilidad de depuración. Los modelos también admiten salida de audio nativa para experiencias conversacionales más naturales.
El modelo Gemini 2.5 Flash ya está disponible para todos en la app de Gemini, y su disponibilidad general en Google AI Studio para desarrolladores y en Vertex AI para empresas llegará a principios de junio. Gemini 2.5 Pro le seguirá poco después, llevando sus funciones de seguridad mejoradas a un público más amplio.