menu
close

Google refuerza Gemini 2.5 frente a amenazas de seguridad en IA

Google ha mejorado significativamente las protecciones de seguridad en sus modelos Gemini 2.5 Pro y Flash, convirtiéndolos en los modelos de IA más seguros de la compañía hasta la fecha. Las mejoras se centran especialmente en los ataques de inyección indirecta de prompts durante el uso de herramientas, una preocupación creciente en ciberseguridad donde se incrustan instrucciones maliciosas en los datos que recuperan los sistemas de IA. Este avance en seguridad coincide con la integración de las capacidades de uso de ordenador de Project Mariner en la API de Gemini y Vertex AI, con empresas como Automation Anywhere y UiPath explorando ya su potencial.
Google refuerza Gemini 2.5 frente a amenazas de seguridad en IA

Google ha implementado importantes mejoras de seguridad en su familia de modelos de IA Gemini 2.5, estableciéndolos como los modelos más seguros de la compañía hasta la fecha en respuesta a las amenazas de seguridad en IA en constante evolución.

En el núcleo de estas mejoras se encuentra un nuevo enfoque de seguridad que incrementa notablemente la protección de Gemini frente a los ataques de inyección indirecta de prompts durante el uso de herramientas. Estos ataques se producen cuando se insertan instrucciones maliciosas en los datos que recupera un modelo de IA, lo que puede llevar al modelo a ejecutar comandos dañinos o filtrar información sensible.

Las mejoras en seguridad llegan mientras Google se prepara para integrar las capacidades de uso de ordenador de Project Mariner en la API de Gemini y Vertex AI. Project Mariner permite que agentes de IA controlen navegadores web y realicen tareas específicas de forma automática, como navegar por sitios web e interactuar con elementos de la web. Varias empresas, entre ellas Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company y Cartwheel, ya están probando estas capacidades, y se espera que el acceso para desarrolladores se amplíe este verano.

La estrategia de seguridad de Google para Gemini 2.5 implica múltiples capas defensivas, incluido el red teaming automatizado (ART), que analiza continuamente posibles vulnerabilidades. Según la investigación de Google DeepMind, este enfoque ha reducido significativamente la tasa de éxito de los ataques adaptativos en comparación con versiones anteriores del modelo. La compañía ha ajustado Gemini utilizando conjuntos de datos con escenarios de ataque realistas, enseñando al modelo a ignorar instrucciones maliciosas incrustadas mientras sigue las peticiones legítimas de los usuarios.

Más allá de las mejoras en seguridad, los modelos Gemini 2.5 incorporan nuevas funciones como resúmenes de razonamiento en la API de Gemini y Vertex AI, que organizan el proceso de pensamiento del modelo en un formato estructurado para una mayor transparencia y facilidad de depuración. Los modelos también admiten salida de audio nativa para experiencias conversacionales más naturales.

El modelo Gemini 2.5 Flash ya está disponible para todos en la app de Gemini, y su disponibilidad general en Google AI Studio para desarrolladores y en Vertex AI para empresas llegará a principios de junio. Gemini 2.5 Pro le seguirá poco después, llevando sus funciones de seguridad mejoradas a un público más amplio.

Source:

Latest News