menu
close

Google amplía su cartera de IA con Gemini 2.5 e Imagen 4

Google ha reforzado su oferta de inteligencia artificial al poner Gemini 2.5 Flash y Pro a disposición general, además de presentar el modelo Flash-Lite, más rentable. La compañía también ha lanzado Imagen 4, su modelo de texto a imagen más avanzado hasta la fecha, con capacidades de renderizado de texto significativamente mejoradas. Estos lanzamientos se complementan con la llegada de Gemini CLI, una herramienta de código abierto que lleva la IA directamente a los terminales de los desarrolladores para programación y resolución de problemas.
Google amplía su cartera de IA con Gemini 2.5 e Imagen 4

Google ha ampliado significativamente su ecosistema de inteligencia artificial con varios lanzamientos importantes, posicionándose a la vanguardia de la tecnología generativa.

La familia Gemini 2.5 ha crecido con la disponibilidad general de los modelos Flash y Pro para uso en producción. Gemini 2.5 Flash y Pro ya son estables y están disponibles de forma general, lo que permite a los desarrolladores crear aplicaciones de producción con confianza. Empresas como Spline, Rooms, Snap y SmartBear ya llevan semanas utilizando estas versiones en entornos productivos. El crecimiento y la demanda de Gemini 2.5 Pro han sido los más pronunciados de cualquier modelo de Google hasta la fecha, lo que ha llevado a la compañía a estabilizar la versión 06-05 manteniendo el mismo precio. Google espera que Pro destaque en escenarios que requieran la máxima inteligencia y capacidades, como la programación y tareas de agentes inteligentes.

Además, Google ha presentado Gemini 2.5 Flash-Lite en versión preliminar, su modelo 2.5 más rápido y rentable hasta el momento. Esta nueva incorporación está diseñada como una opción económica para tareas de alto volumen como la clasificación o el resumen a gran escala, ofreciendo un mejor rendimiento en la mayoría de evaluaciones y un menor tiempo hasta el primer token, además de una mayor velocidad de decodificación de tokens por segundo. Flash-Lite es un modelo de razonamiento que permite el control dinámico del presupuesto de procesamiento mediante un parámetro de la API. A diferencia de otros modelos de la familia, el razonamiento está desactivado por defecto, ya que Flash-Lite está optimizado para coste y velocidad. A pesar de esta optimización, sigue siendo compatible con todas las herramientas nativas, incluyendo Grounding con Google Search, ejecución de código, contexto de URL y llamadas a funciones.

En el ámbito de la generación de imágenes, Google ha lanzado Imagen 4, anunciado por primera vez en el I/O 2025 el mes pasado. Google lo describe como su "mejor modelo de texto a imagen hasta la fecha", con una "representación de texto significativamente mejorada" respecto a modelos anteriores. El nuevo modelo ofrece una claridad notable en detalles finos como tejidos intrincados, gotas de agua y pelaje de animales, y destaca tanto en estilos fotorrealistas como abstractos. Otras mejoras incluyen soporte para resolución 2K y una ortografía y tipografía mejoradas. Imagen 4 y una versión premium Imagen 4 Ultra ya están disponibles para usuarios de pago en vista previa a través de la API de Gemini, con pruebas gratuitas limitadas en Google AI Studio. Imagen 4 tiene un precio de 0,04 dólares por imagen generada, mientras que la versión Ultra cuesta 0,06 dólares por imagen.

Como complemento a estos lanzamientos, llega Gemini CLI, un agente de IA de código abierto que lleva el potencial de Gemini directamente a los terminales de los desarrolladores para programación, resolución de problemas y gestión de tareas. Los usuarios pueden acceder a Gemini 2.5 Pro de forma gratuita con una cuenta personal de Google, o utilizar claves de Google AI Studio o Vertex AI para un acceso ampliado. Gemini CLI ofrece la mayor cuota de uso de la industria, con 60 solicitudes de modelo por minuto y 1.000 solicitudes diarias sin coste. Proporciona potentes capacidades de IA, desde comprensión de código y manipulación de archivos hasta ejecución de comandos y resolución dinámica de problemas, suponiendo una mejora fundamental de la experiencia en línea de comandos y permitiendo a los usuarios escribir código, depurar errores y optimizar flujos de trabajo mediante lenguaje natural.

Estos lanzamientos refuerzan colectivamente la posición de Google en el competitivo panorama de la IA, proporcionando a desarrolladores y usuarios herramientas más potentes, eficientes y accesibles para una amplia gama de aplicaciones.

Source:

Latest News