menu
close

Google amplía su portafolio de IA con Gemini 2.5 e Imagen 4

Google ha fortalecido su oferta de inteligencia artificial al poner a disposición general Gemini 2.5 Flash y Pro, además de presentar el modelo Flash-Lite, que es más eficiente en costos. La compañía también lanzó Imagen 4, su modelo de texto a imagen más avanzado hasta la fecha, con capacidades significativamente mejoradas para la representación de texto. Estos lanzamientos se complementan con Gemini CLI, una herramienta de código abierto que lleva la IA directamente a las terminales de los desarrolladores para programación y resolución de problemas.
Google amplía su portafolio de IA con Gemini 2.5 e Imagen 4

Google ha expandido significativamente su ecosistema de inteligencia artificial con varios lanzamientos importantes, posicionándose a la vanguardia de la tecnología generativa de IA.

La familia Gemini 2.5 ha crecido con los modelos Flash y Pro, que ahora están disponibles de manera general para uso en producción. Gemini 2.5 Flash y Pro ya son estables y están disponibles, permitiendo a los desarrolladores crear aplicaciones de producción con confianza. Empresas como Spline, Rooms, Snap y SmartBear ya han estado utilizando estas versiones en producción durante varias semanas. El crecimiento y la demanda de Gemini 2.5 Pro ha sido la más pronunciada de cualquier modelo de Google hasta la fecha, lo que llevó a la compañía a hacer estable la versión 06-05 manteniendo el mismo precio. Google espera que Pro sobresalga en escenarios que requieren la mayor inteligencia y capacidades, como tareas de programación y agentes autónomos.

Adicionalmente, Google ha presentado Gemini 2.5 Flash-Lite en vista previa, su modelo 2.5 más rápido y eficiente en costos hasta ahora. Esta nueva adición está diseñada como una opción rentable para tareas de alto volumen como clasificación o resumen a gran escala, ofreciendo mejor desempeño en la mayoría de las evaluaciones y menor tiempo hasta el primer token, además de lograr una mayor cantidad de tokens por segundo en decodificación. Flash-Lite es un modelo de razonamiento que permite el control dinámico del presupuesto de procesamiento a través de un parámetro en la API. A diferencia de otros modelos de la familia, el razonamiento está desactivado por defecto ya que Flash-Lite está optimizado para costo y velocidad. A pesar de esta optimización, sigue soportando todas las herramientas nativas, incluyendo Grounding con Google Search, ejecución de código, contexto de URL y llamadas a funciones.

En el ámbito de la generación de imágenes, Google ha lanzado Imagen 4, que fue anunciado por primera vez en I/O 2025 el mes pasado. Google lo describe como su "mejor modelo de texto a imagen hasta ahora", con una "representación de texto significativamente mejorada" respecto a modelos anteriores. El nuevo modelo ofrece una claridad notable en detalles finos como telas intrincadas, gotas de agua y pelaje de animales, y destaca tanto en estilos fotorrealistas como abstractos. Otras mejoras incluyen soporte para resolución 2K y mejor ortografía y tipografía. Imagen 4 y una versión premium Imagen 4 Ultra ya están disponibles para usuarios de vista previa de pago en la API de Gemini, con pruebas gratuitas limitadas en Google AI Studio. Imagen 4 tiene un costo de $0.04 dólares por imagen generada, mientras que la versión Ultra cuesta $0.06 dólares por imagen.

Complementando estos lanzamientos está Gemini CLI, un agente de IA de código abierto que lleva el poder de Gemini directamente a las terminales de los desarrolladores para programación, resolución de problemas y gestión de tareas. Los usuarios pueden acceder a Gemini 2.5 Pro de forma gratuita con una cuenta personal de Google, o utilizar claves de Google AI Studio o Vertex AI para un acceso ampliado. Gemini CLI ofrece la mayor cuota de uso de la industria, con 60 solicitudes de modelo por minuto y 1,000 solicitudes por día sin costo. Proporciona potentes capacidades de IA, desde comprensión de código y manipulación de archivos hasta ejecución de comandos y solución dinámica de problemas, ofreciendo una mejora fundamental en la experiencia de la línea de comandos y permitiendo a los usuarios escribir código, depurar problemas y optimizar flujos de trabajo usando lenguaje natural.

Estos lanzamientos en conjunto refuerzan la posición de Google en el competitivo panorama de la IA, proporcionando a desarrolladores y usuarios herramientas más potentes, eficientes y accesibles para una amplia gama de aplicaciones.

Source:

Latest News