menu
close

구글, Imagen 4 공개 및 Gemini 2.5 라인업 확장

구글이 지금까지 가장 진보된 텍스트-이미지 생성 모델인 Imagen 4를 유료 프리뷰 형태로 Gemini API와 Google AI Studio에서 출시했다. 이번 발표와 함께 Gemini 2.5 Flash 및 Pro 모델이 정식 출시되었으며, 2.5 패밀리 중 가장 비용 효율적이고 빠른 모델인 Gemini 2.5 Flash-Lite도 새롭게 선보였다. 개발자들은 오픈소스 Gemini CLI를 통해 터미널에서 직접 Gemini를 사용할 수 있게 되었다.
구글, Imagen 4 공개 및 Gemini 2.5 라인업 확장

구글이 AI 역량을 대폭 확장하며, 자사의 가장 진보된 텍스트-이미지 생성 모델인 Imagen 4를 출시했다. Imagen 4는 Gemini API와 Google AI Studio를 통해 유료 프리뷰로 제공된다.

Imagen 4는 이전 버전 대비 특히 이미지 내 텍스트 렌더링 품질이 크게 향상된 것이 특징이다. 이번 출시에는 두 가지 버전이 포함되어 있는데, 표준 Imagen 4 모델은 출력 이미지당 0.04달러, 사용자 지시를 더욱 정밀하게 따르는 Imagen 4 Ultra는 이미지당 0.06달러에 제공된다. 두 모델 모두 인간의 눈에는 보이지 않지만 AI 생성 콘텐츠를 식별할 수 있는 SynthID 워터마킹 기술이 적용됐다.

이번 발표는 구글의 Gemini 2.5 모델군 확장의 일환이다. 구글은 프리뷰를 성공적으로 마친 Gemini 2.5 Flash와 Pro 모델을 정식 출시했으며, Gemini 2.5 Flash-Lite를 프리뷰로 선보였다. Flash-Lite는 구글 2.5 모델군 중 가장 비용 효율적이고 빠른 모델로, 분류, 번역, 지능형 라우팅 등 대량 처리와 지연 시간에 민감한 작업에 최적화되어 있다.

효율성에 중점을 두었음에도 불구하고, Gemini 2.5 Flash-Lite는 100만 토큰 컨텍스트 윈도우, Google 검색 연동 및 코드 실행 등 2.5 패밀리의 핵심 기능을 그대로 지원한다. 다른 모델들과 달리, Flash-Lite는 기본적으로 '생각(thinking)' 기능이 꺼져 있으며, 개발자가 API 파라미터를 통해 생각 예산을 직접 조절할 수 있어 속도와 비용 최적화가 가능하다.

개발자 지원도 강화됐다. 구글은 오픈소스 AI 에이전트인 Gemini CLI를 출시해 터미널 환경에서 Gemini를 직접 사용할 수 있도록 했다. 이 도구를 통해 개발자들은 커맨드라인 인터페이스에서 Gemini 2.5 Pro를 활용해 코딩, 문제 해결, 작업 관리를 할 수 있다. Gemini CLI는 Apache 2.0 라이선스로 공개되어 있어, 개발자들이 코드를 검토하고 보안성을 확인하거나 개발에 직접 기여할 수 있다.

구글의 이번 AI 신제품들은 고품질 이미지 생성부터 효율적인 텍스트 처리, 터미널 기반 AI 지원에 이르기까지 다양한 가격대와 활용 사례에 맞춰 점점 더 강력하고 유연한 도구를 제공하겠다는 개발자 중심의 의지를 보여준다.

Source:

Latest News