구글은 Gemini 2.5 모델군을 강화하며, 가장 비용 효율적이고 빠른 2.5 모델인 Gemini 2.5 Flash-Lite를 새롭게 선보였다.
2025년 7월 2일 발표된 Flash-Lite는 이제 정식 출시된 Gemini 2.5 Flash, Pro 모델과 함께 3단계 라인업을 완성해 다양한 AI 애플리케이션 요구에 대응한다. Flash-Lite는 번역, 분류 등 대량 처리와 지연 시간에 민감한 작업에 최적화되어 있으며, 벤치마크 테스트 결과 기존 Flash 모델 대비 더 낮은 지연 시간을 기록했다.
속도와 비용 효율성에 중점을 두었음에도 불구하고, Flash-Lite는 100만 토큰 컨텍스트 윈도우, 멀티모달 입력 지원, Google Search 및 코드 실행 등 Gemini 2.5 제품군의 핵심 기능을 그대로 제공한다. 특히 Flash-Lite는 효율 극대화를 위해 기본적으로 '사고(thinking)' 기능이 비활성화되어 있지만, 필요 시 사용자가 직접 활성화할 수 있다.
이와 함께 구글은 개발자들이 터미널에서 직접 Gemini를 사용할 수 있는 오픈소스 AI 에이전트 'Gemini CLI'도 공개했다. Apache 2.0 라이선스 하에 배포되는 이 도구는 코딩, 콘텐츠 생성, 문제 해결, 작업 관리 등 다양한 용도로 Gemini에 가볍게 접근할 수 있게 해준다. 개발자는 개인 구글 계정만 있으면 Gemini 2.5 Pro를 무료로 이용할 수 있으며, 분당 60회, 일일 1,000회라는 넉넉한 사용 한도가 제공된다.
CLI 도구는 시스템 프롬프트와 설정을 통한 폭넓은 커스터마이징을 지원해 다양한 워크플로우에 맞게 활용할 수 있다. 또한 구글의 AI 코딩 어시스턴트인 Gemini Code Assist와도 통합되어, 여러 개발 환경에서 일관된 경험을 제공한다.
이번 신제품 출시는 고성능이 필요한 복잡한 작업을 위한 Pro 모델부터 대량 처리에 최적화된 비용 효율적 Flash-Lite까지, 다양한 성능과 비용 요구에 맞춘 선택지를 제공하며 고급 AI 기능의 접근성을 높이려는 구글의 전략을 반영한다. Gemini 2.5 제품군은 이제 복잡한 작업부터 대량 처리까지 아우르는 완성도 높은 라인업을 갖추게 됐다.