Google, güçlü yapay zekâyı hem geliştiriciler hem de işletmeler için daha erişilebilir ve verimli hâle getiren önemli bir adım olarak Gemini 2.5 Flash-Lite'ı resmen piyasaya sürdü.
Yeni model, Google'ın "şimdiye kadarki en uygun maliyetli ve en hızlı 2.5 modeli" olarak tanımlanıyor ve yüksek hacimli, gecikmeye duyarlı işlemler için optimize edildi. Flash-Lite, 2.5 model ailesinde en düşük gecikme ve maliyetle piyasaya giriyor; önceki 1.5 ve 2.0 Flash modellerine kıyasla daha uygun maliyetli bir yükseltme olarak tasarlandı. Çoğu değerlendirmede daha iyi performans sunan model, ilk token'a ulaşma süresini azaltırken saniyede daha fazla token çözümlemesiyle ölçekli sınıflandırma veya özetleme gibi yüksek verimli görevler için ideal hâle geliyor.
Bir akıl yürütme modeli olarak Flash-Lite, API parametresi üzerinden düşünme bütçesinin dinamik olarak kontrol edilmesine olanak tanıyor. Diğer Gemini 2.5 modellerinde düşünme varsayılan olarak etkinken, Flash-Lite maliyet ve hız optimizasyonu amacıyla düşünmeyi kapalı tutuyor; yalnızca özel olarak etkinleştirildiğinde devreye giriyor. Bu optimizasyona rağmen, Google Arama ile doğrulama, kod yürütme, URL bağlamı ve fonksiyon çağrısı gibi tüm yerel araçları desteklemeye devam ediyor.
Performans testleri, Flash-Lite'ın Gemini 2.0 Flash'a göre 1,5 kat daha hızlı ve daha düşük maliyetli olduğunu gösteriyor. Bu da onu sınıflandırma, çeviri, akıllı yönlendirme ve diğer maliyet duyarlı, yüksek ölçekli işlemler için özellikle uygun kılıyor. Diğer modeller soruları yanıtlamak için varsayılan olarak daha güçlü (ve pahalı) akıl yürütme araçlarını kullanırken, Flash-Lite bu sürecin kontrolünü geliştiricilere bırakıyor. Kullanıcılar, ihtiyaçlarına göre düşünme yeteneğini açıp kapatabiliyor ve maliyet verimliliğine rağmen Flash-Lite'ın başarabilecekleri konusunda bir sınırlama bulunmuyor.
Gemini 2.5 Flash-Lite'ın önizlemesi, şu anda Google AI Studio ve Vertex AI'da, 2.5 Flash ve Pro'nun kararlı sürümleriyle birlikte sunuluyor. Hem 2.5 Flash hem de Pro, Gemini uygulamasında da erişilebilir durumda ve Google, 2.5 Flash-Lite ile Flash'ın özel sürümlerini Arama'ya da entegre etti.
Gemini model ailesinin bu stratejik genişlemesi, Google'ın farklı kullanım senaryoları için performans, maliyet ve hız arasında denge kuran seçenekler sunarak yapay zekâyı demokratikleştirme konusundaki kararlılığını gösteriyor; ister karmaşık akıl yürütme görevleri ister yüksek hacimli veri işleme olsun.