Google, performans ile hız ve maliyet etkinliğini dengeleyen verimli yapay zeka modelinin en son sürümü olan Gemini 2.5 Flash'ın önizleme versiyonunu kullanıma sundu.
Gemini 2.0 Flash'ın temelleri üzerine inşa edilen yeni 2.5 Flash modeli, verimliliğinden ödün vermeden akıl yürütme yeteneklerinde büyük bir sıçrama sağlıyor. Google, bu modeli "akıl yürütme yeteneklerinde büyük bir yükseltme, ancak hız ve maliyeti önceliklendirmeye devam ediyor" şeklinde tanımlıyor.
Gemini 2.5 Flash'ın öne çıkan özelliği hibrit akıl yürütme sistemi. Google'ın "ilk tamamen hibrit akıl yürütme modeli" olan bu sistem, geliştiricilere düşünme özelliğini açıp kapama ve kalite, maliyet ve gecikme arasında dengeyi optimize etmek için düşünme bütçeleri belirleme imkânı tanıyor. Bu yenilikçi yaklaşım, geliştiricilere modelin karmaşık görevleri nasıl işleyeceği üzerinde benzeri görülmemiş bir kontrol sağlıyor.
Pratikte bu, geliştiricilerin modelin ne kadar akıl yürütme yapacağını belirleyen bir "düşünme bütçesi" tanımlayabileceği anlamına geliyor. Google AI Studio ve Vertex AI'da bir kaydırıcı veya API parametresiyle "modelin düşünürken üretebileceği token sayısı" 0'dan 24.576'ya kadar ayarlanabiliyor. Düşünme bütçesi sıfıra ayarlandığında, modelin maliyeti ve gecikmesi Gemini 2.0 Flash ile aynı seviyede oluyor.
Fiyatlandırma da bu esnekliği yansıtıyor: Akıl yürütme olmadan giriş token'ları milyon başına 15 sent, çıkış token'ları ise milyon başına 60 sent olarak ücretlendiriliyor. Düşünme yetenekleri aktif edildiğinde ise maliyet milyon token başına 3,50 dolara yükseliyor.
Benchmark testlerinde etkileyici sonuçlar elde edildi. Gemini 2.5 Flash, "LMArena'daki Zor İstemlerde yalnızca 2.5 Pro'nun ardından ikinci sırada yer alıyor" ve "diğer önde gelen modellere kıyasla çok daha düşük maliyet ve boyutta benzer metrikler sunuyor"; böylece "fiyat-performans oranında liderliğini sürdürüyor".
Google, 2.5 Flash'ı "hız ve düşük maliyet için tasarlanmış en verimli iş atı modeli" olarak tanımlıyor ve "akıl yürütme, çok modluluk, kod ve uzun bağlam gibi temel ölçütlerde gelişirken, değerlendirmelerde %20-30 daha az token kullanarak daha da verimli hale geldiğini" belirtiyor.
Yeni model şu anda çeşitli kanallar üzerinden önizleme modunda erişime açık. "Google AI Studio (geliştiriciler), Vertex AI (kurumsal) ve Gemini uygulaması (herkes)" üzerinden sunuluyor. Google'ın I/O 2025 duyurularına göre, güncellenmiş sürüm "Haziran başında geliştiriciler için Google AI Studio'da ve kurumsal müşteriler için Vertex AI'da genel kullanıma sunulacak"; Gemini 2.5 Pro ise "kısa süre sonra" takip edecek.
Google yapay zeka yeteneklerini genişletmeye devam ederken, Gemini 2.5 Flash, gelişmiş akıl yürütmeyi geliştiriciler ve kullanıcılar için daha erişilebilir ve maliyet etkin hale getirme yolunda önemli bir adım olarak öne çıkıyor.