menu
close

Google'ın Gemini Diffusion'ı, Yapay Zeka Metin Üretiminde Devrim Yaratıyor

Google, rastgele gürültüyü anlamlı metne dönüştüren ve önceki modellere kıyasla beş kata kadar daha hızlı çalışan çığır açıcı metin üretim modeli Gemini Diffusion'ı tanıttı. Deneysel model, görüntü üretim tekniklerine benzer difüzyon teknolojisini kullanarak saniyede 2.000'e kadar token üretebiliyor ve mevcut modellerin kodlama performansına erişiyor. Google ayrıca, geliştiricilere akıl yürütme yetenekleri ve maliyet üzerinde hassas kontrol sağlayan düşünme bütçeleriyle Gemini 2.5 serisini geliştirdi.
Google'ın Gemini Diffusion'ı, Yapay Zeka Metin Üretiminde Devrim Yaratıyor

Google DeepMind, geleneksel otoregresif dil modellerinden önemli ölçüde ayrışan devrim niteliğinde bir yapay zeka metin üretim yaklaşımı olan Gemini Diffusion'ı tanıttı.

Klasik modellerin metni sırayla, bir token bir token üretmesinin aksine, Gemini Diffusion daha çok görüntü ve video üretiminde kullanılan difüzyon teknolojisini kullanıyor ve rastgele gürültüyü yinelemeli bir süreçle anlamlı metne dönüştürüyor. DeepMind araştırmacılarına göre, bu yenilikçi yöntem modelin saniyede 2.000'e kadar token üretmesini sağlıyor.

Google, duyurusunda "Metni doğrudan tahmin etmek yerine, çıktıları adım adım gürültüyü rafine ederek üretmeyi öğreniyorlar," açıklamasında bulundu. "Bu sayede, bir çözüm üzerinde çok hızlı şekilde yineleme yapabiliyor ve üretim sürecinde hata düzeltebiliyorlar."

Şu anda bekleme listesiyle erişilebilen deneysel demo, bu teknolojinin Google'ın mevcut modellerinin kodlama performansına ulaşırken üretim süresini dramatik biçimde azalttığını gösteriyor. Yapılan karşılaştırmalarda, Gemini Diffusion; HumanEval ve MBPP gibi programlama görevlerinde Gemini 2.0 Flash-Lite ile neredeyse aynı sonuçları veriyor.

Google DeepMind Araştırma Başkan Yardımcısı, Derin Öğrenme Lideri ve Gemini projesinin Eş Başkanı Oriol Vinyals, bu yayını kişisel bir dönüm noktası olarak nitelendirirken, demoda modelin o kadar hızlı çalıştığını, videoyu izlenebilir kılmak için yavaşlatmak zorunda kaldıklarını belirtti.

Bununla birlikte, Google Gemini 2.5 serisini yeni yeteneklerle güçlendirdi. Şirket, geliştiricilere yapay zekanın ne kadar akıl yürütme yapacağını eşi benzeri görülmemiş bir hassasiyetle kontrol etme imkânı tanıyan düşünme bütçeleriyle Gemini 2.5 Flash'ı piyasaya sürdü. Bu özellik, kullanıcıların modelin akıl yürütme süreci için bir token limiti (24.576 token'a kadar) belirleyerek kalite, gecikme ve maliyet arasında denge kurmasını sağlıyor.

Google, düşünme bütçelerini önümüzdeki haftalarda genel kullanıma sunulacak şekilde Gemini 2.5 Pro'ya da genişletiyor. Ayrıca, Gemini API'da Model Context Protocol (MCP) tanımlarına yerel SDK desteği eklenerek açık kaynak araçlarla entegrasyon ve otonom uygulama geliştirme kolaylaştırıldı.

Tüm bu gelişmeler, Google'ın yapay zekayı daha verimli, kontrol edilebilir ve geliştiriciler için erişilebilir kılma çabasının bir göstergesi olarak öne çıkıyor; yüksek performans standartlarını ise korumaya devam ediyor.

Source:

Latest News