menu
close

DeepSeek'in R1 Güncellemesi, Gelişmiş Akıl Yürütme Yeteneğiyle Yapay Zeka Devlerine Meydan Okuyor

Çinli yapay zeka girişimi DeepSeek, açık kaynaklı akıl yürütme modelinin önemli bir yükseltmesi olan R1-0528'i yayınladı. Bu yeni sürüm, artık OpenAI ve Google'ın tescilli modelleriyle rekabet edebilecek seviyeye ulaştı. Geliştirilmiş model, AIME 2025 testinde matematiksel doğruluğunu %70'ten %87,5'e çıkararak akıl yürütme kapasitesini iki katına çıkardı. DeepSeek ayrıca, tek bir GPU üzerinde çalışabilen ve etkileyici performansını koruyan daha küçük, 8 milyar parametreli bir distile versiyon da piyasaya sürdü.
DeepSeek'in R1 Güncellemesi, Gelişmiş Akıl Yürütme Yeteneğiyle Yapay Zeka Devlerine Meydan Okuyor

Çinli yapay zeka girişimi DeepSeek, açık kaynaklı akıl yürütme modelini R1-0528 sürümüyle önemli ölçüde geliştirdi ve performansını OpenAI'nin o3'ü ve Google'ın Gemini 2.5 Pro'su gibi sektör liderlerine yaklaştırdı.

Bu yükseltme, DeepSeek'in akıl yürütme yeteneklerinde, artırılmış hesaplama kaynakları ve algoritmik optimizasyon sayesinde büyük bir ilerlemeye işaret ediyor. Model, yapılan kıyaslama testlerinde matematiksel akıl yürütmede dikkate değer gelişmeler gösterdi; AIME 2025 matematik testindeki doğruluk oranı %70'ten %87,5'e yükseldi. Bu gelişim, modelin artık her bir soru için ortalama 12.000 yerine 23.000 token kullanmasıyla sağlanan daha derin akıl yürütmeden kaynaklanıyor.

Matematiksel gelişmelerin ötesinde, R1-0528 geliştiriciler için daha kullanışlı hale getiren çeşitli yeni özellikler sunuyor. Model artık sistem istemlerini, fonksiyon çağrısını ve JSON çıktısını destekliyor; bu da uygulamalara entegrasyonunu kolaylaştırıyor. Ayrıca, yeniden yazma ve özetleme görevlerinde halüsinasyon oranının %45-50 oranında azaldığı bildiriliyor ve geliştiricilerin doğal dil kullanarak kod üretmesini sağlayan vibe coding desteği de iyileştirildi.

Kaynakları kısıtlı kullanıcılar için önemli bir gelişme olarak, DeepSeek ayrıca DeepSeek-R1-0528-Qwen3-8B adında distile bir sürüm de yayınladı. Alibaba'nın Qwen3 8B modeli, tam R1-0528'den alınan akıl yürütme desenleriyle ince ayar yapılarak oluşturulan bu daha küçük model, tek bir tüketici sınıfı GPU üzerinde çalışabiliyor. Buna rağmen, bazı matematiksel kıyaslamalarda Google'ın Gemini 2.5 Flash modelini geride bırakırken, Microsoft'un Phi 4 reasoning plus modeline de neredeyse yetişiyor.

Önceki sürümde olduğu gibi, R1-0528 de ticari kullanım ve özelleştirmeye izin veren esnek MIT Lisansı altında sunuluyor. Amazon Web Services ve Microsoft Azure gibi büyük bulut sağlayıcıları artık DeepSeek'in modellerini müşterilerine sunuyor; ancak veri gizliliğini sağlamak için bu modelleri Çin sunucularından izole ediyorlar.

Bu yeni sürüm, DeepSeek ve Meta'yı açık kaynak yapay zeka alanında lider konuma daha da sağlamlaştırıyor ve OpenAI, Google, Microsoft ve Anthropic'in tescilli modellerine kıyasla çok daha düşük hesaplama maliyetiyle güçlü alternatifler sunuyor.

Source:

Latest News