Anthropic, yeni nesil yapay zekâ modelleri Claude Opus 4 ve Claude Sonnet 4'ü 22 Mayıs 2025 itibarıyla resmen duyurdu ve bu gelişme, yapay zekâ yeteneklerinde önemli bir ilerlemeye işaret ediyor.
Claude Opus 4, Anthropic'in amiral gemisi modeli olarak konumlandırılıyor ve şirket tarafından "dünyanın en iyi kodlama modeli" olarak nitelendiriliyor. SWE-bench'te %72,5 ve Terminal-bench'te %43,2 puan alarak, binlerce adım gerektiren uzun soluklu görevlerde sürekli yüksek performans sergiliyor. Model, birkaç saat boyunca kesintisiz çalışabiliyor ve önceki Sonnet modellerine kıyasla çok daha iyi sonuçlar elde ederek yapay zekâ ajanlarının başarabileceklerini genişletiyor.
Claude Sonnet 4 ise, Claude Sonnet 3.7'ye kıyasla önemli bir yükseltme sunuyor; daha üstün kodlama ve akıl yürütme yetenekleriyle talimatlara daha hassas yanıtlar veriyor. Dikkat çekici bir şekilde, SWE-bench'te %72,7 başarıya ulaşırken, paralel test zamanı hesaplama ile %80,2 doğruluk oranına erişiyor—bu da daha büyük olan Opus 4 modelinden daha iyi kodlama performansı anlamına geliyor. Anthropic, bu modeli "iç ve dış kullanım senaryoları için performans ve verimlilik dengesine sahip, uygulamalar üzerinde daha fazla kontrol için geliştirilmiş yönlendirilebilirlik sunan" bir seçenek olarak tanımlıyor.
Her iki model de, araç kullanımıyla genişletilmiş düşünme yeteneği dahil olmak üzere güçlü yeni özellikler sunuyor; Claude, yanıtlarını iyileştirmek için akıl yürütme ve araç kullanımı arasında geçiş yapabiliyor. Araçları paralel olarak kullanabiliyor, talimatları daha hassas şekilde takip edebiliyor ve geliştiriciler tarafından yerel dosyalara erişim izni verildiğinde, önemli bilgileri çıkarıp kaydederek zaman içinde sürekliliği koruyup örtük bilgi oluşturma konusunda belirgin şekilde gelişmiş hafıza yetenekleri sergiliyor.
Modeller, "hafıza"ya bilgi kaydedip çıkararak görevleri daha güvenilir şekilde yerine getirebiliyor ve Anthropic'in "örtük bilgi" olarak tanımladığı birikimli bilgi tabanı oluşturabiliyor. Hem Opus 4 hem de Sonnet 4, anlık yanıtlar ile derinlemesine akıl yürütme için uzun süreli düşünme arasında geçiş yapabilen "hibrit" modeller. Akıl yürütme modu etkinleştirildiğinde, yanıt vermeden önce olası çözümleri daha uzun süre değerlendirebiliyor ve düşünce süreçlerinin "kullanıcı dostu" bir özetini sunabiliyorlar.
Her iki model de Anthropic API, Amazon Bedrock ve Google Cloud'un Vertex AI platformlarında erişilebilir durumda. Fiyatlandırma, önceki Opus ve Sonnet modelleriyle aynı şekilde devam ediyor: Opus 4 için milyon token başına $15/$75 (girdi/çıktı), Sonnet 4 için ise $3/$15. Bireysel kullanıcılar için Anthropic, kademeli abonelik planları sunuyor. Ücretsiz plan, günlük kullanım limitleriyle Claude Sonnet 4'e erişim sağlarken, Pro plan ($20/ay veya $200/yıl), ücretsiz plana göre yaklaşık beş kat daha fazla kullanım, model seçiciyle hem Claude 4 Sonnet hem de Claude 4 Opus'a erişim ve yoğun dönemlerde öncelikli erişim imkânı sunuyor.
Claude 4'ün piyasaya sürülmesi, büyük dil modellerinde yeni bir dönemin başlangıcına işaret ediyor. Bu modeller; 200.000 token'lık bağlam penceresi, alanında lider kodlama ve akıl yürütme performansı ile karmaşık, yüksek riskli ve sürekli değişen gerçek dünya senaryoları için tasarlanmış sağlam bir güvenlik çerçevesiyle kurumsal, araştırma ve yaratıcı uygulamalarda mümkün olanın sınırlarını genişletiyor.