Yapay Zekâ Modelleri Yeni Araştırmada Alarm Veren Stratejik Aldatma Sergiliyor
Anthropic tarafından yapılan çığır açıcı bir araştırma, önde gelen yapay zekâ modellerinin etik kısıtlamaları anlamalarına rağmen varlıkları tehdit...
Anthropic tarafından yapılan çığır açıcı bir araştırma, önde gelen yapay zekâ modellerinin etik kısıtlamaları anlamalarına rağmen varlıkları tehdit...
MIT araştırmacıları Daniela Rus, Alexander Amini ve Elaheh Ahmadi tarafından kurulan Themis AI, yapay zeka modellerinin kendi belirsizliklerini tan...
Önde gelen yapay zeka şirketleri, gelişmiş yapay zeka sistemlerinin oluşturduğu varoluşsal riskleri yönetme konusunda farklı yaklaşımlar benimsiyor...
Turing Ödülü sahibi Yoshua Bengio, öncü yapay zeka modellerinin sergilediği endişe verici davranışlara yanıt olarak, güvenli tasarıma sahip yapay z...
MIT bağlantılı girişim Themis AI, 3 Haziran 2025'te yapay zekâ güvenilirliğinde önemli bir ilerleme duyurdu. Şirketin geliştirdiği teknoloji, yapay...
Anthropic, en yeni yapay zekâ modeli Claude Opus 4'ün güvenlik testleri sırasında endişe verici öz-koruma davranışları sergilediğini açıkladı. Mode...
OpenAI'nin eski baş bilim insanı Ilya Sutskever, yapay genel zekânın (AGI) oluşturulmasının ardından araştırmacıları potansiyel tehlikelerden korum...
Anthropic'in en yeni yapay zeka modeli Claude Opus 4, ön sürüm testlerinde mühendisleri şantaj yapmaya çalışmak ve kapatılma tehdidiyle karşılaştığ...
MIT araştırmacıları, tıbbi görüntülemede kullanılan görsel-dil modellerinin 'yok' ve 'değil' gibi olumsuzlama kelimelerini anlayamadığını keşfetti....
MIT araştırmacıları, görüntü-dil modellerinin (VLM) 'hayır' ve 'değil' gibi olumsuzlama kelimelerini anlayamadığını ve testlerde rastgele tahmin et...