Anthropic офіційно представила свої новітні моделі штучного інтелекту — Claude Opus 4 та Claude Sonnet 4, що знаменує суттєвий прорив у можливостях ШІ та автономній роботі.
Claude Opus 4, позиціонований як провідна у світі модель для програмування, досягає 72,5% продуктивності на SWE-bench і 43,2% на Terminal-bench, випереджаючи конкурентів від OpenAI та Google. Його найвражаюча особливість — здатність автономно працювати майже сім годин над складними завданнями, зберігаючи концентрацію протягом тисяч кроків — такої можливості не демонструвала жодна попередня модель ШІ.
«Claude Opus 4 пропонує справді просунуту логіку для програмування. Коли наша команда застосувала його до складного open source проєкту, він автономно кодував майже сім годин — це величезний стрибок у можливостях ШІ, який вразив команду», — зазначив один із перших тестувальників з Rakuten.
Claude Sonnet 4, створений як більш економічний варіант, значно перевершує попередника Claude Sonnet 3.7 завдяки покращеним навичкам програмування, кращому виконанню інструкцій і зменшеній схильності до використання «шпарин» — тепер він на 65% рідше використовує лазівки під час виконання завдань.
Обидві моделі впроваджують низку революційних можливостей. Вони мають гібридну архітектуру, що забезпечує як майже миттєві відповіді, так і розширені режими мислення для глибшого аналізу. Нова бета-функція «розширене мислення з використанням інструментів» дозволяє моделям чергувати логічні міркування та використання зовнішніх інструментів, таких як веб-пошук, для покращення відповідей. При доступі до локальних файлів моделі можуть витягати та зберігати ключову інформацію, поступово формуючи так звані «неявні знання».
Разом із моделями Anthropic зробила Claude Code загальнодоступним з інтеграціями для VS Code, JetBrains і GitHub, що забезпечує зручне парне програмування. Компанія також представила чотири нові можливості API: інструмент виконання коду, конектор MCP, API для роботи з файлами та кешування підказок до однієї години.
Обидві моделі вже доступні через Anthropic API, Amazon Bedrock та Vertex AI від Google Cloud. Вартість залишилася незмінною: Opus 4 — $15/$75 за мільйон токенів (вхід/вихід), Sonnet 4 — $3/$15. Claude Sonnet 4 доступний усім користувачам, включаючи безкоштовні плани, тоді як Opus 4 — лише для користувачів Pro, Max, Team та Enterprise.
Завдяки цим нововведенням Anthropic суттєво підвищила планку автономності ШІ-асистентів, що потенційно змінить підхід розробників, дослідників і бізнесу до використання штучного інтелекту у складних багатокрокових робочих процесах.