Anthropic представи следващото поколение AI модели – Claude Opus 4 и Claude Sonnet 4 – по време на конференцията за разработчици 'Code with Claude 2025' на 22 май. Тези модели са най-значимият технологичен напредък на компанията досега, особено в областта на софтуерното инженерство и автономните агенти.
Claude Opus 4, определян като „най-добрият модел за програмиране в света“, постигна резултат от 72,5% на бенчмарка SWE-bench, изпреварвайки GPT-4.1 на OpenAI (54,6%) и Gemini 2.5 Pro на Google. При тестове в Rakuten, Opus 4 демонстрира способност да програмира автономно почти седем часа – огромен скок спрямо минутните концентрации на предишни AI модели.
И двата модела разполагат с хибридни системи за разсъждение, позволяващи както почти мигновени отговори, така и разширено, поетапно мислене. Те могат да използват множество инструменти паралелно, включително уеб търсене, а при достъп до локални файлове извличат и съхраняват ключова информация, изграждайки т.нар. „неявно знание“ с течение на времето.
Claude Sonnet 4, който надгражда Sonnet 3.7 от февруари, предлага подобрени възможности за решаване на проблеми и по-добро следване на инструкции. Той е достъпен за всички потребители на Claude, включително безплатния слой, докато Opus 4 е ограничен до плановете Pro, Max, Team и Enterprise.
Пускането на новите модели съвпада с бързия растеж на Anthropic – годишните приходи се удвояват до 2 милиарда долара през първото тримесечие на 2025 г., а клиентите, харчещи над 100 000 долара годишно, са се увеличили осемкратно. Компанията наскоро осигури кредитна линия от 2,5 милиарда долара за ускоряване на AI разработките си.
Въпреки техническите постижения, Anthropic въвежда строги мерки за безопасност за Claude Opus 4, класифицирайки го под протокола за AI безопасност – Ниво 3 (ASL-3), след като вътрешни тестове разкриват потенциални рискове. И двата модела са достъпни чрез API на Anthropic, Amazon Bedrock и Vertex AI на Google Cloud, като цените са $15/$75 на милион токени за Opus 4 и $3/$15 за Sonnet 4.