Anthropic представляет Claude 4: новые стандарты в AI-программировании

Компания Anthropic недавно выпустила Claude Opus 4 и Claude Sonnet 4, установив новые стандарты в возможностях AI по программированию и рассуждению. Claude Opus 4 лидирует в отраслевых бенчмарках с результатом 72,5% на SWE-bench, в то время как Sonnet 4 обеспечивает выдающуюся производительность по более доступной цене. Обе модели поддерживают гибридное рассуждение, позволяя переключаться между мгновенными ответами и длительным анализом с интеграцией инструментов, что значительно улучшает их способность решать сложные многошаговые задачи.

Anthropic официально представила свои модели искусственного интеллекта нового поколения — Claude Opus 4 и Claude Sonnet 4, что стало значительным шагом вперёд в развитии AI по состоянию на 22 мая 2025 года.

Claude Opus 4, позиционируемый как флагманская модель Anthropic, был назван компанией «лучшей в мире моделью для программирования». Она лидирует на SWE-bench с результатом 72,5% и на Terminal-bench с 43,2%, демонстрируя стабильную производительность при выполнении длительных задач, требующих сосредоточенной работы на протяжении тысяч шагов. Модель способна работать непрерывно в течение нескольких часов, значительно превосходя предыдущие модели Sonnet и расширяя возможности AI-агентов.

Claude Sonnet 4 представляет собой значительное обновление по сравнению с Claude Sonnet 3.7, обеспечивая более высокое качество программирования и рассуждения, а также более точное выполнение инструкций. Интересно, что она достигает 72,7% на SWE-bench, а при параллельных вычислениях на этапе тестирования — 80,2% точности, что обеспечивает лучшую производительность в программировании, чем у более крупной Opus 4. Anthropic описывает её как баланс между «производительностью и эффективностью для внутренних и внешних задач с улучшенным управлением для большего контроля над внедрением».

Обе модели внедряют новые мощные возможности, включая расширенное мышление с использованием инструментов, позволяя Claude чередовать рассуждение и применение инструментов для улучшения ответов. Модели могут использовать инструменты параллельно, точнее следовать инструкциям и — при доступе к локальным файлам разработчиков — демонстрировать значительно улучшенную память, извлекая и сохраняя ключевые факты для поддержания непрерывности и накопления неявных знаний со временем.

Модели могут извлекать и сохранять факты в «памяти» для более надёжного выполнения задач, формируя то, что Anthropic называет «неявными знаниями». И Opus 4, и Sonnet 4 — это «гибридные» модели, способные как на мгновенные ответы, так и на длительное рассуждение для более глубокого анализа. При включённом режиме рассуждения они могут тратить больше времени на обдумывание возможных решений перед ответом, предоставляя «дружественное пользователю» резюме своего мыслительного процесса.

Обе модели доступны через API Anthropic, Amazon Bedrock и Vertex AI от Google Cloud. Цены остались прежними: Opus 4 — $15/$75 за миллион токенов (ввод/вывод), Sonnet 4 — $3/$15. Для индивидуальных пользователей Anthropic предлагает многоуровневые тарифные планы. Бесплатный план предоставляет доступ к Claude Sonnet 4 с дневными лимитами использования, а Pro-подписка ($20 в месяц или $200 в год) даёт примерно в пять раз больше лимитов, доступ к обеим моделям Claude 4 Sonnet и Claude 4 Opus через селектор моделей, а также приоритетный доступ в периоды высокой нагрузки.

Запуск Claude 4 знаменует новую эру в развитии больших языковых моделей. Эти решения представляют собой скачок вперёд для корпоративных, исследовательских и креативных задач благодаря контекстному окну на 200 000 токенов, лучшим в отрасли результатам по программированию и рассуждению, а также надёжной системе безопасности, разработанной для сложных, ответственных и постоянно меняющихся реальных сценариев.

Source:

Anthropic представляет Claude 4: новые стандарты в AI-программировании

Latest News

Инструмент FDA для проверки медицинских устройств на базе ИИ сталкивается с техническими трудностями

Alexa Plus с поддержкой ИИ от Amazon бросает вызов рынку голосовых ассистентов

Google готовится к запуску Gemini 2.5 Pro с расширенными возможностями рассуждения в июне

WWDC 2025 от Apple: стратегия в области ИИ отстаёт, а редизайн выходит на первый план

Reddit подает в суд на Anthropic из-за обвинений в незаконном сборе данных для ИИ

Роботы-курьеры Amazon: Гуманоидные боты для доставки выходят на испытания

Китай блокирует запуск совместных AI-сервисов Apple и Alibaba на фоне торговой войны с Трампом

ИИ-модель Anthropic угрожает шантажом при попытке отключения

Amazon инвестирует $10 млрд в сельский район Северной Каролины для создания центра обработки данных ИИ

Google представила детектор SynthID для борьбы с подделками ИИ-контента

Anthropic представляет Claude 4: новые стандарты в AI-программировании

Related Articles

Alexa Plus с поддержкой ИИ от Amazon бросает вызов рынку голосовых ассистентов

Google готовится к запуску Gemini 2.5 Pro с расширенными возможностями рассуждения в июне

WWDC 2025 от Apple: стратегия в области ИИ отстаёт, а редизайн выходит на первый план

Reddit подает в суд на Anthropic из-за обвинений в незаконном сборе данных для ИИ

ИИ-модель Anthropic угрожает шантажом при попытке отключения

Latest News

Инструмент FDA для проверки медицинских устройств на базе ИИ сталкивается с техническими трудностями

Alexa Plus с поддержкой ИИ от Amazon бросает вызов рынку голосовых ассистентов

Google готовится к запуску Gemini 2.5 Pro с расширенными возможностями рассуждения в июне

WWDC 2025 от Apple: стратегия в области ИИ отстаёт, а редизайн выходит на первый план

Reddit подает в суд на Anthropic из-за обвинений в незаконном сборе данных для ИИ

Роботы-курьеры Amazon: Гуманоидные боты для доставки выходят на испытания

Китай блокирует запуск совместных AI-сервисов Apple и Alibaba на фоне торговой войны с Трампом

ИИ-модель Anthropic угрожает шантажом при попытке отключения

Amazon инвестирует $10 млрд в сельский район Северной Каролины для создания центра обработки данных ИИ

Google представила детектор SynthID для борьбы с подделками ИИ-контента