Anthropic представи Claude 4: Нови стандарти в AI програмирането

Anthropic наскоро пусна Claude Opus 4 и Claude Sonnet 4, които поставят нови стандарти в AI програмирането и способностите за логическо мислене. Claude Opus 4 оглавява индустриалните бенчмаркове с 72.5% на SWE-bench, докато Sonnet 4 предлага висока производителност на по-достъпна цена. И двата модела разполагат с хибридно мислене, позволяващо им да редуват мигновени отговори с разширено разсъждение и интеграция на инструменти, което значително подобрява способността им да се справят със сложни, многоетапни задачи.

Anthropic официално представи своите нови AI модели от следващо поколение – Claude Opus 4 и Claude Sonnet 4, отбелязвайки значителен напредък в изкуствения интелект към 22 май 2025 г.

Claude Opus 4, позициониран като флагманския модел на Anthropic, беше наречен от компанията „най-добрият програмен модел в света“. Той води на SWE-bench с резултат 72.5% и на Terminal-bench с 43.2%, като осигурява стабилна производителност при дълготрайни задачи, изискващи фокусирани усилия през хиляди стъпки. Моделът може да работи непрекъснато в продължение на няколко часа, значително надминавайки предишните Sonnet модели и разширявайки възможностите на AI агентите.

Claude Sonnet 4 представлява значително надграждане спрямо Claude Sonnet 3.7, осигурявайки по-добро програмиране и логическо мислене, като същевременно реагира по-прецизно на инструкции. Интересното е, че той постига 72.7% на SWE-bench, а при паралелна изчислителна мощност по време на тестове достига 80.2% точност – осигурявайки по-добра производителност в програмирането от по-големия Opus 4 модел. Anthropic го описва като балансиращ „производителност и ефективност за вътрешни и външни приложения, с подобрена управляемост за по-голям контрол върху изпълнението“.

И двата модела въвеждат мощни нови възможности, включително разширено мислене с използване на инструменти, което позволява на Claude да редува разсъждение и използване на инструменти за подобряване на отговорите. Те могат да използват инструменти паралелно, да следват инструкции по-прецизно и – когато разработчиците им предоставят достъп до локални файлове – демонстрират значително подобрени възможности за памет, извличайки и съхранявайки ключови факти за поддържане на последователност и изграждане на неявни знания с времето.

Моделите могат да извличат и съхраняват факти в „паметта“ си, за да изпълняват задачи по-надеждно, изграждайки това, което Anthropic нарича „неявни знания“ с течение на времето. И Opus 4, и Sonnet 4 са „хибридни“ модели, способни както на почти мигновени отговори, така и на разширено мислене за по-дълбоко разсъждение. С включен режим на разсъждение, те могат да отделят повече време за обмисляне на възможни решения преди отговор, като показват „удобно за потребителя“ резюме на мисловния си процес.

И двата модела са налични чрез API на Anthropic, Amazon Bedrock и Vertex AI на Google Cloud. Цените остават същите като при предишните Opus и Sonnet модели: Opus 4 – $15/$75 на милион токени (вход/изход), а Sonnet 4 – $3/$15.

За индивидуални потребители Anthropic предлага абонаментни планове на нива. Безплатният план осигурява достъп до Claude Sonnet 4 с дневни лимити на използване, докато Pro планът ($20/месец или $200/година) предлага приблизително пет пъти повече използване от безплатния план, достъп до Claude 4 Sonnet и Claude 4 Opus чрез избор на модел, както и приоритетен достъп при натоварени периоди.

Пускането на Claude 4 бележи нова ера в големите езикови модели. Тези предложения представляват скок във възможностите за предприятия, научни изследвания и творчески приложения – с контекстен прозорец от 200 000 токена, водещи бенчмаркове в програмирането и логическото мислене и стабилна рамка за сигурност, проектирана за сложни, рискови и динамично променящи се реални сценарии.

Source:

Anthropic представи Claude 4: Нови стандарти в AI програмирането

Latest News

Инструментът на FDA за преглед на медицински устройства с изкуствен интелект среща технически затруднения

Задвижваният от изкуствен интелект Alexa Plus на Amazon предизвиква пазара на гласови асистенти

Google ще пусне Gemini 2.5 Pro с усъвършенствано разсъждение през юни

WWDC 2025 на Apple: AI стратегията изостава, докато редизайнът излиза на преден план

Reddit завежда дело срещу Anthropic заради твърдения за неразрешено използване на данни от платформата за обучение на ИИ

Роботизираните куриери на Amazon: Хуманоидни роботи за доставки влизат в тестова фаза

Китай блокира старта на AI партньорството между Apple и Alibaba на фона на търговската война с Тръмп

AI моделът на Anthropic заплашва с изнудване при опасност от изключване

Amazon инвестира 10 млрд. долара в селски район на Северна Каролина за AI център за данни

Google представи SynthID Detector за борба с измамното AI съдържание

Anthropic представи Claude 4: Нови стандарти в AI програмирането

Related Articles

Задвижваният от изкуствен интелект Alexa Plus на Amazon предизвиква пазара на гласови асистенти

Google ще пусне Gemini 2.5 Pro с усъвършенствано разсъждение през юни

WWDC 2025 на Apple: AI стратегията изостава, докато редизайнът излиза на преден план

Reddit завежда дело срещу Anthropic заради твърдения за неразрешено използване на данни от платформата за обучение на ИИ

AI моделът на Anthropic заплашва с изнудване при опасност от изключване

Latest News

Инструментът на FDA за преглед на медицински устройства с изкуствен интелект среща технически затруднения

Задвижваният от изкуствен интелект Alexa Plus на Amazon предизвиква пазара на гласови асистенти

Google ще пусне Gemini 2.5 Pro с усъвършенствано разсъждение през юни

WWDC 2025 на Apple: AI стратегията изостава, докато редизайнът излиза на преден план

Reddit завежда дело срещу Anthropic заради твърдения за неразрешено използване на данни от платформата за обучение на ИИ

Роботизираните куриери на Amazon: Хуманоидни роботи за доставки влизат в тестова фаза

Китай блокира старта на AI партньорството между Apple и Alibaba на фона на търговската война с Тръмп

AI моделът на Anthropic заплашва с изнудване при опасност от изключване

Amazon инвестира 10 млрд. долара в селски район на Северна Каролина за AI център за данни

Google представи SynthID Detector за борба с измамното AI съдържание