menu
close

Anthropic представи Claude 4: Нови стандарти в AI програмирането

Anthropic наскоро пусна Claude Opus 4 и Claude Sonnet 4, които поставят нови стандарти в AI програмирането и способностите за логическо мислене. Claude Opus 4 оглавява индустриалните бенчмаркове с 72.5% на SWE-bench, докато Sonnet 4 предлага висока производителност на по-достъпна цена. И двата модела разполагат с хибридно мислене, позволяващо им да редуват мигновени отговори с разширено разсъждение и интеграция на инструменти, което значително подобрява способността им да се справят със сложни, многоетапни задачи.
Anthropic представи Claude 4: Нови стандарти в AI програмирането

Anthropic официално представи своите нови AI модели от следващо поколение – Claude Opus 4 и Claude Sonnet 4, отбелязвайки значителен напредък в изкуствения интелект към 22 май 2025 г.

Claude Opus 4, позициониран като флагманския модел на Anthropic, беше наречен от компанията „най-добрият програмен модел в света“. Той води на SWE-bench с резултат 72.5% и на Terminal-bench с 43.2%, като осигурява стабилна производителност при дълготрайни задачи, изискващи фокусирани усилия през хиляди стъпки. Моделът може да работи непрекъснато в продължение на няколко часа, значително надминавайки предишните Sonnet модели и разширявайки възможностите на AI агентите.

Claude Sonnet 4 представлява значително надграждане спрямо Claude Sonnet 3.7, осигурявайки по-добро програмиране и логическо мислене, като същевременно реагира по-прецизно на инструкции. Интересното е, че той постига 72.7% на SWE-bench, а при паралелна изчислителна мощност по време на тестове достига 80.2% точност – осигурявайки по-добра производителност в програмирането от по-големия Opus 4 модел. Anthropic го описва като балансиращ „производителност и ефективност за вътрешни и външни приложения, с подобрена управляемост за по-голям контрол върху изпълнението“.

И двата модела въвеждат мощни нови възможности, включително разширено мислене с използване на инструменти, което позволява на Claude да редува разсъждение и използване на инструменти за подобряване на отговорите. Те могат да използват инструменти паралелно, да следват инструкции по-прецизно и – когато разработчиците им предоставят достъп до локални файлове – демонстрират значително подобрени възможности за памет, извличайки и съхранявайки ключови факти за поддържане на последователност и изграждане на неявни знания с времето.

Моделите могат да извличат и съхраняват факти в „паметта“ си, за да изпълняват задачи по-надеждно, изграждайки това, което Anthropic нарича „неявни знания“ с течение на времето. И Opus 4, и Sonnet 4 са „хибридни“ модели, способни както на почти мигновени отговори, така и на разширено мислене за по-дълбоко разсъждение. С включен режим на разсъждение, те могат да отделят повече време за обмисляне на възможни решения преди отговор, като показват „удобно за потребителя“ резюме на мисловния си процес.

И двата модела са налични чрез API на Anthropic, Amazon Bedrock и Vertex AI на Google Cloud. Цените остават същите като при предишните Opus и Sonnet модели: Opus 4 – $15/$75 на милион токени (вход/изход), а Sonnet 4 – $3/$15.

За индивидуални потребители Anthropic предлага абонаментни планове на нива. Безплатният план осигурява достъп до Claude Sonnet 4 с дневни лимити на използване, докато Pro планът ($20/месец или $200/година) предлага приблизително пет пъти повече използване от безплатния план, достъп до Claude 4 Sonnet и Claude 4 Opus чрез избор на модел, както и приоритетен достъп при натоварени периоди.

Пускането на Claude 4 бележи нова ера в големите езикови модели. Тези предложения представляват скок във възможностите за предприятия, научни изследвания и творчески приложения – с контекстен прозорец от 200 000 токена, водещи бенчмаркове в програмирането и логическото мислене и стабилна рамка за сигурност, проектирана за сложни, рискови и динамично променящи се реални сценарии.

Source:

Latest News