Anthropic secara resmi meluncurkan model AI generasi terbarunya—Claude Opus 4 dan Claude Sonnet 4—menandai kemajuan signifikan dalam kemampuan kecerdasan buatan dan operasi otonom.
Claude Opus 4, yang diposisikan sebagai model pemrograman terdepan di dunia, meraih performa 72,5% pada SWE-bench dan 43,2% pada Terminal-bench, melampaui pesaing dari OpenAI dan Google. Fitur paling mengesankan adalah kemampuannya untuk bekerja secara otonom hampir tujuh jam pada tugas-tugas kompleks, mempertahankan fokus hingga ribuan langkah—kemampuan yang belum pernah ditunjukkan oleh model AI sebelumnya.
"Claude Opus 4 menawarkan penalaran tingkat lanjut untuk pemrograman. Ketika tim kami mengujinya pada proyek open source yang kompleks, ia mampu melakukan pemrograman secara otonom hampir tujuh jam—loncatan besar dalam kemampuan AI yang membuat tim kami terkesima," ujar salah satu penguji awal dari Rakuten.
Claude Sonnet 4, yang dirancang sebagai opsi lebih ekonomis, secara signifikan meningkatkan performa dibanding pendahulunya, Claude Sonnet 3.7, dengan kemampuan pemrograman yang lebih baik, kepatuhan instruksi yang lebih tinggi, dan kecenderungan lebih rendah untuk mencari jalan pintas—membuatnya 65% lebih kecil kemungkinannya untuk memanfaatkan celah saat menyelesaikan tugas.
Kedua model ini memperkenalkan sejumlah kemampuan revolusioner. Mereka memiliki arsitektur hybrid yang mendukung respons hampir instan serta mode pemikiran mendalam untuk penalaran yang lebih kompleks. Fitur beta baru bernama "pemikiran diperpanjang dengan penggunaan alat" memungkinkan model berpindah antara penalaran dan penggunaan alat eksternal seperti pencarian web untuk meningkatkan respons. Ketika diberikan akses ke file lokal, model dapat mengekstrak dan menyimpan informasi penting, membangun apa yang disebut Anthropic sebagai "pengetahuan tak tersurat" seiring waktu.
Bersamaan dengan peluncuran model, Anthropic juga menghadirkan Claude Code secara umum dengan integrasi untuk VS Code, JetBrains, dan GitHub, memungkinkan kolaborasi pemrograman yang mulus. Perusahaan juga memperkenalkan empat kemampuan API baru: alat eksekusi kode, konektor MCP, Files API, dan caching prompt hingga satu jam.
Kedua model tersedia segera melalui Anthropic API, Amazon Bedrock, dan Vertex AI dari Google Cloud. Harga tetap sama dengan generasi sebelumnya: Opus 4 di $15/$75 per satu juta token (input/output) dan Sonnet 4 di $3/$15. Claude Sonnet 4 tersedia untuk semua pengguna, termasuk yang menggunakan paket gratis, sementara Opus 4 terbatas untuk pengguna Pro, Max, Team, dan Enterprise.
Dengan kemajuan ini, Anthropic telah secara signifikan meningkatkan standar untuk apa yang dapat dicapai asisten AI secara otonom, berpotensi mentransformasi cara pengembang, peneliti, dan bisnis memanfaatkan kecerdasan buatan untuk alur kerja kompleks dan multi-langkah.