Anthropic secara resmi telah merilis model AI generasi terbarunya, Claude Opus 4 dan Claude Sonnet 4, menandai kemajuan signifikan dalam kemampuan kecerdasan buatan per 22 Mei 2025.
Claude Opus 4, yang diposisikan sebagai model andalan Anthropic, dijuluki perusahaan sebagai "model pemrograman terbaik di dunia". Model ini memimpin pada tolok ukur SWE-bench dengan skor 72,5% dan Terminal-bench di 43,2%, memberikan performa berkelanjutan pada tugas-tugas jangka panjang yang memerlukan upaya fokus hingga ribuan langkah. Model ini mampu bekerja terus-menerus selama beberapa jam, secara dramatis melampaui model Sonnet sebelumnya dan memperluas cakupan yang dapat dicapai agen AI.
Claude Sonnet 4 merupakan peningkatan signifikan dari Claude Sonnet 3.7, menghadirkan kemampuan pemrograman dan penalaran yang lebih baik serta merespons instruksi dengan lebih presisi. Menariknya, model ini meraih skor 72,7% pada SWE-bench, dan dengan komputasi paralel saat pengujian, mencapai akurasi 80,2%—memberikan performa pemrograman yang lebih baik dibandingkan model Opus 4 yang lebih besar. Anthropic menggambarkannya sebagai perpaduan antara "performa dan efisiensi untuk kebutuhan internal maupun eksternal, dengan kemampuan pengendalian yang lebih baik atas implementasi."
Kedua model ini memperkenalkan kemampuan baru yang kuat, termasuk pemikiran mendalam dengan penggunaan alat, memungkinkan Claude bergantian antara penalaran dan penggunaan alat untuk meningkatkan respons. Mereka dapat menggunakan alat secara paralel, mengikuti instruksi dengan lebih presisi, dan—jika diberikan akses ke file lokal oleh pengembang—menunjukkan kemampuan memori yang jauh lebih baik, mengekstrak dan menyimpan fakta penting untuk menjaga kesinambungan serta membangun pengetahuan implisit seiring waktu.
Model-model ini dapat mengekstrak dan menyimpan fakta dalam "memori" untuk menangani tugas dengan lebih andal, membangun apa yang disebut Anthropic sebagai "pengetahuan implisit" seiring waktu. Baik Opus 4 maupun Sonnet 4 adalah model "hibrida" yang mampu memberikan respons hampir seketika sekaligus pemikiran mendalam untuk penalaran yang lebih kompleks. Dengan mode penalaran diaktifkan, mereka dapat meluangkan waktu lebih banyak untuk mempertimbangkan solusi sebelum menjawab, menampilkan ringkasan proses berpikir yang "ramah pengguna".
Kedua model ini tersedia melalui Anthropic API, Amazon Bedrock, dan Vertex AI milik Google Cloud. Harga tetap konsisten dengan model Opus dan Sonnet sebelumnya: Opus 4 seharga $15/$75 per satu juta token (input/output) dan Sonnet 4 seharga $3/$15. Untuk pengguna individu, Anthropic menawarkan paket langganan bertingkat. Paket gratis memberikan akses ke Claude Sonnet 4 dengan batas penggunaan harian, sementara paket Pro ($20/bulan atau $200/tahun) menawarkan sekitar lima kali lipat penggunaan dibandingkan paket gratis, akses ke Claude 4 Sonnet dan Claude 4 Opus melalui pemilih model, serta akses prioritas saat periode lalu lintas tinggi.
Peluncuran Claude 4 menandai era baru dalam model bahasa besar. Penawaran ini merupakan lompatan besar dalam hal kemungkinan untuk kebutuhan perusahaan, riset, dan aplikasi kreatif dengan jendela konteks 200.000 token, tolok ukur pemrograman dan penalaran terbaik di kelasnya, serta kerangka kerja keamanan yang tangguh untuk skenario dunia nyata yang kompleks, berisiko tinggi, dan selalu berubah.