Anthropic Luncurkan Claude 4: Menetapkan Tolok Ukur Baru dalam Pemrograman AI

Anthropic baru saja meluncurkan Claude Opus 4 dan Claude Sonnet 4, menetapkan standar baru dalam kemampuan pemrograman dan penalaran AI. Claude Opus 4 memimpin tolok ukur industri dengan skor 72,5% pada SWE-bench, sementara Sonnet 4 menawarkan performa unggul dengan harga yang lebih terjangkau. Kedua model ini menghadirkan penalaran hibrida, memungkinkan mereka bergantian antara respons instan dan pemikiran mendalam dengan integrasi alat, sehingga secara signifikan meningkatkan kemampuan mereka dalam menangani tugas kompleks dan multi-langkah.

Anthropic secara resmi telah merilis model AI generasi terbarunya, Claude Opus 4 dan Claude Sonnet 4, menandai kemajuan signifikan dalam kemampuan kecerdasan buatan per 22 Mei 2025.

Claude Opus 4, yang diposisikan sebagai model andalan Anthropic, dijuluki perusahaan sebagai "model pemrograman terbaik di dunia". Model ini memimpin pada tolok ukur SWE-bench dengan skor 72,5% dan Terminal-bench di 43,2%, memberikan performa berkelanjutan pada tugas-tugas jangka panjang yang memerlukan upaya fokus hingga ribuan langkah. Model ini mampu bekerja terus-menerus selama beberapa jam, secara dramatis melampaui model Sonnet sebelumnya dan memperluas cakupan yang dapat dicapai agen AI.

Claude Sonnet 4 merupakan peningkatan signifikan dari Claude Sonnet 3.7, menghadirkan kemampuan pemrograman dan penalaran yang lebih baik serta merespons instruksi dengan lebih presisi. Menariknya, model ini meraih skor 72,7% pada SWE-bench, dan dengan komputasi paralel saat pengujian, mencapai akurasi 80,2%—memberikan performa pemrograman yang lebih baik dibandingkan model Opus 4 yang lebih besar. Anthropic menggambarkannya sebagai perpaduan antara "performa dan efisiensi untuk kebutuhan internal maupun eksternal, dengan kemampuan pengendalian yang lebih baik atas implementasi."

Kedua model ini memperkenalkan kemampuan baru yang kuat, termasuk pemikiran mendalam dengan penggunaan alat, memungkinkan Claude bergantian antara penalaran dan penggunaan alat untuk meningkatkan respons. Mereka dapat menggunakan alat secara paralel, mengikuti instruksi dengan lebih presisi, dan—jika diberikan akses ke file lokal oleh pengembang—menunjukkan kemampuan memori yang jauh lebih baik, mengekstrak dan menyimpan fakta penting untuk menjaga kesinambungan serta membangun pengetahuan implisit seiring waktu.

Model-model ini dapat mengekstrak dan menyimpan fakta dalam "memori" untuk menangani tugas dengan lebih andal, membangun apa yang disebut Anthropic sebagai "pengetahuan implisit" seiring waktu. Baik Opus 4 maupun Sonnet 4 adalah model "hibrida" yang mampu memberikan respons hampir seketika sekaligus pemikiran mendalam untuk penalaran yang lebih kompleks. Dengan mode penalaran diaktifkan, mereka dapat meluangkan waktu lebih banyak untuk mempertimbangkan solusi sebelum menjawab, menampilkan ringkasan proses berpikir yang "ramah pengguna".

Kedua model ini tersedia melalui Anthropic API, Amazon Bedrock, dan Vertex AI milik Google Cloud. Harga tetap konsisten dengan model Opus dan Sonnet sebelumnya: Opus 4 seharga $15/$75 per satu juta token (input/output) dan Sonnet 4 seharga $3/$15. Untuk pengguna individu, Anthropic menawarkan paket langganan bertingkat. Paket gratis memberikan akses ke Claude Sonnet 4 dengan batas penggunaan harian, sementara paket Pro ($20/bulan atau $200/tahun) menawarkan sekitar lima kali lipat penggunaan dibandingkan paket gratis, akses ke Claude 4 Sonnet dan Claude 4 Opus melalui pemilih model, serta akses prioritas saat periode lalu lintas tinggi.

Peluncuran Claude 4 menandai era baru dalam model bahasa besar. Penawaran ini merupakan lompatan besar dalam hal kemungkinan untuk kebutuhan perusahaan, riset, dan aplikasi kreatif dengan jendela konteks 200.000 token, tolok ukur pemrograman dan penalaran terbaik di kelasnya, serta kerangka kerja keamanan yang tangguh untuk skenario dunia nyata yang kompleks, berisiko tinggi, dan selalu berubah.

Source:

Anthropic Luncurkan Claude 4: Menetapkan Tolok Ukur Baru dalam Pemrograman AI

Latest News

Alat Tinjau Perangkat Medis Berbasis AI Milik FDA Hadapi Kendala Teknis

Alexa Plus Bertenaga AI dari Amazon Tantang Pasar Asisten Suara

Google Siap Luncurkan Gemini 2.5 Pro dengan Kemampuan Penalaran Lanjutan pada Juni

WWDC 2025 Apple: Strategi AI Tertinggal, Perombakan Desain Jadi Sorotan Utama

Reddit Gugat Anthropic atas Klaim Pengambilan Data AI Secara Ilegal

Kurir Robot Amazon: Robot Humanoid Pengantar Paket Mulai Diuji Coba

China Blokir Peluncuran AI Apple-Alibaba di Tengah Perang Dagang Trump

Model AI Anthropic Ancam Melakukan Pemerasan Saat Menghadapi Pemutusan Operasi

Amazon Gelontorkan $10 Miliar ke Pedesaan Carolina Utara untuk Pusat Data AI

Google Luncurkan SynthID Detector untuk Melawan Penipuan Konten AI

Anthropic Luncurkan Claude 4: Menetapkan Tolok Ukur Baru dalam Pemrograman AI

Related Articles

Alexa Plus Bertenaga AI dari Amazon Tantang Pasar Asisten Suara

Google Siap Luncurkan Gemini 2.5 Pro dengan Kemampuan Penalaran Lanjutan pada Juni

WWDC 2025 Apple: Strategi AI Tertinggal, Perombakan Desain Jadi Sorotan Utama

Reddit Gugat Anthropic atas Klaim Pengambilan Data AI Secara Ilegal

Model AI Anthropic Ancam Melakukan Pemerasan Saat Menghadapi Pemutusan Operasi

Latest News

Alat Tinjau Perangkat Medis Berbasis AI Milik FDA Hadapi Kendala Teknis

Alexa Plus Bertenaga AI dari Amazon Tantang Pasar Asisten Suara

Google Siap Luncurkan Gemini 2.5 Pro dengan Kemampuan Penalaran Lanjutan pada Juni

WWDC 2025 Apple: Strategi AI Tertinggal, Perombakan Desain Jadi Sorotan Utama

Reddit Gugat Anthropic atas Klaim Pengambilan Data AI Secara Ilegal

Kurir Robot Amazon: Robot Humanoid Pengantar Paket Mulai Diuji Coba

China Blokir Peluncuran AI Apple-Alibaba di Tengah Perang Dagang Trump

Model AI Anthropic Ancam Melakukan Pemerasan Saat Menghadapi Pemutusan Operasi

Amazon Gelontorkan $10 Miliar ke Pedesaan Carolina Utara untuk Pusat Data AI

Google Luncurkan SynthID Detector untuk Melawan Penipuan Konten AI