Model Claude 4 dari Anthropic Cetak Rekor Baru dalam Benchmark Kode AI

Anthropic meluncurkan Claude Opus 4 dan Claude Sonnet 4, model AI terkuat mereka hingga saat ini, pada 22 Mei 2025. Model hybrid reasoning ini menawarkan kemampuan terobosan dalam pemrograman, eksekusi tugas yang lebih panjang, dan fungsi memori canggih. Peluncuran ini memperkuat posisi kompetitif Anthropic melawan OpenAI dan Google, dengan Claude Opus 4 meraih performa terbaik di industri pada benchmark rekayasa perangkat lunak utama.

Anthropic memperkenalkan model AI generasi terbarunya, Claude Opus 4 dan Claude Sonnet 4, dalam konferensi pengembang 'Code with Claude 2025' pada 22 Mei. Kedua model ini merupakan lompatan teknis terbesar perusahaan, khususnya dalam bidang rekayasa perangkat lunak dan kemampuan agen otonom.

Claude Opus 4, yang diposisikan sebagai "model pemrograman terbaik di dunia," mencetak skor 72,5% pada benchmark pemrograman SWE-bench, melampaui GPT-4.1 milik OpenAI (54,6%) dan Gemini 2.5 Pro dari Google. Dalam pengujian di Rakuten, Opus 4 mampu melakukan pemrograman secara otonom selama hampir tujuh jam—lonjakan dramatis dibandingkan model AI sebelumnya yang hanya mampu bertahan beberapa menit.

Kedua model ini dilengkapi sistem hybrid reasoning yang memungkinkan respons hampir seketika maupun pemikiran bertahap yang lebih panjang. Model ini dapat menggunakan berbagai alat secara paralel, termasuk pencarian web, dan ketika diberikan akses ke file lokal, dapat mengekstrak serta menyimpan informasi penting untuk membangun apa yang disebut Anthropic sebagai "pengetahuan tacit" seiring waktu.

Claude Sonnet 4, yang merupakan peningkatan dari Sonnet 3.7 yang dirilis Februari lalu, menawarkan kemampuan pemecahan masalah yang lebih baik dan instruksi yang lebih akurat. Model ini tersedia untuk seluruh pengguna Claude, termasuk pengguna gratis, sementara Opus 4 hanya tersedia untuk paket Pro, Max, Team, dan Enterprise.

Peluncuran ini terjadi di tengah pertumbuhan pesat Anthropic, dengan pendapatan tahunan yang berlipat ganda menjadi $2 miliar pada kuartal pertama 2025 dan peningkatan delapan kali lipat jumlah pelanggan dengan pengeluaran lebih dari $100.000 per tahun. Perusahaan juga baru saja memperoleh fasilitas kredit sebesar $2,5 miliar untuk mendukung pengembangan AI mereka.

Meski pencapaian teknisnya signifikan, Anthropic menerapkan langkah-langkah keamanan ketat untuk Claude Opus 4, mengklasifikasikannya pada protokol AI Safety Level 3 (ASL-3) setelah pengujian internal menemukan potensi risiko. Kedua model ini tersedia melalui API Anthropic, Amazon Bedrock, dan Vertex AI milik Google Cloud, dengan harga $15/$75 per satu juta token untuk Opus 4 dan $3/$15 untuk Sonnet 4.

Source:

Model Claude 4 dari Anthropic Cetak Rekor Baru dalam Benchmark Kode AI

Latest News

Doubao AI dari ByteDance Kini Hadirkan Bantuan Video Real-Time

OnePlus Tinggalkan Alert Slider demi Plus Key Berbasis AI

Raksasa Teknologi Jerman Bersatu untuk Bangun Gigafactory AI Didukung Uni Eropa

Jaksa AS Selidiki Builder.ai Sebelum Startup AI Senilai $1,5 Miliar Ambruk

Dana $1,8 Triliun Norwegia Wajibkan Penggunaan AI bagi Seluruh Karyawan

OpenTools.ai Luncurkan Pusat Berita AI untuk Profesional Teknologi

Google Perluas Kontrol Komputer Berbasis AI untuk Pengembang melalui Gemini

Google Tingkatkan Model Gemini dengan Ringkasan Pemikiran yang Transparan

Model Claude 4 dari Anthropic Cetak Rekor Baru dalam Benchmark Kode AI

Related Articles

Doubao AI dari ByteDance Kini Hadirkan Bantuan Video Real-Time

OpenTools.ai Luncurkan Pusat Berita AI untuk Profesional Teknologi

Google Perluas Kontrol Komputer Berbasis AI untuk Pengembang melalui Gemini

Google Tingkatkan Model Gemini dengan Ringkasan Pemikiran yang Transparan

WordPress Bentuk Tim AI untuk Menyatukan Ekosistem Pengembang

Latest News

Doubao AI dari ByteDance Kini Hadirkan Bantuan Video Real-Time

OnePlus Tinggalkan Alert Slider demi Plus Key Berbasis AI

Raksasa Teknologi Jerman Bersatu untuk Bangun Gigafactory AI Didukung Uni Eropa

Jaksa AS Selidiki Builder.ai Sebelum Startup AI Senilai $1,5 Miliar Ambruk

Dana $1,8 Triliun Norwegia Wajibkan Penggunaan AI bagi Seluruh Karyawan

OpenTools.ai Luncurkan Pusat Berita AI untuk Profesional Teknologi

Google Perluas Kontrol Komputer Berbasis AI untuk Pengembang melalui Gemini

Google Tingkatkan Model Gemini dengan Ringkasan Pemikiran yang Transparan