Anthropic Luncurkan Claude 4: Tolok Ukur Baru dalam Penalaran AI

Pada 22 Mei 2025, Anthropic merilis Claude 4, memperkenalkan dua model canggih—Opus 4 dan Sonnet 4—dengan kemampuan penalaran yang belum pernah ada sebelumnya serta pemrosesan multimodal. Kedua model ini unggul dalam tugas-tugas kompleks termasuk pemrograman, di mana Opus 4 meraih skor tertinggi di industri sebesar 72,5% pada SWE-bench dan mampu mempertahankan performa hingga tujuh jam. Claude 4 memperkenalkan penalaran hibrida yang memungkinkan respons instan maupun pemikiran bertahap dengan integrasi alat yang lebih baik.

Anthropic secara resmi meluncurkan sistem AI tercanggihnya hingga saat ini, menandai evolusi signifikan dalam kemampuan kecerdasan buatan. Keluarga Claude 4, yang dirilis pada 22 Mei 2025, terdiri dari dua model: Claude Opus 4 dan Claude Sonnet 4, keduanya dirancang untuk mendorong batasan apa yang dapat dicapai AI.

Claude Opus 4, model andalan Anthropic, diposisikan sebagai AI pemrograman terbaik di dunia, dengan skor rekor 72,5% pada tolok ukur SWE-bench Verified, melampaui pesaing seperti model OpenAI dan Google Gemini 2.5 Pro. Dalam pengujian di Rakuten, Opus 4 menunjukkan kemampuan luar biasa untuk bekerja secara otonom pada tugas rekayasa perangkat lunak yang kompleks selama hampir tujuh jam tanpa penurunan performa—terobosan yang mengubah AI dari sekadar alat respons cepat menjadi kolaborator sejati.

Sonnet 4, yang dirancang sebagai opsi lebih terjangkau, tetap menawarkan kemampuan impresif dengan skor 72,7% pada SWE-bench. Model ini tersedia untuk pengguna gratis maupun berbayar, dan menjadi peningkatan langsung dari Claude 3.7 Sonnet dengan struktur harga yang sama.

Yang membedakan Claude 4 adalah pendekatan penalaran hibrida. Berbeda dengan model sebelumnya yang hanya menghasilkan respons instan, Claude 4 dapat beralih antara jawaban hampir seketika dan mode pemikiran bertahap, di mana AI memecahkan masalah langkah demi langkah. Pendekatan ini memungkinkan pemrosesan konteks yang lebih bernuansa dan penanganan instruksi ambigu secara lebih baik. Kedua model juga dapat menggunakan beberapa alat secara paralel, termasuk pencarian web, serta bergantian antara penalaran dan penggunaan alat untuk meningkatkan kualitas respons.

Kedua model ini memiliki jendela konteks sebesar 200 ribu token dan kemampuan memori yang jauh lebih baik. Ketika diberikan akses ke file lokal, Claude 4 dapat mengekstrak dan menyimpan informasi penting untuk menjaga kesinambungan dalam tugas-tugas kompleks. Kemajuan ini memungkinkan Claude 4 menangani alur kerja canggih yang sebelumnya memerlukan intervensi manusia.

Anthropic telah menerapkan langkah-langkah keamanan yang diperkuat untuk Claude 4, terutama Opus 4 yang diklasifikasikan dalam tingkat keamanan ASL-3 perusahaan karena kemampuannya yang canggih. Langkah-langkah ini mencakup deteksi konten berbahaya yang lebih kuat dan pertahanan siber yang ditingkatkan.

Peluncuran ini hadir di tengah persaingan sengit di sektor AI, dengan Anthropic menargetkan pertumbuhan pendapatan dari proyeksi $2,2 miliar tahun ini menjadi $12 miliar pada 2027. Claude 4 kini tersedia melalui antarmuka web Anthropic, API, Amazon Bedrock, dan Vertex AI milik Google Cloud, dengan harga Opus 4 sebesar $15/$75 per satu juta token (input/output) dan Sonnet 4 sebesar $3/$15.

Source:

Anthropic Luncurkan Claude 4: Tolok Ukur Baru dalam Penalaran AI

Latest News

Microsoft Luncurkan Sistem Pertahanan Berbasis AI untuk Melawan Ancaman Siber

Google Luncurkan SynthID Detector untuk Melawan Penipuan Konten AI

Qualcomm Luncurkan AI Hub di Vietnam, Perluas Jaringan Riset Global

Koalisi Global Luncurkan Regulasi Bersejarah untuk Chatbot AI

Meta Bertaruh $15 Miliar pada Scale AI untuk Mengejar Superintelligence

Regulator Inggris Gandeng NVIDIA untuk Tingkatkan Inovasi AI di Sektor Keuangan

Google Tingkatkan Pencarian dengan Integrasi AI Gemini 2.5

CEO NVIDIA Desak Inggris Tingkatkan Infrastruktur AI Setelah Investasi £1 Miliar Diumumkan

Mistral Luncurkan Model AI Penalaran Multibahasa Pertama di Eropa

Kepala AI Trump Anggap Remeh Kekhawatiran Penyelundupan Chip

Anthropic Luncurkan Claude 4: Tolok Ukur Baru dalam Penalaran AI

Related Articles

Microsoft Luncurkan Sistem Pertahanan Berbasis AI untuk Melawan Ancaman Siber

Google Luncurkan SynthID Detector untuk Melawan Penipuan Konten AI

Google Tingkatkan Pencarian dengan Integrasi AI Gemini 2.5

CEO NVIDIA Desak Inggris Tingkatkan Infrastruktur AI Setelah Investasi £1 Miliar Diumumkan

Mistral Luncurkan Model AI Penalaran Multibahasa Pertama di Eropa

Latest News

Microsoft Luncurkan Sistem Pertahanan Berbasis AI untuk Melawan Ancaman Siber

Google Luncurkan SynthID Detector untuk Melawan Penipuan Konten AI

Qualcomm Luncurkan AI Hub di Vietnam, Perluas Jaringan Riset Global

Koalisi Global Luncurkan Regulasi Bersejarah untuk Chatbot AI

Meta Bertaruh $15 Miliar pada Scale AI untuk Mengejar Superintelligence

Regulator Inggris Gandeng NVIDIA untuk Tingkatkan Inovasi AI di Sektor Keuangan

Google Tingkatkan Pencarian dengan Integrasi AI Gemini 2.5

CEO NVIDIA Desak Inggris Tingkatkan Infrastruktur AI Setelah Investasi £1 Miliar Diumumkan

Mistral Luncurkan Model AI Penalaran Multibahasa Pertama di Eropa

Kepala AI Trump Anggap Remeh Kekhawatiran Penyelundupan Chip