menu
close

Model Claude 4 Anthropic Tetapkan Penanda Aras Baharu untuk Pengekodan AI

Anthropic telah melancarkan Claude Opus 4 dan Claude Sonnet 4, model AI paling canggih mereka setakat ini, sekali gus menetapkan standard baharu dalam pengekodan, penaakulan, dan kerja autonomi. Claude Opus 4 menunjukkan ketahanan luar biasa, mampu bekerja secara autonomi hampir tujuh jam untuk tugasan kompleks — menghampiri tempoh kerja sehari penuh. Kedua-dua model ini menampilkan keupayaan penaakulan hibrid, integrasi carian web, dan pengekalan memori yang lebih baik, menandakan evolusi ketara daripada chatbot kepada ejen AI autonomi.
Model Claude 4 Anthropic Tetapkan Penanda Aras Baharu untuk Pengekodan AI

Anthropic telah memperkenalkan model AI generasi terbarunya pada 22 Mei 2025, dengan pelancaran Claude Opus 4 dan Claude Sonnet 4 yang menawarkan keupayaan melangkaui batasan sistem AI tanpa campur tangan manusia.

Claude Opus 4, yang digambarkan Anthropic sebagai "model pengekodan terbaik di dunia", telah mencapai skor luar biasa 72.5% dalam SWE-bench, penanda aras kejuruteraan perisian yang ketat untuk mengukur prestasi dalam tugasan pengekodan dunia sebenar. Dalam ujian di Rakuten, model ini menunjukkan ketahanan mengagumkan apabila mampu bekerja secara autonomi pada projek sumber terbuka yang kompleks selama hampir tujuh jam — satu lonjakan besar berbanding tempoh perhatian model AI terdahulu yang hanya beberapa minit.

Claude Sonnet 4, yang direka sebagai alternatif lebih cekap kepada Opus 4, menawarkan keupayaan pengekodan dan penaakulan yang lebih baik berbanding pendahulunya, Claude Sonnet 3.7. Mengejutkan, ia memperoleh skor lebih tinggi dalam SWE-bench iaitu 72.7%, mengatasi pesaing seperti Codex-1 daripada OpenAI (72.1%) dan Gemini 2.5 Pro daripada Google (63.2%).

Kedua-dua model ini menampilkan keupayaan penaakulan hibrid, membolehkan mereka bertukar antara respons hampir serta-merta dan pemikiran lanjutan untuk penaakulan lebih mendalam. Mereka boleh menggunakan alat seperti carian web semasa proses pemikiran dan — apabila diberikan akses kepada fail tempatan — boleh mengekstrak serta menyimpan maklumat penting bagi mengekalkan kesinambungan dan membina pengetahuan dari semasa ke semasa.

Model-model baharu ini mewakili perubahan paradigma dalam fungsi AI, daripada sekadar chatbot kepada ejen kerja autonomi yang mampu mengendalikan aliran kerja kompleks berbilang langkah sehingga ribuan langkah. Evolusi ini membolehkan AI melaksanakan projek sepanjang hari dari perancangan hingga siap sambil mengekalkan konteks sepanjang proses.

Claude Sonnet 4 tersedia untuk semua pengguna Claude, termasuk pengguna percuma, manakala Claude Opus 4 hanya boleh diakses oleh pelanggan pelan Pro, Max, Team, dan Enterprise. Kedua-dua model ini juga boleh diakses melalui API Anthropic, Amazon Bedrock, dan Vertex AI Google Cloud, dengan harga yang konsisten dengan model sebelum ini: Opus 4 pada $15/$75 setiap sejuta token (input/output) dan Sonnet 4 pada $3/$15.

Source:

Latest News