Anthropic telah mencapai satu pencapaian penting dalam pembangunan kecerdasan buatan dengan model Claude 4 Opus yang menunjukkan kebolehan penulisan kod setaraf dengan pengaturcara manusia berpengalaman.
Dilancarkan pada Mei 2025, Claude 4 Opus telah menempatkan dirinya sebagai model penulisan kod AI terunggul, mencapai skor rekod 72.5% dalam SWE-bench, satu penanda aras kejuruteraan perisian yang menguji prestasi pada isu GitHub dunia sebenar. Ini jauh mengatasi GPT-4.1 oleh OpenAI yang hanya mencatat 54.6% dalam ujian yang sama.
Apa yang membezakan Claude 4 Opus ialah keupayaannya mengekalkan fokus dan konteks secara luar biasa dalam tempoh yang panjang. Dalam ujian di Rakuten, model ini secara autonomi mengendalikan projek penstrukturan semula sumber terbuka yang kompleks selama hampir tujuh jam tanpa hilang tumpuan atau koheren—satu kebolehan yang mengubah AI daripada sekadar alat respons pantas kepada rakan kolaborasi sebenar untuk projek sepanjang hari.
Dengan tetingkap konteks 200,000 token, Claude 4 Opus mampu memproses keseluruhan kod asas perusahaan, menavigasi perubahan pelbagai fail yang kompleks, dan menyesuaikan diri dengan gaya penulisan kod tertentu sambil mengekalkan kualiti tinggi untuk projek penjanaan dan penstrukturan semula berskala besar. Menurut maklum balas pembangun, model ini mempamerkan kemahiran setaraf pengaturcara komputer PhD berpengalaman pertengahan.
Kemajuan ini bukan sekadar kemajuan teknikal—ia menandakan perubahan asas dalam cara organisasi mengendalikan kerja berasaskan pengetahuan. Tugas yang dahulunya memerlukan perhatian manusia berterusan kini boleh diserahkan kepada sistem AI yang mampu mengekalkan fokus dan konteks selama berjam-jam atau bahkan berhari-hari. Implikasi ekonomi sangat besar, khususnya apabila penganalisis industri meramalkan tahun 2025 bakal menyaksikan peranan perkhidmatan pelanggan operasi peringkat permulaan dalam sektor kesihatan, kewangan, dan undang-undang mula mengalami penggantian pekerjaan secara besar-besaran.
Walaupun Claude 4 Opus cemerlang dalam penulisan kod, ia juga menunjukkan keupayaan kukuh dalam penyelidikan, penulisan, dan penemuan saintifik. Model ini boleh diakses melalui pelbagai saluran, termasuk API Anthropic, Amazon Bedrock, dan Vertex AI Google Cloud, dengan harga bermula $15 bagi setiap sejuta token input dan $75 bagi setiap sejuta token output.
Seiring sistem AI seperti Claude 4 Opus terus berkembang, cabaran bagi organisasi bukan lagi sama ada AI boleh menandingi kemahiran manusia, tetapi bagaimana menyesuaikan diri dengan masa depan di mana rakan kolaborasi paling produktif mungkin semakin bersifat digital berbanding manusia.