menu
close

OpenAI Luncurkan Keluarga GPT-4.1 untuk Dominasi Pasar AI Coding

OpenAI telah meluncurkan keluarga model baru bernama GPT-4.1, termasuk versi standar, mini, dan nano, yang semuanya dioptimalkan untuk pemrograman dan mengikuti instruksi dengan jendela konteks sebesar 1 juta token. Model eksklusif API ini melampaui penawaran OpenAI sebelumnya dalam tolok ukur pemrograman, dengan GPT-4.1 unggulan menunjukkan peningkatan 21% dibandingkan GPT-4o. Peluncuran ini hadir di tengah persaingan ketat dengan Google Gemini 2.5 Pro dan Claude 3.7 Sonnet dari Anthropic yang juga bersaing untuk mendominasi ruang AI coding.
OpenAI Luncurkan Keluarga GPT-4.1 untuk Dominasi Pasar AI Coding

OpenAI telah meluncurkan keluarga model baru bernama GPT-4.1, yang mencakup GPT-4.1, GPT-4.1 mini, dan GPT-4.1 nano, yang semuanya unggul dalam pemrograman dan mengikuti instruksi. Dirilis pada 14 April, model-model baru ini tersedia secara eksklusif melalui application programming interface (API) OpenAI dan melampaui model GPT-4o yang paling canggih milik perusahaan di semua aspek.

Model-model ini memiliki pemahaman konteks yang lebih baik, mendukung hingga 1 juta token (sekitar 750.000 kata) dan dilengkapi dengan pengetahuan terbaru hingga Juni 2024. Pada SWE-bench Verified, tolok ukur keterampilan rekayasa perangkat lunak dunia nyata, GPT-4.1 menyelesaikan 54,6% tugas, dibandingkan dengan 33,2% untuk GPT-4o. Ini mencerminkan peningkatan kemampuan model dalam menelusuri repositori kode, menyelesaikan tugas, serta menghasilkan kode yang dapat dijalankan dan lolos pengujian.

"Kami telah mengoptimalkan GPT-4.1 untuk penggunaan dunia nyata berdasarkan umpan balik langsung guna meningkatkan area yang paling diperhatikan pengembang: pemrograman frontend, mengurangi suntingan yang tidak perlu, mengikuti format dengan andal, mematuhi struktur dan urutan respons, penggunaan alat yang konsisten, dan lainnya," jelas juru bicara OpenAI. "Peningkatan ini memungkinkan pengembang membangun agen yang jauh lebih baik dalam tugas rekayasa perangkat lunak dunia nyata."

Varian yang lebih kecil menawarkan kompromi antara performa dan biaya. GPT-4.1 mini dan nano lebih efisien dan lebih cepat dengan sedikit pengorbanan akurasi, di mana OpenAI menyebut GPT-4.1 nano sebagai model tercepat dan termurah yang pernah mereka buat. Harga sangat bervariasi di seluruh lini: GPT-4.1 dihargai $2 per juta token input dan $8 per juta token output, GPT-4.1 mini $0,40 per juta token input dan $1,60 per juta token output, sedangkan GPT-4.1 nano hanya $0,10 per juta token input dan $0,40 per juta token output.

Dalam evaluasi di luar pemrograman, OpenAI menguji GPT-4.1 menggunakan Video-MME, yang mengukur kemampuan model memahami konten dalam video. GPT-4.1 mencapai akurasi 72% pada kategori video "panjang, tanpa subtitle", menempati posisi teratas dalam tolok ukur ini.

Peluncuran ini sejalan dengan ambisi lebih luas OpenAI di bidang pemrograman. CFO OpenAI, Sarah Friar, baru-baru ini membahas visi perusahaan untuk menciptakan "agentic software engineer" yang dapat memprogram seluruh aplikasi secara end-to-end. "Model ini benar-benar dapat membangun aplikasi untuk Anda — dan tidak hanya membangunnya, tetapi juga melakukan quality assurance, pengujian bug, dan penulisan dokumentasi secara mandiri," ujar Friar.

Ruang model AI untuk pemrograman semakin kompetitif. Google Gemini 2.5 Pro saat ini memimpin tolok ukur SWE-bench Verified dengan skor 63,8%, sementara Claude 3.7 Sonnet dari Anthropic meraih 62,3% dalam mode standar dan hingga 70,3% dalam mode extended thinking. Meski tolok ukur ini mengesankan, OpenAI mengakui bahwa bahkan model terbaik saat ini masih kesulitan dengan tugas-tugas yang tidak akan menyulitkan para ahli. Banyak studi menunjukkan bahwa model pembuat kode sering gagal memperbaiki, bahkan justru menambah, kerentanan keamanan dan bug. GPT-4.1 juga menjadi kurang andal ketika harus memproses lebih banyak token input.

Source: TechCrunch

Latest News