menu
close

Model AI Kini Belajar Menghabiskan Lebih Banyak Waktu pada Masalah Kompleks

Sebuah model AI terobosan telah dikembangkan yang mampu belajar mengalokasikan lebih banyak sumber daya komputasi untuk masalah-masalah sulit, meniru cara manusia menghabiskan lebih banyak waktu pada tugas yang menantang. Kemampuan penalaran adaptif ini memungkinkan solusi yang lebih tangguh dan generalisasi yang lebih baik pada skenario baru yang belum pernah ditemui. Inovasi ini menandai kemajuan signifikan dalam pemecahan masalah AI, melampaui pengenalan pola menuju proses penalaran yang lebih menyerupai manusia.
Model AI Kini Belajar Menghabiskan Lebih Banyak Waktu pada Masalah Kompleks

Para peneliti telah mengembangkan generasi baru model AI yang dapat secara dinamis menyesuaikan upaya komputasinya berdasarkan kompleksitas masalah, mewakili perubahan besar dalam cara kecerdasan buatan menghadapi tugas-tugas yang menantang.

Teknologi ini, yang dicontohkan oleh model seperti DeepSeek-R1 dan seri o dari OpenAI, menerapkan apa yang disebut pengembang sebagai "pendekatan penalaran-utama" yang memprioritaskan analisis mendalam dibandingkan pencocokan pola secara cepat. DeepSeek-R1 dibangun dengan metodologi penalaran-utama ini, menjadikannya sangat cocok untuk menangani tugas-tugas kompleks di bidang sains, pemrograman, dan matematika melalui inferensi logis dan pemecahan masalah tingkat lanjut. Fokus pada "berpikir sebelum menjawab" ini membuatnya sangat berharga untuk aplikasi teknis.

Berbeda dengan sistem AI konvensional, model penalaran baru ini dilatih untuk "berpikir lebih lama" sebelum memberikan jawaban. Sebagai contoh, OpenAI o3 mampu memecah pertanyaan sulit menjadi langkah-langkah logis, melakukan perhitungan antara atau pemanggilan alat, lalu menghasilkan jawaban yang beralasan kuat. Sebagai model penalaran, mereka secara efektif melakukan pemeriksaan fakta mandiri, yang membantu menghindari jebakan yang biasanya menjerat model standar. Meskipun membutuhkan waktu beberapa detik hingga menit lebih lama untuk mencapai solusi dibandingkan model non-penalaran, mereka cenderung lebih andal di bidang seperti fisika, sains, dan matematika.

OpenAI mengamati bahwa pembelajaran penguatan skala besar menunjukkan tren "lebih banyak komputasi = kinerja lebih baik" yang sama seperti pada pelatihan model sebelumnya. Dengan menelusuri kembali jalur skala—kali ini dalam pembelajaran penguatan—mereka mendorong satu tingkat besaran tambahan baik dalam komputasi pelatihan maupun penalaran saat inferensi, dengan peningkatan kinerja yang jelas membuktikan bahwa performa model terus meningkat seiring waktu berpikir yang diberikan.

Model-model ini secara aktif menghasilkan beberapa jalur solusi selama inferensi, mengevaluasi masing-masing dengan bantuan model evaluator terintegrasi untuk menentukan opsi yang paling menjanjikan. Dengan melatih evaluator pada data berlabel ahli, pengembang memastikan model memiliki kapasitas kuat untuk menalar melalui masalah kompleks yang terdiri dari banyak langkah. Fitur ini memungkinkan model bertindak sebagai penilai atas penalarannya sendiri, membawa model bahasa besar semakin dekat untuk "berpikir" alih-alih sekadar merespons.

Pendekatan DeepSeek menggabungkan penalaran rantai-pemikiran dengan pembelajaran penguatan, di mana agen otonom belajar melakukan tugas melalui trial and error tanpa instruksi manusia. Ini mempertanyakan asumsi bahwa model akan meningkatkan kemampuan penalarannya hanya dengan pelatihan pada contoh berlabel perilaku yang benar. Seperti yang dikatakan salah satu peneliti: "Bisakah kita cukup memberi penghargaan pada model untuk kebenaran dan membiarkannya menemukan cara berpikir terbaik sendiri?"

Dampaknya bagi aplikasi dunia nyata sangat besar. Model-model ini berpotensi mengubah cara AI menangani masalah kompleks di berbagai bidang mulai dari riset ilmiah dan rekayasa hingga strategi bisnis dan pemecahan masalah kreatif. Dengan mengalokasikan sumber daya komputasi secara proporsional terhadap tingkat kesulitan tugas—mirip dengan cara manusia secara alami menghabiskan lebih banyak waktu pada masalah yang lebih sulit—sistem ini menjanjikan kinerja yang lebih andal pada tugas intelektual paling menantang yang dihadapi umat manusia.

Source:

Latest News