menu
close

Model AI Kini Belajar Meluangkan Lebih Banyak Masa pada Masalah Kompleks

Satu model AI terobosan telah dibangunkan yang mampu belajar memperuntukkan lebih banyak sumber pengiraan kepada masalah sukar, meniru cara manusia meluangkan lebih banyak masa pada tugas mencabar. Keupayaan penaakulan adaptif ini membolehkan penyelesaian yang lebih kukuh dan penggeneralisasian yang lebih baik kepada senario baharu yang belum pernah dilihat. Inovasi ini mewakili kemajuan besar dalam penyelesaian masalah AI, melangkaui pengecaman corak kepada proses penaakulan yang lebih menyerupai manusia.
Model AI Kini Belajar Meluangkan Lebih Banyak Masa pada Masalah Kompleks

Para penyelidik telah membangunkan generasi baharu model AI yang boleh melaraskan usaha pengiraan mereka secara dinamik berdasarkan kerumitan masalah, menandakan perubahan besar dalam cara kecerdasan buatan menangani tugas mencabar.

Teknologi ini, seperti yang ditunjukkan oleh model seperti DeepSeek-R1 dan siri o daripada OpenAI, menggunakan apa yang dipanggil oleh pembangun sebagai "pendekatan penaakulan-utama" yang mengutamakan analisis mendalam berbanding pencocokan corak secara pantas. DeepSeek-R1 dibina dengan metodologi penaakulan-utama ini, menjadikannya amat sesuai untuk menangani tugas kompleks dalam bidang sains, pengaturcaraan, dan matematik melalui inferens logik lanjutan dan penyelesaian masalah. Fokus kepada "berfikir sebelum menjawab" ini menjadikannya sangat bernilai untuk aplikasi teknikal.

Tidak seperti sistem AI konvensional, model penaakulan baharu ini dilatih untuk "berfikir lebih lama" sebelum memberi respons. Sebagai contoh, OpenAI o3 boleh memecahkan soalan sukar kepada langkah logik, melakukan pengiraan perantaraan atau panggilan alat, dan kemudian menghasilkan jawapan yang kukuh. Sebagai model penaakulan, ia secara efektif menyemak fakta sendiri, yang membantu mengelakkan perangkap yang biasanya menjerat model standard. Walaupun ia mengambil masa beberapa saat hingga minit lebih lama untuk sampai kepada penyelesaian berbanding model bukan penaakulan biasa, ia cenderung lebih dipercayai dalam bidang seperti fizik, sains, dan matematik.

OpenAI telah memerhati bahawa pembelajaran peneguhan berskala besar memaparkan trend yang sama iaitu "lebih pengiraan = prestasi lebih baik" seperti yang dilihat dalam latihan model terdahulu. Dengan mengulangi laluan penskalaan—kali ini dalam pembelajaran peneguhan—mereka telah meningkatkan satu lagi peringkat magnitud dalam kedua-dua pengiraan latihan dan penaakulan semasa inferens, dengan peningkatan prestasi yang jelas membuktikan bahawa prestasi model terus bertambah baik apabila ia dibenarkan berfikir lebih lama.

Model-model ini secara aktif menjana pelbagai laluan penyelesaian semasa inferens, menilai setiap satu dengan bantuan model penilai bersepadu untuk menentukan pilihan yang paling menjanjikan. Dengan melatih penilai menggunakan data berlabel pakar, pembangun memastikan model membangunkan keupayaan kukuh untuk berfikir melalui masalah kompleks berbilang langkah. Ciri ini membolehkan model bertindak sebagai hakim kepada penaakulannya sendiri, membawa model bahasa besar lebih dekat kepada keupayaan "berfikir" dan bukan sekadar memberi respons.

Pendekatan DeepSeek menggabungkan penaakulan rantai-pemikiran dengan pembelajaran peneguhan di mana ejen autonomi belajar melaksanakan tugas melalui percubaan dan kesilapan tanpa arahan manusia. Ini mencabar andaian bahawa model akan meningkatkan keupayaan penaakulan hanya dengan latihan pada contoh berlabel tingkah laku yang betul. Seperti yang dinyatakan oleh seorang penyelidik: "Bolehkah kita hanya memberi ganjaran kepada model untuk ketepatan dan membiarkannya menemui cara terbaik untuk berfikir sendiri?"

Implikasi untuk aplikasi dunia sebenar adalah sangat besar. Model-model ini boleh mengubah cara AI menangani masalah kompleks dalam pelbagai bidang daripada penyelidikan saintifik dan kejuruteraan kepada strategi perniagaan dan penyelesaian masalah kreatif. Dengan memperuntukkan sumber pengiraan secara berkadar dengan tahap kesukaran tugas—seperti manusia secara semula jadi meluangkan lebih banyak masa pada masalah yang lebih sukar—sistem ini menjanjikan prestasi yang lebih boleh dipercayai untuk tugas intelektual paling mencabar yang dihadapi manusia.

Source:

Latest News