MIT Bongkar Mekanisme Utama di Sebalik Bias LLM

Penyelidik MIT telah mengenal pasti punca asas bias kedudukan dalam model bahasa besar (LLM), iaitu fenomena di mana model terlalu menekankan maklumat di permulaan dan penghujung dokumen sambil mengabaikan bahagian tengah. Kerangka teori mereka mendedahkan bagaimana pilihan reka bentuk tertentu dalam seni bina model, terutamanya penutupan kausal dan mekanisme perhatian, secara semula jadi mencipta bias ini walaupun ia tidak wujud dalam data latihan. Penemuan ini memberikan pandangan penting untuk membangunkan sistem AI yang lebih tepat dan boleh dipercayai.

Penyelidik di MIT telah mencapai penemuan penting dalam memahami mengapa model bahasa besar (LLM) menunjukkan bias, sekali gus membuka jalan ke arah sistem AI yang lebih boleh dipercayai.

Pasukan penyelidik mendapati bahawa LLM mengalami "bias kedudukan", iaitu kecenderungan untuk terlalu menekankan maklumat di permulaan dan penghujung dokumen sambil mengabaikan kandungan di bahagian tengah. Bias ini mempunyai implikasi praktikal—contohnya, apabila seorang peguam menggunakan pembantu berkuasa LLM untuk mencari maklumat dalam dokumen setebal 30 muka surat, sistem lebih cenderung menemui teks berkaitan jika ia terletak di halaman awal atau akhir.

Apa yang menjadikan penemuan ini begitu penting ialah para penyelidik berjaya mengenal pasti punca utama bias tersebut dalam seni bina model itu sendiri. "Model-model ini adalah kotak hitam, jadi sebagai pengguna LLM, anda mungkin tidak sedar bahawa bias kedudukan boleh menyebabkan model anda menjadi tidak konsisten," jelas Xinyi Wu, pelajar siswazah MIT dan penulis utama kajian tersebut.

Pasukan ini membina kerangka teori berasaskan graf untuk menganalisis bagaimana maklumat mengalir melalui seni bina pembelajaran mesin LLM. Analisis mereka mendedahkan bahawa beberapa pilihan reka bentuk—khususnya penutupan kausal dan mekanisme perhatian—memberikan model kecenderungan semula jadi terhadap permulaan input, walaupun bias tersebut tidak wujud dalam data latihan.

"Walaupun sering benar bahawa perkataan awal dan akhir dalam ayat lebih penting, jika LLM digunakan untuk tugas yang bukan penjanaan bahasa semula jadi, seperti penarafan atau pencarian maklumat, bias ini boleh menjadi sangat merugikan," kata Wu.

Penyelidikan ini melengkapi kajian-kajian terkini lain yang menunjukkan bahawa LLM menyimpan pelbagai bentuk bias. Satu kajian berasingan dari Universiti Princeton mendapati bahawa walaupun LLM yang secara eksplisit tidak berat sebelah masih membentuk bias tersirat yang serupa dengan manusia yang secara sedar menolak stereotaip tetapi secara tidak sedar mengekalkannya. Dengan menggunakan ukuran yang diinspirasikan oleh psikologi, penyelidik mengesan bias stereotaip yang meluas merentasi kategori kaum, jantina, agama, dan kesihatan dalam lapan model yang sejajar dengan nilai.

Penemuan MIT ini menawarkan apa yang dipanggil Profesor Amin Saberi dari Stanford sebagai "lensa teori yang jarang berlaku ke dalam mekanisme perhatian yang menjadi teras model transformer," memberikan kejelasan matematik serta pandangan praktikal terhadap sistem dunia sebenar. Memandangkan LLM semakin banyak digunakan dalam aplikasi kritikal, memahami dan menangani bias-bias semula jadi ini akan menjadi penting untuk membangunkan teknologi AI yang adil dan boleh dipercayai.

Source:

MIT Bongkar Mekanisme Utama di Sebalik Bias LLM

Latest News

MIT Merintis Platform Pembelajaran AI Berasaskan Dinamika Sosial

Kulit Robotik Terobosan Membawa Sentuhan Seakan Manusia kepada Mesin

Meta Melancarkan LLaMA 4: Revolusi Suara dalam Kecerdasan Buatan

Home Depot Mendigitalkan Nasihat Pakar dengan Magic Apron Berkuasa AI

Shield AI Peroleh $240 Juta Ketika Ledakan Teknologi Pertahanan Meningkat

Ubat Reka Bentuk AI Rentosertib Menunjukkan Potensi dalam Ujian Klinikal Bersejarah

Gergasi Teknologi Perkenal Ciri Chatbot AI Enterprise yang Lebih Maju

Kejayaan AI Switzerland Kurangkan Emisi Karbon Industri Simen

OpenAI Capai Penanda Pendapatan $10 Bilion Ketika Penggunaan AI Meningkat Pesat

Gemini 2.5 Flash Google Tawarkan Kuasa Pengkodan yang Dipertingkat

MIT Bongkar Mekanisme Utama di Sebalik Bias LLM

Related Articles

Meta Melancarkan LLaMA 4: Revolusi Suara dalam Kecerdasan Buatan

Jurang Penggunaan AI oleh Wanita Mengancam Kesaksamaan di Tempat Kerja

Kerangka Etika Global untuk AI dalam Penjagaan Kesihatan Didedahkan

Gabungan Global Melancarkan Kerangka Etika AGI Bersejarah

OpenAI Gagalkan 10 Kempen Penyalahgunaan AI Disokong Negara

Latest News

MIT Merintis Platform Pembelajaran AI Berasaskan Dinamika Sosial

Kulit Robotik Terobosan Membawa Sentuhan Seakan Manusia kepada Mesin

Meta Melancarkan LLaMA 4: Revolusi Suara dalam Kecerdasan Buatan

Home Depot Mendigitalkan Nasihat Pakar dengan Magic Apron Berkuasa AI

Shield AI Peroleh $240 Juta Ketika Ledakan Teknologi Pertahanan Meningkat

Ubat Reka Bentuk AI Rentosertib Menunjukkan Potensi dalam Ujian Klinikal Bersejarah

Gergasi Teknologi Perkenal Ciri Chatbot AI Enterprise yang Lebih Maju

Kejayaan AI Switzerland Kurangkan Emisi Karbon Industri Simen

OpenAI Capai Penanda Pendapatan $10 Bilion Ketika Penggunaan AI Meningkat Pesat

Gemini 2.5 Flash Google Tawarkan Kuasa Pengkodan yang Dipertingkat