MIT odhaľuje kľúčový mechanizmus zaujatosti veľkých jazykových modelov

Výskumníci z MIT identifikovali základnú príčinu pozičnej zaujatosti vo veľkých jazykových modeloch (LLM), teda javu, pri ktorom modely preceňujú informácie na začiatku a konci dokumentov a zanedbávajú stred. Ich teoretický rámec odhaľuje, ako konkrétne rozhodnutia v architektúre modelu, najmä kauzálne maskovanie a mechanizmy pozornosti, túto zaujatost inherentne vytvárajú, aj keď v trénovacích dátach neexistuje. Tento prelomový objav poskytuje kľúčové poznatky pre vývoj presnejších a spoľahlivejších AI systémov.

Výskumníci z MIT dosiahli významný prelom v pochopení toho, prečo veľké jazykové modely (LLM) vykazujú zaujatosti, čo by mohlo otvoriť cestu k spoľahlivejším AI systémom.

Tím zistil, že LLM trpia tzv. „pozičnou zaujatostou“ – tendenciou preceňovať informácie na začiatku a konci dokumentov, pričom obsah v strede je zanedbávaný. Táto zaujatost má praktické dôsledky – napríklad ak právnik využíva asistenta poháňaného LLM na prehľadávanie 30-stranového dokumentu, systém s väčšou pravdepodobnosťou nájde relevantný text, ak sa nachádza na prvých alebo posledných stranách.

Prelomovosť tohto objavu spočíva v tom, že výskumníci identifikovali samotnú príčinu v architektúre modelu. „Tieto modely sú čierne skrinky, takže ako používateľ LLM pravdepodobne netušíte, že pozičná zaujatost môže spôsobovať nekonzistentnosť vášho modelu,“ vysvetľuje Xinyi Wu, doktorandka na MIT a hlavná autorka výskumu.

Tím vytvoril teoretický rámec založený na grafoch, aby analyzoval, ako informácie prechádzajú strojovým učením v architektúre LLM. Ich analýza ukázala, že určité rozhodnutia v návrhu – konkrétne kauzálne maskovanie a mechanizmy pozornosti – spôsobujú, že modely sú inherentne zaujaté smerom k začiatku vstupu, aj keď takáto zaujatost v trénovacích dátach neexistuje.

„Hoci často platí, že skoršie a neskoršie slová vo vete sú dôležitejšie, ak sa LLM používa na úlohy, ktoré nesúvisia s generovaním prirodzeného jazyka, ako je napríklad radenie alebo vyhľadávanie informácií, tieto zaujatosti môžu byť mimoriadne škodlivé,“ upozorňuje Wu.

Tento výskum dopĺňa ďalšie nedávne štúdie, ktoré ukazujú, že LLM obsahujú rôzne formy zaujatosti. Samostatná štúdia z Princetonskej univerzity zistila, že aj explicitne nezaujaté LLM stále vytvárajú implicitné zaujatosti podobné tým, aké majú ľudia, ktorí síce vedome odmietajú stereotypy, ale nevedome ich udržiavajú. Pomocou psychologicky inšpirovaných meraní výskumníci odhalili rozšírené stereotypné zaujatosti naprieč kategóriami rasy, pohlavia, náboženstva a zdravia v ôsmich modeloch orientovaných na hodnoty.

Zistenia MIT ponúkajú podľa profesora Amína Saberiho zo Stanfordu „zriedkavý teoretický pohľad na mechanizmus pozornosti v jadre transformer modelu“, ktorý poskytuje matematickú jasnosť aj praktické poznatky pre reálne systémy. Keďže sa LLM čoraz viac integrujú do kritických aplikácií, pochopenie a riešenie týchto inherentných zaujatostí bude kľúčové pre vývoj spravodlivých a spoľahlivých AI technológií.

Source:

MIT odhaľuje kľúčový mechanizmus zaujatosti veľkých jazykových modelov

Latest News

MIT priekopníkom v sociálne uvedomelých AI vzdelávacích platformách

Prelomová robotická koža prináša strojom ľudský dotyk

Meta uvádza LLaMA 4: Revolúcia hlasového ovládania v AI

Home Depot digitalizuje odborné poradenstvo pomocou AI asistenta Magic Apron

Shield AI získava 240 miliónov dolárov v čase akcelerujúceho boomu obranných technológií

AI-navrhnutý liek Rentosertib ukazuje sľubné výsledky v prelomovej klinickej štúdii

Technologickí giganti predstavili pokročilé funkcie AI chatbotov pre podniky

Švajčiarsky prelom v oblasti umelej inteligencie znižuje uhlíkovú stopu cementu

OpenAI dosiahol hranicu 10 miliárd dolárov v tržbách vďaka zrýchľujúcej sa adopcii AI

Google predstavuje Gemini 2.5 Flash s vylepšeným výkonom pri programovaní

MIT odhaľuje kľúčový mechanizmus zaujatosti veľkých jazykových modelov

Related Articles

Meta uvádza LLaMA 4: Revolúcia hlasového ovládania v AI

Rozdiel v adopcii AI medzi ženami ohrozuje rovnosť na pracovisku

Predstavený globálny etický rámec pre umelú inteligenciu v zdravotníctve

Globálna koalícia predstavila prelomový etický rámec pre AGI

OpenAI zmarilo 10 štátom podporovaných kampaní zneužívajúcich AI

Latest News

MIT priekopníkom v sociálne uvedomelých AI vzdelávacích platformách

Prelomová robotická koža prináša strojom ľudský dotyk

Meta uvádza LLaMA 4: Revolúcia hlasového ovládania v AI

Home Depot digitalizuje odborné poradenstvo pomocou AI asistenta Magic Apron

Shield AI získava 240 miliónov dolárov v čase akcelerujúceho boomu obranných technológií

AI-navrhnutý liek Rentosertib ukazuje sľubné výsledky v prelomovej klinickej štúdii

Technologickí giganti predstavili pokročilé funkcie AI chatbotov pre podniky

Švajčiarsky prelom v oblasti umelej inteligencie znižuje uhlíkovú stopu cementu

OpenAI dosiahol hranicu 10 miliárd dolárov v tržbách vďaka zrýchľujúcej sa adopcii AI

Google predstavuje Gemini 2.5 Flash s vylepšeným výkonom pri programovaní