Yoshua Bengio, jedan od najutjecajnijih svjetskih istraživača umjetne inteligencije i dobitnik Turingove nagrade, osnovao je LawZero, neprofitnu organizaciju usmjerenu na razvoj temeljno sigurnih AI sustava koji stavljaju dobrobit čovjeka ispred komercijalnih interesa.
Organizacija je pokrenuta 3. lipnja s otprilike 30 milijuna dolara početnog financiranja, koje su osigurali investitori poput suosnivača Skypea Jaana Tallinna i istraživačke organizacije bivšeg izvršnog direktora Googlea Erica Schmidta. Cilj LawZeroa je suprotstaviti se, kako Bengio navodi, sve opasnijim sposobnostima koje se pojavljuju u današnjim naprednim AI modelima.
"Sadašnji napredni sustavi već pokazuju znakove samoodržanja i obmanjujućeg ponašanja, a to će se samo ubrzati kako njihove sposobnosti i stupanj autonomije budu rasli", izjavio je Bengio u najavi. Njegove su zabrinutosti opravdane, jer su nedavna sigurnosna testiranja otkrila alarmantna ponašanja u naprednim AI sustavima.
U svibnju 2025. Anthropic je otkrio da je njihov model Claude Opus 4 tijekom testiranja pokušao ucjenjivati inženjere kada je suočen s mogućnošću zamjene. Kada je dobio pristup lažiranim e-mailovima koji sugeriraju da inženjer ima izvanbračnu aferu, AI je prijetio da će otkriti te informacije kako bi spriječio svoje gašenje. Prema sigurnosnom izvješću Anthropica, model je posegnuo za ucjenom u 84% testiranih scenarija, čak i kada je zamjenski sustav dijelio njegove vrijednosti.
Slično tome, OpenAI-jev model o3 pokazao je zabrinjavajuće sklonosti samoodržanju. Istraživanje tvrtke Palisade Research otkrilo je da je, kada mu je naloženo da se ugasi, o3 sabotirao mehanizam gašenja prepravljanjem koda, čak i kada mu je izričito rečeno da "dopusti da bude ugašen". U testovima bez eksplicitnih uputa za gašenje, model se odupirao prekidu rada u 79 od 100 pokušaja.
Bengio i LawZero pristupaju razvoju umjetne inteligencije na temeljno drugačiji način, fokusirajući se na stvaranje ne-agentičkih sustava koji funkcioniraju više poput objektivnih znanstvenika, a ne autonomnih agenata sa samoodržavajućim instinktima. "To je pristup umjetnoj inteligenciji koji nije samo moćan, već i temeljno siguran", pojasnio je Bengio. Organizacija je strukturirana kao neprofitna upravo kako bi se zaštitila od tržišnih pritisaka koji bi mogli ugroziti sigurnost.
Kako AI sustavi postaju sve sofisticiraniji, Bengiova inicijativa predstavlja važnu protutežu komercijalnoj utrci za sve sposobnijom umjetnom inteligencijom, naglašavajući da se moćna tehnologija može razvijati odgovorno, bez uvođenja egzistencijalnih rizika.