Google poduzima značajan korak naprijed u području umjetne inteligencije proširujući Gemini 2.5 Pro kako bi postao sveobuhvatni 'svjetski model' sposoban razumjeti i simulirati aspekte stvarnosti na načine koji oponašaju ljudsku spoznaju.
Svjetski modeli predstavljaju temeljni pomak u mogućnostima umjetne inteligencije, prelazeći granice obrade jezika i stvarajući interne prikaze fizičkih okruženja. Koncept se fokusira na to kako inteligentni agenti mogu razumjeti i modelirati vanjska interaktivna okruženja radi poboljšanja svojih sposobnosti donošenja odluka i planiranja. Prvotno razvijeni za modeliranje niskorazinskih fizičkih interakcija, svjetski modeli proširili su se na simulaciju stvarnog svijeta i generiranje složenih, realističnih okruženja.
Ovi sofisticirani AI sustavi simuliraju stvarna okruženja koristeći opsežne multimodalne skupove podataka, uključujući slike, zvuk, video i tekst. Ta sposobnost omogućuje AI-u predviđanje ishoda različitih radnji, poboljšavajući njegove mogućnosti rezoniranja i planiranja. Svjetski modeli učinkovito premošćuju jaz između sirovih podataka i primjenjivih uvida, olakšavajući intuitivniju interakciju između strojeva i njihovih okruženja.
Google je najavio kako radi na proširenju Gemini 2.5 Pro u svjetski model "koji može planirati i zamišljati nova iskustva razumijevanjem i simuliranjem aspekata svijeta, baš kao što to čini mozak." Ovaj razvoj predstavlja značajan napredak u Googleovoj AI strategiji, potencijalno omogućujući sofisticiranije rješavanje problema u raznim područjima.
Uz ovu ambicioznu evoluciju, Google je podijelio i nekoliko novosti o svojoj Gemini obitelji modela. Gemini 2.5 Flash sada je dostupan svima u Gemini aplikaciji, a ažurirana verzija bit će općenito dostupna u Google AI Studio za developere i u Vertex AI za poduzeća početkom lipnja, nakon čega slijedi Gemini 2.5 Pro.
Gemini 2.5 Pro bit će unaprijeđen s Deep Thinkom, eksperimentalnim načinom rezoniranja namijenjenim izuzetno složenim matematičkim i programerskim zadacima. Google također donosi nove mogućnosti u oba modela, uključujući napredne sigurnosne mjere. Njihov novi sigurnosni pristup značajno je povećao zaštitu od neizravnih napada putem promptova tijekom korištenja alata, čime je Gemini 2.5 obitelj postala njihova najsigurnija serija modela do sada.
Ovi razvojni pomaci dolaze u trenutku kada se konkurencija na AI tržištu intenzivira, a tvrtke poput Nvidije i startupi poput World Labsa također rade na tehnologiji svjetskih modela. Ono što su veliki jezični modeli za sustave poput ChatGPT-a, to su svjetski modeli za virtualne simulatore potrebne za treniranje robota i drugih AI sustava. Ovi alati mogu generirati 3D okruženja i simulacije koje pomažu robotima da bolje razumiju, planiraju i navigiraju svojim okruženjem.
Kako Google nastavlja pomicati granice mogućnosti umjetne inteligencije, evolucija Gemini 2.5 Pro u svjetski model označava novu eru u kojoj umjetna inteligencija ne može samo obrađivati informacije, već i razumjeti, predviđati i interagirati sa svijetom na sve ljudskiji način.