Google transformuje svoj najpokročilejší AI model, Gemini 2.5 Pro, na takzvaný 'model sveta' – systém, ktorý dokáže chápať a simulovať aspekty reality spôsobom, ktorý napodobňuje fungovanie ľudského mozgu.
Podľa nedávnych oznámení Google DeepMind na konferencii Google I/O 2025 táto schopnosť modelu sveta umožní Gemini plánovať a predstavovať si nové skúsenosti na základe chápania a simulácie sveta. Ide o zásadný posun v schopnosti AI uvažovať o zložitých prostrediach a interagovať s nimi.
„Preto pracujeme na rozšírení nášho najlepšieho multimodálneho základného modelu, Gemini 2.5 Pro, aby sa stal 'modelom sveta', ktorý dokáže plánovať a predstavovať si nové skúsenosti na základe chápania a simulácie sveta, podobne ako to robí mozog,“ uviedol Google na svojom oficiálnom blogu.
Prístup modelu sveta nadväzuje na rozsiahly výskum Googlu v oblasti trénovania AI agentov na zvládanie komplexných hier a tvorbu interaktívnych simulácií. Dôkazy o týchto schopnostiach sa už objavujú v tom, ako Gemini využíva poznatky o svete a uvažovanie na reprezentáciu prirodzených prostredí, pochopenie intuitívnej fyziky či učenie robotov plniť pokyny a prispôsobovať sa v reálnom čase.
Kľúčovým prvkom tohto vývoja je nová funkcia Deep Think, experimentálny režim rozšíreného uvažovania pre Gemini 2.5 Pro. Deep Think umožňuje modelu zvážiť viacero hypotéz pred odpoveďou, čo výrazne zlepšuje výkon pri riešení zložitých matematických a programátorských úloh. Táto funkcia už dosiahla pôsobivé výsledky v náročných benchmarkoch, ako sú matematická súťaž USAMO 2025 a LiveCodeBench pre programovanie.
Gemini 2.5 Pro s Deep Think je momentálne dostupný dôveryhodným testerom prostredníctvom Gemini API, pričom Google vykonáva ďalšie bezpečnostné hodnotenia pred širším sprístupnením. Štandardný model Gemini 2.5 Pro by mal byť všeobecne dostupný koncom júna 2025, po skoršom vydaní Gemini 2.5 Flash.
Tento pokrok smerom k modelovaniu sveta je súčasťou širšej vízie Googlu vytvoriť univerzálneho AI asistenta, ktorý dokáže chápať kontext, efektívne plánovať a konať naprieč zariadeniami – a tým zásadne zmeniť spôsob, akým ľudia interagujú s AI systémami.