Google přetváří svůj nejpokročilejší AI model, Gemini 2.5 Pro, v takzvaný 'model světa' – systém, který dokáže porozumět a simulovat aspekty reality způsobem připomínajícím fungování lidského mozku.
Podle nedávných oznámení Google DeepMind na konferenci Google I/O 2025 umožní tato schopnost modelu světa Gemini plánovat a představovat si nové zážitky díky pochopení a simulaci různých aspektů světa. Jde o zásadní posun ve schopnosti AI uvažovat o složitých prostředích a interagovat s nimi.
"Proto pracujeme na tom, abychom náš nejlepší multimodální základní model, Gemini 2.5 Pro, rozšířili na 'model světa', který dokáže plánovat a představovat si nové zážitky díky porozumění a simulaci aspektů světa, stejně jako to dělá mozek," uvedl Google na svém oficiálním blogu.
Přístup modelu světa navazuje na rozsáhlý výzkum Googlu v oblasti trénování AI agentů k zvládání složitých her a vytváření interaktivních simulací. Důkazy těchto schopností se již objevují v tom, jak Gemini využívá znalosti o světě a uvažování k reprezentaci přírodního prostředí, pochopení intuitivní fyziky a výuce robotů, jak plnit instrukce a adaptovat se v reálném čase.
Středobodem tohoto vývoje je nová funkce Deep Think, experimentální režim rozšířeného uvažování pro Gemini 2.5 Pro. Deep Think umožňuje modelu zvažovat více hypotéz před odpovědí, což výrazně zlepšuje výkon při řešení složitých matematických a programovacích úloh. Funkce již dosáhla působivých výsledků v náročných benchmarcích, jako je matematická soutěž USAMO 2025 a LiveCodeBench pro programování.
Gemini 2.5 Pro s funkcí Deep Think je v současnosti dostupný důvěryhodným testerům prostřednictvím Gemini API, přičemž Google provádí další bezpečnostní hodnocení před širším zpřístupněním. Standardní model Gemini 2.5 Pro by měl být obecně dostupný koncem června 2025, po dřívějším vydání verze Gemini 2.5 Flash.
Tento posun směrem k modelování světa je součástí širší vize Googlu vytvořit univerzálního AI asistenta, který dokáže chápat kontext, efektivně plánovat a jednat napříč zařízeními – a zásadně tak proměnit způsob, jakým lidé s AI systémy interagují.