Google podniká významný krok vpřed v oblasti umělé inteligence tím, že rozšiřuje Gemini 2.5 Pro na komplexní „světový model“, který dokáže chápat a simulovat aspekty reality způsobem, jenž odráží lidské myšlení.
Světové modely představují zásadní posun ve schopnostech AI – posouvají se za hranice zpracování jazyka a vytvářejí vnitřní reprezentace fyzických prostředí. Tento koncept se zaměřuje na to, jak inteligentní agenti mohou chápat a modelovat vnější interaktivní prostředí, aby zlepšili své rozhodování a plánovací schopnosti. Původně byly světové modely vyvíjeny pro modelování nízkoúrovňových fyzikálních interakcí, dnes se rozšiřují na simulaci skutečného světa a generování komplexních, realistických prostředí.
Tyto sofistikované AI systémy simulují reálná prostředí pomocí rozsáhlých multimodálních datových sad, které zahrnují obrázky, zvuk, video i text. Díky této schopnosti může AI předvídat výsledky různých akcí, což posiluje její uvažování a plánování. Světové modely tak efektivně překonávají propast mezi surovými daty a praktickými poznatky a umožňují intuitivnější interakci strojů s jejich okolím.
Google oznámil, že pracuje na rozšíření Gemini 2.5 Pro tak, aby se stal světovým modelem „který dokáže plánovat a představovat si nové zážitky tím, že rozumí a simuluje aspekty světa, podobně jako to dělá mozek“. Tento vývoj představuje významný posun v AI strategii Googlu a potenciálně umožní sofistikovanější řešení problémů napříč různými oblastmi.
Kromě této ambiciózní evoluce Google sdílel několik novinek týkajících se rodiny modelů Gemini. Gemini 2.5 Flash je nyní dostupný všem v aplikaci Gemini, aktualizovaná verze bude obecně dostupná v Google AI Studiu pro vývojáře a ve Vertex AI pro firmy začátkem června, následovat bude Gemini 2.5 Pro.
Gemini 2.5 Pro bude rozšířen o Deep Think, experimentální režim uvažování určený pro vysoce komplexní matematické a programátorské úlohy. Google také přináší nové funkce do obou modelů, včetně pokročilých bezpečnostních opatření. Nový bezpečnostní přístup výrazně zvýšil ochranu proti nepřímým útokům typu prompt injection při používání nástrojů, díky čemuž je rodina Gemini 2.5 dosud nejbezpečnější sérií modelů.
Tyto novinky přicházejí v době, kdy se konkurence v oblasti AI zostřuje – společnosti jako Nvidia i startupy jako World Labs také pracují na technologii světových modelů. Zatímco velké jazykové modely jsou základem systémů typu ChatGPT, světové modely jsou klíčové pro simulátory virtuálních světů potřebné k trénování robotů a dalších AI systémů. Tyto nástroje umožňují vytvářet 3D prostředí a simulace, které pomáhají robotům lépe chápat, plánovat a orientovat se ve svém okolí.
Jak Google dále posouvá hranice možností AI, evoluce Gemini 2.5 Pro ve světový model signalizuje novou éru, kdy umělá inteligence nebude jen zpracovávat informace, ale také chápat, předvídat a interagovat se světem stále lidštějším způsobem.