Google прави значителна крачка напред в областта на изкуствения интелект, като разширява Gemini 2.5 Pro до цялостен „световен модел“, който може да разбира и симулира аспекти на реалността по начини, наподобяващи човешкото мислене.
Световните модели представляват фундаментална промяна в способностите на ИИ, преминавайки отвъд обработката на език към създаване на вътрешни представяния на физическата среда. Концепцията се фокусира върху това как интелигентните агенти могат да разбират и моделират външни интерактивни среди, за да подобрят способностите си за вземане на решения и планиране. Първоначално разработени за моделиране на нискониво взаимодействия във физическия свят, световните модели вече се използват за симулация на реални среди и генериране на сложни, реалистични ситуации.
Тези усъвършенствани ИИ системи симулират реални среди, използвайки обширни мултимодални набори от данни, включващи изображения, аудио, видео и текст. Тази способност позволява на ИИ да предсказва резултатите от различни действия, като подобрява разсъжденията и планирането. Световните модели ефективно преодоляват пропастта между суровите данни и приложимите прозрения, улеснявайки по-интуитивното взаимодействие между машините и околната среда.
Google обяви, че работи по разширяването на Gemini 2.5 Pro до световен модел „който може да прави планове и да си представя нови преживявания, като разбира и симулира аспекти на света, както го прави мозъкът“. Това развитие представлява значителен напредък в стратегията на Google за ИИ и потенциално ще позволи по-усъвършенствано решаване на проблеми в различни области.
В допълнение към тази амбициозна еволюция, Google сподели няколко новини за семейството модели Gemini. Gemini 2.5 Flash вече е достъпен за всички в приложението Gemini, а обновена версия ще бъде общодостъпна в Google AI Studio за разработчици и във Vertex AI за предприятия в началото на юни, следвана от Gemini 2.5 Pro.
Gemini 2.5 Pro ще бъде подобрен с Deep Think — експериментален режим за разсъждение, предназначен за изключително сложни задачи по математика и програмиране. Google добавя и нови възможности към двата модела, включително усъвършенствани мерки за сигурност. Новият подход към сигурността значително увеличава защитата срещу индиректни атаки чрез подмяна на инструкции по време на използване на инструменти, което прави серията Gemini 2.5 най-сигурната до момента.
Тези развития идват на фона на засилващата се конкуренция в сферата на ИИ, като компании като Nvidia и стартъпи като World Labs също работят по технологии за световни модели. Докато големите езикови модели са основата на системи като ChatGPT, световните модели са ключови за виртуалните симулатори, необходими за обучение на роботи и други ИИ системи. Тези инструменти могат да създават 3D среди и симулации, които помагат на роботите по-добре да разбират, планират и навигират в заобикалящия ги свят.
Докато Google продължава да разширява границите на възможностите на ИИ, еволюцията на Gemini 2.5 Pro в световен модел бележи нова ера, в която изкуственият интелект не само обработва информация, но и разбира, предсказва и взаимодейства със света по все по-човешки начин.