Google DeepMind работает над тем, чтобы превратить свою самую передовую мультимодальную базовую модель Gemini 2.5 Pro в так называемую «модель мира» — систему искусственного интеллекта, способную понимать и симулировать аспекты реального мира, имитируя когнитивные процессы человека.
Об этом было объявлено на конференции Google I/O 2025. Амбициозная инициатива направлена на создание ИИ, который может строить планы и воображать новые сценарии, моделируя работу окружающего мира. По словам генерального директора DeepMind Демиса Хассабиса, эта способность является фундаментальным прорывом в области искусственного интеллекта, выходящим за рамки простых классификации и предсказания.
«Именно поэтому мы работаем над тем, чтобы расширить возможности нашей лучшей мультимодальной базовой модели Gemini 2.5 Pro, превратив её в “модель мира”, которая сможет строить планы и воображать новые сценарии, понимая и симулируя аспекты мира так же, как это делает мозг», — пояснил Хассабис в недавнем блоге.
Google уже видит первые признаки появления таких возможностей моделирования мира: Gemini умеет представлять и симулировать природные среды, понимать интуитивную физику с помощью модели Veo, а также обучать роботов захвату объектов и выполнению инструкций через Gemini Robotics.
Компания называет это развитие критическим шагом к созданию «универсального AI-ассистента» — интеллектуальной системы, которая понимает контекст, может планировать и действовать на любых устройствах. В конечном итоге Google планирует превратить приложение Gemini в ассистента, способного выполнять повседневные задачи, заниматься административной работой и давать персонализированные рекомендации.
Возможности «модели мира» опираются на уже впечатляющие способности Gemini 2.5 Pro к рассуждению. Модель лидирует в бенчмарках по сложной математике, науке и программированию, а также занимает первое место в рейтингах LMArena и WebDev Arena, оценивающих предпочтения пользователей при взаимодействии с ИИ.
Google планирует интегрировать эти возможности моделирования мира с технологиями из проектов Project Mariner и Project Astra, которые сосредоточены на многозадачности и визуальном восприятии соответственно. Ожидается, что обновлённая Gemini 2.5 Pro станет общедоступной в июне 2025 года после завершения текущей фазы предварительного тестирования.