Google преобразует свою самую продвинутую модель искусственного интеллекта Gemini 2.5 Pro в так называемую «мировую модель» — систему, способную понимать и моделировать аспекты реальности так, как это делает человеческий мозг.
Согласно недавним заявлениям Google DeepMind на конференции Google I/O 2025, эта функция мировой модели позволит Gemini строить планы и воображать новые сценарии, понимая и моделируя различные стороны окружающего мира. Это означает значительный шаг вперёд в способности ИИ рассуждать и взаимодействовать со сложными средами.
«Именно поэтому мы работаем над тем, чтобы расширить наш лучший мультимодальный базовый ИИ Gemini 2.5 Pro, превратив его в “мировую модель”, способную строить планы и воображать новые сценарии, понимая и моделируя аспекты мира так же, как это делает мозг», — говорится в официальном блоге Google.
Подход мировой модели основан на обширных исследованиях Google по обучению ИИ-агентов работе со сложными играми и созданию интерактивных симуляций. Признаки этих возможностей уже проявляются в умении Gemini использовать знания о мире и логическое мышление для представления природных сред, понимания интуитивной физики, а также обучения роботов следованию инструкциям и быстрой адаптации.
Ключевым элементом этой эволюции стала новая функция Deep Think — экспериментальный режим расширенного рассуждения для Gemini 2.5 Pro. Deep Think позволяет модели рассматривать несколько гипотез перед формированием ответа, что значительно повышает эффективность при решении сложных математических и программных задач. Уже сейчас функция демонстрирует впечатляющие результаты на сложных тестах, таких как математическая олимпиада USAMO 2025 и LiveCodeBench для программирования.
Gemini 2.5 Pro с Deep Think в настоящее время доступен доверенным тестировщикам через API Gemini, а Google проводит дополнительные проверки безопасности перед более широким запуском. Ожидается, что стандартная версия Gemini 2.5 Pro станет общедоступной к концу июня 2025 года, после более раннего релиза Gemini 2.5 Flash.
Продвижение к мировой модели — часть более широкой стратегии Google по созданию универсального ИИ-ассистента, способного понимать контекст, эффективно планировать и действовать на разных устройствах, что в перспективе должно изменить способы взаимодействия человека с ИИ.