Google официально выпустила Gemini 2.5 Flash для всех пользователей, что стало значительным шагом вперёд как в возможностях искусственного интеллекта, так и в области безопасности.
Новая версия, уже доступная в приложении Gemini, приносит серьёзные улучшения по нескольким направлениям. По словам главы Google DeepMind Демиса Хассабиса, Gemini 2.5 Flash «лучше практически по всем параметрам», демонстрируя повышенную производительность в задачах на рассуждение, мультимодальность, программирование и работу с длинным контекстом. Особенно впечатляет то, что эти достижения сопровождаются ростом эффективности: модель стала на 22% эффективнее, используя меньше токенов для генерации аналогичных ответов.
Безопасность стала одним из ключевых акцентов этого релиза. Google внедрила передовые меры защиты, которые значительно усиливают устойчивость Gemini к косвенным атакам через внедрение подсказок при использовании инструментов. Такие атаки происходят, когда вредоносные инструкции встраиваются в данные, которые ИИ-модель затем обрабатывает. Благодаря сочетанию усиления самой модели, проверок входных и выходных данных, а также системных ограничений, Gemini 2.5 стала самой защищённой модельной семьёй Google на сегодняшний день.
Разработчики получат доступ к обновлённой версии в Google AI Studio, а корпоративные клиенты — через Vertex AI уже в начале июня; вскоре после этого выйдет и Gemini 2.5 Pro. В релизе появились новые функции для разработчиков, например, «thought summaries» — структурированные сводки рассуждений модели с заголовками и ключевыми деталями, что упрощает понимание и отладку взаимодействий.
Gemini 2.5 Pro будет дополнена экспериментальным режимом Deep Think, специально созданным для решения сложных математических и программных задач. Эта функция позволяет модели рассматривать несколько гипотез перед формированием ответа, что обеспечивает впечатляющие результаты на сложных тестах, таких как математический экзамен USAMO 2025 и LiveCodeBench для соревновательного программирования.
Семейство Gemini 2.5 также вводит новые аудиовозможности, включая встроенную функцию преобразования текста в речь с поддержкой нескольких дикторов на 24 языках. Пользователи могут настраивать тон, акцент и стиль речи ИИ, а модель способна определять эмоции в голосе пользователя и реагировать соответствующим образом.
Благодаря этим улучшениям Google продолжает позиционировать Gemini как ведущую платформу ИИ для частных и корпоративных пользователей, сочетая передовые возможности с усиленными мерами безопасности.