OpenAI расширила линейку своих моделей для рассуждений, выпустив o3-mini — компактную, но мощную новинку серии «o», которая расширяет границы возможностей малых ИИ-моделей.
Представленная как самая экономичная модель в линейке reasoning-моделей OpenAI, o3-mini демонстрирует выдающиеся результаты в STEM-областях, сохраняя низкую стоимость и малую задержку, как и её предшественник. Модель выводит на новый уровень возможности малых моделей, обеспечивая выдающиеся способности в науке, математике и программировании — при этом сохраняя низкую стоимость и задержку, как у OpenAI o1-mini.
Как и её предшественник o1, o3-mini оптимизирована для задач рассуждения в STEM. При среднем уровне рассуждения она достигает показателей o1 в математике, программировании и науке, но отвечает быстрее. По оценкам экспертов, o3-mini даёт более точные и ясные ответы, демонстрируя более сильные способности к рассуждению по сравнению с o1-mini. Внешние тестировщики предпочли ответы o3-mini ответам o1-mini более чем в половине случаев. Модель также совершила на 39% меньше «серьёзных ошибок» на «сложных реальных вопросах» в A/B-тестах по сравнению с o1-mini и выдавала более «ясные» ответы примерно на 24% быстрее.
Одним из ключевых новшеств o3-mini стала гибкость в рассуждении. Разработчики могут выбирать между тремя уровнями усилий рассуждения — низким, средним и высоким — чтобы оптимизировать модель под свои задачи. Такая гибкость позволяет o3-mini «думать усерднее» при решении сложных задач или отдавать приоритет скорости, если важна задержка.
Это первая компактная reasoning-модель OpenAI, поддерживающая востребованные разработчиками функции: вызов функций, структурированные ответы и сообщения для разработчиков, что делает её готовой к промышленному использованию с момента запуска. В рамках релиза OpenAI утроила лимит сообщений для пользователей Plus и Team: с 50 сообщений в день для o1-mini до 150 сообщений в день для o3-mini. Кроме того, o3-mini теперь работает с поиском, чтобы находить актуальные ответы с ссылками на релевантные веб-источники. С сегодняшнего дня пользователи бесплатного тарифа также могут попробовать o3-mini, выбрав «Reason» в редакторе сообщений или перегенерировав ответ — впервые reasoning-модель стала доступна бесплатным пользователям ChatGPT.
Выход o3-mini происходит в стратегически важный момент для OpenAI, поскольку компания готовится к запуску более мощных моделей o3 и o4-mini. В посте на X генеральный директор Сэм Альтман сообщил, что компания выпустит две новые модели — o3 и o4-mini — в ближайшие недели, а GPT-5 ожидается через несколько месяцев. С апреля 2025 года o3-mini полностью заменена на o4-mini в ChatGPT и API. o4-mini обеспечивает лучшие результаты по большинству бенчмарков, поддерживает нативный мультимодальный ввод и сохраняет совместимость с инструментами — при этом оставаясь быстрее и доступнее, чем o3.