A OpenAI expandiu a sua linha de modelos de raciocínio com o lançamento do o3-mini, uma adição mais pequena mas poderosa à sua série "o" que desafia os limites do que modelos compactos de IA conseguem alcançar.
Apresentado como o modelo mais eficiente em termos de custos da série de raciocínio da OpenAI, o o3-mini oferece um desempenho excecional nas áreas STEM, mantendo o baixo custo e a latência reduzida do seu antecessor. O modelo eleva os limites do que modelos pequenos conseguem atingir, proporcionando capacidades STEM excecionais — com especial destaque para ciência, matemática e programação — tudo isto mantendo o baixo custo e a latência reduzida do OpenAI o1-mini.
Tal como o seu antecessor o1, o o3-mini foi otimizado para raciocínio em STEM. Com um esforço de raciocínio médio, iguala o desempenho do o1 em matemática, programação e ciência, ao mesmo tempo que oferece respostas mais rápidas. Avaliações realizadas por especialistas demonstraram que o o3-mini produz respostas mais precisas e claras, com capacidades de raciocínio superiores ao o1-mini. Testadores externos preferiram as respostas do o3-mini em relação às do o1-mini em mais de metade das vezes. O modelo também cometeu menos 39% de "erros graves" em "questões reais difíceis" em testes A/B face ao o1-mini, e produziu respostas "mais claras" enquanto fornecia respostas cerca de 24% mais rapidamente.
Uma das principais inovações do o3-mini é a sua capacidade de raciocínio flexível. Os programadores podem escolher entre três opções de esforço de raciocínio — baixo, médio e alto — para otimizar de acordo com os seus casos de uso específicos. Esta flexibilidade permite ao o3-mini "pensar mais a fundo" ao enfrentar desafios complexos ou priorizar a velocidade quando a latência é uma preocupação.
O modelo é o primeiro modelo pequeno de raciocínio da OpenAI a suportar funcionalidades muito requisitadas pelos programadores, incluindo chamadas de função, outputs estruturados e mensagens de programador, tornando-o pronto para produção desde o lançamento. Como parte deste lançamento, a OpenAI triplicou o limite de mensagens para utilizadores Plus e Team, passando de 50 mensagens por dia com o o1-mini para 150 mensagens por dia com o o3-mini. Adicionalmente, o o3-mini já funciona com pesquisa para encontrar respostas atualizadas com links para fontes relevantes na web. A partir de hoje, os utilizadores do plano gratuito também podem experimentar o o3-mini ao selecionar 'Raciocínio' no compositor de mensagens ou ao regenerar uma resposta — marcando a primeira vez que um modelo de raciocínio está disponível para utilizadores gratuitos no ChatGPT.
O lançamento do o3-mini surge num momento estratégico para a OpenAI, à medida que a empresa se prepara para o lançamento iminente dos seus modelos mais avançados o3 e o4-mini. Numa publicação partilhada no X, o CEO Sam Altman anunciou que a empresa irá lançar dois novos modelos — o3 e o4-mini — nas próximas semanas, estando o GPT-5 previsto para alguns meses depois. A partir de abril de 2025, o o3-mini foi totalmente substituído pelo o4-mini no ChatGPT e na API. O o4-mini oferece melhor desempenho na maioria dos benchmarks, acrescenta input multimodal nativo e mantém a compatibilidade com ferramentas — tudo isto continuando mais rápido e acessível do que o o3.