menu
close

Gemini 2.5 Pro da Google Evolui para Modelo Avançado do Mundo

A Google anunciou planos para transformar o Gemini 2.5 Pro num sofisticado 'modelo do mundo', capaz de compreender, simular e planear em ambientes complexos. Este avanço permitirá à IA criar planos e imaginar novas experiências ao modelar aspetos do mundo de forma semelhante à cognição humana. A empresa revelou ainda que o Gemini 2.5 Flash já está amplamente disponível, com o 2.5 Pro a chegar em breve, ambos com segurança reforçada e novas capacidades como o Deep Think para raciocínio complexo.
Gemini 2.5 Pro da Google Evolui para Modelo Avançado do Mundo

A Google está a dar um passo significativo na inteligência artificial ao expandir o Gemini 2.5 Pro para se tornar um 'modelo do mundo' abrangente, capaz de compreender e simular aspetos da realidade de formas que refletem a cognição humana.

Os modelos do mundo representam uma mudança fundamental nas capacidades da IA, indo além do processamento de linguagem para criar representações internas de ambientes físicos. O conceito centra-se em como agentes inteligentes podem compreender e modelar ambientes interativos externos para melhorar as suas capacidades de decisão e planeamento. Inicialmente desenvolvidos para modelar interações físicas de baixo nível, os modelos do mundo expandiram-se para simulação do mundo real e geração de ambientes complexos e realistas.

Estes sistemas de IA sofisticados simulam ambientes do mundo real recorrendo a vastos conjuntos de dados multimodais, incluindo imagens, áudio, vídeo e texto. Esta capacidade permite à IA prever os resultados de várias ações, melhorando o seu raciocínio e planeamento. Os modelos do mundo preenchem eficazmente a lacuna entre dados brutos e insights acionáveis, facilitando interações mais intuitivas entre máquinas e os seus ambientes.

A Google anunciou que está a trabalhar para expandir o Gemini 2.5 Pro para se tornar um modelo do mundo "capaz de fazer planos e imaginar novas experiências ao compreender e simular aspetos do mundo, tal como o cérebro faz." Este desenvolvimento representa um avanço significativo na estratégia de IA da Google, potencialmente permitindo uma resolução de problemas mais sofisticada em vários domínios.

Para além desta evolução ambiciosa, a Google partilhou várias atualizações da família de modelos Gemini. O Gemini 2.5 Flash já está disponível para todos na aplicação Gemini, com uma versão atualizada a tornar-se geralmente disponível no Google AI Studio para programadores e no Vertex AI para empresas no início de junho, seguindo-se o Gemini 2.5 Pro.

O Gemini 2.5 Pro será reforçado com o Deep Think, um modo experimental de raciocínio concebido para tarefas altamente complexas de matemática e programação. A Google está também a introduzir novas capacidades em ambos os modelos, incluindo salvaguardas de segurança avançadas. A nova abordagem de segurança aumentou significativamente a proteção contra ataques indiretos de injeção de prompts durante a utilização de ferramentas, tornando a família Gemini 2.5 a série de modelos mais segura da empresa até à data.

Estes desenvolvimentos surgem numa altura em que a concorrência no setor da IA se intensifica, com empresas como a Nvidia e startups como a World Labs também a trabalhar em tecnologia de modelos do mundo. O que os grandes modelos de linguagem são para sistemas como o ChatGPT, os modelos do mundo são para simuladores de mundos virtuais necessários para treinar robôs e outros sistemas de IA. Estas ferramentas podem produzir ambientes e simulações 3D que ajudam os robôs a compreender, planear e navegar melhor nos seus arredores.

À medida que a Google continua a ultrapassar os limites das capacidades da IA, a evolução do Gemini 2.5 Pro para um modelo do mundo assinala uma nova era em que a inteligência artificial não só processa informação, mas também compreende, prevê e interage com o mundo de formas cada vez mais semelhantes às humanas.

Source:

Latest News