menu
close

Gigantes da Cloud Aceleram Corrida à Implementação de Chips de IA Personalizados

A Google iniciou a implementação em massa dos seus chips TPU v6e para inferência de IA, que se tornaram predominantes no primeiro semestre de 2025. Entretanto, a AWS está focada em expandir a sua plataforma Trainium v2 enquanto desenvolve várias variantes do Trainium v3 para produção em 2026, sendo esperado que a AWS lidere todos os fornecedores de serviços cloud dos EUA em envios de chips de IA próprios este ano. Esta tendência assinala uma mudança significativa, à medida que os principais fornecedores de cloud desenvolvem e implementam cada vez mais os seus próprios aceleradores de IA personalizados, em vez de dependerem exclusivamente de soluções de terceiros.
Gigantes da Cloud Aceleram Corrida à Implementação de Chips de IA Personalizados

Os principais fornecedores de serviços cloud estão a avançar rapidamente nas suas estratégias de chips de IA personalizados, remodelando o panorama competitivo da infraestrutura de IA.

Como empresa com uma taxa de adoção relativamente elevada de chips desenvolvidos internamente, a Google iniciou a implementação em massa dos seus chips TPU v6e, focados em inferência de IA, que se tornaram predominantes no primeiro semestre de 2025. A TrendForce destacou que o crescimento dos servidores da Google tem sido impulsionado principalmente por projetos de cloud soberana e pela nova capacidade de centros de dados no Sudeste Asiático. O TPU v6e, também conhecido como Trillium, representa um avanço significativo no portefólio de hardware de IA da Google, apresentando um aumento de 4,7x no desempenho máximo de computação por chip em comparação com o TPU v5e, com o dobro da capacidade e largura de banda de High Bandwidth Memory (HBM).

A Amazon Web Services (AWS) está focada em expandir a sua plataforma Trainium v2 desenvolvida internamente, enquanto desenvolve várias variantes do Trainium v3, cuja produção em massa está agendada para 2026. Espera-se que a AWS lidere todos os CSP dos EUA em envios de chips de IA próprios este ano, duplicando os volumes de 2024. O chip AWS Trainium2 oferece até 4x o desempenho da primeira geração Trainium, com instâncias Amazon EC2 Trn2 baseadas em Trainium2 concebidas especificamente para IA generativa e otimizadas para treinar e implementar modelos com centenas de milhares de milhões a mais de um bilião de parâmetros.

A Oracle, em comparação com os outros grandes CSP, está mais focada na aquisição de servidores de IA e servidores de bases de dados in-memory (IMDB). Em 2025, a Oracle planeia reforçar a implementação de infraestrutura de servidores de IA e integrar os seus principais serviços de bases de dados cloud com aplicações de IA. O cofundador da Oracle, Larry Ellison, destacou a posição única da empresa devido à enorme quantidade de dados empresariais armazenados nas suas bases de dados. A versão mais recente da sua base de dados, Oracle 23ai, foi especificamente concebida para responder às necessidades de cargas de trabalho de IA e é "a única base de dados que pode tornar todos os dados dos clientes instantaneamente disponíveis para todos os modelos de IA populares, preservando totalmente a privacidade dos clientes".

A tendência para chips de IA personalizados representa uma mudança estratégica para os fornecedores de cloud que procuram otimizar o desempenho, reduzindo custos e a dependência de fornecedores terceiros. Estes aceleradores personalizados, como o AWS Trainium e os TPUs da Google, concorrem diretamente com as GPUs NVIDIA A100/H100, mas diferenciam-se pela integração perfeita na cloud, preços previsíveis e infraestrutura otimizada.

De acordo com a mais recente análise da TrendForce, os principais CSP norte-americanos continuam a ser os principais impulsionadores do crescimento do mercado de servidores de IA, com uma procura constante também reforçada por centros de dados de segunda linha e projetos de cloud soberana no Médio Oriente e Europa. Apesar das tensões geopolíticas e das restrições de exportação dos EUA que afetam o mercado chinês, prevê-se que os envios globais de servidores de IA cresçam 24,3% em termos anuais. Este crescimento robusto sublinha como a IA está a tornar-se central nas ofertas de serviços cloud e a impulsionar investimentos significativos em infraestrutura em todo o setor.

Source:

Latest News