Os principais provedores de serviços de nuvem estão avançando rapidamente em suas estratégias de chips de IA personalizados, remodelando o cenário competitivo da infraestrutura de inteligência artificial.
Como uma empresa com uma taxa de adoção relativamente alta de chips desenvolvidos internamente, o Google iniciou a implantação em massa de seus chips TPU v6e, focados em inferência de IA, que se tornaram predominantes no primeiro semestre de 2025. A TrendForce destacou que o crescimento dos servidores do Google tem sido impulsionado principalmente por projetos de nuvem soberana e pela expansão da capacidade de data centers no Sudeste Asiático. O TPU v6e, também conhecido como Trillium, representa um avanço significativo no portfólio de hardware de IA do Google, apresentando um aumento de 4,7 vezes no desempenho máximo de computação por chip em comparação ao TPU v5e, com o dobro da capacidade e largura de banda de High Bandwidth Memory (HBM).
A Amazon Web Services (AWS) está focada em ampliar sua plataforma Trainium v2 desenvolvida internamente, enquanto desenvolve diversas variantes do Trainium v3, previstas para produção em massa em 2026. A expectativa é que a AWS lidere todos os provedores de nuvem dos EUA em remessas de chips de IA próprios neste ano, dobrando os volumes de 2024. O chip AWS Trainium2 oferece até 4 vezes o desempenho da primeira geração do Trainium, com instâncias Amazon EC2 Trn2 baseadas no Trainium2 projetadas especificamente para IA generativa e otimizadas para treinar e implantar modelos com centenas de bilhões a trilhões de parâmetros.
A Oracle, em comparação com outros grandes provedores de nuvem, está mais focada na aquisição de servidores de IA e servidores de banco de dados em memória (IMDB). Em 2025, a Oracle planeja intensificar a implantação de infraestrutura de servidores de IA e integrar seus principais serviços de banco de dados em nuvem com aplicações de IA. O cofundador da Oracle, Larry Ellison, destacou a posição única da empresa devido à vasta quantidade de dados corporativos armazenados em seus bancos de dados. A versão mais recente do seu banco de dados, Oracle 23ai, é especificamente adaptada às necessidades de cargas de trabalho de IA e é "o único banco de dados capaz de tornar todos os dados dos clientes instantaneamente disponíveis para todos os modelos populares de IA, preservando totalmente a privacidade dos clientes".
A tendência em direção a chips de IA personalizados representa uma mudança estratégica para os provedores de nuvem que buscam otimizar desempenho, reduzir custos e diminuir a dependência de fornecedores terceirizados. Esses aceleradores personalizados, como o AWS Trainium e os TPUs do Google, competem diretamente com as GPUs NVIDIA A100/H100, mas se diferenciam pela integração perfeita à nuvem, preços previsíveis e infraestrutura otimizada.
De acordo com a última análise da TrendForce, os principais provedores de nuvem da América do Norte continuam sendo os principais impulsionadores do crescimento do mercado de servidores de IA, com uma demanda constante também reforçada por data centers de segundo nível e projetos de nuvem soberana no Oriente Médio e na Europa. Apesar das tensões geopolíticas e das restrições de exportação dos EUA impactarem o mercado chinês, a previsão é de que os embarques globais de servidores de IA cresçam 24,3% ano a ano. Esse crescimento robusto destaca como a IA está se tornando central nas ofertas de serviços em nuvem e impulsionando investimentos significativos em infraestrutura em todo o setor.