Los principales proveedores de servicios en la nube están avanzando rápidamente en sus estrategias de chips de IA personalizados, transformando el panorama competitivo de la infraestructura de inteligencia artificial.
Como una empresa con una tasa de adopción relativamente alta de chips desarrollados internamente, Google ha comenzado el despliegue masivo de sus chips TPU v6e enfocados en inferencia de IA, los cuales se han vuelto predominantes en la primera mitad de 2025. TrendForce destacó que el crecimiento de servidores de Google ha sido impulsado principalmente por proyectos de nube soberana y nueva capacidad de centros de datos en el sudeste asiático. El TPU v6e, también conocido como Trillium, representa un avance significativo en el portafolio de hardware de IA de Google, presumiendo un aumento de 4.7 veces en el rendimiento máximo de cómputo por chip en comparación con el TPU v5e, además de duplicar la capacidad y el ancho de banda de la memoria de alto rendimiento (HBM).
Amazon Web Services (AWS) se enfoca en escalar su plataforma Trainium v2 desarrollada internamente, mientras desarrolla varias variantes de Trainium v3, programadas para producción masiva en 2026. Se espera que AWS lidere a todos los CSP de EE. UU. en envíos de chips de IA propios este año, duplicando sus volúmenes de 2024. El chip AWS Trainium2 ofrece hasta 4 veces el rendimiento de la primera generación de Trainium, con instancias Amazon EC2 Trn2 basadas en Trainium2 diseñadas específicamente para IA generativa y optimizadas para entrenar y desplegar modelos con cientos de miles de millones hasta billones de parámetros.
Oracle, en comparación con otros CSP principales, está más enfocado en la compra de servidores de IA y servidores de bases de datos en memoria (IMDB). En 2025, Oracle planea intensificar el despliegue de infraestructura de servidores de IA e integrar sus servicios principales de bases de datos en la nube con aplicaciones de IA. Larry Ellison, cofundador de Oracle, ha destacado la posición única de la compañía debido a la enorme cantidad de datos empresariales almacenados en sus bases de datos. La versión más reciente de su base de datos, Oracle 23ai, está específicamente adaptada a las necesidades de cargas de trabajo de IA y es "la única base de datos que puede poner todos los datos del cliente instantáneamente a disposición de todos los modelos de IA populares, preservando completamente la privacidad del cliente".
La tendencia hacia chips de IA personalizados representa un giro estratégico para los proveedores de nube que buscan optimizar el rendimiento mientras reducen costos y dependencia de proveedores externos. Estos aceleradores personalizados como AWS Trainium y los TPU de Google compiten directamente con las GPU A100/H100 de NVIDIA, pero se diferencian por su integración fluida en la nube, precios predecibles e infraestructura optimizada.
Según el análisis más reciente de TrendForce, los principales CSP de Norteamérica siguen siendo los principales impulsores del crecimiento del mercado de servidores de IA, con una demanda constante también respaldada por centros de datos de nivel 2 y proyectos de nube soberana en Medio Oriente y Europa. A pesar de las tensiones geopolíticas y las restricciones de exportación de EE. UU. que afectan al mercado chino, se proyecta que los envíos globales de servidores de IA crecerán un 24.3% interanual. Este sólido crecimiento subraya cómo la IA se está volviendo central en las ofertas de servicios en la nube e impulsa inversiones significativas en infraestructura en toda la industria.