Amazon Web Services (AWS) vient d'annoncer une avancée majeure dans sa stratégie de développement de puces d'IA auto-conçues lors du lancement de Trainium3 et du système Trainium3 UltraServer lors de l'événement AWS re:Invent 2025.
Il s'agit de la génération de puces 3 nanomètres la plus puissante de l'entreprise optimisée pour la formation et la réflexion sur le modèle d'IA à grande échelle.
Selon AWS Trainium3 offre quatre fois plus de performances que la génération précédente et possède une capacité de mémoire quatre fois supérieure ce qui est adapté aux modèles d'IA nécessitant des traitements complexes.
UltraServer est le système d'accompagnement qui peut contenir jusqu'à 144 puces et permettre la connexion de milliers de clusters de serveurs entre eux atteignant un maximum d'un million de puces Trainium3 fonctionnant en parallèle soit 10 fois plus que la capacité d'extension de la génération précédente.
Un point souligné est la capacité d'économie d'énergie lorsque Trainium3 réduit jusqu'à 40 % sa consommation d'énergie par rapport à sa gamme de puces précédente.
Dans un contexte où les centres de données consomment de plus en plus d'énergie AWS a déclaré que l'optimisation de l'énergie apporte deux avantages : elle permet de réduire les coûts d'exploitation d'Amazon et d'aider les clients à utiliser les services d'IA cloud plus économiquement.
De nombreuses entreprises telles qu'Anthropic LLM Karakuri (Japon) Splashmusic ou Decart ont testé la nouvelle génération de puces et ont noté une réduction significative des coûts de raisonnement. Cela montre que le système Trainium3 n'est pas seulement puissant en termes de technique mais aussi attrayant en termes de coûts.
AWS a également dévoilé pour la première fois Trainium4 la prochaine génération de puces en cours de développement. Le point le plus notable est que Trainium4 prendra en charge NVLink Fusion la technologie de connexion haut débit de Nvidia.
Cela signifie que la puce Trainium4 peut fonctionner en parallèle et étendre ses performances avec le GPU Nvidia créant un grand avantage concurrentiel sur le marché de l'infrastructure d'IA qui dépend fortement de CUDA.
Bien qu'il n'ait pas encore annoncé la date de sortie de Trainium4 AWS partagera probablement davantage d'informations lors de l'événement re:Invent l'année prochaine pour continuer à consolider sa position de concurrent redoutable de Nvidia dans l'écosystème de l'IA.