L'année 2025 est considérée comme une étape importante pour l'industrie de l'IA, lorsqu'une série de nouvelles réalisations apparaissent, remodelant l'orientation du développement de l'industrie technologique mondiale. Ne se limitant pas à l'augmentation de la taille du modèle, l'IA cette année montre un changement clair vers l'efficacité, la profondeur algorithmique et la capacité de raisonnement.
Un point culminant majeur est le lancement de DeepSeek R1, un modèle d'IA open source en provenance de Chine. Apparu début 2025, DeepSeek R1 prouve que les systèmes de raisonnement peuvent toujours atteindre des performances élevées sans dépendre d'une infrastructure de calcul massive. L'application du modèle avec des experts et des mécanismes d'attention avancés aide ce modèle d'IA à exploiter efficacement les GPU moins modernes, remettant en question les coûts et la consommation d'énergie dans la formation à l'IA.
Dans le domaine des mathématiques, l'année 2025 marque une étape symbolique lorsque les modèles d'IA d'OpenAI et de Google DeepMind obtiennent des résultats équivalents à la médaille d'or des Olympiades internationales de mathématiques. Cette réalisation montre que l'IA s'est rapprochée de la capacité de raisonnement abstrait à un niveau élevé, dépassant de loin le rôle de création de texte ou d'images. Les chercheurs espèrent que cette capacité aidera à résoudre de nombreux problèmes complexes en cryptographie, en physique théorique et dans d'autres domaines scientifiques de base.
Dans le domaine de la création, les outils de création d'images par l'IA continuent de percer. La fonctionnalité Images for ChatGPT d'OpenAI crée une vague d'art de style Ghibli sur les réseaux sociaux, attirant un grand nombre d'utilisateurs. L'application du modèle GPT-4o avec la méthode de création d'images régénératives rend les images cohérentes, riches en détails et faciles à contrôler, reflétant la maturité de l'IA multimétrique.
L'année 2025 a également vu l'émergence d'agents de l'IA, des systèmes capables d'effectuer automatiquement des tâches. Pour surmonter les limites lorsque les agents doivent interagir avec Internet, qui est conçu pour les humains, le protocole contextuel du modèle est promu comme une norme ouverte, qui reçoit le soutien de nombreux grands groupes technologiques. Ceci est considéré comme une étape importante dans la remodelation de la manière dont l'IA aborde le monde numérique.
La percée la plus audacieuse vient du domaine spatial, lorsque Starcloud a annoncé la formation réussie d'un modèle d'IA sur un GPU placé sur un satellite en orbite basse. Cette expérience ouvre la possibilité de construire une infrastructure d'IA extraterrestre, réduisant ainsi la pression sur les ressources et l'environnement.
Dans l'ensemble, l'année 2025 marque une étape de transformation de l'IA, où la qualité de la pensée et de la conception de modèles est placée au même niveau, voire au-dessus de la course à la taille, créant un prélude à des changements profonds dans les années à venir.