
OpenAI vient d'annoncer 2 modeles d'IA theorique open source nommes gpt-oss-120b et gpt-oss-20b avec des capacites equivalentes a la serie o de la societe. C'est la premiere fois depuis le GPT-2 (lance en 2019) qu'OpenAI publie a nouveau un modele de langage open source. Les deux peuvent etre telecharges gratuitement sur la plateforme Hugging Face en utilisant la licence Apache 2.0 - permettant la commercialisation sans licence ou paiement.
Les modeles sont conçus en differentes tailles : la version 120 milliards de parametres peut fonctionner sur un seul GPU Nvidia ; la version 20 milliards est plus legere et fonctionne bien sur un ordinateur portable avec 16 Go de RAM. OpenAI indique que les deux modeles utilisent une architecture mixte experte (MoE) qui n'active qu'une petite partie des parametres pour chaque tache afin d'optimiser les performances.
Sur de nombreuses echelles le gpt-oss est considere comme ayant des capacites superieures a celles des concurrents ouverts tels que DeepSeek et Qwen bien qu'il soit toujours inferieur a la serie interne o-series. Par exemple sur l'examen Codeforces le gpt-oss-120b a obtenu 2622 points soit plus que DeepSeek R1. Cependant le taux de reponses erronees reste un probleme preoccupant. Gpt-oss provoque des reponses non standard a plus de 49 a 53 % des questions sur la norme Person
En termes de formation OpenAI applique des techniques avancees telles que l'apprentissage renforce (RL) et la sequence de raisonnement multi-etapes similaires aux modeles haut de gamme. Gpt-oss peut prendre en charge les objets de l'IA appeles outils tels que la recherche web ou l'execution de code Python mais ne peut pas traiter les images ou les sons.
OpenAI a declare qu'elle ne publierait pas de donnees d'entraînement pour des raisons juridiques dans un contexte de poursuites judiciaires concernant les droits d'auteur qui se poursuivent. La societe a egalement effectue des tests de securite afin de limiter le risque que le modele soit exploite a des fins malveillantes telles que la fabrication d'armes ou les cyberattaques.
Nous souhaitons que le monde soit construit sur une plateforme d'IA ouverte creee aux Etats-Unis et basee sur des valeurs democratiques' a souligne le PDG Sam Altman. Cependant la course a l'IA ouverte est toujours feroce avec l'attente de DeepSeek R2 et de nouveaux modeles super-intelligence de Meta dans les temps a venir.