Dans un contexte où les entreprises technologiques développent continuellement des modèles d'intelligence artificielle de plus en plus grands et complexes, Alibaba choisit une direction différente en présentant une série de nouveaux modèles d'IA compacts de la gamme Qwen 3. 5.
Les quatre nouveaux modèles comprennent Qwen 3.5-0.8B, 2B, 4B et 9B avec des tailles paramétriques de 0,8 à 9 milliards. Selon Alibaba, ces modèles sont conçus pour fournir une forte capacité de raisonnement tout en étant optimisés en taille, afin de servir les développeurs qui ont besoin de solutions d'IA efficaces et flexibles.
Il est à noter que tous les modèles Qwen 3.5 sont construits sur la même architecture et prennent en charge le multitâche, permettant le traitement à la fois du texte et des images.
Chaque modèle a deux versions, dont la version "basique" pour les développeurs qui souhaitent se personnaliser eux-mêmes et la version "guide" qui peut être déployée immédiatement.
Parmi ceux-ci, le Qwen 3.5-9B est le plus grand modèle de cette gamme et attire beaucoup d'attention. Selon Alibaba, ce modèle atteint des performances très similaires à celles des modèles plus grands, notamment le GPT-oSS-120B.
Malgré une différence de taille significative, le Qwen 3, 5, 9B a toujours montré une compétitivité en matière de raisonnement et de traitement des connaissances dans certains tests.
La société a déclaré que dans des tâches telles que la logique, la résolution de problèmes mathématiques et l'analyse de documents, Qwen 3.5-9B peut obtenir des résultats équivalents à ceux des grands chatbots d'IA tels que ChatGPT d'OpenAI ou Gemini de Google.
À l'inverse, les deux plus petits modèles, Qwen 3.5-0.8B et 2B, sont optimisés pour fonctionner sur des appareils à capacités de calcul limitées tels que les ordinateurs portables ou les smartphones.
Bien que leur capacité de raisonnement ne soit pas aussi forte que celle des versions plus grandes, elles peuvent toujours traiter à la fois le texte et les images.
Les modèles Qwen 3.5 sont désormais publiés avec un poids ouvert, permettant aux développeurs de télécharger et d'exécuter localement via des plateformes populaires telles que Hugging Face ou ModelScope.
Le lancement de cette gamme de modèles a également attiré l'attention du monde de la technologie. Sur le réseau social X, le PDG de xAI, Elon Musk, a fait remarquer que les modèles Qwen 3.5 possèdent une "densité d'intelligence impressionnante", c'est-à-dire la capacité de démontrer des capacités de raisonnement et de traitement de tâches élevées malgré une petite taille de paramètre.
Le succès de Qwen 3.5 montre une nouvelle tendance dans le développement de l'IA, au lieu de se concentrer uniquement sur l'expansion de l'échelle, les entreprises cherchent à optimiser les performances sur des modèles plus petits, ce qui facilite le déploiement de l'IA et permet d'économiser davantage de ressources de calcul.