Le nouveau modèle d'IA d'Alibaba attire l'attention d'Elon Musk

CÁT TIÊN |

Le nouveau modèle d'IA d'Alibaba attire l'attention d'Elon Musk en atteignant des performances élevées.

Dans un contexte où les entreprises technologiques développent continuellement des modèles d'intelligence artificielle de plus en plus grands et complexes, Alibaba choisit une direction différente en présentant une série de nouveaux modèles d'IA compacts de la gamme Qwen 3. 5.

Les quatre nouveaux modèles comprennent Qwen 3.5-0.8B, 2B, 4B et 9B avec des tailles paramétriques de 0,8 à 9 milliards. Selon Alibaba, ces modèles sont conçus pour fournir une forte capacité de raisonnement tout en étant optimisés en taille, afin de servir les développeurs qui ont besoin de solutions d'IA efficaces et flexibles.

Il est à noter que tous les modèles Qwen 3.5 sont construits sur la même architecture et prennent en charge le multitâche, permettant le traitement à la fois du texte et des images.

Chaque modèle a deux versions, dont la version "basique" pour les développeurs qui souhaitent se personnaliser eux-mêmes et la version "guide" qui peut être déployée immédiatement.

Parmi ceux-ci, le Qwen 3.5-9B est le plus grand modèle de cette gamme et attire beaucoup d'attention. Selon Alibaba, ce modèle atteint des performances très similaires à celles des modèles plus grands, notamment le GPT-oSS-120B.

Malgré une différence de taille significative, le Qwen 3, 5, 9B a toujours montré une compétitivité en matière de raisonnement et de traitement des connaissances dans certains tests.

La société a déclaré que dans des tâches telles que la logique, la résolution de problèmes mathématiques et l'analyse de documents, Qwen 3.5-9B peut obtenir des résultats équivalents à ceux des grands chatbots d'IA tels que ChatGPT d'OpenAI ou Gemini de Google.

À l'inverse, les deux plus petits modèles, Qwen 3.5-0.8B et 2B, sont optimisés pour fonctionner sur des appareils à capacités de calcul limitées tels que les ordinateurs portables ou les smartphones.

Bien que leur capacité de raisonnement ne soit pas aussi forte que celle des versions plus grandes, elles peuvent toujours traiter à la fois le texte et les images.

Les modèles Qwen 3.5 sont désormais publiés avec un poids ouvert, permettant aux développeurs de télécharger et d'exécuter localement via des plateformes populaires telles que Hugging Face ou ModelScope.

Le lancement de cette gamme de modèles a également attiré l'attention du monde de la technologie. Sur le réseau social X, le PDG de xAI, Elon Musk, a fait remarquer que les modèles Qwen 3.5 possèdent une "densité d'intelligence impressionnante", c'est-à-dire la capacité de démontrer des capacités de raisonnement et de traitement de tâches élevées malgré une petite taille de paramètre.

Le succès de Qwen 3.5 montre une nouvelle tendance dans le développement de l'IA, au lieu de se concentrer uniquement sur l'expansion de l'échelle, les entreprises cherchent à optimiser les performances sur des modèles plus petits, ce qui facilite le déploiement de l'IA et permet d'économiser davantage de ressources de calcul.

CÁT TIÊN
Nouvelles connexes

ByteDance prend la parole après que le modèle d'IA a été accusé de violation du droit d'auteur

|

ByteDance a déclaré qu'ils renforceraient les mesures de protection contre le modèle AI Seedance 2.0, après avoir reçu des plaintes pour violation du droit d'auteur.

Un nouveau modèle d'IA inquiète Hollywood

|

Le modèle d'IA qui crée la vidéo Seedance 2.0 de ByteDance choque Hollywood en raison du risque de violation flagrante du droit d'auteur.

Le PDG de Google DeepMind souligne les grandes lacunes des modeles d'IA modernes

|

Le PDG de Google DeepMind, Demis Hassabis, estime que les modeles d'IA actuels manquent encore des capacites fondamentales pour reellement comprendre et simuler le monde.

Hà Tĩnh annonce la vente de près de 30 kg d'or pour plus de 142 milliards de dongs

|

Hà Tĩnh - Le Département des finances vient d'annoncer la vente de près de 30 kg d'or pur dont la propriété de l'ensemble du peuple a été établie pour un prix de plus de 142 milliards de dongs.

Lam Dong annule 5 titres fonciers rouges délivrés à des entreprises pour la mise en œuvre du projet Saigon Dai Ninh

|

Lâm Đồng - Après la récupération de terres, la société Sài Gòn Đại Ninh n'a pas restitué 5 titres fonciers, de sorte que les autorités compétentes ont dû prendre la décision d'annuler ces documents.

Une station-service à Hanoï cesse de vendre, annonce qu'il n'y a plus d'essence

|

Hanoï - Bien qu'elle ait activement stocké des marchandises, en raison de la forte demande et des difficultés d'approvisionnement, une station-service de Ha Dong a annoncé qu'elle n'avait plus d'essence.

Un pick-up fonce dans une maison après une collision avec un camion sur la route nationale 1

|

Gia Lai - Après une collision avec un camion sur la route nationale 1, un pick-up a soudainement percuté une maison au bord de la route, endommageant gravement le véhicule et blessant la conductrice.

La Russie s'exprime sur la demande d'aide en armes de l'Iran

|

La Russie n'a reçu aucune demande d'aide, y compris la fourniture d'armes, de l'Iran.

ByteDance prend la parole après que le modèle d'IA a été accusé de violation du droit d'auteur

NGUYỄN ĐĂNG |

ByteDance a déclaré qu'ils renforceraient les mesures de protection contre le modèle AI Seedance 2.0, après avoir reçu des plaintes pour violation du droit d'auteur.

Un nouveau modèle d'IA inquiète Hollywood

NGUYỄN ĐĂNG (THEO TECHCRUNCH) |

Le modèle d'IA qui crée la vidéo Seedance 2.0 de ByteDance choque Hollywood en raison du risque de violation flagrante du droit d'auteur.

Le PDG de Google DeepMind souligne les grandes lacunes des modeles d'IA modernes

Cát Tiên |

Le PDG de Google DeepMind, Demis Hassabis, estime que les modeles d'IA actuels manquent encore des capacites fondamentales pour reellement comprendre et simuler le monde.