DeepSeek lance un nouveau modele qui permet de reduire de moitie les coûts d'API

Cát Tiên (THEO techcrunch) |

La technologie Sparse Attention de DeepSeek optimise la commutation ce qui permet de reduire la charge du serveur tout en conservant l'efficacite de traitement et en ouvrant de nouvelles voies pour l'IA a faible coût.

Le 29 septembre (heure americaine) un groupe de recherche de DeepSeek a annonce un nouveau modele experimental appele V3.2-exp conçu pour reduire considerablement les coûts de raisonnement dans les taches de langage long. Ce modele a ete presente sur la plateforme Hugging Face accompagne d'un article educatif partage publiquement sur GitHub.

Le point fort de V3.2-exp reside dans le mecanisme DeepSeek Sparse Attention (un systeme d'attention rudimentaire). Au lieu de traiter toutes les donnees ce systeme utilise un module appele 'parametres de sequence' pour donner la priorite a la extraction des passages de texte importants dans la fenetre contextuelle.

Ensuite un autre module appele'systeme de selection de code de notification detaille' selectionnera les tokens importants a inclure dans la fenetre d'attention limitee. Cette approche permet de reduire la charge du serveur tout en conservant la capacite de traiter les longs sequences de contexte.

Selon les tests initiaux DeepSeek a declare que le coût d'execution d'une commande API peut etre reduit jusqu'a 50 % dans les situations necessitant un contexte large.

Bien qu'il faille plus d'evaluations independantes pour l'authentification la divulgation du modele sur Hugging Face ouvrira bientot la voie aux tiers pour les tests et les verifications.

Le lancement du V3.2-exp poursuit la serie d'efforts visant a resoudre le probleme du coût de l'analytique qui est l'un des plus grands defis dans l'exploitation du modele d'IA.

Contrairement aux coûts de formation initiaux les coûts de raisonnement sont directement lies a l'infrastructure serveur pour servir les utilisateurs et constituent toujours un fardeau important pour les entreprises qui deploient l'IA.

DeepSeek une societe basee en Chine qui a attire l'attention au debut de l'annee avec le modele R1 est principalement forme par des cours intensifs a faible coût. Cependant R1 n'a pas cree la revolution escomptee et l'interet pour DeepSeek a progressivement diminue ces derniers mois.

Cependant avec ce nouveau mecanisme DeepSeek montre une nouvelle approche pour optimiser l'architecture de transformation. Cette solution n'est peut-etre pas aussi bruyante que R1 mais elle est consideree comme apportant des leçons pratiques en particulier aux fournisseurs de services d'IA aux Etats-Unis dans un contexte ou la necessite de reduire les coûts de raisonnement devient de plus en plus urgente.

Cát Tiên (THEO techcrunch)
Nouvelles connexes

Il y a de plus en plus de pays qui interdisent DeepSeek

|

La Republique tcheque est le dernier pays a interdire DeepSeek a tous les organismes et organisations gouvernementaux en raison de preoccupations concernant la cybersecurite.

La Russie accelere sa progression pour controler davantage de terres a Donetsk

|

Dans l'operation de liberation de Seversk Maly dans le Donetsk les forces aeriennes sans pilote russes ont apporte une contribution non negligeable.

Un match nul Barcelone contre le PSG a domicile

|

Aux premieres heures du 2 octobre (heure vietnamienne) Barcelone bien qu'ayant mene a perdu amerement 1-2 contre le PSG en Ligue des champions.

L'artiste du peuple The Hernal - L'auteur de la chanson "Lan Forest Branch" est decede

|

Le musicien et artiste du peuple The Hien est decede le 1er octobre apres avoir lutte contre un cancer du poumon.

Cereales vertes tombees et ecrasees obligeant 2 grands-meres et petits-enfants a etre hospitalises d'urgence a Ho Chi Minh-Ville

|

Ho Chi Minh-Ville - Dans le quartier de Dong Hoa un arbre vert s'est effondre et a heurte 2 grands-meres et petits-enfants. Les deux grands-meres et petits-enfants ont ete emmenes aux urgences par les habitants immediatement apres.

La semaine prochaine il existe un plan d'organisation des unites de la fonction publique et des entreprises publiques

|

Le ministre de l'Interieur a declare qu'il etait en train de finaliser le plan d'organisation des unites de la fonction publique d'organisation des entreprises publiques et a l'interieur de l'organisation structurelle des ministeres.

La solidarite entre les peuples du Vietnam et de la Federation de Russie se developpera de mieux en mieux

|

Le president du Comite central du Front de la patrie vietnamienne Do Van Chien est convaincu que le partenariat strategique global entre le Vietnam et la Federation de Russie ainsi que l'amitie et le soutien mutuel entre les peuples des deux pays se developperont de mieux en mieux avec confiance et soutien mutuel.

J'ai trouve le corps restant dans l'etang de poisson brise en lao Cai

|

Lao Cai - La rupture de l'etang de peche dans la commune de Bao Thang a emporte 4 travailleurs dont 2 sont decedes.

Il y a de plus en plus de pays qui interdisent DeepSeek

NGUYỄN ĐĂNG |

La Republique tcheque est le dernier pays a interdire DeepSeek a tous les organismes et organisations gouvernementaux en raison de preoccupations concernant la cybersecurite.

Đức yêu cầu Apple và Google chặn ứng dụng AI DeepSeek

HẠO THIÊN (THEO CNBC) |

Cơ quan bảo vệ dữ liệu Berlin (Đức) vừa yêu cầu Apple và Google xem xét việc chặn ứng dụng trí tuệ nhân tạo DeepSeek do lo ngại vi phạm dữ liệu người dùng.

Nhân viên Microsoft bị cấm sử dụng ứng dụng DeepSeek

Anh Vũ |

Microsoft chính thức cấm nhân viên sử dụng ứng dụng DeepSeek vì lo ngại về an ninh dữ liệu và nguy cơ tuyên truyền.