La complexité dépasse ChatGPT en termes de fiabilité dans le travail quotidien

Cát Tiên | 27/05/2026 19:39

Perplexity AI est en tête en termes de fiabilité au travail, dépassant ChatGPT, Gemini et Claude grâce à son faible taux d'"illusions" et à son temps d'activité stable.

Un nouveau rapport de la société de marketing numérique américaine Legal Guardian Digital a attiré l'attention en classant Perplexity AI comme le chatbot AI le plus fiable pour les tâches de travail quotidiennes.

Ce résultat montre que Perplexity surpasse de nombreux concurrents célèbres comme OpenAI avec ChatGPT, Google avec Google Gemini ou encore Anthropic avec Claude.

Selon l'étude, les chatbots d'IA sont évalués sur la base de nombreux critères, notamment le taux de création de fausses informations, le niveau de satisfaction des clients, la cohérence des commentaires et la stabilité du système.

Le rapport est publié dans un contexte où l'IA est de plus en plus largement utilisée sur le lieu de travail, alors qu'environ un quart des travailleurs américains sont considérés comme utilisant régulièrement des outils d'IA pour soutenir leur travail.

Les résultats montrent que Perplexity AI a le taux de diffusion d'informations "hallucinantes" et fausses le plus bas du groupe de grands chatbots, seulement 13%, ce qui est nettement inférieur à la moyenne de ce secteur de 22%.

Cette plateforme atteint également un taux d'activité continue de 100%, c'est-à-dire qu'aucun temps d'arrêt de service n'est enregistré pendant le processus de test.

En deuxième position se trouve Grok, développé par la société d'IA du milliardaire Elon Musk. Grok enregistre un taux de création de fausses informations de 15% et atteint également un temps d'activité parfait.

Pendant ce temps, DeepSeek se classe troisième avec un taux d'"illusions" de 14% et un temps d'activité de 99,52%.

La chose la plus surprenante dans le classement est la position de ChatGPT. Bien qu'il s'agisse du chatbot d'IA le plus populaire au monde aujourd'hui, ChatGPT n'est que sixième en termes de fiabilité globale.

Le rapport indique que ce chatbot donne des réponses inexactes dans environ 30% des cas, soit le double du taux d'erreur de DeepSeek.

Cependant, ChatGPT a toujours reçu des critiques positives de la part des utilisateurs avec un score de satisfaction de 4,7/5.

Dans les positions inférieures, Google Gemini se classe huitième, tandis que Meta avec Meta AI se classe neuvième.

Claude d'Anthropic s'est classé septième et aurait rencontré plus d'incidents opérationnels que ses concurrents.

Le groupe de recherche a déclaré avoir combiné de nombreux facteurs pour calculer le score de fiabilité global de chaque chatbot.

Parmi ceux-ci, les facteurs importants comprennent la fréquence des retours de fausses informations, la capacité de réponse stable à de nombreux types de questions, les évaluations des utilisateurs et le niveau de stabilité du système.

Perplexity AI a obtenu le score de fiabilité le plus élevé avec 85/100 points. Grok a suivi avec 79 points, tandis que DeepSeek a marqué 76 points. ChatGPT n'a reçu que 50 points, tandis que Google Gemini en a marqué 41.

Le rapport mentionne également le prix du service. Perplexity AI coûte environ 40 USD par mois, Grok environ 30 USD par mois, tandis que DeepSeek est actuellement fourni gratuitement bien qu'il reste dans le groupe de chatbots le plus fiable.

M. Austin Hunt - PDG de Legal Guardian Digital, a déclaré que beaucoup considèrent ChatGPT par défaut comme le chatbot le plus fiable en raison de son avantage pionnier et de sa popularité mondiale.

Cependant, en termes de stabilité et de précision dans le travail, les plateformes plus petites comme Perplexity ou Grok montrent une meilleure efficacité.

Cát Tiên