Anthropic vient de publier le dernier modèle d'intelligence artificielle nommé Claude Opus 4.8. Selon la société, il s'agit d'une version considérablement améliorée en termes de capacité de collaboration avec les utilisateurs, en particulier dans des domaines tels que la programmation automatique, la déduction multisectorielle, le contrôle de l'ordinateur par agent d'IA, le traitement du travail intellectuel et l'analyse financière.
Les équipes de test ont estimé que l'Opus 4.8 était plus fiable et capable de faire des jugements plus tranchants lors de l'exécution de tâches automatisées. Le modèle a également été amélioré en termes d'honnêteté, alertant régulièrement lorsqu'il n'est pas sûr des résultats au lieu de faire des affirmations infondées.
Selon Anthropic, les critiques internes montrent que l'Opus 4.8 a une capacité significativement meilleure à détecter et à reconnaître les erreurs dans le code qu'il a lui-même créé. Le taux d'omission d'erreurs sans avertissement a été réduit d'environ 4 fois par rapport à la version précédente.
Les tests de sécurité et d'adéquation à l'utilisateur ont également enregistré des résultats positifs. L'Opus 4.8 a obtenu des scores plus élevés dans des critères tels que le respect de l'autonomie de l'utilisateur et l'action dans l'intérêt de l'utilisateur.
Anthropic indique également que le mode de réponse rapide de l'Opus 4.8 a une vitesse de traitement 2,5 fois plus rapide qu'auparavant, tandis que les coûts d'exploitation sont réduits d'environ 3 fois.