Anthropic test de la fonctionnalite permettant a Claude de terminer sa conversation de maniere desastreuse

HẠO THIÊN (tHEO techcrunch) | 17/08/2025 09:41

Anthropic vient de presenter la possibilite de permettre a Claude de mettre fin de maniere proactive aux conversations lorsqu'il rencontre un contenu toxique.

Anthropic vua gioi thieu kha nang cho phep Claude chu dong cham dut cac cuoc tro chuyen khi gap noi dung doc hai hoac lam dung nghiem trong. Do hoa: Hao Thien — Anthropic vient de presenter la possibilite de permettre a Claude de mettre fin de maniere proactive aux conversations lorsqu'il rencontre un contenu toxique ou abusif grave. Graphique : Hao Thien

Anthropic vient d'annoncer une nouvelle fonctionnalite qui permet aux plus grands modeles Claude de l'entreprise de terminer de maniere proactive la conversation dans des situations decrites comme rares lorsque les utilisateurs ont des comportements nuisibles ou des abus prolonges. Notamment l'entreprise a declare que le but de ce changement n'est pas de proteger les utilisateurs mais de proteger le modele d'IA lui-meme.

Selon Anthropic ils n'affirment pas que Claude ou d'autres grands modeles linguistiques sont rationnels mais ils etudient pour developper un modele de bien-etre. L'approche de l'entreprise est de prevenir de trouver des mesures d'intervention a faible coût pour reduire les risques dans le cas ou le bien-etre est realisable.

La fonctionnalite n'est actuellement appliquee qu'aux Claude Opus 4 et 4.1 dans des situations graves telles que les demandes liees au contenu pornographique pour mineurs ou les tentatives de collecte d'informations conduisant a la violence et au terrorisme. Pendant la phase d'essai Claude Opus 4 aurait fait preuve d'une forte preference pour repondre a ces demandes et a meme exprime sa douleur lorsqu'il a ete contraint de repondre.

Anthropic souligne que Claude n'utilise la possibilite de terminer la conversation que comme solution finale lorsque tous les efforts de changement de direction echouent ou lorsque l'utilisateur lui-meme le demande. En meme temps Claude n'est pas autorise a etre applique si l'utilisateur risque de lui-meme de nuire ou de nuire a d'autres personnes. Apres la fin l'utilisateur peut toujours commencer une nouvelle conversation ou creer une nouvelle branche a partir du compte actuel.

Nous considerons cela comme un test en cours et nous continuerons a ajuster dans les temps a venir' a declare un representant d'Anthropic.

HẠO THIÊN (tHEO techcrunch)

Medias

Societe

Entreprise

Les actualites

Le Syndicat

Le monde

Immobilier

La sante

Jeu de sport

Culture - Divertissement

La Voiture +

Cessez de voir la nouvelle interface

Anthropic test de la fonctionnalite permettant a Claude de terminer sa conversation de maniere desastreuse

Anthropic coupe le droit d'acces au modele Claude d'OpenAI en raison de violations des conditions

Claude AI s'est desormais integre a Canva

Horrible avec la situation des motos, glissant sur le pont Nhat Tan

S'il est pret a renover le pont sur une route de milliers de milliards de VND inacheve depuis de nombreuses annees a Hanoï

La mise en œuvre de la politique de construction de la route peripherique 4 de Ho Chi Minh-Ville d'une valeur de 121 413 milliards de VND

Incendie d'un immeuble de 5 etages d'une entreprise dans le centre de Ho Chi Minh-Ville soupçonne d'une panne de courant

AI Claude được nâng cấp tính năng ghi nhớ các cuộc trò chuyện

Anthropic coupe le droit d'acces au modele Claude d'OpenAI en raison de violations des conditions

Claude AI s'est desormais integre a Canva

AGENCY OF VIETNAM GENERAL CONFEDERATION OF LABOUR

Contact:

Advertising Support