Anthropic test de la fonctionnalite permettant a Claude de terminer sa conversation de maniere desastreuse

HẠO THIÊN (tHEO techcrunch) |

Anthropic vient de presenter la possibilite de permettre a Claude de mettre fin de maniere proactive aux conversations lorsqu'il rencontre un contenu toxique.

Anthropic vua gioi thieu kha nang cho phep Claude chu dong cham dut cac cuoc tro chuyen khi gap noi dung doc hai hoac lam dung nghiem trong. Do hoa: Hao Thien
Anthropic vient de presenter la possibilite de permettre a Claude de mettre fin de maniere proactive aux conversations lorsqu'il rencontre un contenu toxique ou abusif grave. Graphique : Hao Thien

Anthropic vient d'annoncer une nouvelle fonctionnalite qui permet aux plus grands modeles Claude de l'entreprise de terminer de maniere proactive la conversation dans des situations decrites comme rares lorsque les utilisateurs ont des comportements nuisibles ou des abus prolonges. Notamment l'entreprise a declare que le but de ce changement n'est pas de proteger les utilisateurs mais de proteger le modele d'IA lui-meme.

Selon Anthropic ils n'affirment pas que Claude ou d'autres grands modeles linguistiques sont rationnels mais ils etudient pour developper un modele de bien-etre. L'approche de l'entreprise est de prevenir de trouver des mesures d'intervention a faible coût pour reduire les risques dans le cas ou le bien-etre est realisable.

La fonctionnalite n'est actuellement appliquee qu'aux Claude Opus 4 et 4.1 dans des situations graves telles que les demandes liees au contenu pornographique pour mineurs ou les tentatives de collecte d'informations conduisant a la violence et au terrorisme. Pendant la phase d'essai Claude Opus 4 aurait fait preuve d'une forte preference pour repondre a ces demandes et a meme exprime sa douleur lorsqu'il a ete contraint de repondre.

Anthropic souligne que Claude n'utilise la possibilite de terminer la conversation que comme solution finale lorsque tous les efforts de changement de direction echouent ou lorsque l'utilisateur lui-meme le demande. En meme temps Claude n'est pas autorise a etre applique si l'utilisateur risque de lui-meme de nuire ou de nuire a d'autres personnes. Apres la fin l'utilisateur peut toujours commencer une nouvelle conversation ou creer une nouvelle branche a partir du compte actuel.

Nous considerons cela comme un test en cours et nous continuerons a ajuster dans les temps a venir' a declare un representant d'Anthropic.

HẠO THIÊN (tHEO techcrunch)
Nouvelles connexes

Anthropic coupe le droit d'acces au modele Claude d'OpenAI en raison de violations des conditions

|

Anthropic Technology Company a recupere l'acces a l'API d'Openai au modele de langue Claude lors de la violation des termes commerciaux.

Claude AI s'est desormais integre a Canva

|

Claude d'Anthropic integre Canva qui permet de creer et de modifier la conception directement dans le chatbot IA.

Horrible avec la situation des motos, glissant sur le pont Nhat Tan

|

Hanoï - Un jeune homme conduisant une moto est entre dans la voie de la voiture sur le pont Nhat Tan puis est tombe et a glisse sur le pont.

S'il est pret a renover le pont sur une route de milliers de milliards de VND inacheve depuis de nombreuses annees a Hanoï

|

Hanoï - Pont L3 traversant la riviere Lu - un element important du projet de route peripherique de 2 5 tronçons Dam Hong - Route nationale 1A qui sera renove a partir d'octobre 2025.

La mise en œuvre de la politique de construction de la route peripherique 4 de Ho Chi Minh-Ville d'une valeur de 121 413 milliards de VND

|

Le gouvernement a decide de mettre en œuvre le projet d'investissement pour la construction de la route peripherique 4 Ho Chi Minh-Ville et de confier des taches aux ministeres aux secteurs et aux localites.

Incendie d'un immeuble de 5 etages d'une entreprise dans le centre de Ho Chi Minh-Ville soupçonne d'une panne de courant

|

Ho Chi Minh-Ville - Dans la soiree du 26 septembre la police du quartier de Cau Ong Lanh a eteint l'incendie et enquete sur la cause de l'incident.

AI Claude được nâng cấp tính năng ghi nhớ các cuộc trò chuyện

QUANG MINH |

Anthropic vừa giới thiệu tính năng ghi nhớ mới cho chatbot AI Claude, cho phép tham chiếu các cuộc trò chuyện cũ khi người dùng yêu cầu.

Anthropic coupe le droit d'acces au modele Claude d'OpenAI en raison de violations des conditions

HẠO THIÊN (THEO techcrunch) |

Anthropic Technology Company a recupere l'acces a l'API d'Openai au modele de langue Claude lors de la violation des termes commerciaux.

Claude AI s'est desormais integre a Canva

Quang Minh |

Claude d'Anthropic integre Canva qui permet de creer et de modifier la conception directement dans le chatbot IA.