La raison pour laquelle l'intelligence artificielle AI aime deviner au lieu d'admettre ne pas savoir

Cát Tiên (THEO techcrunch) |

L'IA reste un defi majeur. OpenAI propose de modifier le mecanisme d'evaluation de punir severement les fautes et d'encourager le modele d'acceptation incertaine.

Une nouvelle etude d'OpenAI vient de poser une question epineuse : 'Pourquoi les grands modeles linguistiques (LLM) tels que GPT-5 ou les chatbots ChatGPT creent-ils toujours des hallucinations en raison d'informations auditives raisonnables mais erronees? Et plus important encore que pouvons-nous faire pour minimiser ce phenomene?

Dans un article de blog resumant la recherche OpenAI reconnaît que les hallucinations sont le defi fondamental de tous les modeles linguistiques et qu'il est difficile de les eliminer completement.

Pour illustrer ce point de vue les chercheurs ont teste un chatbot populaire sur la these de doctorat d'Adam Tauman Kalai (auteur de l'etude).

En consequence le systeme a donne trois reponses differentes et toutes erronees. Meme lorsqu'on lui a demande sa date de naissance la reponse a continue d'etre erronee.

Selon les chercheurs ce phenomene decoule de la methode de formation initiale. Le modele linguistique apprit principalement a predire les mots suivants dans la serie de textes sans attribuer de bonnes ou de mauvaises etiquettes a chaque donnee.

Les details courants tels que l'orthographe les marque-pages peuvent etre facilement appris avec precision grace a des regles coherentes. Inversement les informations rares et de faible frequence telles que la date de naissance d'un individu ont du mal a etre predites avec precision par le modele ce qui conduit a des hallucinations.

Le point notable est que l'etude ne souligne pas que la phase d'entraînement est la principale cause mais met davantage l'accent sur la maniere d'evaluer le modele.

Actuellement la plupart des systemes sont notes par le nombre de reponses parfaites absolues creant involontairement un modele qui est encourage a deviner au lieu d'admettre ne pas savoir.

Les auteurs ont compare ce mecanisme a un examen a choix multiples comme le fait que les candidats qui disent du mal ont toujours la possibilite de gagner des points tandis que ceux qui sont laisses vides perdent certainement des points. De meme lorsque l'IA n'est evaluee que sur la base d'une precision absolue le systeme aura tendance a 'determiner de maniere raisonnable' au lieu d'admettre que ce n'est pas certain.

La solution proposee est de modifier la methode de notation tout comme l'examen SAT a des points negatifs pour les mauvaises reponses.

Pour l'IA cela signifie punir severement les reponses confiantes mais fausses alors qu'il ne faut punir que legerement ou meme recompenser en partie les reponses qui montrent une incertitude.

Tant que le tableau de notes recompense toujours les predictions de chance le modele continuera a apprendre a deviner' a conclu l'equipe de recherche.

Cette etude ne se contente pas de clarifier la cause profonde de la 'illusion d'IA' mais ouvre egalement la voie a un changement de mecanisme d'evaluation pour encourager le modele a reconnaître ses limites au lieu d'etre confiant face aux mauvaises reponses.

Cát Tiên (THEO techcrunch)
Nouvelles connexes

Koah mobilise 5 millions de dollars pour tester la publicite dans une application d'IA

|

Koah - une start-up basee a San Francisco (Etats-Unis) vient de mobiliser 5 millions de dollars pour le tour de tete avec la conviction que le changement de publicite dans les applications d'IA sera efficace.

Deepfake medical cree de faux medecins IA et risque que les patients soient escroques pour acheter des complements alimentaires

|

Les vrais medecins sont falsifies avec la technologie de l'IA pour examiner et vendre des complements alimentaires de mauvaise qualite semant des informations erronees et mettant en danger la sante publique.

La startup AI soutenue par Amazon veut recreer le film perdu d'Orson Welles

|

Fable - La societe auto-proclamee "Netflix d'Ai", vient d'annoncer le projet de reconstruction de 43 minutes dans le film The Magnificent Amberons (1942).

S'il est pret a renover le pont sur une route de milliers de milliards de VND inacheve depuis de nombreuses annees a Hanoï

|

Hanoï - Pont L3 traversant la riviere Lu - un element important du projet de route peripherique de 2 5 tronçons Dam Hong - Route nationale 1A qui sera renove a partir d'octobre 2025.

La mise en œuvre de la politique de construction de la route peripherique 4 de Ho Chi Minh-Ville d'une valeur de 121 413 milliards de VND

|

Le gouvernement a decide de mettre en œuvre le projet d'investissement pour la construction de la route peripherique 4 Ho Chi Minh-Ville et de confier des taches aux ministeres aux secteurs et aux localites.

Incendie d'un immeuble de 5 etages d'une entreprise dans le centre de Ho Chi Minh-Ville soupçonne d'une panne de courant

|

Ho Chi Minh-Ville - Dans la soiree du 26 septembre la police du quartier de Cau Ong Lanh a eteint l'incendie et enquete sur la cause de l'incident.

Les conducteurs font couler l'eau pour reparer les freins endommages avant d'avoir cause l'accident au marche aux bananes de Tan Long

|

Quang Tri - Decouvrant un systeme de freinage en panne le conducteur a verse de l'eau pour le reparer puis a continue a circuler provoquant un grave accident qui a fait 3 morts au marche aux bananes de Tan Long.

Le Bureau politique demande une sanction disciplinaire a l'ancien secretaire du Comite provincial du Parti de Thanh Hoa Do Trong Hung

|

Le Bureau politique demande au Comite central du Parti d'examiner et de prendre des mesures disciplinaires contre M. Do Trong Hung conformement a sa competence.

Koah mobilise 5 millions de dollars pour tester la publicite dans une application d'IA

HẠO THIÊN (THEO techcrunch) |

Koah - une start-up basee a San Francisco (Etats-Unis) vient de mobiliser 5 millions de dollars pour le tour de tete avec la conviction que le changement de publicite dans les applications d'IA sera efficace.

Deepfake medical cree de faux medecins IA et risque que les patients soient escroques pour acheter des complements alimentaires

Cát Tiên (THEO INDIANEXPRESS) |

Les vrais medecins sont falsifies avec la technologie de l'IA pour examiner et vendre des complements alimentaires de mauvaise qualite semant des informations erronees et mettant en danger la sante publique.

La startup AI soutenue par Amazon veut recreer le film perdu d'Orson Welles

HẠO THIÊN (theo techcrunch) |

Fable - La societe auto-proclamee "Netflix d'Ai", vient d'annoncer le projet de reconstruction de 43 minutes dans le film The Magnificent Amberons (1942).