OpenAI vient de présenter une mise à jour majeure pour ChatGPT fusionnant la voix et le texte dans une seule interface élargissant l'expérience d'interaction dans une direction plus naturelle et fluide.
Avec la nouvelle conception les utilisateurs peuvent commencer la conversation par la voix ou saisir le texte immédiatement tandis que le système répond par le son l'écriture ou l'image en fonction de la situation.
Le point le plus remarquable est que ChatGPT Voice a désormais la capacité d'afficher des cartes en temps réel une fonctionnalité qui n'était jamais apparue dans la version utilisant uniquement la voix.
Des cartes des images et des données visuelles sont présentées juste à côté des réponses sonores ce qui rend la conversation multimédia plus fluide et adaptée à de nombreuses situations d'utilisation allant de la recherche de routes à la recherche d'informations en passant par le traitement du travail.
OpenAI ajoute également une capture d'écran à l'intérieur de la fenêtre de conversation. Grâce à cela tous les échanges vocaux seront affichés sous forme de texte permettant aux utilisateurs de revoir le contenu de suivre le fil de conversation ou de passer entre le mode écoute et lecture si nécessaire.
Il s'agit d'une étape d'amélioration importante pour les personnes qui accomplissent régulièrement des tâches complexes par la voix mais qui souhaitent toujours saisir les informations sous forme de texte.
De plus une conception uniforme permet d'éliminer le choix entre les modes. Les utilisateurs n'ont qu'à ouvrir la fenêtre de chat et à commencer la conversation comme ils le souhaitent le système ajustera automatiquement la forme de réponse appropriée.
Pour ceux qui aiment l'interface sans voix comme avant OpenAI maintient toujours l'option de conversion dans la section d'installation mais le mode unifié sera par défaut à l'avenir.
La mise à jour est progressivement déployée sur le web et les applications mobiles. Les utilisateurs peuvent accéder à ChatGPT Voice directement dans l'interface de conversation principale en tirant parti de l'interaction continue sans interruption entre les formes de saisie.
Ceci est considéré comme une étape importante dans la transformation de ChatGPT en un assistant multimédia plus complet unifiant la façon dont les humains communiquent avec l'IA.