
Selon The Information, au cours des deux derniers mois, OpenAI a fusionne de nombreux groupes techniques, produits et recherches pour restructurer globalement les modeles audio, afin de preparer un appareil personnel prioritaire pour la communication vocale, dont le lancement est prevu dans environ un an.
Cette initiative reflete la tendance generale de l'industrie technologique, ou le son devient progressivement l'interface centrale, remplaçant le role dominant de l'ecran. Les assistants vocaux sont apparus dans plus d'un tiers des foyers aux Etats-Unis via des haut-parleurs intelligents. De nombreux grands groupes technologiques suivent egalement cette tendance.
Meta a recemment ajoute une fonction d'ecoute guidable aux lunettes intelligentes Ray-Ban, utilisant un systeme multi-microphones pour aider les utilisateurs a ecouter plus clairement dans un environnement bruyant. Google teste la fonction de conversion des resultats de recherche en resumes de conversation audio. Pendant ce temps, Tesla integre le chatbot Grok de xAI dans les voitures electriques, permettant aux utilisateurs de controler de nombreuses fonctions par la voix naturelle.
Non seulement les "geants" de la technologie, mais de nombreuses start-up poursuivent egalement l'ambition de construire des appareils IA sans ecran. Cependant, ce chemin n'est pas facile. Certains produits qui ont attire l'attention tels que Humane AI Pin ou vong co Friend AI ont rencontre des echecs ou des controverses liees a la vie privee, montrant le grand risque d'introduire l'IA sonore dans la vie personnelle.
Malgre cela, cette tendance continue d'etre renforcee. Certaines startups, dont Sandbar et la societe fondee par Eric Migicovsky, developpent des bagues AI permettant aux utilisateurs de discuter directement via des appareils portables, dont le lancement est prevu en 2026.
Selon The Information, le nouveau modele audio d'OpenAI, qui devrait etre lance debut 2026, aura une voix plus naturelle, traitera les pauses de maniere flexible et pourra meme "parler en parallele" avec l'utilisateur, creant une sensation de veritable conversation. OpenAI imagine egalement un nouvel ecosysteme d'appareils, qui pourrait inclure des lunettes ou des haut-parleurs intelligents sans ecran, fonctionnant comme un compagnon plutot qu'un outil.
Cette strategie est liee a l'orientation du design audio prioritaire de Jony Ive - ancien directeur du design d'Apple, qui a rejoint la division materielle d'OpenAI apres l'acquisition de la societe io d'une valeur de 6,5 milliards de dollars. Il est considere comme souhaitant reduire la dependance a l'egard des ecrans et considerer l'interface audio comme une opportunite de remodeler la façon dont les gens interagissent avec la technologie grand public a l'avenir.
Dans ce contexte, l'IA sonore n'est plus une fonctionnalite de soutien, mais est consideree comme une plateforme pour la prochaine generation d'appareils personnels, ou la voix devient le nouveau « visage de controle » de l'homme.