Google vient de presenter Gemini 2.5 Computer Use un nouveau modele d'IA conçu pour interagir directement avec l'interface web comme une personne authentique.
Prise en charge par la plateforme Gemini 2.5 Pro cette technologie peut diriger le navigateur saisir des formulaires plier des pages cliquer saisir des donnees et utiliser un ensemble de touches tout cela via un navigateur virtuel developpe specifiquement par Google.
Selon le billet de blog officiel, l'utilisation d'ordinateurs Gemini 2.5 a ete fournie aux developpeurs via Google AI Studio et Vertex AI.
L'objectif du modele est d'autoriser l'IA a effectuer des taches pratiques complexes sur Internet sur la base de directives en langage naturel telles que l'enregistrement de comptes l'organisation de donnees ou l'essayage de logiciels.
Google a declare que le modele a une latence inferieure et des performances superieures a celles de ses concurrents dans de nombreux tests standard sur le web et les appareils mobiles.
Dans les videos d'illustration Gemini 2.5 Computer Use montre la capacite de traitement flexible telle que l'IA peut acceder au site Web lire le contenu puis organiser les informations a la demande de l'utilisateur par exemple tracer les notes a la bonne place dans une application Web.
Google affirme que ces taches sont trois fois plus rapides qu'auparavant ce qui temoigne des progres de la technologie de navigation et d'interface automatique.
Actuellement le Gemini 2.5 Computer Use ne prend en charge que 13 types d'actions principalement au niveau du navigateur et ne peut pas fonctionner directement au niveau du systeme d'exploitation d'ordinateur de bureau.
Malgre cela Google affirme que les groupes techniques internes ont applique ce modele aux tests d'interface utilisateur (UI) ce qui a permis de reduire considerablement le temps de developpement du logiciel.
Cette nouvelle technologie est egalement integree a un certain nombre de produits et de projets internes tels que le mode AI dans Google Search l'agent de verification Firebase et le projet Mariner (plateforme d'IA qui aide les utilisateurs a communiquer dans un langage naturel) pour designer l'agent qui effectue automatiquement des taches telles que la planification la recherche ou la saisie de donnees.
Avec Gemini 2.5 Computer Use Google franchit une nouvelle etape pour transformer l'IA en un veritable utilisateur numerique capable d'interagir de repondre et de traiter des informations directement sur le web ouvrant un avenir ou les taches en ligne sont entierement automatisees par l'intelligence artificielle.