Ces dernieres annees, les geants de la technologie tels que Google, Meta, Microsoft, OpenAI ou Perplexity ont massivement investi des milliards de dollars dans la construction et l'expansion de centres de donnees.
Selon les previsions des analystes, les depenses totales pour cette infrastructure pourraient se rapprocher du seuil de 1 000 milliards de dollars a la fin de la decennie. Cependant, tout le monde dans l'industrie ne pense pas que le centre de donnees restera a jamais le « pilier » de l'intelligence artificielle.
Le PDG de Perplexity, Aravind Srinivas, a souligne que la plus grande menace pour les centres de donnees est la capacite de l'intelligence artificielle a etre integree et a fonctionner directement sur les appareils des utilisateurs. A ce moment-la, l'IA n'aura plus besoin de traiter toutes les donnees dans des bases de donnees massives.
Actuellement, la plupart des chatbots AI populaires tels que ChatGPT, Gemini ou Perplexity reposent sur des systemes de serveurs situes dans des centres de donnees pour traiter les demandes des utilisateurs.
Ces installations consomment une tres grande quantite d'electricite, necessitent des coûts d'entretien eleves et dependent fortement de l'eau pour le refroidissement. C'est egalement la raison pour laquelle l'infrastructure d'IA est de plus en plus remise en question quant a sa durabilite.
Selon Srinivas, si les modeles d'IA pouvaient fonctionner localement sur l'appareil, le role des centres de donnees diminuerait considerablement.
Le traitement immediat sur un ordinateur personnel ou un telephone permet non seulement de reduire les coûts d'electricite et d'exploitation, mais aussi d'apporter des avantages evidents en termes de vie privee.
Les donnees des utilisateurs n'auront pas besoin d'etre envoyees sur le serveur a distance, ce qui reduira le risque de fuite ou d'exploitation illegale.
Un autre avantage de l'IA executant sur un appareil, selon le PDG de Perplexity, est la capacite de personnalisation. Lorsque le modele est "situe directement sur l'ordinateur", l'IA peut facilement s'adapter aux habitudes et preferences de chaque utilisateur sans avoir a dependre d'une infrastructure cloud complexe.
Cependant, Srinivas reconnaît egalement que le plus grand obstacle actuel est l'ampleur et la consommation de ressources des modeles d'IA.
La plupart des modeles actuels sont encore trop lourds pour fonctionner efficacement sur les smartphones ou les ordinateurs portables.
Cependant, il pense que les progres rapides de la technologie des puces, en particulier de la part de societes telles qu'Apple ou Qualcomm, pourraient bientot changer la situation.
En outre, le PDG de Perplexity a egalement evoque la question de l'« illusion », un phenomene d'IA qui cree des informations fausses mais qui semble convaincant.
Il a reconnu que les systemes actuels rencontrent encore cette erreur, mais a predit que dans les 5 prochaines annees, l'hallucination pourrait etre completement corrigee.
L'evaluation de Srinivas montre une perspective differente pour l'industrie de l'IA, d'une forte dependance aux enormes centres de donnees, l'intelligence artificielle pourrait progressivement se deplacer vers les appareils personnels eux-memes.
Si cela devient realite, la course a l'IA a l'avenir pourrait ne pas se limiter a l'echelle de l'infrastructure, mais aussi a la puissance des puces compactes dans les poches des utilisateurs.