Lorsque Google a lance le modele de creation d'image Gemini Nano Banana la communaute technologique n'a pas seulement prete attention a ses performances mais a egalement ete curieuse du nom etrange Nano Banana.
Recemment David Sharon directeur des produits du groupe Gemini a raconte toute l'histoire dans le podcast Made by Google et c'est une histoire interessante et surprenante.
Selon Sharon le nom Nano Banana n'etait initialement qu'un code d'identification temporaire predefini par un employe de Google nomme Nina.
Elle a envoye le modele d'essai sur LM Arena une plateforme ou les utilisateurs peuvent experimenter des modeles d'IA anonymes sans savoir qui est le developpeur.
Pour garder le secret Nina a dû saisir un faux nom aleatoire. Elle a trouve ce nom vers 2h30 du matin. Ce n'etait qu'un choix amusant sans but precis' a raconte Sharon.
Cependant la surprise s'est produite lorsque les utilisateurs de LM Arena ont commence a aimer ce modele et surtout le nom Nano Banana.
Nous avons realise que tout le monde l'appelait ainsi. Alors au lieu de changer de nom nous avons decide de le conserver' a partage Sharon.
Derriere le nom amusant se cache une percee dans la technologie d'imagerie de Google. Gemini Nano Banana a la capacite de maintenir la coherence du visage et de l'identite du personnage un point faible precedent de nombreux modeles d'IA.
« La premiere fois que j'ai essaye j'ai telecharge ma propre photo et j'ai demande a l'IA de me mettre dans l'espace. Le resultat a ete incroyable car c'etait toujours moi et non une copie deformee creee par l'IA » a raconte Sharon.
La capacite de conserver les caracteristiques faciales et la creativite flexible font de Nano Banana une avancee majeure dans la gamme d'IA d'imagerie de Google en concurrence directe avec des outils tels que DALL·E 3 Midjourney ou Firefly d'Adobe.
Un groupe interne appele Greenfield chez Google a lance Nano Banana dans de nombreux defis creatifs differents. Lorsqu'on lui a demande de « fixer une longue chaise et des pommes de terre » le modele a immediatement cree l'image de 'couch potato' ce qui signifie des pommes de terre sur le canape de maniere paresseuse mais enthousiaste. C'est la preuve de la capacite de comprehension du contexte et de combinaison du concept flexible de l'IA.
Ces tests montrent que Nano Banana cree non seulement de belles images mais comprend egalement les idees et ouvre de nouvelles possibilites d'application dans l'art numerique la publicite et le design.
Le succes du modele montre que Google parie fortement sur une nouvelle generation d'IA d'imagerie ou la creativite la reconnaissance et la personnalisation sont combinees harmonieusement a partir d'une'mangue nano' qui semblait etre juste une blague au milieu de la nuit.