Gemini : l’édition photo par IA devient visuelle avec des outils d’annotation
Fini les prompts interminables. L’edition photo par intelligence artificielle prend une tournure plus visuelle et plus intuitive. Que l’on soit favorable ou non aux images modifiées par IA, la tendance est claire : la photographie mobile s’oriente vers des outils intégrés et gestuels.
Google avance, mais un irritant subsiste
Google a pris de l’avance avec ses outils d’edition fondes sur Gemini. Les derniers modèles, comme le Nano Banana Pro, surpassent deja Gemini 3 Pro Image en capacités. Pourtant, un obstacle persiste : il faut encore expliquer en texte ce que l’on souhaite changer sur une photo. Cette contrainte complique le processus et multiplie les essais infructueux.
Des « pouvoirs de gribouillage » pour Gemini
Selon une fuite de TestingCatalog, Google travaille a l’integration d’outils d’annotation directement dans Gemini Web. L’interface devrait permettre de dessiner sur une image, entourer des objets, ajouter du texte ou indiquer une zone a retoucher, le tout dans la meme fenetre que celle utilisée pour generer ou editer les images.
- dessiner ou surligner des zones;
- entourer des elements a modifier;
- associer un marquage visuel a une instruction textuelle;
- realiser des retouches locales sans exporter la photo vers une autre app.
Cela evite d’ouvrir Google Photos ou un editeur externe uniquement pour pointer un element sur une image. C’est un gain d’ergonomie notable.
D’un prompt complique… a un geste simple
Des traces dans l’application mobile laissaient deja entrevoir cette direction, avec des fenetres de dialogue permettant de lier un marquage visuel a une commande textuelle. Par exemple : entourer un objet puis indiquer « enleve cet objet », « change sa couleur » ou « adouci l’ombre ». Le geste visuel clarifie l’intention et réduit les erreurs d’interpretation frequentes des IA d’edition.
Une petite fonction qui change tout
En apparence banale, l’annotation transforme le flux de travail : elle reduit la friction, rend Gemini plus accessible aux debutants et améliore la precision pour les editions complexes (details fins, zones qui se chevauchent, objets multiples). Cote experience utilisateur, l’IA s’adapte davantage a l’utilisateur plutot que l’inverse.
Une integration proche
Entre les elements deja visibles dans le code mobile et la nouvelle interface teste sur le web, il ne s’agit plus d’une simple expérimentation. La fonctionnalite semble en phase avancee de developpement et une annonce officielle pourrait intervenir prochainement. Lors de son lancement, Gemini pourrait devenir le premier editeur d’images IA veritablement intuitif, ou la communication avec l’algorithme passe autant par le geste que par les mots.




