Google vient d'annoncer le prochain avénement d'algorithmes capables d'analyser une image et de produire automatiquement un texte expliquant son contenu. On imagine des perspectives étonnantes pour ces outils, mais également un taux d'erreur à maîtriser inévitablement...
Google vient d'annoncer qu'il a désormais la possibilité de créer des descriptions textuelles d'images trouvées sur le Web et ce de façon automatique. Quelques exemples fournis à l'occasion : "Two pizzas sitting on top of a stove top oven", "A group of people shopping at an outdoor market" ou "Best seats in the house".
L'algorithme est basé sur des systèmes d'apprentissage automatique (machine-learning) et issu du monde de la traduction automatique et des Recurrent Neural Network (RNN) / Convolutional Neural Network (CNN).
Source de l'image : Google |
Les exemples présentés ci-dessous sont bluffants et on imagine le nombre d'applications possibles pour ces algorithmes, mais également le nombre d'erreurs que cela peut générer. Pour l'instant, Google ne dit pas sur son blog la façon dont il pense utiliser ces logiciels à l'avenir (ils ne semblent pas encore opérationnels) mais un moteur comme Google Images pourrait, bien sûr, y gagner énormément en pertinence. Si les descriptions sont exactes, bien entendu. Une procédure de correction par les internautes sera-t-elle prévue en cas d'erreur ? On ne le sait pas encore...
Source de l'image : Google |
C’est un peu flippant quand même !
Avec les moyens que Google dispose, ce n’est pas du tout étonnant. Toutefois il faut faire attention car vue l’avancée de ce géant du web, ça sent à plein un grand vouloir de dominer le monde.
Excusez-moi, mais l’article et encore plus ses commentaires suscitent un profond malaise chez moi.
C’est fou l’aveuglement des gens et leur absence de sens critique en présence de la communication des gars de Google.
Mais que diable, si les gars de Google sont capables de décrire le contenu des images ou font des progrès dans ce sens, qu’ils commencent d’abord par les mettre en œuvre, par éliminer les images complètement non pertinentes dans les résultats des requêtes sur images.
Alors, oui, je féliciterais le progrès réalisé. Et très vivement.
Mais ici, absolument rien de tel. On s’extasie (c’est vraiment le bon mot) sur simplement de la communication sans AUCUNE amorce d’implémentation .
—-
Cela me rappelle le cas de Lernout & Hauspie, société tout à fait en pointe dans la reconnaissance vocale et dont GOOGLE était d’ailleurs actionnaire et qui pour continuer à recevoir des commandes et les capitaux surévaluait grandement les progrès faits en la matière jusqu’au jour où le pot au rose a été découvert.
Engloutissant l’épargne des pauvres cons qui avaient pris leur communication (études SCIENTIFIQUES à l’appui) pour la réalité.
Google, t’as de beaux yeux tu sais !
( faudra revoir ton image d’illustration en haut de l’article 🙂 )
J’en reviens pas, j’en ai parlé en formation mardi. Après l’épisode du « mobile friendly » que j’avais envisagé, je commence à croire que je suis devin (mais pas un génie pour autant… ^^). En tout cas, je dois sérieusement envisager une reconversion en madame Soleil de la SEO… ^^
Je pense que cet algo sera basé sur les ALTs des images car les images avec des ALTs vides ne seront pas indexées.
@Pierre Alouit oui Brain Vision Systems » développe depuis 10 ans ! Google commercialise 🙂
Pour info mon client la société française « Brain Vision Systems » développe déjà ces technologies depuis 10 ans avec en plus ces circuits intégrés ASIC ultra rapide.
C’est la future remise en question de la balise ALT ?
C’est assez fou de voir à quelle vitesse Google arrive à générer de nouvelle technologie ou bien se sert de technologies existantes …
Des prémices à de nouvelles possibilités mais on se demande à quelle fins … confère l’épisode des google glass qui pourtant jugé utile devient mal perçu….
@Pierre : Je crois qu’il faut arrêté de toute automatisé de la sorte et qui n’en ont pas vraiment besoin … cela risque de devenir ambiguë .
@Marie : Google a racheté les principales boites d’IA en plus d’avoir les meilleurs ingénieurs en TALN au monde… il ne doit que faire mieux.
Assurément c’est Super, Y’a plus qu’a reprendre tout le contenu disponible sur internet, le retravailler et le redistribuer directement aux internautes, comme cela on supprime tous les intermédiaires, elle est pas belle la vie ?
Super ces nouveaux algporythmes et je suis vraiment impressionné par la capacité de google de générer de tels descriptifs. Pour analyser une image, il va donc devoir détecter les visages, l’orientation des visages, la précense d’objets sur les images,… bref c’est limite intelligence artificielle forte.