Google Lens, plus performant que jamais, détecte un milliard d’objets

Sommaire

Google a récemment annoncé que sa technologie Google Lens, commercialisée depuis un an, peut désormais détecter plus d’un milliard d’objets. Lors de son lancement, la fonction d’intelligence artificielle de l’appareil photo ne pouvait reconnaître que 250 000 éléments. L’algorithme de Google Lens a été alimenté en informations via des centaines de millions de requêtes dans la recherche d’images pour servir de base à l’entraînement de ses algorithmes. Il recueille également des données à partir de photos capturées par des smartphones et peut étendre ses capacités de reconnaissance de produits via Google Shopping.  Bien que la base de données d’articles que Google Lens peut maintenant reconnaître soit massive, pour l’instant, il est fort probable qu’il ne reconnaisse pas les articles rares et obscurs tels que les voitures de collection ou les systèmes stéréo des années 70. Google Lens a beaucoup d’applications pratiques. Il peut transformer les images d’un individu en requêtes de recherche pour faire apparaître toutes les informations pertinentes sur l’image via son algorithme d’apprentissage automatique et d’intelligence artificielle.

 

Le fonctionnement

 

Évidemment, ce système n’est pas parfait. Il peut être confondu par un objet d’apparence similaire. Lens apporte des images spécifiques à la requête en même temps que les milliers d’images qui sont retournées pour chaque requête de recherche. Ces images pertinentes aident à entraîner les algorithmes pour produire des résultats encore plus précis. Le Knowledge Graph de Google, aide à faire apparaître des dizaines de milliards de faits sur une variété de sujets allant des “pop stars aux races de chiots.” Il est souvent facile de tromper le système. Nous prenons des photos sous différents angles, dans différents arrière-plans ou dans des conditions d’éclairage variables. Tous ces facteurs peuvent produire des photos qui diffèrent de la base de données dont dispose Google Lens. Il y a encore du travail à faire pour rendre Lens plus intelligent. C’est pourquoi l’équipe de Google élargit la base de données de Lens en lui fournissant des photos prises via des smartphones. Google Lens peut également lire du texte dans des menus ou des livres. L’objectif rend ces mots interactifs afin que les utilisateurs puissent effectuer diverses actions sur eux. Par exemple :

  • les utilisateurs peuvent pointer l’appareil photo de leur smartphone sur une carte de visite et l’ajouter à leur liste de contacts ;
  • les utilisateurs peuvent également enregistrer les ingrédients d’un livre de recettes physique et les importer dans leur liste de courses.

 

Google a appris à la Lens à lire d’une manière très dépouillée. Google a développé un moteur de reconnaissance optique de caractères (OCR). L’entreprise l’a combiné avec sa compréhension du fonctionnement des langues à partir de Google Search et du Knowledge Graph. Elle a enseigné aux algorithmes d’apprentissage automatique via différents caractères, langues et polices, et s’est inspirée de sources telles que les scans de Google Livres. Lens dispose aussi d’une fonction de recherche de style qui donne des suggestions d’éléments stylistiquement similaires. Ainsi, si un utilisateur pointe son appareil photo sur des tenues et de la décoration intérieure, il recevra des suggestions d’articles dont le style est similaire. Ainsi, par exemple, si un utilisateur voit une lampe qu’il trouve vraiment intéressante, Google Lens lui suggérera des lampes au design similaire en vente. Lens affichera des avis sur des produits pertinents sur le plan stylistique. Nos smartphones deviennent de plus en plus intelligents au fil des jours. Nous comptons tellement sur eux en raison de leur portabilité et de leur facilité d’utilisation globale. C’est ce que Google a compris depuis longtemps. Il se concentre fortement sur l’amélioration de ses services basés sur les smartphones. Google Lens n’en est qu’un exemple. Les algorithmes d’apprentissage profond utilisés dans Google Lens pourraient aussi bientôt être utilisés pour les diagnostics médicaux. Ils montrent un grand potentiel pour détecter les signes de rétinopathie diabétique simplement en regardant des photos d’yeux. Pour l’instant, Lens ne peut fonctionner que sur les smartphones, mais nous le voyons devenir un outil technologique omniprésent dans un avenir proche.

Facebook
Twitter
LinkedIn