Immersion, traduction... Google continue de révolutionner la recherche

28 septembre 2022 à 22h15
4
Dounia Berrada © Google
Dounia Berrada, Ingénieure logiciel senior chez Google, a présenté une fonctionnalité de traduction bluffante © Capture d'écran par Clubic du Google Search On

Google a fait de nouvelles annonces mercredi, lors de l'événement Search On, qui vont bien au-delà de la recherche textuelle historique.

Depuis des années, Google développe toujours plus de moyens naturels et intuitifs pour chercher des informations. De la recherche textuelle d'antan, il est désormais possible d'effectuer des recherches à partir d'une photo ou d'une commande vocale. Mercredi, la firme de Mountain View a profité de son événement Google Search On pour montrer toutes les capacités offertes par les progrès de l'intelligence artificielle, au travers de nouvelles fonctionnalités toujours plus immersives.

La fonctionnalité Multisearch, qui permet une recherche à partir d'images et de textes simultanément, va vite arriver en Europe

Elle était pour l'instant uniquement disponible en version bêta aux États-Unis, mais voilà qu'elle va s'élargir à plus de 70 nouvelles langues, dont le français, dans le mois à venir. De quoi parle-t-on ? De la fonctionnalité Multisearch, qui fait elle-même appel à la recherche visuelle Google Lens, inaugurée en 2017 et qui aujourd'hui permet de traiter quelque 8 milliards de requêtes par mois.

Multisearch © Google
Un exemple de la fonctionnalité Multisearch © Google

Multisearch permet d'effectuer des recherches à partir d'images et de texte, le tout simultanément. Cette première fonctionnalité sera bientôt disponible en France, mais Google a déjà promis de lancer, dès cet automne aux États-Unis, la version améliorée. Celle-ci est baptisée Multisearch near me, comprenez « Multisearch près de moi » en français. Ici, l'utilisateur prend une photo d'un objet, d'une plante, d'un plat, et Google lui indique en un instant où le trouver dans un endroit proche. Assez bluffant.

Une nouvelle ère pour la traduction

Google Translate va aussi connaître sa révolution. L'outil de traduction de la firme américaine veut contribuer à faire tomber les barrières linguistiques grâce à la communication visuelle. C'est ainsi que Google, avec l'aide de l'IA, a pu passer de la traduction de texte à la traduction d'images. Un chiffre témoigne de l'utilité de l'outil : chaque mois, l'entreprise enregistre plus d'un milliard d'utilisations pour la traduction d'un texte depuis une photo, le tout dans 100 langues différentes.

Et pour aller plus loin, Google offre désormais à ses utilisateurs la possibilité de réintégrer le texte une fois celui-ci traduit, directement dans l'image originale, par le biais des GAN (Generative Adversarial Networks), que l'on peut traduire par « réseaux antagonistes génératifs », une technologie assez récente particulièrement prometteuse, que l'on peut comparer à la partie créative du machine learning.

Google Lens Translate
À gauche, votre image de départ ; à droite, celle après traduction. On voit que Google a directement remplacé le texte sur l'image © Google

Sur l'aspect pratique, si vous dirigez votre appareil photo vers un magazine dans une langue étrangère, Google traduira le texte automatiquement et le superposera sur les images de la page, comme s'il était imprimé.

La vue immersive vient enrichir Google Maps plus que jamais

Avec les progrès faits en matière de modèles prédictifs et de vision artificielle, Google clame haut et fort avoir réimaginé le concept de la carte, passant ainsi d'une image 2D à une vue multidimensionnelle de notre monde. Tout cela pour que l'utilisateur se représente un lieu presque comme s'il y était physiquement.

On connaissait déjà l'affichage du trafic en temps réel, basé notamment sur l'aspect participatif de Google Maps, mais voilà que l'application va être enrichie par la vue immersive. Cette dernière consiste en une représentation dynamique de renseignements divers et variés, comme l'affluence et la météo. En plus de tous les renseignements déjà fournis… L'utilisateur peut alors se faire une idée assez précise d'un lieu visé avant même d'y avoir mis les pieds.

Vue immersive
La vue immersive, pour un Google Maps encore plus riche en renseignements © Google

Si l'on prend l'exemple d'un restaurant, la vue immersive permet de zoomer d'abord sur le quartier, puis sur l'établissement ciblé, en prenant donc connaissance de la fréquentation du lieu à tel ou tel moment de la jounée (l'utilisateur dispose d'un curseur qui l'aide à choisir l'horaire précis), et de la météo.

Évidemment, cette fonctionnalité nécessite de grosses ressources humaines et des images aériennes, donc elle est particulièrement complexe à déployer. C'est notre petit regret. 250 monuments sont ainsi disponibles pour la première version de cette fonctionnalité. La vue immersive sera, elle, définitivement lancée dans cinq villes (San Francisco, Los Angeles, New York, Londres et Tokyo) dans les prochains mois. D'autres métropoles suivront sans doute plus tard.

Soyez toujours courtois dans vos commentaires.
Respectez le réglement de la communauté.
4
5
HAL1
La vidéo en fin d’article est plus longue que je pensais…
Biktamere
Il y a deux domaines dans lesquels il y a un véritable défi informatique, pas encore bien résolu : la traduction et la dictée vocale, particulièrement pour la langue française qui est particulièrement riche, complexe, pleine d’exceptions . A ma connaissance il n’existe qu’un logiciel de dictée vocale qui tienne la route : Dragon Naturally speaking, mais c’est une vraie usine à gaz, ancienne, pas mise à jour, pleine de bugs, et qui profite outrageusement de sa position dominante. La possibilité de dictée vocale de Google lui est au moins égale mais en ligne seulement et encore incomplète… J’attends depuis des années que ce défi majeur soit enfin traité sérieusement, mais ça ne semble pas intéresser les éditeurs de programmes et le monde informatique… de même, ça manque de programmes relatifs à la grammaire, aux synonymes, ( à part Antidote qui est un add-on) tout ce qui a trait à la langue, finalement… Je trouve ça bien dommage et que c’est même un retard majeur et étonnant dans l’évolution de l’informatique
Voir tous les messages sur le forum

Derniers actualités

Un antivirus hyper efficace et gratuit ? Voici la bonne solution
Apple iPhone 14 Plus : une jolie baisse de prix chez Amazon avant Noël
Chrome : Google annonce un mode économie d'énergie et de mémoire !
Elon Musk a transformé des bureaux de Twitter en chambre... parce que le travail n'attend pas
Juste avant Noël, l'écran gamer Samsung Odyssey G3 chute à 145€
Le micro Trust Gaming GXT 258W Fyru est complètement bradé sur Amazon
Huawei Band 7 : le bracelet connecté chute à moins de 50€ juste avant Noël
Chez Twitter, Musk aurait fait renvoyer les femmes en priorité
Idée cadeau : la liseuse Kobo Clara est 20€ moins chère pour Noël !
Idée cadeau | EcoSphere : un écosystème complet dans une sphère
Haut de page