L’IA peut devenir bilingue sans aucune aide

le 30 décembre 2017
 0
Est-ce que les traducteurs, qui passent des heures à trouver le bon terme pour bien traduire un texte, doivent se sentir menacés ? Pas encore. Mais le résultat de deux recherches totalement différentes et pourtant semblables montrerait qu'une Intelligence Artificielle est capable de devenir bilingue sans aucune aide. Sans aide humaine, déjà, mais également sans dictionnaire. Une avancée majeure qui doit toutefois être vérifiée.

Ce sont les recherches de Mikel Artetxe et Guillaume Lample qui pourraient améliorer la traduction automatique de textes. Mais on est encore loin du résultat d'un traducteur humain expérimenté.

L'apprentissage non supervisé : une nouvelle technique pour l'IA



Que l'Intelligence Artificielle sache traduire plus ou moins un texte correctement n'est pas une nouveauté : on a tous utilisé Google Translate et des services similaires. Mais l'apprentissage se fait alors avec un superviseur humain : l'IA tente une traduction, l'Homme lui dit si elle est juste ou fausse et l'IA apprend de ce retour.

Artexte et Lample, dans deux recherches distinctes, se sont penchés sur un nouveau système : l'apprentissage non supervisé. Les deux chercheurs ont développé deux systèmes distincts : le premier est la « traduction retour » (Back Translation) d'Artexte, le deuxième la traduction par « suppression de bruit » de Lample.

Mais pour commencer les deux systèmes ont dû créer un « dictionnaire bilingue » en ne se basant que sur les occurrences de certains termes dans deux langues distinctes. Par exemple : les termes table et chaise sont utilisés souvent à proximité en français et en anglais ; une IA est en mesure de reconnaître ces occurrences et de faire le rapport entre « chaise » en français et « chair » en anglais.

01F4000008210664-photo-intelligence-artificielle-artificial-ai-ia-ban.jpg


Un niveau encore très bas par rapport à Google Translate



La « traduction retour » d'Artexte propose de travailler de la manière suivante : l'IA prend le texte en langue A puis le traduit en langue B et le retraduit en langue A. Si la traduction finale n'est pas identique à la phrase initiale, l'IA va retravailler ses connaissances et s'améliorer.

Du côté du système de Lample, l'idée est la même mais entre la traduction aller et la traduction retour, Lample ajoute du « bruit », comme la suppression d'un terme ou la modification de l'ordre des mots. Là aussi, l'IA va apprendre de ses erreurs si la traduction retour n'est pas identique à la phrase d'origine.

Les deux systèmes ne sont toutefois pas encore au point : par rapport à l'apprentissage supervisé de Google Translate, qui réussit un score de 40 lors des évaluations, ou par rapport à un traducteur humain capable de réaliser un score supérieur à 50, cette méthode non-supervisée n'obtient qu'un score de 15 pour l'instant. Mais le champ de recherche est important, puisqu'une telle méthode permettrait de mettre au point des traductions automatiques pour des langues où il n'existe que peu de documents déjà traduits.

Modifié le 01/06/2018 à 15h36
Cet article vous a intéressé ?
Abonnez-vous à la newsletter et recevez chaque jour, le meilleur de l’actu high-tech et du numérique.

Dernières actualités

#Rediff | Comparatif 2019 : quelles sont les meilleures enceintes pour PC ?
Le Sri Lanka bloque les principaux réseaux sociaux après la vague d'attentats
GTX 1650 : sortie le 24 avril à partir de 150€
Galaxy Fold : Samsung retarde officiellement la sortie de l'appareil, voici pourquoi
Les moules de l’iPhone XI confirment la présence d’un trio d’APN disposé en triangle
Bose annonce la compatibilité de trois de ses enceintes avec AirPlay 2
Pour le patron de Toyota, aucun constructeur ne rentabilise ses véhicules électriques
Quand le machine learning permet de donner un sérieux coup de jeune à de vieux jeux vidéo
Après le meurtre d'une étudiante, Uber et Lyft renforcent leurs mesures de sécurité
Projet BlackHoles@Home : prêtez la puissance de calcul de votre ordinateur à la science
Dans son rapport 2018, l'ANSSI fait état d'une cybermenace plus forte que jamais en France
Un fossile de bébé Tyrannosaure en vente sur eBay, pour 2,95 millions de dollars
Test AKG Y500 : tout le son AKG dans un casque supra-aural élégant
Pourquoi YouTube a-t-il tant de mal à modérer ses contenus ? La CEO répond à la question
Grâce à ses IA, Microsoft veut aider à lutter contre le changement climatique
scroll top