L’IA peut devenir bilingue sans aucune aide

30 décembre 2017 à 18h34
0
Est-ce que les traducteurs, qui passent des heures à trouver le bon terme pour bien traduire un texte, doivent se sentir menacés ? Pas encore. Mais le résultat de deux recherches totalement différentes et pourtant semblables montrerait qu'une Intelligence Artificielle est capable de devenir bilingue sans aucune aide. Sans aide humaine, déjà, mais également sans dictionnaire. Une avancée majeure qui doit toutefois être vérifiée.

Ce sont les recherches de Mikel Artetxe et Guillaume Lample qui pourraient améliorer la traduction automatique de textes. Mais on est encore loin du résultat d'un traducteur humain expérimenté.

L'apprentissage non supervisé : une nouvelle technique pour l'IA



Que l'Intelligence Artificielle sache traduire plus ou moins un texte correctement n'est pas une nouveauté : on a tous utilisé Google Translate et des services similaires. Mais l'apprentissage se fait alors avec un superviseur humain : l'IA tente une traduction, l'Homme lui dit si elle est juste ou fausse et l'IA apprend de ce retour.

Artexte et Lample, dans deux recherches distinctes, se sont penchés sur un nouveau système : l'apprentissage non supervisé. Les deux chercheurs ont développé deux systèmes distincts : le premier est la « traduction retour » (Back Translation) d'Artexte, le deuxième la traduction par « suppression de bruit » de Lample.

Mais pour commencer les deux systèmes ont dû créer un « dictionnaire bilingue » en ne se basant que sur les occurrences de certains termes dans deux langues distinctes. Par exemple : les termes table et chaise sont utilisés souvent à proximité en français et en anglais ; une IA est en mesure de reconnaître ces occurrences et de faire le rapport entre « chaise » en français et « chair » en anglais.

01F4000008210664-photo-intelligence-artificielle-artificial-ai-ia-ban.jpg


Un niveau encore très bas par rapport à Google Translate



La « traduction retour » d'Artexte propose de travailler de la manière suivante : l'IA prend le texte en langue A puis le traduit en langue B et le retraduit en langue A. Si la traduction finale n'est pas identique à la phrase initiale, l'IA va retravailler ses connaissances et s'améliorer.

Du côté du système de Lample, l'idée est la même mais entre la traduction aller et la traduction retour, Lample ajoute du « bruit », comme la suppression d'un terme ou la modification de l'ordre des mots. Là aussi, l'IA va apprendre de ses erreurs si la traduction retour n'est pas identique à la phrase d'origine.

Les deux systèmes ne sont toutefois pas encore au point : par rapport à l'apprentissage supervisé de Google Translate, qui réussit un score de 40 lors des évaluations, ou par rapport à un traducteur humain capable de réaliser un score supérieur à 50, cette méthode non-supervisée n'obtient qu'un score de 15 pour l'instant. Mais le champ de recherche est important, puisqu'une telle méthode permettrait de mettre au point des traductions automatiques pour des langues où il n'existe que peu de documents déjà traduits.

Modifié le 01/06/2018 à 15h36
0 réponses
0 utilisateurs
Suivre la discussion

Les actualités récentes les plus commentées

Normandie : la plus grande route solaire du monde est un échec
Windows Defender obtient 3 fois le score maximum aux tests AV-Test
Sur Reddit, les développeurs d'Apex Legends dérapent et insultent leur communauté
Matrix 4 officiellement annoncé, avec Keanu Reeves et Carrie-Ann Moss
PS5 : la fuite d'un brevet révèle un design plutôt original
L'astéroïde Apophis qui frôlera la Terre en 2029 est-il vraiment dangereux ?
Starman et sa Tesla Roadster viennent d'achever leur première orbite autour du Soleil
A peine lancée aux USA, Apple annonce que sa Card serait sensible au jean et au cuir
Un chercheur français a trouvé une faille critique dans le système de vote russe
C’est officiel : Disney+ ne sera pas disponible au lancement en France

Notre charte communautaire

1. Participez aux discussions

Nous encourageons chacun à exprimer ses idées sur les sujets qui l'intéressent, et à faire profiter l'ensemble de la communauté de son expertise sur un sujet particulier.

2. Partagez vos connaissances

Que vous soyez expert ou amateur passionné, partagez vos connaissances aux autres membres de la communauté pour enrichir le niveau d'expertise des articles.

3. Échangez vos idées

Donnez votre opinion en étayant votre propos et soyez ouverts aux idées des autres membres de la communauté, même si elles sont radicalement différentes des vôtres.

4. Faites preuve de tolérance

Qu'il s'agisse de rédacteurs professionnels ou amateurs, de lecteurs experts ou passionnés, vous devez faire preuve de tolérance et vous placer dans une démarche d'entraide.

5. Restez courtois

Particulièrement lorsque vous exprimez votre désaccord, critiquez les idées, pas les personnes. Évitez à tout prix les insultes, les attaques et autres jugements sur la forme des messages.

6. Publiez des messages utiles

Chaque participation a vocation à enrichir la discussion, aussi les partages d'humeurs personnelles ne doivent pas venir gêner le fil des échanges.

7. Soignez votre écriture

Utilisez la ponctuation, prohibez le langage SMS et les majuscules, relisez-vous afin de corriger un peu les fautes de frappe et de français : trop de fautes n’engagent ni à lire le message, ni à répondre à une question.

8. Respectez le cadre légal

Ne publiez pas de contenus irrespectueux, racistes, homophobes, obscènes ou faisant l'apologie de courants radicaux, qu'ils soient politiques ou religieux. N'utilisez pas plusieurs comptes utilisateurs.

9. Ne faites pas de promotion

Ne profitez pas d'une discussion pour faire la publicité d'un produit, d'un service ou même de votre site web personnel.

10. Ne plagiez pas

Exprimez uniquement vos opinions ou partagez des idées en citant vos sources.

scroll top