Naptha : copier et traduire le texte de n'importe quelle image du Web

28 avril 2014 à 10h42
0
Que diriez-vous de manipuler du texte se trouvant dans une image aussi facilement que le texte d'une page Internet ? C'est ce que propose le projet Naptha, qui permet de sélectionner du texte dans une image, de le copier, de le traduire et même de l'effacer.

Après avoir obtenu la deuxième place du HackMIT 2013 il y a quelques mois, le plus grand concours de développement de la prestigieuse université américaine, cette solution qu'on doit à un dénommé Kevin Kwok a été peaufinée et rendue publique la semaine dernière.

Le projet Naptha, initialement appelé « Images as Text », se présente dans un premier temps sous la forme d'une extension pour le navigateur Google Chrome. Une fois installée, elle permet de sélectionner et de manipuler du texte dans toutes sortes d'images. Alors qu'habituellement il faut recopier manuellement du texte apparaissant dans une capture d'écran, dans une infographie ou dans un document numérisé, on peut ici le copier-coller, l'effacer ou même le remplacer par une version traduite.

0190000007327936-photo-projet-naptha.jpg

Techniquement, Naptha repose essentiellement sur le portage JavaScript de technologies existantes. L'extension opère principalement sur l'ordinateur de l'utilisateur, des serveurs (le cloud) pouvant participer dans certains cas. Kevin Kwok utilise Stroke Width Transform (SWT) de Microsoft Research pour reconnaître les blocs de texte et permettre leur sélection, puis le moteur de reconnaissance optique de caractères (OCR) Ocrad pour la traduction en texte brut. L'auteur reconnaît que ce dernier, une solution libre, a quelques années de retard.

Mais l'utilisateur peut faire appel, via le cloud, au moteur Tesseract de Google, qui prend en compte la langue et le contexte pour améliorer la reconnaissance (« he1|o » devient ainsi « hello »). L'auteur travaille par ailleurs sur l'amélioration de la détection des blocs de texte dans des scènes naturelles sur des photos, apparaissant en perspective et/ou à la verticale. Sans oublier un algorithme dédié aux memes, c'est-à-dire à la typographie Impact Bold, difficile à reconnaître.

Le projet Naptha est donc disponible dès à présent pour Google Chrome. Une version Firefox est envisagée. Mais sur le site Internet détaillé dédié au projet, Kevin Kwok rappelle à juste titre qu'une telle fonction devrait être intégrée d'origine aux navigateurs. Gageons que les éditeurs feront appel à son savoir faire ou s'en inspireront.
Modifié le 01/06/2018 à 15h36
0 réponses
0 utilisateurs
Suivre la discussion

Les actualités récentes les plus commentées

L'Angleterre envisage l'interdiction du smartphone en conduisant, même en main libre
Sur Reddit, les développeurs d'Apex Legends dérapent et insultent leur communauté
Windows Defender obtient 3 fois le score maximum aux tests AV-Test
L'Audi e-tron devient la voiture électrique la plus sûre du monde
Piratées, les enceintes connectées pourraient être une menace pour leurs utilisateurs
WoW Classic : Blizzard dit s’attendre à des files d’attente monstrueuses à l’ouverture
Selon Google, 1,5% des mots de passe seraient compromis
Starman et sa Tesla Roadster viennent d'achever leur première orbite autour du Soleil
Une étude montre que les cyclistes
C’est officiel : Disney+ ne sera pas disponible au lancement en France

Notre charte communautaire

1. Participez aux discussions

Nous encourageons chacun à exprimer ses idées sur les sujets qui l'intéressent, et à faire profiter l'ensemble de la communauté de son expertise sur un sujet particulier.

2. Partagez vos connaissances

Que vous soyez expert ou amateur passionné, partagez vos connaissances aux autres membres de la communauté pour enrichir le niveau d'expertise des articles.

3. Échangez vos idées

Donnez votre opinion en étayant votre propos et soyez ouverts aux idées des autres membres de la communauté, même si elles sont radicalement différentes des vôtres.

4. Faites preuve de tolérance

Qu'il s'agisse de rédacteurs professionnels ou amateurs, de lecteurs experts ou passionnés, vous devez faire preuve de tolérance et vous placer dans une démarche d'entraide.

5. Restez courtois

Particulièrement lorsque vous exprimez votre désaccord, critiquez les idées, pas les personnes. Évitez à tout prix les insultes, les attaques et autres jugements sur la forme des messages.

6. Publiez des messages utiles

Chaque participation a vocation à enrichir la discussion, aussi les partages d'humeurs personnelles ne doivent pas venir gêner le fil des échanges.

7. Soignez votre écriture

Utilisez la ponctuation, prohibez le langage SMS et les majuscules, relisez-vous afin de corriger un peu les fautes de frappe et de français : trop de fautes n’engagent ni à lire le message, ni à répondre à une question.

8. Respectez le cadre légal

Ne publiez pas de contenus irrespectueux, racistes, homophobes, obscènes ou faisant l'apologie de courants radicaux, qu'ils soient politiques ou religieux. N'utilisez pas plusieurs comptes utilisateurs.

9. Ne faites pas de promotion

Ne profitez pas d'une discussion pour faire la publicité d'un produit, d'un service ou même de votre site web personnel.

10. Ne plagiez pas

Exprimez uniquement vos opinions ou partagez des idées en citant vos sources.

scroll top