CAPTCHA + biométrie = authentification imparable ?

le mardi 20 février 2018
Et si demain, vous utilisiez votre visage et votre voix pour vous authentifier ? Pour Erkam Uzun, Simon Pak Ho Chung, Irfan Essa et Wenke Lee, du Georgia institute of technology, un tel scénario est le seul moyen fiable pour permettre à un smartphone de s'assurer que la personne qui l'utilise est bien son propriétaire légitime.

Une technique d'authentification forte, reposant sur non pas une, mais deux composantes biométriques (le visage et la voix), agrémentée de deux « défis » supplémentaires, vient d'être présentée au colloque Network and distributed systems security (NDSS) symposium 2018, qui se tient en ce moment à San Diego.

Le CAPTCHA du futur intégrera simultanément plusieurs types de vérifications


Vous connaissez déjà le CAPTCHA et l'identification par reconnaissance faciale, présente sur certains smartphones, peut-être avez-vous même entendu parler de l'identification par la voix (comme cela se fait sur les plateformes téléphoniques de certaines banques) ? Et si toutes ces techniques étaient utilisées simultanément ? C'est même comme ça qu'Erkam Uzun, assistant de recherche à Georgia Tech, et ses collègues, voient l'avenir de l'authentification.

Le smartphone présenté par Erkam Uzun affiche une question, par exemple un problème mathématique comme « 46 + 5 = ? » et demande de donner une réponse à l'oral et en souriant. Le micro capte le son, qui est alors comparé à « l'empreinte vocale » correspondant à cet utilisateur précis, tandis que les traits du visage de la personne en face de la caméra sont comparés aux images sauvegardées.

clubic__les-captchas-bientot-obsoletes-__3166387__489886_854x480_3.jpg


Le temps de réaction, un critère clé


Les chances de tromper le smartphone sont d'autant plus réduites que le geste facial (cligner des yeux, sourire, froncer les sourcils etc.) est à chaque fois donné au hasard. L'intelligence artificielle est certes capable de générer un visage souriant à partir d'une photo, mais cela lui prend un certain temps. Et lorsqu'en plus, il lui faut synthétiser la voix de l'utilisateur en train de prononcer des mots précis (eux aussi inconnus à l'avance), le temps nécessaire sera d'autant plus long.

C'est précisément sur cette « fenêtre de réaction » réduite que mise le modèle élaboré par Erkam Uzun et ses collègues. Face à ces « défis », un humain est capable de donner la réponse correcte aux vues de tous les critères au bout d'une ou deux secondes, tandis que l'ordinateur mettra au moins 5-7 secondes. Si la réponse tarde à arriver, une conclusion s'impose : le smartphone n'est pas face à un humain.

Modifié le 01/06/2018 à 15h36