Ce projet s'appelle Difface et n'a besoin que d'un séquençage ADN pour reconstituer un visage en 3D avec une précision ahurissante. Officiellement, il a été développé pour la recherche uniquement. En revanche, rien ne garantit que les limites éthiques fixées aujourd’hui seront celles respectées demain.

 Le visage devient une ici une donnée calculable, et non plus capturée. © New Africa / Shutterstock
Le visage devient une ici une donnée calculable, et non plus capturée. © New Africa / Shutterstock

Il y avait un seuil technique que la reconnaissance faciale n’avait pas encore franchi : celui qui permettrait de reconstruire un visage sans image, sans caméra de surveillance et sans aucune trace visuelle.

Mais ça, c'était avant. Cette limite vient d’être franchie par une équipe de chercheurs de l’Académie chinoise des sciences à Pékin. Ces derniers sont parvenus à concevoir une IA capable de générer le visage d’un individu à partir de son ADN, avec une précision de l’ordre de quelques millimètres. À ce stade, on ne peut même plus réellement parler d’identification ; disons les faits tels qu'ils sont : c'est de la reconstitution.

Si vous désirez connaître plus en détail les tenants et les aboutissants de cette technologie qui frôle la dystopie, vous pouvez lire les travaux complets de l'équipe à l'origine de Difface. Ils ont été publiés le 7 mai dans la revue Advanced Science.

Quand l’IA lit le génome comme dans un miroir

Le modèle s’appuie sur un corpus de données constitué à partir de 9 500 volontaires d’origine Han chinoise (principale ethnie du pays, représentant plus de 90 % de la population). Pour chacun, deux éléments ont été collectés : un séquençage complet de l’ADN et un scan 3D haute définition du visage.

L’objectif n’était pas de repérer des similarités générales, mais d’identifier des corrélations entre certaines variations génétiques. Ce qu'on appelle les SNPs (single nucleotide polymorphisms), ainsi que des caractéristiques morphologiques quantifiables, comme la largeur du nez, l’angle de la mâchoire ou le relief des pommettes.

L’image est ensuite générée à l’aide d’un modèle de diffusion, une technique de synthèse largement utilisée aujourd’hui dans l’IA générative ; dans des outils comme DALL-E ou Stable Diffusion ; pour produire des images à partir de descriptions textuelles. Ici, au lieu de langage, c’est le génome qui sert de base à la génération.

 Cette image montre comment Difface réalise la reconstitution faciale 3D précise à partir de l'ADN via un encodeur de SNPs et un modèle de diffusion, comparant l'original et le visage généré (en bas à droite). © Mingqi Jiao et al. / Advanced Science
Cette image montre comment Difface réalise la reconstitution faciale 3D précise à partir de l'ADN via un encodeur de SNPs et un modèle de diffusion, comparant l'original et le visage généré (en bas à droite). © Mingqi Jiao et al. / Advanced Science

Contrairement à des modèles comme ChatGPT ou Gemini, qui prédisent les mots les plus probables, Difface prédit une structure faciale plausible à partir de données génétiques, en respectant des contraintes morphologiques mesurées.

Selon les chercheurs, la distance moyenne entre certains points de référence du visage réel et ceux du visage généré est de 3,5 millimètres. Ce chiffre tombe à moins de 3 mm lorsque l’on ajoute à l’analyse trois variables supplémentaires : l’âge, le sexe et l’indice de masse corporelle. À l'échelle d'un portrait, la restitution est donc très crédible.

En traitant le génome comme un ensemble de coordonnées, l’IA peut ainsi produire un visage sans jamais l’avoir vu. © New Africa / Shutterstock

Outil judiciaire ou cauchemar éthique ?

Le projet est évidemment présenté comme une contribution à la recherche biomédicale ou à l’identification forensique. Toutefois, s'arrêter à cette façade sans réfléchir plus loin reviendrait à rater la réelle problématique posée par Difface. Car une fois qu’un visage peut être généré à partir d’un simple fragment d’ADN la notion d’anonymat génétique perd toute consistance. Une trace biologique isolée, laissée sur un objet ou un textile, devient potentiellement identifiable.

Les applications policières sont les plus directes, mais aussi les plus balisées juridiquement. Le vrai risque vient d’ailleurs : rien n’empêche des acteurs privés, commerciaux ou étatiques, de s’approprier ce type de modèle.

À partir de là, certaines dérives sont identifiables. Un recruteur pourrait, à travers un test ADN prétendument réalisé à des fins médicales ou préventives, accéder à des données qui permettent de générer un visage. Un assureur qui analyse des prédispositions génétiques pour ajuster ses contrats, ou un État collectant discrètement des données biologiques ; tous pourraient, à terme, extraire des profils morphologiques sans consentement explicite. Le verrou technologique est levé ; le reste n’est qu’une question d’usage et de régulation.

Bien heureusement, le cadre européen de protection des données personnelles repose sur un principe fondamental : aucune identification d'un individu ne peut être déduite de données biologiques sans son consentement explicite. En revanche, ce que les États du Vieux Continent n'ont pas encore suffisamment précisé, c'est la manière d'appliquer leur doctrine et leurs réglementations existantes ; qui encadrent déjà les données biologiques ; pour cerner strictement l'exploitation de ces données. C'est justement ce que Difface introduit : un visage sans caméra et une identité sans image.

Certes, à court terme, un outil de ce type ne peut absolument pas être déployé en Europe ou en France, mais cela ne signifie pas pour autant que le sujet peut être écarté. Difface démontre qu'il est techniquement faisable de reconstituer un visage à partir d'une trace biologique ; pour l'instant, seulement à partir d'individus Han. Une fois cette disposition établie, réfléchir à des garde-fous suffisamment solides devient indispensable, non seulement pour encadrer la collecte des données génétiques, mais surtout pour limiter leur exploitation à des fins de projection identitaire.

Source : BGR