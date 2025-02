Entraîné sur plus de 18 700 heures de données vidéo, le système combine images, audio et données de mouvement pour synchroniser gestes, expressions faciales et discours. Contrairement aux outils précédents limités aux visages ou aux bustes, il anime l’intégralité du corps humain, y compris dans des positions dynamiques comme la danse ou la manipulation d’objets.

L’IA procède d’abord par compression des données d’entrée (photo + audio), puis génère progressivement les mouvements grâce à un système de raffinement comparatif. Cette méthode permet d’obtenir des résultats comme cet Einstein virtuel délivrant un cours de physique ou une fausse conférence TED, présentés par les chercheurs.