Lyria 3, le nouveau modèle de génération musicale de Google DeepMind, est disponible dans Google Gemini. Un texte, une photo, et en quelques secondes, un morceau de 30 secondes est généré avec paroles, mélodie et pochette d'album.

Vous tapez une description, vous importez une photo, et Gemini produit une chanson de 30 secondes avec paroles, mélodie et illustration - Capture d'écran ©google / Mélina Loupia pour Clubic
Vous tapez une description, vous importez une photo, et Gemini produit une chanson de 30 secondes avec paroles, mélodie et illustration - Capture d'écran ©google / Mélina Loupia pour Clubic

Google a annoncé hier l'intégration de Lyria 3 dans Gemini. Il s'agit du modèle de Google qui transforme un prompt en morceau de musique. Vous tapez une description, vous importez une photo, et Gemini produit une chanson de 30 secondes avec paroles, mélodie et illustration. Vous n'avez besoin ni de partition, ni de logiciel audio, et encore moins d'écrire une seule ligne de texte chanté. Ça, c'est Lyria 3 qui s'en charge. Dans son communiqué, en guise d'exemple officiel , Google a présenté « un slow R&B humoristique sur une chaussette qui trouve sa partenaire ». En creux, ce que propose le modèle, c'est plus une bande-son pour vos stories, vos Shorts, vos souvenirs, accessible à n'importe qui que le titre-phare de votre premier album.

Il n'empêche. Par rapport aux versions précédentes de Lyria, Moutain view propose trois améliorations. Les pistes sont musicalement plus complexes et plus réalistes. Vous disposez d'un contrôle accru sur le style, le tempo et le chant. Et les paroles sont générées automatiquement à partir de la requête. Vous n'êtes donc pas obligé d'être un descendant de Pierre Delanoë pour obtenir un résultat.

Le top et le flop de Lyria 3

Les parties instrumentales des extraits fournis par Google sont souvent convaincantes. Là où ça coince, c'est sur les paroles : elles sonnent parfois ringard, parfois franchement bizarre, comme si le modèle avait du mal à trouver le bon registre entre sincérité et second degré. Rien de rédhibitoire pour un usage casual, mais suffisant pour rappeler qu'on est encore loin d'une production humaine maîtrisée.

Gemini génère aussi une pochette d'album via Nano Banana, le modèle image maison, et le morceau peut être partagé directement depuis l'application. Sur YouTube, les créateurs de Shorts accèdent à Lyria 3 via Dream Track, déjà disponible aux États-Unis et en cours de déploiement dans d'autres pays, pour habiller leurs vidéos d'une bande-son sur mesure.

SynthID dans les oreilles

Tous les morceaux produits intègrent SynthID, le filigrane invisible de Google pour les contenus générés par IA. Mieux encore : Gemini peut désormais analyser un fichier audio importé par l'utilisateur pour détecter si SynthID y est présent. La vérification des contenus IA s'étend donc à l'audio, après les images et les vidéos.

Google dit avoir travaillé avec la communauté musicale depuis le lancement de Lyria en 2023, et avoir veillé aux droits d'auteur lors du développement de Lyria 3. Si une requête mentionne un artiste précis, le modèle s'en inspire pour le style, sans chercher à l'imiter directement. Des filtres comparent les productions avec des contenus existants. Une précaution qui, de l'aveu même de Google, n'est pas infaillible.

Lyria 3 est accessible dès aujourd'hui sur ordinateur via gemini.google.com, et dans les prochains jours sur mobile, pour les utilisateurs de plus de 18 ans en anglais, allemand, espagnol, français, hindi, japonais, coréen et portugais. Les abonnés AI Plus, Pro et Ultra bénéficient quant à eux de quotas plus élevés. Le déploiement mobile est en cours.

Source : Engadget, Google