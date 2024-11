Selon NVIDIA, Fugatto repose sur une architecture composée de plus de 2,5 milliards de paramètres, avec en prime une fonction d'interpolation avancée, permettant (entre autres) de gérer l'intensité de certains effets, comme ajouter un accent à une voix ou transformer une voix calme en une voix (plus ou moins) colérique.

Dans l'exemple proposé par NVIDIA, on peut aussi voir Fugatto créer un son à partir de la commande : « Créer un son où un train passe et se transforme en un orchestre de cordes luxuriant ». On peut également isoler la partie vocale d'un morceau en proposant à Fugatto le morceau musical en question et la requête textuelle associée.