🔴 French Days en direct 🔴 French Days en direct

Voice Engine : le cloneur de voix d'OpenAI (ChatGPT) va vous bluffer !

31 mars 2024 à 09h03
1
Sam Altman, cofondateur d'OpenAI © Rokas Tenys / Shutterstock
Sam Altman, cofondateur d'OpenAI © Rokas Tenys / Shutterstock

Avec Voice Engine, OpenAI entre en force sur le marché des solutions text-to-voice qui reposent sur l'IA.

OpenAI ne s'arrête plus. Après la génération de texte, d'image et de vidéo, la société spécialisée en intelligence artificielle annonce avoir créé un modèle capable de générer et même d'imiter des voix.

Un outil text-to-voice

La plateforme, baptisée Voice Engine, requiert une invite sous forme de texte et un échantillon audio de seulement 15 secondes pour générer une voix naturelle qui se rapproche de très près de celle de l'orateur d'origine. OpenAI promet que son outil est capable de créer « des voix émouvantes et réalistes ».

L'entreprise indique avoir entamé le développement de Voice Engine à la fin de l'année 2022. Elle précise que le modèle alimente déjà les voix prédéfinies disponibles dans son API de synthèse vocale ainsi que ChatGPT Voice et Read Aloud.

Comme pour le générateur de vidéo Sora, OpenAI se montre prudente quant au déploiement de Voice Engine, « en raison du potentiel d'utilisation abusive de la voix synthétique ». La fonctionnalité n'est donc pas disponible auprès du grand public actuellement.

Voice Engine propose du text-to-voice © Ole.CNX / Shutterstock
Voice Engine propose du text-to-voice © Ole.CNX / Shutterstock

Pour la traduction et l'aide à la lecture

La société n'est d'ailleurs pas certaine aujourd'hui de lancer à terme une version accessible à tous, qu'elle soit gratuite ou payante. « Sur la base des conversations et des résultats des tests à petite échelle, nous prendrons une décision plus éclairée quant à l'opportunité et à la manière de déployer cette technologie à grande échelle », communique OpenAI.

Parmi les applications tirant parti de Voice Engine, OpenAI cite la possibilité de fournir une aide à la lecture aux non-lecteurs et aux enfants. La capacité du service à générer des voix naturelles et chargées d'émotions s'est montrée bien utile pour l'entreprise de technologie éducative Age of Learning, qui a eu recours à Voice Engine pour générer du contenu voix off préscénarisé.

Un autre aspect important pourrait être la traduction de contenus, notamment de vidéos et de podcasts, permettant aux entreprises et aux créateurs de toucher un public multilingue. OpenAI précise que Voice Engine préserve l'accent natif du locuteur d'origine lorsqu'il est utilisé pour la traduction. Générer une voix en anglais à partir de l'échantillon audio d'un locuteur français produit par exemple une voix anglaise avec un accent français.

ChatGPT
  • Chat dans différentes langues, dont le français
  • Générer, traduire et obtenir un résumé de texte
  • Générer, optimiser et corriger du code

Créé par OpenAI, ChatGPT est un chatbot avancé propulsé par le modèle linguistique de dernière génération GPT-4. En exploitant des technologies d'apprentissage en profondeur et d'intelligence artificielle, ce chatbot a la capacité de déchiffrer et de comprendre les demandes des utilisateurs. Grâce à son habileté à générer du texte de manière ingénieuse, ChatGPT offre des réponses adaptées et pertinentes, garantissant une interaction de chat fluide et une expérience utilisateur optimisée.

Créé par OpenAI, ChatGPT est un chatbot avancé propulsé par le modèle linguistique de dernière génération GPT-4. En exploitant des technologies d'apprentissage en profondeur et d'intelligence artificielle, ce chatbot a la capacité de déchiffrer et de comprendre les demandes des utilisateurs. Grâce à son habileté à générer du texte de manière ingénieuse, ChatGPT offre des réponses adaptées et pertinentes, garantissant une interaction de chat fluide et une expérience utilisateur optimisée.

Source : OpenAI

Alexandre Schmid

Gamer et tech enthusiast, j’ai fait de mes passions mon métier. Diplômé d’un Master en RNG sur Hearthstone. Rigole aux blagues d’Alexa.

Lire d'autres articles

Gamer et tech enthusiast, j’ai fait de mes passions mon métier. Diplômé d’un Master en RNG sur Hearthstone. Rigole aux blagues d’Alexa.

Lire d'autres articles
Vous êtes un utilisateur de Google Actualités ou de WhatsApp ? Suivez-nous pour ne rien rater de l'actu tech !
google-news

A découvrir en vidéo

Rejoignez la communauté Clubic S'inscrire

Rejoignez la communauté des passionnés de nouvelles technologies. Venez partager votre passion et débattre de l’actualité avec nos membres qui s’entraident et partagent leur expertise quotidiennement.

S'inscrire

Commentaires (1)

Bestdoud
Je vois bien la traduction des films avec la vraie voix des acteurs<br /> Ça serait la fin des doublages<br /> Si en plus ils utilisent l’IA pour modifier les mouvements de bouches, l’illusion serait parfaite
Voir tous les messages sur le forum
Haut de page

Sur le même sujet