Mistral AI, champion français de l'intelligence artificielle (IA) vient de présenter trois nouveaux modèles baptisés Voxtral. Objectif : proposer une alternative ouverte, performante et abordable aux solutions de transcription et de compréhension vocale.

Mistral AI étoffe sa gamme de modèles. ©Rokas Tenys / Shutterstock
Mistral AI étoffe sa gamme de modèles. ©Rokas Tenys / Shutterstock
L'info en 3 points
  • Mistral AI dévoile Voxtral, une gamme de modèles IA pour transcription et compréhension vocale, rivalisant avec des géants comme ElevenLabs et OpenAI.
  • Voxtral Small, avec 24 milliards de paramètres, cible les déploiements à grande échelle, tandis que Voxtral Mini, plus léger, s'adapte aux appareils locaux.
  • Voxtral Mini Transcribe se distingue par sa rapidité et son efficacité en transcription audio, surpassant Whisper d'OpenAI.

Car l'audio devient un terrain que l'on ne peut éviter dans le domaine de l'IA, la parole se transformant petit à petit en interface naturelle entre humains et machines. Et si Mistral attire les convoitises d'Apple, la start-up, qui se spécialise dans les modèles ouverts, entend bien prendre position sur ce marché stratégique.

Le chat Mistral
  • Peut tourner en local selon votre configuration
  • Open-source
  • API peu coûteuse

Trois modèles distincts

Cette nouvelle gamme comprend premièrement Voxtral Small, un modèle de 24 milliards de paramètres pensé pour des déploiements en production à grande échelle. Il vient directement concurrencer des technologies établies comme ElevenLabs Scribe, GPT-4o-mini ou Gemini 2.5 Flash. À l’inverse, Voxtral Mini, doté de 3 milliards de paramètres, vise des usages plus légers, notamment sur des serveurs ou appareils locaux.

À titre d'exemples, ces IA peuvent résumer une réunion enregistrée, répondre à des questions précises sur un podcast ou encore convertir des commandes vocales en actions en temps réel, comme lancer une recherche, appeler une API ou automatiser une tâche. Elles s’adaptent aussi bien à des assistants vocaux qu’à des outils professionnels pour la productivité ou le service client.

Pour finir, Voxtral Mini Transcribe est présentée comme une version ultra-optimisée pour la seule transcription audio. Ce dernier modèle est promu comme plus rapide et plus économique que Whisper d'OpenAI, tout en offrant une meilleure qualité. Une solution optimale pour les développeurs souhaitant intégrer rapidement une brique vocale dans leurs applications locales.

Le logo de Mistral AI. ©Alexandre Boero / Clubic

Une alternative aux géants américains

Contrairement aux modèles fermés d’acteurs comme OpenAI ou Google, Voxtral est ouvert : cela permet aux entreprises de l’utiliser, le modifier et l’intégrer comme bon leur semble, sans être contraintes par des API propriétaires ou des conditions d’usage restrictives.

L’offre vise en priorité les entreprises qui cherchent à déployer des outils vocaux robustes, tout en gardant la main sur leurs données et leur infrastructure technique. Pour tester Voxtral, Mistral propose un accès gratuit via deux canaux : l’API disponible sur Hugging Face, ainsi que via propre chatbot Le Chat, qui permet d’expérimenter les capacités du modèle directement.

À découvrir
Quels sont les 5 meilleurs chatbots à intelligence artificielle ? Comparatif 2025

04 février 2025 à 14h11

Comparatifs services

Sources : TechCrunch, Mistral