Microsoft a présenté deux modèles d’intelligence artificielle développés en interne : MAI-Voice-1, capable de générer de la parole à partir de texte, et MAI-1-preview, destiné à tester de nouvelles fonctions pour Copilot. L’entreprise poursuit ses négociations avec OpenAI sur l’accès aux modèles et la valorisation de la start-up.
- Microsoft a dévoilé deux nouveaux modèles d'intelligence artificielle : MAI-Voice-1 et MAI-1-preview.
- MAI-Voice-1 génère de la parole réaliste, tandis que MAI-1-preview aide à enrichir les fonctionnalités de Copilot.
- L'entreprise discute avec OpenAI sur l'accès aux modèles et la valorisation potentielle de la start-up.
Ce jeudi, Microsoft AI a lancé MAI-Voice-1 et MAI-1-preview. MAI-Voice-1 produit rapidement de la parole réaliste. MAI-1-preview répond aux instructions des utilisateurs et fournit des informations pour Copilot. Mustafa Suleyman, PDG de Microsoft AI, a déclaré que l’entreprise cherchait à créer ses propres compétences en intelligence artificielle pour ses services. Microsoft continue sa collaboration avec OpenAI, tandis que les deux sociétés discutent de la propriété intellectuelle, des droits d’accès aux modèles et d’une restructuration d’OpenAI, qui pourrait valoriser la start-up à 500 milliards de dollars.
- Intégration de DALL-E 3 pour une création d'images plus créatives et réalistes
- Capacité de traitement des images par GPT-4 Vision pour des réponses contextuelles précises
- Interface conviviale et intégrée dans divers produits Microsoft
Deux modèles maison pour évaluer l’IA dans Copilot
Microsoft a développé MAI-Voice-1 et MAI-1-preview pour tester l’IA sur ses services existants. MAI-Voice-1 génère une minute d’audio en moins d’une seconde sur un seul GPU. Le modèle alimente Copilot Labs, Copilot Daily et Copilot Podcasts. L’équipe suit les résultats et note la précision des voix synthétiques.
MAI-1-preview utilise 15 000 GPU NVIDIA H100. Il fournit des réponses détaillées aux utilisateurs et permet d’expérimenter de nouvelles fonctionnalités de Copilot. Les testeurs américains peuvent demander un accès anticipé pour certains scénarios précis. LMArena a classé ce modèle treizième mondial en qualité de sortie, derrière grok-3-preview-02-24 et devant gemini-2.5-flash.
Mustafa Suleyman a déclaré : « Nous devons être capables de disposer de l’expertise interne pour créer les modèles les plus solides au monde ». Microsoft exploite son cluster GB200 pour observer le fonctionnement des modèles et identifier les usages les plus efficaces. Ces deux outils servent à tester la génération vocale et la réponse aux instructions dans des contextes concrets.
OpenAI et Microsoft discutent de contrats et de capital
Il faut savoir que Microsoft possède actuellement des droits exclusifs pour héberger les modèles OpenAI sur Azure. OpenAI cherche à nouer des partenariats avec d’autres fournisseurs de cloud pour diversifier ses revenus tout en conservant l’accès de Microsoft aux modèles.
Mais il y a un petit caillou dans la chaussure. Une clause sur l’intelligence artificielle générale permet à OpenAI de limiter l’accès si un système autonome dépasse les performances humaines dans des tâches économiques. Satya Nadella, P-DG de Microsoft, souhaite la supprimer. OpenAI veut la maintenir partiellement. Selon un participant aux discussions, cette clause sert de levier technique et financier.
En plus, la répartition du capital après restructuration n’est pas encore fixée. Microsoft pourrait posséder entre 30 et 35 % d’OpenAI. La start-up prévoit une vente secondaire d’actions détenues par ses employés, valorisant l’entreprise à environ 500 milliards de dollars. Les échanges avec les autres actionnaires et les autorités de Californie et du Delaware pourraient prolonger le processus.
Pas simple. N'empêche, ce mois-ci, OpenAI a levé 8,3 milliards de dollars lors de la première tranche de financement menée par SoftBank. La demande pour ce tour de financement a largement dépassé l’offre initiale. Preuve en est, s'il en fallait, que certains investisseurs sont vivement intéressés par la maison mère de ChatGPT.