Durant la Build 2026, Microsoft a prolongé son chantier autour de l’IA locale dans Windows. Après les modèles, les NPU et les outils développeurs, l’éditeur veut mieux encadrer l’exécution des agents IA sur la machine.

Microsoft veut faire de Windows un vrai terrain d’exécution pour les agents IA locaux. © hodim / Shutterstock
Microsoft veut faire de Windows un vrai terrain d’exécution pour les agents IA locaux. © hodim / Shutterstock

L’IA locale sur Windows n’est plus seulement une affaire de NPU, de Copilot+ PC ni de modèles optimisés pour fonctionner hors du cloud. Depuis la Build 2025, Microsoft travaille à faire de son système un terrain plus complet pour les développeurs IA. Windows AI Foundry, Foundry Local, Windows ML et prise en charge de MCP ont posé les premières bases, notamment pour connecter les agents aux applications du poste. Cette trajectoire s’est poursuivie lors de l’Ignite avec Agent Workspace, un espace séparé dans Windows dans lequel les agents peuvent accéder à des applications et des fichiers sous un compte distinct de celui de l’utilisateur. Durant la Build 2026, Redmond a resserré le sujet autour de l’exécution locale des agents et du rôle que Windows peut tenir lorsqu’ils agissent directement sur la machine.

Windows va mieux encadrer l’exécution locale des agents IA

Après avoir posé les bases de l’IA locale côté modèles et outils développeurs, Microsoft s’attaque donc à l’étape suivante, celle des agents capables d’agir directement sur le poste. La principale nouveauté côté système s’appelle Microsoft Execution Containers, ou MXC. Disponible en preview, cette technologie introduit une couche de politiques dans Windows pour définir les règles de confinement des agents IA, puis les faire appliquer par le système lui-même.

Dans les grandes lignes, l’idée consiste à éviter que ces agents tournent dans des sessions utilisateur mal encadrées lorsqu’ils exécutent du code, accèdent à des fichiers ou interagissent avec le réseau de la machine. Les développeurs et les administrateurs IT peuvent décrire les conditions d’exécution une seule fois, puis s’appuyer sur Windows pour les faire respecter au moyen des mécanismes natifs de l’OS. Microsoft veut ainsi réduire les réglages nécessaires pour exécuter des agents en local sans perdre la main sur l’identité, l’isolation et la gouvernance.

MXC doit notamment prendre en charge des runtimes d’agents comme OpenClaw sur Windows, désormais disponible en alpha sur GitHub. L’objectif est de permettre à ces agents d’exécuter localement des enchaînements de tâches en plusieurs étapes dans des limites imposées par l’OS, plutôt que dans de simples sessions utilisateur. NVIDIA travaille aussi avec Microsoft sur OpenShell, son runtime open source pour agents autonomes, construit sur MXC afin de faciliter leur exécution dans des environnements sandboxés. Il doit aussi prendre en charge des fonctions plus adaptées aux entreprises, comme la gestion des politiques, le routage d’inférence et l’obfuscation des données personnelles identifiables.

À noter que Redmond applique aussi ce modèle aux agents hébergés dans Foundry Agent Service. Chaque session doit disposer de sa propre sandbox, d’une mémoire persistante et d’une capacité à monter en charge selon les besoins. Que l’agent tourne sur Windows ou dans le cloud, l’idée reste de lui offrir un environnement d’exécution isolé, défini en amont et adapté à ses actions.

Une nouvelle Surface de développement pour faire tourner de gros modèles en local

Pour accompagner ce virage logiciel, Microsoft mise aussi sur le matériel. La Surface RTX Spark Dev Box est une machine de développement conçue autour de la nouvelle NVIDIA RTX Spark, pensée pour des charges IA soutenues comme les longues tâches de traitement, les opérations agentiques ou le fine-tuning local de modèles.

Microsoft annonce jusqu’à 1 petaFLOP de puissance de calcul et 128 Go de mémoire unifiée. Selon l’éditeur, cette configuration doit permettre d’exécuter localement des modèles jusqu’à 120 milliards de paramètres, sans passer par une instance GPU dans le cloud. Des chiffres à manier comme des promesses constructeur, mais qui donnent une idée assez nette de la cible visée. Il ne s’agit pas d’un PC grand public dopé à l’IA, mais d’une station compacte pour développeurs, équipes IA et organisations qui veulent multiplier les essais en local avant de déplacer les charges les plus lourdes vers Azure.

La Surface RTX Spark Dev Box sera disponible à partir de l'automne aux États-Unis via le site de Microsoft. Elle arrivera avec WSL 2 préconfiguré, la prise en charge native de CUDA et un accès direct au GPU depuis l’environnement Linux, ainsi que Visual Studio Code, GitHub Copilot et plusieurs outils développeurs préinstallés.

Windows 11
  • Refonte graphique de l'interface réussie
  • Snap amélioré
  • Groupes d'ancrage efficaces
8 / 10