Amazon Web Services a dévoilé mardi de nouvelles fonctionnalités pour AgentCore, sa plateforme d'agents IA. Des contrôles de sécurité et d'évaluation facilitent enfin le déploiement d'agents autonomes en production.

L'intelligence artificielle autonome fait rêver autant qu'elle inquiète. Comment lâcher la bride à un agent numérique capable de prendre des décisions seul, sans risquer la catastrophe ? Depuis Las Vegas et l'AWS re:Invent ce mardi, Amazon tente de lever cette épine avec AgentCore, fraîchement enrichi de garde-fous sophistiqués. Téléchargé plus de 2 millions de fois en cinq mois seulement, cet outil promet aux entreprises de déployer leurs assistants intelligents sans perdre le sommeil, grâce à des balises de sécurité précises et un système de surveillance en temps réel qui ne laisse en théorie rien passer.
Amazon installe des contrôles préventifs sur chaque action des agents IA
L'autonomie des agents IA ressemble à une arme à double tranchant. Certes, ils peuvent accomplir des tâches complexes sans supervision constante, mais qu'arrive-t-il s'ils s'aventurent là où ils ne devraient pas ? Policy in AgentCore intervient comme un vigile numérique, peut-on dire. Chaque fois qu'un agent s'apprête à agir, le système vérifie instantanément si cette action respecte les règles établies, avant même qu'elle ne s'exécute.
Les équipes peuvent définir ces règles en langage courant ou à l'aide de Cedar, un langage open source spécialisé. Prenons le cas concret d'un agent chargé des remboursements. Les développeurs peuvent stipuler qu'il ne traite que les demandes inférieures à 200 dollars, et uniquement si l'utilisateur possède le rôle refund-agent (agent de remboursement) dans son authentification. Simple sur le papier, redoutablement efficace dans la pratique.
Le distributeur brésilien Grupo Elfa en fait l'expérience quotidienne. Ses équipes commerciales jonglent avec des milliers de devis journaliers, pilotés par des agents IA sous haute surveillance. On obtient du coup une traçabilité absolue à 100% des décisions prises, et surtout un temps de résolution des problèmes réduit de moitié. Pendant ce temps, le PGA TOUR (la célèbre ligue de golf) booste sa vitesse de rédaction d'articles de 1 000% grâce à un système multi-agents, tout en écrasant ses coûts de 95%.

La mémoire épisodique transforme les agents en véritables assistants personnels
Mais sécuriser les actions ne suffit pas, encore faut-il que l'agent réponde correctement. AgentCore Evaluations joue les superviseurs exigeants en analysant en continu la qualité des interactions selon plusieurs prismes, comme l'exactitude factuelle, la pertinence des réponses, et l'absence de contenu problématique. Les entreprises peuvent même créer leurs propres critères d'évaluation sur mesure et programmer des alertes si les performances dégringolent de plus de 10% sur huit heures, par exemple.
La mémoire épisodique permet un sacré bond qualitatif. Imaginez un agent de réservation qui mémorise vos habitudes. Après plusieurs voyages professionnels où vous décalez systématiquement votre vol retour à cause de réunions clients, il anticipe désormais le coup. Dès votre prochaine demande mentionnant des rendez-vous professionnels, il suggère spontanément des billets flexibles. Cette capacité d'apprentissage transforme l'agent en véritable assistant personnel qui s'améliore avec le temps. Du côté de l'entreprise Workday (un cloud des ressources humaines et des documents financiers), l'agent de planification financière grignote 30% du temps passé sur les analyses routinières, soit environ 100 heures récupérées chaque mois.
Et cerise sur le gâteau, le streaming bidirectionnel révolutionne aussi les conversations vocales. Fini ces échanges saccadés où l'agent monopolise la parole jusqu'à épuisement de sa réponse. Désormais, vous pouvez l'interrompre à mi-phrase, il comprendra et ajustera son discours instantanément. Cette fluidité rapproche enfin l'expérience d'un véritable dialogue humain, tout en conservant la puissance analytique qui fait la force de l'IA.