Bien que de nombreux écrits traitent des architectures d'agents, les implémentations concrètes à l'échelle de la production restent limitées. Cet article met en lumière le maillage d'IA agentique , un concept introduit dans une étude récente de McKinsey. 1
Nous examinerons les défis qui se posent dans les environnements de production et démontrerons comment notre architecture proposée permet une mise à l'échelle contrôlée des capacités d'IA.
Défis liés aux systèmes multi-agents
À mesure que les équipes passent des tests et des expérimentations avec des agents d'IA au déploiement de cas d'utilisation évolutifs et concrets , plusieurs défis émergent :
- Lacunes d'intégration : Lors des phases d'expérimentation, les équipes utilisent des solutions préconfigurées pour accélérer le développement, mais ces solutions manquent souvent d'homogénéité lors du passage à l'échelle. Il en résulte des problèmes d'intégration et de coordination, et donc des lacunes dans la couverture. Par exemple, nous avons constaté que lors du déploiement à grande échelle de chatbots basés sur l'IA, les différents systèmes de données et d'interactions clients ne parviennent pas à se synchroniser.
- Isolement des agents : La plupart des agents actuels fonctionnent indépendamment avec des informations locales. Par exemple, un agent de planification, un agent de récupération et un agent d’exécution connectés via des API peuvent ne pas disposer d’un contexte unifié. À mesure que les organisations évoluent vers des écosystèmes multi-agents, l’absence de mémoire partagée et de coordination devient un enjeu majeur.
- Limitations opérationnelles : les applications d'agents d'IA peuvent conduire à des résultats imprévisibles et à un comportement non déterministe, générant des réponses incohérentes ou ne parvenant pas à fournir des solutions précises.
Présentation de l'architecture de maillage agentique
Le réseau d'IA envisage un « Internet des agents », où plusieurs agents peuvent raisonner, collaborer et agir de manière autonome au sein d'un réseau distribué de systèmes et d'outils.
Contrairement aux pipelines RAG ou aux API de microservices, il crée un système d'enregistrement du comportement des agents : chaque invocation d'outil, erreur et résultat est distribué à travers le maillage d'événements et préservé par la couche de coordination.
Au fil du temps, cette histoire partagée se transforme en une base de connaissances plus riche, permettant aux acteurs de s'aligner sur un contexte commun et de collaborer plus efficacement.
Comment fonctionne un réseau d'agents :
1. Composabilité :
Tout agent, outil ou modèle (par exemple, un nouveau LLM) peut être connecté au maillage sans nécessiter de modifications des autres composants.
Cette conception modulaire favorise la mise à l'échelle en permettant aux organisations d'ajouter ou de remplacer des fonctionnalités progressivement, sans perturber les flux de travail existants.
2. Raisonnement d'agents parallèles :
Le maillage permet de répartir le raisonnement entre plusieurs agents. Cela accroît la complexité, mais permet à des agents spécialisés de traiter des parties d'une tâche plus vaste au lieu de dépendre d'un seul LLM.
Cette division du travail facilite la mise à l'échelle des systèmes d'IA, car les charges de travail peuvent être réparties entre des agents fonctionnant en parallèle.
3. Séparation par couches :
Le maillage sépare les fonctions clés (logique, mémoire, orchestration et interfaces, par exemple) en couches distinctes. Ainsi, le raisonnement d'un agent peut fonctionner indépendamment de son stockage de données ou de son interface utilisateur.
4. Neutralité du fournisseur :
Le maillage n'est lié à aucun fournisseur ni à aucune plateforme. Les composants peuvent être remplacés ou mis à jour indépendamment, avec une préférence pour les standards ouverts tels que le protocole MCP (Model Context Protocol) et A2A (Agent2Agent) plutôt que pour les API propriétaires.
Par exemple, la norme A2A (Google) définit un format de message commun et un mécanisme de découverte pour la collaboration inter-frameworks, tandis que la norme MCP (Anthropic) offre aux agents une méthode universelle pour récupérer des données. À l'instar de l'USB, ces normes permettent l'interopérabilité, ce qui permet aux équipes de combiner des outils et des modèles provenant de différents fournisseurs sans travail d'intégration supplémentaire.
5. Autonomie encadrée :
Les agents du réseau agissent de manière autonome, mais dans le cadre de garde-fous, de politiques intégrées et d'autres contraintes. Autrement dit, chaque action autonome est préalablement régie par des règles.
Capacités opérationnelles : Comment fonctionne le réseau en pratique ?
Chacune de ces fonctionnalités couvre l'ensemble du maillage (sans être liée à une seule plateforme) et présente souvent des similitudes avec des concepts issus des environnements cloud ou de microservices, tels que les registres de services ou les journaux d'audit.
Nous décrivons ci-dessous chaque fonctionnalité et son fonctionnement en pratique :
Découverte des agents et des flux de travail :
Le réseau centralise tous les agents et flux de travail disponibles. Les équipes peuvent ainsi facilement trouver, réutiliser et intégrer les fonctionnalités existantes, sans avoir à les recréer entièrement. Les agents peuvent également publier des fiches de fonctionnalités standardisées décrivant leurs capacités, consultables par d'autres agents ou des opérateurs humains.
En imposant une taxonomie et des normes de métadonnées communes, les organisations peuvent également appliquer des politiques de gouvernance telles que la restriction de certaines tâches sensibles aux seuls agents certifiés.
Registre des actifs d'IA :
Le registre des ressources centralise tous les éléments d'IA critiques qui influencent le comportement des agents. Cela inclut les invites, les définitions d'outils, les configurations de modèles, les jeux de données et les politiques. Chaque élément du registre est versionné, auditable et soumis à une gouvernance.
Les actifs essentiels comprennent souvent :
- Les invites et les instructions ont été testées afin de détecter toute tentative de jailbreak ou tout biais.
- Configurations des agents spécifiant les outils, API et modèles autorisés.
- Paramètres LLM définissant les modèles et paramètres disponibles.
- Définitions d'outils et serveurs MCP avec contrôles d'accès intégrés.
- Des exemples d'entrée/sortie de référence qui constituent des outils fiables pour l'apprentissage et l'évaluation.
Gestion des commentaires :
Des boucles de rétroaction sont intégrées au sein du système afin que chaque exécution de flux de travail devienne une source d'apprentissage. Des indicateurs tels que la latence, la précision, les taux d'erreur, voire les évaluations humaines, sont collectés et réinjectés dans le système.
Conformité et gestion des risques :
Chaque flux de travail d'agents doit s'exécuter selon des règles et des contraintes définies. Des outils de conformité et de gestion des risques sont intégrés directement au système pour garantir cela.
Par exemple,
- Les agents de conformité peuvent auditer les actions au regard des normes organisationnelles ou réglementaires avant la finalisation des livrables.
- Les politiques peuvent exiger que les tâches sensibles fassent l'objet de vérifications par des agents de protection de la vie privée ou de sécurité, tandis que les journaux d'audit consignent chaque action pour un examen ultérieur.
Systèmes d'évaluation :
Les pipelines d'évaluation fonctionnent comme des tests d'intégration pour les flux de travail automatisés. Ils visent à garantir la robustesse de ces flux même en cas de modification des modèles logiques sous-jacents ou de changements des conditions externes.
À chaque déploiement ou mise à jour de modèle, ils exécutent des suites de tests structurées pour en vérifier l'exactitude.
Ils comprennent généralement :
- Tests au niveau des étapes (par exemple, l'API/l'outil approprié a-t-il été invoqué ?).
- Tests au niveau du flux de travail (par exemple, le processus global a-t-il produit le résultat attendu ?).
- Tests adverses (par exemple, injection rapide, utilisation abusive, déni de service).
Observabilité :
Dans un réseau d'agents, l'observabilité garantit que chaque interaction et flux de travail entre agents peut être tracé, enregistré et analysé. Cette fonctionnalité offre une visibilité complète sur la manière dont les agents collaborent, les outils utilisés et les ressources consommées.
En centralisant les indicateurs et les journaux d'événements, les organisations peuvent détecter les anomalies, contrôler les coûts et vérifier que les résultats restent conformes aux politiques de gouvernance.
Les normes émergentes telles qu'OpenTelemetry pour les agents contribuent à rendre l'observabilité interopérable entre différents environnements d'exécution.
Authentification et autorisation :
Dans un réseau maillé d'agents, chaque communication entre agents ou entre un agent et un service doit être authentifiée et autorisée. On peut comparer cela à la délivrance de badges de sécurité temporaires : les agents ne reçoivent que les autorisations strictement nécessaires, et celles-ci expirent rapidement.
L'utilisation de normes telles que OAuth 2.0, JWT et le principe du moindre privilège permet de sécuriser les interactions et de limiter l'impact en cas de compromission d'un composant.
Pourquoi est-ce important ?
Ensemble, ces fonctionnalités transforment des agents faiblement interconnectés en un réseau cohérent et bien géré. Les flux de travail deviennent supervisés, auditables et adaptatifs, tout en conservant la flexibilité nécessaire pour intégrer de nouveaux agents, outils ou modèles selon les besoins.
Par exemple, un agent construit par Atlassian pourrait découvrir et invoquer de manière transparente un agent spécialisé Salesforce à travers le maillage, avec des flux d'identité et de données gérés par des protocoles partagés.
C’est ce qui distingue un maillage d’agents des systèmes de gestion de flux de travail traditionnels. Les orchestrateurs classiques peuvent connecter les API et les tâches, mais ils ne disposent généralement pas des mécanismes intégrés de gouvernance, de retour d’information continu et de conformité qu’offre le maillage.
Cas d'utilisation du maillage agentique
Les concepts de maillage multi-agents gagnent du terrain, mais les implémentations concrètes et prêtes à l'emploi restent limitées . La plupart des exemples actuels sont des déploiements préliminaires ou des preuves de concept. Cela dit, plusieurs fournisseurs commencent à présenter des cas d'utilisation pratiques :
Kubernetes et contrôle d'entrée
Au lieu de s'appuyer uniquement sur des contrôleurs d'entrée statiques, dans un système de maillage d'agents, les agents d'IA peuvent étendre les environnements natifs de Kubernetes en permettant aux agents de gérer le trafic, d'appliquer la sécurité et d'optimiser les charges de travail à travers les API et les flux d'événements.
Domaines d'application :
- Contrôle d'accès : les agents appliquent l'authentification, la terminaison TLS et les règles de stratégie pour protéger les API contre les accès non autorisés.
- Orchestration prenant en compte les clusters : les agents adaptent la charge de travail à la hausse ou à la baisse et ajustent les stratégies de routage en fonction de la disponibilité des ressources.
Exemple concret :
Optimisation des systèmes backend
Un maillage d'agents peut contribuer à optimiser les systèmes backend en permettant aux agents de gérer le trafic, d'appliquer des politiques et d'équilibrer les charges de travail en temps réel.
Domaines d'application :
- Gestion du trafic : Appliquez des limites de débit précises, des quotas et des contrôles de pics de trafic pour éviter la surcharge.
- Équilibrage de charge : répartir les appels API entrants et le trafic des flux d’événements entre les serveurs afin de maintenir des services réactifs.
- Prévention des goulots d'étranglement : détecter et limiter les requêtes API ou de flux de données excessives afin de garantir des performances constantes.
- Optimisation de la résilience et de la disponibilité : Améliorer la tolérance aux pannes en réacheminant les requêtes API/événements ayant échoué.
Exemple concret :
La compagnie ferroviaire Eurostar utilise un maillage d'agents pour optimiser ses systèmes backend. Elle gère l'accès des clients aux API de manière granulaire afin d'assurer un contrôle du trafic et une répartition de la charge plus sûrs. 5
Gestion centralisée des API
Un maillage d'agents aide les organisations à centraliser les API, les flux d'événements et les agents d'IA au sein d'une plateforme unifiée.
Domaines d'application :
- Prise en charge de plusieurs passerelles : Intégrez des API provenant de différentes plateformes telles qu'AWS, Azure et Apigee.
- Authentification de niveau entreprise : assurez un contrôle d’accès approprié pour gérer qui peut interagir avec les API et les agents.
Exemple concret :
SKF, une entreprise manufacturière, utilise une plateforme de maillage d'agents pour centraliser et gérer ses API. 6
Gestion et exposition des flux de données et d'événements en temps réel
Un maillage d'agents aide les organisations à gérer et sécuriser l'accès aux flux de données et d'événements en temps réel, en assurant une intégration et un contrôle fluides. Il s'agit d'une plateforme centralisée où différents systèmes, tels que les API et les courtiers d'événements, peuvent communiquer et partager efficacement des données.
Domaines d'application :
- Sécurité centralisée : s'assurer que toutes les données et les API sont sécurisées et conformes aux normes de l'organisation.
- Médiation de protocole : Convertir différents types de flux de données (par exemple, Kafka, MQTT) en formats communs et faciles à utiliser comme REST ou WebSocket.
- Découverte d'API et d'événements : Fournir un portail unique permettant aux développeurs de trouver et d'utiliser des données et des API.
- Gestion unifiée : Gérez tous les types d'API et de flux de données, y compris REST et WebSocket, depuis un seul et même endroit.
L'avenir des réseaux de neurones à maillage actif : un simple effet de mode ?
Agentic Mesh promet une approche novatrice permettant aux agents d'IA autonomes de collaborer au sein d'un écosystème structuré. Toutefois, il existe un risque qu'il ne devienne qu'un simple cadre technique parmi d'autres, dominé par des solutions d'infrastructure telles que les maillages de services et les architectures d'intégration .
- Un schéma similaire s'est produit avec le concept de maillage de données . Lorsque Zhamak Dehghani l'a introduit, l'idée a révolutionné la gestion des données en mettant l'accent sur la propriété, la gouvernance et la considération des données comme un produit. Pourtant, les fournisseurs ont rapidement rebaptisé leurs solutions existantes « maillage de données ». 7
- La même tendance s'observe désormais avec les réseaux maillés multi-agents. Bien que la discussion porte principalement sur des aspects techniques tels que la sécurité des communications et l'orchestration, il s'agit avant tout de composants d'infrastructure.
Pour éviter de le réduire à un simple Service Mesh 2.0 ou Data Fabric 2.0 avec IA , la véritable opportunité réside dans la création de valeur, et non pas seulement dans l'infrastructure sous-jacente.
Il est essentiel que les domaines métiers assument la responsabilité de leurs agents, au lieu de se reposer uniquement sur les fournisseurs de middleware. Si les organisations adoptent la propriété, la gestion et la gouvernance fédérée de leurs domaines, le maillage d'agents peut devenir un puissant outil de transformation.
Soyez le premier à commenter
Votre adresse courriel ne sera pas publiée. Tous les champs sont obligatoires.