Les modèles de conception d'IA agentiques renforcent l'autonomie des grands modèles de langage (LLM) tels que Llama, Claude ou GPT en tirant parti de l'utilisation d'outils, de la prise de décision et de la résolution de problèmes. Ceci offre une approche structurée pour la création et la gestion d'agents autonomes dans divers cas d'usage .
Que sont les flux de travail agentiques ?
Un agent est considéré comme plus intelligent s'il choisit systématiquement des actions qui conduisent à des résultats plus conformes à sa fonction objective.
Flux de travail automatisés (basés sur des règles, non basés sur l'IA)
Suivre des règles et des processus prédéfinis , généralement basés sur des instructions fixes. Ils sont conçus pour gérer efficacement les tâches répétitives, souvent grâce à des systèmes comme l'automatisation robotisée des processus (RPA), qui ne nécessitent que peu ou pas de prise de décision.
Flux de travail d'IA (non-agents)
Systèmes où les modules linguistiques et les outils sont orchestrés par des chemins de code prédéfinis, nécessitant une réflexion minimale. Dans un flux de travail non automatisé, un module linguistique génère une sortie à partir d'une invite, par exemple une liste de recommandations basée sur une entrée.
Flux de travail agents
Processus pilotés par l'IA où des agents autonomes prennent des décisions, agissent et coordonnent des tâches avec une intervention humaine minimale. Ces flux de travail utilisent des composantes clés telles que le raisonnement, la planification et l'utilisation d'outils pour gérer des tâches complexes.
Comparé à l'automatisation traditionnelle, comme la RPA , qui suit des règles et des conceptions fixes, les flux de travail agentiques sont plus « dynamiques et flexibles », s'adaptant aux données en temps réel et aux conditions inattendues.
Dans ce flux de travail, l' agent IA répond à la requête de l'utilisateur (Exemple : « Qui a gagné l'Euro en 2024 ? »)
- Requête de l'utilisateur : L'utilisateur pose une question.
- Analyse LLM : Le LLM interprète les données et détermine si des données externes sont nécessaires.
- Activation d'un outil externe : un outil de recherche récupère des informations en temps réel.
- Création de la réponse : Le LLM combine les données et les réponses :
« L’Espagne a remporté l’Euro 2024 face à l’Angleterre sur le score de 2-1 en finale à Berlin en juillet 2024. »
5 types de modèles de conception d'IA agentique
Motif de réflexion
Le modèle de réflexion améliore les flux de travail des agents grâce à une auto-amélioration continue.
→ Ce modèle implique un mécanisme d'auto-rétroaction dans lequel un agent d'IA évalue ses résultats ou ses décisions avant de finaliser sa réponse ou d'entreprendre d'autres actions.
→ Cela permet à l'agent d'analyser son propre travail, d'identifier les erreurs ou les lacunes et d'affiner son approche, ce qui conduit à de meilleurs résultats au fil du temps. Ce processus n'est pas limité à une seule itération ; les agents peuvent ajuster leurs réponses lors d'interactions ultérieures.
Exemple concret :
Les agents d'IA tels que GitHub Copilot peuvent affiner le code grâce à l'autoréflexion en examinant et en modifiant sa propre structure et son propre comportement lors de l'exécution, par exemple :
- Réponse initiale : GitHub Copilot génère un extrait de code en fonction d’une invite.
- Processus de réflexion : Ce processus examine le code généré afin d’identifier les erreurs, les inefficacités et les axes d’amélioration. Il peut s’appuyer sur une boucle de rétroaction, par exemple en exécutant le code dans un environnement isolé, pour repérer les bogues.
- Auto-itération : Évalue si le code généré fonctionne comme prévu, affine sa logique et suggère des optimisations.
Modèle d'utilisation des outils
Le modèle d'utilisation des outils dans l'IA agentique améliore les capacités des grands modèles de langage (LLM) en leur permettant d'interagir dynamiquement avec des outils et des ressources externes.
Des protocoles comme le Model Context Protocol (MCP) contribuent à standardiser le processus d'utilisation des outils. 2
La standardisation de l'utilisation des outils via MCP permet de passer d'une conception d'agents basée sur des intégrations API personnalisées à une couche de contexte unifiée. Au lieu de gérer des connecteurs individuels, les agents utilisent MCP pour maintenir un flux de données sécurisé entre le modèle et l'environnement local ou d'entreprise. Grâce aux protocoles d'utilisation des outils et aux modèles d'agents, ces derniers peuvent :
- accéder à des informations en temps réel (via des API), effectuer des recherches sur le Web
- interagir avec les API pour traiter et générer des réponses
- interagir avec les systèmes de recherche d'informations
- récupérer des ensembles de données spécifiques
- exécuter des scripts pour l'analyse des données
- exploiter les modèles d'apprentissage automatique pour exécuter des algorithmes spécialisés
Nous avons utilisé des agents d'IA populaires pour tester leurs capacités d'utilisation d'outils :
Exemple concret :
Le projet de synthèse visuelle-textuelle utilise GPT-4 pour interagir dynamiquement avec des outils externes (tels que CLIP pour l'analyse d'images et GPT-4 pour le raisonnement) et des ressources externes (par exemple, des outils de conception, des plateformes de commerce électronique) pour accomplir des tâches complexes. 3
Modèle de planification
Ce modèle de planification permet aux responsables de la maîtrise en droit de décomposer les tâches importantes en sous-tâches.
Un LLM utilisant le modèle de planification organisera les sous-objectifs selon une séquence logique. En fonction de la complexité, l'agent peut planifier les actions de manière linéaire ou créer des branches pour une exécution parallèle.
Exemple concret :
Un groupe de chercheurs a démontré comment les agents LLM collaborent avec des modèles provenant de plateformes comme Hugging Face pour gérer des tâches complexes et de grande envergure.
Cette approche a été baptisée HuggingGPT , un agent basé sur les LLM qui exploite les LLM (par exemple, ChatGPT) pour connecter différents modèles d'IA dans les communautés d'apprentissage automatique (par exemple, Hugging Face) afin de résoudre des tâches d'IA. 4
Dans les flux de travail actuels, la planification est de plus en plus intégrée au raisonnement au niveau du modèle. Tandis que les frameworks gèrent la délégation des tâches de haut niveau, les modèles de raisonnement effectuent un traitement interne pour valider les plans avant leur exécution. Cette délibération interne :
- réduit les erreurs logiques lors de la décomposition des tâches
- minimise le besoin d'ingénierie rapide en plusieurs étapes
- permet à l'agent de s'auto-corriger avant d'initier une action
Modèle multi-agents
Les modèles multi-agents se concentrent sur la délégation de tâches, qui consiste à affecter différents agents à différentes tâches pouvant être créées en demandant à un seul LLM (ou à plusieurs LLM) de gérer des responsabilités distinctes.
Par exemple, pour créer un agent développeur de logiciels, vous pourriez demander au LLM : « Vous êtes un expert en écriture de code efficace et clair. Veuillez écrire le code pour accomplir [specific task] . »
Dans les systèmes multi-agents, les agents communiquent via des protocoles de communication agent-à-agent (A2A) qui définissent le flux d'informations entre eux. Par exemple, le protocole A2A de Google est un cadre ouvert qui fournit aux agents un contexte structuré et des outils. 5
Cadres multi-agents actuels :
- LangGraph : Facilite les flux de travail cycliques et la gestion d'état pour les agents nécessitant des boucles de rétroaction.
- PydanticAI : un framework axé sur l’orchestration d’agents sûre en termes de types et prête pour la production.
- CrewAI : Orchestre les agents en leur attribuant des rôles spécifiques et des séquences de tâches collaboratives.
- OpenAI Swarm : Un protocole léger pour gérer les transferts entre modèles spécialisés.
Pour en savoir plus : Créateurs et frameworks d’IA agentique open source .
Modèle avec intervention humaine dans la boucle (HITL)
Le modèle HITL intègre une intervention humaine à des points de décision spécifiques afin de garantir l'exactitude et la sécurité. Les principales mises en œuvre comprennent :
- Points de contrôle d'approbation : L'agent effectue une pause pour obtenir une confirmation humaine avant d'exécuter des actions à fort impact, telles que des transactions financières ou des suppressions de données.
- Boucles de révision : un humain ou un modèle de supervision secondaire évalue la sortie de l’agent afin de fournir une couche de contrôle qualité avant la fin du processus.
Cas d'utilisation du flux de travail agentique
1. Génération augmentée par la récupération (RAG)
Les modèles de conception d'agents peuvent être utilisés dans les systèmes RAG pour intégrer des agents dans le pipeline RAG.
Pour en savoir plus, consultez :
→ Découvrez les meilleurs systèmes RAG d'agents
→ Comparer les meilleurs outils de génération augmentée par la recherche
2. Développement logiciel
- Génération et complétion du code :
- Curseur : Génère automatiquement des extraits de code et des fonctions complètes à partir de descriptions en langage naturel.
- Devin : Crée des applications à partir de zéro avec une supervision humaine minimale, en utilisant un navigateur ou une interface de ligne de commande.
- Tests logiciels automatisés :
- Diffblue : Écrit automatiquement des tests unitaires pour le code Java, garantissant la couverture et l'exactitude du code.
- Snyk : Détecte et corrige les failles de sécurité dans les dépendances sans intervention humaine.
- Diffblue : Écrit automatiquement des tests unitaires pour le code Java, garantissant la couverture et l'exactitude du code.
3. Jeux
- PNJ autonomes :
- AI Dungeon : Utilise un LLM pour générer des PNJ textuels entièrement autonomes, réagissant aux actions du joueur et créant des événements narratifs.
- AgentRefine : Permet aux agents et modèles d'IA d'identifier les erreurs et de les corriger de manière autonome, améliorant ainsi leurs performances pour les tâches générales.
- Exploration autonome :
- Spore (évolution contrôlée par l'IA) : Les agents d'IA se reproduisent, mutent et évoluent sans intervention humaine, devenant de plus en plus intelligents et diversifiés à chaque génération.
- Recherche de chemin :
- NavMesh AI : Système de navigation autonome dans les jeux vidéo, où les agents peuvent naviguer dans des environnements dynamiques.
4. Création multimédia
- Transformer les résultats de recherche GenAI en pages Wikipédia
- Perplexity Pages : Lorsqu'un utilisateur saisit une requête de recherche, Perplexity Pages agrège les informations pertinentes provenant de plusieurs sources pour transformer les résultats de recherche en pages Wikipédia.
- Production vidéo automatisée
- Pictory transforme automatiquement le contenu textuel en vidéo.
5. Recherche et analyse des données
- ChemCrow : Exécution de simulations et formulation de recommandations autonomes.
pour la découverte de médicaments. - AI2 : Fournit une gestion d’entrepôt de données via des systèmes autonomes.
6. Utilisation de l'ordinateur
Les agents modernes peuvent interagir avec les interfaces graphiques (GUI) de la même manière que les utilisateurs humains. Grâce à leurs capacités informatiques, ils interprètent les pixels de l'écran, déplacent le curseur et saisissent du texte dans diverses applications. Ces agents peuvent :
- effectuer des recherches sur le Web et interagir avec les interfaces des logiciels de bureau.
- naviguer dans des systèmes ERP internes dépourvus d'API structurées
- exécuter des flux de travail administratifs multiplateformes
- Remplissez les formulaires en ligne et réservez vos voyages.
7. Service client
Les agents d'IA pour le service client répondent aux questions des clients en langage naturel, interprètent le contexte et génèrent des réponses naturelles. Ces agents sont couramment utilisés pour l'automatisation des centres de contact. En voici quelques exemples :
- Zendesk IA
- Film d'interphone
- Agent Kore.AI
8. Automatisation des soins de santé
L'intelligence artificielle appliquée au secteur de la santé vise à exploiter les systèmes de santé pour automatiser les flux de travail dans les opérations cliniques. Exemples d'outils :
Automatisation des soins de santé à usage général :
- Sully.ai
- IA hippocratique
- Innovateur
- Agent Beam AI Healthcare
- Santé remarquable
Soutien aux patients :
- Amélia IA
- Cognition
Pour en savoir plus
- Meilleurs outils d'agent IA
- Agents d'IA : comparaison entre l'utilisation par un opérateur, par navigateur et avec Project Mariner
Soyez le premier à commenter
Votre adresse courriel ne sera pas publiée. Tous les champs sont obligatoires.