Au cours du dernier trimestre, nous avons testé des agents d'IA dans les domaines du développement, du service client, des ventes, de la recherche et des processus métier. Nous n'avons pas étudié les arguments marketing des fournisseurs, mais utilisé ces outils au quotidien pour évaluer leur efficacité.
La plupart des outils actuels sont des copilotes, et non des pilotes automatiques. Ils prennent en charge la recherche et automatisent les tâches répétitives, mais nécessitent toujours une prise de décision humaine pour tout ce qui compte.
Exemples de plateformes et d'outils populaires de type agentique
- Lyro de Tidio : chat en direct interactif centré sur les PME
- Creatio : Solution CRM Agentic et générateur d'agents IA pour les moyennes et grandes entreprises.
- Curseur : édition de code IA
- Otter.ai : prise de notes par IA
- OpenAI Frontier : Gestion et orchestration des agents d'entreprise
- Kiro (AWS) : IDE agentique piloté par spécifications et agent de codage autonome
- Averi : création de contenu marketing IA
- Make (Celonis) : Automatisation low-code évolutive
- Kompas AI : Recherche approfondie et génération de rapports
- LangGraph : Génération de flux de travail complexes pour agents de qualité industrielle
- Beam AI : Flux de travail riches en documents
- Pertinence IA : Analyses intégrées + flux de décision
- IBM Watson Orchestrate : Orchestration de niveau entreprise
Qu'est-ce qu'un agent IA ?
Un agent IA fonctionne en boucle. C'est là la principale différence avec un chatbot.
Source : GitHub 1
Il n'existe pas de définition unique et consensuelle. L'IA traditionnelle définit les agents comme des systèmes interagissant avec leur environnement. Certaines sociétés d'analyse les définissent comme des systèmes entièrement autonomes fonctionnant indépendamment sur de longues périodes, utilisant des outils tels que des fonctions ou des API pour interagir avec leur environnement et prendre des décisions en fonction du contexte et des objectifs. 2 D'autres utilisent ce terme pour décrire des implémentations plus prescriptives qui suivent des flux de travail prédéfinis. 3
Voici les facteurs qui font qu'un système d'IA est considéré comme plus autonome :
Voici un exemple concret et une conversation concernant un agent logiciel open source gérant les déploiements chez Humanlayer : 4
Source : GitHub 5
Capacités des systèmes d'IA agentifs
Adapté de : Cobus Greyling 6
Lire la suite : Agents d’IA d’entreprise , constructeurs d’agents d’IA , modèles d’actions à grande échelle (LAM) et IA agentique en cybersécurité .
Agents de codage
Curseur
Cursor demeure l'éditeur de code IA le plus répandu parmi les développeurs indépendants. Sur Reddit, même ceux qui préfèrent d'autres outils s'y comparent. Son atout principal réside dans son ergonomie : une intégration fluide avec VSCode, une navigation rapide entre les fichiers et un flux de travail qui privilégie la vitesse à l'intelligence brute.
La version 2026 a ajouté des sous-agents parallèles pour les sous-tâches discrètes, BugBot pour la revue de code automatisée au niveau des demandes de tirage, 7 Cursor Blame (Enterprise) est utilisé pour l'attribution IA ligne par ligne et la génération d'images au sein de l'agent. Salesforce a constaté des gains de vitesse de plus de 30 % après le déploiement de Cursor auprès de 20 000 développeurs. 8 Cursor a franchi la barre du milliard de dollars de revenus annualisés avec plus d'un million de développeurs payants. 9
Ses points faibles : le changement de tarification de Cursor, passant de 500 requêtes mensuelles fixes à un système de crédits indexé sur le coût réel de l’API, a suscité une vive réaction de la communauté. Le nombre effectif de requêtes premium a chuté de 500 à environ 225 par mois pour l’abonnement à 20 $. 10 plaintes concernant la facturation restent un sujet récurrent sur r/cursor et G2. Les abonnements actuels varient de 20 $/mois (Pro) à 200 $/mois (Ultra), avec une option intermédiaire à 60 $/mois (Pro+). Les équipes utilisant des flux de travail complexes avec plusieurs fichiers d'agents devraient estimer leurs dépenses réelles en jetons avant de choisir un abonnement. Cursor est également moins performant que Claude pour l'analyse architecturale et peut présenter des dysfonctionnements sur les bases de code complexes.
Code Claude
Claude Code a dépassé les 2,5 milliards de dollars de chiffre d'affaires annualisé en février 2026, soit le double depuis le début de l'année. Il représente plus de la moitié des dépenses totales des entreprises en produits Anthropic. 11 entreprises représentent 80 % de l'activité globale de Anthropic, et le nombre de clients dépensant plus de 100 000 $ par an chez Claude a été multiplié par sept au cours de la dernière année.
Anthropic a lancé Claude Cowork, un agent macOS pour les utilisateurs non techniques, basé sur Claude Code. Grâce à la gestion des permissions des dossiers, Claude peut lire, écrire et exécuter des tâches complexes sur les fichiers sans avoir besoin de connaître la ligne de commande. L'application a été développée par Claude Code en une semaine et demie environ. Le 30 janvier, Anthropic a ajouté un système de plugins permettant l'automatisation au niveau des services via des intégrations MCP personnalisées, des sous-agents et des commandes slash. 12
Anthropic a lancé Code Review pour Claude Code, un système multi-agents qui dépêche une équipe d'IA pour analyser chaque demande de fusion. Cette fonctionnalité est actuellement en avant-première pour les utilisateurs des versions Team et Enterprise. Lors du déploiement interne de Anthropic, le pourcentage de commentaires pertinents sur les demandes de fusion est passé de 16 % à 54 % après le lancement. 13 Moins de 1 % des résultats sont jugés incorrects par les ingénieurs, et le système n’approuve pas les PR ; cette décision reste entre les mains des humains.
Anthropic a également lancé des applications interactives directement dans l'interface de chat de Claude, notamment Slack, Canva, Figma, Box et Clay, permettant à Claude d'effectuer des actions dans ces plateformes sans quitter la conversation. 14
GitHub Copilot
GitHub Copilot a connu une expansion majeure en 2026, passant d'un outil de suggestion de code à un environnement de développement multi-agents. La mise à jour de l'interface de ligne de commande (CLI) du 14 janvier a introduit quatre agents parallèles spécialisés : Explore (questions-réponses rapides sur le code source sans encombrer le contexte principal), Task (exécution automatisée des tests et des compilations avec synthèse intelligente des résultats) et Code-review (identification des problèmes de logique et de sécurité, et non des préférences de style). Ces agents s'exécutent simultanément, condensant ainsi les opérations qui nécessitaient auparavant des transferts séquentiels en une exécution parallèle. 15
Kiro (AWS)
Lancé en avant-première en juillet 2025, Kiro est un EDI agentique piloté par spécifications qui convertit les requêtes en langage naturel en exigences structurées, en documents de conception technique et en tâches d'implémentation séquencées. Lors de l'AWS re:Invent en décembre 2025, Amazon a dévoilé une version étendue de Kiro, capable de fonctionner de manière autonome pendant plusieurs jours grâce à un contexte persistant entre sessions, et prise en charge par un agent de sécurité AWS (qui identifie les vulnérabilités au fur et à mesure de l'écriture du code) et un agent DevOps. 16
Amazon a imposé l'adoption interne de Kiro au détriment de Claude Code, et environ 70 % de ses ingénieurs logiciels ont déjà utilisé Kiro au moins une fois. Cependant, près de 1 500 ingénieurs d'Amazon ont signé une publication sur un forum interne en faveur de Claude Code, pointant du doigt les performances insuffisantes de Kiro comme un frein à la productivité. Cela a engendré un conflit manifeste : les ingénieurs commerciaux d'AWS qui vendent Claude Code via Amazon Bedrock ne peuvent pas l'utiliser officiellement dans leurs propres environnements de production. 17
Agents de flux de travail métier
OpenAI Frontière
Frontier a été lancé en 2026 comme une plateforme ouverte et complète permettant aux entreprises de créer, déployer et gérer des agents d'IA compatibles avec les modèles de n'importe quel fournisseur. HP, Intuit, State Farm, Thermo Fisher et Uber figurent parmi les premiers utilisateurs. Frontier est la réponse directe de WatsonX, Orchestrate, Relevance AI et Agentforce dans le domaine de l'orchestration d'agents d'entreprise.
OpenAI a déprécié son framework Swarm et a lancé un SDK Agents unifié et indépendant du fournisseur qui prend en charge plus de 100 LLM, signalant un passage d'outils expérimentaux à une infrastructure de qualité production. 18
Capacités clés : Identité d'agent définie avec des autorisations explicites et des garde-fous basés sur les rôles pour les environnements réglementés ; boucles d'évaluation de la qualité et de rétroaction intégrées ; une couche de contexte métier partagée connectant les entrepôts de données, les CRM et les applications internes ; et un environnement d'exécution déployable sur site, sur le cloud d'entreprise ou hébergé. 19
IBM Watsonx Orchestrate
Watsonx Orchestrate (réf. 991259_1716) est conçu pour l'orchestration de niveau entreprise, avec gouvernance et sécurité intégrées. Il est destiné aux secteurs réglementés où la traçabilité des audits et la conformité sont essentielles. Le compromis est réel : délais de mise en œuvre plus longs, coût plus élevé et obligation d'adhérer à l'écosystème Watsonx Orchestrate. Pour les entreprises disposant déjà d'une infrastructure Watsonx Orchestrate, c'est l'option la plus justifiée. Pour les autres, les coûts supplémentaires sont rarement significatifs.
Pertinence IA
Relevance AI combine l'analyse intégrée aux flux de décision. Son succès repose sur une intégration poussée avec les plateformes d'entreprise courantes, notamment Slack, Notion et Analytics. Là où les plateformes horizontales offrent de la flexibilité, Relevance permet un déploiement plus rapide au sein des flux de travail existants.
Agents du service à la clientèle
Lyro de Tidio
Lyro de Tidio est une solution de chat en direct pour les PME dotée de fonctionnalités d'agent. D'après les retours d'utilisateurs : elle traite 70 à 80 % des questions courantes sans intervention humaine et s'améliore grâce aux retours d'expérience au cours des premiers mois. En revanche, elle montre ses limites face aux questions nécessitant de l'empathie ou du discernement. Ce n'est donc pas l'outil idéal pour les situations clients complexes.
Salesforce Agentforce
Agentforce s'est imposé comme la plateforme de référence pour les agents de service client en entreprise. Son chiffre d'affaires annuel récurrent a atteint 800 millions de dollars, soit une hausse de 169 % sur un an. Depuis son lancement, Agentforce a conclu 29 000 contrats, avec une croissance de 50 % par trimestre. 20 Plus de 60 % des réservations d'Agentforce au quatrième trimestre proviennent de l'expansion de clients existants, ce qui suggère que le produit offre une valeur de production suffisante pour que les clients se développent plutôt que de se désabonner.
Lors d'un déploiement en production chez UCSF Health, Agentforce Voice a atteint une couverture des tâches de 88 % grâce à une formation basée sur la simulation, soit nettement plus que les 60 à 70 % typiques des approches traditionnelles. 21
Ce constat général se vérifie sur toutes les plateformes : les agents du service client sont performants pour les demandes répétitives et en grand volume, mais ont plus de difficultés avec les tâches qui nécessitent du jugement, de l’empathie ou un contexte impliquant plusieurs parties.
Recherche et analyse
Kompas AI
Kompas AI est spécialisée dans la recherche approfondie et la génération de rapports. Elle lit et synthétise les articles scientifiques, gère correctement les citations, effectue une veille constante des nouvelles publications et s'intègre aux bases de données arXiv, PubMed et SSRN. Son principal inconvénient réside dans sa vitesse : elle privilégie la précision au détriment du débit et son coût par requête est supérieur à celui des IA généralistes. Pour les professionnels du savoir qui exigent des résultats fiables et référencés, ce compromis est justifié.
Beam AI
Beam AI gère les flux de travail impliquant de nombreux documents, notamment dans les environnements où l'extraction de données structurées à partir de grands ensembles de documents constitue le principal goulot d'étranglement.
Loutre.ai
Otter.ai reste une solution fiable pour la prise de notes en réunion, mais n'a guère évolué depuis 2024, se limitant à la transcription et à la synthèse basique. Si cela vous suffit, elle convient encore. En revanche, si vous recherchez des agents capables d'agir sur le contenu des réunions, il vous faudra chercher une autre solution.
Cas d'utilisation des agents d'IA
Les agents d'IA sont utilisés dans de nombreux secteurs et pour de nombreux rôles . Vous trouverez ci-dessous quelques exemples de leur utilisation :
- Développeurs
- Assistants SecOps
- Personnages de jeu à l'apparence humaine
- Créateurs de contenu
- assistants d'assurance
- assistants en ressources humaines (RH)
- assistants du service à la clientèle
- assistants de recherche
- utilisateurs d'ordinateurs
- constructeurs d'agents IA
Notez que certains de ces cas d'utilisation sont des cas d'utilisation d'agents , car l'IA agentique englobe et étend les agents d'IA traditionnels en ajoutant l'autonomie, la mémoire, le raisonnement et un comportement orienté vers un but.
Qu'est-ce qui différencie les agents réellement utiles ?
Autonomie vs. Contrôle
La décision la plus importante concerne le degré d'autonomie souhaité. Les agents copilotes tels que Cursor et Otter maintiennent une supervision humaine pour les décisions clés, gérant la recherche et l'exécution, mais exigeant une approbation avant toute action critique. Les plateformes d'automatisation stratégique comme n8n et Make suivent des flux de travail prédéfinis avec une prise de décision minimale en temps réel ; ce qui garantit prévisibilité et fiabilité, mais peut s'avérer problématique face à des situations imprévues. Les systèmes à base de règles réagissent à des déclencheurs sans compréhension du contexte ; ils ne sont pas véritablement autonomes, mais restent utiles pour une automatisation simple.
En 2026, la plupart des entreprises fonctionnent avec des agents de niveau 2 ou 3. Une autonomie totale engendre plus de problèmes qu'elle n'en résout, à moins d'avoir mis en place des garde-fous importants.
Spécialisé vs. Usage général
Les agents spécialisés possèdent une connaissance approfondie du domaine. Ils comprennent les flux de travail, la terminologie et les exigences de conformité du secteur, obtiennent des taux de réussite plus élevés dans leur domaine et sont totalement inadaptés aux cas d'utilisation connexes.
Les plateformes horizontales telles que LangGraph, watsonx Orchestrate et Relevance AI offrent des frameworks flexibles pour la création d'agents personnalisés. Elles privilégient la polyvalence à l'optimisation du domaine. LangGraph se concentre sur la génération de workflows multi-agents de qualité professionnelle, un atout majeur pour les développeurs de systèmes complexes, mais qui requiert une expertise technique. Relevance AI, quant à elle, s'adresse aux utilisateurs métiers avec des modèles prédéfinis et une configuration simplifiée. Enfin, les agents de recherche comme Kompas AI privilégient la précision et l'exhaustivité à la vitesse.
Profondeur d'intégration
Anthropic a fait don de MCP à la fondation Agentic AI de la Linux Foundation, en faisant un standard ouvert et indépendant des fournisseurs, sous le même modèle de gouvernance indépendante que Kubernetes et Node.js. MCP compte désormais plus de 10 000 serveurs publiés et 97 millions de téléchargements mensuels de son SDK, avec une prise en charge optimale par Claude, Cursor, GitHub Copilot, Gemini, VS Code et ChatGPT.
Les intégrations natives aux plateformes distinguent les agents orientés métier. Beam AI et Relevance AI doivent leur succès à une intégration poussée avec Slack, Notion et Analytics. Leur valeur ajoutée réside moins dans les capacités d'IA que dans la fluidité des flux de données. Les architectures privilégiant les API, comme n8n et Make, permettent des intégrations personnalisées mais requièrent une expertise technique. Elles prennent en charge des centaines de connecteurs prédéfinis et autorisent les nœuds personnalisés.
Sécurité et conformité
Les exigences de déploiement en production engendrent des différences architecturales majeures. Les agents de niveau entreprise, tels que WatsonX (référence 991259_1716), et les agents dédiés au secteur de la santé privilégient les certifications de sécurité (SOC 2, ISO 27001), les pistes d'audit, les cadres de conformité (RGPD, HIPAA), le contrôle d'accès basé sur les rôles, le chiffrement des données et les processus de gouvernance. Ces coûts d'infrastructure supplémentaires augmentent les dépenses, mais permettent un déploiement dans les secteurs réglementés.
Un test notable dans le monde réel de ces limites : en février 2026, trois agences du cabinet américain ont ordonné à leur personnel de cesser d'utiliser Claude après que Anthropic ait refusé de supprimer les interdictions contractuelles sur la surveillance intérieure de masse et les armes entièrement autonomes. 22 Cet épisode illustre que les décisions de gouvernance prises au niveau du fournisseur ont des conséquences opérationnelles directes pour les entreprises clientes dans des environnements réglementés ou proches du gouvernement.
Les outils destinés aux développeurs, tels que LangGraph et les agents de codage, se concentrent sur le débogage, la journalisation et l'intégration aux systèmes de contrôle de version, et s'adressent aux utilisateurs techniques qui implémentent leur propre sécurité. Les outils destinés aux consommateurs, quant à eux, sont souvent dépourvus de fonctionnalités de conformité pour les entreprises.
Le problème de gouvernance que personne n'a encore résolu
Les outils de gouvernance commencent à se développer. Plusieurs solutions concrètes ont été déployées :
- Cisco AI Agent Monitor pour Splunk Observability Cloud : suivi en temps réel de la qualité du flux de travail des agents, du coût par exécution et des anomalies comportementales, en phase de test public. 23
- OpenAI Chez Frontier, chaque agent se voit attribuer une identité définie avec des autorisations explicites, des pistes d'audit et des garde-fous, sur le modèle de la façon dont les entreprises gèrent l'accès des employés. 24
- L'Agentic AI Foundation (AAIF), OpenAI, Anthropic et Block ont cofondé un consortium soutenu par la Linux Foundation en décembre 2025 afin d'établir des normes de gouvernance ouvertes et indépendantes des fournisseurs pour l'IA agentique. AWS, Google, Microsoft, Bloomberg et Cloudflare ont rejoint le consortium en tant que membres Platine. Anthropic a fait don de MCP à la fondation, garantissant ainsi qu'il reste une norme industrielle ouverte plutôt qu'un protocole propriétaire. 25
Ce qui fonctionne, ce qui ne fonctionne pas (exemples concrets)
Ce qui fonctionne réellement aujourd'hui
Assistance au codage de niveau 3 : Combinaison de code Cursor + Claude utilisée par des milliers de développeurs. Cursor pour une programmation fluide et des itérations rapides, Claude pour les problèmes complexes.
Flux de travail typique :
- Utilisez le curseur pour 80 % du codage (implémentation de fonctionnalités, refactoring).
- En cas de blocage, faites appel à Claude Code pour obtenir des conseils architecturaux.
- Laisser l'agent exécuter les tests, itérer sur les échecs
- Un humain examine le résultat final avant la fusion.
Automatisation de la prospection commerciale : des agents IA qualifient les prospects, planifient des rendez-vous et effectuent des relances. Les entreprises constatent une augmentation de 2 à 3 fois la productivité de leurs équipes commerciales.
Klarna a déployé des agents commerciaux pour la prise de contact et la qualification initiale. Les représentants humains se concentrent sur les transactions complexes et le développement des relations.
Service client pour les questions fréquentes : 70 à 80 % des demandes courantes sont traitées par les agents en dehors des heures ouvrables. La satisfaction client s’est améliorée grâce à des réponses instantanées, contrairement aux délais habituels (« nous vous recontacterons demain »).
Synthèse de la recherche : Les chercheurs universitaires utilisent des agents pour analyser les nouveaux articles, extraire les sections pertinentes et gérer les bases de données de citations. Gain de temps considérable par rapport à la recherche bibliographique manuelle.
Ce qui ne fonctionne pas encore
Déploiement entièrement autonome : des agents de niveau 4 déploient du code en production sans intervention humaine. Trop risqué pour la plupart des entreprises. Même avec des tests approfondis, des cas particuliers peuvent poser problème.
Exception : Systèmes simples et bien délimités où les défaillances sont récupérables.
Situations clients complexes : les agents perdent leurs moyens lorsqu’il faut faire preuve d’empathie, de discernement ou d’une compréhension nuancée. Un simple « Je comprends votre frustration » de leur part sonne creux.
Prise de décision multipartite : les agents ne peuvent pas naviguer dans les méandres de la politique de bureau, comprendre le contexte non verbal ou lire entre les lignes lors des négociations commerciales.
Stratégie créative : les agents peuvent exécuter des tactiques, mais ne développent pas d’approches stratégiques novatrices. Ils optimisent leurs actions dans le cadre de paramètres donnés, sans remettre en question ces paramètres.
La réalité des coûts
Tout le monde parle des capacités des agents. Rares sont ceux qui abordent les aspects économiques.
Coûts directs :
- Appels d'API du modèle : 0,003 $ à 0,10 $ par tranche de 1 000 jetons (variable selon le modèle)
- Exécution des outils : API, sources de données, intégrations
- Infrastructure : Hébergement, puissance de calcul pour les systèmes auto-hébergés
Coûts cachés :
- L'utilisation de la fenêtre de contexte augmente rapidement avec les conversations à plusieurs tours de parole.
- Tentatives d'exécution infructueuses (l'agent tente, échoue, réessaie ; chaque tentative est facturée).
- Temps de débogage et d'amélioration
- Infrastructure de gouvernance et de sécurité
- Former l'équipe à travailler efficacement avec les agents
Les entreprises leaders considèrent l'optimisation des coûts des agents comme une priorité architecturale majeure. Elles intègrent des modèles économiques dès la conception des agents plutôt que d'ajouter des mécanismes de contrôle des coûts a posteriori.
Exemples de stratégies d'optimisation :
- Acheminer les requêtes simples vers des modèles plus petits et moins coûteux
- Utilisez la mise en cache des prompts de manière intensive (réduction des coûts de 90 % pour un contexte répété).
- Mettre en place des disjoncteurs pour arrêter les agents incontrôlés
- Surveiller l'utilisation des jetons par tâche, optimiser les invites
- Requêtes par lots lorsque la latence n'est pas critique
Si vous vous intéressez à l'infrastructure qui sous-tend l'IA agentique compatible avec le Web, voici nos derniers benchmarks :
- Navigateurs distants : comment l’infrastructure du navigateur permet aux agents d’interagir avec le Web en toute sécurité .
- Comparatif des serveurs MCP pour navigateurs : Meilleurs serveurs MCP pour l’utilisation d’outils et l’accès web.
Un changement structurel s'opère également dans la manière dont les fournisseurs tarifent les outils d'IA agentique. Le passage de Cursor à un système de crédits à deux niveaux et l'intégration de Claude Code dans les licences du plan Team par Anthropic témoignent de la normalisation du marché, qui considère désormais l'IA agentique comme un coût d'infrastructure fixe plutôt que comme une dépense par requête. Les principales organisations d'ingénierie modélisent désormais les dépenses de jetons au niveau du flux de travail, et non plus par invite individuelle. 26
Soyez le premier à commenter
Votre adresse courriel ne sera pas publiée. Tous les champs sont obligatoires.