Si bien se ha escrito mucho sobre arquitecturas de agentes, las implementaciones en entornos de producción reales siguen siendo limitadas. Este artículo destaca la malla de IA con agentes , un concepto presentado en un informe reciente de McKinsey. 1
Analizaremos los retos que surgen en los entornos de producción y demostraremos cómo nuestra arquitectura propuesta permite una escalabilidad controlada de las capacidades de IA.
Desafíos en los sistemas de agentes
A medida que los equipos pasan de probar y experimentar con agentes de IA a implementar casos de uso escalables en el mundo real , surgen varios desafíos:
- Brechas de integración : Durante la experimentación, los equipos utilizan soluciones predefinidas que aceleran el desarrollo, pero estas soluciones suelen carecer de un enfoque coherente a la hora de escalar. Como resultado, surgen problemas de integración y coordinación, lo que genera brechas en la cobertura. Por ejemplo, hemos observado que al intentar escalar chatbots con IA, los diferentes sistemas de datos e interacciones con los clientes no se sincronizan correctamente.
- Aislamiento de agentes : Actualmente, la mayoría de los agentes trabajan de forma independiente con información local. Por ejemplo, un agente planificador, un recuperador y un ejecutor conectados mediante API pueden carecer de un contexto unificado. A medida que las organizaciones escalan hacia ecosistemas multiagente, la ausencia de memoria compartida y coordinación se convierte en un desafío clave.
- Limitaciones operativas : Las aplicaciones de agentes de IA pueden dar lugar a resultados impredecibles y a un comportamiento no determinista, generando respuestas inconsistentes o impidiendo que se proporcionen soluciones precisas.
Presentamos la arquitectura de malla agente.
La red de IA prevé una "Internet para agentes", donde múltiples agentes puedan razonar, colaborar y actuar de forma autónoma a través de una red distribuida de sistemas y herramientas.
A diferencia de las canalizaciones RAG o las API de microservicios, crea un sistema de registro para el comportamiento de los agentes : cada invocación de herramienta, error y resultado se distribuye a través de la malla de eventos y se conserva mediante la capa de coordinación.
Con el tiempo, esta historia compartida se va consolidando hasta convertirse en una base de conocimientos más rica, lo que permite a los agentes alinearse en torno a un contexto común y colaborar de forma más eficaz.
¿Cómo funciona una malla agencial?
1. Componibilidad:
Cualquier agente, herramienta o modelo (por ejemplo, un nuevo LLM) puede conectarse a la malla sin necesidad de modificar otros componentes.
Este diseño modular permite la escalabilidad, ya que posibilita que las organizaciones añadan o reemplacen funcionalidades de forma incremental, sin interrumpir los flujos de trabajo existentes.
2. Razonamiento de agentes paralelos:
La malla permite distribuir el razonamiento entre múltiples agentes. Esto aumenta la complejidad, pero permite que agentes especializados se encarguen de partes de una tarea más grande en lugar de depender de un único modelo de lógica difusa.
Esta división del trabajo facilita la escalabilidad de los sistemas de IA, ya que las cargas de trabajo se pueden distribuir entre agentes que se ejecutan en paralelo.
3. Acoplamiento por capas:
La malla separa las funciones clave (lógica electrónica, memoria, orquestación e interfaces) en capas distintas. Esto significa que el razonamiento de un agente puede operar independientemente de su almacenamiento de datos o interfaz de usuario.
4. Neutralidad del proveedor:
La red no está vinculada a ningún proveedor ni plataforma en particular. Los componentes se pueden reemplazar o actualizar de forma independiente, priorizando los estándares abiertos como el Protocolo de Contexto de Modelo (MCP) y Agent2Agent (A2A) sobre las API propietarias.
Por ejemplo, el estándar A2A de Google define un formato de mensaje común y un mecanismo de descubrimiento para la colaboración entre diferentes plataformas, mientras que el estándar MCP de Anthropic proporciona una forma universal para que los agentes obtengan datos. Al igual que USB, estos estándares permiten la interoperabilidad, de modo que los equipos pueden combinar herramientas y modelos de diferentes proveedores sin necesidad de trabajo de integración adicional.
5. Autonomía gobernada:
Los agentes en la red actúan de forma independiente, pero dentro de límites establecidos, políticas predefinidas y otras restricciones. En otras palabras, cada acción autónoma está regida por reglas preestablecidas.
Capacidades operativas: ¿Cómo funciona la red en la práctica?
Cada una de estas capacidades abarca toda la red (sin estar vinculada a una sola plataforma) y, a menudo, presenta paralelismos con conceptos de entornos de nube o microservicios, como registros de servicios o registros de auditoría.
A continuación, describimos cada funcionalidad y cómo funciona en la práctica:
Descubrimiento de agentes y flujos de trabajo :
La red mantiene un directorio central de todos los agentes y flujos de trabajo disponibles. Esto garantiza que los equipos puedan encontrar, reutilizar e integrar fácilmente las funcionalidades existentes, en lugar de tener que crearlas desde cero. Los agentes también pueden publicar "fichas de funcionalidad" estandarizadas que describen sus acciones, las cuales pueden ser consultadas por otros agentes u operadores humanos.
Al imponer una taxonomía común y estándares de metadatos, las organizaciones también pueden aplicar políticas de gobernanza, como restringir ciertas tareas delicadas únicamente a agentes certificados.
Registro de activos de IA :
El registro de activos proporciona un repositorio para todos los activos críticos de IA que influyen en el comportamiento de los agentes. Esto incluye indicaciones, definiciones de herramientas, configuraciones de modelos, conjuntos de datos y políticas. Todo en el repositorio está controlado por versiones, es auditable y está sujeto a gobernanza.
Los activos esenciales suelen incluir:
- Las indicaciones e instrucciones se han probado para detectar vulnerabilidades o sesgos.
- Configuraciones de agente que especifican qué herramientas, API y modelos están permitidos.
- Configuración de LLM que define los modelos y parámetros disponibles.
- Definiciones de herramientas y servidores MCP con controles de acceso integrados.
- Ejemplos de entrada/salida de referencia que constituyen puntos de referencia fiables para el aprendizaje y la evaluación.
Gestión de comentarios :
Los bucles de retroalimentación están integrados en la malla, de modo que cada ejecución del flujo de trabajo se convierte en una fuente de aprendizaje. Se recopilan métricas como la latencia, la precisión, las tasas de error e incluso las valoraciones humanas, y se retroalimentan al sistema.
Cumplimiento normativo y gestión de riesgos :
Cada flujo de trabajo de agente debe operar dentro de reglas y restricciones definidas. Las herramientas de cumplimiento y gestión de riesgos están integradas directamente en la malla para garantizarlo.
Por ejemplo,
- Los agentes de cumplimiento pueden auditar las acciones en función de las normas organizativas o reglamentarias antes de que se finalicen los resultados.
- Las políticas pueden exigir que las tareas delicadas incluyan comprobaciones por parte de agentes de privacidad o seguridad, mientras que los registros de auditoría documentan cada acción para su posterior revisión.
Sistemas de evaluación :
Los procesos de evaluación funcionan como pruebas de integración para flujos de trabajo basados en agentes. Su objetivo es garantizar que los flujos de trabajo sigan siendo robustos incluso cuando cambian los modelos de lógica de negocio subyacentes o las condiciones externas varían.
Siempre que se produce una implementación o una actualización del modelo, ejecutan conjuntos de pruebas estructuradas para validar su correcto funcionamiento.
Suelen incluir:
- Pruebas paso a paso (por ejemplo, ¿se invocó la API/herramienta correcta?).
- Pruebas a nivel de flujo de trabajo (por ejemplo, ¿el proceso general produjo el resultado esperado?).
- Pruebas adversarias (por ejemplo, inyección rápida, uso indebido, denegación de servicio).
Observabilidad :
En una red de agentes, la observabilidad garantiza que cada interacción y flujo de trabajo de los agentes pueda ser rastreado, registrado y analizado. Esta capacidad proporciona visibilidad integral sobre cómo colaboran los agentes, qué herramientas se utilizan y qué recursos se consumen.
Al centralizar las métricas y los registros de eventos, las organizaciones pueden detectar anomalías, controlar los costos y verificar que los resultados se ajusten a las políticas de gobernanza.
Los estándares emergentes, como OpenTelemetry para agentes, están contribuyendo a que la observabilidad sea interoperable entre diferentes entornos de ejecución.
Autenticación y autorización :
En una red de agentes, cada llamada entre agentes o entre agentes y servicios debe autenticarse y autorizarse. Imagínelo como emitir credenciales de seguridad temporales: los agentes solo obtienen los permisos exactos que necesitan, y estos caducan rápidamente.
El uso de estándares como OAuth 2.0, JWT y el acceso con privilegios mínimos mantiene las interacciones seguras y limita el impacto si un componente se ve comprometido.
¿Por qué es importante esto?
En conjunto, estas capacidades transforman agentes conectados de forma laxa en una red coherente y bien gestionada. Los flujos de trabajo se vuelven supervisados, auditables y adaptables, manteniendo al mismo tiempo la flexibilidad para integrar nuevos agentes, herramientas o modelos según sea necesario.
Por ejemplo, un agente creado por Atlassian podría descubrir e invocar sin problemas a un agente especializado Salesforce a través de la malla, con flujos de identidad y datos gestionados por protocolos compartidos.
Esto es lo que distingue a una malla de agentes de los sistemas tradicionales de gestión de flujos de trabajo. Los orquestadores convencionales pueden conectar API y tareas, pero suelen carecer de la gobernanza integrada, la retroalimentación continua y los mecanismos de cumplimiento que proporciona la malla.
Casos de uso de malla agente
Los conceptos de malla agente están ganando terreno, pero las implementaciones reales y de nivel de producción aún son limitadas . La mayoría de los ejemplos actuales son despliegues iniciales o pruebas de concepto. Dicho esto, varios proveedores están comenzando a mostrar casos de uso prácticos:
Kubernetes y control de entrada
En lugar de depender únicamente de controladores de entrada estáticos, en un sistema de malla basado en agentes, los agentes de IA pueden extender los entornos nativos de Kubernetes al permitir que los agentes administren el tráfico, apliquen la seguridad y optimicen las cargas de trabajo a través de API y flujos de eventos.
Áreas de aplicación:
- Control de entrada : Los agentes aplican la autenticación, la terminación TLS y las reglas de política para proteger las API del acceso no autorizado.
- Orquestación con reconocimiento de clúster : Los agentes escalan las cargas de trabajo hacia arriba o hacia abajo y ajustan las estrategias de enrutamiento en función de la disponibilidad de recursos.
Ejemplo del mundo real:
Optimización de sistemas backend
Una malla de agentes puede ayudar a optimizar los sistemas de backend al permitir que los agentes gestionen el tráfico, apliquen políticas y equilibren las cargas de trabajo en tiempo real.
Áreas de aplicación:
- Gestión del tráfico : Aplique límites de velocidad, cuotas y controles de picos de tráfico precisos para evitar la sobrecarga.
- Balanceo de carga : Distribuye las llamadas entrantes a la API y el tráfico de flujo de eventos entre los servidores para mantener servicios receptivos.
- Prevención de cuellos de botella : Detecta y limita las solicitudes excesivas de API o flujos de datos para garantizar un rendimiento constante.
- Optimización de la resiliencia y el tiempo de actividad : Mejore la tolerancia a fallos redirigiendo las solicitudes de API/eventos que fallen.
Ejemplo del mundo real:
La compañía ferroviaria Eurostar utiliza una malla de agentes para optimizar sus sistemas de backend. Gestionan el acceso de los clientes a las API de forma granular para lograr un control de tráfico y una distribución de carga más seguros. 5
Gestión centralizada de API
Una malla de agentes ayuda a las organizaciones a centralizar las API, los flujos de eventos y los agentes de IA en una plataforma unificada.
Áreas de aplicación:
- Compatibilidad con múltiples pasarelas : integre las API de diversas plataformas como AWS, Azure y Apigee.
- Autenticación de nivel empresarial : Asegure un control de acceso adecuado para gestionar quién puede interactuar con las API y los agentes.
Ejemplo del mundo real :
SKF, una empresa manufacturera, utiliza una plataforma de malla agemática para centralizar y gestionar sus API. 6
Gestionar y exponer flujos de datos y eventos en tiempo real.
Una malla de agentes ayuda a las organizaciones a gestionar y proteger el acceso a datos y flujos de eventos en tiempo real, proporcionando una integración y un control impecables. Imagínelo como un centro centralizado donde diferentes sistemas, como API y agentes de eventos, pueden comunicarse y compartir datos de manera eficiente.
Áreas de aplicación:
- Seguridad centralizada : Garantizar que todos los datos y las API sean seguros y cumplan con los estándares de la organización.
- Mediación de protocolos : Convierte diferentes tipos de flujos de datos (por ejemplo, Kafka, MQTT) en formatos comunes y fáciles de usar, como REST o WebSocket.
- Descubrimiento de API y eventos : Proporciona un portal único para que los desarrolladores encuentren y utilicen datos y API.
- Gestión unificada : Gestione todo tipo de API y flujos de datos, incluidos REST y WebSocket, en un solo lugar.
El futuro de la malla agente: ¿Solo otra moda pasajera?
La malla agencial promete una forma transformadora para que los agentes de IA autónomos colaboren dentro de un ecosistema estructurado. Sin embargo, existe el riesgo de que se convierta en un marco técnico más, dominado por soluciones de infraestructura como las mallas de servicios y los tejidos de integración .
- Un patrón similar surgió con el concepto de malla de datos . Cuando Zhamak Dehghani lo presentó, la idea revolucionó la gestión de datos al centrarse en la propiedad, la gobernanza y el tratamiento de los datos como un producto. Sin embargo, los proveedores no tardaron en renombrar las soluciones existentes como malla de datos. 7
- La misma tendencia se observa ahora en las redes de agentes. Si bien el debate se centra en aspectos técnicos como la comunicación/orquestación segura, estos son principalmente componentes de infraestructura.
Para evitar reducirlo a un simple Service Mesh 2.0 o Data Fabric 2.0 con IA , la verdadera oportunidad reside en centrarse en la creación de valor, no solo en la infraestructura subyacente.
Es fundamental garantizar que los dominios empresariales asuman la responsabilidad de sus agentes, en lugar de depender únicamente de los proveedores de middleware. Si las organizaciones adoptan la propiedad, la administración y la gobernanza federada de los dominios, la malla de agentes puede convertirse en una poderosa herramienta de transformación.
Sé el primero en comentar
Tu dirección de correo electrónico no será publicada. Todos los campos son obligatorios.