Serviços
Contate-nos
Nenhum resultado encontrado.

Malha Agética: O Futuro da Colaboração Escalável em IA

Cem Dilmegani
Cem Dilmegani
atualizado em Jan 23, 2026
Veja o nosso normas éticas

Embora muito já tenha sido escrito sobre arquiteturas de agentes, as implementações em nível de produção no mundo real ainda são limitadas. Este artigo destaca a malha de IA agenica , um conceito apresentado em um estudo recente da McKinsey. 1

Analisaremos os desafios que surgem em ambientes de produção e demonstraremos como a arquitetura proposta permite o escalonamento controlado das capacidades de IA.

Desafios em sistemas agentes

À medida que as equipes passam da fase de testes e experimentação com agentes de IA para a implementação de casos de uso escaláveis no mundo real , vários desafios surgem:

  • Lacunas de integração : Durante a experimentação, as equipes usam soluções pré-construídas que aceleram o desenvolvimento, mas essas soluções geralmente carecem de uma abordagem consistente na hora de escalar. Como resultado, surgem problemas de integração e coordenação, levando a lacunas na cobertura. Por exemplo, observamos que, ao tentar escalar chatbots com inteligência artificial, diferentes sistemas de dados e interações com clientes não conseguem se sincronizar.
  • Isolamento de agentes : A maioria dos agentes atuais trabalha de forma independente com informações locais. Por exemplo, um agente Planejador, um agente Recuperador e um agente Executor conectados por meio de APIs podem não ter um contexto unificado. À medida que as organizações escalam para ecossistemas multiagentes, a ausência de memória compartilhada e de coordenação torna-se um desafio crucial.
  • Limitações operacionais : as aplicações de agentes de IA podem levar a resultados imprevisíveis e comportamento não determinístico, gerando respostas inconsistentes ou falhando em fornecer soluções precisas.

Apresentando a arquitetura de malha agética

A malha de IA prevê uma "Internet para Agentes", onde múltiplos agentes podem raciocinar, colaborar e agir de forma autônoma em uma rede distribuída de sistemas e ferramentas.

Diferentemente dos pipelines RAG ou das APIs de microsserviços, ele cria um sistema de registro para o comportamento do agente : cada invocação de ferramenta, erro e resultado é distribuído pela malha de eventos e preservado pela camada de coordenação.

Com o tempo, essa história compartilhada se transforma em uma base de conhecimento mais rica, permitindo que os agentes se alinhem em torno de um contexto comum e colaborem de forma mais eficaz.

Como funciona uma malha agética:

To get up to date on enterprise AI and software, follow us:
Cem Dilmegani
Cem Dilmegani
Principal Analyst
Arquitetura de malha de IA agenciada 2

1. Composibilidade:

Qualquer agente, ferramenta ou modelo (por exemplo, um novo LLM) pode ser conectado à malha sem exigir alterações em outros componentes.

Esse design modular oferece suporte à escalabilidade, permitindo que as organizações adicionem ou substituam recursos de forma incremental, sem interromper os fluxos de trabalho existentes.

2. Raciocínio de agentes paralelos:

A malha permite que o raciocínio seja distribuído entre vários agentes. Isso aumenta a complexidade, mas permite que agentes especializados lidem com partes de uma tarefa maior, em vez de depender de um único LLM (Módulo de Aprendizado de Liderança).

Essa divisão de trabalho facilita a escalabilidade de sistemas de IA, uma vez que as cargas de trabalho podem ser distribuídas entre agentes que operam em paralelo.

3. Secupling em camadas:

A malha separa funções-chave (como lógica, memória, orquestração e interfaces) em camadas distintas. Isso significa que o raciocínio de um agente pode operar independentemente de seu armazenamento de dados ou interface de usuário.

4. Neutralidade do fornecedor:

A malha não está vinculada a nenhum fornecedor ou plataforma específica. Os componentes podem ser substituídos ou atualizados independentemente, com preferência por padrões abertos como o Model Context Protocol (MCP) e o Agent2Agent (A2A) em vez de APIs proprietárias.

Por exemplo, o A2A do Google define um formato de mensagem comum e um mecanismo de descoberta para colaboração entre diferentes estruturas, enquanto o MCP do Anthropic fornece uma maneira universal para os agentes obterem dados. Semelhante ao USB, esses padrões permitem a interoperabilidade, para que as equipes possam combinar ferramentas e modelos de diferentes fornecedores sem trabalho extra de integração.

5. Autonomia governada:

Os agentes na malha agem por conta própria, mas dentro de limites, políticas incorporadas e outras restrições. Em outras palavras, toda ação autônoma é pré-regida por regras.

Capacidades operacionais: Como a malha funciona na prática?

capacidades de malha agética 3

Cada uma dessas funcionalidades abrange toda a malha (não está vinculada a uma única plataforma) e frequentemente apresenta paralelos com conceitos de ambientes de nuvem ou microsserviços, como registros de serviços ou logs de auditoria.

A seguir, descrevemos cada funcionalidade e como ela opera na prática:

Descoberta de agentes e fluxos de trabalho :

A malha mantém um diretório central de todos os agentes e fluxos de trabalho disponíveis. Isso garante que as equipes possam encontrar, reutilizar e integrar facilmente as funcionalidades existentes, em vez de recriá-las do zero. Os agentes também podem publicar "cartões de capacidade" padronizados, descrevendo o que podem fazer, os quais podem ser consultados por outros agentes ou operadores humanos.

Ao impor uma taxonomia comum e padrões de metadados, as organizações também podem aplicar políticas de governança, como restringir determinadas tarefas sensíveis apenas a agentes certificados.

Registro de ativos de IA :

O registro de ativos fornece um repositório para todos os ativos críticos de IA que moldam o comportamento do agente. Isso inclui prompts, definições de ferramentas, configurações de modelos, conjuntos de dados e políticas. Tudo no repositório é versionado, auditável e sujeito à governança.

Os ativos essenciais geralmente incluem:

  • Instruções e comandos testados para garantir a compatibilidade com jailbreaks e evitar vieses.
  • Configurações do agente que especificam quais ferramentas, APIs e modelos são permitidos.
  • Configurações do LLM que definem os modelos e parâmetros disponíveis.
  • Definições de ferramentas e servidores MCP com controles de acesso incorporados.
  • Exemplos de entrada/saída de alta qualidade que servem como referências confiáveis para aprendizado e avaliação.

Gestão de feedback :

Os ciclos de feedback são incorporados à malha, de modo que cada execução do fluxo de trabalho se torne uma fonte de aprendizado. Métricas como latência, precisão, taxas de erro e até mesmo avaliações humanas são coletadas e reinseridas no sistema.

Conformidade e gestão de riscos :

Cada fluxo de trabalho baseado em agentes deve operar dentro de regras e restrições definidas. Ferramentas de conformidade e gerenciamento de riscos são integradas diretamente à malha para garantir isso.

Por exemplo,

  • Os agentes de conformidade podem auditar as ações em relação aos padrões organizacionais ou regulamentares antes que os resultados sejam finalizados.
  • As políticas podem exigir que tarefas sensíveis incluam verificações por agentes de privacidade ou segurança, enquanto os registros de auditoria documentam cada ação para posterior revisão.

Sistemas de avaliação :

Os pipelines de avaliação funcionam como testes de integração para fluxos de trabalho com agentes. Seu objetivo é garantir que os fluxos de trabalho permaneçam robustos mesmo quando os modelos de lógica de linha de comando (LLMs) subjacentes mudam ou as condições externas se alteram.

Sempre que ocorre uma implantação ou atualização de modelo, eles executam conjuntos de testes estruturados para validar a correção.

Normalmente incluem:

  • Testes passo a passo (por exemplo, a API/ferramenta correta foi invocada?).
  • Testes em nível de fluxo de trabalho (por exemplo, o processo geral produziu o resultado esperado?).
  • Testes adversários (por exemplo, injeção imediata, uso indevido, negação de serviço).

Observabilidade :

Em uma malha de agentes, a observabilidade garante que cada interação e fluxo de trabalho do agente possa ser rastreado, registrado e analisado. Essa capacidade proporciona visibilidade de ponta a ponta sobre como os agentes colaboram, quais ferramentas são invocadas e quais recursos são consumidos.

Ao centralizar métricas e registros de eventos, as organizações podem detectar anomalias, controlar custos e verificar se os resultados estão em conformidade com as políticas de governança.

Padrões emergentes como o OpenTelemetry para agentes estão ajudando a tornar a observabilidade interoperável em diferentes ambientes de execução.

Autenticação e autorização :

Em uma malha de agentes, cada chamada entre agentes ou entre agentes e serviços precisa ser autenticada e autorizada. Pense nisso como a emissão de crachás de segurança temporários: os agentes recebem apenas as permissões exatas de que precisam, e essas expiram rapidamente.

A utilização de padrões como OAuth 2.0, JWTs e acesso com privilégios mínimos mantém as interações seguras e limita o impacto caso um componente seja comprometido.

Por que isso é importante?

Em conjunto, essas capacidades transformam agentes pouco conectados em uma malha coerente e bem governada. Os fluxos de trabalho tornam-se supervisionados, auditáveis e adaptáveis, mantendo a flexibilidade para integrar novos agentes, ferramentas ou modelos conforme necessário.

Por exemplo, um agente desenvolvido pela Atlassian poderia descobrir e invocar perfeitamente um agente especializado Salesforce através da malha, com a identidade e os fluxos de dados gerenciados por protocolos compartilhados.

É isso que diferencia uma malha de agentes dos sistemas tradicionais de gerenciamento de fluxo de trabalho. Os orquestradores convencionais podem conectar APIs e tarefas, mas normalmente não possuem os mecanismos integrados de governança, feedback contínuo e conformidade que a malha oferece.

Casos de uso de malhas agéticas

Os conceitos de malhas agetivas estão ganhando força, mas as implementações reais e de nível de produção ainda são limitadas . A maioria dos exemplos atuais são implantações iniciais ou provas de conceito. Dito isso, vários fornecedores estão começando a demonstrar casos de uso práticos:

Kubernetes e controle de entrada

Em vez de depender exclusivamente de controladores de entrada estáticos, em um sistema de malha com agentes, os agentes de IA podem estender os ambientes nativos do Kubernetes, permitindo que os agentes gerenciem o tráfego, apliquem segurança e otimizem cargas de trabalho em APIs e fluxos de eventos.

Áreas de aplicação:

  • Controle de entrada : os agentes aplicam autenticação, encerramento TLS e regras de política para proteger as APIs contra acesso não autorizado.
  • Orquestração com reconhecimento de cluster : os agentes dimensionam as cargas de trabalho para cima ou para baixo e ajustam as estratégias de roteamento com base na disponibilidade de recursos.

Exemplo prático:

Veja como a malha Agentic simplifica o gerenciamento do Kubernetes e da API. 4

Otimização de sistemas de back-end

Uma malha de agentes pode ajudar a otimizar sistemas de back-end, permitindo que os agentes gerenciem o tráfego, apliquem políticas e equilibrem as cargas de trabalho em tempo real.

Áreas de aplicação:

  • Gestão de tráfego : Aplique limites de taxa precisos, quotas e controles de pico para evitar sobrecarga.
  • Balanceamento de carga : Distribui as chamadas de API recebidas e o tráfego de fluxo de eventos entre os servidores para manter os serviços responsivos.
  • Prevenção de gargalos : Detectar e limitar solicitações excessivas de API ou fluxos de dados para garantir um desempenho consistente.
  • Resiliência e otimização do tempo de atividade : Melhore a tolerância a falhas redirecionando solicitações de API/eventos com falha.

Exemplo prático:

A empresa ferroviária Eurostar utiliza uma malha de agentes para otimizar seus sistemas de back-end. Ela gerencia o acesso dos clientes às APIs de forma granular, proporcionando um controle de tráfego e uma distribuição de carga mais seguros. 5

Gerenciamento centralizado de APIs

Uma malha agética ajuda as organizações a centralizar APIs, fluxos de eventos e agentes de IA em uma plataforma unificada.

Áreas de aplicação:

  • Suporte a múltiplos gateways : Integre APIs de diversas plataformas como AWS, Azure e Apigee.
  • Autenticação de nível empresarial : Garanta o controle de acesso adequado para gerenciar quem pode interagir com APIs e agentes.

Exemplo prático :

A SKF, uma empresa de manufatura, utiliza uma plataforma de malha agética para centralizar e gerenciar suas APIs. 6

Gerenciar e expor fluxos de dados e eventos em tempo real.

Uma malha de agentes ajuda as organizações a gerenciar e proteger o acesso a fluxos de dados e eventos em tempo real, proporcionando integração e controle perfeitos. Imagine-a como um hub centralizado onde diferentes sistemas, como APIs e agentes de eventos, podem se comunicar e compartilhar dados de forma eficiente.

Áreas de aplicação:

  • Segurança centralizada : Garantir que todos os dados e APIs estejam seguros e atendam aos padrões da organização.
  • Mediação de protocolo : Converter diferentes tipos de fluxos de dados (por exemplo, Kafka, MQTT) em formatos comuns e fáceis de usar, como REST ou WebSocket.
  • Descoberta de APIs e eventos : Forneça um portal único para que os desenvolvedores encontrem e utilizem dados e APIs.
  • Gerenciamento unificado : Gerencie todos os tipos de APIs e fluxos de dados, incluindo REST e WebSocket, em um só lugar.

O futuro das malhas agéticas: apenas mais uma moda passageira?

A arquitetura de malha agética promete uma forma transformadora para que agentes de IA autônomos colaborem dentro de um ecossistema estruturado. No entanto, existe o risco de se tornar apenas mais uma estrutura técnica, dominada por soluções de infraestrutura como malhas de serviço e redes de integração .

  • Um padrão semelhante surgiu com o conceito de malha de dados . Quando Zhamak Dehghani o apresentou, a ideia revolucionou o gerenciamento de dados ao focar na propriedade, governança e no tratamento dos dados como um produto. No entanto, os fornecedores rapidamente renomearam as soluções existentes como Malha de Dados. 7
  • A mesma tendência agora é visível com a malha agenic. Embora a conversa esteja focada em aspectos técnicos como comunicação/orquestração segura, estes são principalmente componentes de infraestrutura.

Para evitar que se torne apenas mais um Service Mesh 2.0 ou Data Fabric 2.0 com IA , a verdadeira oportunidade reside em focar na criação de valor, e não apenas na infraestrutura subjacente.

É essencial garantir que os domínios de negócios assumam a responsabilidade por seus agentes, em vez de dependerem apenas de fornecedores de middleware. Se as organizações adotarem a propriedade do domínio, a gestão e a governança federada, a malha de agentes poderá se tornar uma ferramenta poderosa de transformação.

Cem Dilmegani
Cem Dilmegani
Analista Principal
Cem é o analista principal da AIMultiple desde 2017. A AIMultiple fornece informações para centenas de milhares de empresas (segundo o SimilarWeb), incluindo 55% das empresas da Fortune 500, todos os meses. O trabalho de Cem foi citado por importantes publicações globais, como Business Insider, Forbes e Washington Post, além de empresas globais como Deloitte e HPE, ONGs como o Fórum Econômico Mundial e organizações supranacionais como a Comissão Europeia. Você pode ver mais empresas e recursos renomados que mencionaram a AIMultiple. Ao longo de sua carreira, Cem atuou como consultor de tecnologia, comprador de tecnologia e empreendedor na área. Ele assessorou empresas em suas decisões tecnológicas na McKinsey & Company e na Altman Solon por mais de uma década. Também publicou um relatório da McKinsey sobre digitalização. Liderou a estratégia de tecnologia e a área de compras de uma empresa de telecomunicações, reportando-se diretamente ao CEO. Além disso, liderou o crescimento comercial da empresa de tecnologia avançada Hypatos, que atingiu uma receita recorrente anual de sete dígitos e uma avaliação de nove dígitos, partindo de zero, em apenas dois anos. O trabalho de Cem no Hypatos foi noticiado por importantes publicações de tecnologia, como TechCrunch e Business Insider. Cem participa regularmente como palestrante em conferências internacionais de tecnologia. Ele se formou em engenharia da computação pela Universidade Bogazici e possui um MBA pela Columbia Business School.
Ver perfil completo

Seja o primeiro a comentar

Seu endereço de e-mail não será publicado. Todos os campos são obrigatórios.

0/450