Os padrões de projeto de IA agética aprimoram a autonomia de grandes modelos de linguagem (LLMs), como Llama, Claude ou GPT, aproveitando o uso de ferramentas, a tomada de decisões e a resolução de problemas. Isso proporciona uma abordagem estruturada para a criação e o gerenciamento de agentes autônomos em diversos casos de uso .
O que são fluxos de trabalho agentivos?
Um agente é considerado mais inteligente se escolher consistentemente ações que levem a resultados mais alinhados com sua função objetivo.
Fluxos de trabalho automatizados (baseados em regras, não IA)
Seguem regras e processos predefinidos , geralmente baseados em instruções fixas. São projetados para lidar com tarefas repetitivas de forma eficiente, frequentemente por meio de sistemas como a automação robótica de processos (RPA), onde pouca ou nenhuma tomada de decisão é necessária.
Fluxos de trabalho de IA (não agentes)
Sistemas onde os LLMs e as ferramentas são orquestrados por meio de fluxos de código predefinidos, com o mínimo de esforço mental envolvido. Em um fluxo de trabalho não-agente, um LLM gera uma saída a partir de um prompt, como gerar uma lista de recomendações com base em uma entrada.
Fluxos de trabalho agéticos
Processos orientados por IA, nos quais agentes autônomos tomam decisões, executam ações e coordenam tarefas com mínima intervenção humana. Esses fluxos de trabalho utilizam componentes-chave como raciocínio, planejamento e utilização de ferramentas para lidar com tarefas complexas.
Em comparação com a automação tradicional, como a RPA , que segue regras e modelos fixos, os fluxos de trabalho baseados em agentes são mais “ dinâmicos e flexíveis ”, adaptando-se a dados em tempo real e a condições inesperadas.
Nesse fluxo de trabalho, o agente de IA responde à consulta do usuário (Exemplo: “Quem ganhou a Eurocopa em 2024?”).
- Consulta do usuário: O usuário faz uma pergunta.
- Análise LLM : O LLM interpreta os dados e determina se são necessários dados externos.
- Ativação de ferramenta externa: Uma ferramenta de busca recupera informações em tempo real.
- Criação de respostas: O LLM combina os dados e as respostas:
“A Espanha venceu o Euro 2024 contra a Inglaterra por 2 a 1 na final em Berlim, em julho de 2024.”
5 tipos de padrões de design de IA agética
Padrão de reflexão
O padrão de reflexão aprimora os fluxos de trabalho de agentes com autoaperfeiçoamento contínuo.
→ Esse padrão envolve um mecanismo de auto-feedback no qual um agente de IA avalia suas saídas ou decisões antes de finalizar sua resposta ou tomar outras medidas.
→ Permite que o agente analise seu próprio trabalho, identifique erros ou lacunas e refine sua abordagem, levando a melhores resultados ao longo do tempo. Esse processo não se limita a uma única iteração; os agentes podem ajustar suas respostas em interações subsequentes.
Exemplo prático:
Agentes de IA, como o GitHub Copilot, podem refinar o código por meio da autorreflexão, examinando e modificando sua própria estrutura e comportamento em tempo de execução, por exemplo:
- Resposta inicial : O GitHub Copilot gera um trecho de código com base em uma solicitação.
- Processo de reflexão : Analisa o código gerado em busca de erros, ineficiências ou melhorias. Pode utilizar um ciclo de feedback, como executar o código em um ambiente de teste (sandbox), para identificar erros.
- Auto-iteração : Avalia se o código gerado funciona conforme o esperado, refina sua lógica e sugere otimizações.
Padrão de uso da ferramenta
O padrão de uso de ferramentas na IA agente aprimora as capacidades de grandes modelos de linguagem (LLMs) ao permitir que eles interajam dinamicamente com ferramentas e recursos externos.
Protocolos como o Model Context Protocol (MCP) ajudam a padronizar o processo de utilização da ferramenta. 2
A padronização do uso de ferramentas por meio do MCP (Model-Copy-Place Protocol) migra o design de agentes de integrações de API personalizadas para uma camada de contexto unificada. Em vez de gerenciar conectores individuais, os agentes utilizam o MCP para manter um fluxo de dados seguro entre o modelo e o ambiente local ou corporativo. Com protocolos de uso de ferramentas e modelos de agentes, os agentes podem:
- Acessar informações em tempo real (via APIs), pesquisar na web.
- Interagir com APIs para processar e gerar respostas.
- interagir com sistemas de recuperação de informação
- recuperar conjuntos de dados específicos
- Executar scripts para análise de dados
- Utilizar modelos de aprendizado de máquina para executar algoritmos especializados.
Utilizamos agentes de IA populares para testar suas capacidades de uso de ferramentas:
Exemplo prático:
O projeto de síntese visual-textual utiliza GPT-4 para interagir dinamicamente com ferramentas externas (como o CLIP para análise de imagens e GPT-4 para raciocínio) e recursos externos (por exemplo, ferramentas de design, plataformas de comércio eletrônico) para concluir tarefas complexas. 3
Padrão de planejamento
O padrão de planejamento permite que os LLMs dividam grandes tarefas em subtarefas.
Um LLM que utiliza o padrão de planejamento organizará as submetas em uma sequência lógica. Dependendo da complexidade, o agente pode planejar ações em ordem linear ou criar ramificações para execução paralela.
Exemplo prático:
Um grupo de pesquisadores demonstrou como os agentes do LLM colaboram com modelos de plataformas como o Hugging Face para lidar com tarefas complexas e de maior porte.
A abordagem foi chamada de HuggingGPT , um agente baseado em LLM que utiliza LLMs (por exemplo, ChatGPT) para conectar vários modelos de IA em comunidades de aprendizado de máquina (por exemplo, Hugging Face) para resolver tarefas de IA. 4
Nos fluxos de trabalho atuais, o padrão de planejamento está cada vez mais integrado ao raciocínio em nível de modelo. Enquanto as estruturas lidam com a delegação de tarefas de alto nível, os modelos de raciocínio realizam o processamento interno para validar os planos antes da execução. Essa deliberação interna:
- Reduz erros lógicos durante a decomposição de tarefas.
- minimiza a necessidade de engenharia de consulta em várias etapas
- Permite que o agente se autocorrija antes de iniciar uma ação.
Padrão multiagente
Os padrões multiagentes focam na delegação de tarefas, que envolve atribuir diferentes agentes a diferentes tarefas que podem ser criadas solicitando a um único LLM (ou a múltiplos LLMs) que lidem com responsabilidades distintas.
Por exemplo, para criar um agente desenvolvedor de software, você poderia instruir o LLM: “Você é especialista em escrever código eficiente e claro. Por favor, escreva o código para realizar [specific task] . ”
Em sistemas multiagentes, os agentes comunicam-se utilizando protocolos Agente-para-Agente (A2A) que definem o fluxo de informações entre eles. Por exemplo, o protocolo A2A de Google é uma estrutura aberta que fornece aos agentes contexto e ferramentas estruturadas. 5
Estruturas multiagentes atuais:
- LangGraph: Facilita fluxos de trabalho cíclicos e gerenciamento de estado para agentes que requerem ciclos de feedback.
- PydanticAI: Uma estrutura focada na orquestração de agentes com tipagem estática e pronta para produção.
- CrewAI: Orquestra agentes atribuindo funções específicas e sequências de tarefas colaborativas.
- OpenAI Swarm: Um protocolo leve para gerenciar a transferência de informações entre modelos especializados.
Para mais informações: Construtores e frameworks de IA agética de código aberto .
Padrão Human-in-the-Loop (HITL)
O padrão HITL incorpora a intervenção humana em pontos de decisão específicos para garantir precisão e segurança. As principais implementações incluem:
- Pontos de verificação de aprovação: O agente aguarda a confirmação humana antes de executar ações de alto impacto, como transações financeiras ou exclusões de dados.
- Ciclos de revisão: Um supervisor humano ou secundário avalia o resultado do agente para fornecer uma camada de controle de qualidade antes da conclusão do processo.
casos de uso de fluxo de trabalho agético
1. Geração aumentada por recuperação (RAG)
Padrões de projeto agentivos podem ser usados em sistemas RAG para incorporar agentes no pipeline RAG.
Para mais informações, consulte:
→ Descubra os melhores sistemas RAG da Agentic
→ Comparar as principais ferramentas de geração aumentada por recuperação
2. Desenvolvimento de software
- Geração e preenchimento automático de código :
- Cursor : Gera automaticamente trechos de código e funções inteiras com base em descrições em linguagem natural.
- Devin: Cria aplicativos do zero com supervisão humana mínima, usando um navegador ou uma interface de linha de comando.
- Testes automatizados de software :
- Diffblue : Escreve automaticamente testes unitários para código Java, garantindo cobertura e correção do código.
- Snyk : Detecta e corrige vulnerabilidades de segurança em dependências sem intervenção humana.
- Diffblue : Escreve automaticamente testes unitários para código Java, garantindo cobertura e correção do código.
3. Jogos
- NPCs autônomos:
- AI Dungeon : Utiliza um LLM para gerar NPCs totalmente autônomos baseados em texto, que reagem às ações do jogador e criam eventos narrativos.
- AgentRefine: Permite que agentes e modelos de IA identifiquem erros e os corrijam autonomamente, melhorando seu desempenho em tarefas gerais.
- Exploração autônoma:
- Spore (evolução controlada por IA) : Agentes de IA se reproduzem, sofrem mutações e evoluem sem intervenção humana, tornando-se cada vez mais inteligentes e diversos a cada geração.
- Busca de caminhos:
- NavMesh AI : Sistema autônomo de busca de caminhos em jogos, onde agentes podem navegar em ambientes dinâmicos.
4. Criação multimídia
- Transformando resultados de pesquisa GenAI em páginas da Wikipedia
- Perplexity Páginas: Quando um usuário insere uma consulta de pesquisa, Perplexity Páginas agrega informações relevantes de múltiplas fontes para transformar os resultados da pesquisa em páginas da Wikipédia.
- Produção de vídeo automatizada
- O Pictory transforma conteúdo baseado em texto em vídeo de forma autônoma.
5. Pesquisa e análise de dados
- ChemCrow : Executando simulações e fazendo recomendações autônomas.
para a descoberta de medicamentos. - AI2: Fornece gerenciamento de data warehouse por meio de sistemas autônomos.
6. Uso do computador
Agentes modernos podem interagir com Interfaces Gráficas de Usuário (GUIs) de forma semelhante aos usuários humanos. Por meio de suas capacidades de uso do computador, os agentes interpretam pixels da tela, movem cursores e inserem texto em diversos aplicativos. Esses agentes podem:
- pesquisar na web e interagir com interfaces de software para desktop.
- Navegar em sistemas ERP internos que não possuem APIs estruturadas
- Executar fluxos de trabalho administrativos multiplataforma
- Preencha formulários online e reserve viagens.
7. Atendimento ao cliente
Agentes de IA para atendimento ao cliente respondem a perguntas de clientes em linguagem natural, interpretam o contexto e geram respostas semelhantes às humanas. Esses agentes são comumente usados para automação de centrais de atendimento. Alguns exemplos incluem:
- Zendesk AI
- Filme do Intercomunicador
- Agente Kore.AI
8. Automação na área da saúde
A IA ativa para a área da saúde visa aproveitar os sistemas de saúde para automatizar fluxos de trabalho em operações clínicas. Exemplos de ferramentas incluem:
Automação de saúde de uso geral:
- Sully.ai
- IA Hipocrática
- Inovador
- Agente de saúde Beam AI
- Saúde Notável
Apoio ao paciente:
- Amelia IA
- Cognigy
Leitura complementar
- Principais ferramentas de agentes de IA
- Agentes de IA: uso via operador versus navegador versus Projeto Mariner
Seja o primeiro a comentar
Seu endereço de e-mail não será publicado. Todos os campos são obrigatórios.