Todo mundo tem criado agentes de IA, então, após testes práticos com agentes de IA populares, desenvolvedores e ferramentas de IA usam benchmarks para avaliar suas capacidades no mundo real . Compilamos uma lista selecionada com mais de 50 dos melhores agentes de IA de código aberto . Clique nos títulos das categorias para ir direto às nossas principais escolhas:
Desenvolvimento de agentes e infraestrutura
- Frameworks de agentes (Monte o seu próprio)
- Ferramentas de automação e orquestração de fluxos de trabalho
Aplicações de agentes específicos de domínio
- Agentes de automação e navegação web
- Ferramentas de codificação e desenvolvimento
- Ferramentas de cibersegurança
- Criadores de conteúdo de vídeo com IA
- assistentes financeiros
- auxiliares de saúde
- Agentes de pesquisa
- Assistentes de análise de dados
- Assistentes pessoais
Como pensar sobre agentes de IA?
Um agente de IA é mais do que apenas um LLM com instruções. Tecnicamente, é um sistema composto que combina planejamento, memória, uso de ferramentas e execução iterativa. Ele forma um ciclo estruturado em torno de um LLM que pode tomar decisões, executar ações e se adaptar a novas informações.
Eis como pensar sobre eles:
- Autonomia e fluxos de trabalho: os agentes de IA variam desde a automação básica de tarefas com base em fluxos de trabalho predefinidos até sistemas totalmente autônomos capazes de decomposição de objetivos, uso de memória e interação com ferramentas. O principal desafio técnico reside em manter o contexto ao longo das etapas e coordenar operações em múltiplos estágios.
- Contexto e controle : O verdadeiro desafio em agentes de IA é garantir que o LLM (Learning Learning Machine) tenha o contexto apropriado em cada etapa. Isso inclui gerenciar o conteúdo inserido no LLM e garantir que o agente execute tarefas relevantes com base em um contexto atualizado.
- Integração de ferramentas : A criação de agentes eficazes exige uma integração perfeita com ferramentas externas, APIs e fontes de dados. Frameworks como o LangChain podem auxiliar na integração desses recursos externos, mas o controle sobre o fluxo de trabalho é essencial para adaptar o comportamento do agente a novas entradas.
- Benefícios dos frameworks de agentes : Todos os sistemas de agentes, sejam fluxos de trabalho simples ou agentes autônomos complexos, podem se beneficiar dos recursos principais fornecidos pelos frameworks de agentes . Esses recursos podem ser desenvolvidos do zero ou aproveitados de uma plataforma de código aberto existente, dependendo das suas necessidades.
Novos padrões
- Protocolo de Contexto de Modelo (MCP): O padrão da indústria para a forma como os agentes se comunicam com fontes de dados externas. O LangGraph integra o MCP para permitir que os agentes se conectem a bancos de dados e ferramentas locais sem a necessidade de wrappers personalizados.
- Protocolo de Comércio Agente (ACP) da Stripe: Este é o primeiro padrão da indústria em funcionamento que permite que agentes de IA gerenciem pagamentos, estoque e envios com segurança. Ele possibilita o "Checkout Agente", onde o agente pode concluir uma compra para o usuário dentro de uma interface de chat.
O que exatamente é um agente de IA?
Não existe uma definição consensual do que constitui um "agente de IA".
- A IA tradicional define agentes como sistemas que interagem com o ambiente ao seu redor.
- A pesquisa de Simon Willison com profissionais da área apresenta uma variedade de definições práticas fornecidas por participantes do setor. 2
- A definição de Anthropic descreve os princípios de design para a construção de agentes de IA eficazes e alinhados. 3
- As principais empresas de consultoria enfatizam o papel dos agentes na automatização dos fluxos de trabalho e da tomada de decisões empresariais. 4 .
Muitos desses incluem explicitamente fluxos de trabalho e colocam a autonomia em uma das extremidades de um espectro.
Concordamos com esses pontos de vista e, portanto, não fornecemos uma definição estrita. Em vez disso, listamos os fatores que influenciam um sistema de IA. Para ser considerado mais agente :
- Ambiente e objetivos:
- Sistemas de IA em ambientes complexos, como aqueles com múltiplas tarefas e mudanças inesperadas, são agentes.
- Sistemas de IA que seguem objetivos sem receber instruções são chamados de agentes.
- Interface do usuário e supervisão: Sistemas de IA que conseguem aprender linguagens naturais e sistemas que necessitam de menos supervisão do usuário são chamados de agentes.
- Projeto de sistemas: Sistemas que utilizam padrões de projeto, como o uso de ferramentas (por exemplo, busca na web, programação) ou planejamento (por exemplo, reflexão, desdobramento de subobjetivos), são agentes.
Para uma explicação mais detalhada, listamos anteriormente esses fatores e discutimos como eles definem sistemas de IA agéticos .
Esses agentes são totalmente autônomos?
Ainda não. A maioria dos agentes de IA de código aberto aprimora a autonomia do aprendizado de máquina ao permitir o uso de ferramentas, a tomada de decisões e a resolução de problemas, mas ainda exigem entradas estruturadas e a intervenção humana.
Exemplos como Devon e PR-Agent seguem lógicas predefinidas ou fluxos de trabalho de aprendizado por reforço, em vez de demonstrarem comportamento totalmente autônomo. Outros agentes de IA ainda carecem de capacidades de aprendizado autônomo e generalização.
Quando (e quando não) usar agentes de IA
Nem toda aplicação de LLM requer complexidade agentiva. Muitos casos de uso são melhor atendidos por geração aumentada por recuperação (RAG) leve.
Sistemas agentes introduzem sobrecarga arquitetural: gerenciamento de memória, orquestração de ferramentas, tratamento de erros e loops de controle que aumentam a latência e o custo. Por exemplo, em nossos testes de desempenho, observamos que as taxas de sucesso dos agentes de IA diminuíram após 35 minutos de interação humana.
Para mitigar esses riscos, é essencial testar sistemas de agentes em ambientes controlados e implementar medidas de segurança robustas antes da implantação.
Os agentes são mais valiosos quando as etapas não podem ser facilmente previstas ou codificadas. Eles são particularmente adequados para situações em que:
- As tarefas são dinâmicas e compostas por várias etapas , com lógica ramificada ou subobjetivos pouco claros.
- A utilização de ferramentas é condicional ou adaptativa , exigindo que o sistema escolha qual ferramenta invocar com base na entrada ou no estado anterior.
- É necessário ter memória de longo prazo ou contexto , ao longo das sessões ou etapas de execução.
- A execução deve responder ao feedback do ambiente , como resultados de API, resultados de pesquisa ou ações com falha.
- É necessária a colaboração com participação humana , onde autonomia e supervisão devem ser combinadas (por exemplo, copilotos de IA).
Por outro lado, fluxos de trabalho ou chamadas LLM sem estado são preferíveis quando:
- A lógica da tarefa é estática ou previsível , como o preenchimento de formulários ou a transformação de conteúdo.
- A baixa latência é crucial , por exemplo, em interações com o usuário.
- Minimizar custos é essencial , especialmente evitando chamadas recursivas ao LLM e orquestração complexa.
Leia mais
Aqui estão nossos benchmarks mais recentes sobre a infraestrutura comumente usada por sistemas agentes:
- Navegadores remotos : como a infraestrutura do navegador permite que os agentes interajam com a web de forma segura.
- Benchmark de navegadores MCP : Melhores servidores MCP para uso de ferramentas e acesso à web.
Exemplos de agentes de IA de código aberto
Algumas ferramentas descritas como " agentes de IA " não são, na verdade, tão " agentes" assim; esses sistemas ( por exemplo, o Devon PR-agent ) são, em grande parte, fluxos de trabalho de IA baseados em aprendizado por reforço, com modelos de aprendizagem baseados em lógica (LLMs) organizados por meio de caminhos de código predefinidos.
1. Frameworks de agentes (Monte o seu próprio)
Bibliotecas modulares e SDKs para desenvolvedores criarem agentes com controle sobre lógica, memória, ferramentas e orquestração.
✳️ Alguns agentes, como o SmolAgents e o Agno, se encaixam tanto em frameworks de agentes quanto em categorias de automação de fluxo de trabalho .
Estruturas gerais de agentes
Frameworks que se concentram na criação de agentes , oferecendo ferramentas flexíveis e personalizáveis para orquestrar fluxos de trabalho, configurações multiagentes e casos de uso de propósito geral.
- LangGraph – Orquestração de fluxo de trabalho LLM baseada em grafos – O LangGraph é um software proprietário, mas fornece uma biblioteca de código aberto para desenvolvimento de agentes. Ideal para pipelines RAG , gerenciamento de memória /estado de agentes e configurações multiagentes .
- AutoGen – Colaboração assíncrona multiagente – Projetado para coordenar agentes que utilizam ferramentas por meio de APIs semelhantes a chats. Ideal para automatizar fluxos de trabalho complexos, principalmente na geração autônoma de código .
- CrewAI – Framework multiagente sem código/com pouco código – Uma das ferramentas mais fáceis para começar, oferecendo modelos de agentes prontos para uso ( por exemplo, agente de preparação de reuniões ).
Estruturas de agentes especializados
Frameworks com foco especializado em tipos específicos de comportamentos de agentes ou integrações de agentes.
- Camel – Simulação de agentes baseada em funções – Otimizada para agentes colaborativos que interpretam papéis usando raciocínio estruturado . Ideal para automação de fluxo de trabalho e geração de dados sintéticos.
- Mastra – Desenvolvimento de agentes integrados ao frontend – Baseado em JavaScript , ideal para incorporar agentes em aplicações voltadas para o usuário .
- PydanticAI – Controle de agente mínimo e seguro em relação a tipos – Oferece validação rigorosa e caminhos lógicos transparentes com Pydantic .
- Inteligência Artificial em Cibersegurança (CAI) – Framework de agente de cibersegurança orientado por IA – Oferece testes de penetração , descoberta de vulnerabilidades e simulação de ataques cibernéticos (red teaming) com recursos de interação humana, aproveitando grandes modelos de linguagem e integrações com ferramentas como o Nmap.
- Agentes Atômicos – Construtor de agentes personalizados granulares com abordagem de esquema – Projetado para estrutura de agentes granular e lógica composta .
- SmolAgents – SDK de agentes leve para desenvolvedores – Abstração mínima , lógica de roteamento via Python em vez de JSON.
Tempos de execução de agentes (agentes autônomos pré-construídos)
Agentes pré-construídos e independentes que você pode executar imediatamente (como um aplicativo). Normalmente, oferecem suporte à execução autônoma de tarefas a partir de objetivos em linguagem natural.
Totalmente autônomo:
- Auto-GPT – Decomposição de objetivos e execução autônoma – Divide objetivos em subtarefas e as executa usando ferramentas, memória e raciocínio. Oferece agentes pré-construídos e uma interface de baixo código.
- AIlice – Execução local de tarefas de propósito geral – Executa tarefas complexas no dispositivo, suporta ferramentas locais e manipulação de arquivos. Tem como objetivo criar um assistente de IA, semelhante ao JARVIS, baseado no LLM de código aberto.
- Manus AI – Operações em sandbox de propósito geral . Executa ferramentas e fluxos de trabalho em um ambiente seguro, capaz de lidar com operações de múltiplos domínios e etapas de forma autônoma. Foi adquirida pela Meta, integrando-se ao ecossistema “Personal Ambient Meta”. 5
Parcialmente autônomo:
- BabyAGI – Executor de loop de tarefas iterativas – Cria, prioriza e executa listas de tarefas em um ciclo de feedback. Ideal para experimentos de geração de tarefas.
Baseado em navegador/interface:
- AgentGPT – Agente autônomo implantado via navegador – Permite que os usuários criem e executem agentes de tarefas por meio de uma interface web. Leve, ideal para experimentação.
- OpenManus – Agente de navegador persistente – Projetado para fluxos de trabalho que abrangem várias sessões em ambientes de navegador. Utiliza ferramentas como o Playwright para automatizar interações na web. Ideal para uso em pipelines de automação existentes. A configuração é rápida com o Conda.
2. Automação e orquestração de fluxos de trabalho
Ferramentas que automatizam fluxos de trabalho e integram múltiplas plataformas ou serviços, frequentemente com a capacidade de integrar agentes de IA.
Automação e integração geral do fluxo de trabalho
Plataformas que conectam APIs, disparam eventos e automatizam tarefas, facilitando a criação e integração de fluxos de trabalho em diferentes sistemas.
- n8n – Automação visual de fluxos de trabalho e integração de APIs – Conecta aplicativos, gatilhos e fluxos de dados usando um editor de nós. Combina a criação visual sem código com JavaScript/Python personalizado e oferece suporte a mais de 400 integrações. Você pode hospedar e executar fluxos de trabalho de agentes de IA com o LangChain. Ideal para pessoas com conhecimento técnico.
- PlanExe – Ferramenta de planejamento LLM-para-Gantt/WBS – Planejador de IA semelhante à pesquisa aprofundada de OpenAI. Converte objetivos em linguagem natural em cronogramas estruturados usando o LlamaIndex.
- Agno ✳️ – Construtor de agentes e fluxos de trabalho amigável para desenvolvedores – Funciona tanto como uma ferramenta de automação de fluxos de trabalho (ajudando a automatizar tarefas e fluxos de trabalho) quanto como um construtor de agentes.
- SmolAgents ✳️ – SDK de agentes leve para desenvolvedores – O SmolAgents é flexível o suficiente para funcionar tanto como um SDK de agentes leve (para frameworks de agentes) quanto como uma ferramenta de fluxo de trabalho (pois se integra aos modelos do Hugging Face).
- Windmill – Plataforma de desenvolvimento de código aberto e mecanismo de fluxo de trabalho – Converte scripts em interfaces de usuário, APIs e tarefas cron; suporta Python, TypeScript, Go e outras linguagens.
- Activepieces – Plataforma de automação de código aberto – Construtor de fluxo de trabalho visual auto-hospedado para automatizar tarefas e integrar aplicativos com o mínimo de código. Suporta mais de 280 servidores MCP para executar tarefas de IA distribuídas e cadeias de agentes em escala.
- Huginn – Automação web e gerenciamento de agentes – Cria agentes para automatizar tarefas e monitoramento baseados na web.
- Node-RED – Desenvolvimento baseado em fluxos para IoT e dados em tempo real – Integra serviços e automatiza tarefas com um editor de fluxos baseado em navegador.
Orquestração de fluxo de trabalho multiagente
Estruturas projetadas para coordenar agentes que interagem em fluxos de trabalho estruturados e integrar sistemas multiagentes.
- HyperAgent – Orquestração completa do ciclo de vida do software por agentes – Os agentes trabalham em conjunto para planejar, codificar e verificar tarefas de engenharia.
- Supercog – agentivo – Orquestração modular com blocos lógicos reutilizáveis – Projetado para automação escalável, estruturada e baseada em equipe.
3. Automação e navegação na Web
Os agentes navegam autonomamente em sites e executam tarefas complexas, como preenchimento de formulários, extração de dados e automação de navegação na web.
Agentes web autônomos e copilotos
Agentes autônomos de propósito geral (compatíveis com a web) :
- AgenticSeek – Agente de navegação web totalmente autônomo – IA totalmente local e intuitiva. Especializado em extração de dados e preenchimento de formulários, automatizando tarefas na web.
- Agent-E – Agente de automação de navegador com reconhecimento de DOM – Concentra-se na interação com páginas da web analisando o DOM (Document Object Model), ideal para clicar em botões e preencher formulários.
- AutoWebGLM – Agente web baseado em LLM – Utiliza aprendizado por reforço e simplificação de HTML para melhor navegação em sites complexos.
Agentes de navegação web baseados em visão (multimodal) :
- Extensão Autogen WebSurfer – Agente web multimodal – Combina entrada de texto e visual (capturas de tela) para aprimorar a interação na web.
- Skyvern – Agente de IA com visão computacional – Automatiza fluxos de trabalho usando LLMs e visão computacional, lidando com elementos de texto e visuais.
- WebVoyager – Agente web com recursos visuais – Utiliza texto e capturas de tela para melhorar a navegação em sites com muitas imagens.
Para saber mais sobre automação e navegação web de código aberto, aqui está uma análise estruturada de algumas das principais ferramentas e agentes:
Ferramentas de automação e extração de dados da web
Web RPA com tecnologia LLM e extensões de navegador
Extratores e rastreadores web com IA
ferramentas de busca na web com IA
4. Codificação e desenvolvimento
Agentes de IA projetados para auxiliar em tarefas de programação, fornecendo suporte em tempo real para desenvolvedores por meio de sugestões de código, depuração e automação de tarefas.
Agentes de codificação baseados em CLI
- Codex C LI – Ferramenta de interação multimodo (sugerir, editar, executar) – Aprimora os fluxos de trabalho do desenvolvedor por meio da linha de comando, oferecendo sugestões e edições de código.
- OpenDevin – Assistente de programação de IA de código aberto – Auxilia em tarefas de programação, oferecendo sugestões de código para diversas linguagens. Observação: O OpenDevin foi recentemente renomeado para OpenHands para refletir sua missão mais ampla de "IA para todas as mãos". 6
- Aider – Assistente de programação em pares com IA – Integrado ao seu terminal para auxiliar na codificação, oferecendo recursos como autocompletar, depuração e automação de tarefas.
editores de código de IA
- Neovim – Editor de código com inteligência artificial integrada – Plugins com inteligência artificial que oferecem autocompletar código e refatoração.
- Visual Studio Code (VS Code) – Ferramenta de preenchimento automático de código e depuração com inteligência artificial – Oferece sugestões de código e preenchimento automático via GitHub Copilot, integrada a ambientes IDE para desenvolvedores.
- Cursor – Editor de código com IA integrada – Desenvolvido com preenchimento automático de código em tempo real com inteligência artificial.
Construtores de prompts para aplicativos ( Vibe coding )
Alternativas de código aberto v0 / adoráveis / Bolt:
- Dyad – Construtor de aplicativos de IA de código aberto – Ferramenta local e sem código para criar aplicativos orientados por IA com comandos em linguagem natural.
- vx.dev – Construtor de aplicativos de IA de código aberto – Uma ferramenta local, com pouco código, focada em transformar comandos em linguagem natural em aplicativos.
5. Segurança cibernética
Agentes de IA projetados para aprimorar as operações de segurança cibernética, incluindo tarefas como testes de penetração, descoberta de vulnerabilidades, simulação de ataques cibernéticos (red teaming) e detecção autônoma de ameaças.
- YAWNING TITAN – Simulação abstrata de cibersegurança baseada em grafos – Suporta o treinamento de agentes para operações cibernéticas autônomas com foco em ambientes baseados em grafos.
- bumpgen – Agente de gerenciamento de pacotes – Atualiza pacotes npm (gerenciador de pacotes do Node.js) automaticamente.
- Agentes LLM de cibersegurança – Tarefas de cibersegurança orientadas por LLM – Construídas sobre o AutoGen . Utilizadas em diversas aplicações de pesquisa para demonstrar a automação do ChatGPT EDR e CI/CD automatizado para engenharia de detecção .
6. Criação de conteúdo de vídeo com IA
Agentes de IA que auxiliam na geração, edição e aprimoramento de conteúdo visual e multimídia, incluindo arte , imagens e vídeos .
- Mochi – Geração de vídeo a partir de texto – Converte textos em vídeo, com foco na criação de vídeos curtos. Ideal para gerar vídeos rapidamente a partir de descrições textuais.
- CogVideo – Geração de vídeo a partir de texto – Converte instruções de texto em vídeo com alta fidelidade, permitindo a criação de vídeos a partir de imagens. Uma ferramenta mais avançada para geração de vídeos de alta qualidade a partir de texto ou imagens.
- Allegro – Geração de vídeo a partir de texto – Converte instruções de texto em vídeo com foco na criação de conteúdo criativo. Esta ferramenta enfatiza a síntese criativa de vídeo a partir de texto para produzir narrativas visuais únicas.
- DALL·E (versões de código aberto) – Geração de vídeo a partir de texto – Gera imagens a partir de descrições de texto, transformando instruções escritas em conteúdo visual detalhado e criativo.
7. Finanças
Agentes de IA que fornecem aprimoramento automatizado de aprendizado por reforço ou análise de dados financeiros em tempo real .
- FinRL – Aprendizado por reforço automatizado para negociação – Aprende e executa estratégias de negociação de forma autônoma com base em dados de mercado, adaptando-se a ambientes financeiros dinâmicos.
- Terminal OpenBB – Análise de dados financeiros – Fornece informações financeiras autônomas para negociação em tempo real, permitindo que profissionais de investimento tomem decisões de negociação informadas.
8. Assistência médica
Agentes de IA que auxiliam no diagnóstico médico, monitoramento de doenças e obtenção de informações sobre saúde, analisando dados de pacientes e relatórios médicos.
- HIA (Health Insights Agent) – Análise de relatórios médicos – Analisa relatórios médicos e fornece informações sobre saúde.
- Assistente de Saúde com IA – Diagnóstico e monitoramento de doenças – Diagnostica e monitora doenças usando dados do paciente.
9. Pesquisa
Agentes de IA que auxiliam na coleta de dados, revisões bibliográficas e testes de hipóteses, otimizando o processo de pesquisa.
- ChemCrow – Agente autônomo de pesquisa química – Integra LLMs com ferramentas de química para planejar e executar tarefas experimentais e computacionais complexas em análises químicas.
- Pesquisador GPT – Assistente de pesquisa geral autônomo – Realiza buscas online estruturadas, analisa conteúdo e compila relatórios de pesquisa detalhados com mínima intervenção do usuário.
10. Análise de dados
Agentes de IA que processam, analisam e interpretam dados para fornecer informações práticas e apoiar a tomada de decisões.
Financiar
- FinRobot – Agente de análise de dados financeiros – Automatiza a interpretação e a geração de relatórios de dados financeiros usando grandes modelos de linguagem.
Inteligência de negócios e consultas
- Wren AI – Agente de insights de negócios de texto para SQL – Converte perguntas em linguagem natural em consultas SQL para relatórios de negócios.
- Entaoai – Ferramenta de engenharia de dados assistida por GenAI – Oferece uma interface de chat para tarefas de consulta e transformação de dados.
- Vanna AI – Agente de linguagem natural para SQL – Gera consultas SQL com base em comandos do usuário para explorar conjuntos de dados estruturados.
mídias sociais
- Agente de Personalidade do Twitter – Agente de análise de mídias sociais – Analisa o histórico de tweets para inferir traços comportamentais e de personalidade.
11. Assistência pessoal
Agentes de IA que auxiliam no gerenciamento de tarefas, agendamento e organização pessoal, aumentando a produtividade e a gestão do tempo.
- VacAIgent (agente pré-construído do CrewAI) – Assistente de planejamento de viagens – Gera de forma autônoma itinerários de viagem completos usando Streamlit e LLMs.
- Inbox Zero – Assistente de e-mail – prioriza, classifica e resume mensagens usando processamento de linguagem natural e integração com o Gmail.
- Cal – Agente de agendamento de calendário – Automatiza a criação, o reagendamento e o resumo de reuniões por meio de interação baseada em LLM.
Construindo sistemas de agentes de IA
Muitas estruturas de IA são controladas por um único fornecedor ou repositórios públicos, mas são rigorosamente governadas.
Esses projetos frequentemente migram para modelos de núcleo aberto : o código base permanece gratuito, mas a orquestração multiagente, a observabilidade ou o controle granular podem ser restritos por meio de licenças comerciais. Em alguns ecossistemas "abertos", o uso em produção muitas vezes exige a aquisição de um backend fechado.
Fonte 7
Projetos de agentes de IA no mundo real
Com base em nossa experiência, aqui estão algumas aplicações de agentes de IA:
- Desenvolvimento de API
- Desenvolvimento de aplicativos
- Geração de sites com IA
- Captura de tela da execução do código
- Encomendar entregas
- Fazer uma reserva em um restaurante
- Projetando um quarto
Outros projetos independentes de agentes de IA:
Outros projetos de agentes de IA em termos de estrutura:
Leitura complementar
- Compare 20 ferramentas de segurança LLM e frameworks de código aberto
- Quais são os 10 principais riscos de segurança para um mestrado em Direito (LLM)?
Seja o primeiro a comentar
Seu endereço de e-mail não será publicado. Todos os campos são obrigatórios.