Todo el mundo ha estado creando agentes de IA, así que después de realizar pruebas prácticas con agentes de codificación de IA populares, los creadores de agentes de IA y las herramientas utilizan pruebas comparativas para evaluar sus capacidades en el mundo real , hemos elaborado una lista seleccionada de los más de 50 mejores agentes de IA de código abierto . Haz clic en los encabezados de las categorías para ir directamente a nuestra selección principal:
Desarrollo de agentes e infraestructura
- Marcos de agentes (Crea el tuyo propio)
- Herramientas de automatización y orquestación de flujos de trabajo
Aplicaciones de agentes específicas del dominio
- Agentes de automatización y navegación web
- Herramientas de codificación y desarrollo
- Herramientas de ciberseguridad
- creadores de contenido de vídeo con IA
- asistentes financieros
- auxiliares de atención médica
- Agentes de investigación
- asistentes de análisis de datos
- Asistentes personales
¿Cómo concebir los agentes de IA?
Un agente de IA es más que un simple modelo de lógica de negocio con instrucciones. Técnicamente, es un sistema componible que combina planificación, memoria, uso de herramientas y ejecución iterativa. Forma un bucle estructurado alrededor de un modelo de lógica de negocio que puede tomar decisiones, realizar acciones y adaptarse a nueva información.
Así es como se debe pensar en ellos:
- Autonomía y flujos de trabajo: Los agentes de IA abarcan desde la automatización básica de tareas basada en flujos de trabajo predefinidos hasta sistemas totalmente autónomos capaces de descomponer objetivos, gestionar la memoria e interactuar con herramientas. El principal desafío técnico reside en mantener el contexto entre las distintas etapas y coordinar operaciones multifase.
- Contexto y control : El verdadero desafío en los agentes de IA radica en garantizar que el LLM cuente con el contexto adecuado en cada paso. Esto incluye gestionar el contenido que se introduce en el LLM y asegurar que el agente ejecute las tareas pertinentes basándose en un contexto actualizado.
- Integración de herramientas : Para crear agentes eficaces, es necesaria una integración perfecta con herramientas externas, API y fuentes de datos. Plataformas como LangChain pueden ayudar a integrar estos recursos externos, pero el control del flujo de trabajo es fundamental para adaptar el comportamiento del agente a nuevas entradas.
- Ventajas de los marcos de trabajo para agentes : Todos los sistemas basados en agentes, ya sean flujos de trabajo sencillos o agentes autónomos complejos, pueden beneficiarse de las funcionalidades principales que ofrecen estos marcos de trabajo . Estas funcionalidades pueden crearse desde cero o aprovecharse de una plataforma de código abierto existente, según sus necesidades.
Nuevos estándares
- Protocolo de contexto de modelo (MCP): El estándar de la industria para la comunicación entre agentes y fuentes de datos externas. LangGraph integra MCP para permitir que los agentes se conecten fácilmente con bases de datos y herramientas locales sin necesidad de adaptadores personalizados.
- Stripe Agentic Commerce Protocol (ACP): Este es el primer estándar industrial en funcionamiento que permite a los agentes de IA gestionar pagos, inventario y envíos de forma segura. Permite el "pago con agente", donde el agente puede completar una compra para el usuario dentro de una interfaz de chat.
¿Qué es exactamente un agente de IA?
No existe una definición consensuada de lo que constituye un “agente de IA”.
- La IA tradicional define a los agentes como sistemas que interactúan con su entorno.
- La encuesta realizada por Simon Willison entre profesionales del sector presenta diversas definiciones operativas aportadas por los participantes de la industria. 2
- La definición de Anthropic describe los principios de diseño para construir agentes de IA eficaces y alineados. 3
- Las principales empresas de consultoría destacan el papel de los agentes en la automatización de los flujos de trabajo empresariales y la toma de decisiones. 4 .
Muchos de ellos incluyen explícitamente flujos de trabajo y sitúan la autonomía en el extremo de un espectro.
Estamos de acuerdo con estos puntos de vista, por lo tanto, no proporcionamos una definición estricta. En cambio, enumeramos los factores que causan un sistema de IA. ser considerado más agente :
- Entorno y objetivos:
- Los sistemas de IA en entornos complejos, como aquellos con múltiples tareas y cambios inesperados, son agentes activos.
- Los sistemas de IA que persiguen objetivos sin recibir instrucciones son agentes.
- Interfaz de usuario y supervisión: Los sistemas de IA que pueden aprender lenguajes naturales y los sistemas que necesitan menos supervisión del usuario son agentes.
- Diseño de sistemas: Los sistemas que utilizan patrones de diseño como el uso de herramientas (por ejemplo, búsqueda web, programación) o la planificación (por ejemplo, reflexión, desglose de subobjetivos) son agentes.
Para una explicación más detallada, anteriormente enumeramos estos factores y analizamos cómo definen los sistemas de IA con capacidad de gestión de agentes .
¿Son estos agentes totalmente autónomos?
Todavía no. La mayoría de los agentes de IA de código abierto mejoran la autonomía de la gestión del lenguaje natural al permitir el uso de herramientas, la toma de decisiones y la resolución de problemas, pero aún requieren entradas estructuradas y la intervención humana.
Ejemplos como Devon y PR-Agent siguen lógica predefinida o flujos de trabajo de aprendizaje por refuerzo en lugar de demostrar un comportamiento completamente autónomo. Otros agentes de IA aún carecen de capacidades de aprendizaje autónomo y generalización.
Cuándo (y cuándo no) usar agentes de IA
No todas las aplicaciones LLM requieren complejidad de agente. Muchos casos de uso se satisfacen mejor con la generación aumentada de recuperación (RAG) ligera.
Los sistemas basados en agentes introducen una sobrecarga arquitectónica: gestión de memoria, orquestación de herramientas, manejo de errores y bucles de control que aumentan la latencia y el costo. Por ejemplo, en nuestras pruebas comparativas, observamos que las tasas de éxito de los agentes de IA disminuyeron después de 35 minutos de interacción humana.
Para mitigar estos riesgos, es fundamental probar los sistemas basados en agentes en entornos controlados e implementar medidas de seguridad sólidas antes de su despliegue.
Los agentes son más valiosos cuando los pasos no se pueden predecir fácilmente o están predefinidos. Son especialmente adecuados para situaciones en las que:
- Las tareas son dinámicas y constan de varios pasos , con lógica ramificada o subobjetivos poco claros.
- El uso de las herramientas es condicional o adaptativo , lo que requiere que el sistema elija qué herramienta invocar en función de la entrada o del estado previo.
- Se requiere memoria a largo plazo o contexto , a lo largo de las sesiones o etapas de ejecución.
- La ejecución debe responder a la retroalimentación del entorno , como los resultados de la API, los resultados de las búsquedas o las acciones fallidas.
- Es necesaria la colaboración con intervención humana , donde la autonomía y la supervisión deben combinarse (por ejemplo, mediante copilotos de IA).
Por otro lado, los flujos de trabajo o las llamadas LLM sin estado son preferibles cuando:
- La lógica de la tarea es estática o predecible , como por ejemplo el llenado de formularios o la transformación de contenido.
- La baja latencia es fundamental , por ejemplo, en las interacciones con el usuario.
- Minimizar los costes es fundamental , especialmente evitando las llamadas recursivas a LLM y la orquestación compleja.
Leer más
Aquí están nuestros últimos datos comparativos sobre la infraestructura comúnmente utilizada por los sistemas agenciales:
- Navegadores remotos : Cómo la infraestructura del navegador permite a los agentes interactuar con la web de forma segura.
- Comparativa de navegadores MCP : Los mejores servidores MCP para el uso de herramientas y el acceso web.
Ejemplos de agentes de IA de código abierto
Algunas herramientas descritas como " agentes de IA " en realidad no son tan " agentes" ; estos sistemas ( por ejemplo, Devon PR-agent ) son en gran medida flujos de trabajo de IA basados en aprendizaje por refuerzo, con modelos de lógica descriptiva organizados a través de rutas de código predefinidas.
1. Marcos de agentes (Crea el tuyo propio)
Bibliotecas modulares y SDK para que los desarrolladores creen agentes con control sobre la lógica, la memoria, las herramientas y la orquestación.
✳️ Algunos agentes, como SmolAgents y Agno, encajan tanto en las categorías de marcos de agentes como en las de automatización de flujos de trabajo .
Marcos de agentes generales
Marcos de trabajo centrados en la creación de agentes , que ofrecen herramientas flexibles y personalizables para la orquestación de flujos de trabajo, configuraciones multiagente y casos de uso de propósito general.
- LangGraph – Orquestación de flujos de trabajo LLM basados en grafos – LangGraph es un software propietario, pero proporciona una biblioteca de código abierto para el desarrollo de agentes. Ideal para pipelines RAG , gestión de memoria /estado de agentes y configuraciones multiagente .
- AutoGen – Colaboración asíncrona entre múltiples agentes – Diseñado para coordinar agentes que utilizan herramientas a través de API tipo chat. Ideal para automatizar flujos de trabajo complejos, especialmente en la generación autónoma de código .
- CrewAI : marco multiagente sin código/con poco código : una de las herramientas más fáciles para empezar, que ofrece plantillas de agentes predefinidas ( por ejemplo, agente de preparación de reuniones ).
Marcos de agentes especializados
Marcos de trabajo con un enfoque especializado en tipos específicos de comportamientos de agentes o integraciones de agentes.
- Camel – Simulación de agentes basada en roles – Optimizada para agentes colaborativos que interpretan roles mediante razonamiento estructurado . Ideal para la automatización de flujos de trabajo y la generación de datos sintéticos.
- Mastra – Desarrollo de agentes integrados en el frontend – Basado en JavaScript , ideal para integrar agentes en aplicaciones orientadas al usuario .
- PydanticAI – Control mínimo de agentes con tipado seguro – Proporciona validación estricta y rutas lógicas transparentes con Pydantic .
- IA de ciberseguridad (CAI) : marco de agente de ciberseguridad impulsado por IA : proporciona pruebas de penetración , descubrimiento de vulnerabilidades y ejercicios de simulación de ataques (red teaming) con capacidades de intervención humana, aprovechando grandes modelos de lenguaje e integraciones con herramientas como Nmap.
- Atomic Agents – Creador de agentes personalizados granulares basado en esquemas – Diseñado para una estructura de agente granular y lógica componible .
- SmolAgents : SDK de agentes ligero para desarrolladores : abstracción mínima , lógica de rutas mediante Python en lugar de JSON.
Entornos de ejecución de agentes (agentes autónomos preconfigurados)
Agentes preconfigurados e independientes que puedes ejecutar inmediatamente (como una aplicación). Normalmente, admiten la ejecución autónoma de tareas a partir de objetivos definidos en lenguaje natural.
Totalmente autónomo:
- Auto-GPT – Descomposición de objetivos y ejecución autónoma – Divide los objetivos en subtareas y las completa utilizando herramientas, memoria y razonamiento. Ofrece agentes predefinidos y una interfaz de bajo código.
- AIlice – Ejecución de tareas locales de propósito general – Ejecuta tareas complejas en el dispositivo, admite herramientas locales y manipulación de archivos. Su objetivo es crear un asistente de IA, similar a JARVIS, basado en el lenguaje de programación de código abierto LLM.
- Manus AI – Operaciones aisladas de propósito general . Ejecuta herramientas y flujos de trabajo en un entorno aislado seguro, capaz de gestionar operaciones multidominio y multietapa de forma autónoma. Ha sido adquirida por Meta, integrándose en el ecosistema “Personal Ambient Intelligence” de Meta. 5
Parcialmente autónomo:
- BabyAGI – Ejecutor de bucles de tareas iterativos – Crea, prioriza y ejecuta listas de tareas en un ciclo de retroalimentación. Ideal para experimentos de generación de tareas.
Basado en navegador/interfaz:
- AgentGPT – Agente autónomo implementado en navegador – Permite a los usuarios crear y ejecutar agentes de tareas a través de una interfaz web. Ligero, ideal para experimentar.
- OpenManus – Agente persistente para navegador – Diseñado para flujos de trabajo que abarcan varias sesiones en entornos de navegador. Utiliza herramientas como Playwright para automatizar las interacciones web. Ideal para integrarse en flujos de automatización existentes. Su configuración es rápida con Conda.
2. Automatización y orquestación de flujos de trabajo
Herramientas que automatizan flujos de trabajo e integran múltiples plataformas o servicios, a menudo con la capacidad de integrar agentes de IA.
Automatización e integración general del flujo de trabajo
Plataformas que conectan API, activan eventos y automatizan tareas, lo que facilita la creación e integración de flujos de trabajo en diferentes sistemas.
- n8n – Automatización visual de flujos de trabajo e integración de API – Conecta aplicaciones, activadores y flujos de datos mediante un editor de nodos. Combina la creación visual sin código con JavaScript/Python personalizado y admite más de 400 integraciones. Puedes alojarlo tú mismo y ejecutar flujos de trabajo de agentes de IA con LangChain. Ideal para profesionales técnicos.
- PlanExe – Herramienta de planificación LLM a Gantt/WBS – Planificador de IA similar a la profunda investigación de OpenAI. Convierte objetivos en lenguaje natural en cronogramas estructurados mediante LlamaIndex.
- Agno ✳️ – Creador de agentes y flujos de trabajo fáciles de usar para desarrolladores – Funciona tanto como herramienta de automatización de flujos de trabajo (ayudando a automatizar tareas y flujos de trabajo) como creador de agentes.
- SmolAgents ✳️ – SDK de agente ligero para desarrolladores – SmolAgents es lo suficientemente flexible como para funcionar tanto como un SDK de agente ligero (para marcos de agentes) como una herramienta de flujo de trabajo (ya que se integra con los modelos de Hugging Face).
- Windmill : plataforma de desarrollo y motor de flujo de trabajo de código abierto . Convierte scripts en interfaces de usuario, API y tareas programadas (cron jobs); es compatible con Python, TypeScript, Go y otros lenguajes.
- Activepieces : plataforma de automatización de código abierto . Creador de flujos de trabajo visuales autohospedados para automatizar tareas e integrar aplicaciones con un mínimo de programación. Admite más de 280 servidores MCP para ejecutar tareas de IA distribuidas y cadenas de agentes a gran escala.
- Huginn – Automatización web y gestión de agentes – Crea agentes para automatizar tareas basadas en la web y realizar tareas de monitorización.
- Node-RED : desarrollo basado en flujos para IoT y datos en tiempo real ; integra servicios y automatiza tareas con un editor de flujos basado en navegador.
Orquestación de flujos de trabajo multiagente
Marcos de trabajo diseñados para coordinar agentes que interactúan entre sí a través de flujos de trabajo estructurados e integrar sistemas multiagente.
- HyperAgent : orquestación de agentes para todo el ciclo de vida del software : los agentes trabajan juntos para planificar, codificar y verificar las tareas de ingeniería.
- Supercog – agentic – Orquestación modular con bloques lógicos reutilizables – Diseñado para la automatización escalable, estructurada y basada en equipos.
3. Automatización y navegación web
Los agentes navegan de forma autónoma por los sitios web y realizan tareas de varios pasos, como rellenar formularios, extraer datos y automatizar la navegación web.
Agentes web autónomos y copilotos
Agentes autónomos de propósito general (con capacidad web) :
- AgenticSeek – Agente de navegación web totalmente autónomo – Totalmente local. Desarrollado por Manus AI. Especializado en extracción de datos y llenado de formularios, automatizando tareas web.
- Agent-E : agente de automatización de navegador compatible con el DOM. Se centra en la interacción con páginas web mediante el análisis del DOM (Modelo de Objetos del Documento), ideal para hacer clic en botones y rellenar formularios.
- AutoWebGLM , un agente web basado en LLM , utiliza aprendizaje por refuerzo y simplificación de HTML para una mejor navegación en sitios web complejos.
Agentes de navegación web basados en visión (multimodales) :
- Extensión Autogen WebSurfer – Agente web multimodal – Combina texto y entrada visual (capturas de pantalla) para mejorar la interacción web.
- Skyvern , un agente de IA con visión artificial , automatiza flujos de trabajo mediante modelos lógicos y visión artificial, gestionando tanto texto como elementos visuales.
- WebVoyager – Agente web con capacidad de visión – Utiliza texto y capturas de pantalla para mejorar la navegación en sitios web con gran cantidad de imágenes.
Para obtener más información sobre la automatización y la navegación web de código abierto, aquí tiene una visión estructurada de algunas de las principales herramientas y agentes:
Agentes de uso de computadoras
Herramientas de automatización web y extracción de datos
RPA web y extensiones de navegador con tecnología LLM
Rastreadores y extractores web de IA
Herramientas de búsqueda web basadas en IA
4. Codificación y desarrollo
Agentes de IA diseñados para ayudar con las tareas de codificación, proporcionando soporte en tiempo real a los desarrolladores mediante sugerencias de código, depuración y automatización de tareas.
Agentes de codificación basados en CLI
- Codex C LI – Herramienta de interacción multimodo (sugerir, editar, ejecutar) – Mejora los flujos de trabajo de los desarrolladores a través de la línea de comandos al ofrecer sugerencias y ediciones de código.
- OpenDevin – Asistente de codificación con IA de código abierto : ayuda con las tareas de programación y ofrece sugerencias de código para diversos lenguajes. Nota: OpenDevin cambió recientemente su nombre a OpenHands para reflejar su misión más amplia de "IA para todos". 6
- Aider – Asistente de programación en pareja con IA – Integrado en tu terminal para ayudarte a programar, con soporte para autocompletado, depuración y automatización de tareas.
editores de código de IA
- Neovim : editor de código con IA integrada ; complementos con IA que ofrecen autocompletado de código y refactorización.
- Visual Studio Code (VS Code) , una herramienta de depuración y autocompletado de código con inteligencia artificial , ofrece sugerencias de código y autocompletado a través de GitHub Copilot, integrado con entornos IDE para desarrolladores.
- Cursor – Editor de código con IA integrada – Diseñado con autocompletado de código en tiempo real mediante IA.
Creadores de aplicaciones a partir de indicaciones ( codificación Vibe )
Alternativas de código abierto v0 / lovable / Bolt:
- Dyad – Creador de aplicaciones de IA de código abierto – Herramienta local sin código para crear aplicaciones basadas en IA con comandos en lenguaje natural.
- vx.dev – Creador de aplicaciones de IA de código abierto – Una herramienta de bajo código, diseñada para funcionar localmente, centrada en transformar indicaciones en lenguaje natural en aplicaciones.
5. Ciberseguridad
Agentes de IA diseñados para mejorar las operaciones de ciberseguridad, incluyendo tareas como pruebas de penetración, descubrimiento de vulnerabilidades, simulacros de ataques (red teaming) y detección autónoma de amenazas.
- TITÁN JATÓN : simulación abstracta de ciberseguridad basada en grafos que permite entrenar a agentes para operaciones cibernéticas autónomas, centrándose en entornos basados en grafos.
- bumpgen – Agente de gestión de paquetes – Actualiza automáticamente los paquetes npm (gestor de paquetes de Node.js).
- Agentes LLM de ciberseguridad : tareas de ciberseguridad basadas en LLM , construidas sobre AutoGen . Se utilizan en diversas aplicaciones de investigación para demostrar la automatización de ChatGPT EDR y la CI/CD automatizada para la ingeniería de detección .
6. Creación de contenido de vídeo con IA
Agentes de IA que ayudan a generar, editar y mejorar contenido visual y multimedia, incluyendo arte , imágenes y vídeos .
- Mochi – Generación de vídeo a partir de texto – Convierte textos en vídeos, centrándose en la creación de vídeos cortos. Ideal para generar vídeos rápidamente a partir de descripciones textuales.
- CogVideo – Generación de vídeo a partir de texto – Convierte textos en vídeos de alta fidelidad, permitiendo la creación de vídeos a partir de imágenes. Una herramienta avanzada para la generación de vídeo de alta calidad a partir de texto o imágenes.
- Allegro – Generación de texto a vídeo – Convierte textos en vídeos, centrándose en la creación de contenido creativo. Esta herramienta prioriza la síntesis creativa de vídeo a partir de texto para producir narrativas visuales únicas.
- DALL·E (versiones de código abierto) : Generación de texto a vídeo : Genera imágenes a partir de descripciones de texto, convirtiendo indicaciones escritas en contenido visual detallado y creativo.
7. Finanzas
Agentes de IA que proporcionan mejora automatizada del aprendizaje por refuerzo o análisis de datos financieros en tiempo real .
- FinRL – Aprendizaje por refuerzo automatizado para el trading – Aprende y ejecuta de forma autónoma estrategias de trading basadas en datos de mercado, adaptándose a entornos financieros dinámicos.
- Terminal OpenBB – Análisis de datos financieros – Proporciona información financiera autónoma para operar en tiempo real, lo que permite a los profesionales de la inversión tomar decisiones de inversión informadas.
8. Atención médica
Agentes de inteligencia artificial que ayudan en el diagnóstico médico, el seguimiento de enfermedades y la obtención de información sobre la salud mediante el análisis de datos de pacientes e informes médicos.
- HIA (Health Insights Agent) – Análisis de informes médicos – Analiza informes médicos y proporciona información relevante sobre la salud.
- Asistente de IA para la atención médica : diagnóstico y seguimiento de enfermedades : diagnostica y realiza un seguimiento de las enfermedades utilizando datos del paciente.
9. Investigación
Agentes de inteligencia artificial que ayudan en la recopilación de datos, las revisiones bibliográficas y la comprobación de hipótesis, agilizando así el proceso de investigación.
- ChemCrow , un agente autónomo de investigación química , integra modelos de lenguaje natural con herramientas químicas para planificar y ejecutar tareas experimentales y computacionales complejas en el análisis químico.
- Investigador GPT : asistente de investigación general autónomo que realiza búsquedas estructuradas en línea, analiza el contenido y elabora informes de investigación detallados con una mínima intervención del usuario.
10. Análisis de datos
Agentes de IA que procesan, analizan e interpretan datos para proporcionar información útil y apoyar la toma de decisiones.
Finanzas
- FinRobot – Agente de análisis de datos financieros – Automatiza la interpretación y la elaboración de informes de datos financieros mediante el uso de grandes modelos de lenguaje.
Inteligencia empresarial y consultas
- Wren AI – Agente de análisis empresarial de texto a SQL – Convierte preguntas en lenguaje natural en consultas SQL para la elaboración de informes empresariales.
- Entaoai , una herramienta de ingeniería de datos asistida por GenAI , proporciona una interfaz de chat para tareas de consulta y transformación de datos.
- Vanna AI – Agente de lenguaje natural a SQL – Genera consultas SQL basadas en las indicaciones del usuario para explorar conjuntos de datos estructurados.
redes sociales
- Agente de personalidad de Twitter : agente de análisis de redes sociales que analiza el historial de tweets para inferir rasgos de comportamiento y personalidad.
11. Asistencia personal
Agentes de IA que ayudan con la gestión de tareas, la planificación y la organización personal, mejorando la productividad y la gestión del tiempo.
- VacAIgent (agente CrewAI preconfigurado): asistente de planificación de viajes ; genera de forma autónoma itinerarios de viaje completos utilizando Streamlit y LLM.
- Inbox Zero , el asistente de correo electrónico , prioriza, clasifica y resume los mensajes mediante el procesamiento del lenguaje natural y la integración con Gmail.
- Cal – Agente de programación de calendario – Automatiza la creación, reprogramación y resumen de reuniones mediante interacción basada en LLM.
Creación de sistemas de agentes de IA
Muchos marcos de trabajo de IA están controlados por un único proveedor o repositorios públicos, pero están estrictamente regulados.
Estos proyectos suelen orientarse hacia modelos de código abierto : el código base sigue siendo gratuito, pero la orquestación multiagente, la observabilidad o el control detallado pueden estar sujetos a licencias comerciales. En algunos ecosistemas “abiertos”, el uso en producción a menudo requiere la adquisición de un sistema backend bloqueado.
Fuente 7
Proyectos de agentes de IA del mundo real
Según nuestra experiencia, estas son algunas aplicaciones de agentes de IA:
- desarrollo de API
- Desarrollo de aplicaciones
- Generación de sitios web mediante IA
- Captura de pantalla de la ejecución del código
- Realizar pedidos de entrega
- Hacer una reserva en un restaurante
- Diseñar una habitación
Otros proyectos de agentes de IA independientes:
Otros proyectos de agentes de IA basados en marcos de trabajo:
Lecturas adicionales
- Comparación de 20 herramientas de seguridad y marcos de código abierto para másteres en derecho (LLM).
- ¿Cuáles son los 10 principales riesgos de seguridad en los programas de LLM?
Sé el primero en comentar
Tu dirección de correo electrónico no será publicada. Todos los campos son obligatorios.