Los agentes de IA generativa autónoma ejecutan tareas complejas con poca o ninguna supervisión humana. La IA agente se diferencia de los chatbots y los copilotos.
A diferencia de la IA tradicional, en particular la IA generativa , que a menudo requiere intervención humana en flujos de trabajo complejos, la IA con agentes busca navegar y optimizar procesos de forma autónoma gracias a sus capacidades de toma de decisiones y su comportamiento orientado a objetivos. Los agentes de IA sirven como:
- Desarrolladores
- Asistentes de operaciones de seguridad
- Personajes de videojuegos con apariencia humana
- creadores de contenido
- Asistentes de seguros
- Asistentes de recursos humanos (RRHH)
- asistentes de atención al cliente
- asistentes de investigación
- Usuarios de computadoras
- creadores de agentes de IA
Agentes de IA como desarrolladores
1. Aplicaciones de construcción
Los editores de código de IA como Cursor AI Editor, Windsurf Editor y Replit tienen como objetivo crear e implementar aplicaciones ( por ejemplo, una aplicación de lista de tareas pendientes ) mediante:
- Seleccionar las herramientas adecuadas para cada tarea, como Flask para las API o React para el desarrollo frontend.
- Generación de código en el lenguaje elegido (por ejemplo, Python, JavaScript) a partir de indicaciones sencillas.
- Automatización de flujos de trabajo con integraciones como GitHub Actions para pruebas e implementación.
Ejemplo de la vida real:
Un desarrollador utilizó el operador de OpenAI y el agente de IA de Replit para crear una aplicación completa en 90 minutos . Los dos agentes intercambiaron credenciales de forma autónoma y realizaron pruebas.
Ejemplo de la vida real:
El modo agente Composer de Cursor tiene como objetivo generar un juego completo de Tres en Raya a partir de una sola instrucción: "Genera un juego de Tres en Raya para 2 jugadores en HTML, CSS y JavaScript".
El cursor es capaz de codificar en varios archivos, ejecutar comandos y determinar automáticamente el contexto que necesita (sin necesidad de añadir archivos).
Leer más
Si estás explorando la infraestructura que impulsa los sistemas de IA con agentes, te recomendamos que consultes nuestros últimos puntos de referencia:
- Navegadores remotos : Cómo la infraestructura del navegador permite a los agentes interactuar con la web de forma segura.
- Comparativa de MCP : Los mejores servidores MCP para el uso de herramientas y el acceso web.
2. Crea tu propia API con programación de IA.
Los editores de código con IA automatizan la creación de API transformando las especificaciones en código funcional. Así es como suele funcionar el proceso:
- Integrar el resultado en el entorno del desarrollador para realizar pruebas, controlar las versiones y desplegar el software.
- Ingesta de especificaciones de API (por ejemplo, archivos OpenAPI/Swagger).
- Generación de código de backend basado en los puntos finales, métodos y esquemas documentados.
Ejemplo de la vida real:
Flujos de trabajo de API sin código para agentes de IA con n8n .
Aquí se muestra una abstracción de alto nivel de un flujo de trabajo de API :
3. Edición de código en lenguaje natural
Puedes seleccionar fragmentos de código y emitir comandos en inglés sencillo como por ejemplo:
“Duplica el tamaño del tablero. Hazlo verde, como un Apple IIe.” (Ver ejemplo real a continuación).
Ejemplo de la vida real:
Los agentes de codificación como Cursor identifican la intención, modifican el código relevante en todos los archivos y aplican los cambios.
4. Creación de sitios web
Los creadores de sitios web con IA como v0 de Vercel , Bolt , Lovable y CerebrasCoder tienen como objetivo crear plataformas complejas como sitios web de aprendizaje electrónico, generando páginas clave como:
- Páginas de inicio
- Páginas de listado de cursos
- Paneles de control personalizados para estudiantes
De manera similar, los editores de código de IA como Replit crean sitios web y aprovechan las API. 4
Ejemplo de la vida real :
Cómo crear un agente de IA para un sitio web:
Este es el flujo de trabajo de automatización:
5. Generación de un panel de control de CRM
Los agentes son capaces de generar la interfaz de usuario , configurar la lógica del servidor y establecer interacciones con la base de datos .
Ejemplo de la vida real:
Roo Code utiliza el modelo DeepSeek para construir de forma autónoma paneles CRM completos.
6. Codificación recursiva y modernización de código heredado
Si bien la codificación básica suele ser una tarea de los LLM, los flujos de trabajo de codificación recursiva, donde un agente mejora/amplía iterativamente el código a través de múltiples capas, son inherentemente propios de un agente .
Los agentes reescriben de forma autónoma grandes bloques de código, aplican cambios de configuración y prueban los resultados en ciclos hasta que se alcanza un objetivo.
Ejemplos de la vida real:
GT Edge AI convierte el código COBOL antiguo a Java moderno. 7
Persistent proporciona un marco multiagente utilizado para migrar de forma autónoma código COBOL a Java, y funciona de la siguiente manera: 8
7. Refactorización de código
Mediante el uso de codificación recursiva, los agentes de IA mejoran continuamente el diseño del código sin cambiar su funcionamiento, lo que facilita su comprensión y mantenimiento.
Ejemplo de la vida real:
Los desarrolladores de una startup tecnológica crearon un agente que refactoriza tu código en más de 25 lenguajes de programación. 9
8. Generar sugerencias de código en su IDE
Las herramientas como GitHub Copilot proporcionan sugerencias de código y autocompletado en tiempo real, y reducen la probabilidad de errores de sintaxis.
9. Monitoreo y optimización del pipeline de CI/CD
Los agentes de IA gestionan la infraestructura en entornos nativos de la nube como Kubernetes. Estos agentes DevOps tienen como objetivo:
- Identificar controladores de entrada en ejecución u otras cargas de trabajo.
- Identificar pods en ejecución
- Interpretar comandos de alto nivel como “apagar el pod de NGINX”.
Ejemplo de la vida real:
Cuando se conecta a Kubernetes mediante herramientas o wrappers, Claude puede actuar como un agente DevOps para consultar el estado del clúster. "Comprueba si tengo algún pod en ejecución" .
Agentes de IA como asistentes de operaciones de seguridad
10. Inteligencia sobre amenazas
Los agentes recopilan y correlacionan las tácticas, técnicas y procedimientos (TTP) de los actores de amenazas a partir de fuentes abiertas y propietarias, e integran los hallazgos en los flujos de trabajo de detección.
Ejemplo de la vida real:
El Security Copilot de Microsoft incluye un agente especializado de información sobre amenazas Intelligence Briefing Agent que recopila, filtra y resume dinámicamente la inteligencia sobre amenazas.
11. Detección y clasificación
Estas acciones se producen en la fase inicial de recepción de la señal para reducir el ruido y organizar los datos de alerta antes de un análisis más profundo.
- Eliminación de duplicados de alertas : Elimina eventos idénticos o casi idénticos de múltiples fuentes para reducir el ruido.
- Supresión de falsos positivos : Suprime las alertas benignas recurrentes utilizando patrones de resolución anteriores.
- Agrupación/clusterización de alertas : Agrupa las alertas relacionadas (mismo usuario, host o táctica) en un único incidente.
Ejemplo de la vida real:
Charlotte AI realiza detección y clasificación autónomas. por:
- Identificación de comportamientos maliciosos basándose en tácticas, técnicas y procedimientos conocidos.
- Comparación de patrones de ejecución y rutas de archivo.
- Proporcionar una explicación del veredicto comprensible para el ser humano.
12. Enriquecimiento contextual y atribución de amenazas
Este paso, que se realiza tras la evaluación inicial , aporta profundidad y contexto a las alertas.
Los sistemas automatizados de atribución de atacantes procesan flujos de información sobre amenazas cibernéticas (CTI), extraen características de comportamiento y temporales, y calculan puntuaciones de similitud entre incidentes. Los algoritmos de agrupamiento luego asocian las intrusiones con actores de amenazas conocidos (por ejemplo, APT41 , Mozi o Lazarus ) basándose en la superposición de patrones.
Ejemplo de la vida real:
Google Los agentes de IA Chronicle + Mandiant + Gemini ingieren de forma autónoma telemetría y fuentes CTI , enriquecen las alertas con contexto IOC (por ejemplo, reputación de IP, hashes de malware) y cotejan patrones de comportamiento con tácticas conocidas de actores de amenazas del marco MITRE ATT&CK.
En esta configuración de agentes:
- Detección: Un agente de IA detecta el movimiento lateral utilizando cuentas de servicio .
- Enriquecimiento: Enriquece automáticamente la alerta con datos de los registros de Chronicle , el inventario de activos y la inteligencia sobre amenazas de Mandiant .
- Atribución: Un segundo agente agrupa esta actividad con cadenas de intrusión históricas atribuidas a un grupo conocido (por ejemplo, APT41 ).
13. Escalada y traspaso
- Traducción/simplificación de alertas : Convierte las alertas técnicas en resúmenes fáciles de entender para los analistas.
- Gestión automática de incidencias y asignación de analistas : Crea incidencias y las dirige al nivel o equipo adecuado.
14. Acciones de respuesta proactiva
En SecOps, los agentes aíslan los puntos finales, deshabilitan cuentas o eliminan procesos maliciosos. Estos sistemas tienen como objetivo:
- Consultar registros automáticamente mediante lenguaje natural o activadores contextuales.
- Ejecutar manuales de procedimientos automatizados para investigaciones y escalamiento.
- Adaptar los flujos de trabajo en tiempo real en función de nuevas evidencias o de una lógica modificada.
- Generar infraestructura como código (por ejemplo, Terraform, Pulumi) para la remediación.
- Elabora y modifica reglas de detección basándose en los resultados de la investigación.
Ejemplo de la vida real:
Google desarrolló el agente SOC Manager , que aprovecha múltiples subagentes para ejecutar un plan estructurado de respuesta a incidentes para la detección de malware. 16
Estructura del proyecto Agentic:
En el paso final del plan de respuesta a incidentes (Paso 5: Finalización), los IOC (Indicadores de Compromiso) fueron bloqueados de forma proactiva por el agente del SOC Manager mediante la ejecución de un manual de contención automatizado (véase más abajo).
Fuente:
Seguridad en la nube de Mandiant & Google 17
15. Búsqueda de amenazas
Los agentes que participan en la búsqueda de amenazas tienen como objetivo:
- Escanee continuamente en busca de anomalías en los registros de identidad, red y nube.
- Automatice las búsquedas repetitivas, como las consultas de IOC o la detección de patrones.
- Detectar amenazas desconocidas comparando el comportamiento con los valores de referencia históricos y la actividad de pares.
Ejemplo de la vida real:
Los investigadores desarrollaron un sistema MITRE ATT&CK Driven Threat Hunting Automated by Local LLM , en el que los agentes de IA colaboran para generar reglas Sigma para la detección de amenazas.
En este ejemplo, un usuario introduce una solicitud (por ejemplo, "Genere una regla Sigma para detectar ataques Kerberoasting" ) a través de una interfaz web.
El agente 1 recupera los métodos de detección relevantes de MITRE ATT&CK, mientras que el agente 2 utiliza esta información para generar reglas Sigma que tengan en cuenta el contexto, utilizando un modelo de lenguaje. 18
16. Pruebas automatizadas de software y aplicaciones
Los agentes de pruebas de IA crean y ejecutan pruebas unitarias, de integración, de vulnerabilidad y de rendimiento sin una intervención manual extensa. Sin embargo, la creación de estos sistemas de IA requiere muchos recursos, ya que necesitan una gran capacidad de procesamiento.
Ejemplo de la vida real:
La función Copilot de Pcloudy proporciona scripts de prueba de Selenium, encuentra los navegadores disponibles para realizar las pruebas y ejecuta los casos de prueba. 19
Leer más: Asistentes de IA empresariales , creadores de agentes de IA , agentes de IA de código abierto .
Agentes de IA como personajes de videojuegos con apariencia humana
Los agentes de IA mejoran los NPC y otros procesos de agentes en el mundo del juego al realizar comportamientos de NPC, jugabilidad y adaptabilidad, y generación de contenido procedimental .
17. Personajes no jugadores (PNJ) con capacidad de acción
Los agentes de IA totalmente autónomos en los videojuegos proporcionan un comportamiento y una jugabilidad similares a los humanos para los personajes no jugadores (NPC).
Ejemplo de la vida real:
Los investigadores crearon una pequeña ciudad virtual poblada por IA mediante la construcción de un entorno de juego libre similar a Los Sims con 25 agentes llamado " Stanford AI Village ".
En esta aldea, los usuarios pueden observar e interactuar con los agentes mientras comparten noticias, entablan relaciones y organizan actividades grupales. 20
Aquí tienes una descripción general de los componentes e ideas clave que sustentan estos conceptos:
- Guiones de comportamiento : Los agentes de Stanford AI Village utilizan guiones predefinidos para sus acciones y reacciones. Esto puede incluir comportamientos básicos como interactuar positivamente con otros PNJ.
- Comportamiento dinámico : Los PNJ utilizan inteligencia artificial para ajustar su comportamiento en función de las acciones del jugador, lo que hace que el mundo del juego sea más receptivo.
- Búsqueda de rutas : Los PNJ utilizan algoritmos para navegar eficazmente por el mundo del juego, encontrando caminos para sortear obstáculos y persiguiendo al jugador.
18 Juego
Los agentes de IA juegan videojuegos o ayudan a los jugadores humanos a lograr objetivos específicos aprovechando:
- Búsqueda de rutas y navegación: Los agentes del juego exploran los entornos del juego, utilizando el método de ensayo y error para encontrar las estrategias óptimas. Por ejemplo, aprenden rutas de navegación en laberintos complejos refinando continuamente su proceso de toma de decisiones.
- Emulación de entrada: Los agentes del juego emulan las entradas, como las pulsaciones del teclado, los movimientos del ratón o los controles del mando. Esto les permite interactuar con el juego como lo haría un jugador humano.
- Adaptabilidad del juego: Los agentes analizan el estilo de juego del jugador y adaptan el mundo del juego, las interacciones y el diseño de las misiones en consecuencia. Por ejemplo, un jugador que se centra en el sigilo puede enfrentarse a menos desafíos de combate directo.
Ejemplo de la vida real:
Google El sistema multiagente instructable escalable (SIMA) de DeepMind navega e interactúa con situaciones de juego. SIMA tiene como objetivo jugar a juegos como No Man's Sky y Goat Simulator.
Fuente: Google 22
19. Generación de contenido procedimental
Los agentes de IA son altamente capaces de generar grandes cantidades de contenido de juego algorítmicamente, como por ejemplo:
- Terreno y paisajes
- Escenarios de combate
- Diseños de personajes
- Paisajes sonoros y música
Ejemplo de la vida real:
No Man's Sky , un juego de aventuras, utiliza la generación procedural para crear planetas enteros con:
- Topografía variada (por ejemplo, montañas, valles, cañones).
- Biomas únicos (por ejemplo, desiertos, bosques, océanos).
- Patrones meteorológicos dinámicos (por ejemplo, tormentas, lluvias). 23
Agentes de IA como creadores de contenido
Los agentes de IA automatizan la creación, edición y publicación de contenido. Estos agentes asisten a escritores humanos y generan contenido de forma independiente. Algunas aplicaciones de los asistentes de escritura con IA incluyen:
20. Escritura narrativa automatizada
Los agentes de IA escriben una narración, esbozando capítulos, redactando contenido y puliendo la prosa.
Ejemplo de la vida real:
En un proyecto de agentes de IA de GitHub , 10 agentes de IA especializados trabajaron de forma autónoma para escribir una novela de 100.000 palabras (~300 páginas) sin intervención humana. Algunos ejemplos de esos 10 agentes incluyen:
- Agente de especificaciones : Analiza los requisitos de la historia y mantiene la coherencia narrativa.
- Agente de producción : Genera contenido e implementa cambios creativos.
- Agente de gestión : Coordina entre los agentes y realiza un seguimiento del flujo creativo.
- Agente de duplicación : Evita la redundancia y la duplicación de contenido.
Aquí tenéis una retransmisión en directo que muestra cómo los agentes crean la novela :
21. Redacción de informes técnicos o propuestas
Los agentes de IA redactan de forma autónoma informes técnicos que incluyen:
- Informes de ingeniería
- Propuestas de proyectos
- Artículos de investigación
- Especificaciones del producto
Ejemplo de la vida real:
ParagraphAI , un asistente de redacción basado en IA, redacta informes técnicos de ingeniería detallando el cronograma, el presupuesto y los recursos y el personal necesarios. 25
22. Generación de artículos basada en el conocimiento
Los agentes extraen información de bases de datos de conocimiento como Wikipedia, manuales de productos o revistas académicas para crear una visión general completa de un tema específico.
Ejemplo de la vida real:
Perplexity Pages convierte los resultados de búsqueda de IA genérica en páginas estructuradas de Wikipedia. 26
23. Generación de paneles de control y diagramas
Los agentes generan componentes de interfaz de usuario/experiencia de usuario, diagramas de sistema y diagramas de flujo a partir de indicaciones de texto, lo que agiliza el proceso de diseño.
Ejemplo de la vida real:
FigJam AI utiliza indicaciones de texto para generar:
- Paneles de control para reuniones y ejercicios de equipo
- Diagramas y diagramas de flujo
- Cronogramas visuales y diagramas de Gantt 27
Agentes de IA como asistentes de seguros
Los agentes automatizan la revisión, aprobación y detección de fraudes de las reclamaciones, agilizando así todo el ciclo de procesamiento de las mismas. Por ejemplo, una gran aseguradora automatiza aproximadamente el 90 % de las reclamaciones individuales de automóviles mediante la integración de agentes de IA personalizados en su flujo de trabajo. 28
24. Procesamiento integral de reclamaciones
Una vez presentada una reclamación, un sistema de IA basado en agentes extrae los datos relevantes de los formularios enviados, verifica los detalles con las bases de datos existentes e identifica cualquier inconsistencia o posible señal de fraude.
Ejemplo de la vida real:
Plataforma Power Platform de Microsoft : automatiza un formulario de reclamación de seguros:
Aquí, la plataforma de poder de Microsoft :
- Documentos de formularios de reclamación capturados, como selecciones de casillas de verificación y textos.
- Se ha subido el formulario de reclamación a la aplicación de gestión de contenido de SharePoint .
- Se extrajeron datos del formulario de reclamación, como el ID de la reclamación y los valores de las casillas de verificación (por ejemplo, tipo de reclamación, número de póliza).
- Integrado con Dataverse para el almacenamiento de datos para guardar los datos extraídos (incluidos los valores de las casillas de verificación) en Microsoft Dataverse.
- Los flujos de trabajo procesados en formularios , por ejemplo, utilizaban agentes de Power Apps para aprobar o denegar reclamaciones.
25. Suscripción
La IA de Agentic automatiza la suscripción de pólizas con agentes especializados, incluyendo un agente de evaluación de riesgos para la valoración de la probabilidad de siniestros y un agente de precios para ajustes dinámicos de las primas, etc.
Ejemplo de la vida real:
Los agentes de Akira AI automatizan la suscripción de seguros y la evaluación de riesgos a través del sistema multiagente, cada uno especializado en un aspecto crítico de la suscripción:
- Agente de recolección de datos: Recopila datos estructurados y no estructurados.
- Agente de evaluación de riesgos: Analiza datos históricos y detalles del solicitante para predecir la probabilidad de reclamaciones.
- Agente de detección de fraude: Detecta anomalías o patrones sospechosos en reclamaciones y solicitudes.
- Agente de precios: Sugiere un precio basado en factores como las condiciones del mercado, los precios de la competencia y el comportamiento del cliente. 30
26. Resolución de pólizas personalizadas
Los agentes comunican al titular de la póliza el estado de la reclamación y los pasos a seguir, incluyendo cualquier documentación adicional requerida, actualizaciones sobre la aprobación o denegación, o detalles del pago.
Agentes de IA como asistentes de recursos humanos (RRHH)
Las operaciones de recursos humanos suelen implicar numerosas tareas repetitivas, como la revisión de currículos, que pueden automatizarse. A continuación, se presentan ejemplos clave de IA con capacidad de gestión de agentes en las operaciones de recursos humanos:
27. Selección de currículums
Los flujos de trabajo de Agentic automatizan el proceso de selección, filtran las habilidades relevantes y asignan automáticamente puntuaciones en función de los criterios predefinidos.
Ejemplo de la vida real:
PepsiCo utiliza herramientas de inteligencia artificial para clasificar a los candidatos en función de su grado de adecuación a los requisitos del puesto. 31
28. Programación de entrevistas
Los agentes pueden encargarse de programar las entrevistas y coordinar la comunicación entre los candidatos y los responsables de contratación para encontrar los horarios óptimos.
Ejemplo de la vida real:
El asistente de recursos humanos de LinkedIn realiza tareas cotidianas como sintetizar descripciones de puestos, buscar candidatos y realizar llamadas de preselección básicas. 32
29. Automatización de nóminas
Los agentes de procesamiento de nóminas calculan los salarios, procesan las deducciones y gestionan las retenciones fiscales. Se integran con los sistemas de información de recursos humanos (SIRH) y el software de contabilidad para garantizar la precisión y el cumplimiento de las normas de nómina.
Descubra más sobre soluciones de automatización financiera como:
- Casos de uso y herramientas de RPA para finanzas
- Referencia de herramientas para el programa LLM en finanzas
- Herramientas financieras de IA agente
Ejemplo de la vida real:
El sistema de nómina multiagente de Akira AI automatiza todos los aspectos del ciclo de nómina. El sistema utiliza varios agentes, entre ellos:
Fuente: Akira AI 33
Aquí, el sistema de nómina multiagente de Akira AI utiliza varios agentes, entre ellos:
- Agente de ingesta y preprocesamiento de datos : Utiliza métodos de extracción de datos para limpiar la información de los sistemas de recursos humanos y finanzas.
- Agente de cálculo de nóminas : Automatiza los cálculos de nómina, incluyendo sueldos, deducciones y bonificaciones.
- Agente de informes de cumplimiento : Detecta problemas de cumplimiento mediante aprendizaje automático.
- Agente de resolución de consultas: Resuelve problemas de nómina utilizando RAG .
Agentes de IA como asistentes de atención al cliente
Los chatbots tradicionales responden preguntas básicas, pero a menudo se topan con obstáculos a la hora de ayudar realmente al cliente. Las herramientas de atención al cliente de Agentic cambian eso al:
- Interpretar consultas con matices , incluso cuando las preguntas son vagas o complejas.
- Funcionamiento fluido a través de canales de chat, voz y correo electrónico, recuperando datos de perfiles de clientes, historial de pedidos y bases de conocimiento.
- Conservar el contexto de interacciones previas , lo que permite respuestas más informadas y personalizadas.
- Actuar de forma proactiva , por ejemplo, enviando recordatorios para revisiones o seguimientos antes de que el cliente inicie el contacto.
30. Atender las llamadas de los clientes:
Cuando un cliente llama para realizar una consulta, los agentes de IA procesan la llamada utilizando lenguaje natural.
Ejemplo de la vida real:
El agente de IA Ada responde a las llamadas de los clientes:
31. Respuesta a las solicitudes de los clientes
Los agentes de IA ofrecen respuestas contextualizadas o dirigen a los clientes a los recursos adecuados para obtener más ayuda.
32. Envío de SMS de seguimiento e informativos
Tras una interacción, los agentes envían mensajes SMS para dar seguimiento a los clientes.
33. Generación y optimización de preguntas frecuentes
Agentes:
- Genera y actualiza automáticamente las preguntas frecuentes a partir de las interacciones con los clientes en tiempo real y el historial de incidencias.
- Integrar con herramientas de CRM, chat y base de conocimientos para identificar consultas recurrentes.
Agentes de IA como asistentes de investigación
Los agentes de IA, como asistentes de investigación, se utilizan en diversos campos para ayudar con el análisis de datos, la revisión de la literatura, la generación de hipótesis y el diseño experimental.
Ejemplos de la vida real:
1. La investigación profunda de OpenAI utiliza el razonamiento para sintetizar grandes cantidades de información en línea y completar investigaciones de varios pasos a nivel de doctorado cuando se realizan grandes búsquedas utilizando o3 y DeepSeek . 35 36
En un experimento en el que los investigadores pidieron a Deep Research que realizara un proyecto de la vida real con una instrucción detallada, Deep Research:
- Se formularon preguntas de seguimiento para aclarar el alcance y los detalles del proyecto de investigación antes de comenzar.
- Conclusiones sintetizadas a partir de 22 fuentes basadas en informes académicos y de la industria. 37
2. Se solicitó al sistema de apoyo a la toma de decisiones clínicas (CDS) de ChemicalQDevice que ejecutara el flujo de trabajo de agentes para el descubrimiento de fármacos. En este ejemplo, el sistema de ChemicalQDevice:
- Se analizaron grandes cantidades de literatura clínica a partir de conjuntos de datos.
- Se realizó codificación automatizada con herramientas como GitHub Actions.
- Se utilizó IA generativa (por ejemplo, GPT-4 o modelos personalizados) para generar hipótesis, sugerir diseños experimentales y redactar informes de investigación. 38
3. El sistema de flujo de trabajo de agente integral, otto-SR , aprovecha los modelos lógicos legales (LLM) para realizar búsquedas bibliográficas, aplica criterios de inclusión/exclusión, extrae datos estructurados y realiza metaanálisis. 39
El sistema de investigación profunda ChemicalQDevice de OpenAI y otto-SR se pueden utilizar en varios casos de uso de agentes que se detallan a continuación:
34. Revisión de la literatura y descubrimiento de conocimiento
Realizar búsquedas autónomas en bases de datos académicas, revistas y repositorios de investigación en línea (por ejemplo, Google Scholar, PubMed) para recopilar estudios, artículos y documentos relevantes relacionados con temas o hipótesis de investigación específicos.
35. Generación y comprobación de hipótesis
Generar de forma proactiva hipótesis de análisis basadas en patrones en los datos y ponerlas a prueba (trabajo que suelen realizar los analistas y los usuarios de negocio).
36. Minería y análisis de datos
Manipular datos estructurados y no estructurados de diversas fuentes, como bases de datos de investigación, redes sociales, patentes o resultados de ensayos clínicos, para obtener información sobre las tendencias emergentes.
37. Visualización y presentación de datos
Generación de representaciones visuales esclarecedoras de conjuntos de datos complejos.
Agentes de IA como usuarios de computadoras
El objetivo de “Uso de la computadora” es permitir que la IA interactúe con una computadora como lo haría una persona. Esto brinda la flexibilidad para realizar tareas digitales sin utilizar API específicas del sistema operativo o de la web.
Existen dos enfoques para que los agentes de IA realicen tareas como los humanos:
- Realizar acciones de la interfaz gráfica de usuario (GUI) del sistema operativo ( Claude de Anthropic, OmniParser de Microsoft, etc. ).
- Navegación web ( OpenAI Operador, Kura AI, Runner H , HyperWriteAI, MultiOn Agent Q, etc.) .
Ejemplos de herramientas:
- La nueva herramienta Operator de OpenAI permite a los agentes de IA completar tareas en varios sitios web, como comprar comida para mascotas. 40
- Kura AI y Runner H tienen como objetivo completar tareas utilizando navegadores web. 41 42
- HyperWriteAI tiene como objetivo rellenar formularios de texto, hacer clic en botones y seleccionar opciones de menú para realizar un pedido en línea. 43
- OmniParser de Microsoft mejora la comprensión de los agentes sobre las interfaces visuales para la automatización de la interfaz gráfica de usuario. 44
38. Relleno de formularios y automatización web
Los agentes navegan por páginas web, hacen clic en campos y rellenan formularios en función de las indicaciones del usuario o de datos estructurados.
Ejemplo de la vida real:
39. Generación y edición de documentos
Los agentes abren archivos, realizan ediciones, cambian el nombre, organizan y guardan documentos en entornos locales o en la nube.
Ejemplo de la vida real:
A Claude, del documento Anthropic, se le pide que “genere 25 filas de gastos de muestra, las guarde en una hoja de cálculo y luego abra la hoja de cálculo”.
En este ejemplo, Claude:
- Abrí el archivo CSV en la aplicación LibreOffice Calc.
- Se creó un archivo CSV con 25 filas de datos de gastos de muestra.
- He instalado la hoja de cálculo LibreOffice Calc. 46
40. Investigación web y recopilación de datos estructurados
A diferencia de los scripts de automatización básicos, los agentes de investigación de la web profunda interpretan información no estructurada de múltiples páginas y devuelven información relevante en un formato estructurado.
Ejemplo de la vida real:
La función Deep Research de OpenAI, una nueva capacidad de agente dentro de ChatGPT diseñada para planes de investigación web de varios pasos y alto contexto, navega y sintetiza información de múltiples fuentes para responder consultas complejas.
41. Operaciones de CLI y ejecución de scripts
Los agentes de codificación basados en la interfaz de línea de comandos (CLI), como Aider, diseñados para flujos de trabajo de desarrollo basados en la terminal, ejecutan comandos de shell, instalan software, inician scripts e interpretan las salidas en las interfaces de terminal.
Ejemplo de la vida real:
Aider, un agente de codificación de IA nativo de la línea de comandos, es utilizado por los desarrolladores para refactorizar bases de código y ejecutar comandos de shell, como la ejecución de conjuntos de pruebas (pytest, npm test). El agente interpreta las salidas de la terminal, corrige errores de forma iterativa y confirma los cambios directamente en los repositorios de Git. 48
42. Navegación y coordinación de aplicaciones multimodales
Los agentes GUI unificados (por ejemplo, los prototipos de operador OpenAI ) pueden cambiar entre aplicaciones.
Ejemplo de la vida real:
Para probar un caso de uso de entrega de pedidos, proporcioné una solicitud de compra simple desde Open Operator: Ayúdame a comprar una funda de cojín estilo boho por menos de $30 .
Agentes de flujo de trabajo autónomos (tareas a largo plazo)
Los agentes de planificación con memoria y uso de herramientas (por ejemplo, Auto-GPT, Agente Q con establecimiento de objetivos) ejecutan objetivos de varios pasos a través de diversas herramientas (por ejemplo, recopilar información, realizar acciones, revisar el plan), tomando decisiones en tiempo real.
Ejemplo de la vida real:
En este análisis de informes financieros por etapas, el agente de planificación de IA recibe la siguiente tarea: "Analizar el desempeño financiero del último trimestre y preparar un resumen para el equipo de finanzas".
Se le pide al agente que obtenga:
- Noticias recientes de la empresa (las 3 noticias más importantes)
- Precio actual de las acciones de la empresa (
AAPL) - Información de la empresa (por ejemplo, perfil, capitalización bursátil, sector)
- Precios históricos de las acciones (intervalo de 1 día durante el último mes)
- Recomendaciones de analistas (por ejemplo, calificaciones de compra/mantener/venta)
Aquí está el resultado del informe financiero:
Ejemplo de la vida real:
El agente Q de MultiOn está reservando un vuelo.
Creación de agentes de IA
El cambio de aplicaciones básicas de agentes, como búsquedas meteorológicas en lenguaje natural utilizando herramientas como LangChain, a casos de uso autónomos más complejos como el desarrollo de aplicaciones (por ejemplo, generar un juego de tres en raya con el editor Cursor AI) dio como resultado los siguientes desafíos:
- Gestionar la complejidad en la ejecución de tareas
- Estandarizar patrones que guíen su proceso de toma de decisiones.
- Incorporar múltiples opciones y seleccionar la acción óptima para ejecutar una tarea. (Por ejemplo, "¿Debo mostrar esta pantalla u otra según la entrada del usuario?").
- Interacción con sistemas externos y API.
43. Generación de agentes de IA personalizados:
Los marcos de trabajo para la creación de agentes de IA ayudan a abordar estos desafíos al proporcionar:
- __21833__
- Marcos de toma de decisiones y razonamiento (por ejemplo, aprendizaje automático o modelos probabilísticos) para estandarizar patrones e incorporar múltiples opciones.
- Herramientas de acceso e integración de datos (por ejemplo, conectores API) para interactuar con sistemas externos y API.
Ejemplo de la vida real:
Creación de un agente de guía de viajes personalizado de Eslovenia con Microsoft 365:
Preguntas frecuentes
Si bien las empresas están realizando numerosas pruebas de concepto sobre el tema, el costo de los errores es bastante elevado en muchos flujos de trabajo empresariales. La naturaleza probabilística de los modelos de lógica de negocio reduce su fiabilidad y ralentiza la adopción de agentes en entornos de producción.
La IA agente es el marco general que permite a los sistemas de IA resolver problemas con una supervisión mínima. Dentro de este marco, los agentes de IA son los componentes individuales responsables de ejecutar tareas específicas de forma autónoma.
Si bien la IA con capacidad de gestión comprende los objetivos del usuario y orquesta el proceso de resolución de problemas, los agentes de IA realizan las tareas.
Toma de decisiones: Opera con una mínima intervención humana, evaluando situaciones y eligiendo acciones basadas en objetivos predefinidos y un contexto cambiante.
Resolución de problemas: Sigue un ciclo de cuatro pasos: percibir → razonar → actuar → aprender .
Autonomía: Los sistemas de IA con capacidad de gestión de agentes actúan de forma independiente, aprendiendo y mejorando con el tiempo.
Interactividad: Interactúa de forma proactiva con su entorno, ajustando sus acciones en tiempo real (por ejemplo, los coches autónomos toman decisiones de conducción dinámicas).
Planificación: Capaz de ejecutar estrategias de múltiples pasos, lo que le permite resolver tareas complejas y alcanzar objetivos a largo plazo.
La IA generativa crea contenido bajo demanda, mientras que la IA automatizada persigue objetivos de forma independiente.
La IA generativa crea contenido original a partir de las indicaciones del usuario. Es reactiva y responde a las entradas específicas del usuario. Herramientas como ChatGPT y GitHub Copilot son ejemplos populares.
La IA agente, en cambio, está diseñada para actuar de forma autónoma . Combina modelos de lógica descriptiva con herramientas como el aprendizaje por refuerzo y la representación del conocimiento para tomar decisiones, planificar acciones y adaptarse a situaciones cambiantes. Es proactiva , capaz de iniciar y completar tareas complejas.
Sé el primero en comentar
Tu dirección de correo electrónico no será publicada. Todos los campos son obligatorios.