Benchmark

Simulación de Audiencia: ¿Pueden los LLMs Predecir el Comportamiento Humano?

actualizado el 28 de abr. de 2026

En marketing, evaluar con qué precisión los LLMs predicen el comportamiento humano es crucial para evaluar su eficacia a la hora de anticipar las necesidades de la audiencia y reconocer los riesgos de desalineación, comunicación ineficaz o influencia no deseada.

La simulación de audiencia con LLMs permite modelar audiencias virtuales, ayudando a las organizaciones a anticipar reacciones a contenidos o productos sin depender de costosas encuestas o grupos focales.

Probamos qué tan bien los modelos de IA pueden predecir cuál de dos publicaciones de LinkedIn del mismo autor obtendrá mayor participación (me gusta, comentarios, compartidos), simulando esencialmente el comportamiento de una audiencia humana.

Resultados del benchmark de simulación de audiencia

Loading Chart

Razones detrás de las diferencias de rendimiento en los LLMs

Los modelos de lenguaje de gran tamaño muestran diferentes niveles de precisión para predecir cuál de dos publicaciones de LinkedIn del mismo autor recibirá mayor participación. Estas diferencias surgen de qué tan bien cada modelo procesa las entradas descritas en el benchmark y con qué eficacia identifica los factores que influyen en las reacciones de la audiencia.

Comprendiendo las señales de participación

El benchmark requiere que los modelos evalúen señales sutiles que predicen la participación. Los modelos de mayor rendimiento tienden a detectar estas señales con mayor precisión. Estas señales incluyen si la publicación:

Presenta una visión personal o una lección
Hace una pregunta directa
Es relevante para una audiencia amplia
Parece promocional
La estructura afecta la atención del lector

Modelos como DeepSeek Chat V3 y Claude Opus 4 funcionan bien porque identifican estas señales con mayor consistencia.

Uso de información contextual

La evaluación incluye varios datos contextuales para cada publicación, y los modelos difieren en qué tan bien los utilizan. Cada modelo recibe:

Texto de la publicación
Tipo de medio: texto, imagen, video o enlace
Rango de seguidores del autor

Una predicción precisa requiere que el modelo combine estas entradas. Los modelos de mayor rendimiento reconocen patrones, como menor participación en publicaciones con enlace y mayor participación en narrativas reflexivas. Los modelos más débiles a menudo tratan las entradas de forma aislada o pasan por alto sus interacciones.

Interpretación del comportamiento humano

Predecir la participación requiere razonar sobre las preferencias de la audiencia. Pocos modelos muestran una capacidad sólida en esta área. Muchos modelos se mantienen cerca de la línea base del 50% porque el comportamiento de la audiencia es variable y depende de factores psicológicos difíciles de inferir solo a partir del texto.

Los modelos que rinden alrededor del 52% muestran una comprensión parcial de estas señales. Pueden identificar patrones generales pero tienen dificultades en casos límite. Los modelos con puntuaciones bajas, como o1, parecen juzgar mal los impulsores estándar de participación y a menudo favorecen la opción menos atractiva.

Influencia de los datos de entrenamiento

Se observa que los resultados del modelo reflejan los datos con los que fueron entrenados. Si los datos de entrenamiento no representan una amplia gama de estilos de comunicación o grupos demográficos, el modelo puede malinterpretar ciertos tipos de contenido. Estas diferencias de entrenamiento contribuyen directamente a la dispersión de resultados en el benchmark.

Los modelos entrenados con conjuntos de datos más amplios o conversacionales tienden a aproximar mejor las reacciones de los usuarios. Los modelos entrenados con conjuntos de datos más reducidos a menudo se basan en características superficiales que no se correlacionan bien con la participación real.

Generalización entre autores

El conjunto de datos incluye publicaciones de 50 autores con diversos números de seguidores, preferencias de medios y estilos de escritura. Los modelos deben generalizar a través de estas diferencias. Los modelos más sólidos forman expectativas consistentes sobre lo que impulsa la participación, independientemente del autor.

Los modelos de menor rendimiento aplican criterios inconsistentes en diferentes autores y publicaciones.

Consulte nuestra metodología para entender cómo calculamos estas mediciones.

¿Qué es la simulación de audiencia?

La simulación de audiencia es la práctica de utilizar poblaciones sintéticas, impulsadas por modelos, a veces llamadas audiencias virtuales, para predecir cómo reaccionarán las personas reales ante contenidos, productos o ideas políticas antes de su lanzamiento. En lugar de realizar pruebas en vivo con costosas encuestas o grupos focales, las organizaciones pueden crear personas que representen a su público objetivo y observar sus respuestas simuladas.

La técnica se basa en métodos de modelado basado en agentes, modelos de lenguaje de gran tamaño y simulación de personas. Cada agente o persona simulada está diseñada con atributos como demografía, preferencias o tendencias de comportamiento. Together, estas personas interactúan, produciendo datos sintéticos que aproximan el comportamiento de un grupo de clientes o ciudadanos reales en la misma situación.

¿Cómo funcionan las herramientas de simulación de audiencia?

La mecánica de la simulación de audiencia depende de las herramientas utilizadas, pero la mayoría de los enfoques comparten componentes estándar:

Diseño de personas: Los investigadores definen personas basadas en demografía, psicografía o segmentos de mercado específicos. Estas personas pueden variar desde agentes simples basados en reglas hasta personas de IA detalladas enriquecidas con biografías y habilidades conversacionales.
Generación de datos sintéticos: Los modelos de lenguaje de gran tamaño ayudan a simular diálogos, respuestas a encuestas o comportamientos de publicación. Por ejemplo, Artificial Societies opera de 100–300 personas de IA que leen, reaccionan y comparten publicaciones de LinkedIn para simular dinámicas de red.
Modelado de interacciones: Las personas no actúan de forma aislada. Interactúan, se influyen mutuamente y forman patrones como cámaras de eco, cascadas de reposteos o cambios en la opinión pública. Esto permite que las simulaciones capturen tanto reacciones individuales como fenómenos a nivel grupal.
Pruebas de escenarios: Variando entradas como el encuadre del mensaje, el tipo de medio o las preguntas de la encuesta, las organizaciones pueden observar cómo responden las audiencias simuladas a estas variaciones. Estos escenarios ayudan a generar hipótesis y probar ideas en una etapa de práctica segura antes de interactuar con personas reales.
Análisis de datos: Los resultados se analizan mediante técnicas como nubes de palabras, análisis de sentimiento y puntuaciones de precisión. Los resultados pueden mostrar los ganadores probables entre dos variantes de publicación, temas comunes en los comentarios o la perspectiva de una persona sobre por qué una idea resuena más que otra.

Ejemplo de la vida real: Simulaciones de agentes generativos de Stanford

Un equipo de investigación de la Universidad de Stanford desarrolló una arquitectura de agentes que convierte datos cualitativos de entrevistas en representaciones potenciadas por LLM de individuos reales.

En lugar de construir personas a partir de etiquetas demográficas únicamente, cada agente se fundamenta en una entrevista de dos horas con la persona que representa. Probados contra la Encuesta Social General, los agentes igualaron las respuestas de sus individuos fuente casi tan bien como esos individuos igualaron sus propias respuestas cuando se les volvió a encuestar dos semanas después.

La arquitectura también mostró un sesgo de predicción reducido entre grupos raciales e ideológicos en comparación con los enfoques de personas específicas por demografía, lo que sugiere que puede modelar poblaciones diversas con mayor fidelidad que los métodos más simples.¹

Casos de uso de la simulación de audiencia

Marketing y publicidad

Las marcas pueden probar eslóganes, imágenes o posicionamiento de productos con una audiencia virtual antes de gastar en distribución a gran escala. En lugar de depender únicamente de las respuestas de encuestas tradicionales, pueden generar datos sintéticos a partir de personas de IA y comparar el rendimiento entre grupos.

Por ejemplo, los especialistas en marketing pueden determinar si un producto resuena más con la Generación Z que con profesionales mayores y ajustar su estrategia creativa en consecuencia. Esta capacidad de validar campañas en la etapa de prueba conduce a ahorros de costos y una segmentación más precisa.

Ejemplo de la vida real: Focus Agent

Investigadores de la KU Leuven construyeron un sistema multiagente que replica la estructura de un grupo focal tradicional completamente en software, incluyendo tanto a los participantes como el rol de moderador.

El sistema se validó realizando cinco sesiones reales de grupos focales con 23 participantes humanos sobre los mismos temas de discusión, y luego comparando los resultados con los generados solo por participantes de IA. Las opiniones generadas por la IA se alinearon estrechamente con las de los encuestados humanos.

Más allá de reemplazar participantes, el moderador LLM también ofreció ventajas prácticas sobre la moderación humana, como una dirección más consistente del tema y gestión del tiempo.²

Medios y publicaciones

Las empresas de medios pueden simular cómo diferentes formatos de contenido (por ejemplo, publicaciones cortas, artículos extensos, videos explicativos) funcionarán entre sus audiencias.

La simulación de personas también permite probar cómo los titulares afectan los clics o cómo el tono influye en los compartidos. Al anticipar reacciones, los editores pueden priorizar historias con más probabilidades de difundirse, en lugar de esperar a las métricas posteriores a la publicación.

Políticas públicas e investigación

Los gobiernos y los think tanks pueden usar la simulación de audiencia para probar ideas de investigación de políticas. Las poblaciones sintéticas modeladas según demografías específicas pueden ilustrar cómo diferentes comunidades podrían responder a un nuevo impuesto, regulación de salud o iniciativa climática. Los investigadores han aplicado simulaciones generativas para explorar temas como la polarización y la desinformación.

Este enfoque facilita la generación de hipótesis y proporciona un entorno más seguro para anticipar consecuencias no deseadas antes de interactuar con personas reales.

Desarrollo de productos

Las empresas pueden simular cómo las personas que representan demografías específicas hablan sobre una nueva característica o dispositivo. Por ejemplo, una empresa de tecnología podría comparar si los propietarios de pequeñas empresas, estudiantes o gerentes empresariales encuentran más valor en una nueva actualización de software.

Los conocimientos de la simulación pueden informar las decisiones de diseño y mitigar el riesgo de lanzar funciones que no resuenen con el público objetivo.

Capacitación y educación

Las universidades y empresas pueden usar simulaciones para crear entornos de práctica donde los estudiantes interactúen con personas de IA. Un negociador en formación podría practicar con contrapartes simuladas, o un estudiante de medicina podría probar estrategias de comunicación con pacientes sintéticos.

Estos escenarios de capacitación ofrecen una gama realista de respuestas, permitiendo a los alumnos perfeccionar sus habilidades antes de encontrarse con personas reales.

Agencias de investigación de mercado

Las preguntas de encuestas tradicionales y los grupos focales pueden ser costosos y lentos. Las agencias de investigación de mercado pueden complementarlos con la simulación de audiencia para generar datos sintéticos que proporcionen información direccional rápida.

Si bien las simulaciones no reemplazan la interacción con clientes reales, pueden reducir la dependencia de paneles costosos y acelerar las pruebas en etapas tempranas.

Deja que nuestro equipo automatice uno de tus procesos de negocio con agentes de IA, sin coste alguno.

Automatizar un proceso

Herramientas de simulación de audiencia

Si busca una herramienta dedicada para la simulación de audiencia en lugar de usar LLMs, aquí tiene algunas opciones:

Artificial Societies

Artificial Societies permite a los usuarios describir un público objetivo en lenguaje sencillo o generar uno basado en interacciones en redes sociales. Luego construye una “sociedad” de personas y ejecuta simulaciones impulsadas por IA.

Cada simulación incluye pruebas A/B automáticas, que generan variaciones de un mensaje en el estilo del usuario y las prueban contra la audiencia. Los resultados se presentan con puntuaciones, comentarios y resúmenes, lo que permite una interpretación rápida. Los casos de uso abarcan relaciones públicas, desarrollo de productos, branding, marketing, periodismo y redes sociales.

Figura 1: Panel de simulación de audiencia de Artificial Societies.

Figura 1: Panel de simulación de Artificial Societies.

Ejemplo de la vida real: Teneo

Teneo, una empresa de relaciones públicas, se estaba preparando para lanzar una nueva estrategia tecnológica y necesitaba probar si su mensaje resonaría con las partes interesadas clave antes de anunciarlo públicamente. Sin embargo, la empresa enfrentaba varias limitaciones:

La estrategia era confidencial, lo que limitaba los métodos de investigación tradicionales.
El plazo era corto, lo que dificultaba las encuestas a gran escala.
Las audiencias importantes, como los responsables políticos, líderes de la industria y partes interesadas especializadas, eran casi imposibles de alcanzar a través de los paneles de investigación de mercado convencionales.

Para abordar estos desafíos, Teneo se asoció con Artificial Societies. El proceso incluyó:

Creación de personas de IA: Se generaron más de 5,000 personas de IA. Estas personas se basaron en perfiles demográficos y psicográficos reales, informados por la escucha social y la investigación cualitativa.
Construcción de “sociedades” especializadas: Sociedades de IA separadas representaron diferentes grupos de partes interesadas, incluyendo:
- Consumidores
- Colegas de la industria
- Responsables políticos, lobistas e influenciadores políticos.
Prueba de narrativas de mensajes: Los investigadores probaron seis narrativas tecnológicas en competencia utilizando encuestas y experimentos dentro de cada sociedad de IA.
Análisis de reacciones: Las respuestas se analizaron tanto a nivel agregado como a nivel de persona individual, lo que permitió al equipo comparar reacciones entre segmentos de audiencia.

La simulación produjo información a gran escala más rápido que los métodos de investigación tradicionales. Los resultados clave incluyeron:

189,756 respuestas únicas generadas a partir de las simulaciones de IA.
Información basada en 30 preguntas de investigación en profundidad en seis narrativas.
Identificación de la narrativa más efectiva y mensajes personalizados para cada segmento de audiencia.
Entrega de resultados a través de una plataforma de análisis interactiva y un informe escrito.³

Ask rally

Ask Rally es un simulador de audiencia virtual que permite a los usuarios probar preguntas, contenido e ideas con personas de IA diseñadas para parecerse a audiencias reales.

Los usuarios crean o editan personas, o las clonan a partir de datos existentes como entrevistas o encuestas. Después de definir una audiencia, pueden hacer preguntas y recibir respuestas generadas por personas, que van desde 5 hasta 100. La plataforma agrega respuestas, proporciona información clave y permite que los agentes voten sobre las opciones.

Las características clave incluyen:

Respuestas multiagente con resúmenes agregados e información.
La memoria de personas basada en Mem0 permite que las personas retengan el contexto y los patrones de comportamiento, ayudando a simular reacciones de audiencia más consistentes y realistas.
La sofisticación de audiencia de cuatro niveles permite modelar audiencias con diferentes niveles de experiencia o familiaridad con un tema.
La simulación de reacción de video permite a los equipos probar cómo las audiencias podrían responder al contenido de video, como anuncios, materiales de campaña o presentaciones.
El acceso a la API permite a los equipos integrar el simulador en flujos de trabajo de investigación, herramientas internas o pipelines de pruebas automatizadas.
Entornos de prueba para sitios web, campañas y medios.
Capacidades adicionales como gemelos digitales, entornos de simulación y calibración con datos del mundo real.
Plan gratuito para experimentación y pruebas tempranas.

Generative Audiences by Dentsu

Generative Audiences es una herramienta de inteligencia de marketing de IA que crea audiencias de consumidores simuladas a partir de datos reales. Ayuda a las marcas a mejorar la segmentación de audiencia, la planificación de medios y el rendimiento de las campañas al permitir que los profesionales del marketing interactúen con estas personas de IA y analicen sus respuestas.⁴

Datos deterministas e impulsados por IA: Combina datos deterministas basados en personas con señales de comportamiento impulsadas por IA para modelar con precisión el comportamiento de la audiencia.
Información interactiva del consumidor: Los profesionales del marketing pueden interactuar con personas simuladas para explorar motivaciones y comportamientos, por ejemplo, para probar cómo las audiencias podrían responder a nuevos mensajes, ideas de productos o eventos actuales.
Integración de datos de múltiples fuentes: Sintetiza múltiples fuentes de datos (estáticas y en tiempo real) y se integra con los datos existentes del cliente.
Planificación y activación de medios: Los conocimientos de las audiencias de IA se pueden utilizar para construir estrategias de medios dirigidas y activar campañas.
Modelado de audiencia respetuoso con la privacidad: Debido a que utiliza simulaciones estadísticas en lugar de depender en gran medida de identificadores personales, la solución puede escalar la segmentación de audiencia manteniendo un mayor cumplimiento de la privacidad.

Electric Twin

Electric Twin es una plataforma de audiencia sintética que crea poblaciones digitales a partir de datos del mundo real.⁵

Modelado de audiencia sintética: Crea poblaciones digitales que representan grupos demográficos reales y simulan el comportamiento humano.
Retroalimentación de audiencia en tiempo real: Los usuarios pueden hacer preguntas y recibir respuestas inmediatas de personas simuladas, en lugar de realizar encuestas.
Pruebas de escenarios y mensajes: Los equipos pueden evaluar conceptos de productos, campañas, estrategias de precios y propuestas de políticas antes de lanzarlas.
Encuestas y grupos focales simulados: Admite encuestas rápidas, entrevistas y discusiones estilo grupo focal con personas de IA.
Audiencias personalizadas y predefinidas: Las organizaciones pueden construir audiencias utilizando sus propios datos de encuestas o usar poblaciones demográficas predefinidas en varios países.
Motor de predicción: Compara los resultados con datos de encuestas del mundo real para estimar las respuestas probables de los consumidores.
Entorno de investigación que preserva la privacidad: Las poblaciones sintéticas permiten probar ideas sin exponer datos sensibles o personales.

Simile IA

Creado por investigadores de Stanford, Simile tiene como objetivo simular grandes grupos, o incluso sociedades enteras, para predecir cómo las personas podrían reaccionar ante productos, políticas o decisiones corporativas.⁶

Personas gemelas digitales: Crea agentes de IA que representan a individuos reales basados en datos de comportamiento y entrevistas.
Simulaciones de comportamiento humano a gran escala: Modela interacciones entre miles de agentes para predecir decisiones de consumo o resultados sociales.
Pronóstico de escenarios: Las empresas pueden anticipar eventos como cambios en la demanda de los consumidores o preguntas de analistas durante las llamadas de resultados.
Arquitectura de agente generativo: Los agentes de IA planifican acciones, forman opiniones e interactúan entre sí para producir dinámicas de comportamiento realistas.

Metodología del benchmark de simulación de audiencia

Nuestra pregunta de investigación para este benchmark fue: “¿Pueden los modelos de IA predecir qué publicación de LinkedIn obtendrá más participación antes de ser publicada?”. Para ello, evaluamos qué tan bien los modelos de IA pueden predecir cuál de dos publicaciones de LinkedIn del mismo autor generará mayor participación total (me gusta + comentarios + compartidos) dentro de los 7 días posteriores a la publicación.

Usamos publicaciones de 50 autores para nuestro conjunto de datos. Cada fila contiene un par de publicaciones del mismo autor con estas características:

Contenido de la publicación: Texto sin procesar de ambas publicaciones
Tipo de medio: texto/imagen/video/enlace para cada publicación
Contexto del autor: Rango de seguidores (por ejemplo, “1k-5k”, “5k-20k”)
Verdad fundamental: Números reales de participación y etiqueta del ganador (A o B)

Datos de ejemplo:

Publicación A (Ganadora – 156 interacciones): “Después de tres startups fallidas, esto es lo que desearía que alguien me hubiera dicho sobre el ajuste producto-mercado: Dejen de crear funciones que sus cinco usuarios beta pidieron. Comiencen a obsesionarse con el problema que enfrenta realmente el 95% de su mercado objetivo. Cometí este error durante 2 años. No lo repitan. ¿Cuál es la mayor lección de producto que aprendieron por las malas?”

Medio: texto
Seguidores: 5k-20k

Publicación B (84 interacciones): “¡Emocionados de compartir nuestro nuevo panel de análisis impulsado por IA! Echa un vistazo a la demo y dinos qué opinas.”

Medio: enlace
Seguidores: 5k-20k

Análisis: La publicación A ganó porque proporciona un consejo específico y accionable a partir del fracaso personal, hace una pregunta atractiva y ofrece contenido con el que identificarse. La publicación B es una promoción genérica con menos potencial de interacción.

Evaluación del benchmark de simulación de audiencia

En la evaluación, cada modelo recibe esta información para ambas publicaciones:

Texto de la publicación
Tipo de medio
Rango de seguidores del autor

Con esta información, se espera que los modelos predigan si la publicación A o B es la de mejor rendimiento. Pueden mostrar su razonamiento, pero no evaluamos su razonamiento en este benchmark.

Dado que los modelos tienen una probabilidad del 50% de acertar sobre el mejor rendimiento (hay dos opciones), estamos considerando buscar la “mejora sobre el azar (Precisión menos 50%, que es la línea base de adivinación aleatoria)” como línea base en el futuro.

Aun así, en este conjunto de datos, no hemos observado adivinación aleatoria; todos los modelos explicaron su razonamiento, ya sea que sus respuestas fueran correctas o incorrectas.

No te pierdas nuestros análisis comparativos e insights basados en datos. El botón abre Google; seleccionar AIMultiple confirma que deseas ver AIMultiple con más frecuencia en los resultados de búsqueda de Google.

Añadir como fuente preferida

¿Cuáles son los posibles desafíos de la simulación de audiencia?

A pesar de sus promesas, la simulación de audiencia debe abordarse con precaución.

Validación con clientes reales

Las predicciones de audiencias virtuales deben compararse con resultados reales. Sin benchmarks, los resultados pueden generar una falsa confianza. La validación es crucial para garantizar que las personas sintéticas reflejen con precisión el comportamiento de personas reales.

Sesgo en los modelos de lenguaje

Las personas de IA están moldeadas por los datos que entrenaron los modelos de lenguaje subyacentes. Si esos datos subrepresentan a ciertos grupos, las personas resultantes pueden distorsionar cómo se representan demografías específicas. Esto puede afectar cómo se simulan las respuestas de encuestas o la opinión pública.

Interpretabilidad

Aunque las conversaciones de personas o las nubes de palabras pueden mostrar temas comunes, no siempre está claro por qué surgen resultados específicos. La complejidad de las respuestas de LLM puede dificultar la explicación o validación del comportamiento de la audiencia.

Directrices éticas

El uso de datos sintéticos para la investigación de clientes o políticas requiere transparencia. Las organizaciones deben asegurarse de que no presenten las simulaciones como un reemplazo de los clientes reales y respeten los límites éticos al definir personas.

Generalizabilidad

Las simulaciones dependen en gran medida del alcance del diseño de las personas. Un modelo entrenado con fundadores tecnológicos de EE. UU. no puede predecir automáticamente las respuestas de la Generación Z en Asia. La generalización excesiva es un riesgo al extender los hallazgos a poblaciones que no estaban representadas en la simulación.

Costo computacional

Ejecutar simulaciones detalladas con miles de personas puede requerir recursos significativos. Aunque las herramientas de IA están mejorando la eficiencia, los experimentos a gran escala aún demandan tiempo, conocimiento técnico e infraestructura.

Cita esta investigación

Elige el formato que se ajuste al lugar donde vas a publicar. Pegar la versión con enlace en tu CMS conserva el enlace de retroceso.

Sıla Ermut (2026) - "Simulación de Audiencia: ¿Pueden los LLMs Predecir el Comportamiento Humano?". Publicado en línea en AIMultiple.com. Recuperado el 28 de Abril de 2026, de: https://aimultiple.com/audience-simulation [Recurso en línea]

Ermut, S. (2026, 28 de Abril). Simulación de Audiencia: ¿Pueden los LLMs Predecir el Comportamiento Humano?. AIMultiple. https://aimultiple.com/audience-simulation

@misc{ermut2026,
  author = {Ermut, Sıla},
  title  = {{Simulación de Audiencia: ¿Pueden los LLMs Predecir el Comportamiento Humano?}},
  year   = {2026},
  month  = apr,
  howpublished    = {\url{https://aimultiple.com/audience-simulation}},
  note   = {AIMultiple. Recuperado el 28 de Abril de 2026}
}

Enlaces de referencia

https://arxiv.org/pdf/2411.10109

https://arxiv.org/pdf/2409.01907

Artificial Societies

Dentsu Launches Generative Audiences: AI-Powered Growth Intelligence That Thinks Like Consumers | News | dentsu

Electric Twin - Synthetic Audiences for Instant Consumer Insights

Electric Twin

Home | Simile

Sıla Ermut

Analista de la industria

Sıla Ermut es una analista de la industria en AIMultiple centrada en el marketing por correo electrónico y los vídeos de ventas. Anteriormente trabajó como reclutadora en empresas de gestión de proyectos y consultoría. Sıla tiene un máster en Psicología Social y una licenciatura en Relaciones Internacionales.

Ver perfil completo