Simulación de audiencia: ¿Pueden los modelos de aprendizaje lingüístico predecir el comportamiento humano?
En marketing, evaluar con qué precisión los modelos de aprendizaje lógico (MLL) predicen el comportamiento humano es crucial para evaluar su eficacia a la hora de anticipar las necesidades de la audiencia y reconocer los riesgos de desajuste, comunicación ineficaz o influencia no deseada.
La simulación de audiencias con modelos LLM permite modelar audiencias virtuales, lo que ayuda a las organizaciones a anticipar reacciones al contenido o a los productos sin depender de costosas encuestas o grupos focales.
Probamos hasta qué punto los modelos de IA pueden predecir cuál de dos publicaciones de LinkedIn del mismo autor obtendrá mayor interacción (me gusta, comentarios, compartidos), simulando esencialmente el comportamiento de la audiencia humana.
Resultados de referencia de la simulación de audiencia
Razones que explican las diferencias de rendimiento en los másteres jurídicos
Los modelos de lenguaje de gran tamaño muestran distintos niveles de precisión al predecir cuál de dos publicaciones de LinkedIn del mismo autor recibirá mayor interacción. Estas diferencias surgen de la eficacia con la que cada modelo procesa los datos de entrada descritos en la evaluación comparativa y de la efectividad con la que identifica los factores que influyen en las reacciones de la audiencia.
Comprender las señales de participación
El estándar requiere que los modelos evalúen señales sutiles que predicen la participación. Los modelos con mejor rendimiento tienden a detectar estas señales con mayor precisión. Estas señales incluyen si la publicación:
- Presenta una reflexión personal o una lección.
- Hace una pregunta directa
- Es algo con lo que un público amplio puede identificarse.
- Parece promocional
- La estructura afecta la atención del lector.
Los modelos como DeepSeek Chat V3 y Claude Opus 4 funcionan bien porque identifican estas señales con mayor consistencia.
Utilizando información contextual
La evaluación incluye varios datos contextuales para cada publicación, y los modelos difieren en la eficacia con la que los utilizan. Cada modelo recibe:
- Texto de la publicación
- Tipo de medio, como texto, imagen, vídeo o enlace.
- Cubo de seguidores del autor
Para una predicción precisa, el modelo debe combinar estas entradas. Los modelos de mayor rendimiento reconocen patrones, como una menor interacción en las publicaciones con enlaces y una mayor interacción en las narrativas reflexivas. Los modelos menos eficaces suelen tratar las entradas de forma aislada o pasan por alto sus interacciones.
Interpretación del comportamiento humano
Predecir la participación requiere razonar sobre las preferencias de la audiencia. Solo unos pocos modelos demuestran una gran capacidad en este ámbito. Muchos modelos se mantienen cerca del 50 % de la base de referencia, ya que el comportamiento de la audiencia es variable y depende de factores psicológicos difíciles de inferir únicamente a partir del texto.
Los modelos con un rendimiento cercano al 52% demuestran una comprensión parcial de estas señales. Pueden identificar patrones generales, pero tienen dificultades en casos límite. Los modelos con puntuaciones muy bajas, como o1, parecen interpretar erróneamente los factores que impulsan la participación y, a menudo, favorecen la opción menos atractiva.
Influencia de los datos de entrenamiento
Cabe destacar que los resultados del modelo reflejan los datos con los que se entrena. Si los datos de entrenamiento no representan una amplia gama de estilos de comunicación o grupos demográficos, el modelo podría interpretar erróneamente ciertos tipos de contenido. Estas diferencias en el entrenamiento contribuyen directamente a la dispersión de los resultados en la evaluación comparativa.
Los modelos entrenados con conjuntos de datos más amplios o conversacionales tienden a aproximarse mejor a las reacciones de los usuarios. Los modelos entrenados con conjuntos de datos más limitados suelen basarse en características superficiales que no se correlacionan bien con la interacción real.
Generalización entre autores
El conjunto de datos incluye publicaciones de 50 autores con diferentes cantidades de seguidores, preferencias de medios y estilos de escritura. Los modelos deben generalizar a través de estas diferencias. Los modelos más robustos generan expectativas consistentes sobre qué impulsa la interacción, independientemente del autor.
Los modelos con menor rendimiento aplican criterios inconsistentes entre diferentes autores y publicaciones.
Consulte nuestra metodología para comprender cómo calculamos estas mediciones.
¿Qué es la simulación de audiencia?
La simulación de audiencia consiste en utilizar poblaciones sintéticas, basadas en modelos (a veces denominadas audiencias virtuales), para predecir cómo reaccionarían las personas reales ante contenidos, productos o propuestas políticas antes de su lanzamiento. En lugar de realizar pruebas en vivo con costosas encuestas o grupos focales, las organizaciones pueden crear perfiles que representen a su público objetivo y observar sus respuestas simuladas.
Esta técnica se basa en métodos de modelado basado en agentes, modelos de lenguaje a gran escala y simulación de perfiles de usuario. Cada agente o perfil simulado se diseña con atributos como datos demográficos, preferencias o tendencias de comportamiento. En conjunto, estos perfiles interactúan, generando datos sintéticos que se aproximan al comportamiento de un grupo de clientes o ciudadanos reales en la misma situación.
¿Cómo funcionan las herramientas de simulación de audiencia?
La mecánica de la simulación de audiencia depende de las herramientas utilizadas, pero la mayoría de los enfoques comparten componentes estándar:
- Diseño de perfiles de usuario : Los investigadores definen perfiles de usuario basándose en datos demográficos, psicográficos o segmentos de mercado específicos. Estos perfiles pueden variar desdeagentes simples basados en reglas hasta perfiles de IA detallados, enriquecidos con biografías y habilidades conversacionales.
- Generación de datos sintéticos : Los modelos de lenguaje a gran escala ayudan a simular diálogos, respuestas a encuestas o comportamientos de publicación. Por ejemplo, Artificial Societies opera entre 100 y 300 perfiles de IA que leen, reaccionan y comparten publicaciones de LinkedIn para simular la dinámica de la red.
- Modelado de interacción : Los usuarios no actúan de forma aislada. Interactúan, se influyen mutuamente y forman patrones como cámaras de eco, cascadas de publicaciones compartidas o cambios en la opinión pública. Esto permite que las simulaciones capturen no solo reacciones individuales, sino también fenómenos a nivel grupal.
- Pruebas de escenarios : Al variar elementos como el enfoque del mensaje, el tipo de medio o las preguntas de la encuesta, las organizaciones pueden observar cómo responden las audiencias simuladas a estas variaciones. Estos escenarios ayudan a generar hipótesis y a probar ideas en una fase de práctica segura antes de interactuar con personas reales.
- Análisis de datos : Los resultados se analizan mediante técnicas como nubes de palabras, análisis de sentimiento y puntuación de precisión. Los resultados pueden mostrar las posibles ganadoras entre dos variantes de publicación, temas comunes en los comentarios o la perspectiva de un usuario sobre por qué una idea resuena más que otra.
Casos de uso de simulación de audiencia
Marketing y publicidad
Las marcas pueden probar eslóganes, elementos visuales o el posicionamiento de sus productos con una audiencia virtual antes de invertir en una distribución a gran escala. En lugar de depender únicamente de las respuestas a encuestas tradicionales, pueden generar datos sintéticos a partir de perfiles de IA y comparar el rendimiento entre diferentes grupos.
Por ejemplo, los profesionales del marketing pueden determinar si un producto tiene mayor acogida entre la Generación Z que entre los profesionales de mayor edad y ajustar su estrategia creativa en consecuencia. Esta capacidad de validar las campañas en la fase de prueba permite ahorrar costes y lograr una segmentación más precisa.
Medios de comunicación y edición
Las empresas de medios pueden simular cómo funcionarán los diferentes formatos de contenido (por ejemplo, publicaciones cortas, artículos extensos, vídeos explicativos) entre sus audiencias.
La simulación de perfiles de usuario también permite probar cómo los titulares afectan a los clics o cómo el tono influye en las veces que se comparte el contenido. Al anticipar las reacciones, los editores pueden priorizar las historias con mayor probabilidad de difusión, en lugar de esperar a las métricas posteriores a la publicación.
Políticas públicas e investigación
Los gobiernos y los centros de investigación pueden utilizar la simulación de audiencias para poner a prueba ideas de investigación política. Las poblaciones sintéticas, modeladas a partir de datos demográficos específicos, pueden ilustrar cómo diferentes comunidades podrían responder a un nuevo impuesto, una nueva normativa sanitaria o una iniciativa climática. Los investigadores han aplicado simulaciones generativas para explorar temas como la polarización y la desinformación.
Este enfoque facilita la generación de hipótesis y proporciona un entorno más seguro para anticipar consecuencias no deseadas antes de interactuar con personas reales.
Desarrollo de productos
Las empresas pueden simular cómo los usuarios que representan a grupos demográficos específicos hablan sobre una nueva función o dispositivo. Por ejemplo, una empresa tecnológica podría comparar si los propietarios de pequeñas empresas, los estudiantes o los gerentes de grandes empresas encuentran más valor en una nueva actualización de software.
Los resultados de la simulación pueden servir de base para las decisiones de diseño y mitigar el riesgo de lanzar funciones que no conecten con el público objetivo.
Formación y educación
Las universidades y las empresas pueden utilizar simulaciones para crear entornos de práctica donde los estudiantes interactúen con personajes de IA. Un negociador en formación podría practicar con contrapartes simuladas, o un estudiante de medicina podría probar estrategias de comunicación con pacientes sintéticos.
Estos escenarios de entrenamiento ofrecen una gama realista de respuestas, lo que permite a los alumnos perfeccionar sus habilidades antes de encontrarse con personas reales.
Agencias de investigación de mercado
Las encuestas tradicionales y los grupos focales pueden resultar costosos y lentos. Las agencias de investigación de mercado pueden complementarlos con simulaciones de audiencia para generar datos sintéticos que proporcionen información valiosa y rápida.
Si bien las simulaciones no reemplazan la interacción con clientes reales, pueden reducir la dependencia de paneles costosos y acelerar las pruebas en las primeras etapas.
Herramientas de simulación de audiencia
Si buscas una herramienta específica para la simulación de audiencias en lugar de utilizar modelos de lenguaje de programación (LLM) , aquí tienes algunas opciones:
Sociedades artificiales
Artificial Societies permite a los usuarios describir un público objetivo en lenguaje sencillo o generarlo a partir de interacciones en redes sociales. A continuación, crea una «sociedad» de perfiles de usuario y ejecuta simulaciones basadas en inteligencia artificial.
Cada simulación incluye pruebas A/B automáticas, que generan variaciones de un mensaje según el estilo del usuario y las prueban con la audiencia. Los resultados se presentan con puntuaciones, comentarios y resúmenes, lo que permite una interpretación rápida. Los casos de uso abarcan relaciones públicas, desarrollo de productos, creación de marcas, marketing, periodismo y redes sociales.
Figura 1: Panel de simulación de Sociedades Artificiales.
Ejemplo de la vida real: Teneo
Teneo, una empresa de relaciones públicas, se preparaba para lanzar una nueva estrategia tecnológica y necesitaba comprobar si su mensaje tendría eco entre las partes interesadas clave antes de anunciarla públicamente. Sin embargo, la empresa se enfrentó a varias limitaciones:
- La estrategia era confidencial, lo que limitaba los métodos de investigación tradicionales.
- El plazo era ajustado, lo que dificultaba la realización de encuestas a gran escala.
- Resultaba prácticamente imposible llegar a públicos importantes, como los responsables políticos, los líderes de la industria y las partes interesadas especializadas, a través de los paneles de investigación de mercado convencionales.
Para abordar estos desafíos, Teneo se asoció con Artificial Societies. El proceso incluyó:
- Creación de perfiles de IA: Se generaron más de 5000 perfiles de IA. Estos perfiles se basaron en perfiles demográficos y psicográficos reales, obtenidos mediante el análisis de las redes sociales y la investigación cualitativa.
- Creación de “sociedades” especializadas: Las distintas sociedades de IA representaban a diferentes grupos de interés, entre ellos:
- consumidores
- colegas de la industria
- Responsables políticos, grupos de presión e influyentes políticos.
- Prueba de narrativas de mensajes: Los investigadores pusieron a prueba seis narrativas tecnológicas contrapuestas mediante encuestas y experimentos dentro de cada sociedad de IA.
- Análisis de las reacciones: Las respuestas se analizaron tanto a nivel agregado como a nivel de perfil individual, lo que permitió al equipo comparar las reacciones entre los diferentes segmentos de la audiencia.
La simulación produjo información valiosa a gran escala mucho más rápido que los métodos de investigación tradicionales. Los resultados clave incluyeron:
- Se generaron 189.756 respuestas únicas a partir de las simulaciones de IA.
- Conclusiones basadas en 30 preguntas de investigación exhaustivas distribuidas en seis narrativas.
- Identificación de la narrativa más eficaz y mensajes personalizados para cada segmento de audiencia.
- Entrega de resultados a través de una plataforma de análisis interactiva y un informe escrito. 1
Ask rally
Ask Rally es un simulador de audiencia virtual que permite a los usuarios probar preguntas, contenido e ideas con perfiles de IA diseñados para parecerse a audiencias reales.
Los usuarios crean o editan perfiles de usuario, o los clonan a partir de datos existentes, como entrevistas o encuestas. Tras definir su público objetivo, pueden formular preguntas y recibir respuestas generadas por estos perfiles, que pueden variar entre 5 y 100. La plataforma recopila las respuestas, ofrece información clave y permite a los agentes votar sobre las opciones disponibles.
Las características principales incluyen:
- Respuestas multiagente con resúmenes y análisis agregados.
- La memoria de perfiles de usuario basada en Mem0 permite que estos perfiles conserven el contexto y los patrones de comportamiento a lo largo del tiempo, lo que ayuda a simular reacciones de la audiencia más consistentes y realistas.
- La sofisticación de la audiencia en cuatro niveles permite a los usuarios modelar audiencias con diferentes niveles de experiencia o familiaridad con un tema.
- La simulación de reacciones a vídeos permite a los equipos probar cómo podría responder el público a contenidos de vídeo como anuncios, materiales de campaña o presentaciones.
- El acceso a la API permite a los equipos integrar el simulador en flujos de trabajo de investigación, herramientas internas o sistemas de pruebas automatizadas.
- Entornos de prueba para sitios web, campañas y medios de comunicación.
- Capacidades adicionales como gemelos digitales, entornos de simulación y calibración con datos del mundo real.
- Plan gratuito para experimentación y pruebas preliminares.
Audiencias generativas de Dentsu
Generative Audiences es una herramienta de inteligencia de marketing basada en IA que crea audiencias de consumidores simuladas a partir de datos reales. Ayuda a las marcas a mejorar la segmentación de audiencia, la planificación de medios y el rendimiento de las campañas, al permitir que los profesionales del marketing interactúen con estos perfiles de IA y analicen sus respuestas. 2
- Datos deterministas y basados en IA: Combina datos deterministas basados en personas con señales de comportamiento impulsadas por IA para modelar con precisión el comportamiento de la audiencia.
- Información interactiva sobre el consumidor: Los profesionales del marketing pueden interactuar con perfiles de usuario simulados para explorar sus motivaciones y comportamientos, por ejemplo, para probar cómo podrían responder las audiencias a nuevos mensajes, ideas de productos o acontecimientos actuales.
- Integración de datos de múltiples fuentes: Sintetiza múltiples fuentes de datos (estáticas y en tiempo real) y las integra con los datos existentes del cliente.
- Planificación y activación de medios: La información obtenida de las audiencias generadas por IA se puede utilizar para crear estrategias de medios específicas y activar campañas.
- Modelado de audiencias que respeta la privacidad: Gracias a que utiliza simulaciones estadísticas en lugar de depender en gran medida de identificadores personales, la solución puede ampliar la segmentación de audiencias sin dejar de cumplir mejor con las normas de privacidad.
Bicilíndrico eléctrico
Electric Twin es una plataforma de audiencia sintética que crea poblaciones digitales a partir de datos del mundo real. 3
- Modelado de audiencias sintéticas: Crea poblaciones digitales que representan grupos demográficos reales y simulan el comportamiento humano.
- Retroalimentación de la audiencia en tiempo real: Los usuarios pueden hacer preguntas y recibir respuestas inmediatas de perfiles simulados, en lugar de realizar encuestas.
- Pruebas de escenarios y mensajes: Los equipos pueden evaluar conceptos de productos, campañas, estrategias de precios y propuestas de políticas antes de su lanzamiento.
- Encuestas y grupos focales simulados: Permite realizar sondeos rápidos, entrevistas y debates al estilo de los grupos focales con perfiles de IA.
- Audiencias personalizadas y predefinidas: Las organizaciones pueden crear audiencias utilizando sus propios datos de encuestas o emplear poblaciones demográficas predefinidas de varios países.
- Motor de predicción: Compara los resultados con datos de encuestas reales para estimar las posibles respuestas de los consumidores.
- Entorno de investigación que preserva la privacidad: Las poblaciones sintéticas permiten probar ideas sin exponer datos sensibles o personales.
IA de similitud
Simile, creado por investigadores de Stanford, tiene como objetivo simular grandes grupos, o incluso sociedades enteras, para predecir cómo podrían reaccionar las personas ante productos, políticas o decisiones corporativas. 4
- Personas gemelas digitales: Crea agentes de IA que representan a individuos reales basándose en datos de comportamiento y entrevistas.
- Simulaciones de comportamiento humano a gran escala: Modelan las interacciones entre miles de agentes para predecir decisiones de consumo o resultados sociales.
- Previsión de escenarios: Las empresas pueden anticipar acontecimientos como cambios en la demanda de los consumidores o preguntas de los analistas durante las teleconferencias sobre resultados.
- Arquitectura de agentes generativos: los agentes de IA planifican acciones, forman opiniones e interactúan entre sí para producir dinámicas de comportamiento realistas.
Metodología de evaluación comparativa
Nuestra pregunta de investigación para este estudio comparativo fue: "¿Pueden los modelos de IA predecir qué publicación de LinkedIn obtendrá mayor interacción antes de su publicación?". Para ello, evaluamos la capacidad de los modelos de IA para predecir cuál de dos publicaciones de LinkedIn del mismo autor generará una mayor interacción total (me gusta + comentarios + compartidos) en los 7 días posteriores a su publicación.
Para nuestro conjunto de datos utilizamos publicaciones de 50 autores. Cada fila contiene un par de publicaciones del mismo autor con las siguientes características:
- Contenido de la publicación: Texto sin formato de ambas publicaciones
- Tipo de medio: texto/imagen/vídeo/enlace para cada publicación
- Contexto del autor: Rango de seguidores (por ejemplo, "1k-5k", "5k-20k")
- Datos reales: Cifras de participación reales y clasificación del ganador (A o B).
Datos de ejemplo:
Publicación A (Ganadora – 156 interacciones): “Después de tres startups fallidas, esto es lo que me hubiera gustado que alguien me dijera sobre la adecuación producto-mercado: Deja de desarrollar las funciones que solicitaron tus cinco usuarios beta. Empieza a obsesionarte con el problema que realmente enfrenta el 95 % de tu mercado objetivo. Cometí este error durante 2 años. No lo repitas. ¿Cuál es la lección más importante sobre productos que aprendiste por las malas?”
- Medios: texto
- Seguidores: 5k-20k
Mensaje B (84 interacciones): “¡Nos entusiasma compartir nuestro nuevo panel de análisis impulsado por IA! Echa un vistazo a la demostración y cuéntanos qué te parece.”
- Medios: enlace
- Seguidores: 5k-20k
Análisis : La publicación A ganó porque ofrece consejos específicos y prácticos basados en el fracaso personal, plantea una pregunta interesante y ofrece contenido con el que el público puede identificarse. La publicación B es una promoción genérica con menor potencial de interacción.
Evaluación
En la evaluación, cada modelo recibe esta información para ambos puestos:
- Texto de la publicación
- Tipo de medio
- cubo de recuento de seguidores del autor
Con esta información, se espera que los modelos predigan si la publicación A o la B tiene el mejor rendimiento. Pueden mostrarnos su razonamiento, pero no lo evaluamos en esta prueba comparativa.
Dado que los modelos tienen un 50% de probabilidad de acertar con respecto al mejor rendimiento (solo hay dos opciones), estamos considerando buscar en el futuro una línea base de "mejora por azar (precisión menos el 50%, que es la línea base de adivinación aleatoria)".
Sin embargo, en este conjunto de datos no hemos observado conjeturas aleatorias; todos los modelos explicaron su razonamiento, independientemente de si sus respuestas eran correctas o incorrectas.
¿Cuáles son los posibles desafíos de la simulación de audiencia?
A pesar de su potencial, la simulación de audiencia debe abordarse con precaución.
Validación con clientes reales
Las predicciones de las audiencias virtuales deben compararse con los resultados reales. Sin puntos de referencia, los resultados pueden generar una falsa sensación de seguridad. La validación es fundamental para garantizar que los perfiles sintéticos reflejen con precisión el comportamiento de las personas reales.
Sesgo en los modelos lingüísticos
Los perfiles de IA se configuran a partir de los datos utilizados para entrenar los modelos de lenguaje subyacentes. Si esos datos no representan adecuadamente a ciertos grupos, los perfiles resultantes pueden distorsionar la forma en que se representan determinados grupos demográficos. Esto puede afectar la manera en que se simulan las respuestas a las encuestas o la opinión pública.
Interpretabilidad
Si bien las conversaciones con perfiles de usuario o las nubes de palabras pueden mostrar temas comunes, no siempre queda claro por qué surgen resultados específicos. La complejidad de las respuestas en los modelos de aprendizaje por voz puede dificultar la explicación o la validación del comportamiento de la audiencia.
Directrices éticas
El uso de datos sintéticos para la investigación de clientes o la investigación de políticas requiere transparencia. Las organizaciones deben asegurarse de no presentar las simulaciones como un sustituto de los clientes reales y deben respetar los límites éticos al definir los perfiles de usuario .
Generalizabilidad
Las simulaciones dependen en gran medida del alcance del diseño de los perfiles de usuario. Un modelo entrenado con fundadores de empresas tecnológicas estadounidenses no puede predecir automáticamente las respuestas de la Generación Z en Asia. Existe el riesgo de generalizar en exceso al extender los resultados a poblaciones que no estuvieron representadas en la simulación.
Costo computacional
Realizar simulaciones detalladas con miles de perfiles de usuario puede requerir recursos considerables. Si bien las herramientas de IA están mejorando la eficiencia, los experimentos a gran escala aún exigen tiempo, conocimientos técnicos e infraestructura.
Sé el primero en comentar
Tu dirección de correo electrónico no será publicada. Todos los campos son obligatorios.