Benchmark

Simulação de Audiência: LLMs Podem Prever o Comportamento Humano?

atualizado em 28 abr. 2026

No marketing, avaliar com que precisão os LLMs preveem o comportamento humano é crucial para avaliar a sua eficácia na antecipação das necessidades da audiência e reconhecer os riscos de desalinhamento, comunicação ineficaz ou influência não intencional.

A simulação de audiência com LLMs permite a modelagem de audiências virtuais, ajudando as organizações a antecipar reações a conteúdos ou produtos sem depender de pesquisas caras ou grupos focais.

Testamos quão bem os modelos de IA podem prever qual de duas publicações do LinkedIn do mesmo autor terá maior engajamento (gostos, comentários, partilhas), essencialmente simulando o comportamento da audiência humana.

Resultados do benchmark de simulação de audiência

Loading Chart

Razões por trás das diferenças de desempenho nos LLMs

Os grandes modelos de linguagem mostram diferentes níveis de precisão na previsão de qual de duas publicações do LinkedIn do mesmo autor receberá maior engajamento. Estas diferenças emergem da forma como cada modelo processa os inputs descritos no benchmark e da eficácia com que identifica os fatores que influenciam as reações da audiência.

Compreensão dos sinais de engajamento

O benchmark exige que os modelos avaliem pistas subtis que preveem o engajamento. Os modelos de maior desempenho tendem a detetar estas pistas com mais precisão. Estas pistas incluem se a publicação:

Apresenta uma visão pessoal ou uma lição
Faz uma pergunta direta
É relevante para uma audiência ampla
Parece promocional
A estrutura afeta a atenção do leitor

Modelos como o DeepSeek Chat V3 e o Claude Opus 4 têm bom desempenho porque identificam estas pistas com maior consistência.

Utilização de informação contextual

A avaliação inclui vários elementos de dados contextuais para cada publicação, e os modelos diferem na forma como os utilizam. Cada modelo recebe:

Texto da publicação
Tipo de media, como texto, imagem, vídeo ou link
Intervalo de seguidores do autor

A previsão precisa exige que o modelo combine estes inputs. Os modelos de maior desempenho reconhecem padrões, como menor engajamento para publicações com link e maior engajamento para narrativas reflexivas. Os modelos mais fracos tratam frequentemente os inputs isoladamente ou ignoram as suas interações.

Interpretação do comportamento humano

Prever o engajamento requer raciocínio sobre as preferências da audiência. Alguns modelos exibem uma forte capacidade nesta área. Muitos modelos permanecem perto da linha de base de 50% porque o comportamento da audiência é variável e depende de fatores psicológicos que são difíceis de inferir apenas a partir do texto.

Os modelos que têm um desempenho em torno de 52% mostram uma compreensão parcial destas pistas. Conseguem identificar padrões gerais, mas têm dificuldades em casos limítrofes. Os modelos com pontuações baixas, como o o1, parecem avaliar mal os impulsionadores de engajamento padrão e frequentemente favorecem a opção menos envolvente.

Influência dos dados de treino

É de notar que os outputs dos modelos refletem os dados nos quais foram treinados. Se os dados de treino não representarem uma ampla gama de estilos de comunicação ou grupos demográficos, o modelo pode interpretar mal certos tipos de conteúdo. Estas diferenças de treino contribuem diretamente para a dispersão dos resultados no benchmark.

Os modelos treinados em conjuntos de dados mais amplos ou mais conversacionais tendem a aproximar melhor as reações dos utilizadores. Os modelos treinados em conjuntos de dados mais restritos baseiam-se frequentemente em características superficiais que não se correlacionam bem com o engajamento real.

Generalização entre autores

O conjunto de dados inclui publicações de 50 autores com várias contagens de seguidores, preferências de media e estilos de escrita. Os modelos devem generalizar através destas diferenças. Os modelos mais fortes formam expectativas consistentes sobre o que impulsiona o engajamento, independentemente do autor.

Os modelos de menor desempenho aplicam critérios inconsistentes entre diferentes autores e publicações.

Veja a nossa metodologia para compreender como calculamos estas medições.

O que é a simulação de audiência?

A simulação de audiência é a prática de utilizar populações sintéticas, baseadas em modelos, por vezes designadas como audiências virtuais, para prever como as pessoas reais podem reagir a conteúdos, produtos ou ideias de políticas antes de serem lançados. Em vez de realizar testes reais com pesquisas caras ou grupos focais, as organizações podem criar personas que representam a sua audiência-alvo e observar as suas respostas simuladas.

A técnica baseia-se em métodos de modelagem baseada em agentes, grandes modelos de linguagem e simulação de personas. Cada agente ou persona simulada é concebida com atributos como dados demográficos, preferências ou tendências comportamentais. Juntas, estas personas interagem, produzindo dados sintéticos que se aproximam do comportamento de um grupo de clientes ou cidadãos reais na mesma situação.

Como funcionam as ferramentas de simulação de audiência?

Os mecanismos da simulação de audiência dependem das ferramentas utilizadas, mas a maioria das abordagens partilha componentes padrão:

Design de personas: Os investigadores definem personas com base em dados demográficos, psicográficos ou segmentos de mercado específicos. Estas personas podem variar desde agentes simples baseados em regras até personas de IA detalhadas, enriquecidas com biografias e capacidades de conversação.
Geração de dados sintéticos: Os grandes modelos de linguagem ajudam a simular diálogos, respostas a pesquisas ou comportamentos de publicação. Por exemplo, a Artificial Societies opera 100–300 personas de IA que leem, reagem e partilham novamente publicações do LinkedIn para simular dinâmicas de rede.
Modelagem de interações: As personas não atuam isoladamente. Elas interagem, influenciam-se mutuamente e formam padrões como câmaras de eco, cascatas de republicações ou mudanças na opinião pública. Isto permite que as simulações capturem tanto reações individuais como fenómenos ao nível do grupo.
Teste de cenários: Ao variar inputs como o enquadramento da mensagem, tipo de media ou perguntas da pesquisa, as organizações podem observar como as audiências simuladas respondem a estas variações. Estes cenários ajudam a gerar hipóteses e a testar ideias numa fase de prática segura antes de envolver pessoas reais.
Análise de dados: Os outputs são analisados utilizando técnicas como nuvens de palavras, análise de sentimento e pontuação de precisão. Os resultados podem mostrar os prováveis vencedores entre duas variantes de publicação, temas comuns no feedback ou a perspetiva de uma persona sobre o porquê de uma ideia ressoar mais do que outra.

Exemplo real: Generative Agent Simulations de Stanford

Uma equipa de investigação da Universidade de Stanford desenvolveu uma arquitetura de agentes que converte dados qualitativos de entrevistas em representações de indivíduos reais baseadas em LLM.

Em vez de construir personas apenas a partir de rótulos demográficos, cada agente é fundamentado numa entrevista de duas horas com a pessoa que representa. Testados contra o General Social Survey, os agentes corresponderam às respostas dos seus indivíduos de origem quase tão bem quanto esses indivíduos corresponderam às suas próprias respostas quando inquiridos novamente com duas semanas de intervalo.

A arquitetura também mostrou uma redução do viés de previsão entre grupos raciais e ideológicos em comparação com abordagens de personas específicas por demografia, sugerindo que pode modelar populações diversas de forma mais fiel do que métodos mais simples.¹

Casos de uso da simulação de audiência

Marketing e publicidade

As marcas podem testar slogans de campanha, elementos visuais ou posicionamento de produto com uma audiência virtual antes de gastar em distribuição em larga escala. Em vez de dependerem apenas de respostas de pesquisas tradicionais, podem gerar dados sintéticos a partir de personas de IA e comparar o desempenho entre grupos.

Por exemplo, os profissionais de marketing podem determinar se um produto ressoa mais com a Geração Z do que com profissionais mais velhos e ajustar a sua estratégia criativa em conformidade. Esta capacidade de validar campanhas na fase de teste conduz a poupanças de custos e a um direcionamento mais preciso.

Exemplo real: Focus Agent

Investigadores da KU Leuven construíram um sistema multiagente que replica a estrutura de um grupo focal tradicional inteiramente em software, incluindo tanto os participantes como o papel de moderador.

O sistema foi validado através da realização de cinco sessões reais de grupos focais com 23 participantes humanos sobre os mesmos tópicos de discussão, comparando depois os outputs com os gerados apenas por participantes de IA. As opiniões geradas pela IA alinharam-se de perto com as dos respondentes humanos.

Além de substituir os participantes, o moderador LLM também ofereceu vantagens práticas sobre a moderação humana, como uma orientação de tópicos e gestão do tempo mais consistentes.²

Media e publicação

As empresas de media podem simular como diferentes formatos de conteúdo (por exemplo, publicações curtas, artigos longos, vídeos explicativos) terão desempenho entre as suas audiências.

A simulação de personas também permite testar como os títulos afetam os cliques ou como o tom influencia as partilhas. Ao antecipar reações, os editores podem dar prioridade a histórias com maior probabilidade de se difundirem, em vez de esperarem por métricas pós-publicação.

Políticas públicas e investigação

Os governos e os think tanks podem utilizar a simulação de audiência para testar ideias de investigação de políticas. Populações sintéticas modeladas com base em dados demográficos específicos podem ilustrar como diferentes comunidades podem responder a um novo imposto, regulamento de saúde ou iniciativa climática. Os investigadores aplicaram simulações generativas para explorar questões como a polarização e a desinformação.

Esta abordagem facilita a geração de hipóteses e proporciona um ambiente mais seguro para antecipar consequências não intencionais antes de envolver pessoas reais.

Desenvolvimento de produtos

As empresas podem simular como personas que representam dados demográficos específicos falam sobre uma nova funcionalidade ou dispositivo. Por exemplo, uma empresa de tecnologia poderia comparar se os proprietários de pequenas empresas, estudantes ou gestores empresariais encontram mais valor numa nova atualização de software.

Os insights da simulação podem informar decisões de design e mitigar o risco de lançar funcionalidades que não ressoam com a audiência pretendida.

Formação e educação

As universidades e empresas podem utilizar simulações para criar ambientes de prática onde os alunos interagem com personas de IA. Um negociador em formação pode praticar com contrapartes simuladas, ou um estudante de medicina pode testar estratégias de comunicação com pacientes sintéticos.

Estes cenários de formação oferecem uma gama realista de respostas, permitindo que os alunos refinem as suas competências antes de encontrarem indivíduos reais.

Agências de estudos de mercado

As perguntas de pesquisas tradicionais e os grupos focais podem ser dispendiosos e lentos. As agências de estudos de mercado podem complementá-los com simulação de audiência para gerar dados sintéticos que fornecem insights direcionais rápidos.

Embora as simulações não substituam o envolvimento com clientes reais, podem reduzir a dependência de painéis dispendiosos e acelerar os testes em fase inicial.

Deixe nossa equipe automatizar um dos seus processos de negócio com agentes de IA, gratuitamente.

Automatizar um processo

Ferramentas de simulação de audiência

Se procura uma ferramenta dedicada para simulação de audiência em vez de utilizar LLMs, aqui estão algumas opções:

Artificial Societies

A Artificial Societies permite que os utilizadores descrevam uma audiência-alvo em linguagem simples ou gerem uma com base em interações nas redes sociais. Em seguida, constrói uma "sociedade" de personas e executa simulações baseadas em IA.

Cada simulação inclui testes A/B automáticos, que geram variações de uma mensagem no estilo do utilizador e as testam contra a audiência. Os resultados são apresentados com pontuações, comentários e resumos, permitindo uma interpretação rápida. Os casos de uso abrangem RP, desenvolvimento de produtos, branding, marketing, jornalismo e redes sociais.

Figura 1: Painel de simulação de audiência da Artificial Societies.

Figura 1: Painel de simulação da Artificial Societies.

Exemplo real: Teneo

A Teneo, uma empresa de RP, estava a preparar-se para lançar uma nova estratégia de tecnologia e precisava de testar se as suas mensagens ressoariam com os principais stakeholders antes de as anunciar publicamente. No entanto, a empresa enfrentava várias restrições:

A estratégia era confidencial, limitando os métodos de investigação tradicionais.
O prazo era curto, dificultando a realização de pesquisas em larga escala.
Audiências importantes, como decisores políticos, líderes da indústria e stakeholders especializados, eram quase impossíveis de alcançar através de painéis de estudos de mercado convencionais.

Para enfrentar estes desafios, a Teneo estabeleceu uma parceria com a Artificial Societies. O processo incluiu:

Criação de personas de IA: Foram geradas mais de 5.000 personas de IA. Estas personas basearam-se em perfis demográficos e psicográficos reais, informados por escuta social e investigação qualitativa.
Construção de "sociedades" especializadas: Sociedades de IA separadas representavam diferentes grupos de stakeholders, incluindo:
- Consumidores
- Pares da indústria
- Decisores políticos, lobistas e influenciadores políticos.
Teste de narrativas de mensagens: Os investigadores testaram seis narrativas tecnológicas concorrentes utilizando pesquisas e experiências dentro de cada sociedade de IA.
Análise de reações: As respostas foram analisadas tanto a nível agregado como ao nível de persona individual, permitindo que a equipa comparasse reações entre segmentos de audiência.

A simulação produziu insights em larga escala mais rapidamente do que os métodos de investigação tradicionais. Os principais resultados incluíram:

189.756 respostas únicas geradas a partir das simulações de IA.
Insights baseados em 30 perguntas de investigação aprofundadas em seis narrativas.
Identificação da narrativa mais eficaz e mensagens personalizadas para cada segmento de audiência.
Entrega de resultados através de uma plataforma de análise interativa e um relatório escrito.³

Ask rally

O Ask Rally é um simulador de audiência virtual que permite aos utilizadores testar perguntas, conteúdos e ideias com personas de IA concebidas para se assemelharem a audiências reais.

Os utilizadores criam ou editam personas, ou clonam-nas a partir de dados existentes, como entrevistas ou pesquisas. Após definir uma audiência, podem fazer perguntas e receber respostas geradas por personas, variando de 5 a 100. A plataforma agrega respostas, fornece insights principais e permite que os agentes votem em opções.

As principais funcionalidades incluem:

Respostas multiagente com resumos agregados e insights.
A memória de personas baseada em Mem0 permite que as personas retenham contexto e padrões comportamentais, ajudando a simular reações de audiência mais consistentes e realistas.
Sofisticação de audiência em quatro níveis permite que os utilizadores modelem audiências com diferentes níveis de especialização ou familiaridade com um tópico.
A simulação de reação a vídeos permite que as equipas testem como as audiências podem responder a conteúdos de vídeo, como anúncios, materiais de campanha ou apresentações.
O acesso API permite que as equipas integrem o simulador em fluxos de trabalho de investigação, ferramentas internas ou pipelines de teste automatizados.
Ambientes de teste para websites, campanhas e media.
Capacidades adicionais, como gémeos digitais, ambientes de simulação e calibração contra dados do mundo real.
Plano gratuito para experimentação e testes iniciais.

Generative Audiences da Dentsu

O Generative Audiences é uma ferramenta de inteligência de marketing de IA que cria audiências de consumidores simuladas a partir de dados reais. Ajuda as marcas a melhorar o direcionamento de audiência, o planeamento de media e o desempenho de campanhas, permitindo que os profissionais de marketing interajam com estas personas de IA e analisem as suas respostas.⁴

Dados determinísticos e baseados em IA: Combina dados determinísticos baseados em pessoas com sinais comportamentais baseados em IA para modelar o comportamento da audiência com precisão.
Insights interativos do consumidor: Os profissionais de marketing podem interagir com personas simuladas para explorar motivações e comportamentos, por exemplo, para testar como as audiências podem responder a novas mensagens, ideias de produtos ou eventos atuais.
Integração de dados de múltiplas fontes: Sintetiza múltiplas fontes de dados (estáticas e em tempo real) e integra-se com dados existentes do cliente.
Planeamento e ativação de media: Os insights das audiências de IA podem ser utilizados para construir estratégias de media direcionadas e ativar campanhas.
Modelagem de audiência consciente da privacidade: Por utilizar simulações estatísticas em vez de depender fortemente de identificadores pessoais, a solução pode escalar o direcionamento de audiência mantendo-se mais compatível com a privacidade.

Electric Twin

O Electric Twin é uma plataforma de audiência sintética que cria populações digitais a partir de dados do mundo real.⁵

Modelagem de audiência sintética: Cria populações digitais que representam grupos demográficos reais e simulam o comportamento humano.
Feedback da audiência em tempo real: Os utilizadores podem fazer perguntas e receber respostas imediatas de personas simuladas, em vez de realizar pesquisas.
Teste de cenários e mensagens: As equipas podem avaliar conceitos de produtos, campanhas, estratégias de preços e propostas de políticas antes de as lançar.
Pesquisas e grupos focais simulados: Suporta sondagens rápidas, entrevistas e discussões ao estilo de grupos focais com personas de IA.
Audiências personalizadas e pré-construídas: As organizações podem construir audiências utilizando os seus próprios dados de pesquisas ou utilizar populações demográficas prontas em vários países.
Motor de previsão: Compara os resultados com dados de pesquisas do mundo real para estimar as prováveis respostas dos consumidores.
Ambiente de investigação que preserva a privacidade: As populações sintéticas permitem testar ideias sem expor dados sensíveis ou pessoais.

Simile IA

Construído por investigadores de Stanford, o Simile visa simular grandes grupos, ou mesmo sociedades inteiras, para prever como as pessoas podem reagir a produtos, políticas ou decisões empresariais.⁶

Personas gémeas digitais: Cria agentes de IA que representam indivíduos reais com base em dados comportamentais e entrevistas.
Simulações de comportamento humano em larga escala: Modela interações entre milhares de agentes para prever decisões de consumidores ou resultados sociais.
Previsão de cenários: As empresas podem antecipar eventos como mudanças na procura dos consumidores ou perguntas de analistas durante as chamadas de resultados.
Arquitetura de agentes generativos: Os agentes de IA planeiam ações, formam opiniões e interagem uns com os outros para produzir dinâmicas comportamentais realistas.

Metodologia do benchmark de simulação de audiência

A nossa pergunta de investigação para este benchmark foi "Podem os modelos de IA prever qual a publicação do LinkedIn que terá mais engajamento antes de ser publicada?" Para este fim, avaliámos quão bem os modelos de IA podem prever qual de duas publicações do LinkedIn do mesmo autor gerará maior engajamento total (gostos + comentários + partilhas) no prazo de 7 dias após a publicação.

Utilizámos publicações de 50 autores para o nosso conjunto de dados. Cada linha contém um par de publicações do mesmo autor com estas características:

Conteúdo da publicação: Texto bruto de ambas as publicações
Tipo de media: texto/imagem/vídeo/link para cada publicação
Contexto do autor: Intervalo de seguidores (ex.: "1k-5k", "5k-20k")
Verdade de referência: Números reais de engajamento e rótulo do vencedor (A ou B)

Dados de exemplo:

Publicação A (Vencedora – 156 de engajamento): "Após três startups falhadas, eis o que gostaria que alguém me tivesse dito sobre o product-market fit: Parem de construir funcionalidades que os vossos cinco utilizadores beta pediram. Comecem a obcecar com o problema que 95% do vosso mercado-alvo realmente enfrenta. Cometi este erro durante 2 anos. Não o repitam. Qual é a maior lição de produto que aprenderam da maneira difícil?"

Media: texto
Seguidores: 5k-20k

Publicação B (84 de engajamento): "Entusiasmados por partilhar o nosso novo painel de análise baseado em IA! Vejam a demonstração e digam-nos o que pensam."

Media: link
Seguidores: 5k-20k

Análise: A Publicação A venceu porque fornece conselhos específicos e acionáveis a partir de um fracasso pessoal, faz uma pergunta envolvente e oferece conteúdo relevante. A Publicação B é uma promoção genérica com menor potencial de engajamento.

Avaliação do benchmark de simulação de audiência

Na avaliação, cada modelo recebe esta informação para ambas as publicações:

Texto da publicação
Tipo de media
Intervalo de contagem de seguidores do autor

Com esta informação, espera-se que os modelos prevejam se a publicação A ou B é a de melhor desempenho. Eles podem mostrar-nos o seu raciocínio, mas não avaliamos o seu raciocínio neste benchmark.

Uma vez que os modelos têm uma probabilidade de 50% de serem precisos sobre o melhor desempenho (existem duas escolhas), estamos a considerar procurar o "ganho sobre o acaso (Precisão menos 50%, que é a linha de base da adivinhação aleatória)" como linha de base no futuro.

Ainda assim, neste conjunto de dados, não observámos adivinhação aleatória; todos os modelos explicaram o seu raciocínio, quer as suas respostas estivessem certas ou erradas.

Não perca os nossos benchmarks e insights baseados em dados. O botão abre o Google; selecionar a AIMultiple confirma que deseja ver a AIMultiple com mais frequência nos resultados de pesquisa do Google.

Adicionar como fonte preferencial

Quais são os potenciais desafios da simulação de audiência?

Apesar da sua promessa, a simulação de audiência deve ser abordada com cautela.

Validação contra clientes reais

As previsões de audiências virtuais devem ser comparadas com resultados reais. Sem benchmarks, os resultados podem criar falsa confiança. A validação é crucial para garantir que as personas sintéticas refletem com precisão o comportamento das pessoas reais.

Viés nos modelos de linguagem

As personas de IA são moldadas pelos dados que treinaram os modelos de linguagem subjacentes. Se esses dados sub-representarem certos grupos, as personas resultantes podem distorcer a forma como dados demográficos específicos são retratados. Isto pode afetar a forma como as respostas a pesquisas ou a opinião pública são simuladas.

Interpretabilidade

Embora as conversas de personas ou as nuvens de palavras possam mostrar temas comuns, nem sempre é claro porque é que determinados outputs emergem. A complexidade das respostas dos LLM pode dificultar a explicação ou validação do comportamento da audiência.

Diretrizes éticas

A utilização de dados sintéticos para investigação de clientes ou investigação de políticas requer transparência. As organizações devem garantir que não apresentam as simulações como um substituto para clientes reais e devem respeitar os limites éticos na definição de personas.

Generalização

As simulações são altamente dependentes do âmbito do design de personas. Um modelo treinado em fundadores de tecnologia baseados nos EUA não pode prever automaticamente as respostas da Geração Z na Ásia. A sobregeneralização é um risco quando se estendem descobertas a populações que não estavam representadas na simulação.

Custo computacional

A execução de simulações detalhadas com milhares de personas pode exigir recursos significativos. Embora as ferramentas de IA estejam a melhorar a eficiência, as experiências em larga escala ainda exigem tempo, conhecimento técnico e infraestrutura.

Cite esta pesquisa

Escolha o formato adequado ao local onde você vai publicar. Colar a versão com link no seu CMS preserva o backlink.

Sıla Ermut (2026) - "Simulação de Audiência: LLMs Podem Prever o Comportamento Humano?". Publicado on-line em AIMultiple.com. Acessado em 28 Abril 2026, em: https://aimultiple.com/audience-simulation [Recurso on-line]

Ermut, S. (2026, 28 Abril). Simulação de Audiência: LLMs Podem Prever o Comportamento Humano?. AIMultiple. https://aimultiple.com/audience-simulation

@misc{ermut2026,
  author = {Ermut, Sıla},
  title  = {{Simulação de Audiência: LLMs Podem Prever o Comportamento Humano?}},
  year   = {2026},
  month  = apr,
  howpublished    = {\url{https://aimultiple.com/audience-simulation}},
  note   = {AIMultiple. Acessado em 28 Abril 2026}
}

Links de referência

https://arxiv.org/pdf/2411.10109

https://arxiv.org/pdf/2409.01907

Artificial Societies

Dentsu Launches Generative Audiences: AI-Powered Growth Intelligence That Thinks Like Consumers | News | dentsu

Electric Twin - Synthetic Audiences for Instant Consumer Insights

Electric Twin

Home | Simile

Sıla Ermut

Analista do Setor

Sıla Ermut é analista do setor na AIMultiple com foco em marketing por email e vídeos de vendas. Anteriormente, trabalhou como recrutadora em empresas de gerenciamento de projetos e consultoria. Sıla possui mestrado em Psicologia Social e bacharelado em Relações Internacionais.

Ver perfil completo