Contate-nos
Nenhum resultado encontrado.

Análise comparativa de OCR de recibos com LLMs

Cem Dilmegani
Cem Dilmegani
atualizado em Jan 23, 2026
Veja o nosso normas éticas

A extração de dados de recibos é essencial para as empresas, visto que milhões de funcionários registram suas despesas relacionadas ao trabalho por meio desses documentos. Com os avanços recentes em IA generativa e grandes modelos de linguagem , a precisão da extração de dados atingiu um nível comparável ao dos humanos.

Avaliamos a precisão da extração de dados de modelos de reconhecimento de linguagem (LLMs) em imagens de recibos de baixa e alta qualidade, utilizando o algoritmo Claude 3.5 Sonnet para avaliar suas capacidades de extração de dados em recibos. Os resultados demonstram alta precisão no teste de OCR em recibos, com uma taxa média de sucesso de 97%.

Resultados de referência do OCR de recibos

Figura 1: Resultados da precisão da extração de dados.

Conjunto de dados

Dividimos nosso conjunto de dados em duas partes:

  • Alta qualidade: Recibos digitalizados em alta resolução. As imagens estão bem alinhadas e com alto contraste. 1

  • Baixa qualidade: Fotografado, baixa qualidade

    recibos. Essas imagens não estão alinhadas corretamente, sem nenhum pré-processamento para torná-las

    contraste maior. 2

Figura 2: Amostras de um conjunto de dados de alta qualidade e de um conjunto de dados de baixa qualidade.

Nosso objetivo é abordar casos da vida real o máximo possível.

Solicitamos uma saída em formato JSON para facilitar a avaliação. Nossa instrução é: Por favor, insira o texto dos PDFs em um formato JSON adequado.

Leia também o benchmark de OCR para faturas , caso tenha interesse.

Metodologia

Os resultados foram avaliados no nível de pares chave-valor:

  • Se um campo contiver o rótulo e o valor corretos, ele será marcado como correto.

  • Se houver alguma diferença de caracteres em relação ao valor ou à verdade fundamental no rótulo, essa linha será marcada como falsa.

Precisão da extração: Número de pares chave-valor extraídos corretamente dividido pelo número total de pares chave-valor.

O que é OCR de recibos?

O OCR (Reconhecimento Óptico de Caracteres) para recibos é uma tecnologia que extrai dados de recibos digitalizados e impressos usando inteligência artificial e algoritmos de aprendizado de máquina. O OCR para recibos analisa os dados, converte-os em um formato estruturado e captura detalhes do recibo, como data, itens e preços.

Melhores práticas para extrair dados de recibos

Para aumentar a precisão do OCR , as imagens devem ser:

  • Em alta resolução

  • Bem alinhado

  • Livre de erros de impressão

Você deve estar ciente de:

A maioria das ferramentas de OCR para recibos falha ao não conseguir associar o item correto ao preço correto quando há uma observação sobre o item na linha seguinte sem preço listado. Nesse caso, é comum que as ferramentas interpretem o preço do item seguinte como o preço da observação. Para entender melhor, vejamos o exemplo:

Figura 3: Um erro comum das ferramentas de OCR para recibos.

Nesses casos, o resultado do OCR pode corresponder a “SpcyDlx +PJ” com o preço 0,40, o que não está correto. Isso pode ocorrer principalmente quando a resolução e a qualidade da imagem são baixas e a imagem não está alinhada corretamente.

Notamos que, em casos de baixa resolução ou erros de impressão (tinta que não cobre completamente a letra, etc.), as ferramentas têm dificuldade em identificar letras e números semelhantes, como "8" e "9" ou "5" e "6". Também é comum haver dificuldade em identificar "/" e "1", principalmente em datas.

Tipos de dados que podem ser extraídos de recibos

  • Número do recibo

  • Data

  • Nome do fornecedor

  • Subtotal

  • Valor do imposto

  • Montante total

  • Itens comprados

Um guia passo a passo para extração de dados de recibos:

  • Digitalização de recibos: Digitalização do recibo em alta resolução. A digitalização de recibos por OCR ajuda a obter imagens de maior qualidade do que tirar fotos dos recibos.

  • Processamento de recibos: Para aumentar o contraste e a legibilidade da imagem de entrada, pode ser necessário processar os recibos.

  • Análise de recibos: Analisar a imagem do recibo é essencial para analisar e capturar dados, pois divide os dados em partes mais organizadas.

  • Utilização de dados estruturados: Dados estruturados podem ser usados para automatizar a entrada de dados em sistemas existentes, como softwares de contabilidade. Dados relevantes podem ser utilizados em diversos casos, como no rastreamento da data da transação em registros financeiros e na gestão de despesas. A extração automática de dados de recibos por meio de LLMs ou APIs de OCR para recibos pode reduzir erros e a entrada manual de dados, aumentando a eficiência geral com alta precisão.

Você também pode consultar nosso benchmark de OCR de escrita à mão.

Perguntas frequentes

A tecnologia OCR auxilia no rastreamento de despesas e na identificação de padrões de gastos. Os itens de linha em uma resposta JSON podem fornecer informações importantes e ajudar a economizar tempo, extraindo automaticamente o texto bruto de documentos e faturas. As empresas podem ajustar um mecanismo de OCR de acordo com as necessidades do projeto. Números de empresas de diferentes países, como o número de empresa australiano e o número de IVA, podem ser extraídos de recibos.

Cem Dilmegani
Cem Dilmegani
Analista Principal
Cem é o analista principal da AIMultiple desde 2017. A AIMultiple fornece informações para centenas de milhares de empresas (segundo o SimilarWeb), incluindo 55% das empresas da Fortune 500, todos os meses. O trabalho de Cem foi citado por importantes publicações globais, como Business Insider, Forbes e Washington Post, além de empresas globais como Deloitte e HPE, ONGs como o Fórum Econômico Mundial e organizações supranacionais como a Comissão Europeia. Você pode ver mais empresas e recursos renomados que mencionaram a AIMultiple. Ao longo de sua carreira, Cem atuou como consultor de tecnologia, comprador de tecnologia e empreendedor na área. Ele assessorou empresas em suas decisões tecnológicas na McKinsey & Company e na Altman Solon por mais de uma década. Também publicou um relatório da McKinsey sobre digitalização. Liderou a estratégia de tecnologia e a área de compras de uma empresa de telecomunicações, reportando-se diretamente ao CEO. Além disso, liderou o crescimento comercial da empresa de tecnologia avançada Hypatos, que atingiu uma receita recorrente anual de sete dígitos e uma avaliação de nove dígitos, partindo de zero, em apenas dois anos. O trabalho de Cem no Hypatos foi noticiado por importantes publicações de tecnologia, como TechCrunch e Business Insider. Cem participa regularmente como palestrante em conferências internacionais de tecnologia. Ele se formou em engenharia da computação pela Universidade Bogazici e possui um MBA pela Columbia Business School.
Ver perfil completo

Seja o primeiro a comentar

Seu endereço de e-mail não será publicado. Todos os campos são obrigatórios.

0/450