Benchmark

Benchmark de Reconhecimento de Manuscrito: LLMs vs OCRs

atualizado em 2 jul. 2026

As ferramentas de OC R alcançam mais de 99% de precisão em texto digitado em imagens de alta qualidade. No entanto, a caligrafia continua sendo um desafio devido a variações no estilo, espaçamento e irregularidades. Apresentamos um benchmark de caligrafia cursiva com 100 amostras de caligrafia escritas por nossa equipe para evitar sobreajuste.

Resultados do benchmark de caligrafia cursiva

Neste benchmark, GPT-5, Gemini 3 Pro Preview e olmOCR-2-7B-1025-FP8 são os modelos com melhor desempenho, alcançando as pontuações mais altas de similaridade semântica e a interpretação mais consistente de texto cursivo em todas as amostras.

Os nomes completos dos produtos estão abaixo, nós os encurtamos no gráfico. Neste benchmark, são usadas suas versões mais recentes até novembro de 2025:

GPT-5
Gemini 3 Pro Preview
Gemini 2.5 Pro
olmOCR-2-7B-1025-FP8
Moondream OCR
Claude Sonnet 4.5
Nanonets-OCR2-3B
Dots OCR
Azure Cognitive Service
Google Vision
Mistral OCR
PaddleOCR-VL
Amazon Textract
Deepseek OCR

Metodologia do benchmark de caligrafia cursiva

Para este benchmark, 10 redatores escreveram à mão 10 parágrafos cada um em cursivo, resultando em um conjunto de dados de 100 amostras de caligrafia cursiva. Não foi solicitado aos redatores que escrevessem de forma legível. A conectividade natural das letras, a variabilidade do traço, a distorção do espaçamento e a fluidez da linha foram intencionalmente preservadas para refletir a complexidade realista da cursiva.

O conjunto de dados inclui:

Inclinação variável, pressão do traço e padrões de ligadura
Texto misturado com números, pontuação e capitalização
Diversas resoluções de imagem e fundos para garantir robustez

Todas as amostras foram avaliadas usando nosso pipeline de avaliação OCR unificado, baseado na similaridade de cosseno para uma comparação justa.

Exemplo de imagem digitalizada:

O que é reconhecimento de manuscrito?

O reconhecimento de manuscrito, também conhecido como OCR de manuscrito ou OCR cursivo, é um subcampo da OCR tecnologia que traduz letras manuscritas para texto digital correspondente ou comandos em tempo real. Para realizar esta tarefa, esses sistemas se beneficiam da correspondência de padrões para identificar vários estilos de letras manuscritas. A Wikipedia define o reconhecimento de manuscrito como:

A capacidade de um computador de receber e interpretar entrada manuscrita inteligível de fontes como documentos em papel, fotografias, telas sensíveis ao toque e outros dispositivos.

LLM habilidades de reconhecimento de manuscrito também são altamente desenvolvidas, em nosso benchmark, gemini-3-pro é 100% preciso.

O que está incluído na caligrafia?

Por caligrafia, nos referimos a textos escritos em forma de manuscrito e cursiva. Textos em estilo manuscrito são mais fáceis de reconhecer, pois os caracteres são escritos separadamente como letras de forma. No entanto, a caligrafia cursiva envolve caracteres unidos conforme são escritos.

Este aspecto exige que as ferramentas de reconhecimento de manuscrito percebam cada caractere separadamente corretamente e os identifiquem com precisão. Abaixo estão exemplos de escrita manuscrita e cursiva.

Fonte: Quora¹

As ferramentas de reconhecimento de manuscrito também podem identificar caligrafia em telas digitais. Esse tipo de caligrafia pode ser rastreado conforme é escrita. O software pode aproveitar seu movimento dinâmico para fornecer resultados mais precisos. Abaixo está um exemplo de reconhecimento de manuscrito digital, fornecido pelo Microsoft Azure Ink Recognizer API.

Quais são os desafios de converter caligrafia em texto?

Embora as ferramentas tradicionais de OCR estejam no mercado desde os anos 70, ainda não existem muitas ferramentas que possam lidar com o reconhecimento de manuscrito. Como cada pessoa tem seu próprio estilo de escrita, as ferramentas tradicionais de OCR não conseguem perceber a caligrafia de todos.

Além da tecnologia de visão computacional, algoritmos de aprendizado profundo altamente complexos são necessários para identificar todas essas variações com sucesso. Abaixo está uma lista de desafios que as ferramentas de reconhecimento de manuscrito encontram com frequência:

Desafios

Qualidade da imagem: O texto manuscrito é frequentemente capturado em baixa resolução ou iluminação ruim. As páginas podem incluir manchas, sombras ou borrões que atuam como ruído de fundo.
Variedade de estilos de escrita: Cada indivíduo tem uma forma única de escrever. Diferenças em alfabetos, formas de letras e tamanhos de caracteres dificultam o reconhecimento.
Texto inclinado: Linhas manuscritas raramente são perfeitamente retas. As palavras podem inclinar, curvar ou até aparecer em ângulos incomuns.
Caracteres conectados: Na escrita cursiva ou rápida, letras e símbolos frequentemente se unem, tornando-os mais difíceis de separar.
Degradação: Documentos mais antigos ou muito utilizados podem ter tinta desbotada, amarelamento ou danos na página, reduzindo a clareza do texto.

Soluções

As ferramentas modernas de HTR combinam visão computacional com aprendizado profundo para superar esses desafios. Essas abordagens vão além do OCR tradicional, que existe desde os anos 1970, mas ainda tem dificuldades com a caligrafia. Hoje, o progresso está sendo feito por meio de:

Melhorar a qualidade de entrada: Capture ou digitalize documentos com maior resolução e melhor iluminação.
Limpeza de fundo: Use técnicas de aprendizado de máquina ou fotografia para remover ruídos e melhorar a clareza.
Algoritmos de reconhecimento avançados: Aplique modelos de aprendizado profundo projetados para lidar com estilos de escrita variados, alfabetos e letras conectadas.
Correção de inclinação: Use ferramentas de processamento de imagem para detectar e corrigir texto inclinado ou rotacionado.
Design amigável para OCR: Quando possível, crie formulários e documentos que sejam fáceis para as ferramentas de OCR processarem.

Deixe nossa equipe automatizar um dos seus processos de negócio com agentes de IA, gratuitamente.

Automatizar um processo

Preparação para conversão de notas manuscritas

Há uma variedade de fatores a considerar ao projetar documentos. O mais importante são os dados a serem capturados dos documentos. Como existem diferentes maneiras de representar o mesmo tipo de dados, você precisa considerar a velocidade, a precisão e a facilidade de uso de cada opção ao construir seu documento.²,³,⁴

1. Digitalização e pré-processamento

Garanta uma digitalização clara: Use um scanner ou um aplicativo dedicado para criar uma imagem de alta resolução e bem iluminada de suas anotações.
Binarização: Converta a imagem digitalizada em preto e branco para melhorar o contraste e tornar o texto mais distinto do fundo.

Fonte: Datacap.hk

Remoção de ruído e correção de inclinação: Aplique filtros para remover quaisquer marcas ou sombras perdidas e corrija qualquer inclinação no documento. Evite fundos coloridos. Aproveite os elementos de alinhamento para evitar documentos inclinados.

2. Técnicas de segmentação

A segmentação é o processo de dividir a imagem em componentes menores e mais gerenciáveis, como linhas de texto, palavras e caracteres individuais. Para garantir isso, as empresas podem usar métodos de segmentação, que você pode ver abaixo.

Fonte: How OCR Works⁵

Segmentação de linhas de texto: Este é um pré-requisito para outras tarefas e envolve a separação do documento em linhas individuais de texto. Mantenha os dados dentro das margens.
Segmentação de palavras e caracteres: Após a segmentação de linhas, você pode dividir ainda mais as linhas em palavras individuais e, em seguida, caracteres, o que é crucial para o reconhecimento preciso de texto.
Utilização de ferramentas avançadas de IA: Ferramentas alimentadas por IA, como o Transkribus, podem realizar segmentação sofisticada de texto e layout automaticamente para notas complexas.

3. Incorporando caixas de seleção para digitalização mais fácil

Caixas pré-impressas: Se você sabe que irá digitalizar suas anotações, desenhe ou imprima caixas de seleção claramente na página, garantindo que sejam grandes o suficiente para serem facilmente reconhecidas pelo software de OCR.
Formatação clara: Certifique-se de que as caixas de seleção não estejam muito próximas do texto ao qual estão associadas e tenham contraste suficiente com o papel.
Aproveite o OCR alimentado por IA: As ferramentas podem ser treinadas para reconhecer essas caixas de seleção, permitindo um processamento e extração mais fáceis de informações marcadas/não marcadas.
Padronize: Use o mesmo tipo de caixa de seleção e estilo em todas as suas anotações para consistência.

4. Usando software de OCR

Aplique OCR: Uma vez que as notas estão digitalizadas e segmentadas, use o software de Reconhecimento Óptico de Caracteres (OCR) para converter as imagens do texto em texto digital legível por máquina.
Pós-processamento: Revise o texto digitalizado em busca de erros, especialmente em áreas com caligrafia complexa ou layouts incomuns.

Existe pesquisa ativa sobre reconhecimento de manuscrito?

Como a capacidade de reconhecimento de manuscrito depende muito de redes neurais, os avanços nesses algoritmos afetam profundamente o desempenho das ferramentas de reconhecimento de manuscrito. Assim, a pesquisa ativa sobre reconhecimento de manuscrito geralmente é baseada em algoritmos de redes neurais.

A pesquisa do Google sobre reconhecimento de manuscrito começa com várias etapas de treinamento:

Introdução de todos os caracteres possíveis de diferentes alfabetos
Treinamento da ferramenta para segmentar cada caractere em um texto
Treinamento da ferramenta para extração de recursos para identificação precisa de caracteres

O Google também está usando algoritmos de processamento de linguagem para melhorar o desempenho do reconhecimento de manuscrito. Por exemplo, se a ferramenta precisar decidir entre “i” e “l”, ela pode analisar a palavra inteira e decidir o caractere adequado para fornecer resultados precisos.

O software de OCR geralmente possui vários mecanismos de reconhecimento de manuscrito integrados ao software. Esses mecanismos trabalham sincronizadamente para gerar a representação de caractere mais precisa correspondente à entrada.

Não perca os nossos benchmarks e insights baseados em dados. O botão abre o Google; selecionar a AIMultiple confirma que deseja ver a AIMultiple com mais frequência nos resultados de pesquisa do Google.

Adicionar como fonte preferencial

Fornecedores de reconhecimento de manuscrito

Como o reconhecimento de manuscrito é um subcampo do OCR, os critérios para escolher o reconhecimento de manuscrito adequado são semelhantes aos das ferramentas de OCR. Ao selecionar um fornecedor de reconhecimento de manuscrito, você deve considerar os seguintes fatores:

Precisão no reconhecimento de caracteres
Capacidades de aprendizado contínuo
Velocidade de computação caso os resultados precisem ser entregues em tempo real
Facilidade de uso da interface, se a interface for usada por humanos

Além desses, práticas recomendadas de aquisição, como garantir um Custo Total de Propriedade (TCO) mínimo, flexibilidade, práticas recomendadas de segurança de dados e evitar dependência de fornecedor, são essenciais.

Abaixo você pode encontrar uma pequena lista de fornecedores de reconhecimento de manuscrito. Você também deve ter em mente que esses fornecedores também podem fornecer serviços de OCR para o seu negócio.

Abbyy
Google Cloud Vision API
Hanvon Technology
Hanwang Technology
Infrrd.ai
MicroBlink
Microsoft Azure Read API
Mitek
MyScript
Selvasai
Unitek.ai
Vidado

Perguntas frequentes

Use um leitor de cursiva ou software de reconhecimento de manuscrito para ajudar a decifrar caligrafia ilegível
Endireite e achate as notas de papel para evitar inclinação ou distorção, e obtenha digitalizações com a maior qualidade possível
Use software de reconhecimento óptico de caracteres (OCR) para converter imagens digitalizadas ou fotografias de texto manuscrito.
Exporte o texto digital convertido para arquivos PDF ou outros formatos para compartilhamento ou armazenamento

Procure por recursos como reconhecimento de caracteres, tinta digital e suporte a letras de forma

Se você quiser ler mais sobre ferramentas de reconhecimento de manuscrito, estes artigos também podem interessá-lo:

Cite este benchmark

Escolha o formato adequado ao local onde você vai publicar. Colar a versão com link no seu CMS preserva o backlink.

Cem Dilmegani (2026) - "Benchmark de Reconhecimento de Manuscrito: LLMs vs OCRs". Publicado on-line em AIMultiple.com. Acessado em 2 Julho 2026, em: https://aimultiple.com/handwriting-recognition [Recurso on-line]

Dilmegani, C. (2026, 2 Julho). Benchmark de Reconhecimento de Manuscrito: LLMs vs OCRs. AIMultiple. https://aimultiple.com/handwriting-recognition

@misc{dilmegani2026,
  author = {Dilmegani, Cem},
  title  = {{Benchmark de Reconhecimento de Manuscrito: LLMs vs OCRs}},
  year   = {2026},
  month  = jul,
  howpublished    = {\url{https://aimultiple.com/handwriting-recognition}},
  note   = {AIMultiple. Acessado em 2 Julho 2026}
}

Links de referência

When you write, do you print or use cursive? - Quora

Enhanced Hybrid Technique for Efficient Digitization of Handwritten Marksheets

Page restricted | ScienceDirect

Preprocessing Techniques for Online Handwriting Recognition | Springer Nature Link

Springer Berlin Heidelberg

Putting the Hardware to Work | How OCR Works

Cem Dilmegani

Analista Principal

Cem é o analista principal da AIMultiple desde 2017. A AIMultiple fornece informações para centenas de milhares de empresas (segundo o SimilarWeb), incluindo 55% das empresas da Fortune 500, todos os meses. O trabalho de Cem foi citado por importantes publicações globais, como Business Insider, Forbes e Washington Post, além de empresas globais como Deloitte e HPE, ONGs como o Fórum Econômico Mundial e organizações supranacionais como a Comissão Europeia. Você pode ver mais empresas e recursos renomados que mencionaram a AIMultiple. Ao longo de sua carreira, Cem atuou como consultor de tecnologia, comprador de tecnologia e empreendedor na área. Ele assessorou empresas em suas decisões tecnológicas na McKinsey & Company e na Altman Solon por mais de uma década. Também publicou um relatório da McKinsey sobre digitalização. Liderou a estratégia de tecnologia e a área de compras de uma empresa de telecomunicações, reportando-se diretamente ao CEO. Além disso, liderou o crescimento comercial da empresa de tecnologia avançada Hypatos, que atingiu uma receita recorrente anual de sete dígitos e uma avaliação de nove dígitos, partindo de zero, em apenas dois anos. O trabalho de Cem no Hypatos foi noticiado por importantes publicações de tecnologia, como TechCrunch e Business Insider. Cem participa regularmente como palestrante em conferências internacionais de tecnologia. Ele se formou em engenharia da computação pela Universidade Bogazici e possui um MBA pela Columbia Business School.

Ver perfil completo

Comentários 4

Compartilhe suas ideias

Seu endereço de e-mail não será publicado. Todos os campos são obrigatórios. Os comentários são deixados em seu idioma original.

Swanidhi Singh

Aug 07, 2025 at 00:28

Exactly what I was looking for. Thank you!

Sara

Sep 22, 2021 at 06:40

Hi Cem, your article is very clear and practical. Thank you for sharing your knowledge! It will be very useful for me.

Vivienne

Feb 10, 2021 at 00:03

See Transkribus from readcoop for handwritten text recognition for cursive writing.

Leonard

Dec 10, 2020 at 11:08

Which service or software would you recommend in this case: - manuscript/diary 100s of pages written by one author - other language than English (German in this case) I need the software to learn my handwriting, that is not in English and preferably with a good tool to correct all the error.

Cem Dilmegani

Dec 12, 2020 at 19:54

Thank you for reaching out. You can try Google Cloud Vision. It is not bad at handwriting recognition and is free to try. I don't know if it can get user feedback to improve its models. Let us know if you find that functionality.