Benchmark

Benchmark sul riconoscimento della scrittura a mano: LLMs vs OCRs

Cem Dilmegani

con

Ezgi Arslan, PhD.

aggiornato il 29 lug. 2026

Guarda il nostro norme etiche

Cita Questo Benchmark

OC R strumenti raggiungono una precisione superiore al 99% sul testo dattiloscritto in immagini di alta qualità. Tuttavia, la scrittura a mano rimane impegnativa a causa di variazioni nello stile, nella spaziatura e nelle irregolarità. Introduciamo un benchmark di scrittura in corsivo con 100 campioni di scrittura a mano scritti dal nostro team per prevenire l'overfitting.

Risultati del benchmark sulla scrittura in corsivo

In questo benchmark, GPT-5, Gemini 3 Pro Preview e olmOCR-2-7B-1025-FP8 sono i modelli migliori, ottenendo i punteggi più alti di somiglianza semantica e l'interpretazione più coerente del testo in corsivo su tutti i campioni.

Loading Chart

I nomi completi dei prodotti sono elencati di seguito, li abbiamo abbreviati nel grafico. In questo benchmark, sono state utilizzate le loro ultime versioni a novembre 2025:

GPT-5
Gemini 3 Pro Preview
Gemini 2.5 Pro
olmOCR-2-7B-1025-FP8
Moondream OCR
Claude Sonnet 4.5
Nanonets-OCR2-3B
Dots OCR
Azure Cognitive Service
Google Vision
Mistral OCR
PaddleOCR-VL
Amazon Textract
Deepseek OCR

Metodologia del benchmark sulla scrittura in corsivo

Per questo benchmark, 10 scrittori hanno scritto a mano 10 paragrafi ciascuno in corsivo, producendo un dataset di 100 campioni di scrittura in corsivo. Non è stato chiesto loro di scrivere in modo ordinato. La connettività naturale delle lettere, la variabilità del tratto, la distorsione della spaziatura e la fluidità delle linee sono state conservate intenzionalmente per riflettere la complessità realistica del corsivo.

Il dataset include:

Inclinazione variabile, pressione del tratto e schemi di legatura
Testo misto a numeri, punteggiatura e maiuscole
Risoluzioni e sfondi delle immagini diversi per garantire robustezza

Tutti i campioni sono stati valutati utilizzando la nostra pipeline di valutazione OCR unificata, basata sulla similarità del coseno per un confronto equo.

Immagine scansionata di esempio:

Che cos'è il riconoscimento della scrittura a mano?

Il riconoscimento della scrittura a mano, noto anche come OCR per la scrittura a mano o OCR per il corsivo, è un sottocampo della OCR tecnologia che traduce le lettere scritte a mano in testo digitale corrispondente o comandi in tempo reale. Per eseguire questo compito, questi sistemi si avvalgono del pattern matching per identificare vari stili di lettere manoscritte. Wikipedia definisce il riconoscimento della scrittura a mano come:

La capacità di un computer di ricevere e interpretare input scritto a mano intelligibile da fonti come documenti cartacei, fotografie, touch-screen e altri dispositivi.

Le capacità di riconoscimento della scrittura a mano degli LLM sono anch'esse molto sviluppate; nel nostro benchmark, gemini-3-pro è preciso al 100%.

Cosa comprende la scrittura a mano?

Per scrittura a mano, ci riferiamo a testi scritti in stampatello e in corsivo. I testi in stampatello sono più facili da riconoscere poiché i caratteri sono scritti separatamente come lettere maiuscole. Tuttavia, la scrittura in corsivo coinvolge caratteri uniti mentre vengono scritti.

Questo aspetto richiede che gli strumenti di riconoscimento della scrittura a mano percepiscano correttamente ogni singolo carattere e lo identifichino con precisione. Di seguito sono riportati esempi di scrittura in stampatello e in corsivo.

Fonte: Quora¹

Gli strumenti di riconoscimento della scrittura a mano possono anche identificare la scrittura su schermi digitali. Questo tipo di scrittura può essere tracciato mentre viene scritto. Il software può sfruttare il movimento dinamico per fornire risultati più accurati. Di seguito un esempio di riconoscimento della scrittura digitale, fornito dall'Ink Recognizer API di Microsoft Azure.

Quali sono le sfide nella conversione della scrittura a mano in testo?

Anche se gli strumenti OCR tradizionali sono sul mercato dagli anni 70s, non ci sono ancora molti strumenti in grado di gestire il riconoscimento della scrittura a mano. Poiché ognuno ha il proprio stile di scrittura, gli strumenti OCR tradizionali non riescono a percepire la scrittura di tutti.

Oltre alla tecnologia di visione artificiale, sono necessari algoritmi di deep learning altamente complessi per identificare con successo tutte queste variazioni. Di seguito un elenco di sfide che gli strumenti di riconoscimento della scrittura a mano incontrano frequentemente:

Sfide

Qualità dell'immagine: Il testo scritto a mano viene spesso catturato a bassa risoluzione o in condizioni di scarsa illuminazione. Le pagine possono includere macchie, ombre o sbavature che agiscono come rumore di fondo.
Varietà degli stili di scrittura: Ogni individuo ha un modo unico di scrivere. Le differenze negli alfabeti, nelle forme delle lettere e nelle dimensioni dei caratteri rendono il riconoscimento più difficile.
Testo inclinato: Le righe scritte a mano raramente sono perfettamente diritte. Le parole possono inclinarsi, curvarsi o addirittura apparire ad angolazioni insolite.
Caratteri collegati: Nella scrittura in corsivo o veloce, le lettere e i simboli spesso si uniscono tra loro, rendendone più difficile la separazione.
Degrado: I documenti più vecchi o molto utilizzati possono presentare inchiostro sbiadito, ingiallimento o danni alla pagina, riducendo la chiarezza del testo.

Soluzioni

I moderni strumenti HTR combinano la visione artificiale con il deep learning per superare queste sfide. Questi approcci vanno oltre l'OCR tradizionale, che esiste dagli anni '70 ma che ancora fatica con la scrittura a mano. Oggi, i progressi vengono compiuti attraverso:

Migliorare la qualità dell'input: Acquisire o scansionare documenti a risoluzione più elevata e con una migliore illuminazione.
Pulizia dello sfondo: Utilizzare tecniche di apprendimento automatico o fotografiche per rimuovere il rumore e migliorare la chiarezza.
Algoritmi di riconoscimento avanzati: Applicare modelli di deep learning progettati per gestire stili di scrittura, alfabeti e lettere collegate differenti.
Correzione dell'inclinazione: Utilizzare strumenti di elaborazione delle immagini per rilevare e correggere il testo inclinato o ruotato.
Progettazione amichevole dell'OCR: Quando possibile, creare moduli e documenti facili da elaborare per gli strumenti OCR.

Lascia che il nostro team automatizzi uno dei tuoi processi aziendali con agenti IA, gratuitamente.

Automatizza un processo

Preparazione per la conversione degli appunti scritti a mano

Ci sono diversi fattori da considerare durante la progettazione dei documenti. Il più importante sono i dati da estrarre dai documenti. Poiché esistono modi diversi per rappresentare lo stesso tipo di dati, è necessario considerare la velocità, la precisione e la facilità d'uso di ciascuna opzione durante la creazione del documento.²,³,⁴

1. Scansione e preelaborazione

Garantire una scansione nitida: Utilizzare uno scanner o un'app dedicata per creare un'immagine dei propri appunti ad alta risoluzione e ben illuminata.
Binarizzazione: Convertire l'immagine scansionata in bianco e nero per migliorare il contrasto e rendere il testo più distinto dallo sfondo.

Fonte: Datacap.hk

Rimozione del rumore e correzione dell'inclinazione: Applicare filtri per rimuovere eventuali segni vaganti o ombre e correggere qualsiasi inclinazione del documento. Evitare sfondi colorati. Utilizzare elementi di allineamento per prevenire documenti inclinati.

2. Tecniche di segmentazione

La segmentazione è il processo di suddivisione dell'immagine in componenti più piccole e gestibili, come righe di testo, parole e singoli caratteri. Per garantire ciò, le aziende possono utilizzare metodi di segmentazione, che puoi vedere di seguito.

Fonte: How OCR Works⁵

Segmentazione delle righe di testo: Questo è un prerequisito per altre attività e consiste nel separare il documento in singole righe di testo. Mantenere i dati entro i margini.
Segmentazione di parole e caratteri: Dopo la segmentazione delle righe, è possibile dividere ulteriormente le righe in singole parole e poi in caratteri, il che è cruciale per un riconoscimento accurato del testo.
Utilizzo di strumenti IA avanzati: Strumenti basati sull'IA come Transkribus possono eseguire automaticamente una sofisticata segmentazione del testo e del layout per appunti complessi.

3. Incorporare caselle di controllo per facilitare la digitalizzazione

Caselle prestampate: Se si prevede di digitalizzare gli appunti, disegnare o stampare chiaramente caselle di controllo sulla pagina, assicurandosi che siano sufficientemente grandi per essere facilmente riconosciute dal software OCR.
Formattazione chiara: Assicurarsi che le caselle di controllo non siano troppo vicine al testo a cui sono associate e che abbiano un contrasto sufficiente con la carta.
Sfruttare l'OCR basato sull'IA: Gli strumenti possono essere addestrati a riconoscere queste caselle di controllo, consentendo un'elaborazione e un'estrazione più semplice delle informazioni selezionate/non selezionate.
Standardizzare: Utilizzare lo stesso tipo di casella di controllo e stile in tutti gli appunti per coerenza.

4. Utilizzo di software OCR

Applicare l'OCR: Una volta che gli appunti sono stati scansionati e segmentati, utilizzare il software di riconoscimento ottico dei caratteri (OCR) per convertire le immagini del testo in testo digitale leggibile dalla macchina.
Post-elaborazione: Esaminare il testo digitalizzato per individuare errori, specialmente in aree con scrittura a mano complessa o layout insoliti.

Esiste una ricerca attiva sul riconoscimento della scrittura a mano?

Poiché la capacità di riconoscimento della scrittura a mano dipende fortemente dalle reti neurali, i progressi in questi algoritmi influenzano profondamente le prestazioni degli strumenti di riconoscimento della scrittura a mano. Pertanto, la ricerca attiva sul riconoscimento della scrittura a mano si basa generalmente su algoritmi di reti neurali.

La ricerca di Google sul riconoscimento della scrittura a mano inizia con diversi passaggi di addestramento:

Introduzione di tutti i possibili caratteri da diversi alfabeti
Addestramento dello strumento per segmentare ogni carattere in un testo
Addestramento dello strumento per l'estrazione delle caratteristiche per un'identificazione accurata dei caratteri

Google utilizza anche algoritmi di elaborazione del linguaggio per migliorare le prestazioni del riconoscimento della scrittura a mano. Ad esempio, se lo strumento deve decidere tra "i" e "l", può analizzare l'intera parola e decidere il carattere appropriato per fornire risultati accurati.

Il software OCR di solito ha diversi motori di riconoscimento della scrittura a mano integrati nel software. Questi motori lavorano in modo sincrono per generare la rappresentazione del carattere più precisa corrispondente all'input.

Non perderti i nostri benchmark e approfondimenti basati sui dati. Il pulsante apre Google; selezionare AIMultiple conferma che desideri vedere AIMultiple più spesso nei risultati di ricerca di Google.

Aggiungi come fonte preferita

Fornitori di riconoscimento della scrittura a mano

Poiché il riconoscimento della scrittura a mano è un sottocampo dell'OCR, i criteri per scegliere lo strumento di riconoscimento della scrittura a mano appropriato sono simili a quelli degli strumenti OCR. Nel selezionare un fornitore di riconoscimento della scrittura a mano, è necessario considerare i seguenti fattori:

Precisione del riconoscimento dei caratteri
Capacità di apprendimento continuo
Velocità di calcolo nel caso in cui i risultati debbano essere forniti in tempo reale
Facilità d'uso dell'interfaccia, se l'interfaccia sarà utilizzata da esseri umani

Oltre a questi, le migliori pratiche di approvvigionamento come garantire un costo totale di proprietà (TCO) minimo, flessibilità, migliori pratiche di sicurezza dei dati ed evitare il vincolo al fornitore sono essenziali.

Di seguito puoi trovare un breve elenco di fornitori di scrittura a mano. Tieni inoltre presente che questi fornitori possono anche offrire servizi OCR per la tua azienda.

Abbyy
Google Cloud Vision API
Hanvon Technology
Hanwang Technology
Infrrd.ai
MicroBlink
Microsoft Azure Read API
Mitek
MyScript
Selvasai
Unitek.ai
Vidado

FAQ

Utilizzare un lettore di corsivo o un software di riconoscimento della scrittura a mano per aiutare a decifrare la scrittura illeggibile
Raddrizzare e appiattire gli appunti cartacei per prevenire inclinazioni o distorsioni e ottenere documenti scansionati di alta qualità
Utilizzare il riconoscimento ottico dei caratteri (OCR) per convertire immagini scansionate o fotografie di testo scritto a mano.
Esportare il testo digitale convertito in file PDF o altri formati per la condivisione o l'archiviazione

Cerca funzionalità come il riconoscimento dei caratteri, l'inchiostro digitale e il supporto per le lettere in stampatello

Se desideri saperne di più sugli strumenti di riconoscimento della scrittura a mano, potrebbero interessarti anche questi articoli:

Cita questo benchmark

Scegli il formato adatto a dove pubblicherai. Incollare la versione con link nel tuo CMS preserva il backlink.

Cem Dilmegani and Ezgi Arslan, PhD. (2026) - "Benchmark sul riconoscimento della scrittura a mano: LLMs vs OCRs". Pubblicato online su AIMultiple.com. Consultato il 29 Luglio 2026, da: https://aimultiple.com/handwriting-recognition [Risorsa online]

Dilmegani, C., & PhD., E. A. (2026, 29 Luglio). Benchmark sul riconoscimento della scrittura a mano: LLMs vs OCRs. AIMultiple. https://aimultiple.com/handwriting-recognition

@misc{dilmegani2026,
  author = {Dilmegani, Cem and PhD., Ezgi Arslan,},
  title  = {{Benchmark sul riconoscimento della scrittura a mano: LLMs vs OCRs}},
  year   = {2026},
  month  = jul,
  howpublished    = {\url{https://aimultiple.com/handwriting-recognition}},
  note   = {AIMultiple. Consultato il 29 Luglio 2026}
}

Collegamenti di riferimento

When you write, do you print or use cursive? - Quora

Enhanced Hybrid Technique for Efficient Digitization of Handwritten Marksheets

Page restricted | ScienceDirect

Preprocessing Techniques for Online Handwriting Recognition | Springer Nature Link

Springer Berlin Heidelberg

Putting the Hardware to Work | How OCR Works

Cem Dilmegani

Analista principale

Segui

Cem è l'analista principale di AIMultiple dal 2017. AIMultiple informa centinaia di migliaia di aziende (secondo SimilarWeb) compreso il 60% delle Fortune 500 ogni mese.

Il lavoro di Cem è stato citato da importanti pubblicazioni globali tra cui Business Insider, Forbes, Washington Post, aziende globali come Deloitte, HPE e ONG come il World Economic Forum e organizzazioni sovranazionali come la Commissione europea.

Nel corso della sua carriera, Cem ha lavorato come consulente tecnologico, acquirente di tecnologia e imprenditore tecnologico. Ha consigliato aziende sulle loro decisioni tecnologiche presso McKinsey & Company e Altman Solon per oltre un decennio. Ha anche pubblicato un rapporto McKinsey sulla digitalizzazione.

Ha guidato la strategia tecnologica e gli approvvigionamenti di una società di telecomunicazioni rispondendo direttamente al CEO. Ha anche guidato la crescita commerciale dell'azienda deep tech Hypatos che ha raggiunto un fatturato annuo ricorrente a 7 cifre e una valutazione a 9 cifre partendo da 0 in 2 anni. Il lavoro di Cem in Hypatos è stato trattato da importanti pubblicazioni tecnologiche come TechCrunch e Business Insider.

Cem interviene regolarmente a conferenze tecnologiche internazionali. Si è laureato in ingegneria informatica all'Università Bogazici e ha conseguito un MBA presso la Columbia Business School.

Visualizza il profilo completo

Ricercato da

Ezgi Arslan, PhD.

Analista di Settore

Segui

Ezgi ha conseguito un dottorato di ricerca in Economia Aziendale con specializzazione in finanza e lavora come Analista di Settore presso AIMultiple. Guida la ricerca e gli approfondimenti all'intersezione tra tecnologia e business, con competenze che spaziano dalla sostenibilità, ai sondaggi e all'analisi del sentiment, alle applicazioni degli agenti AI nella finanza, all'ottimizzazione per i motori di risposta, alla gestione dei firewall e alle tecnologie di procurement.

Visualizza il profilo completo

Commenti 4

Condividi i tuoi pensieri

Il tuo indirizzo email non verrà pubblicato. Tutti i campi sono obbligatori. I commenti vengono lasciati nella loro lingua originale.

Swanidhi Singh

Aug 07, 2025 at 00:28

Exactly what I was looking for. Thank you!

Sara

Sep 22, 2021 at 06:40

Hi Cem, your article is very clear and practical. Thank you for sharing your knowledge! It will be very useful for me.

Vivienne

Feb 10, 2021 at 00:03

See Transkribus from readcoop for handwritten text recognition for cursive writing.

Leonard

Dec 10, 2020 at 11:08

Which service or software would you recommend in this case: - manuscript/diary 100s of pages written by one author - other language than English (German in this case) I need the software to learn my handwriting, that is not in English and preferably with a good tool to correct all the error.

Cem Dilmegani

Dec 12, 2020 at 19:54

Thank you for reaching out. You can try Google Cloud Vision. It is not bad at handwriting recognition and is free to try. I don't know if it can get user feedback to improve its models. Let us know if you find that functionality.