Benchmark

Benchmark de reconnaissance de l'écriture manuscrite: LLMs vs OCRs

mis à jour le 2 juil. 2026

Les outils d'OC R atteignent plus de 99% de précision sur le texte dactylographié dans des images de haute qualité. Cependant, l'écriture manuscrite reste difficile en raison des variations de style, d'espacement et des irrégularités. Nous présentons un benchmark d'écriture cursive avec 100 échantillons d'écriture manuscrite rédigés par notre équipe pour éviter le surapprentissage.

Résultats du benchmark d'écriture cursive

Dans ce benchmark, GPT-5, Gemini 3 Pro Preview, et olmOCR-2-7B-1025-FP8 sont les modèles plus performants, obtenant les scores de similarité sémantique les plus élevés et l'interprétation la plus cohérente du texte cursif sur tous les échantillons.

Les noms complets des produits sont ci-dessous, nous les avons raccourcis dans le graphique. Dans ce benchmark, leurs dernières versions de novembre 2025 sont utilisées :

GPT-5
Gemini 3 Pro Preview
Gemini 2.5 Pro
olmOCR-2-7B-1025-FP8
Moondream OCR
Claude Sonnet 4.5
Nanonets-OCR2-3B
Dots OCR
Azure Cognitive Service
Google Vision
Mistral OCR
PaddleOCR-VL
Amazon Textract
Deepseek OCR

Méthodologie du benchmark d'écriture cursive

Pour ce benchmark, 10 rédacteurs ont écrit à la main 10 paragraphes chacun en cursive, résultant en un dataset de 100 échantillons d'écriture cursive. Les rédacteurs n'ont pas été invités à écrire proprement. La connectivité naturelle des lettres, la variabilité des traits, la distorsion de l'espacement et la fluidité des lignes ont été intentionnellement préservées pour refléter la complexité réaliste de l'écriture cursive.

Le dataset comprend :

Inclinaison, pression du trait et motifs de ligature variables
Texte mélangé avec des chiffres, de la ponctuation et des majuscules
Résolutions d'image et arrière-plans divers pour garantir la robustesse

Tous les échantillons ont été évalués à l'aide de notre pipeline unifié d'évaluation OCR, basé sur la similarité cosinus pour une comparaison équitable.

Exemple d'image scannée :

Qu'est-ce que la reconnaissance de l'écriture manuscrite ?

La reconnaissance de l'écriture manuscrite, également connue sous le nom d'OCR manuscrit ou d'OCR cursif, est un sous-domaine de la technologie OCR qui traduit les lettres manuscrites en texte numérique ou en commandes correspondantes en temps réel. Pour effectuer cette tâche, ces systèmes bénéficient de la correspondance de motifs pour identifier divers styles de lettres manuscrites. Wikipédia définit la reconnaissance de l'écriture manuscrite comme :

La capacité d'un ordinateur à recevoir et à interpréter des entrées manuscrites intelligibles provenant de sources telles que des documents papier, des photographies, des écrans tactiles et d'autres dispositifs.

Les capacités de reconnaissance de l'écriture manuscrite des LLM sont également très développées, dans notre benchmark, gemini-3-pro est précis à 100%.

Qu'est-ce qui est inclus dans l'écriture manuscrite ?

Par écriture manuscrite, nous faisons référence aux textes écrits en style script et cursif. Les textes en style script sont plus faciles à reconnaître car les caractères sont écrits séparément comme des lettres d'imprimerie. Cependant, l'écriture cursive implique des caractères joints tels qu'ils sont écrits.

Cet aspect nécessite que les outils de reconnaissance de l'écriture manuscrite perçoivent chaque caractère séparé correctement et les identifient avec précision. Voici des exemples d'écriture script et cursive.

Source : Quora¹

Les outils de reconnaissance de l'écriture manuscrite peuvent également identifier l'écriture sur des écrans numériques. Ce type d'écriture peut être suivi au fur et à mesure qu'elle est écrite. Le logiciel peut tirer parti de votre mouvement dynamique pour fournir des résultats plus précis. Voici un exemple de reconnaissance d'écriture manuscrite numérique, fourni par l'API Ink Recognizer de Microsoft Azure.

Quels sont les défis de la conversion de l'écriture manuscrite en texte ?

Même si les outils OCR traditionnels sont sur le marché depuis les années 70, il n'existe toujours pas beaucoup d'outils capables de gérer la reconnaissance de l'écriture manuscrite. Comme chacun a son propre style d'écriture, les outils OCR traditionnels ne peuvent pas percevoir l'écriture de chacun.

Outre la technologie de vision par ordinateur, des algorithmes d'apprentissage profond très complexes sont nécessaires pour identifier avec succès toutes ces variations. Voici une liste des défis que les outils de reconnaissance de l'écriture manuscrite rencontrent fréquemment :

Défis

Qualité de l'image : Le texte manuscrit est souvent capturé en basse résolution ou avec un mauvais éclairage. Les pages peuvent inclure des taches, des ombres ou des bavures qui agissent comme un bruit de fond.
Variété des styles d'écriture : Chaque individu a une façon unique d'écrire. Les différences d'alphabets, de formes de lettres et de tailles de caractères rendent la reconnaissance plus difficile.
Texte incliné : Les lignes manuscrites sont rarement parfaitement droites. Les mots peuvent s'incliner, se courber ou même apparaître à des angles inhabituels.
Caractères connectés : Dans l'écriture cursive ou rapide, les lettres et les symboles se joignent souvent, ce qui les rend plus difficiles à séparer.
Dégradation : Les documents plus anciens ou très utilisés peuvent avoir de l'encre décolorée, un jaunissement ou des dommages de page, réduisant la clarté du texte.

Solutions

Les outils HTR modernes combinent la vision par ordinateur et l'apprentissage profond pour surmonter ces défis. Ces approches vont au-delà de l'OCR traditionnel, qui existe depuis les années 1970 mais peine encore avec l'écriture manuscrite. Aujourd'hui, des progrès sont réalisés grâce à :

Améliorer la qualité d'entrée : Capturez ou numérisez les documents à une résolution plus élevée et avec un meilleur éclairage.
Nettoyage de l'arrière-plan : Utilisez l'apprentissage automatique ou des techniques de photographie pour supprimer le bruit et améliorer la clarté.
Algorithmes de reconnaissance avancés : Appliquez des modèles d'apprentissage profond conçus pour gérer les styles d'écriture, les alphabets et les lettres connectées variés.
Correction de l'inclinaison : Utilisez des outils de traitement d'image pour détecter et corriger le texte incliné ou pivoté.
Conception adaptée à l'OCR : Lorsque cela est possible, créez des formulaires et des documents faciles à traiter pour les outils OCR.

Laissez notre équipe automatiser l'un de vos processus métier avec des agents IA, gratuitement.

Automatiser un processus

Préparation pour la conversion de notes manuscrites

Il y a une variété de facteurs à prendre en compte lors de la conception de documents. Le plus important est les données à capturer à partir des documents. Comme il existe différentes façons de représenter le même type de données, vous devez tenir compte de la vitesse, de la précision et de la convivialité de chaque option lors de la construction de votre document.²,³,⁴

1. Numérisation et prétraitement

Assurer une numérisation claire : Utilisez un scanner ou une application dédiée pour créer une image haute résolution et bien éclairée de vos notes.
Binarisation : Convertissez l'image numérisée en noir et blanc pour améliorer le contraste et rendre le texte plus distinct de l'arrière-plan.

Source : Datacap.hk

Suppression du bruit et correction de l'inclinaison : Appliquez des filtres pour supprimer les marques parasites ou les ombres et corrigez toute inclinaison dans le document. Évitez les arrière-plans colorés. Bénéficiez d'éléments d'alignement pour éviter les documents inclinés.

2. Techniques de segmentation

La segmentation est le processus de décomposition de l'image en composants plus petits et plus faciles à gérer, tels que les lignes de texte, les mots et les caractères individuels. Pour garantir cela, les entreprises peuvent utiliser des méthodes de segmentation, que vous pouvez voir ci-dessous.

Source : How OCR Works⁵

Segmentation des lignes de texte : C'est un prérequis pour d'autres tâches et implique de séparer le document en lignes de texte individuelles. Conservez les données dans les marges.
Segmentation des mots et des caractères : Après la segmentation des lignes, vous pouvez diviser davantage les lignes en mots individuels puis en caractères, ce qui est crucial pour une reconnaissance précise du texte.
Utilisation d'outils d'IA avancés : Les outils alimentés par l'IA comme Transkribus peuvent effectuer automatiquement une segmentation sophistiquée du texte et de la mise en page pour des notes complexes.

3. Incorporation de cases à cocher pour une numérisation plus facile

Cases pré-imprimées : Si vous savez que vous allez numériser vos notes, dessinez ou imprimez clairement des cases à cocher sur la page, en vous assurant qu'elles sont suffisamment grandes pour être facilement reconnues par le logiciel OCR.
Formatage clair : Assurez-vous que les cases à cocher ne sont pas trop proches du texte auquel elles sont associées et qu'elles ont un contraste suffisant avec le papier.
Tirer parti de l'OCR alimenté par l'IA : Les outils peuvent être entraînés à reconnaître ces cases à cocher, permettant un traitement et une extraction plus faciles des informations cochées/décochées.
Standardiser : Utilisez le même type de case à cocher et le même style dans toutes vos notes pour plus de cohérence.

4. Utilisation d'un logiciel OCR

Appliquer l'OCR : Une fois les notes numérisées et segmentées, utilisez un logiciel de reconnaissance optique de caractères (OCR) pour convertir les images du texte en texte numérique lisible par machine.
Post-traitement : Examinez le texte numérisé à la recherche d'erreurs, en particulier dans les zones avec une écriture manuscrite complexe ou des mises en page inhabituelles.

Y a-t-il une recherche active sur la reconnaissance de l'écriture manuscrite ?

Comme la capacité de reconnaissance de l'écriture manuscrite dépend fortement des réseaux neuronaux, les avancées de ces algorithmes affectent profondément les performances des outils de reconnaissance de l'écriture manuscrite. Ainsi, la recherche active sur la reconnaissance de l'écriture manuscrite est généralement basée sur des algorithmes de réseaux neuronaux.

La recherche de Google sur la reconnaissance de l'écriture manuscrite commence par plusieurs étapes d'entraînement :

Introduction de tous les caractères possibles de différents alphabets
Entraînement de l'outil pour segmenter chaque caractère dans un texte
Entraînement de l'outil pour l'extraction de caractéristiques pour une identification précise des caractères

Google utilise également des algorithmes de traitement du langage pour améliorer les performances de reconnaissance de l'écriture manuscrite. Par exemple, si l'outil doit choisir entre "i" et "l", il peut analyser le mot entier et décider du caractère approprié pour fournir des résultats précis.

Les logiciels OCR ont généralement plusieurs moteurs de reconnaissance de l'écriture manuscrite intégrés dans le logiciel. Ces moteurs fonctionnent de manière synchrone pour générer la représentation de caractère la plus précise correspondant à l'entrée.

Ne manquez pas nos benchmarks et analyses basées sur les données. Le bouton ouvre Google ; sélectionner AIMultiple confirme que vous souhaitez voir AIMultiple plus souvent dans les résultats de recherche Google.

Ajouter comme source préférée

Fournisseurs de reconnaissance de l'écriture manuscrite

Comme la reconnaissance de l'écriture manuscrite est un sous-domaine de l'OCR, les critères de choix de la reconnaissance de l'écriture manuscrite appropriée sont similaires à ceux des outils OCR. Lors de la sélection d'un fournisseur de reconnaissance de l'écriture manuscrite, vous devez prendre en compte les facteurs suivants :

Précision de la reconnaissance des caractères
Capacités d'apprentissage continu
Vitesse de calcul dans le cas où les résultats doivent être livrés en temps réel
Convivialité de l'interface, si l'interface doit être utilisée par des humains

En plus de cela, les meilleures pratiques d'approvisionnement telles que garantir un coût total de possession (TCO) minimum, la flexibilité, les meilleures pratiques de sécurité des données et éviter la dépendance vis-à-vis d'un fournisseur sont essentielles.

Vous trouverez ci-dessous une courte liste de fournisseurs de reconnaissance de l'écriture manuscrite. Vous devez également garder à l'esprit que ces fournisseurs peuvent également fournir des services OCR pour votre entreprise.

Abbyy
Google Cloud Vision API
Hanvon Technology
Hanwang Technology
Infrrd.ai
MicroBlink
Microsoft Azure Read API
Mitek
MyScript
Selvasai
Unitek.ai
Vidado

FAQ

Utilisez un lecteur cursif ou un logiciel de reconnaissance de l'écriture manuscrite pour aider à déchiffrer l'écriture illisible
Redressez et aplatissez les notes papier pour éviter l'inclinaison ou la distorsion, et obtenez des documents numérisés de la plus haute qualité possible
Utilisez un logiciel de reconnaissance optique de caractères (OCR) pour convertir des images numérisées ou des photographies de texte manuscrit.
Exportez le texte numérique converti vers des fichiers PDF ou d'autres formats pour le partage ou le stockage

Recherchez des fonctionnalités telles que la reconnaissance de caractères, l'encre numérique et la prise en charge des lettres d'imprimerie

Si vous souhaitez en savoir plus sur les outils de reconnaissance de l'écriture manuscrite, ces articles peuvent également vous intéresser :

Citez ce benchmark

Choisissez le format qui correspond à votre lieu de publication. Coller la version avec lien dans votre CMS préserve le lien retour.

Cem Dilmegani (2026) - "Benchmark de reconnaissance de l'écriture manuscrite: LLMs vs OCRs". Publié en ligne sur AIMultiple.com. Consulté le 2 Juillet 2026, à : https://aimultiple.com/handwriting-recognition [Ressource en ligne]

Dilmegani, C. (2026, 2 Juillet). Benchmark de reconnaissance de l'écriture manuscrite: LLMs vs OCRs. AIMultiple. https://aimultiple.com/handwriting-recognition

@misc{dilmegani2026,
  author = {Dilmegani, Cem},
  title  = {{Benchmark de reconnaissance de l'écriture manuscrite: LLMs vs OCRs}},
  year   = {2026},
  month  = jul,
  howpublished    = {\url{https://aimultiple.com/handwriting-recognition}},
  note   = {AIMultiple. Consulté le 2 Juillet 2026}
}

Liens de référence

When you write, do you print or use cursive? - Quora

Enhanced Hybrid Technique for Efficient Digitization of Handwritten Marksheets

Page restricted | ScienceDirect

Preprocessing Techniques for Online Handwriting Recognition | Springer Nature Link

Springer Berlin Heidelberg

Putting the Hardware to Work | How OCR Works

Cem Dilmegani

Analyste principal

Suivre

Cem est analyste principal chez AIMultiple depuis 2017. AIMultiple informe chaque mois des centaines de milliers d'entreprises (selon similarWeb), dont 55 % des entreprises du classement Fortune 500. Les travaux de Cem ont été cités par des publications internationales de premier plan telles que Business Insider, Forbes et le Washington Post, ainsi que par des entreprises mondiales comme Deloitte et HPE, des ONG comme le Forum économique mondial et des organisations supranationales comme la Commission européenne. Vous trouverez d'autres entreprises et ressources réputées ayant fait référence à AIMultiple. Tout au long de sa carrière, Cem a exercé les fonctions de consultant, d'acheteur et d'entrepreneur dans le secteur des technologies. Il a conseillé des entreprises sur leurs décisions technologiques chez McKinsey & Company et Altman Solon pendant plus de dix ans. Il a également publié un rapport McKinsey sur la numérisation. Il a dirigé la stratégie technologique et les achats d'un opérateur télécom, sous la responsabilité directe du PDG. Il a également piloté la croissance commerciale de la société de deep tech Hypatos, qui a atteint un chiffre d'affaires annuel récurrent à sept chiffres et une valorisation à neuf chiffres en seulement deux ans. Les travaux de Cem chez Hypatos ont été présentés dans des publications technologiques de référence telles que TechCrunch et Business Insider. Cem intervient régulièrement lors de conférences internationales sur les technologies. Diplômé en génie informatique de l'université de Bogazici, il est également titulaire d'un MBA de la Columbia Business School.

Voir le profil complet

Commentaires 4

Partagez vos idées

Votre adresse courriel ne sera pas publiée. Tous les champs sont obligatoires. Les commentaires sont laissés dans leur langue d'origine.

Swanidhi Singh

Aug 07, 2025 at 00:28

Exactly what I was looking for. Thank you!

Sara

Sep 22, 2021 at 06:40

Hi Cem, your article is very clear and practical. Thank you for sharing your knowledge! It will be very useful for me.

Vivienne

Feb 10, 2021 at 00:03

See Transkribus from readcoop for handwritten text recognition for cursive writing.

Leonard

Dec 10, 2020 at 11:08

Which service or software would you recommend in this case: - manuscript/diary 100s of pages written by one author - other language than English (German in this case) I need the software to learn my handwriting, that is not in English and preferably with a good tool to correct all the error.

Cem Dilmegani

Dec 12, 2020 at 19:54

Thank you for reaching out. You can try Google Cloud Vision. It is not bad at handwriting recognition and is free to try. I don't know if it can get user feedback to improve its models. Let us know if you find that functionality.