OCR araçları, yüksek kaliteli görüntülerdeki yazılı metinlerde %99'un üzerinde doğruluk oranına ulaşmaktadır. Bununla birlikte, el yazısı, stil, aralık ve düzensizliklerdeki farklılıklar nedeniyle zorlu olmaya devam etmektedir. Aşırı uyumun önüne geçmek için ekibimiz tarafından yazılmış 100 el yazısı örneği içeren bir bitişik el yazısı kıyaslama testi sunuyoruz.
El yazısı kıyaslama sonuçları
Bu karşılaştırmada, GPT-5, Gemini 3 Pro Preview ve olmOCR-2-7B-1025-FP8 en yüksek anlamsal benzerlik puanlarını elde eden ve tüm örneklerde el yazısı metninin en tutarlı yorumunu sağlayan en iyi performans gösteren modellerdir.
Ürünlerin tam adları aşağıdadır, grafikte kısaltılmıştır. Bu karşılaştırmada, Kasım 2025 itibarıyla en son sürümleri kullanılmıştır:
- GPT-5
- Gemini 3 Pro Önizlemesi
- Gemini 2.5 Pro
- olmOCR-2-7B-1025-FP8
- Moondream OCR
- Claude Sonnet 4.5
- Nanonets-OCR2-3B
- Nokta OCR
- Azure Bilişsel Hizmeti
- Google Vizyon
- Mistral OCR
- PaddleOCR-VL
- Amazon Textract
- Deepseek OCR
El yazısı kıyaslama metodolojisi
Bu kıyaslama çalışması için, 10 yazar her biri el yazısıyla 10 paragraf yazdı ve bu da 100 el yazısı örneğinden oluşan bir veri kümesiyle sonuçlandı. Yazarlardan düzgün yazmaları istenmedi. Gerçekçi el yazısı karmaşıklığını yansıtmak için doğal harf bağlantısı, vuruş çeşitliliği, boşluk bozulması ve çizgi akıcılığı kasıtlı olarak korundu.
Veri seti şunları içerir:
- Değişken eğim, vuruş basıncı ve ligatür desenleri
- Sayılar, noktalama işaretleri ve büyük harflerle karışık metin.
- Sağlamlığı sağlamak için çeşitli görüntü çözünürlükleri ve arka planlar.
Tüm örnekler, adil bir karşılaştırma için kosinüs benzerliğine dayalı olarak, birleşik OCR değerlendirme hattımız kullanılarak değerlendirildi.
Örnek taranmış görüntü:

El yazısı tanıma nedir?
El yazısı tanıma, el yazısı OCR veya el yazısı OCR olarak da bilinen, el yazısı harfleri gerçek zamanlı olarak karşılık gelen dijital metne veya komutlara çevirenOCR teknolojisinin bir alt alanıdır. Bu görevi yerine getirmek için, bu sistemler çeşitli el yazısı harf stillerini tanımlamak için desen eşleştirmeden yararlanır. Wikipedia el yazısı tanımayı şu şekilde tanımlar:
Bilgisayarın, kağıt belgeler, fotoğraflar, dokunmatik ekranlar ve diğer cihazlar gibi kaynaklardan gelen anlaşılabilir el yazısı girdisini alabilme ve yorumlayabilme yeteneği.
LLM'nin el yazısı tanıma yetenekleri de oldukça gelişmiştir; karşılaştırma testlerimizde gemini-3-pro %100 doğruluk oranına sahiptir.
El yazısı neleri kapsar?
El yazısı derken, düz yazı ve bitişik yazı biçiminde yazılmış metinleri kastediyoruz. Düz yazı biçimindeki metinler, karakterler ayrı ayrı büyük harflerle yazıldığı için daha kolay tanınır. Ancak bitişik yazıda karakterler birleşik olarak yazılır.
Bu durum, el yazısı tanıma araçlarının her bir karakteri doğru bir şekilde algılamasını ve hassas bir şekilde tanımlamasını gerektirir. Aşağıda düz yazı ve bitişik yazı örnekleri verilmiştir.
Kaynak: Quora 1
El yazısı tanıma araçları, dijital ekranlardaki el yazısını da tanımlayabilir. Bu tür el yazısı, yazılırken takip edilebilir. Yazılım, daha doğru sonuçlar sağlamak için dinamik hareketinizi kullanabilir. Aşağıda, Microsoft Azure Ink Recognizer API tarafından sağlanan dijital el yazısı tanıma örneği verilmiştir.
El yazısını metne dönüştürmenin zorlukları nelerdir?
Geleneksel optik karakter tanıma (OCR) araçları 1970'lerden beri piyasada olmasına rağmen, el yazısı tanıma özelliğine sahip çok az araç bulunmaktadır. Herkesin kendine özgü bir yazı stili olduğundan, geleneksel OCR araçları herkesin el yazısını algılayamaz.
Bilgisayarlı görme teknolojisinin yanı sıra, tüm bu varyasyonları başarıyla tanımlamak için oldukça karmaşık derin öğrenme algoritmalarına da ihtiyaç duyulmaktadır. Aşağıda, el yazısı tanıma araçlarının sıklıkla karşılaştığı zorlukların bir listesi bulunmaktadır:
Zorluklar
- Görüntü kalitesi: El yazısı metinler genellikle düşük çözünürlükte veya yetersiz ışıkta kaydedilir. Sayfalarda arka plan gürültüsü görevi gören lekeler, gölgeler veya izler bulunabilir.
- Yazım stillerindeki çeşitlilik: Her bireyin kendine özgü bir yazım tarzı vardır. Alfabelerdeki, harf şekillerindeki ve karakter boyutlarındaki farklılıklar, tanınmayı daha da zorlaştırır.
- Eğik yazı: El yazısıyla yazılan satırlar nadiren mükemmel düzdür. Kelimeler eğik, kıvrımlı veya hatta alışılmadık açılarda görünebilir.
- Birbirine bağlı karakterler: El yazısı veya hızlı yazıda, harfler ve semboller genellikle birleşerek ayrılmalarını zorlaştırır.
- Yıpranma: Daha eski veya çok kullanılmış belgelerde mürekkep solması, sararma veya sayfa hasarı olabilir, bu da metin netliğini azaltır.
Çözümler
Modern HTR araçları, bu zorlukların üstesinden gelmek için bilgisayar görüşünü derin öğrenmeyle birleştiriyor. Bu yaklaşımlar, 1970'lerden beri var olan ancak el yazısıyla hala mücadele eden geleneksel OCR'nin ötesine geçiyor. Günümüzde şu alanlarda ilerleme kaydediliyor:
- Giriş kalitesini iyileştirin: Belgeleri daha yüksek çözünürlükte ve daha iyi aydınlatma koşullarında yakalayın veya tarayın.
- Arka plan temizleme: Gürültüyü gidermek ve netliği artırmak için makine öğrenimi veya fotoğrafçılık tekniklerini kullanın.
- Gelişmiş tanıma algoritmaları: Çeşitli yazı stillerini, alfabeleri ve birleşik harfleri ele almak üzere tasarlanmış derin öğrenme modellerini uygulayın.
- Eğiklik düzeltme: Eğik veya dönmüş metni tespit etmek ve düzeltmek için görüntü işleme araçlarını kullanın.
- OCR dostu tasarım: Mümkün olduğunca, OCR araçlarının işlemesini kolaylaştıracak formlar ve belgeler oluşturun.
El yazısı notların dijital ortama aktarılmasına hazırlık
Belge tasarlarken dikkate alınması gereken çeşitli faktörler vardır. Bunların en önemlisi, belgelerden alınacak verilerdir. Aynı tür veriyi temsil etmenin farklı yolları olduğundan, belgenizi oluştururken her seçeneğin hızını, doğruluğunu ve kullanıcı dostluğunu göz önünde bulundurmanız gerekir. 2 , 3 , 4
1. Tarama ve ön işleme
- Net bir tarama sağlayın: Notlarınızın yüksek çözünürlüklü ve iyi aydınlatılmış bir görüntüsünü oluşturmak için bir tarayıcı veya özel bir uygulama kullanın.
- İkili hale getirme: Taranan görüntüyü siyah beyaz hale dönüştürerek kontrastı iyileştirir ve metni arka plandan daha belirgin hale getirir.
Kaynak: Datacap.hk
- Gürültü giderme ve eğim düzeltme: Belgedeki istenmeyen izleri veya gölgeleri gidermek ve eğimi düzeltmek için filtreler uygulayın. Renkli arka planlardan kaçının. Eğik belgeleri önlemek için hizalama öğelerinden yararlanın.
2. Bölümleme teknikleri
Segmentasyon, görüntüyü metin satırları, kelimeler ve tek tek karakterler gibi daha küçük, daha kolay yönetilebilir bileşenlere ayırma işlemidir. Bunu sağlamak için işletmeler, aşağıda görebileceğiniz segmentasyon yöntemlerini kullanabilirler.
Kaynak: OCR Nasıl Çalışır? 5
- Metin satırı bölümlendirme: Bu, diğer görevler için bir ön koşuldur ve belgeyi ayrı metin satırlarına ayırmayı içerir. Verileri kenar boşlukları içinde tutun.
- Kelime ve karakter bölümlendirme: Satır bölümlendirmesinin ardından, satırları ayrı ayrı kelimelere ve ardından karakterlere bölebilirsiniz; bu, doğru metin tanıma için çok önemlidir.
- Gelişmiş yapay zeka araçlarından yararlanma: Transkribus gibi yapay zeka destekli araçlar, karmaşık notlar için gelişmiş metin ve düzen bölümlendirmesini otomatik olarak gerçekleştirebilir.
3. Dijitalleştirmeyi kolaylaştırmak için onay kutularının eklenmesi
- Önceden basılmış kutular: Notlarınızı dijitalleştireceğinizi biliyorsanız, sayfaya net bir şekilde onay kutuları çizin veya yazdırın ve OCR yazılımı tarafından kolayca tanınabilecek kadar büyük olduklarından emin olun.
- Düzgün biçimlendirme: Onay kutularının ilişkili oldukları metne çok yakın olmadığından ve kağıtla yeterli kontrast oluşturduğundan emin olun.
- Yapay zekâ destekli OCR'den yararlanın: Araçlar bu onay kutularını tanıyacak şekilde eğitilebilir, bu da işaretli/işaretsiz bilgilerin daha kolay işlenmesini ve çıkarılmasını sağlar.
- Standartlaştırın: Tutarlılık sağlamak için notlarınızın tamamında aynı tür onay kutusu ve stili kullanın.
4. OCR yazılımı kullanımı
- OCR uygulayın: Notlar tarandıktan ve bölümlere ayrıldıktan sonra, metin görüntülerinin makine tarafından okunabilir dijital metne dönüştürülmesi için Optik Karakter Tanıma (OCR) yazılımı kullanın.
- Son işlem: Dijitalleştirilmiş metni, özellikle karmaşık el yazısı veya alışılmadık düzenlere sahip alanlardaki hatalar açısından gözden geçirin.
El yazısı tanıma konusunda aktif bir araştırma yürütülüyor mu?
El yazısı tanıma yeteneği büyük ölçüde sinir ağlarına bağlı olduğundan, bu algoritmalardaki gelişmeler el yazısı tanıma araçlarının performansını derinden etkiler. Bu nedenle, el yazısı tanıma üzerine yapılan aktif araştırmalar genellikle sinir ağı algoritmalarına dayanmaktadır.
Google'un el yazısı tanıma üzerine yaptığı araştırma, birkaç eğitim adımıyla başlıyor:
- Farklı alfabelerden mümkün olan tüm karakterlerin tanıtılması
- Metindeki her karakteri ayrı ayrı bölümlere ayırmak için aracı eğitme
- Doğru karakter tanımlaması için özellik çıkarma aracının eğitilmesi
Google ayrıca el yazısı tanıma performansını iyileştirmek için dil işleme algoritmaları kullanmaktadır. Örneğin, araç "i" ve "l" arasında karar vermesi gerekiyorsa, tüm kelimeyi analiz edebilir ve doğru sonuçlar sağlamak için uygun karakteri belirleyebilir.
OCR yazılımları genellikle içine entegre edilmiş birkaç el yazısı tanıma motoruna sahiptir. Bu motorlar, girdiye karşılık gelen en doğru karakter temsilini oluşturmak için senkronize olarak çalışır.
El yazısı tanıma yazılımı sağlayıcıları
El yazısı tanıma, optik karakter tanıma (OCR) alanının bir alt dalı olduğundan, doğru el yazısı tanıma aracını seçme kriterleri OCR araçlarınınkine benzerdir. Bir el yazısı tanıma sağlayıcısı seçerken aşağıdaki faktörleri göz önünde bulundurmalısınız:
- Karakter tanıma doğruluğu
- Sürekli öğrenme yetenekleri
- Sonuçların gerçek zamanlı olarak iletilmesi gerektiğinde hesaplama hızı
- Arayüzün kullanıcı dostu olması, arayüzün insanlar tarafından kullanılacak olması durumunda önemlidir.
Bunlara ek olarak, minimum Toplam Sahip Olma Maliyeti (TCO) sağlanması, esneklik, veri güvenliği en iyi uygulamaları ve tedarikçi bağımlılığından kaçınma gibi en iyi tedarik uygulamaları da çok önemlidir.
Aşağıda el yazısı tanıma hizmeti veren firmaların kısa bir listesini bulabilirsiniz. Ayrıca bu firmaların işletmeniz için optik karakter tanıma (OCR) hizmeti de sağlayabileceğini unutmayın.
- Abbyy
- Google Cloud Vision API
- Hanvon Teknolojisi
- Hanwang Teknoloji
- Infrrd.ai
- MikroBlink
- Microsoft Azure Okuma API'si
- Mitek
- MyScript
- Selvasai
- Unitek.ai
- Vidado
SSS'ler
Okunaksız el yazısını çözmek için el yazısı okuyucu veya el yazısı tanıma yazılımı kullanın.
Kağıt notları düzeltin ve eğrilmeyi veya bozulmayı önleyin, böylece mümkün olan en yüksek kalitede taranmış belgeler elde edin.
Taranmış görüntüler veya fotoğraflardaki el yazısı metinleri optik karakter tanıma (OCR) yazılımı kullanarak dönüştürün.
Dönüştürülen dijital metni paylaşmak veya saklamak için PDF dosyalarına veya diğer formatlara aktarın.
Karakter tanıma, dijital mürekkep ve büyük harf desteği gibi özelliklere dikkat edin.
El yazısı tanıma araçları hakkında daha fazla bilgi edinmek isterseniz, bu makaleler de ilginizi çekebilir:
- OCR'nin Mevcut Durumu: Çözülmüş Bir Sorun Mu?
- Fatura OCR Karşılaştırması: LLM'lerin ve OCR'lerin Çıkarma Doğruluğu
Yorumlar 4
Düşüncelerinizi Paylaşın
E-posta adresiniz yayınlanmayacak. Tüm alanlar gereklidir.
Exactly what I was looking for. Thank you!
Hi Cem, your article is very clear and practical. Thank you for sharing your knowledge! It will be very useful for me.
See Transkribus from readcoop for handwritten text recognition for cursive writing.
Which service or software would you recommend in this case: - manuscript/diary 100s of pages written by one author - other language than English (German in this case) I need the software to learn my handwriting, that is not in English and preferably with a good tool to correct all the error.
Thank you for reaching out. You can try Google Cloud Vision. It is not bad at handwriting recognition and is free to try. I don't know if it can get user feedback to improve its models. Let us know if you find that functionality.