OCR ile resimden tarih alınması


#1

Merhabalar,

Bir video üzerinden kendi eğitim setimi yaratmaya çalışıyorum. Video turnikeden geçişleri içeriyor ve aşağıdaki gibi framelere bölmüş durumdayım videoyu. Sorunum framede sol üstte yer alan tarihi alamıyor oluşum. pytesseract kütüphanesini kullandım şimdiye kadar. İlk başta tüm fotoğrafı gönderip denedim hiçbir şey bulamadı. Bunun üzerine sadece tarihin olduğu kısmı kesip gönderdim çok düşük bir başarı ile bulmaya başladı. %1 gibi bir başarı. Bunun üzerine tarih kısmında iki renk olmasına odaklandım. Beyazları siyaha çevirerek ve siyahları beyaza çevirerek tarihi tek renk yazmayı başarıp denedim. Başarı %10 civarlarına geldi. Ancak hala çok çok yetersiz. Önerisi olan var mı? Nasıl yapabilirim?


#2

Sadece sol üst bölümdeki tarih saat kısmını kesilmiş şekilde, OpenCV ile önce 3x3lük filtre ile medianBlur() uygulayıp daha sonra pytesseract ile elde edilen sonuç şu şekilde;

“06-04-2018 Hon 0 45:32”

Bence kesinlikle önce siyah veya beyaz aynı renge boyamanız gerekir. Daha sonra o hali üzerinden, morfolojik işlemler veya OCR yöntemlerini denemeniz.
Hedefiniz de tarih saat bölümü de olduğundan ve videodaki yeri her zaman sabit olduğundan sadece o bölümü işlemeniz de hem hız hem başarı performansınızı arttıracaktır.


#3

Dropbox OCR icin bir deep learning pipeline’i gelistirmiş. GAN ile yazılardan resimler oluşturarak dataset oluşturmuşlar daha sonra bazı modeller kullanmışlar (LSTM, CNN). Yazıda detaylı bir şekilde anlatılıyor. https://blogs.dropbox.com/tech/2017/04/creating-a-modern-ocr-pipeline-using-computer-vision-and-deep-learning/