Tag Archive for Optyczne Rozpoznawanie Znaków

Szablon OCR – dedykowany czy uniwersalny?

Szablon OCR

Sporo pisałem ostatnio o wykorzystaniu OCR w kontekście CAPTCHY. Jednakże nie można zapominać o tym, iż technologia Optycznego Rozpoznawania Znaków jest coraz powszechniej wykorzystywana w firmach. Największy zwrot z inwestycji (ROI) uzyskuje się dzięki zespoleniu OCR-a z systemem obiegu dokumentów. Dlatego też jednym z najpopularniejszych scenariuszy zastosowania Optical Character Recognition jest procesowanie za jego pomocą faktur kosztowych.

Dlaczego? Załóżmy, że firma Kowalski ma 100 kontrahentów, od których regularnie dostaje faktury. Każdy z nich ma inny wzór dokumentu, przez co manualne rejestrowanie tychże staje się dość uciążliwe, ponieważ większość czasu pracownicy spędzają na odszukiwaniu poszczególnych danych.

Dlatego też firma Kowalski decyduje się na wdrożenie systemu obiegu dokumentów ze zintegrowanym modułem OCR, aby proces ten przyspieszyć i zoptymalizować.

OCR a obieg dokumentów

Jak działa takie rozwiązanie? Mamy dwa podstawowe warianty. Pierwszy zakłada, że kontrahenci firmy Kowalski idą z duchem czasu i zamiast zasypywać siedzibę firmy zbędnym papierem, przysyłają na odpowiednią skrzynkę faktury drogą e-mailową. Wówczas są one przechwytywane, automatycznie poddawane skanowaniu przez OCR, poszczególne wartości (np. kwota netto/brutto, NIP, data wystawienia itd.) przenoszone są automatycznie do elektronicznego formularza, a skan faktury załączany do obiegu. W dalszej kolejności dokument przechodzi przez ścieżkę akceptacji i trafia do archiwum.

Czytaj dalej

Microsoft oferuje OCR w SkyDrive!

OCR w SkyDrive

Software’owi giganci robią wszystko by nie pozostać w tyle i nie stracić pozycji rynkowej! Niedawno pisałem o OCR w usłudze Google Drive. Okazało się, że podobny patent zastosował Microsoft w usłudze SkyDrive. Szykuje nam się OCR-owa wojna?

Od końca sierpnia tego roku, chmura Microsoftu ma możliwość optycznego rozpoznawania znaków z przesyłanych do niej zdjęć. W SkyDrive wykorzystano dokładnie ten sam engine, który obecny jest w wyszukiwarce Bing. Może być to przydatne w celu przechowania i możliwości szybkiego skopiowania informacji znajdujących się np. na ulotkach, wizytówkach, mapach i innych obiektach tego typu.
OCR w SkyDrive
Obecnie możliwe jest rozpoznawanie znaków w językach: angielskim, portugalskim, hiszpańskim, francuskim i niemieckim. Na tym polu Microsoft zdecydowanie przegrywa z Google, który oferuje skanowanie w 34 językach, w tym polskim.

Czytaj dalej

5 największych przeszkód w OCR-owaniu

OCR dokumentów

Optical Character Recognition (OCR) to technologia bez wątpienia przydatna i pożyteczna. Nie jest jednak pozbawiona wad. O niedoskonałościach w rozpoznawaniu znaków napomknąłem już wcześniej. Teraz chciałbym przedstawić inne problemy, które negatywnie wpływają na rozpoznawanie znaków.

OCR świetnie sprawdza się w firmach – tam zazwyczaj skanowane wydruki są dobrej jakości i większość programów bez problemu rozpoznaje między 95 a 99% znaków. Dużo gorzej jest np. w przypadku bibliotek. Tam, niektóre ze zbiorów (często już wiekowych) nie stwarzają już tak dobrych warunków do digitalizacji tekstu. Książki bywają zniszczone, pisane archaicznym językiem i niespotykaną obecnie czcionką. To oczywiście dość ekstremalne przypadki, ale dobrze obrazują przeszkody jakie napotyka oprogramowanie.

Problemy w pełnotekstowym skanowaniu OCR

Przyjrzyjmy się co bywa największym problemem w pełnotekstowym skanowaniu.

Czytaj dalej

Yet Another Social Plugin powered by TutsKid.com.