Archive for Zastosowanie OCR

Zastosowanie modułu OCR w praktyce

OCR w WEBCON BPS

W poprzednich wpisach skupiałem się bardziej na teoretycznym opisie tego czym jest Optical Character Recognition (OCR). Tymczasem warto byłoby zobaczyć jak całe rozwiązanie jest w stanie funkcjonować jako część większej platformy.

Obecnie moduł OCR najczęściej wykorzystywany jest w przedsiębiorstwach przy zarządzaniu elektronicznymi dokumentami. Jeśli przyjąć za kryterium wyboru sprawność w digitalizacji tradycyjnych dokumentów, a także procesy zarządzające ich obiegiem, jednym z ciekawszych rozwiązań na rynku jest WEBCON Business Process Suite, którego integralną częścią jest wbudowany OCR.

Charakterystyczne cechy OCR w WEBCON BPS:

– oparty jest na logice algorytmów rozmytych – wyszukuje i zaznacza słowa kluczowe (np. NIP, data płatności), przez co nie ma konieczności tworzenia dedykowanego szablonu dla każdego kontrahenta. Informacje są pobierane i uzupełniane samoczynnie, a następnie przekazywane w systemie obiegu dokumentów do akceptacji.

Czytaj dalej

Jak digitalizujemy książki nawet o tym nie wiedząc?

Logo reCAPTCHA

Jednym z najciekawszych i najbardziej pomysłowych rozwiązań na jakie się ostatnio natknąłem jest reCAPTCHA. Dzięki niej, miliony ludzi na świecie staje się swego rodzaju manualnym OCR-em, nawet o tym nie wiedząc. Jak to możliwe?

Rejestrując się na stronie lub na forum, zazwyczaj na koniec tego procesu witryna zmusza Cię do udowodnienia, że nie jesteś botem do rozpowszechniania spamu. Co robisz? W 90% przypadków przepisujesz kod/wyraz z wyświetlonego obrazka obrazka. Tak działa m.in. reCAPTCHA.

Jak to się ma do OCR-a? Nawet najlepsze systemy nie są w stanie rozpoznać 100% skanowanych wyrazów. Obecnie skuteczność tego typu programów kształtuje się na poziomie 90-98%, w zależności od wykorzystywanych algorytmów i jakości skanowanego tekstu. To oznacza, że przy tekście zawierającym 20 000 słów, wciąż od 400 do 2000 pozostaje do rozpoznania przez człowieka.

Błędne rozpoznanie systemu OCR

Czytaj dalej

Dyrektor IT o OCR

Logo Sudzucker

Niedawno ukazał się wywiad z Markiem Witkowskim, dyrektorem IT w Sudzucker Polska. Wśród różnych, dość interesujących wypowiedzi, znalazłem także fragment o wykorzystaniu modułu OCR w tej firmie. Historia jest ciekawa, dlatego pozwalam ją sobie przytoczyć, cytując fragment wywiadu.

„- Od kilku lat firma korzysta z modułu OCR. Jak jest wykorzystywany, jakie przynosi korzyści i czy jest wart polecenia?

Czytaj dalej

Yet Another Social Plugin powered by TutsKid.com.