Szablon OCR – dedykowany czy uniwersalny?

Szablon OCR

Sporo pisałem ostatnio o wykorzystaniu OCR w kontekście CAPTCHY. Jednakże nie można zapominać o tym, iż technologia Optycznego Rozpoznawania Znaków jest coraz powszechniej wykorzystywana w firmach. Największy zwrot z inwestycji (ROI) uzyskuje się dzięki zespoleniu OCR-a z systemem obiegu dokumentów. Dlatego też jednym z najpopularniejszych scenariuszy zastosowania Optical Character Recognition jest procesowanie za jego pomocą faktur kosztowych.

Dlaczego? Załóżmy, że firma Kowalski ma 100 kontrahentów, od których regularnie dostaje faktury. Każdy z nich ma inny wzór dokumentu, przez co manualne rejestrowanie tychże staje się dość uciążliwe, ponieważ większość czasu pracownicy spędzają na odszukiwaniu poszczególnych danych.

Dlatego też firma Kowalski decyduje się na wdrożenie systemu obiegu dokumentów ze zintegrowanym modułem OCR, aby proces ten przyspieszyć i zoptymalizować.

OCR a obieg dokumentów

Jak działa takie rozwiązanie? Mamy dwa podstawowe warianty. Pierwszy zakłada, że kontrahenci firmy Kowalski idą z duchem czasu i zamiast zasypywać siedzibę firmy zbędnym papierem, przysyłają na odpowiednią skrzynkę faktury drogą e-mailową. Wówczas są one przechwytywane, automatycznie poddawane skanowaniu przez OCR, poszczególne wartości (np. kwota netto/brutto, NIP, data wystawienia itd.) przenoszone są automatycznie do elektronicznego formularza, a skan faktury załączany do obiegu. W dalszej kolejności dokument przechodzi przez ścieżkę akceptacji i trafia do archiwum.

Drugie rozwiązanie opiera się na tradycyjnej metodzie przesyłania faktur papierowych. Wówczas te wymagają ręcznego ich zaniesienia do skanera, a następnie uruchomienia odpowiedniego obiegu. Dalej proces wygląda tak samo jak w poprzednim przykładzie.

W porządku. Jak zatem działa OCR „pod spodem” na przykładzie faktur w elektronicznym obiegu dokumentów? Zasadniczo mamy dwie możliwości konfiguracji: za pomocą szablonu dedykowanego i uniwersalnego.

Szablon dedykowany OCR

Szablony dedykowane tworzy się osobno dla każdego kontrahenta, zgodnie ze wzorem jego faktury. Wówczas wskazujemy jakie konkretne informacje znajdować będą się w poszczególnych miejscach na danej fakturze. Rozwiązanie to pozwala na osiągnięcie bardzo wysokiej skuteczności rozpoznawania znaków, dzięki czemu zredukowany do minimum zostaje czas, potrzebny na sprawdzenie poprawności działania mechanizmu OCR. Niestety rozwiązanie to ma także swoje wady. Zakładając, że firma Kowalski ma 100 kontrahentów, którzy przysyłają jej faktury, zajdzie konieczność stworzenia 100 osobnych szablonów dla każdego z nich. Przyjmijmy, że stworzenie jednego szablonu dedykowanego zajmuje średnio pół dnia roboczego. Wychodzi na to, że aby uruchomić OCR faktur, na samo tworzenie szablonów należy poświęcić prawie 2 miesiące… A co jeśli po jakimś czasie wzór faktury kontrahentów się zmieni? A co jeśli będziemy chcieli wdrożyć OCR dla innych typów dokumentów?

Szablon uniwersalny OCR

Alternatywą jest wykorzystanie szablonu uniwersalnego OCR. Wówczas rozpoznawane są poszczególne nazwy, tj. NIP, nazwa kontrahenta, kwota netto itd. bez względu na ich położenie na formularzu. Dzięki temu implementowany jest tylko jeden szablon dla wszystkich faktur. Rozwiązanie to zapewnia zdecydowanie krótszy czas wdrożenia, a także nie wymaga wprowadzania modyfikacji w przypadku zmian we wzorze faktur kontrahentów. Jedynym minusem uniwersalnego szablonu jest fakt, iż zapewnia on nieznacznie mniejszą skuteczność rozpoznawania znaków od szablonów dedykowanych. Jednakże ze względu na fakt, iż praktycznie zawsze efekty działania OCR weryfikowane są przez człowieka, nie powinno być to zbyt uciążliwe.

Szablon czy sieci neuronowe w OCR?

Sieci neuronowe?

Bardzo obiecującym rozwiązaniem wydaje się być zastosowanie sieci neuronowych w rozpoznawaniu znaków. Tego typu mechanizmy mają zdolność uczenia się wraz z kolejnym zeskanowanym dokumentem, podnosząc tym samym skuteczność działania OCR. Wkrótce postaram się napisać więcej o tego typu oprogramowaniu.

Co wybrać?

Szablony dedykowane są rozwiązaniem przestarzałym, czasochłonnym we wdrożeniu i drogim w utrzymaniu. Obecnie optymalnym wyborem będzie zastosowanie szablonów uniwersalnych, które są zdecydowanie bardziej elastyczne i wydajne kosztowo. Niemniej jednak przyszłość może należeć do sieci neuronowych, które stale rozwijane będą w stanie dostarczać nową jakość w pełnotekstowym skanowaniu dokumentów.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.

Yet Another Social Plugin powered by TutsKid.com.