Tag Archive for Intelligent Character Recognition

ICR – czy warto skanować pismo odręczne?

ICR

W swoich dotychczasowych wpisach poruszałem głównie tematykę związaną z „klasycznym” OCR-rem. Nie jest to jednak jedyny termin określający oprogramowanie rozpoznające znaki. Jednym z ciekawszych przykładów jest ICR – Intelligent Character Recogniction (Inteligentne Rozpoznawanie znaków).

Na czym polega ICR?

Intelligent Character Recognition to aplikacja wykorzystująca zaawansowane algorytmy, służące do rozpoznawania pisma odręcznego. Większość aplikacji ICR posiada algorytmy uczące się (tzw. sieci neuronowe), które automatycznie aktualizują swoją bazę w miarę rozpoznawania kolejnych typów pisma.

Zasada działania jest analogiczna jak w przypadku OCR. Rozpoznawane kształty przenoszone są do formy cyfrowej, natomiast tam gdzie program napotkał problem, znaki pozostają do rozpoznania przez użytkownika. Oprogramowanie ICR często posiada kilka silników rozpoznających na raz. Wówczas wyniki skanów zestawiane są ze sobą w celu jak najlepszej interpretacji tekstu.

Czytaj dalej

Wykorzystanie OCR – badania i statystyki

Statystyki skanowania OCR

W niniejszym wpisie chciałbym spojrzeć na Optical Character Recognition (OCR) z nieco szerszej perspektywy. Dlatego też w oparciu o badania AIIM przedstawię kilka liczb opisujących m.in.: w jakim procencie przedsiębiorstw używa się OCR-a, w ilu przypadkach pomimo skanowania, tekst musi być mimo wszystko ręcznie wprowadzany, o ile procent OCR/ICR jest w stanie przyspieszyć pracę na dokumentami i nie tylko.

Wykorzystanie OCR

26% użytkowników OCR

skanuje 100 lub mniej dokumentów na dzień.

10% użytkowników OCR

procesuje ponad 10 000 dokumentów na dzień!

88%

– taki odsetek respondentów korzysta ze skanowania w pracy. Jednakże tylko 32% z nich używa do tego OCR.

55%

– ponad połowa z przepytanych osób skanuje dokumenty, a następnie ręcznie przepisuje zawarte w nich dane, korzystając przy tym z systemu workflow
CZYTAJ DALEJ

Jak działa OCR?

OCR - rozpoznawanie struktury rastrowej

Proces konwersji pliku graficznego do edytowalnego dokumentu podzielony jest na kilka etapów, za które odpowiadają różne zestawy algorytmów.

Pierwszym krokiem jest załadowanie obrazu dokumentu w postaci bitmapy. Następnie zeskanowany tekst jest analizowany na kilka różnych sposobów.

Na początku program OCR dokonuje analizy layoutu i dzieli stronę na poszczególne elementy. Dzięki temu możliwa jest identyfikacja miejsc, w których znajduje się tekst. Ten z kolei dzielony jest na coraz mniejsze elementy: akapity, wersy, słowa i znaki. Na tym etapie dokument zapamiętywany jest jako zbiór pojedynczych znaków.

OCR - rozpoznawanie struktury rastrowej

Następnie znaki te rozpoznawane są przy użyciu poszczególnych algorytmów. Rodzaj i sposób ich wykorzystania zależy od producentów oprogramowania. Nie istnieje jedna, uniwersalna metoda, jednak można wyszczególnić kilka najbardziej popularnych technik:

Czytaj dalej

Yet Another Social Plugin powered by TutsKid.com.