Archive for Październik 2012

Czym jest OCR – optyczne rozpoznawanie znaków?

OCR skaner

OCR (z ang. Optical Character Recognition) – Optyczne Rozpoznawanie Znaków.

Oprogramowanie służące do analizy tekstu pisanego, drukowanego bądź odręcznego, a następnie jego konwersji do postaci elektronicznej (w formie plików .txt, .doc lub .pdf), umożliwiającej dalszą edycję. Technologia ta znajduje szerokie zastosowanie m.in. w przedsiębiorstwach (rejestrowanie dokumentów i wniosków) i bibliotekach (archiwizacja zbiorów).

Prosty schemat działania systemu OCR:

Optical Character Recognition2

 

 

 

 

Najpierw dokument skanowany jest za pomocą skanera. Następnie przetwarzany przez komputer z odpowiednim oprogramowaniem. W efekcie końcowym wyświetlany jest edytowalny tekst. Metoda rozpoznawania różna jest w zależności od wykorzystanych algorytmów. Obecnie najlepsze programy OCR zapewniają skuteczność na poziomie 99%-99,5%, co oznacza że wciąż zachodzi konieczność manualnej weryfikacji rozpoznania niektórych słów.

Czytaj dalej

Yet Another Social Plugin powered by TutsKid.com.