Czym jest OCR – optyczne rozpoznawanie znaków?

OCR skaner

OCR (z ang. Optical Character Recognition) – Optyczne Rozpoznawanie Znaków.

Oprogramowanie służące do analizy tekstu pisanego, drukowanego bądź odręcznego, a następnie jego konwersji do postaci elektronicznej (w formie plików .txt, .doc lub .pdf), umożliwiającej dalszą edycję. Technologia ta znajduje szerokie zastosowanie m.in. w przedsiębiorstwach (rejestrowanie dokumentów i wniosków) i bibliotekach (archiwizacja zbiorów).

Prosty schemat działania systemu OCR:

Optical Character Recognition2

 

 

 

 

Najpierw dokument skanowany jest za pomocą skanera. Następnie przetwarzany przez komputer z odpowiednim oprogramowaniem. W efekcie końcowym wyświetlany jest edytowalny tekst. Metoda rozpoznawania różna jest w zależności od wykorzystanych algorytmów. Obecnie najlepsze programy OCR zapewniają skuteczność na poziomie 99%-99,5%, co oznacza że wciąż zachodzi konieczność manualnej weryfikacji rozpoznania niektórych słów.

Przykład wykorzystania OCR przez Google Docs:
Google Docs OCR

 

 

 

 

 

 

 

Poniżej filmik przedstawiający w praktyce wykorzystanie OCR. W tym przypadku z wykorzystaniem systemu elektronicznego obiegu dokumentów.

Rejestracja faktury w systemie obiegu dokumentów

3 comments

  1. suplementy ketony pisze:

    strona bardzo mi sie podoba, dawno nie czytalam tak ciekawych i przydatnych notek. Mam nadzieje, ze znajde tu, w przyszlosci, jeszcze wiecej interesujacych informacji. Pozdrawiam serdecznie!

  2. praca w internecie od zaraz pisze:

    Bardzo ciekawa wpis, czytalem z przyjemnoscia. Moglbym prosic o jakies powiadomienia, gdy pojawia sie kolejne? Chcialbym tu czesciej zagladac, a taka forma przypomnienia bylaby dla mnie najwygodniejsza. Super strona! Pozdrawiam!

  3. Alex pisze:

    Cześć, radzę spróbować tej stronie https://img2txt.com/pl/ =)

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.

Yet Another Social Plugin powered by TutsKid.com.