Czym jest OCR – optyczne rozpoznawanie znaków?

OCR skaner

OCR (z ang. Optical Character Recognition) – Optyczne Rozpoznawanie Znaków.

Oprogramowanie służące do analizy tekstu pisanego, drukowanego bądź odręcznego, a następnie jego konwersji do postaci elektronicznej (w formie plików .txt, .doc lub .pdf), umożliwiającej dalszą edycję. Technologia ta znajduje szerokie zastosowanie m.in. w przedsiębiorstwach (rejestrowanie dokumentów i wniosków) i bibliotekach (archiwizacja zbiorów).

Prosty schemat działania systemu OCR:

Optical Character Recognition2

 

 

 

 

Najpierw dokument skanowany jest za pomocą skanera. Następnie przetwarzany przez komputer z odpowiednim oprogramowaniem. W efekcie końcowym wyświetlany jest edytowalny tekst. Metoda rozpoznawania różna jest w zależności od wykorzystanych algorytmów. Obecnie najlepsze programy OCR zapewniają skuteczność na poziomie 99%-99,5%, co oznacza że wciąż zachodzi konieczność manualnej weryfikacji rozpoznania niektórych słów.

Czytaj dalej

Witaj na blogu o OCR!

OCR blog

Technologie informatyczne są nieodłącznym elementem naszego życia. Jeszcze w 1946 roku uważano komputer ENIAC (Electronic Numerical Integrator And Computer) za szczyt rozwoju myśli technicznej. Wówczas ten amerykański wynalazek zajmował powierzchnię zbliżoną do rozmiarów boiska do piłki nożnej, a cała aparatura ważyła ok. 27 ton. Jego moc obliczeniowa była wiele razy niższa, od tej którą obecnie posiadają najprostsze kalkulatory.

Komputer ENIAC, 1946 rok:

ENIAC

Tymczasem to, co w połowie XX wieku pozostawało co najwyżej w sferze marzeń, dziś jest rzeczywistością. Bankowość internetowa, e-maile czy portale społecznościowe, to tylko kilka przykładów rozwiązań, z których większość z nas korzysta na co dzień. Celem niniejszego bloga jest przybliżenie czytelnikowi technologii, która choć nie uzyskała powszechnego rozgłosu, z roku na rok udowadnia, że jej wykorzystanie może znacząco przyczynić się do ułatwienia codziennych zadań, szczególnie w sferze pracy. Mowa tu o systemie Optical Character Recognition (OCR), zamieniającym w ciągu kilku sekund tekst na papierze, w tekst elektroniczny.

 

Dalej

Yet Another Social Plugin powered by TutsKid.com.