Tag Archive for skan

Dokumenty papierowe a bezpieczeństwo danych

Bezpieczeństwo dokumentów

Znacie Kevina Mitnicka? To najsłynniejszy hacker na świecie, o którym Hollywood nakręcił film (Takedown, 2000). Zapewne słysząc słowo „hacker”, większość osób ma w wyobraźni obraz typowego „kujona” we flanelowej koszulki, który od komputera odchodzi tylko po to, aby zaspokoić swoje podstawowe potrzeby życiowe. Dużo mniej osób jednak wie, że Mitnick swój sukces zawdzięcza nie tylko znajomościom systemów komputerowych, ale także socjotechnice i tzw. dumpster divingowi (brzmi mądrze, lecz chodzi o pospolite grzebanie w śmieciach, w tym przypadku w poszukiwaniu przydatnych danych). Wszak najsłabszym ogniwem każdego systemu jest zawsze człowiek.

Mitnick, w książce „Sztuka Podstępu” udowadniał jak wiele ważnych informacji można znaleźć w pojemniku na odpady umieszczonym obok siedziby firmy. Dane pracowników, numery kont bankowych, korespondencję i wiele innych. Posiadając taką wiedzę, manipulowanie pracownikami okazywało się czynnością dziecinnie prostą.

Elektroniczne dokumenty vs papierowe dokumenty

Jednakże wciąż w bardzo wielu organizacjach, kiedy przywołany zostaje temat zastąpienia papierowych dokumentów elektronicznymi, pracownicy obawiają się o bezpieczeństwo. Brak wiedzy, ignorancja czy zbytnie przyzwyczajenie do papieru? Przyjrzyjmy się jakie największe zagrożenia niesie ze sobą wykorzystywanie papierowych dokumentów.

Czytaj dalej

ICR – czy warto skanować pismo odręczne?

ICR

W swoich dotychczasowych wpisach poruszałem głównie tematykę związaną z „klasycznym” OCR-rem. Nie jest to jednak jedyny termin określający oprogramowanie rozpoznające znaki. Jednym z ciekawszych przykładów jest ICR – Intelligent Character Recogniction (Inteligentne Rozpoznawanie znaków).

Na czym polega ICR?

Intelligent Character Recognition to aplikacja wykorzystująca zaawansowane algorytmy, służące do rozpoznawania pisma odręcznego. Większość aplikacji ICR posiada algorytmy uczące się (tzw. sieci neuronowe), które automatycznie aktualizują swoją bazę w miarę rozpoznawania kolejnych typów pisma.

Zasada działania jest analogiczna jak w przypadku OCR. Rozpoznawane kształty przenoszone są do formy cyfrowej, natomiast tam gdzie program napotkał problem, znaki pozostają do rozpoznania przez użytkownika. Oprogramowanie ICR często posiada kilka silników rozpoznających na raz. Wówczas wyniki skanów zestawiane są ze sobą w celu jak najlepszej interpretacji tekstu.

Czytaj dalej

5 największych przeszkód w OCR-owaniu

OCR dokumentów

Optical Character Recognition (OCR) to technologia bez wątpienia przydatna i pożyteczna. Nie jest jednak pozbawiona wad. O niedoskonałościach w rozpoznawaniu znaków napomknąłem już wcześniej. Teraz chciałbym przedstawić inne problemy, które negatywnie wpływają na rozpoznawanie znaków.

OCR świetnie sprawdza się w firmach – tam zazwyczaj skanowane wydruki są dobrej jakości i większość programów bez problemu rozpoznaje między 95 a 99% znaków. Dużo gorzej jest np. w przypadku bibliotek. Tam, niektóre ze zbiorów (często już wiekowych) nie stwarzają już tak dobrych warunków do digitalizacji tekstu. Książki bywają zniszczone, pisane archaicznym językiem i niespotykaną obecnie czcionką. To oczywiście dość ekstremalne przypadki, ale dobrze obrazują przeszkody jakie napotyka oprogramowanie.

Problemy w pełnotekstowym skanowaniu OCR

Przyjrzyjmy się co bywa największym problemem w pełnotekstowym skanowaniu.

Czytaj dalej

Yet Another Social Plugin powered by TutsKid.com.