Archive for Informacje ogólne

OCR wzbogacony o sieci neuronowe = nowa jakość?

neural_network_by_stuart203-d4r1tc5

Mechanizm Optycznego Rozpoznawania Znaków jest obecnie narzędziem o wysokiej skuteczności i różnorodnym zastosowaniu – od firmowych dokumentów do książek digitalizowanych przez (nie)świadomych użytkowników reCAPTCHY. A co gdyby dodać do OCR także namiastkę inteligencji w postaci sieci neuronowych?

Zanim przejdę jednak do omówienia możliwości oferowanych przez sieci neuronowe, chciałbym zwrócić uwagę na fakt, iż obecnie możemy podzielić działanie OCR na dwie sfery:

Czytaj dalej

Microsoft oferuje OCR w SkyDrive!

OCR w SkyDrive

Software’owi giganci robią wszystko by nie pozostać w tyle i nie stracić pozycji rynkowej! Niedawno pisałem o OCR w usłudze Google Drive. Okazało się, że podobny patent zastosował Microsoft w usłudze SkyDrive. Szykuje nam się OCR-owa wojna?

Od końca sierpnia tego roku, chmura Microsoftu ma możliwość optycznego rozpoznawania znaków z przesyłanych do niej zdjęć. W SkyDrive wykorzystano dokładnie ten sam engine, który obecny jest w wyszukiwarce Bing. Może być to przydatne w celu przechowania i możliwości szybkiego skopiowania informacji znajdujących się np. na ulotkach, wizytówkach, mapach i innych obiektach tego typu.
OCR w SkyDrive
Obecnie możliwe jest rozpoznawanie znaków w językach: angielskim, portugalskim, hiszpańskim, francuskim i niemieckim. Na tym polu Microsoft zdecydowanie przegrywa z Google, który oferuje skanowanie w 34 językach, w tym polskim.

Czytaj dalej

Dokumenty papierowe a bezpieczeństwo danych

Bezpieczeństwo dokumentów

Znacie Kevina Mitnicka? To najsłynniejszy hacker na świecie, o którym Hollywood nakręcił film (Takedown, 2000). Zapewne słysząc słowo „hacker”, większość osób ma w wyobraźni obraz typowego „kujona” we flanelowej koszulki, który od komputera odchodzi tylko po to, aby zaspokoić swoje podstawowe potrzeby życiowe. Dużo mniej osób jednak wie, że Mitnick swój sukces zawdzięcza nie tylko znajomościom systemów komputerowych, ale także socjotechnice i tzw. dumpster divingowi (brzmi mądrze, lecz chodzi o pospolite grzebanie w śmieciach, w tym przypadku w poszukiwaniu przydatnych danych). Wszak najsłabszym ogniwem każdego systemu jest zawsze człowiek.

Mitnick, w książce „Sztuka Podstępu” udowadniał jak wiele ważnych informacji można znaleźć w pojemniku na odpady umieszczonym obok siedziby firmy. Dane pracowników, numery kont bankowych, korespondencję i wiele innych. Posiadając taką wiedzę, manipulowanie pracownikami okazywało się czynnością dziecinnie prostą.

Elektroniczne dokumenty vs papierowe dokumenty

Jednakże wciąż w bardzo wielu organizacjach, kiedy przywołany zostaje temat zastąpienia papierowych dokumentów elektronicznymi, pracownicy obawiają się o bezpieczeństwo. Brak wiedzy, ignorancja czy zbytnie przyzwyczajenie do papieru? Przyjrzyjmy się jakie największe zagrożenia niesie ze sobą wykorzystywanie papierowych dokumentów.

Czytaj dalej

Ngram Viewer – kolejny przykład wykorzystania OCR

Google Labs

Pamiętacie wpis o reCAPTCHY*, który ujawniał jak na co dzień skanujemy książki? Teraz czas na system, który pozwala wykorzystać zeskanowane materiały. Ngram Viewer, bo o nim mowa, stworzony został przez Google Labs i zawiera bazę ponad 5 milionów książek (zawierający 500 miliardów słów!) z lat 1800-2008, które poddano OCR-owaniu w firmie Larry’ego Page’a.

Wszystkie mole książkowe, którym zaświeciły się w tym miejscu oczy, na myśl o dostępie do tych wszystkich zbiorów, muszę ostrzec: Ngram Viewer służy głównie do badań statystycznych i językoznawczych. Nie ma możliwości przeczytania danego dzieła od deski do deski, można co najwyżej podejrzeć pewne fragmenty. 

Jak to działa?

Ale po kolei. Narzędzie Google służy do wyszukiwania pożądanych fraz, w danym przedziale czasowym i języku zeskanowanych publikacji. Dane zwracane są w formie wykresu, który prezentuje poziom częstotliwości występowania danego słowa na przestrzeni czasu. Możliwe jest wyszukiwanie złożonych fraz (np. atak terrorystyczny) jak i zestawianie ich ze sobą (np. Bóg i nauka jak na obrazku poniżej). 

Czytaj dalej

Testy OCR – który najlepszy dla firmy? Cz. 1: ABBYY

Testy OCR od ABBYY

Technologia Optycznego Rozpoznawania Znaków (OCR) wykorzystana w przedsiębiorstwie, jest w stanie zaoszczędzić wymierne sumy pieniędzy, które w innym przypadku musiałby zostać wydane np. na opłacenie odpowiednich pracowników. W poprzednim wpisie wskazałem na co zwracać uwagę podczas wyboru konkretnego rozwiązania. Czas na przyjrzenie się konkretnym programom.

Każdy kto słyszał o OCR, z pewnością natknął się na jeden z produktów ABBYY. Nie bez powodu, gdyż oprogramowanie tej rosyjskiej firmy, obecne jest na rynku dość długo i znane jest z bardzo dobrej jakości. 

Jak to wygląda w testach? Zależy od testu :). Aczkolwiek w ogromnej ilości przypadków OCR od ABBYY radzi sobie całkiem nieźle. Przedstawiam zestaw kilku różnych testów, w które w rozmaity sposób wyciskają siódme poty z rosyjskiego OCR-a:

Czytaj dalej

OCR – jak wybrać dobry software?

barcoderay

Na początku lat 90. zaczęto organizować swego rodzaju zawody w dokładności rozpoznawania znaków przez oprogramowanie OCR. Nie były to jednak chałupnicze projekty, a dość poważne i kompleksowe badania przeprowadzane przez amerykańskie Information Science Research Institute (ISRI) oraz University of Nevada Las Vegas (tak, nawet w światowej stolicy hazardu znajduje się szanowana uczelnia!). W 1995 roku odbyła się ostatnia edycja tego konkursu.

Od tego czasu sporo się jednak zmieniło. W końcu 18 lat w branży informatycznej to niemalże wieczność. Jak zatem stwierdzić który software obecnie jest najlepszy? 

Dużo zależy od tego jak przeprowadzone zostaną testy, jakie kryteria będą wzięte pod uwagę oraz czego tak naprawdę potrzeba osobie/firmie zainteresowanej kupnem oprogramowania OCR. Bowiem inne wymagania będzie mieć firma sprzedażowa, pracująca głównie na drukowanych fakturach, a inne biblioteka publiczna, starająca się digitalizować swoje wiekowe zbiory.

Podczas oceny i wyboru oprogramowania należy wziąć przynajmniej 6 czynników, które mogą mieć wpływ na ostateczną decyzję:

Czytaj dalej

Wykorzystanie OCR – badania i statystyki

Statystyki skanowania OCR

W niniejszym wpisie chciałbym spojrzeć na Optical Character Recognition (OCR) z nieco szerszej perspektywy. Dlatego też w oparciu o badania AIIM przedstawię kilka liczb opisujących m.in.: w jakim procencie przedsiębiorstw używa się OCR-a, w ilu przypadkach pomimo skanowania, tekst musi być mimo wszystko ręcznie wprowadzany, o ile procent OCR/ICR jest w stanie przyspieszyć pracę na dokumentami i nie tylko.

Wykorzystanie OCR

26% użytkowników OCR

skanuje 100 lub mniej dokumentów na dzień.

10% użytkowników OCR

procesuje ponad 10 000 dokumentów na dzień!

88%

– taki odsetek respondentów korzysta ze skanowania w pracy. Jednakże tylko 32% z nich używa do tego OCR.

55%

– ponad połowa z przepytanych osób skanuje dokumenty, a następnie ręcznie przepisuje zawarte w nich dane, korzystając przy tym z systemu workflow
CZYTAJ DALEJ

Czym jest OCR – optyczne rozpoznawanie znaków?

OCR skaner

OCR (z ang. Optical Character Recognition) – Optyczne Rozpoznawanie Znaków.

Oprogramowanie służące do analizy tekstu pisanego, drukowanego bądź odręcznego, a następnie jego konwersji do postaci elektronicznej (w formie plików .txt, .doc lub .pdf), umożliwiającej dalszą edycję. Technologia ta znajduje szerokie zastosowanie m.in. w przedsiębiorstwach (rejestrowanie dokumentów i wniosków) i bibliotekach (archiwizacja zbiorów).

Prosty schemat działania systemu OCR:

Optical Character Recognition2

 

 

 

 

Najpierw dokument skanowany jest za pomocą skanera. Następnie przetwarzany przez komputer z odpowiednim oprogramowaniem. W efekcie końcowym wyświetlany jest edytowalny tekst. Metoda rozpoznawania różna jest w zależności od wykorzystanych algorytmów. Obecnie najlepsze programy OCR zapewniają skuteczność na poziomie 99%-99,5%, co oznacza że wciąż zachodzi konieczność manualnej weryfikacji rozpoznania niektórych słów.

Czytaj dalej

Yet Another Social Plugin powered by TutsKid.com.