dokumenty Archives - OCR w dokumentach

Tag Archive for dokumenty

Google Drive i darmowy OCR

18 lipca 2013 Michał Rykiert Zastosowanie OCR 6 comments

Interesuje Cię OCR, ale nie będziesz skanować tak dużo, aby opłacalne było kupno specjalistycznego oprogramowania? „Wujek Google” ma dla Ciebie rozwiązanie. Oferuje Optyczne Rozpoznawanie Znaków przy okazji korzystania z Google Drive. Skanować można także używając aplikacji mobilnej na Androida. Brzmi nieźle? Zobaczmy jak to wygląda w praktyce.

Cały proces jest bardzo prosty. Umieszczając plik PDF lub zdjęcie (JPG, GIF, PNG) na Dysku Google możemy skorzystać z funkcji OCR. Wówczas zostanie on zeskanowany i przekonwertowany do formy tekstowej. Przy tym wszystko odbywa się w chmurze przy minimalnej ingerencji użytkownika końcowego. System obsługuje 34 języki, wśród których jest także polski, a z trudniejszych do odczytania także rosyjski, chiński (uproszczony) i kilka innych rodem z Azji.

Usługa ma jednak swoje limity. Pliki graficzne nie mogą przekraczać 2MB, a pliki PDF 10-u stron. Ponadto materiał poddawany skanowaniu powinien być dobrej jakości, szczególnie jeśli chodzi o rozdzielczość, jakość obrazu czy orientację. Do zadań firmowych to zdecydowanie za mało, jednakże dla zastosowań domowych powinno wystarczyć.

Czytaj dalej

Wykorzystanie OCR – badania i statystyki

20 marca 2013 Michał Rykiert Informacje ogólne, Korzyści z OCR, Zastosowanie OCR 2 comments

W niniejszym wpisie chciałbym spojrzeć na Optical Character Recognition (OCR) z nieco szerszej perspektywy. Dlatego też w oparciu o badania AIIM przedstawię kilka liczb opisujących m.in.: w jakim procencie przedsiębiorstw używa się OCR-a, w ilu przypadkach pomimo skanowania, tekst musi być mimo wszystko ręcznie wprowadzany, o ile procent OCR/ICR jest w stanie przyspieszyć pracę na dokumentami i nie tylko.

26% użytkowników OCR

skanuje 100 lub mniej dokumentów na dzień.

10% użytkowników OCR

procesuje ponad 10 000 dokumentów na dzień!

88%

– taki odsetek respondentów korzysta ze skanowania w pracy. Jednakże tylko 32% z nich używa do tego OCR.

55%

– ponad połowa z przepytanych osób skanuje dokumenty, a następnie ręcznie przepisuje zawarte w nich dane, korzystając przy tym z systemu workflow
CZYTAJ DALEJ

Rozponawanie tekstu w przedsiębiorstwie

7 marca 2013 Michał Rykiert Korzyści z OCR, Zastosowanie OCR No comments

Szukając materiału do kolejnego wpisu natknąłem się na serię artykułów o OCR, znajdujących się na stronie Uniwersytetu Ekonomicznego w Krakowie. Jeden z nich szczególnie przykuł moją uwagę, dlatego pozwalam sobie na zacytowanie kilku jego fragmentów.

Autorem tekstu jest p. Kinga Rocławska:

„Jeśli jedna osoba przepisywałaby ręcznie 1 stronę A4 dziennie, to w ciągu roku spędziłaby 15 dni roboczych czyli 3 tygodnie pracy na tej czynności. Natomiast jeżeli dwudziestu pracownikom firmy zajmuje po 30 minut w ciągu dnia ręczne przepisywanie tekstu, strata czasu jest 20-krotnie wyższa.”

Czytaj dalej

Zastosowanie modułu OCR w praktyce

21 lutego 2013 Michał Rykiert OCR w systemie, Zastosowanie OCR 2 comments

W poprzednich wpisach skupiałem się bardziej na teoretycznym opisie tego czym jest Optical Character Recognition (OCR). Tymczasem warto byłoby zobaczyć jak całe rozwiązanie jest w stanie funkcjonować jako część większej platformy.

Obecnie moduł OCR najczęściej wykorzystywany jest w przedsiębiorstwach przy zarządzaniu elektronicznymi dokumentami. Jeśli przyjąć za kryterium wyboru sprawność w digitalizacji tradycyjnych dokumentów, a także procesy zarządzające ich obiegiem, jednym z ciekawszych rozwiązań na rynku jest WEBCON Business Process Suite, którego integralną częścią jest wbudowany OCR.

Charakterystyczne cechy OCR w WEBCON BPS:

– oparty jest na logice algorytmów rozmytych – wyszukuje i zaznacza słowa kluczowe (np. NIP, data płatności), przez co nie ma konieczności tworzenia dedykowanego szablonu dla każdego kontrahenta. Informacje są pobierane i uzupełniane samoczynnie, a następnie przekazywane w systemie obiegu dokumentów do akceptacji.

Czytaj dalej

Jak digitalizujemy książki nawet o tym nie wiedząc?

11 stycznia 2013 Michał Rykiert Jak działa OCR?, Zastosowanie OCR 26 comments

Jednym z najciekawszych i najbardziej pomysłowych rozwiązań na jakie się ostatnio natknąłem jest reCAPTCHA. Dzięki niej, miliony ludzi na świecie staje się swego rodzaju manualnym OCR-em, nawet o tym nie wiedząc. Jak to możliwe?

Rejestrując się na stronie lub na forum, zazwyczaj na koniec tego procesu witryna zmusza Cię do udowodnienia, że nie jesteś botem do rozpowszechniania spamu. Co robisz? W 90% przypadków przepisujesz kod/wyraz z wyświetlonego obrazka obrazka. Tak działa m.in. reCAPTCHA.

Jak to się ma do OCR-a? Nawet najlepsze systemy nie są w stanie rozpoznać 100% skanowanych wyrazów. Obecnie skuteczność tego typu programów kształtuje się na poziomie 90-98%, w zależności od wykorzystywanych algorytmów i jakości skanowanego tekstu. To oznacza, że przy tekście zawierającym 20 000 słów, wciąż od 400 do 2000 pozostaje do rozpoznania przez człowieka.

Czytaj dalej

Dyrektor IT o OCR

9 stycznia 2013 Michał Rykiert Jak działa OCR?, Zastosowanie OCR No comments

Niedawno ukazał się wywiad z Markiem Witkowskim, dyrektorem IT w Sudzucker Polska. Wśród różnych, dość interesujących wypowiedzi, znalazłem także fragment o wykorzystaniu modułu OCR w tej firmie. Historia jest ciekawa, dlatego pozwalam ją sobie przytoczyć, cytując fragment wywiadu.

„- Od kilku lat firma korzysta z modułu OCR. Jak jest wykorzystywany, jakie przynosi korzyści i czy jest wart polecenia?

Czytaj dalej

Czym jest OCR – optyczne rozpoznawanie znaków?

12 października 2012 Michał Rykiert Informacje ogólne 3 comments

OCR (z ang. Optical Character Recognition) – Optyczne Rozpoznawanie Znaków.

Oprogramowanie służące do analizy tekstu pisanego, drukowanego bądź odręcznego, a następnie jego konwersji do postaci elektronicznej (w formie plików .txt, .doc lub .pdf), umożliwiającej dalszą edycję. Technologia ta znajduje szerokie zastosowanie m.in. w przedsiębiorstwach (rejestrowanie dokumentów i wniosków) i bibliotekach (archiwizacja zbiorów).

Prosty schemat działania systemu OCR:

Najpierw dokument skanowany jest za pomocą skanera. Następnie przetwarzany przez komputer z odpowiednim oprogramowaniem. W efekcie końcowym wyświetlany jest edytowalny tekst. Metoda rozpoznawania różna jest w zależności od wykorzystanych algorytmów. Obecnie najlepsze programy OCR zapewniają skuteczność na poziomie 99%-99,5%, co oznacza że wciąż zachodzi konieczność manualnej weryfikacji rozpoznania niektórych słów.

Czytaj dalej

Witaj na blogu o OCR!

5 października 2012 Michał Rykiert Bez kategorii One comment

Technologie informatyczne są nieodłącznym elementem naszego życia. Jeszcze w 1946 roku uważano komputer ENIAC (Electronic Numerical Integrator And Computer) za szczyt rozwoju myśli technicznej. Wówczas ten amerykański wynalazek zajmował powierzchnię zbliżoną do rozmiarów boiska do piłki nożnej, a cała aparatura ważyła ok. 27 ton. Jego moc obliczeniowa była wiele razy niższa, od tej którą obecnie posiadają najprostsze kalkulatory.

Komputer ENIAC, 1946 rok:

Tymczasem to, co w połowie XX wieku pozostawało co najwyżej w sferze marzeń, dziś jest rzeczywistością. Bankowość internetowa, e-maile czy portale społecznościowe, to tylko kilka przykładów rozwiązań, z których większość z nas korzysta na co dzień. Celem niniejszego bloga jest przybliżenie czytelnikowi technologii, która choć nie uzyskała powszechnego rozgłosu, z roku na rok udowadnia, że jej wykorzystanie może znacząco przyczynić się do ułatwienia codziennych zadań, szczególnie w sferze pracy. Mowa tu o systemie Optical Character Recognition (OCR), zamieniającym w ciągu kilku sekund tekst na papierze, w tekst elektroniczny.

Dalej

OCR w dokumentach

Jedyny, polski blog o Optycznym Rozpoznawaniu Znaków, oraz naprawa telefonów Warszawa która obsługuje cało Polskę

Tag Archive for dokumenty

Google Drive i darmowy OCR

Wykorzystanie OCR – badania i statystyki

26% użytkowników OCR

10% użytkowników OCR

88%

55%

Rozponawanie tekstu w przedsiębiorstwie

Zastosowanie modułu OCR w praktyce

Charakterystyczne cechy OCR w WEBCON BPS:

Jak digitalizujemy książki nawet o tym nie wiedząc?

Dyrektor IT o OCR

Czym jest OCR – optyczne rozpoznawanie znaków?

OCR (z ang. Optical Character Recognition) – Optyczne Rozpoznawanie Znaków.

Prosty schemat działania systemu OCR:

Witaj na blogu o OCR!

Najnowsze wpisy

Polecane

Kategorie

Najnowsze komentarze

Archiwa

Kalendarz

Meta

Październik 2017
P	W	Ś	C	P	S	N
« sie
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31