<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>OCR w dokumentach &#187; Michał Rykiert</title>
	<atom:link href="/author/michal-rykiert/feed/" rel="self" type="application/rss+xml" />
	<link>http://ocrwdokumentach.pl</link>
	<description>Jedyny, polski blog o Optycznym Rozpoznawaniu Znaków</description>
	<lastBuildDate>Wed, 12 Aug 2015 10:43:17 +0000</lastBuildDate>
	<language>pl-PL</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	
	<item>
		<title>OCR wzbogacony o sieci neuronowe = nowa jakość?</title>
		<link>http://ocrwdokumentach.pl/ocr-wzbogacony-o-sieci-neuronowe-nowa-jakosc/</link>
		<comments>http://ocrwdokumentach.pl/ocr-wzbogacony-o-sieci-neuronowe-nowa-jakosc/#comments</comments>
		<pubDate>Wed, 12 Aug 2015 10:41:21 +0000</pubDate>
		<dc:creator><![CDATA[Michał Rykiert]]></dc:creator>
				<category><![CDATA[Informacje ogólne]]></category>
		<category><![CDATA[Jak działa OCR?]]></category>
		<category><![CDATA[faktura]]></category>
		<category><![CDATA[faktury]]></category>
		<category><![CDATA[Optical Character Recognition]]></category>
		<category><![CDATA[searchable PDF]]></category>
		<category><![CDATA[sieć neuronowa]]></category>
		<category><![CDATA[sieci neuronowe]]></category>

		<guid isPermaLink="false">http://ocrwdokumentach.pl/?p=424</guid>
		<description><![CDATA[<p>Mechanizm Optycznego Rozpoznawania Znaków jest obecnie narzędziem o wysokiej skuteczności i różnorodnym zastosowaniu – od firmowych dokumentów do książek digitalizowanych przez (nie)świadomych użytkowników reCAPTCHY. A co gdyby dodać do OCR</p>
<p>Post <a rel="nofollow" href="/ocr-wzbogacony-o-sieci-neuronowe-nowa-jakosc/">OCR wzbogacony o sieci neuronowe = nowa jakość?</a> pojawił się poraz pierwszy w <a rel="nofollow" href="/">OCR w dokumentach</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p>Mechanizm Optycznego Rozpoznawania Znaków jest obecnie narzędziem o wysokiej skuteczności i różnorodnym zastosowaniu – od firmowych dokumentów do książek digitalizowanych przez <a href="/jak-digitalizujemy-ksiazki-o-tym-nie-wiedzac/" target="_blank">(nie)świadomych użytkowników reCAPTCHY</a>. A co gdyby dodać do OCR także namiastkę inteligencji w postaci sieci neuronowych?</p>
<p>Zanim przejdę jednak do omówienia możliwości oferowanych przez sieci neuronowe, chciałbym zwrócić uwagę na fakt, iż obecnie możemy podzielić działanie <strong>OCR</strong> na dwie sfery:</p>
<p><span id="more-424"></span></p>
<h4>Rozpoznanie znaków</h4>
<p>Mechanizm rozpoznaje pojedyncze znaki, a poprzez analizowanie odstępów w skanowanym tekście dzieli je na wyrazy. Tego typu działanie służy np. do tworzenia tzw. „wyszukiwalnych plików PDF” (z ang. <strong>searchable PDF</strong>). W zależności od producenta, skuteczność rozpoznania zwiększana jest poprzez zastosowanie kolejnych warstw algorytmów, np. porównujących rozpoznaną frazę z wbudowanym słownikiem.</p>
<h4>Rozpoznanie treści</h4>
<p>Tutaj wykorzystywana jest pierwsza metoda w połączeniu z zaawansowanymi mechanizmami, które analizują rozpoznanie tekstu także w kontekście słów znajdujących się w jego bezpośredniej okolicy. OCR identyfikuje poszczególne wyrazy i sprawdza jak rozpoznanie wpasowuje się w całość skanowanego tekstu.</p>
<p>W tym drugim przypadku szczególnie przydatne okazują się <strong>sieci neuronowe</strong>, które zawierają zestaw reguł wg których rozpoznawane są poszczególne słowa i frazy. Weźmy za przykład faktury. OCR „wie”, że dane o wystawiającym fakturę powinny znajdować się w okolicach prawego górnego rogu. Nazwa ulicy poprzedzona jest wyrazem „ul.” po którym następuje numer domu, a następnie kod pocztowy i miasto. Natomiast numer konta bankowego ma 26 cyfr, zazwyczaj zapisany jest w określonym formacie i występuje obok słowa bank.</p>
<p><a href="/wp-content/uploads/2015/08/OCR-AI.png"><img class="aligncenter wp-image-427 size-large" title="OCR - sieci neuronowe" src="/wp-content/uploads/2015/08/OCR-AI-1024x474.png" alt="OCR sieci neuronowe" width="530" height="245" /></a></p>
<h2>Sieci neuronowe – z czym się to je</h2>
<p>Powyższe, to oczywiście prosty przykład, a tego typu reguł jest naprawdę dużo. To czym różni od siebie szablony rozpoznawania dokumentów od sieci neuronowych, to <strong>możliwość dynamicznej zmiany i „douczania”</strong> tych drugich, na podstawie rozpoznawanych dokumentów. Przy czym w przeciwieństwie do dedykowanych bądź uniwersalnych szablonów, nie jest to czynność wymagająca pracy programistycznej.</p>
<p>Odpowiednio przygotowany interfejs pozwoli każdemu użytkownikowi na wprowadzenie odpowiednich zmian i zmodyfikowanie sieci. Pomimo niebagatelnych zalet takiego rozwiązania (łatwość wykorzystania, elastyczność), <strong>istnieje też pewne ryzyko</strong>. Poprzez nieumiejętne „szkolenie” sieci neuronowych, można je „popsuć”. Prostym przykładem jest wskazywanie przez użytkownika błędnych danych jako poprawne. Idąc za przykładem faktur, byłoby to np. wskazanie numeru telefonu jako NIP-u sprzedawcy. Im więcej tego typu modyfikacji, tym gorsze będą wyniki rozpoznania.</p>
<p>Istnieją też przypadki pośrednie. W <a href="http://www.webcon.pl/" target="_blank">systemach obiegu dokumentów</a>, OCR jest rzeczą powszechnie wykorzystywaną. Zazwyczaj przygotowywana jest uniwersalna sieć neuronowa, działająca w odniesieniu do konkretnego typu dokumentu (np. wcześniej już wspomnianej faktury). Jednakże zdarzają się sytuacje, w których np. faktury od jednego z kontrahentów mają zupełnie inną strukturę niż w przypadku pozostałych. Co wtedy?</p>
<p>Uczenie uniwersalnej sieci na przykładzie wyjątków poskutkuje lepszym rozpoznaniem ich samych, jednocześnie negatywnie wpływając na identyfikacje całej reszty dokumentów. Dlatego też rozwiązania tej klasy oferują możliwość tworzenia <strong>dedykowanych sieci neuronowych</strong> ro skanowania dokumentów od wybranych kontrahentów. Wówczas wyróżnikiem, za pomocą którego system wybiera odpowiednią sieć neuronową, jest numer NIP, dlatego iż jest on unikalny i ściśle powiązanym z kontrahentem.</p>
<h2>Sieci neuronowe – co dalej?</h2>
<p>Bez wątpienia <strong>sieci neuronowe są przyszłością OCR</strong>. Wydaje się, iż jest to obecnie jedyny kierunek rozwoju, który może w przyszłości dostarczyć skuteczność rozpoznawania znaków i treści na poziomie 100%. W przypadku pisma maszynowego, nawet w kontekście słabej jakości skanów, nie jest to zbyt daleka przyszłość. Natomiast pismo odręczne to zupełnie inna bajka i na jakiekolwiek sensowne rezultaty (powyżej 80%, w warunkach „bojowych”, a nie laboratoryjnych) prawdopodobnie przyjdzie jeszcze nam trochę poczekać. Niemniej jednak &#8211; warto.</p>
<p>Post <a rel="nofollow" href="/ocr-wzbogacony-o-sieci-neuronowe-nowa-jakosc/">OCR wzbogacony o sieci neuronowe = nowa jakość?</a> pojawił się poraz pierwszy w <a rel="nofollow" href="/">OCR w dokumentach</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://ocrwdokumentach.pl/ocr-wzbogacony-o-sieci-neuronowe-nowa-jakosc/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Szablon OCR &#8211; dedykowany czy uniwersalny?</title>
		<link>http://ocrwdokumentach.pl/szablon-ocr-dedykowany-czy-uniwersalny/</link>
		<comments>http://ocrwdokumentach.pl/szablon-ocr-dedykowany-czy-uniwersalny/#comments</comments>
		<pubDate>Fri, 06 Dec 2013 13:09:38 +0000</pubDate>
		<dc:creator><![CDATA[Michał Rykiert]]></dc:creator>
				<category><![CDATA[OCR w systemie]]></category>
		<category><![CDATA[Zastosowanie OCR]]></category>
		<category><![CDATA[dedykowany]]></category>
		<category><![CDATA[dokument]]></category>
		<category><![CDATA[faktura]]></category>
		<category><![CDATA[moduł]]></category>
		<category><![CDATA[obieg dokumentów]]></category>
		<category><![CDATA[Optical Character Recognition]]></category>
		<category><![CDATA[Optyczne Rozpoznawanie Znaków]]></category>
		<category><![CDATA[sieć neuronowa]]></category>
		<category><![CDATA[sieci neuronowe]]></category>
		<category><![CDATA[szablon]]></category>
		<category><![CDATA[uniwersalny]]></category>

		<guid isPermaLink="false">http://ocrwdokumentach.pl/?p=402</guid>
		<description><![CDATA[<p>Sporo pisałem ostatnio o wykorzystaniu OCR w kontekście CAPTCHY. Jednakże nie można zapominać o tym, iż technologia Optycznego Rozpoznawania Znaków jest coraz powszechniej wykorzystywana w firmach. Największy zwrot z inwestycji</p>
<p>Post <a rel="nofollow" href="/szablon-ocr-dedykowany-czy-uniwersalny/">Szablon OCR &#8211; dedykowany czy uniwersalny?</a> pojawił się poraz pierwszy w <a rel="nofollow" href="/">OCR w dokumentach</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p>Sporo pisałem ostatnio o wykorzystaniu <a title="OCR i CAPTCHA" href="/captcha-kontra-spam/" target="_blank">OCR w kontekście CAPTCHY</a>. Jednakże nie można zapominać o tym, iż technologia Optycznego Rozpoznawania Znaków jest coraz powszechniej wykorzystywana w firmach. Największy zwrot z inwestycji (<strong>ROI</strong>) uzyskuje się dzięki zespoleniu OCR-a z systemem obiegu dokumentów. Dlatego też jednym z najpopularniejszych scenariuszy zastosowania Optical Character Recognition jest procesowanie za jego pomocą faktur kosztowych.</p>
<p>Dlaczego? Załóżmy, że firma Kowalski ma 100 kontrahentów, od których regularnie dostaje faktury. Każdy z nich ma inny wzór dokumentu, przez co manualne rejestrowanie tychże staje się dość uciążliwe, ponieważ większość czasu pracownicy spędzają na odszukiwaniu poszczególnych danych.</p>
<p>Dlatego też firma Kowalski decyduje się na wdrożenie systemu <strong>obiegu dokumentów ze</strong> <strong>zintegrowanym modułem OCR</strong>, aby proces ten przyspieszyć i zoptymalizować.</p>
<h2>OCR a obieg dokumentów</h2>
<p>Jak działa takie rozwiązanie? Mamy dwa podstawowe warianty. Pierwszy zakłada, że kontrahenci firmy Kowalski idą z duchem czasu i zamiast zasypywać siedzibę firmy zbędnym papierem, przysyłają na odpowiednią skrzynkę <strong>faktury drogą e-mailową</strong>. Wówczas są one przechwytywane, automatycznie poddawane skanowaniu przez OCR, poszczególne wartości (np. kwota netto/brutto, NIP, data wystawienia itd.) przenoszone są automatycznie do elektronicznego formularza, a skan faktury załączany do obiegu. W dalszej kolejności dokument przechodzi przez ścieżkę akceptacji i trafia do archiwum.</p>
<p><span id="more-402"></span></p>
<p>Drugie rozwiązanie opiera się na tradycyjnej metodzie przesyłania faktur papierowych. Wówczas te wymagają ręcznego ich zaniesienia do skanera, a następnie uruchomienia odpowiedniego obiegu. Dalej proces wygląda tak samo jak w poprzednim przykładzie.</p>
<p>W porządku. Jak zatem działa OCR „pod spodem” na przykładzie <a title="Procesowanie faktur w elektronicznym obiegu dokumentów" href="http://www.webcon.pl/workflow-obieg-faktury-kosztowej">faktur w elektronicznym obiegu dokumentów</a>? Zasadniczo mamy dwie możliwości konfiguracji: za pomocą szablonu dedykowanego i uniwersalnego.</p>
<h2>Szablon dedykowany OCR</h2>
<p>Szablony dedykowane tworzy się osobno dla każdego kontrahenta, zgodnie ze wzorem jego faktury. Wówczas wskazujemy jakie konkretne informacje znajdować będą się w poszczególnych miejscach na danej fakturze. Rozwiązanie to pozwala na osiągnięcie <strong>bardzo wysokiej skuteczności rozpoznawania znaków</strong>, dzięki czemu zredukowany do minimum zostaje czas, potrzebny na sprawdzenie poprawności działania mechanizmu OCR. Niestety rozwiązanie to ma także swoje wady. Zakładając, że firma Kowalski ma 100 kontrahentów, którzy przysyłają jej faktury, zajdzie konieczność stworzenia 100 osobnych szablonów dla każdego z nich. Przyjmijmy, że stworzenie jednego szablonu dedykowanego zajmuje średnio pół dnia roboczego. Wychodzi na to, że aby uruchomić <strong>OCR faktur</strong>, na samo tworzenie szablonów należy poświęcić prawie <strong>2 miesiące</strong>… A co jeśli po jakimś czasie wzór faktury kontrahentów się zmieni? A co jeśli będziemy chcieli wdrożyć OCR dla innych typów dokumentów?</p>
<h2>Szablon uniwersalny OCR</h2>
<p>Alternatywą jest wykorzystanie szablonu uniwersalnego OCR. Wówczas<strong> rozpoznawane są poszczególne nazwy</strong>, tj. NIP, nazwa kontrahenta, kwota netto itd. <strong>bez względu na ich położenie na formularzu</strong>. Dzięki temu implementowany jest tylko <strong>jeden szablon dla wszystkich faktur</strong>. Rozwiązanie to zapewnia zdecydowanie k<strong>rótszy czas wdrożenia</strong>, a także nie wymaga wprowadzania modyfikacji w przypadku zmian we wzorze faktur kontrahentów. Jedynym minusem uniwersalnego szablonu jest fakt, iż zapewnia on nieznacznie mniejszą skuteczność rozpoznawania znaków od szablonów dedykowanych. Jednakże ze względu na fakt, iż praktycznie zawsze efekty działania OCR weryfikowane są przez człowieka, nie powinno być to zbyt uciążliwe.</p>
<p style="text-align: center;"><a href="/wp-content/uploads/2013/12/neural_networking.jpg"><img class="aligncenter size-full wp-image-405" alt="Szablon czy sieci neuronowe w OCR?" src="/wp-content/uploads/2013/12/neural_networking.jpg" width="552" height="367" /></a></p>
<h2>Sieci neuronowe?</h2>
<p>Bardzo obiecującym rozwiązaniem wydaje się być zastosowanie <strong>sieci neuronowych w rozpoznawaniu znaków</strong>. Tego typu mechanizmy mają <strong>zdolność uczenia</strong> się wraz z kolejnym zeskanowanym dokumentem, podnosząc tym samym skuteczność działania OCR. Wkrótce postaram się napisać więcej o tego typu oprogramowaniu.</p>
<h2>Co wybrać?</h2>
<p>Szablony dedykowane są rozwiązaniem przestarzałym, czasochłonnym we wdrożeniu i drogim w utrzymaniu. Obecnie optymalnym wyborem będzie zastosowanie<strong> szablonów uniwersalnych</strong>, które są zdecydowanie <strong>bardziej elastyczne i wydajne kosztowo</strong>. Niemniej jednak przyszłość może należeć do sieci neuronowych, które stale rozwijane będą w stanie dostarczać nową jakość w pełnotekstowym skanowaniu dokumentów.</p>
<p>Post <a rel="nofollow" href="/szablon-ocr-dedykowany-czy-uniwersalny/">Szablon OCR &#8211; dedykowany czy uniwersalny?</a> pojawił się poraz pierwszy w <a rel="nofollow" href="/">OCR w dokumentach</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://ocrwdokumentach.pl/szablon-ocr-dedykowany-czy-uniwersalny/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>CAPTCHA kontra spam &#8211; czy OCR będzie kolejnym dynamitem?</title>
		<link>http://ocrwdokumentach.pl/captcha-kontra-spam/</link>
		<comments>http://ocrwdokumentach.pl/captcha-kontra-spam/#comments</comments>
		<pubDate>Tue, 29 Oct 2013 12:07:03 +0000</pubDate>
		<dc:creator><![CDATA[Michał Rykiert]]></dc:creator>
				<category><![CDATA[Ciekawostki]]></category>
		<category><![CDATA[Zastosowanie OCR]]></category>
		<category><![CDATA[CAPTCHA]]></category>
		<category><![CDATA[CRAPTCHA]]></category>
		<category><![CDATA[ludzka farma]]></category>
		<category><![CDATA[łamanie]]></category>
		<category><![CDATA[Optical Character Recognition]]></category>
		<category><![CDATA[reCAPTCHA]]></category>
		<category><![CDATA[spam]]></category>
		<category><![CDATA[spambot]]></category>
		<category><![CDATA[webmaster]]></category>
		<category><![CDATA[zabezpieczenia]]></category>

		<guid isPermaLink="false">http://ocrwdokumentach.pl/?p=392</guid>
		<description><![CDATA[<p>Spam jest prawie tak stary jak Internet. Oprócz wirusów, trojanów, malware’u itp. jest największą plagą cyberprzestrzeni. Któż z nas nie dostał e-maila z reklamą cudownych tabletek na powiększenie męskiego&#8230; hardware’u</p>
<p>Post <a rel="nofollow" href="/captcha-kontra-spam/">CAPTCHA kontra spam &#8211; czy OCR będzie kolejnym dynamitem?</a> pojawił się poraz pierwszy w <a rel="nofollow" href="/">OCR w dokumentach</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p>Spam jest prawie tak stary jak Internet. Oprócz wirusów, trojanów, malware’u itp. jest największą plagą cyberprzestrzeni. Któż z nas nie dostał e-maila z reklamą cudownych tabletek na powiększenie męskiego&#8230; hardware’u :)? Od dekady jednym z najskuteczniejszych mechanizmów zabezpieczenia stron internetowych i forów dyskusyjnych jest wykorzystywanie (re)CAPTCHY. Jednak i ten mur udaje się rozbić, m.in. dzięki mechanizmom <strong>OCR</strong> &#8211; Optycznego Rozpoznawania Znaków.</p>
<p>Obecnie oprócz reklamowania szemranych produktów i usług, spam na stronach internetowych służy również m.in. do: manipulowania wynikami ankiet, masowego linkowania, rozprowadzania złośliwego kodu czy naruszania integralności kodu stron. Szacuje się, że aż <strong>90% wiadomości wysyłanych w Internecie to spam</strong>.</p>
<p>Od dekady jednym ze skuteczniejszych mechanizmów służących do obrony przed spamem jest <strong>CAPTCHA</strong> oraz jej pochodne tj. <a title="Czym jest RECAPTCHA?" href="/jak-digitalizujemy-ksiazki-o-tym-nie-wiedzac/" target="_blank">reCAPTCHA</a>. Pomysłowość osób rozsyłających spam sięga coraz dalej i nawet CAPTCHA niekiedy bywa zawodna. Zobaczmy jakie są 3 najczęstsze sposoby jej łamania:</p>
<p><span id="more-392"></span></p>
<h2>OCR</h2>
<p>Technologia Optical Character Recognition nieustannie się rozwija. Obecnie topowe rozwiązania potrafią rozpoznać 99% znaków w przypadku dokumentów o przyzwoitej jakości. Fakt ten nie umknął spamerom, którzy coraz częściej wykorzystują OCR do <strong>łamania kodów</strong> serwowanych przez CAPTCHE. W wielu przypadkach nawet szumy, zakłócenia i zniekształcenia to zbyt mało by przeszkodzić w rozpoznaniu znaków.</p>
<p>Obecnie wiele haseł serwowanych przez programy zabezpieczające jest tak trudna, że nawet ludzie mają problemy z jej rozpoznaniem. Wszystko wskazuje na to, że ciągłe udoskonalanie programów OCR doprowadzi do zmierzchu CAPTCHy, która swoim skomplikowaniem zniechęca wielu użytkowników do jej rozwiązywania i podejmowania wielokrotnych prób. Stworzono nawet mechanizm <a title="CRAPTCHA - impossible CAPTCHA" href="http://laughingsquid.com/crapcha-impossible-captcha-tests-that-prank-web-users/ " target="_blank">CRAPTCHA</a> stworzony do <strong>trollowania sfrustrowanych internautów</strong> poprzez przedstawianie znaków niemożliwych do przepisania.</p>
<p>Smutny jest niestety fakt, iż technologia, która powinna służyć pożytecznym i ambitnym projektom, tj. <strong>digitalizacja starych księgozbiorów</strong>, wykorzystywana jest do ułatwienia spamerom zaśmiecania sieci. Sytuacja ta przypomina nieco losy najsłynniejszego wynalazku Alfreda Nobla. Dynamit z założenia miał pomagać w rozwoju cywilizacyjnym, lecz po pewnym czasie został wykorzystany przeciwko cywilizacji.</p>
<p><a href="/wp-content/uploads/2013/10/suspicion.png"><img class="aligncenter size-full wp-image-394" alt="CAPTCHA zabija boty" src="/wp-content/uploads/2013/10/suspicion.png" width="551" height="167" /></a></p>
<h2>Ludzkie farmy</h2>
<p>Innym sposobem radzenia sobie z mechanizmami CAPTCHA jest tania siła robocza. Jak to działa? <strong>Spamboty</strong> próbując dostać się do danej strony internetowej napotykają na hasło do rozwiązania. Robią zrzut ekranu i wysyłają go do osób, które zdecydowały się za grosze (1-2$ dziennie) rozpoznawać tego typu tekst. Wprowadzenie takiego trybu działania w państwach zachodnich byłoby nieopłacalne ze względu na koszt pracy. Niestety wykorzystanie<strong> taniej siły roboczej</strong> z krajów tj. Indie, Pakistan czy Filipiny umożliwia zastosowanie tego typu metod. Ile to kosztuje? Za rozwiązanie 5000 CAPTCHY zapłacimy niecałe&#8230; 7 dolarów.</p>
<h2>Fałszywa CAPTCHA</h2>
<p>Szukasz w Internecie informacji. Aby uzyskać do niej dostęp musisz rozwiązać CAPTCHE. Wprowadzasz hasło. Źle. Drugi raz. Trzeci. Za czwartym wiesz już na pewno, że wprowadziłeś poprawne dane, a mimo to nie możesz przejść dalej. Właśnie <strong>stałeś się częścią darmowej ludzkiej farmy do rozpoznawania znaków</strong>. Mechanizm jest bardzo podobny jak w poprzednio omawianym przypadku, z tą różnicą że wykorzystuje nieświadomość użytkownika i podstawia mu kod, który tak naprawdę posłuży kolejnemu spambotowi.</p>
<p><a href="/wp-content/uploads/2013/10/constructive.png"><img class="aligncenter size-full wp-image-393" alt="Pożyteczne spamboty" src="/wp-content/uploads/2013/10/constructive.png" width="492" height="176" /></a></p>
<p>Zabezpieczenie cyberprzestrzeni staje się coraz trudniejsze dla webmasterów i coraz bardziej uciążliwe dla użytkowników.  <strong>Obecnie rozwiązanie CAPTCHY zajmuje około 15-20 sekund. To wystarczająco dużo, aby porzucić stronę.</strong> Szczególnie jeśli jedna próba nie wystarczy. Na rynku pojawiają się coraz nowsze rozwiązania. Wśród nich obiecująco zapowiadają się proste i interaktywne animacje, w których np. trzeba sportowcom przydzielić odpowiedni do zajmowanego miejsca medal.</p>
<p>Wszystko wskazuje na to, że <strong>wojna spamerów z webmasterami nigdy się nie skończy</strong>. Zmienią się jedynie narzędzia prowadzenia walki. Najwięcej ucierpią niestety cywile, czyli my – zwykli Internauci.</p>
<p>Komiksy pochodzą ze strony: xkcd.com</p>
<p>AKTUALIZACJA:</p>
<p>Z ostatniej chwili: w sieci pojawił się filmik, którego autorzy twierdzą, że złamali CATPCHę. Do obejrzenia (i poczytania) tutaj: http://www.wired.com/wiredscience/2013/10/captcha-busted/</p>
<p>Post <a rel="nofollow" href="/captcha-kontra-spam/">CAPTCHA kontra spam &#8211; czy OCR będzie kolejnym dynamitem?</a> pojawił się poraz pierwszy w <a rel="nofollow" href="/">OCR w dokumentach</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://ocrwdokumentach.pl/captcha-kontra-spam/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Microsoft oferuje OCR w SkyDrive!</title>
		<link>http://ocrwdokumentach.pl/microsoft-oferuje-ocr-w-skydrive/</link>
		<comments>http://ocrwdokumentach.pl/microsoft-oferuje-ocr-w-skydrive/#comments</comments>
		<pubDate>Tue, 01 Oct 2013 12:49:11 +0000</pubDate>
		<dc:creator><![CDATA[Michał Rykiert]]></dc:creator>
				<category><![CDATA[Informacje ogólne]]></category>
		<category><![CDATA[bing]]></category>
		<category><![CDATA[chmura]]></category>
		<category><![CDATA[cloud]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[microsoft]]></category>
		<category><![CDATA[Optical Character Recognition]]></category>
		<category><![CDATA[Optyczne Rozpoznawanie Znaków]]></category>
		<category><![CDATA[skydrive]]></category>

		<guid isPermaLink="false">http://ocrwdokumentach.pl/?p=346</guid>
		<description><![CDATA[<p>Software’owi giganci robią wszystko by nie pozostać w tyle i nie stracić pozycji rynkowej! Niedawno pisałem o OCR w usłudze Google Drive. Okazało się, że podobny patent zastosował Microsoft w</p>
<p>Post <a rel="nofollow" href="/microsoft-oferuje-ocr-w-skydrive/">Microsoft oferuje OCR w SkyDrive!</a> pojawił się poraz pierwszy w <a rel="nofollow" href="/">OCR w dokumentach</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p>Software’owi giganci robią wszystko by nie pozostać w tyle i nie stracić pozycji rynkowej! Niedawno pisałem o OCR w usłudze <a title="OCR w Google Drive" href="/google-drive-darmowy-ocr/" target="_blank">Google Drive</a>. Okazało się, że podobny patent zastosował Microsoft w usłudze SkyDrive. Szykuje nam się OCR-owa wojna?</p>
<p>Od końca sierpnia tego roku, chmura Microsoftu ma możliwość <strong>optycznego rozpoznawania znaków</strong> z przesyłanych do niej zdjęć. W SkyDrive wykorzystano dokładnie ten sam engine, który obecny jest w wyszukiwarce Bing. Może być to przydatne w celu przechowania i możliwości szybkiego skopiowania informacji znajdujących się np. na ulotkach, wizytówkach, mapach i innych obiektach tego typu.<br />
<a href="/wp-content/uploads/2013/10/skydrive_0.jpg"><img class="aligncenter size-full wp-image-348" alt="OCR w SkyDrive" src="/wp-content/uploads/2013/10/skydrive_0.jpg" width="420" height="264" /></a><br />
Obecnie możliwe jest rozpoznawanie znaków w językach: angielskim, portugalskim, hiszpańskim, francuskim i niemieckim. Na tym polu Microsoft zdecydowanie <strong>przegrywa z Google</strong>, który oferuje skanowanie w 34 językach, w tym polskim.</p>
<p><span id="more-346"></span></p>
<p>Co ciekawe, usługa OCR zawita także do Windowsa 8.1, który będzie miał wbudowaną funkcjonalność o nazwie Smart Search.  Microsoft mocno stawia na <strong>chmurę</strong> i tajemnicą nie jest, że możliwe będzie przechowywanie wielu danych z jej pomocą. Znany jest już schemat działania tzw. smart files, czyli plików które przechowywane są w chmurze, a na fizycznych urządzeniach (PC, laptop, smartfon) odwzorowywana jest jedynie ich struktura. Pliki ściągane są tylko w razie konieczności. W przypadku folderu ze zdjęciami, który waży 5,6GB, na dysku zajmie on tylko 185mb na miniatury o niskiej rozdzielczości.</p>
<p>Co prawda w czasach gdy 1TB dysk kosztuje wręcz grosze, kwestia miejsca na dane nie jest ogromnym problemem, to może być jednak <strong>pożyteczna</strong> dla posiadaczy dysków SSD i urządzeń przenośnych, gdzie miejsce jest ograniczone.</p>
<p>Czy <strong>SkyDrive</strong> będzie w stanie skutecznie konkurować z Google Drive w kontekście OCR? Myślę, że tak, chociaż póki co liczba obsługiwanych języków jest zdecydowanie zbyt mała.</p>
<p>Post <a rel="nofollow" href="/microsoft-oferuje-ocr-w-skydrive/">Microsoft oferuje OCR w SkyDrive!</a> pojawił się poraz pierwszy w <a rel="nofollow" href="/">OCR w dokumentach</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://ocrwdokumentach.pl/microsoft-oferuje-ocr-w-skydrive/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>ZXX – sposób na przechytrzenie NSA</title>
		<link>http://ocrwdokumentach.pl/zxx-sposob-na-przechytrzenie-nsa/</link>
		<comments>http://ocrwdokumentach.pl/zxx-sposob-na-przechytrzenie-nsa/#comments</comments>
		<pubDate>Tue, 03 Sep 2013 08:00:18 +0000</pubDate>
		<dc:creator><![CDATA[Michał Rykiert]]></dc:creator>
				<category><![CDATA[Ciekawostki]]></category>
		<category><![CDATA[Zastosowanie OCR]]></category>
		<category><![CDATA[algorytm]]></category>
		<category><![CDATA[czcionka]]></category>
		<category><![CDATA[Edward Snowden]]></category>
		<category><![CDATA[National Security Agency]]></category>
		<category><![CDATA[NSA]]></category>
		<category><![CDATA[Optical Character Recognition]]></category>
		<category><![CDATA[rozpoznawanie]]></category>
		<category><![CDATA[Sang Mun]]></category>
		<category><![CDATA[whistle blower]]></category>
		<category><![CDATA[znaki]]></category>
		<category><![CDATA[ZXX]]></category>

		<guid isPermaLink="false">http://ocrwdokumentach.pl/?p=312</guid>
		<description><![CDATA[<p>Wobec informacji ujawnionych przez Edwarda Snowdena o programie PRISM, nie jest niczym nowym, iż rozmaite organizacje rządowe zbierają o nas tyle informacji, ile tylko się da. Jednym to nie przeszkadza,</p>
<p>Post <a rel="nofollow" href="/zxx-sposob-na-przechytrzenie-nsa/">ZXX – sposób na przechytrzenie NSA</a> pojawił się poraz pierwszy w <a rel="nofollow" href="/">OCR w dokumentach</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p>Wobec informacji ujawnionych przez <strong>Edwarda Snowdena</strong> o programie <strong>PRISM</strong>, nie jest niczym nowym, iż rozmaite organizacje rządowe zbierają o nas tyle informacji, ile tylko się da. Jednym to nie przeszkadza, drudzy natomiast biją na alarm, iż ograniczane są podstawowe prawa i przywileje obywateli. Nikt natomiast nie lubi być podglądany, szczególnie w Internecie.</p>
<p>Agencją, która w największym stopniu śledzi życie obywateli w cyberprzestrzeni jest <strong>NSA</strong> – National Security Agency. <strong>Były agent</strong> NSA, Sang Mun, który przez dwa lata pracował w Korei  i miał okazję z pierwszej ręki dowiedzieć się jak wydobywa się cenne dane, postanowił się temu procederowi sprzeciwić. Opracował specjalny rodzaj czcionek, nazwanych ZXX (od trzyliterowego kodu wykorzystywanego w Bibliotece Kongresu, którym oznaczane są książki o statusie: „brak treści językowej; nie dotyczy”), które są <strong>nie do rozpoznania</strong>, nawet przy zastosowaniu najbardziej zaawansowanych mechanizmów OCR.</p>
<p><a href="/wp-content/uploads/2013/08/zxx-gif.gif"><img class="aligncenter size-full wp-image-317" alt="ZXX - mix" src="/wp-content/uploads/2013/08/zxx-gif.gif" width="394" height="197" /></a></p>
<h2>Jak działa ZXX?</h2>
<p>Spośród sześciu opracowanych czcionek ZXX, zeskanowane i rozpoznane mogą być tylko dwie. Pozostałe cztery: Camo, False, Noise i Xed uniemożliwiają programom Optical Character Recognition na odczytanie znaków z jakąkolwiek sensowną trafnością.</p>
<p><span id="more-312"></span></p>
<p>Cały trik polega na tym, iż do poszczególnych liter dodane są określone efekty, które z jednej strony nie pozwalają maszynie na poprawne rozpoznanie, a z drugiej nie są na tyle uciążliwe by nie mogły być odczytane przez człowieka. I tak:</p>
<p><img class="alignleft" style="font-size: 11px; line-height: 16.5px; margin: 5px;" alt="ZXX - Camo" src="/wp-content/uploads/2013/08/zxx1.png" width="80" height="102" /><strong>Czcionka Camo</strong> została skonstruowana w taki sposób, by zakamuflować „szkielet” tradycyjnego znaku. Dodane zostały różne owalne i nieregularne kształty, przypominające maskowanie na żołnierskich mundurach.</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p><img class="alignleft" style="margin: 5px;" alt="ZXX - False" src="/wp-content/uploads/2013/08/zxx2.png" width="80" height="102" /></p>
<p><strong>Czcionka False</strong> opiera się na zgoła innym założeniu. W tym przypadku w duże litery (fałszywe) wpisane są mniejsze (prawdziwe), co powoduje, że OCR odczytuje mniejszy znak, jako szum. Proste, lecz skuteczne.</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p><img class="alignleft" style="margin: 5px;" alt="ZXX - Noise" src="/wp-content/uploads/2013/08/zxx3.png" width="80" height="102" /></p>
<p><strong>Czcionka Noise</strong> zawiera szumy w postaci kwadratów, które okalają dany znak. Każdy z nich został przetestowany pod kątem tego, jaką ilość szumów należy dodać, aby zmylić program skanujący. Okazało się, że litera „m”, jest najlepiej rozpoznawana i wymagała dodania największej ilości szumów.</p>
<p>&nbsp;</p>
<p><img class="alignleft" style="margin: 5px;" alt="ZXX - Xed" src="/wp-content/uploads/2013/08/zxx4.png" width="80" height="102" /></p>
<p><strong>Czionka Xed</strong> zawiera „iksy” w każdej literze i cyfrze, rozciągające się na całą powierzchnię znaku.  Dzięki temu OCR ma ogromne problemy z rozpoznaniem kształtu. Xed jest najskuteczniejszą z wszystkich czcionek, a w dodatku bardzo łatwą do odczytania przez ludzkie oko.</p>
<p>&nbsp;</p>
<p>Zmiksowanie wszystkich czterech powyższych typów zapewni natomiast najlepszy możliwy efekt, zmniejszając tym samym <a title="Skuteczny OCR w obiegu dokumentów" href="http://www.webcon.pl/ocr-i-rejestracja-dokumentow-sharepoint" target="_blank">skuteczność OCR</a>-a do wartości na granicy błędu statystycznego.</p>
<p>Więcej informacji w filmiku poniżej:<br />
<iframe src="http://player.vimeo.com/video/42675696" height="306" width="500" allowfullscreen="" frameborder="0"></iframe></p>
<h2>Zastosowanie czcionek ZXX</h2>
<p>Jak podaje autor, celem wykorzystania czcionek jest u<strong>możliwienie swobodnego przepływu informacji w sieci</strong>, z dala od oczu „Wielkiego Brata”. ZXX może omijać firewalle, a także służyć tzw. „whistle blowerom”, czyli ludziom tj. Edward Snowden, którzy ujawniają niemoralne i niezgodne z prawem praktyki organizacji rządowych i korporacji.</p>
<p>Jednakże, głównym celem stworzenia ZXX przez Sang Muna, jest <strong>zwiększenie świadomości społecznej</strong> i poważna debata dotycząca prywatności w sieci. To swego rodzaju manifest nawołujący do sprzeciwu wobec naruszenia podstawowych praw obywatelskich.</p>
<p>Na koniec należy zwrócić uwagę na jeszcze jeden fakt. Zastosowanie ZXX ma sens tylko w <strong>przypadku plików graficznych</strong> i ew. kopii papierowych. Z tego względu, że z punktu widzenia programistycznego zwykłe „a” to taki sam ciąg zer i jedynek jak „a” w ZXX czy każdej innej czcionce. Dlatego też w przypadku np. wpisu na blogu nie wymagany jest OCR by rozpoznać wszystkie znaki, gdyż zawierają one uniwersalne kodowanie. Ponadto nie ulega wątpliwości, iż kwestią czasu jest aż NSA przystosuje algorytmy swojego OCR do nowych, mylących czcionek. Dlatego póki co, mimo wszystko warto uważać na to co się w sieci umieszcza.</p>
<p>Post <a rel="nofollow" href="/zxx-sposob-na-przechytrzenie-nsa/">ZXX – sposób na przechytrzenie NSA</a> pojawił się poraz pierwszy w <a rel="nofollow" href="/">OCR w dokumentach</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://ocrwdokumentach.pl/zxx-sposob-na-przechytrzenie-nsa/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Dokumenty papierowe a bezpieczeństwo danych</title>
		<link>http://ocrwdokumentach.pl/dokumenty-papierowe-a-bezpieczenstwo/</link>
		<comments>http://ocrwdokumentach.pl/dokumenty-papierowe-a-bezpieczenstwo/#comments</comments>
		<pubDate>Tue, 20 Aug 2013 10:07:08 +0000</pubDate>
		<dc:creator><![CDATA[Michał Rykiert]]></dc:creator>
				<category><![CDATA[Informacje ogólne]]></category>
		<category><![CDATA[Zastosowanie OCR]]></category>
		<category><![CDATA[bezpieczeństwo]]></category>
		<category><![CDATA[BPM]]></category>
		<category><![CDATA[BPMS]]></category>
		<category><![CDATA[DMS]]></category>
		<category><![CDATA[dokument]]></category>
		<category><![CDATA[elektroniczny dokument]]></category>
		<category><![CDATA[elektroniczny obieg dokumentów]]></category>
		<category><![CDATA[Kevin Mitnick]]></category>
		<category><![CDATA[korespondencja]]></category>
		<category><![CDATA[Optical Character Recognition]]></category>
		<category><![CDATA[papier]]></category>
		<category><![CDATA[papierowy dokument]]></category>
		<category><![CDATA[skan]]></category>
		<category><![CDATA[skanowanie]]></category>
		<category><![CDATA[system]]></category>

		<guid isPermaLink="false">http://ocrwdokumentach.pl/?p=299</guid>
		<description><![CDATA[<p>Znacie Kevina Mitnicka? To najsłynniejszy hacker na świecie, o którym Hollywood nakręcił film (Takedown, 2000). Zapewne słysząc słowo „hacker”, większość osób ma w wyobraźni obraz typowego „kujona” we flanelowej koszulki,</p>
<p>Post <a rel="nofollow" href="/dokumenty-papierowe-a-bezpieczenstwo/">Dokumenty papierowe a bezpieczeństwo danych</a> pojawił się poraz pierwszy w <a rel="nofollow" href="/">OCR w dokumentach</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p>Znacie <strong>Kevina Mitnicka</strong>? To najsłynniejszy hacker na świecie, o którym Hollywood nakręcił film (Takedown, 2000). Zapewne słysząc słowo „hacker”, większość osób ma w wyobraźni obraz typowego „kujona” we flanelowej koszulki, który od komputera odchodzi tylko po to, aby zaspokoić swoje podstawowe potrzeby życiowe. Dużo mniej osób jednak wie, że Mitnick swój sukces zawdzięcza nie tylko znajomościom systemów komputerowych, ale także socjotechnice i tzw. <strong>dumpster divingowi</strong> (brzmi mądrze, lecz chodzi o pospolite grzebanie w śmieciach, w tym przypadku w poszukiwaniu przydatnych danych). Wszak najsłabszym ogniwem każdego systemu jest zawsze człowiek.</p>
<p>Mitnick, w książce „Sztuka Podstępu” udowadniał jak <strong>wiele ważnych informacji można znaleźć w pojemniku na odpady</strong> umieszczonym obok siedziby firmy. Dane pracowników, numery kont bankowych, korespondencję i wiele innych. Posiadając taką wiedzę, manipulowanie pracownikami okazywało się czynnością dziecinnie prostą.</p>
<p style="text-align: center;"><img class="aligncenter size-full wp-image-300" alt="Elektroniczne dokumenty vs papierowe dokumenty" src="/wp-content/uploads/2013/08/elektroniczny-dokument1.jpg" width="247" height="204" /></p>
<p>Jednakże wciąż w bardzo wielu organizacjach, kiedy przywołany zostaje temat zastąpienia papierowych dokumentów elektronicznymi, pracownicy obawiają się o bezpieczeństwo. Brak wiedzy, ignorancja czy zbytnie przyzwyczajenie do papieru? Przyjrzyjmy się <strong>jakie największe zagrożenia niesie ze sobą wykorzystywanie papierowych dokumentów</strong>.</p>
<p><span id="more-299"></span></p>
<h2>1. „Gdzieś się zapodział”.</h2>
<p>Około <strong>50%</strong> przypadków naruszenia bezpieczeństwa danych wynika z zagubienia dokumentu papierowego. I nic dziwnego. Często wędrują one po całej firmie, od działu do działu. Składane są na kupki, wkładane do segregatorów i szuflad. Przechodzą przez ręce kilkunastu(dziesięciu) pracowników i tylko kwestią czasu jest jak któryś z nich się zapodzieje. Nie ma jasnej ewidencji u kogo się aktualnie znajduje, kto i kiedy zmienił jego położenie. Pół biedy, jeśli został źle skatalogowany. Dużo gorzej w przypadku gdy trafia w niewłaściwe ręce. A konkurencja nie śpi&#8230;</p>
<h2>2. „Tego tu nie było”.</h2>
<p>Kolejnym zagrożeniem jakie stwarzają dokumenty papierowe jest manipulowanie danymi. O ile w <a title="System BPM z OCR i kodami kreskowymi" href="http://www.webcon.pl/workflow-sekretariat" target="_blank">systemie klasy BPM/DMS</a>, który pilnuje użytkowników w trakcie wprowadzania informacji, bardzo ciężko jest zawrzeć nieprawdziwe informacje (szczególnie jeśli system ten jest zintegrowany z <strong>OCR</strong> i na podstawie skanu uzupełnia pola). O tyle w przypadku dokumentu papierowego, zamienienie trójki na ósemkę czy sfałszowanie podpisu jest dużo łatwiejsze.</p>
<h2>3. „A te dokumenty to pana?”</h2>
<p>Dokumenty swobodnie leżące na biurku, zostawione w ogólnodostępnej drukarce, w koszu na śmieci, niezamknięte szafki, omyłkowo wysłane faksy itd. Potencjalnych zagrożeń jest wiele, a <strong>nieautoryzowany dostęp do poufnych informacji</strong> może być fatalny w skutkach. Tymczasem elektroniczny obieg dokumentów pozwala na zdefiniowanie kto będzie miał dostęp do których informacji. Ponadto dane mogą być szyfrowane i nawet w przypadku kiedy dostaną się w niepowołane ręce, mogą być chronione.</p>
<p><img class="aligncenter size-full wp-image-301" alt="Elektroniczny obieg dokumentów" src="/wp-content/uploads/2013/08/elektroniczny-dokument2.jpg" width="419" height="208" /></p>
<h2>Wnioski</h2>
<p>„<em>Jeżeli jesteśmy do czegoś przyzwyczajeni, sądzimy, że nam się to sprawiedliwie należy. Postęp nie ma większego wroga niż przyzwyczajenie</em>”. Przytoczone słowa José Martíego, perfekcyjnie wręcz odzwierciedlają największą przeszkodę, która stoi na drodze do pozbycia się papieru.<strong> Ludzkie nawyki bywają największą barierą</strong> w implementacji nowych rozwiązań. Należy jednak patrzeć na nie z punktu widzenia korzyści: większej produktywności, bezpieczeństwa, a w efekcie i wygody. Bo gdy przyzwyczaimy pracowników do nowego sposobu działania, nie będą już chcieli wracać do starych metod.</p>
<p>Post <a rel="nofollow" href="/dokumenty-papierowe-a-bezpieczenstwo/">Dokumenty papierowe a bezpieczeństwo danych</a> pojawił się poraz pierwszy w <a rel="nofollow" href="/">OCR w dokumentach</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://ocrwdokumentach.pl/dokumenty-papierowe-a-bezpieczenstwo/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>ICR &#8211; czy warto skanować pismo odręczne?</title>
		<link>http://ocrwdokumentach.pl/icr-rozpoznawanie-pisma-odrecznego/</link>
		<comments>http://ocrwdokumentach.pl/icr-rozpoznawanie-pisma-odrecznego/#comments</comments>
		<pubDate>Wed, 07 Aug 2013 09:08:54 +0000</pubDate>
		<dc:creator><![CDATA[Michał Rykiert]]></dc:creator>
				<category><![CDATA[ICR]]></category>
		<category><![CDATA[administracja publiczna]]></category>
		<category><![CDATA[bankowość]]></category>
		<category><![CDATA[Inteligentne Rozpoznawanie znaków]]></category>
		<category><![CDATA[Intelligent Character Recognition]]></category>
		<category><![CDATA[Optical Character Recognition]]></category>
		<category><![CDATA[pismo odręczne]]></category>
		<category><![CDATA[skan]]></category>
		<category><![CDATA[skaner]]></category>
		<category><![CDATA[służba zdrowia]]></category>

		<guid isPermaLink="false">http://ocrwdokumentach.pl/?p=284</guid>
		<description><![CDATA[<p>W swoich dotychczasowych wpisach poruszałem głównie tematykę związaną z „klasycznym” OCR-rem. Nie jest to jednak jedyny termin określający oprogramowanie rozpoznające znaki. Jednym z ciekawszych przykładów jest ICR – Intelligent Character</p>
<p>Post <a rel="nofollow" href="/icr-rozpoznawanie-pisma-odrecznego/">ICR &#8211; czy warto skanować pismo odręczne?</a> pojawił się poraz pierwszy w <a rel="nofollow" href="/">OCR w dokumentach</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p>W swoich <a title="Wykorzystanie OCR - badania i statystyki" href="/wykorzystanie-ocr-badania-i-statystyki/" target="_blank">dotychczasowych wpisach</a> poruszałem głównie tematykę związaną z „klasycznym” OCR-rem. Nie jest to jednak jedyny termin określający oprogramowanie rozpoznające znaki. Jednym z ciekawszych przykładów jest ICR – <strong>Intelligent Character Recogniction</strong> (Inteligentne Rozpoznawanie znaków).</p>
<h2>Na czym polega ICR?</h2>
<p>Intelligent Character Recognition to aplikacja wykorzystująca zaawansowane algorytmy, służące do rozpoznawania pisma odręcznego. Większość aplikacji ICR posiada algorytmy uczące się (tzw. sieci neuronowe), które automatycznie aktualizują swoją bazę w miarę rozpoznawania kolejnych typów pisma.</p>
<p>Zasada działania jest analogiczna jak w przypadku <strong>OCR</strong>. Rozpoznawane kształty przenoszone są do formy cyfrowej, natomiast tam gdzie program napotkał problem, znaki pozostają do rozpoznania przez użytkownika. Oprogramowanie ICR często posiada kilka silników rozpoznających na raz. Wówczas wyniki skanów zestawiane są ze sobą w celu jak najlepszej interpretacji tekstu.</p>
<p><span id="more-284"></span></p>
<p><strong>Skuteczność ICR</strong> może sięgać 98%. Jednakże aby osiągnąć taki wynik, skanowany tekst musi spełnić co najmniej kilka wymagań:<br />
• litery muszą być czytelne i wyraźne<br />
• tekst powinien być ustrukturyzowany i jednolity<br />
• kontrast między tekstem a tłem powinien być wysoki</p>
<p style="text-align: center;"><img class="aligncenter size-full wp-image-286" title="ICR - Rozpoznawanie pisma odręcznego" alt="ICR - Rozpoznawanie pisma odręcznego" src="/wp-content/uploads/2013/08/ICR2.jpg" width="386" height="255" /></p>
<h2>Zastosowanie ICR</h2>
<p>Ze względu na fakt coraz częstszego wykorzystania rozmaitych programów (np. MS Word) służących do edycji tekstu, ICR traci z czasem na znaczeniu. Z pewnością będzie przydatny wszędzie tam, gdzie istnieje potrzeba<strong> ręcznego wprowadzania tekstu</strong> na podstawie dokumentów napisanych odręcznie. Oprogramowanie ICR jest wówczas w stanie zaoszczędzić wymierną ilość czasu.</p>
<p>Inteligentne rozpoznawanie znaków będzie zatem użyteczne w przypadku formularzy stałopozycyjnych, w których dane zawsze znajdują się w tym samym miejscu (np. ankiety, formularze, tabele). Możliwe jest także procesowanie formularzy zmiennopozycyjnych, w których pożądane dane bywają umieszczone w różnych miejscach (np. pisma, reklamacje).</p>
<p><strong>ICR znajduje zastosowanie w branżach tj.:</strong><br />
• finanse i bankowość<br />
• sprzedaż detaliczna<br />
• służba zdrowia<br />
• administracja publiczna</p>
<h2>Oprogramowanie ICR</h2>
<p>• <strong>ABBYY Flexi Capture</strong> – po raz kolejny wymieniam ABBYY na pierwszym miejscu. Chcąc nie chcąc jest to oprogramowanie oferujące największe możliwości. Zarówno jeśli weźmiemy pod uwagę skuteczność, jak i liczbę obsługiwanych języków (ponad 100!)<br />
• <strong>SmartZone</strong> – ICR i OCR przeznaczony do integracji z innymi systemami. Niezłe możliwości rozpoznawania, obsługuje podstawowe języki (polskiego brak)<br />
• <strong>TypeReader</strong> – 13 obsługiwanych języków, support dla 200 różnych skanerów</p>
<h2>ICR – wdrażać?</h2>
<p>Ze względu na fakt, iż rola pisma odręcznego systematycznie maleje, zalecałbym ostrożność we wdrożeniu oprogramowania ICR. Może się bowiem okazać, że dużo wydajniejsze i bardziej przyszłościowe będzie przestawienie się na cyfrowe wprowadzanie danych. Wówczas dużo <a title="OCR w obiegu dokumentów" href="http://www.webcon.pl/ocr-i-rejestracja-dokumentow-sharepoint" target="_blank">lepsze efekty będzie w stanie dostarczyć OCR</a>. Intelligent Character Recognition natomiast winien być zastosowany tylko tam, gdzie jest to absolutnie niezbędne, a odejście od pisma odręcznego jest niemożliwe lub trudne do zrealizowania.</p>
<p>Post <a rel="nofollow" href="/icr-rozpoznawanie-pisma-odrecznego/">ICR &#8211; czy warto skanować pismo odręczne?</a> pojawił się poraz pierwszy w <a rel="nofollow" href="/">OCR w dokumentach</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://ocrwdokumentach.pl/icr-rozpoznawanie-pisma-odrecznego/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Google Drive i darmowy OCR</title>
		<link>http://ocrwdokumentach.pl/google-drive-darmowy-ocr/</link>
		<comments>http://ocrwdokumentach.pl/google-drive-darmowy-ocr/#comments</comments>
		<pubDate>Thu, 18 Jul 2013 09:52:46 +0000</pubDate>
		<dc:creator><![CDATA[Michał Rykiert]]></dc:creator>
				<category><![CDATA[Zastosowanie OCR]]></category>
		<category><![CDATA[chmura]]></category>
		<category><![CDATA[dane]]></category>
		<category><![CDATA[dokumenty]]></category>
		<category><![CDATA[dysk]]></category>
		<category><![CDATA[GIF]]></category>
		<category><![CDATA[Google Drive]]></category>
		<category><![CDATA[Optical Character Recognition]]></category>
		<category><![CDATA[PDF]]></category>
		<category><![CDATA[przechowywanie]]></category>
		<category><![CDATA[reCAPTCHA]]></category>
		<category><![CDATA[skanowanie]]></category>
		<category><![CDATA[zdjęcia]]></category>

		<guid isPermaLink="false">http://ocrwdokumentach.pl/?p=277</guid>
		<description><![CDATA[<p>Interesuje Cię OCR, ale nie będziesz skanować tak dużo, aby opłacalne było kupno specjalistycznego oprogramowania? „Wujek Google” ma dla Ciebie rozwiązanie. Oferuje Optyczne Rozpoznawanie Znaków przy okazji korzystania z Google</p>
<p>Post <a rel="nofollow" href="/google-drive-darmowy-ocr/">Google Drive i darmowy OCR</a> pojawił się poraz pierwszy w <a rel="nofollow" href="/">OCR w dokumentach</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p>Interesuje Cię OCR, ale nie będziesz skanować tak dużo, aby opłacalne było kupno specjalistycznego oprogramowania? „Wujek Google” ma dla Ciebie rozwiązanie. Oferuje Optyczne Rozpoznawanie Znaków przy okazji korzystania z Google Drive. Skanować można także używając aplikacji mobilnej na Androida. Brzmi nieźle? Zobaczmy jak to wygląda w praktyce.</p>
<p>Cały proces jest bardzo prosty. Umieszczając plik PDF lub zdjęcie (JPG, GIF, PNG) na Dysku Google możemy skorzystać z funkcji OCR. Wówczas zostanie on zeskanowany i przekonwertowany do formy tekstowej. Przy tym wszystko odbywa się w chmurze przy minimalnej ingerencji użytkownika końcowego. System obsługuje 34 języki, wśród których jest także polski, a z trudniejszych do odczytania także rosyjski, chiński (uproszczony) i kilka innych rodem z Azji.</p>
<p><img class="aligncenter size-full wp-image-278" alt="Google Drive i OCR" src="/wp-content/uploads/2013/07/gdrive-560x273.png" width="481" height="235" /><br />
Usługa ma jednak swoje limity. Pliki graficzne nie mogą przekraczać 2MB, a pliki PDF 10-u stron. Ponadto materiał poddawany skanowaniu powinien być dobrej jakości, szczególnie jeśli chodzi o rozdzielczość, jakość obrazu czy orientację. Do zadań firmowych to zdecydowanie za mało, jednakże dla zastosowań domowych powinno wystarczyć.</p>
<p><span id="more-277"></span><br />
Sporo możliwości daje natomiast aplikacja mobilna, która niedawno doczekała się aktualizacji. Mocno odświeżony został interfejs, a także dodano kilka nowych opcji. Z punktu widzenia tematyki, którą poruszam najbardziej interesująca jest możliwość skanowania z poziomu smartfona. Wystarczy, że zrobimy zdjęcie, np. dokumentowi czy ulotce, a tekst który się tam znajduje zostanie rozpoznany i przekonwertowany do pliku PDF. Szybko, łatwo i przyjemnie. Zastosowań może być sporo, a zważywszy że większość z nas smartfona ma przez większość czasu pod ręką, może się faktycznie przydać. Podejrzewam, że rozwiązanie to szczególnie może zainteresować studentów, którzy będą chcieli skanować notatki, skrypty itp.</p>
<p>Aplikacja dostępna jest w sklepie Google Play, za darmo, pod tym adresem: https://play.google.com/store/apps/details?id=com.google.android.apps.docs</p>
<p>Bez wątpienia Google oferuje użytkownikom swojego wirtualnego dysku sporo przydatnych opcji. Wśród niszczących się dokumentów papierowych, porysowanych płyt CD/DVD i uszkodzonych pendrive’ów, możliwość trzymania plików w chmurze bywa bardzo przydatna i w miarę bezpieczna. Oczywiście pod warunkiem że zabezpieczymy się dobrym, i tylko nam znanym, hasłem.</p>
<p>Przy okazji nie wiem czy wiecie, ale Google przejęło <a title="Zobacz jak działa reCAPTCHA" href="/jak-digitalizujemy-ksiazki-o-tym-nie-wiedzac/" target="_blank">projekt reCAPTCHY</a>. W związku z powyższym przepisując tekst kontrolny na rozmaitych forach i stronach internetowych możemy teoretycznie pomagać w skanowaniu… swoich własnych tekstów umieszczanych w Google Drive.</p>
<p>A tak na zakończenie (w ramach ciekawostki): zwolennicy teorii spiskowych twierdzą, iż drugim dnem dla którego funkcjonuje Google Drive, jest fakt pozyskiwania danych przez Google o swoich użytkownikach. Ciężko to ocenić, choć oczywiście jest to możliwe. Dlatego na wszelki wypadek kluczowe informacje przetrzymujmy mimo wszystko na tradycyjnych nośnikach.</p>
<p>Post <a rel="nofollow" href="/google-drive-darmowy-ocr/">Google Drive i darmowy OCR</a> pojawił się poraz pierwszy w <a rel="nofollow" href="/">OCR w dokumentach</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://ocrwdokumentach.pl/google-drive-darmowy-ocr/feed/</wfw:commentRss>
		<slash:comments>6</slash:comments>
		</item>
		<item>
		<title>5 największych przeszkód w OCR-owaniu</title>
		<link>http://ocrwdokumentach.pl/5-najwiekszych-przeszkod-w-ocr-owaniu/</link>
		<comments>http://ocrwdokumentach.pl/5-najwiekszych-przeszkod-w-ocr-owaniu/#comments</comments>
		<pubDate>Fri, 21 Jun 2013 09:45:12 +0000</pubDate>
		<dc:creator><![CDATA[Michał Rykiert]]></dc:creator>
				<category><![CDATA[Jak działa OCR?]]></category>
		<category><![CDATA[Zastosowanie OCR]]></category>
		<category><![CDATA[biblioteka]]></category>
		<category><![CDATA[czcionka]]></category>
		<category><![CDATA[druk]]></category>
		<category><![CDATA[firma]]></category>
		<category><![CDATA[Optical Character Recognition]]></category>
		<category><![CDATA[Optyczne Rozpoznawanie Znaków]]></category>
		<category><![CDATA[problemy]]></category>
		<category><![CDATA[przedsiębiorstwo]]></category>
		<category><![CDATA[przeszkody]]></category>
		<category><![CDATA[skan]]></category>
		<category><![CDATA[skanowanie]]></category>
		<category><![CDATA[tekst]]></category>

		<guid isPermaLink="false">http://ocrwdokumentach.pl/?p=266</guid>
		<description><![CDATA[<p>Optical Character Recognition (OCR) to technologia bez wątpienia przydatna i pożyteczna. Nie jest jednak pozbawiona wad. O niedoskonałościach w rozpoznawaniu znaków napomknąłem już wcześniej. Teraz chciałbym przedstawić inne problemy, które</p>
<p>Post <a rel="nofollow" href="/5-najwiekszych-przeszkod-w-ocr-owaniu/">5 największych przeszkód w OCR-owaniu</a> pojawił się poraz pierwszy w <a rel="nofollow" href="/">OCR w dokumentach</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p>Optical Character Recognition (OCR) to technologia bez wątpienia przydatna i pożyteczna. Nie jest jednak pozbawiona wad. O <a title="Jak wybrać dobre oprogramowanie OCR" href="/ocr-jak-wybrac-dobry-software/" target="_blank">niedoskonałościach w rozpoznawaniu</a> znaków napomknąłem już wcześniej. Teraz chciałbym przedstawić inne problemy, które negatywnie wpływają na rozpoznawanie znaków.</p>
<p>OCR świetnie sprawdza się w firmach – tam zazwyczaj skanowane wydruki są dobrej jakości i większość programów bez problemu rozpoznaje między 95 a 99% znaków. Dużo gorzej jest np. w przypadku bibliotek. Tam, niektóre ze zbiorów (często już wiekowych) nie stwarzają już tak dobrych warunków do digitalizacji tekstu. Książki bywają zniszczone, pisane archaicznym językiem i niespotykaną obecnie czcionką. To oczywiście dość ekstremalne przypadki, ale dobrze obrazują przeszkody jakie napotyka oprogramowanie.</p>
<p style="text-align: center;"><a href="/wp-content/uploads/2013/06/OCR-logo.jpg"><img class="size-full wp-image-267 aligncenter" title="Problemy w pełnotekstowym skanowaniu OCR" alt="Problemy w pełnotekstowym skanowaniu OCR" src="/wp-content/uploads/2013/06/OCR-logo.jpg" width="271" height="226" /></a></p>
<p>Przyjrzyjmy się co bywa największym problemem w pełnotekstowym skanowaniu.</p>
<p><span id="more-266"></span></p>
<p>1. Jednym z najczęstszych problemów jest <strong>słaba jakość druku źródłowego</strong>. W przypadku gdy liczba (gęstość) pikseli jest zbyt mała, programy zwyczajnie się gubią, dając albo niepoprawne wyniki, albo w ogóle nie rozpoznając znaków i poszczególnych słów. Jest to najczęstszy i uniwersalny problem dotyczący skanowania.</p>
<p>2. <strong>Brak jednolitości tekstu</strong> to kolejny czynnik, który zaniża skuteczność rozpoznawania. Korzystanie z różnych czcionek i różnych wielkości ujemnie wpływa na możliwość poprawnego zeskanowania tekstu. W miarę możliwości należy tego unikać, aby otrzymać jak najlepszy efekt.</p>
<p>3. <strong>Wyblakłe kolory i zbyt mały kontrast</strong>. Optymalnie byłoby, gdyby skanowany tekst miał czcionkę o głębokiej czerni. Niestety rzeczywistość jest mniej różowa i często okazuje się, że barwa poszczególnych liter nie jest wystarczająco wyrazista. Warto także zwrócić uwagę na fakt, iż użycie innych kolorów niż czarny,co również może być przeszkodą dla OCR-a.</p>
<p>4. <strong>Tekst</strong> nie powinien być także <strong>zbyt gęsty</strong>. Zbyt duże nagromadzenie tekstu na stronie (liter, paragrafów) może poskutkować niższą skutecznością.</p>
<p>5. <strong>Rozmiar czcionki</strong> również ma znaczenie. Minimalny próg, w zależności od rodzaju stosowanych algorytmów przez OCR, powinien wynosić między 6 a 8.</p>
<p>Co by nie mówić, technologia idzie do przodu. Programy do rozpoznawania znaków są coraz lepsze, tak jak i materiały skanowane na co dzień (choćby faktury czy umowy). Jestem ciekaw kiedy doczekamy</p>
<p>Na koniec ciekawostka. Znaczenie ma także rodzaj skanowanego papieru (materiału). Ze względu na nietypowy, jak na dzisiejsze czasy, skład papieru, skanowaniu nie poddaje się większości tekstów wydanych przed 1850 rokiem. Aby to zrobić konieczne są dodatkowe analizy oraz ustawienie niestandardowych parametrów dla OCR-a, dostosowanych do skanowanego materiału.</p>
<p>Post <a rel="nofollow" href="/5-najwiekszych-przeszkod-w-ocr-owaniu/">5 największych przeszkód w OCR-owaniu</a> pojawił się poraz pierwszy w <a rel="nofollow" href="/">OCR w dokumentach</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://ocrwdokumentach.pl/5-najwiekszych-przeszkod-w-ocr-owaniu/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Ngram Viewer – kolejny przykład wykorzystania OCR</title>
		<link>http://ocrwdokumentach.pl/ngram-viewer-przyklad-wykorzystania-ocr/</link>
		<comments>http://ocrwdokumentach.pl/ngram-viewer-przyklad-wykorzystania-ocr/#comments</comments>
		<pubDate>Wed, 05 Jun 2013 12:11:37 +0000</pubDate>
		<dc:creator><![CDATA[Michał Rykiert]]></dc:creator>
				<category><![CDATA[Informacje ogólne]]></category>
		<category><![CDATA[Zastosowanie OCR]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[Google Labs]]></category>
		<category><![CDATA[historia]]></category>
		<category><![CDATA[językoznawstwo]]></category>
		<category><![CDATA[książki]]></category>
		<category><![CDATA[ngram viewer]]></category>
		<category><![CDATA[Optical Character Recognition]]></category>
		<category><![CDATA[skanowanie]]></category>
		<category><![CDATA[statystyki]]></category>

		<guid isPermaLink="false">http://ocrwdokumentach.pl/?p=243</guid>
		<description><![CDATA[<p>Pamiętacie wpis o reCAPTCHY*, który ujawniał jak na co dzień skanujemy książki? Teraz czas na system, który pozwala wykorzystać zeskanowane materiały. Ngram Viewer, bo o nim mowa, stworzony został przez</p>
<p>Post <a rel="nofollow" href="/ngram-viewer-przyklad-wykorzystania-ocr/">Ngram Viewer – kolejny przykład wykorzystania OCR</a> pojawił się poraz pierwszy w <a rel="nofollow" href="/">OCR w dokumentach</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p><!--[if gte mso 9]><xml>
<o:OfficeDocumentSettings>
<o:RelyOnVML/>
<o:AllowPNG/>
</o:OfficeDocumentSettings>
</xml><![endif]--></p>
<p><!--[if gte mso 9]><xml>
<w:WordDocument>
<w:View>Normal</w:View>
<w:Zoom>0</w:Zoom>
<w:TrackMoves/>
<w:TrackFormatting/>
<w:HyphenationZone>21</w:HyphenationZone>
<w:PunctuationKerning/>
<w:ValidateAgainstSchemas/>
<w:SaveIfXMLInvalid>false</w:SaveIfXMLInvalid>
<w:IgnoreMixedContent>false</w:IgnoreMixedContent>
<w:AlwaysShowPlaceholderText>false</w:AlwaysShowPlaceholderText>
<w:DoNotPromoteQF/>
<w:LidThemeOther>EN-US</w:LidThemeOther>
<w:LidThemeAsian>X-NONE</w:LidThemeAsian>
<w:LidThemeComplexScript>X-NONE</w:LidThemeComplexScript>
<w:Compatibility>
<w:BreakWrappedTables/>
<w:SnapToGridInCell/>
<w:WrapTextWithPunct/>
<w:UseAsianBreakRules/>
<w:DontGrowAutofit/>
<w:SplitPgBreakAndParaMark/>
<w:EnableOpenTypeKerning/>
<w:DontFlipMirrorIndents/>
<w:OverrideTableStyleHps/>
</w:Compatibility>
<m:mathPr>
<m:mathFont m:val="Cambria Math"/>
<m:brkBin m:val="before"/>
<m:brkBinSub m:val="&#45;-"/>
<m:smallFrac m:val="off"/>
<m:dispDef/>
<m:lMargin m:val="0"/>
<m:rMargin m:val="0"/>
<m:defJc m:val="centerGroup"/>
<m:wrapIndent m:val="1440"/>
<m:intLim m:val="subSup"/>
<m:naryLim m:val="undOvr"/>
</m:mathPr></w:WordDocument>
</xml><![endif]--><!--[if gte mso 9]><xml>
<w:LatentStyles DefLockedState="false" DefUnhideWhenUsed="true"   DefSemiHidden="true" DefQFormat="false" DefPriority="99"   LatentStyleCount="267">
<w:LsdException Locked="false" Priority="0" SemiHidden="false"    UnhideWhenUsed="false" QFormat="true" Name="Normal"/>
<w:LsdException Locked="false" Priority="9" SemiHidden="false"    UnhideWhenUsed="false" QFormat="true" Name="heading 1"/>
<w:LsdException Locked="false" Priority="9" QFormat="true" Name="heading 2"/>
<w:LsdException Locked="false" Priority="9" QFormat="true" Name="heading 3"/>
<w:LsdException Locked="false" Priority="9" QFormat="true" Name="heading 4"/>
<w:LsdException Locked="false" Priority="9" QFormat="true" Name="heading 5"/>
<w:LsdException Locked="false" Priority="9" QFormat="true" Name="heading 6"/>
<w:LsdException Locked="false" Priority="9" QFormat="true" Name="heading 7"/>
<w:LsdException Locked="false" Priority="9" QFormat="true" Name="heading 8"/>
<w:LsdException Locked="false" Priority="9" QFormat="true" Name="heading 9"/>
<w:LsdException Locked="false" Priority="39" Name="toc 1"/>
<w:LsdException Locked="false" Priority="39" Name="toc 2"/>
<w:LsdException Locked="false" Priority="39" Name="toc 3"/>
<w:LsdException Locked="false" Priority="39" Name="toc 4"/>
<w:LsdException Locked="false" Priority="39" Name="toc 5"/>
<w:LsdException Locked="false" Priority="39" Name="toc 6"/>
<w:LsdException Locked="false" Priority="39" Name="toc 7"/>
<w:LsdException Locked="false" Priority="39" Name="toc 8"/>
<w:LsdException Locked="false" Priority="39" Name="toc 9"/>
<w:LsdException Locked="false" Priority="35" QFormat="true" Name="caption"/>
<w:LsdException Locked="false" Priority="10" SemiHidden="false"    UnhideWhenUsed="false" QFormat="true" Name="Title"/>
<w:LsdException Locked="false" Priority="1" Name="Default Paragraph Font"/>
<w:LsdException Locked="false" Priority="11" SemiHidden="false"    UnhideWhenUsed="false" QFormat="true" Name="Subtitle"/>
<w:LsdException Locked="false" Priority="22" SemiHidden="false"    UnhideWhenUsed="false" QFormat="true" Name="Strong"/>
<w:LsdException Locked="false" Priority="20" SemiHidden="false"    UnhideWhenUsed="false" QFormat="true" Name="Emphasis"/>
<w:LsdException Locked="false" Priority="59" SemiHidden="false"    UnhideWhenUsed="false" Name="Table Grid"/>
<w:LsdException Locked="false" UnhideWhenUsed="false" Name="Placeholder Text"/>
<w:LsdException Locked="false" Priority="1" SemiHidden="false"    UnhideWhenUsed="false" QFormat="true" Name="No Spacing"/>
<w:LsdException Locked="false" Priority="60" SemiHidden="false"    UnhideWhenUsed="false" Name="Light Shading"/>
<w:LsdException Locked="false" Priority="61" SemiHidden="false"    UnhideWhenUsed="false" Name="Light List"/>
<w:LsdException Locked="false" Priority="62" SemiHidden="false"    UnhideWhenUsed="false" Name="Light Grid"/>
<w:LsdException Locked="false" Priority="63" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Shading 1"/>
<w:LsdException Locked="false" Priority="64" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Shading 2"/>
<w:LsdException Locked="false" Priority="65" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium List 1"/>
<w:LsdException Locked="false" Priority="66" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium List 2"/>
<w:LsdException Locked="false" Priority="67" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Grid 1"/>
<w:LsdException Locked="false" Priority="68" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Grid 2"/>
<w:LsdException Locked="false" Priority="69" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Grid 3"/>
<w:LsdException Locked="false" Priority="70" SemiHidden="false"    UnhideWhenUsed="false" Name="Dark List"/>
<w:LsdException Locked="false" Priority="71" SemiHidden="false"    UnhideWhenUsed="false" Name="Colorful Shading"/>
<w:LsdException Locked="false" Priority="72" SemiHidden="false"    UnhideWhenUsed="false" Name="Colorful List"/>
<w:LsdException Locked="false" Priority="73" SemiHidden="false"    UnhideWhenUsed="false" Name="Colorful Grid"/>
<w:LsdException Locked="false" Priority="60" SemiHidden="false"    UnhideWhenUsed="false" Name="Light Shading Accent 1"/>
<w:LsdException Locked="false" Priority="61" SemiHidden="false"    UnhideWhenUsed="false" Name="Light List Accent 1"/>
<w:LsdException Locked="false" Priority="62" SemiHidden="false"    UnhideWhenUsed="false" Name="Light Grid Accent 1"/>
<w:LsdException Locked="false" Priority="63" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Shading 1 Accent 1"/>
<w:LsdException Locked="false" Priority="64" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Shading 2 Accent 1"/>
<w:LsdException Locked="false" Priority="65" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium List 1 Accent 1"/>
<w:LsdException Locked="false" UnhideWhenUsed="false" Name="Revision"/>
<w:LsdException Locked="false" Priority="34" SemiHidden="false"    UnhideWhenUsed="false" QFormat="true" Name="List Paragraph"/>
<w:LsdException Locked="false" Priority="29" SemiHidden="false"    UnhideWhenUsed="false" QFormat="true" Name="Quote"/>
<w:LsdException Locked="false" Priority="30" SemiHidden="false"    UnhideWhenUsed="false" QFormat="true" Name="Intense Quote"/>
<w:LsdException Locked="false" Priority="66" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium List 2 Accent 1"/>
<w:LsdException Locked="false" Priority="67" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Grid 1 Accent 1"/>
<w:LsdException Locked="false" Priority="68" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Grid 2 Accent 1"/>
<w:LsdException Locked="false" Priority="69" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Grid 3 Accent 1"/>
<w:LsdException Locked="false" Priority="70" SemiHidden="false"    UnhideWhenUsed="false" Name="Dark List Accent 1"/>
<w:LsdException Locked="false" Priority="71" SemiHidden="false"    UnhideWhenUsed="false" Name="Colorful Shading Accent 1"/>
<w:LsdException Locked="false" Priority="72" SemiHidden="false"    UnhideWhenUsed="false" Name="Colorful List Accent 1"/>
<w:LsdException Locked="false" Priority="73" SemiHidden="false"    UnhideWhenUsed="false" Name="Colorful Grid Accent 1"/>
<w:LsdException Locked="false" Priority="60" SemiHidden="false"    UnhideWhenUsed="false" Name="Light Shading Accent 2"/>
<w:LsdException Locked="false" Priority="61" SemiHidden="false"    UnhideWhenUsed="false" Name="Light List Accent 2"/>
<w:LsdException Locked="false" Priority="62" SemiHidden="false"    UnhideWhenUsed="false" Name="Light Grid Accent 2"/>
<w:LsdException Locked="false" Priority="63" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Shading 1 Accent 2"/>
<w:LsdException Locked="false" Priority="64" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Shading 2 Accent 2"/>
<w:LsdException Locked="false" Priority="65" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium List 1 Accent 2"/>
<w:LsdException Locked="false" Priority="66" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium List 2 Accent 2"/>
<w:LsdException Locked="false" Priority="67" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Grid 1 Accent 2"/>
<w:LsdException Locked="false" Priority="68" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Grid 2 Accent 2"/>
<w:LsdException Locked="false" Priority="69" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Grid 3 Accent 2"/>
<w:LsdException Locked="false" Priority="70" SemiHidden="false"    UnhideWhenUsed="false" Name="Dark List Accent 2"/>
<w:LsdException Locked="false" Priority="71" SemiHidden="false"    UnhideWhenUsed="false" Name="Colorful Shading Accent 2"/>
<w:LsdException Locked="false" Priority="72" SemiHidden="false"    UnhideWhenUsed="false" Name="Colorful List Accent 2"/>
<w:LsdException Locked="false" Priority="73" SemiHidden="false"    UnhideWhenUsed="false" Name="Colorful Grid Accent 2"/>
<w:LsdException Locked="false" Priority="60" SemiHidden="false"    UnhideWhenUsed="false" Name="Light Shading Accent 3"/>
<w:LsdException Locked="false" Priority="61" SemiHidden="false"    UnhideWhenUsed="false" Name="Light List Accent 3"/>
<w:LsdException Locked="false" Priority="62" SemiHidden="false"    UnhideWhenUsed="false" Name="Light Grid Accent 3"/>
<w:LsdException Locked="false" Priority="63" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Shading 1 Accent 3"/>
<w:LsdException Locked="false" Priority="64" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Shading 2 Accent 3"/>
<w:LsdException Locked="false" Priority="65" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium List 1 Accent 3"/>
<w:LsdException Locked="false" Priority="66" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium List 2 Accent 3"/>
<w:LsdException Locked="false" Priority="67" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Grid 1 Accent 3"/>
<w:LsdException Locked="false" Priority="68" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Grid 2 Accent 3"/>
<w:LsdException Locked="false" Priority="69" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Grid 3 Accent 3"/>
<w:LsdException Locked="false" Priority="70" SemiHidden="false"    UnhideWhenUsed="false" Name="Dark List Accent 3"/>
<w:LsdException Locked="false" Priority="71" SemiHidden="false"    UnhideWhenUsed="false" Name="Colorful Shading Accent 3"/>
<w:LsdException Locked="false" Priority="72" SemiHidden="false"    UnhideWhenUsed="false" Name="Colorful List Accent 3"/>
<w:LsdException Locked="false" Priority="73" SemiHidden="false"    UnhideWhenUsed="false" Name="Colorful Grid Accent 3"/>
<w:LsdException Locked="false" Priority="60" SemiHidden="false"    UnhideWhenUsed="false" Name="Light Shading Accent 4"/>
<w:LsdException Locked="false" Priority="61" SemiHidden="false"    UnhideWhenUsed="false" Name="Light List Accent 4"/>
<w:LsdException Locked="false" Priority="62" SemiHidden="false"    UnhideWhenUsed="false" Name="Light Grid Accent 4"/>
<w:LsdException Locked="false" Priority="63" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Shading 1 Accent 4"/>
<w:LsdException Locked="false" Priority="64" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Shading 2 Accent 4"/>
<w:LsdException Locked="false" Priority="65" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium List 1 Accent 4"/>
<w:LsdException Locked="false" Priority="66" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium List 2 Accent 4"/>
<w:LsdException Locked="false" Priority="67" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Grid 1 Accent 4"/>
<w:LsdException Locked="false" Priority="68" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Grid 2 Accent 4"/>
<w:LsdException Locked="false" Priority="69" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Grid 3 Accent 4"/>
<w:LsdException Locked="false" Priority="70" SemiHidden="false"    UnhideWhenUsed="false" Name="Dark List Accent 4"/>
<w:LsdException Locked="false" Priority="71" SemiHidden="false"    UnhideWhenUsed="false" Name="Colorful Shading Accent 4"/>
<w:LsdException Locked="false" Priority="72" SemiHidden="false"    UnhideWhenUsed="false" Name="Colorful List Accent 4"/>
<w:LsdException Locked="false" Priority="73" SemiHidden="false"    UnhideWhenUsed="false" Name="Colorful Grid Accent 4"/>
<w:LsdException Locked="false" Priority="60" SemiHidden="false"    UnhideWhenUsed="false" Name="Light Shading Accent 5"/>
<w:LsdException Locked="false" Priority="61" SemiHidden="false"    UnhideWhenUsed="false" Name="Light List Accent 5"/>
<w:LsdException Locked="false" Priority="62" SemiHidden="false"    UnhideWhenUsed="false" Name="Light Grid Accent 5"/>
<w:LsdException Locked="false" Priority="63" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Shading 1 Accent 5"/>
<w:LsdException Locked="false" Priority="64" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Shading 2 Accent 5"/>
<w:LsdException Locked="false" Priority="65" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium List 1 Accent 5"/>
<w:LsdException Locked="false" Priority="66" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium List 2 Accent 5"/>
<w:LsdException Locked="false" Priority="67" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Grid 1 Accent 5"/>
<w:LsdException Locked="false" Priority="68" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Grid 2 Accent 5"/>
<w:LsdException Locked="false" Priority="69" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Grid 3 Accent 5"/>
<w:LsdException Locked="false" Priority="70" SemiHidden="false"    UnhideWhenUsed="false" Name="Dark List Accent 5"/>
<w:LsdException Locked="false" Priority="71" SemiHidden="false"    UnhideWhenUsed="false" Name="Colorful Shading Accent 5"/>
<w:LsdException Locked="false" Priority="72" SemiHidden="false"    UnhideWhenUsed="false" Name="Colorful List Accent 5"/>
<w:LsdException Locked="false" Priority="73" SemiHidden="false"    UnhideWhenUsed="false" Name="Colorful Grid Accent 5"/>
<w:LsdException Locked="false" Priority="60" SemiHidden="false"    UnhideWhenUsed="false" Name="Light Shading Accent 6"/>
<w:LsdException Locked="false" Priority="61" SemiHidden="false"    UnhideWhenUsed="false" Name="Light List Accent 6"/>
<w:LsdException Locked="false" Priority="62" SemiHidden="false"    UnhideWhenUsed="false" Name="Light Grid Accent 6"/>
<w:LsdException Locked="false" Priority="63" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Shading 1 Accent 6"/>
<w:LsdException Locked="false" Priority="64" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Shading 2 Accent 6"/>
<w:LsdException Locked="false" Priority="65" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium List 1 Accent 6"/>
<w:LsdException Locked="false" Priority="66" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium List 2 Accent 6"/>
<w:LsdException Locked="false" Priority="67" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Grid 1 Accent 6"/>
<w:LsdException Locked="false" Priority="68" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Grid 2 Accent 6"/>
<w:LsdException Locked="false" Priority="69" SemiHidden="false"    UnhideWhenUsed="false" Name="Medium Grid 3 Accent 6"/>
<w:LsdException Locked="false" Priority="70" SemiHidden="false"    UnhideWhenUsed="false" Name="Dark List Accent 6"/>
<w:LsdException Locked="false" Priority="71" SemiHidden="false"    UnhideWhenUsed="false" Name="Colorful Shading Accent 6"/>
<w:LsdException Locked="false" Priority="72" SemiHidden="false"    UnhideWhenUsed="false" Name="Colorful List Accent 6"/>
<w:LsdException Locked="false" Priority="73" SemiHidden="false"    UnhideWhenUsed="false" Name="Colorful Grid Accent 6"/>
<w:LsdException Locked="false" Priority="19" SemiHidden="false"    UnhideWhenUsed="false" QFormat="true" Name="Subtle Emphasis"/>
<w:LsdException Locked="false" Priority="21" SemiHidden="false"    UnhideWhenUsed="false" QFormat="true" Name="Intense Emphasis"/>
<w:LsdException Locked="false" Priority="31" SemiHidden="false"    UnhideWhenUsed="false" QFormat="true" Name="Subtle Reference"/>
<w:LsdException Locked="false" Priority="32" SemiHidden="false"    UnhideWhenUsed="false" QFormat="true" Name="Intense Reference"/>
<w:LsdException Locked="false" Priority="33" SemiHidden="false"    UnhideWhenUsed="false" QFormat="true" Name="Book Title"/>
<w:LsdException Locked="false" Priority="37" Name="Bibliography"/>
<w:LsdException Locked="false" Priority="39" QFormat="true" Name="TOC Heading"/>
</w:LatentStyles>
</xml><![endif]--><!--[if gte mso 10]>


<style>
 /* Style Definitions */
table.MsoNormalTable
{mso-style-name:Standardowy;
mso-tstyle-rowband-size:0;
mso-tstyle-colband-size:0;
mso-style-noshow:yes;
mso-style-priority:99;
mso-style-parent:"";
mso-padding-alt:0cm 5.4pt 0cm 5.4pt;
mso-para-margin-top:0cm;
mso-para-margin-right:0cm;
mso-para-margin-bottom:10.0pt;
mso-para-margin-left:0cm;
line-height:115%;
mso-pagination:widow-orphan;
font-size:11.0pt;
font-family:"Calibri","sans-serif";
mso-ascii-font-family:Calibri;
mso-ascii-theme-font:minor-latin;
mso-hansi-font-family:Calibri;
mso-hansi-theme-font:minor-latin;
mso-ansi-language:EN-US;
mso-fareast-language:EN-US;}
</style>

<![endif]--></p>
<p class="MsoNoSpacing" style="text-align: justify;"><span style="mso-ansi-language: PL;">Pamiętacie <a title="Jak digitalizujemy książki nawet o tym nie wiedząc" href="/jak-digitalizujemy-ksiazki-o-tym-nie-wiedzac/" target="_blank">wpis o reCAPTCHY</a>*, który ujawniał jak na co dzień skanujemy książki? Teraz czas na system, który pozwala wykorzystać zeskanowane materiały. Ngram Viewer, bo o nim mowa, stworzony został przez Google Labs i zawiera bazę ponad 5 milionów książek (zawierający 500 miliardów słów!) z lat 1800-2008, które poddano OCR-owaniu w firmie Larry’ego Page’a.</span></p>
<p class="MsoNoSpacing" style="text-align: justify;"><span style="mso-ansi-language: PL;">Wszystkie mole książkowe, którym zaświeciły się w tym miejscu oczy, na myśl o dostępie do tych wszystkich zbiorów, muszę ostrzec: Ngram Viewer służy głównie do badań statystycznych i językoznawczych. Nie ma możliwości przeczytania danego dzieła od deski do deski, można co najwyżej podejrzeć pewne fragmenty.</span><span style="mso-ansi-language: PL;"> </span></p>
<h2>Jak to działa?</h2>
<p class="MsoNoSpacing" style="text-align: justify;"><span style="mso-ansi-language: PL;">Ale po kolei. Narzędzie Google służy do wyszukiwania pożądanych fraz, w danym przedziale czasowym i języku zeskanowanych publikacji. Dane zwracane są w formie wykresu, który prezentuje poziom częstotliwości występowania danego słowa na przestrzeni czasu. Możliwe jest wyszukiwanie złożonych fraz (np. atak terrorystyczny) jak i zestawianie ich ze sobą (np. Bóg i nauka jak na obrazku poniżej).</span><span style="mso-ansi-language: PL;"> </span></p>
<p class="MsoNoSpacing" style="text-align: justify;"><span id="more-243"></span></p>
<p class="MsoNoSpacing" style="text-align: center;"><span style="mso-ansi-language: PL;"><img class="size-large wp-image-245 aligncenter" title="Ngram Viewer przykład wykorzystania" alt="Ngram Viewer przykład wykorzystania" src="/wp-content/uploads/2013/06/ngram_viewer1-1024x495.png" width="530" height="256" /></span></p>
<p class="MsoNoSpacing" style="text-align: justify;"><span style="mso-ansi-language: PL;">Ponadto możliwe jest podejrzenie 40 wybranych przez system publikacji, które przedstawiać będą znalezione słowa. Dlaczego tylko tyle? Ponieważ w przypadku większych ilości Ngram Viewer mógłby dostać czkawki. </span></p>
<h2>„Wszystko fajnie, tylko po co”?</h2>
<p class="MsoNoSpacing" style="text-align: justify;"><span style="mso-ansi-language: PL;">Do czego można wykorzystać narzędzie Google Labs? Początkowy zamysł był taki, aby narzędzie służyło głównie historykom i językoznawcom. Ngram Viewer okazuje się bardzo przydatny w badaniach lingwistycznych i w prosty sposób pozwala na wychwycenie jak zmieniała się popularność poszczególnych słów, a co za tym idzie, jak zmieniał się sam język na przestrzeni lat. Co jeszcze można wycisnąć z tego narzędzia?</span></p>
<p class="MsoNoSpacing" style="text-align: justify;"><span style="mso-ansi-language: PL;">W bardzo przejrzysty sposób można zaobserwować np. trendy w postępie technologicznym. Zestawienie fraz tj.: statek, kolej, samolot pokaże stopień i skalę przemian. Z drugiej strony można zestawiać także mężczyzn i kobiety, marketing i innowacje, otyłość i fast food itd. Warto samemu spróbować i zobaczyć co wyjdzie. Oczywiście wyniki należy traktować raczej orientacyjnie, a nie jako ścisły dowód naukowy.</span><span style="mso-ansi-language: PL;"> </span></p>
<p class="MsoNoSpacing" style="text-align: justify;"><span style="mso-ansi-language: PL;">Ngram Viewer na pewno przyda się także literaturoznawcom, którzy będą mieli możliwość np. zestawienia konkretnych wyrazów opisujących emocje z daną epoką. Możliwości jest sporo<b>.</b></span></p>
<h2>A błędy?</h2>
<p style="text-align: center;"><img class="size-full wp-image-254 aligncenter" title="Słowo &quot;Congress&quot; zapisane starą czcionką" alt="Słowo &quot;Congress&quot; zapisane starą czcionką" src="/wp-content/uploads/2013/06/congress.png" width="251" height="129" /></p>
<p class="MsoNoSpacing" style="text-align: justify;"><span style="mso-ansi-language: PL;">O tym, że OCR nie jest wolny od błędów wie na pewno każdy czytelnik niniejszego bloga</span><span style="mso-ansi-language: PL;">. Co prawda 99%, a nawet 99,5% to sporo, ale margines błędu zawsze jest. Nie inaczej jest i w tym przypadku. Polecam prześledzenie case study słowa fuck/suck z tego <a title="Artykuł o pomyłkach w OCR" href="http://searchengineland.com/when-ocr-goes-bad-googles-ngram-viewer-the-f-word-59181" target="_blank">linka</a>. W skrócie rzecz rozbija się o pisownie „suck” w starych pismach, którą OCR interpretuje jako „fuck”, dając tym samym fałszywe wyniki wykorzystania słowa np. w XIX wieku. Swoją drogą, to nieco ironiczna pomyłka, prawda?<br />
</span></p>
<p class="MsoNoSpacing" style="text-align: justify;"><span style="mso-ansi-language: PL;">Takich błędów jest pewnie więcej, dlatego zawsze należy podchodzić do wyników z rezerwą.</span><span style="mso-ansi-language: PL;"> </span></p>
<h2>Co dalej?</h2>
<p class="MsoNoSpacing" style="text-align: justify;"><span style="mso-ansi-language: PL;">Póki co system od Google Labs nie zachwyca, wziąwszy pod uwagę np. możliwość przeglądania książek, dokładność czy interfejs graficzny. Z pewnością natomiast drzemie w programie ogromny potencjał i jestem pewien, że w przyszłości będzie miał do zaoferowania dużo więcej. Ponadto jest żywym dowodem na to, że <a title="OCR-owanie dokumentów w systemie workflow" href="http://www.webcon.pl/ocr-i-rejestracja-dokumentow-sharepoint" target="_blank">OCR to bardzo pożyteczna technologia</a>, która zwyczajnie służy ludziom i zachowaniu ich dziedzictwa kulturowego w postaci książek.</span><span style="mso-ansi-language: PL;"> </span></p>
<p class="MsoNoSpacing" style="text-align: justify;"><span style="mso-ansi-language: PL;">Na marginesie: Ngram Viewer nie jest dostępny niestety dla polskich zbiorów. Oferuje za to języki tj.: angielski, francuski, rosyjski, niemiecki, włoski, hiszpański, hebrajski i kilka innych. Może kiedyś się doczekamy się także i naszego ojczystego.</span></p>
<p class="MsoNoSpacing" style="text-align: justify;">
<p class="MsoNoSpacing" style="text-align: justify;">* Wpis o reCAPTCHY stał się zdecydowanym hitem tego bloga. Dzięki poleceniom, linkom i portalowi wykop.pl zobaczyło go ponad 10 000 osób. Dzięki!</p>
<p>Post <a rel="nofollow" href="/ngram-viewer-przyklad-wykorzystania-ocr/">Ngram Viewer – kolejny przykład wykorzystania OCR</a> pojawił się poraz pierwszy w <a rel="nofollow" href="/">OCR w dokumentach</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://ocrwdokumentach.pl/ngram-viewer-przyklad-wykorzystania-ocr/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
	</channel>
</rss>
