<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>OCR w dokumentach &#187; PDF</title>
	<atom:link href="/tag/pdf/feed/" rel="self" type="application/rss+xml" />
	<link>http://ocrwdokumentach.pl</link>
	<description>Jedyny, polski blog o Optycznym Rozpoznawaniu Znaków</description>
	<lastBuildDate>Wed, 12 Aug 2015 10:43:17 +0000</lastBuildDate>
	<language>pl-PL</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	
	<item>
		<title>Google Drive i darmowy OCR</title>
		<link>http://ocrwdokumentach.pl/google-drive-darmowy-ocr/</link>
		<comments>http://ocrwdokumentach.pl/google-drive-darmowy-ocr/#comments</comments>
		<pubDate>Thu, 18 Jul 2013 09:52:46 +0000</pubDate>
		<dc:creator><![CDATA[Michał Rykiert]]></dc:creator>
				<category><![CDATA[Zastosowanie OCR]]></category>
		<category><![CDATA[chmura]]></category>
		<category><![CDATA[dane]]></category>
		<category><![CDATA[dokumenty]]></category>
		<category><![CDATA[dysk]]></category>
		<category><![CDATA[GIF]]></category>
		<category><![CDATA[Google Drive]]></category>
		<category><![CDATA[Optical Character Recognition]]></category>
		<category><![CDATA[PDF]]></category>
		<category><![CDATA[przechowywanie]]></category>
		<category><![CDATA[reCAPTCHA]]></category>
		<category><![CDATA[skanowanie]]></category>
		<category><![CDATA[zdjęcia]]></category>

		<guid isPermaLink="false">http://ocrwdokumentach.pl/?p=277</guid>
		<description><![CDATA[<p>Interesuje Cię OCR, ale nie będziesz skanować tak dużo, aby opłacalne było kupno specjalistycznego oprogramowania? „Wujek Google” ma dla Ciebie rozwiązanie. Oferuje Optyczne Rozpoznawanie Znaków przy okazji korzystania z Google</p>
<p>Post <a rel="nofollow" href="/google-drive-darmowy-ocr/">Google Drive i darmowy OCR</a> pojawił się poraz pierwszy w <a rel="nofollow" href="/">OCR w dokumentach</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p>Interesuje Cię OCR, ale nie będziesz skanować tak dużo, aby opłacalne było kupno specjalistycznego oprogramowania? „Wujek Google” ma dla Ciebie rozwiązanie. Oferuje Optyczne Rozpoznawanie Znaków przy okazji korzystania z Google Drive. Skanować można także używając aplikacji mobilnej na Androida. Brzmi nieźle? Zobaczmy jak to wygląda w praktyce.</p>
<p>Cały proces jest bardzo prosty. Umieszczając plik PDF lub zdjęcie (JPG, GIF, PNG) na Dysku Google możemy skorzystać z funkcji OCR. Wówczas zostanie on zeskanowany i przekonwertowany do formy tekstowej. Przy tym wszystko odbywa się w chmurze przy minimalnej ingerencji użytkownika końcowego. System obsługuje 34 języki, wśród których jest także polski, a z trudniejszych do odczytania także rosyjski, chiński (uproszczony) i kilka innych rodem z Azji.</p>
<p><img class="aligncenter size-full wp-image-278" alt="Google Drive i OCR" src="/wp-content/uploads/2013/07/gdrive-560x273.png" width="481" height="235" /><br />
Usługa ma jednak swoje limity. Pliki graficzne nie mogą przekraczać 2MB, a pliki PDF 10-u stron. Ponadto materiał poddawany skanowaniu powinien być dobrej jakości, szczególnie jeśli chodzi o rozdzielczość, jakość obrazu czy orientację. Do zadań firmowych to zdecydowanie za mało, jednakże dla zastosowań domowych powinno wystarczyć.</p>
<p><span id="more-277"></span><br />
Sporo możliwości daje natomiast aplikacja mobilna, która niedawno doczekała się aktualizacji. Mocno odświeżony został interfejs, a także dodano kilka nowych opcji. Z punktu widzenia tematyki, którą poruszam najbardziej interesująca jest możliwość skanowania z poziomu smartfona. Wystarczy, że zrobimy zdjęcie, np. dokumentowi czy ulotce, a tekst który się tam znajduje zostanie rozpoznany i przekonwertowany do pliku PDF. Szybko, łatwo i przyjemnie. Zastosowań może być sporo, a zważywszy że większość z nas smartfona ma przez większość czasu pod ręką, może się faktycznie przydać. Podejrzewam, że rozwiązanie to szczególnie może zainteresować studentów, którzy będą chcieli skanować notatki, skrypty itp.</p>
<p>Aplikacja dostępna jest w sklepie Google Play, za darmo, pod tym adresem: https://play.google.com/store/apps/details?id=com.google.android.apps.docs</p>
<p>Bez wątpienia Google oferuje użytkownikom swojego wirtualnego dysku sporo przydatnych opcji. Wśród niszczących się dokumentów papierowych, porysowanych płyt CD/DVD i uszkodzonych pendrive’ów, możliwość trzymania plików w chmurze bywa bardzo przydatna i w miarę bezpieczna. Oczywiście pod warunkiem że zabezpieczymy się dobrym, i tylko nam znanym, hasłem.</p>
<p>Przy okazji nie wiem czy wiecie, ale Google przejęło <a title="Zobacz jak działa reCAPTCHA" href="/jak-digitalizujemy-ksiazki-o-tym-nie-wiedzac/" target="_blank">projekt reCAPTCHY</a>. W związku z powyższym przepisując tekst kontrolny na rozmaitych forach i stronach internetowych możemy teoretycznie pomagać w skanowaniu… swoich własnych tekstów umieszczanych w Google Drive.</p>
<p>A tak na zakończenie (w ramach ciekawostki): zwolennicy teorii spiskowych twierdzą, iż drugim dnem dla którego funkcjonuje Google Drive, jest fakt pozyskiwania danych przez Google o swoich użytkownikach. Ciężko to ocenić, choć oczywiście jest to możliwe. Dlatego na wszelki wypadek kluczowe informacje przetrzymujmy mimo wszystko na tradycyjnych nośnikach.</p>
<p>Post <a rel="nofollow" href="/google-drive-darmowy-ocr/">Google Drive i darmowy OCR</a> pojawił się poraz pierwszy w <a rel="nofollow" href="/">OCR w dokumentach</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://ocrwdokumentach.pl/google-drive-darmowy-ocr/feed/</wfw:commentRss>
		<slash:comments>6</slash:comments>
		</item>
		<item>
		<title>Jak działa OCR?</title>
		<link>http://ocrwdokumentach.pl/jak-dziala-ocr/</link>
		<comments>http://ocrwdokumentach.pl/jak-dziala-ocr/#comments</comments>
		<pubDate>Thu, 29 Nov 2012 13:32:50 +0000</pubDate>
		<dc:creator><![CDATA[Michał Rykiert]]></dc:creator>
				<category><![CDATA[Jak działa OCR?]]></category>
		<category><![CDATA[bazy słownikowe]]></category>
		<category><![CDATA[biznes]]></category>
		<category><![CDATA[działanie]]></category>
		<category><![CDATA[Intelligent Character Recognition]]></category>
		<category><![CDATA[jak działa]]></category>
		<category><![CDATA[korekta gramatyczna]]></category>
		<category><![CDATA[layout]]></category>
		<category><![CDATA[Optical Character Recognition]]></category>
		<category><![CDATA[PDF]]></category>
		<category><![CDATA[rozpoznawanie cech]]></category>
		<category><![CDATA[rozpoznywanie wzorców]]></category>

		<guid isPermaLink="false">http://ocrwdokumentach.pl/?p=17</guid>
		<description><![CDATA[<p>Proces konwersji pliku graficznego do edytowalnego dokumentu podzielony jest na kilka etapów, za które odpowiadają różne zestawy algorytmów. Pierwszym krokiem jest załadowanie obrazu dokumentu w postaci bitmapy. Następnie zeskanowany tekst</p>
<p>Post <a rel="nofollow" href="/jak-dziala-ocr/">Jak działa OCR?</a> pojawił się poraz pierwszy w <a rel="nofollow" href="/">OCR w dokumentach</a>.</p>
]]></description>
				<content:encoded><![CDATA[<p>Proces konwersji pliku graficznego do edytowalnego dokumentu podzielony jest na kilka etapów, za które odpowiadają różne zestawy<strong> algorytmów</strong>.</p>
<p>Pierwszym krokiem jest załadowanie obrazu dokumentu w postaci bitmapy. Następnie zeskanowany tekst jest analizowany na kilka różnych sposobów.</p>
<p>Na początku program OCR dokonuje <strong>analizy layoutu</strong> i dzieli stronę na poszczególne elementy. Dzięki temu możliwa jest identyfikacja miejsc, w których znajduje się tekst. Ten z kolei dzielony jest na coraz mniejsze elementy: akapity, wersy, słowa i znaki. Na tym etapie dokument zapamiętywany jest jako zbiór pojedynczych znaków.</p>
<p><a href="/wp-content/uploads/2012/11/raster.gif"><img class="wp-image-54 aligncenter" title="OCR - rozpoznawanie struktury rastrowej" src="/wp-content/uploads/2012/11/raster-262x300.gif" alt="OCR - rozpoznawanie struktury rastrowej" width="157" height="181" /></a></p>
<p style="text-align: left;">Następnie znaki te rozpoznawane są przy użyciu poszczególnych algorytmów. Rodzaj i sposób ich wykorzystania zależy od producentów oprogramowania. Nie istnieje jedna, uniwersalna metoda, jednak można wyszczególnić kilka najbardziej popularnych technik:</p>
<p><span id="more-17"></span></p>
<ol>
<li>Podstawową jest <strong>rozpoznawanie wzorców</strong>. Wówczas program porównuje analizowany obraz z zaimplementowaną bazą danych, zawierającą setki różnych czcionek. Jeżeli dany znak pasuje do znaku z bazy danych, wówczas zostaje uznany za rozpoznany.</li>
<li>Inną metodą jest <strong>rozpoznawanie cech.</strong> W tym przypadku zadaniem programu jest rozpoznanie cech charakterystycznych dla danego znaku. Może się to odbywać na kilka różnych sposobów, m.in za pomocą klasyfikacji rastra (porównanie znaku z różnymi krojami czcionek), klasyfikacji struktury (znaki zostają rozłożone na krzywe i identyfikowane na podstawie ich położenia), czy klasyfikacji cech (wyszukiwanie charakterystycznych cech danych znaków).</li>
<li>Odrębną techniką, którą również się wykorzystuje, jest <strong>ICR (Intelligent Character Recognition</strong>). Algorytm ten używany jest głównie w przypadku tekstu pisanego ręcznie. Bazuje na architekturze sieci neuronowej i systemach uczenia się. W przypadku gdy system nie ma pewności czy dany znak został rozpoznany poprawnie, wówczas prosi użytkownika o wskazanie jego poprawnej formy. Wybór ten zostaje zapamiętany i wykorzystany w przyszłości w podobnej sytuacji. Dzięki temu rozwiązaniu, programy oparte o algorytm ICR nieustannie podnoszą swoją skuteczność w rozpoznawaniu pisma odręcznego.</li>
</ol>
<p><a href="/wp-content/uploads/2012/11/ocr-liczby.png"><img class="aligncenter" title="OCR konwersja tekstu ręcznego do elektronicznego" src="/wp-content/uploads/2012/11/ocr-liczby.png" alt="OCR konwersja tekstu ręcznego do elektronicznego" width="192" height="205" /></a></p>
<p>Powyższe algorytmy to tylko część z tych, które wykorzystywane są w systemach OCR. Zazwyczaj programy posiadają ich co najmniej kilka, a rezultat końcowy zależy od porównania wyników analizy każdego z algorytmów.</p>
<p>Kolejnym krokiem jest złożenie tekstu z uprzednio rozpoznanych znaków. Program OCR wykorzystuje <strong>bazy słownikowe</strong>, za pomocą których na nowo konstruuje poszczególne wyrazy, zdania i akapity. Stosowana jest także <strong>korekta gramatyczna</strong> dla uzyskania poprawności poszczególnych zwrotów. Następnie cały tekst, tym razem już w formie elektronicznej, budowany jest z powrotem na podstawie wcześniej przeprowadzonej analizy layoutu.</p>
<p>W jednej z ostatnich faz całego procesu użyte zostają algorytmy mające na celu poprawę jakości danego tekstu. Ich zadaniem jest również usunięcie wszelkiego rodzaju <strong>szumów i wad</strong>, które mogłyby utrudnić odczytanie treści.</p>
<p>Etapem końcowym jest zapis pliku w jednym z pożądanych formatów, np. .pdf, .txt czy .doc. Najczęściej wykorzystywany format<strong> PDF</strong> posiada po zakończeniu OCR dwie warstwy: jedną z nich stanowi obraz (skan), drugą jest tekst, który możemy swobodnie zaznaczać i przeszukiwać.</p>
<p>Możliwości<a title="OCR w biznesie" href="http://www.webcon.pl/ocr-i-rejestracja-dokumentow-sharepoint" target="_blank"> biznesowego wykorzystania OCR</a> są szersze, jedną z nich jest automatyczna rejestracja wszelkiego rodzaju formularzy, na podstawie treści rozpoznanej w skanowanym dokumencie. Więcej o tym w następnym wpisie.</p>
<p>&nbsp;</p>
<p>Post <a rel="nofollow" href="/jak-dziala-ocr/">Jak działa OCR?</a> pojawił się poraz pierwszy w <a rel="nofollow" href="/">OCR w dokumentach</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://ocrwdokumentach.pl/jak-dziala-ocr/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
	</channel>
</rss>
