Jako, że jesteśmy Linuksowcami będziemy używać OCR dla Linuksa. Właśnie zainstalowałeś silnik OCR ze słownikiem (by nie robił błędów)



Podobne dokumenty
Wymagania systemowe oraz sposób instalacji systemu Lokale Spis treści

LINUX. Instalacja oprogramowania

w o l f e n s t e i n ENEMY TERRITORY P O R A D N I K INSTALACJA GRY W SYSTEMIE WINDOWS et.wrocek.com:27960

Tworzenie wirtualnej maszyny

Przed rozpoczęciem kompresji musimy pobrać program w wersji odpowiedniej dla naszego systemu.

Konfiguracja oprogramowania w systemach MS Windows dla kont z ograniczonymi uprawnieniami

Aby uruchomić Multibooka, należy podłączyć nośnik USB do gniazda USB w komputerze, na którym program ma być używany.

INSTRUKCJA UŻYTKOWNIKA

Konfiguracja Javy. Jak prawidłowo skonfigurować środowisko Java. Jak zacząć? Poradnik dla systemów Windows 7,8, 8.1 i 10. Wersja 1.

Konfiguracja oprogramowania w systemach MS Windows dla kont z ograniczonymi uprawnieniami

Nagrywamy podcasty program Audacity

Instrukcja połączenia z programem Compas LAN i import konfiguracji

Instalacja Wirtualnego Serwera Egzaminacyjnego

Kancelaria Prawna.WEB - POMOC

Program nazywa się: unetbootin

SPOSOBY DYSTRYBUCJI OPROGRAMOWANIA PANDA

Platforma szkoleniowa krok po kroku

INSTRUKCJA INSTALACJI

Instrukcja dodawania pakietów z symbolami do programu MÓWik PRINT 2.0

Synchronizator plików (SSC) - dokumentacja

Instalacja aplikacji

BACKUP BAZ DANYCH MS SQL

Procedura wygenerowania paczki instalacyjnej oprogramowania F-Secure

Oczyszczanie dysku. Zobacz również: 6 sposobów na zwolnienie miejsca na dysku twardym

Poradnik cz.1 Użycie połączenia SSH

Instrukcja pierwszego logowania do Serwisu BRe Brokers!

Jak skonfigurować klienta Mozilla Thunderbird?

Praca z programami SAS poza lokalną siecią komputerową UZ. Zestawienie tunelu SSH oraz konfiguracja serwera proxy w przeglądarce WWW

UNIFON podręcznik użytkownika

Dodawanie wzorca graficznego do programów linii InsERT GT

Instrukcja instalacji programu serwisowego NTSN krok po kroku

Szybki start instalacji SUSE Linux Enterprise Server 11

Ewidencja Wyposażenia PL+

Konwersja maszyny fizycznej na wirtualną

Compas 2026 Personel Instrukcja obsługi do wersji 1.05

Szybki start instalacji SUSE Linux Enterprise Server 11 SP1

Instrukcja użytkownika. programu NFZMonit

Procedura wdrożeniowa program MERKURY QUATTRO wer. 1.0

Instrukcja instalacji i konfiguracji bazy danych SQL SERVER 2008 EXPRESS R2. Instrukcja tworzenia bazy danych dla programu AUTOSAT 3. wersja 0.0.

Dodatki. Dodatek A Octave. Język maszyn

Instrukcja obsługi programu CMS Dla rejestratorów HANBANG

AKTYWNY SAMORZĄD. Instrukcja instalacji, aktualizacji i konfiguracji.

Instrukcja instalacji środowiska testowego na TestingCup wersja 1.0

Instrukcja instalacji programu FaceController.

Wstęp. Skąd pobrać program do obsługi FTP? Logowanie

Wymagania. Instalacja SP DETAL

Instrukcja instalacji odtwarzacza RealPlayer dla systemu Windows.

Comodo Endpoint Security Manager instrukcja instalacji.

INSTRUKCJA INSTALACJI I PIERWSZEGO URUCHOMIENIA APLIKACJI Rodzajowa Ewidencja Wydatków plus Zamówienia i Umowy

Najczęściej występujące problemy z instalacją i konfiguracją i ich rozwiązania.

Spis treści. Strona 1 z 20

Instrukcja instalacji usługi Sygnity Service

Udostępnianie drukarek za pomocą systemu Windows (serwer wydruku).

Platforma szkoleniowa krok po kroku. Poradnik Kursanta

Synchronizacja czasu - protokół NTP

Wersja polska. Wstęp. Zawartość opakowania. Dane techniczne. Dodatkowe dane techniczne. BT200 - Sweex Bluetooth 2.0 Class II Adapter USB

Użytkowniku programu FINKA, przekazujemy E-book, który omawia najważniejsze kwestie dotyczące generowania i wysyłania JPK.

Instalacja Webroot SecureAnywhere przy użyciu GPO w Active Directory

Instrukcja instalacji oprogramowania SimPlant Planner v.11

Program PortaScan wersja Instrukcja obsługi

SystimPlus. Dokumentacja (FAQ) dla wersji: v

oprogramowania F-Secure

Korzystanie z edytora zasad grupy do zarządzania zasadami komputera lokalnego w systemie Windows XP

EGZAMIN POTWIERDZAJĄCY KWALIFIKACJE W ZAWODZIE Rok 2017 CZĘŚĆ PRAKTYCZNA

MS Visual Studio Express 2012 for Web instalacja i konfiguracja

Instrukcja instalacji usługi Sygnity Service

Instalacja SAS Forecast Studio for Desktop 12.1

Konfiguracja systemu operacyjnego Windows XP Professional SP2 dla poprawnej współpracy z oprogramowaniem Wonderware

Wersja polska. Wstęp. Zawartość opakowania. Dane techniczne BT100. Dodatkowe dane techniczne BT100 S W E E X. C O M

StacjaSQL.2012 / PIERWSZE URUCHOMIENIE I PODSTAWOWE USTAWIENIA / / USUNIĘCIE "BAZY TESTOWEJ, PRZEJŚCIE NA WERSJĘ KOMERCYJNĄ / oraz. str.

Aktualizowanie systemów operacyjnych

HYUNDAI Magic Scan Nr produktu

Instalacja serwera zarządzającego F-Secure Policy Manager

Instrukcja instalacji usługi Sygnity SmsService

ArchTour Documentation

Instrukcja użytkownika aplikacji npodpis r.

Krótka instrukcja instalacji Adobe Acrobat Reader

Systemy zarządzania produkcją - MES

Jak zapisać wersję elektroniczną pracy dyplomowej? - INSTRUKCJA (krok po kroku)

Jak stworzyć stronę WWW drużyny harcerskiej. dh Paweł Wnuk

Pracownia internetowa w każdej szkole (edycja jesień 2005)

INTERFEJS SUBARU USB INSTRUKCJA OBSŁUGI strona 1/14

Przykładowa konfiguracja konta pocztowego w programie Outlook Express z wykorzystaniem MKS 2k7 (MS Windows 2000 Proessional)

Laboratorium - Zarządzanie systemem plików poprzez wbudowane oprogramowanie w systemie Windows 7

Praca z programami SAS poza lokalną siecią komputerową UZ. Zestawienie tunelu SSH oraz konfiguracja serwera proxy w przeglądarce WWW

Część zadań będzie już zrobiona, np. część programów zainstalowana, ale proszę przeczytać instrukcje i ew. np. zainstalować w domu.

Program RMUA. Instrukcja konfiguracji i pracy w programie. (Wersja 2)

Instrukcja instalacji BMW INPA do interfejsu BMW USB VIAKEN

Oprócz tego dzięki programowi EIS/EZS Password Reader możemy przygotować stacyjkę do adaptacji w nowym samochodzie.

Uruchamianie bazy PostgreSQL

Mazowiecki Elektroniczny Wniosek Aplikacyjny

Definiowanie drukarek w programie ZAFIR

Pomoc: konfiguracja PPPoE

Instalacja programu na systemie vista/win7/win8/win10. Instrukcja dotyczy instalacji wszystkich programów ( na przykładzie Helios ).

Pracownia internetowa w każdej szkole (edycja Jesień 2007)

INSTRUKCJA INSTALACJI I URUCHOMIENIA PROGRAMÓW FINKA DOS W SYSTEMACH 64 bit

INSTALACJA W PROGRAMACH MAGAZYNOWYCH KROK PO KROKU FAREX FLEX

SKRÓCONA INSTRUKCJA INSTALACJI MODEMU I KONFIGURACJA POŁĄCZENIA Z INTERNETEM NA WINDOWS 8 DLA AnyDATA ADU-520L

Skrócona instrukcja obsługi

Jak zapisać wersje elektroniczną pracy dyplomowej? - INSTRUKCJA (krok po kroku)

Transkrypt:

Witajcie! Wyobraźmy sobie, że mamy przepisać książkę, która liczy sobie 600 lat, ma 1000 stron do LibreOffice Writer. KATORGA! Jednak żyjemy w XXI wieku, w którym komputery pomagają nam na każdym kroku. Dziś zainteresuję was technologią OCR - Optical Character Recognition. Zapraszam W skrócie dla laika Oprogramowanie wykorzystujące OCR ma za zadanie wyciągać tekst z obrazka (zazwyczaj z zeskanowanej książki). Program komputerowy skanuje grafikę rozpoznając litery i przepisuje. Jako, że jesteśmy Linuksowcami będziemy używać OCR dla Linuksa 1) Pobieranie i instalacja tesseract'a (wymagane) Aby pobrać Tesseract'a (silnik OCR) możemy wpisać w konsoli: sudo apt-get -y install tesseract-ocr tesseract-ocr-pol Ja polecam to zrobić bezpośrednio z konsoli mimo że odstrasza nowych użytkowników; pozwala w łatwy sposób zainstalować (i nie tylko) to co potrzebujemy. Właśnie zainstalowałeś silnik OCR ze słownikiem (by nie robił błędów) 2) Pobieranie i instalacja OCRFeeder (zalecane) OCRFeeder to nakładka graficzna na silniki OCR (jest ich parę, my zajmujemy się tessaract'em). Można w łatwy sposób obrobić dokument Aby go zainstalować, wystarczy wpisać w konsoli: sudo apt-get -y install ocrfeeder Po skończonym procesie instalacji w Menu Biuro OCRFeeder możemy go uruchomić. Pojawia się oto takie okienko:

Teraz musimy skonfigurować (zasadniczo dopisać) kawałek kodu w OCRFeeder, by Tesseract używał Języka Polskiego (inaczej będzie używał języka Angielskiego, co sprawi, że program nie rozpozna Polskich liter). Aby tego dokonać klikamy w Narzędzia Mechanizmy OCR I na liście wybieramy Tesseract i klikamy przycisk Edytuj. Jeśli na liście nie ma silnika Tesseract, naciskamy przycisk Wykryj. Wyskoczyło nam takie okienko, teraz w parametry silnika: na początku dopisujemy -l pol Czyli w 5 wierszu ma być: -l pol $IMAGE $FILE > /dev/null 2> /dev/null; cat $FILE.txt; rm $FILE $FILE.txt I naciskamy przycisk OK Wspaniale, OCR został skonfigurowany, teraz wystarczy przetestować go w praktyce. Do tego posłużę się Linux+ z Grudnia 2004 roku (Taki wpadł mi w ręce)

OCRFeeder może robić też jako narzędzie do skanowania Skanujemy go za pomocą Prostego Skanowania (OCRFeeder u mnie skanuje w monochromatycznych barwach, więc odpada)

Rezultat skanowania Teraz ładujemy grafikę Plik Dodaj Obraz Wskazujemy plik graficzny A następnie: Dokument Rozpoznaj dokument W tym momencie domyślny silnik OCR rozszyfrowuje nam okładkę Rezultat nie jest powalający, ale cóż :P Crystal Space, OGRE, Irrlldlł najlepsze silniki gier 3D w Open Source linux 2.6.9 - Openüfflcemrg l.l.3 Pl Firefox 1.0 PR Pl - VMware 4.5.2 LiNUX+ LiNUX+ NAJWIĘKSZY W POLSCE MAGAZYN O LINUKSIE Nr 12 (92) Grudzień 2004 Cena 24 zł Stawka VAT 0% INDEX 322679 Naklad 10 000 691.' URUCHAMIAMY #gry z Windows NA LIN KSIE bez W i i A? i i i i i umilamy Crystal Spass. OGRE i Alrrlichł. Torque i Unreal 2 i Skan z okładki słabo wyszedł A z tekstu? Zeskanujemy (mam nadzieję, że legalnie) kawałek artykułu o Fedora Core

No to testujemy :-) - Dodatkowo porównanie 3 silników OCR* * Nie wiem jak w pozostałych dwóch ustawić Polskie kodowanie, przez to test nie jest wiarygodny Tesseract GOCR OCRAD Wymagania systemowe: Wymagania minimalne Fedory Core 3 dla pracy w trybie tekstowym: - procesor zgodny z Pentium, zalecany 200 MHz lub lepszy pamięć 64 MB Do pracy w trybie grañcznym są potrzebne: - procesor: zalecany 400 MHz Pentium ll lub lepszy - pamięć: minimum 192 MB, zalecane 256 MB Niezbędne wolne miejsce na dysku: ~ instalacja minimalna: 620 MB - serwer: minimum 1.1 GB =t t ; E Wymagania systemowe: b n_ b _ Wymagan ia Wymagania minimalne Fedory systemowe: _ Wyma9ania Core 3 dla pracy w trybie minimalne Fedory Core 3 dla tekstowym: pracy w trybie tekstowym:. procesor zgodny z Pentium, _ procesor zgodny z Pentium, zalecany 200 MHz lub lepszy. 2alecany 200 MHz lub lepszy _ pamie_ 64 MB pamieċ64mb : D0 P'aCY Do pracy w trybie grafianym s4 w {Y " 9'a 4nYm q P0t"' n'' pot_ebne: t,, _ procesor: zalecany 400. procesor: 2alecany 400 MHz MHz Pentium _ Illuble_szy =, Pentium II lub lepszy pamie_: _ pamieć: minimum 192 MB, minimum 192 MB, zalecane zaleca',, ne2_6mb _ '_; 256 MB NleZbedne WOlne mlejsce na Niezbedne wolne miejsce na dysku= :; _' _ instalacja dysku: minimalna: 620 MB,, _. instalacja minimalna: 620 serwer: minimum 1.1 GB! _ MB. serwer: minimum 1.1 biuro, szkota i dom: 2,3 GB,. _ GB. biuro, szkota i dom: 2,3 stacja robocza: 3 GB t _ GB. stacja robocza: 3 GB szyst_i_p i_ty,'6,9, wszys_kie pdkie_y..ó,_ GB _odatkowo _magane jest Dodatkowo wymagane jest miejsce na miejsce na Najlepiej sprawdził się Tesseract przede wszystkim, że wiem jak przestawić go na Polskie Pismo.Zrobił 2 błędy Tesseract Poprawna forma grañcznym graficznym 11 II (Pentium II, a nie Pentium 11) OCRFeeder ma też funkcję łatwego poprawiania błędów za pomocą słownika najeżdżamy na błędny napis i Prawym Przyciskiem Myszy klikamy na owy napis. Wyskoczy nam propozycja poprawnego słowa (o ile słownik rozpoznaje).