Zajęcia 3: Skanowanie i rozpoznawanie materiałów



Podobne dokumenty
Formatowanie komórek

Edytor tekstu OpenOffice Writer Podstawy

EDYCJA TEKSTU MS WORDPAD

Europejski Certyfikat Umiejętności Komputerowych. Moduł 3 Przetwarzanie tekstów

Zaznaczanie komórek. Zaznaczenie pojedynczej komórki polega na kliknięciu na niej LPM

Formularze w programie Word

Instrukcja. Systemu Centralnego Wydruku (SCW) Podstawy obsługi

Podział na strony, sekcje i kolumny

1. Narzędzia główne: WORD 2010 INTERFEJS UŻYTKOWNIKA. wycinamy tekst, grafikę

Formularz MS Word. 1. Projektowanie formularza. 2. Formularze do wypełniania w programie Word

LampScan. Nr produktu

Niniejsza skrócona instrukcja obsługi pomaga w rozpoczęciu korzystania z urządzenia IRIScan TM Mouse Executive 2.

LEGISLATOR. Data dokumentu:17 września 2012 Wersja: 1.3 Autor: Paweł Jankowski

Prezentacja multimedialna MS PowerPoint 2010 (podstawy)

INSTRUKCJA INSTALACJI APLIKACJI PROF- EAN 2

Edytor tekstu MS Word podstawy

Edytor tekstu Microsoft Office 2007 przewodnik dla gimnazjalisty Autor: Dariusz Kwieciński nauczyciel ZPO w Sieciechowie

Sylabus Moduł 2: Przetwarzanie tekstów

Edytor tekstu MS Office Word

Wstęp 7 Rozdział 1. OpenOffice.ux.pl Writer środowisko pracy 9

Informatyka Edytor tekstów Word 2010 dla WINDOWS cz.3

Arkusz strona zawierająca informacje. Dokumenty Excela są jakby skoroszytami podzielonymi na pojedyncze arkusze.

Twoja ulotka instrukcja obsługi programu

Edytor tekstu MS Word podstawy

Informatyka Edytor tekstów Word 2010 dla WINDOWS cz.3

Jak przygotować pliki gotowe do publikacji w sieci za pomocą DigitLabu?

Edytor tekstu Notatnik

Przed skonfigurowaniem tego ustawienia należy skonfigurować adres IP urządzenia.

Edytor tekstu MS Word 2010 PL: grafika. Edytor tekstu MS Word umożliwia wstawianie do dokumentów grafiki.

Tworzenie i edycja dokumentów w aplikacji Word.

Techniki wstawiania tabel

Plan lekcji Optivum. 1. W programie Plan lekcji Optivum otwórz plik z ułożonym planem lekcji.

Tworzenie prezentacji w MS PowerPoint

KATEGORIA OBSZAR WIEDZY

EDTCJA TEKSTU MS WORD

Dodawanie grafiki i obiektów

ECDL/ICDL Przetwarzanie tekstów Moduł B3 Sylabus - wersja 5.0

Jeżeli pole Krawędź będzie zaznaczone uzyskamy obramowanie w całej wstawianej tabeli

Skanowanie OCR w aplikacji Kancelaria Komornika. Instrukcja dla użytkownika

Edytor tekstu OpenOffice Writer Podstawy

ABBYY FineReader. Wersja 10 Podręcznik użytkowanika ABBYY. Wszystkie prawa zastrzeżone.

4.2. Program i jego konfiguracja

Dostosowanie szerokości kolumn

ABC 2002/XP PL EXCEL. Autor: Edward C. Willett, Steve Cummings. Rozdział 1. Podstawy pracy z programem (9) Uruchamianie programu (9)

Praktyczne wykorzystanie arkusza kalkulacyjnego w pracy nauczyciela część 1

1. Wprowadzenie. 1.1 Uruchamianie AutoCAD-a Ustawienia wprowadzające. Auto CAD Aby uruchomić AutoCada 14 kliknij ikonę

Dokument zawiera podstawowe informacje o użytkowaniu komputera oraz korzystaniu z Internetu.

APLIKACJE WCHODZĄCE W SKŁAD PAKIETU MS OFFICE DLA UŻYTKOWNIKÓW DOMOWYCH

Zadanie 3. Praca z tabelami

Wstawianie nowej strony

Podstawy technologii cyfrowej i komputerów

ECDL/ICDL Przetwarzanie tekstów Moduł B3 Sylabus - wersja 6.0

Arkusz kalkulacyjny MS Excel 2010 PL.

Formatowanie tekstu za pomocą zdefiniowanych stylów. Włączanie okna stylów. 1. zaznaczyć tekst, który chcemy formatować

Zadanie 9. Projektowanie stron dokumentu

Zadanie 1. Stosowanie stylów

Dlaczego stosujemy edytory tekstu?

OKNO NA ŚWIAT - PRZECIWDZIAŁANIE WYKLUCZENIU CYFROWEMU W MIEŚCIE BRZEZINY

4.Arkusz kalkulacyjny Calc

1.3. Tworzenie obiektów 3D. Rysunek 1.2. Dostępne opcje podręcznego menu dla zaznaczonego obiektu

1. Umieść kursor w miejscu, w którym ma być wprowadzony ozdobny napis. 2. Na karcie Wstawianie w grupie Tekst kliknij przycisk WordArt.

Kopiowanie. Szybkie kopiowanie. Kopiowanie przy użyciu podajnika ADF. Kopiowanie przy użyciu szyby skanera. Kopiowanie

Lp. Nazwisko Wpłata (Euro)

Zastosowanie programu PowerPoint do tworzenia prezentacji multimedialnych

5. WORD W POLSKIEJ WERSJI

oprogramowanie mobilne Instrukcja obsługi PSR 2010

narzędzie Linia. 2. W polu koloru kliknij kolor, którego chcesz użyć. 3. Aby coś narysować, przeciągnij wskaźnikiem w obszarze rysowania.

1. Przypisy, indeks i spisy.

Kopiowanie przy użyciu szyby skanera. 1 Umieść oryginalny dokument na szybie skanera stroną zadrukowaną skierowaną w dół, w lewym, górnym rogu.

NAGŁÓWKI, STOPKI, PODZIAŁY WIERSZA I STRONY, WCIĘCIA

Praca z widokami i nawigacja w pokazie

Instrukcja obsługi Konfigurator MLAN-1000

Przewodnik użytkownika (instrukcja) AutoMagicTest

Obsługa mapy przy użyciu narzędzi nawigacji

Instrukcja obsługi wewnętrznej poczty mmedica

Skaner Mustek Scan Express

ROZDZIAŁ 6. FORMATOWANIE TABEL I OBIEKTÓW GRAFICZNYCH

MS Office Picture Manager

ABBYY FineReader. Wersja 10 Podręcznik użytkowanika ABBYY. Wszystkie prawa zastrzeżone.

Klawiatura. Klawisze specjalne. Klawisze specjalne. klawisze funkcyjne. Klawisze. klawisze numeryczne. sterowania kursorem. klawisze alfanumeryczne

NAGŁÓWKI, STOPKI, PODZIAŁY WIERSZA I STRONY, WCIĘCIA

Excel 2007 PL. Pierwsza pomoc

Adobe InDesign lab.1 Jacek Wiślicki, Paweł Kośla. Spis treści: 1 Podstawy pracy z aplikacją Układ strony... 2.

Instalacja urządzenia

Rozdział VI. Tabele i ich możliwości

ToonDoo Maker tworzenie pojedynczej sceny komiksowej

Wspólne Zaawansowana tabela

Rozwiązanie ćwiczenia 8a

Fragment tekstu zakończony twardym enterem, traktowany przez edytor tekstu jako jedna nierozerwalna całość.

Praca w edytorze WORD

Edytor tekstu MS Word 2010 PL. Edytor tekstu to program komputerowy umożliwiający wprowadzenie lub edycję tekstu.

Nowości w systemie Streamsoft Prestiż wprowadzone w wersji 314

ABBYY FineReader 11 Podręcznik użytkowanika

Wymiarowanie i teksty. Polecenie:

Zadaniem tego laboratorium będzie zaznajomienie się z podstawowymi możliwościami kompozycji strony i grafiki

LEGISLATOR. Dokument zawiera opis sposobu tworzenia tabel w załącznikach. Data dokumentu:30 maja 2012 Wersja: 1.2 Autor: Paweł Jankowski

PRZYKŁADOWY TEST EGZAMINACYJNY

ABBYY FineReader 11 Podręcznik użytkowanika

Instrukcja obsługi funkcji specjalnych szablonu C01 v.1.0

System Informatyczny CELAB. Terminy, alarmy

Transkrypt:

Zajęcia 3: Skanowanie i rozpoznawanie materiałów Czym jest proces skanowania; trudności automatycznego rozpoznawania tekstu; korzystanie z programu ABBYY FineReader 8; narzędzia programu, etapy skanowania; zaawansowane opcje programu; praca indywidualna z programem I. Podstawowe pojęcia 1. Czym jest proces skanowania materiałów? Przetwarzanie materiałów czarnodrukowych do postaci pliku graficznego. W wyniku skanowania otrzymujemy bitmapowy obraz strony. 2. Co oznacza rozpoznanie tekstu? Rozpoznanie pisma występującego na obrazie (OCR Optical Character Recognition) w powstałym po zeskanowaniu dokumentu pliku graficznym. 3. Dlaczego to takie trudne? W drukowanych dokumentach występuje bardzo szeroka gama krojów czcionek i ich wielkości, w druku możliwe są mniejsze lub większe defekty kształtu wydrukowanych liter, a kolejne defekty może stworzyd niezbyt dokładne ułożenie dokumentu na szybie skanera. Trudnośd sprawiają elementy ozdobne czcionek np. szeryfy oraz znaki diakrytyczne charakterystyczne dla danego języka lokalnego. Błędy rozpoznania powodują podobieostwa znaków i ligatury, np. l ~ I ~ 1 l ~ / rn ~ m ch ~ dn itp.

4. Istotne jest dobranie właściwych parametrów skanowania: jasności, rozdzielczości, kontrastu Zbyt duża jasnośd: Zbyt mała jasnośd: Dobry obraz: II. Przygotowanie materiału do skanowania Przed przystąpieniem do skanowania należy przygotowad skanowany materiał: powycierad ew. zakreślenia ołówkiem, zorientowad się jaki język (języki) jest używany w dokumencie. III. Program ABBY FineReader 8 przygotowanie do skanowania 1. Przed przystąpieniem do skanowania należy włączyd wbudowany w program mechanizm sterowania skanerem: Narzędzia->Opcje->"Użyj programu Fine Reader" 2. Jeśli dany skaner nie jest obsługiwany przez program Abbyy Fine Reader wówczas należy użyd uniwersalnego sterownika TWAIN: Narzędzia->Opcje->"Użyj tylko sterownika TWAIN"

3. Należy dobrad odpowiednie parametry skanowania: typ materiału (kolorowy, odcienie szarości, czarnobiały), rozdzielczośd skanowania, jasnośd/kontrast Narzędzia->Opcje->Ustawienia skanera Dla typowych materiałów czarnodrukowych zalecane są parametry: Tryb skanowania: "Obrazy w odcieniach szarości" Rozdzielczośd: "300dpi" Jasnośd: "Automatyczny" 4. Dla danego języka (języków) skanowanego dokumentu należy odpowiednio ustawid język rozpoznawania. Narzędzia->Opcje->Rozpoznaj(Czytaj)->Język rozpoznawania Po wybraniu opcji "Wybierz kilka języków" można ustawid do 9 rozpoznawanych języków. UWAGA: Im większa ilośd ustawionych języków rozpoznawania tym większe prawdopodobieostwo błędów przy rozpoznawaniu znaków narodowych. 5. Obszar roboczy programu został podzielony na 4 okna: 1. Wiązka lista z podglądem miniatur zeskanowanych stron 2. Obraz podgląd bitmapowego obrazu strony, po analizie układu strony widoczny jest podział na bloki 3. Tekst podgląd zawartości bloków po ich rozpoznaniu, w oknie możliwa jest także edycja i korekta rozpoznanego tekstu 4. Powiększenie powiększony wycinek obszaru wskazanego w oknie "Obraz" lub "Tekst"

IV. Etapy skanowania: 1. Skanowanie materiałów 2. Analiza układu strony podział na odpowiednie bloki: tekst, tabela, grafika 3. Rozpoznanie zawartości bloków (tekst, tabela) 4. Sprawdzenie pisowni 5. Eksport do pliku tekstowego

W programie Abbyy Fine Reader kolejnym etapom przypisano ikony w głównym pasku narzędziowym. Dodatkowe opcje dostępne są po kliknieciu na strzałkę znajdującą się obok danej ikony. Odpowiada im menu "Akcja". V. Skanowanie 1. Skanowanie dokumentu: kliknięcie ikony "Skanuj" powoduje uruchomienie Kreatora skanowania. Ręczny tryb uruchamiany jest po rozwinięciu opcji skanowania i wyborze "Skanuj czytaj" lub przez skrót Ctrl+D 2. Dla skanowania wielostronicowych dokumentów warto wybrad opcję automatycznego skanowania kolejnych stron w: Narzędzia->Opcje->Skanuj->Ustawienia skanera->skanuj wiele stron 3. Odstęp między kolejnymi przebiegami można ustawid w: Narzędzia->Opcje->Skanuj->Ustawienia skanera->pauza między stronami 4. Jeśli w obszarze skanowania mieszczą się dwie strony rozłożonej książki można automatycznie podzielid ją na odrębne strony wybierając: Narzędzia->Opcje->Skanuj->Ustawienia skanera->podział stron podwójnych UWAGA: w tym przypadku istotna jest orientacja ułożonej książki należy ją sprawdzid poprzez skan testowy i sprawdzenie w jakiej kolejnosci rozpoznają się strony prawidłowej np. 21, 22 czy odwrotnej: 22, a potem 21.

5. Ułatwieniem podczas skanowania jest włączenie wykrywania automatycznej orientacji obrazu: Narzędzia->Opcje->Skanuj->Ustawienia skanera->wykrywanie orientacji obrazu 6. Dla książek o grubym grzbiecie podczas skanowania może powstawad efekt zawijania kartki wewnątrz zszycia, wówczas należy zaznaczyd opcję korekty tego efektu w: Narzędzia->Opcje->Skanuj->Ustawienia skanera->wyprostuj linie tekstu UWAGA: Włączenie tej opcji znacząco wydłuża skanowanie oraz może powodowad przekłamania VI. Analiza układu strony i rozpoznanie 1. Domyślnie program automatycznie dokonuje analizy strony i rozpoznania bloków oraz ich zawartości. Można jednak wymusid jedynie skanowanie obrazów Akcia->Dodaj obrazy->skanuj obraz (Skrót Ctrl+K) i później włączyd rozpoznawanie obrazów Akcja->Rozpoznaj->Rozpoznaj wszystkie strony 2. W efekcie rozpoznawania program: 1. rozpoznaje orientację strony 2. dzieli zawartośd strony na bloki o określonej zawartości (tekst, tabela, grafika) 3. blokom przydziela logiczną kolejnośd 4. rozpoznaje zawartośd bloków tekst i tabela. 3. Automatyczna analiza strony często powoduje pierwsze błędy: 1. niewłaściwy podział na bloki 2. niewłaściwy dobór typów bloków 3. niewłaściwa kolejnośd

4. Okno "Obraz" umożliwia dokonywanie korekt chwytanie myszą za krawędzie bloków umożliwia zmianę ich wielkości kliknięcie prawym przyciskiem myszy umożliwia dobór parametrów bloku: zmianę typu bloku analizę zawartości (rozpoznanie) zmianę kolejności

5. Okno "Obraz" dodatkowo wyposażone jest w pasek narzędzi umożliwiających korektę analizy i rozpoznania obrazu: Analizuj układ Rysuj obszar rozpoznawania Narysuj blok tekstowy Rysuj blok tabeli Rysuj blok graficzny Zaznacz obiekty Dodaj do bloku Usuo z bloku usuo bloki Dodaj krawędź pionową (dla tabel) Dodaj krawędź poziomą (dla tabel) Usuo krawędź (dla tabel) Obetnij obraz Gumka Wyprostuj linie tekstu Obród w prawo Obród w lewo 6. Każdorazowe dodanie nowego bloku typu "tekst" lub "tabela", bądź jego zmiana wymaga ponownego rozpoznania Prawy przycisk myszy->rozpoznaj blook lub skrót Ctrl+Shift+B VII. Korekta 1. W oknie "tekst" dostępny jest podgląd rozpoznanego tekstu. Niepewne znaki wyróżnione są jasnoniebieskim tłem. Znaki błędnie rozpoznane wyróżnione są tłem ciemnoniebieskim 2. Dodatkowo możliwe jest sprawdzenie pisowni za pomocą wbudowanego słownika Akcja->Sprawdzeine pisowni->sprawdź pisownię lub poprzez skrót F7. Między następnym/wcześniejszym błędem można się przemieszczad klawiszami F4/Shift+F4

VIII. Eksport do pliku tekstowego 1. Rozpoznany i poprawiony tekst można zapisad w jednym z wielu formatów tekstowych: DOC, RTF, Word XLS, PDF, HTML, PPT, TXT, DBF, CSV, LIT. Wcześniej należy wybrad odpowiednie parametry eksportu: Narzędzia->Opcje->Zapisz 2. Układ strony określa jakie parametry formatowania mają zostad zachowane. Dostępne są opcje: 1. Układ oryginału zachowuje pełne rozmieszczenie bloków na stronie. Uwaga, wybranie tej opcji może sprawid, że zaskanowany dokument nie będzie dostępny dla programów odczytu ekranu. 2. Kolumny, tabele, paragrafy, czcionki zachowane są tylko te wymienione cechy dokumentu 3. Tabele, paragrafy, czcionki j.w. 3. Ustawienia tekstu określa pozostałe cechy tekstu, głównie akapitów: Odstępy między liniami, Odstępy między stronami, Kolor tekstu itp. Uwaga: ze względu na dalszą obróbkę tekstu nie należy zaznaczad opcji "Usuo opcjonalny znak przeniesienia do nowej lini" 4. Ustawienia obrazu jeśli chcemy zachowad zawarte w rozpoznanym dokumenci obrazy należy zaznaczyd opcję: Zachowaj grafikę 5. Najczęściej formatem docelowym zeskanowanego dokumentu będzie MS Word. Wówczas dokonujemy eksportu poprzez: Akcja->Zapisz wyniki->wyślij wszystkie strony do->microsoft Word