Zajęcia 3: Skanowanie i rozpoznawanie materiałów Czym jest proces skanowania; trudności automatycznego rozpoznawania tekstu; korzystanie z programu ABBYY FineReader 8; narzędzia programu, etapy skanowania; zaawansowane opcje programu; praca indywidualna z programem I. Podstawowe pojęcia 1. Czym jest proces skanowania materiałów? Przetwarzanie materiałów czarnodrukowych do postaci pliku graficznego. W wyniku skanowania otrzymujemy bitmapowy obraz strony. 2. Co oznacza rozpoznanie tekstu? Rozpoznanie pisma występującego na obrazie (OCR Optical Character Recognition) w powstałym po zeskanowaniu dokumentu pliku graficznym. 3. Dlaczego to takie trudne? W drukowanych dokumentach występuje bardzo szeroka gama krojów czcionek i ich wielkości, w druku możliwe są mniejsze lub większe defekty kształtu wydrukowanych liter, a kolejne defekty może stworzyd niezbyt dokładne ułożenie dokumentu na szybie skanera. Trudnośd sprawiają elementy ozdobne czcionek np. szeryfy oraz znaki diakrytyczne charakterystyczne dla danego języka lokalnego. Błędy rozpoznania powodują podobieostwa znaków i ligatury, np. l ~ I ~ 1 l ~ / rn ~ m ch ~ dn itp.
4. Istotne jest dobranie właściwych parametrów skanowania: jasności, rozdzielczości, kontrastu Zbyt duża jasnośd: Zbyt mała jasnośd: Dobry obraz: II. Przygotowanie materiału do skanowania Przed przystąpieniem do skanowania należy przygotowad skanowany materiał: powycierad ew. zakreślenia ołówkiem, zorientowad się jaki język (języki) jest używany w dokumencie. III. Program ABBY FineReader 8 przygotowanie do skanowania 1. Przed przystąpieniem do skanowania należy włączyd wbudowany w program mechanizm sterowania skanerem: Narzędzia->Opcje->"Użyj programu Fine Reader" 2. Jeśli dany skaner nie jest obsługiwany przez program Abbyy Fine Reader wówczas należy użyd uniwersalnego sterownika TWAIN: Narzędzia->Opcje->"Użyj tylko sterownika TWAIN"
3. Należy dobrad odpowiednie parametry skanowania: typ materiału (kolorowy, odcienie szarości, czarnobiały), rozdzielczośd skanowania, jasnośd/kontrast Narzędzia->Opcje->Ustawienia skanera Dla typowych materiałów czarnodrukowych zalecane są parametry: Tryb skanowania: "Obrazy w odcieniach szarości" Rozdzielczośd: "300dpi" Jasnośd: "Automatyczny" 4. Dla danego języka (języków) skanowanego dokumentu należy odpowiednio ustawid język rozpoznawania. Narzędzia->Opcje->Rozpoznaj(Czytaj)->Język rozpoznawania Po wybraniu opcji "Wybierz kilka języków" można ustawid do 9 rozpoznawanych języków. UWAGA: Im większa ilośd ustawionych języków rozpoznawania tym większe prawdopodobieostwo błędów przy rozpoznawaniu znaków narodowych. 5. Obszar roboczy programu został podzielony na 4 okna: 1. Wiązka lista z podglądem miniatur zeskanowanych stron 2. Obraz podgląd bitmapowego obrazu strony, po analizie układu strony widoczny jest podział na bloki 3. Tekst podgląd zawartości bloków po ich rozpoznaniu, w oknie możliwa jest także edycja i korekta rozpoznanego tekstu 4. Powiększenie powiększony wycinek obszaru wskazanego w oknie "Obraz" lub "Tekst"
IV. Etapy skanowania: 1. Skanowanie materiałów 2. Analiza układu strony podział na odpowiednie bloki: tekst, tabela, grafika 3. Rozpoznanie zawartości bloków (tekst, tabela) 4. Sprawdzenie pisowni 5. Eksport do pliku tekstowego
W programie Abbyy Fine Reader kolejnym etapom przypisano ikony w głównym pasku narzędziowym. Dodatkowe opcje dostępne są po kliknieciu na strzałkę znajdującą się obok danej ikony. Odpowiada im menu "Akcja". V. Skanowanie 1. Skanowanie dokumentu: kliknięcie ikony "Skanuj" powoduje uruchomienie Kreatora skanowania. Ręczny tryb uruchamiany jest po rozwinięciu opcji skanowania i wyborze "Skanuj czytaj" lub przez skrót Ctrl+D 2. Dla skanowania wielostronicowych dokumentów warto wybrad opcję automatycznego skanowania kolejnych stron w: Narzędzia->Opcje->Skanuj->Ustawienia skanera->skanuj wiele stron 3. Odstęp między kolejnymi przebiegami można ustawid w: Narzędzia->Opcje->Skanuj->Ustawienia skanera->pauza między stronami 4. Jeśli w obszarze skanowania mieszczą się dwie strony rozłożonej książki można automatycznie podzielid ją na odrębne strony wybierając: Narzędzia->Opcje->Skanuj->Ustawienia skanera->podział stron podwójnych UWAGA: w tym przypadku istotna jest orientacja ułożonej książki należy ją sprawdzid poprzez skan testowy i sprawdzenie w jakiej kolejnosci rozpoznają się strony prawidłowej np. 21, 22 czy odwrotnej: 22, a potem 21.
5. Ułatwieniem podczas skanowania jest włączenie wykrywania automatycznej orientacji obrazu: Narzędzia->Opcje->Skanuj->Ustawienia skanera->wykrywanie orientacji obrazu 6. Dla książek o grubym grzbiecie podczas skanowania może powstawad efekt zawijania kartki wewnątrz zszycia, wówczas należy zaznaczyd opcję korekty tego efektu w: Narzędzia->Opcje->Skanuj->Ustawienia skanera->wyprostuj linie tekstu UWAGA: Włączenie tej opcji znacząco wydłuża skanowanie oraz może powodowad przekłamania VI. Analiza układu strony i rozpoznanie 1. Domyślnie program automatycznie dokonuje analizy strony i rozpoznania bloków oraz ich zawartości. Można jednak wymusid jedynie skanowanie obrazów Akcia->Dodaj obrazy->skanuj obraz (Skrót Ctrl+K) i później włączyd rozpoznawanie obrazów Akcja->Rozpoznaj->Rozpoznaj wszystkie strony 2. W efekcie rozpoznawania program: 1. rozpoznaje orientację strony 2. dzieli zawartośd strony na bloki o określonej zawartości (tekst, tabela, grafika) 3. blokom przydziela logiczną kolejnośd 4. rozpoznaje zawartośd bloków tekst i tabela. 3. Automatyczna analiza strony często powoduje pierwsze błędy: 1. niewłaściwy podział na bloki 2. niewłaściwy dobór typów bloków 3. niewłaściwa kolejnośd
4. Okno "Obraz" umożliwia dokonywanie korekt chwytanie myszą za krawędzie bloków umożliwia zmianę ich wielkości kliknięcie prawym przyciskiem myszy umożliwia dobór parametrów bloku: zmianę typu bloku analizę zawartości (rozpoznanie) zmianę kolejności
5. Okno "Obraz" dodatkowo wyposażone jest w pasek narzędzi umożliwiających korektę analizy i rozpoznania obrazu: Analizuj układ Rysuj obszar rozpoznawania Narysuj blok tekstowy Rysuj blok tabeli Rysuj blok graficzny Zaznacz obiekty Dodaj do bloku Usuo z bloku usuo bloki Dodaj krawędź pionową (dla tabel) Dodaj krawędź poziomą (dla tabel) Usuo krawędź (dla tabel) Obetnij obraz Gumka Wyprostuj linie tekstu Obród w prawo Obród w lewo 6. Każdorazowe dodanie nowego bloku typu "tekst" lub "tabela", bądź jego zmiana wymaga ponownego rozpoznania Prawy przycisk myszy->rozpoznaj blook lub skrót Ctrl+Shift+B VII. Korekta 1. W oknie "tekst" dostępny jest podgląd rozpoznanego tekstu. Niepewne znaki wyróżnione są jasnoniebieskim tłem. Znaki błędnie rozpoznane wyróżnione są tłem ciemnoniebieskim 2. Dodatkowo możliwe jest sprawdzenie pisowni za pomocą wbudowanego słownika Akcja->Sprawdzeine pisowni->sprawdź pisownię lub poprzez skrót F7. Między następnym/wcześniejszym błędem można się przemieszczad klawiszami F4/Shift+F4
VIII. Eksport do pliku tekstowego 1. Rozpoznany i poprawiony tekst można zapisad w jednym z wielu formatów tekstowych: DOC, RTF, Word XLS, PDF, HTML, PPT, TXT, DBF, CSV, LIT. Wcześniej należy wybrad odpowiednie parametry eksportu: Narzędzia->Opcje->Zapisz 2. Układ strony określa jakie parametry formatowania mają zostad zachowane. Dostępne są opcje: 1. Układ oryginału zachowuje pełne rozmieszczenie bloków na stronie. Uwaga, wybranie tej opcji może sprawid, że zaskanowany dokument nie będzie dostępny dla programów odczytu ekranu. 2. Kolumny, tabele, paragrafy, czcionki zachowane są tylko te wymienione cechy dokumentu 3. Tabele, paragrafy, czcionki j.w. 3. Ustawienia tekstu określa pozostałe cechy tekstu, głównie akapitów: Odstępy między liniami, Odstępy między stronami, Kolor tekstu itp. Uwaga: ze względu na dalszą obróbkę tekstu nie należy zaznaczad opcji "Usuo opcjonalny znak przeniesienia do nowej lini" 4. Ustawienia obrazu jeśli chcemy zachowad zawarte w rozpoznanym dokumenci obrazy należy zaznaczyd opcję: Zachowaj grafikę 5. Najczęściej formatem docelowym zeskanowanego dokumentu będzie MS Word. Wówczas dokonujemy eksportu poprzez: Akcja->Zapisz wyniki->wyślij wszystkie strony do->microsoft Word