Skanowanie dokumentów i techniki rozpoznawania znaków



Podobne dokumenty
Skaner. Skanery płaskie (ang. flatbed scanners) powszechnie używane w domach i biurach, materiał do skanowania umieszczany jest na poziomej szybie.

Urządzenia techniki komputerowej Identyfikacja i charakteryzowanie urządzeń zewnętrznych komputera. Budowa i zasada działania skanera

Budowa i zasada działania Skaner Skanery

Budowa i zasada działania skanera

Rodzaje skanerów - płaskie

Rodzaje skanerów. skaner ręczny. skaner płaski. skaner bębnowy. skaner do slajdów. skaner kodów kreskowych


GRAFIKA RASTROWA. WYKŁAD 1 Wprowadzenie do grafiki rastrowej. Jacek Wiślicki Katedra Informatyki Stosowanej

Podstawy przetwarzania obrazów teledetekcyjnych. Format rastrowy

Praktyczne metody pozyskiwania i przetwarzania danych cyfrowych.

Urządzenia do wprowadzania informacji graficznej. Skanery, Digitizery, Aparaty i Kamery cyfrowe

Dodatek B - Histogram

Obróbka grafiki cyfrowej

Podstawy grafiki komputerowej. Teoria obrazu.

INFORMATYKA WSTĘP DO GRAFIKI RASTROWEJ

Akwizycja obrazów. Zagadnienia wstępne

Skanowanie. Piotr Steć. Wszystkie operacje na obrazie opisywane w niniejszym materiale wykonywane są za pomocą programu Photoshop.

GRAFIKA. Rodzaje grafiki i odpowiadające im edytory

Pojęcie Barwy. Grafika Komputerowa modele kolorów. Terminologia BARWY W GRAFICE KOMPUTEROWEJ. Marek Pudełko

Budowa i działanie skanera

Tworzenie obrazu w aparatach cyfrowych

GRAFIKA. Cyfrowy aparat fotograficzny i skaner

Grafika na stronie www

Piotr Misiorek. Zespół Szkół Ponadgimnazjalnych Nr 1 w Zamościu

Do zamiany dokumentu z papierowego na jego obraz elektroniczny skaner potrzebuje sześciu podstawowych komponentów: źródła światła białego, systemu

GRAFIKA RASTROWA GRAFIKA RASTROWA

0. OpenGL ma układ współrzędnych taki, że oś y jest skierowana (względem monitora) a) w dół b) w górę c) w lewo d) w prawo e) w kierunku do

MODELE KOLORÓW. Przygotował: Robert Bednarz

Grafika 2D. Pojęcia podstawowe. opracowanie: Jacek Kęsik

Waldemar Izdebski - Wykłady z przedmiotu SIT / Mapa zasadnicza 30

Teoria światła i barwy

Grafika komputerowa. Dla DSI II

Plan wykładu. Wprowadzenie Program graficzny GIMP Edycja i retusz zdjęć Podsumowanie. informatyka +

URZĄDZENIA ZEWNĘTRZNE

Współczesne metody badań instrumentalnych

Gimp Grafika rastrowa (konwersatorium)

SKANERY

Plan wykładu. Wprowadzenie Program graficzny GIMP Edycja i retusz zdjęć Podsumowanie. informatyka +

Rejestracja obrazu. Budowa kamery

@ʁ ud3 k0 Urządzenia Techniki Komputerowej

Przetwarzanie obrazów wykład 1. Adam Wojciechowski

Charakteryzowanie technologiczno-eksploatacyjne skanerów

Fotometria CCD 3. Kamera CCD. Kalibracja obrazów CCD

Obraz jako funkcja Przekształcenia geometryczne

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 2 AiR III

Monitory LCD (ang. Liquid Crystal Display) (1)

Grafika Komputerowa Wybrane definicje. Katedra Informatyki i Metod Komputerowych Uniwersytet Pedagogiczny im. KEN w Krakowie apw@up.krakow.

Wykład II. Reprezentacja danych w technice cyfrowej. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

Kurs grafiki komputerowej Lekcja 2. Barwa i kolor

zeskanowania publikacji artykułów cyfrowej

SPRZĘT DLA JEDNOSTEK ORGANIZACYJNYCH

SPRZĘT DLA JEDNOSTEK ORGANIZACYJNYCH

Do opisu kolorów używanych w grafice cyfrowej śluzą modele barw.

Przygotowanie plików PDF do druku

Podstawy Informatyki Wykład V

Grafika komputerowa. Oko posiada pręciki (100 mln) dla detekcji składowych luminancji i 3 rodzaje czopków (9 mln) do detekcji koloru Żółty

* Big Index - Indeks dołączony do ProfiCD w formacie 25x24 cm. Usługa dotyczy negatywów i diapozytywów typu 135. Index zawiera 36 klatek.

Zasady edycji (cyfrowej) grafiki nieruchomej

Skanery. Rodzaje skanerów

1 LEKCJA. Definicja grafiki. Główne działy grafiki komputerowej. Programy graficzne: Grafika rastrowa. Grafika wektorowa. Grafika trójwymiarowa

Podstawy grafiki komputerowej

Grafika rastrowa (bitmapa)-

SPRZĘT DLA JEDNOSTEK ORGANIZACYJNYCH

DIGITALIZACJA. Maciej Rynarzewski Oddział Zbiorów Specjalnych

Podstawy cyfrowego przetwarzania obrazów teledetekcyjnych. Dr S. Królewicz, Dr inż. J. Piekarczyk

FOTOGRAMETRIA I TELEDETEKCJA

Sposoby cyfrowego zapisywania obrazów

Przykłady wybranych fragmentów prac egzaminacyjnych z komentarzami fototechnik 313[01]

SPRZĘT DLA JEDNOSTEK ORGANIZACYJNYCH

SPRZĘT DLA JEDNOSTEK ORGANIZACYJNYCH

SPRZĘT DLA JEDNOSTEK ORGANIZACYJNYCH

1.2 Logo Sonel podstawowe załoŝenia

Tworzenie zasobów cyfrowych

Cyfrowe fotografie. czyli jak zrobić coś czego nasz aparat nie potrafi. Piotr Kopciał

INFORMATYKA GRAFIKA I MULTIMEDIA. Zbiór zadań

Opis właściwości plików macierzystych (plików TIFF) dla Wojewódzkiej Biblioteki Publicznej im. Hieronima Łopacińskiego w Lublinie

Wprowadzenie do technologii HDR

OBLIGATORYJNE WYMAGANIA TECHNICZNE CZĘŚĆ II DRUKARKI I SKANERY

Adam Korzeniewski p Katedra Systemów Multimedialnych

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 1 AiR III

Grafika rastrowa i wektorowa

4. Oprogramowanie OCR do rozpoznawania znaków 39

matrycę. W chwili wykonywania zdjęcia lustro obraca się tak, by światło padało na matrycę. Zaletą lustrzanek jest możliwość wymiany obiektywów.

Analiza obrazu. wykład 1. Marek Jan Kasprowicz Uniwersytet Rolniczy Marek Jan Kasprowicz Analiza obrazu komputerowego 2009 r.

Multimedia i grafika komputerowa

Wysoki kontrast i szeroki zakres dynamiki dzięki cechom panelu OLED takim, jak reprodukcja głębokiej czerni i wysoka jasność szczytowa

. Sposób zapisu plików pojedynczej publikacji w formacie DjVu

WYMAGANIA EDUKACYJNE NA POSZCZEGÓLNE OCENY Z ZAJĘĆ ARTYSTYCZNYCH - Grafika komputerowa dla klas II-III rok szkolny 2017/2018

Dostosowuje wygląd kolorów na wydruku. Uwagi:

Rozszerzenia i specyfikacja przyjmowanych przez nas plików.

dr inż. Piotr Odya dr inż. Piotr Suchomski

Ćwiczenie 2. Przetwarzanie graficzne plików. Wprowadzenie teoretyczne

Cechy formatu PNG Budowa bloku danych Bloki standardowe PNG Filtrowanie danych przed kompresją Wyświetlanie progresywne (Adam 7)

Laboratorium. Cyfrowe przetwarzanie sygnałów. Ćwiczenie 9. Przetwarzanie sygnałów wizyjnych. Politechnika Świętokrzyska.

Jak przygotować pliki gotowe do publikacji w sieci za pomocą DigitLabu?

Anna Barwaniec Justyna Rejek

Pomiary jasności tła nocnego nieba z wykorzystaniem aparatu cyfrowego. Tomek Mrozek 1. Instytut Astronomiczny UWr 2. Zakład Fizyki Słońca CBK PAN

Histogram obrazu, modyfikacje histogramu

Przemysław Kowalski Instytut Informatyki Teoretycznej i Stosowanej PAN

hurtowniakamer.com.pl

Transkrypt:

Skanowanie dokumentów i techniki rozpoznawania znaków Tomasz Lewicki WWSIS, Wrocław czerwiec 2007 Tomasz Lewicki (WWSIS, Wrocław) Archiwizacja dokumentów i danych czerwiec 2007 1 / 17

Skanowanie Skanowanie to proces przekształcania nieruchomego dwywymiarowego obrazu lub obiektu trójwymiarowego do postaci cyfrowej przy pomocy urządzenia zwanego ogólnie skanerem optycznym. Tomasz Lewicki (WWSIS, Wrocław) Archiwizacja dokumentów i danych czerwiec 2007 2 / 17

Obraz w postaci cyfrowej Obrazy cyfrowe (zdigitalizowane) mogą być tworzone bezpośrednio przy pomocy cyfrowych urządzeń rejestracji obrazu, np. cyfrowych aparatów fotograficznych lub cyfrowych kamer video lub pośrednio, np. skanując obrazy analogowe za pomocą skanerów optycznych. Obraz cyfrowy tworzy się próbkując obraz analogowy z określoną rozdzielczością. Przyjmuje się założenie, że obraz analogowy tworzy siatkę punktów (pikseli). W trakcie próbkowania otrzymuje się zbiór punktów siatki opisanych dla każdego piksela jego wartością tonalną (biały, czarny, odcień szarości lub kolor) w zapisie bitowym. Z obrazu cyfrowego można po odpowiednich przekształceniach odtworzyć obraz analogowy, np. na drukarce lub ploterze. Tomasz Lewicki (WWSIS, Wrocław) Archiwizacja dokumentów i danych czerwiec 2007 3 / 17

Rodzaje skanerów optycznych Przykłady klasyfikacji Ze względu na sposób użycia: ręczne płaskie, inaczej stołowe (flatbed) bębnowe Ze względu na przeznaczenie: skaner klisz i slajdów skaner dokumentów skaner kodów kreskowych Tomasz Lewicki (WWSIS, Wrocław) Archiwizacja dokumentów i danych czerwiec 2007 4 / 17

Parametry skanerów Jakość skanera opisuje kilka podstawowych parametrów: głębia kolorów (color depth) rozdzielczość optyczna (optical resolution) zakres gęstości (density range) Tomasz Lewicki (WWSIS, Wrocław) Archiwizacja dokumentów i danych czerwiec 2007 5 / 17

Głębia kolorów Głębią kolorów nazywamy ilość bitów potrzebnych do opisania barwy piksela na obrazie. Wyższe wartości tego parametru wskazują, że możliwe jest oddanie większej ilości barw i odcieni na obrazie. Najmniejsza głębia kolorów wynosi 1 bit i umożliwia zapisanie każdego piksela w dwóch kolorach: czarnym lub białym. Kolejne wartości głębi kolorów powszechnie stosowane w grafice komputerowej to: 8 bitów: 2 8 = 256; zarówno w skali szarości, jak i w ograniczonej palecie kolorów 15 bitów: (2 5 ) 3 = 2 15 = 32768 16 bitów: 2 5+6+5 = 2 16 = 65536; tzw. Hi-color 24 bity: (2 8 ) 3 = 2 24 = 16777216; tzw. True-color 32 bity: (2 8 ) 4 = 2 32 Ta ostatnia wartość to w rzeczywistości Hi-color z dodatkowymi ośmioma bitami używanymi najczęściej do zapisania informacji o przezroczystości. Tomasz Lewicki (WWSIS, Wrocław) Archiwizacja dokumentów i danych czerwiec 2007 6 / 17

Rozdzielczość obrazu Rozdzielczość optyczna i interpolowana Rozdzielczość obrazu cyfrowego to łączna liczba pikseli tworzących obraz. Rozdzielczość należy rozpatrywać w odniesieniu do konkretnego urządzenia, np. ekranu monitora, na którym wyświetlany jest obraz. W odniesieniu do skanerów wyróżnia się dwie rozdzielczości: optyczną oraz interpolowaną. Rozdzielczość optyczna zwana również fizyczną to rzeczywista ilość elementów światłoczułych (CCD lub CIS) skanera podzielona przez maksymalną szerokość obiektu, jaką skaner jest w stanie zeskanować. Rozdzielczość interpolowana to programowe zwiększenie rozdzielczości optycznej. Interpolacja w przypadku skanera polega na wstawianiu pomiędzy dwa rzeczywiste punkty zeskanowanego obrazu dodatkowych pikseli, których wartości (barwa i jasność) są wyliczane na podstawie pewnego modelu z analogicznych wartości sąsiednich pikseli. Tomasz Lewicki (WWSIS, Wrocław) Archiwizacja dokumentów i danych czerwiec 2007 7 / 17

Zakres gęstości Zakres gęstości, zwany też zakresem dynamiki (dynamic range) jest miarą zdolności skanera do rozróżniania barw w naciemniejszych i najjaśniejszych obszarach obrazu. Oznaczany jest dużą literą D. Mówiąc ściślej jest to różnica pomiędzy czułością przy najwyższej (D max ; najciemniejsze piksele) i najniższej (D min ; najjaśniejsze piksele) gęstości. Wartości D zawierają się w umownym przedziale od 0 do 4, gdzie 0 oznacza przezroczystą błonę fotograficzną, a 4 błonę całkowicie zaczernioną. Gęstość jest mierzona w skali logarytmicznej o podstawie 10, czyli gęstość D = 2 jest 10-krotnie mniejsza niż D = 3. Skanery wysokiej klasy (większość bębnowych, niektóre płaskie) mają wyższe zakresy gęstości oraz wartości D min i D max. Wyższe wartości D mają znaczenie zwłaszcza przy obróbce materiałów transparentnych (np. klisz fotograficznych). Tomasz Lewicki (WWSIS, Wrocław) Archiwizacja dokumentów i danych czerwiec 2007 8 / 17

Przechwytywanie obrazu przez skaner CCD CCD jest skrótem od Charge Coupled Device, czyli urządzenie o sprzężeniu ładunkowym. Jest to matryca elementów światłoczułych działających na zasadzie wewnętrznego efektu fotoelektrycznego. W skanerach płaskich elementy te są umieszczone liniowo (dla każdej z barw składowych RGB osobno) na ruchomej belce przesuwającej się wewnątrz skanera. W rejestracji obrazu pomaga układ luster i soczewek oraz zimna lampa katodowa dająca barwę światła zbliżoną do naturalnej. Taki układ ma stosunkowo dużą głębię ostrości. W aparatach cyfrowych CCD ma postać macierzy dwuwymiarowej obraz jest rejestrowany w całości w jednym momencie. Tomasz Lewicki (WWSIS, Wrocław) Archiwizacja dokumentów i danych czerwiec 2007 9 / 17

Przechwytywanie obrazu przez skaner c.d. CIS CIS to skrót od Contact Image Sensor. Jest to technika rejestracji młodsza niż CCD. Źródłem światła są diody półprzewodnikowe LED, dzięki czemu pobór prądu jest mniejszy niż w przypadku skanerów CCD. Zwierciadło jest zbędnym elementem układu, ponieważ sensory są umieszczone bliżej skanowanego obiektu. Całość jest umieszczona na ruchomej belce, podobnie jak w przypadku skanerów opartych o układy CCD. Skanery z układami CIS mają małą głębię ostrości. Tomasz Lewicki (WWSIS, Wrocław) Archiwizacja dokumentów i danych czerwiec 2007 10 / 17

Przechwytywanie obrazu przez skaner c.d. PMT PMT jest skrótem od Photomultiplier Tube i oznacza fotopowielacz. Urządzenie ma postać lampy próżniowej, zbudowanej z anody i katody oraz co najmniej jednej dynody (zazwyczaj więcej niż jednej), której zadaniem jest powielenie elektronu wybitego z fotokatody przez foton na nią padający. Fotopowielacze charakteryzują się dużymi czułościami i wzmocnieniami, ale wymagają do działania wysokiego napięcia (od kilkuset do kilku tysięcy woltów) i są drogie, przez co znajdują zastosowanie niemal wyłącznie w profesjonalnych urządzeniach, np. w skanerach bębnowych (po jednym fotopowielaczu dla każdej z barw składowych RGB). Tomasz Lewicki (WWSIS, Wrocław) Archiwizacja dokumentów i danych czerwiec 2007 11 / 17

Przygotowanie do druku Podczas przygotowywania zdigitalizowanego obrazu do druku należy mieć na uwadze fakt, iż rozdzielczość drukarki różni się od rozdzielczości skanera. Pamiętać trzeba również o tym, że drukarka dysponuje tylko czterema kolorami (CMYK), przy pomocy których musi oddać wszystkie kolory widoczne na ekranie (o ile oczywiście mamy do czynienia z obrazem barwnym). Jeśli obraz ma zbyt niską rozdzielczość, drukarka będzie miała za mało informacji potrzebnych do wiernego oddania detali i barw poszczególnych pikseli. Jest obraz jest w bardzo wysokiej rozdzielczości, przed drukiem należy dokonać tzw. downsamplingu, czyli zmniejszenia częstości próbkowania sygnału (tutaj: obrazu). Tomasz Lewicki (WWSIS, Wrocław) Archiwizacja dokumentów i danych czerwiec 2007 12 / 17

Rozpoznawanie znaków OCR OCR jest skrótem od Optical Character Recognition i oznacza optyczne rozpoznawanie znaków, potocznie zwane rozpoznawaniem tekstu. Jest to technika pozwalająca z obrazu w postaci cyfrowej wyekstrahować tekst, ewentualnie cechy czcionek użytych do jego złożenia (krój, wielkość) i inne elementy dokumentu, np. formatowanie, tabele, formularze. Tomasz Lewicki (WWSIS, Wrocław) Archiwizacja dokumentów i danych czerwiec 2007 13 / 17

Rozpoznawanie znaków ICR ICR to skrót od Intelligent Character Recognition, czyli inteligentne rozpoznawanie znaków. Podstawowym zadaniem systemów ICR jest rozpoznanie znaków alfanumerycznych zapisanych odręcznie. Do rozpoznawania używane są mechanizmy sieci neuronowych. Tomasz Lewicki (WWSIS, Wrocław) Archiwizacja dokumentów i danych czerwiec 2007 14 / 17

Rozpoznawanie znaków OMR OMR oznacza Optical Mark Recognition optyczne rozpoznawanie znaczników. Polega na rozpoznawaniu znaków innych niż alfanumeryczne, np. pól wyboru lub kodów kreskowych. Czytniki OMR znacznie ułatwiają analizę dużej ilości zestandaryzowanych formularzy oraz umożliwiają kontrolę poprawności ich wypełnienia. Rozpoznanie znacznika polega na zmierzeniu ilości światła odbitego lub przechodzącego przez ściśle określony fragment skanowanego dokumentu. Tomasz Lewicki (WWSIS, Wrocław) Archiwizacja dokumentów i danych czerwiec 2007 15 / 17

Skuteczność technik rozpoznawania tekstu i znaków Systemy OCR, ICR i OMR znajdują zastosowanie na różnych polach. Z tego względu ich skuteczność musi być badane według odmiennych kryteriów. Jeśli przyjąć za podstawowe kryterium odsetek prawidłowo odczytanych i przeanalizowanych danych, to najbardziej skuteczne są techniki OMR (nawet 99,9%), mniej skuteczne są systemy OCR, a największym procentem błędnych interpretacji cechują się systemy ICR. Dwa ostatnie systemy (OCR i ICR) również mogą osiągać około 99% skuteczności, ale tylko w bardzo ściśle określonych, niemal laboratoryjnych warunkach oraz po ręcznej edycji błędów. Tomasz Lewicki (WWSIS, Wrocław) Archiwizacja dokumentów i danych czerwiec 2007 16 / 17

Sztuczki i kruczki dla celów OCR Przygotowując dokumenty papierowe do digitalizacji i rozpoznania tekstu dobrze jest pamiętać o kilku zasadach, które mogą znacząco podnieść skuteczność rozpoznania: papier powinien być jasny i jeśli to możliwe pozbawiony skaz, zagnieceń, włókien z pulpy papierowej itp. defektów dokument należy skanować z rozdzielczością optyczną co najmniej 300 dpi, czasami wyższą obraz przeznaczony do OCR powinien być zapisany w odcieniach szarości, najlepiej w formacie nieskompresowanym należy przyjrzeć się ustawieniom jasności i kontrastu w programie skanującym, ewentualnie wykonać kilka skanów próbnych i poddać je procesowi OCR najwięcej błędów zdarza się przy interpretacji drobnych znaków, np. kropek, przecinków, średników, myślników Tomasz Lewicki (WWSIS, Wrocław) Archiwizacja dokumentów i danych czerwiec 2007 17 / 17