Przygotowanie materiału uczącego dla OCR w oparciu o aplikację Wycinanki.



Podobne dokumenty
Samochodowy system detekcji i rozpoznawania znaków drogowych. Sensory w budowie maszyn i pojazdów Maciej Śmigielski

Ustawienia kolorów w Fiery Command WorkStation 6 FS200

Analiza i przetwarzanie obrazów

Automatyzacja i robotyzacja procesów technologicznych

INSTRUKCJA SKŁADANIA OFERT W SYSTEMIE WITKAC.PL

Tworzenie konta Na stronie głównej klikamy w przycisk Zarejestruj się

INSTRUKCJA UŻYTKOWNIKA

Kurs Adobe Photoshop Elements 11

Pomorski Czarodziej 2016 Zadania. Kategoria C

Krój czcionki można wybrać na wstążce w zakładce Narzędzia główne w grupie przycisków Cz cionka.

Instrukcja dotycząca generowania klucza dostępowego do Sidoma v8

Zajęcia komputerowe klasy I-III- wymagania

Cash Flow System Instrukcja

Narzędzie informatyczne wspomagające dokonywanie ocen pracowniczych w służbie cywilnej

Adobe InDesign lab. 3 Jacek Wiślicki,

Podstawy edycji tekstu

58 Zjazd Naukowy PTChem. Zgłaszanie abstraktów

Jakie nowości i udogodnienia niesie za sobą przejście do Sidoma 8, część z tych różnic znajdziecie Państwo w tabeli poniżej.

LOGO BUDOWA LOGO. Znak składa się z dwóch części - sygentu zbudowanego z trzech wielkoątów oraz logotypu - typograficznego zapisu nazwy firmy CDA.

Odciski palców ekstrakcja cech

Instrukcja obsługi ebook Geografia XXI wieku

Słownik. Instrukcja obsługi programu

Wymagania edukacyjne - Informatyka w klasie I

Tworzenie stempla W poniższym poradniku zostanie zaprezentowany ciekawy sposób na stworzenie

ToonDoo Maker tworzenie pojedynczej sceny komiksowej

1. Skopiować naswój komputer: (tymczasowy adres)

Prezentacja multimedialna MS PowerPoint 2010 (podstawy)

WYMAGANIA EDUKACYJNE NIEZBĘDNE DO UZYSKANIA POSZCZEGÓLNYCH ŚRODROCZNYCH I ROCZNYCH OCEN Z ZAJĘĆ KOMPUTEROWYCH W KLASIE IV

narzędzie Linia. 2. W polu koloru kliknij kolor, którego chcesz użyć. 3. Aby coś narysować, przeciągnij wskaźnikiem w obszarze rysowania.

Informatyka Edytor tekstów Word 2010 dla WINDOWS cz.1

Po uruchomieniu programu nasza litera zostanie wyświetlona na ekranie

Jak zainstalować i skonfigurować komunikator MIRANDA, aby wyglądał i funkcjonował jak Gadu Gadu Tutorial by t800.

BRELOK DO KLUCZY. ZADANIE Stwórz breloczek z nazwą twojej szkoły 1. Szkic breloczka z napisem MAKER

Instrukcja migracji danych z bazy Derby do bazy Oracle

Techniki multimedialne

Ogranicz listę klasyfikacji budżetowych do powiązanych z danym kontem księgowym

Wskazówki: 1. Proszę wypełnić dwie sąsiadujące komórki zgodne z zasadą ciągu, a następnie zaznaczyć komórki w następujący sposób:

Dzielenie tekstu. Ręczne dostosowywanie dzielenia wyrazów. Automatyczne dostosowywanie dzielenia wyrazów

Edytor tekstu MS Word 2010 PL: grafika. Edytor tekstu MS Word umożliwia wstawianie do dokumentów grafiki.

a. Wersja podstawowa pozioma

Rozkłady zajęć- notatki

Jak napisać program obliczający pola powierzchni różnych figur płaskich?

Transformacja współrzędnych geodezyjnych mapy w programie GEOPLAN

PLAN WYNIKOWY KLASA 1

Zawartość. Wstęp. Moduł Rozbiórki. Wstęp Instalacja Konfiguracja Uruchomienie i praca z raportem... 6

SYSTEM OZNACZANIA ZAWORÓW KULOWYCH +GF+

Aplikacja z zastosowaniem czujnika wizyjnego LightPix z pakietem softwarowym Pattern Matching

Rozszerzenia i specyfikacja przyjmowanych przez nas plików.

Raport z badania w JSA

Zbiorcze korekty faktur by CTI. Instrukcja

Prezentacja MS PowerPoint 2010 PL.

Zajęcia 3: Skanowanie i rozpoznawanie materiałów

Zadanie 1. Stosowanie stylów

Instrukcja użytkownika NAUCZYCIELA AKADEMICKIEGO SYSTEMU ARCHIWIZACJI PRAC

PRZEDMIOTOWY SYSTEM OCENIANIA Z JĘZYKA POLSKIEGO

Instrukcja użytkownika aplikacji modernizowanego Systemu Informacji Oświatowej

jako integralna część Regionalnego Systemu Informacji Przestrzennej (RSIP)

Języki programowania zasady ich tworzenia

MODELER MODUŁ KOREKCJI DYSTORSJI SOCZEWKI WERSJA ZEWNĘTRZNA UPROSZCZONA INSTRUKCJA OBSŁUGI PROGRAMU

Ćwiczenia nr 7. TEMATYKA: Krzywe Bézier a

epuap Zakładanie konta organizacji

Instrukcja przygotowania pliku do deponowania

EGZAMIN MATURALNY Z INFORMATYKI MAJ 2010 POZIOM ROZSZERZONY CZĘŚĆ I WYBRANE: Czas pracy: 90 minut. Liczba punktów do uzyskania: 20 WPISUJE ZDAJĄCY

Rozdział ten zawiera informacje na temat zarządzania Modułem DMX oraz jego konfiguracji.

Przewodnik Szybki start

KOREKTA ROZKŁADU JASNOŚCI (obrazy monochromatyczne i barwne)

ARCHIWUM PRAC DYPLOMOWYCH

Dlaczego Strefa Wiedzy?

UWAGA: poniższe procedury przygotowane zostały w oparciu o program HiTi PhotoDesiree 2 w wersji

Instrukcja składania wniosków w Generatorze witkac.pl

Instrukcja składania wniosku o dofinansowanie w systemie informatycznym IP na potrzeby konkursu nr 1/1.1.1/2015

Regulamin uczestnictwa w kursach językowych dostępnych na platformie Lubelskiego Uniwersytetu Inspiracji

Księgarnia internetowa Lubię to!» Nasza społeczność

JAK ZAPROJEKTOWAĆ WYGLĄD STRONY INTERNETOWEJ W KREATORZE CLICK WEB?

Program graficzny MS Paint.

Temat 1. Więcej o opracowywaniu tekstu

Pattern Classification

Obsługa programu Paint. mgr Katarzyna Paliwoda

Instrukcja interpretacji Raportu podobieństwa systemu Antyplagiat

Podręcznik użytkownika programu. Ceremonia 3.1

(12) OPIS OCHRONNY WZORU PRZEMYSŁOWEGO

EGZAMIN MATURALNY 2011 INFORMATYKA

Ocenianie opisowe Optivum. Jak przygotować i wydrukować świadectwa lub arkusze ocen?

Instrukcje dla zawodników

Grafika Komputerowa Materiały Laboratoryjne

Programowanie w języku C++ Grażyna Koba

System wizyjny OMRON Xpectia FZx

Instrukcja Użytkownika Systemu Zarządzania Tożsamością Wersja. 1.0

Szczegółowe wymagania edukacyjne. dla uczniów Szkoły Podstawowej nr 1 w Proszowicach. z przedmiotu zajęcia komputerowe

Obsługa kalendarza wizyt w serwisie elekarze. Podręcznik użytkownika

WOJEWÓDZKI KONKURS INFORMATYCZNY DLA UCZNIÓW SZKÓŁ PODSTAWOWYCH ETAP SZKOLNY BIAŁYSTOK, 19 LISTOPADA 2018 R.

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

Wykrywanie twarzy na zdjęciach przy pomocy kaskad

Przetworzenie map ewidencyjnych do postaci rastrowej

. Sposób zapisu plików pojedynczej publikacji w formacie DjVu

CENTRUM ROZWOJU. ul. Krótka KRAKÓW. ZNAKI I SYGNA Y DROGOWE ZAKTUALIZOWANE Pakiet EXT03 wersja 1.1

Przetwarzanie obrazów wykład 7. Adam Wojciechowski

ZUS PRZEZ INTERNET KROK PO KROKU ZŁOŻENIE WNIOSKU O ŚWIADCZENIE WYCHOWAWCZE NA DRUGIE I KOLEJNE DZIECKO. Zaloguj się do swojego profilu PUE.

Transkrypt:

Przygotowanie materiału uczącego dla OCR w oparciu o aplikację Wycinanki. Zespół bibliotek cyfrowych PCSS 6 maja 2011 1 Cel aplikacji Aplikacja wspomaga przygotowanie poprawnego materiału uczącego dla systemu automatycznego rozpoznawania znaków (ang. OCR). Pod pojęciem poprawnego materiału uczącego rozumiemy zestaw kształtów (obszarów) wyizolowanych z dokumentu źródłowego, składających się na czcionkę użytą do druku danego dokumentu. Poprawny materiał uczący posiada następujące cechy: 1. Wyizolowany obszar zawiera pełny kształt pojedynczego znaku nie powinien on zawierać zabrudzeń i fragmentów innych znaków. Należy również pamiętać, że znaki diakrytyczne (np. akcenty czy ogonki) są integralną częścią właściwego znaku. 2. Wyizolowany kształt powinien możliwie wiernie odzwierciedlać cechy czcionki użytej do druku. 3. Z wyizolowanym obszarem w formie graficznej, skojarzony jest odpowiadający mu znak wprowadzony z klawiatury komputera lub klawiatury wirtualnej. 4. Wyizolowany kształt oznaczony jest jako poprawny bądź błędnie wydrukowany. 2 Proces przygotowania materiału uczącego W ramach aplikacji proces przygotowania materiału uczącego został podzielony na następujące kroki: 1

1. Poprawne zaznaczenie obszaru zawierającego pełny kształt znaku (porównaj cecha 1), powinno bazować na podpowiedzi aplikacji lub samodzielnie zaznaczonym obszarze. Jeżeli zaproponowany przez aplikację obszar jest nieprawidłowy i nie zostanie wykorzystany przez użytkownika, należy go usunąć. Aplikacja przejdzie wówczas do kolejnej podpowiedzi (krok nr 1). 2. Dobranie stopnia (progu) binaryzacji, który możliwie wiernie wyizoluje kształt znaku (porównaj cecha 2). W tym kroku aplikacja zaproponuje początkowe ustawienie binaryzacji, które w razie potrzeby powinno zostać skorygowane przez użytkownika. 3. Wymazanie elementów, który nie należy do oryginalnego kształtu litery (porównaj cecha 1) za pomocą pędzla. 4. Wprowadzenie znaku, któremu odpowiada wyizolowany kształt (porównaj cecha 3). 5. Zapisanie kształtu lub oznaczenie go jako niepoprawnie wydrukowanego (porównaj cecha 4). Po kroku nr 5 następuje powrót do kroku nr 1, aż do momentu przetworzenia wszystkich znaków w dokumencie. 3 Przykłady Poszczególne kroki oraz zalecenia są szczegółowo omówione na poniższych przykładach. 3.1 Krok 1: Zaznaczenie obszaru z kształtem znaku diakrytycznego. Obszar zaproponowany przez aplikację nie zawiera znaku diakrytycznego będącego częścią opracowywanej litery. W takiej sytuacji należy rozszerzyć obszar, aby obejmował cały kształt litery (porównaj cecha 1). 2

3.2 Krok 1: Połączenie sąsiadujących obszarów. Podpowiedź aplikacji jest błędna, ponieważ znak V został podzielony na dwa nakładające się obszary: Należy rozszerzyć jeden z nich w taki sposób, by obejmował cały kształt znaku, natomiast drugi odrzucić. Poniżej pokazano dwa obszary zaproponowane przez aplikację, oraz trzeci obszar wynikowy. 3.3 Krok 1: Błędny obszar nie zawierający znaku Obszar zaproponowany przez aplikację może nie zawierać znaku. W takim przypadku należy usunąć (odrzucić) zaproponowany obszar. Poniżej znajdują się przykłady obszarów zawierających kolejno zabrudzenie, fragment grafiki ozdobnej oraz fragment obramowania tabeli. 3

3.4 Krok 2: Dobór stopnia (progu) binaryzacji Dobranie stopnia (progu) binaryzacji w kroku 2 kontroluje się przyciskami + oraz -, a także suwakiem: Proces binaryzacji to konwersja z obrazu wielokolorowego (czy też odcieni szarości) do postaci czarno białej (dwukolorowej). Korygując stopień binaryzacji, należy dążyć do tego aby wyizolowany kształt znaku odzwierciedlał jego właściwy charakter (por. cecha 2). Poniżej pokazano jak dobór stopnia binaryzacji wpływa na to jak wygląda wynikowy kształt (czarno biały) znaku L. Od prawej: oryginalny obszar (obraz w odcieniach szarości) oraz wyniki procesu binaryzacji dla rosnących wartości stopnia binaryzacji. Jak widać w przykładzie, zwiększając stopień (poziom) binaryzacji udało się usunąć poziome zniekształcenia (szumy) obszaru. Z kolei zbyt duża wartość stopnia binaryzacji może doprowadzić do zamazania kształtu. Zatem w powyższym przykładzie poprawny jest drugi stopień binaryzacji. Następny przykład pokazuje, jak za pomocą doboru stopnia binaryzacji można wyizolować kształt znaku, usuwając przy tym kształty nie należące do znaku. Ponownie przedstawiono oryginalny obszar oraz zwiększane wartości stopnia binaryzacji. Uwaga. Celem doboru stopnia binaryzacji jest wyizolowanie możliwie wiernie kształtu znaku w formie czarno białej. Nie zawsze możliwe jest przy tym 4

wymazanie kształtów innego pochodzenia, szczególnie jeśli cechują się tym samym odcieniem. 3.5 Krok 3: Wymazanie sąsiadującego znaku W sytuacji, gdy prostokątny obszar nie może objąć pojedynczego znaku (zobacz przykład poniżej), należy usunąć fragmenty należące np. do innych znaków, za pomocą pędzla. Poniższy przykład ilustruje oryginalny obszar oraz kolejne etapy wymazywania niechcianego fragmentu. Uwaga 1. Zaleca się wymazanie kształtów po wcześniejszej regulacji stopnia binaryzacji w kroku 2. Uwaga 2. Narzędzie wymazywania kształtów nie powinno być używane do uzyskiwania idealnego kształtu (porównaj zalecenia do kroku 2). 3.6 Krok 5: Znaki błędnie wydrukowane. Z uwagi na charakter dokumentów, na podstawie których przygotowywany jest materiał uczący, możliwa jest sytuacja, gdy pojedyncze znaki (lub większe fragmenty tekstu) będą błędnie wydrukowane. W takich przypadkach niemożliwe jest wyizolowanie kształtu wiernie reprezentującego dany znak. Należy zatem oznaczyć dany kształt w kroku 5 jako błąd drukarski (zobacz cecha 4), mimo błędu o ile to możliwe należy wpisać jaki znak reprezentuje dany kształt. Poniżej znajdują się przykłady kształtów, które powinny być oznaczone jako błąd drukarski. Podano obszar oryginalny oraz kształt zbinaryzowany (czarno biały): 1. Niedobita czcionka dla znaku a: 5

2. Niedobita czcionka dla znaku A: 3. Niedobita czcionka dla znaku S. Pokazano, jak zwiększanie stopnia (progu) binaryzacji doprowadza do nadmiarowego wyodrębnienia kształtu, powodując jego zamazanie: Uwaga 1. W przypadku, gdy błąd drukarski jest znaczny, może nie być pewności jaki znak reprezentuje dany kształt. Należy wówczas w kroku 4 prowadzić znak rozpoznany na podstawie szerszego kontekstu, np. wyrazu. Przykładem jest powyższy znak S w wyrazie Sądy. Uwaga 2. W przypadku niektórych błędów drukarskich, kształt znaku jest zniekształcony, jednakże nadal poprawny. Jako ilustrację przedstawiono poniższy przykład znaku a, które pomimo zabrudzeń nadal stanowi poprawny kształt: 6

7