Rozpoznawanie obrazów dłoni za pomocą gramatyk klasy ETPL(k) w systemach wizyjnych analizy języka migowego.

Podobne dokumenty
Gramatyki grafowe. Dla v V, ϕ(v) etykieta v. Klasa grafów nad Σ - G Σ.

Anna Fabijańska. Algorytmy segmentacji w systemach analizy ilościowej obrazów

Gramatyki, wyprowadzenia, hierarchia Chomsky ego. Gramatyka

Gramatyka operatorowa

Badania operacyjne: Wykład Zastosowanie kolorowania grafów w planowaniu produkcji typu no-idle

Zadania badawcze prowadzone przez Zakład Technik Programowania:

rozpoznawania odcisków palców

1 Automaty niedeterministyczne

Grafowy model bazy danych na przykładzie GOOD

Gramatyki atrybutywne

przetworzonego sygnału

Kodowanie transformacyjne. Plan 1. Zasada 2. Rodzaje transformacji 3. Standard JPEG

Zadanie analizy leksykalnej

Interpretacja gestów dłoni w sekwencji obrazów cyfrowych. autor: Karol Czapnik opiekun: prof. dr hab. Włodzimierz Kasprzak

Porównanie wydajności CUDA i OpenCL na przykładzie równoległego algorytmu wyznaczania wartości funkcji celu dla problemu gniazdowego

Automat ze stosem. Języki formalne i automaty. Dr inż. Janusz Majewski Katedra Informatyki

SYSTEM BIOMETRYCZNY IDENTYFIKUJĄCY OSOBY NA PODSTAWIE CECH OSOBNICZYCH TWARZY. Autorzy: M. Lewicka, K. Stańczyk

technologii informacyjnych kształtowanie , procesów informacyjnych kreowanie metod dostosowania odpowiednich do tego celu środków technicznych.

Gramatyki rekursywne

10. Redukcja wymiaru - metoda PCA

PROLOG WSTĘP DO INFORMATYKI. Akademia Górniczo-Hutnicza. Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej.

Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.

Aproksymacja funkcji a regresja symboliczna

Teoretyczne podstawy informatyki

Parsery LL(1) Teoria kompilacji. Dr inż. Janusz Majewski Katedra Informatyki

Graf. Definicja marca / 1

bo od managera wymaga się perfekcji

Hierarchia Chomsky ego Maszyna Turinga

Technologie informacyjne - wykład 12 -

Wprowadzenie. Teoria automatów i języków formalnych. Literatura (1)

PROGRAMOWANIE DYNAMICZNE W ROZMYTYM OTOCZENIU DO STEROWANIA STATKIEM

Analizator syntaktyczny

Sprawozdanie do zadania numer 2

KATEDRA INFORMATYKI TECHNICZNEJ. Ćwiczenia laboratoryjne z Logiki Układów Cyfrowych. ćwiczenie 204

WSPÓŁCZYNNIK GOTOWOŚCI SYSTEMU LOKOMOTYW SPALINOWYCH SERII SM48

w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.

2.2. Gramatyki, wyprowadzenia, hierarchia Chomsky'ego

Najprostszy schemat blokowy

Praca Magisterska. Automatyczna kontekstowa korekta tekstów na podstawie Grafu Przyzwyczajeń. internetowego dla języka polskiego

Tworzenie języków specyfikacji dla zagadnień numerycznych

Detekcja punktów zainteresowania

Analiza semantyczna. Gramatyka atrybutywna

Równoległy algorytm wyznaczania bloków dla cyklicznego problemu przepływowego z przezbrojeniami

!!!!!!!!!!! PORTFOLIO: Analiza zachowań użytkowników serwisów internetowych. Autorzy: Marek Zachara

POLITECHNIKA POZNAŃSKA Wydział Maszyn Roboczych i Transportu

JAO - Wprowadzenie do Gramatyk bezkontekstowych

Maszyna Turinga języki

10. Translacja sterowana składnią i YACC

Definicje. Najprostszy schemat blokowy. Schemat dokładniejszy

Pattern Classification

Modele bezpieczeństwa logicznego i ich implementacje w systemach informatycznych / Aneta Poniszewska-Marańda. Warszawa, 2013.

PLAN ZARZĄDZANIA WYMAGANIAMI PROJEKT <NAZWA PROJEKTU> WERSJA <NUMER WERSJI DOKUMENTU>

Operacje morfologiczne w przetwarzaniu obrazu

DOBÓR ŚRODKÓW TRANSPORTOWYCH DLA GOSPODARSTWA PRZY POMOCY PROGRAMU AGREGAT - 2

9.9 Algorytmy przeglądu

KOMPUTEROWE MODELOWANIE PĘKNIĘĆ NA BAZIE ZDJĘĆ RADIOGRAFICZNYCH

5. Analiza dyskryminacyjna: FLD, LDA, QDA

Klasyfikacja konturów w znaczników w z wykorzystaniem miary zmienności na obrazie z sonaru sektorowego

R E C E N Z J A. 1. Podstawa formalna.

1. Podstawowe pojęcia

AUTOMATYKA INFORMATYKA

Raport Hurtownie Danych

Systemy uczące się wykład 2

XQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery

Ćwiczenie 6. Transformacje skali szarości obrazów

Metody Programowania

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 8 AiR III

Metody Kompilacji Wykład 3

Rozpoznawanie obrazów na przykładzie rozpoznawania twarzy

Proces technologiczny. 1. Zastosowanie cech technologicznych w systemach CAPP

Język UML w modelowaniu systemów informatycznych

PRACA DOKTORSKA. Rozpoznawanie obrazów dłoni za pomocą gramatyk klasy ETPL(k) w systemach wizyjnych analizy języka migowego.

Wyrażenia regularne.

POPRAWIANIE JAKOŚCI OBRAZU W DZIEDZINIE PRZESTRZENNEJ (spatial image enhancement)

Obraz jako funkcja Przekształcenia geometryczne

Plan wykładu. Kompilatory. Literatura. Translatory. Literatura Translatory. Paweł J. Matuszyk

Rozszerzony konspekt przedmiotu Inteligentne maszyny i systemy

Spis treści. Wstęp Część I Internet rozwiązania techniczne... 13

Wizja maszynowa w robotyce i automatyzacji Kod przedmiotu

Przetwarzanie obrazu

Analiza leksykalna 1. Teoria kompilacji. Dr inż. Janusz Majewski Katedra Informatyki

Wykorzystanie protokołu SCEP do zarządzania certyfikatami cyfrowymi w systemie zabezpieczeń Check Point NGX

Akademia Górniczo-Hutnicza

Laboratorium modelowania oprogramowania w języku UML. Ćwiczenie 4 Ćwiczenia w narzędziu CASE diagram czynności. Materiały dla studenta

OKREŚLANIE WSPÓŁRZĘDNYCH KĄTOWYCH CELU PRZY UŻYCIU GŁOWICY WIZYJNEJ RAKIETY

Matematyczne Podstawy Informatyki

Wprowadzenie do Sztucznej Inteligencji

Teoria automatów i języków formalnych. Określenie relacji

Struktury danych i złożoność obliczeniowa Wykład 7. Prof. dr hab. inż. Jan Magott

Algorytm. a programowanie -

Zagadnienia egzaminacyjne INFORMATYKA. stacjonarne. I-go stopnia. (INT) Inżynieria internetowa STOPIEŃ STUDIÓW TYP STUDIÓW SPECJALNOŚĆ

Turing i jego maszyny

AUTOMATYZACJA PROCESÓW DYSKRETNYCH 2016

Modelowanie jako sposób opisu rzeczywistości. Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka

Przetwarzanie obrazu

3 Abstrakcyjne kompleksy symplicjalne.

7. Maszyny wektorów podpierajacych SVMs

Laboratorium Programowanie Obrabiarek CNC. Nr H7

Hybrydowa analiza transformat w rozpoznawaniu wysokości dźwięków w polifonicznych nagraniach instrumentów muzycznych

Algorytm. Krótka historia algorytmów

Transkrypt:

Rozpoznawanie obrazów dłoni za pomocą gramatyk klasy ETPL(k) w systemach wizyjnych analizy języka migowego. Autor: Afiliacja: Promotor pracy: Recenzenci: mgr inŝ. Szymon Myśliński Katedra Systemów Informatycznych UJ Prof. dr hab. Mariusz Flasiński Uniwersytet Jagielloński Prof. dr hab. inŝ. Marek Kurzyński Politechnika Wrocławska Prof. dr hab. Marek Ogiela Akademia Górniczo-Hutnicza Cel i zakres pracy Celem pracy było skonstruowanie metody rozpoznawania układu dłoni (ang. hand posture) na obrazie, opartej na modelu parsingu języków grafowych. Metodę przystosowano do obrazów układów dłoni Polskiego Języka Miganego (PJM), który jest podstawowym środkiem komunikacji osób głuchych i niedosłyszących z osobami spoza tego środowiska. Badana metoda klasyfikacji obrazów charakteryzuje się niŝszą złoŝonością obliczeniową i większą uniwersalnością od uŝywanego dotychczas podejścia bazującego na reprezentacji grafowej dłoni w procesie rozpoznawaniu obrazów dopasowania grafów (ang. graph-matching). Ta właściwość predestynuje ją do zastosowania w systemach wizyjnych w celu rozpoznawania układów dłoni w czasie rzeczywistym. SEGMENTACJA WYZNACZANIE ŚRODKA MASY DŁONI WYZNACZANIE KONTURU DŁONI WYZNACZANIE PUNKTÓW CHAR. OBRAZ DŁONI TOR PRZETWARZANIA I ROZPOZNAWANIA OBRAZU PRZETWARZANIE WSTĘPNE GENERACJA REPREZENTACJI GRAFOWEJ ANALIZA SYNTAKTYCZNA UKŁAD DŁONI ROZPINANIE GRAFU ETYKIETOWANIE KRAWĘDZI INDEKSOWANIE WIERZCHOŁKÓW ETYKIETOWANIE WIERZCHOŁKÓW Rys. 1 Schemat toru przetwarzania i rozpoznawania obrazu Rozpoznawanie układu dłoni w prezentowanej metodzie przebiega w następujących etapach (Rys. 1). 1. Obraz wejściowy podlega wstępnemu przetwarzaniu, w wyniku którego wyznaczany jest zbiór punktów charakterystycznych obrazu. 2. Budowana jest grafowa reprezentacja obrazu dłoni, w postaci umoŝliwiającej zastosowanie efektywnego algorytmu analizy syntaktycznej.

3. W procesie parsingu stworzonej reprezentacji grafowej rozpoznawany jest układ dłoni na obrazie. Teza pracy została sformułowana jak następuje. Syntaktyczne metody rozpoznawania układu dłoni oparte na parsingu języków grafowych pozwalają na uzyskanie najniŝszej moŝliwej złoŝoności obliczeniowej algorytmu rozpoznawania O(n 2 ), gdzie n jest liczbą wierzchołków grafu reprezentującego strukturę dłoni. W ramach pracy wykonane zostały następujące zadania badawcze. 1. Zidentyfikowanie kroków wstępnego przetwarzania obrazu. 2. Zaprojektowanie algorytmu identyfikacji punktów charakterystycznych na obrazie dłoni. 3. Opracowanie formalnego modelu grafowego reprezentacji obrazów dłoni, dla którego moŝliwe jest zastosowanie algorytmu parsingu o moŝliwie najniŝszej złoŝoności obliczeniowej. 4. Opracowanie algorytmu rozpinania grafu opisującego przestrzenne relacje pomiędzy wyznaczonymi punktami obrazu dłoni. 5. Zdefiniowanie podklasy TETPL(k) gramatyk grafowych (w ramach klasy ETPL(k) 1 ) umoŝliwiającej generację grafowych reprezentacji obrazów dłoni. 6. Zdefiniowanie algorytmu parsera dla podklasy TETPL(k) gramatyk grafowych. 7. Zaprojektowanie i implementacja parsera podklasy TETPL(k) gramatyk grafowych. 8. Przeprowadzenie eksperymentów weryfikujących opracowaną metodę. Przetwarzanie wstępne Pierwszy z etapów przetwarzania etap przetwarzania wstępnego obrazu rozpoczyna się od segmentacji obrazu w celu rozdzielenia obszaru dłoni i dopełniającego go obszaru tła. Do tego celu autor wybrał znaną z literatury metodę segmentacji na podstawie modelu barwy skóry ludzkiej (Rys. 2). Rys. 2 Segmentacja obrazu na podstawie modelu barwy skóry ludzkiej Wpływ błędów segmentacji, tj. pojedynczych pikseli o wartości 1 na obszarze tła oraz postrzępionych krawędzi obszaru dłoni, na dalsze etapy rozpoznawania obrazu, jest 1 Mariusz Flasiński. On the parsing of deterministic graph languages for syntactic pattern recognition. Pattern Recognit., 26:1 16, 1993.

minimalizowany poprzez przeprowadzenie morfologicznej operacji otwarcia przy uŝyciu kolistego elementu strukturalnego (Rys. 3). Rys. 3 Eliminacja błędów segmentacji obrazu metodami morfologii matematycznej Dla wyznaczonego w ten sposób obszaru, wyliczane jest połoŝenie punktu środka jego masy. Punkt ten będzie stanowił odniesienie dla pozostałych punktów charakterystycznych wyznaczonych na obszarze dłoni (Rys. 4). Rys. 4 Wyznaczanie środka masy obszaru dłoni Kolejnym krokiem jest identyfikacja konturów podstawowego i (jeśli taki istnieje) wewnętrznego dłoni (Rys. 5). Ze względu na potrzebę maksymalizacji wydajności procesu, autor zrezygnował ze standardowych metod wykrywania krawędzi na rzecz algorytmu śledzenia konturu obszaru na obrazie binarnym. Rys. 5 Wyznaczanie konturu podstawowego i wewnętrznego obszaru dłoni Ostatnim krokiem tego etapu było zaproponowanie algorytmu wyznaczającego punkty charakterystyczne obrazu. Autor zaprojektował metodę aproksymacji wyznaczonych

konturów odcinkami. Ich końce, wraz z punktem środka masy obszaru dłoni, tworzą zbiór punktów charakterystycznych obrazu dłoni (Rys. 6). Rys. 6 Wyznaczanie punktów charakterystycznych obrazu poprzez aproksymację konturu dłoni odcinkami Generowanie reprezentacji obrazu dłoni Kolejny etap przetwarzania polega na budowaniu grafu na wyznaczonych uprzednio punktach. Graf ten stanowi podstawę do klasyfikacji obrazu dłoni na etapie analizy syntaktycznej. Autor skonstruował algorytm rozpinania grafu na punktach charakterystycznych obrazu dłoni. Sposób doboru krawędzi powoduje odzwierciedlenie budowy anatomicznej dłoni w strukturze rozpinanego grafu (Rys. 7). Rys. 7 Rozpinanie grafu na wyznaczonych punktach charakterystycznych obrazu W trakcie rozwaŝań, na podstawie przedstawionych przykładów, dowiedziono potrzeby rozszerzenia znanego z literatury formalnego modelu opartego na gramatykach grafowych klasy ETPL(k). Koniecznym okazało się rozwarstwienie zbioru etykiet krawędziowych w celu zapewnienia jednoznaczności reprezentacji grafowej obrazu dłoni. W tym celu autor wprowadził definicję 2DEL-IE grafów (Def. 1).

Def. 1 2DEL-IE graf IE grafem o krawędziach z etykietami dwuwymiarowymi, tzw. 2DEL-IE grafem (ang. Two-Dimensionally Edge Labelled IE Graph), reprezentującym strukturę obrazu nazywamy siódemkę: gdzie: H = (V, E, Σ, Γ 1, Γ 2, Γ 3, φ) V jest skończonym, niepustym zbiorem wierzchołków grafu, którym zostały przypisane w sposób jednoznaczny indeksy na bazie obiektów obrazu O, Σ jest skończonym, niepustym zbiorem etykiet wierzchołkowych, Γ 1 jest skończonym, niepustym zbiorem podstawowych etykiet krawędziowych, Γ 2 jest skończonym, niepustym zbiorem pomocniczych etykiet krawędziowych, Γ 3 jest skończonym, niepustym zbiorem nieterminalnych etykiet krawędziowych, E jest zbiorem krawędzi postaci (v, λ 1 λ 2, w), lub (v, λ 3, w), gdzie: λ 1 Γ 1, λ 2 Γ 2, λ 3 Γ 3, v,w V, oraz indeks wierzchołka v jest mniejszy, niŝ indeks wierzchołka w, φ : V Σ jest funkcją etykietowania wierzchołków. Następnie autor zdefiniował dla nich funkcje etykietujące krawędzie i wierzchołki. Wynikiem tego etapu przetwarzania jest reprezentacja obrazu dłoni w formie 2DEL-IE grafu (Rys. 8), która posłuŝy do klasyfikacji tego obrazu w dalszej części przetwarzania. Rys. 8 Reprezentacja obrazu dłoni w formie 2DEL-IE grafu Analiza syntaktyczna reprezentacji obrazu dłoni Etap analizy syntaktycznej zapewnia rozpoznanie układu dłoni na obrazie na podstawie jego reprezentacji grafowej. W wyniku analizy przykładów parsingu stworzonych reprezentacji, autor dowiódł potrzeby dalszej modyfikacji modelu formalnego. Niezbędna okazała się moŝliwość kasowania krawędzi nieterminalnych w trakcie wywodu gramatycznego, na co nie pozwalała formalna definicja gramatyk klasy ETPL(k). Autor zdefiniował zatem nową klasę gramatyk TETPL(k), która umoŝliwia tę operację (Def. 2).

Def. 2 Gramatyka grafowa klasy TETPL(k) Gramatykę PL(k) nazywamy gramatyką grafową klasy TETPL(k) (ang.terminal Edge ETPL(k)), jeśli zachodzi następujący warunek. Dla kaŝdej produkcji postaci: jeśli (b, y), gdzie y jest terminalną etykietą krawędziową, jest potencjalnym kontekstem poprzedzającym dla A, to istnieje dokładnie jeden element (X 1, b, z, in) C l (y, in), i {1,,m}, gdzie C l jest transformacją l-tej produkcji. Jeśli i = 1, to z = y, tzn. (X 1, b, y, in) C l (y, in). Wynikiem modyfikacji definicji uŝywanej gramatyki i formalnego modelu grafowego, konieczne stało się ponowne zdefiniowanie związanych z nimi pojęć. Autor wprowadził równieŝ algorytm parsera języków TETPL(k) w oparciu o ideę parsera dla języków ETPL(k). Następnie dowiódł, Ŝe jego złoŝoność obliczeniowa to O(n 2 ). Eksperymanty Wszystkie przeanalizowane uprzednio zagadnienia znalazły odzwierciedlenie w projekcie systemu rozpoznawania układu dłoni na obrazie. Dodatkowo, autor przeanalizował wpływ sposobu jego implementacji na wydajność przetwarzania. Zaimplementował on system zgodnie ze stworzonym projektem i przeprowadził pomiary jego wydajności, w celu weryfikacji przyjętych rozwiązań. Ich wyniki potwierdziły słuszność wyboru metody przetwarzania wielowątkowego w celu maksymalizacji wydajności systemu. Do dalszych eksperymentów niezbędne było zgromadzenie zbioru obrazów testowych. W celu zapewnienia niezaleŝności poprawności rozpoznania od cech anatomicznych dłoni oraz dokładności wykonania jej układów, zdecydowano o generacji obrazów dłoni metodą renderingu. Autor przygotował modele dłoni dla kaŝdego z układów występujących w Polskim Języku Miganym (Rys. 9). Rys. 9 Przygotowanie modeli dłoni i uzyskanie zbioru obrazów metodą renderingu Następnie, za pomocą serii skryptów, wygenerowano zbiór obrazów referencyjnych oraz lekko zniekształconych. Zniekształcenia te polegały na zmianie proporcji dłoni, dokładności wykonania układu, oraz kąta obserwacji dłoni przez kamerę. Za pomocą skonstruowanego rozwiązania programowego autor przeprowadził serię eksperymentów w celu weryfikacji proponowanej metody.

Podsumowanie Na podstawie wyników uzyskanych podczas opisanych powyŝej badań, moŝna stwierdzić, Ŝe postawiony we wstępie cel badawczy został zrealizowany. Co więcej, potwierdzić moŝna tezę stawianą w niniejszej pracy. Bazując na przebiegu rozwaŝań i wynikach badań przeprowadzonych w niniejszej pracy moŝna sformułować kierunek dalszego rozwoju opisywanej metody. W celu dalszego rozszerzenia jej elastyczności naleŝy wprowadzić mechanizmy analizy syntaktycznej z korekcją błędów dla rozpoznawania obrazów silnie zniekształconych. Publikacje doktoranta 1. Flasiński M., Jurek J., Myśliński S.: Parallel computing scheme for graph grammarbased syntactic pattern recognition, Lecture Notes in Computer Science, Springer, przyjety do druku. 2. Flasiński M., Jurek J., Myśliński S.: Multi-agent system for recognition of hand postures, Lecture Notes in Computer Science, 5545, Springer, pp. 815 824, 2009. 3. Myśliński S.: On the generation of graph representation of hand postures for syntactic pattern recognition. Journal of Applied Computer Science, 17, 2009. 4. Wołczowski A., Myśliński S.: Identifying the relation between finger motion and EMG signals for bioprosthesis control. MMAR06: Proc 12th IEEE int. conf. Methods and Models in Automation and Robotics, pp. 817-822, 2006.