Syntactic Pattern Recognition Anna Kuchna Maciej arnowski
Wprowadzenie Pattern recognition (rozpoznawanie wzorców) jest gałzi sztucznej inteligencji zajmujc si klasyfikacj i opisem obserwowanych obiektów. Celem rozpoznawania wzorców jest klasyfikacja danych, bazujca albo na wczeniejszej wiedzy o nich, albo na statystycznych informacjach uzyskanych z wzorców.
System rozpoznawania wzorców Mechanizm ekstrakcji charakterystycznych cech obserwowanego obiektu (składowe prymitywne) wyznaczajcy ich numeryczn albo symboliczn reprezentacj (feature extraction mechanism) Schemat klasyfikacji i opisu
Róne podejcia do klasyfikacji i opisu rozpoznanych wzorców Statystyczne bazujce na statystycznych charakterystykach wzorca Strukturalne dekompozycja obiektu na składowe pierwotne, analiza relacji zachodzcych pomidzy nimi Syntaktyczne polega na znalezieniu formalnego opisu obserwowanych obiektów
Schemat
Idea Obiekt opisujemy za pomoc słowa, trzeba sprawdzi, czy naley do pewnego jzyka Definiuje si produkcje, gramatyki i rozpoznajce słowa automaty skoczone
Zastosowania rozpoznawanie znaków alfabetu angielskiego i chiskiego (pismo odrczne) rozpoznawanie odcisków palców rozpoznanie mowy analiza trajektorii czstek elementarnych w komorze pcherzykowej (Wilsona), analiza danych biomedycznych (obrazy chromosomów, EEG) rozpoznawanie struktur chemicznych analiza sygnałów sejsmicznych etc.
Przykład zastosowania: rozpoznawanie obrazu Rodzaje podej syntaktycznych: Cigowe kody łacuchowe Freemana jzyk opisu obrazu Drzewowe T drzewa proste (bez etykiet i skierowania) EDT edge-labeled directed tree Grafowe Wykorzystywane raczej do opisu obrazów, mniej do rozpoznawania
Syntaktyczne rozpoznawanie cigów Gramatyka generujca cigi (string grammar): gdzie: N - skoczony zbiór symboli nieterminalnych, Σ - skoczony zbiór symboli terminalnych, P - zbiór produkcji, S N - symbol pocztkowy Notacja: V* - zbiór wszystkich cigów (zda) złoonych z symboli z V
Gramatyki Gramatyki wykorzystywane szczególnie czsto w rozpoznawaniu obrazów: regularne bezkontekstowe
Przykład: rozpoznawanie obrazu
Przykład cd.
Semantyka Czasami dogodnie jest stworzy baz danych zawierajc reguły semantyczne, formułujce pewne warunki narzucane na składowe pierwotne (SP), w tym: reguły dotyczce dopuszczalnych sposobów łczenia SP (np. łczenie tylko na kocach), wielko SP, orientacja SP, ograniczenia na liczb uy danej produkcji w wywodzie (<, >).
Semantyka - przykład Reguły semantyczne uyte niejawnie w wywodzie w poprzednim przykładzie: 1) połczenia tylko w punktach; kierunek a = dwusieczna kata wyznaczonego ramionami ; długo 3cm 2) połczenia tylko w punktach; wielokrotne połczenia s niedozwolone; kierunek b musi by taki sam jak kierunek a; długo b 0.25cm; wolno stosowa co najwyej 10 razy 3) kierunki a i b musza by zgodne; połczenia tylko w punktach;
Gramatyki a automaty Zachodzi wzajemnie jednoznaczna odpowiednio pomidzy gramatykami regularnymi a automatami skoczonymi. Dla kadej gramatyki regularnej G da si zbudowa automat skoczony który akceptuje jedynie słowa z L(G). Automat skoczony: A =(Q, Σ, δ, F, q, d ) gdzie: Q - skoczony niepusty zbiór stanów, Σ - skoczony alfabet wejciowy, δ - mapowanie: Q Σ 2Q q0 - stan pocztkowy, F Q - zbiór stanów kocowych (akceptujcych)
Gramatyki drzewowe,syntaktyczne rozpoznawanie drzew Gramatyki drzewowe s bardzo przydatne w reprezentacji bardziej skomplikowanych wzorców 2-D lub wicej wymiarowych (tj. takich, które składaj si z składników prymitywnych połczonych w kilku miejscach Gramatyka generujca drzewa (tree grammar): G = (N, Σ, P, r, S) gdzie: N - skoczony zbiór symboli nieterminalnych, Σ - skoczony zbiór symboli terminalnych, P - zbiór produkcji; produkcje maj posta: Ti Tj, gdzie Ti i Tj s drzewami, r - funkcja rangujca (ranking function), podajca liczb bezporednich potomków terminala S N - symbol pocztkowy (moe by drzewem)
Syntaktyczne rozpoznawanie drzew Szczególny przypadek, najczciej wykorzystywany w rozpoznawaniu obrazów: drzewowe gramatyki ekspansywne (expansive tree grammars), w których wszystkie produkcje s postaci:
Przykład
Uczenie w podejciach syntaktycznych Jawne wyspecyfikowanie gramatyki przez projektanta systemu jest zazwyczaj nierealne. Podane: moliwo uczenia si (konstruowania) automatów na podstawie przykładowych wzorców (cigów, drzew, etc.). Poniewa zachodzi odpowiednio automatów i gramatyk, problem ten sprowadza si do problemu uczenia si gramatyk z przykładów (tzw. wywodzenie gramatyk, grammatical inference).
Uczenie w podejciach syntaktycznych c.d. Załómy ze wszystkie wzorce nalece do klasy, która chcemy rozpoznawa, generowane s przez nieznana gramatyk G, mamy do dyspozycji skoczony zbiór uczcy (przykładów pozytywnych). R + {a a L(G) } O zbiorze R+ powiemy ze jest strukturalnie kompletny jeeli kada produkcja z G jest wykorzystywana do wygenerowania przynajmniej jednego przykładu uczcego z R+. Cel: synteza skoczonego automatu Af który bdzie akceptował cigi z R+ oraz (by moe) pewne cigi podobne do R+ (indukcja!).
Algorytmy wywodzenia gramatyk ECGI (error-correction grammatical inference) oparty na koncepcji rónic pomidzy łacuchami
Przykład ECGI cd.
Algorytmy wywodzenia gramatyk c.d. MCA (maximal canonical automaton) PTA (prefix tree acceptor) negatywne wzorce pomagaj usuwa nadmierna generalizacje
Algorytmy wywodzenia gramatyk c.d. Algorytmy genetyczne schemat działania: 1. Zakoduj automat jako string 2. Zdefiniuj crossover 3. Zdefiniuj optimum jako automat z najmniejsza liczba stanów, nie akceptujcy przykładów negatywnych 4. Wykonuj algorytm genetyczny do osignicia warunku stopu
Wady i zalety podejcia syntaktycznego Zalety: elegancki formalizm podejcie całociowe
Wady i zalety podejcia syntaktycznego Wady: problemy z uwzgldnianiem zaszumienia danych (obrazów) i danymi brakujcymi, problemy z automatycznym generowaniem gramatyk z przykładów, problemy z aktualizacja gramatyki/automatu gdy pojawiaj si nowe przykłady. złoono obliczeniowa analizy syntaktycznej: NP (dla wikszoci klas gramatyk)
Ciekawe odnoniki Optical Character Recognition: http://www.dsic.upv.es/users/tlcc/papers/fullp apers/sl03.pdf Face Recognition http://www.face-rec.org/interestingpapers/general/zhao00face.pdf