Syntactic Pattern Recognition. Anna Kuchna Maciej arnowski

Podobne dokumenty
Gramatyki regularne i automaty skoczone

WYKŁAD 4 PLAN WYKŁADU. Sieci neuronowe: Algorytmy uczenia & Dalsze zastosowania. Metody uczenia sieci: Zastosowania

Gramatyki, wyprowadzenia, hierarchia Chomsky ego. Gramatyka

JAO - Wprowadzenie do Gramatyk bezkontekstowych

Maszyny Turinga i problemy nierozstrzygalne. Maszyny Turinga i problemy nierozstrzygalne

AUTOMATYKA INFORMATYKA

Hierarchia Chomsky ego Maszyna Turinga

Języki formalne i automaty Ćwiczenia 1

JAO - J zyki, Automaty i Obliczenia - Wykªad 1. JAO - J zyki, Automaty i Obliczenia - Wykªad 1

Wprowadzenie do kompilatorów

2.2. Gramatyki, wyprowadzenia, hierarchia Chomsky'ego

Podstawy Informatyki Gramatyki formalne

Inteligentne wydobywanie informacji z internetowych serwisów społecznościowych

Równowano modeli oblicze

Zadanie 1. Czy prawdziwa jest następująca implikacja? Jeśli L A jest językiem regularnym, to regularnym językiem jest też. A = (A, Q, q I, F, δ)

Zadanie analizy leksykalnej

Programowanie Obiektowe

Języki, automaty i obliczenia

Analiza leksykalna 1. Teoria kompilacji. Dr inż. Janusz Majewski Katedra Informatyki

Teoretyczne Podstawy Informatyki

Planowanie adresacji IP dla przedsibiorstwa.

Obliczenia inspirowane Naturą

Elementy kognitywistyki II: Sztuczna inteligencja. WYKŁAD IX: Agent przetwarza język naturalny

Generatory analizatorów

Model syntaktycznego rozpoznawania wzorców znieksztaªconych oparty na gramatykach ci gowych klasy DPLL(k)

Pattern Classification

11 Probabilistic Context Free Grammars

Bazy danych. Plan wykładu. Podzapytania - wskazówki. Podzapytania po FROM. Wykład 5: Zalenoci wielowartociowe. Sprowadzanie do postaci normalnych.

Temat: Programowanie zdarzeniowe. Zdarzenia: delegacje, wykorzystywanie zdarze. Elementy Windows Application (WPF Windows Presentation Foundation).

GRAMATYKI BEZKONTEKSTOWE

1) Grafy eulerowskie własnoci algorytmy. 2) Problem chiskiego listonosza

Gramatyki grafowe. Dla v V, ϕ(v) etykieta v. Klasa grafów nad Σ - G Σ.

Analiza semantyczna. Gramatyka atrybutywna

Bazy danych. Plan wykładu. Podstawy modeli relacyjnych. Diagramy ER. Wykład 3: Relacyjny model danych. SQL

Wprowadzenie: języki, symbole, alfabety, łańcuchy Języki formalne i automaty. Literatura

Bazy danych. Plan wykładu. Proces modelowania i implementacji bazy danych. Elementy ERD. Wykład 2: Diagramy zwizków encji (ERD)

KATEDRA INFORMATYKI TECHNICZNEJ. Ćwiczenia laboratoryjne z Logiki Układów Cyfrowych. ćwiczenie 204

Bazy danych. Plan wykładu. Proces modelowania i implementacji bazy danych. Elementy ERD. Wykład 2: Diagramy zwizków encji (ERD)

Temat: Problem minimalnego drzewa Steinera. Definicja problemu. Zastosowania. Algorytm dokładny Hakimi. Algorytmy aproksymacyjne.

Matematyczne Podstawy Informatyki

Plan wykładu. Kompilatory. Literatura. Translatory. Literatura Translatory. Paweł J. Matuszyk

Gramatyka operatorowa

Języki formalne i automaty Ćwiczenia 9

Gramatyki (1-2) Definiowanie języków programowania. Piotr Chrząstowski-Wachjtel

Jaki język zrozumie automat?

Bazy danych Podstawy teoretyczne

Uproszczony schemat działania kompilatora

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

MODELOWANIE I PROGRAMOWANIE PRACY

Wprowadzenie i pojęcia wstępne.

Automat ze stosem. Języki formalne i automaty. Dr inż. Janusz Majewski Katedra Informatyki

.! $ Stos jest list z trzema operacjami: dodawanie elementów na wierzch stosu, zdejmowanie elementu z wierzchu stosu, sprawdzanie czy stos jest pusty.

Bazy danych. Plan wykładu. Przetwarzanie zapyta. Etapy przetwarzania zapytania. Wykład 12: Optymalizacja zapyta. Etapy przetwarzanie zapytania

Języki i gramatyki formalne

Algorytmy genetyczne w automatycznym generowaniu gramatyk bezkontekstowych dla potrzeb syntaktycznej interpretacji wzorców

Języki programowania zasady ich tworzenia

Matematyczne Podstawy Informatyki

Języki formalne i automaty Ćwiczenia 4

JĘZYKI FORMALNE I METODY KOMPILACJI

Rozpoznawanie obrazów dłoni za pomocą gramatyk klasy ETPL(k) w systemach wizyjnych analizy języka migowego.

3.4. Przekształcenia gramatyk bezkontekstowych

Temat: Struktury danych do reprezentacji grafów. Wybrane algorytmy grafowe.

Obliczenia inspirowane Naturą

Temat: Liniowe uporzdkowane struktury danych: stos, kolejka. Specyfikacja, przykładowe implementacje i zastosowania. Struktura słownika.

Parsery LL(1) Teoria kompilacji. Dr inż. Janusz Majewski Katedra Informatyki

Analiza skupień. Analiza Skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania

Definicja 2. Twierdzenie 1. Definicja 3

Gramatyki atrybutywne

Języki formalne i automaty Ćwiczenia 7

Tworzenie bazy danych Biblioteka tworzenie tabel i powiza, manipulowanie danymi. Zadania do wykonani przed przystpieniem do pracy:

Języki formalne i automaty Ćwiczenia 3

Obliczenia inspirowane Naturą

Metody Kompilacji Wykład 3

Optymalizacja oprogramowania - wprowadzenie

Analizator syntaktyczny

Program We Kompilator Wy Źródłowy

SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska

Gramatyki rekursywne

Modele Obliczeń. Wykład 1 - Wprowadzenie. Marcin Szczuka. Instytut Matematyki, Uniwersytet Warszawski

Maszyna Turinga języki

Uproszczony schemat działania kompilatora

Języki formalne i automaty Ćwiczenia 6

Programowanie w Logice Gramatyki metamorficzne. Przemysław Kobylański na podstawie [CM2003] i [SS1994]

Projektowanie algorytmów rekurencyjnych

Zaawansowane algorytmy i struktury danych

Projekt okablowania strukturalnego dla I semestru Akademii CISCO we WSIZ Copernicus we Wrocławiu

1. Maszyna Turinga, gramatyki formalne i ONP

Opis wzorców polegający na na wykorzystaniu modelu definicji rekurencyjnych, nazywamy gramatyką bezkontekstową (ang. contex-free grammar).

Analiza danych tekstowych i języka naturalnego

Z punktu widzenia kognitywisty: język naturalny

Projektowanie systemów informatycznych. Roman Simiński siminskionline.pl. Modelowanie danych Diagramy ERD

1 Automaty niedeterministyczne

Opisy efektów kształcenia dla modułu

Języki, automaty i obliczenia

Systemy Agentowe główne cechy. Mariusz.Matuszek WETI PG

Wektor o pocztku i kocu odpowiednio w punktach. Prosta zawierajca punkty p i q: pq Półprosta zaczynajca si w punkcie p i zawierajca punkt q:.

JIP. Analiza składni, gramatyki

SZTUCZNA INTELIGENCJA

Wykład5,str.1. Maszyny ze stosem ... 1,0 λ r. λ,z λ

Metoda tabel semantycznych. Dedukcja drogi Watsonie, dedukcja... Definicja logicznej konsekwencji. Logika obliczeniowa.

Transkrypt:

Syntactic Pattern Recognition Anna Kuchna Maciej arnowski

Wprowadzenie Pattern recognition (rozpoznawanie wzorców) jest gałzi sztucznej inteligencji zajmujc si klasyfikacj i opisem obserwowanych obiektów. Celem rozpoznawania wzorców jest klasyfikacja danych, bazujca albo na wczeniejszej wiedzy o nich, albo na statystycznych informacjach uzyskanych z wzorców.

System rozpoznawania wzorców Mechanizm ekstrakcji charakterystycznych cech obserwowanego obiektu (składowe prymitywne) wyznaczajcy ich numeryczn albo symboliczn reprezentacj (feature extraction mechanism) Schemat klasyfikacji i opisu

Róne podejcia do klasyfikacji i opisu rozpoznanych wzorców Statystyczne bazujce na statystycznych charakterystykach wzorca Strukturalne dekompozycja obiektu na składowe pierwotne, analiza relacji zachodzcych pomidzy nimi Syntaktyczne polega na znalezieniu formalnego opisu obserwowanych obiektów

Schemat

Idea Obiekt opisujemy za pomoc słowa, trzeba sprawdzi, czy naley do pewnego jzyka Definiuje si produkcje, gramatyki i rozpoznajce słowa automaty skoczone

Zastosowania rozpoznawanie znaków alfabetu angielskiego i chiskiego (pismo odrczne) rozpoznawanie odcisków palców rozpoznanie mowy analiza trajektorii czstek elementarnych w komorze pcherzykowej (Wilsona), analiza danych biomedycznych (obrazy chromosomów, EEG) rozpoznawanie struktur chemicznych analiza sygnałów sejsmicznych etc.

Przykład zastosowania: rozpoznawanie obrazu Rodzaje podej syntaktycznych: Cigowe kody łacuchowe Freemana jzyk opisu obrazu Drzewowe T drzewa proste (bez etykiet i skierowania) EDT edge-labeled directed tree Grafowe Wykorzystywane raczej do opisu obrazów, mniej do rozpoznawania

Syntaktyczne rozpoznawanie cigów Gramatyka generujca cigi (string grammar): gdzie: N - skoczony zbiór symboli nieterminalnych, Σ - skoczony zbiór symboli terminalnych, P - zbiór produkcji, S N - symbol pocztkowy Notacja: V* - zbiór wszystkich cigów (zda) złoonych z symboli z V

Gramatyki Gramatyki wykorzystywane szczególnie czsto w rozpoznawaniu obrazów: regularne bezkontekstowe

Przykład: rozpoznawanie obrazu

Przykład cd.

Semantyka Czasami dogodnie jest stworzy baz danych zawierajc reguły semantyczne, formułujce pewne warunki narzucane na składowe pierwotne (SP), w tym: reguły dotyczce dopuszczalnych sposobów łczenia SP (np. łczenie tylko na kocach), wielko SP, orientacja SP, ograniczenia na liczb uy danej produkcji w wywodzie (<, >).

Semantyka - przykład Reguły semantyczne uyte niejawnie w wywodzie w poprzednim przykładzie: 1) połczenia tylko w punktach; kierunek a = dwusieczna kata wyznaczonego ramionami ; długo 3cm 2) połczenia tylko w punktach; wielokrotne połczenia s niedozwolone; kierunek b musi by taki sam jak kierunek a; długo b 0.25cm; wolno stosowa co najwyej 10 razy 3) kierunki a i b musza by zgodne; połczenia tylko w punktach;

Gramatyki a automaty Zachodzi wzajemnie jednoznaczna odpowiednio pomidzy gramatykami regularnymi a automatami skoczonymi. Dla kadej gramatyki regularnej G da si zbudowa automat skoczony który akceptuje jedynie słowa z L(G). Automat skoczony: A =(Q, Σ, δ, F, q, d ) gdzie: Q - skoczony niepusty zbiór stanów, Σ - skoczony alfabet wejciowy, δ - mapowanie: Q Σ 2Q q0 - stan pocztkowy, F Q - zbiór stanów kocowych (akceptujcych)

Gramatyki drzewowe,syntaktyczne rozpoznawanie drzew Gramatyki drzewowe s bardzo przydatne w reprezentacji bardziej skomplikowanych wzorców 2-D lub wicej wymiarowych (tj. takich, które składaj si z składników prymitywnych połczonych w kilku miejscach Gramatyka generujca drzewa (tree grammar): G = (N, Σ, P, r, S) gdzie: N - skoczony zbiór symboli nieterminalnych, Σ - skoczony zbiór symboli terminalnych, P - zbiór produkcji; produkcje maj posta: Ti Tj, gdzie Ti i Tj s drzewami, r - funkcja rangujca (ranking function), podajca liczb bezporednich potomków terminala S N - symbol pocztkowy (moe by drzewem)

Syntaktyczne rozpoznawanie drzew Szczególny przypadek, najczciej wykorzystywany w rozpoznawaniu obrazów: drzewowe gramatyki ekspansywne (expansive tree grammars), w których wszystkie produkcje s postaci:

Przykład

Uczenie w podejciach syntaktycznych Jawne wyspecyfikowanie gramatyki przez projektanta systemu jest zazwyczaj nierealne. Podane: moliwo uczenia si (konstruowania) automatów na podstawie przykładowych wzorców (cigów, drzew, etc.). Poniewa zachodzi odpowiednio automatów i gramatyk, problem ten sprowadza si do problemu uczenia si gramatyk z przykładów (tzw. wywodzenie gramatyk, grammatical inference).

Uczenie w podejciach syntaktycznych c.d. Załómy ze wszystkie wzorce nalece do klasy, która chcemy rozpoznawa, generowane s przez nieznana gramatyk G, mamy do dyspozycji skoczony zbiór uczcy (przykładów pozytywnych). R + {a a L(G) } O zbiorze R+ powiemy ze jest strukturalnie kompletny jeeli kada produkcja z G jest wykorzystywana do wygenerowania przynajmniej jednego przykładu uczcego z R+. Cel: synteza skoczonego automatu Af który bdzie akceptował cigi z R+ oraz (by moe) pewne cigi podobne do R+ (indukcja!).

Algorytmy wywodzenia gramatyk ECGI (error-correction grammatical inference) oparty na koncepcji rónic pomidzy łacuchami

Przykład ECGI cd.

Algorytmy wywodzenia gramatyk c.d. MCA (maximal canonical automaton) PTA (prefix tree acceptor) negatywne wzorce pomagaj usuwa nadmierna generalizacje

Algorytmy wywodzenia gramatyk c.d. Algorytmy genetyczne schemat działania: 1. Zakoduj automat jako string 2. Zdefiniuj crossover 3. Zdefiniuj optimum jako automat z najmniejsza liczba stanów, nie akceptujcy przykładów negatywnych 4. Wykonuj algorytm genetyczny do osignicia warunku stopu

Wady i zalety podejcia syntaktycznego Zalety: elegancki formalizm podejcie całociowe

Wady i zalety podejcia syntaktycznego Wady: problemy z uwzgldnianiem zaszumienia danych (obrazów) i danymi brakujcymi, problemy z automatycznym generowaniem gramatyk z przykładów, problemy z aktualizacja gramatyki/automatu gdy pojawiaj si nowe przykłady. złoono obliczeniowa analizy syntaktycznej: NP (dla wikszoci klas gramatyk)

Ciekawe odnoniki Optical Character Recognition: http://www.dsic.upv.es/users/tlcc/papers/fullp apers/sl03.pdf Face Recognition http://www.face-rec.org/interestingpapers/general/zhao00face.pdf