Gramatyka TAG dla języka polskiego
|
|
- Kinga Górska
- 7 lat temu
- Przeglądów:
Transkrypt
1 Gramatyka TAG dla języka polskiego Katarzyna Krasnowska IPI PAN 25 lutego 2013 Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
2 Plan prezentacji 1 TAG 2 Ekstrakcja gramatyki TAG 3 pl-tag i TuLiPA-pl 4 TAG w wykrywaniu błędów Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
3 Tree Adjoining Grammar formalna definicja Gramatyka TAG (Joshi i Schabes, 1997) to 5-krotka Σ, NT, I, A, S : Σ skończony zbiór terminali NT skończony zbiór nieterminali I skończony zbiór drzew początkowych (ang. initial trees) A skończony zbiór drzew pomocniczych (ang. auxiliary trees); I A = S NT symbol początkowy Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
4 Tree Adjoining Grammar Gramatyka słabo kontekstowa Parsowalna wielomianowo (O(n 6 )) Słabo równoważna m.in. formalizmowi CCG (Combinatory Categorial Grammar) Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
5 Operacje na drzewach: podstawienie (substitution) S A A S A A miejsce podstawienia (substitution node/site) (nieterminalny liść) Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
6 Operacje na drzewach: podstawienie (substitution) Przykład: S NP S NP VP N NP VP V Marysia N V biegnie Marysia biegnie Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
7 Operacje na drzewach: dołączenie (adjunction) S B B B S B B B tzw. foot node (nieterminalny liść o etykiecie identycznej z korzeniem drzewa) Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
8 Operacje na drzewach: dołączenie (adjunction) Przykład: S VP S NP VP ADVP VP NP VP N V ADV N ADVP VP Marysia biegnie szybko Marysia ADV V szybko biegnie Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
9 Drzewo wyprowadzenia Dla każdego drzewa elementarnego zaznaczony jest adres Gorna węzła, w którym dokonano podstawienia/dołączenia Drzewo wyprowadzenia dla zdania Marysia szybko biegnie : biegnie Marysia (1) szybko (2) Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
10 LTAG Lexicalised Tree Adjoining Grammar Każde drzewo elementarne posiada co najmniej jeden liść terminal (element leksykalny, ang. anchor) Dopuszczalne są dodatkowe leksemy w liściach (co-anchors) element leksykalny oznaczany jest symbolem. Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
11 Plan prezentacji 1 TAG 2 Ekstrakcja gramatyki TAG 3 pl-tag i TuLiPA-pl 4 TAG w wykrywaniu błędów Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
12 Procedura ekstrakcji (Chen i Vijay-Shanker, 2000): Działanie procedury w węźle η (wynik drzewo elementarne α): Stwórz η kopię η korzeń drzewa α Dla każdego dziecka η nie będącego elementem głównym, zdecyduj, czy jest ono argumentem Dla każdego γ dziecka η, jeśli jest ono... Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
13 Procedura ekstrakcji...nieterminalnym elementem głównym uruchom procedurę rekurencyjnie dla γ i dołącz jej wynik jako dziecko η. γ γ η η γ γ... Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
14 Procedura ekstrakcji...terminalnym elementem głównym dołącz kopię γ jako dziecko η i oznacz jako element leksykalny. η η γ γ... Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
15 Procedura ekstrakcji...argumentem dołącz kopię γ jako dziecko η ; uruchom procedurę dla γ, tworząc nowe drzewo początkowe. γ γ η γ η γ... γ Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
16 Procedura ekstrakcji...nie jest argumentem uruchom procedurę dla γ, tworząc nowe drzewo początkowe, i przekształć je w drzewo pomocnicze. γ γ η η η γ γ η Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
17 Przykład drzewo ze Składnicy Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
18 Przykład zdanie fwe partykuła formaczas formaprzym formarzecz formarzecz nie obudził fps formarzecz Ogłuszający stukot kół formaprzys formaprzym mężczyzny smacznie śpiącego Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
19 Przykład argument zdanie fwe partykuła formaczas formaprzym formarzecz formarzecz nie obudził fps formarzecz Ogłuszający stukot kół formaprzys formaprzym mężczyzny smacznie śpiącego Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
20 Przykład zdanie fwe partykuła formaczas nie obudził fps formarzecz formaprzys formaprzym mężczyzny smacznie śpiącego Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
21 Przykład element główny zdanie fwe partykuła formaczas nie obudził fps formarzecz formaprzys formaprzym mężczyzny smacznie śpiącego Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
22 Przykład zdanie fwe partykuła formaczas nie obudził fps formarzecz formaprzys formaprzym mężczyzny smacznie śpiącego Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
23 Przykład argument zdanie fwe partykuła formaczas nie obudził fps formarzecz formaprzys formaprzym mężczyzny smacznie śpiącego Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
24 Przykład zdanie fwe partykuła formaczas obudził fps formarzecz formaprzys formaprzym mężczyzny smacznie śpiącego Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
25 Przykład element główny zdanie fwe partykuła formaczas obudził fps formarzecz formaprzys formaprzym mężczyzny smacznie śpiącego Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
26 Przykład zdanie fwe partykuła formaczas obudził fps formarzecz formaprzys formaprzym mężczyzny smacznie śpiącego Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
27 Przykład terminal zdanie fwe partykuła formaczas obudził fps formarzecz formaprzys formaprzym mężczyzny smacznie śpiącego Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
28 Przykład zdanie fwe partykuła formaczas obudzić fps formarzecz formaprzys formaprzym mężczyzny smacznie śpiącego Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
29 Przykład argument zdanie fwe partykuła formaczas obudzić fps formarzecz formaprzys formaprzym mężczyzny smacznie śpiącego Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
30 Przykład zdanie fwe partykuła formaczas obudzić Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
31 Przykład fps formarzecz formaprzys formaprzym mężczyzny smacznie śpiącego fps formarzecz formaprzys formaprzym mężczyzna smacznie śpiący Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
32 Plan prezentacji 1 TAG 2 Ekstrakcja gramatyki TAG 3 pl-tag i TuLiPA-pl 4 TAG w wykrywaniu błędów Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
33 TuLiPA Tübingen Linguistic Parsing Architecture (Kallmeyer et al. (2008); Parser m.in. dla gramatyk TAG Korzysta z 3-warstwowego opisu Gramatyka składa się z tzw. rodzin drzew drzewa elementarne bez elementów leksykalnych Leksykon zawiera listę możliwych dopasowań leksemu do rodziny drzew każde takie dopasowanie odpowiada zleksykalizowanemu drzewu elementarnemu Morfoskładnia dla słów z leksykonu Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
34 Fragment gramatyki class ZDANIE_22c declare?n1?n2?n3?n4?n5?n6?v1?v2?v3?v4?v5 { <syn> { node?n1 [cat = ZDANIE, liczba =?V1, rodzaj =?V2, osoba =?V3, czas =?V4] { node?n2 [cat = FF, liczba =?V1, rodzaj =?V2, osoba =?V3, czas =?V4] { node?n3 [cat = FWE, liczba =?V1, rodzaj =?V2, osoba =?V3, czas =?V4] { node?n4 [cat = FORMACZAS, liczba =?V1, rodzaj =?V2, osoba =?V3, czas =?V4] { node?n5 (mark = anchor) [cat = verb, liczba =?V1, rodzaj =?V2, osoba =?V3, czas =?V4] } } } node?n6 (mark = subst, name = substnode1) [cat = FPT, liczba =?V1, przypadek =?V5, rodzaj =?V2] } } } Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
35 Fragment leksykonu *ENTRY: pozostać *CAT: verb *SEM: *ACC: 1 *FAM: ZDANIE_22c *FILTERS: [] *EX: {} *EQUATIONS: substnode1 -> przypadek = mian *COANCHORS: *ENTRY: być *CAT: verb *SEM: *ACC: 1 *FAM: ZDANIE_22c *FILTERS: [] *EX: {} *EQUATIONS: substnode1 -> przypadek = mian *COANCHORS: Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
36 TuLiPA-pl Nieco zmodyfikowana wersja parsera TuLiPA: Wymaga tylko dwóch pierwszych warstw gramatyki Plik z morfoskładnią jest opcjonalny W przypadku jego braku TuLiPA-pl korzysta z Morfeusza. Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
37 pl-tag Gramatyka TAG dla języka polskiego ( Uzyskana z 7229 drzew ze Składnicy 2802 rodziny drzew 1825 początkowych 977 pomocniczych różnych słów w leksykonie drzew elementarnych Średnia liczba drzew leksykalizowanych przez słowo: 2, słów (69%) leksykalizuje tylko jedno drzewo elementarne Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
38 pl-tag ewaluacja wynik zdania % rozbiór % brak rozbioru 128 2% błąd parsera 640 9% za mało pamięci % za mało czasu 44 1% Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
39 pl-tag ewaluacja Porównanie z rozbiorami ze Składnicy: Wybór najlepiej dopasowanego rozbioru TAG: najwięcej pokrywających się kategorii przypisanych frazom Spośród wszystkich fraz w Składnicy: 92% identycznie przypisanych kategorii 98,8% dla niepustych rozbiorów TAG Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
40 pl-tag przykład niedopasowania w rozbiorze Drzewo ze Składnicy: zdanie ff Powstrzymał jej pytania ruchem ręki Rozbiór uzyskany za pomocą gramatyki TAG: zdanie zdanie ff zdanie ruchem??? ręki Powstrzymał jej pytania Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
41 Podsumowanie Prawdopodobnie pierwszy taki eksperyment dla języka polskiego Duża (ale nie 100%) zgodność z bankiem drzew, z którego uzyskano gramatykę Problemy wydajnościowe Trudności np. ze swobodnym szykiem zdań Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
42 Plan prezentacji 1 TAG 2 Ekstrakcja gramatyki TAG 3 pl-tag i TuLiPA-pl 4 TAG w wykrywaniu błędów Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
43 TAG w wykrywaniu błędów (Kulick et al., 2011): Porównanie drzew wyprowadzenia TAG dla identycznych ciągów słów Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
44 Bibliografia Chen, J. i Vijay-Shanker, K. (2000). Automated extraction of Tags from the Penn Treebank. W: Proceedings of IWPT Joshi, A. i Schabes, Y. (1997). Tree-adjoining grammars. W: Handbook of Formal Lanaguages and Automata. Springer-Verlag, Berlin. Kallmeyer, L., Lichte, T., Maier, W., Parmentier, Y., Dellert, J. i Evang, K. (2008). TuLiPA: Towards a multi-formalism parsing environment for grammar engineering. W: Coling 2008: Proceedings of the workshop on Grammar Engineering Across Frameworks, str. 1 8, Manchester, England. Coling 2008 Organizing Committee. Kulick, S., Bies, A. i Mott, J. (2011). Using derivation trees for treebank error detection. W: Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies: short papers - Volume 2, HLT 11, str , Stroudsburg, PA, USA. Association for Computational Linguistics. Katarzyna Krasnowska (IPI PAN) Gramatyka TAG dla języka polskiego 25 lutego / 31
Metody automatycznego wykrywania błędów w bankach drzew
Metody automatycznego wykrywania błędów w bankach drzew Katarzyna Krasnowska IPI PAN 26 listopada 2012 Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 1 / 49 Plan prezentacji
Leksykon gramatyki kategorialnej dla języka polskiego
Leksykon gramatyki kategorialnej dla języka polskiego MIM UW pm262952@students.mimuw.edu.pl 1 października 2012 Cel pracy CCG Celem jest konwersja polskiego banku drzew na format wywodów CCG. Potrzebne
Bank częściowo ujednoznacznionych struktur LFG
Bank częściowo ujednoznacznionych struktur LFG Katarzyna Krasnowska 1 Witold Kieraś 1,2 1 IPI PAN 2 IJP UW 7 października 2013 Katarzyna Krasnowska Witold Kieraś Bank struktur LFG 7 października 2013 1
Składnia. Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (248 / 272)
Składnia Składnia to nauka o związkach wyrazów w zdaniu, szyku wyrazów i roli pełnionej przez wyrazy. Zapis składni powinien w łatwy sposób umożliwiać jej opis i wykorzystanie w automatycznej analizie
Gramatyka operatorowa
Gramatyki z pierwszeństwem operatorów Teoria kompilacji Dr inŝ. Janusz Majewski Katedra Informatyki Gramatyka operatorowa Definicja: G = G BK jest gramatyką operatorową (i) (ii) G jest gramatyką
Maszynowe tłumaczenie Polskiego Języka Migowego
Maszynowe tłumaczenie Polskiego Języka Migowego Projekt WiTKoM Dorota Grądalska VoicePIN.com Sp. z o.o; Akademia Górniczo-Hutnicza, Wydział Informatyki, Elektroniki i Telekomunikacji, Katedra Elektroniki
Uproszczony schemat działania kompilatora
Uproszczony schemat działania kompilatora Wykład7,str.1 program źródłowy ciąg leksemów drzewo wywodu drzewo i tablice symboli analiza leksykalna analiza syntaktyczna analiza semantyczna KOMPILATOR generacja
Parsery LL(1) Teoria kompilacji. Dr inż. Janusz Majewski Katedra Informatyki
Parsery LL() Teoria kompilacji Dr inż. Janusz Majewski Katedra Informatyki Zadanie analizy generacyjnej (zstępującej, top-down) symbol początkowy już terminale wyprowadzenie lewostronne pierwszy od lewej
Matematyczne Podstawy Informatyki
Matematyczne Podstawy Informatyki dr inż. Andrzej Grosser Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Rok akademicki 2013/2014 Gramatyki bezkontekstowe I Gramatyką bezkontekstową
Uproszczony schemat działania kompilatora
Wykład7,13XI2009,str.1 Uproszczony schemat działania kompilatora program źródłowy ciąg leksemów drzewo wywodu drzewo i tablice symboli analiza leksykalna analiza syntaktyczna analiza semantyczna KOMPILATOR
11 Probabilistic Context Free Grammars
11 Probabilistic Context Free Grammars Ludzie piszą i mówią wiele rzeczy, a ich wypowiedzi mają zawsze jakąś określoną strukture i regularność. Celem jest znalezienie i wyizolowanie tego typu struktur.
Języki formalne i automaty Ćwiczenia 2
Języki formalne i automaty Ćwiczenia 2 Autor: Marcin Orchel Spis treści Spis treści... 1 Wstęp teoretyczny... 2 Metoda brute force... 2 Konwersja do postaci normalnej Chomskiego... 5 Algorytm Cocke a-youngera-kasamiego
Metody Kompilacji Wykład 7 Analiza Syntaktyczna
Metody Kompilacji Wykład 7 Analiza Syntaktyczna Parsowanie Parsowanie jest to proces określenia jak ciąg terminali może być generowany przez gramatykę. Włodzimierz Bielecki WI ZUT 2/57 Parsowanie Dla każdej
Metody Kompilacji Wykład 3
Metody Kompilacji Wykład 3 odbywa się poprzez dołączenie zasad(reguł) lub fragmentów kodu do produkcji w gramatyce. Włodzimierz Bielecki WI ZUT 2 Na przykład, dla produkcji expr -> expr 1 + term możemy
JAO - Wprowadzenie do Gramatyk bezkontekstowych
JAO - Wprowadzenie do Gramatyk bezkontekstowych Definicja gramatyki bezkontekstowej Podstawowymi narzędziami abstrakcyjnymi do opisu języków formalnych są gramatyki i automaty. Gramatyka bezkontekstowa
Języki formalne i automaty Ćwiczenia 1
Języki formalne i automaty Ćwiczenia Autor: Marcin Orchel Spis treści Spis treści... Wstęp teoretyczny... 2 Wprowadzenie do teorii języków formalnych... 2 Gramatyki... 5 Rodzaje gramatyk... 7 Zadania...
Generatory analizatorów
Generatory analizatorów Generator analizatora leksykalnego flex ( http://www.gnu.org/software/flex/ ) Generator analizatora składniowego bison ( http://www.gnu.org/software/bison/ ) Idea ogólna Opis atomów
Gramatyki wykorzystywane w analizie języka naturalnego
Gramatyki wykorzystywane w analizie języka naturalnego PCFG=Probabilistic Context-Free Grammars HLPCFG=Head-Lexicalised PCFG HG=Head Grammar HPSG=Head Grammar IG=Indexed Grammar LIG=Linear Indexed Grammar
Gramatyki rekursywne
Gramatyki bezkontekstowe, rozbiór gramatyczny eoria automatów i języków formalnych Dr inŝ. Janusz Majewski Katedra Informatyki Gramatyki rekursywne Niech będzie dana gramatyka bezkontekstowa G =
Metody Kompilacji Wykład 8 Analiza Syntaktyczna cd. Włodzimierz Bielecki WI ZUT
Metody Kompilacji Wykład 8 Analiza Syntaktyczna cd Analiza Syntaktyczna Wstęp Parser dostaje na wejściu ciąg tokenów od analizatora leksykalnego i sprawdza: czy ciąg ten może być generowany przez gramatykę.
2.2. Gramatyki, wyprowadzenia, hierarchia Chomsky'ego
2.2. Gramatyki, wyprowadzenia, hierarchia Chomsky'ego Gramatyka Gramatyką G nazywamy czwórkę uporządkowaną G = gdzie: N zbiór symboli nieterminalnych, T zbiór symboli terminalnych, P zbiór
10. Translacja sterowana składnią i YACC
10. Translacja sterowana składnią i YACC 10.1 Charakterystyka problemu translacja sterowana składnią jest metodą generacji przetworników tekstu języków, których składnię opisano za pomocą gramatyki (bezkontekstowej)
Analiza leksykalna 1. Teoria kompilacji. Dr inż. Janusz Majewski Katedra Informatyki
Analiza leksykalna 1 Teoria kompilacji Dr inż. Janusz Majewski Katedra Informatyki Zadanie analizy leksykalnej Kod źródłowy (ciąg znaków) Analizator leksykalny SKANER Ciąg symboli leksykalnych (tokenów)
Włączenie analizy leksykalnej do analizy składniowej jest nietrudne; po co więc jest wydzielona?
Po co wydziela się analizę leksykalną? Wykład7,str1 Włączenie analizy leksykalnej do analizy składniowej jest nietrudne; po co więc jest wydzielona? 1 Analiza leksykalna jest prostsza niż składniowa leksyka
Analizator syntaktyczny
Analizator syntaktyczny program źródłowy analizator leksykalny token daj nast. token analizator syntaktyczny drzewo rozbioru syntaktycznego analizator semantyczny kod pośredni tablica symboli Analizator
Wprowadzenie do analizy składniowej. Bartosz Bogacki.
Wprowadzenie do analizy składniowej Bartosz Bogacki Bartosz.Bogacki@cs.put.poznan.pl Witam Państwa. Wykład, który za chwilę Państwo wysłuchają dotyczy wprowadzenia do analizy składniowej. Zapraszam serdecznie
Indukcja reguł gramatyki j. polskiego
Indukcja reguł gramatyki języka polskiego dr inż. m.golebski@elka.pw.edu.pl Instytut Informatyki Politechnika Warszawska 25 lutego 2008 Plan prezentacji 1 Aktualny stan wiedzy 2 Wyniki badań D. Magermana
Metody Kompilacji Wykład 1 Wstęp
Metody Kompilacji Wykład 1 Wstęp Literatura: Alfred V. Aho, Ravi Sethi, Jeffrey D. Ullman: Compilers: Princiles, Techniques, and Tools. Addison-Wesley 1986, ISBN 0-201-10088-6 Literatura: Alfred V. Aho,
Definiowanie języka przez wyrażenie regularne(wr)
Wykład3,str1 Definiowanie języka przez wyrażenie regularne(wr) DEFINICJA: (wyrażenia regularne) M(specjalneznakinienależącedoalfabetu:{,},, ) literyalfabetusąwr złożeniawrsąwr: jeśliw 1 iw 2 sąwr,to{w
Obliczenia inspirowane Naturą
Obliczenia inspirowane Naturą Wykład 05 Biologia i gramatyka Jarosław Miszczak IITiS PAN Gliwice 07/04/2016 1 / 40 1 Nieformalne określenie fraktali. 2 Wymiar pudełkowy/fraktalny. 3 Definicja fraktali.
GRAMATYKI BEZKONTEKSTOWE
GRAMATYKI BEZKONTEKSTOWE PODSTAWOWE POJĘCIE GRAMATYK Przez gramatykę rozumie się pewien układ reguł zadający zbiór słów utworzonych z symboli języka. Słowa te mogą być i interpretowane jako obiekty językowe
Języki, automaty i obliczenia
Języki, automaty i obliczenia Wykład 9: Własności języków bezkontekstowych Sławomir Lasota Uniwersytet Warszawski 27 kwietnia 2016 Plan 1 Pompowanie języków bezkontekstowych 2 Własności domknięcia 3 Obrazy
Wstęp do Językoznawstwa
Wstęp do Językoznawstwa Prof. Nicole Nau UAM, IJ, Językoznawstwo Komputerowe Dziesiąte zajęcie 08.12.2015 Składnia: Co bada? Jak bada? Konstrukcja składniowa a) ciąg (zespół) form wyrazowych związanych
Słowem wstępu. Część rodziny języków XSL. Standard: W3C XSLT razem XPath 1.0 XSLT Trwają prace nad XSLT 3.0
Słowem wstępu Część rodziny języków XSL Standard: W3C XSLT 1.0-1999 razem XPath 1.0 XSLT 2.0-2007 Trwają prace nad XSLT 3.0 Problem Zakładane przez XML usunięcie danych dotyczących prezentacji pociąga
Hierarchia Chomsky ego Maszyna Turinga
Hierarchia Chomsky ego Maszyna Turinga Języki formalne i automaty Dr inż. Janusz Majewski Katedra Informatyki Gramatyka Gramatyką G nazywamy czwórkę uporządkowaną gdzie: G = V skończony zbiór
Gramatyki, wyprowadzenia, hierarchia Chomsky ego. Gramatyka
Gramatyki, wyprowadzenia, hierarchia Chomsky ego Teoria automatów i języków formalnych Dr inŝ. Janusz Majewski Katedra Informatyki Gramatyka Gramatyką G nazywamy czwórkę uporządkowaną gdzie: G =
Programowanie obiektowe i C++ dla matematyków
Programowanie obiektowe i C++ dla matematyków Bartosz Szreder szreder (at) mimuw... 22 XI 2011 Uwaga! Ponieważ już sobie powiedzieliśmy np. o wskaźnikach i referencjach, przez które nie chcemy przegrzebywać
Metody Kompilacji Wykład 13
Metody Kompilacji Wykład 13 Prosty Translator Translator dla prostych wyrażeń Schemat translacji sterowanej składnią często służy za specyfikację translatora. Schemat na następnym slajdzie zostanie użyty
Jerzy Nawrocki, Wprowadzenie do informatyki
Jerzy Nawrocki, Jerzy Nawrocki Wydział Informatyki Politechnika Poznańska jerzy.nawrocki@put.poznan.pl Sztuczna inteligencja i język naturalny Test Turinga (1950) A B Komputer Człowiek Gracz Alan Turing
Kompresja danych Streszczenie Studia Dzienne Wykład 10,
1 Kwantyzacja wektorowa Kompresja danych Streszczenie Studia Dzienne Wykład 10, 28.04.2006 Kwantyzacja wektorowa: dane dzielone na bloki (wektory), każdy blok kwantyzowany jako jeden element danych. Ogólny
Model zaszumionego kanału
W X kanal Y W^ koder dekoder p(y x) Oryginalna praca Shannona polegała na poszukiwaniu takiego kodowania, które umożliwiało ustalenie nadmiarowości informacji w taki sposób, żeby na wyjściu można było
Wykład 10. Translacja sterowana składnią
Wykład 10 Translacja sterowana składnią Translacja sterowana składnią Z konstrukcjami języków programowania wiąże się pewną informację przez dołączenie atrybutów do symboli gramatyki reprezentujących te
Programowanie w Logice Gramatyki metamorficzne. Przemysław Kobylański na podstawie [CM2003] i [SS1994]
Programowanie w Logice Gramatyki metamorficzne Przemysław Kobylański na podstawie [CM2003] i [SS1994] Gramatyki bezkontekstowe Gramatyką bezkontekstową jest uporządkowana czwórka G = Σ, N, S, P, gdzie
Zadanie analizy leksykalnej
Analiza leksykalna 1 Teoria kompilacji Dr inŝ. Janusz Majewski Katedra Informatyki Zadanie analizy leksykalnej Przykład: We: COST := ( PRICE + TAX ) * 0.98 Wy: id 1 := ( id 2 + id 3 ) * num 4 Tablica symboli:
Języki, automaty i obliczenia
Języki, automaty i obliczenia Wykład 12: Gramatyki i inne modele równoważne maszynom Turinga. Wstęp do złożoności obliczeniowej Sławomir Lasota Uniwersytet Warszawski 20 maja 2015 Plan 1 Gramatyki 2 Języki
Efektywny parsing języka naturalnego przy użyciu gramatyk probabilistycznych
Uniwersytet im. Adama Mickiewicza Wydział Matematyki i Informatyki Paweł Skórzewski nr albumu: 301654 Efektywny parsing języka naturalnego przy użyciu gramatyk probabilistycznych Praca magisterska na kierunku:
Podstawy Informatyki. Metody dostępu do danych
Podstawy Informatyki c.d. alina.momot@polsl.pl http://zti.polsl.pl/amomot/pi Plan wykładu 1 Bazy danych Struktury danych Średni czas odszukania rekordu Drzewa binarne w pamięci dyskowej 2 Sformułowanie
3.4. Przekształcenia gramatyk bezkontekstowych
3.4. Przekształcenia gramatyk bezkontekstowych Definicje Niech będzie dana gramatyka bezkontekstowa G = G BK Symbol X (N T) nazywamy nieużytecznym w G G BK jeśli nie można w tej gramatyce
Drzewa czerwono-czarne.
Binboy at Sphere http://binboy.sphere.p l Drzewa czerwono-czarne. Autor: Jacek Zacharek Wstęp. Pojęcie drzewa czerwono-czarnego (red-black tree) zapoczątkował Rudolf Bayer w książce z 1972 r. pt. Symmetric
Parsery wykorzystywane w analizie języka naturalnego
Parsery wykorzystywane w analizie języka naturalnego 1. Link Grammar Parser 2. Part of Speech Tagging 3. PCFG's 4. HPCFG's 5. Parser Charniak'a 6. LoPar 7. MiniPar Autorzy: Tomasz Masternak, Adam Łączyński
Podstawy generatora YACC. Bartosz Bogacki.
Podstawy generatora YACC Bartosz Bogacki Bartosz.Bogacki@cs.put.poznan.pl Witam Państwa. Wykład, który za chwilę Państwo wysłuchają dotyczy generatora analizatorów składniowych YACC. Zapraszam serdecznie
JĘZYKIFORMALNE IMETODYKOMPILACJI
Stefan Sokołowski JĘZYKIFORMALNE IMETODYKOMPILACJI Inst. Informatyki Stosowanej, PWSZ Elbląg, 2009/2010 JĘZYKI FORMALNE reguły gry Wykład1,2X2009,str.1 Zasadnicze informacje: http://iis.pwsz.elblag.pl/
Syntactic Pattern Recognition. Anna Kuchna Maciej arnowski
Syntactic Pattern Recognition Anna Kuchna Maciej arnowski Wprowadzenie Pattern recognition (rozpoznawanie wzorców) jest gałzi sztucznej inteligencji zajmujc si klasyfikacj i opisem obserwowanych obiektów.
Automatyczne wspomaganie tworzenia słowników fleksyjnych jednostek wieloczłonowych
Automatyczne wspomaganie tworzenia słowników fleksyjnych jednostek wieloczłonowych IPI PAN 26 stycznia 2015 Przeglad treści Wstęp 1 Wstęp 2 3 4 5 Problem podstawowy Odmiana jednostek wieloczłonowych: (np.:
JĘZYKI FORMALNE I METODY KOMPILACJI
Stefan Sokołowski JĘZYKI FORMALNE I METODY KOMPILACJI Inst Informatyki Stosowanej, PWSZ Elbląg, 2015/2016 JĘZYKI FORMALNE reguły gry Wykład1,str1 Zasadnicze informacje: http://iispwszelblagpl/ stefan/dydaktyka/jezform
Sortowanie - wybrane algorytmy
Sortowanie - wybrane algorytmy Aleksandra Wilkowska Wydział Matematyki - Katedra Matematyki Stosowanej Politechika Wrocławska 2 maja 2018 1 / 39 Plan prezentacji Złożoność obliczeniowa Sortowanie bąbelkowe
Hierarchia Chomsky ego
Hierarchia Chomsky ego Gramatyki nieograniczone Def. Gramatyką nieograniczoną (albo typu 0) nazywamy uporządkowaną czwórkę G= gdzie: % Σ - skończony alfabet symboli końcowych (alfabet, nad którym
Wydobywanie reguł na potrzeby ujednoznaczniania morfo-syntaktycznego oraz płytkiej analizy składniowej tekstów polskich
Wydobywanie reguł na potrzeby ujednoznaczniania morfo-syntaktycznego oraz płytkiej analizy składniowej tekstów polskich Adam Radziszewski Instytut Informatyki Stosowanej PWr SIIS 23, 12 czerwca 2008 O
dr hab. Maciej Witek, prof. US MODELE UMYSŁU rok akademicki 2016/2017, semestr letni
dr hab. Maciej Witek, prof. US http://kognitywistyka.usz.edu.pl/mwitek MODELE UMYSŁU rok akademicki 2016/2017, semestr letni Temat 2: Gramatyki Chomsky'ego jako modele umysłu Narodziny kognitywistyki 1957:
Algorytmy i Struktury Danych
Algorytmy i Struktury Danych Kopce Bożena Woźna-Szcześniak bwozna@gmail.com Jan Długosz University, Poland Wykład 11 Bożena Woźna-Szcześniak (AJD) Algorytmy i Struktury Danych Wykład 11 1 / 69 Plan wykładu
Wizualizacja wyników analizy syntaktycznej
Janusz S. Bień Wizualizacja wyników analizy syntaktycznej Reprezentacja struktur syntaktycznych za pomocą wykresów nazywanych technicznie grafami ma długą tradycję. Najczęściej stosuje się drzewa, czyli
Elementy kognitywistyki II: Sztuczna inteligencja. WYKŁAD IX: Agent przetwarza język naturalny
Elementy kognitywistyki II: Sztuczna inteligencja WYKŁAD IX: Agent przetwarza język naturalny Przetwarzanie języka naturalnego Natural Language Processing, NLP... to formułowanie i testowanie obliczeniowo
8. Drzewa decyzyjne, bagging, boosting i lasy losowe
Algorytmy rozpoznawania obrazów 8. Drzewa decyzyjne, bagging, boosting i lasy losowe dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Drzewa decyzyjne Drzewa decyzyjne (ang. decision trees), zwane
Zaawansowany kurs języka Python
Wykład 5. 30 października 2013 Plan wykładu 1 2 3 4 yield from Zamiast Example for item in iterable: yield item: można pisać Example yield from iterable Plan wykładu 1 2 3 4 Przykłady wyrażeń regularnych
Zastosowanie CP-grafów do generacji siatek
Zastosowanie CP-grafów do generacji siatek 1 Cel zajęć Celem zajęć jest praktyczne zaznajomienie się z pojęciem CP-grafu i gramatyk grafowych, przy pomocy których można je tworzyć i nimi manipulować. Jako
Komputerowa weryfikacja gramatyki Świdzińskiego
Marcin Woliński Komputerowa weryfikacja gramatyki Świdzińskiego 12 maja 2005 j INSTYTUT PODSTAW INFORMATYKI POLSKIEJ AKADEMII NAUK ul. J. K. Ordona 21, 01-237 Warszawa Automatyczna analiza składniowa Niniejsza
Klasyczne i kwantowe podejście do teorii automatów i języków formalnych p.1/33
Klasyczne i kwantowe podejście do teorii automatów i języków formalnych mgr inż. Olga Siedlecka olga.siedlecka@icis.pcz.pl Zakład Informatyki Stosowanej i Inżynierii Oprogramowania Instytut Informatyki
JIP. Analiza składni, gramatyki
JIP Analiza składni, gramatyki Książka o różnych językach i paradygmatach 2 Polecam jako obowiązkową lekturę do przeczytania dla wszystkich prawdziwych programistów! Podsumowanie wykładu 2 3 Analiza leksykalna
JAO - lematy o pompowaniu dla jezykow bezkontekstowy
JAO - lematy o pompowaniu dla jezykow bezkontekstowych Postać normalna Chomsky ego Gramatyka G ze zbiorem nieterminali N i zbiorem terminali T jest w postaci normalnej Chomsky ego wtw gdy każda produkcja
Analiza metodą zstępującą. Bartosz Bogacki.
Analiza metodą zstępującą Bartosz Bogacki Bartosz.Bogacki@cs.put.poznan.pl Witam Państwa. Wykład, który za chwilę Państwo wysłuchają dotyczy analizy metodą zstępującą. Zapraszam serdecznie do wysłuchania.
Analiza znaczeniowa sterowana składnią
S e ISA(e, Czytanie) Czytający(e, Ola) Czytany(e, Książka) NP VP N.Ola V.czyta NP N.książkę W jaki sposób przenieść znaczenie pojedynczych słów ze słownika w odpowiednie miejsca w reprezentacji zdania?
Algorytmy stochastyczne, wykład 05 Systemy Liendenmayera, modelowanie roślin
Algorytmy stochastyczne, wykład 5, modelowanie roślin Jarosław Piersa Wydział Matematyki i Informatyki, Uniwersytet Mikołaja Kopernika 214-3-2 1 2 3 ze stosem Przypomnienie gramatyka to system (Σ, A, s,
Metodologie programowania
Co kształtuje języki programowania? Wykład2,str.1 Metodologie programowania Koszty obliczeń: 1980 1960:sprzętdrogi,a wysiłek programistów niewielki 1970: sprzęt coraz tańszy, a programowane problemy coraz
Ekstrakcja informacji o zdarzeniach z tekstów dziedzinowych
Ekstrakcja informacji o zdarzeniach z tekstów dziedzinowych mgr inż. Michał Marcińczuk opiekun naukowy prof. Zbigniew Huzar Instytut Informatyki Stosowanej Politechnika Wrocławska 17 czerwca 2008 Plan
Plan wykładu. Kompilatory. Literatura. Translatory. Literatura Translatory. Paweł J. Matuszyk
Plan wykładu (1) Paweł J. Matuszyk AGH Kraków 1 2 tor leksykalny tor syntaktyczny Generator pośredniego Generator wynikowego Hopcroft J. E., Ullman J. D., Wprowadzenie do teorii automatów, języków i obliczeń,
Przegląd metod error recovery (dla parsingu top-down, przykłady)
Referat z przedmiotu Teoria Kompilacji Przegląd metod error recovery (dla parsingu top-down, przykłady) Skąd biorą się błędy? Proces obsługi błędów zajmuje się defektami powstającymi z powodu błędów w
Wprowadzenie do programowania języki i gramatyki formalne. dr hab. inż. Mikołaj Morzy
Wprowadzenie do programowania języki i gramatyki formalne dr hab. inż. Mikołaj Morzy plan wykładu wprowadzenie gramatyki podstawowe definicje produkcje i drzewa wywodu niejednoznaczność gramatyk hierarchia
Tworzenie języków specyfikacji dla zagadnień numerycznych
Tworzenie języków specyfikacji dla zagadnień numerycznych prof. dr hab. inż. Norbert Sczygiol dr inż. Andrzej Grosser Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska 11 września
MAGICIAN. czyli General Game Playing w praktyce. General Game Playing
MAGICIAN czyli General Game Playing w praktyce General Game Playing 1 General Game Playing? Cel: stworzenie systemu umiejącego grać/nauczyć się grać we wszystkie gry Turniej w ramach AAAI National Conference
Języki formalne i automaty Ćwiczenia 8
Języki formalne i automaty Ćwiczenia 8 Autor: Marcin Orchel Spis treści Spis treści... 1 Wstęp teoretyczny... 2 Konwersja NFA do DFA... 2 Minimalizacja liczby stanów DFA... 4 Konwersja automatu DFA do
Gramatyki atrybutywne
Gramatyki atrybutywne, część 1 (gramatyki S-atrybutywne Teoria kompilacji Dr inŝ. Janusz Majewski Katedra Informatyki Gramatyki atrybutywne Do przeprowadzenia poprawnego tłumaczenia, oprócz informacji
Języki i gramatyki formalne
Języki i gramatyki formalne Języki naturalne i formalne Cechy języka naturalnego - duża swoboda konstruowania zdań (brak ścisłych reguł gramatycznych), duża ilość wyjątków. Języki formalne - ścisły i jednoznaczny
Modelowanie motywów łańcuchami Markowa wyższego rzędu
Modelowanie motywów łańcuchami Markowa wyższego rzędu Uniwersytet Warszawski Wydział Matematyki, Informatyki i Mechaniki 23 października 2008 roku Plan prezentacji 1 Źródła 2 Motywy i ich znaczenie Łańcuchy
Testowanie hipotez statystycznych
9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :
Sofiia Lahoda *, Marek Miłosz. Politechnika Lubelska, Instytut Informatyki, Nadbystrzycka 36B, Lublin, Polska
JCSI 8 (2018) 230-234 Wysłane: 2017-12-12 Przyjęte: 2017-12-19 System monitoringu użytkownika wykorzystujący sieci społecznościowe budowa i analiza możliwości Sofiia Lahoda *, Marek Miłosz Politechnika
Definicja pliku kratowego
Pliki kratowe Definicja pliku kratowego Plik kratowy (ang grid file) jest strukturą wspierająca realizację zapytań wielowymiarowych Uporządkowanie rekordów, zawierających dane wielowymiarowe w pliku kratowym,
Analiza semantyczna. Gramatyka atrybutywna
Analiza semantyczna Do przeprowadzenia poprawnego tłumaczenia, oprócz informacji na temat składni języka podlegającego tłumaczeniu, translator musi posiadać możliwość korzystania z wielu innych informacji
Języki formalne i automaty Ćwiczenia 7
Języki formalne i automaty Ćwiczenia 7 Autor: Marcin Orchel Spis treści Spis treści... 1 Wstęp teoretyczny... 2 Automaty... 2 Cechy automatów... 4 Łączenie automatów... 4 Konwersja automatu do wyrażenia
Rozpoznawanie obrazów dłoni za pomocą gramatyk klasy ETPL(k) w systemach wizyjnych analizy języka migowego.
Rozpoznawanie obrazów dłoni za pomocą gramatyk klasy ETPL(k) w systemach wizyjnych analizy języka migowego. Autor: Afiliacja: Promotor pracy: Recenzenci: mgr inŝ. Szymon Myśliński Katedra Systemów Informatycznych
< K (2) = ( Adams, John ), P (2) = adres bloku 2 > < K (1) = ( Aaron, Ed ), P (1) = adres bloku 1 >
Typy indeksów Indeks jest zakładany na atrybucie relacji atrybucie indeksowym (ang. indexing field). Indeks zawiera wartości atrybutu indeksowego wraz ze wskaźnikami do wszystkich bloków dyskowych zawierających
Automat ze stosem. Języki formalne i automaty. Dr inż. Janusz Majewski Katedra Informatyki
Automat ze stosem Języki formalne i automaty Dr inż. Janusz Majewski Katedra Informatyki Automat ze stosem (1) dno stosu Stos wierzchołek stosu Wejście # B B A B A B A B a b b a b a b $ q i Automat ze
Minimalne drzewa rozpinające
KNM UŚ 26-28 listopada 2010 Ostrzeżenie Wprowadzenie Motywacja Definicje Niektóre pojęcia pojawiające się podczas tego referatu są naszymi autorskimi tłumaczeniami z języka angielskiego. Nie udało nam
Algebrą nazywamy strukturę A = (A, {F i : i I }), gdzie A jest zbiorem zwanym uniwersum algebry, zaś F i : A F i
Algebrą nazywamy strukturę A = (A, {F i : i I }), gdzie A jest zbiorem zwanym uniwersum algebry, zaś F i : A F i A (symbol F i oznacza ilość argumentów funkcji F i ). W rozważanych przez nas algebrach
Podstawy programowania 2. Temat: Drzewa binarne. Przygotował: mgr inż. Tomasz Michno
Instrukcja laboratoryjna 5 Podstawy programowania 2 Temat: Drzewa binarne Przygotował: mgr inż. Tomasz Michno 1 Wstęp teoretyczny Drzewa są jedną z częściej wykorzystywanych struktur danych. Reprezentują
0.1 Lewostronna rekurencja
0.1 Lewostronna rekurencja Sprawdź czy poniższa gramatyka E jest zgodna z LL(1), tzn. czy umożliwia przeprowadzenie analizy bez powrotu z wyprzedzeniem o jeden symbol. Wyjaśnienie pojęcia LL(1): Pierwsze
Wstęp do programowania. Drzewa podstawowe techniki. Piotr Chrząstowski-Wachtel
Wstęp do programowania Drzewa podstawowe techniki Piotr Chrząstowski-Wachtel Drzewa wyszukiwań Drzewa często służą do przechowywania informacji. Jeśli uda sie nam stworzyć drzewo o niewielkiej wysokości
Maszyna Turinga języki
Maszyna Turinga języki Teoria automatów i języków formalnych Dr inż. Janusz Majewski Katedra Informatyki Maszyna Turinga (1) b b b A B C B D A B C b b Q Zależnie od symbolu obserwowanego przez głowicę
ALGORYTMY I STRUKTURY DANYCH
LGORTM I STRUKTUR DNH Temat 6: Drzewa ST, VL Wykładowca: dr inż. bigniew TRPT e-mail: bigniew.tarapata@isi.wat.edu.pl http://www.tarapata.strefa.pl/p_algorytmy_i_struktury_danych/ Współautorami wykładu
Języki formalne i automaty Ćwiczenia 4
Języki formalne i automaty Ćwiczenia 4 Autor: Marcin Orchel Spis treści Spis treści... 1 Wstęp teoretyczny... 2 Sposób tworzenia deterministycznego automatu skończonego... 4 Intuicyjne rozumienie konstrukcji
Porównywanie tagerów dopuszczajacych niejednoznaczności
Porównywanie tagerów dopuszczajacych niejednoznaczności (na przykładzie tagerów wykorzystanych w Korpusie IPI PAN) 3 listopad 2008 Plan prezentacji 1 Wprowadzenie Problem niejednoznaczności Poprawna interpretacja