Gramatické formalismy pro ZPJ

Podobne dokumenty
Definice Řekneme, že PDA M = (Q,Σ,Γ,δ,q 0,Z 0,F) je. 1. pro všechna q Q a Z Γ platí: kdykoliv δ(q,ε,z), pak δ(q,a,z) = pro všechna a Σ;

1 Soustava lineárních rovnic

Linea rnı (ne)za vislost

Aproximace funkcí 1,00 0,841 1,10 0,864 1,20 0,885. Body proložíme lomenou čarou.

Kristýna Kuncová. Matematika B3

5. a 12. prosince 2018

Kristýna Kuncová. Matematika B2 18/19

MATEMATIKA 3. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

(1) Derivace. Kristýna Kuncová. Matematika B2 17/18. Kristýna Kuncová (1) Derivace 1 / 35

Edita Pelantová, katedra matematiky / 16

Logika V. RNDr. Kateřina Trlifajová PhD. Katedra teoretické informatiky Fakulta informačních technologíı BI-MLO, ZS 2011/12

Komplexní analýza. Martin Bohata. Katedra matematiky FEL ČVUT v Praze Martin Bohata Komplexní analýza Mocninné řady 1 / 18

Numerické metody minimalizace

IB047. Pavel Rychlý. 21. února

Numerické metody 8. května FJFI ČVUT v Praze

Internet a zdroje. (Zdroje na Internetu) Mgr. Petr Jakubec. Katedra fyzikální chemie Univerzita Palackého v Olomouci Tř. 17.

Úvodní informace. 18. února 2019

Składnia. Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (248 / 272)

Katedra aplikované matematiky FEI VŠB Technická univerzita Ostrava

Automatové modely. Stefan Ratschan. Fakulta informačních technologíı. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Kapitola 4: Soustavy diferenciálních rovnic 1. řádu

Inverzní Z-transformace

Funkce zadané implicitně. 4. března 2019

Stavový popis Stabilita spojitých systémů (K611MSAP) Katedra aplikované matematiky Fakulta dopravní ČVUT. čtvrtek 20. dubna 2006

Matematika 2, vzorová písemka 1

Obsah: Komunikace Gramatiky. PA026 Projekt z umělé inteligence.

Přirozený jazyk prostředek komunikace

Expresivní deskripční logiky

Formálne jazyky Automaty. Formálne jazyky. 1 Automaty. IB110 Podzim

podle přednášky doc. Eduarda Fuchse 16. prosince 2010

(13) Fourierovy řady

Geometrická nelinearita: úvod

Kristýna Kuncová. Matematika B2

Co nám prozradí derivace? 21. listopadu 2018

Obsah: Komunikace Gramatiky. PA026 Projekt z umělé inteligence.

Obsah Atributová tabulka Atributové dotazy. GIS1-2. cvičení. ČVUT v Praze, Fakulta stavební, katedra mapování a kartografie

Rovnice proudění Slapový model

ggplot2 Efektní vizualizace dat v prostředí jazyka R Martin Golasowski 8. prosince 2016

Necht je funkce f spojitá v intervalu a, b a má derivaci v (a, b). Pak existuje bod ξ (a, b) tak, že f(b) f(a) b a. Geometricky

Katedra kybernetiky skupina Inteligentní Datové Analýzy (IDA) Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Matematika (KMI/PMATE)

Matematika III Stechiometrie stručný

kontaktní modely (Winklerův, Pasternakův)

Anna Kratochvílová Anna Kratochvílová (FJFI ČVUT) PDR ve zpracování obrazu / 17

Komplexní analýza. Martin Bohata. Katedra matematiky FEL ČVUT v Praze Martin Bohata Komplexní analýza Úvod 1 / 32

TGH01 - Algoritmizace

PA152,Implementace databázových systémů 2 / 25

Obsah: CLP Constraint Logic Programming. Úvod do umělé inteligence 6/12 1 / 17

Matematická analýza II pro kombinované studium. Konzultace první a druhá. RNDr. Libuše Samková, Ph.D. pf.jcu.cz

Laplaceova transformace

Matematika 1 Jiˇr ı Fiˇser 24. z aˇr ı 2013 Jiˇr ı Fiˇser (KMA, PˇrF UP Olomouc) KMA MAT1 24. z aˇr ı / 52

GEM a soustavy lineárních rovnic, část 2

ČVUT FEL, K Radek Mařík Strukturované testování 20. října / 52

Powyższe reguły to tylko jedna z wersji gry. Istnieje wiele innych wariantów, można też ustalać własne zasady. Miłej zabawy!

Euklidovský prostor. Funkce dvou proměnných: základní pojmy, limita a spojitost.

Gramatyka TAG dla języka polskiego

Petr Křemen FEL ČVUT. Petr Křemen (FEL ČVUT) Vysvětlování modelovacích chyb 133 / 156

Cauchyova úloha pro obyčejnou diferenciální rovnici

Univerzita Karlova v Praze Matematicko-fyzikální fakulta

Výzvy, které před matematiku staví

j INSTYTUT PODSTAW INFORMATYKI

Operace s funkcemi [MA1-18:P2.1] funkční hodnota... y = f(x) (x argument)

DFT. verze:

Základní elektrotechnická terminologie,

Diferenciální rovnice základní pojmy. Rovnice se

Katedra aplikované matematiky FEI VŠB Technická univerzita Ostrava

(A B) ij = k. (A) ik (B) jk.

Petr Krajča. Katedra informatiky Univerzita Palackého v Olomouci. Petr Krajča (UP) KMI/YDATA: Přednáška I. 5. říjen, / 37

Určitý (Riemannův) integrál a aplikace. Nevlastní integrál. 19. prosince 2018

Algebra I Cvičení. Podstatná část příkladů je převzata od kolegů, jmenovitě Prof. Kučery, Doc. Poláka a Doc. Kunce, se

XML data na disku jako databáze

fakulty MENDELU v Brně (LDF) s ohledem na disciplíny společného základu (reg. č. CZ.1.07/2.2.00/28.

Martin Pergel. 26. února Martin Pergel

(2) Funkce. Kristýna Kuncová. Matematika B2. Kristýna Kuncová (2) Funkce 1 / 25

Jednoduchá zobrazení. Podpořeno z projektu FRVŠ 584/2011.

Obsah. Limita posloupnosti a funkce. Petr Hasil. Limita posloupnosti. Pro a R definujeme: Je-li a < 0, pak a =, a ( ) =. vlastní body.

Úvod do umělé inteligence, jazyk Prolog

TGH01 - Algoritmizace

POLIURETANOWE SPRĘŻYNY NACISKOWE. POLYURETHANOVÉ TLAČNÉ PRUŽINY

Průvodce studiem V této kapitole se budeme zabývat diferenciálním počtem pro funkce více

Jednoduchá zobrazení. Podpořeno z projektu FRVŠ 584/2011.

K SAMOSTATNÉ MODULOVÉ SCHODY MONTÁŽI. asta

LBF/ZUB22 Programové vybavení ordinace zubního lékaře. Mgr. Markéta Trnečková, Ph.D. Palacký University, Olomouc

CA CZ, s.r.o. May 21, Radek Mařík Testování řídicích struktur May 21, / 45

SCRIPT PRO ZPRACOVÁNÍ OBRAZU

Stochastické modelování v ekonomii a financích Konzistence odhadu LWS. konzistence OLS odhadu. Předpoklady pro konzistenci LWS

Pojem množiny nedefinujeme, pouze připomínáme, že množina je. Nejprve shrneme pojmy a fakta, které znáte ze střední školy.

Lineární algebra - iterační metody

Kombinatorika a komplexní aritmetika

Reprezentace a vyvozování znalostí

Obsah: Organizace předmětu IB030. Situace na FI MU

(a). Pak f. (a) pro i j a 2 f

algebrou úzce souvisí V druhém tematickém celku se předpokládá základní znalosti z matematické analýzy

Paralelní implementace a optimalizace metody BDDC

Nástroj pro analýzu XML dat

Odpřednesenou látku naleznete v kapitolách skript Abstraktní a konkrétní lineární algebra.

Vybrané kapitoly z matematiky

Reprezentace dat. BI-PA1 Programování a Algoritmizace I. Ladislav Vagner

Kristýna Kuncová. Matematika B2 18/19. Kristýna Kuncová (1) Vzorové otázky 1 / 36

Transkrypt:

Gramatické formalismy pro ZPJ Aleš Horák E-mail: hales@fi.muni.cz http://nlp.fi.muni.cz/poc_lingv/ Obsah: Gramatické formalismy Kategoriální gramatiky Závislostní gramatiky Stromové gramatiky TAG a LTAG Úvod do počítačové lingvistiky 6/11 1 / 37 Gramatické formalismy Gramatické formalismy existuje množství různých přístupů k formální specifikaci gramatik (přirozených jazyků), různé gramatické formalismy popíšeme několik nejrozšířenějších formalismů: kategoriální gramatiky categorial grammars, CG závislostní gramatiky dependency grammars stromové gramatiky (Lexicalized) Tree Adjoining Grammar, (L)TAG lexikální funkční gramatiky Lexical Functional Grammar, LFG gramatiky příznakových struktur Head Phrase Structure Grammar, HPSG soustředíme se na zápis gramatiky (notaci) Úvod do počítačové lingvistiky 6/11 2 / 37

Kategoriální gramatiky Kategoriální gramatiky kategoriální gramatika (categorial grammar, CG) skupina teoríı syntaxe a sémantiky PJ s velkým důrazem na lexikon neobsahuje pravidla pro kombinování slov lexikální kategorie slov tvoří funkce, které určují, jak se dané kategorie kombinují s jinými výraz je výsledkem aplikace podvýrazů na sebe pěkný := NP/N... funkce, která má argument N a vrací NP všechny verze CG se opírají o princip kompozicionality: Význam složeného výrazu je jednoznačně určen významy částí tohoto výrazu a způsobem, jakým jsou tyto části složeny dohromady. zakladatelé generativních gramatik Leśniewski (publ. 1929) a Ajdukiewicz (publ. 1935) ve vazbě na Husserlovu a Russellovu teorii kategoríı a teorii typů první použití kategoriálních gramatik pro popis přirozeného jazyka Jehošua Bar-Hillel, 1953 Úvod do počítačové lingvistiky 6/11 3 / 37 Kategoriální gramatiky Notace kategoriálních gramatik existuje několik různých variant notace Notace kategoriálních gramatik šikovní psi mají rádi kočky NP/N N > (S\NP)/NP NP > NP S\NP < S jiný rozšířený zápis výsledek na vrcholku (result on top) Lambek 1958 šikovní psi mají rádi kočky NP/N N > (NP\S)/NP NP > NP NP\S < S Úvod do počítačové lingvistiky 6/11 4 / 37

Kategoriální gramatiky Notace kategoriálních gramatik Notace kategoriálních gramatik pokrač. kategoriální gramatika je šestice Σ, C base, C, Lex, RS, C complete, kde 1. Σ je konečná množina slov 2. C base je konečná množina základních kategoríı (funkčních typů) 3. C je množina kategoríı definovaná induktivně takto: a) C base C b) pokud X, Y C, potom i (X /Y ) C a (X \Y ) C c) C obsahuje pouze prvky dané výše uvedenými body a) a b) 4. Lex Σ C je konečná množina lexikon (zapisujeme v indexovém tvaru slovo kategorie ) 5. RS je množina následujících schémat pravidel: a) α (X /Y ) β (Y ) αβ (X ) b) β (Y ) α (X \Y ) βα (X ), kde α, β Σ a X, Y C 6. C complete C je množina dokončených (kompletních) kategoríı Úvod do počítačové lingvistiky 6/11 5 / 37 Kategoriální gramatiky Notace kategoriálních gramatik Notace kategoriálních gramatik pokrač. daná schémata umožňují 2 způsoby kombinace: argument vpravo (/) α (X /Y ) β (Y ) αβ (X ) argument vlevo (\) β (Y ) α (X \Y ) βα (X ) tento typ kategoriální gramatiky označoval Bar-Hillel jako obousměrný (bidirectional CG) Karel miluje Marii: bázové kategorie = {NP, S} kategorie z lexikonu: Karel (NP), Marii (NP), miluje ((S\NP)/NP) C complete = {S} v tomto tvaru je odvození ekvivalentní derivačním stromům CFG existují ale rozšíření kategoriálních gramatik, která vedou k systémům s vyšší vyjadřovací silou, než mají standardní CFG Úvod do počítačové lingvistiky 6/11 6 / 37

Kategoriální gramatiky Rozšíření kategoriálních gramatik Rozšíření kategoriálních gramatik kĺıčový problém nespojité větné části, tzv. neprojektivity řešení pomocí rozšíření CG přídavné kombinatorické operátory založené na typech dva možné přístupy: pravidlově orientovaný přidává pravidla odpovídající jednoduchým operacím nad kategoriemi, jako jsou: wrap komutace argumentů type-raising aplikace typů podobná aplikaci tradičních pádů na jmenné fráze comp kompozice funkcí k nejpropracovanějším systémům tohoto typu patří kombinatorické kategoriální gramatiky (CCG). deduktivní přístup vychází z Lambekova syntaktického kalkulu pohled na kategoriální lomítko (slash) jako formu logické implikace axiomy a inferenční pravidla potom definují teorii důkazu např. aplikace funkce pravidlo modus ponens P (P Q) Q OpenCCG library http://openccg.sourceforge.net/ Úvod do počítačové lingvistiky 6/11 7 / 37 Závislostní gramatiky Závislostní gramatiky bĺızko ke kategoriálním gramatikám vztah závislosti mezi řídícími a závislými větnými členy vhodné pro popis jazyků s volným slovosledem používají výhradně lexikalizovaných uzlů (v závislostním stromu) neexistují žádné neterminály závislostní analýza se jeví jednodušší využívá valence či subkategorizace vztah mezi jedním slovem a jeho argumenty typicky vztah mezi slovesem a jeho možnými doplněními: nosit = koho co = komu & koho co Úvod do počítačové lingvistiky 6/11 8 / 37

Závislostní gramatiky Závislostní gramatiky pokrač. hlavní přístupy: navazuje na evropskou lingvistickou tradici až k antice nejstarší užití Tesnière 1959 funkční generativní popis (Functional Generative Description, FGD) jeden z nejpropracovanějších závislostních systémů, pražská lingvistická škola (Sgall, Hajičová, Panevová) UDG, Unification Dependency Grammar Maxwell MTT, Meaning-Text Theory Mel čuk WG, Word Grammar Hudson Lexicase Starosta FG, Functional Grammar Dik LG, Link Grammar Temperley, Carnegie Mellon University http://www.link.cs.cmu.edu/link/ DUG, Dependency Unification Grammar Halliday Úvod do počítačové lingvistiky 6/11 9 / 37 Závislostní gramatiky Universal Dependencies Universal Dependencies www.universaldependencies.org, UD sjednocení závislostní anotace pro různé jazyky více než 100 stromových bank (treebanks) ve více než 70 jazycích Úvod do počítačové lingvistiky 6/11 10 / 37

Závislostní gramatiky Universal Dependencies Google Universal Tagset gramatiky pro jednotlivé jazyky založené na podobných principech detaily značkování ale často nejsou převoditelné 1:1 sjednocení značkování v UD založené na minimalistické Google Universal Tagset Open class words Closed class words Other ADJ ADP PUNCT ADV AUX SYM INTJ CCONJ X NOUN DET PROPN VERB NUM PART PRON SCONJ Universal Features Úvod do počítačové lingvistiky 6/11 11 / 37 Závislostní gramatiky Universal Dependencies značky z Universal Tagset vymezují základní třídy lexikální a gramatické vztahy popisují Universal Features Lexical features Inflectional features Nominal Verbal PronType Gender VerbForm NumType Animacy Mood Poss Number Tense Reflex Case Aspect Foreign Definite Voice Abbr Degree Evident Polarity Person Polite Úvod do počítačové lingvistiky 6/11 12 / 37

Závislostní gramatiky Universal Dependencies Universal Dependencies 1 Správkyně Správkyně NOUN Case=Nom Gender=Fem Number=Sing Polarity=Pos 2 dědictví dědictví NOUN Case=Gen Gender=Neut Number=Sing Polarity=Pos 3 Nováková Nováková PROPN Case=Nom Gender=Fem NameType=Sur Number=Sing Polarity=Pos 4 označila označit VERB Aspect=Perf Gender=Fem,Neut Number=Plur,Sing Polarity=Pos Tense=Past VerbForm=Part Voice=Act 5 pondělní pondělní ADJ Case=Acc Degree=Pos Gender=Neut Number=Sing Polarity=Pos 6 rozhodnutí rozhodnutí NOUN Case=Acc Gender=Neut Number=Sing Polarity=Pos 7 za za ADP AdpType=Prep Case=Acc 8 potěšující potěšující ADJ Aspect=Imp Case=Acc Gender=Neut Number=Sing Polarity=Pos Tense=Pres VerbForm=Part Voice=Act 9.. PUNCT Úvod do počítačové lingvistiky 6/11 13 / 37 Závislostní gramatiky Universal Dependencies Jazykové instrukce pro Universal Dependencies každý jazyk má uvedené instrukce pro: tokenizaci (hranice slov) morfologické značky syntax základní a rozšířené závislosti např. pro češtinu www.universaldependencies.org/cs/ cíl instrukcí sjednocení anotací napříč jazyky obsahuje i instrukce netypické pro daný jazyk např. v češtině značkování některých zájmen jako determiner nebo expandování slov kdybych = když + bych Úvod do počítačové lingvistiky 6/11 14 / 37

Závislostní gramatiky Universal Dependencies Využití Universal Dependencies srovnání lingvistických fenomenů napříč jazyky testování syntaktické analýzy na různých jazycích vícejazyčná syntaktická analýza paralelní dokumenty snadné porozumění rozdílům v anotacích UD poskytuje univerzální nástroje pro: anotace (editor, statistiky, validace) vizualizace dotazování UDPipe trénování a automatické anotace Úvod do počítačové lingvistiky 6/11 15 / 37 Stromové gramatiky TAG a LTAG Stromové gramatiky TAG a LTAG Tree Adjoining Grammar Joshi, Levy a Takahashi: TAG Formalism, 1975 Lexicalized TAG Joshi a Schabes: Parsing with Lexicalized TAG, 1991 pracují přímo se stromy a ne s řetězci slov množina počátečních stromů základní stavební prvky složitější věty odvozovány s použitím pomocných stromů počáteční (initial) strom: pomocný (auxiliary) strom: Úvod do počítačové lingvistiky 6/11 16 / 37

Stromové gramatiky TAG a LTAG TAG počáteční a pomocné stromy počáteční stromy neobsahují rekurzi popisují složkovou strukturu jednoduchých vět, jmenných skupin, předložkových skupin,... 1. všechny nelistové uzly odpovídají neterminálům 2. všechny listové uzly odpovídají terminálům nebo neterminálním uzlům určeným k substituci počáteční strom typu X = jeho kořen je označen termem X pomocné stromy reprezentují rekurzivní struktury popisují větné členy, které se připojují k základním strukturám (např. příslovečné určení) charakterizace: 1. všechny nelistové uzly odpovídají neterminálům 2. všechny listové uzly odpovídají terminálům nebo neterminálním uzlům určeným k substituci kromě právě jednoho neterminálního uzlu (patový uzel, foot node) 3. patový uzel má stejné označení jako kořenový uzel patový uzel slouží k připojení stromu k jinému uzlu TAG operace Úvod do počítačové lingvistiky 6/11 17 / 37 Stromové gramatiky TAG a LTAG operace dvě operace substituce a připojení (adjunction) operace substituce nahrazuje označený neterminál v listech nějakého stromu stromem, jehož kořen nese stejné označení Y 1 označený pro substituci Úvod do počítačové lingvistiky 6/11 18 / 37

Stromové gramatiky TAG a LTAG operace TAG operace připojení operace připojení vložení pomocného stromu, popisujícího rekurzi neterminálu X, se stromem, který obsahuje uzel označený rovněž X Úvod do počítačové lingvistiky 6/11 19 / 37 Stromové gramatiky TAG a LTAG operace Definice TAG TAG G = (I, A, S) je: množina I konečných počátečních stromů množina A pomocných stromů typ stromu S neterminál označující větu množina stromů T (G) TA gramatiky G = množina všech stromů odvoditelných z počátečních stromů typu S z I, jejichž spodní okraj sestává čistě z terminálních uzlů (všechny substituční uzly byly doplněny) jazyk řetězců L(G) generovaných TA gramatikou G = množina všech terminálních řetězců na spodním okraji stromů v T (G). Úvod do počítačové lingvistiky 6/11 20 / 37

Stromové gramatiky TAG a LTAG lexikalizace LTAG lexikalizace LTAG je lexikalizovanou variantou formalismu TAG počáteční i pomocné stromy obsahují v listech jednu nebo více tzv. lexikálních kotev uzly, které jsou přiřazeny (ukotveny) k určitým slovům lexikonu lexikalizované stromy (substituční uzly, patové uzly *): I = { A, NP, S }, A = { VP } Malý A N NP VP VP* ADV Petr V přišel domů Úvod do počítačové lingvistiky 6/11 21 / 37 Stromové gramatiky TAG a LTAG lexikalizace LTAG lexikalizované připojení A Malý NP N Petr S VP V přišel + VP* VP ADV domů S NP VP = A N VP ADV Malý Petr V domů přišel Úvod do počítačové lingvistiky 6/11 22 / 37

Stromové gramatiky TAG a LTAG generované jazyky TAG a LTAG generované jazyky díky použití operace připojení mají TAG a LTAG větší generativní sílu než bezkontextové gramatiky (CFG MCSL) generují mírně kontextové jazyky (mildly context-sensitive languages) MCSL: vlastnost konstantního růstu pokud uspořádáme řetězce jazyka vzestupně podle délky, potom rozdíl dvou po sobě jdoucích délek nemůže být libovolný (každá délka je lineární kombinací konečného počtu pevných délek). analyzovatelnost v polynomiálním čase O(n 6 ) vzhledem k délce vstupu i jiné formalismy umí MCSL (jsou ekvivalentní s (L)TAG): LIG, Linear Indexed Grammars Gazdar, 1985 HG, Head Grammars Pollard, 1984 CCG, kombinatorické kategoriální gramatiky The XTAG Project http://www.cis.upenn.edu/~xtag/ Úvod do počítačové lingvistiky 6/11 23 / 37 LFG, Lexical Functional Grammar Kaplan a Bresnan, 1982 dva typy syntaktických struktur vnější, c-struktura viditelná hierarchická organizace slov do frází vnitřní, f-struktura abstraktnější struktura gramatických funkcí, které tvoří hierarchii komplexních funkčních struktur důvod: různé přirozené jazyky se významným způsobem odlišují v organizaci fráze, v pořadí a způsobech realizace gramatických funkcí abstraktnější, funkcionální organizace jazyků se odlišuje mnohem méně v mnoha jazycích se např. objevují gramatické funkce podmětu, předmětu atd. Úvod do počítačové lingvistiky 6/11 24 / 37

pokrač. L = vztahy mezi jazykovými formami, např. mezi aktivními a pasivními formami slovesa, jsou zobecněním struktury lexikonu, ne transformačními operacemi, derivujícími jednu formu z druhé F = funkcionální teorie gramatické vztahy, jako je podmět, předmět atd., jsou základními konstrukty, a nejsou definovány pomocí konfigurace frázové struktury, nebo sémantických pojmů typu Agent a Patient v LFG pro reprezentaci funkcionální syntaktické informace je vhodné definovat hierarchickou strukturu jazykových jednotek, avšak vynucená linearizace pořádku těchto struktur není vhodná Úvod do počítačové lingvistiky 6/11 25 / 37 Syntaktické úrovně LFG c-struktura a f-struktura dvě syntaktické úrovně: složková struktura (c-structure, constituent structure) zachycuje frázovou dominanci a prioritu a je reprezentována jako strom frázové struktury (CFG strom) funkcionální struktura (f-structure) zachycuje syntaktickou strukturu typu predikát-argumenty a je reprezentována maticí dvojic atribut-hodnota nabízí jednotnou reprezentaci syntaktické informace abstrahující od detailů struktury fráze a lineárního pořádku f-struktura obsahuje soubor atributů: příznaky čas, rod, číslo,... funkce PRED, SUBJ, OBJ, jejichž hodnoty mohou být jiné f-struktury vztah mezi c-strukturami (stromy) a odpovídajícími f-strukturami: projekce φ : {uzly stromu c-struktury} {f-struktury} vyjádřená funkčními schématy Úvod do počítačové lingvistiky 6/11 26 / 37

c-struktura a f-struktura LFG c-struktura LFG pravidla: klasická CF pravidla plus funkční schémata výrazy pracující se symboly na pravé straně pravidel (za, RHS) LHS rodičovský uzel (žádná schémata) RHS symboly uzlů potomků S NP ( SUBJ) = VP = seznamy funkčních schémat (0 nebo více u každého uzlu) LFG pravidla Úvod do počítačové lingvistiky 6/11 27 / 37 c-struktura a f-struktura příklady: S NP ( SUBJ) = VP = VP NP V = (DET) = (NP) ( OBJ) = N = výrazy ( SUBJ) =, = a ( OBJ) = jsou funkční schémata Úvod do počítačové lingvistiky 6/11 28 / 37

lexikon LFG lexikon lexikon také obsahuje funkční schémata položka lexikonu: 1. konkrétní tvar slova 2. syntaktickou kategorii 3. seznam funkčních schémat konkrétní tvar slova syntaktická kategorie John N ( PRED) = John ( PERS) = 3 ( NUM) = singular seznam funkčních schémat Úvod do počítačové lingvistiky 6/11 29 / 37 lexikon LFG lexikon pokrač. příklady: John N ( PRED) = JOHN ( NUM) = SING ( PERS) = 3 sees V ( PRED) = SEE<( SUBJ)( OBJ)> ( SUBJ NUM) = SING ( SUBJ PERS) = 3 Mary N ( PRED) = MARY ( NUM) = SING ( PERS) = 3 Úvod do počítačové lingvistiky 6/11 30 / 37

konstrukce c- a f-struktur LFG konstrukce c-struktury informace v c-struktuře: hierarchická struktura větných členů funkční anotace (funkční schémata převedená do stromu) po jejich interpretaci získáme výslednou f-strukturu Úvod do počítačové lingvistiky 6/11 31 / 37 konstrukce c- a f-struktur LFG f-struktura grafický zápis: matice atribut-hodnota (attribute-value matrix, AVM) levé sloupce jsou atributy, pravé sloupce hodnoty (symboly, podřazené f-struktury nebo sémantické formy) funkční rovnice a f-struktury: (f p ATT) = VAL v f-struktuře f p je řádek, kde atribut je ATT a jeho hodnota je VAL funkční rovnice mohou být splněny nebo nesplněny (true/false) Úvod do počítačové lingvistiky 6/11 32 / 37

konstrukce c- a f-struktur LFG instanciace hodnot Instanciace hodnot 1. doplňuje hodnoty metaproměnných a 2. transformuje schémata na funkční rovnice výrazy získané z f-struktur grafický zápis f-struktura v hranatých závorkách [] každý uzel c-struktury má k sobě připojenou matici f-struktury, které se označují indexy f i Úvod do počítačové lingvistiky 6/11 33 / 37 konstrukce c- a f-struktur LFG doplnění hodnot metaproměnných a (metaproměnné) se odkazují na f-struktury je potřeba najít správné proměnné f i na místa šipek metaproměnná EGO nebo SELF odkazuje na f-strukturu uzlu nad schématem metaproměnná MOTHER odkazuje na f-strukturu rodičovského uzlu vzhledem k uzlu nad schématem Úvod do počítačové lingvistiky 6/11 34 / 37

konstrukce c- a f-struktur Úvod do počítačové lingvistiky 6/11 35 / 37 konstrukce c- a f-struktur LFG funkční popis funkční popis = množina všech instanciovaných funkčních rovnic stromu vlastní konstrukce f-struktury pracuje pouze s tímto funkčním popisem funkční popis předchozí věty: a. (f 1 SUBJ) = f 2 i. (f 5 SUBJ NUM) = SING b. f 3 = f 2 j. (f 5 SUBJ PERS) = f 3 c. (f 3 PRED) = JOHN k. (f 4 OBJ) = f 6 d. (f 3 NUM) = SING l. f 6 = f 7 e. (f 3 PERS) = f 3 m. (f 7 PRED) = MARY f. f 1 = f 4 n. (f 7 NUM) = SING g. f 4 = f 5 o. (f 7 PERS) = f 3 h. (f 5 PRED) = SEE<(f 5 SUBJ)(f 5 OBJ)> Úvod do počítačové lingvistiky 6/11 36 / 37

konstrukce c- a f-struktur LFG konstrukce f-struktury f-struktura se tvoří z funkčního popisu tak, aby všechny funkční rovnice byly splněny výsledná f-struktura musí být minimální taková f-struktura XLE web interface http://pargram.b.uib.no/tools/, http://xlfg.labri.fr Úvod do počítačové lingvistiky 6/11 37 / 37