Obsah: Komunikace Gramatiky. PA026 Projekt z umělé inteligence.

Podobne dokumenty
Obsah: Komunikace Gramatiky. PA026 Projekt z umělé inteligence.

Přirozený jazyk prostředek komunikace

Definice Řekneme, že PDA M = (Q,Σ,Γ,δ,q 0,Z 0,F) je. 1. pro všechna q Q a Z Γ platí: kdykoliv δ(q,ε,z), pak δ(q,a,z) = pro všechna a Σ;

Obsah: Organizace předmětu IB030. Situace na FI MU

Gramatické formalismy pro ZPJ

Úvod do umělé inteligence, jazyk Prolog

MATEMATIKA 3. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Aproximace funkcí 1,00 0,841 1,10 0,864 1,20 0,885. Body proložíme lomenou čarou.

IB047. Pavel Rychlý. 21. února

Edita Pelantová, katedra matematiky / 16

Internet a zdroje. (Zdroje na Internetu) Mgr. Petr Jakubec. Katedra fyzikální chemie Univerzita Palackého v Olomouci Tř. 17.

Logický agent, výroková logika

1 Soustava lineárních rovnic

Úvodní informace. 18. února 2019

Numerické metody 8. května FJFI ČVUT v Praze

(1) Derivace. Kristýna Kuncová. Matematika B2 17/18. Kristýna Kuncová (1) Derivace 1 / 35

Necht je funkce f spojitá v intervalu a, b a má derivaci v (a, b). Pak existuje bod ξ (a, b) tak, že f(b) f(a) b a. Geometricky

Kristýna Kuncová. Matematika B2 18/19

Funkce zadané implicitně. 4. března 2019

Logický agent, výroková logika

Elementární funkce. Edita Pelantová. únor FJFI, ČVUT v Praze. katedra matematiky, FJFI, ČVUT v Praze

Kristýna Kuncová. Matematika B3

Linea rnı (ne)za vislost

Formálne jazyky Automaty. Formálne jazyky. 1 Automaty. IB110 Podzim

Komplexní analýza. Martin Bohata. Katedra matematiky FEL ČVUT v Praze Martin Bohata Komplexní analýza Mocninné řady 1 / 18

Kristýna Kuncová. Matematika B2

5. a 12. prosince 2018

Logika V. RNDr. Kateřina Trlifajová PhD. Katedra teoretické informatiky Fakulta informačních technologíı BI-MLO, ZS 2011/12

Co nám prozradí derivace? 21. listopadu 2018

Numerické metody minimalizace

Automatové modely. Stefan Ratschan. Fakulta informačních technologíı. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Představení projektu

kontaktní modely (Winklerův, Pasternakův)

Obsah. Limita posloupnosti a funkce. Petr Hasil. Limita posloupnosti. Pro a R definujeme: Je-li a < 0, pak a =, a ( ) =. vlastní body.

Geometrická nelinearita: úvod

SCRIPT PRO ZPRACOVÁNÍ OBRAZU

(TIL) Obsah: Transparentní intenzionální logika. Úvod do umělé inteligence 9/12 1 / 34

Komplexní analýza. Martin Bohata. Katedra matematiky FEL ČVUT v Praze Martin Bohata Komplexní analýza Úvod 1 / 32

Výzvy, které před matematiku staví

Vybrané kapitoly z matematiky

Inverzní Z-transformace

Martin Pergel. 26. února Martin Pergel

Obsah. Zobrazení na osmistěn. 1 Zobrazení sféry po částech - obecné vlastnosti 2 Zobrazení na pravidelný konvexní mnohostěn

Matematika (KMI/PMATE)

Kapitola 4: Soustavy diferenciálních rovnic 1. řádu

Kombinatorika a grafy I

PA152,Implementace databázových systémů 2 / 25

Operace s funkcemi [MA1-18:P2.1] funkční hodnota... y = f(x) (x argument)

DFT. verze:

Rovnice proudění Slapový model

ggplot2 Efektní vizualizace dat v prostředí jazyka R Martin Golasowski 8. prosince 2016

TTIC 31210: Advanced Natural Language Processing. Kevin Gimpel Spring Lecture 8: Structured PredicCon 2

Matematická analýza II pro kombinované studium. Konzultace první a druhá. RNDr. Libuše Samková, Ph.D. pf.jcu.cz

Kristýna Kuncová. Matematika B2 18/19. Kristýna Kuncová (1) Vzorové otázky 1 / 36

Katedra aplikované matematiky FEI VŠB Technická univerzita Ostrava

Anna Kratochvílová Anna Kratochvílová (FJFI ČVUT) PDR ve zpracování obrazu / 17

Expresivní deskripční logiky

Cauchyova úloha pro obyčejnou diferenciální rovnici

Reprezentace a vyvozování znalostí

Univerzita Palackého v Olomouci

ZÁVĚREČNÁ KONFERENCE Poslanecká sněmovna PČR Praha MEZINÁRODNÍ DOTAZNÍKOVÉ ŠETŘENÍ ANKIETY MIEDZYNARODOWE

Platforma pro analýzu, agregaci a vizualizaci otevřených dat souv

GEM a soustavy lineárních rovnic, část 2

Obkládačky a dlaždičky Płytki ścienne i podłogowe: SIGHT šedá szary

IEL Přechodové jevy, vedení

Matematika 2, vzorová písemka 1

Biosignál II. Lékařská fakulta Masarykovy univerzity Brno

Katedra kybernetiky skupina Inteligentní Datové Analýzy (IDA) Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

TGH01 - Algoritmizace

NÁVOD K POUŽITÍ KEZELÉSI KÉZIKÖNYV INSTRUKCJA OBSŁUGI NÁVOD NA POUŽÍVANIE. Česky. Magyar. Polski. Slovensky

7. Aplikace derivace

ULS4805FE. Návod k použití Návod na použitie Instrukcja obsługi Instruction Manual Használatı utasítás. Licensed by Hyundai Corporation, Korea

Matematika 1 Jiˇr ı Fiˇser 24. z aˇr ı 2013 Jiˇr ı Fiˇser (KMA, PˇrF UP Olomouc) KMA MAT1 24. z aˇr ı / 52

Reprezentace dat. BI-PA1 Programování a Algoritmizace I. Ladislav Vagner

učební text pro PLIN019

POLIURETANOWE SPRĘŻYNY NACISKOWE. POLYURETHANOVÉ TLAČNÉ PRUŽINY

(2) Funkce. Kristýna Kuncová. Matematika B2. Kristýna Kuncová (2) Funkce 1 / 25

Reprezentace a vyvozování znalostí

Lineární algebra - iterační metody

Reprezentace a vyvozování znalostí

CA CZ, s.r.o. May 21, Radek Mařík Testování řídicích struktur May 21, / 45

Stochastické modelování v ekonomii a financích Konzistence odhadu LWS. konzistence OLS odhadu. Předpoklady pro konzistenci LWS

Jednoduchá zobrazení. Podpořeno z projektu FRVŠ 584/2011.

B0B99PRPA Procedurální programování

Paradigmata programování 2

FAKULTA STAVEBNÍ. Stavební statika. Telefon: WWW:

Register and win!

Příručka k rychlé instalaci: NWD2105. Základní informace. 1. Instalace softwaru

Reprezentace a vyvozování znalostí.

Nekomutativní Gröbnerovy báze

Matematika III Stechiometrie stručný

Obsah Atributová tabulka Atributové dotazy. GIS1-2. cvičení. ČVUT v Praze, Fakulta stavební, katedra mapování a kartografie

Bardzo formalny, odbiorca posiada specjalny tytuł, który jest używany zamiast nazwiska

Paralelní implementace a optimalizace metody BDDC

Paradoxy geometrické pravděpodobnosti

Návod k použití BUBNOVÁ SUŠIČKA

TTIC 31210: Advanced Natural Language Processing. Kevin Gimpel Spring Lecture 7: Structured Prediction 1

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Inteligentne systemy decyzyjne. Przetwarzanie języka naturalnego

B0B99PRPA Procedurální programování. Stanislav Vítek

Transkrypt:

Zpracování přirozeného jazyka Aleš Horák E-mail: hales@fi.muni.cz http://nlp.fi.muni.cz/uui/ Obsah: Komunikace Analýza přirozeného jazyka PA026 Projekt z umělé inteligence Úvod do umělé inteligence 12/12 1 / 36

Komunikace Přirozený jazyk prostředek komunikace Přirozený jazyk prostředek komunikace komunikace = cílená výměna informace pomocí produkce a vnímání (sdílených) pokynů zvířata až stovky pokynů (šimpanz, delfín,...) člověk potenciálně neomezené množství, díky přirozenému jazyku 2 náhledy na přirozený jazyk: klasický (před 1953) jazyk se skládá z vět, které jsou bud pravdivé nebo nepravdivé (srovnej s logikou) moderní (po 1953) užití jazyka je jedna z možných akcí Wittgenstein (1953) Philosophical Investigations Searle (1969) Speech Acts Turingův test založen na jazyku jazyk je pevně spojen s myšlením komunikace se tvoří pomocí řečových aktů (speech acts) jako jeden z typů agentových akcí cíl komunikace změnit akce ostatních agentů Úvod do umělé inteligence 12/12 2 / 36

Komunikace Řečové akty Řečové akty Komunikační situace Mluvčí (speaker) Promluva (utterance) Posluchač (hearer) řečové akty směřují k naplnění cílů mluvčího: informovat (inform) Před tebou je jáma. ptát se (query) Vidíš zlato? přikázat/žádat (command/request) Zvedni to. sĺıbit/svěřit se s plánem (promise, Rozděĺım se s tebou o zlato. commit to plan) potvrdit (acknowledge) OK plánování řečových aktů vyžaduje znalosti: komunikační situace sémantiky a syntaxe (sdílených konvencí) informace o Posluchači cíle, znalosti, rozumnost Úvod do umělé inteligence 12/12 3 / 36

Komunikace Komunikační fáze (při informování) Komunikační fáze (při informování) průběh promluvy je možné rozložit na fáze: záměr (intention) M chce informovat Po, že Pr generování (generation) M vybírá slova W pro vyjádření Pr syntéza (synthesis) M říká slova W vnímání (perception) Po vnímá W analýza (analysis) Po odvozuje možné významy Pr 1,...,Pr n zjednoznačnění Po vybírá zamýšlený význam Pr i (disambiguation) zahrnutí (incorporation) Po zahrne Pr i do své báze znalostí Může přitom vzniknout chyba? neupřímnost (Po nevěří Pr) víceznačnost promluvy (Po zvoĺı špatné Pr i ) různé pochopení aktuální situace (zamýšlený význam mezi Pr i není) Úvod do umělé inteligence 12/12 4 / 36

Komunikace Komunikační fáze (při informování) Komunikační fáze příklad záměr generování syntéza Mluvčí Vědět(Po, Wumpus je mrtvý. [v u m p u s j e m r t v i:] Na živu(wumpus 1,S 3 )) vnímání analýza zjednoznačněníposluchač Na živu(wumpus S 1,S 3 )) Wumpus je mrtvý. syntaktická analýza: NP VP Noun Verb Adjective Wumpus je mrtvý zahrnutí Tell(KB, Na živu(wumpus 1,S 3 )) sémantická Na živu(wumpus,ted ) interpretace: Unavený(Wumpus, Ted ) pragmatická Na živu(wumpus 1,S 3 ) interpretace: Unavený(Wumpus 1,S 3 ) Úvod do umělé inteligence 12/12 5 / 36

zvířata používají místo vět izolované symboly omezená sada komunikovatelných situací žádná generativní kapacita gramatika specifikuje skladební strukturu složených pokynů definuje formální jazyk pokynů formální jazyk = množina řetězců (vět) teminálních symbolů (slov) 2 náhledy na vztah věty a gramatiky: S je správný řetězec/věta z jazyka S je analyzovatelný danou gramatikou příslušná gramatika generuje S S je správný řetězec/věta z jazyka gramatika je zadána jako množina přepisovacích pravidel S NP VP Pronoun já ty on... v tomto příkladu: S větný symbol kořenový symbol gramatiky NP, VP neterminály já,ty,... terminály Úvod do umělé inteligence 12/12 6 / 36

Typy gramatik Typy gramatik regulární (regular) S as S b neterminál terminál[neterminál] ekvivalentní síle konečných automatů, neumí a n b n bezkontextové (context-free) neterminál cokoliv S asb ekvivalentní síle zásobníkových automatů, umí a n b n, neumí a n b n c n kontextové (context-sensitive) víc termů na levé straně (kontext neterminálu) ASB AAaBB umí a n b n c n rekurzivně vyčíslitelné (recursively enumerable) bez omezení ekvivalentní síle Turingova stroje přirozený jazyk byl dlouho pokládán za bezkontextový nyní prokázáno, že obsahuje kontextové prvky Úvod do umělé inteligence 12/12 7 / 36

Typy gramatik Přesnost a pokrytí gramatiky u složitějších jazyků (např. přirozených) jazyk L 1 (generovaný gramatikou) se liší od zamýšleného jazyka L 2 L 1 L 2 chybně generované chybně negenerované kvalita gramatiky: pokrytí procento vět jazyka L 2 generovatelných gramatikou ( L 1 L 2 / L 2 ) přesnost procento generovaných vět, které jsou správné věty jazyka L 2 ( L 1 L 2 / L 1 ) tvorba gramatiky... postupný proces zvyšování pokrytí a přesnosti gramatiky přirozených jazyků velmi rozsáhlé a přesto většinou nepopisují plně ani angličtinu Úvod do umělé inteligence 12/12 8 / 36

DC gramatiky gramatiky uspořádaných klauzuĺı DC gramatiky gramatiky uspořádaných klauzuĺı uspořádaných klauzuĺı: Definite-Clause Grammars, DCG významná aplikace Prologu syntaktická analýza DCG jsou rozšířením bezkontextových gramatik (CFG) jejich implementace využívá rozdílových seznamů Úvod do umělé inteligence 12/12 9 / 36

DC gramatiky gramatiky uspořádaných klauzuĺı DC gramatika příklad 1 gramatika vět typu The young boy sings a song. % 1. část pravidla sentence > noun phrase, verb phrase. noun phrase > determiner, noun phrase2. noun phrase > noun phrase2. noun phrase2 > adjective, noun phrase2. noun phrase2 > noun. verb phrase > verb. verb phrase > verb, noun phrase. % 2. část lexikon determiner > [the]. determiner > [a]. verb > [sings]. noun > [boy]. noun > [song]. adjective > [young]. Úvod do umělé inteligence 12/12 10 / 36

DC gramatiky gramatiky uspořádaných klauzuĺı Podobnosti mezi DCG a CFG Formální podobnosti mezi DCG a CFG: CFG: pravidla tvaru x y, kde x N je neterminál a y (N T) je konečná posloupnost terminálů a neterminálů DCG: pravidla tvaru hlava > tělo, kde hlava je opět neterminál a tělo je opět konečná posloupnost terminálů a neterminálů pravidlo hlava > tělo znamená, že jedním z možných tvarů hlavy je tělo, neboli: hlavu je možné vyjádřit jako tělo Úvod do umělé inteligence 12/12 11 / 36

DC gramatiky gramatiky uspořádaných klauzuĺı Rozdíly a rozšíření DCG oproti CFG DCG: 1. Neterminál může být téměř libovolný term, kromě seznamu, proměnné a čísla. 2. Terminál může být libovolný term, s tím, že terminály a posloupnosti terminálů uzavíráme do hranatých závorek jako seznamy. 3. Pravá strana pravidla může obsahovat dodatečné podmínky v podobě prologovských podcílů. Tyto podmínky uzavíráme do složených závorek. 4. Levá strana pravidla může dokonce vypadat i tak, že neterminál je následován posloupností terminálů. 5. Tělo pravidla smí obsahovat řez. Úvod do umělé inteligence 12/12 12 / 36

DC gramatiky gramatiky uspořádaných klauzuĺı Analýza v Prologu pomocí append věta = seznam slov [the,young,boy,sings,a,song] pravidlová část neterminál chápeme jako unární predikát, jehož argumentem je ta větná složka, kterou daný neterminál popisuje sentence(s) :- append(np,vp,s), noun phrase(np), verb phrase(vp).... slovníková část, lexikon reprezentujeme pomocí faktů: determiner([the]). noun([boy]). determiner([a]).... Úvod do umělé inteligence 12/12 13 / 36

DC gramatiky gramatiky uspořádaných klauzuĺı Efektivněji rozdílové seznamy přepis gramatiky do Prologu pomocí rozdílových seznamů: sentence(s,s0) :- noun phrase(s,s1), verb phrase(s1,s0). noun phrase(s,s0) :- determiner(s,s1), noun phrase2(s1,s0). noun phrase(s,s0) :- noun phrase2(s,s0). noun phrase2(s,s0) :- adjective (S,S1), noun phrase2(s1,s0). noun phrase2(s,s0) :- noun(s,s0). verb phrase(s,s0) :- verb(s,s0). verb phrase(s,s0) :- verb(s,s1), noun phrase(s1,s0). determiner([ the S], S). determiner([ a S], S). verb([ sings S], S). noun([boy S], S). noun([song S], S). adjective ([ young S], S).? sentence([the, young,boy,sings, a, song],[] ). Yes Úvod do umělé inteligence 12/12 14 / 36

Lexikon pro agenta ve Wumpusově jeskyni Lexikon pro agenta ve Wumpusově jeskyni Gramatika přímo na slovech je příliš rozsáhlá. Řešením je rozdělení slov do kategoríı: podst. jméno: Noun zápach vánek třpyt nic wumpuse jáma zlato... sloveso: Verb jsem je vidím cítím působí zapáchá jdu... příd. jméno: Adjective levý pravý východní jižní... příslovce: Adverb tady tam bĺızko vpředu vpravo vlevo východně jižně vzadu... vl. jméno: Name Petr Honza Brno FI MU... zájmeno: Pronoun já ty mě toho ten ta... předložka: Preposition do v na u... spojka: Conjunction a nebo ale... číslice: Digit 0 1 2 3 4 5 6 7 8 9 kategorie můžeme dělit na otevřené (vyvíjející se) a uzavřené (stálé) Úvod do umělé inteligence 12/12 15 / 36

Lexikon pro agenta ve Wumpusově jeskyni Morfologická analýza v češtině u lexikonu nestačí prostý výčet tvarů je nutná morfologická analýza (morfologie=tvarosloví) skloňovaná a časovaná slova se rozkládají na segmenty pří-lež-it-ost-n-ými: pří prefix; lež kořen; it, ost, n suffixy; ými koncovka základní tvar slova (lemma), podle koncovky se určují gramatické kategorie % slovník základních gramatických kategoríı pád, číslo, rod % adj(+slovo, +Lemma, +Pad, +Cislo, +Rod) adj(chytrý, chytrý, 1, sg, mz). adj(chytrého, chytrý, 2, sg, mz). adj(chytří, chytrý, 1, pl, mz). reálná morfologická analýza ČJ program Majka na FI MU http://nlp.fi.muni.cz/projekty/wwwajka/ ajka>nejneuvěřitelněji <s> nej-ne=uvěřiteln==ěji= (1022) <l>uvěřitelně <c>k6xmend3 ajka>hnát <s> ==hná=t= (618) <l>hnát <c>k5eamfai <s> =hnát=== (1030) <l>hnát <c>k1ginsc1,k1ginsc4 Úvod do umělé inteligence 12/12 16 / 36

Lexikon pro agenta ve Wumpusově jeskyni Gramatická pravidla pro agenta ve Wumpusově jeskyni S NP VP % já + cítím vánek S Conjunction S % já cítím vánek + a + já jdu % na východ NP Pronoun % já Noun % jáma Adjective Noun % levá jáma Pronoun NP % toho + wumpuse Noun Digit, Digit % pole + 3,4 NP PP % jáma + na východě NP RelClause % toho wumpuse +,který % zapáchá VP Verb % zapáchá VP NP % cítím + vánek VP Adjective % je + třpytivý VP PP % jdu + na východ VP Adverb Adverb VP % jdu + dopředu PP Preposition NP RelClause, který VP % na + východ %,který + zapáchá Úvod do umělé inteligence 12/12 17 / 36

Syntaktický strom Syntaktický strom syntaktický strom vzniká během syntaktické analýzy a dává záznam o jejím průběhu: S NP VP VP NP VP Adjective Noun Adverb Verb Noun Východní jáma tady působí vánek Úvod do umělé inteligence 12/12 18 / 36

Syntaktický strom Konstrukce derivačního stromu Neterminály opatříme argumentem: sentence(sentence(np,vp)) > noun phrase(np), verb phrase(vp). Převod do podoby klauzuĺı: sentence(sentence(np,vp),s,s0) :- noun phrase(np,s,s1), verb phrase(vp,s1,s0). Úvod do umělé inteligence 12/12 19 / 36

Syntaktický strom DC gramatika s konstrukcí stromu analýzy sentence(s(n,v)) > noun phrase(n), verb phrase(v). noun phrase(np(d,n)) > determiner(d), noun phrase2(n). noun phrase(np(n)) > noun phrase2(n). noun phrase2(np2(a,n)) > adjective(a), noun phrase2(n). noun phrase2(np2(n)) > noun(n). verb phrase(vp(v)) > verb(v). verb phrase(vp(v,n)) > verb(v), noun phrase(n). determiner(det(the)) > [the]. determiner(det(a)) > [a]. adjective(adj(young)) > [young]. noun(noun(boy)) > [boy]. noun(noun(song)) > [song]. verb(verb(sings)) > [sings].? sentence(tree, [the,young,boy,sings,a,song],[]). Tree=s(np(det(the),np2(adj(young),np2(noun(boy)))), vp(verb(sings),np(det(a),np2(noun(song))))) Úvod do umělé inteligence 12/12 20 / 36

Syntaktický strom Derivační strom analýzy v DC gramatikách? sentence(tree, [the, young, boy, sings, a, song], []). Tree=s(np(det(the), np2(adj(young), np2(noun(boy)))), vp(verb(sings), np(det(a), np2(noun(song))))) s np vp np2 np np2 np2 det adj noun verb det noun the young boy sings a song Úvod do umělé inteligence 12/12 21 / 36

Test na shodu Test na shodu Pokud však rozšíříme slovník: noun(noun(boys)) > [boys]. verb(verb(sing)) > [sing]. Narazíme na problém se shodou v čísle:? sentence(,[a, young, boys, sings],[]). Yes? sentence(,[a, boy, sing],[]). Yes Proto rozšíříme neterminály o další argument Num, ve kterém můžeme testovat shodu: sentence(sentence(np,vp)) > noun phrase(np,num), verb phrase(vp,num). Úvod do umělé inteligence 12/12 22 / 36

Test na shodu DC gramatika s testy na shodu sentence(sentence(n,v)) > noun phrase(n,num), verb phrase(v,num). noun phrase(np(d,n),num) > determiner(d,num), noun phrase2(n,num). noun phrase(np(n),num) > noun phrase2(n,num). noun phrase2(np2(a,n),num) > adjective(a), noun phrase2(n,num). noun phrase2(np2(n),num) > noun(n,num). verb phrase(vp(v),num) > verb(v,num). verb phrase(vp(v,n),num) > verb(v,num), noun phrase(n,num1). determiner(det(the), ) > [the]. determiner(det(a), sg) > [a]. verb(verb(sings), sg) > [sings]. verb(verb(sing), pl) > [sing]. adjective (adj(young)) > [young]. noun(noun(boy),sg) > [boy]. noun(noun(song),sg) > [song]. noun(noun(boys),pl) > [boys]. noun(noun(songs),pl) > [songs].? sentence(,[a, young, boys, sings],[] ). No? sentence(,[the,boys,sings,a,song],[] ). No? sentence(,[the,boys,sing,a,song],[] ). Yes Úvod do umělé inteligence 12/12 23 / 36

Test na shodu Podmínky v těle pravidel DC gramatiky mohou mít pomocné podmínky v těle pravidel libovolný Prologovský kód CFG pro vyhodnocení artimetického výrazu: zapíšeme včetně výpočtu hodnoty výrazu: expr(x) > term(y), [+], expr(z), {X is Y+Z}. expr(x) > term(y), [ ], expr(z), {X is Y Z}. expr(x) > term(x). term(x) > factor(y), [ ], term(z), {X is Y Z}. term(x) > factor(y), [/], term(z), {X is Y/Z}. term(x) > factor(x). factor(x) > [ ( ], expr(x), [ ) ]. factor(x) > [X], {integer(x)}. E T +E T E T T F T F/T F F (E) f? expr(x,[3,+,4,/,2,, (,2,,6,/,3,+,2, ) ],[]). % 3+4/2 (2 6/3+2) = 1 X = 1 Úvod do umělé inteligence 12/12 24 / 36

Generativní síla DCG Generativní síla DCG Generativní (rozpoznávací) síla DCG je větší než CFG např. jazyk a n b n c n : abc > a(n), b(n), c(n). a(0) > []. a(s(n)) > [a], a(n). b(0) > []. b(s(n)) > [b], b(n). c(0) > []. c(s(n)) > [c], c(n).? abc(x,[]). X = [] ; X = [a, b, c] ; X = [a, a, b, b, c, c] ; X = [a, a, a, b, b, b, c, c, c] ;... Úvod do umělé inteligence 12/12 25 / 36

Analýza přirozeného jazyka Význam syntaktické analýzy Význam syntaktické analýzy analýza syntaxe je nutná pro analýzu významu většina teoríı analýzy významu využívá princip kompozicionality: Význam složeného výrazu je funkcí významu jednotlivých podvýrazů proces sémantické analýzy: bud vychází z výsledků syntaktické analýzy nebo probíhá současně se syntaktickou analýzou; pak může zasahovat i do tvorby syntaktického stromu Úvod do umělé inteligence 12/12 26 / 36

Analýza přirozeného jazyka Problémy při analýze přirozeného jazyka Problémy při analýze přirozeného jazyka víceznačnost anaforické výrazy indexické výrazy nejasnost nekompozicionalita struktura promluvy metonymie metafory Úvod do umělé inteligence 12/12 27 / 36

Analýza přirozeného jazyka Problémy při analýze přirozeného jazyka Víceznačnost ambiguity víceznačnost může být lexikální, syntaktická, sémantická a referenční lexikální stát, žena, hnát syntaktická Jím špagety s masem. Jím špagety se salátem. Jím špagety s použitím vidličky. Jím špagety se sebezapřením. Jím špagety s přítelem. sémantická Jeřáb je vysoký. Viděli jsme veliké oko. referenční Oni přišli pozdě. Můžeš mi půjčit knihu? Ředitel vyhodil dělníka, protože (on) byl agresivní. Úvod do umělé inteligence 12/12 28 / 36

Analýza přirozeného jazyka Problémy při analýze přirozeného jazyka Anaforické a indexické výrazy anaforické výrazy: anaphora používají zájmena pro odkazování na objekty zmíněné dříve Poté co se Honza s Maríı rozhodli se vzít, (oni) vyhledali kněze, aby je oddal. Marie uviděla ve výloze prstýnek a požádala Honzu, aby jí ho koupil. indexické výrazy: indexicals odkazují se na údaje v jiných částech promluvy nebo mimo promluvu Já jsem tady. Proč jsi to udělal? Úvod do umělé inteligence 12/12 29 / 36

Analýza přirozeného jazyka Problémy při analýze přirozeného jazyka Metafora a metonymie metafora: metaphor použití slov v přeneseném významu (na základě podobnosti), často systematicky Zkoušel jsem ten proces zabít, ale nešlo to. Bouře se vzteká. metonymie: metonymy používání jména jedné věci pro (často zkrácené) označení věci jiné Čtu Shakespeara. Chrysler oznámil rekordní zisk. Ten pstruh na másle u stolu 3 chce další pivo. Úvod do umělé inteligence 12/12 30 / 36

Analýza přirozeného jazyka Problémy při analýze přirozeného jazyka Nekompozicionalita noncompositionality příklady porušení pravidla kompozicionality u ustálených termínů nebo přednost jiného možného významu při určitých spojeních aligátoří boty, basketbalové boty, dětské boty pata sloupu červená kniha, červené pero bílý trpasĺık dřevěný pes, umělá tráva velká molekula Úvod do umělé inteligence 12/12 31 / 36

Analýza přirozeného jazyka Reálná syntaktická analýza přirozeného jazyka Reálná syntaktická analýza přirozeného jazyka velice rozsáhlé gramatiky (desítky až stovky tisíc pravidel) silná víceznačnost někdy až obrovské množství (>milióny) možných syntaktických stromů Obehnat Šalounův pomník mistra Jana Husa na pražském Staroměstském náměstí živým plotem z hustých keřů s trny navrhuje občanské sdružení Společnost Jana Jesenia. existují efektivní algoritmy pro takové gramatiky např. tabulkový analyzátor (chart parser), beží v O(n 3 ), tisíce slov/sekundu Úvod do umělé inteligence 12/12 32 / 36

Analýza přirozeného jazyka Reálná syntaktická analýza přirozeného jazyka Příklad stromu analýzy v systému synt start sentence clause,, clause,, clause ends np VBL bylo part adv np VL udělaly np VL vyprávěla np np.. ADJ Postižených np ADV víc np pp N bankrot PRONPER nám np prop names,, np N cestovek NUMK dvě PREP z np NPR Ludmila NPR Janočková np np PRONPER nich N majitelka N agentury http://nlp.fi.muni.cz/projekty/wwwsynt/ Úvod do umělé inteligence 12/12 33 / 36

Analýza přirozeného jazyka Reálná syntaktická analýza přirozeného jazyka Příklad logické analýzy v systému synt Když je pořádná zima s množstvím sněhu, ani velký nával návštěvníků přírodě příliš nevadí. λw 1 λt 2 [když ani w1 t 2, ( λw 3 λt 4 ( i 5 ) [pořádný w3 t 4,i 5 ] [zima w3 t 4,i 5 ] [ [sw3 t 4,[Of,množství,sníh] ] ] ),i w3t4 5, [ ( λw 6 λt 7 [Not, True w6 t 7,λw 8 λt 9 ( x 10 )( i 11 )( i 12 ) [ Doesw8 t 9,i 12,[Imp w8,x 10 ] ] [příroda w8 t 9,i 11 ] x 10 [vadit,i 11 ] w8 [příliš,x 10 ] [ [velký,[of,nával,návštěvník] ] w 8 t 9,i 12 ] )]]]...o τω Úvod do umělé inteligence 12/12 34 / 36

Analýza přirozeného jazyka Reálná syntaktická analýza přirozeného jazyka NLP Natural Language Processing část umělé inteligence zaměřená na zpracování textu a řeči Významné úkoly v NLP (předměty IB030 a IA161) analýza textu v přirozeném jazyce morfologická, syntaktická, sémantická generování textu v přirozeném jazyce syntéza a rozpoznávání řeči strojový překlad (Machine translation) odpovídání na otázky (Question answering) komunikace člověk-stroj (Man-machine communication, Chatbots) získávání informací (Information retrieval) korektura textu (Spell-checking, Grammar checking) extrakce informací (Information extraction, Text mining) výtah z textu (Text summarization) určení typu dokumentu (Text classification/clustering) určení stylu dokumentu/autora (Stylometry, Authorship attribution) Úvod do umělé inteligence 12/12 35 / 36

PA026 Projekt z umělé inteligence PA026 Projekt z umělé inteligence navazuje na předmět PB016 Úvod do umělé inteligence volba programovacího jazyka ovšem není nijak omezena samostatná volba tématu v rozsahu 1 semestru předmět probíhá jako konzultace zajímavé výsledky (http://nlp.fi.muni.cz/uiprojekt/) projekt elnet > 5 let spolupráce na grantových projektech simulace elektrorozvodných sítí projekt plagiaty z webu reálné a funkční vyhledávání shod s dokumenty na celém webu projekt robot johnny 5 sestavení a oživení robota mobilního počítače Úvod do umělé inteligence 12/12 36 / 36