Parsowanie semantyczne wypowiedzi w języku polskim z użyciem parsera ENIAM

Podobne dokumenty
Parsowanie semantyczne i jego zastosowania

Kategorialny Parser Składniowo-Semantyczny dla języka polskiego

Wykład 11a. Składnia języka Klasycznego Rachunku Predykatów. Języki pierwszego rzędu.

Wprowadzenie do logiki Zdania, cz. III Język Klasycznego Rachunku Predykatów

WSTĘP ZAGADNIENIA WSTĘPNE

Semantyka rachunku predykatów

Systemy ekspertowe i ich zastosowania. Katarzyna Karp Marek Grabowski

Wykład 6. Reguły inferencyjne systemu aksjomatycznego Klasycznego Rachunku Zdań

Podstawy Sztucznej Inteligencji (PSZT)

Internet Semantyczny. Logika opisowa

Strukturalizacja otoczenia agentów: ontologie, CYC, sieci semantyczne

Ontologie, czyli o inteligentnych danych

Reprezentacja wiedzy ontologie, logiki deskrypcyjne

Wykład 11b. System aksjomatyczny Klasycznego Rachunku Predykatów. Aksjomaty i reguły inferencyjne

Klasyczny rachunek zdań 1/2

Kultura logiczna Klasyczny rachunek zdań 1/2

Wprowadzenie do Prologa

Elementy kognitywistyki III: Modele i architektury poznawcze

Internet Semantyczny i Logika II

Reguły gry zaliczenie przedmiotu wymaga zdania dwóch testów, z logiki (za ok. 5 tygodni) i z filozofii (w sesji); warunkiem koniecznym podejścia do

Metoda Tablic Semantycznych

Świat rzeczywisty i jego model

Diagramy klas. dr Jarosław Skaruz

Katedra Teorii i Filozofii Prawa Poznań, dnia 27 września 2018 r.

Logika dla socjologów Część 2: Przedmiot logiki

Predykat. Matematyka Dyskretna, Podstawy Logiki i Teorii Mnogości Barbara Głut

Rysunek 1: Przykłady graficznej prezentacji klas.

Składnia rachunku predykatów pierwszego rzędu

MATEMATYKA DYSKRETNA, PODSTAWY LOGIKI I TEORII MNOGOŚCI

Metodologia prowadzenia badań naukowych Semiotyka, Argumentacja

Logika Stosowana. Wykład 2 - Logika modalna Część 2. Marcin Szczuka. Instytut Informatyki UW. Wykład monograficzny, semestr letni 2016/2017

Adam Meissner.

Cele kształcenia wymagania ogólne

Internet Semantyczny i Logika I

Klasyczny rachunek predykatów

Wstęp do logiki. Klasyczny Rachunek Predykatów I

Andrzej Wiśniewski Logika II. Materiały do wykładu dla studentów kognitywistyki

PRZEWODNIK PO PRZEDMIOCIE

Rachunek zdań - semantyka. Wartościowanie. ezyków formalnych. Semantyka j. Logika obliczeniowa. Joanna Józefowska. Poznań, rok akademicki 2009/2010

Andrzej Wiśniewski Logika I Materiały do wykładu dla studentów kognitywistyki. Wykłady 12 i 13. Dowód i dowodzenie w KRP. Tezy KRP

Wstęp do logiki. Kto jasno i konsekwentnie myśli, ściśle i z ładem się wyraża,

Co to jest znaczenie? Współczesne koncepcje znaczenia i najważn. i najważniejsze teorie semantyczne

Program warsztatów CLARIN-PL

Projektowanie systemów informatycznych. Roman Simiński siminskionline.pl. Modelowanie danych Diagramy ERD

Języki programowania zasady ich tworzenia

Semantyka rachunku predykatów pierwszego rzędu. Dziedzina interpretacji. Stałe, zmienne, funkcje. Logika obliczeniowa.

Wstęp do logiki. Klasyczny Rachunek Zdań II

Programowanie deklaratywne

Definicje. Algorytm to:

Bazy danych. Zachodniopomorski Uniwersytet Technologiczny w Szczecinie. Wykład 3: Model związków encji.

Elementy logiki matematycznej

Wprowadzenie do składni

MAS dr. Inż. Mariusz Trzaska

Logika Stosowana. Wykład 7 - Zbiory i logiki rozmyte Część 3 Prawdziwościowa logika rozmyta. Marcin Szczuka. Instytut Informatyki UW

Elementy logiki. Wojciech Buszkowski Wydział Matematyki i Informatyki UAM Zakład Teorii Obliczeń

Metody Kompilacji Wykład 1 Wstęp

Wykład 2. Relacyjny model danych

Metoda tabel semantycznych. Dedukcja drogi Watsonie, dedukcja... Definicja logicznej konsekwencji. Logika obliczeniowa.

Teraz bajty. Informatyka dla szkoły podstawowej. Klasa VI

Rachunek logiczny. 1. Język rachunku logicznego.

Michał Lipnicki (UAM) Logika 11 stycznia / 20

Reprezentacja wiedzy: Logika

Np. Olsztyn leży nad Łyną - zdanie prawdziwe, wartość logiczna 1 4 jest większe od 5 - zdanie fałszywe, wartość logiczna 0

Co to jest znaczenie? Współczesne koncepcje znaczenia i najważn. i najważniejsze teorie semantyczne

Główne problemy kognitywistyki: Reprezentacja

Indukowane Reguły Decyzyjne I. Wykład 3

Technologie obiektowe

Logika Matematyczna (1)

Logika pragmatyczna dla inżynierów

Reprezentacja wiedzy: Grafy pojęć, byty mentalne i wnioskowanie o przekonaniach

Komputerowe Systemy Przemysłowe: Modelowanie - UML. Arkadiusz Banasik arkadiusz.banasik@polsl.pl

Piotr Kulicki Katolicki Uniwersytet Lubelski Jana Pawła II Instytut Filozofii Teoretycznej Katedra Podstaw Informatyki

Twierdzenia Gödla dowody. Czy arytmetyka jest w stanie dowieść własną niesprzeczność?

Programowanie deklaratywne

Diagramu Związków Encji - CELE. Diagram Związków Encji - CHARAKTERYSTYKA. Diagram Związków Encji - Podstawowe bloki składowe i reguły konstrukcji

Analiza znaczeniowa sterowana składnią

LOGIKA Klasyczny Rachunek Zdań

Wymagania edukacyjne z informatyki dla uczniów klas VI SP nr 53 w Krakowie w roku szkolnym 2019/2020

Diagramy związków encji. Laboratorium. Akademia Morska w Gdyni

Programowanie deklaratywne i logika obliczeniowa

Podstawowe Pojęcia. Semantyczne KRZ

Wprowadzenie do logiki Klasyczny Rachunek Zdań część 3

Wprowadzenie. Teoria automatów i języków formalnych. Literatura (1)

Modelowanie danych, projektowanie systemu informatycznego

Język rachunku predykatów Formuły rachunku predykatów Formuły spełnialne i prawdziwe Dowody założeniowe. 1 Zmienne x, y, z...

Ziemia obraca się wokół Księżyca, bo posiadając odpowiednią wiedzę można stwierdzić, czy są prawdziwe, czy fałszywe. Zdaniami nie są wypowiedzi:

Logika Matematyczna (1)

Analiza i projektowanie obiektowe 2017/2018. Wykład 3: Model wiedzy dziedzinowej

Programowanie w logice

I. Podstawowe pojęcia i oznaczenia logiczne i mnogościowe. Elementy teorii liczb rzeczywistych.

Sztuczna inteligencja : Zbiory rozmyte cz. III

IDEOLOGIA, POSTAWA A KOMUNIKACJA

Spis treści Informacje podstawowe Predykaty Przykłady Źródła RDF. Marek Prząda. PWSZ w Tarnowie. Tarnów, 6 lutego 2009

Wprowadzenie do logiki Zdania, cz. I Wprowadzenie do Klasycznego Rachunku Zdań

Open Access w technologii językowej dla języka polskiego

Wstęp do logiki. Semiotyka cd.

Kultura logicznego myślenia

5. Rozważania o pojęciu wiedzy. Andrzej Wiśniewski Wstęp do filozofii Materiały do wykładu 2015/2016

Andrzej Wiśniewski Logika II. Materiały do wykładu dla studentów kognitywistyki. Wykład 14. Wprowadzenie do logiki intuicjonistycznej

Kryteria oceny dla poszczególnych form wypowiedzi z języka polskiego

Transkrypt:

Parsowanie semantyczne wypowiedzi w języku polskim z użyciem parsera ENIAM Wojciech Jaworski Instytut Podstaw Informatyki Polskiej Akademii Nauk 3 lutego 2017 Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 1 / 35

Co to jest parsowanie semantyczne? Zadanie znajdowania form logicznych. Wyrażanie treści zdania, akapitu, czy tekstu w sposób jawny, uporzadkowany i zrozumiały dla komputera. Wymaga przyjęcia języka opisu zwanego językiem reprezentacji znaczenia oraz teorii (sposobu, koncepcji) opisu świata. Jako język reprezentacji znaczenia wykorzystuje się zwykle logikę formalny język opisu reguły wnioskowania formalna semantyka oparta na teorii modeli Teoria opisu świata składa się z ontologii definiujacej typy bytów (pojęcia) teorii poszczególnych dziedzin (teoria czasu, przestrzeni, zdarzeń itp.) Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 2 / 35

Wersje demonstracyjne parsera Demo oficjalne: http://eniam.nlp.ipipan.waw.pl Demo nieoficjalne: http://students.mimuw.edu.pl/ wjaworski/eniam.html Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 3 / 35

Język reprezentacji znaczenia Jako język reprezentacji znaczenia przyjmujemy rozszerzona logikę pierwszego rzędu Formuły naszego języka reprezentacji znaczenia będziemy wyrażać graficznie w formie grafów semantycznych. Słoń trabi. Pres trabić Init sg słoń W powyższym grafie pudełka reprezentuja obiekty, o których jest mowa. występuje zatem obiekt słoń i zdarzenie trabić, symbol sg określa liczność obiektów jako dokładnie 1. występujace w pudełkach napisy to typy bytów, sa nimi pochodzace ze Słowosieci sensy. Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 4 / 35

Język reprezentacji znaczenia Słoń trabi. Pres trabić Init sg słoń Kółeczka reprezentuja relacje między obiektami. Init wskazuje na to, że słoń jest inicjatorem trabienia, a Pres na to, że zdarzenie jest równoczesne z czasem jego wypowiedzenia. Strzałka wchodzaca to pierwszy argument, wychodzaca drugi. Źródłem informacji o relacjach ł acz acych czasowniki z ich argumentami jest słownik walencyjny Walenty. Zewnętrzna ramka to kontekst. Reprezentuje on sytuację, czyli podzbiór czasoprzestrzeni, w którym istnieja byty wskazane przez pojęcia w pudełkach i zachodza wymienione w kółeczkach relacje pomiędzy nimi. Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 5 / 35

Język reprezentacji znaczenia Słoń trabi. Pres trabić Init sg słoń Powyższy graf jest równoważny formule logicznej (x, DSCR(x, (s, TYPE(s, słoń) s = 1, (t, TYPE(t, trabić) INIT(t, s)))), PRES(x)), w której każdy z obiektów jest identyfikowany przez zmienna. Predykat TYPE(x, t) przypisuje typ t do zmiennej x, stwierdza, że zbiór bytów wskazywanych przez x należy do sensu t. Ze zmiennymi zawsze wiażemy zbiory bytów. Pozwala to w prosty sposób zdefniować zdefiniować liczność. Predykat metajęzykowy DSCR wyraża kontekst. Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 6 / 35

Nazwy własne Franciszek trabi. Pres trabić Init sg osoba Franciszek Formuła odpowiadajaca temu zdaniu ma postać (x, DSCR(x, (o, TYPE(o, osoba) HASNAME(o, Franciszek ) o = 1 (t, TYPE(t, trabić) INIT(t, o)))), PRES(x)). Nazwy własne reprezentujemy za pomoca predykatu HASNAME(x, name ), który wiaże nazwę name ze zbiorem bytów oznaczonym przez x. W grafach semantycznych nazwy własne umieszczamy w cudzysłowach. Nazwy własne nie definiuja typu obiektu, tylko identyfikuja obiekt poprzez podanie przypisanej mu etykiety. Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 7 / 35

Kwantyfikatory Składnię rachunku predykatów pierwszego rzędu rozszerzamy o kwantyfikatory (np. co dziesiaty, czy prawie każdy). Każdy słoń trabi codziennie. Pres Quant trabić Init sg słoń Quant codziennie każdy (x, DSCR(x, KAŻDY(s, TYPE(s, słoń) s = 1, CODZIENNIE(t, TYPE(t, trabić) INIT(t, s)))), PRES(x)), Reprezentacja grafowa pozwala nie dospecyfikowywać zakresu kwantyfikatorów. Kwantyfikatory w formułach sa wprowadzane zgodnie z kolejnośca słów w zdaniu. Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 8 / 35

Cechy Zazwyczaj wyrażane przez przymiotniki i przysłówki. Przyjmujemy, że cechy (atrybuty) to byty majace swoje instancje. Słowa odnosza do instancji cech, a nie samych cech. Przykładowo instancjami koloru różowy moga być różne odcienie tego koloru. Intensywnie różowy słoń trabi. trabić Init sg słoń Attr różowy Manr intensywnie intensywnie Manr trabić Init sg słoń Attr różowy Nazwę cechy łaczymy z nazwa określanego przedmiotu za pomoca relacji Attr. Indywidua moga mieć cechy i same cechy moga mieć cechy. Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 9 / 35

Określenia miejsca Zazwyczaj wyrażane przez wyrażenia przyimkowe i przysłówki. Przyimki lokatywne reprezentuja relacje pomiędzy miejscami. Relacje te sa zreifikowane. Relacje te moga być modyfikowane, np. dość głęboko w szafie. Relacje Loc, Loc Src, Loc Goal, Path informuja o obecności i kierunku ruchu. Relacja Ref łaczy przyimek z jego podrzędnikiem. Kot wyszedł spod komody. sg kot Init wyjść Loc Src spod Ref sg komoda Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 10 / 35

Modele wewnętrzne Jan wierzy, że słoń trabi. Pres wierzyć Init sg Jan Cond że trabić Init sg słoń Pres Zdanie, które jest przedmiotem przekonań nie musi być obiektywnie prawdziwe. Umieszczamy je w pudełku oznaczajacym, że jego prawdziwość należy określać ze względu na subiektywny model świata posiadany przez Jana. Aby reprezentować modele w języku przedmiotowym, rozszerzamy notację logiczna o metajazykowy predykat DSCR. Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 11 / 35

Częściowa dezambiguacja Kot aranżuje. aranżować Init sg osoba Kot Kot miauczy. miauczeć Init sg kot Zasoby semantyczne pozwalaja wykonać częściowa dezambiguację na podstawie cech semantycznych Walenty wyznacza preferencje selekcyjne podrzędników czasownika. Słowosieć określa sensy słów uzgadniane z preferencjami selekcyjnymi. SGJP wskazuje, że Kot jest nazwa własna i wskazuje jej typ. Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 12 / 35

Kot miauczy codziennie. Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 13 / 35

Kot miauczy codziennie. [x, DSCR([, x), [k, TYPE(k, kot 1) k = 1, CODZIENNIE[m, TYPE(m, miauczeć 1) PRES(m) INIT(m, k)]]]] Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 14 / 35

Jaś wystosował petycję do urzędu. Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 15 / 35

Jaś wystosował petycję do urzędu. [x, DSCR([, x), [o, TYPE(o, osoba 1) HASNAME(o, Jaś ) o = 1, [w, TYPE(w, wystosować 1) PAST(w) [u, TYPE(u, urzad 1) u = 1, RECIPENT(w, u)] [p, TYPE(p, petycja 1) p = 1, THEME(w, u)] INIT(w, o)]]]] Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 16 / 35

Ania schowała piłkę głęboko w szafie. Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 17 / 35

Ania schowała piłkę głęboko w szafie. Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 18 / 35

Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 19 / 35

- Chcę jeść - zawołał Jaś. Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 20 / 35

- Chcę jeść - zawołał Jaś. Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 21 / 35

Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 22 / 35

Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 23 / 35

Jaś zawołał, że chce jeść. Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 24 / 35

Jaś zawołał, że chce jeść. Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 25 / 35

Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 26 / 35

Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 27 / 35

Kucharz posolił wszystkie dania dwoma łyżkami soli. Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 28 / 35

Kucharz posolił wszystkie dania dwoma łyżkami soli. Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 29 / 35

Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 30 / 35

Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 31 / 35

Kot odkupił 25 sierpnia 2015 samochód za 20000zł. Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 32 / 35

Kot odkupił 25 sierpnia 2015 samochód za 20000zł. Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 33 / 35

Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 34 / 35

Wojciech Jaworski (IPI PAN) Parsowanie semantyczne 3 lutego 2017 35 / 35