Negacja w języku polskim,



Podobne dokumenty
Analiza znaczeniowa sterowana składnią

Paradygmaty dowodzenia

użytkownika 1 Jak wybrać temat pracy 2 Spis treści 3 Część pierwsza problematyka 4 Część druga stosowane metody 5 Część trzecia propozycja rozwiązania

Przykłady zastosowań funkcji tekstowych w arkuszu kalkulacyjnym

Uniwersytet Zielonogórski Instytut Sterowania i Systemów Informatycznych. Ćwiczenie 3 stos Laboratorium Metod i Języków Programowania

Wykład 11a. Składnia języka Klasycznego Rachunku Predykatów. Języki pierwszego rzędu.

Strona czynna i strona bierna czasownika

Opis nowych funkcji w programie Symfonia Handel w wersji 2010

SPIS TREŚCI. Wykaz skrótów Przedmowa... 11

Proces uprawniania w module klubowym działa w sposób następujący.

Metody Kompilacji Wykład 3

Badania operacyjne: Wykład Zastosowanie kolorowania grafów w planowaniu produkcji typu no-idle

Polacy o OFE. Polacy o OFE. TNS Czerwiec 2014 K.043/14

Instrukcja laboratoryjna cz.0

Reguły gry zaliczenie przedmiotu wymaga zdania dwóch testów, z logiki (za ok. 5 tygodni) i z filozofii (w sesji); warunkiem koniecznym podejścia do

Wstęp do logiki. Semiotyka cd.

SPRAWDZIAN Klucz punktowania zadań. C e n t r a l n a K o m i s j a E g z a m i n a c y j n a. w W a r s z a w i e

Logika Stosowana. Wykład 1 - Logika zdaniowa. Marcin Szczuka. Instytut Informatyki UW. Wykład monograficzny, semestr letni 2016/2017

programu Neofon instrukcja obsługi Spis treści

Spis treści 5. Spis treści. Przedmowa Przedmowa do wydania II Część pierwsza MORFOLOGIA

SYSTEM ZARZĄDZANIA LICENCJAMI ORAZ REJESTRACJI UCZESTNIKÓW ZAWODÓW

SYSTEM ZARZĄDZANIA LICENCJAMI ORAZ REJESTRACJI UCZESTNIKÓW ZAWODÓW

Wskazówki: 1. Proszę wypełnić dwie sąsiadujące komórki zgodne z zasadą ciągu, a następnie zaznaczyć komórki w następujący sposób:

Planowanie zajęć równoległych i mieszanych

Powiązania techniczne i technologiczne nie należą do zakresu specjalności i branży architektonicznej

Walenty. słownik walencyjny języka polskiego z kontrolą i koordynacją. Filip Skwarski. 5 listopada 2012 r. IPI PAN

Proces uprawniania w module klubowym

Wykrywanie twarzy na zdjęciach przy pomocy kaskad

Analiza wyników egzaminu gimnazjalnego z języka obcego

Dane w poniższej tabeli przedstawiają sprzedaż w dolarach i sztukach oraz marżę wyrażoną w dolarach dla:

AUDIO B1 KONFLIKT POKOLEŃ (wersja dla studenta)

Proces uprawniania w module klubowym

WYMAGANIA EDUKACYJNE Z JĘZYKA NIEMIECKIEGO DLA KLASY PIERWSZEJ GIMNAZJUM - POZIOM III0. Uczeń potrafi: Dopuszczający Dostateczny Dobry Bardzo dobry

Teraz przechodzimy do zakładki Zarządzanie kolorami.

Zadanie 1. (6 punktów) Słowo w nazwiemy anagramem słowa v jeśli w można otrzymać z v poprzez zamianę kolejności liter. Niech

W opisywanym przykładzie konta VoIP prezentują się adresem SIP URL:

Kwestionariusz stylu komunikacji

Metoda tabel semantycznych. Dedukcja drogi Watsonie, dedukcja... Definicja logicznej konsekwencji. Logika obliczeniowa.

UNIWERSYTET ŚLĄSKI W KATOWICACH

W opisywanym przykładzie konta VoIP prezentują się adresem SIP URL:

Poprawne opisanie szkoły dla dorosłych w module Administrowanie. 1. Zaloguj się do systemu jako administrator i uruchom moduł Administrowanie.

Imię, nazwisko, nr indeksu

WYMAGANIA EDUKACYJNE Z JĘZYKA ANGIELSKIEGO KLASA IV. ocena

Przygotowanie materiału uczącego dla OCR w oparciu o aplikację Wycinanki.

Wskaźnik może wskazywać na jakąś zmienną, strukturę, tablicę a nawet funkcję. Oto podstawowe operatory niezbędne do operowania wskaźnikami:

Spis treści. ROZDZIAŁ 2 Wzajemne oddziaływanie między leksykonem a innymi środkami służącymi kodowaniu informacji... 67

mgr inż. Magdalena Deckert Poznań, r. Metody przyrostowego uczenia się ze strumieni danych.

Dopasowywanie modelu do danych

AUDIO / VIDEO (A 2 / B1 ) (wersja dla studenta) ROZMOWY PANI DOMU ROBERT KUDELSKI ( Pani domu, nr )

ECDL/ICDL Przetwarzanie tekstów Moduł B3 Sylabus - wersja 5.0

Przewodnik dla użytkownika. Instrukcja korzystania z aplikacji mobilnej mtoken Asseco MAA

10. Wstęp do Teorii Gier

Zamiana ułamków na procenty oraz procentów na ułamki

Po zakończeniu rozważań na temat World Wide Web, poznaniu zasad organizacji witryn WWW, przeczytaniu kilkudziesięciu stron i poznaniu wielu nowych

ZESTAWIENIE I ANALIZA PRÓBNEGO EGZAMINU Z JĘZYKA NIEMIECKIEGO UCZNIÓW III KLAS GIMNAZJUM IM. JANA PAWŁA II W BUDZOWIE

Metoda Tablic Semantycznych

Stwórz dokument XML zawierający poniższe informacje. Wykorzystaj atrybuty.

FORMUŁY AUTOSUMOWANIE SUMA

Instrukcja Użytkownika (Studenta) Systemu Obsługującego Lokalne Archiwum Dokumentów

Wypowiedzenie, zdanie, równoważnik zdania, czyli w jaki sposób budujemy swoje wypowiedzi

Matematyczne Podstawy Informatyki

Instrukcja korzystania z aplikacji mobilnej mtoken Asseco MAA klient korporacyjny

ECDL/ICDL Przetwarzanie tekstów Moduł B3 Sylabus - wersja 6.0

Obliczenia inspirowane Naturą

Okręgowa Komisja Egzaminacyjna w Poznaniu Egzamin gimnazjalny z języka rosyjskiego poziom rozszerzony Analiza poziomu umiejętności uczniów na

Evolution plus 1 PLAN WYNIKOWY UNIT 1. Środki językowe. Umiejętności językowe wg NPP. Macmillan Polska 2014

Łącznik niełamliwy Ctrl+Shift+minus

Moduł Usprawiedliwiania


CZY PYTANIE MUSI MIEĆ ZNAK ZAPYTANIA? O SPOSOBACH FORMUŁOWANIA PYTAŃ PRZEZ DZIECI

Poznajemy różne formy rzeczownika odmieniamy rzeczownik przez przypadki

Jak pisać publikacje naukowe? Nie o naukowej, a technicznej stronie pisania artykułu

praca zbiorowa pod kierunkiem EXCEL nowych punktów widzenia

Język angielski kl. 4

W badaniach 2008 trzecioklasiści mieli kilkakrotnie za zadanie wyjaśnić wymyśloną przez siebie strategię postępowania.

Operacje na Wielu Arkuszach

Organizacja informacji

Instrukcja dla użytkowników serwisu internetowego

Język angielski kl. 6

Słowem wstępu. Część rodziny języków XSL. Standard: W3C XSLT razem XPath 1.0 XSLT Trwają prace nad XSLT 3.0

KLUCZ PUNKTOWANIA ODPOWIEDZI

Opis modułu kształcenia

KLUCZ PUNKTOWANIA ZADAŃ

Plan wynikowy Das ist Deutsch! Kompakt

Spis treści. Konwencje zastosowane w książce...5. Dodawanie stylów do dokumentów HTML oraz XHTML...6. Struktura reguł...9. Pierwszeństwo stylów...

CZYTANIE CICHE ZE ZROZUMIENIEM

Proces uprawniania w module klubowym

Logika Stosowana. Wykład 7 - Zbiory i logiki rozmyte Część 3 Prawdziwościowa logika rozmyta. Marcin Szczuka. Instytut Informatyki UW

3. Instrukcje warunkowe

Podstawy Sztucznej Inteligencji (PSZT)

Gramatyki kształtu. 1 Cel zajęć. 2 Narzędzie. 3 Ćwiczenie wprowadzające. 2.1 Uwagi ogólne odnośnie działania

i na matematycznej wyspie materiały dla ucznia, klasa III, pakiet 3, s. 1 KARTA:... Z KLASY:...

Kategorialny Parser Składniowo-Semantyczny dla języka polskiego

Evolution plus 2. Macmillan Polska 2014 KRYTERIA OCENIANIA

WYMAGANIA EDUKACYJNE NIEZBĘDNE DO OTRZYMANIA PRZEZ UCZNIA POSZCZEGÓLNYCH ŚRÓDROCZNYCH I ROCZNYCH OCEN KLASYFIKACYJNYCH Z JĘZYKA ANGIELSKIEGO W KLASIE

Extensible Markup Language (XML) Wrocław, Java - technologie zaawansowane

Opis postępowania dla uczestników aukcji. Aukcje z postępowań- typ aukcji: japoński

ZADANIA OTWARTE ZADANIA ROZPRAWKA )- 25 5

ZARZĄDZANIE WYDRUKIEM ETYKIET

Wizualizacja wyników analizy syntaktycznej

Transkrypt:

Negacja w języku polskim, Implementacja n-słów w środowisku Separ Dariusz Leniowski 13 września 2011 Streszczenie Artykuł ten poświęcony jest zjawiskom występującym przy słowach wprowadzających negację (n-słowach). Owocem projektu jest gramatyka, która odtwarza najważniejsze reguły uzgadniania i semantyki. Jako reprezentatywne wybrano słowa: nikt, nic oraz żaden. Całość została zaimplementowana w środowisku Separ. 1 Wprowadzenie W języku polskim słowa zanegowane wprowadzają dodatkowe ograniczenia na całą frazę. Najważniejszym z nich jest wymuszenie negacji czasownika, niezależnie czy słowo zanegowane znajduje się w kontekście podmiotu czy dopełnienia: 1 1a. Nikt nie spał. 1b. (Ja) nie napisałem niczego. 1c. (On) nie poszedł do żadnej szkoły. W pewnych przypadkach wymuszenie negacji przenosi się na wyższy poziom w hierarchii, np. 2a. Marek chciał nie iść nigdzie. 2b. Marek nie chciał iść nigdzie. 2c. Jackowi przeszkadza nieobgadywanie nikogo. 2d. Jackowi nie przeszkadza obgadywanie nikogo. Zdarza się jednak, że takie przeniesienie jest niepoprawne: 3a. Jackowi przeszkadza, że nie obgadują nikogo. 3b. *Jackowi nie przeszkadza, że obgadują nikogo. 4a. Jacek pisał książkę nie używając niczego. 4b. *Jacek nie pisał książki używając niczego. Warto zwrócić uwagę różnicę w odmianie wyrazu książka w dwóch ostatnich prezentowanych zdaniach. Zjawisko to jest zwane dopełniaczem negacji i powoduje zamianę biernika na dopełniacz w przypadku zanegowanych czasowników. Dodatkowo zaznaczę, że w języku polskim niektóre słowa wprowadzające negację występują jeszcze w innych znaczeniach, np. 1 Specjalnie wyróżniono słowa wymuszone oraz zanegowane. Zdania niepoprawne oznaczane są gwiazdką. 1

5a. O niczym nie rozmawiałem. 5b. Rozmawiałem o niczym. [Rozmawiałem o czymś, ale nie było to nic istotnego.] 6a. Donikąd nie poszedłem. 6b. Poszedłem donikąd. [Gdzieś poszedłem, ale nie trafiłem w żadne szczególne miejsce.] 7a. Czekanie w korku nie było żadną przyjemnością. 7b. Czekanie w korku to żadna przyjemność. [Czekanie w korku to wątpliwa przyjemność.] 8. W tym zdaniu używam słowa nikt. Kluczowe jest, że zdania 5a, 6a i 7a mają znaczenie nie istnieje, natomiast 5b, 6b oraz 7b posiadają wydźwięk bliski istnieje, ale jest to nieważne, wątpliwe, etc. Naturalnie, w zdaniu 8 słowo nikt jest cytowane i nie podlega standardowym regułom. Więcej informacji na temat negacji w języku polskim, wraz z bardziej wyczerpującą analizą, można znaleźć w [2]; z pracy tej zostały zaczerpnięte niektóre przykłady. 2 Syntaktyka Aby wymusić zgodność pomiędzy odpowiednimi frazami, każdy wierzchołek w drzewie wyprowadzenia został wzbogacony o dwie właściwości, których możliwe wartości wraz z wyjaśnieniami zostały podane poniżej. ZanegowanieGóra Tak fraza wymaga od wierzchołka-ojca akceptacji negacji. Nie fraza nie wymaga od wierzchołka-ojca akceptacji negacji. ZanegowanieDół Niezanegowane fraza akceptuje tylko niezanegowane wierzchołki-dzieci. NiePropaguj fraza akceptuje dowolne wierzchołki-dzieci, nie zmienia to wartości właściwości ZanegowanieGóra. Propaguj fraza akceptuje dowolne wierzchołki-dzieci, ale wierzchołki wymagające akceptacji negacji powodują, że fraza wynikowa również będzie wymagać akceptacji negacji. Zakładamy, że pojedyncze słowa posiadają odpowiednie adnotacje w leksykonie, np. ZanegowanieGóra ZanegowanieDół marek Nie Niezanegowane nic Tak Niezanegowane żaden Tak Niezanegowane spał Nie Niezanegowane nie spał Nie NiePropaguj do Nie Propaguj obgadywanie Nie Propaguj nieobgadywanie Nie NiePropaguj używając Nie Niezanegowane nie używając Nie NiePropaguj 2

Następnie wystarczy je kombinować ze sobą według poniższych reguł (brak dopasowania oznacza niepoprawne wyprowadzenie): fraza dominująca fraza zdominowana fraza wynikowa α, Niezanegowane Nie α, Niezanegowane α, NiePropaguj β α, NiePropaguj Nie, Propaguj β β, Propaguj Tak, Propaguj β Tak, Propaguj Reguły w dwóch ostatnich wierszach tabeli pokrywają również przypadek wielokrotnych dopełnień dla słów, które propagują negację wystarczy jedna zanegowana fraza, aby całość przejęła cechę. W poniższych przykładach błędy dopasowania zaznaczono na czerwono, a poprawne wyliczenia na niebiesko. Nie,Niezanegowane Nie,Niezanegowane Nie,Niezanegowane Marek spał Tak,Niezanegowane Nie,Niezanegowane Nikt spał Nie,NiePropaguj Tak,Niezanegowane Nie,NiePropaguj Nikt nie spał Nie,Niezanegowane Tak,Propaguj przeszkadzało Nie,Propaguj Tak,Niezanegowane obgadywanie nikogo Nie,Niepropaguj Nie,Niepropaguj Tak,Propaguj Nie poszedł Nie,Propaguj Tak,Niezanegowane do Tak,Niezanegowane Nie,Niezanegowane żadnej szkoły Dodatkowe znaczenia n-słów ze zdań 5b, 6b oraz 7b faktycznie nie wprowadzają negacji do zdania (np. nikt ma znaczenie ktoś nieważny) i jako nieciekawe zostały zignorowane. Zamodelowane za to zostało zjawisko dopełniacza negacji. Można to robić automatycznie (jeżeli wymaganym przypadkiem jest biernik, zamień go na dopełniacz), lecz ze względu na prostotę rozwiązania leksykon posiada oddzielne wpisy dla czasownika i jego negacji. 3 Semantyka Dla części słów z leksykonu (reszta okazała się być dokładnym powtórzeniem) podano semantykę w postaci formuł λfol. Dla słów wprowadzających negację w kontekście podmiotu znaczenie było analogiczne do znaczenia słów takich jak każdy, wszystko i podobnych, np. 3

Bartek nie dał książki. Nikt nie dał książki. Wszyscy nie dali książki. Dać(Bartek, Książka) x. Dać(x, Książka) x. Dać(x, Książka) W kontekście dopełnienia są dwie wersje, w zależności od tego, czy uznamy, że znak negacji obejmuje kwantyfikatory, czy nie. Bartek nie dał książki. Dać(Bartek, Książka) Dać(Bartek, Książka) Bartek nie dał niczego. x. Dać(Bartek, x) x. Dać(Bartek, x) Bartek nie dał wszystkiego. x. Dać(Bartek, x) x. Dać(Bartek, x) Rozwiązania wydają się równoważne, ale ze względu na semantykę zdań postaci A wskazuje/pokazuje/opisuje B wybrano podejście, w którym znak negacji obejmuje kwantyfikatory dopełnienia. W poniższym przykładzie przedstawiono jedynie intuicję, nie są to prawidłowe formuły λfol. Dowody wskazują na nieprzestrzeganie niczego. Wskazywać(Dowody, x. przestrzegać(x)) Wskazywać(Dowody, x. przestrzegać(x)) Dowody nie wskazują na przestrzeganie niczego. Wskazywać(Dowody, x. przestrzegać(x)) Wskazywać(Dowody, x. przestrzegać(x)) źle dobrze Dowody nie wskazują na przestrzeganie wszystkiego. Wskazywać(Dowody, x. przestrzegać(x)) Wskazywać(Dowody, x. przestrzegać(x)) źle dobrze Słowo żaden i formy pokrewne zachowują się analogicznie do słów nikt czy nic, a mianowicie słowo kontekst podmiotu kontekst dopełnienia nikt λk. x. k(x) λk. x. k(x) nic λk. x. k(x) λk. x. k(x) żadna Marysia λk. x. Marysia(x) k(x) λk. x. Marysia(x) k(x) żaden λm. λk. x. m(x) k(x) λm.λk. x. m(x) k(x) W ostatnim wierszu tabeli występuje aplikacja m(x), z czego wynika, że wcześniejsze znaczenie frazy rzeczownikowej Marysia nie może być konkretną wartością. Ponadto mogą wyniknąć problemy, gdybyśmy chcieli w przyszłości uwzględnić przetwarzanie wyrażeń w stylu żaden ktoś lub żaden nikt (niezależnie od tego, co one miałyby znaczyć). W związku z tym, frazy rzeczownikowe zostały wzbogacone o dodatkowe znaczenie, znaczenie predykatowe jest ono predykatem, który jest prawdziwy tylko i wyłącznie dla obiektów opisywanych przez to wyrażenie. W ten sposób słowu żaden można przypisać następujące znaczenia (odpowiednio podmiotowe i dopełnieniowe): λm. λk. x. znaczeniepodmiotowepredykatowe(m)(x) k(x) λm. λk. x. znaczeniedopelnieniowepredykatowe(m)(x) k(x) 4

Kluczowym elementem przy opracowywaniu semantyki było zapewnienie, aby pomimo wielu fraz wprowadzających negację, w końcowym zdaniu negacja pojawiła się tylko raz. Wynik ten uzyskiwany jest poprzez odpowiednie znacznia czasowników. Ponieważ słowa wprowadzające negacje implikują negację któregoś czasownika (lub słów pochodnych), znaczenie tego właśnie wyrazu pozwoli na odpowiednie zarządzanie negacją. Zastosowaną strategię najłatwiej wyjaśnić na przykładzie: Żaden Adam nie pisał niczego używając pióra. Żaden Adam nie pisał niczego używając pióra. x. Adam(x) y. Pisać(x, y, Pióro) żaden Adam znaczenie podmiotowe: λk. x. Adam(x) k(x) znaczenie dopełnieniowe: λk. x. Adam(x) k(x) żaden zn. podmiotowe: λm. λk. x. znpodmiotowepredykatowe(m)(x) k(x) zn. dopełnieniowe: λm. λk. x. zndopelnieniowepredykatowe(m)(x) k(x) Adam znaczenie zwykłe: λk. k(adam) znaczenie predykatowe λx. Adam(x) nie pisał niczego używając pióra λa. znaczeniepodmiotowezwykle(a)(λa. y. Pisać(a, y, Pióro)) nie pisał λn. λo. λa. znaczeniepodmiotowezwykle(a)(λa. znaczeniedopelnieniowezwykle(n)(λn. ) znaczniedopelnieniowezwykle(o)(λo. ) Pisać(a, o, n ) ) niczego znaczenie podmiotowe: λk. x. k(x) znaczenie dopełnieniowe: λk. x. k(x) używając pióra znaczenie zwykłe: λk. k(pióro) znaczenie predykatowe: λx.pióro(x) (w tym przypadku imiesłów używając zachowuje się podobnie do przyimka i jest usuwany wcześniej, przy parsowaniu przez reguły syntaktyczne) Zastosowana strategia działa nawet w przypadku czasowników podwójnie przechodnich: Marek nie dał Marysi Kwiatów Dać(Marek, Marysia, Kwiaty) Marek nie dał nikomu Kwiatów x. Dać(Marek, x, Kwiaty) Marek nie dał Marysi niczego y. Dać(Marek, Marysia, y) Marek nie dał nikomu niczego x. y. Dać(Marek, x, y) 5

Niestety, zaproponowane podejście nie sprawdza się uniwersalnie. Po dodaniu słów w stylu wszyscy, zdanie Marek nie dał wszystkim niczego jest rozumiane nieregularnie (pojawia się dodatkowa negacja dla słowa niczego) jako zamiast przewidywanego x. y. Dać(Marek, x, y) x. y. Dać(Marek, x, y) W prawdzie pozostałe osiem przypadków jest rozpoznawanych poprawnie, jednak ten jeden wymyka się spod kontroli i w tej chwili autor nie wie, czy da się go rozpatrzeć w spójny, jednolity sposób. 4 Podsumowanie W artykule opisano najważniejsze zjawiska dotyczące uzgodnień i semantyki słów wprowadzających negację w języku polskim. Zaprezentowano szkic gramatyki zaimplementowanej w środowisku Separ[1] oraz budowę wyrażeń semantycznych otrzymywanych przez parser. Jako reprezentatywne wybrano słowa nikt, nic oraz żaden. Projekt uwzględnia propagację negacji, a także występujące dla niej bariery. Ponadto dodano obsługę zjawiska dopełniacza negacji, czyli zmianę przypadków z biernika na dopełniacz dla zanegowanych czasowników. Jedynym nierozwiązanym problemem jest nieregularne zachowanie się negacji w znaczeniu zdań postaci α czasownikdwuprzechodni wszyscy nic. Inne możliwe rozszerzenia to m.in. dodanie alternatywnych znaczeń dla nikt, nic, etc., obsługa pytań, dodanie semantyki dla wyrażeń czasowych wprowadzających negację (nigdy, żadnego wieczoru) oraz dozwolenie nic w zdaniach postaci Nic nie widzę (zamiast Niczego nie widzę). Literatura [1] D. Leniowski, Automatyczna analiza semantyczna tekstu w ję zyku naturalnym, studium przypadku, Master s thesis, Uniwersytet Warszawski, Warszawa, 2010. [2] A. Przepiórkowski and A. Kupść, Negative concord in Polish, Tech. Rep. 828, Institute of Computer Science, Polish Academy of Sciences, feb 1997. 6