Wstęp. Psycholingwistyka



Podobne dokumenty
WordNet. Leksykograficzny słownik języka angielskiego obecnie w wersji 3.1

030 PROJEKTOWANIE BAZ DANYCH. Prof. dr hab. Marek Wisła

Zagadnienia (1/3) Data-flow diagramy przepływów danych ERD diagramy związków encji Diagramy obiektowe w UML (ang. Unified Modeling Language)

domykanie relacji, relacja równoważności, rozkłady zbiorów

Wprowadzenie. Teoria automatów i języków formalnych. Literatura (1)

Bazy danych TERMINOLOGIA

SEMANTYCZNE ZNACZNIKOWANIE ARTYKUŁÓW WIKIPEDII SYNSETAMI SŁOWNIKA WORDNETA 1

Pojęcie bazy danych. Funkcje i możliwości.

Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu

Laboratorium 6 DIAGRAM KLAS (Class Diagram)

I. DLACZEGO I DLA KOGO NAPISAŁEM TĘ KSIĄŻKĘ? II. JĘZYK OSOBNICZY A JĘZYK SYTUACYJNY...

Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.

Ekstrakcja informacji oraz stylometria na usługach psychologii Część 2

Wprowadzenie do logiki Język jako system znaków słownych

2

Baza danych. Baza danych to:

KRYTERIA OCEN Z JĘZYKA POLSKIEGO W KLASIE V

Projekt 4: Programowanie w logice

INFORMATYKA GEODEZYJNO- KARTOGRAFICZNA. Modelowanie danych. Model związków-encji

Diagramu Związków Encji - CELE. Diagram Związków Encji - CHARAKTERYSTYKA. Diagram Związków Encji - Podstawowe bloki składowe i reguły konstrukcji

Metodologia prowadzenia badań naukowych Semiotyka, Argumentacja

Bazy danych. Zachodniopomorski Uniwersytet Technologiczny w Szczecinie. Wykład 3: Model związków encji.

Wstęp do Sztucznej Inteligencji

Komputerowe Systemy Przemysłowe: Modelowanie - UML. Arkadiusz Banasik arkadiusz.banasik@polsl.pl

Rozwiązywanie dysambiguacji za pomocą lingwistycznej sieci symantycznych relacji leksykalnych na przykładzie systemu WordNet

I. DLACZEGO I DLA KOGO NAPISAŁEM TĘ KSIĄŻKĘ? II. JĘZYK OSOBNICZY A JĘZYK SYTUACYJNY...

hierarchie klas i wielodziedziczenie

Logika Stosowana. Wykład 7 - Zbiory i logiki rozmyte Część 3 Prawdziwościowa logika rozmyta. Marcin Szczuka. Instytut Informatyki UW

Wykład 4 Logika dla prawników. Nazwy, Relacje między zakresami nazw, Podział logiczny, Definicje

Gramatyki atrybutywne

Andrzej Wiśniewski Logika II. Wykłady 10b i 11. Semantyka relacyjna dla normalnych modalnych rachunków zdań

Wymagania edukacyjne-język angielski Klasa VII-English Class-poziom A2plus

Bazy Danych. C. J. Date, Wprowadzenie do systemów baz danych, WNT - W-wa, (seria: Klasyka Informatyki), 2000

LOGIKA I TEORIA ZBIORÓW

Słowosiec leksykalna siec semantyczna je zyka polskiego i jej zastosowania

Internet Semantyczny i Logika II

Tychy, plan miasta: Skala 1: (Polish Edition)

Kryteria ocen - język angielski - klasa V Project 2

Modelowanie hierarchicznych struktur w relacyjnych bazach danych

Znaczenia złapane w sieć

Wstęp do Techniki Cyfrowej... Teoria automatów

Paweł Kurzawa, Delfina Kongo

Z punktu widzenia kognitywisty: język naturalny

Bazy danych. Plan wykładu. Zależności funkcyjne. Wykład 2: Relacyjny model danych - zależności funkcyjne. Podstawy SQL.

mgr Anna Dziuba Uniwersytet Wrocławski mgr Anna Dziuba

Narzędzia do automatycznego wydobywania kolokacji

BAZY DANYCH model związków encji. Opracował: dr inż. Piotr Suchomski

problem w określonym kontekście siły istotę jego rozwiązania

Modelowanie konceptualne model EER

Paradygmaty dowodzenia

< K (2) = ( Adams, John ), P (2) = adres bloku 2 > < K (1) = ( Aaron, Ed ), P (1) = adres bloku 1 >

UML w Visual Studio. Michał Ciećwierz

Słowosiec leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa

Badania eksploracyjne Badania opisowe Badania wyjaśniające (przyczynowe)

Wstęp do przetwarzania języka naturalnego. Wykład 10 Zaawansowana wektoryzacja i klasyfikacja

Język UML w modelowaniu systemów informatycznych

Normalizacja baz danych

Blow-Up: Photographs in the Time of Tumult; Black and White Photography Festival Zakopane Warszawa 2002 / Powiekszenie: Fotografie w czasach zgielku

Technologie baz danych

1 Projektowanie systemu informatycznego

W poszukiwaniu sensu w świecie widzialnym

Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska

SSW1.1, HFW Fry #20, Zeno #25 Benchmark: Qtr.1. Fry #65, Zeno #67. like

Diagramy ERD. Model struktury danych jest najczęściej tworzony z wykorzystaniem diagramów pojęciowych (konceptualnych). Najpopularniejszym

Metody Kompilacji Wykład 3

Projektowanie Zorientowane na Dziedzinę. ang. Domain Driven Design

Wykład 2. Relacyjny model danych

Rachunek logiczny. 1. Język rachunku logicznego.

Bazy danych. dr inż. Andrzej Macioł

Narzędzia do automatycznego wydobywania kolokacji

Język angielski. Poziom rozszerzony Próbna Matura z OPERONEM i Gazetą Wyborczą CZĘŚĆ I KRYTERIA OCENIANIA ODPOWIEDZI POZIOM ROZSZERZONY CZĘŚĆ I

WYMAGANIA EDUKACYJNE Z JĘZYKA ANGIELSKIEGO do podręcznika New English Adventure 1

Wyszukiwanie informacji w internecie. Nguyen Hung Son

Kryteria oceniania z języka angielskiego dla klasy 6

BOGDAN ZARĘBSKI ZASTOSOWANIE ZASADY ABSTRAKCJI DO KONSTRUKCJI LICZB CAŁKOWITYCH

Technologie baz danych

Słowosiec leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa

(4) x (y z) = (x y) (x z), x (y z) = (x y) (x z), (3) x (x y) = x, x (x y) = x, (2) x 0 = x, x 1 = x

1. Funkcje monotoniczne, wahanie funkcji.

Wymagania edukacyjne na poszczególne stopnie szkolne z języka angielskiego w klasie VII

ANALIZA WYNIKÓW PRÓBNEGO EGZAMINU GIMNAZJALNEGO-ROK SZKOLNY 2015/2016 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI

WYMAGANIA EDUKACYJNE Z JĘZYKA ANGIELSKIEGO DLA KLAS III ODDZIAŁÓW GIMNAZJALNYCH

Wymagania edukacyjne Ocena dopuszczająca Ocena dostateczna Ocena dobra Ocena bardzo dobra Ocena celująca

Internet Semantyczny. Wstęp do OWL 2

Analiza i projektowanie systemów informatycznych. Analiza systemowa

Modelowanie i Programowanie Obiektowe

Dariusz Brzeziński. Politechnika Poznańska, Instytut Informatyki

WYMAGANIA EDUKACYJNE

WYMAGANIA EDUKACYJNE Z JĘZYKA ANGIELSKIEGO DO KLASY 1 SZKOŁY PODSTAWOWEJ PODRĘCZNIK New English Adventure 1

AUTOMATYCZNA KLASYFIKACJA RZECZOWNIKÓW DO GRUP SEMANTYCZNYCH NA PODSTAWIE KORPUSU TEKSTÓW

Projektowanie bazy danych

Proces badawczy schemat i zasady realizacji

Pojęcie systemu informacyjnego i informatycznego

Stargard Szczecinski i okolice (Polish Edition)

6. Algorytmy ochrony przed zagłodzeniem dla systemów Linux i Windows NT.

Filozofia z elementami logiki Język jako system znaków słownych część 2

Wrota Parsęty II o bazie danych przestrzennych - wprowadzenie

Np. Olsztyn leży nad Łyną - zdanie prawdziwe, wartość logiczna 1 4 jest większe od 5 - zdanie fałszywe, wartość logiczna 0

Transkrypt:

Mikołaj Gierulski

Wstęp Psycholingwistyka Zajmuje się psychologiczną bazą funkcjonowania języka, tzn. tym jak język jest przetwarzany przez człowieka (źródło - http://pl.wikipedia.org/wiki/psycholingwistyka) Poniższa prezentacja opisuje koncepcje stosowane w systemie WordNet, ale również badania i analizy z zakresu psycholingwistyki. Ponieważ system WordNet zbudowany jest w języku angielskim, przykłady nie będą tłumaczone na polski.

Co to jest WordNet Prace nad projektem WordNet rozpoczęto 1985 roku w Princeton. Celem powstającego projektu było dostarczenie narzędzia ułatwiającego koncepcyjne (a nie alfabetyczne) przeszukiwanie słownika. (http://www.cogsci.princeton.edu/~wn/) W miarę rozwoju projektu cel wyewoluował do znacznie bardziej wyrafinowanego stworzenie językowego systemu bazodanowego opartego na teoriach psycholingwistycznych dotyczących ludzkiej pamięci leksykalnej. Inaczej: jest to obszerny zbiór semantycznych zależności pomiędzy słowami w języku angielskim.

Czym WordNet nie jest WordNet nie jest słownikiem języka angielskiego, jego celem nie jest szczegółowe objaśnienie znaczenia danego słowa. WordNet nie jest próbą opisu rzeczywistości za pomocą języka angielskiego. WordNet jest projektem, w którym celem nie jest zamodelowanie wiedzy zawartej w języku.

Co to jest WordNet WordNet ma na celu zamodelowanie pamięci leksykalnej. WordNetmoże przypominać wyrafinowany słownik wyrazów bliskoznacznych, jest to jednak tylko część jego pełnej funkcjonalności. WordNet, w przeciwieństwie do typowego słownika, organizuje słowa pod względem znaczenia, a nie budowy.

Semantyka leksykalna Każde słowo jest powiązaniem znaczeniowego pojęcia i wyrażenia pełniącego rolę syntaktyczną. Niech semantyka leksykalna będzie mapowaniem pomiędzy formą słowa a znaczeniem słowa. Formy słowa Znaczenia słowa F1 F2 F3... Fn Z1 E 1,1 E 1,2 Z2 E 2,2 Z3 E 3,3...... Zm E m,n F1 i F2 są synonimami, a F2 jest wieloznaczne. Widać, że mapowanie jest postaci wiele do wiele.

Reprezentacja znaczeń w WordNecie Jak reprezentować znaczenia słów? Za pomocą definicji. Czym są definicje? Teoria konstruktywna definicja zawiera wystarczające informacje do jednoznacznego zidentyfikowania (skonstruowania) pojęcia wg. badaczy bardzo trudne do zrealizowania w praktyce, np. definicje słownikowe nie spełniają wymagań tej teorii. Teoria różnicowa (differential) definicja służy do jednoznacznego rozróżnienia pojęć (np. poprzez symbole) wystarczająca, jeśli dane znaczenie jest znane użytkownikowi

Reprezentacja znaczeń w WordNecie Znaczenia są reprezentowane w drugi z wymienionych sposobów. Każde znaczenie jest jednoznacznie reprezentowane przez zbiór słów (synonimów), z którymi jest związane Np. dwa ze znaczeń słowa board reprezentowane są przez zbiory: {board, plank} {board, committee} Takie zbiory synonimów będziemy nazywać synsetami. Są to podstawowe jednostki semantyczne w WordNecie.

Synsety Synsety nie objaśniają, co znaczy dane pojęcie. Pokazują jedynie, że dane pojęcie istnieje. Czasem nie istnieją synonimy dla słowa w danym znaczeniu. Wtedy dołącza się do niego krótkie objaśnienie konkretyzujące dane pojęcie {board, (a person s meals, provided regularly for money)} Objaśnienie nie ma na celu stworzenia nowego pojęcia u osoby, która go nie zna, a jedynie wyjaśnienie, które ze znaczeń dany synset reprezentuje.

Struktura WordNet WordNet składa się ze zbioru synsetów oraz związków między nimi. Związki pomiędzy synsetami to relacje leksykalne i semantyczne. Są to m.in.: Jednoznaczność (Synonymy) Przeciwieństwo (Antonymy) Hiponimia (Hyponymy) Przynależność (Meronymy) Relacje morfologiczne

Jednoznaczność Podobieństwo znaczeniowe jest jedną z podstawowych relacji w WordNet. Istnieje definicja mówiąca, że dwa wyrażenia są synonimami, jeśli podstawienie jednego za pomocą drugiego nigdy nie zmieni prawdziwości danego zdania. Takie synonimy występują nader rzadko. Ta definicja jest dla nas zbyt mocna, dlatego skorzystamy z innej: wyrażenia są synonimami w kontekście C, jeśli podstawienie jednego za drugie kontekście C nie zmieni prawdziwości zdania. Np.: podstawienia board za plank praktycznie zawsze można dokonać w kontekście stolarstwa, ale istnieją konteksty, w których nie miałoby ono sensu.

Jednoznaczność Taka definicja jednoznaczności wymusza podział zbioru słów na rzeczowniki, czasowniki, przymiotniki i przysłówki. Podział taki jest naturalny dla człowieka. Badania psycholingwistyczne dowodzą, że taki podział występuje w leksykalnej pamięci ludzkiej.

Przeciwieństwo (Antonymy) Relacja leksykalna, zachodzi pomiędzy formami leksykalnymi, a nie pomiędzy pojęciami Relacja bardzo trudna do zdefiniowania. Przykład: Zarówno {rise, ascend}, jak i {fall, descend} mają przeciwne znaczenie, ale nie są antonimami, natomiast [rise/fall] oraz [ascend/descend] to już antonimy. Relacja pomiędzy antonimami stanowi podstawową konstrukcję sieci zależności przymiotników i przysłówków w WordNecie i jest odróżniona od zwykłego przeciwieństwa znaczeniowego.

Hiponimia (hyponymy/isa) Semantyczna relacja pomiędzy pojęciami Oznacza bycie rodzajem czegoś, np. drzewo jest rodzajem rośliny klon jest rodzajem drzewa Relacja przechodnia i antysymetryczna Wyznacza podstawową strukturę organizacji rzeczowników w WordNet.

Przynależność (meronymy) Oznacza bycie częścią czegoś (A y has an x (as a part)./an x is a part of y) Jest przechodnia (z pewnymi zastrzeżeniami) i antysymetryczna

Relacje morfologiczne Stanowią znaczną część relacji językowych Początkowo w ogóle nie brane pod uwagę w projekcie Wymuszone ze względów praktycznych (patrz przykład) Zaimplementowane na poziomie interfejsu do bazy. Przykład: zapytanie o trees powinno zwrócić wszystkie odpowiedzi dotyczące tree, ale bez uwzględnionych relacji morfologicznych nic nie zwróci.

Rzeczowniki

Rzeczowniki system dziedziczenia Rzeczowniki (synsety) zorganizowane są w struktury (prawie) drzewiaste. Struktury drzew wyznacza relacja ISA (x is a (kind of) y) Oznacza się ją przez @ oak @ tree @ plant @ organism ISA jest symetryczna. Relację specjalizacji oznacza się przez Struktura zależności rzeczowników tworzy LIS (Lexical Inheritance System)

Podział rzeczowników Wszystkie synsety podzielone są na kategorie. Każda kategoria wywodzi się o jednego, najogólniejszego synsetu korzenia. Zdecydowano nie wyprowadzać wszystkich kategorii z jednego nienaturalnego metakorzenia. Drzewa są dość płytkie, zwykle nie przekraczają głębokości 10 poziomów. Istnieją (rzadkie) krawędzie pomiędzy drzewami.

Korzenie Wyodrębnione zostały następujące korzenie: {act, action, activity} {natural object} {animal, fauna} {natural phenomenon} {artifact} {person, human being} {attribute, property} {plant, flora} {body, corpus} {possession} {cognition, knowledge} {process} {communication} {quantity, amount} {event, happening} {relation} {feeling, emotion} {shape} {food} {state, condition} {group, collection} {substance} {location, place} {time} {motive}

Cechy szczególne Synsety są rozróżnialne także poprzez ich cechy szczególne. Wyróżnione cechy szczególne to: Atrybuty Części Funkcje Atrybuty odwołują się do przymiotników. Części odwołują się do rzeczowników. Funkcje odwołują się do czasowników. Odnośniki do czasowników i rzeczowników zostały zaimplementowane, ale nie wprowadzone do bazy danych.

Objaśnienia W późniejszej fazie projektu do synsetów dołączono także krótkie objaśnienia w stylu słownikowym, jako elementy zbioru synsetów Przykład: hierarchia dla {artifact} zawierająca case {carton, case0, box,@ (a box made of cardboard; opens by flaps on the top)} {case1, bag,@ (a portable bag for carrying small objects)} {case2, pillowcase, pillowslip, slip2, bed linen,@ (a removable and washable cover for a pillow)} {bag1, case3, grip, suitcase, traveling bag,@ (a portable rectangular traveling bag for carrying clothes)} {cabinet, case4, console, cupboard,@ (a cupboard with doors and shelves)} {case5, container,@ (a small portable metal container)} {shell, shell plating, case6, casing1, outside surface,@ (the outer covering or housing of something)} {casing, case7, framework,@ (the enclosing frame around a door or window opening)}

Przynależność (meronymy) Relacja całość-część. Jest przedstawiana poprzez cechę parts synsetów. Jest dziedziczona w dół drzewa ISA. Jest przechodnia (ale tylko do pewnego stopnia).

Przechodniość relacji przynależności Przechodniość wydaje się być w wielu przypadkach mocno ograniczona, np.: klamka jest częścią drzwi, a drzwi częścią domu, jednak zdanie Dom ma klamkę jest nienaturalne. gałąź jest częścią drzewa, a drzewo częścią lasu, ale Gałąź jest częścią lasu jest nienaturalne. Zaproponowano podejście, wg. którego relacje gałąź/drzewo i drzewo/las, nie są tymi samymi relacjami.

Relacje przynależności Wyróżniono sześć różnych typów relacji przynależności: componnent-object (branch/tree) member-collection (tree/forest) portion-mass (slice/cake) stuff-object (aluminum/airplane) feature-activity (paying/shopping) place-area (Princeton/New Jersey) Trzy typy zostały zamieszczone w WordNecie: Wm #p Wh component(wm)-object(wh) Wm #m Wh member(wm)-collection(wh) Wm #s Wh stuff(wm)-object(wh)

Funkcje Opisują czynności lub funkcje, jakie dane pojęcie wykonuje lub spełnia Zwykle dobrze charakteryzują znaczenie danego pojęcia. Są jedynymi cechami pojęć abstrakcyjnych, np.: synset {ornament, decoration} może być nieokreślonego rozmiaru lub kształtu, nie posiada atrybutów, jest jedynie definiowany przez funkcję, jaką ma spełniać.

Antonimy Relacja najistotniejsza pod względem psychologicznym Nie jest kluczowa dla organizacji elementów WordNeta, ale w nim występuje. Przykład: { [man, woman,!], person,@... (a male person) } { [woman, man,!], person,@... (a female person) }

Przykład reprezentacja trzech semantycznych relacji.

Dane liczbowe W roku 1993 WordNet zawierał ok. 57 000 rzeczowników pogrupowanych w ok. 48 000 synsetów.

Czasowniki

Czasowniki Charakteryzują się znacznie większą wieloznacznością, niż rzeczowniki Collins English Dictionary zawiera 43,636 rzeczowników, a tylko 14,190 czasowników Na rzeczownik przypada ok. 1,74 znaczeń, a na czasownik 2,11.

Czasowniki w WordNet Są przechowywane w synsetach, charakteryzujących ich znaczenie, np.: {beat, strike, hit} {beat, flatten} {beat, throb, pulse} {beat, defeat} {beat, flog, punish} {beat, circumvent (the system)} {beat, shape, do metalwork} {beat, baffle} {beat,stir,whisk} {beat, mark}

Synsety czasowników Aby zwiększyć czytelność i jednoznaczność synsetów, powinny zawierać referencje do rzeczowników, do których czasowniki z danego synsetu się odnoszą opcja obecnie niezaimplementowana.

Czasowniki w WordNet WordNet zawiera ok. 21 000 form czasownikowych, pogrupowanych w ok. 8400 synsetów (w tym tzw. phrasal verbs, jak look up czy fall back) Synsety pogrupowane są w 15 plikach. 14 z nich dotyczy konkretnych grup semantycznych. 1 plik zawiera synsety dotyczące stanu (np. belong, resemble). Synsety z tego pliku nie tworzą grupy semantycznej.

Synsety czasownikowe Występuje bardzo mało prawdziwych synonimów czasownikowych (np. shut, close). Istnieje natomiast duża grupa słów o podobnym znaczeniu, ale nie wymiennych (np. begin-commence, end-terminate, rise-ascend, blinknictate, behead-decapitate, spit-expectorate) W większości w skład synsetów wchodzą peryfrazy, np. {swim,travel through water}, {mumble, talk indistinctly}, {saute, fry briefly} Obrazują one często proces słowotwórczy, np. {whiten, become white}, {enrich, make rich}

Dekompozycja, a model relacyjny Dekompozycja polega na badaniu czasowników poprzez rozbiór ich na części składowe, np. zbiór bazowych czasowników i przymiotniki. Podejście relacyjne bada język, jako zbiór istniejących rekordów powiązanych relacjami, nadającymi sens poszczególnym elementom. Struktura WordNetu jest znacznie bliższa drugiemu podejściu, choć zawiera pewne elementy pierwszego (pogrupowanie czasowników w semantyczne domeny wywodzące się od pojęć bazowych)

Relacje między czasownikami Podstawową relacją narzucającą strukturę synsetów czasownikowych w WordNet jest relacja pociągania /implikacji (Lexical Entailment)

Lexical Entailment Odpowiednik logicznej implikacji Zachodzi pomiędzy V1 i V2, jeśli stwierdzenie Someone V1 pociąga za sobą prawdziwość stwierdzenia Someone V2 mówimy wtedy, ze V1 pociąga za sobą V2 Przykład (snore/sleep) He is snoring Pociąga za sobą He is sleeping

Lexical Entailment Jest to relacja antysymetryczna (za wyjątkiem synonimów) Pomiędzy elementami może zachodzić tymczasowe zawieranie Kierunek zawierania nie jest zawsze ten sam, np.: snore pociąga za sobą sleep i się w nim zawiera, natomiast buy pociąga za sobą pay i jednocześnie je zawiera Jeśli V1 pociąga za sobą V2 oraz zachodzi między nimi częściowe zawieranie, to zachodzi pomiędzy nimi związek całość-część.

Troponymy Jest odpowiednikiem ISA dla czasowników Zachodzi pomiędzy V1 i V2 jeśli To V1 is to V2 in some particular manner np. to limp is to walk in a certain manner Jest szczególnym podzbiorem relacji pociągania (entilement) Pary w tej relacji mają zawsze wspólny zasięg

Entailment - podział

Klasyfikacja czasowników Struktura grafów czasowników jest znacznie bardziej krzaczasta niż rzeczowników Drzewa zwykle mają nie więcej niż 4 poziomy W każdej hierarchii wyróżnia się pewien poziom najsilniejszego rozbudowania

Przeciwstawność Relacja bardzo ważna psychologicznie także w przypadku czasowników Niekoniecznie wyrazy o przeciwnym znaczeniu są antonimami (rise/fall, ascend/descend, rise/descend) Niekoniecznie antonimy mają przeciwne znaczenie (walk/run) Wiele antonimów współdzieli wyraz w relacji pociągania, np. hit/miss, obydwa pociągają aim Współdzielony wyraz w tej relacji oznacza zwykle sekwencję czynności (brak tymczasowego zawierania) (try jest przed fail/succeed, play przed win/lose)

Wsteczna presupozycja Informacja zawarta nie bezpośrednio w wypowiedzi, ale milcząco w niej założona Jest również istotnym podzbiorem relacji pociągania Wyklucza relację całość-część

Entailment - podział

Relacja przyczyny WordNet zawiera informacje o parach relacji przyczynowo-skutkowej. (np. {teach, instruct, educate} i {learn, acquire knowledge}) W przeciwieństwie do relacji pociągania, nie jest ona dziedziczona przez troponimy. Czasowniki przyczynowe należą do grupy cause to be/become/happen/have lub cause to do. Przeprowadzają one czasowniki do grupy stanów lub akcji np. give, teach prowadzą do stanów have, know a feed do czynności eat

Przyczyna i pociąganie Jeśli V1 jest przyczyną V2, to V2 pociąga za sobą V1. Związek ten charakteryzuje się brakiem tymczasowego zawierania (expel/leave)

Pełny model relacyjny dla czasowników

Przymiotniki WordNet zawiera ok. 19 500 przymiotników pogrupowanych w ok. 10 000 synsetów Przymiotniki podzielone są na grupy Opisowe (heavy, high) Zmieniające punkt odniesienia (reference modifying) (former, present, alleged, likely) Kolory (black, yellow) Związane z pojęciem (dental hygiene, atomic bomb)

Przymiotniki opisujące Powiązane znaczeniowo (synsety) Powiązane antonimy Powiązanie bipolarne

Źródła http://www.cogsci.princeton.edu/~wn/ Dokumenty znane jako 5 papers on wordnet : Introduction to WordNet: An On-line Lexical Database George A. Miller, Richard Beckwith, Christiane Fellbaum, Derek Gross, Katherine Miller Nouns in WordNet: A Lexical Inheritance System George A. Miller Adjectives in WordNet Christiane Fellbaum, Derek Gross, Katherine Miller English Verbs as a Semantic Net Christiane Fellbaum Design and Implementation of the WordNet Lexical Database and Searching Software Richard Beckwith, George A. Miller, Randee Tengi

Koniec

Jakieś pytania? Koniec