Słowosiec leksykalna siec semantyczna je zyka polskiego i jej zastosowania

Podobne dokumenty
Słowosieć - polskie zasoby leksykalne i możliwość ich wykorzystania

Narzędzia do automatycznego wydobywania kolokacji

Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych

Automatyczne rozpoznawanie polskich leksykalnych relacji derywacyjno-semantycznych

Narzędzia do automatycznego wydobywania kolokacji

Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych

Narzędzia do wydobywania słowników związków frazeologicznych i terminów

Słowosiec leksykalna siec semantyczna języka polskiego i jej zastosowania

Słowosiec leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa

Open Access w technologii językowej dla języka polskiego

Słowosiec leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa

Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych

S owosiec leksykalna siec semantyczna jezyka polskiego i jej zastosowania

Program warsztatów CLARIN-PL

Słowosieć leksykalna sieć semantyczna języka polskiego i jej zastosowania

Słowosieć leksykalna sieć semantyczna języka polskiego i jej zastosowanie w analizie znaczeń

I. DLACZEGO I DLA KOGO NAPISAŁEM TĘ KSIĄŻKĘ? II. JĘZYK OSOBNICZY A JĘZYK SYTUACYJNY...

JEDNOSTKI WIELOWYRAZOWE. PROCEDURA SPRAWDZANIA LEKSYKALNOŚCI POŁĄCZEŃ WYRAZOWYCH. Seria: PRE nr 11

Słowosiec leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen

Wstęp do Językoznawstwa

I. DLACZEGO I DLA KOGO NAPISAŁEM TĘ KSIĄŻKĘ? II. JĘZYK OSOBNICZY A JĘZYK SYTUACYJNY...

Marta Dobrowolska, Agnieszka Dziob, Bożena Hojka, Amelia Kiełbawska, Justyna Ławniczak, Marek Maziarz, Maciej Piasecki, Stanisław Szpakowicz

Narzędzia do automatycznej analizy semantycznej tekstu na poziomach: leksykalnym i struktur

4. Zaimek wskazujący Zaimek względny Zaimek pytający Zaimek nieokreślony 55

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2014/2015

Ekstrakcja informacji oraz stylometria na usługach psychologii Część 2

CLARINPL. wielka infrastruktura badawcza technologii językowych dla nauk humanistycznych i społecznych CLARIN-PL. Jan Wieczorek Maciej Piasecki

ANALIZA WYNIKÓW PRÓBNEGO EGZAMINU GIMNAZJALNEGO- ROK SZKOLNY 2017/2018 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI

PODSTAWOWE WIADOMOŚCI Z GRAMATYKI POLSKIEJ I WŁOSKIEJ SZKIC PORÓWNAWCZY

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016

Spis treści tomu pierwszego

Spis treści 5. Spis treści. Przedmowa Przedmowa do wydania II Część pierwsza MORFOLOGIA

WK, FN-1, semestr letni 2010 Tworzenie list frekwencyjnych za pomocą korpusów i programu Poliqarp

SPIS TREŚCI

Zaawansowane narzędzie do analizy korpusu w oparciu o reguły

PRÓBNY EGZAMIN GIMNAZJALNY Z NOWĄ ERĄ 2015/2016 JĘZYK POLSKI

NaCoBeZu na co będę zwracać uwagę. Wymagania do cyklu lekcji dotyczących składni

Kategorie imienne polszczyzny

CLARIN-PL wielka infrastruktura badawcza technologii językowych dla nauk humanistycznych i społecznych

CLARIN rozproszony system technologii językowych dla różnych języków europejskich

OPIS MODUŁU (PRZEDMIOTU), PROGRAMU NAUCZANIA ORAZ SPOSOBÓW WERYFIKACJI EFEKTÓW KSZTAŁCENIA CZEŚĆ A OPIS MODUŁU (PRZEDMIOTU) studia pierwszego stopnia

Rozwiązywanie dysambiguacji za pomocą lingwistycznej sieci symantycznych relacji leksykalnych na przykładzie systemu WordNet

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2016/2017

Kategorie gramatyczne polszczyzny

Opis relacji leksykalno-semantycznych w Słowosieci 2.0. Rzeczownik Joanna Rabiega-Wiśniewska, Marek Maziarz, Maciej Piasecki, Stanisław Szpakowicz

SZCZEGÓŁOWE WYMAGANIA EDUKACYJNE Z JĘZYKA ANGIELSKIEGO DLA KLAS 5-6 ROK SZKOLNY 2017/2018

KRYTERIA OCENY ROCZNEJ Z JĘZYKA POLSKIEGO W KLASIE IV

Cele kształcenia wymagania ogólne

Słowosieć jako narzędzie wspomagające pracę tłumacza

Obrazkowy Test Słownikowy Rozumienie (OTSR): wystandaryzowane i znormalizowane narzędzie do oceny zasobu słownictwa dzieci w wieku 2-6 lat

Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex

Liczba procentowa zdobytych punktów. 0 39% niedostateczny % dopuszczający % dostateczny % dobry % bardzo dobry

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2016/2017

Sprawdzian kompetencji językowych do klasy dwujęzycznej z językiem angielskim

Wymagania edukacyjne z języka angielskiego dla klasy II gimnazjum. Ocenę dopuszczającą otrzymuje uczeń, który: OSIĄGNIĘCIA

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2018/2019

Klasyfikacja tradycyjna Klasyfikacja Zygmunta Saloniego Przykład analizy. Części mowy. Anna Kozłowska. Uniwersytet Kardynała Stefana Wyszyńskiego

Wymagania na ocenę celującą (6) z języka angielskiego dla klasy czwartej

PRZEWODNIK PO PRZEDMIOCIE RODZAJ ZAJĘĆ LICZBA GODZIN W SEMESTRZE WYKŁAD ĆWICZENIA LABORATORIUM PROJEKT SEMINARIUM 30

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2018/2019

Welttour Deutsch 2 plan wynikowy ze szczegółowymi kryteriami oceniania

JEZIORO, ŁÓDKA, CHMURA CO MOŻE WYNIKAĆ Z ICH KOMBINACJI?

Analiza wyników egzaminu gimnazjalnego 2016 r. Test humanistyczny język polski

ŹRÓDŁA INFORMACJI O RYNKU. Dane pierwotne Dane wtórne

ANALIZA WYNIKÓW PRÓBNEGO EGZAMINU GIMNAZJALNEGO-ROK SZKOLNY 2015/2016 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI

CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy

Rozdział 1 Klasyczny język japoński wprowadzenie... 13

Klasa 4 OCENA DOSTATECZNA OCENA DOBRA OCENA BARDZO DOBRA

Wymagania edukacyjne z języka angielskiego dla klas IV-VI. Wymagania na ocenę celującą (6):

Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego

ZESTAWIENIE WYMAGAŃ EDUKACYJNYCH Z JĘZYKA ANGIELSKIEGO dla klasy V na rok szklony 2017/2018:

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016

SZCZEGÓŁOWE WYMAGANIA EDUKACYJNE Z JĘZYKA ANGIELSKIEGO DLA KLAS 4-6 ROK SZKOLNY 2015/2016

II cykl wykładów i warsztatów. CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych

Wymagania edukacyjne Język angielski Kl VI

1. Opis merytoryczny

PRZEWODNIK PO PRZEDMIOCIE RODZAJ ZAJĘĆ LICZBA GODZIN W SEMESTRZE WYKŁAD ĆWICZENIA LABORATORIUM PROJEKT SEMINARIUM 30

Analiza listów pożegnalnych w oparciu o metody lingwistyki informatycznej i klasyfikacji semantycznej tekstów

Język niemiecki. Kryteria oceny biegłości językowej w zakresie szkolnych wymagań edukacyjnych: podstawowym i ponadpodstawowym

Polskie korpusy równoległe i zasoby wielojęzyczne w projekcie CESAR

OCENIANIE PRZEDMIOTOWE. język łaciński

PRZEDMIOTOWY SYSTEM OCENIANIA Z JĘZYKA ŁACIŃSKIEGO

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2018/2019

Reprezentacja wiedzy wprowadzenie, sieci semantyczne, ramy

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2016/2017

Spis treści. ROZDZIAŁ 2 Wzajemne oddziaływanie między leksykonem a innymi środkami służącymi kodowaniu informacji... 67

WordNet. Leksykograficzny słownik języka angielskiego obecnie w wersji 3.1

Katedra Języków Specjalistycznych Wydział Lingwistyki Stosowanej U n i w e r s y t e t W a r s z a w s k i. Debiuty Naukowe. Leksykon tekst wyraz

ANALIZA WYNIKÓW EGZAMINU GIMNAZJALNEGO-ROK SZKOLNY 2016/2017 Z ZAKRESU PRZEDMIOTÓW HUMANISTYCZNYCH- JĘZYK POLSKI

Co to jest znaczenie? Współczesne koncepcje znaczenia i najważn. i najważniejsze teorie semantyczne

WebSty - otwarty sieciowy system do analizy stylometrycznej i semantycznej tekstów

Sposoby sprawdzania i oceniania osiągnięć edukacyjnych uczniów

Walenty. słownik walencyjny języka polskiego z kontrolą i koordynacją. Filip Skwarski. 5 listopada 2012 r. IPI PAN

Polacy są bardzo równomiernie podzieleni, jeśli chodzi o świadomość popełniania przez nich błędów językowych oraz zdanie, czy błędy te mogą utrudniać

czasowników - alfabet - pierwsza podróż mnogiej - czas wolny charakter -negacja - rodzina

Socjolekt polskich alpinistów. Analiza leksykalno-semantyczna słownictwa

Wymogi edukacyjne na poszczególne oceny z języka hiszpańskiego w klasie 7A, 7bw klasach ogólnych z językiem hiszpańskim

Transkrypt:

Słowosiec 3.2 - leksykalna siec semantyczna je zyka polskiego i jej zastosowania Poziom rozszerzony Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 agnieszka.dziob@pwr.edu.pl Agnieszka Dziob 2018-04-13

Relacje synsetów (przykłady) Podstawowa: hiperonimia (odwrotna hiponimia) wiąże z kategorią nadrzędną Relacja cząstkowości-całościowości: meronimia-holonimia dla rzeczowników Relacja mero-/holonimii taksonomicznej dla rzeczownika wiąże drzewo taksonomii naukowej z drzewem wiedzy potocznej Relacja dla nazw własnych: typ-egzemplarz (oznaczenie nazw własnych: NP w komentarzu) Relacje opisu związków przyczynowo-skutkowych dla czasowników: Wcześniej (przyczyna): uprzedniość i presupozycja Jednocześnie: mero-/ i holonimia czasownikowa Później (skutek): kauzacja (inchoatywność) i procesywność Relacje wielokrotności dla czasowników: dystrybutywność i iteratywność

Relacje jednostek Wybrane relacje derywacyjne: dla rzeczownika: noun-noun: żeńskość, istota młoda, nacechowanie (ekspresywność, deminutywność) noun-verb: rola (np. narzędzie drukarka narzędzie, za pomocą którego ktoś drukuje ) dla przymiotnika: adj-verb: rola (np. wędrowny taki, który wędruje ), predyspozycyjność (np. mieszkalny taki, w którym można mieszkać) adj-noun: rola-materiał (dla przymiotników materiałowych, np. drewniany taki, który jest zrobiony z drewna ) stopniowanie szczątkowy opis podyktowany względami praktycznymi (bardzo mało instancji) dla przysłówka: stopniowanie, szczątkowy opis dla czasownika: verb-noun: zawieranie roli (np. nocować to spędzać noc )

Relacje jednostek Wybrane relacje derywacyjne: aspektowość (dla czasownika; verb-verb): czysta (pomiędzy perf i imperf nie ma zmiany znaczenia) wtórna (głównie czasowniki tworzone od prefiksów znaczących) dla wszystkich części mowy: derywacyjność (obrazuje mniej regularne procesy derywacyjne)

Relacje jednostek Relacje niederywacyjne: kolokacyjność: ok. 16 tys. kolokacji przypisanych do wszystkich części mowy; relacja kolokacyjności łączy konkretne znaczenia, nie słowa relacje przeciwieństwa: antonimia (właściwa i komplementrana, konwersja) antonimia komplementarna: X jest przeciwieństwem Y i żadne Z nie jest możliwe (np. starczyć i braknąć) antonimia właściwa: X jest przeciwieństwem Y, ale jest możliwe jakieś Z (np. włączyć i wyłączyć; Z oznacza nie wykonywać żadnego działania); w tej grupie mieszczą się antonimy kulturowe (skonwencjonalizowane) a także znaczna część czasowników prefiksowanych konwersja: X do Z ma się tak samo jak Y do Z, X i Y oznaczają zmianę perspektywy (np. kupić i sprzedać)

Powiązanie z innymi zasobami MWELexicon, Word2Vec Słownik jednostek wielowyrazowych: MWELexicon https://clarin-pl.eu/dspace/handle/11321/274 opis składniowy (WCCL) jednostek wyrazowych opisanych semantycznie w Słowosieci przykład operatora WCCL: <MWE base="po polsku"> <var name="b1">po</var> <var name="b2">polski</var> </MWE>

Powiązanie z innymi zasobami MWELexicon, Word2Vec Opis semantyczny jednostek wielowyrazowych w Słowosieci jednostki niekompozycyjne semantycznie, np. czerwona kartka (w Słowosieci oznaczone jako <##DD> w komentarzu jednostki niekompozycyjne składniowo, tzn. takie, których frekwencja w korpusie wskazuje na nieseparowalność i szyk ustalony, np. płytka posadzkowa (w Słowosieci oznaczane jako <##as1dd>, <##as2dd>, <##as3dd> terminy, np. prądnica tachometryczna (oznaczone jako <##DD> w komentarzu, znaczna część z nich zawiera podane źródła <##REF>) niewielką ilość jednostek <##DS> uznanych mocą autorytetu koordynatora (funkcja pragmatyczna) <##ndd> - połączenia kompozycyjne, zostaną usunięte ze Słowosieci (zebrane w oddzielnym zasobie częstych kolokacji), bi- i trigrammy (niewielka ilość tetra- i pentagrammów), części mowy: rzeczownik, przymiotnik, przysłówek, dla czasownika tylko bigrammy z się wytyczne dla lingwistów: http://clarin-pl.eu/wp-content/uploads/2015/05/jednostkiwielowyrazowe_procecura-sprawdzania-leksykalno%c5%9bcipo%c5%82%c4%85cze%c5%84-wielowyrazowych.pdf )

Powiązanie z innymi zasobami MWELexicon, Word2Vec Usługa sieciowa wykorzystująca powiązania dystrybucyjne pomiędzy jednostkami Słowosieci (metoda wektorowa): http://ws.clarin-pl.eu/w2vdemo.shtml Lista wektorowa dla czasownika palić (nie ma usługi, proszę o kontakt)

Rejestry leksykalne Wytyczne dla lingwistów Słowosieci: http://clarin-pl.eu/wpcontent/uploads/2017/06/kwalifikator%c3%b3w-system.pdf Szczegółowe zasady: synchroniczny opis języka (słownictwo daw. jest rzadkie, archaizmów nie ma) Nienorm. tylko jeśli ma wysoką frekwencję w korpusie Środ. ograniczone do języka młodzieżowego, żargonu grup zamkniętych (np. więziennej) i zawodowych, niezrozumiałego poza tymi grupami Reg. tylko jeśli ma wysoką frekwencję w korpusie (Słowosieć nie opisuje systemowo odmian regionalnych)

Wykorzystanie WNLooma Długotrwały kontakt językowy i jego skutki leksykalne oraz semantyczne na przykładzie polskich zapożyczeń leksykalnych w jidysz - grant NCN (OPUS 11); kierownik prof. Ewa Geller (UW)

Dziękuję bardzo za uwagę Zapraszam do kontaktu: agnieszka.dziob@pwr.edu.pl