Elektroniczny tezaurus czasowników ukraińskich: problemy i metodyka układania

Podobne dokumenty
2. Wymagania wstępne w zakresie wiedzy, umiejętności oraz kompetencji społecznych (jeśli obowiązują): BRAK

Spis treści tomu pierwszego

Gramatyka opisowa języka polskiego Kod przedmiotu

W obrębie polskiego języka narodowego należy wydzielić dwa systemy:

Agnieszka Sawicka Od terminologii do słownika specjalistycznego czyli jak skonstruować słownik profesjonalisty

SYLLABUS. Leksykologia i leksykografia

Języki deskryptorowe. Dr Marek Nahotko

PRZEWODNIK PO PRZEDMIOCIE RODZAJ ZAJĘĆ LICZBA GODZIN W SEMESTRZE WYKŁAD ĆWICZENIA LABORATORIUM PROJEKT SEMINARIUM 30

studia rozpoczęte od roku akademickiego 2011/2012 Lp. Przedmiot ECTS studia niestacjonarne

O słowach kluczowych prawie wszystko

KIERUNKOWE EFEKTY KSZTAŁCENIA

Ontologie, czyli o inteligentnych danych

Nowa podstawa programowa a Europejski System Opisu Kształcenia Językowego

Katedra Języków Specjalistycznych Wydział Lingwistyki Stosowanej U n i w e r s y t e t W a r s z a w s k i. Debiuty Naukowe. Leksykon tekst wyraz

OPIS MODUŁU (PRZEDMIOTU) filologia polska. prof. dr hab. Andrzej S. Dyszak

teoretyczne zajęcia praktyczne razem N+S razem N Razem S Praktyczna nauka drugiego języka ZO

Słowa jako zwierciadło świata

Forma. Główny cel kursu. Umiejętności nabywane przez studentów. Wymagania wstępne:

Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego

KARTA PRZEDMIOTU. M2/2/7 w języku polskim Gramatyka opisowa 2 w języku angielskim Descriptive grammar 2 USYTUOWANIE PRZEDMIOTU W SYSTEMIE STUDIÓW

Szkolenie z zakresu konstrukcji umów w języku angielskim

prof. dr hab. Jadwiga Woźniak-Kasperek Instytut Informacji Naukowej i Studiów Bibliologicznych Uniwersytet Warszawski

Państwowa Wyższa Szkoła Zawodowa w Raciborzu

MINIMUM PROGRAMOWE DLA STUDENTÓW MISH od roku akademickiego 2019/2020 SPECJALNOŚĆ PRZEKŁAD I TECHNOLOGIE TŁUMACZENIOWE

PRZEWODNIK PO PRZEDMIOCIE

Kierunek studiów: LINGWISTYKA STOSOWANA Poziom kształcenia: studia I stopnia Profil kształcenia: ogólnoakademicki Forma studiów: stacjonarne

4. Zaimek wskazujący Zaimek względny Zaimek pytający Zaimek nieokreślony 55

Wydział Filologiczny

Socjolekt polskich alpinistów. Analiza leksykalno-semantyczna słownictwa

Uniwersytet Śląski w Katowicach str. 1 Wydział

Lokalne systemy klasyfikacji zbiorów funkcjonujące w Bibliotece Głównej i bibliotekach specjalistycznych Uniwersytetu Opolskiego

Elżbieta Pułka Słownik polsko-serbsko-chorwacki Serbskiej Akademii Nauk i Sztuk. Biuletyn Polonistyczny 27/3-4 (93-94),

Spis treści 5. Spis treści. Przedmowa Przedmowa do wydania II Część pierwsza MORFOLOGIA

KIERUNKOWE EFEKTY KSZTAŁCENIA

Załącznik Nr 5 do Zarz. Nr 33/11/12

WyŜsza Szkoła Europejska im. ks. Józefa Tischnera z siedzibą w Krakowie

Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych

SPIS TREŚCI

Praktyczna nauka drugiego języka obcego II

Laboratorium modelowania oprogramowania w języku UML. Ćwiczenie 4 Ćwiczenia w narzędziu CASE diagram czynności. Materiały dla nauczyciela

Punkty ECTS uzyskane w ramach specjalizacji nauczycielskiej są zaliczane do specjalizacji językoznawczej jako specjalizacji pierwszej

Angielsko-polskie i polsko-angielskie słowniki specjalistyczne ( ) Analiza terminograficzna

Szczegółowy opis przedmiotu zamówienia

KIERUNKOWE EFEKTY KSZTAŁCENIA

Uniwersytet Śląski w Katowicach str. 1 Wydział

Uniwersytet Śląski w Katowicach str. 1 Wydział

Uniwersytet Śląski w Katowicach str. 1 Wydział

Plany studiów na rok akademicki Etnolingwistyka

4 Zasoby językowe Korpusy obcojęzyczne Korpusy języka polskiego Słowniki Sposoby gromadzenia danych...

SYLLABUS. Uniwersytet Przyrodniczo-Humanistyczny w Siedlcach Wydział Humanistyczny

MODUŁ KSZTAŁCENIA: Praktyczna nauka języka angielskiego: moduł 2

Gramatyka kontrastywna polsko-angielska. III rok filologii angielskiej studia niestacjonarne I stopnia, semestr II. Profil ogólnoakademicki

Modele bezpieczeństwa logicznego i ich implementacje w systemach informatycznych / Aneta Poniszewska-Marańda. Warszawa, 2013.

Marek Świdziński Elementy gramatyki opisowej języka polskiego Uniwersytet Warszawski * Wydział Polonistyki Seria szósta, T. XXXIII Warszawa 1997

Załącznik Nr 5 do Zarz. Nr 33/11/12

PRZYGOTOWANIE PEDAGOGICZNE

Informacja o egzaminie z Praktycznej Nauki Języka Francuskiego

OPIS MODUŁU (PRZEDMIOTU) ogólnoakademicki. stacjonarne. zaliczenie z oceną. specjalizacyjny. polski

OPIS MODUŁU (PRZEDMIOTU), PROGRAMU NAUCZANIA ORAZ SPOSOBÓW WERYFIKACJI EFEKTÓW KSZTAŁCENIA CZEŚĆ A OPIS MODUŁU (PRZEDMIOTU) studia pierwszego stopnia

Technologie informacyjne - wykład 12 -

SPIS TREŚCI CZĘŚĆ I : PRZEZNACZENIE, PROCES I PODSTAWY METODOLOGICZNE BADAŃ MARKETINGOWYCH...17

Harmonogram zajęd Koło z zasadami realizowanych w projekcie Umied więcej? Fajna rzecz! Terespol 2009/2010. Prowadzący zajęcia: Anna Warakomska

PODSTAWOWE WIADOMOŚCI Z GRAMATYKI POLSKIEJ I WŁOSKIEJ SZKIC PORÓWNAWCZY

OPIS PRZEDMIOTU gramatyka opisowa języka polskiego (fleksja) / k, 1, II. prof. dr hab. Andrzej S. Dyszak

Laboratorium modelowania oprogramowania w języku UML. Ćwiczenie 5 Ćwiczenia w narzędziu CASE diagram przypadków uŝycia. Materiały dla nauczyciela

PROGRAM KURSU KWALIFIKACYJNEGO

DOTACJA NA UTRZYMANIE POTENCJAŁU BADAWCZEGO DOTACJA Wykaz planowanych do realizacji zadań badawczych, ujętych w planie zadaniowym jednostki

FILOLOGIA GERMAŃSKA Plan studiów na rok akademicki 2018/2019 Studia niestacjonarne II stopnia (magisterskie) 09-ZU-German

Efekty uczenia się na kierunku. Logistyka (studia pierwszego stopnia o profilu praktycznym)

KARTA MODUŁU KSZTAŁCENIA

ZARZĄDZANIE I INŻYNIERIA PRODUKCJI

Laboratorium modelowania oprogramowania w języku UML. Ćwiczenie 1 Wprowadzenie do narzędzia CASE. Materiały dla nauczyciela

Grant Wielkopolskiego Kuratora Oświaty

Zastosowanie metodyki myślenia sieciowego do tworzenia scenariuszy transformacji wiedzy w sieciach gospodarczych Wielkopolski

INSTYTUT FILOLOGII SŁOWIAŃSKIEJ MINIMUM PROGRAMOWE na rok akad. 2010/2011 dla studentów MISH Studia pierwszego stopnia. Forma Zal./ Punkty ECTS ROK I

ruchem kolejowym przydatną w rozwiązywaniu złożonych zadań.

Umysł-język-świat 2012

Odniesienie do obszarowych efektów kształcenia Kierunkowe efekty kształcenia WIEDZA (W)

Laboratorium modelowania oprogramowania w języku UML. Ćwiczenie 3 Ćwiczenia w narzędziu CASE diagram sekwencji. Materiały dla nauczyciela

Stylistyka języka angielskiego

Internet Semantyczny i Logika II

MINIMUM PROGRAMOWE DLA STUDENTÓW MISH od roku akademickiego 2016/2017

A. Moduły kierunkowe

Wykaz przedmiotów realizowanych na kierunku Filologia Rosyjska w roku akad. 2016/2017. Studia stacjonarne I stopnia. /kolejność wpisu do indeksu/

SEMESTR I Forma zajęć W Ć L I

SYLLABUS. Historia języka polskiego. Kierunek: filologia polska. specjalność: nauczycielska / dziennikarska

UNIWERSYTET WARSZAWSKI WYDZIAŁ NEOFILOLOGII

Mechatronika i inteligentne systemy produkcyjne. Paweł Pełczyński ppelczynski@swspiz.pl

OPIS MODUŁU (PRZEDMIOTU) Humanistyczny. Filologia polska. Studia pierwszego stopnia. ogólnoakademicki. stacjonarne

Wstęp do językoznawstwa 2010/2011 dr Konrad Juszczyk Wstęp do językoznawstwa. dr Konrad Juszczyk

PROGRAM STUDIÓW. II MODUŁY KSZTAŁCENIA WSKAŹNIKI ILOŚCIOWE - Punkty ECTS w ramach zajęć: Efekty kształcenia

Publikacje z zakresu bezpiecznego funkcjonowania człowieka w środowisku pracy z lat jako obraz prowadzonych badań

MODUŁ KSZTAŁCENIA: Praktyczna nauka języka angielskiego: moduł 1

PROGRAM NAUCZANIA MODUŁU (PRZEDMIOTU)

Modelowanie jako sposób opisu rzeczywistości. Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka

II MODUŁY KSZTAŁCENIA WSKAŹNIKI ILOŚCIOWE - Punkty ECTS w ramach zajęć: Przedmioty/moduły. suma 2,0 1,2 0,0 0,0 0,0 0,0 0,0 0,0

Filozofia z elementami logiki Język jako system znaków słownych część 2

2. Opis zajęć dydaktycznych i pracy studenta

Transkrypt:

Elektroniczny tezaurus czasowników ukraińskich: problemy i metodyka układania Olena Siruk Laboratorium Lingwistyki Komputerowej Narodowy Uniwersytet Kijowski imieniatarasa Szewczenki Kijów, Ukraina olebosi@gmail.com

Treść Tezaurusy Komputerowe (TK): po co i jak? Stosowanie TK w lingwistyce Terminy kluczowe Cel badania Etapy badania Etap przygotowawczy Etap analizy Teoretyczne problemy układania TK Relacje leksykalno-semantyczne w TK Czasownik w tezaurusie: jaki on jest? Etap syntezy Synoptyczny schemat TK czasowników mówienia Fragment schematu synoptycznego w TK Strefowa struktura artykułu TK Przykład artykułu TK Mikroartykuł czasownika w TK języka ukraińskiego Etap eksperymentalny Przewagi komputerowego przedstawienia danych lingwistycznych Osiągnięcia tworzenia TK Lingwistyczna sesja stypendystów IBI AL UW, Warszawa, 16-17 lipca 2009 r. 2

Tezaurusy Komputerowe (TK): po co i jak? Rozwój leksykografii ukraińskiej Potrzeby uŝytkowników w systematyzowaniu informacji Rozwój technologii komputerowych Projektowanie ogólnych і specjalistycznych tezaurusów Opracowanie formalizowanej metodyki układania tezaurusów Lingwistyczna sesja stypendystów IBI AL UW, Warszawa, 16-17 lipca 2009 r. 3

Stosowanie TK w lingwistyce 1) wieloplanowany system poradniczy; 2) instrumentarium badań; 3) sposób przedstawienia, utrwalenia jednostek i relacje w leksykalno-semantycznej strukturze podjęzyków; 4) środek do studiowania języków; 5) środek wymiaru znaczenia bliskości tekstów; 6) automatyczna morfologiczna analiza tekstu; 7) leksykon dla gramatyk formalnych. Lingwistyczna sesja stypendystów IBI AL UW, Warszawa, 16-17 lipca 2009 r. 4

Cel badania opracowanie formalizowanej metodyki układania komputerowego tezaurusa czasowników języka ukraińskiego aprobacja metodyki na materiale czasowników leksykalno-semantycznego pola (LSP) mówienia Lingwistyczna sesja stypendystów IBI AL UW, Warszawa, 16-17 lipca 2009 r. 5

Terminy kluczowe 1) Tezaurus, albo słownik ideograficzny ogólny słownik niealfabetycznego typu, w którym eksplicytnie są odzwierciedlone systemowe leksykalnosemantyczne relacje między jednostkami. 2) Tezaurus komputerowy (ТK) przedstawiony za pomocą komputera słownik ideograficzny. 3) Koncept - pojęcie, podstawowe znaczenie, z którym są związane warianty leksykalno-semantyczne. 4) Ideografia komputerowa (ІK) pododdział leksykografii komputerowej, poświęcony badaniu tezaurusów komputerowych, opracowaniu metodyki ich układania i stosowania. 5) Formalizacja - opis i przedstawienie informacji językowej w postaci, przydatnej do opracowywania komputerowego. Lingwistyczna sesja stypendystów IBI AL UW, Warszawa, 16-17 lipca 2009 r. 6

Etapy badania 1) Etap przygotowawczy 2) Etap analizy 3) Etap syntezy 4) Etap eksperymentalny Lingwistyczna sesja stypendystów IBI AL UW, Warszawa, 16-17 lipca 2009 r. 7

Etap przygotowawczy 1) Klasyfikacja TK 2) Systematyzacja terminologii IK 3) Zbiór teoretycznych i technologicznych danych, dotyczących zasad metodyki układania TK Lingwistyczna sesja stypendystów IBI AL UW, Warszawa, 16-17 lipca 2009 r. 8

Teoretyczne problemy układania TK 1. ТK: jednostki, relacje, metody analizy, struktura. 2. Osobliwości ideograficznego opisu czasowników. 3. Układanie TK jako procedura formalizowana. 4. Sposoby tworzenia konceptów. 5. Dobór nazw do konceptów. Lingwistyczna sesja stypendystów IBI AL UW, Warszawa, 16-17 lipca 2009 r. 9

Etap analizy 1. Dobór metod do analizy jednostek (słowotwórcza analiza leksemów LSP mówienia, syntaktyczna analiza zdania lustracyjnego, syntaktyczna analiza tłumaczenia, komponentowa analiza tłumaczenia, stupenewa identyfikacja leksyki). 2. Ustalanie stosunków między jednostkami (hyponymia, synonimia, antonimia, derywatywne i inne typy relacji). 3. Algorytmizacja procesów analizy materiału. Lingwistyczna sesja stypendystów IBI AL UW, Warszawa, 16-17 lipca 2009 r. 10

Relacje leksykalno-semantyczne w TK 1) hierarchiczne międzyczasownikowe relacje, albo hyponymia, w szczególności hyponymia derywatywna, przedstawione hyponimem, hyperonimem i czasownikami rodzajów działania (ДРД). 2) międzyczasownikowe relacje jednego poziomu, czyli synonimia (przedstawiona absolutnymi synonimami, w szczególności fonetycznymi wariantami czasowników, stylistycznymi i derywatywnymi synonimami) i antonimia (przedstawiona antonimami). 3) Relacje czasownika z innymi częściami mowy, które opierają się na derywacji czasownikowej i walencyjnym potencjale czasownika. Lingwistyczna sesja stypendystów IBI AL UW, Warszawa, 16-17 lipca 2009 r. 11

Czasownik w tezaurusie: jaki on jest? PoniewaŜ w czasownikach przewaŝa semantyka sygnifikatywna, one określają relacje między realiami. Dla nich charakterystyczne są: wewnętrzne, sygnifikatywne uwarunkowanie wyboru konceptów; indukcyjne podejście do uporządkowywania leksemów; celowość stosowania metod komponentowej analizy tłumaczenia i stupenewej identyfikacji znaczenia dla analizy czasowników oraz elementów słowotwórczej analizy leksemów i syntaktycznej analizy tłumaczeń słownikowych ; relacje, polegające na typach słowotwórczych (ДРД) i rekcji (podstawa dla relacji między czasownikiem a innymi częściami mowy); obecność umiarkowano szerokiej sieci hyponimii, synonimii, antonimii; nieobecność stosunku typu «część-całe», taksonomii; niska częstotliwość w tezaurusach terminologicznyh, nawet innojęzycznych. Lingwistyczna sesja stypendystów IBI AL UW, Warszawa, 16-17 lipca 2009 r. 12

Etap syntezy 1) Kształtowanie makrostruktury TK czasowników (budowa synoptycznego schematu tezaurusa, projektowania wejść do słownika). 2) Okreslenie mikrostruktury tezaurusa (opracowanie słownikowego formatu artykułu, oświetlania struktury relacji międzyczasownikowych). 3) Integracja czasownikowej części TK w komputerowy tezaurus języka ukraińskiego (na podstawie relacji czasownika z innymi częściami mowy). Lingwistyczna sesja stypendystów IBI AL UW, Warszawa, 16-17 lipca 2009 r. 13

Synoptyczny schemat TK czasowników mówienia Діяльність мовленнєва 1 рівень Висловленнядумки / почуття (висловлювати) 2 рівень Обмін думками (розмовляти) 2 рівень Особливості вимови (вимовляти) 2 рівень * багато, беззмістовно, про неістотне 3 рівень * басом 3 рівень * включаючисвоїсловавчиєсьмовлення 3 рівень * грубо 3 рівень * длязаписуванняіншоюособою 3 рівень * довго, захоплюючись розмовою 3 рівень * дотепно 3 рівень * дужеголосно 3 рівень * * знегативнимнаслідком 4 рівень * * зпозитивнимнаслідком 4 рівень * * одинраз 4рівень * * разпораз 4рівень * * постійно 4рівень [ ] * чітко 3 рівень [ ] Повідомлення інформації (повідомляти) 2 рівень [ ] Здатність, спроможність, уміння 1 рівень [ ] Lingwistyczna sesja stypendystów IBI AL UW, Warszawa, 16-17 lipca 2009 r. 14

Fragment synoptyki schematu w TK Lingwistyczna sesja stypendystów IBI AL UW, Warszawa, 16-17 lipca 2009 r. 15

Strefowa struktura artykułu TK strefa stosunków hierarchicznych; strefa rodzajów działania: początku działania (інгресивне); końca działania (фінітивне); długotrwałego działania ograniczającego (делімітативне); delimitatywnego działania intensywnego; długotrwałego działania skończonego (пердуративне); działania nagromadzonego (кумулятивне); działania jednokrotnego (семельфактивне); działania zwrotnego (зворотнє); długotrwałego działania periodycznego (періодичне); działania narastającego (аугментативне); działania nasycalnego (сатуративне) wygórowanego działania dokonanego; strefa synonimii; strefa antonimii; strefa dodatkowej semy (zawiera reprezentanty pola, w których sema mówienia jest dyferencjalna). Lingwistyczna sesja stypendystów IBI AL UW, Warszawa, 16-17 lipca 2009 r. 16

Przykład artykułu TK Lingwistyczna sesja stypendystów IBI AL UW, Warszawa, 16-17 lipca 2009 r. 17

Mikroartykuł czasownika w TK języka ukraińskiego 6 + = 9 stref Strefa substantywów Strefa atrybutywów Strefa adwerbatywów Lingwistyczna sesja stypendystów IBI AL UW, Warszawa, 16-17 lipca 2009 r. 18

Etap eksperymentalny aprobacja opracowanej metodyki na czasownikach, będących reprezentantami innych LSP; stosowania TK jako instrumentarium badania tekstów artystycznych (L. Kostenko і W. Stusa). Lingwistyczna sesja stypendystów IBI AL UW, Warszawa, 16-17 lipca 2009 r. 19

Przewagi komputerowego przedstawienia danych lingwistycznych Rozszerzenie objętości informacji lingwistycznej w tezaurusie czasowników przez oboczne układanie ideograficznego, dwujęzykowego, synonimicznego, antonimicznego słowników; MoŜliwość zjednoczenia w jednym systemie trzech hipostaz (semantyczny model leksyki; wieloplanowany system informacyjny, edukacyjny i poradniczy; instrumentarium badań leksykalnosemantycznych); MoŜliwość integracji produktu do sieci oprogramowania lingwistycznego. Lingwistyczna sesja stypendystów IBI AL UW, Warszawa, 16-17 lipca 2009 r. 20

Osiągnięcia tworzenia TK Opracowanie formalizowanej metodyki konstruowania tezaurusów komputerowych jak ogólnych, tak i specjalistycznych. Tworzenie słownika specjalistycznego ideografii komputerowej i tezaurusa ukraińskich czasowników LSP mówienia. Modelowanie leksykalno-semantycznego systemu języka, gdzie kaŝdy składnik struktury opisywany jest jako jednostka systemowa. MoŜliwość wykorzystywania tezaurusa w eksperymentach i badaniach lingwistycznych (uŝycia tezaurusa czasowników jako komputerowe instrumentarium badań tekstów artystycznych). MoŜliwość integracji TK do automatycznych systemów obróbki tekstów; uŝycia jego jako systemu informacyjnego, w celach dydaktycznych. Lingwistyczna sesja stypendystów IBI AL UW, Warszawa, 16-17 lipca 2009 r. 21

Laboratorium Lingwistyki Komputerowej (p. 130) Instytut Filologii Narodowy Uniwersytet Kijowski imienia Tarasa Szewczenki olebosi@gmail.com http://linguist.univ.kiev.ua; http://mova.info tel.: (+38-044)-239-33-54 DZIĘKUJĘ ZA UWAGĘ! Lingwistyczna sesja stypendystów IBI AL UW, Warszawa, 16-17 lipca 2009 r. 22