Korpusowe badania składniowe



Podobne dokumenty
Znaczenia złapane w sieć

LingVaria Rok III (2008) nr 2 (6) Witold Kieraś 1 Uniwersytet Warszawski Warszawa

Marek Świdziński Elementy gramatyki opisowej języka polskiego Uniwersytet Warszawski * Wydział Polonistyki Seria szósta, T. XXXIII Warszawa 1997

Gramatyka opisowa języka polskiego Kod przedmiotu

Walenty. słownik walencyjny języka polskiego z kontrolą i koordynacją. Filip Skwarski. 5 listopada 2012 r. IPI PAN

Spis treści tomu pierwszego

Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego

WK, FN-1, semestr letni 2010 Tworzenie list frekwencyjnych za pomocą korpusów i programu Poliqarp

Z punktu widzenia kognitywisty: język naturalny

Wstęp do Językoznawstwa

Praktyczna nauka drugiego języka obcego II

Zasób leksykalny polszczyzny II poł. XIX wieku a możliwość automatycznej analizy morfologicznej tekstów z tego okresu

SYLLABUS. Leksykologia i leksykografia

Lingwistyka korpusowa w Polsce źródła, stan, perspektywy

KPWr (otwarty korpus języka polskiego o wielowarstwowej anotacji) Inforex (system do budowania, anotowania i przeszukiwania korpusów)

Wykaz przedmiotów objętych egzaminami i zaliczeniami w roku akademickim 2014/2015. Rok I, semestr I

Język jako hierarchiczny system dwuklasowy

CLARIN rozproszony system technologii językowych dla różnych języków europejskich

Składnia. Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (248 / 272)

Systemy ekspertowe i ich zastosowania. Katarzyna Karp Marek Grabowski

Co to jest znaczenie? Współczesne koncepcje znaczenia i najważn. i najważniejsze teorie semantyczne

Chomsky. Syntactic Structures

Komputerowa weryfikacja gramatyki Świdzińskiego

Wstęp do Językoznawstwa

Co to jest znaczenie? Współczesne koncepcje znaczenia i najważn. i najważniejsze teorie semantyczne

Akomodacja syntaktycznajako mechanizm grupotwórczy

Uniwersytet Śląski w Katowicach str. 1 Wydział Filologiczny Katedra Międzynarodowych Studiów Polskich

Kategorialny Parser Składniowo-Semantyczny dla języka polskiego

Spis treści. ROZDZIAŁ 2 Wzajemne oddziaływanie między leksykonem a innymi środkami służącymi kodowaniu informacji... 67

Słowa jako zwierciadło świata

Załącznik Nr 5. Standardy nauczania dla kierunku studiów: filologia polska STUDIA MAGISTERSKIE I. WYMAGANIA OGÓLNE

OPIS PRZEDMIOTU. gramatyka opisowa języka polskiego (składnia) Humanistyczny. Instytut Filologii Polskiej i Kulturoznawstwa.

Program warsztatów CLARIN-PL


Korpus tekstów drugiej połowy doby nowopolskiej ( )

Spis treści 0. Szkoła Tokarskiego Marcin Woliński Adam Przepiórkowski Korpus IPI PAN Inne pojęcia LXIII Zjazd PTJ, Warszawa

POZIOMY FUNKCJONALNE JĘZYKA NATURALNEGO

Konotacja składniowajako podstawowy mechanizm zdaniotwórczy

OPIS MODUŁU (PRZEDMIOTU) filologia polska. prof. dr hab. Andrzej S. Dyszak

Wyższa Szkoła Pedagogiczna ZNP w Warszawie. Specjalność: Pedagogika pracy z zarządzaniem i marketingiem,

Polszczyzna i inżynieria lingwistyczna. Autor: Marcin Miłkowski (IFiS PAN)

OPIS MODUŁU (PRZEDMIOTU), PROGRAMU NAUCZANIA ORAZ SPOSOBÓW WERYFIKACJI EFEKTÓW KSZTAŁCENIA CZEŚĆ A OPIS MODUŁU (PRZEDMIOTU) studia pierwszego stopnia

Szko ly strukturalizmu cz. 3.:glossematyka

Copyright by Wydawnictwo Lingo sp. j., Warszawa 2014 ISBN:

Wstęp do translatoryki - opis przedmiotu

Gramatyki wykorzystywane w analizie języka naturalnego Ciekawe zastosowania

do osób zainteresowanych językiem polskim, jego składnią, zjawiskami z pogranicza składni i semantyki oraz z pogranicza składni i morfologii;

Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex

Maszynowe tłumaczenie Polskiego Języka Migowego

Języki programowania zasady ich tworzenia

AUTOMATYKA INFORMATYKA

OPIS MODUŁU (PRZEDMIOTU), PROGRAMU NAUCZANIA ORAZ SPOSOBÓW WERYFIKACJI EFEKTÓW KSZTAŁCENIA CZEŚĆ A

System Korekty Tekstu Polskiego

Poziom organizacji tekstu

KARTA PRZEDMIOTU. M2/2/7 w języku polskim Gramatyka opisowa 2 w języku angielskim Descriptive grammar 2 USYTUOWANIE PRZEDMIOTU W SYSTEMIE STUDIÓW

Inteligentne wydobywanie informacji z internetowych serwisów społecznościowych

Gramatyki atrybutywne

Karta (sylabus) modułu/przedmiotu Pedagogika (Nazwa kierunku studiów)

Dygitalizacja i komputeryzacja słowników na przykładzie Słownika polszczyzny XVI wieku

II cykl wykładów i warsztatów. CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych

Umysł-język-świat 2012

System Korekty Tekstu Polskiego

Akademia Wychowania Fizycznego i Sportu w Gdańsku SYLABUS NA CYKL KSZTAŁCENIA

i INSTYTUT PODSTAW INFORMATYKI

SPOSOBY WERYFIKACJI EFEKTÓW KSZTAŁCENIA W ZAKRESIE POSZCZEGÓLNYCH PRZEDMIOTÓW MODUŁU LITERATUROZNAWCZEGO KIERUNKOWE EFEKTY KSZTAŁCENIA

Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych

j INSTYTUT PODSTAW INFORMATYKI

Humanistyka cyfrowa w Katedrze Lingwistyki Formalnej UW

Kultura logicznego myślenia

OPIS PRZEDMIOTU, PROGRAMU NAUCZANIA ORAZ SPOSOBÓW WERYFIKACJI EFEKTÓW KSZTAŁCENIA. CZEŚĆ A * (opis przedmiotu i programu nauczania) OPIS PRZEDMIOTU

CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy

DOTACJA NA UTRZYMANIE POTENCJAŁU BADAWCZEGO DOTACJA Wykaz planowanych do realizacji zadań badawczych, ujętych w planie zadaniowym jednostki

Wstęp do translatoryki - opis przedmiotu

MAGDALENA DERWOJEDOWA WITOLD KIERAŚ DANUTA SKOWROŃSKA ROBERT WOŁOSZ

Open Access w technologii językowej dla języka polskiego

Wstęp do Językoznawstwa

Komputerowa weryfikacja gramatyki Świdzińskiego

Przyrostowa metoda dygitalizacji słowników

ZASADY NALICZANIA PUNKTÓW DO WNIOSKU O STYPENDIUM DLA NAJLEPSZYCH DOKTORANTÓW I. ZASADY PRZYZNAWANIA PUNKTÓW DLA DOKTORANTÓW I ROKU

NOWY egzamin maturalny z języka polskiego

BIULETYN POLSKIEGO TOWARZYSTWA JĘZYKOZNAWCZEGO BULLETIN DE LA SOCIÉTÉ POLONAISE DE LINGUISTIQUE

Język francuski biznesu II - opis przedmiotu

Karta przedmiotu. FILOLOGIA ANGIELSKA Z PRZYGOTOWANIEM PEDAGOGICZNYM Studia pierwszego stopnia/ogólnoakademicki

frazy bezokolicznikowej we współczesnym zdaniu polskim

STUDIA KOGNITYWNE. SEMANTYKA I KONFRONTACJA JĘZYKOWA COGNITIVE STUDIES. SEMANTICS AND CONTRASTIVE LINGUISTICS

Konwersatoria tematyczne VI - opis przedmiotu

Załącznik Nr 4. Standardy nauczania dla kierunku studiów: filologia STUDIA MAGISTERSKIE I. WYMAGANIA OGÓLNE

KLUCZ PUNKTOWANIA ODPOWIEDZI

Język francuski biznesu II - opis przedmiotu

Przedstawiony tu obraz sytuacji metodologicznej w lingwistyce ma

KONWERSATORIUM Z KULTURY JĘZYKA POLSKIEGO DLA 3-LETNICH STUDIÓW POLONISTYCZNYCH PIERWSZEGO STOPNIA PROBLEMATYKA ZAJĘĆ

Recenzja rozprawy doktorskiej mgr. Agnieszki Płuwak Ramy semantyczne w tekstach prawnych analiza konfrontatywna polsko-angielsko-niemiecka

Inżynieria języka z językiem migowym w tle

LINGWISTYKA KORPUSOWA W POLSCE ŹRÓDŁA, STAN, PERSPEKTYWY

FORMULARZ CENOWY. Wartość netto [zł] Ilość sztuk. netto [zł] sztuk. brutto[zł] 1. Technologia gastronomiczna cz netto [zł]

Gramatyka kontrastywna polsko-angielska. III rok filologii angielskiej studia niestacjonarne I stopnia, semestr II. Profil ogólnoakademicki

Teoria i praktyka przekładu - opis przedmiotu

Efekty kształcenia. Wiedza Umiejętności Kompetencje społeczne (symbole) Metody kształcenia oraz sposoby weryfikacji.

Inforex - zarządzanie korpusami i ich anotacja

Dobór tekstów do Elektronicznego korpusu tekstów polskich z XVII i XVIII w. (do 1772 r.) możliwości i ograniczenia budowanego warsztatu badawczego

Transkrypt:

derwojed@uw.edu.pl Sesja korpusowa 16 lipca 2009 r.

1 Wstęp: korpus tekstów 2 A. Wierzbicka, System składniowy prozy polskiego renesansu 3 M. Świdziński, Własności składniowe wypowiedników polskich 4 M. Derwojedowa, Porządek linearny składników zdania elementarnego 5 W. Kieraś: Eksperyment z ramami interpretacyjnymi 6 RAMKI zależności głębinowoskładniowe

Wstęp: korpus tekstów Definicja Korpus tekstów to zbiór książek, czasopism, artykułów itp. przeznaczony do jakichś prac lub badań. Termin specjalistyczny. (ISJP)

A. Wierzbicka, System składniowy prozy polskiego renesansu gramatyka zależnościowa (Tesnière 1959); badania konotacyjnych relacji między wyrazami: stopień konotacji; kierunek konotacji; badania szyku: konfiguracyjność (projekcyjność; por. Lecerf 1960, Fitiałow 1962) ); ciągłość składników bezpośrednich; szyk progresywny i antycypacyjny (por. Bally 1965, 327 328); głębokość konstrukcji ; opis morfologiczny (adaptowany z Mel čuk 1974).

M. Świdziński, Własności składniowe wypowiedników polskich Grant 1 P104 030 04 Ukierunkowana gramatycznie tekstowa baza danych: korpus wypowiedzeń współczesnej polszczyzny pisanej 1993 1996 ; empiryczna weryfikacja Gramatyki formalnej języka polskiego; korpus Słownika frekwencyjnego polszczyzny współczesnej (1963 1967/1974-1977/1991; por. SFPW); opis 1000 próbek korpusu, 50 000 słów, 9000 wypowiedników.

Korpus SFPW 5 stylów (popularnonaukowy, publicystyczny, dramat artystyczny, proza artystyczna, drobne wiadomości prasowe; próbki gronowe (50 słów); fiszki dostępne na stronie http://www.mimuw.edu.pl/polszczyzna/pl196x/fiszki/index.htm; przykładowa fiszka:

Gramatyka formalna Świdzińskiego gramatyka składników bezpośrednich; skracająca; w zasadzie bezkontekstowa; wyrażona w Prologu.

Baza wypowiedników STYL: DR TEKST: *121*, 3-1 (W tobie) <jest> /teraz/ \już\ [tylko jedno uczucie]. TYP: Z CEN: jest HAS: być KL: V ASP: i CHAR: 3pe,te SCH: 15 OPIS: PS DL: 8 VF: 1 SU: 3 TPSU: OB1: 2 OB2: 0 LU1: 1 LU2: 0 IN: 1 TPI: juz SZYK: OVS

M. Derwojedowa, Porządek linearny składników zdania elementarnego badanie porządku linearnego składników zdania; badanie nieciągłości konstrukcji składniowej ; baza składniowa z badania M. Świdzińskiego.

W. Kieraś, Eksperyment z ramami interpretacyjnymi (wymagania czasowników związanych z piłką nożną) koncepcja ram interpretacyjnych (Fillmore 1982); korpus ze źródeł internetowych o objętości 500 tys. segmentów otagowany za pomocą taggera regułowego Ł. Dębowskiego; zestaw scenariuszy, ról i ram z Kicktionary (http://www.kicktionary.de/index de.html); znakowanie za pomocą ról semantycznych i powierzchniowoskładniowe; możliwy do przeglądania w przeglądarce Poliqarp (http://korpus.pl/index.php?page=poliqarp).

Przykład: znakowanie składniowe (STRZELAĆ I)

Wstęp: korpus tekstów A. Wierzbicka M. Świdziński M. Derwojedowa Football RAMKI Literatura Przykład: znakowanie semantyczne (STRZELAĆ II)

RAMKI zależności głębinowoskładniowe grant MNiSW N104 024 32/1840; 200 jednostek czasownikowych; klasyfikacja czasowników wg własności składniowych, semantycznych (i pragmatycznych): powierzchniowe własności walencyjne; spis ról realizowanych przez poszczególne elementy ramy; schematyczny opis sytuacji (scenariusz); oznakowane przykład z korpusu; http://www.ramki.uw.edu.pl/.

Przykład: RISK (Fillmore i Atkins 1992) (risky) situation valued object victim Adj, Sent D-obj obj-to chance actor Subj RISK harm FOR/OUT OF motivation purpose To/IN ORDER TO clause clause obj of FOR FOR deed (intended) gain beneficiary

Lista ram

Przykładowa analiza

Literatura I [Bally 1965] Ch. Bally, Linguistique générale et linguistique française, wyd. IV, Berne 1965. [Derwojedowa 2000] M. Derwojedowa, Porządek linearny składników zdania elementarnego, Elipsa 2000. [Fillmore 1982] Ch. J. Fillmore, Frame semantics, [w:] Linguistics in the Morning Calm, Seoul, Hanshin Publishing Co., s. 111 137. [Fillmore i Atkins 1992] Ch. J. Fillmore i B. T. S. Atkins, Towards a frame-based organization of the lexicon: The semantics of RISK and its neighbors, [w:] A. Lehrer i E. Kittay (red.) Frames, Fields, and Contrast: New Essays in Semantics and Lexical Organization, Hillsdale: Lawrence Erlbaum Associates, s. 75 102. [Fitiałow 1962] S. J. Fitiałow, O modelirovanii sintaksa v strukturno i lingvistikie, Problemy strukturno i lingvistiki, Moskwa, 1962. [Lecerf 1960] Y. Lecerf, Programme des conflits, modèle des conflits, La Traduction Automatique, 4 5.

Literatura II [Mel čuk 1974] I. A. Mel čuk Opyt teorii lingvistiqeskih modele i smysl tekst, Moskwa 1974. [SFPW] I. Kurcz, A. M. Lewicki, J. Sambor, K. Szafran i J. Woronczak, Słownik frekwencyjny polszczyzny współczesnej, Kraków 1990. [Świdziński 1996] M. Świdziński, Gramatyka formalna języka polskiego, Warszawa. [Świdziński 1996] M. Świdziński, Własności składniowe wypowiedników polskich, Warszawa. [Tesnière 1959] L. Tesnière, Éléments de syntaxe structurale, Paris 1959. [Wierzbicka 1972] A. Wierzbicka, System składniowy prozy polskiego renesansu, t. 5 serii Historia i teoria literatury. Studia. Teoria literatury, Warszawa, 1972.

Głębokość konstrukcji NP a NP 0 good man for 0 the job 0 ;

Konfiguracyjność (projekcyjność) Definicja Konfiguracyjność (projekcyjność) drzewo zależności T = (V,, ) jest projekcyjne, jeżeli j 1, j 2 Subtree i & ν (j 1, j 2 ) ν Subtree i

Konfiguracyjność (projekcyjność), cd. 1 2 3 4 5 Jakie Marysia wzięła ze sobą sukienki?

Nieciągłość 4 2 1 3 najlepszy samochód w Anglii wygra.