Towards Events Annotated Corpus of Polish

Podobne dokumenty
Machine Learning for Data Science (CS4786) Lecture11. Random Projections & Canonical Correlation Analysis

Katowice, plan miasta: Skala 1: = City map = Stadtplan (Polish Edition)

Extraclass. Football Men. Season 2009/10 - Autumn round

Egzamin maturalny z języka angielskiego na poziomie dwujęzycznym Rozmowa wstępna (wyłącznie dla egzaminującego)

Tychy, plan miasta: Skala 1: (Polish Edition)

Stargard Szczecinski i okolice (Polish Edition)

deep learning for NLP (5 lectures)

Zakopane, plan miasta: Skala ok. 1: = City map (Polish Edition)

SSW1.1, HFW Fry #20, Zeno #25 Benchmark: Qtr.1. Fry #65, Zeno #67. like

MaPlan Sp. z O.O. Click here if your download doesn"t start automatically

Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition)

Surname. Other Names. For Examiner s Use Centre Number. Candidate Number. Candidate Signature

Zajęcia z języka angielskiego TELC Gimnazjum Scenariusz lekcji Prowadzący: Jarosław Gołębiewski Temat: Czas Present Perfect - wprowadzenie

ANKIETA ŚWIAT BAJEK MOJEGO DZIECKA

Miedzy legenda a historia: Szlakiem piastowskim z Poznania do Gniezna (Biblioteka Kroniki Wielkopolski) (Polish Edition)

Dolny Slask 1: , mapa turystycznosamochodowa: Plan Wroclawia (Polish Edition)

Immigration Housing. Housing - Renting. Szukam do wynajęcia. Stating that you want to rent something. pokoju (mianownik: pokój) Type of accommodation

PLSH1 (JUN14PLSH101) General Certificate of Education Advanced Subsidiary Examination June Reading and Writing TOTAL

DODATKOWE ĆWICZENIA EGZAMINACYJNE

Few-fermion thermometry

Pielgrzymka do Ojczyzny: Przemowienia i homilie Ojca Swietego Jana Pawla II (Jan Pawel II-- pierwszy Polak na Stolicy Piotrowej) (Polish Edition)

Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition)

Karpacz, plan miasta 1:10 000: Panorama Karkonoszy, mapa szlakow turystycznych (Polish Edition)

Machine Learning for Data Science (CS4786) Lecture 11. Spectral Embedding + Clustering

No matter how much you have, it matters how much you need

ARNOLD. EDUKACJA KULTURYSTY (POLSKA WERSJA JEZYKOWA) BY DOUGLAS KENT HALL

Odpowiedzi do zadań zamieszczonych w arkuszu egzaminu ósmoklasisty z języka angielskiego 17 KWIETNIA 2019 opracowane przez ekspertów Nowej Ery

European Crime Prevention Award (ECPA) Annex I - new version 2014

Zdecyduj: Czy to jest rzeczywiście prześladowanie? Czasem coś WYDAJE SIĘ złośliwe, ale wcale takie nie jest.

Country fact sheet. Noise in Europe overview of policy-related data. Poland

Sargent Opens Sonairte Farmers' Market

Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition)

ABOUT NEW EASTERN EUROPE BESTmQUARTERLYmJOURNAL


Jak zasada Pareto może pomóc Ci w nauce języków obcych?

Has the heat wave frequency or intensity changed in Poland since 1950?

Weronika Mysliwiec, klasa 8W, rok szkolny 2018/2019

Emilka szuka swojej gwiazdy / Emily Climbs (Emily, #2)

Wydział Fizyki, Astronomii i Informatyki Stosowanej Uniwersytet Mikołaja Kopernika w Toruniu

An employer s statement on the posting of a worker to the territory of the Republic of Poland

Konsorcjum Śląskich Uczelni Publicznych

Angielski Biznes Ciekawie

KPWr (otwarty korpus języka polskiego o wielowarstwowej anotacji) Inforex (system do budowania, anotowania i przeszukiwania korpusów)

Revenue Maximization. Sept. 25, 2018


Council of the European Union Brussels, 7 April 2016 (OR. en, pl)

XT001_ INTRODUCTION TO EXIT INTERVIEW PYTANIE NIE JEST ZADAWANE W POLSCE W 2006 ROKU. WCIŚNIJ Ctrl+R BY PRZEJŚĆ DALEJ. 1.

Unit of Social Gerontology, Institute of Labour and Social Studies ageing and its consequences for society

English Challenge: 13 Days With Real-Life English. Agnieszka Biały Kamil Kondziołka

TTIC 31210: Advanced Natural Language Processing. Kevin Gimpel Spring Lecture 8: Structured PredicCon 2

Zestawienie czasów angielskich

Władysław Miodunka. CZEŚĆ, JAK SIĘ MASZ? SPOTKAMY SIĘ W EUROPIE. Tom II Podręcznik do nauki języka polskiego dla cudzoziemców. Poziom podstawowy A2

Marzec: food, advertising, shopping and services, verb patterns, adjectives and prepositions, complaints - writing

ERASMUS + : Trail of extinct and active volcanoes, earthquakes through Europe. SURVEY TO STUDENTS.

Regulamin Dzielnicowego Konkursu Języka Angielskiego dla klas III Master of English.

Karpacz, plan miasta 1:10 000: Panorama Karkonoszy, mapa szlakow turystycznych (Polish Edition)

Helena Boguta, klasa 8W, rok szkolny 2018/2019

PLSH1 (JUN12PLSH101) General Certificate of Education Advanced Subsidiary Examination June Reading and Writing TOTAL

Miedzy legenda a historia: Szlakiem piastowskim z Poznania do Gniezna (Biblioteka Kroniki Wielkopolski) (Polish Edition)

Domy inaczej pomyślane A different type of housing CEZARY SANKOWSKI

Lesson 1. Book 1. Lesson 1


Życie za granicą Studia

Latent Dirichlet Allocation Models and their Evaluation IT for Practice 2016

Fig 5 Spectrograms of the original signal (top) extracted shaft-related GAD components (middle) and

Dominika Janik-Hornik (Uniwersytet Ekonomiczny w Katowicach) Kornelia Kamińska (ESN Akademia Górniczo-Hutnicza) Dorota Rytwińska (FRSE)

Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition)

Evaluation of the main goal and specific objectives of the Human Capital Operational Programme

Angielski bezpłatne ćwiczenia - gramatyka i słownictwo. Ćwiczenie 4

Egzamin pisemny: Zakres treści (KATALOG TEMATÓW)

Część ustna (bez określania poziomu). Przykładowe zestawy zadań

F+H GCSE POLISH 8688/SF+SH. Paper 2 Speaking (Foundation and Higher) Specimen 2019 SPECIMEN MATERIAL

propozycje najbardziej odpowiednich kreacji dobór dodatków i akcesoriów przygotowania przed weselem propozycja wspólnych zakupów

Published by Express Publishing

Financial support for start-uppres. Where to get money? - Equity. - Credit. - Local Labor Office - Six times the national average wage (22000 zł)

Immigration Studying. Studying - University. Stating that you want to enroll. Stating that you want to apply for a course.

Wybrzeze Baltyku, mapa turystyczna 1: (Polish Edition)

Standard pre-qualification form for contractors & suppliers. Formularz wstępny dla Wykonawców i Dostawców

PSB dla masazystow. Praca Zbiorowa. Click here if your download doesn"t start automatically

Egzamin maturalny z języka angielskiego Rozmowa wstępna (wyłącznie dla egzaminującego)

Blow-Up: Photographs in the Time of Tumult; Black and White Photography Festival Zakopane Warszawa 2002 / Powiekszenie: Fotografie w czasach zgielku

Volley English! Tak więc zapraszamy na lekcję nr 2.

SubVersion. Piotr Mikulski. SubVersion. P. Mikulski. Co to jest subversion? Zalety SubVersion. Wady SubVersion. Inne różnice SubVersion i CVS

18. Przydatne zwroty podczas egzaminu ustnego. 19. Mo liwe pytania egzaminatora i przyk³adowe odpowiedzi egzaminowanego

EGZAMIN MATURALNY 2011 JĘZYK ANGIELSKI

Polska Szkoła Weekendowa, Arklow, Co. Wicklow KWESTIONRIUSZ OSOBOWY DZIECKA CHILD RECORD FORM

Arkusz zawiera informacje prawnie chronione do momentu rozpoczęcia egzaminu. UZUPEŁNIA ZESPÓŁ NADZORUJĄCY miejsce na naklejkę z kodem

g]bbvd`cyw>[ealyb^vwvvzo]^vwp`[[ab]cfwxyzy[v\]^]bvwvazovf

y = The Chain Rule Show all work. No calculator unless otherwise stated. If asked to Explain your answer, write in complete sentences.

PL-DE data test case. Kamil Rybka. Helsinki, November 2017

Polskie Tlumaczenie Testy Prawo Jazdy UK - Samochody Osobowe (Polish Translation Driving Theory Test UK - Category B - Cars) 2008/2009 (Polish

Tekst polski English text

Załącznik 1. Kwestionariusz rozesłany został również w języku angielskim do spółek zagranicznych.

EGZAMIN MATURALNY 2011 JĘZYK ANGIELSKI

Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition)

Previously on CSCI 4622

Materiały dydaktyczne. Język angielski. Semestr III

ZGŁOSZENIE WSPÓLNEGO POLSKO -. PROJEKTU NA LATA: APPLICATION FOR A JOINT POLISH -... PROJECT FOR THE YEARS:.


Transkrypt:

Towards Events Annotated Corpus of Polish Michał Marcińczuk, Marcin Oleksy, Jan Kocoń, Tomasz Bernaś and Michał Wolski {michal.marcinczuk, marcin.oleksy, jan.kocon, tomasz.bernas, michal.wolski}@pwr.edu.pl Institute of Informatics Wrocław University of Technology Wybrzeże Wyspiańskiego 27, Wrocław, Poland April 10, 2015 Work financed as part of the investment in the CLARIN-PL research infrastructure funded by the Polish Ministry of Science and Higher Education.

Introduction» Event recognition Event recognition Part of Natural Language Engineering Major task in Information Extraction (IE) field The goal is to identify actions and some states described in text: Textual evidence of an event Event arguments (who? when? where?...) Event attributes (specific/generic, true/false, past/present...) Structural representation of events data mining M. Marcińczuk, et al. April 10, 2015 2 / 15

Example (1/2) Introduction» Example Text Two Russians and a Frenchman left the Mir and endured a rough landing on the snow-covered plains of Central Asia on Thursday. (...) The two Russians arrived on the Mir last August (...). Solovyou celebrated his 50th birthday during his six-month space voyage. What to annotate: Temporal expressions Events Signals Links source: http://www.themoscowtimes.com/ M. Marcińczuk, et al. April 10, 2015 3 / 15

Example (2/2) Introduction» Example Rob O Neil - weteran NAVY Seals, który zastrzelił w maju 2011 roku Osamę bin Ladena, po 16 latach służby odszedł z jednostki i ujawnił swoją tożsamość. Nazwisko mężczyzny wyszło na jaw po tym, jak amerykańska stacja informacyjna Fox News poinformowała, że żołnierz udzieli w niej wywiadu i opowie o całej akcji wymierzonej w szefa Al-Kaidy. Jak mówi jego ojciec, nie boją się zemsty ze strony Państwa Islamskiego, ani innych organizacji terrorystycznych. M. Marcińczuk, et al. April 10, 2015 4 / 15

Introduction» Example Example (2/2) - timeline maju 2011 roku zastrzelił służby odszedł ujawnił Rob O Neil 16 lat Fox News poinformowała wyszło (na jaw) mówi ojciec udzieli opowie (nie) boimy się akcji zemsty M. Marcińczuk, et al. April 10, 2015 5 / 15

Events in TimeML» What to annotate? What to annotate? Tensed Verbs: A fresh flow of lava, gas and debris erupted there Saturday. Untensed verbs: Prime Minister Benjamin Netanyahu called the prime minister of the Netherlands to thank him for thousands of gas masks (...). Nominalizations: Israel will ask the US to delay a military strike against Iraq until the Jewish state is fully prepared for a possible Iraqi attack. Adjectives: A Philippine volcano, dormant for six centuries, began exploding with searing gases, thick ash and deadly debris. Prepositional phrases: All 75 people on board the Aeroflot Airbus died. Predicative Clauses: "There is no reason why we would not be prepared," Mordechai told the Yediot Ahronot daily. M. Marcińczuk, et al. April 10, 2015 6 / 15

Classes Events in TimeML» Classes REPORTING: say, report, announce,... PERCEPTION: see, hear, watch, feel,... ASPECTUAL: begin, start, finish, stop, continue,... I_ACTION: attempt, try, promise, offer, regret,... I_STATE: believe, want, wish,... STATE: be on board, kidnapped, recovering, love,... OCCURRENCE: die, crash, build, merge, sell, take advantage of,... M. Marcińczuk, et al. April 10, 2015 7 / 15

Event annotation» Textual mentions Textual mentions (1/2) Step 1 Annotation of textual mentions of events Event X Event Y Verb Action dynamic Reporting We know that X occured or not Light_predicate Auxiliary verbs State static Perception A D Ascpectual B I_Action We do not know if X occured or not I_State C M. Marcińczuk, et al. April 10, 2015 8 / 15

Event annotation» Textual mentions Textual mentions (2/2) Action State Reporting Perception pracy 53 ma 93 powiedział 41 widać 18 spotkania 43 mają 47 mówi 26 zobacz 18 spotkanie 40 mieć 23 stwierdził 13 zobaczyć 12 zginęło 35 miał 23 mówił 13 widzę 7 odbędzie 35 oznacza 21 informuje 9 posłuchać 5 I_Action I_State Light_predicate Aspectual zapowiedział 13 można 163 doszło 5 zakończył 13 pozwala 10 może 120 ma 5 zaczęła 12 zgodę 9 ma 45 ulec 5 zaczyna 10 wymaga 9 trzeba 42 dokonał 4 rozpoczął 9 proszę 8 należy 39 prowadzić 3 końcowa 8 Table 1: Top 5 mentions (ortographic forms) for each category. M. Marcińczuk, et al. April 10, 2015 9 / 15

What has been done?» Event mentions Event mentions in KPWr Documents in KPWr 1634 Documents annotated 558 Annotations (unique) 9557 Annotations (total) 24023 0 2000 4000 6000 8000 10000 12000 14000 Action Aspectual I_Action I_State Light_predicate Perception Reporting State M. Marcińczuk, et al. April 10, 2015 10 / 15

What has been done?» Annotation agreement Annotation agreement Positive specific agreement between two annotators (A and B) for 100 documents from KPWr. Events (only spans) 3184 393 664 85.76% Events 2561 1016 1287 68.98% Action 2085 766 418 77.89% Aspectual 46 4 10 86.79% Perception 20 2 37 50.63% Reporting 39 29 28 57.78% I_Action 23 19 21 53.49% I_State 115 61 70 63.71% State 213 92 634 36.98% Light_predicate 20 41 20 39.60% M. Marcińczuk, et al. April 10, 2015 11 / 15

Arguments What is to be done?» Event arguments Step 2 Linking event mentions with generic arguments agency who performed the action, temporal when the action was performed and how long the action was being performed or how long the state was present, spatial where the action was performed. M. Marcińczuk, et al. April 10, 2015 12 / 15

Attributes What is to be done?» Event attributes Step 3 described event attributes generality specific or general, tense past, present or future, polarity affirmative or negative, M. Marcińczuk, et al. April 10, 2015 13 / 15

What is to be done?» Event linking Event linking Step 4 event linking subordination link relations between events (modal, factive, counter-factive, evidential, negative evidential, conditional) aspectual link relation between an aspectual event and its argument event. M. Marcińczuk, et al. April 10, 2015 14 / 15

The End» Thank you for your attention. M. Marcińczuk, et al. April 10, 2015 15 / 15