Metody automatycznego wykrywania błędów w bankach drzew

Podobne dokumenty
Gramatyka TAG dla języka polskiego

Bank częściowo ujednoznacznionych struktur LFG

Maszynowe tłumaczenie Polskiego Języka Migowego

Indukcja reguł gramatyki j. polskiego

j INSTYTUT PODSTAW INFORMATYKI

Wstęp do Językoznawstwa

Składnia. Jan Daciuk, KISI, ETI, PG Przetwarzanie języka naturalnego 10. Metody opisu składni (248 / 272)

Porównywanie tagerów dopuszczajacych niejednoznaczności

Zastosowanie sieci neuronowych w problemie klasyfikacji wielokategorialnej. Adam Żychowski

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2018/2019

Wydobywanie reguł na potrzeby ujednoznaczniania morfo-syntaktycznego oraz płytkiej analizy składniowej tekstów polskich

Model zaszumionego kanału

Program warsztatów CLARIN-PL

Drzewa decyzyjne i lasy losowe

Analiza listów pożegnalnych w oparciu o metody lingwistyki informatycznej i klasyfikacji semantycznej tekstów

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2017/2018

Lokalizacja Oprogramowania

Próbny Sprawdzian Szóstoklasisty. Język polski i matematyka Klucz punktowania. Nr zadania

JĘZYK ANGIELSKI POZIOM ROZSZERZONY

Optymalizacja Automatycznych Testów Regresywnych

Morfeusz 2 analizator i generator fleksyjny dla języka polskiego

Słowem wstępu. Część rodziny języków XSL. Standard: W3C XSLT razem XPath 1.0 XSLT Trwają prace nad XSLT 3.0

System Korekty Tekstu Polskiego

Automatyczne wspomaganie tworzenia słowników fleksyjnych jednostek wieloczłonowych

Rozszerzanie ontologii nazw geograficznych

Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA

LEMRG algorytm generowania pokoleń reguł decyzji dla baz danych z dużą liczbą atrybutów

Wojewódzki Konkurs Przedmiotowy z Matematyki etap szkolny. Przykładowe rozwiązania i propozycja punktacji rozwiązań

Automatyczne tworzenie trójwymiarowego planu pomieszczenia z zastosowaniem metod stereowizyjnych

Leksykon gramatyki kategorialnej dla języka polskiego

Narzędzia do ekstrakcji informacji z tekstu

Testowanie hipotez statystycznych

KRYTERIA OCENIANIA Z JĘZYKA ANGIELSKIEGO DLA KLASY VI

PRZEDMIOTOWE ZASADY OCENIANIA Z JĘZYKA ANGIELSKIEGO

Ekstrakcja informacji o zdarzeniach z tekstów dziedzinowych

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2016/2017

Testowanie hipotez statystycznych

Metody Kompilacji Wykład 1 Wstęp

OCENA CELUJĄCA SPRAWNOŚĆ PISANIA

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2017/2018

OGÓLNE KRYTERIA OCENIANIA POSZCZEGÓLNYCH SPRAWNOŚCI JĘZYKOWYCH

PRZEDMIOTOWY SYSTEM OCENIANIA

OCENIANIE WYPOWIEDZI PISEMNYCH

REGULAMIN SZKOLNEGO KONKURSU ORTOGRAFICZNEGO MISTRZ ORTOGRAFII DLA UCZNIÓW KLAS IV-VI

SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska

Semantyczne podobieństwo stron internetowych

MAGICIAN. czyli General Game Playing w praktyce. General Game Playing

Klucz do zadań zamkniętych. Cztery pory roku. zadania 1 C 2 B 3 B 4 D 5 A 6 C 7 D 8 B 9 C 10 A 11 D 12 A 13 D 14 B 15 C 16 D 17 A 18 B 19 C 20 D

Projekt i implementacja systemu wspomagania planowania w języku Prolog

b) bc a Rys. 1. Tablice Karnaugha dla funkcji o: a) n=2, b) n=3 i c) n=4 zmiennych.

WK, FN-1, semestr letni 2010 Tworzenie list frekwencyjnych za pomocą korpusów i programu Poliqarp

WYMAGANIA EDUKACYJNE Z JĘZYKA ANGIELSKIEGO klasa I gimnazjum Mgr Magdalena Mazanek Mgr Magdalena Pajor GRAMATYKA I SŁOWNICTWO.

Walenty. słownik walencyjny języka polskiego z kontrolą i koordynacją. Filip Skwarski. 5 listopada 2012 r. IPI PAN

WK, FN-1, semestr letni 2010 Korpusy tekstów w lingwistyce. Wyrażenia regularne. Cz. I

JĘZYK ANGIELSKI POZIOM ROZSZERZONY

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2018/2019

Zajęcia wprowadzające W-1 termin I temat: Sposób zapisu wyników pomiarów

i INSTYTUT PODSTAW INFORMATYKI

Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego

ZAKRES WYMAGAŃ EDUKACYJNYCH NA POSZCZEGÓLNE OCENY SZKOLNE MEINE DEUTSCHTOUR KL.II gimnazjum

Przedmiotowy system oceniania z języków obcych: j. angielski, j. niemiecki, j. włoski, j. hiszpański, j. rosyjski

Narzędzia NLP Wzmocniona ekstrakcja relacji IS-A na bazie przypadka gramatycznego. System NEKST - wykorzystanie narzędzi NLP

Przedmiotowe zasady oceniania z języka polskiego Opracowany przez mgr Katarzynę Krzyścin

EGZAMIN MATURALNY 2011 JĘZYK ANGIELSKI

ZAKRES WYMAGAŃ EDUKACYJNYCH NA POSZCZEGÓLNE OCENY SZKOLNE

ZAKRES WYMAGAŃ EDUKACYJNYCH NA POSZCZEGÓLNE OCENY SZKOLNE

Konkurs z przedmiotu eksploracja i analiza danych: problem regresji i klasyfikacji

-stopień celujący -stopień bardzo dobry:

Kryteria wymagań na poszczególne oceny do podręcznika Meine Deutschtour do języka niemieckiego do klasy VII

Zaawansowane narzędzie do analizy korpusu w oparciu o reguły

Zachodniopomorski Uniwersytet Technologiczny w Szczecinie. Wydział Informatyki. mgr inż. Marcin Pietras

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2015/2016

Poszukiwanie struktury w danych naprzykładzieanalizykorespondencji

ZAKRES WYMAGAŃ EDUKACYJNYCH NA POSZCZEGÓLNE OCENY SZKOLNE Z JĘZYKA NIEMIECKIEGO DLA KLAS I III POZIOM PODSTAWOWY I ROZSZERZONY

Przedmiotowy system oceniania z języka angielskiego obowiązujący od roku szkolnego 2009/2010 (nowa podstawa programowa)

Extensible Markup Language (XML) Wrocław, Java - technologie zaawansowane

PRZEDMIOTOWE ZASADY OCENIANIA Z JĘZYKA NIEMIECKIEGO DLA KLASY 7 W ROKU SZKOLNYM 2017/2018. PODRĘCZNIK Meine Deutschtour.

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Wymagania edukacyjne na poszczególne oceny z języka niemieckiego MEINE DEUTSCHTOUR 3 OCENA CELUJĄCA GRAMATYKA I SŁOWNICTWO SPRAWNOŚĆ PISANIA

Reguły decyzyjne, algorytm AQ i CN2. Reguły asocjacyjne, algorytm Apriori.

WYMAGANIA EDUKACYJNE Z JĘZYKA ANGIELSKIEGO klasa III Magdalena Pajor GRAMATYKA I SŁOWNICTWO. Poziomy wymagań:

OCENA CELUJĄCA SPRAWNOŚĆ PISANIA

Przedmiotowy system oceniania z języków obcych (angielskiego, niemieckiego) w klasach IV VI szkoły podstawowej oraz w klasach I III gimnazjum

WYMAGANIA EDUKACYJNE Z JĘZYKA NIEMIECKIEGO KLASA

Podstawy Informatyki. Algorytmy i ich poprawność

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

JAK EFEKTYWNIE I POPRAWNIE WYKONAĆ ANALIZĘ I RAPORT Z BADAŃ BIEGŁOŚCI I WALIDACJI PRAKTYCZNE WSKAZÓWKI

Próbny Sprawdzian Szóstoklasisty Język polski i matematyka Klucz punktowania

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi

Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

KORPORACYJNE SYSTEMY ZARZĄDZANIA INFORMACJĄ

Języki i metody programowania Java INF302W Wykład 3 (część 1)

Projektowanie systemów pomiarowych. 02 Dokładność pomiarów

Próbny Sprawdzian Szóstoklasisty Język polski i matematyka Klucz punktowania

Projekt ZSWS. Instrukcja uŝytkowania narzędzia SAP Business Explorer Analyzer. 1 Uruchamianie programu i raportu. Tytuł: Strona: 1 z 31

SPRAWNOŚĆ MÓWIENIA SPRAWNOŚĆ PISANIA GRAMATYKA I SŁOWNICTWO

WYMAGANIA EDUKACYJNE Z JĘZYKA ANGIELSKIEGO W LICEUM IM. JANA PAWŁA II SIÓSTR PREZENTEK W RZESZOWIE 2015/2016

WYMAGANIA EDUKACYJNE Z JĘZYKA NIEMIECKIEGO W KLASIE VII PODRĘCZNIK MEINE DEUTSCHTOUR ZAKRES WYMAGAŃ EDUKACYJNYCH NA POSZCZEGÓLNE OCENY SZKOLNE

Transkrypt:

Metody automatycznego wykrywania błędów w bankach drzew Katarzyna Krasnowska IPI PAN 26 listopada 2012 Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 1 / 49

Plan prezentacji 1 Składnica pierwsze próby 2 Składnica metoda STSG 3 Składnica zależnościowa 4 Treebank rzutowany Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 2 / 49

Składnica Polski bank drzew (Świdziński i Woliński, 2010) Aktualna wersja zawiera 8227 drzew składniowych Drzewa budowane półautomatycznie Węzły wewnętrzne posiadają kategorię składniową oraz zestaw atrybutów Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 3 / 49

Składnica przykład drzewa Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 4 / 49

Składnica przykład drzewa Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 5 / 49

Składnica vs Penn Treebank (WSJ) Rozmiar korpusu: 8227 vs 49208 drzew Sposób konstrukcji: półautomatyczny vs ręczny Poziom zróżnicowania tekstów: Składnica: literatura, prasa, obrady Sejmu... WSJ: dziennik Wall Street Journal Fleksyjność języka Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 6 / 49

Zbiory ID (Dickinson i Meurers, 2005): Immediate Dominance Sets zbiory bezpośredniej dominacji Dla każdego występującego w treebanku rodzeństwa wyznaczany jest zbiór wszystkich ojców Zróżnicowanie takiego zbioru sugeruje błąd w anotacji np. rodzeństwo ADJP, NP występuje raz jako dzieci węzła NP, a raz węzła ADJP Wyniki na WSJ: poprawność (precision) 65,6% pełność (recall) 43,0% Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 7 / 49

Zbiory ID wyniki eksperymentów W pierwszym podejściu: 1254 (16,5%) drzew oznaczonych jako błędne niemal wyłącznie fałszywe alarmy związane z etykietami fw/fl Po wyeliminowaniu węzłów fw/fl: 103 drzew wskazane jako błędne w tym 80% niesłusznie Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 8 / 49

Metoda n-gramowa (Dickinson i Meurers, 2003): W banku drzew wyszukiwane są wystąpienia identycznych ciągów słów, dla których: węzły dominujące mają różne etykiety...... lub tylko jeden z nich posiada węzeł dominujący (tj. drugi nie został opisany jako fraza) Im dłuższy wspólny kontekst, tym lepiej Przykład: NP NP NP NP its biggest jolt last month its biggest jolt last Kontekst: market received its biggest jolt last month from Campeau Corp., which... month Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 9 / 49

Metoda n-gramowa wyniki eksperymentów n-gramy form ortograficznych bez kontekstu (etykieta = kategoria składniowa + pełen zestaw atrybutów): długość ciągu 1 2 3 4 5 liczba ciągów 4375 881 108 14 3 Dickinson i Meurers (2003): maksymalna długość 46 Dla długości 1 niemal wyłącznie niejednoznaczności typu widzę kobiety vs kobiety przyszły Przy wymaganiu obustronnego kontekstu długości 1 liczba n-gramów spadła do 56 Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 10 / 49

Metoda n-gramowa wyniki eksperymentów n-gramy form ortograficznych bez kontekstu (etykieta = kategoria składniowa + pełen zestaw atrybutów): długość n-gramy zdania sprawdzone prawidłowe sprawdzone prawidłowe 2 31 5 16,1% 130 12 9,2% 3 22 3 13,6% 59 7 11,9% 4 14 8 57,1% 32 19 59,4% 5 3 3 100,0% 6 6 100,0% razem 70 19 27,1% 227 44 19,4% Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 11 / 49

Metoda n-gramowa wyniki eksperymentów n-gramy tagów morfoskładniowych bez kontekstu: długość n-gramu 2 3 4 5 6 7 liczba n-gramów 1516 1760 599 91 9 2 n-gramy tagów morfoskładniowych z kontekstem: min. długość kontekstu 2 3 4 5 6 liczba n-gramów 5511 499 88 35 16 Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 12 / 49

Metoda n-gramowa wyniki eksperymentów min. długość kontekstu 2 3 rozmiar próbki 52 39 poprawność (precision) 23,1% 44,8% Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 13 / 49

Przykłady n-gramów Kontekst długości 2: Czy ktoś jeszcze qub [chciał praet by qub ] formaczas się qub zapisać? Nie qub [orientował praet się qub ] NIL też qub, że popełnia przestępstwo (...). fałszywy alarm oba zdania są prawidłowo opisane kontekst długości 3: Minęło praet [już qub kilka num ] flicz dni subst:pl:gen:m3, interp odkąd (...). Do obozu pozostało praet [jeszcze qub parę num ] NIL kilometrów subst. interp błąd w Składnicy Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 14 / 49

Przykłady n-gramów kontekst długości 4: Daktyle (...) dodać z prep [pozostałym adj masłem subst ] fno do prep kuskusu subst. interp Z prep [oficjalnym adj żądaniem subst ] NIL wobec prep MKOl subst, interp (...) wystąpił Narodowy Komitet Olimpijski KRLD (...). fałszywy alarm kontekst długości 6: Złotówka straciła też qub [na prep wartości subst ] fpm w prep stosunku subst do prep euro subst:sg:gen:n. interp (...) uczniowie ustawiają się qub [na prep zbiórce subst ] NIL w prep parku subst naprzeciwko prep gimnazjum subst. interp fałszywy alarm Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 15 / 49

Plan prezentacji 1 Składnica pierwsze próby 2 Składnica metoda STSG 3 Składnica zależnościowa 4 Treebank rzutowany Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 16 / 49

Synchronous Tree Substitution Grammar Cohn i Lapata (2009), Kato i Matsubara (2010): Każda reguła składa się z: pary drzew elementarnych (elementary trees) wyrównania 1-do-1 (alignment) między ich liśćmi Przykład reguły: Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 17 / 49

Synchronous Tree Substitution Grammar Cohn i Lapata (2009), Kato i Matsubara (2010): Każda reguła składa się z: pary drzew elementarnych (elementary trees) wyrównania 1-do-1 (alignment) między ich liśćmi Przykład reguły: źródło: S cel: S NP 1 VP NP 3 NP 1 VP V 2 V 2 NP 3 Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 17 / 49

Uzyskiwanie reguł STSG z banku drzew Dla każdych dwóch poddrzew o identycznych etykietach korzeni i plonach... S S NP VP NP VP NP N V NP N V DET N John ate DET N John ate an apple an apple Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 18 / 49

Uzyskiwanie reguł STSG z banku drzew...dokonywane jest wyrównanie pomiędzy ich węzłami wewnętrznymi o identycznych etykietach korzeni i plonach. S S NP 1 VP NP 1 VP N 2 V 3 N 2 V 3 NP 4 DET 5 N 6 John ate NP 4 DET 5 N 6 John ate an apple an apple Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 18 / 49

Uzyskiwanie reguł STSG z banku drzew Dzieci każdego wyrównanego węzła są następnie usuwane... S S NP 1 VP NP 1 VP N V 3 N V 3 NP 4 DET N John ate NP 4 DET N John ate an apple an apple Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 18 / 49

Uzyskiwanie reguł STSG z banku drzew...w rezultacie powstaje reguła: źródło: S cel: S NP 1 VP NP 3 NP 1 VP V 2 V 2 NP 3 Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 19 / 49

Wybór reguł STSG Dla każdej powstałej w ten sposób reguły, powstanie również reguła odwrotna Reguły o poprawnym źródle i niepoprawnym celu powinny zostać wyeliminowane Spodziewamy się, że poprawne konstrukcje są częstsze od błędnych f (τ) częstość występowania drzewa elementarnego τ w banku, 0 f (τ) 1 Wybierane są reguły o wysokiej wartości Score: Score( τ, τ ) = f (τ ) f (τ) + f (τ ) Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 20 / 49

Eksperyment na WSJ 49 208 zdań 8 776 reguł Użyto 100 najlepszych wg. miary Score: Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 21 / 49

Eksperyment na WSJ 49 208 zdań 8 776 reguł Użyto 100 najlepszych wg. miary Score: 331 zmian w korpusie dokładność: 71,9% dla 70 reguł dokładność wyniosła 100% 30 reguł zmieniających strukturę drzew Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 21 / 49

Modyfikacje metody (Krasnowska et al., 2012) Tagi morfoskładniowe zamiast form ortograficznych możliwość brania pod uwagę formy bazowej dla kublików, przyimków, spójników i predykatywów możliwość wyboru składników tagów morfoskładniowych Kategoria składniowa oraz wybrane atrybuty jako etykiety Zastąpienie wartości wybranych atrybutów zmiennymi Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 22 / 49

Uzmiennianie atrybutów przykład fno przypadek mian liczba poj (1) fno przypadek mian liczba poj fpt przypadek mian liczba poj fno przypadek x liczba y fpm przypadek miej (2) fno przypadek x liczba y fpt przypadek x liczba y fpm przypadek z Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 23 / 49

Przykładowa reguła źródło: cel: fpm liczba x przypadek y rodzaj z fno liczba x przypadek y rodzaj z osoba v fpm liczba x przypadek y rodzaj z fno liczba x przypadek y rodzaj z osoba v fno liczba x przypadek y rodzaj z osoba v fpm liczba x przypadek y rodzaj z fno liczba x przypadek y rodzaj z osoba v fpm liczba x przypadek y rodzaj z fno liczba x przypadek y rodzaj z osoba v Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 24 / 49

Wyniki eksperymentu na Składnicy Typ wyniku ERR 0 INC 0 ERR 1 INC 1 FP Komentarz Wykryty błąd, prawidłowa propozycja poprawy. Wykryta niespójność, prawidłowa propozycja poprawy. Wykryty błąd, nieprawidłowa propozycja poprawy. Wykryta niespójność, nieprawidłowa propozycja poprawy. Fałszywy alarm. Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 25 / 49

Wyniki eksperymentu na Składnicy P 0 = ERR 0 + INC 0 ALL P 1 = ERR 0 + INC 0 + ERR 1 + INC 1 ALL P err = ERR 0 + ERR 1 ALL R = ERR 0 + INC 0 + ERR 1 + INC 1 1481 Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 26 / 49

Wyniki eksperymentu na Składnicy min. Score P 0 P 1 R F 0,5 50,33% 56,26% 17,29% 26,45% 0,6 50,33% 56,29% 17,22% 26,37% 0,7 49,44% 55,51% 16,68% 25,65% 0,8 48,82% 54,98% 15,67% 24,38% 0,9 68,04% 75,26% 9,86% 17,43% Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 27 / 49

Wyniki eksperymentu na Składnicy 1 0.8 0.6 0.4 0.2 P 1 P 0 Score 0 0 10 20 30 40 50 reguła Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 28 / 49

Wyniki eksperymentu na Składnicy 1 0.8 0.6 0.4 0.2 P 1 P ERR Score 0 0 10 20 30 40 50 reguła Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 29 / 49

Wyniki eksperymentu na Składnicy przykład Tymczasem wiadomo, że 37-letnia gwiazda jest uzależniona od alkoholu i narkotyków. zdanie fno ff fno zdanie 37-letnia gwiazda jest fpt fno ff fpt uzależniona... 37-letnia gwiazda jest uzależniona... Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 30 / 49

Wyniki eksperymentu na Składnicy przykład Nasz system polityczny ewoluuje w kierunku dwóch wielkich bloków. fno fno fno fpt fno flicz fno flicz wielkich bloków dwóch fpt fno dwóch wielkich bloków Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 31 / 49

Plan prezentacji 1 Składnica pierwsze próby 2 Składnica metoda STSG 3 Składnica zależnościowa 4 Treebank rzutowany Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 32 / 49

Składnica zależnościowa Bank drzew zależnościowych Powstały w wyniku konwersji Składnicy (Wróblewska, 2012) 8227 zdań Motywacja: być może w drzewach w postaci zależnościowej uda się wykryć błędy anotacji, których nie wychwyciła poprzednia metoda Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 33 / 49

Składnica zależnościowa przykład drzewa Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 34 / 49

Krótko o metodzie Pary spójnych podgrafów drzew zależnościowych Reguła jest tworzona, jeżeli: zawierają ten sam ciąg części mowy (CPOS) ale różnią się strukturą (kształtem lub relacjami zależnościowymi) Analogiczna miara Score dla reguł Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 35 / 49

Przykład - Ja myślę, że ludzie chcą zaoszczędzić. PRED ADJUNCT ADJUNCT SUBJ... myślę... że ludzie chcą... verb comp subst verb Jeśli to jest absolutnie niemożliwe, znaczy to, że twój charakter jest czymś pośrednim pomiędzy dwoma opisanymi w rozwiązaniu przy odpowiednich numerach. PRED ADJUNCT COMPLM SUBJ... znaczy... że... charakter jest... verb comp subst verb Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 36 / 49

Przykład c.d. Uzyskana reguła: ADJUNCT ADJUNCT PRED SUBJ... verb comp subst verb ADJUNCT COMPLM PRED SUBJ... verb comp subst verb Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 37 / 49

Eksperymenty 1000 drzew jako dane robocze Pozostałe 7227 drzew jako ostateczne dane testowe Mało obiecujące wyniki pomimo licznych prób ich poprawy: dla niektóre części mowy bardziej szczegółowo rozróżniane (INF, IMPS, PRED, GER, BEDZIE) dodanie do części mowy informacji o przypadku forma bazowa dla kublików, interpunkcji, przyimków itp. pominięcie relacji zależnościowych związanych z interpunkcją wymuszenie włączania wybranych relacji do podgrafów (COMPLM, NEG, REFL) Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 38 / 49

Wyniki 100 pierwszych zgłoszonych błędów 1 ocena błędy zdania rzeczywisty błąd, dobrze poprawiony 20 17 rzeczywisty błąd, źle poprawiony 11 11 fałszywy alarm 77 73 razem 108 101 1 W 99 zdaniach; niektóre reguły wprowadzały dwie różne zmiany (stąd liczba zgłoszonych błędów 108); w dwóch takich przypadkach jedna zmiana była poprawna, a druga nie (dlatego liczby w kol. zdania sumują się do 101). Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 39 / 49

Wnioski z eksperymentu Powodem wielu niepoprawnych zgłoszeń błędu był brak informacji leksykalnej w regułach na przykład dla czasownika mieć próba zamiany relacji COMP na OBJ Składnica zależnościowa zawiera zbyt mało zdań, aby można było tę informację wykorzystać Potrzebny dużo większy zasób Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 40 / 49

Plan prezentacji 1 Składnica pierwsze próby 2 Składnica metoda STSG 3 Składnica zależnościowa 4 Treebank rzutowany Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 41 / 49

Treebank rzutowany (Wróblewska i Przepiórkowski, 2012) Ponad 3 miliony zdań Zdania z korpusu równoległego polsko-angielskiego Tekst angielski sparsowany za pomocą dobrej jakości narzędzi Drzewa zależnościowe dla zdań polskich stworzone na podstawie zrównoleglenia Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 42 / 49

Eksperymenty Rozmiar zasobu pozwolił na branie pod uwagę pełnej informacji leksykalnej formy bazowe słów + przypadek 4111 reguł 18885 zdań (0,6% ze wszystkich) Spośród 119 ręcznie sprawdzonych: 57 (50%) poprawnych 19 (17%) niepoprawnych (również ważna informacja!) 37 (33%) nieskutecznych Dokładna ewaluacja trudna ze względu na rozmiar danych Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 43 / 49

Przykład zastosowania reguły Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 44 / 49

Przykład zastosowania reguły Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 45 / 49

Przykład nieskutecznej reguły Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 46 / 49

Co dalej? Różne pomysły na modyfikacje: tylko niektóre części mowy w formie bazowej więcej cech morfoskładniowych uzmiennienie reguł... Problem: czasochłonna ocena skuteczności! Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 47 / 49

Co dalej? Pomysł: system wspomagający ewaluację metody w tej chwili: MaltEval tylko wizualizacja Wyświetlanie par drzew pierwotne oraz z proponowaną zmianą Użytkownik ocenia, czy zmiana jest prawidłowa System zapamiętuje te decyzje i nie pyta użytkownika po raz kolejny o tę samą zmianę Efekt uboczny : lista zmian, które należy wprowadzić w banku drzew Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 48 / 49

Bibliografia Cohn, T. i Lapata, M. (2009). Sentence compression as tree transduction. Journal of Artificial Intelligence Research, 34, 637 674. Dickinson, M. i Meurers, W. D. (2003). Detecting inconsistencies in treebanks. W: Proceedings of the Second Workshop on Treebanks and Linguistic Theories, TLT 03, str. 45 56, Växjö, Szwecja. Dickinson, M. i Meurers, W. D. (2005). Prune diseased branches to get healthy trees! How to find erroneous local trees in a treebank and why it matters. W: Proceedings of the Fourth Workshop on Treebanks and Linguistic Theories, TLT 05, str. 41 52, Barcelona, Hiszpania. Kato, Y. i Matsubara, S. (2010). Correcting errors in a treebank based on synchronous tree substitution grammar. W: Proceedings of the ACL 2010 Conference Short Papers, ACLShort 10, str. 74 79, Stroudsburg, PA, USA. Association for Computational Linguistics. Krasnowska, K., Kieraś, W., Woliński, M. i Przepiórkowski, A. (2012). Using tree transducers for detecting errors in a treebank of polish. W: Proceedings of the 15th international conference on Text, Speech and Dialogue, TSD 12, tom 7499 serii Lecture Notes in Artificial Intelligence, str. 119 126, Berlin. Springer-Verlag. Świdziński, M. i Woliński, M. (2010). Towards a bank of constituent parse trees for polish. W: Proceedings of the 13th international conference on Text, Speech and Dialogue, TSD 10, str. 197 204, Berlin, Heidelberg. Springer-Verlag. Wróblewska, A. (2012). Polish dependency bank. Linguistic Issues in Language Technology, 7(1). Wróblewska, A. i Przepiórkowski, A. (2012). Induction of dependency structures based on weighted projection. W: Proceedings of the 4th International Conference on Computational Collective Intelligence Technologies and Applications (ICCCI 2012), Part I, tom 7653 serii Lecture Notes in Artificial Intelligence, str. 364 374, Berlin. Springer-Verlag. Katarzyna Krasnowska (IPI PAN) Automatyczne wykrywanie błędów 26 listopada 2012 49 / 49