Maszynowe tłumaczenie Polskiego Języka Migowego

Podobne dokumenty
Gramatyka TAG dla języka polskiego

Wydobywanie reguł na potrzeby ujednoznaczniania morfo-syntaktycznego oraz płytkiej analizy składniowej tekstów polskich

Course type* German I BA C 90/120 WS/SS 8/9. German I BA C 30 WS 2. English I BA C 60/90 WS/SS 5/6. English I BA C 30 WS 2. German I BA L 30 WS 4

MIT nr. 1 Niesłyszący czytają z ust i wszystko rozumieją.

Materiał pomocniczy dla nauczycieli kształcących w zawodzie:

Model zaszumionego kanału

Krzysztof Michalski: Chodzi o kilkadziesiąt tysięcy mniejszości

Lokalizacja Oprogramowania

Wpływ automatycznego tłumaczenia na wyniki automatycznej identyfikacji cha- rakteru opinii konsumenckich. 1 Wstęp

Metody automatycznego wykrywania błędów w bankach drzew

Języki programowania zasady ich tworzenia

UMCS, Department of English, BA Courses

Regulamin Studium Języków Obcych PJATK Gdańsk WYDZIAŁ INFORMATYKI WYDZIAŁ SZTUKI NOWYCH MEDIÓW

Testowanie biegłości językowej w zakresie języków wizualnoprzestrzennych

Field of study: Computer Science Study level: First-cycle studies Form and type of study: Full-time studies. Auditorium classes.

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA (2017/ /2019) (skrajne daty) 1. PODSTAWOWE INFORMACJE O PRZEDMIOCIE/MODULE

ID1SII4. Informatyka I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) stacjonarne (stacjonarne / niestacjonarne)

Narzędzia do ekstrakcji informacji z tekstu

UMCS, English Institute, BA Courses

Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego

Bank częściowo ujednoznacznionych struktur LFG

Wydział Informatyki, Elektroniki i Telekomunikacji

Z punktu widzenia kognitywisty: język naturalny

Zasób leksykalny polszczyzny II poł. XIX wieku a możliwość automatycznej analizy morfologicznej tekstów z tego okresu

CLARIN rozproszony system technologii językowych dla różnych języków europejskich

LEMRG algorytm generowania pokoleń reguł decyzji dla baz danych z dużą liczbą atrybutów

Nauczanie i uczenie się polskiego języka migowego metodą Vision Virtuelle

Forma. Główny cel kursu. Umiejętności nabywane przez studentów. Wymagania wstępne:

Kierunek: Elektronika i Telekomunikacja Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne. Wykład Ćwiczenia

Fakty i mity na temat edukacji specjalnej

SYLABUS. DOTYCZY CYKLU KSZTAŁCENIA (skrajne daty) Podstawy języka migowego

Kierunek: Informatyka Poziom studiów: Studia I stopnia Forma studiów: Stacjonarne. audytoryjne. Wykład Ćwiczenia

Analiza leksykalna 1. Teoria kompilacji. Dr inż. Janusz Majewski Katedra Informatyki

Open Access w technologii językowej dla języka polskiego


EGZAMIN MATURALNY, ANALIZA WYNIKÓW W LATACH XX Liceum Ogólnokształcące w Gdańsku

SYLABUS. DOTYCZY CYKLU KSZTAŁCENIA (skrajne daty) Podstawy języka migowego

Szkolne plany nauczania 2017/18; 2018/19; 2019/20. klasy I

Szkolne plany nauczania 2017/18; 2018/19; 2019/20. klasy I

Nowości oraz trendy w obszarze BPM nurty i kierunki rozwoju. Jarosław Żeliński analityk biznesowy, projektant systemów

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA Bieżący sylabus w semestrze zimowym roku 2016/17

Obecny model edukacji głuchych: plusy i minusy

Wykaz publikacji i konferencji

Szkolne plany nauczania 2017/18; 2018/19; 2019/20. klasy II

SYLABUS. DOTYCZY CYKLU KSZTAŁCENIA (skrajne daty) Podstawy języka migowego. mgr Anna Bejster ćwiczenia konwersatoryjne

Field of study: Electronics and Telecommunications Study level: First-cycle studies Form and type of study: Full-time studies. Auditorium classes

Informatyka studia stacjonarne pierwszego stopnia

Spis treści 0. Szkoła Tokarskiego Marcin Woliński Adam Przepiórkowski Korpus IPI PAN Inne pojęcia LXIII Zjazd PTJ, Warszawa

Szanowni Państwo, Konferencja będzie tłumaczona na polski język migowy.

PoliTa multitager morfosyntaktyczny dla j. ezyka polskiego

Biometryczna Identyfikacja Tożsamości

PRZEWODNIK PO PRZEDMIOCIE

Field of study: Computer Science Study level: First-cycle studies Form and type of study: Full-time studies. Auditorium classes.

Widzenie komputerowe (computer vision)

dla elektroniki i elektrotechniki dla elektroinstalatorów

Inżynieria języka z językiem migowym w tle

Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.

PRZEWODNIK PO PRZEDMIOCIE RODZAJ ZAJĘĆ LICZBA GODZIN W SEMESTRZE WYKŁAD ĆWICZENIA LABORATORIUM PROJEKT SEMINARIUM 30

Jacek Tomaszczyk Instytut Bibliotekoznawstwa i Informacji Naukowej Uniwersytet Śląski

ZASADY REKRUTACJI. Wydział Nauk Humanistycznych i Społecznych

Wprowadzenie. Teoria automatów i języków formalnych. Literatura (1)

Zastosowanie sieci neuronowych w problemie klasyfikacji wielokategorialnej. Adam Żychowski





Raport z realizacji projektu Przyszłość pieniądza kryptowaluty, waluty lokalne, gospodarka bezgotówkowa

Transkrypcja wywiadu z dr. Pawłem Rutkowskim dla Platon TV (10 marca 2014 r.). Rozmowę prowadziła Magdalena Madej.

Kierunek: Informatyka Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne. Wykład Ćwiczenia

Studia Podyplomowe Polski Język Migowy Postgraduate Studies Polish Sign Language Wydział Polonistyki Uniwersytetu Warszawskiego *

Uchwała nr 44/2018 Senatu Politechniki Rzeszowskiej im. Ignacego Łukasiewicza z dnia 24 maja 2018 r.

PRZEWODNIK PO PRZEDMIOCIE

SYLABUS. DOTYCZY CYKLU KSZTAŁCENIA (skrajne daty) Język migowy z terminologią medyczną

Course name (in English) - unofficial translation Year Semester ECTS

Automatyczne wspomaganie tworzenia słowników fleksyjnych jednostek wieloczłonowych

Uchwała nr 44/2018 Senatu Politechniki Rzeszowskiej im. Ignacego Łukasiewicza z dnia 24 maja 2018 r.

SYLABUS MODUŁU (PRZEDMIOTU) Informacje ogólne. Język migowy. Nie dotyczy

Ekstrakcja informacji o zdarzeniach z tekstów dziedzinowych

Kryteria ocen z języka hiszpańskiego

Translacja wprowadzenie

Kierunek: Informatyka rev rev jrn Stacjonarny EN 1 / 6

TERMIN NADSYŁANIA ZGŁOSZEŃ/ ABSTRAKTÓW WIĘCEJ INFORMACJI NA: TERMIN KONFERENCJI KONTAKT ORGANIZATOR NAZWA

Barbara Mazur Beata Sokołowska Katarzyna Zagórska

Podział na okręgi wyborcze w wyborach do organów Samorządu Studentów Uniwersytetu Jagiellońskiego na kadencję

Regulamin Studium Języków Obcych PJATK Gdańsk

Załącznik do Uchwały Senatu nr IX/87/16/17

Aleksandra Włodarczak tel

Biometryczna Identyfikacja Tożsamości

Automatyczna ekstrakcja i klasyfikacja semantyczna wielosegmentowych jednostek leksykalnych języka naturalnego

11 Probabilistic Context Free Grammars

RAMOWY PROGRAM KONFERENCJI Wszystkie wystąpienia będą tłumaczone na polski język migowy.

CASPAR długoterminowa archiwizacja zasobów cyfrowych

Rola komunikacji migowej w rozwoju i edukacji dzieci głuchych

Szkolne plany nauczania

ID1SIII4. Informatyka I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) stacjonarne (stacjonarne / niestacjonarne)

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA

RAPORT Z DIAGNOZY WSTĘPNEJ Z JĘZYKÓW OBCYCH W ROKU SZKOLNYM 2014/2015. TERMIN: wrzesień 2014 r. OPRACOWAŁA: Janina Angowska

Ewa Piotrowska-Rola Marzena Porębska POLSKI JEST COOL. Seria do nauki języka polskiego jako obcego na poziomie A1 ZESZYT ĆWICZEŃ

Transkrypt:

Maszynowe tłumaczenie Polskiego Języka Migowego Projekt WiTKoM Dorota Grądalska VoicePIN.com Sp. z o.o; Akademia Górniczo-Hutnicza, Wydział Informatyki, Elektroniki i Telekomunikacji, Katedra Elektroniki dorota.gradalska@gmail.com Krzysztof Wróbel Akademia Górniczo-Hutnicza, Katedra Informatyki; Uniwersytet Jagielloński, Katedra Lingwistyki Komputerowej kwrobel@agh.edu.pl

Wirtualny Tłumacz Komunikacji Migowej (WiTKoM) Projekt realizowany przez konsorcjum naukowe Akademii Górniczo-Hutniczej oraz VoicePIN.com sp. z o.o. w latach 2013-2015 w ramach Programu Badań Stosowanych Narodowego Centrum Badań i Rozwoju. Głównym celem projektu jest zbadanie możliwości zastosowania algorytmów rozpoznawania obrazu, uczenia maszynowego i przetwarzania języka naturalnego w kontekście wypowiedzi w Polskim Języku Migowym (PJM).

Schematic workflow in WiTKoM project, author: mgr inż. Katarzyna Barczewska

Schematic workflow in WiTKoM project, author: mgr inż. Katarzyna Barczewska

Cechy Polskiego Języka Migowego (PJM) naturalny język osób Głuchych dostępny w poznaniu wzrokowym odrębny i niezależny od języka polskiego wyróżniający się gramatyką wizualno-przestrzenną zawiera elementy, które nie występują w językach fonicznych (mimika, klasyfikatory kształtu, wielkości, ruchu etc.) zróżnicowany regionalnie obcy dla słyszących

Szyk zdania w Polskim Języku Migowym - przykłady 1. Na stole obok siebie leżą dwie książki. PJM: [STÓŁ] [KSIĄŻKA] [KSIĄŻKA] 2. Kot pije mleko. PJM: [KOT] [PIĆ MLEKO + klasyfikator ruchu] 3. On lubi jabłka. PJM: [ON] [JABŁKO] [LUBIĆ] 4. Dziewczynka podniosła oczy do góry. PJM: [DZIEWCZYNKA] [PATRZEĆ + klasyfikator ruchu gałek ocznych] 5. Kiedy odbędzie się egzamin? PJM: [EGZAMIN] [KIEDY] + {mimika pytająca}

Cechy Polskiego Języka Migowego (PJM) naturalny język osób Głuchych dostępny w poznaniu wzrokowym odrębny i niezależny od języka polskiego wyróżniający się gramatyką wizualno-przestrzenną zawiera elementy, które nie występują w językach fonicznych (mimika, klasyfikatory kształtu, wielkości, ruchu etc.) zróżnicowany regionalnie obcy dla słyszących

Stan wiedzy o PJM język słabo poznany, Pozostawał w zasadzie poza obszarem zainteresowania polskiego językoznawstwa aż do połowy lat 90-tych XX w. Badania nad PJM prowadzi, powołana w 2010 r. na Wydziale Polonistyki Uniwersytetu Warszawskiego, Pracownia Lingwistyki Migowej. Obecnym kierownikiem Pracowni jest dr Paweł Rutkowski. nieustalony korpus leksykalny, jedynie cząstkowe opracowania gramatyki, niewielka liczba materiałów źródłowych.

Tłumaczenie maszynowe Słońce jest żółte. - A nap sárga. Słońce jest niebieskie. - A nap kék. Niebo jest niebieskie. - Az ég kék. Niebo jest żółte. - Az ég sárga. Trawa jest zielona. - A fű zöld. Kupiłem zieloną trawę. - Megvettem a zöld fű.

Tłumaczenie maszynowe Słońce jest żółte. - A nap sárga. Słońce jest niebieskie. - A nap kék. Niebo jest niebieskie. - Az ég kék. Niebo jest żółte. - Az ég sárga. Trawa jest zielona. - A fű zöld. Kupiłem zieloną trawę. - Megvettem a zöld fű. słońce - a nap niebo - az ég trawa - a fű żółte - sárga niebieskie - kék zielone - zöld

Korpus Przykłady: Daj mi twoją książkę. - [TWÓJ] [KSIĄŻKA] [DAĆ MI] [.] Ja nie lubię pisać. - [JA] [PISAĆ] [NIE LUBIĆ] [.] Ogólne Ilość zdań Medyczne Wszystkie 48 52 100 Średnia ilość słów w zdaniu 6,79 8,88 7,88 Ilość słów 326 462 780 Ilość unikalnych słów 108 203 270

Język polski - narzędzia tagger morfosyntaktyczny forma lemma znaczniki Daj dać impt:sg:sec:perf mi ja ppron12:sg:dat:m1:pri:nakc Twoją twój adj:sg:acc:f:pos książkę książka subst:sg:acc:f.. interp Waszczuk J. (2012). Harnessing the CRF complexity with domain-specific constraints. The case of morphosyntactic tagging of a highly inflected language. Mumbai: COLING

Język polski - narzędzia parser zależnościowy Wróblewska A., Woliński M. (2012). Preliminary experiments in Polish dependency parsing." Security and Intelligent Information Systems. Springer Berlin Heidelberg, pp. 279-292.

PJM - narzędzia brak

Reguły tłumaczenia operują na drzewie zależnościowym struktura własności definiują akcje: usuwania słów dodawania zależności łączenia wyrazów wielosegmentowych nie uwzględniają kolejności wyrazów w zdaniu Kay, M. (1984). "Functional unification grammar: A formalism for machine translation." Proceedings of the 10th International Conference on Computational Linguistics and 22nd annual meeting on Association for Computational Linguistics. Association for Computational Linguistics.

Przykład dodaj osobę ( ty ) gdy ujęta w czasowniku

Wyniki PER (%) Ogólne Medyczne Wszystkie Brak reguł 42,69 56,04 49,64 30 reguł 19,57 35,45 27,83 System tłumaczenia dla języka hiszpańskiego osiągnął PER 13,17 na 150 zdaniach z 153 regułami. Statystyczna metoda wytrenowana na 266 zdaniach osiągnęła PER 29,14. San-Segundo R. et al. (2008). "Speech to sign language translation system for Spanish." Speech Communication 50.11, pp. 1009-1020.

Dalsze prace dokończenie implementacji zdefiniowanych reguł próba statystycznego zamodelowania kolejności znaków w zdaniu na poziomie zależnościowym {pred, obj_th, obj, punct, subj} (subj, pred, objt_th, obj, punct) {adjunct, obj} (adjunct,obj)

Kontakt Projekt WiTKoM Kierownik projektu: dr inż. Jakub Gałka jgalka@agh.edu.pl Dorota Grądalska: dorota.gradalska@gmail.com Krzysztof Wróbel: kwrobel@agh.edu.pl Praca finansowana przez Narodowe Centrum Badań i Rozwoju w ramach Programu Badań Stosowanych, projekt nr PBS2/B3/21/2013, pt. Wirtualny Tłumacz Komunikacji Migowej.