Korpusy mowy i narzędzia do ich przetwarzania



Podobne dokumenty
Korpusy i Narzędzia do Analizy Mowy w Clarin-PL

Korpusy i Narzędzia do Analizy Mowy w Clarin-PL

OPIS MODUŁU (PRZEDMIOTU), PROGRAMU NAUCZANIA ORAZ SPOSOBÓW WERYFIKACJI EFEKTÓW KSZTAŁCENIA CZEŚĆ A OPIS MODUŁU (PRZEDMIOTU) studia pierwszego stopnia

KARTA PRZEDMIOTU. 11. ZAŁOŻENIA I CELE PRZEDMIOTU: 1. Dostarczenie studentom dogłębnej wiedzy na temat angielskiego systemu fonologicznego.

Akustyka mowy wprowadzenie. Opracował: dr inż. Piotr Suchomski

Segmentacja akustycznej bazy językowej na potrzeby realizacji korpusowej syntezy mowy w systemie Festival

Synteza mowy. opracowanie: mgr inż. Kuba Łopatka

Program warsztatów CLARIN-PL

OPIS PRZEDMIOTU, PROGRAMU NAUCZANIA ORAZ SPOSOBÓW WERYFIKACJI EFEKTÓW KSZTAŁCENIA. CZEŚĆ A * (opis przedmiotu i programu nauczania) OPIS PRZEDMIOTU

2. Opis zajęć dydaktycznych i pracy studenta

OPIS MODUŁU (PRZEDMIOTU)

2. Opis zajęć dydaktycznych i pracy studenta

Kod przedmiotu w języku polskim Nazwa przedmiotu w języku angielskim USYTUOWANIE PRZEDMIOTU W SYSTEMIE STUDIÓW. Ćwiczenia

Usprawnianie percepcji słuchowej. Jolanta Hysz Konsultant ds. informatyki i edukacji początkowej WODN w Skierniewicach

Język jako hierarchiczny system dwuklasowy

2. Opis zajęć dydaktycznych i pracy studenta

KARTA PRZEDMIOTU. WYMAGANIA WSTĘPNE: znajomość języka angielskiego na poziomie B1 (na początku semestru 2) i B1+ (na początku semestru 3)

Poznańskie Studia Polonistyczne Seria Językoznawcza t. 21 (41), z. 1 DOI: /pspsj

Transkrypcja fonetyczna i synteza mowy. Jolanta Bachan

WyŜsza Szkoła Europejska im. ks. Józefa Tischnera z siedzibą w Krakowie

LUTY MIESIĘCZNIK DLA RODZICÓW DZIECI Z PRZEDSZKOLA NR 24 W CHORZOWIE

Opis akustyczny samogłosek Wprowadzenie

Artykulacja i percepcja w perspektywie psycholingwistycznej

Gramatyka opisowa języka polskiego Kod przedmiotu

FONETYKA. Co to jest fonetyka? Język polski Klasa III Gim

Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści

Wstęp do Językoznawstwa

Wykorzystanie suprasegmentalnych zjawisk językowych w modelowaniu języka polskiego na potrzeby systemu rozpoznawania mowy

Percepcja, język, myśłenie

Zastosowanie MRROC++ do budowy układu sterowania robotem zdolnym do werbalnej komunikacji z człowiekiem

Kognitywistyka UAM, rok II

TEORIA WYTWARZANIA DŹWIĘKÓW

Z punktu widzenia kognitywisty: język naturalny

Profilaktyka logopedyczna w przedszkolu. Jolanta Hysz konsultant ds. informatyki i edukacji początkowej WODN w Skierniewicach

Szko ly strukturalizmu cz. 1.:praska szko la funkcjonalna

Synteza mowy (TTS) Rozpoznawanie mowy (ARM) Optyczne rozpoznawanie znaków (OCR) Jolanta Bachan

Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.

Program Logopedia. - opis szczegółowy. Szereg ciszący.

Michalina Biernacka Uniwersytet Łódzki, Wydział Filologiczny Katedra Lingwistyki Stosowanej i Kulturowej UŁ Łódź, ul.

SŁUCH FONEMATYCZNY. Opracowała: Ewa Pazdro, logopeda. W procesie komunikowania się istotną rolę, obok przekazywania informacji, odgrywa jej odbiór.

ROLA SŁUCHU FONEMATYCZNEGO

Zastosowanie ćwiczeń metafonologicznych w terapii dziecka z trudnościami w czytaniu

Optymalizacja funkcji kosztu w korpusowej syntezie mowy polskiej

USPRAWNIANIE PERCEPCJI SŁUCHOWEJ

PRZEWODNIK PO PRZEDMIOCIE

NeuroVoice. Synteza i analiza mowy. Paweł Mrówka

I. Wstęp II. Niemiecka wymowa ortofoniczna III. Narządy mowy i ich czynności IV. Spółgłoski wprowadzenie ogólne V. Spółgłoski niemieckie

Umysł-język-świat 2012

PRZEWODNIK PO PRZEDMIOCIE. PNJA Fonetyka praktyczna j. angielskiego brytyjskiego Angielski Język Biznesu

PODSTAWOWE WIADOMOŚCI Z GRAMATYKI POLSKIEJ I WŁOSKIEJ SZKIC PORÓWNAWCZY

Przygotowanie bazy difonów języka polskiego dla realizacji syntezy mowy w systemie MBROLA

POJĘCIE KOMPETENCJI FONOLOGICZNEJ VEL FONETYCZNEJ ROZWAŻANIA TERMINOLOGICZNE

Rozwój mowy dziecka OKRES ZDANIA - OD 2 DO 3 ROKU ŻYCIA.

Modelowanie iloczasu głoskowego na potrzeby syntezy mowy polskiej

Optymalizacja funkcji kosztu w korpusowej syntezie mowy polskiej

2. Wymagania wstępne w zakresie wiedzy, umiejętności oraz kompetencji społecznych (jeśli obowiązują): BRAK

PRZEWODNIK PO PRZEDMIOCIE. PNJA Fonetyka praktyczna (j.a. amerykański) Angielski Język Biznesu

Zaburzenia słuchu fonematycznego a niepowodzenia szkolne. Oprac. H. Wasiluk

PRZEWODNIK PO PRZEDMIOCIE. PNJA Fonetyka praktyczna (j.a. amerykański) Angielski Język Biznesu

Jak ćwiczyć słuch fonematyczny wskazówki dla rodziców

WYMAGANIA EDUKACYJNE DLA KLASY II ROK SZKOLNY 2015/2016

PRZEWODNIK PO PRZEDMIOCIE. PNJA Fonetyka praktyczna (j.a. brytyjski) Angielski Język Biznesu

Wykorzystanie metody symultaniczno- sekwencyjnej w terapii logopedycznej. Opracowały: Dębska Martyna, Łągiewka Dorota

polski ENCYKLOPEDIA W TABELACH Wydawnictwo Adamantan

PROGRAM TERAPII LOGOPEDYCZNEJ W PUBLICZNEJ SZKOLE PODSTAWOWEJ

Państwowa Wyższa Szkoła Zawodowa w Nowym Sączu. Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2011/2012

CZYTANIE DYSLEKTYCZNE PORADNIA PSYCHOLOGICZNO PEDAGOGICZNA NR 2 W ELBLĄGU ANNA LASSMANN

IHFIL-L-2k3-2013FA-N IHFIL-L-2k3-2013LS-N

Spis treści. Księgarnia PWN: Alicja Nagórko - Podręczna gramatyka języka polskiego. Przedmowa Wstęp Fonetyka...

Transkrypcja fonetyczna

Rozpoznawanie mowy dla języków semickich. HMM - HTK, CMU SPHINX-4, Simon

Logopedyczny program multimedialny Bambikowe Logoprzygody. - wsparcie w terapii i stymulowaniu rozwoju mowy i języka dziecka

Rozpoznawanie mowy za pomocą HTK

Język jako hierarchiczny system dwuklasowy

dr inż. Ewa Kuśmierek, Kierownik Projektu Warszawa, 25 czerwca 2014 r.

Bateria Testów Fonologicznych IBE

Recenzja rozprawy doktorskiej mgr Michała Lenarczyka

Wstęp do językoznawstwa 2010/2011 dr Konrad Juszczyk Wstęp do językoznawstwa. dr Konrad Juszczyk

kształcenie świadomości fonologicznej u dzieci 6-letnich; podnoszenie sprawności artykulacyjnej;

SŁOWNIK LOGOPEDYCZNY

Księgarnia PWN: Tomasz Karpowicz - Kultura języka polskiego. T. 3. I. Wymowa

OCENĘ DOPUSZCZAJĄCĄ Otrzymuje uczeń, który osiągnął poziom wymagań koniecznych.

KARTA PRZEDMIOTU. 1. NAZWA PRZEDMIOTU: Nauka o języku i komunikacji. 2. KIERUNEK: Nauczanie języka angielskiego na poziomie wczesnoszkolnym

SYLABUS MODUŁU KSZTAŁCENIA

Skrypt z fonetyki teoretycznej i fonologii jêzyka rosyjskiego (z æwiczeniami)

AKUSTYKA MOWY. Podstawy rozpoznawania mowy część I

Cechy charakterystyczne fonetyki polskiej w nauczaniu Katalończyków.

PLAN ZESPOŁU WYRÓWNAWCZEGO W KLASIE III B. Opracowała mgr Anna Śladowska

Gazetka przedszkolna nr 2 luty 2015 r.

USPRAWNIANIE CZYTANIA U UCZNIÓW DYSLEKTYCZNYCH

Uczeń z nieprawidłową wymową

Wymagana edukacyjne z j.niemieckiego mniejszości narodowej w klase I SP

Jak usprawniać wymowę dziecka dwujęzycznego

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

Zajęcia z dzieckiem słabo słyszącym

Komputerowe przetwarzanie sygnału mowy

Fonetyka. to dział gramatyki, który zajmuje się dźwiękami mowy i zjawiskami artykulacyjnymi (wymawianie głosek)

PATOFONETYKA W PRAKTYCE LOGOPEDYCZNEJ

Transkrypt:

Korpusy mowy i narzędzia do ich przetwarzania Danijel Korzinek, Krzysztof Marasek Polsko-Japońska Akademia Technik Komputerowych Katedra Multimediów kmarasek@pjwstk.edu.pl danijel@pjwstk.edu.pl 2015-05-18

Mowa Warsztaty Warszawa 13-15 IV 2015 Fonetyka Badanie dźwięków mowy od strony ich artykulacji Cechy akustyczne dźwięków mowy i ich percepcja Cechy prozodyczne, jakość głosu Fonologia Nauka o systemach dźwiękowych segmentalna segmenty/fonemy Suprasegmentalna dłuższe jednostki i prozodia Lingwistyka komputerowa Wykorzystanie narzędzi komputerowych w analizie mowy Technika Automatyczne rozpoznawanie mowy, rozumienie mowy Synteza mowy, naturalność syntezy Korpusy mowy, ich analiza

Warstwowa struktura komunikacji Warstwa lingwistyczna tekst wypowiedzi Warstwa paralingwistyczna nasz stosunek do tego tekstu Warstwa ekstralingwistyczna cechy mówcy, jego status społeczny, to co nas identyfikuje http://www2.ims.uni-stuttgart.de/egg/

Segmentalna struktura mowy Feature cecha odróżniająca od innych segmentów Segment część o stałych cechach Syllable sylaba, jednostka organizacji wypowiedzi Setting cecha paralingwistyczna utterance fraza wypowiedzi speaking-turn cała wypowiedź

Głoska, segment, fonem Głoska: najmniejsza, niepodzielna cząstka formy dźwiękowej języka. Cecha dystynktywna odróżniająca dźwięki (głoski, segmenty) danego języka, przy czym różnica między segmentami pociąga za sobą różnicę w znaczeniu wyrazów (opozycja fonologiczna). Cechy dystynktywne funkcjonują zawsze w określonym języku Fonem abstrakcyjna jednostka, będąca zbiorem cech dystynktywnych głoski. Fonem pełni w mowie rolę podobną do liter alfabetu. Głoska jest to konkretna realizacja dźwiękowa danego fonemu. W przypadku regularnych kontekstowych zmian realizacji dźwiękowej danego fonemu taką realizację głoski nazywamy allofonem.

Fonemy w języku polskim Analiza akustyczna mowy polskiej daje podstawy do przyjęcia, że w języku polskim mamy 6 samogłosek ustnych 2 samogłoski nazalizowane 29 spółgłosek W sumie 37 fonemów

Transkrypcja fonetyczna Konwersja zapisu ortograficznego na fonetyczny Różne alfabety (IPA, SAMPA..) Problemy transkrypcji Warianty wymowy Zjawiska fonetyczne koartykulacja, upodobnienia pod względem dźwięczności, nosowości, miękkości, miejsca i sposobu artykulacji Asymilacje (perseweracje i antycypacje) Niedbała wymowa, regionalizmy https://gramatyka.wordpress.com/2007/06/13/zmiany-gloskowe-ze-wzgledu-na-cechektorej-dotyczy-wplyw-sasiedztwa-fonetycznego/ Symbol Word Transcription PLOSIVES p pat pat b bat bat t test test d dym dim k kat kat g gen gen AFFRICATES ts coś tsos dz dzwon dzvon ts ćwicz ts fits dz dźwięk dz vje~k ts czyn tsin dz dżin dzin FRICATIVES f fin fin v waga vaga s syk sik z zez zes S szyk SIk Z żyto ZIto s świt s fit z źle z le x hak hak NASALS m mak mak n nasz nas n koń kon N gong gong LATERAL l luk luk APPROXIMANTS r rak rak w łuk wuk j jak jak i tik tik I typ tip e test test a pat pat o pot pot u puk puk e~ tę te~ o~ tą to~ CONSONANTS VOWELS

Organizacja wypowiedzi Struktura płytka opis akustyczny, składnia Cechy segmentów akustycznych Struktura głęboka semantyka Prozodia intonacja, głośność, sposób wypowiedzi 500 450 400 350 300 250 ts I m b I u g p a n S p I s w a ts' k o o g z' e t o v r f e k r o 200 a n 150 100 50 0 0 0.25 0.5 0.75 1 1.25 1.5 1.75 2 2.25 2.5 Czas [s]

Opis sygnału mowy: samogłoski Warsztaty Warszawa 13-15 IV 2015

Opis sygnału mowy: spółgłoski Warsztaty Warszawa 13-15 IV 2015

Analiza sygnału mowy Warsztaty Warszawa 13-15 IV 2015 Intensywność (głośność) Rodzaj pobudzenia dźwięki harmoniczne, trące, zwarte Barwa dźwięku Iloczas Praat

Mowa a inne dźwięki Warsztaty Warszawa 13-15 IV 2015 Parametryzacja sygnału mowy Klasyfikatory statystyczne Uczenie maszynowe Podejście hierarchiczne Detekcja mowy Rozpoznawanie innych dźwięków web.mit.edu

Dopasowanie czasowe Warsztaty Warszawa 13-15 IV 2015 Dopasowanie tekstu do nagrań Znany tekst, znane nagranie Wykorzystanie technologii ASR Tekst->transkrypcja fonetyczna->parametryzacja sygnału- >wyszukanie najlepszych modeli->dopasowanie do sygnału

W przygotowaniu Warsztaty Warszawa 13-15 IV 2015 Wyszukiwanie słów kluczowych Fonetyczna baza danych

Dziękuję za uwagę

Diaryzacja mówców Warsztaty Warszawa 13-15 IV 2015 Podział nagrania na poszczególnych mówców i ich ew. rozpoznawanie Aktualne rozwiązanie bazuje na LIUM Speaker diarization toolkit (FR) Własne modele mówców Wyszukiwanie tego samego mówcy w nagraniach Przy dużej bazie mówców konieczne duże zasoby i dużo cierpliwości