HARMONOGRAM ORAZ INSTRUKCJE DWICZEO

Podobne dokumenty
4 Zasoby językowe Korpusy obcojęzyczne Korpusy języka polskiego Słowniki Sposoby gromadzenia danych...

TEORIA WYTWARZANIA DŹWIĘKÓW

PRZEWODNIK PO PRZEDMIOCIE

Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści

Podstawy Przetwarzania Sygnałów

PRZEWODNIK PO PRZEDMIOCIE

Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej

Zakres wymaganych wiadomości do testów z przedmiotu Metrologia. Wprowadzenie do obsługi multimetrów analogowych i cyfrowych

Ćwiczenie 3,4. Analiza widmowa sygnałów czasowych: sinus, trójkąt, prostokąt, szum biały i szum różowy

II. Cel dwiczenia: Zastosowanie oprogramowania ImagePro Plus

Akustyka mowy wprowadzenie. Opracował: dr inż. Piotr Suchomski

Rozpoznawanie i synteza mowy w systemach multimedialnych. Analiza i synteza mowy - wprowadzenie. Spektrogram wyrażenia: computer speech

Komputerowe systemy pomiarowe. Dr Zbigniew Kozioł - wykład Mgr Mariusz Woźny - laboratorium

PRZEWODNIK PO PRZEDMIOCIE

PRZEWODNIK PO PRZEDMIOCIE

Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej

PRZEWODNIK PO PRZEDMIOCIE

KARTA MODUŁU KSZTAŁCENIA

2. Próbkowanie Sygnały okresowe (16). Trygonometryczny szereg Fouriera (17). Częstotliwość Nyquista (20).

Zjawisko aliasingu. Filtr antyaliasingowy. Przecieki widma - okna czasowe.

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

58. Otwarte Seminarium z Akustyki, OSA '11, Gdańsk-Jurata, September 2011

ZAKŁAD SYSTEMÓW ELEKTRONICZNYCH I TELEKOMUNIKACYJNYCH Laboratorium Podstaw Telekomunikacji WPŁYW SZUMÓW NA TRANSMISJĘ CYFROWĄ

Laboratorium EAM. Instrukcja obsługi programu Dopp Meter ver. 1.0

Cyfrowe przetwarzanie sygnałów w urządzeniach EAZ firmy Computers & Control

PRZEWODNIK PO PRZEDMIOCIE

WOJSKOWA AKADEMIA TECHNICZNA

Analizy Ilościowe EEG QEEG

ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU

Ćwiczenie 4: Próbkowanie sygnałów

Pomiary w technice studyjnej. TESTY PESQ i PEAQ

Parametryzacja przetworników analogowocyfrowych

PRZEWODNIK PO PRZEDMIOCIE

Filtry cyfrowe procesory sygnałowe

Elektronika i Telekomunikacja I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny)

Przetwarzanie AC i CA

PRZEWODNIK PO PRZEDMIOCIE

Widmo akustyczne radia DAB i FM, porównanie okien czasowych Leszek Gorzelnik

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

Kwantowanie sygnałów analogowych na przykładzie sygnału mowy

Miernictwo dynamiczne Dynamic Measurement. Elektrotechnika I stopnia (I stopień / II stopień) Ogólnoakademicki (ogólno akademicki / praktyczny)

Przetwarzanie A/C i C/A

Wymiar: Forma: Semestr: 30 h wykład VII 30 h laboratoria VII

KARTA PROGRAMOWA. Technologia informacyjna M25 Nazwa modułu kształcenia w języku angielskim

Ćwiczenie 11. Podstawy akwizycji i cyfrowego przetwarzania sygnałów. Program ćwiczenia:

MODEL AKUSTYCZNY SALI WIDOWISKOWEJ TEATRU POLSKIEGO IM. ARNOLDA SZYFMANA W WARSZAWIE

Zaawansowane algorytmy DSP

ĆWICZENIE nr 3. Badanie podstawowych parametrów metrologicznych przetworników analogowo-cyfrowych

Badanie widma fali akustycznej

Informatyka I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) kierunkowy (podstawowy / kierunkowy / inny HES)

Zalecane ustawienia zwrotnic i filtrów

Doświadczalne wyznaczanie prędkości dźwięku w powietrzu

System Oceny Uczniów

Generator przebiegów pomiarowych Ex-GPP2

PL B1. Sposób i układ pomiaru całkowitego współczynnika odkształcenia THD sygnałów elektrycznych w systemach zasilających

PRZEWODNIK PO PRZEDMIOCIE

Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej

Synteza mowy. opracowanie: mgr inż. Kuba Łopatka

Ćwiczenie EA8 Prądnice tachometryczne

Co to jest dźwięk. Dźwięk to wyrażenie słuchowe wywołane przez falę akustyczną. Ludzki narząd wyłapuje dźwięki z częstotliwością 16 do 20 Hz

Ćwiczenie - 1 OBSŁUGA GENERATORA I OSCYLOSKOPU. WYZNACZANIE CHARAKTERYSTYKI AMPLITUDOWEJ I FAZOWEJ NA PRZYKŁADZIE FILTRU RC.

Laboratorium Telewizji Cyfrowej

KARTA MODUŁU KSZTAŁCENIA

Generowanie sygnałów na DSP

Egzamin / zaliczenie na ocenę*

Analiza sygnałów biologicznych

KAMERA AKUSTYCZNA NOISE INSPECTOR DLA SZYBKIEJ LOKALIZACJI ŹRÓDEŁ HAŁASU

Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2)

Sprawdzian wiadomości z jednostki szkoleniowej M3.JM1.JS3 Użytkowanie kart dźwiękowych, głośników i mikrofonów

KARTA PRZEDMIOTU. Techniki przetwarzania sygnałów, D1_3

EDUKACJA WCZESNOSZKOLNA KRYTERIA OCEN KLASA 1

PRZEWODNIK PO PRZEDMIOCIE

Metodyka i system dopasowania protez słuchu w oparciu o badanie percepcji sygnału mowy w szumie

PRZETWARZANIE MOWY W CZASIE RZECZYWISTYM

Cechy karty dzwiękowej

WYDZIAŁ FIZYKI I INFORMATYKI STOSOWANEJ

Rozdział 5. Przetwarzanie analogowo-cyfrowe (A C)

Komputerowe systemy pomiarowe. Podstawowe elementy sprzętowe elektronicznych układów pomiarowych

III. Przebieg ćwiczenia. 1. Generowanie i wizualizacja przebiegów oraz wyznaczanie ich podstawowych parametrów

Wydział Elektryczny. Katedra Telekomunikacji i Aparatury Elektronicznej. Instrukcja do pracowni specjalistycznej

Politechnika Łódzka. Instytut Systemów Inżynierii Elektrycznej

Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej

Transformata Fouriera

Algorytmy detekcji częstotliwości podstawowej

PRZEWODNIK PO PRZEDMIOCIE

Opis akustyczny samogłosek Wprowadzenie

Ćwiczenie: "Mierniki cyfrowe"

dr inż. Jacek Naruniec

Ćwiczenie 5. Pomiary parametrów sygnałów napięciowych. Program ćwiczenia:

Ćwiczenie 4. Filtry o skończonej odpowiedzi impulsowej (SOI)

PRZEWODNIK PO PRZEDMIOCIE

Imię i nazwisko (e mail) Grupa:

Systemy multimedialne. Instrukcja 5 Edytor audio Audacity

Teoria sygnałów Signal Theory. Elektrotechnika I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny)

PRZEWODNIK PO PRZEDMIOCIE

Tematy prac dyplomowych w Katedrze Awioniki i Sterowania Studia I stopnia (inżynierskie)

PRZEWODNIK PO PRZEDMIOCIE

PRZEWODNIK PO PRZEDMIOCIE

Dźwięk dźwiękowi nierówny, czyli o tym jak brzmi XXI wiek

Ćw. 7 Przetworniki A/C i C/A

Transkrypt:

HARMONOGRAM ORAZ INSTRUKCJE DWICZEO O p ra c o wa n ie: dr inż. J er zy Sa w icki S z c z ec in 2008

WYKAZ DWICZEO LABORATORYJNYCH ORAZ HARMONOGRAM ZAJĘD TEMATY DWICZEO LABORATORYJNYCH (w nawiasach symboliczne skróty) 1. Zapoznanie ze stanowiskami laboratoryjnymi, strukturą sprzętu i oprogramowania (BAZA). 2. Badanie wpływu częstotliwości próbkowania i rozdzielczości bitowej na zrozumiałośd i subiektywnie odczuwaną jakośd sygnału mowy (KOD). 3. Pomiary częstotliwości podstawowej głosu (F0). 4. Wygładzanie widma sygnału mowy (LPC). 5. Pomiar częstotliwości formantowych (FORMANT). 6. Rozpoznawanie dźwięków mowy na podstawie mapy formantów F1-F2 (ARM). 7. Synteza sygnału mowy (SYNTEZA). HARMONOGRAM DWICZEO LABORATORYJNYCH Zespół 1 Zespół 2 Zespół 3 Zespół 4 Zajęcia 1 Zajęcia 2 Zajęcia 3 Zajęcia 4 Zajęcia 5 Zajęcia 6 Zajęcia 7 BAZA KOD F0 LPC FORMANT ARM SYNTEZA Zajęcia odbywają się co dwa tygodnie po dwie godziny.

DWICZENIE NR 1 (BAZA) ZAPOZNANIE ZE STANOWISKAMI LABORATORYJNYMI, STRUKTURĄ SPRZĘTU I OPROGRAMOWANIA WYMAGANA jest podstawowa wiedza z zakresu reprezentacji sygnału mowy w dziedzinie czasu i częstotliwości. PRZEBIEG ZAJĘD Zapoznanie się z następującymi stanowiskami: 1. System edycji i analizy dźwięków SonoLab firmy Young Digital Poland. 2. Program do edycji i analizy sygnału mowy MultiSpeech firmy KAY-Pentax. 3. Program do analizy sygnału mowy Praat z Institute of Phonetic Sciences, Amsterdam. Nauka podstawowych czynności na każdym ze stanowisk: 1. Ustawianie parametrów rejestracji sygnału z mikrofonu (częstotliwośd próbkowania, ilośd kanałów, preemfaza, czas rejestracji, wizualizacja przebiegu). 2. Zapisywanie i odczytywanie plików dźwiękowych. 3. Dodawanie uzupełniających informacji fonetycznych do pliku dźwiękowego. 4. Edycja przebiegu czasowego sygnału mowy. 5. Podstawowe operacje w dziedzinie czasu i częstotliwości (przycinanie pliku, filtracja). 6. Obserwacja przebiegów czasowych, widm i spektrogramów dla izolowanych samogłosek, spółgłosek szumowych i innych dźwięków. Porównanie poziomów sygnałów i szerokości pasma różnych dźwięków. 7. Obserwacja wpływu rodzaju okna czasowego na analizy widmowe sygnału mowy. SPRAWOZDANIE Z DWICZENIA nie jest wymagane. 1. System edycji i analizy dźwięku SonoLab instrukcja obsługi (dostępna do wglądu w sali C221). 2. MultiSpeech instrukcja obsługi (dostępna do wglądu w sali C221). 3. Praat program oraz instrukcja obsługi dostępne w Internecie: www.fon.hum.uva.nl

DWICZENIE NR 2 (KOD) BADANIE WPŁYWU CZĘSTOTLIWOŚCI PRÓBKOWANIA I ROZDZIELCZOŚCI BITOWEJ NA ZROZUMIAŁOŚD I SUBIEKTYWNIE ODCZUWANĄ JAKOŚD SYGNAŁU MOWY WYMAGANA jest znajomośd zasad poprawnego próbkowania i kwantowania sygnałów. PRZEBIEG ZAJĘD 1. Rejestracja za pomocą mikrofonu krótkiego komunikatu głosowego (np. data dzienna, godzina itp.) z maksymalną częstotliwością próbkowania na jaką pozwala dany system wprowadzania danych i zapisanie go w pliku. 2. Wykonywanie kolejnych filtracji i przepróbowao sygnału oraz odsłuchowa ocena utraty jakości i pogorszenia zrozumiałości w porównaniu z redukcją objętości informacyjnej sygnału w bitach/sekundę. 3. Obserwacja zjawiska aliasingu włączanie i wyłączanie filtru antyaliasingowego. 4. Rejestracja za pomocą mikrofonu krótkiego komunikatu głosowego z częstotliwością próbkowania 32 khz i zapisanie go w pliku. Należy zwrócid uwagę, by sygnał wykorzystywał większośd dostępnych poziomów kwantowania. 5. Zmniejszanie rozdzielczości bitowej wszystkich próbek zarejestrowanego sygnału, przywracanie oryginalnego poziomu i odsłuchowa ocena utraty jakości i pogorszenia zrozumiałości w porównaniu z redukcją objętości informacyjnej sygnału w bitach/sekundę. 6. Rejestracja za pomocą mikrofonu krótkiego komunikatu głosowego z częstotliwością próbkowania 16 khz, dodanie dwóch jego powtórzeo i zapisanie go w pliku. Należy znaleźd taką częstotliwośd graniczną f g, która podzieli zarejestrowany sygnał na dwie subiektywnie równoważne części: dolnoprzepustową (poniżej f g powtórzenie pierwsze) i górnoprzepustową (powyżej f g powtórzenie drugie). Należy zacząd od f g = 4 khz, a następnie korygowad wartośd stosownie do subiektywnego wyniku. W przypadku zmiany poziomu sygnału po filtracji dokonad odpowiedniej korekcji wzmocnienia. SPRAWOZDANIE Z DWICZENIA ma zawierad zwarty opis przeprowadzonych badao oraz wnioski. W celu ilustracji można wykorzystad zapisane podczas badao kopie obrazu komputerowego.

DWICZENIE NR 3 (F0) POMIARY CZĘSTOTLIWOŚCI PODSTAWOWEJ GŁOSU WYMAGANA jest znajomośd procesu wytwarzania mowy, modelu typu źródło-filtr, budowy akustycznej sygnału głosek dźwięcznych, relacji między przebiegiem czasowym a widmem sygnału okresowego. 1. Rejestracja za pomocą mikrofonu samogłosek i krótkich słów. Obserwacja struktury przebiegu czasowego. Znajdowanie granic kolejnych okresów częstotliwości podstawowej (tonu krtaniowego). Obserwacja widma jednego okresu tonu krtaniowego (zmiany poziomu harmonicznych, ilośd harmonicznych). 2. Wykorzystanie sygnału błędu LPC do automatycznego wyznaczania granic okresu tonu krtaniowego w przebiegu czasowym. 3. Pomiar częstotliwości podstawowej głosów członków zespołu. 4. Zdolnośd maksymalnej zmiany częstotliwości podstawowej głosu eksperyment z generowaniem bardzo niskich i bardzo wysokich częstotliwości podstawowych. Obliczanie przedziału zmian w oktawach. 5. Rejestracja za pomocą mikrofonu zdao pytających i ich zapisanie w pliku. 6. Automatyczne wyznaczanie dla zarejestrowanych zdao znaczników tonu krtaniowego oraz konturu intonacyjnego. Obserwacja pojawiających się błędów. SPRAWOZDANIE Z DWICZENIA powinno zawierad wyniki pomiarów z oszacowaniem dokładności, porównanie otrzymanych wyników F0 z danym statystycznymi, klasyfikację muzyczną wysokości głosu.

DWICZENIE NR 4 (LPC) WYGŁADZANIE WIDMA SYGNAŁU MOWY WYMAGANA jest znajomośd podstaw teoretycznych techniki liniowej predykcji (LPC) oraz analizy kepstralnej. 1. Rejestracja za pomocą mikrofonu izolowanych samogłosek. Analiza LPC w różnych miejscach przebiegu czasowego samogłosek. 2. Badanie wpływu rzędu LPC na poprawnośd znajdowania formantów F1-F4. 3. Określenie wpływu preemfazy na wyniki analizy LPC. 4. Dla tych samych samogłosek wykonad analizę kepstralną, określid długośd liftru i wygładzid widmo odrzucając szybkozmienną częśd kepstrum. 5. Porównad wyniki wyniki wygładzania widma za pomocą LPC i kepstrum. SPRAWOZDANIE Z DWICZENIA powinno zawierad wyniki zwarty opis przeprowadzonych badao z zestawieniem wyników częstotliwości formantowych otrzymanych w wyniku zastosowania obydwu rodzajów analiz. 3. Bolc L., Borodziewicz W., Cytowski J., Jaszczak K.: Komputerowe przetwarzanie sygnału mowy. Metody. Technologia. Zastosowania, Wydawnictwa UW, Warszawa 1990. 4. Cytowski J.: Metody i algorytmy sztucznej inteligencji w cyfrowym przetwarzaniu sygnałów, Akademicka Oficyna Wydawnicza PLJ, Warszawa 1999 I N Ż Y N I E R I A B I O M E D Y C Z N A I A K U S T Y C Z N A W W W. I B A. P S. P L

DWICZENIE NR 5 (FORMANTY) POMIAR CZĘSTOTLIWOŚCI FORMANTOWYCH WYMAGANA jest znajomośd podstaw teoretycznych techniki liniowej predykcji oraz umiejętnośd jej praktycznego wykorzystania. 1. Rejestracja za pomocą mikrofonu (f p = 8 khz) sześciu podstawowych wypowiadanych w izolacji samogłosek *a, e, i, o,u, y+ przez każdego uczestnika dwiczenia. 2. Wykonanie preemfazy i zachowanie materiału dźwiękowego w pliku. 3. Określenie wartości częstotliwości formantowych F1, F2, F3 i F4 dla każdej samogłoski (należy kontrolowad poprawnośd identyfikacji formantów przez porównywanie z przeciętnymi wynikami publikowanymi w literaturze). 4. Powtórzyd punkty od 1 do 3 dla samogłosek wypowiadanych w kontekście (zaproponowad i wykorzystad wyrazy zawierające dużą liczbę różnych samogłosek). SPRAWOZDANIE Z DWICZENIA powinno zawierad wyniki zwarty opis przeprowadzonych badao z zestawieniem wyników częstotliwości formantowych dla wszystkich mówców oraz wykres położenia samogłosek na mapie formantów w układzie współrzędnych F1-F2 z zaznaczeniem obszarów wspólnych dla tego samego typu samogłoski.. 3. Jassem W.: Podstawy fonetyki akustycznej, PWN, Warszawa 1973. 4. Jassem W.: Mowa a nauka o łączności, WKiŁ, Warszawa 1974. I N Ż Y N I E R I A B I O M E D Y C Z N A I A K U S T Y C Z N A W W W. I B A. P S. P L

Z A K Ł A D CYB E R N E T Y K I I E L E K T R O N I K I - W W W. Z C I E. P S. P L DWICZENIE NR 6 (ARM) ROZPOZNAWANIE DŹWIĘKÓW MOWY NA PODSTAWIE MAPY FORMANTÓW F1-F2 WYMAGANA jest znajomośd podstaw teoretycznych techniki liniowej predykcji oraz umiejętnośd jej praktycznego wykorzystania. 1. Wyłączyd sprzętowo (w sposób uniemożliwiający przypadkowe włączenie funkcji odsłuchu) zestawy głośnikowe wchodzące w skład stanowiska. 2. Wczytad wskazany przez prowadzącego dźwiękowy plik testowy z dysku. 3. Dla każdego dźwięku z pliku określid wartośd częstotliwości podstawowej F0 i na tej podstawie ustalid płed osoby mówiącej oraz metodą LPC częstotliwości formantowe F1 i F2 i za pomocą mapy formantów sporządzonej w dwiczeniu laboratoryjnym nr 5 określid rodzaj samogłoski. Uwaga plik testowy może zawierad spółgłoski i dźwięki nie należące do sygnałów mowy (należy to odnotowad i nie prowadzid dla nich dalszych analiz). 4. Włączyd zestawy głośnikowe i skonfrontowad otrzymane wyniki z rzeczywistymi dźwiękami. W przypadku błędnych rozpoznao znaleźd przyczynę błędów. 5. Powtórzyd punkty od 1 do 4 dla kolejnych wskazanych przez prowadzącego zajęcia plików testowych. SPRAWOZDANIE Z DWICZENIA powinno zawierad wyniki zwarty opis przeprowadzonych badao ze wskazaniem odsetka poprawnie rozpoznanych dźwięków w kolejnych testach oraz omówienie najważniejszych przyczyn błędnych rozpoznao. Wskazad trudności w zalgorytmizowaniu czynności wykonywanych podczas dwiczenia. 3. Jassem W.: Podstawy fonetyki akustycznej, PWN, Warszawa 1973. 4. Jassem W.: Mowa a nauka o łączności, WKiŁ, Warszawa 1974. I N Ż Y N I E R I A B I O M E D Y C Z N A I A K U S T Y C Z N A W W W. I B A. P S. P L

L A B O RA T OR I U M A NA L I Z Y I P R Z E T W AR Z A NI A S Y G N AŁ U M OW Y S A L A C221 DWICZENIE NR 7 (SYNTEZA) SYNTEZA SYGNAŁU MOWY WYMAGANA jest znajomośd podstaw teoretycznych syntezy mowy metodami kompilacyjnymi i formantowymi. 1. Zaplanowad i przeprowadzid eksperymenty z konkatenacją wyodrębnionych fragmentów wyrazów (np. *MOWA]=[doMOfon]+[koWAl]). 2. Zaplanowad i przeprowadzid eksperymenty ze zmianą znaczenia zdao (np. *to jest nieprawda+ *to jest prawda]). 3. Przeprowadzid eksperyment z kompilacyjną syntezą liczebników typu rdzeń + sufiks (np. [jeden]+[naście], [dwa]+[naście]. 4. Przeprowadzid testy systemu syntezy mowy EXPRESSIVO. Znaleźd słabe punkty systemu syntezy (liczebniki, skróty, wtrącone wyrazy obcojęzyczne itd.). SPRAWOZDANIE Z DWICZENIA powinno zawierad zwarty opis przeprowadzonych eksperymentów oraz ocenę systemu syntezy EXPRESSIVO. 3. Jassem W.: Podstawy fonetyki akustycznej, PWN, Warszawa 1973. 4. EXPRESSIVO Twój osobisty lektor strona internetowa www.expressivo.com/pl/ 5. Bolc L., Borodziewicz W., Cytowski J., Jaszczak K.: Komputerowe przetwarzanie sygnału mowy. Metody. Technologia. Zastosowania, Wydawnictwa UW, Warszawa 1990. 6. Cytowski J.: Metody i algorytmy sztucznej inteligencji w cyfrowym przetwarzaniu sygnałów, Akademicka Oficyna Wydawnicza PLJ, Warszawa 1999 I N Ż Y N I E R I A B I O M E D Y C Z N A I A K U S T Y C Z N A W W W. I B A. P S. P L