TEORIA WYTWARZANIA DŹWIĘKÓW

Podobne dokumenty
Analiza sygnału mowy pod kątem rozpoznania mówcy chorego. Anna Kosiek, Dominik Fert

Głos. Proces generacji dźwięku płuca, fałdy głosowe, kanał głosowy rezonatory i artykulatory. Ton krtaniowy Częstotliwości formantowe dla mowy

Akustyka mowy wprowadzenie. Opracował: dr inż. Piotr Suchomski

Synteza mowy. opracowanie: mgr inż. Kuba Łopatka

Rozpoznawanie i synteza mowy w systemach multimedialnych. Analiza i synteza mowy - wprowadzenie. Spektrogram wyrażenia: computer speech

1.Klasyfikacja głosek języka polskiego. 2.Układ narządów artykulacyjnych przy wymowie wybranych głosek.

PARAMETRYZACJA SYGNAŁU MOWY. PERCEPTUALNE SKALE CZĘSTOTLIWOŚCI.

Akustyka muzyczna. Wykład 8 Instrumenty dęte. dr inż. Przemysław Plaskota

Opis akustyczny samogłosek Wprowadzenie

PRZETWARZANIE MOWY W CZASIE RZECZYWISTYM

f = 2 śr MODULACJE

LABORATORIUM POMIARY W AKUSTYCE. ĆWICZENIE NR 4 Pomiar współczynników pochłaniania i odbicia dźwięku oraz impedancji akustycznej metodą fali stojącej

1. Po upływie jakiego czasu ciało drgające ruchem harmonicznym o okresie T = 8 s przebędzie drogę równą: a) całej amplitudzie b) czterem amplitudom?

Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści

Wstęp do Językoznawstwa

Z tego rozdziału dowiesz się:

Ćwiczenie 3,4. Analiza widmowa sygnałów czasowych: sinus, trójkąt, prostokąt, szum biały i szum różowy

Nowy eliptyczny model traktu głosowego

CHARAKTERYSTYKA WIĄZKI GENEROWANEJ PRZEZ LASER

Dźwięk dźwiękowi nierówny, czyli o tym jak brzmi XXI wiek

dr med. Ewa Kazanecka Podstawy Foniatrii Katedra Audiologii i Foniatrii Uniwersytet Muzyczny Fryderyka Chopina w Warszawie

Spis treści. Wykaz ważniejszych oznaczeń. Przedmowa 15. Wprowadzenie Ruch falowy w ośrodku płynnym Pola akustyczne źródeł rzeczywistych

1. Określenie hałasu wentylatora

(1.1) gdzie: - f = f 2 f 1 - bezwzględna szerokość pasma, f śr = (f 2 + f 1 )/2 częstotliwość środkowa.

ANALIZA HARMONICZNA DŹWIĘKU SKŁADANIE DRGAŃ AKUSTYCZNYCH DUDNIENIA.

Demodulator FM. o~ ~ I I I I I~ V

Dźwięk. Cechy dźwięku, natura światła

Akwizycja i przetwarzanie sygnałów cyfrowych

TEORIA DRGAŃ Program wykładu 2016

Akustyka muzyczna. Wykład 9 Głos ludzki. Instrumenty perkusyjne. dr inż. Przemysław Plaskota

(L, S) I. Zagadnienia. II. Zadania

PROGRAM TERAPII LOGOPEDYCZNEJ W PUBLICZNEJ SZKOLE PODSTAWOWEJ

HARMONOGRAM ORAZ INSTRUKCJE DWICZEO

Temat: Wzmacniacze selektywne

Zestaw ćwiczeń laboratoryjnych z Biofizyki dla kierunku elektroradiologia w roku akademickim 2017/2018.

Semantyczne kodowanie mowy przy bardzo małych prędkościach transmisji.

Komputerowe przetwarzanie sygnału mowy

SPIS TREŚCI. Od Autora. Wykaz ważniejszych oznaczeń. 1. Wstęp 1_. 2. Fale i układy akustyczne Drgania układów mechanicznych 49. Literatura..

Zestaw ćwiczeń laboratoryjnych z Biofizyki dla kierunku Elektroradiologia w roku akademickim 2016/2017.

Radioodbiornik i odbiornik telewizyjny RADIOODBIORNIK

Ponieważ zakres zmian ciśnień fal akustycznych odbieranych przez ucho ludzkie mieści się w przedziale od 2*10-5 Pa do 10 2 Pa,

PODSTAWY FIZYKI LASERÓW Wstęp

Sposoby modelowania układów dynamicznych. Pytania

ZASTOSOWANIE PSYCHOAKUSTYKI ORAZ AKUSTYKI ŚRODOWISKA W SYSTEMACH NAGŁOŚNIAJĄCYCH

Filtry aktywne filtr środkowoprzepustowy

2LO 6 lu L 92, 93, 94 T3.5.2 Matematyczny opis zjawisk falowych cd. Na poprzednich lekcjach już było mamy to umieć 1. Ruch falowy 1.

Drgania i fale sprężyste. 1/24

Fal podłużna. Polaryzacja fali podłużnej

autor: Włodzimierz Wolczyński rozwiązywał (a)... ARKUSIK 32 AKUSTYKA Rozwiązanie zadań należy zapisać w wyznaczonych miejscach pod treścią zadania

1 Dana jest funkcja logiczna f(x 3, x 2, x 1, x 0 )= (1, 3, 5, 7, 12, 13, 15 (4, 6, 9))*.

Nauka o słyszeniu Wykład IV Wysokość dźwięku

Przygotowała: prof. Bożena Kostek

Modele systemu słuchowego buduje się ze względu na różne motywacje. Na przykład można mówić o modelach tworzonych dla potrzeb ochrony słuchu

Autorzy: Tomasz Sokół Patryk Pawlos Klasa: IIa

Automatyczne rozpoznawanie mowy. Autor: mgr inż. Piotr Bratoszewski

Szczegółowe kryteria oceniania z fizyki w gimnazjum. kl. III

Nauka o słyszeniu. Wykład III +IV Wysokość+ Głośność dźwięku

Akustyka muzyczna. Wykład 6 Instrumenty dęte. Głos ludzki. Instrumenty perkusyjne. dr inż. Przemysław Plaskota

Analiza właściwości filtrów dolnoprzepustowych

Systemy multimedialne. Instrukcja 5 Edytor audio Audacity

4 Zasoby językowe Korpusy obcojęzyczne Korpusy języka polskiego Słowniki Sposoby gromadzenia danych...

Akustyka muzyczna. Wykład 1 Wprowadzenie. O muzyce. Elementy muzyki. O dźwięku. dr inż. Przemysław Plaskota

Właściwości dynamiczne kolektora słonecznego a efektywność instalacji grzewczej

Kwantowanie sygnałów analogowych na przykładzie sygnału mowy

Zastosowanie ultradźwięków w technikach multimedialnych

Przetwarzanie sygnałów biomedycznych

06 Tor pośredniej częstotliwości, demodulatory AM i FM Pytania sprawdzające Wiadomości podstawowe Budowa wzmacniaczy pośredniej częstotliwości

Teoria sterowania - studia niestacjonarne AiR 2 stopień

Korpusy mowy i narzędzia do ich przetwarzania

Filtry aktywne filtr górnoprzepustowy

TEORIA OBWODÓW I SYGNAŁÓW LABORATORIUM

NAJCZĘŚCIEJ WYSTĘPUJĄCE WADY WYMOWY oraz ZABURZENIA ROZWOJU MOWY U DZIECI

14 Modulatory FM CELE ĆWICZEŃ PODSTAWY TEORETYCZNE Podstawy modulacji częstotliwości Dioda pojemnościowa (waraktor)

SYNTEZA METODĄ MODELOWANIA FIZYCZNEGO

LABORATORIUM AKUSTYKI MUZYCZNEJ. Ćw. nr 12. Analiza falkowa dźwięków instrumentów muzycznych. 1. PODSTAWY TEORETYCZNE ANALIZY FALKOWEJ.

Laboratorium optycznego przetwarzania informacji i holografii. Ćwiczenie 4. Badanie optycznej transformaty Fouriera

Urządzenie i sposób pomiaru skuteczności filtracji powietrza.

Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej

TEORIA OBWODÓW I SYGNAŁÓW LABORATORIUM

Głośność, wysokość, barwa dźwięku Długość fali (λ), prędkość (v) i częstotliwość drgań (ν) związane są zależnością:

Przygotowali: Bartosz Szatan IIa Paweł Tokarczyk IIa

Laboratorium Półprzewodniki Dielektryki Magnetyki Ćwiczenie nr 8

Organizacja terapii logopedycznej

POWTÓRKA PRZED KONKURSEM CZĘŚĆ 5 A

Instrukcja do laboratorium z Fizyki Budowli. Temat laboratorium: CZĘSTOTLIWOŚĆ

Dźwięk podstawowe wiadomości technik informatyk

Podstawy Przetwarzania Sygnałów

I. PROMIENIOWANIE CIEPLNE

Laboratorium nr 4: Porównanie filtrów FIR i IIR. skończonej odpowiedzi impulsowej (FIR) zawsze stabilne, mogą mieć liniową charakterystykę fazową

Ćwiczenie 4: Próbkowanie sygnałów

Podstawy Akustyki. Drgania normalne a fale stojące Składanie fal harmonicznych: Fale akustyczne w powietrzu Efekt Dopplera

Wykład FIZYKA I. 11. Fale mechaniczne. Dr hab. inż. Władysław Artur Woźniak

POMIAR PRĘDKOŚCI DŹWIĘKU METODĄ REZONANSU I METODĄ SKŁADANIA DRGAŃ WZAJEMNIE PROSTOPADŁYCH

Kompresja dźwięku w standardzie MPEG-1

FONETYKA. Co to jest fonetyka? Język polski Klasa III Gim

Mapa akustyczna Torunia

Analiza harmoniczna dźwięku.

HAŁASU Z UWZGLĘDNIENIEM ZJAWISK O CHARAKTERZE NIELINIOWYM

BADANIE SZEREGOWEGO OBWODU REZONANSOWEGO RLC

Transkrypt:

1 TEORIA WYTWARZANIA DŹWIĘKÓW MOWY, FORMANTY, MODELOWANIE WYTWARZANIA DŹWIĘKÓW MOWY. mgr inż. Kuba Łopatka

PLAN WYKŁADU 1. Teoria wytwarzania dźwięków mowy Ogólna teoria wytwarzania dźwięków mowy Ton krtaniowy Pobudzenie szumowe Transmitancja traktu głosowego 2. Formanty Pojęcie formantu Parametry formantowe Formanty F1 i F2, trójkąt samogłosek 3. Modelowanie wytwarzania dźwięków mowy Modelowanie fizyczne Modelowanie elektryczne i komputerowe Model źródło-filtr 2

TEORIA WYTWARZANIA DŹWIĘKÓW MOWY 3

PRZYPOMNIENIE ANATOMIA 4

OGÓLNY SCHEMAT ZASTĘPCZY WYTWARZANIA MOWY fonacja artykulacja Podstawowym założeniem tej teorii jest niezależność charakterystyk tonu krtaniowego i artykulatorów. 5

TON KRTANIOWY Jest to sygnał akustyczny wytworzony przez drgające struny głosowe. Stanowi pobudzenie dla głosek dźwięcznych i zwartych. Powstaje w procesie fonacji. Trudno go zbadać, bo zawsze jest w postaci zmodulowanej. Sam w sobie jest słaby i bezbarwny, ulega wzmocnieniu i nabiera brzmienia dopiero w wyższych partiach traktu głosowego. Podstawowy parametr częstotliwość podstawowa f 0 (lubf 0 )- zgodna z częstotliwością podstawową mowy. 6

TON KRTANIOWY Zakres częstotliwości podstawowej tonu krtaniowego: w mowie (typowe): mężczyźni: 85-180Hz kobiety: 165-255Hz dzieci: 250-300Hz W śpiewie w zależności od rodzaju głosu: bas, baryton: 65Hz-349Hz tenor:130-523hz alt:195-698hz mezzosopran, sopran: 220-1280Hz 7

TON KRTANIOWY Postać czasowa: Widmo: Obecne są wszystkie harmoniczne częstotliwości podstawowej opadające ok. 6-12dB/okt. (w praktyce nie jest tak regularnie) 8

POBUDZENIE SZUMOWE Przy artykulacji głosek szumowych strumień wydychanego powietrza przechodzi z przepływu laminarnego do przepływu turbulentnego (zjawisko znane w hydrodynamice). Przy przejściu powietrza przez szczelinę dokonuje się konwersja energii kinetycznej na akustyczną. Przy nagłym otworzeniu drogi przepływu powietrza podczas artykulacji spółgłosek zwartych powietrze tworzy falę udarową, która jest nośnikiem energii akustycznej. 9

TRANSMITANCJA TRAKTU GŁOSOWEGO Z punktu widzenia akustycznego trakt głosowy to układ rezonatorów. Kształt i połączenia między tymi rezonatorami zmieniają się w zależności od ułożenia narządów artykulacyjnych żuchwy, języka, warg, podniebienia. Charakterystyka częstotliwościowa traktu głosowego jest połączeniem krzywych rezonansowych. 10

TRANSMITANCJA TRAKTU GŁOSOWEGO Różne konfiguracje narządów mowy: i y e a o u 11

TRANSMITANCJA TRAKTU GŁOSOWEGO Rezonans akustyczny narządów mowy powoduje podbicie pewnych częstotliwości (pewnych obszarów widma). To, które obszary widma zostaną podbite, zależy od ułożenia narządów mowy przez zmianę ułożenia narządów mowy zmieniają się wymiary rezonatorów. W efekcie w widmie sygnału mowy obserwuje się charakterystyczne skupiska energii. Widmo tonu krtaniowego charakterystyka traktu głosowego widmo sygnału mowy 12

13 FORMANTY

FORMANTY Skupisko energii w widmie sygnału nazywamy formantem. Formant to jedno z najważniejszych pojęć w akustyce mowy. Rozmieszczenie formantów zależy od tego, jaka głoska jest artykułowana. 14

FORMANTY Formanty oznaczamy: F1 F2 F3 Częstotliwości formantowe oznaczamy: F 1 F 2 F 3 Czasem formantem F0 nazywa się ton krtaniowy (o częstotliwości podstawowej F 0 ) 15

FORMANTY Ucho ludzkie jest czułe na formanty. Teoria głosi, że formanty leżą u podstaw rozpoznawania mowy przez człowieka. W związku z tym wykorzystuje się je przy automatycznym rozpoznawaniu mowy. 16

FORMANTY Parametry formantowe to: Częstotliwość formantu F N Poziom formantu A N (wyrażany w db, względny unormowany do najsilniejszego formantu albo bezwzględny) 17

DWA PIERWSZE FORMANTY Dwa pierwsze formanty (F1 i F2) zależą od ułożenia języka (dzielącego jamę ustną na dwie wnęki). Niektóre spośród głosek (zwłaszcza samogłoski) można odróżnić na podstawie tylko tych dwóch formantów. W akustyce mowy rozpowszechniony jest wykres na płaszczyźnie częstotliwości F 1 i F 2 tzw. trójkąt samogłosek. 18

TRÓJKĄT SAMOGŁOSEK 19

TRÓJKĄT SAMOGŁOSEK 20

MODELOWANIE MECHANIZMÓW WYTWARZANIA MOWY 21

MODELOWANIE WYTWARZANIA MOWY Modelowanie wytwarzania mowy wymaga 3 składników: Modelowanie pobudzenia Modelowanie traktu głosowego Modelowanie emisji mowy W praktyce najważniejsze są dwa pierwsze elementy. 22

MODELOWANIE POBUDZENIA Głoski dźwięczne modelowanie tonu krtaniowego Ton krtaniowy modeluje się najczęściej przebiegiem piłokształtnym, który ma zbliżone właściwości widmowe. Głoski bezdźwięczne pobudzenie szumowe. Modeluje się szumem o widmie opadającym 6dB/okt. 23

MODELOWANIE TRAKTU GŁOSOWEGO Model fizyczny Fizycznie trakt głosowy można zamodelować jako połączenie ściętych stożków lub walców. W pierwszym przypadku powstaje model tubowy, zachowujący ciągłość przekroju, w drugim - model cylindryczny. model tubowy model cylindryczny 24

MODELOWANIE TRAKTU GŁOSOWEGO rezonator Helmholtza (umożliwia modelowanie pojedynczego formantu) podwójny rezonator Helmholtza (umożliwia modelowanie dwóch formantów) modele złożone z kilku rur zakończonych płaską tarczą kołową (odgrodą) imitującą charakterystykę promieniowania ust jako nadajnika dźwięku trójparametrowy model Fanta, uwzględniający rozkład biegunów i zer na płaszczyźnie zespolonej i podstawowe trzy parametry: miejsce artykulacji (miejsce największego przewężenia kanału), stopień tego przewężenia (powierzchnia przekroju) oraz kształt otworu wylotowego ust model Markela-Graya 25

MODELOWANIE TRAKTU GŁOSOWEGO Model elektryczny Odwzorowanie charakterystyki częstotliwościowej za pomocą układu filtrów elektrycznych o charakterystyce rezonansowej (LC). Modele komputerowe: - Model LPC odwzorowanie charakterystyki traktu głosowego za pomocą filtra biegunowego. - Model artykulacyjny matematyczne odwzorowanie mechanizmów generowania mowy. Więcej na wykładzie o syntezie mowy. 26

MODEL ŹRÓDŁO-FILTR W większości modeli wytwarzania dźwięków mowy powtarza się idea, by schemat zastępczy generowania mowy przedstawiać w układzie źródło-filtr. źródło filtr obciążenie 27

MODEL ŹRÓDŁO-FILTR Jak w teorii obwodów, odpowiedź układu powstaje z wymnożenia charakterystyk pobudzenia i filtra. wymnożenia charakterystyk pobudzenia i filtra. źródło filtr odpowiedź * = 28