Akustyczno-fonetyczne cechy mowy polskiej

Podobne dokumenty

Znajdowanie pozostałych pierwiastków liczby zespolonej, gdy znany jest jeden pierwiastek

Metrologia: miary dokładności. dr inż. Paweł Zalewski Akademia Morska w Szczecinie

Rysunek 1: Fale stojące dla struny zamocowanej na obu końcach; węzły są zaznaczone liniami kropkowanymi, a strzałki przerywanymi

PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH

POLITECHNIKA OPOLSKA

Jarosław Wróblewski Analiza Matematyczna 1A, zima 2012/13. Ciągi.

Damian Doroba. Ciągi. 1. Pierwsza z granic powinna wydawać się oczywista. Jako przykład może służyć: lim n = lim n 1 2 = lim.

Stwierdzenie 1. Jeżeli ciąg ma granicę, to jest ona określona jednoznacznie (żaden ciąg nie może mieć dwóch różnych granic).

Elementy modelowania matematycznego

Jarosław Wróblewski Analiza Matematyczna 1, zima 2016/17

Pierwiastki z liczby zespolonej. Autorzy: Agnieszka Kowalik

WYKŁAD 6 TRANZYSTORY POLOWE

Jak obliczać podstawowe wskaźniki statystyczne?

Projekt Inżynier mechanik zawód z przyszłością współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego

STATYSTYKA OPISOWA WYKŁAD 1 i 2

Estymacja przedziałowa

Analiza dokładności pomiaru, względnego rozkładu egzytancji widmowej źródeł światła, dokonanego przy użyciu spektroradiometru kompaktowego

x t 1 (x) o 1 : x s 3 (x) Tym samym S(3) = {id 3,o 1,o 2,s 1,s 2,s 3 }. W zbiorze S(n) definiujemy działanie wzorem

Jarosław Wróblewski Analiza Matematyczna 2B, lato 2015/16

RÓWNANIA RÓŻNICZKOWE WYKŁAD 11

Kolorowanie Dywanu Sierpińskiego. Andrzej Szablewski, Radosław Peszkowski

ROZDZIAŁ 5 WPŁYW SYSTEMU OPODATKOWANIA DOCHODU NA EFEKTYWNOŚĆ PROCESU DECYZYJNEGO

3. Regresja liniowa Założenia dotyczące modelu regresji liniowej

MINIMALIZACJA PUSTYCH PRZEBIEGÓW PRZEZ ŚRODKI TRANSPORTU

Analiza matematyczna. Robert Rałowski

Ćwiczenia rachunkowe TEST ZGODNOŚCI χ 2 PEARSONA ROZKŁAD GAUSSA

MODELE MATEMATYCZNE W UBEZPIECZENIACH. 1. Renty

INSTRUKCJA DO ĆWICZEŃ LABORATORYJNYCH Z WYTRZYMAŁOŚCI MATERIAŁÓW

Internetowe Kółko Matematyczne 2004/2005

WERSJA TESTU A. Komisja Egzaminacyjna dla Aktuariuszy. LX Egzamin dla Aktuariuszy z 28 maja 2012 r. Część I. Matematyka finansowa

3. Funkcje elementarne

CHARAKTERYSTYKI CZĘSTOTLIWOŚCIOWE PODSTAWOWYCH CZŁONÓW LINIOWYCH UKŁADÓW AUTOMATYKI

INSTRUKCJA NR 06-2 POMIARY TEMPA METABOLIZMU METODĄ TABELARYCZNĄ

STATYSTYKA I ANALIZA DANYCH

Geometrycznie o liczbach

Fundamentalna tabelka atomu. eureka! to odkryli. p R = nh -

Jarosław Wróblewski Analiza Matematyczna A1, zima 2011/12. Kresy zbiorów. x Z M R

Teoria. a k. Wskaźnik sumowania można oznaczać dowolną literą. Mamy np. a j = a i =

Ćwiczenie nr 14. Porównanie doświadczalnego rozkładu liczby zliczeń w zadanym przedziale czasu z rozkładem Poissona

Rekursja 2. Materiały pomocnicze do wykładu. wykładowca: dr Magdalena Kacprzak

Wykład 11. a, b G a b = b a,

Ćwiczenia nr 5. TEMATYKA: Regresja liniowa dla prostej i płaszczyzny

MATEMATYKA (poziom podstawowy) przykładowy arkusz maturalny wraz ze schematem oceniania dla klasy II Liceum

Struktura czasowa stóp procentowych (term structure of interest rates)

Arkusz ćwiczeniowy z matematyki Poziom podstawowy ZADANIA ZAMKNIĘTE. W zadaniach od 1. do 21. wybierz i zaznacz poprawną odpowiedź. 1 C. 3 D.

BADANIA DOCHODU I RYZYKA INWESTYCJI

Podprzestrzenie macierzowe

Ćwiczenie 10/11. Holografia syntetyczna - płytki strefowe.

2 n < 2n + 2 n. 2 n = 2. 2 n 2 +3n+2 > 2 0 = 1 = 2. n+2 n 1 n+1 = 2. n+1

Podprzestrzenie macierzowe

O liczbach naturalnych, których suma równa się iloczynowi

7 Liczby zespolone. 7.1 Działania na liczbach zespolonych. Liczby zespolone to liczby postaci. z = a + bi,

Materiał ćwiczeniowy z matematyki Marzec 2012

ma rozkład złożony Poissona z oczekiwaną liczbą szkód równą λ i rozkładem wartości pojedynczej szkody takim, że Pr( Y

Egzamin maturalny z matematyki CZERWIEC 2011

a n 7 a jest ciągiem arytmetycznym.

Rachunek prawdopodobieństwa i statystyka W12: Statystyczna analiza danych jakościowych. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.

WYZNACZANIE WSPÓŁCZYNNIKA ZAŁAMANIA ŚWIATŁA METODĄ SZPILEK I ZA POMOCĄ MIKROSKOPU. Wprowadzenie. = =

Numeryczny opis zjawiska zaniku

ELEKTROTECHNIKA I ELEKTRONIKA

MACIERZE STOCHASTYCZNE

Chemia Teoretyczna I (6).

Zasada indukcji matematycznej. Dowody indukcyjne.

I. Podzielność liczb całkowitych

Moduł 4. Granica funkcji, asymptoty

Artykuł techniczny CVM-NET4+ Zgodny z normami dotyczącymi efektywności energetycznej

KADD Metoda najmniejszych kwadratów

X i. X = 1 n. i=1. wartość tej statystyki nazywana jest wartością średnią empiryczną i oznaczamy ją symbolem x, przy czym x = 1. (X i X) 2.

WYDZIAŁ ELEKTRYCZNY POLITECHNIKI WARSZAWSKIEJ INSTYTUT ELEKTROENERGETYKI ZAKŁAD ELEKTROWNI I GOSPODARKI ELEKTROENERGETYCZNEJ

Metody badania zbieżności/rozbieżności ciągów liczbowych

a 1, a 2, a 3,..., a n,...

Podstawy Przetwarzania Sygnałów

z przedziału 0,1. Rozważmy trzy zmienne losowe:..., gdzie X

Termodynamika defektów sieci krystalicznej

Zdarzenia losowe, definicja prawdopodobieństwa, zmienne losowe

Informatyka Stosowana-egzamin z Analizy Matematycznej Każde zadanie należy rozwiązać na oddzielnej, podpisanej kartce!

Elementy statystyki opisowej Izolda Gorgol wyciąg z prezentacji (wykład I)

Błędy kwantyzacji, zakres dynamiki przetwornika A/C

Niepewności pomiarowe

Jarosław Wróblewski Analiza Matematyczna 1, zima 2016/ n 333))

I kolokwium z Analizy Matematycznej

c 2 + d2 c 2 + d i, 2

TRANZYSTORY POLOWE JFET I MOSFET

Jarosław Wróblewski Analiza Matematyczna 1A, zima 2014/15. n 4n n 1

VII MIĘDZYNARODOWA OLIMPIADA FIZYCZNA (1974). Zad. teoretyczne T3.

Matematyka ubezpieczeń majątkowych r.

PRZYKŁADY ROZWIAZAŃ STACJONARNEGO RÓWNANIA SCHRӦDINGERA. Ruch cząstki nieograniczony z klasycznego punktu widzenia. mamy do rozwiązania równanie 0,,

Sygnały pojęcie i klasyfikacja, metody opisu.

I. Ciągi liczbowe. , gdzie a n oznacza n-ty wyraz ciągu (a n ) n N. spełniający warunek. a n+1 a n = r, spełniający warunek a n+1 a n

O pewnych zastosowaniach rachunku różniczkowego funkcji dwóch zmiennych w ekonomii

Ćwiczenie 3,4. Analiza widmowa sygnałów czasowych: sinus, trójkąt, prostokąt, szum biały i szum różowy

Przykładowe zadania dla poziomu rozszerzonego

INWESTYCJE MATERIALNE

Laboratorium Sensorów i Pomiarów Wielkości Nieelektrycznych. Ćwiczenie nr 1

Statystyka opisowa - dodatek

Charakterystyki liczbowe zmiennych losowych: wartość oczekiwana i wariancja

Matematyka. Zakres podstawowy. Nawi zanie do gimnazjum. n/m Rozwi zywanie zada Zadanie domowe Dodatkowe Komunikaty Bie ce materiały

Prawdopodobieństwo i statystyka

Relacje rekurencyjne. będzie następująco zdefiniowanym ciągiem:

Transkrypt:

II PRACOWNIA FIZYCZNA Akustyczo-foetycze cechy mowy polskiej Opis ćwiczeia w ramach II Pracowi Fizyczej Adrzej Wicher Aleksader Sęk Jacek Koieczy Istytut Akustyki UAM Pozań, 5

. WSTĘP... 3. SYGNAŁY ORAZ ICH ANALIZA... 3.. RODZAJE SYGNAŁÓW... 4.. ANALIZA SYGNAŁÓW OKRESOWYCH... 6.3. ANALIZA SYGNAŁÓW NIEOKRESOWYCH....4. ANALIZA SYGNAŁÓW DYSKRETNYCH....4.. Próbkowaie i dyskretyzacja sygału....4.. Aaliza widmowa sygałów dyskretych... 4.5. ANALIZA SYGNAŁÓW MOWY. SPEKTROGRAM... 8 3. MOWA... 3.. WYTWARZANIE DŹWIĘKÓW MOWY... 3.. GŁOSKI, ALLOFONY I FONEMY... 3 3.3. SAMOGŁOSKI... 4 4. ĆWICZENIE NR : ANALIZA WYBRANYCH CECH SAMOGŁOSEK JĘZYKA POLSKIEGO... 5 4.. WPROWADZENIE... 5 4.. CEL ĆWICZENIA... 6 4.3. PRZEBIEG ĆWICZENIA... 6 5. ĆWICZENIE NR : PODSTAWOWE CECHY WIDMOWE SAMOGŁOSEK I WYBRANYCH SPÓŁGŁOSEK JĘZYKA POLSKIEGO... 3 5.. WPROWADZENIE... 3 5.. CEL ĆWICZENIA... 33 5.3. PRZEBIEG ĆWICZENIA:... 33 6. ĆWICZENIE NR 3: PROZODYCZNE CECHY MOWY... 35 6.. WPROWADZENIE... 35 6.. CEL ĆWICZENIA... 35 6.3. PRZEBIEG ĆWICZENIA... 35 LITERATURA... 36 ZAŁĄCZNIK... 37

. WSTĘP Jedym z ajwydajiejszych sposobów komuikowaia się ludzi z otoczeiem jest mówieie i słyszeie. Z fizyczego puktu widzeia te proces komuikacji polega a geerowaiu i odbiorze bodźców akustyczych. Narząd mowy jest wyspecjalizowaym układem umożliwiającym geerowaie szerokiej gamy dźwięków. Steruje o strumieiem powietrza wypływającym z płuc, umożliwiając kodowaie użyteczej iformacji w postaci zmia chwilowego ciśieia. Zmysł słuchu umożliwia odbiór bodźców akustyczych i wyselekcjoowaie z ich użyteczych iformacji. W peryferyjym układzie słuchowym fala akustycza jest poddaa aalizie częstotliwościowej i zamiaie a ciągi impulsów euroowych. Impulsy te są astępie iterpretowae przez wyższe piętra układu słuchowego a zrozumiałe iformacje. Sposób tej iterpretacji w dużym stopiu zależy (choć ie jest to zależość do końca pozaa) od rodzaju sygałów akustyczych, ich cech widmowych, itp. Niiejsze opracowaie zawiera podstawowe iformacje a temat rodzajów sygałów, możliwości ich aalizy, a przede wszystkim zasadicze iformacje dotyczące dźwięków mowy (źródła dźwięków mowy, klasyfikacja dźwięków mowy oraz metody ich aalizy). Zaczą część miejsca w iiejszym opracowaiu poświęcoo aalizie widmowej sygałów, która jest podstawą aalizy dźwięku. Szczególy acisk położoo a aalizę sygałów dyskretych, z którymi mamy ajczęściej do czyieia, w prowadzeiu eksperymetalej aalizy sygałów mowy za pomocą specjalistyczych pakietów programów.. SYGNAŁY ORAZ ICH ANALIZA Sygałem, z puktu widzeia aalizy sygałów, jest przebieg w czasie dowolej wielkości fizyczej (p. przebieg zmia temperatury powietrza, zmia apięcia a odbioriku elektryczości). Fala akustycza powstająca a skutek drgań ciała w ośrodku sprężystym (p. powietrzu) jest także przykładem sygału, poieważ wprowadza oa chwilowe zmiay ciśieia akustyczego. W tym też świetle mowa jest sygałem akustyczym, do którego moża zastosować szereg metod aalizy sygałów. Przedstawieie zasadiczych metod aalizy sygałów mowy wymaga uprzediego wprowadzeia podziału sygałów a poszczególe klasy/rodzaje. Wiąże się to z tym, że do różych typów sygałów stosuje się różego rodzaju metody aalizy. 3

.. Rodzaje sygałów Sygały moża ogólie podzielić a zdetermiowae i iezdetermiowae. Sygały zdetermiowae to takie, które dają opisać się aalityczie. Sygały iezdetermiowae, azywae też sygałami losowymi, ie dają opisać się zależościami matematyczymi. Z praktyczego puktu widzeia sygały, które moża odtworzyć warukach laboratoryjych, to sygały zdetermiowae. Sygały iezdetermiowae ie dają się atomiast odtworzyć w sposób powtarzaly. Klasyfikację sygałów zdetermiowaych ilustruje Rysuek.. Sygały zdetermiowae Sygały okresowe Sygały ieokresowe Sygały Sygały Sygały Sygały harmoicze poliharmoicze prawieokresowe trasjetowe Rysuek.. Klasyfikacja sygałów zdetermiowaych Sygały okresowe to sygały, których przebieg powtarza się co jakiś czas T, azyway okresem. Ścisła defiicja sygału okresowego wymaga, by sygał te trwał ieskończeie długo, toteż w praktyce za sygał okresowy uzaje się każdy sygał, którego przebieg powtarza się w skończoym przedziale czasu. Najprostszym przykładem sygału okresowego jest sygał siusoidaly, azyway też sygałem harmoiczym, którego akustyczym odpowiedikiem jest to prosty. Sygał taki w pełi charakteryzują trzy jego parametry: amplituda, częstotliwość i faza początkowa. Zaczie częściej możemy się zetkąć z sygałami okresowymi złożoymi z wielu sygałów siusoidalych, które azywae są sygałami poliharmoiczymi. Sygał taki składa się często ze składowej stałej A i sumy skończoej lub ieskończoej liczby składowych siusoidalych (harmoiczych) o amplitudach A, fazach początkowych ϕ i częstotliwościach f =f, będących wielokrotościami częstotliwości podstawowej f : = A + A si = ( π f t + ϕ ) D( t) (.) Okresowe sygały poliharmoicze mogą powstawać w wyiku sumowaia składowych siusoidalych, których stosuki częstotliwości są liczbami całkowitymi. Przykładem sygałów poliharmoiczych są przede wszystkim dźwięki muzyki a ieco 4

gorszym dźwięcze części mowy (p. samogłoski i spółgłoski dźwięcze), które wytwarzae są przy udziale drgań wiązadeł głosowych. Jeśli częstotliwości poszczególych składowych sygału złożoego ie są całkowitymi wielokrotościami składowej podstawowej oraz stosuki ie wszystkich możliwych par częstotliwości tych składowych są liczbami wymierymi, to sygał taki azywa się sygałem prawie okresowym i moża go zapisać w postaci: D( t) = = A si f ( π + ϕ ) (.) gdzie f m /f ie jest w ogólości liczbą wymierą. Najprostszym przykładem sygału prawie okresowego jest suma dwóch siusoid o częstotliwościach p. f = i f = / Hz. Sygały trasjetowe obejmują szeroką grupę zdetermiowaych sygałów ieokresowych i moża opisać je za pomocą odpowiedich fukcji zmieych w czasie. Ich charakterystyczą cechą jest zmiea w czasie amplituda o charakterze arastaia lub zaikaia. Sygałami takimi są dźwięki muzyki i mowy, w których moża wydzielić odciki o ieustaloym przebiegu w czasie. Zaczie szerszą klasą sygałów iż sygały zdetermiowae jest grupa sygałów iezdetermiowaych lub losowych. Sygały odpowiadające losowym zjawiskom są iepowtarzalymi, jedyymi w warukach kokretej obserwacji, i ie moża opisać ich aalityczie. Ich losowość ozacza w ogólości, że ie jesteśmy w staie przewidzieć wartości ich parametrów w żadej z przyszłych chwil czasu. Jedak dla iektórych typów sygałów losowych możemy określić prawdopodobieństwo tego, że parametry tych sygałów osiągą określoe wartości. W związku z tym możemy mówić o procesie losowym (lub stochastyczym) oraz o jego realizacji, czyli każdej jego odrębej obserwacji. Np. zapis przebiegu apięcia a geeratorze szumu (typowy przykład sygału losowego) w skończoym odciku czasu jest jedą realizacją procesu losowego. Jedym z ajczęściej stosowaych sygałów losowych w badaiach słuchu jest tzw. szum biały. W szumie tym występuje ieskończeie wiele składowych siusoidalych, których częstotliwości obejmują cały zakres słyszaly (tj. do ok. khz). Amplitudy wszystkich składowych są jedakowe a ich fazy początkowe są wartościami przypadkowymi. Nazwa tego szumu jest pewą aalogią do światła białego, które jest sumą wszystkich elemetarych barw składowych o różej częstotliwości z całego zakresu częstotliwości fal widzialych. Szum biały jest tzw. stacjoarym sygałem losowym, poieważ jego tzw. charakterystyki probabilistycze (p. wartość średia, wartość średiokwadratowa) ie zmieiają się w czasie. Jest o azyway także szumem gaussowskim, poieważ rozkład jego wartości chwilowych jest opisay za 5

pomocą rozkładu Gaussa. Rysuek. przedstawia przebieg czasowy odcika szumu białego oraz odpowiadający mu rozkład prawdopodobieństwa jego wartości chwilowych. Warto w tym miejscu dodać, że sygały mowy ie dają się jedozaczie zakwalifikować do żadej z powyższych grup. Jedak iewielkie odciki czasowe sygałów mowy, odpowiadające w przybliżeiu poszczególym głoskom, moża w wielu sytuacjach potraktować jako sygały tego typu. Np. sygał samogłosek moża w przybliżeiu potraktować jako sygał poliharmoiczy, zaś sygały odpowiadające spółgłoskom zwartotrącym ("cz", "c", "dż", "dź") moża potraktować jako pasmo szumu. Prawdopodobieństwo Wartość chwilowa.5 -.5-4 6 8 Czas, s Rysuek.. Przykładowy przebieg czasowy szumu białego.. Aaliza sygałów okresowych Aaliza sygału, w ajbardziej podstawowym rozumieiu tego słowa, polega a przedstawieiu badaego sygału za pomocą sumy fukcji elemetarych, tz. rozłożeiu go a składowe dźwięki elemetare jakimi są toy. Zazwyczaj celem aalizy sygału jest przedstawieie go za pomocą widma, tj. wykresu ilustrującego zależość amplitudy (lub mocy) sygałów składających się a aalizoway dźwięk jako fukcji ich częstotliwości. Dlatego też aalizę sygałów dość często określa się jako aalizę widmową. Aalizy widmowej zdetermiowaych sygałów okresowych dokouje się wykorzystując matematycze arzędzie zwae szeregiem Fouriera. Zdetermiowae przebiegi ieokresowe aalizuje się z wykorzystaiem przekształceia (całki) Fouriera. Rozważmy ajpierw aalizę sygałów okresowych. Według twierdzeia Fouriera fukcję okresową f(t) moża rozłożyć a szereg trygoometryczy postaci: = [ A cos( t) + B ( ω t ] f ( t) = A + ω si ) (.3) Fukcję f(t) moża więc wyrazić jako sumę siusoid i cosiusoid o określoych częstotliwościach i amplitudach składowej stałej A. W szeregu przedstawioym rówaiem (.3) jedyą zmieą jest czas t, a pozostałe parametry są stałe. Częstotliwości siusoid i 6

cosiusoid pozostają w stosuku harmoiczym, czyli są wielokrotościami częstotliwości podstawowej ω : π ω = ω =. (.4) T Częstotliwość podstawowa jest ajmiejszą częstotliwością mogącą wystąpić w szeregu Fouriera (.3), a fala o tej częstotliwości ma okres T = i jest o rówy okresowi πω fukcji f(t). Zasadiczą ideą szeregu Fouriera jest to, że każdą fukcję okresową moża przedstawić w postaci sumy siusoid i cosiusoid, których okresy mieszczą się całkowitą liczbę razy w okresie podstawowym złożoej fali okresowej. Występujące w rówaiu (.3) współczyiki A i B są azywae współczyikami szeregu Fouriera. Opisują oe udział siusoidy i cosiusoidy o umerze (a więc o częstotliwości razy większej od częstotliwości podstawowej) w sygale f(t). W ogólości, dowolą fukcję okresową f(t) moża przedstawić jako sumę ieskończeie wielu składików szeregu Fouriera. Jedak w praktyce do stworzeia ajczęściej występujących przebiegów falowych wystarcza skończoa liczba składików, czyli moża takie przebiegi aproksymować sumą skończoej liczby siusoid i cosiusoid. Współczyiki A i B moża wyzaczyć za pomocą astępujących zależości: A A B = T = T = T T T T T T x x x T () t dt, () t cos( t) ω dt, >, (.5) () t si( ω t) dt, >. Graice całkowaia w rówaiach (.5) rozciągają się od T/ do T/. Takie graice całkowaia ie zawsze są wygode i czasem wygodiej jest użyć graic całkowaia od do T. Wybór graic całkowaia do obliczeia współczyików szeregu Fouriera jest w zasadzie dowoly z tym, że przedział całkowaia powiie mieć długość jedego okresu, czyli T. Rozwiiecie fukcji f(t) w szereg Fouriera w postaci (.3) moża przekształcić, do iej, wygodiejszej formy zakładając, że: h = A + B B ϕ = arctg A., (.6) 7

Wartości h reprezetują amplitudy kolejych cosiusoid o umerze (częstotliwości razy większej od częstotliwości podstawowej), w związku z czym ich zbiór azywa się widmem amplitudowym. Aalogiczie zbiór wartości ϕ tworzy tzw. widmo fazowe. Po podstawieiu (.6) do (.3) i skorzystaiu z tożsamości trygoometryczej moża apisać: f () t A + h ( ω t ϕ ) = = cos. (.7) Ogóly wyraz h cos( ω t + ϕ) przedstawia -tą składową fukcji f(t), zwaą też -tą harmoiczą. Należy podkreślić, że rozwiięcie fukcji w szereg Fouriera jest jedozacze, tz., że daą fukcję f(t) moża tylko w jede sposób przedstawić za pomocą szeregu trygoometryczego. Poadto warto pamiętać, że suma częściowa szeregu Fouriera jest ajlepszym możliwym przybliżeiem fukcji rozwijaej w szereg trygoometryczy. Lepsze przybliżeie moża uzyskać jedyie dołączając dalsze wyrazy tego szeregu, a ie przez zmiaę współczyików A i B. Watość chwilowa Watość chwilowa.5 -.5 -.5 -.5 -..4.6.8 czas, s..4.6.8 czas, s Amplituda Amplituda.5 5 5 Częstotliwość, Hz.5 5 5 Częstotliwość, Hz Watość chwilowa.5 -.5 -..4.6.8 czas, s 5 5 Częstotliwość, Hz Rysuek.3. Przykłady sygałów oraz ich widm otrzymaych za pomocą rozkładu a szereg Fouriera. Amplituda Przykłady widm iektórych sygałów zdetermiowaych, które moża uzyskać za pomocą przedstawieia sygału za pomocą szeregu Fouriera, przedstawia Rysuek.3. Eergia dźwięków periodyczych o długim czasie trwaia przypada dla pewych dyskretych.5 8

wartości częstotliwości i widmo takie azywae jest widmem prążkowym. Pierwsze trzy przykłady z Rysuek.3 przedstawiają właśie widma tego typu. Sygał siusoidaly, z defiicji, zawiera jedą składową częstotliwościową. Fala prostokąta składa się z ieparzystych harmoiczych składowej podstawowej a amplitudy tych składowych maleją ze wzrostem umeru harmoiczej. Ciąg impulsów powtarzających się co stały przedział czasu zawiera wszystkie składowe harmoicze składowej podstawowej o rówych amplitudach. Poieważ jedak pojedyczy impuls ma małą eergię a składowych harmoiczych jest wiele to składowe te mają małą amplitudę. W praktyce szereg Fouriera ie może być stosoway do aalizy częstotliwościowej sygałów, poieważ w rozważaiach teoretyczych zakłada się ieskończoy czas trwaia przebiegu, podczas gdy zjawiska obserwowae w praktyce mają skończoy czas trwaia. Poadto zakłada się okresowość przebiegu f(t), a tymczasem przebiegi występujące w rzeczywistości są często ieokresowe. Pewym uogólieiem szeregu Fouriera w powyższej formie jest jego postać zespoloa wyrażoa astępującą formułą: = + jωt f ( t) = X e = gdzie X π / ω ω jωt = f ( t) e dt π. (.8) π / ω Dość często zamiast X używa się otacji X(jω). Jak widać z tego rówaia dowolą fukcję okresową moża zapisać w postaci szeregu, w którym występują ujeme częstotliwości (sumowaie dokoywae jest od =- do =+ a wyrażeie ω ozacza częstotliwość -tej składowej). Nie ma w tym ic dziwego, bowiem prosty sygał cosiusoidaly a mocy rówań Eulera moża zapisać jako sumę dwóch składików: e e jβ jβ α e = cos β + j si β = cos β j si β jβ α + e jβ Acos(πft + θ ) = = α cos β A e j(πft+ θ ) A + e j(πft+ θ ) (.9) Z uwagi a tak specyficze przedstawieie sygałów aaliza Fouriera w przypadku szeregów zespoloych pozwala a wyzaczeie tzw. widm dwustroego (bo zawiera iezerowe amplitudy składowych o ujemych częstotliwościach) zarówo widma amplitudowego, jak i fazowego. Ważą właściwością aalizy za pomocą szeregu Fouriera jest rówież i to, że aaliza ta pozwala za rozłożeie złożoej fukcji okresowej a dyskrete składowe, co ozacza, że 9

eergia sygału skupioa jest tylko w sygałach o częstotliwościach ω. W przedziałach pomiędzy tymi składowymi ie ma żadej eergii. Dla rzeczywistej fukcji x(t) moża zapisać: Re( X Im( X ) = Re T ) = Im T T / T / T / T / x( t) e x( t) e j πft jπft Oraz wykazać pewe właściwości symetrii: Re[ X Im[ X X X arg( X = X = ] = Re[ X ] ] = Im[ X * X ) = arg( X ] ) dt = T dt = T T / T / x( t)cos(πf t) dt T / T / Poadto, w przypadku sygału rzeczywistego moża zapisać: x( t) = X x( t) = X + + jπft jπf ( ) t [ X e + X e ] = = X cos(πft + arg( X ) x( t)si(πf t) dt (.) (.) (.) co w dalszej kolejości umożliwia wyzaczeie widma jedostroego (a więc zawierającego tylko składowe o dodatich częstotliwościach) zarówo amplitudowego, jak i fazowego a podstawie astępujących zależości: X = Ph(( X (Re( X )) + (Im( X Im( X ) = arcta Re( X ) ) )) (.3) Watość chwilowa.5 -.5 - jωt jω t ( e + e ) x( t) = cos( ωt) = X =, X =, X k = k ± - -.5.5 czas, s Amplituda.5 - - Częstotliwość, Hz Rysuek.4. Przykładowe widmo dwustroe

.3. Aaliza sygałów ieokresowych Aalizy spektralej sygałów ieokresowych opisaych fukcjami aalityczymi dokouje się często za pomocą tzw. przekształceia Fouriera, które zdefiiowae jest astępującą zależością: jωt = f ( t e dt F( jω ) ) (.4) gdzie F ( jω) jest azywae przekształceiem Fouriera fukcji f (t). Zarówo F ( jω) jak i f (t) są tu fukcjami ciągłymi, zdefiiowaymi w ieskończoym przedziale swoich argumetów. Poieważ F ( jω) jest fukcją ω to o trasformacji tej mówi się, że trasformuje oa fukcję f (t) z dziedziy czasu do dziedziy częstotliwości. Aby w pełi udokumetować związek wielkości ω z częstotliwością moża pokazać, że fukcja F( jω) jest swoistym uogólieiem wielkości h (lub c ), które w przypadku szeregu Fouriera staowiły zbiór wartości dyskretych. Jedak w przypadku całki Fouriera F ( jω) staowią pewe kotiuum wartości gdy okres fukcji f (t) rośie do ieskończoości, w rezultacie czego fukcja f ( t) staje się aperiodycza. Aby uzasadić te pukt widzeia załóżmy, że okresowa fukcja f (t) może być rozłożoa a astępujący szereg Fouriera: = + = jω f ( t) = c e t gdzie c π / ω ω = f ( t) e π π / ω jω t dt (.5) Okres fukcji f (t) jest tu rówy π/ω sekud gdy ω wyrażoe jest w radiaach a sekudę, a skład harmoiczy fukcji f (t) ie jest ograiczoy. Każda wartość c jest zespoloą składową częstotliwościową fukcji f (t) o częstotliwości kątowej ω. Widmo amplitudowe fukcji f (t) jest symetrycze względem puktu ω =, poieważ wartość sprzężoa * współczyików c jest rówa c w związku z czym c = c. Różiczkowaie fukcji F ( jω) zakłada, że wartość ω, czyli odstęp częstotliwości pomiędzy dwoma sąsiedimi składowymi w szeregu Fouriera zmierza do tak, że widmo prążkowe wyrażoe szeregiem Fouriera (poszczególe składowe co ω ) staje się ciągłym zbiorem wartości. Aby to osiągąć ie ograicza się okresu składowej o częstotliwości podstawowej π/ω (może o rosąć ieograiczeie) co jedocześie ozacza, że dopuszcza się istieie częstotliwości ieskoczeie małych, tj. ω. Zastępując ω przez ω, by podkreślić zmiejszaie się różicy pomiędzy każdymi dwoma sąsiedimi składowymi, oraz

przechodząc z sumowaia do całkowaia, gdy ω, ostaie rówaie moża zapisać w postaci astępujących całek: j = ω ω t jωt f ( t) F( j ) e dω oraz F( jω ) = π f ( t) e dt (.6) Trasformata Fouriera F( jω) wyraża więc ciąg współczyików rozwiięcia fukcji f (t) w szereg Fouriera dla wartości ω dążącego do ieskończeie małej wartości. Możemy zatem uzać, że wielkość F ( jω) jest widmem amplitudowym i jest teraz fukcją ciągłą w odróżieiu od dyskretych wartości h. Dwie ostatie zależości tworzą tzw. parę trasformat Fouriera: odwrotą i prostą. Warukiem istieia trasformaty Fouriera jest zbieżość aalizowaej fukcji tz.: f ( t) dt < (.7) Oczywiście żada fukcja periodycza ie posiada tej właściwości, ale p. pojedyczy zaikający ekspoecjalie impuls, który zaika w skończoym czasie do zera ma taką trasformatę, podobie jak ie fukcje zaikające dość szybko. Jedak przedstawioa para trasformat ie pozostawia żadych wątpliwości: przejście z ie gubi żadych iformacji o sygale. f (t) do F ( jω) i z powrotem W praktyce eksperymetalej ie prowadzi się aalizy sygału za pomocą całki Fouriera, lecz za pomocą pewej jej formy azwaej Dyskretą Trasformatą Fouriera (DFT), realizowaej za pomocą powszechie uzaego algorytmu szybkiej trasformaty Fouriera (FFT). Nim jedak przedstawioa zostaie ta trasformata warto zapozać się z podstawowymi wiadomościami dotyczącymi próbkowaia i kwatowaia sygału..4. Aaliza sygałów dyskretych.4.. Próbkowaie i dyskretyzacja sygału Sygały są geeralie ciągłe, przyjmujące pewą wartość w każdej chwili czasu. Jedak odczytaie wartości chwilowej sygału w każdej chwili czasu jest iemożliwe i dlatego też odczyt wartości chwilowej dokoyway jest ajczęściej w regularych odstępach czasu, p. co T. Te proces odczytywaia i zapamiętywaia chwilowej wartości sygału azywa się próbkowaiem sygału. Odstęp czasu pomiędzy dwoma sąsiedimi próbkami, T (lub częściej T s ), azywa się okresem próbkowaia a jego odwrotość osi azwę szybkości próbkowaia:

Watość chwilowa f s = = (.8) T T s Dość często wielkości te ozacza się rówież za pomocą symboli F s i T s. W wyiku próbkowaia otrzymujemy sygał którego wartości są zae tylko w kolejych, dyskretych chwilach czasu (co T) i ie wiemy jaką wartość przyjmował sygał pomiędzy dwoma dowolymi próbkami. Przykład takiego sygału przedstawia Rysuek.5.5 -.5 - - -.5.5 czas, s - - -.5.5 czas, s Rysuek.5. Przykładowy przebieg sygału ciągłego oraz jego próbek czasowych. Watość próbki Próbkowaie sygału jest tylko jedym z elemetów przetwarzaia aalogowocyfrowego sygału. Kolejym iezmierie istotym etapem tego procesu jest tzw. dyskretyzacja, lub kwatowaie sygału. Dyskretyzacja sygału polega a przyporządkowaiu wartościom chwilowym sygału liczb z pewego, ustaloego z góry zakresu. Zakres te zależy od tzw. rozdzielczości przetwarzaia (p. 8 bitów 6 bitów itd.). Jest to kolejy iezbędy proces, bowiem zapamiętaie każdej wartości amplitudy sygału ciągłego byłoby zaczie bardziej skomplikowae. Jeśli rozdzielczość aalizy wyosi bitów to chwilowe wartości amplitudy zamieiaie są a jedą z liczb. Jeśli dyspoujemy więc przetwarzaiem 6 bitowym to każda chwilowa wartość sygału zamieiaa jest a jedą liczbę całkowitą z przedziału -65536. Zatem, gdy aalizoway sygał zmieia się w zakresie ± V, to zakres V podzieloy zostaje a 65536 jedakowych przedziałów po.35 mv każdy (tzw. krok dyskretyzacji), a dowola chwilowa wartość apięcia zostaje zamieioa a liczbę rówa wielokrotości tego pojedyczego przedziału apięcia. Warto jedak dodać, że pierwsza połowa tych liczb (a więc zakres -3768) przyporządkowaa jest ujemym wartościom chwilowym, a liczby z przedziału 3769-65536 przyporządkowae są dodatim apięciom. Zatem apięcie rówe V reprezetowae jest przez liczbę 65536 a apięcie V przez liczbę. W procesie tym ie każda wartość chwilowa zajdzie odpowiadającą mu liczbę. Np. przy kroku dyskretyzacji.35 mv apięcie +3.3 powio zostać zamieioe a liczbę 3768+3.3/.35=43587.673475. Jedak poieważ przetwarzaie to jest odwzorowaiem wartości ciągłych w wartości dyskrete i całkowite, to w wyiku tej operacji otrzymamy liczbę 43587. Dyskretyzacja iesie więc ze sobą pewe błędy przetwarzaia, których wartość zależy od rozdzielczości: im większa rozdzielczość, tym miejszy błąd..5 -.5 3

Błędy te są ajczęściej pomijae jeśli tylko dyspoujemy przetwarzaiem 6- lub więcej bitowym. Warto w podsumowaiu stwierdzić, że sygał dyskrety to taki sygał którego wartości chwilowe są zae tylko w określoych chwilach czasu oraz, że przyjmują oe jedą z dozwoloych wartości..4.. Aaliza widmowa sygałów dyskretych Aalizy widmowej sygałów dyskretych dokouje się w oparciu o tzw. Dyskretą Trasformatę Fouriera (DFT). Ogóle wyrażeie opisujące tę trasformatę jest łudząco podobe do rówaia przedstawiającego rozwiięcie fukcji periodyczej w zespoloy szereg Fouriera i ma postać: = N X ( m) = x( ) e = jωm N (.9) gdzie X(m) ozacza m-tą składową dyskretej trasformaty Fouriera, N liczbę aalizowaych próbek, a i m odpowiedio koleje umery próbek czasowych (wejściowych) i widmowych (wyjściowych). Zasadiczą różicą jest tu oczywiście zastosowaie dyskretego sygału wejściowego x() (zamiast ciągłego x(t) jak to ma miejsce w szeregu Fouriera) oraz wyik w postaci dyskretych próbek widma a wyjściu tej aalizy. Wykładik potęgi ma też ieco ią postać wyikającą bezpośredio z faktu zastosowaia dyskretego sygału a wejściu. Rówież ieskończoa suma szeregu Fouriera zamieioa została a sumę po wszystkich elemetach wejściowych. Podobie jak w przypadku całki Fouriera wartości modułu kolejych wyrażeń X(m), które zazwyczaj są liczbami zespoloymi, tworzą widmo sygału (a dokładiej widmową gęstość amplitudy sygału). Zastosowaie aalizy DFT w odiesieiu do sygału o liczości N daje w efekcie dokładie tyle samo iezależych próbek widmowych. Poieważ aaliza ta daje w efekcie poumerowae jedyie próbki to a postawie wyłączie wartości tych próbek, trudo jest określić odpowiadające im częstotliwości. Jest to zadaie iewykoale jeśli ie wiemy z jaką szybkością próbkoway był sygał. Załóżmy jedak że szybkość próbkowaia była rówa F s. Na tej podstawie możemy więc zapisać: N F = s = (.) rejestracji Ts t 4

gdzie t rejestracji ozacza czas trwaia aalizowaego sygału. A uproszczoą wersję rówaia (.9) pozwalającą a łatwiejsze wyzaczeie częstotliwości m-tej próbki widmowej moża zapisać astępująco: X ( m) = = N = πm x( )cos 443 N πfmt πm jx( )si N Argumet fukcji sius lub cosius moża zapisać w astępującej postaci (.) πm = πf mt (.) N gdzie f m ozacza częstotliwość m-tej próbki widmowej, zaś zapisując to rówaie dla dwóch kolejych próbek czasowych (t=t s ) otrzymujemy: ( + ) m m N N mfs fm = N = f m T s (.3) Poieważ w odpowiedzi a N próbek wejściowych otrzymujemy N iezależych próbek wyjściowych w związku z tym pierwsza próbka wyjściowa (m=) będzie odpowiadała częstotliwości f m =, zaś N-ta próbka wyjściowa o umerze N- będzie odpowiadała częstotliwości F s. Wszystkie próbki wyjściowe są rówomierie rozłożoe w przedziale od do szybkości próbkowaia (F s ). Warto zauważyć, że rówaie (.9), czy też (.) opisuje fukcję periodyczą ze względu a zmieą m (jeśli tylko założyć, że m może przyjmować dowolą wartość całkowitą) przy czym okres tej fukcji jest rówy N. Ozacza to, że fukcja ta powtarza się dokładie co N próbek wyjściowych. Ma to ogrome zaczeie dla właściwego odczytaia widma sygału. Załóżmy, że mamy sygał ciągły, o którym wiemy, że składowa o ajwiększej częstotliwości w im zawarta ma częstotliwość f. Załóżmy poadto, że zamy widmo tego sygału F ( jω) wyzaczoe a podstawie całki Fouriera co przedstawia Rysuek.6. Załóżmy dalej, że próbkujemy te sygał z szybkością F s, która jest dużo większa (co ajmiej dwa razy większa) iż częstotliwość f. Te spróbkoway sygał przedstawioy jest a rys.6c, zaś obliczoe próbki widmowe przedstawioe są a rys..6d. Rysuek te pokazuje rówież możliwe do wyliczeia próbki widmowe w sytuacji, gdy wskaźik m może przybierać dowole całkowite wartości spoza przedziału (,N-). Jak widać z tego rysuku jest to przebieg periodyczy z okresem N (lub z okresem F s ), bowiem koleje widma są 5

prostymi traslacjami widma wyzaczoego a podstawie całki Fouriera. Dzięki założeiu, że F s >>f, koleje traslacje tego widma ie zachodzą a siebie, co pozwala przypuszczać, że tak dokoaa aaliza jest poprawa. Załóżmy jedak teraz, że zmiejszamy szybkość a) f f t b) f X ( jω ) f f c) d) X ) ( jω)... Fs f g F s f F F... X ) ( jω) g s s ω e)... F F F... s s F s s f f g g Rysuek.6. Przykładowy sygał i jego widmo dwustroe obliczoe za pomocą całki Fouriera próbkowaia tak, że f>fs>f. Widmo tak spróbkowaego sygału przedstawia rys..6e. Jak widać z tego rysuku dla tak specyficzie dobraej szybkości próbkowaia koleje traslacje widma zachodzą a siebie, co czyi wyik aalizy iemiarodajy. Zjawisko to osi azwę aliasigu i występuje wówczas, gdy szybkość próbkowaia jest miejsza iż podwojoa maksymala częstotliwość występująca w aalizowaym sygale. Aby go uikąć trzeba dobrać szybkość próbkowaia tak, by była oa co ajmiej dwa razy większa iż maksymala częstotliwość występująca w aalizowaym sygale. Jest to kwitesecja twierdzeia (waruku) Nyquista, odgrywającego iezmierie istotą rolę w aalizie sygałów. Warto też pamiętać, że bezstrate odtworzeie sygału a podstawie jego widma, w sytuacji gdy występuje aliasig, jest iemożliwe. Dlatego m.i. szybkość próbkowaia ω 6

sygałów zapisaych a płytach kompaktowych jest rówa 44. khz, bowiem awet jeśli czułość aszego słuchu sięga khz, to waruek Nyquista jest i tak spełioy. Jak widać z rys..5 zamieszczoe widma są symetrycze względem całkowitych wielokrotości szybkości próbkowaia, lub całkowitej wielokrotości liczby próbek N poddaych aalizie. Jest to jeda z podstawowych cech wyików dyskretej trasformaty Fouriera. Poieważ wyik tej aalizy jest zbiorem liczb zespoloych, to symetrię tę moża zapisać astępująco: X ( m) = X ( m) Arg( X ( m)) = Arg( X ( m)) (.4) X ( m) = X * ( m) oraz: X ( kn m) = X ( m) = X ( m) Arg( X ( kn m)) = Arg( X ( m)) = X ( kn m) = X * ( m) Arg( X ( m)) (.5) dla dowolego całkowitego k. Stwierdzoa symetria oraz możliwość wystąpieia alisasigu sugeruje, że widmo zawiera dwa razy więcej próbek iż ich iezbęda liczba. Rzeczywiście, miarodajym wyikiem aalizy widmowej dokoywaej za pomocą dyskretej trasformaty Fouriera jest tylko pierwsza część próbek tj. od próbki zerowej (której wartość wyraża średią wszystkich próbek czasowych) do próbki o umerze N/. Dlatego też przebieg widmowej gęstości amplitudy wyzaczają koleje moduły wyrażeń X(m) otrzymaych a podstawie DFT ale tych o umerach od do N/. Jedak ajczęściej widmo sygału przedstawia się poprzez wykreśleie mocy (czyli kwadratu modułu) każdej ze składowych w fukcji ich częstotliwości. Zależość ta, będąca fukcją częstotliwości, osi azwę widmowej gęstości mocy. Pomimo, że jest to zbiór wartości dyskretych, przypadających dla ściśle określoych wartości częstotliwości, to każda z ich wyraża moc sygału przepadającą a pewie przedział częstotliwości, a więc zupełie iaczej iż w przypadku rozłożeia sygału za pomocą szeregu Fouriera. Jeśli dla N-puktowej trasformaty Fouriera koleje wartości X(m) odległe są o f (tzw. rozdzielczość częstotliwościowa aalizy), to każda z tych wartości określa moc sygału w paśmie częstotliwości o szerokości f, tj. od f m -.5 f do f m +.5 f. Łatwo więc zauważyć, że powiększaie liczby próbek wejściowych prowadzi do coraz lepszej rozdzielczości częstotliwościowej, a więc i do dokładiejszej aalizy. Jedak z drugiej stroy powiększaie 7

liczby próbek prowadzi do gubieia iformacji o zmiaach zachodzących w czasie trwaia sygału. Np. jeśli aalizie widmowej poddamy sygał, którego częstotliwość zmieiła się skokowo z f a f to otrzymamy dwa dyskrete prążki. Jest więc to wyik bardzo uśredioy, który też ie jest w pełi miarodajy. Zatem powiększaie liczby próbek bez ryzyka utraty iformacji o zmieości w czasie moża stosować do sygałów, które ie zmieiają się. Natomiast w sytuacji p. sygału mowy zabieg taki prowadzi do admierego uśredieia. Powyższe przesłaki legły u podstaw defiicji widma długotermiowego i krótkotermiowego. Pierwsze z ich ozacza obliczeie widma a podstawie dużej liczby próbek, podczas gdy drugie (azywae też iekiedy widmem chwilowym) bazuje a bardzo ograiczoej liczbie próbek. Obliczając widmo chwilowe dzieli się sygał a iewielkie porcje (p. po próbek) i dla każdej porcji próbek wyzacza się odrębą DFT. Dodatkowo, aby uikąć iepożądaego poszerzeie widma związaego z agłym włączeiem/wyłączeiem sygału a każdą porcję sygału zakłada się tzw. okieko czasowe, czyli przemaża się ją przez sygał arastający i wybrzmiewający łagodie. Najczęściej stosuje się w tym zakresie oko Haiga opisae astępującą zależością: k w[ k + ] =.5 cos π k =,,,...,. (.6) którego przebieg ilustruje Rysuek.7. Watość chwilowa.5 - -.5.5 czas, s Rysuek.7. Przebieg czasowy oka czasowego Haiga. Warto też w zakończeiu wspomieć o tzw. techice akładkowej. Podział sygału a porcje czasowe ie ozacza bowiem, że muszą być oe rozłącze: astępa porcja sygału ie musi wcale zaczyać się dokładie z końcem poprzediej, a może zawierać część próbek (p. połowę) z poprzediego oka. Taki podział sygału osi właśie azwę techiki akładkowej, jako że koleje oka akładają się a siebie. Najczęściej stosuje się w tym zakresie 5% akładaie: każde astępe oko zawiera połowę próbek z poprzediego oka..5. Aaliza sygałów mowy. Spektrogram Z uwagi a zaczą specyfikę sygałów mowy zastosowaie kowecjoalych metod aalizy widmowej, opartych o p. wyzaczeie widma długotermiowego, ie przyosi 8

zadowalających skutków. Dlatego też ajważiejszą i ajczęściej stosowaą metodą aalizy dźwięków mowy jest metoda oparta o wyzaczaie chwilowego widma sygału oraz przedstawieie ewolucji widm chwilowych w czasie a tzw. spektrogramie. Spektrogram jest trójwymiarowym wykresem pokazującym ilość eergii przypadającej dla daej częstotliwości jako fukcję czasu. Aby wyzaczyć spektrogram dzieli się sygał mowy a krótkie odciki czasowe i oblicza się widma chwilowe dla tych odcików. Czas odłożoy jest a osi odciętych, częstotliwość a osi rzędych a stopień zaczerieia (lub odpowiedie kolory) odwzorowuje atężeie (poziom atężeia) dźwięku. Przykładowy spektrogram ilustruje. Rys..8. 8 Częstotliwość, khz 6 4..4.6.8. Rysuek.8. Spektrogram słowa 'akustyka'. a k u s t y k a Czas, s Wyzacza się zazwyczaj dwa typy spektrogramów, tz. szerokopasmowy i wąskopasmowy, a podział te wyika ze stosowaej w przeszłości techiki wyzaczaia widma sygałów za pomocą filtrów. W szerokopasmowym spektrogramie ajczęściej stosuje się pasmo o szerokości 3 Hz, a uzyskiwaa przy tym rozdzielczość czasowa jest wystarczająco dobra, bowiem pozwala obserwować poszczególe impulsy tou krtaiowego (każdy z impulsów tou krtaiowego odpowiada jedemu okresowi drgaia fałdów głosowych). Nie pozwala jedak a jedoczesą obserwację poszczególych harmoiczych częstotliwości podstawowej głosu. Szerokopasmowe spektrogramy są często stosowae do aalizy przebiegu czasowego i kształtu formatów. Rysuek.8 przedstawia właśie przykład szerokopasmowego spektrogramu. Miejsca ozaczoe kolorem czerwoym wskazują a zaczą kocetrację eergii dla określoych częstotliwości i w określoych chwilach czasu, podczas gdy miejsca ozaczoe kolorem zieloym wskazują a brak eergii. Czerwoe pasma przebiegające w przybliżeiu poziomo odpowiadają formatom. W 9

przypadku spektrogramu wąskopasmowego szerokość pasma aalizującego jest rówa 45 Hz. Jest to zwykle wystarczająca rozdzielczość dla obserwacji zmieości poszczególych składowych harmoiczych, ale daje też gorszą rozdzielczość czasową, uiemożliwiając obserwację impulsów tou krtaiowego. Współczese metody wyzaczaia spektrogramu bazują a wyzaczaiu widm chwilowych i ich odpowiedim przedstawieiu. Szerokość pasma aalizującego wyika wprost z rozdzielczości zastosowaej aalizy widmowej. Np. środowisko Matlab zawiera fukcję specgram umożliwiającą szybkie wyzaczeie spektrogramu dla parametrów aalizy. Jedak istieje wiele specjalizowaych programów do obróbki i aalizy sygałów mowy z których PRAAT wydaje się być jedym z ajdogodiejszym (http://www.praat.org). Przykładowe wyiki aalizy sygałów mowy uzyskae za pomoca programu PRAAT zamieszczoo w rozdziale 4.3 oraz 5. iiejszego opracowaia. Aalizując sygał mowy wyzacza się też często przebieg zmia częstotliwości tou krtaiowego a podstawie tzw. przejść sygału mowy przez zero. Zmiay częstotliwości tego tou odwzorowują tzw. itoację związaą ze zmiaą wysokości głosu (częstotliwości tou krtaiowego), która często sugeruje to wypowiedzi oraz stay emocjoale mówcy.

3. MOWA 3.. Wytwarzaie dźwięków mowy Dźwięki mowy wytwarzae są w tzw. orgaie mowy, którego przekrój porzeczy przedstawia Rysuek 3.a. Zasadiczymi jego elemetami są płuca, tchawica, krtań, gardło, os, jama osowa oraz usta. Część drogi głosowej leżącą powyżej krtai azywa się kaałem głosowym. Kształt jego przekroju poprzeczego może się zaczie zmieiać pod wpływem ruchów języka, warg i szczęki (tzw. arządów artykulacyjych) umożliwiając wymawiaie (artykulację) różych głosek. Zasadiczymi elemetami krtai, które ilustruje Rysuek 3.bd, są tzw. fałdy (wiązadła) głosowe. Przestrzeń pomiędzy fałdami głosowymi azywa się głośią. Fałdy głosowe mogą się otwierać i zamykać zmieiając w te sposób rozmiary głośi, co wpływa a przepływ powietrza z płuc. Dźwięk wytwarzay w trakcie wydostawaia się powietrza z płuc przez fałdy głosowe, które wykoują szybkie ruchy (periodycze lub quasi-periodycze) zamykające i otwierające głośię, azywa się toem krtaiowym. Dźwięki wytwarzae przy udziale drgań fałdów głosowych azywają się dźwięczymi. Toy krtaiowe są dźwiękami periodyczymi o dość małej częstotliwości podstawowej, zawierającymi harmoicze ze zaczego zakresu częstotliwości. a) b) c) d) Rysuek 3.. Część (a) przedstawia orga mowy: - przepoa, płuca, 3 tchawica, 4 wiązadła głosowe, 5 język, 6 języczek, 7 jama osowa, 8 kaał głosowy. W części (b) przedstawioo przekrój profilowy krtai: agłośia, fałd kieszoki krtaiowej Morgaiego, 4 fałd głosowy, 5 chrząstka tarczowa, 6 chrząstka pierścieiowa, 7 kość gykowa, 8 tchawica. W części (c) przedstawioo przekrój czołowy krtai, ozaczeia jak w części (b). Część (d) przedstawia przekrój poziomy krtai: chrząstka tarczowa, chrząstki alewkowe, 3 głośia, 4 mięśie głosowe (wewątrz fałdów głosowych), 5 wiązadła głosowe, 6 mięśie międzyalewkowe. Rysuek a podstawie Basztury (988). Częstotliwość podstawowa tego drgaia zawiera się w przedziale od do 4 Hz dla głosów męskich, lub od do 5 Hz dla głosów kobiecych. Większa część eergii tego dźwięku zawarta jest w składowych o małych częstotliwościach, co ilustruje Rysuek 3.a.

To krtaiowy staowi jedocześie pewie pierwoty sygał wejściowy do kaału głosowego, w którym jego widmo podlega zaczym modyfikacjom. Kaał głosowy zachowuje się jak układ filtrów (rezoatorów) o określoych częstotliwościach rezoasowych (por. Rysuek 3.b) tak, że widmo tou krtaiowego po przejściu przez układ tych filtrów charakteryzuje się pewymi maksimami i miimami lokalymi. Te lokale Rysuek 3.. Ilustracja sposobu geeracji dźwięków iektórych samogłosek. W części (a) przedstawioo widmo dźwięku (tou krtaiowego) wytwarzaego w wyiku drgań fałdów głosowych. Dźwięk te składa się z wielu harmoiczych, których poziom maleje ze wzrostem częstotliwości. W części (b) przedstawioo przekroje poprzecze kaału głosowego w kofiguracjach odpowiadających trzem samogłoskom. Część (c) przedstawia charakterystyki przeiesieia kaału głosowego odpowiadające różym jego kofiguracjom, właściwym poszczególym samogłoskom. Część (d) przedstawia widma samogłosek po przejściu tou krtaiowego (a) przez filtry o charakterystykach przedstawioych w części (c). Rysuek a podstawie Moore (999). maksima azywae są formatami i ozaczae są zwykle za pomocą litery F z liczbą ozaczającą kolejy umer formatu. Format o ajmiejszej częstotliwości jest azyway pierwszym formatem (F), astępy drugim formatem (F) itd. Częstotliwość środkowa każdego z formatów jest ia i ściśle związaa z kształtem kaału głosowego. Lokale miima widma sygału po przejściu przez kaał głosowy azywa się często atyformatami, a ich obecość w sygale ma rówie waże zaczeie jak obecość formatów. Przykładowe widma tou krtaiowego po przejściu przez kaał głosowy przedstawia Rysuek 3.c. Bezwzględe wartości częstotliwości poszczególych formatów wykazują dość duże

zróżicowaie międzyosobicze. Jedak ich względe wartości ie zależą od idywidualych cech głosowych. Rówież poziomy poszczególych formatów (wyrażoe względem formatu F) wykazują stałe w przybliżeiu wartości. To krtaiowy, modyfikoway przez arządy artykulacyje w kaale głosowym, ie jest jedyym dźwiękiem jaki może wygeerować aparat głosowy. Źródłem dźwięku może być p. agłe uwolieie powietrza zgromadzoego w pewym miejscu kaału głosowego lub przepuszczaie strumieia powietrza przez przewężeie. Dlatego też podział dźwięków mowy ze względu a sposób ich wytwarzaia przedstawia się astępująco: aspiraty (samogłoski wypowiadae szeptem), które powstają przez przepuszczaie strumieia powietrza przez przewężeie krtai (szum krtaiowy), dźwięcze bezszumowe (samogłoski) powstające przez geerowaie tou krtaiowego, dźwięcze szumowe, które powstają przy geerowaiu tou krtaiowego i przepuszczaia powietrza przez przewężeie kaału głosowego (/z/ /dz/), szumowe (bezdźwięcze), które powstają wyłączie przez przepuszczaie powietrza przez przewężeie pewej części kaału głosowego, (/f/, /s/), udarowe (zwarte), które powstają a skutek uwolieia powietrza zgromadzoego w pewym miejscu kaału głosowego (/b/ lub /p/). Iego podziału dźwięków mowy moża dokoać aalizując ich zmieość w czasie. Ustaloymi przebiegami w czasie charakteryzują się samogłoski oraz spółgłoski osowe, bocze i trące. Grupa spółgłosek zwartych charakteryzuje się przebiegami ieustaloymi zbliżoymi do dźwięków o charakterze impulsowym. 3.. Głoski, allofoy i foemy Zasadiczym elemetem składowym każdej wypowiedzi są wyrazy, a które składają się głoski. Głoskę ituicyjie pojmować moża jako foetyczy odpowiedik litery, choć relacje pomiędzy literami pisaymi a ich wymową są w ogólości w wielu językach bardzo zawiłe i ieregulare. Język polski jest pod tym względem jest dość regulary, choć pomiędzy elemetami mowy a odpowiadającymi im zakami pisma zachodzą złożoe relacje. Zapis w którym zachodzą ajprostsze i bezwyjątkowe relacje głoska litera azywa się traskrypcją foetyczą. Podstawowymi elemetami alfabetu foetyczego są tzw. foemy, czyli ajmiejsze segmety (odciki czasowe) sygału mowy pozwalające a odróżieie zaczeia. Foemy staowią zatem podstawowe elemety wypowiedzi, a ich zbiory układają się w wyrazy i zdaia. 3

Segmet foetyczo-akustyczy to fragmet przebiegu czasowego sygału mowy w obrębie którego parametry foetyczo-akustycze są stałe lub zmieiają się w jedym kieruku. Rozróżiamy segmety zależe i iezależe. Segmet iezależy wraz z sąsiedimi segmetami zależymi staowi głoskę. Jeśli różice pomiędzy głoskami mają charakter przypadkowy albo związay z idywidualymi różicami pomiędzy mówcami to mówimy, że mamy do czyieia z klasą głosek rówoważych, czyli allofoem akustyczym. W sytuacji gdy a różice pomiędzy allofoami wpływają bezpośredio sąsiedie allofoy to mamy do czyieia z różicami kotekstowymi. Natomiast jeśli różice pomiędzy allofoami są iezależe od sąsiedich allofoów to mówimy o różicach dystyktywych. Grupę allofoów pomiędzy którymi ie ma różic dystyktywych azywamy foemem. Dlatego też foemy moża traktować jako podstawowe elemety alfabetu foetyczego. Traskrypcja foetycza korzysta z symboli, z których większość ma taki sam ses jak odpowiadające im litery zwykłej pisowi, a ie ozaczae są zakami specjalymi. Język traskrypcji w swym założeiu pomyślay jest jako język międzyarodowy i często zdarza się, że jakaś litera zapisu foetyczego ozacza zupełie ią głoskę iż ta, z którą kojarzy się oa w polskiej ortografii. Np. zak foetyczy /w/ odpowiada głosce pisaej w języku polskim jako Ł a foetycze /v/ odpowiada głosce sygalizowaej przez W. Tak więc wyraz weła ma w traskrypcji foetyczej postać / vewa/ (zak ozacza, że astępująca po im sylaba jest akcetowaa). 3.3. Samogłoski Wśród ustaloych dźwięków mowy samogłoski są tymi dźwiękami, które ajłatwiej scharakteryzować. Powstają oe w warukach swobodego przepływu powietrza wzdłuż języka. Wiązadła głosowe drgają periodyczie lub quasi-periodyczie a podiebieie miękkie jest uiesioe do góry blokując dostęp powietrza do osa. O tym jaką samogłoskę wypowiadamy decyduje położeie środkowej i tylej części języka względem podiebieia twardego, gdyż przód języka jest biery. Dlatego też możemy mówić o samogłoskach przedich i tylych oraz o wysokich i iskich. Samogłoski są stosukowo łatwymi obiektami do badań z uwagi a dość długi ich czas trwaia (powyżej ms) i wyraźie zarysoway sta ustaloy umożliwiający wyzaczeie częstotliwości tzw. formatów. Formatem azywamy lokale maksimum eergii dźwięku mowy, o których będzie mowa w dalszej części opracowaia. 4

4. ĆWICZENIE NR : ANALIZA WYBRANYCH CECH SAMOGŁOSEK JĘZYKA POLSKIEGO 4.. Wprowadzeie Parametry samogłosek omawia się dość często w kotekście tzw. pętli formatowej, tj. wykresu ilustrującego zależość częstotliwości formatu F od częstotliwości formatu F. Rysuek 4. ilustruje pętle formatowe samogłosek zaokrągloych oraz iezaokrągloych. Samogłoski iezaokrągloe to te, które są wymawiae bez zaokrąglaia ust (tj. przy możliwie ajstaraiejszej wymowie i przy jak ajszerszym otwieraiu ust), atomiast zaokrągloe powstają podczas wypowiadaia samogłosek z zaokrągloymi (ie w pełi otwartymi) ustami. 3 i y i i ɸ e i œ e ɛ Œ a F [khz],9,8,7,6,5 u a ^ ɣ o a Ɯ o ɔ u,,3,4,5,6,7,8,9 F [khz] Rysuek 4.. Pętla formatowa samogłosek zaokrągloych (do której ależy p. samogłoska /u/) oraz pętla formatowa samogłosek iezaokrągloych (do których ależy p. samogłoska /a/), Jassem, 973. Na podstawie aalizy pętli formatowej moża stwierdzić p. że im samogłoska jest bardziej otwarta (tyla część języka usytuowaa jest w ajiższym z możliwych położeń 5

względem podiebieia miękkiego) tym większa jest częstotliwość formatu F. Poadto duża wartość F jest charakterystycza dla samogłosek przedich (tj. takich w czasie wymawiaia których tyla część języka jest wysuięta możliwie ajdalej do przodu). Choć bezwzględe wartości częstotliwości poszczególych formatów wykazują dość duże zróżicowaie międzyosobicze (płeć, wiek), to ich względe wartości ie zależą od idywidualych cech głosowych. Poziomy poszczególych formatów, wyrażoe względem formatu F, rówież wykazują stałe w przybliżeiu wartości. Poziom drugiego formatu jest od 5 (jak w /a/) do 5 db (jak w /i/) iższy od poziomu pierwszego formatu. Poziom trzeciego formatu jest z kolei o (jak w /a/) do 4 db (jak w /u/) iższy iż format F. Poziom czwartego formatu jest a ogół poad db iższy iż formatu podstawowego i ie odgrywa o praktyczie większej roli. 4.. Cel ćwiczeia Główym celem ćwiczeia jest określeie podstawowych widmowych cech samogłosek języka polskiego /i/, /i/, /e/, /a/, /o/, /u/. Ćwiczeie to polegać ma a : a) zarejestrowaiu samogłosek izolowaych (wypowiadaych oddzielie), b) wyzaczeiu spektrogramu dla samogłosek w przypadku aalizy wąsko- i szerokopasmowej, c) obliczeiu średich wartości częstotliwości formatów F, F, F3 oraz F4 dla poszczególych samogłosek, d) wyzaczeiu pętli formatowej dla zarejestrowaych samogłosek, e) porówaiu uzyskaych wyików z daymi z literatury. Poadto wykoujący ćwiczeie mogą dokoać aalogiczej aalizy samogłosek zajdujących się a początku, w środku i a końcu wyrazu. Rówież istieje możliwość dokoaia aalizy samogłosek w kotekście trybu w jakim wypowiaday jest aalizoway fragmet sygału mowy: ozajmujący, rozkazujący i pytający. 4.3. Przebieg ćwiczeia Jedym z wielu pakietów software służących do przeprowadzeia aalizy dźwięków mowy jest program o azwie PRAAT. Program te został opracoway przez autorów Paula Boersma a i Davida Weeik a z Istitute of Phoetics Scieces of the Uiversity of Amsterdam. Program te jest bardzo dobrym arzędziem do aalizy sygałów mowy. Zakres dostępych w im opcji zaczie wykracza poza zagadieia omawiae w opracowaiu. 6

Poiżej przedstawioo przykłady działaia programu PRAAT które są bezpośredio związae z tematyką tego ćwiczeia. Po uruchomieiu programu pojawiają się dwa oka z których jedo PRAAT objects zawiera wszystkie opcje aalizy, drugie zaś PRAAT picture umożliwia tworzeie obiektów graficzych w celu dokumetowaia wyików aaliz. Przykładowe oka tego programu ilustruje Rysuek 4.. W celu zarejestrowaia dźwięku ależy z meu główego New wybrać opcję agrywaia. Następie zarejestrowaemu sygałowi ależy przypisać azwę. Nazwa ta będzie widocza w okie Objects. Dla daego obiektu przyporządkowae są dostępe w formie przycisków możliwości aalizy. Po wykoaiu dowolej operacji aalizy a zarejestrowaym sygale program tworzy owy obiekt, przyporządkowując mu automatyczie azwę. W celu przeiesieia daego rysuku do oka Praat picture ależy posłużyć się poleceiem Draw dostępym w okie główym programu. Rysuek 4.. Główe oka programu PRAAT. Rysuek 4.3 przedstawia przykład zarejestrowaej samogłoski /a/. Góry pael tego rysuku przedstawia przebieg czasowy sygału, atomiast doly spektrogram. Opcje z meu Format pozwalają a wyzaczeie parametrów poszczególych formatów, tz. średich wartości częstotliwości formatów, Poadto istieje możliwość wyzaczeia zależości zmia częstotliwości formatów w fukcji czasu trwaia sygału. Pukty aiesioe a spektrogram odpowiadają chwilowym wartościom częstotliwości poszczególych formatów 7

F, F oraz F3. Istieje także możliwość wyzaczeia średiego widma gęstości mocy dla zarejestrowaego sygału. Rysuek 4.3. Przebieg czasowy i spektrogram samogłoski /a/. F 4 F F F Rysuek 4.4.Obwiedia widma gęstości mocy dla samogłoski /a/. Rysuek 4.4 przedstawia przykład obwiedi widma gęstości mocy dla samogłoski /a/. Na rysuku zazaczoo formaty, które odpowiadają lokalym maksimom obwiedi widma gęstości mocy. W zależości od rozdzielczości aalizy widmowej (szerokości oka aalizy) 8

istieje możliwość wygładzeia struktury widmowej, lub też w przypadku, kiedy chcemy uzyskać więcej iformacji o subtelej strukturze widmowej zawężeia oka czasowego aalizy. W celu wyzaczeia pętli samogłoskowej, czyli zależości częstotliwości drugiego formatu F od częstotliwości pierwszego formatu F dla poszczególych samogłosek ależy dokoać kilkukrotej rejestracji każdej z samogłosek, a astępie obliczyć średie wartości częstotliwości formatów F, F, F3 i F4. Uzyskae wyiki (wartości średie i odchyleia stadardowe) ależy przedstawić w formie wykresu pętli formatowej. Poadto a wykres ależy aieść dae z literatury (patrz Tabela., Załączik ). Uwaga! W przypadku aalizy formatów dla głosu żeńskiego zakres aalizy ależy ustawić do 5.5 khz, atomiast w przypadku głosu męskiego do 5 khz. Tabelę ze średimi wartościami częstotliwości formatowych samogłosek języka polskiego przedstawioo w Załącziku. 9

5. ĆWICZENIE NR : PODSTAWOWE CECHY WIDMOWE SAMOGŁOSEK I WYBRANYCH SPÓŁGŁOSEK JĘZYKA POLSKIEGO 5.. Wprowadzeie Spółgłoski trące (szczeliowe) są pasmami szumu, atomiast samogłoski są wielotoami (ściślej: wielotoami aharmoiczymi). Spółgłoski trące (i zwarto-trące) to spółgłoski takie jak : s, sz, z, ż, c, cz, dz, dż. Spółgłoski trące, jako impulsy szumów pasmowych mogą być charakteryzowae prze dwa parametry : przez czas trwaia tej spółgłoski (czyli - przez tzw. "iloczas") oraz przez szerokość pasma szumu, lub rówoważie - przez iloczas oraz przez dolą częstotliwość odcięcia pasma szumu (jeśli stwierdzi się, że góra częstotliwość odcięcia pasma szumu ie różicuje poszczególych spółgłosek trących). Wyróżieie tych dwóch ajważiejszych parametrów charakteryzujących spółgłoski trące powoduje, że możemy te spółgłoski klasyfikować ze względu a wartości częstotliwości dwóch pierwszych formatów. Dla poszczególych samogłosek częstotliwości pierwszego i drugiego formatu aosimy w odpowiediej przestrzei dwuwymiarowej uzyskując pewą krzywą zwaą "pętlą formatową" (patrz Rysuek 4.). Jeżeli ograiczaliśmy się wyłączie do samogłosek przedich i tylich, to uzyskiwaliśmy w tej przestrzei cztery wierzchołki, które połączoe liiami prostymi staowiły tzw. "czworobok samogłoskowy". W przypadku samogłosek wzdłuż jedej z osi odkładamy częstotliwości pierwszego z formatów (F), wzdłuż drugiej osi - częstotliwości drugiego z formatów (F). W przypadku spółgłosek trących mamy do czyieia z przestrzeią dwuwymiarową, gdzie wzdłuż jedej osi odkładamy wartości iloczasu a wzdłuż drugiej osi - dolą częstotliwość odcięcia pasma szumu. Zatem przez aalogię do "czworoboków samogłoskowych" możemy rówież kostruować "czworoboki spółgłosek trących oraz zwarto-trących". Te aiesioe wartości są współrzędymi poszczególych samogłosek lub spółgłosek trących lokalizującymi ich położeie a mapie "głoskowej", jaką staowi sporządzoy w te sposób wykres. Przykładową pętlę spółgłoskową przedstawia Rysuek 5. Niezależie od szczegółów termiologiczych, poszczególe głoski klasyfikuje się poprzez wyzaczeie względych odległości pomiędzy imi w pewej, kowecjoalej przestrzei wielowymiarowej, iż poprzez jedozacze określeie ich parametrów. 3