Zastosowanie współczynników HFCC jako cech sygnału mowy w automatycznej detekcji wad wymowy

Wielkość: px
Rozpocząć pokaz od strony:

Download "Zastosowanie współczynników HFCC jako cech sygnału mowy w automatycznej detekcji wad wymowy"

Transkrypt

1 Tomasz ZIELIŃSKI ), Paweł GAJDA ), Marcin STACHURA ) Robert WIELGAT 2), Daniel KRÓL 2), Tomasz WOŹNIAK 3), Stanisław GRABIAS 3) ) AKADEMIA GÓRNICZO-HUTNICZA, KATEDRA METROLOGII 2) PAŃSTWOWA WYŻSZA SZKOŁA ZAWODOWA W TARNOWIE, INSTYTUT POLITECHNICZNY 3) UNIWERSYTET IM. M. CURIE-SKŁODOWSKIEJ W LUBLINIE, ZAKŁAD LOGOPEDII I JĘZYKOZNAWSTWA STOSOWANEGO { tzielin@uci.agh.edu.pl, rwielgat@poczta.onet.pl, twozniak@vp.pl} Zastosowanie współczynników HFCC jako cech sygnału mowy w automatycznej detekcji wad wymowy Streszczenie W artykule opisano wyniki badań, dotyczące automatycznego rozpoznawania mowy zaburzonej. Badania przeprowadzono dla kilku polskich fonemów sprawiających największe problemy dzieciom z wadami wymowy. Zbadano trzy rodzaje współczynników cepstralnych: standardowe (CC), mel-cepstralne MFCC oraz współczynniki HFCC jako cechy sygnału mowy. Jako klasyfikatorów użyto klasycznego algorytmu nieliniowej transformacji czasowej (ang. Dynamic Time Warping) oraz średniego wektora cech. Zastosowanie cech HFCC wpłynęło na znaczącą poprawę wyników rozpoznawania. Przebadano szeroki zakres wartości parametrów w procesie obliczania HFCC w celu znalezienia ich optymalnych wartości dla różnych zadań rozpoznawania. Abstract This paper describes research results on isolated phoneme recognition of speech-impaired children. A several Polish phonemes most confusing for speech impaired children were investigated and three types of cepstral coefficients: standard (CC), mel-frequency (MFCC) as well as human factor (HFCC) were used for tracking of speech content in frequency domain. Classical dynamic time warping (DTW) algorithm with adjusted parameters values was exploited as a main classifier in the reported research. The superior HFCC performance during conducted recognition experiments has been observed. Słowa kluczowe: diagnoza i terapia zaburzeń wymowy, automatyczne rozpoznawanie mowy, ekstrakcja cech, współczynniki cepstralne i mel-cepstralne Keywords: diagnosis and therapy of pathological pronunciation, automatic speech recognition, feature extraction, cepstral and mel-cepstral coefficients Title: Application of HFCC Coefficients as Features in Automatic Detection of Pathological Pronunciation. Wprowadzenie Rozróżnienie między wymową patologiczną a normatywną nie jest dostatecznie ostre []. Dlatego zagadnie- # Wykonano w ramach projektu nr: KBN H0F nie rozpoznawania mowy i formalnego rozróżnienia realizacji patologicznych i normatywnych przy użyciu metod analizy akustycznej jest bardzo istotną kwestią badawczą. Wyniki takich badań mogą dostarczyć więcej danych na temat wymowy poprawnej i pozwolić na określenie cech patologii. Na przykład badania porównawcze przy użyciu metod akustycznych wykazały, że polskie głoski frykatywne sz, ż są retrofleksami a nie przedniojęzykowo-dziąsłowymi jak się powszechnie uważa [2]. W przypadku wymowy patologicznej głosek (zaburzenia paradygmatyczne) przyjmuje się językoznawczą klasyfikację zaburzeń mowy [3]. Zaburzenia paradygmatyczne dzielą się na: () elizje (brak realizacji fonemu), (2) substytucje (realizacja danego fonemu jest zastępowana przez realizację innego fonemu), (3) deformacje. W prezentowanym artykule przedstawiono wyniki badań dotyczące głównie kwestii automatycznej detekcji substytucji. Systemy automatycznego rozpoznawania mowy prawidłowo wykrywające rodzaj podstawionej głoski w mowie patologicznej mogą znacząco zwiększyć efektywność diagnozy oraz terapii logopedycznej u dzieci z wadami wymowy. Jedną z metod automatycznego rozpoznawania mowy zmierzającej do poprawnego diagnozowania substytucji jest rozpoznawanie głosek wypowiadanych przez dzieci w słowach pochodzących z odpowiednio opracowanych kwestionariuszy logopedycznych. Zadanie rozpoznawania w przedstawionej powyżej sytuacji można zatem uprościć zakładając, że dziecko stara się wypowiadać te słowa, które się od niego wymaga. Wówczas zadanie rozpoznawania polega na wykryciu substytucji w znanym słowie, a co za tym idzie w znanym kontekście fonetycznym. Słownik substytuowanych głosek można również z góry przewidzieć z dużym prawdopodobieństwem opierając się na opracowaniach logopedycznych [3]. Zadanie rozpoznawania upraszcza się jeszcze bardziej na etapie terapii logopedycznej. Wówczas znając rodzaj zaburzenia u dziecka można znacząco zawęzić słownik substytucji nawet do 2-3 głosek zwiększając tym samym szansę na poprawne ich rozpoznanie. Niemniej jednak mimo przyjęcia uproszczeń wynikających ze specyfiki zagadnienia przedstawione powyżej zadania rozpoznawania mowy wciąż pozostają problemami trudnymi do rozwiązania.

2 Kluczowym zagadnieniem w zadaniu rozpoznawania substytuowanych głosek jest dobór odpowiednich cech sygnału mowy maksymalizujących możliwość prawidłowej detekcji głoski w słowie. Obecnie do najpowszechniej stosowanych cech sygnału mowy można zaliczyć współczynniki cepstralne CC (Cepstral Coefficients) oraz mel-cepstralne MFCC (Mel-Frequency Cepstral Coefficients) [4], [5], [6]. Jednak skuteczność rozpoznawania za pomocą wspomnianych cech znacząco obniża się wraz ze zwiększaniem się poziomu szumów otoczenia. Jako próba rozwiązania problemu zostały w ostatnich latach zaproponowane współczynniki HFCC (Human-Factor Cepstral Coefficients) [7], [8]. Oczywiście zagadnienie rozpoznawania sygnału mowy w obecności silnych zakłóceń jest od wielu lat intensywnie badane w świecie i istnieje wiele alternatywnych rozwiązań [9], np. ostatnio opisane w [0]. Współczynniki HFCC zostały zastosowane w przeprowadzonych badaniach z powodu ich prostoty obliczeniowej oraz już raportowanej w literaturze skuteczności walki z szumem w przypadku rozpoznawania całych słów [8]. Podobnie jak cechy MFCC są one również oparte na fizjologii mechanizmu słyszenia u człowieka, jednak zawierają pewne modyfikacje zwiększające rozpoznawalność wypowiedzi w warunkach silnego szumu otoczenia. Szerokości filtrów we współczynnikach HFCC są określone znaną zależnością pomiędzy częstotliwością, a fizjologiczną szerokością pasma krytycznego dla tej częstotliwości. Jednak w przeciwieństwie do współczynników MFCC szerokości pasm filtrów nie są zdeterminowane rozmieszczeniem środków filtrów w dziedzinie częstotliwości. Zmieniając szerokość pasma filtrów można znacząco wpływać na poprawę skuteczności rozpoznawania wypowiedzi dla niskiego SNR. Jak dotąd współczynniki HFCC zostały jedynie przebadane w ograniczonym zakresie dla izolowanych słów (cyfr) języka angielskiego [8]. W niniejszym artykule są przedstawione wyniki prac dotyczących rozpoznawania za pomocą cech HFCC wybranych głosek języka polskiego, które zostały wycięte z izolowanych wypowiedzi języka polskiego, dostępnych w popularnej bazie CORPORA []. Do pomiaru odległości pomiędzy sekwencjami wektorów cech (czyli macierzy cech) głosek rozpoznawanych i wzorców użyto prostej lecz efektywnej metody nieliniowej transformacji czasowej (ang. DTW Dynamic Time Warping) [2], [3], [4], [5] oraz prostej miary średniego wektora cech dla całej głoski. W badaniach skorzystano z gotowych kodów programów napisanych w języku Matlab (współczynniki: CC [5], MFCC [6], HFCC [7]), które odpowiednio zmodyfikowano. W pracy zawarto wyniki obszernych badań eksperymentalnych oraz ich dyskusję. Wyciągnięte wnioski dotyczą doboru sposobu oraz optymalnych wartości parametrów metod ekstrakcji cech, w szczególności wykorzystywanych w procesie obliczania współczynników HFCC. 2. Badane rodzaje cech sygnału mowy W badaniach jako cech sygnału mowy wykorzystano trzy rodzaje współczynników cepstralnych: standardowe cepstralne (CC), mel-cepstralne (MFCC) oraz humancepstralne (HFCC), uwarunkowane fizjologicznie. Poniżej skrótowo opisano sposób ich wyznczania. 2.. Współczynniki CC Standardowe współczynniki cepstralne c(n) wyznacza się dla fragmentu sygnału mowy x(n), wyciętego z wykorzystaniem okna czasowego w(n), najczęściej Hamminga, za pomocą sekwencji dwóch transformacji Fouriera (n = 0,, 2,..., q): N N c( n) = ln w( m) x( m) e e N k= m= C( k) j2 π km / N ± j2πkn Są one równe współczynnikom transformaty Fouriera logarytmu naturalnego modułu widma sygnału. Te o niskich indeksach charakteryzują obwiednię modułu widma sygnału mowy, czyli w dużej mierze treść wypowiedzi. Alternatywnie można je wyznaczać metodą liniowej predykcji. W badaniach wykorzystano tę drugą metodę. Jej algorytm, szczegółowo opisany w [5], jest przedstawiony w tabeli. Tab.. Algorytm wyznaczania współczynników CC ) Preemfaza, podział sygnału na poprzesuwane względem siebie, nakładające się fragmenty, tzw. ramki, oraz ich okienkowanie za pomocą okna Hamminga (dalej kolejne kroki identyczne dla każdej ramki). 2) Wyznaczenie funkcji autokorelacji sygnału w ramce: r ( k N ) = x ( n ) x ( n + k ) N p n= p a następnie zbudowanie odpowiedniego wektora r i macierzy R z próbek funkcji autokorelacji: r(0) r() L r( p ) r() r() r(0) L r( p 2) r(2) R =, r = M M O M M r( p ) r( p 2) L r(0) r( p) oraz wyznaczenie wektora współczynników filtra predykcji a na podstawie równania a = R r. 3) Wyznaczenie wektora c współczynników cepstralnych na podstawie a (gdzie p rząd filtra predykcji liniowej, q liczba współczynników cepstralnych): c = a, k k m k m m= k k m c = a + c a, 2 k p k k m k m m= k m c = c a, p + k q oraz jego wersji ważonej za pomocą wag w k cw = c w, k q k k k q πk wk = + sin, k q 2 q

3 2.2. MFCC Współczynniki mel-cepstralne MFCC, które są wzorowane na przetwarzaniu sygnału akustycznego w ślimaku narządu słuchu człowieka, były podczas badań obliczane według algorytmu przedstawionego w tabeli 2, częściowo opisanego w [5] oraz dostępnego w postaci biblioteki języka Matlab [6]. Tab. 2. Algorytm wyznaczania współczynników MFCC ) Preemfaza (filtr cyfrowy o transmitancji H(z)= z ), podział sygnału na poprzesuwane względem siebie, nakładające się fragmenty, tzw. ramki, oraz ich okienkowanie za pomocą okna Hamminga (dalej kolejne kroki identyczne dla każdej ramki). 2) Wykonanie algorytmu szybkiej transformaty Fouriera (FFT) na zokienkowanym sygnale w poszczególnych ramkach. Wyliczenie widma mocy sygnału w każdej z nich. 3) Podział widma mocy za pomocą okna Hamminga na zachodzące na siebie podpasma częstotliwościowe z środkami pasm równomiernie rozłożonymi w skali melowej (patrz rys. ). Przejście ze skali częstotliwościowej na skalę melową jest dane wzorem: ( f / 0) f mel = Hz 4) Obliczenie współczynników widma mocy w podpasmach melowych. 5) Wykonanie transformacji DCT na wektorze współczynników widma mocy (n = 0, 2,..., q-): X ( n) = c( n) c( 0) =, K π (2k + ) K K ln( S k )cos k = 0 2 n 2 c( n) = dla n q K gdzie: S k widmo mocy w k-tym podpaśmie; K liczba podpasm częstotliwościowych; q liczba wyznaczanych współczynników MFCC. 6) Obliczenie aproksymat pierwszej i drugiej pochodnej współczynników MFCC względem czasu, czyli tzw. współczynników delta oraz delta-delta. Sposób aproksymaty tych pochodnych zależał od wartości współczynnika DeltaSize Amplituda Podzial widma mocy na pasma w skali melowej f(mel) Rys.. Podział widma mocy na pasma częstotliwościowe z częstotliwościami środkowymi równomiernie rozłożonymi w skali melowej Jak widać z powyższego algorytmu współczynniki MFCC są wynikiem transformacji kosinusowej, wykonanej na logarytmie widma mocy, zakumulowanego w zadanych przedziałach częstotliwościowych, związanych ze skalą melową HFCC Algorytm wyznaczania współczynników HFCC [7], [8] jest bardzo zbliżony do algorytmu wyznaczania współczynników MFCC. Jedyną ale za to bardzo ważną różnicą jest inna szerokość filtrów, która w tym przypadku nie zależy sztywno od położenia ich częstotliwości środkowych. W metodzie HFCC częstotliwości środkowe f c kolejnych filtrów są położone identycznie jak poprzednio i równo oddalone od siebie w skali melowej, ale szerokość filtrów jest dowolna i równa pasmu ERB (Equivalent Rectangular Bandwidth): 2 c ERB = 6.23 f f Hz przeskalowanemu za pomocą arbitralnie dobieranego współczynnika mnożącego ERBScaleFactor. (f c jest wyrażone w khz). Kiedy przyjmuje on wartości większe od jedności, szerokości filtrów są szersze i obserwuje się lepsze uśrednianie szumu, co z kolei prowadzi do większej odporności metody rozpoznawania, bazującej na HFCC, na zakłócenia. W [8], [7] można znaleźć: szczegółowy opis metody, równania do wyznaczania granic przeskalowanych podpasm oraz implementację metody w języku Matlab. 3. Miary odległości, klasyfikatory W wyniku analizy otrzymuje się dla każdej głoski zbiór wektorów cech, jeden dla każdej ramki danych, które następnie składa się w macierz. Macierz ta opisuje dynamikę zmian parametrów sygnału w mowy w funkcji czasu. Operacja rozpoznawania wypowiedzianej głoski polega na porównaniu otrzymanej macierzy z macierzami wzorców głosek, tzn. znalezieniu w bazie wzorców tej macierzy, która jest najbliższa wyznaczonej macierzy głoski względem przyjętego kryterium (np. najmniejszej odległości, największej liczbie wzorców tego samego typu w zbiorze K najbliższych sąsiadów). W przeprowadzonych eksperymentach wykorzystano i przebadano dwie metody rozpoznawania i klasyfikacji macierzy cech CC, MFCC i HFCC, pochodzących od różnych głosek. Pierwszą z nich była klasyfikacja za pomocą klasycznej metody nieliniowej transformacji czasowej DTW (Dynamic Time Warping) [2][3][4], nieznacznie zmodyfikowana na potrzeby przeprowadzanego eksperymentu (poprzez dobór odpowiednich wartości parametrów). Natomiast druga metoda polegała na uśrednieniu wszystkich wektorów cech głoski, otrzymanych dla kolejnych fragmentów sygnału, i porównywaniu ze sobą wektorów wartości średnich a nie macierzy. W dalszych badaniach jest planowane zastosowanie jako klasyfikatora ukrytych modeli Markowa (Hidden Markov Models). Nieliniowa normalizacja czasowa DTW jest standardową metodą obliczania odległości między przetworzonymi wypowiedziami. Jest ona w sposób przystępny opisana i zaimplementowana w języku Matlab w [5]. Cechuję ją c

4 prostota obliczeniowa oraz dobre właściwości użytkowe, chociaż gorsze od metody HMM. W skrócie jej idea polega na obliczeniu macierzy odległości lokalnych d(m, n), w naszym przypadku euklidesowych, pomiędzy każdym m-tym wektorem cech (CC, MFCC lub HFCC), należącym do rozpoznawanej głoski, w ogólności słowa (s), a każdym n-tym wektorem cech wzorca (w). Następnie metodą programowania dynamicznego jest znajdowana najkrótsza ścieżka w tej macierzy, łącząca lewy, dolny punkt startowy z prawym, górnym punktem końcowym. Najkrótsza to znaczy mająca najmniejszą zakumulowana wartość odległości poszczególnych wektorów cech rozpoznawanego słowa i wzorca wzdłuż drogi przejścia. Wartość ta jest miarą odległości pomiędzy wypowiedziami. Przykładowy kształt macierzy odległości jest przedstawiony na rysunku 2 dla słowa dwa traktowanego równocześnie jako wzorzec. wektorów cech reprezentujących rozpoznawane fonemy oraz wzorce fonemów na trzy równe części: początek, środek i koniec. W każdej z części był obliczany średni wektor cech. Jako miara odległości między odpowiadającymi sobie uśrednionymi wektorami cech była przyjmowana odległość euklidesowa. Rys. 3. Ilustracja poszukiwania w algorytmie DTW najkrótszej (optymalnej) ścieżki przejścia w macierzy odległości lokalnych pomiędzy wektorami cech rozpoznawanej głoski oraz wzorca, ograniczonej przez dwie linie równoległe. 4. Wyniki eksperymentów 4.. Metodologia Rys. 2. Przykładowy kształt macierzy odległości euklidesowych d (n s, n w ) wektorów cepstralnych słowa dwa traktowanego jednocześnie jako rozpoznawane słowo (s) i wzorzec (w) [5] Zakumulowana odległość g(i, j) w każdym punkcie poszukiwanej ścieżki była obliczana zgodnie z poniższym wzorem rekurencyjnym: g( i 2, j ) + d( i, j) g( i, j) = min g( i, j ) + d( i, j) g( i, j 2) + d( i, j) W celu normalizacji otrzymanego wyniku zakumulowana funkcja kosztu przejścia była dzielona przez stałą D: D = N w N S gdzie: N W liczba wektorów cech wzorca, N S liczba wektorów cech rozpoznawanej głoski, w ogólności słowa. Poszukiwana ścieżka była ograniczana przez dwie linie równoległe, wzajemnie przesunięte o stałą Q: Q = round( w max( N S, NW )) gdzie w jest współczynnikiem szerokości równym 0,2 (patrz rys. 3). Niezależnie od zastosowania metody DTW przebadano również możliwość użycia średniego wektora cech. Uśrednione wektory cech były obliczane dzieląc ciągi Badania przeprowadzano w oparciu o fonemy wyekstrahowane z wypowiedzi należących do bazy nagrań dla języka polskiego CORPORA [] (częstotliwość próbkowania równa 6 khz, rozdzielczość 6 bitów). Przebadano następujące grupy polskich głosek: {s, ś, sz}, {c, ć, cz}, { z, ź, ż }, { dz, dź, dż }, {l, r}. Wycięto 6 realizacji tej samej głoski, wypowiadanej w w tym samym słowie przez 6 różnych osób. Wszystkie realizacje uporządkowano w ww. przedstawione grupy. Następnie wybierano jedną z głosek całej grupy i ją rozpoznawano, traktując głoski pozostałe jako wzorce. Głoskę tę zaszumiano, dodając do niej szum gaussowski w taki sposób, aby otrzymać zadaną wartość współczynnika stosunku sygnału do szumu: coef = y( n) = x( n) + coef * s( n) N n= 2 SNR /0 x ( n) N eng ( + 0 ) N SNR /0 2 0 s ( n) n= gdzie: x(n) sygnał o długości N próbek reprezentujący fonem, s(n) biały szum gaussowski, y(n) zaszumiony fonem, coef współczynnik skalujący, zapewniający wymagany stosunek sygnału do szumu (SNR), eng średnia energia przypadająca na próbkę naturalnego szumu otoczenia w nagraniach z bazy CORPORA. Podczas testów każda głoska była zaszumiana razy różnymi realizacjami szumu (jednak tymi sami podczas

5 testowania różnych metod) i rozpoznawana. Do rozpoznawania wykorzystywano macierze cech CC, MFCC oraz HFCC lub jeden wektor uśrednionych cech. W przypadku macierzy wykorzystywano algorytm DTW do wyznaczenia odległości pomiędzy nimi (najkrótsza, zakumulowana droga przejścia w diagramie wszystkich możliwych przejść), natomiast w przypadku wektorów odległość euklidesową. Dysponując miarami odległości pomiędzy rozpoznawaną głoską a wzorcami stosowano różne kryteria wyboru rozwiązania, np. najmniejszą odległość lub największą liczbę wzorców w zbiorze K-najbliższych sąsiadów. W tabeli 3 podano wartości parametrów różnych metod, dla których dokonywano ekstrakcji cech. Dodatkowo stosowano następujące opcje: E dodanie do wektora cech logarytmu energii bloku próbek sygnału (jednej ramki danych), D dodanie do wektora cech współczynników delta, M usunięcie wartości średniej każdego współczynnika cepstralnego po czasie. Tab. 3. Wartości parametrów ekstrakcji cech Parametr Cechy Cepstrum MFCC HFCC Preemfaza z z z - Długość ramki danych 25 ms 25 ms 25 ms Przesunięcie ramki 20 ms 20 ms 20 ms Okno Hamming Hamming Hamming Liczba filtrów - Liczba wsp. cepstralnych DeltaSize - 4, 4, 0 ERBScaleFactor W badaniach zaobserwowano, że dodanie współczynników delta do wektora cech poprawiło skuteczność rozpoznawania w każdej grupie badanych fonemów. Tab. 4. Optymalne kombinacje opcji rozpoznawania fonemów z różnych grup. Grupa fonemów Optymalna kombinacja parametrów { c, ć, cz } HEMD { dz, dź, dż } HD { s, ś, sz } HED { z, ź, ż } HD { l, r } H 4.2. Optymalne wartości cech HFCC Na skuteczność rozpoznawania głosek za pomocą współczynników HFCC wpływa wiele parametrów, co obrazuje rys. 4. Pokazane na nim wykresy przedstawiają zależność skuteczności rozpoznawania od wartości współczynnika SNR sygnału dla grupy głosek {s, ś, sz}. Na rysunku: H oznacza wersję podstawową metody, pozostałe zaś litery jej dodatkowe opcje, omówione w poprzednim podrozdziale. W rezultacie badań okazało się, że każda grupa fonemów charakteryzuje się innymi optymalnymi zestawami opcji testowanego algorytmu. Są one zestawione w tabeli 4. Rys. 5. Spektrogramy głosek {s, ś, sz}, kolejno od góry, dla mówcy AFK z bazy Corpora (256-punktowe FFT, okno Hanna). Skutecznosc rozpoznawania w grupie glosek s, si, sz za pomoca HFCC H HE HM HD HME HED HMD HEMD Rys. 4. Porównanie wyników rozpoznawania grupy głosek {s, ś, sz} dla różnych opcji metody HFCC. Rys. 6. Spektrogramy głosek {z, ź, ż}, kolejno od góry, dla mówcy AFK z bazy Corpora (256-punktowe FFT, okno Hanna).

6 Niezerowe wartości współczynników delta reprezentują zmiany widma w czasie: im moduły tych wartości są większe tym zmiany widma są gwałtowniejsze. Ponadto zauważono, że dla głosek bezdźwięcznych {c, ć, cz} i {s, ś, sz} skuteczność rozpoznawania poprawia dodanie logarytmu enegrii wyliczanej w poszczególnych ramkach sygnału. Natomiast dla dźwięcznych odpowiedników tych głosek dodanie logarytmu energii pogarsza wyniki. Wpływ dodania logarytmu energii na skuteczność rozpoznawania można wyjaśnić na podstawie analizy spektrogramów głosek. Na rys. 5 zostały przedstawione spektrogramy głosek {s, ś, sz} dla jednego mówcy. Wynika z niego, że rozkłady czasowe energii dla poszczególnych głosek różnią się między sobą, dzięki czemu głoski te można pomiędzy sobą rozpoznawać na podstawie tej właściwości. Warto również zauważyć, że na wartość energii w ramce sygnału mają głównie wpływ składowe widma o wyższych częstotliwościach. Na rys. 6 zostały przedstawione spektrogramy głosek {z, ź, ż}, różniące się od głosek {s, ś, sz} jedynie cechą dźwięczności. Cecha dźwięczności powoduje obecność w ich spektrogramach tonu krtaniowego o dużej energii (widocznego jako poziomy ciemny pasek u dołu skali częstotliwościowej spektrogramu), której poziom jest w przybliżeniu jednakowy dla każdej z głosek. Efektem obecności tonu krtaniowego jest osłabienie siły dyskryminacyjnej energii z zakresu wyższych częstotliwości w fonemach {z, ź, ż}. Podobne zależności można dostrzec po analizie spektrogramów dla grup głosek {c, ć, cz} oraz {dz, dź, dż}. Zestawy optymalnych parametrów z Tab. 4 zostały przyjęte jako podstawa do dalszych eksperymentów rozpoznawania w każdej grupie fonemowej. W toku dalszych prac wykonano serię badań zmierzających do dobrania optymalnych wartości parametrów ERBScaleFactor oraz DeltaSize. Wyniki rozpoznawania w oparciu o optymalne parametry rozpoznawania zostały pokazane na rys. 7. postawionego zadania rozpoznawania. Znaczenie parametru ERBScaleFactor zostało omówione w rozdziale 2.3. Parametr DeltaSize mówi o liczbie współczynników filtru opisanego równaniem różnicowym: y ( n) = DeltaSize k = 0 k( x( n + k) x( n k)), Filtry te stosuje się do każdego elementu wektora cech obliczając w ten sposób współczynnik delta. Zestaw współczynników delta dla danego wektora cech stanowi dodatkowe cechy w oparciu o które można rozpoznawać sygnał. Współczynniki delta można obliczać na podstawie każdego rodzaju cech. Dla badanych głosek nie posiadających stacjonarnego charakteru jak { c, ć, cz } oraz {dz, dź, dż} optymalne parametry HFCC wynoszą: ERBScaleFactor = i DeltaSize = 0. Powyższe grupy fonemów różnią się głównie cechą dźwięczności. Dla fonemów, których widmo jest quasi-stacjonarne jak {s, ś, sz} oraz {z, ź, ż}, optymalne wartości parametru ERBScaleFactor is > oraz DeltaSize =. Te grupy fonemów podobnie jak poprzednie różnią się głównie cechą dźwięczności. W przypadku grupy głosek {s, ś, sz} zostały otrzymane różne wartości optymalnych parametrów w zależności od wartości szumu otoczenia Skutecznosc rozpoznawania dla HFCC w grupie glosek s, si, sz srednia skutecznosc rozpoznawania skutecznosc rozpoznawania dla gloski 's' skutecznosc rozpoznawania dla gloski 'si' skutecznosc rozpoznawania dla gloski 'sz 0 Skutecznosc rozpoznawania metoda HFCC dla roznych grup glosek Rys. 8. Porównanie skuteczności rozpoznawania w obrębie grupy głosek {s, ś, sz} metodą HFCC dla optymalnych parametrów rozpoznawania (HED, ERB- ScaleFactor = 5, DeltaSize = ). c, ci, cz; HEMD; ERB=; DS=0 dz, dzi, drz; HD; ERB=; DS=0 s, sz, si; HED; ERB=5; DS=; LN s, sz, si; HED; ERB=2; DS=4; HN z, zi, rz, HD; ERB=3; DS= l, r; H; ERB=4 Rys. 7. Skuteczność rozpoznawania w funkcji stosunku sygnału do szumu dla różnych głosek dla różnych wartości współczynnika ERBScaleFactor oraz DeltaSize. (ERB ERBScaleFactor, DS DeltaSize, LN mały poziom szumu, HN duży poziom szumu) Z rys. 7 wynika, że oprócz optymalnych kombinacji rodzajów cech istnieją również optymalne parametry cech HFCC, które powinno się przyjmować w zależności od Skutecznosc rozpoznawania dla HFCC w grupie glosek c, ci, cz srednia skutecznosc rozpoznawania skutecznosc rozpoznawania gloski 'c' skutecznosc rozpoznawania gloski 'ci' skutecznosc rozpoznawania gloski 'cz' 20 Rys. 9. Porównanie skuteczności rozpoznawania w obrębie grupy głosek {c, ć, cz} metodą HFCC dla optymalnych parametrów rozpoznawania (HEMD, ERB- ScaleFactor =, DeltaSize = 0).

7 20 Skutecznosc rozpoznawania dla HFCC w grupie glosek z, zi, rz srednia skutecznosc rozpoznawania skutecznosc rozoznawania gloski z skutecznosc rozpoznawania gloski zi skutecznosc rozpoznawania gloski rz 0 Rys. 0. Porównanie skuteczności rozpoznawania w obrębie grupy głosek {z, ź, ż} metodą HFCC dla optymalnych parametrów rozpoznawania (HD, ERBScaleFactor = 3, DeltaSize = ). wynika, że najlepiej rozpoznawane są w swoich grupach głoski s oraz c. Natomiast pozostałe głoski są rozpoznawane gorzej. Wyjaśnienie tego faktu można przeprowadzić w oparciu o spektrogramy. Widać z nich, że struktura widmowa głoski s znacząco się różni od struktury widmowej głosek ś oraz sz. Natomiast głoski ś oraz sz mają z reguły bardzo do siebie podobne widma. Podobne zależności występują dla głosek {c, ci, cz}(rys.4). Głoski {z, ź, ż} oraz {s, ś, sz} różnią się między sobą cechą dźwięczności. Poza tym ustawienie artykulatorów jest prawie identyczne. Jak widać dodanie cechy dźwięczności zmieniło hierarchię skuteczności rozpoznawania (rys. 0). Teraz najlepiej rozpoznawaną głoską jest głoska ż. Podobne zależność wystąpiła w grupie {dz, dź, dż} (rys. ). Dość interesująca, ale trudna do wyjaśnienia zależność skuteczności rozpoznawania od SNR sygnału wystąpiła dla grupy głosek {l, r} (rys. 2). Skutecznosc rozpoznawania w grupie glosek dz, dzi, drz dla HFCC srednia skutecznosc rozpoznawania skutecznosc rozpoznawania dla gloski dz skutecznosc rozpoznawania dla gloski dzi skutecznosc rozpoznawania dla gloski drz 55 Rys.. Porównanie skuteczności rozpoznawania w obrębie grupy głosek { dz, dź, dż } metodą HFCC dla optymalnych parametrów rozpoznawania (HD, ERBScale- Factor = 3, DeltaSize = ). Skutecznosc rozpoznawania dla HFCC w grupie glosek l, r Rys. 4. Spektrogramy realizacji głosek {c, ć, cz}. kolejno od góry dla różnych mówców (256-punktowa okno von Hann FFT) srednia skutecznosc rozpoznawania skutecznosc rozpoznawania dla gloski r skutecznosc rozpoznawania dla gloski l Rys. 2. Porównanie skuteczności rozpoznawania w obrębie grupy głosek { r, l } metodą HFCC dla optymalnych parametrów rozpoznawania (H, ERBScale- Factor = 4). Z rysunków 8, 9. Przedstawiających najlepsze wyniki rozpoznawania dla grup głosek {s, ś, sz} oraz {c, ć, cz} 4.3. Porównanie cech CC, MFCC i HFCC Obecnie zostanie przedstawione porównanie skuteczności rozpoznawania na podstawie współczynników CC, MFCC oraz HFCC w obrębie różnych grup głosek. Do celów porównawczych zostały przeprowadzone eksperymenty rozpoznawania przy ustawionych optymalnych parametrach dla każdej z badanych metod ekstrakcji cech. Badania wykazały, że w porównaniu ze standardowymi stosowanymi obecnie parametrami cepstralnymi (CC oraz MFCC) parametry HFCC okazały się dla większości badanych głosek zdecydowanie lepszymi cechami sygnału mowy. Pogorszenie wyników rozpoznawania wystąpiło jedynie w pewnych warunkach dla grup głosek bezdźwięcznych. Dla grupy głosek {c, ć, cz} pogorszenie wystąpiło dla dużych wartości SNR (4 db db) oraz dla głosek {s, ś, sz} dla małych wartości SNR (0 db 8 db). W drugim z przypadków nie stanowi to jednak znaczącej utraty jakości

8 metody w rozważanych zastosowaniach, ponieważ diagnozy i terapii logopedycznej nie przeprowadza się w warunkach silnego szumu otoczenia oraz niskiej skuteczności rozpoznawania technicznego narzędzia diagnostyczno- terapeutycznego. Porownanie skutecznosci rozpoznawania w grupie glosek c, ci, cz dla HFCC, CC i MFCC Porownanie skutecznosci rozpoznawania w grupie glosek z, zi, rz dla HFCC, CC i MFCC HFCC, HD, ERB=3, DS= cepstral coefficients (CC) MFCC Rys. 8. Porównanie skuteczności rozpoznawania dla głosek {z, ź, ż} dla cech CC, MFCC i HFCC. 45 HFCC; HEMD; ERB=; DS=0 CC, DS=0 MFCC, DS=0 Rys. 5. Porównanie skuteczności rozpoznawania dla głosek {c, ć, cz} dla cech CC, MFCC i HFCC. Dla grup głosek dźwięcznych {dz, dź, dż}, {z, ź, ż} oraz {l, r} parametry HFCC wykazują zdecydowaną przewagę w porównaniu z innymi parametrami cepstralnymi. Poprawa skuteczności rozpoznawania waha się dla wspomnianych grup głosek w granicach od ok. 0 % do ok. %. Porownanie skutecznosci rozpoznawania w grupie glosek s, si, sz dla HFCC, CC i MFCC 95 Porownanie skutecznosci rozpoznawania w grupie l, r dla HFCC, CC i MFCC HFCC; HED, ERB=5, DS= HFCC, H, ERB=4 wspolczynniki cepstralne (CC) MFCC, LogEnergy Wspolczynniki cepstralne (CC) MFCC, ED Rys. 6. Porównanie skuteczności rozpoznawania dla głosek {s, ś, sz} dla cech CC, MFCC i HFCC. Rys. 9. Porównanie skuteczności rozpoznawania dla głosek {l, r} dla cech CC, MFCC i HFCC. Porownanie skutecznosci rozpoznawania w grupie glosek dz, dzi, drz dla HFCC, CC i MFCC HFCC, HD; ERB=; DS=0 wspolczynniki cepstralne MFCC, 0-th CC Rys. 7. Porównanie skuteczności rozpoznawania dla głosek {dz, dź, dż} dla cech CC, MFCC i HFCC. Wyjaśnienia uzyskanych rezultatów należałoby upatrywać w najbardziej istotnej właściwości parametrów HFCC, czyli w uniezależnieniu szerokości pasm filtrów od liczby współczynników HFCC Uśrednione wektory cech Ostatnim badanym aspektem rozpoznawania fonemów, był wybór metody klasyfikacji. Ze względu na niewielką liczbę zmian w widmie badanych sygnałów jakimi są głoski wydaje się intuicyjnie uzasadnione stosowanie metod klasyfikacji prostszych niż standardowe metody jakimi są DTW oraz HMM. W związku z powyższym przeprowadzono badania dotyczące rozpoznawania w oparciu o niewielką liczbę uśrednionych wektorów cech. Jednak wyniki badań nie przyniosły oczekiwanej poprawy rezultatów (Rys. 20). Wyniki rozpoznawania dla każdego przypadku grup głosek były gorsze niż te otrzymywane za pomocą metody DTW.

9 skutecznosci rozpoznawania dla metody DTW oraz wektorow srednich dla glosek c, ci, cz DTW 3 wektory srednie poczatkowy wektor sredni srodkowy wektor sredni koncowy wektor sredni Rys. 20. Porównanie skuteczności rozpoznawania dla klasyfikacji metodą DTW oraz klasyfikacji na podstawie uśrednionych wektorów cech. Za pomocą rozpoznawania na podstawie uśrednionych wektorów cech wykryto natomiast pewne zależności czasowe dotyczące rozpoznawania głosek. Okazało się np. że dla grupy głosek {c, ć, cz} najbardziej istotne z punktu widzenia rozpoznawania informacje były zawarte pośrodku głoski, co potwierdza najwyższa dla uśrednionych wektorów cech skuteczność rozpoznawania przy zastosowaniu środkowego wektora cech (rys. 20). 5. Wnioski końcowe Badania wykazały większą skuteczność rozpoznawania za pomocą cech HFCC w porównaniu z cechami MFCC oraz CC. Wyższa skuteczność rozpoznawania HFCC dla zadania rozpoznawania izolowanych słów języka angielskiego w oparciu o metodę HMM była już sygnalizowana w pracy [8]. W obecnej pracy potwierdzono tą zależność dla metody DTW dla wybranych grup fonemów języka polskiego, będących fragmentami ciągłych wypowiedzi. Pozytywne wyniki badań zostaną wykorzystane w trakcie tworzenia logopedycznego programu diagnostyczno-terapeutycznego. Przewiduje się kontynuację badań w następujących kierunkach: Opracowanie metody automatycznego wykrywaniem głosek w wyrazie Zastosowanie metody niejawnych modeli Markowa do klasyfikacji głosek Przeprowadzenie badań z wykorzystaniem innych fizjologicznych (ang. auditory based) cech sygnału mowy. [4] L. R. Rabiner, B. H. Juang, Fundamentals of Speech Recognition, Prentice Hall 993. [5] T. F. Quatieri, Discrete-Time Speech Signal Processing. Principles and Practice. Prentice Hall [6] Joseph W. Picone. Signal modeling techniques in speech recognition. Proceedings of the IEEE, Vol. 8, No. 9, pp , 993. [7] M. D. Skowronski, J. G. Harris: Increased MFCC Filter Bandwidth for Noise-Robust Phoneme Recognition, IEEE Int. Conf. on Acoustics, Speech and Signal Processing, Florida [8] M. D. Skowronski, John G. Harris, Exploiting independent filter band-width of human factor cepstral coefficients in automatic speech recognition, J. Acoust. Soc. Am., 6 (3), pp , Sept [9] D. Dimitrios, P. Vassilis, P. Maragos: Robust Features for Automatic Speech Recognition Systems, in K. Daoudi State of the Art in Speech and Audio Processing, Technical Raport INRIA, 2004, imedia/muscle/ WP5/Docs/WP5_SoA_Task3_sept04.pdf [0] D. Dimitriadis, P. Maragos, A. Potamianos Auditory Teager Energy Cepstrum Coefficients for Robust Speech Recognition, Inerspeech 2005, Lisbona, Sept [] CORPORA Polish Speech Database, CD-ROM. [2] H. Sakoe, S. Chiba, Dynamic Programming Algorithm Optimization for Spoken Word Recognition, IEEE Trans. Acoust., Speech, Signal Processing, vol. ASSP-26, pp , Feb [3] L. R. Rabiner, A. Rosenberg, S. Levinson, Considerations in Dynamic Time Warping Algorithms for Discrete Word Recognition, IEEE Trans. Acoust., Speech, Signal Processing, vol. ASSP- 26, pp , Dec [4] M. H. Kuhn, H. H. Tomaschewski, Improvements in Isolated Word Recognition, IEEE Trans. Acoust., Speech, Signal Processing, vol. ASSP-3, NO., pp , Feb.983. [5] T. Zieliński: Cyfrowe Przetwarzanie Sygnałów. Od Teorii do Zastosowań, WKŁ [6] VoiceBox: Speech Processing Toolbox for Matlab, http: // ml. [7] HFCC Toolbox for Matlab, ~markskow/. Artykuł recenzowany 6. Literatura [] P. Łobacz, Wymowa patologiczna a norma fonetyczna, [w:] Zaburzenia mowy, S. Grabias red., Lublin, Wydawnictwo UMCS 200, pp [2] M. Żygis, Dlaczego polskie sybilanty sz i ż są retrorefleksami?, Logopedia 33, pp. 9-32, Lublin [3] J. T. Kania, Podstawy językoznawczej klasyfikacji zaburzeń mowy, [w:] Szkice logopedyczne, Lublin, Polskie Towarzystwo Logopedyczne 200, pp. -

10

Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści

Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, 2011 Spis treści Przedmowa 11 Rozdział 1. WPROWADZENIE 13 1.1. Czym jest automatyczne rozpoznawanie mowy 13 1.2. Poziomy

Bardziej szczegółowo

Podstawy Przetwarzania Sygnałów

Podstawy Przetwarzania Sygnałów Adam Szulc 188250 grupa: pon TN 17:05 Podstawy Przetwarzania Sygnałów Sprawozdanie 6: Filtracja sygnałów. Filtry FIT o skończonej odpowiedzi impulsowej. 1. Cel ćwiczenia. 1) Przeprowadzenie filtracji trzech

Bardziej szczegółowo

AKUSTYKA MOWY. Podstawy rozpoznawania mowy część I

AKUSTYKA MOWY. Podstawy rozpoznawania mowy część I AKUSTYKA MOWY Podstawy rozpoznawania mowy część I PLAN WYKŁADU Część I Podstawowe pojęcia z dziedziny rozpoznawania mowy Algorytmy, parametry i podejścia do rozpoznawania mowy Przykłady istniejących bibliotek

Bardziej szczegółowo

Zjawisko aliasingu. Filtr antyaliasingowy. Przecieki widma - okna czasowe.

Zjawisko aliasingu. Filtr antyaliasingowy. Przecieki widma - okna czasowe. Katedra Mechaniki i Podstaw Konstrukcji Maszyn POLITECHNIKA OPOLSKA Komputerowe wspomaganie eksperymentu Zjawisko aliasingu.. Przecieki widma - okna czasowe. dr inż. Roland PAWLICZEK Zjawisko aliasingu

Bardziej szczegółowo

ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU

ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU i klasyfikacja sygnału audio dr inż. Jacek Naruniec Sygnał mowy mózg (układ sterujący) głośnia (źródło dźwięku) rezonator akustyczny (filtr) sygnał mowy 2 Sygnał mowy

Bardziej szczegółowo

dr inż. Jacek Naruniec

dr inż. Jacek Naruniec dr inż. Jacek Naruniec Przetwarzanie wstępne Wyznaczenie obszarów zainteresowania Ekstrakcja cech - dźwięk Klasyfikacja detekcja mowy okno analizy spektrogram filtr preemfazy wokodery (formantów, kanałowe,

Bardziej szczegółowo

Omówienie różnych metod rozpoznawania mowy

Omówienie różnych metod rozpoznawania mowy Omówienie różnych metod rozpoznawania mowy Na podstawie artykułu: Comparative study of automatic speech recognition techniques Beniamin Sawicki Wydział Inżynierii Mechanicznej i Robotyki Inżynieria Akustyczna

Bardziej szczegółowo

Ćwiczenie 3,4. Analiza widmowa sygnałów czasowych: sinus, trójkąt, prostokąt, szum biały i szum różowy

Ćwiczenie 3,4. Analiza widmowa sygnałów czasowych: sinus, trójkąt, prostokąt, szum biały i szum różowy Ćwiczenie 3,4. Analiza widmowa sygnałów czasowych: sinus, trójkąt, prostokąt, szum biały i szum różowy Grupa: wtorek 18:3 Tomasz Niedziela I. CZĘŚĆ ĆWICZENIA 1. Cel i przebieg ćwiczenia. Celem ćwiczenia

Bardziej szczegółowo

Automatyczne rozpoznawanie mowy. Autor: mgr inż. Piotr Bratoszewski

Automatyczne rozpoznawanie mowy. Autor: mgr inż. Piotr Bratoszewski Automatyczne rozpoznawanie mowy Autor: mgr inż. Piotr Bratoszewski Rys historyczny 1930-1950 pierwsze systemy Automatycznego rozpoznawania mowy (ang. Automatic Speech Recognition ASR), metody holistyczne;

Bardziej szczegółowo

ROZPOZNAWANIE GRANIC SŁOWA W SYSTEMIE AUTOMATYCZNEGO ROZPOZNAWANIA IZOLOWANYCH SŁÓW

ROZPOZNAWANIE GRANIC SŁOWA W SYSTEMIE AUTOMATYCZNEGO ROZPOZNAWANIA IZOLOWANYCH SŁÓW ROZPOZNAWANIE GRANIC SŁOWA W SYSTEMIE AUTOMATYCZNEGO ROZPOZNAWANIA IZOLOWANYCH SŁÓW Maciej Piasecki, Szymon Zyśko Wydziałowy Zakład Informatyki Politechnika Wrocławska Wybrzeże Stanisława Wyspiańskiego

Bardziej szczegółowo

DYSKRETNA TRANSFORMACJA FOURIERA

DYSKRETNA TRANSFORMACJA FOURIERA Laboratorium Teorii Sygnałów - DFT 1 DYSKRETNA TRANSFORMACJA FOURIERA Cel ćwiczenia Celem ćwiczenia jest przeprowadzenie analizy widmowej sygnałów okresowych za pomocą szybkiego przekształcenie Fouriera

Bardziej szczegółowo

Kompresja dźwięku w standardzie MPEG-1

Kompresja dźwięku w standardzie MPEG-1 mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 7, strona 1. Kompresja dźwięku w standardzie MPEG-1 Ogólne założenia kompresji stratnej Zjawisko maskowania psychoakustycznego Schemat blokowy

Bardziej szczegółowo

ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU

ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU i klasyfikacja sygnału audio dr inż. Jacek Naruniec Sygnał mowy mózg (układ sterujący) głośnia (źródło dźwięku) rezonator akustyczny (filtr) sygnał mowy 2 Sygnał mowy

Bardziej szczegółowo

Komputerowe przetwarzanie sygnału mowy

Komputerowe przetwarzanie sygnału mowy Komputerowe przetwarzanie sygnału mowy Prof dr hab inż Bożena Kostek Katedra Systemów Multimedialnych Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska Komputerowe przetwarzanie sygnału

Bardziej szczegółowo

KATEDRA SYSTEMÓW MULTIMEDIALNYCH. Inteligentne systemy decyzyjne. Ćwiczenie nr 12:

KATEDRA SYSTEMÓW MULTIMEDIALNYCH. Inteligentne systemy decyzyjne. Ćwiczenie nr 12: KATEDRA SYSTEMÓW MULTIMEDIALNYCH Inteligentne systemy decyzyjne Ćwiczenie nr 12: Rozpoznawanie mowy z wykorzystaniem ukrytych modeli Markowa i pakietu HTK Opracowanie: mgr inż. Kuba Łopatka 1. Wprowadzenie

Bardziej szczegółowo

OKREŚLENIE WPŁYWU WYŁĄCZANIA CYLINDRÓW SILNIKA ZI NA ZMIANY SYGNAŁU WIBROAKUSTYCZNEGO SILNIKA

OKREŚLENIE WPŁYWU WYŁĄCZANIA CYLINDRÓW SILNIKA ZI NA ZMIANY SYGNAŁU WIBROAKUSTYCZNEGO SILNIKA ZESZYTY NAUKOWE POLITECHNIKI ŚLĄSKIEJ 2008 Seria: TRANSPORT z. 64 Nr kol. 1803 Rafał SROKA OKREŚLENIE WPŁYWU WYŁĄCZANIA CYLINDRÓW SILNIKA ZI NA ZMIANY SYGNAŁU WIBROAKUSTYCZNEGO SILNIKA Streszczenie. W

Bardziej szczegółowo

Podstawy automatycznego rozpoznawania mowy. Autor: mgr inż. Piotr Bratoszewski

Podstawy automatycznego rozpoznawania mowy. Autor: mgr inż. Piotr Bratoszewski Podstawy automatycznego rozpoznawania mowy Autor: mgr inż. Piotr Bratoszewski Rys historyczny 1930-1950 pierwsze systemy Automatycznego rozpoznawania mowy (ang. Automatic Speech Recognition ASR), metody

Bardziej szczegółowo

Automatyczne tworzenie trójwymiarowego planu pomieszczenia z zastosowaniem metod stereowizyjnych

Automatyczne tworzenie trójwymiarowego planu pomieszczenia z zastosowaniem metod stereowizyjnych Automatyczne tworzenie trójwymiarowego planu pomieszczenia z zastosowaniem metod stereowizyjnych autor: Robert Drab opiekun naukowy: dr inż. Paweł Rotter 1. Wstęp Zagadnienie generowania trójwymiarowego

Bardziej szczegółowo

System do sterowania ruchem kamery przemysłowej za pomocą komend głosowych

System do sterowania ruchem kamery przemysłowej za pomocą komend głosowych System do sterowania ruchem kamery przemysłowej za pomocą komend głosowych Dariusz Krala 1 1 Wydział Inżynierii Mechanicznej i Informatyki Kierunek Informatyka, Rok V {dariusz.krala}@gmail.com Streszczenie

Bardziej szczegółowo

Biometryczna Identyfikacja Tożsamości

Biometryczna Identyfikacja Tożsamości c Adam Czajka, IAiIS PW, wersja: 6 grudnia 2015, 1/39 Adam Czajka Wykład na Wydziale Elektroniki i Technik Informacyjnych Politechniki Warszawskiej Semestr zimowy 2015/16 c Adam Czajka, IAiIS PW, wersja:

Bardziej szczegółowo

PARAMETRYZACJA SYGNAŁU MOWY. PERCEPTUALNE SKALE CZĘSTOTLIWOŚCI.

PARAMETRYZACJA SYGNAŁU MOWY. PERCEPTUALNE SKALE CZĘSTOTLIWOŚCI. 1 PARAMETRYZACJA SYGNAŁU MOWY. PERCEPTUALNE SKALE CZĘSTOTLIWOŚCI. mgr inż. Kuba Łopatka Katedra Systemów Multimedialnych p. 628, tel. 348-6332 PLAN WYKŁADU 1. Potrzeba i istota parametryzacji 2. Klasyfikacja

Bardziej szczegółowo

Przekształcenia sygnałów losowych w układach

Przekształcenia sygnałów losowych w układach INSTYTUT TELEKOMUNIKACJI ZAKŁAD RADIOKOMUNIKACJI Instrukcja laboratoryjna z przedmiotu Sygnały i kodowanie Przekształcenia sygnałów losowych w układach Warszawa 010r. 1. Cel ćwiczenia: Ocena wpływu charakterystyk

Bardziej szczegółowo

Inwersja mowy za pomocą nieliniowej transfomacji czasowej Inversion of speech by non-linear transformation of temporary

Inwersja mowy za pomocą nieliniowej transfomacji czasowej Inversion of speech by non-linear transformation of temporary Robert Wielgat 1 *, Anita Lorenc 2 1 Państwowa Wyższa Szkoła Zawodowa w Tarnowie, Instytut Politechniczny, Zakład Elektroniki i Telekomunikacji State Higher Vocational School in Tarnow, Polytechnic Institute,

Bardziej szczegółowo

Widmo akustyczne radia DAB i FM, porównanie okien czasowych Leszek Gorzelnik

Widmo akustyczne radia DAB i FM, porównanie okien czasowych Leszek Gorzelnik Widmo akustycznych sygnałów dla radia DAB i FM Pomiary widma z wykorzystaniem szybkiej transformacji Fouriera FFT sygnału mierzonego w dziedzinie czasu wykonywane są w skończonym czasie. Inaczej mówiąc

Bardziej szczegółowo

Układy i Systemy Elektromedyczne

Układy i Systemy Elektromedyczne UiSE - laboratorium Układy i Systemy Elektromedyczne Laboratorium 1 Stetoskop elektroniczny parametry sygnałów rejestrowanych. Opracował: dr inż. Jakub Żmigrodzki Zakład Inżynierii Biomedycznej, Instytut

Bardziej szczegółowo

DYSKRETNE PRZEKSZTAŁCENIE FOURIERA C.D.

DYSKRETNE PRZEKSZTAŁCENIE FOURIERA C.D. CPS 6 DYSKRETE PRZEKSZTAŁCEIE FOURIERA C.D. Twierdzenie o przesunięciu Istnieje ważna właściwość DFT, znana jako twierdzenie o przesunięciu. Mówi ono, że: Przesunięcie w czasie okresowego ciągu wejściowego

Bardziej szczegółowo

Laboratorium Przetwarzania Sygnałów Biomedycznych

Laboratorium Przetwarzania Sygnałów Biomedycznych Laboratorium Przetwarzania Sygnałów Biomedycznych Ćwiczenie 3 Analiza sygnału o nieznanej strukturze Opracowali: - prof. nzw. dr hab. inż. Krzysztof Kałużyński - mgr inż. Tomasz Kubik Politechnika Warszawska,

Bardziej szczegółowo

Przygotowała: prof. Bożena Kostek

Przygotowała: prof. Bożena Kostek Przygotowała: prof. Bożena Kostek Ze względu na dużą rozpiętość mierzonych wartości ciśnienia (zakres ciśnień akustycznych obejmuje blisko siedem rzędów wartości: od 2x10 5 Pa do ponad 10 Pa) wygodniej

Bardziej szczegółowo

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania Kodowanie podpasmowe Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania Zasada ogólna Rozkład sygnału źródłowego na części składowe (jak w kodowaniu transformacyjnym) Wada kodowania

Bardziej szczegółowo

LABORATORIUM PODSTAW TELEKOMUNIKACJI

LABORATORIUM PODSTAW TELEKOMUNIKACJI WOJSKOWA AKADEMIA TECHNICZNA im. Jarosława Dąbrowskiego w Warszawie Wydział Elektroniki LABORATORIUM PODSTAW TELEKOMUNIKACJI Grupa Podgrupa Data wykonania ćwiczenia Ćwiczenie prowadził... Skład podgrupy:

Bardziej szczegółowo

Laboratorium Przetwarzania Sygnałów Biomedycznych

Laboratorium Przetwarzania Sygnałów Biomedycznych Laboratorium Przetwarzania Sygnałów Biomedycznych Ćwiczenie 1 Wydobywanie sygnałów z szumu z wykorzystaniem uśredniania Opracowali: - prof. nzw. dr hab. inż. Krzysztof Kałużyński - mgr inż. Tomasz Kubik

Bardziej szczegółowo

Sposoby opisu i modelowania zakłóceń kanałowych

Sposoby opisu i modelowania zakłóceń kanałowych INSTYTUT TELEKOMUNIKACJI ZAKŁAD RADIOKOMUNIKACJI Instrukcja laboratoryjna z przedmiotu Podstawy Telekomunikacji Sposoby opisu i modelowania zakłóceń kanałowych Warszawa 2010r. 1. Cel ćwiczeń: Celem ćwiczeń

Bardziej szczegółowo

Biometryczna Identyfikacja Tożsamości

Biometryczna Identyfikacja Tożsamości Biometryczna Identyfikacja Tożsamości Wykład 9: Rozpoznawanie mówiącego Adam Czajka Wykład na Wydziale Elektroniki i Technik Informacyjnych Politechniki Warszawskiej Semestr letni 2015 c Adam Czajka, IAiIS

Bardziej szczegółowo

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Piotr Dalka Przykładowe algorytmy decyzyjne Sztuczne sieci neuronowe Algorytm k najbliższych sąsiadów Kaskada klasyfikatorów AdaBoost Naiwny

Bardziej szczegółowo

Zaawansowane algorytmy DSP

Zaawansowane algorytmy DSP Zastosowania Procesorów Sygnałowych dr inż. Grzegorz Szwoch greg@multimed.org p. 732 - Katedra Systemów Multimedialnych Zaawansowane algorytmy DSP Wstęp Cztery algorytmy wybrane spośród bardziej zaawansowanych

Bardziej szczegółowo

2. Próbkowanie Sygnały okresowe (16). Trygonometryczny szereg Fouriera (17). Częstotliwość Nyquista (20).

2. Próbkowanie Sygnały okresowe (16). Trygonometryczny szereg Fouriera (17). Częstotliwość Nyquista (20). SPIS TREŚCI ROZDZIAŁ I SYGNAŁY CYFROWE 9 1. Pojęcia wstępne Wiadomości, informacje, dane, sygnały (9). Sygnał jako nośnik informacji (11). Sygnał jako funkcja (12). Sygnał analogowy (13). Sygnał cyfrowy

Bardziej szczegółowo

Algorytmy detekcji częstotliwości podstawowej

Algorytmy detekcji częstotliwości podstawowej Algorytmy detekcji częstotliwości podstawowej Plan Definicja częstotliwości podstawowej Wybór ramki sygnału do analizy Błędy oktawowe i dokładnej estymacji Metody detekcji częstotliwości podstawowej czasowe

Bardziej szczegółowo

CYFROWE PRZETWARZANIE SYGNAŁÓW

CYFROWE PRZETWARZANIE SYGNAŁÓW POLITECHNIKA RZESZOWSKA im. I. Łukasiewicza WYDZIAŁ ELEKTROTECHNIKI I INFORMATYKI Katedra Metrologii i Systemów Diagnostycznych CYFROWE PRZETWARZANIE SYGNAŁÓW Analiza widmowa sygnałów (2) dr inż. Robert

Bardziej szczegółowo

PL B1. Sposób i układ pomiaru całkowitego współczynnika odkształcenia THD sygnałów elektrycznych w systemach zasilających

PL B1. Sposób i układ pomiaru całkowitego współczynnika odkształcenia THD sygnałów elektrycznych w systemach zasilających RZECZPOSPOLITA POLSKA (12) OPIS PATENTOWY (19) PL (11) 210969 (13) B1 (21) Numer zgłoszenia: 383047 (51) Int.Cl. G01R 23/16 (2006.01) G01R 23/20 (2006.01) Urząd Patentowy Rzeczypospolitej Polskiej (22)

Bardziej szczegółowo

Analiza sygnału mowy pod kątem rozpoznania mówcy chorego. Anna Kosiek, Dominik Fert

Analiza sygnału mowy pod kątem rozpoznania mówcy chorego. Anna Kosiek, Dominik Fert Analiza sygnału mowy pod kątem rozpoznania mówcy chorego Anna Kosiek, Dominik Fert Wstęp: Analiza sygnału akustycznego była wykorzystywana w medycynie jeszcze przed wykorzystaniem jej w technice. Sygnał

Bardziej szczegółowo

Analiza obrazów - sprawozdanie nr 2

Analiza obrazów - sprawozdanie nr 2 Analiza obrazów - sprawozdanie nr 2 Filtracja obrazów Filtracja obrazu polega na obliczeniu wartości każdego z punktów obrazu na podstawie punktów z jego otoczenia. Każdy sąsiedni piksel ma wagę, która

Bardziej szczegółowo

9. Dyskretna transformata Fouriera algorytm FFT

9. Dyskretna transformata Fouriera algorytm FFT Transformata Fouriera ma szerokie zastosowanie w analizie i syntezie układów i systemów elektronicznych, gdyż pozwala na połączenie dwóch sposobów przedstawiania sygnałów reprezentacji w dziedzinie czasu

Bardziej szczegółowo

Ćwiczenie 11. Podstawy akwizycji i cyfrowego przetwarzania sygnałów. Program ćwiczenia:

Ćwiczenie 11. Podstawy akwizycji i cyfrowego przetwarzania sygnałów. Program ćwiczenia: Ćwiczenie 11 Podstawy akwizycji i cyfrowego przetwarzania sygnałów Program ćwiczenia: 1. Konfiguracja karty pomiarowej oraz obserwacja sygnału i jego widma 2. Twierdzenie o próbkowaniu obserwacja dwóch

Bardziej szczegółowo

LABORATORIUM AKUSTYKI MUZYCZNEJ. Ćw. nr 12. Analiza falkowa dźwięków instrumentów muzycznych. 1. PODSTAWY TEORETYCZNE ANALIZY FALKOWEJ.

LABORATORIUM AKUSTYKI MUZYCZNEJ. Ćw. nr 12. Analiza falkowa dźwięków instrumentów muzycznych. 1. PODSTAWY TEORETYCZNE ANALIZY FALKOWEJ. LABORATORIUM AKUSTYKI MUZYCZNEJ. Ćw. nr 1. Analiza falkowa dźwięków instrumentów muzycznych. 1. PODSTAWY TEORETYCZNE ANALIZY FALKOWEJ. Transformacja falkowa (ang. wavelet falka) przeznaczona jest do analizy

Bardziej szczegółowo

Pattern Classification

Pattern Classification Pattern Classification All materials in these slides were taken from Pattern Classification (2nd ed) by R. O. Duda, P. E. Hart and D. G. Stork, John Wiley & Sons, 2000 with the permission of the authors

Bardziej szczegółowo

Metody systemowe i decyzyjne w informatyce

Metody systemowe i decyzyjne w informatyce Metody systemowe i decyzyjne w informatyce Laboratorium JAVA Zadanie nr 2 Rozpoznawanie liter autorzy: A. Gonczarek, J.M. Tomczak Cel zadania Celem zadania jest zapoznanie się z problemem klasyfikacji

Bardziej szczegółowo

Ćwiczenie 4. Filtry o skończonej odpowiedzi impulsowej (SOI)

Ćwiczenie 4. Filtry o skończonej odpowiedzi impulsowej (SOI) Politechnika Wrocławska Wydział Elektroniki Mikrosystemów i Fotoniki Przetwarzanie sygnałów laboratorium ETD5067L Ćwiczenie 4. Filtry o skończonej odpowiedzi impulsowej (SOI) 1. Filtracja cyfrowa podstawowe

Bardziej szczegółowo

8. Realizacja projektowanie i pomiary filtrów IIR

8. Realizacja projektowanie i pomiary filtrów IIR 53 8. Realizacja projektowanie i pomiary filtrów IIR Cele ćwiczenia Realizacja na zestawie TMX320C5515 ezdsp prostych liniowych filtrów cyfrowych. Pomiary charakterystyk amplitudowych zrealizowanych filtrów

Bardziej szczegółowo

x(n) x(n-1) x(n-2) D x(n-n+1) h N-1

x(n) x(n-1) x(n-2) D x(n-n+1) h N-1 Laboratorium Układy dyskretne LTI projektowanie filtrów typu FIR Z1. apisać funkcję y = filtruj(x, h), która wyznacza sygnał y będący wynikiem filtracji sygnału x przez filtr FIR o odpowiedzi impulsowej

Bardziej szczegółowo

Transformata Fouriera

Transformata Fouriera Transformata Fouriera Program wykładu 1. Wprowadzenie teoretyczne 2. Algorytm FFT 3. Zastosowanie analizy Fouriera 4. Przykłady programów Wprowadzenie teoretyczne Zespolona transformata Fouriera Jeżeli

Bardziej szczegółowo

III. Przebieg ćwiczenia. 1. Generowanie i wizualizacja przebiegów oraz wyznaczanie ich podstawowych parametrów

III. Przebieg ćwiczenia. 1. Generowanie i wizualizacja przebiegów oraz wyznaczanie ich podstawowych parametrów POLITECHNIKA RZESZOWSKA KATEDRA METROLOGII I SYSTEMÓW DIAGNOSTYCZNYCH LABORATORIUM GRAFICZNE ŚRODOWISKA PROGRAMOWANIA S.P. WPROWADZENIE DO UŻYTKOWANIA ŚRODOWISKA VEE (1) I. Cel ćwiczenia Celem ćwiczenia

Bardziej szczegółowo

Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej

Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej Politechnika Białostocka Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej Instrukcja do zajęć laboratoryjnych z przedmiotu: Przetwarzanie Sygnałów Kod: TS1A400027 Temat ćwiczenia:

Bardziej szczegółowo

PROGRAMOWANIE DYNAMICZNE W ROZMYTYM OTOCZENIU DO STEROWANIA STATKIEM

PROGRAMOWANIE DYNAMICZNE W ROZMYTYM OTOCZENIU DO STEROWANIA STATKIEM Mostefa Mohamed-Seghir Akademia Morska w Gdyni PROGRAMOWANIE DYNAMICZNE W ROZMYTYM OTOCZENIU DO STEROWANIA STATKIEM W artykule przedstawiono propozycję zastosowania programowania dynamicznego do rozwiązywania

Bardziej szczegółowo

Ćwiczenie 3. Właściwości przekształcenia Fouriera

Ćwiczenie 3. Właściwości przekształcenia Fouriera Politechnika Wrocławska Wydział Elektroniki Mikrosystemów i Fotoniki Przetwarzanie sygnałów laboratorium ETD5067L Ćwiczenie 3. Właściwości przekształcenia Fouriera 1. Podstawowe właściwości przekształcenia

Bardziej szczegółowo

CYFROWE PRZTWARZANIE SYGNAŁÓW (Zastosowanie transformacji Fouriera)

CYFROWE PRZTWARZANIE SYGNAŁÓW (Zastosowanie transformacji Fouriera) I. Wprowadzenie do ćwiczenia CYFROWE PRZTWARZANIE SYGNAŁÓW (Zastosowanie transformacji Fouriera) Ogólnie termin przetwarzanie sygnałów odnosi się do nauki analizowania zmiennych w czasie procesów fizycznych.

Bardziej szczegółowo

8. Analiza widmowa metodą szybkiej transformaty Fouriera (FFT)

8. Analiza widmowa metodą szybkiej transformaty Fouriera (FFT) 8. Analiza widmowa metodą szybkiej transformaty Fouriera (FFT) Ćwiczenie polega na wykonaniu analizy widmowej zadanych sygnałów metodą FFT, a następnie określeniu amplitud i częstotliwości głównych składowych

Bardziej szczegółowo

IMPLEMENTATION OF THE SPECTRUM ANALYZER ON MICROCONTROLLER WITH ARM7 CORE IMPLEMENTACJA ANALIZATORA WIDMA NA MIKROKONTROLERZE Z RDZENIEM ARM7

IMPLEMENTATION OF THE SPECTRUM ANALYZER ON MICROCONTROLLER WITH ARM7 CORE IMPLEMENTACJA ANALIZATORA WIDMA NA MIKROKONTROLERZE Z RDZENIEM ARM7 Łukasz Deńca V rok Koło Techniki Cyfrowej dr inż. Wojciech Mysiński opiekun naukowy IMPLEMENTATION OF THE SPECTRUM ANALYZER ON MICROCONTROLLER WITH ARM7 CORE IMPLEMENTACJA ANALIZATORA WIDMA NA MIKROKONTROLERZE

Bardziej szczegółowo

Efekt Lombarda. Czym jest efekt Lombarda?

Efekt Lombarda. Czym jest efekt Lombarda? Efekt Lombarda Na podstawie raportu Priscilli Lau z roku 2008 na Uniwersytecie w Berkeley wykonanego na podstawie badań w laboratorium Fonologii. Autor prezentacji: Antoni Lis Efekt Lombarda Czym jest

Bardziej szczegółowo

Ćwiczenie 6 Projektowanie filtrów cyfrowych o skończonej i nieskończonej odpowiedzi impulsowej

Ćwiczenie 6 Projektowanie filtrów cyfrowych o skończonej i nieskończonej odpowiedzi impulsowej Ćwiczenie 6 Projektowanie filtrów cyfrowych o skończonej i nieskończonej odpowiedzi impulsowej. Filtry FIR o skończonej odpowiedzi impulsowej (SOI) Filtracja FIR polega na tym, że sygnał wyjściowy powstaje

Bardziej szczegółowo

Twierdzenie o splocie

Twierdzenie o splocie Twierdzenie o splocie g(t) = (s h) (t) G(f ) = S(f ) H(f ) (1) To twierdzenie działa też w drugą stronę: G(f ) = (S H) (f ) g(t) = s(t) h(t) (2) Zastosowania: zamiana splotu na mnożenie daje wgląd w okienkowanie

Bardziej szczegółowo

4 Zasoby językowe Korpusy obcojęzyczne Korpusy języka polskiego Słowniki Sposoby gromadzenia danych...

4 Zasoby językowe Korpusy obcojęzyczne Korpusy języka polskiego Słowniki Sposoby gromadzenia danych... Spis treści 1 Wstęp 11 1.1 Do kogo adresowana jest ta książka... 12 1.2 Historia badań nad mową i językiem... 12 1.3 Obecne główne trendy badań... 16 1.4 Opis zawartości rozdziałów... 18 2 Wyzwania i możliwe

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

KOMPUTEROWE TECHNIKI ANALIZY INFORMACJI ZAWARTEJ W SYGNAŁACH AKUSTYCZNYCH MASZYN ELEKTRYCZNYCH DLA CELÓW DIAGNOSTYKI STANÓW PRZEDAWARYJNYCH

KOMPUTEROWE TECHNIKI ANALIZY INFORMACJI ZAWARTEJ W SYGNAŁACH AKUSTYCZNYCH MASZYN ELEKTRYCZNYCH DLA CELÓW DIAGNOSTYKI STANÓW PRZEDAWARYJNYCH 1. Praca Adam Głowacz z roku 2013 str. 1-4 2. Praca Witold Głowacz z roku 2017 str. 1-4 AKADEMIA GÓRNICZO-HUTNICZA IM. STANISŁAWA STASZICA W KRAKOWIE AKADEMIA GÓRNICZO-HUTNICZA IM. STANISŁAWA STASZICA

Bardziej szczegółowo

Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej

Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej Politechnika Białostocka Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej Instrukcja do zajęć laboratoryjnych z przedmiotu: Przetwarzanie Sygnałów Kod: TS1C400027 Temat ćwiczenia:

Bardziej szczegółowo

Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej

Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej Politechnika Białostocka Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej Instrukcja do zajęć laboratoryjnych z przedmiotu: Przetwarzanie Sygnałów Kod: TS1A400027 Temat ćwiczenia:

Bardziej szczegółowo

Aproksymacja funkcji a regresja symboliczna

Aproksymacja funkcji a regresja symboliczna Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą

Bardziej szczegółowo

Rozpoznawanie i synteza mowy w systemach multimedialnych. Analiza i synteza mowy - wprowadzenie. Spektrogram wyrażenia: computer speech

Rozpoznawanie i synteza mowy w systemach multimedialnych. Analiza i synteza mowy - wprowadzenie. Spektrogram wyrażenia: computer speech Slajd 1 Analiza i synteza mowy - wprowadzenie Spektrogram wyrażenia: computer speech Slide 1 Slajd 2 Analiza i synteza mowy - wprowadzenie Slide 2 Slajd 3 Analiza i synteza mowy - wprowadzenie Slide 3

Bardziej szczegółowo

TWORZENIE MODELU AKUSTYCZNEGO NA POTRZEBY WERYFIKACJI MÓWCY PRZY UŻYCIU UKRYTYCH MODELI MARKOWA

TWORZENIE MODELU AKUSTYCZNEGO NA POTRZEBY WERYFIKACJI MÓWCY PRZY UŻYCIU UKRYTYCH MODELI MARKOWA MODELOWANIE INŻYNIERSKIE ISSN 1896-771X 40, s. 249-256, Gliwice 2010 TWORZENIE MODELU AKUSTYCZNEGO NA POTRZEBY WERYFIKACJI MÓWCY PRZY UŻYCIU UKRYTYCH MODELI MARKOWA IWONA WANAT MAREK IWANIEC Katedra Automatyzacji

Bardziej szczegółowo

POMIARY WYBRANYCH PARAMETRÓW TORU FONICZNEGO W PROCESORACH AUDIO

POMIARY WYBRANYCH PARAMETRÓW TORU FONICZNEGO W PROCESORACH AUDIO Politechnika Rzeszowska Katedra Metrologii i Systemów Diagnostycznych Laboratorium Elektroniczne przyrządy i techniki pomiarowe POMIARY WYBRANYCH PARAMETRÓW TORU FONICZNEGO W PROCESORACH AUDIO Grupa Nr

Bardziej szczegółowo

Diagnostyka silnika synchronicznego oparta na analizie sygnałów akustycznych z zastosowaniem MFCC i klasyfikatora rozmytego

Diagnostyka silnika synchronicznego oparta na analizie sygnałów akustycznych z zastosowaniem MFCC i klasyfikatora rozmytego mgr inż. ADAM GŁOWACZ Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki Akademia Górniczo-Hutnicza w Krakowie Diagnostyka silnika synchronicznego oparta na analizie sygnałów akustycznych z

Bardziej szczegółowo

PL B BUP 16/04. Kleczkowski Piotr,Kraków,PL WUP 04/09

PL B BUP 16/04. Kleczkowski Piotr,Kraków,PL WUP 04/09 RZECZPOSPOLITA POLSKA (12) OPIS PATENTOWY (19) PL (11) 201536 (13) B1 (21) Numer zgłoszenia: 358531 (51) Int.Cl. G10L 21/02 (2006.01) H03G 3/00 (2006.01) Urząd Patentowy Rzeczypospolitej Polskiej (22)

Bardziej szczegółowo

PRACA DYPLOMOWA INŻYNIERSKA

PRACA DYPLOMOWA INŻYNIERSKA AKADEMIA GÓRNICZO-HUTNICZA IM. STANISŁAWA STASZICA W KRAKOWIE Wydział Informatyki, Elektroniki i Telekomunikacji Katedra Elektroniki PRACA DYPLOMOWA INŻYNIERSKA Temat: Adaptacyjny system redukcji szumu

Bardziej szczegółowo

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska. SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia

Bardziej szczegółowo

Ze względu na dużą rozpiętość mierzonych wartości ciśnienia (zakres ciśnień akustycznych obejmuje blisko siedem rzędów wartości: od 2x10 5 Pa do

Ze względu na dużą rozpiętość mierzonych wartości ciśnienia (zakres ciśnień akustycznych obejmuje blisko siedem rzędów wartości: od 2x10 5 Pa do Ze względu na dużą rozpiętość mierzonych wartości ciśnienia (zakres ciśnień akustycznych obejmuje blisko siedem rzędów wartości: od 2x10 5 Pa do ponad 10 Pa) wygodniej jest mierzone ciśnienie akustyczne

Bardziej szczegółowo

Przetwarzanie sygnałów

Przetwarzanie sygnałów Przetwarzanie sygnałów Ćwiczenie 5 Filtry o nieskończonej odpowiedzi impulsowej (NOI) Spis treści 1 Wprowadzenie 1 1.1 Filtry jednobiegunowe....................... 1 1.2 Filtry wąskopasmowe........................

Bardziej szczegółowo

Laboratorium Optyki Falowej

Laboratorium Optyki Falowej Marzec 2019 Laboratorium Optyki Falowej Instrukcja do ćwiczenia pt: Filtracja optyczna Opracował: dr hab. Jan Masajada Tematyka (Zagadnienia, które należy znać przed wykonaniem ćwiczenia): 1. Obraz fourierowski

Bardziej szczegółowo

Analiza szeregów czasowych: 2. Splot. Widmo mocy.

Analiza szeregów czasowych: 2. Splot. Widmo mocy. Analiza szeregów czasowych: 2. Splot. Widmo mocy. P. F. Góra http://th-www.if.uj.edu.pl/zfs/gora/ semestr letni 2007/08 Splot Jedna z najważniejszych własności transformaty Fouriera jest to, że transformata

Bardziej szczegółowo

Porównanie szeregów czasowych z wykorzystaniem algorytmu DTW

Porównanie szeregów czasowych z wykorzystaniem algorytmu DTW Zlot użytkowników R Porównanie szeregów czasowych z wykorzystaniem algorytmu DTW Paweł Teisseyre Instytut Podstaw Informatyki, Polska Akademia Nauk 21 września 2010 Miary podobieństwa między szeregami

Bardziej szczegółowo

METODY ROZWIĄZYWANIA RÓWNAŃ NIELINIOWYCH

METODY ROZWIĄZYWANIA RÓWNAŃ NIELINIOWYCH METODY ROZWIĄZYWANIA RÓWNAŃ NIELINIOWYCH Jednym z zastosowań metod numerycznych jest wyznaczenie pierwiastka lub pierwiastków równania nieliniowego. W tym celu stosuje się szereg metod obliczeniowych np:

Bardziej szczegółowo

Politechnika Wrocławska Wydział Elektroniki Mikrosystemów i Fotoniki Przetwarzanie sygnałów laboratorium ETD5067L

Politechnika Wrocławska Wydział Elektroniki Mikrosystemów i Fotoniki Przetwarzanie sygnałów laboratorium ETD5067L Politechnika Wrocławska Wydział Elektroniki Mikrosystemów i Fotoniki Przetwarzanie sygnałów laboratorium ETD5067L Ćwiczenie 4. Filtry o skończonej odpowiedzi impulsowej (SOI) 1. Filtracja cyfrowa podstawowe

Bardziej szczegółowo

CYFROWE PRZETWARZANIE SYGNAŁÓW

CYFROWE PRZETWARZANIE SYGNAŁÓW POLITECHNIKA RZESZOWSKA im. I. Łukasiewicza WYDZIAŁ ELEKTROTECHNIKI I INFORMATYKI Katedra Metrologii i Systemów Diagnostycznych CYFROWE PRZETWARZANIE SYGNAŁÓW Analiza korelacyjna sygnałów dr hab. inż.

Bardziej szczegółowo

ĆWICZENIE nr 3. Badanie podstawowych parametrów metrologicznych przetworników analogowo-cyfrowych

ĆWICZENIE nr 3. Badanie podstawowych parametrów metrologicznych przetworników analogowo-cyfrowych Politechnika Łódzka Katedra Przyrządów Półprzewodnikowych i Optoelektronicznych WWW.DSOD.PL LABORATORIUM METROLOGII ELEKTRONICZNEJ ĆWICZENIE nr 3 Badanie podstawowych parametrów metrologicznych przetworników

Bardziej szczegółowo

Metoda określania pozycji wodnicy statków na podstawie pomiarów odległości statku od głowic laserowych

Metoda określania pozycji wodnicy statków na podstawie pomiarów odległości statku od głowic laserowych inż. Marek Duczkowski Metoda określania pozycji wodnicy statków na podstawie pomiarów odległości statku od głowic laserowych słowa kluczowe: algorytm gradientowy, optymalizacja, określanie wodnicy W artykule

Bardziej szczegółowo

Kwantowanie sygnałów analogowych na przykładzie sygnału mowy

Kwantowanie sygnałów analogowych na przykładzie sygnału mowy Kwantowanie sygnałów analogowych na przykładzie sygnału mowy Treść wykładu: Sygnał mowy i jego właściwości Kwantowanie skalarne: kwantyzator równomierny, nierównomierny, adaptacyjny Zastosowanie w koderze

Bardziej szczegółowo

ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU

ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU obraz dr inż. Jacek Naruniec Analiza Składowych Niezależnych (ICA) Independent Component Analysis Dąży do wyznaczenia zmiennych niezależnych z obserwacji Problem opiera

Bardziej szczegółowo

PRZETWARZANIE MOWY W CZASIE RZECZYWISTYM

PRZETWARZANIE MOWY W CZASIE RZECZYWISTYM PRZETWARZANIE MOWY W CZASIE RZECZYWISTYM Akustyka mowy opracowanie: M. Kaniewska, A. Kupryjanow, K. Łopatka PLAN WYKŁADU Zasada przetwarzania sygnału w czasie rzeczywistym Algorytmy zmiany czasu trwania

Bardziej szczegółowo

Metody analizy zapisu EEG. Piotr Walerjan

Metody analizy zapisu EEG. Piotr Walerjan Metody analizy zapisu EEG Piotr Walerjan Metody automatyczne i semiautomatyczne w EEG automatyczna detekcja (i zliczanie) zdarzeń wykrywanie wyładowań, napadów tworzenie hipnogramów analizy widmowe, wykresy

Bardziej szczegółowo

Technika audio część 2

Technika audio część 2 Technika audio część 2 Wykład 12 Projektowanie cyfrowych układów elektronicznych Mgr inż. Łukasz Kirchner lukasz.kirchner@cs.put.poznan.pl http://www.cs.put.poznan.pl/lkirchner Wprowadzenie do filtracji

Bardziej szczegółowo

POMIAR CZĘSTOTLIWOŚCI NAPIĘCIA W URZĄDZENIACH AUTOMATYKI ELEKTROENERGETYCZNEJ

POMIAR CZĘSTOTLIWOŚCI NAPIĘCIA W URZĄDZENIACH AUTOMATYKI ELEKTROENERGETYCZNEJ Prace Naukowe Instytutu Maszyn, Napędów i Pomiarów Elektrycznych Nr 63 Politechniki Wrocławskiej Nr 63 Studia i Materiały Nr 9 9 Piotr NIKLAS* pomiar częstotliwości, składowe harmoniczne, automatyka elektroenergetyczna

Bardziej szczegółowo

ĆWICZENIE III ANALIZA WIDMOWA SYGNAŁÓW DYSKRETNYCH. ver.3

ĆWICZENIE III ANALIZA WIDMOWA SYGNAŁÓW DYSKRETNYCH. ver.3 1 Zakład Elektrotechniki Teoretycznej ver.3 ĆWICZEIE III AALIZA WIDMOWA SYGAŁÓW DYSKRETYCH (00) Celem ćwiczenia jest przeprowadzenie analizy widmowej dyskretnych sygnałów okresowych przy zastosowaniu szybkiego

Bardziej szczegółowo

Promotor: dr Marek Pawełczyk. Marcin Picz

Promotor: dr Marek Pawełczyk. Marcin Picz Promotor: dr Marek Pawełczyk Marcin Picz Stosowane metody: - Grupa metod odejmowania widm (subtractive( subtractive-typetype algorithms); - Filtracja Wienera; - Neural networks & Fuzzy logic (sieci neuronowe

Bardziej szczegółowo

f = 2 śr MODULACJE

f = 2 śr MODULACJE 5. MODULACJE 5.1. Wstęp Modulacja polega na odzwierciedleniu przebiegu sygnału oryginalnego przez zmianę jednego z parametrów fali nośnej. Przyczyny stosowania modulacji: 1. Umożliwienie wydajnego wypromieniowania

Bardziej szczegółowo

Egzamin / zaliczenie na ocenę*

Egzamin / zaliczenie na ocenę* WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI Zał. nr 4 do ZW 33/01 KARTA PRZEDMIOTU Nazwa w języku polskim CYFROWE PRZETWARZANIE SYGNAŁÓW Nazwa w języku angielskim DIGITAL SIGNAL PROCESSING Kierunek studiów

Bardziej szczegółowo

Dynamiczne badanie wzmacniacza operacyjnego- ćwiczenie 8

Dynamiczne badanie wzmacniacza operacyjnego- ćwiczenie 8 Dynamiczne badanie wzmacniacza operacyjnego- ćwiczenie 8 1. Cel ćwiczenia Celem ćwiczenia jest dynamiczne badanie wzmacniacza operacyjnego, oraz zapoznanie się z metodami wyznaczania charakterystyk częstotliwościowych.

Bardziej szczegółowo

Laboratorium nr 4: Porównanie filtrów FIR i IIR. skończonej odpowiedzi impulsowej (FIR) zawsze stabilne, mogą mieć liniową charakterystykę fazową

Laboratorium nr 4: Porównanie filtrów FIR i IIR. skończonej odpowiedzi impulsowej (FIR) zawsze stabilne, mogą mieć liniową charakterystykę fazową Teoria Sygnałów sprawozdanie z zajęć laboratoryjnych Zajęcia z dnia 07.01.2009 Prowadzący: dr inż. Stanisław Nuckowski Sprawozdanie wykonał: Tomasz Witka Laboratorium nr 4: Porównanie filtrów FIR i IIR

Bardziej szczegółowo

Układy i Systemy Elektromedyczne

Układy i Systemy Elektromedyczne UiSE - laboratorium Układy i Systemy Elektromedyczne Laboratorium 5 Elektroniczny stetoskop - moduł TMDXMDKDS3254. Opracował: dr inż. Jakub Żmigrodzki Zakład Inżynierii Biomedycznej, Instytut Metrologii

Bardziej szczegółowo

Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej

Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej Politechnika Białostocka Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej Instrukcja do zajęć laboratoryjnych z przedmiotu: Przetwarzanie Sygnałów Kod: TS1A400027 Temat ćwiczenia:

Bardziej szczegółowo

Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j

Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j Kompresja transformacyjna. Opis standardu JPEG. Algorytm JPEG powstał w wyniku prac prowadzonych przez grupę ekspertów (ang. Joint Photographic Expert Group). Prace te zakończyły się w 1991 roku, kiedy

Bardziej szczegółowo

SYSTEM BIOMETRYCZNY IDENTYFIKUJĄCY OSOBY NA PODSTAWIE CECH OSOBNICZYCH TWARZY. Autorzy: M. Lewicka, K. Stańczyk

SYSTEM BIOMETRYCZNY IDENTYFIKUJĄCY OSOBY NA PODSTAWIE CECH OSOBNICZYCH TWARZY. Autorzy: M. Lewicka, K. Stańczyk SYSTEM BIOMETRYCZNY IDENTYFIKUJĄCY OSOBY NA PODSTAWIE CECH OSOBNICZYCH TWARZY Autorzy: M. Lewicka, K. Stańczyk Kraków 2008 Cel pracy projekt i implementacja systemu rozpoznawania twarzy, który na podstawie

Bardziej szczegółowo

uzyskany w wyniku próbkowania okresowego przebiegu czasowego x(t) ze stałym czasem próbkowania t takim, że T = t N 1 t

uzyskany w wyniku próbkowania okresowego przebiegu czasowego x(t) ze stałym czasem próbkowania t takim, że T = t N 1 t 4. 1 3. " P r ze c ie k " w idm ow y 1 0 2 4.13. "PRZECIEK" WIDMOWY Rozważmy szereg czasowy {x r } dla r = 0, 1,..., N 1 uzyskany w wyniku próbkowania okresowego przebiegu czasowego x(t) ze stałym czasem

Bardziej szczegółowo