Zastosowanie metod grupowania sekwencji czasowych w rozpoznawaniu mowy na podstawie ukrytych modeli Markowa



Podobne dokumenty
OKRES ZWROTU JAKO JEDNA Z METOD OCENY OPŁACALNOŚCI PRZEDSIĘWZIĘĆ INWESTYCYJNYCH

Metody dokładne w zastosowaniu do rozwiązywania łańcuchów Markowa

PRZEKŁADNIE FALOWE. 1. Wstęp. (W. Ostapski)

SZACOWANIE NIEPEWNOŚCI POMIARU METODĄ PROPAGACJI ROZKŁADÓW

WikiWS For Business Sharks

Tomasz Grębski. Liczby zespolone

Analiza danych OGÓLNY SCHEMAT. Dane treningowe (znana decyzja) Klasyfikator. Dane testowe (znana decyzja)

Algebra WYKŁAD 2 ALGEBRA 1

ALGEBRA rok akademicki

TWIERDZENIA O WZAJEMNOŚCIACH

Proces narodzin i śmierci

Opisy efektów kształcenia dla modułu

Grupa obrotów. - grupa symetrii kuli, R - wszystkie możliwe obroty o dowolne kąty wokół osi przechodzących przez środek kuli

W takim modelu prawdopodobieństwo konfiguracji OR wynosi. 0, 21 lub , 79. 6

Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści

A = {dostęp do konta} = {{właściwe hasło,h 2, h 3 }} = 0, (10 4 )! 2!(10 4 3)! 3!(104 3)!

( ) Elementy rachunku prawdopodobieństwa. f( x) 1 F (x) f(x) - gęstość rozkładu prawdopodobieństwa X f( x) - dystrybuanta rozkładu.

Informacje uzupełniające: Wyboczenie z płaszczyzny układu w ramach portalowych. Spis treści

Transformator Φ M. uzwojenia; siła elektromotoryczna indukowana w i-tym zwoju: dφ. = z1, z2 liczba zwojów uzwojenia pierwotnego i wtórnego.

Metoda weryfikacji mówcy na podstawie nieuzgodnionej wypowiedzi

Wielokryteriowa optymalizacja liniowa (WPL)

Edycja pierwsza 2014/1015. dla kierunku fizyka medyczna, I rok, studia magisterskie

Weryfikacja hipotez dla wielu populacji

KATEDRA SYSTEMÓW MULTIMEDIALNYCH. Inteligentne systemy decyzyjne. Ćwiczenie nr 12:

Wielokategorialne systemy uczące się i ich zastosowanie w bioinformatyce. Rafał Grodzicki

Badanie współzależności dwóch cech ilościowych X i Y. Analiza korelacji prostej

Rynek szkoleniowy w województwie kujawskopomorskim. badań

gdzie: L( G ++ )- współczynnik złożoności struktury , -i-ty węzeł, = - stopień rozgałęzienia i-tego węzła,

WPŁYW PARAMETRÓW DYSKRETYZACJI NA NIEPEWNOŚĆ WYNIKÓW POMIARU OBIEKTÓW OBRAZU CYFROWEGO

Optymalizacja (w matematyce) termin optymalizacja odnosi się do problemu znalezienia ekstremum (minimum lub maksimum) zadanej funkcji celu.

UZĘBIENIA CZOŁOWE O ŁUKOWO KOŁOWEJ LINII ZĘBÓW KSZTAŁTOWANE NARZĘDZIEM JEDNOOSTRZOWYM

ORGANIZACJA I ZARZĄDZANIE

Algebra WYKŁAD 1 ALGEBRA 1

D Archiwum Prac Dyplomowych - Instrukcja dla studentów

FOLIA POMERANAE UNIVERSITATIS TECHNOLOGIAE STETINENSIS Folia Pomer. Univ. Technol. Stetin. 2011, Oeconomica 285 (62), 27 36

WSPÓŁCZYNNIK GOTOWOŚCI SYSTEMU LOKOMOTYW SPALINOWYCH SERII SM48

Określanie mocy cylindra C w zaleŝności od ostrości wzroku V 0 Ostrość wzroku V 0 7/5 6/5 5/5 4/5 3/5 2/5 Moc cylindra C 0,5 0,75 1,0 1,25 1,5 > 2

Umowa licencyjna na dane rynkowe - poufne

W praktyce często zdarza się, że wyniki obu prób możemy traktować jako. wyniki pomiarów na tym samym elemencie populacji np.

Naprężenia wywołane ciężarem własnym gruntu (n. geostatyczne)

MES W ANALIZIE SPRĘŻYSTEJ UKŁADÓW PRĘTOWYCH

ZASTOSOWANIE GRANICZNYCH ZAGADNIEŃ ODWROTNYCH DO OKREŚLANIA DOPUSZCZALNYCH STĘŻEŃ SUBSTANCJI CHEMICZNYCH NA POWIERZCHNI TERENU

Problemy jednoczesnego testowania wielu hipotez statystycznych i ich zastosowania w analizie mikromacierzy DNA

Zapis informacji, systemy pozycyjne 1. Literatura Jerzy Grębosz, Symfonia C++ standard. Harvey M. Deitl, Paul J. Deitl, Arkana C++. Programowanie.

Elementy modelowania matematycznego

SZTUCZNA INTELIGENCJA

PROWIZJA I AKORD1 1 2

TRANZYSTOR BIPOLARNY CHARAKTERYSTYKI STATYCZNE

Evaluation of estimation accuracy of correlation functions with use of virtual correlator model

Statystyczna analiza danych

NOWA METODA BUDOWY RODZIN KONSTRUKCJI (SPRĘŻYNOWE UKŁADY ODCIĄŻAJĄCE BRAM GARAŻOWYCH)

Ćwiczenie 10. Metody eksploracji danych

Grupa TP i Grupa TVN podpisały długoterminową umowę o współpracy w zakresie dostarczania treści, telewizji i usług komunikacyjnych

11/22/2014. Jeśli stała c jest równa zero to takie gry nazywamy grami o sumie zerowej.

65120/ / / /200

Harmonogramowanie produkcji przedsiębiorstwa budowlanego

Pattern Classification

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Systemy Ochrony Powietrza Ćwiczenia Laboratoryjne

Kier. MTR Programowanie w MATLABie Laboratorium Ćw. 12

MIĘDZYNARODOWE UNORMOWANIA WYRAśANIA ANIA NIEPEWNOŚCI POMIAROWYCH

STATYSTYKA MATEMATYCZNA WYKŁAD 5 WERYFIKACJA HIPOTEZ NIEPARAMETRYCZNYCH

Definicje ogólne

PRZEKŁADNIE ZĘBATE CZOŁOWE ŚRUBOWE. WALCOWE (równoległe) STOŻKOWE (kątowe) ŚLIMAKOWE HIPERBOIDALNE. o zebach prostych. walcowe. o zębach.

ANALIZA ROZDZIAŁU SIŁ HAMOWANIA POJAZDU HYBRYDOWEGO Z NAPĘDEM NA KOŁA TYLNE W ASPEKCIE REKUPERACJI ENERGII

Zjawiska masowe takie, które mogą wystąpid nieograniczoną ilośd razy. Wyrazów Obcych)

Zasady rekrutacji uczniów do I Liceum Ogólnokształcącego im. Tadeusza Kościuszki na rok szkolny 2015/2016

AKUSTYKA MOWY. Podstawy rozpoznawania mowy część I

z czynności komornika za I półrocze 2015 r. przez wyegzekwowanie ogółem (kol.6 do12) z powodu bezskuteczności na żądanie wierzyciela świadczenia

MS-Kom23. MINISTERSTWO SPRAWIEDLIWOŚCI, Al. Ujazdowskie 11, Warszawa Komornik Sądowy Komornik Sądowy Agnieszka Bąk-Batowska przy Sądzie

MS-Kom23 SPRAWOZDANIE Okręg Sądu

z czynności komornika za rok 2015 r. przez wyegzekwowanie ogółem (kol.6 do12) z powodu bezskuteczności na żądanie wierzyciela świadczenia egzekucji

MS-Kom23 SPRAWOZDANIE Okręg Sądu

MS-Kom23 SPRAWOZDANIE Okręg Sądu

System Przeciwdziałania Powstawaniu Bezrobocia na Terenach Słabo Zurbanizowanych SPRAWOZDANIE Z BADAŃ Autor: Joanna Wójcik

H P1 H L1 A 1 N L A 5 A 6 H P 2 H L 2. Pojedynczy rekord obserwacyjny: Schemat opracowania jednej serii obserwacyjnej:

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

TEMAT: Próba statyczna rozciągania metali. Obowiązująca norma: PN-EN :2002(U) Zalecana norma: PN-91/H lub PN-EN AC1

Spacery losowe generowanie realizacji procesu losowego

( ) ( ) 2. Zadanie 1. są niezależnymi zmiennymi losowymi o. oraz. rozkładach normalnych, przy czym EX. i σ są nieznane. 1 Niech X

Ćwiczenie 13. Wyznaczanie ruchliwości i koncentracji nośników prądu w półprzewodnikach metodą efektu Halla. Cel ćwiczenia

Analiza transformatora

Zginanie Proste Równomierne Belki

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Sprawozdanie ze sprzedaŝy usług związanych z obsługą działalności gospodarczej. za 2011 rok

METODA UNITARYZACJI ZEROWANEJ Porównanie obiektów przy ocenie wielokryterialnej. Ranking obiektów.

Regulamin Promocji kredytu gotówkowego Oprocentowanie niższe niż najniższe - edycja świąteczna. Obowiązuje od r. do r.

MODEL MUNDELLA-FLEMINGA

ROZPOZNAWANIE SYGNAŁÓW FONICZNYCH

Analiza danych. Analiza danych wielowymiarowych. Regresja liniowa. Dyskryminacja liniowa. PARA ZMIENNYCH LOSOWYCH

Egzamin ze statystyki/ Studia Licencjackie Stacjonarne/ Termin I /czerwiec 2010

Analiza rodzajów skutków i krytyczności uszkodzeń FMECA/FMEA według MIL STD A

Neural networks. Krótka historia rozpoznawanie znaków alfanumerycznych.

Sprawozdanie ze sprzedaży usług związanych z obsługą działalności gospodarczej. za 2016 rok

Wstęp do sieci neuronowych, wykład 12 Łańcuchy Markowa

Najprostsze modele sieci z rekurencją. sieci Hopfielda; sieci uczone regułą Hebba; sieć Hamminga;

EKONOMETRIA I Spotkanie 1, dn

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7


Algorytm projektowania dolnoprzepustowych cyfrowych filtrów Buttlewortha i Czebyszewa

Transkrypt:

BIULETYN INSTYTUTU AUTOMATYKI I ROBOTYKI NR 23, 2006 Zastosowane metod grupowana sekwencj casowych w roponawanu mowy na podstawe ukrytych model Markowa Tomas PAŁYS Zakład Automatyk, Instytut Telenformatyk Automatyk WAT, ul. Kalskego 2, 00-908 Warsawa STRESZCZENIE: Artykuł dotycy problemu tworena ukrytych model Markowa na podstawe arejestrowanych wypowed. Klucowym problemem jest wynacene boru stanów modelu Markowa. Pryjęto, Ŝe stany modelu są określone pre skupena obserwacj. Skupena te moŝna uyskać drogą grupowana sekwencj obserwacj sygnału mowy. SŁOWA KLUCZOWE: HMM, ukryte modele Markowa, estymacja, roponawane mowy. Wprowadene Podstawę roponawana mowy stanow sygnał próbkowany e stałą cęstotlwoścą F s. Pryjmuje sę ałoŝene, Ŝe właścwośc (cechy) sygnału mowy ne menają sę w krótk okrese casu, w tw. ramkach casowych. Ramk mają jednakową serokość mogą achodć na sebe. Cechy wynacone na podstawe ramk o numere t stanową obserwację onacaną jako o t. Cechy wynacone w kolejnych, dyskretnych momentach casu t =,..., T wynacają sekwencję obserwacj O = (o,..., o T ). Numery ramek casowych tworą bór chwl casowych modelu. Obserwacje o t są losowe, a ch rokład prawdopodobeństwa moŝe być róŝny dla róŝnych chwl casowych. Pryjmuje sę, Ŝe rokład prawdopodobeństwa obserwacj o t jest aleŝny od stanu q t procesu Markowa. Stanów procesu Markowa ne moŝna bepośredno wdeć (są one ukryte). Istnene kaŝdego nch objawa sę tylko tym, Ŝe generowane cąg obserwacj są godne róŝnym rokładam prawdopodobeństwa. 23

T. Pałys Podstawę proponowanego rowąana stanow spostreŝene, Ŝe stan modelu moŝna kojaryć e skupenam obserwacj w prestren cech. Wyodrębnene skupeń moŝe stanowć punkt wyjśca do określena rokładów prawdopodobeństwa, godne którym ostały wygenerowane obserwacje. Osoblwość model Markowa wykorystywanych w adanach roponawana mowy polega na ałoŝenu, Ŝe trajektora (będąca sekwencją stanów modelu) ne powraca do stanów, w których model prebywał w poprednch chwlach casowych (tn. moŝe poostać w aktualnym stane albo prejść do dowolnego e stanów następnych). Modele HMM tego typu są określane jako lewy prawy (godne dagramem prejść łańcucha). 2. Ukryte modele Markowa Predstawone ostaną podstawowe agadnena dotycące ukrytych model Markowa (ang. Hdden Markov Models, HMM) scególnego rodaju: umoŝlwające ch łącene. Metodę łącena model HMM aproponował Young [9]. Uupełnł on model HMM o dwa stany: neemsyjny stan wejścowy perwsy stan modelu ora neemsyjny stan wyjścowy ostatn stan modelu o numere N. Poostałe stany pryjął jako stany emsyjne ałoŝył, Ŝe tylko one mogą generować obserwacje. Take postępowana spowodowało, Ŝe bory chwl casowych są róŝne dla obserwacj procesu many stanów. Sekwencję obserwacj, pocynonych w dyskretnych momentach casu od t = do casu t = T, onacamy następująco: O = (o, o 2,..., o t,..., o T ). Chwle casu t dla obserwacj tworą bór chwl casowych: t {,..., T}, a dla procesu many stanów bór: {0,,..., T, T + }. Cecha ta odróŝna model Younga od wykłego modelu HMM. Proces many stanów modelu HMM opsuje sę jednorodnym łańcuchem Markowa. Nech menna q t onaca stan modelu, w którym najduje sę model, w dyskretnym momence casu t 0. System jest gotowy do pracy, gdy model najduje sę w neemsyjnym stane wejścowym, dlatego awse q 0 =. W dyskretnej chwl casu T + model awse najde sę w neemsyjnym stane wyjścowym, cyl q T+ = N. Dla t, T model moŝe prebywać w jednym N 2 róŝnych stanów emsyjnych, cyl q t {2,..., N }. Pryjmuje sę, Ŝe sekwencja stanów Q = (q 0, q,..., q T, q T+ ) ne jest nana. Prawdopodobeństwa prejść pomędy kolejnym stanam opsuje sę macerą prejść A = [ a j ], gde: ( + ), {,..., }, {,..., } a = P q = j q = N j N. j t t Pocątkowy rokład prawdopodobeństwa stanów jest punktowy: q 0 =. Dla procesu obserwacj stotny jest rokład w chwl t =. Określony 24 Buletyn Instytutu Automatyk Robotyk, 23/2006

Zastosowane metod grupowana sekwencj casowych jest on pre prawdopodobeństwo: a j, gde j {2,..., N } (prejśca neemsyjnego stanu wejścowego do dowolnego stanu emsyjnego modelu). Wartość a N równa jest prawdopodobeństwu pomnęca modelu (jest to prawdopodobeństwo prejśca neemsyjnego stanu wejścowego do neemsyjnego stanu wyjścowego). Prawdopodobeństwo pomnęca końcowych stanów emsyjnych a N, gde {2,..., N }, moŝe być neerowe. JeŜel A jest macerą trójkątną górną (a j = 0 dla > j), to model naywa sę lewy prawy. Jest on wykle stosowany do modelowana jednostek akustycnych [9]. W dostępnej lterature brak jest nformacj na temat stosowana nnych typów ukrytych model Markowa w adanach roponawana mowy. Zgodne pryjętym powyŝej ałoŝenam prawdopodobeństwa prejść spełnają następujące ograncena: ) 0 a j, {,..., N}, j {,..., N}, 2) a j = 0, jeśl > j, 3) a = 0, 4) a NN =, 5) N a j j = =, {,..., N}. Sposób generowana obserwacj aleŝy od aktualnego stanu. Jest on charakteryowany pre rodnę rokładów prawdopodobeństw B. W ogólnym prypadku jest to wektor, którego współrędne opsują rokłady prawdopodobeństwa generowana obserwacj pre stany emsyjne modelu HMM: ( ) ( ) B = b2 o... b N o, ( ) gde: b j (o) funkcja określająca rokład prawdopodobeństwa wygenerowana obserwacj o pre stan j, gde j {2,..., N }, N lcba stanów modelu HMM. Wektor B w dalsej cęśc będemy naywać wektorem rokładów obserwacj. Funkcja b j (o) w aleŝnośc od typu rokładu moŝe być funkcją prawdopodobeństwa lub funkcją gęstośc prawdopodobeństwa. W ogólnym prypadku pryjmuje sę multodalne funkcje gęstośc, w postac tw. kompoycj funkcj gęstośc: b o = c exp o E V o E M ( ) D m= ( 2Π ) V 2 ( ) ( ) T, ( 2 ) Buletyn Instytutu Automatyk Robotyk, 23/2006 25

T. Pałys gde: o wektor wersowy o D elementach, c waga składnka kompoycj m stanu, M lcba składnków kompoycj stanu, E wartośc ocekwana składnka kompoycj o numere m dla stanu, V macer kowarancj składnka kompoycj o numere m dla stanu. Wag c spełnają następujący warunek: M m= c =, dla c 0. ( 3 ) Ropatrywany ukryty model Markowa apsywać będemy następująco: λ = ( A, B ), ( 4 ) gde: A macer prejść, B wektor rokładów obserwacj. Z wykorystanem model HMM wąane są następujące problemy: ) Problem segmentacj polega na wynacenu trajektor, dla której prawdopodobeństwo wystąpena wra arejestrowaną sekwencją obserwacj jest najwękse. 2) Problem ewaluacj HMM polega na ocene moŝlwośc wygenerowana pre model arejestrowanej sekwencj obserwacj, cyl oblcenu prawdopodobeństwa wygenerowana pre model arejestrowanej sekwencj obserwacj. 3) Problem estymacj parametrów HMM polega na budowanu modelu na podstawe arejestrowanych wceśnej worcowych sekwencj obserwacj. 2.. Konkatenacja model HMM Metodę łącena, albo nacej mówąc konkatenacj, model HMM predstawł Young w [9]. Jak juŝ anacono, Young do modelu HMM dodał dwa stany: neemsyjny stan wejścowy ora neemsyjny stan wyjścowy. Stany te są wykorystywane do łącena model. Ideę łącena predstawono na rys.. Lną prerywaną na rys. a onacono łącene model. Stany neemsyjne onacono sarym kolorem. W wynku połącena otrymano model, który predstawono na rys. b. Połącene model jest równowaŝne połącenem neemsyjnego stanu wyjścowego modelu λ neemsyjnym stanem wejścowym modelu λ 2. Ze wględu na mnejsą łoŝoność oblcenową, fakt połącena model 26 Buletyn Instytutu Automatyk Robotyk, 23/2006

Zastosowane metod grupowana sekwencj casowych uwględna sę tylko w algorytmach ewaluacj estymacj parametrów HMM. Stosowne algorytmy moŝna naleźć w [7] [9]. a) Model λ 0,04 0,96 0,4 0,4 0,4 2 3 4 5 Model λ 2 0,6 0,6 0,6 0,98 0,02 0,2 0,2 0,2 2 3 4 5 b) Model Λ 0,0008 0,8 0,8 0,8 0,0392 0,008 0,96 0,4 0,4 0,392 2 3 4 0,2 0,2 0,2 5 6 7 8 0,6 0,6 0,6 0,8 0,8 0,8 Rys.. a) sposób łącena (konkatenacj) model HMM b) wynk konkatenacj model HMM 3. Estymacja parametrów modelu wypowed Estymacj parametrów model dokonuje sę na podstawe segmentacj boru sekwencj ucących. Pryjęto ałoŝene, Ŝe segmenty są jednoceśne skupenam obserwacj w prestren cech. Segmentację wykonuje sę wykorystując wynk grupowana sekwencj casowych [5]. KaŜdą sekwencję ucącą dely na tyle grup lu stanów emsyjnych składa sę model kaŝda grupa repreentuje stan emsyjny modelu wypowed. NajwaŜnejse własnośc algorytmu, to: estymacja parametrów model HMM be wstępnej segmentacj, jednocesna estymacja parametrów wsystkch model HMM. Jednak najwaŝnejsą własnoścą algorytmu estymacj parametrów modelu wypowed jest moŝlwość jednocesnej estymacj parametrów model HMM, które wchodą w skład modelu wypowed. Uyskana segmentacja określa pryporądkowane obserwacj stanom model jednostek akustycnych, co umoŝlwa późnej estymację parametrów model HMM. Onacmy bór sekwencj ucących jako {O r }, r =,..., R, gde R lcba sekwencj ucących repreentujących wypowedź W. Nech konkatenacja model HMM Λ = λ &... & λ k &... & λ K onaca model Buletyn Instytutu Automatyk Robotyk, 23/2006 27

T. Pałys wypowed W, gde λ k jest modelem jednostk akustycnej. Estymacj parametrów model λ k dokonuje sę na podstawe boru sekwencj ucących {O r }, r =,..., R, gde R lcba sekwencj ucących, które repreentują wypowedź W. KaŜda sekwencja obserwacj O r składa sę T r obserwacj (punktów). KaŜdy model składa sę dwóch stanów neemsyjnych (wejścowego wyjścowego) ora N (k) 2 stanów emsyjnych. Pre N onacmy lcbę stanów emsyjnych modelu wypowed, cyl: gde: N K = N 2, ( 5 ) k = N lcba stanów emsyjnych konkatenacj Λ, N (k) lcba wsystkch stanów modelu λ k, K lcba model. W modelu HMM pryjmuje sę, Ŝe tylko stany emsyjne generują obserwacje. Stany te utoŝsama sę e skupenam punktów w prestren cech wygenerowanym godne pewnym rokładem prawdopodobeństwa. Estymacj parametrów model dokonuje sę na podstawe segmentacj boru sekwencj ucących. Segmentację wykonuje sę wykorystując wynk grupowana sekwencj casowych. Według pryjętej metody grupowana wynacamy drewo grupowana, a następne dely sekwencję na N grup. ( ) KaŜda grupa G k repreentuje stan emsyjny modelu wypowed, gde: = 2,..., N (k) ; k =,..., K; K lcba model konkatenacj Λ. Pred prystąpenem do opsu algorytmu pryjmjmy następujące onacena: ξ (k) (, j) lcba prejść pomędy stanem (, k) a stanem (j, k), gde: =,..., N (k), j =,..., N (k) ; Ξ (k) () lcba stanów (, k) wygenerowanych pre model wypowed Λ, gde: =,..., N (k). Kolejne krok algorytmu estymacj parametrów są następujące. Struktury danych Stałe: {O r } bór sekwencj ucących, r =,..., R, T r długość sekwencj obserwacj, R lcba sekwencj ucących, Zmenne: k numer modelu konkatenacj Λ, N (k) lcba stanów modelu λ k, 28 Buletyn Instytutu Automatyk Robotyk, 23/2006

Zastosowane metod grupowana sekwencj casowych M lcba składowych kompoycj stanu (, k), gde = 2,..., N (k), G n grupa repreentująca stan emsyjny modelu λ k, gde: n = 2,..., N (k), G grupa repreentująca kompoycję m stanu emsyjnego (, k), gde: = 2,..., N (k) ( ) ; m =,..., M k, ξ (k) (, j) lcba prejść pomędy stanem (, k) ora (j, k), gde: =,..., N (k), j =,..., N (k), ξ r (, j) lcba prejść pomędy stanem (, k) ora (j, k), które towarysyły sekwencj obserwacj O r, gde: =,..., N (k), j =,..., N (k), r =,..., R, Ξ lcba stanów (, k) wygenerowanych pre model ( ) wypowed Λ, gde: =,..., N (k), ( ) Ξ k r ( ) lcba stanów (, k) modelu wypowed Λ, które towarysyły sekwencj obserwacj O r, gde: =,..., N (k), r =,..., R, c waga składnka kompoycj m stanu (, k), gde: ( m =,..., M k ), = 2,..., N (k), k =,..., K, E wartość ocekwana składnka kompoycj m stanu (, k), ( gde: m =,..., M k ), = 2,..., N (k), k =,..., K, V macer kowarancj składnka kompoycj m stanu (, k), ( gde: m =,..., M k ), = 2,..., N (k), k =,..., K. Oblcena wstępne Dla kaŝdej sekwencj obserwacj O r, gde: r =, 2,..., R, naleŝy wykonać predstawone ponŝej cynnośc. Według wybranego algorytmu grupowana sekwencj casowych [5] naleŝy wynacyć drewo grupowana sekwencj O r, opsane macerą Z. Następne naleŝy dokonać podału na N grup, wykorystując do tego celu algorytm podału na grupy [5]. W prypadku algorytmu grupowana nakładanem, punkty mogą ostać prypsane do węcej nŝ jednej grupy. Wtedy, wykorystując metodę najwęksej warygodnośc, naleŝy pryporądkować punkty tylko do jednej grupy tak, aby grupy ułoŝyły sę w nepowracający cąg. NaleŜy odnaleźć grupę, w której najduje sę punkt o ndekse () równym. Wsystke jej punkty naleŝy pryporądkować do grupy G 2, apamętując najwęksy ndeks t punktu pryporądkowanego do tego Buletyn Instytutu Automatyk Robotyk, 23/2006 29

T. Pałys stanu. Następne odnaleźć grupę punktem o ndekse t + pryporądkować jej elementy grupe G. Postępuje sę tak, aŝ do () pryporądkowana elementów grupe G () () 3 N. Następne prypsane ropocyna sę od grupy repreentującej perwsy stan emsyjny modelu (2) numer dwa, cyl od G 2, td. Prypsane elementów grupom, repreentującym stany emsyjne, kontynuuje sę, aŝ do ch wycerpana. Dla kaŝdej sekwencj O r (r =,..., R) określć lcbę prejść ( pomędy stanam modelu, cyl macer ξ k ), a następne sumować ją macerą ξ, cyl: (, j) = (, j) + (, j) ξ ξ ξ, ( 6 ) r gde: =,..., N (k), j =,..., N (k), k =,..., K. Wynacyć lcbę pryporądkowań obserwacj poscególnym stanom ( ) emsyjnym modelu wypowed, tn. wynacyć macer Ξ k sumować ją macerą Ξ : ( ) = ( ) + ( ) Ξ Ξ Ξ, ( 7 ) r gde: = 2,..., N (k), k =,..., K. Dla wsystkch model naleŝy uwględnć, Ŝe dałane systemu ropocyna sę w neemsyjnym stane wejścowym, a końcy w neemsyjnym stane wyjścowym. Jest to powodem węksena odpowednch wartośc elementów macery o jeden: k ( j) ( j) ( ) ξ, = ξ, +, jeśl ( N ) ( N ) o G, ( ) k j ( ) ( ) ( ) ( ) ξ k, k = ξ k, k +, jeśl k ( ) ( ) ( ) Ξ = Ξ +, ( N ) ( N ) ( ) ( ) ( ) ( ) Ξ k k = Ξ k k +. r o r G, Aby wynacyć parametry kompoycj funkcj gęstośc dodatkowo dokonuje sę podału grup repreentujących stany emsyjne modelu. ( ) Elementy grupy k ( ) G naleŝy podelć na M k podgrup, wykorystując do tego celu algorytm rołącnego grupowana punktów metodą herarchcną. W wynku tego otrymujemy grupy: G, gde: T r 30 Buletyn Instytutu Automatyk Robotyk, 23/2006

Zastosowane metod grupowana sekwencj casowych = 2,..., N (k) ( ) ; m =,..., M k, k =,..., K. Etap wstępny końcy sę w momence pogrupowana wsystkch sekwencj ucących Etap estymacj Estymacj parametrów model wchodących w skład konkatenacj Λ dokonuje sę następująco. Macer prejść A (k) wynacamy dla kaŝdego modelu λ k według woru: A ξ, = Ξ ( j) (, j) ( j) ( ) ( ) gde: =,..., k k N, j =,..., N, k =,..., K.. ( 8 ) Dla kaŝdego składnka kompoycj m stanu emsyjnego (, k) naleŝy wynacyć: współcynnk kompoycj: c = G G ( 9 ) gde: = 2,..., N, m =,..., M, k =,..., K. wartość średną: ( r ) o E = k ( ) ot G G t gde: = 2,..., N, m =,..., M, k =,..., K. macer kowarancj: ( r) ( r) o E o E V = k ( ) ot G ( t )( t ) G gde: = 2,..., N, m =,..., M, k =,..., K. ( 0 ) ( ) Etap końcowy Oblcena końcymy po wynacenu parametrów wsystkch model HMM. Buletyn Instytutu Automatyk Robotyk, 23/2006 3

T. Pałys 4. Wynk badań Wsystke dośwadcena wykonano pry pomocy laboratoryjnego systemu roponawana mowy, który budował autor artykułu. Oblcena preprowadono na komputere procesorem AMD Athlon XP 700+ pamęcą RAM 024 MB. Tab.. Słownk systemu Słownk systemu Lcba sekwencj element słownka W transkrypcja fonetycna lcba stanów emsyjnych ucących testowych 0 ero qeroq 4 90 20 jeden qjedenq 7 95 20 2 dwa qdwaq 94 20 3 Try qtsyq 95 20 4 ctery qcteryq 7 94 9 5 pęć qpęćq 95 20 6 seść qseśćq 4 94 9 7 sedem qśedemq 7 95 20 8 osem qośemq 4 94 20 9 dewęć qźewęćq 7 95 20 Jako bór ucący ora bór testowy uŝyto plków dźwękowych asobu mowy Robot. Plk awerają sesnastobtowe próbk sygnału mowy, poyskane cęstotlwoścą próbkowana F s = 22,05 kh akodowane w formace Mcrosoft PCM. Sekwencje obserwacj poyskano stosując ramk casowe o serokośc 5 ms. Ramk nakładały sę na sebe w połowe swojej serokośc. Z kaŝdej ramk wynacono 0 współcynnków LPC ora 5 współcynnków MFCC [7]. W tab. predstawono słownk systemu ora lcbę sekwencj ucących testowych. Jako jednostkę akustycną pryjęto głoskę. Na pocątku na końcu kaŝdej wypowed dodano głoskę q, który onaca csę. Modele jednostek akustycnych to modele lewy prawy (rys. 2). Składają sę one trech stanów emsyjnych ora dwóch stanów neemsyjnych: wejścowego wyjścowego, które na rys. 2a onacono sarym tłem. Wyjątkem jest model csy (rys. 2b), który składa sę dwóch stanów neemsyjnych jednego stanu emsyjnego. Jako boru ucącego uŝyto 94 sekwencj obserwacj. Zbór 32 Buletyn Instytutu Automatyk Robotyk, 23/2006

Zastosowane metod grupowana sekwencj casowych testowy składał sę 98 sekwencj obserwacj. a) b) a22 a33 a44 a22 a2 a23 a34 a45 a2 2 3 4 5 2 a23 3 Rys. 2. Dagram dowolonych prejść dla: a) modelu głosk, b) modelu csy W celu dokonana oceny moŝlwośc estymacj parametrów model wypowed pry wykorystanu opracowanych metod grupowana sekwencj casowych preprowadono następujący eksperyment. Jako metodę odnesena pryjęto metodę Bauma Welcha. Wynacono parametry model wypowed preprowadono roponawane sekwencj testowych. Wynk dośwadcena predstawono w rod. 4.. Na ch podstawe dokonano oceny tych moŝlwośc Dodatkowo badano wpływ sposobu łącena w grupy na skutecność roponawana wypowed. Ops dośwadcena ora jego wynk predstawono w rod. 4.2. Ocena moŝlwośc wykorystana do estymacj parametrów model wypowed metod grupowana sekwencj casowych jest pośredna na podstawe oceny skutecnośc systemu roponawana mowy. Wykorystane wskaźnk oceny systemu roponawana mowy opracowano na podstawe [6], [8]. Pry omawanu wynków eksperymentu pryjęto następujące onacena: R lcba sekwencj testowych wypowed W, ɶ R lcbę sekwencj obserwacj roponanych jako wypowedź W, R ˆ lcba poprawne roponanych sekwencj obserwacj wypowed W, γ stopa błędnego pretworena obserwacj pochodących wypowed W, ˆ γ poom neufnośc roponana wypowed W, ϑ skutecność roponawana wypowed W. 4.. Reestymacja parametrów model wypowed metodą Bauma Welcha Eksperyment polegał na badanu moŝlwośc reestymacj model jednostek akustycnych pry wykorystanu algorytmu Bauma Welcha. Buletyn Instytutu Automatyk Robotyk, 23/2006 33

T. Pałys Dokonano jednokrotnego pomaru casu dla predstawonego powyŝej boru ucącego konfguracj komputera Pocątkowe parametry model jednostek akustycnych wynacono na podstawe równomernego podału sekwencj boru ucącego na segmenty. Parametry pocątkowe wynacono w case równym 3,5 s. Następne wykonano pęć teracj algorytmu Bauma Welcha. Jedna teracja algorytmu trwała około 8 mnut. Po dokonanu reestymacj parametrów model jednostek akustycnych preprowadono roponawane sekwencj e boru sekwencj testowych. Wynk eksperymentu predstawono w tab. 2. Tab. 2. Wynk roponawana po reestymacj metodą Bauma Welcha Z R R ɶ R γ ˆ ˆ γ ϑ 0 20 20 2 0 0,0476 00,00% 20 20 20 0 0 00,00% 2 20 9 9 0,0500 0 95,00% 3 20 20 20 0 0 00,00% 4 9 9 20 0 0,0500 00,00% 5 20 9 9 0,0500 0 95,00% 6 9 9 9 0 0 00,00% 7 20 9 9 0,0500 0 95,00% 8 20 20 20 0 0 00,00% 9 20 20 2 0 0,0476 00,00% Ogólne 98 95 98 0,050 0,045 98,50% SUMA γ ˆ γ ϑ 4.2. Estymacja parametrów model wypowed na podstawe grupowana sekwencj casowych Dośwadcalne badano astosowane algorytmów grupowana sekwencj punktów, herarchcnego grupowana rołącnego ora herarchcnego grupowana nakładanem, do estymacj parametrów model wypowed. Eksperyment polegał na badanu algorytmu estymacj parametrów model wypowed. Pośredn wskaźnkem oceny algorytmu jest skutecność systemu roponawana mowy. Zbadano, cy wybór sposobu określana odległośc 34 Buletyn Instytutu Automatyk Robotyk, 23/2006

Zastosowane metod grupowana sekwencj casowych pomędy punktam ora grupam ma wpływ na skutecność systemu roponawana mowy. Tab. 3. Wynk roponawana sekwencj testowych po estymacj parametrów na podstawe grupowana rołącnego pry określanu odległośc pomędy: grupam metodą Warda, pomędy punktam według metryk Mahalanobsa R R ɶ R γ ˆ ˆ γ ϑ 0 20 20 20 0 0 00,00% 20 20 20 0 0 00,00% 2 20 20 20 0 0 00,00% 3 20 5 5 0,2500 0 75,00% 4 9 9 24 0 0,2083 00,00% 5 20 9 9 0,0500 0 95,00% 6 9 9 9 0 0 00,00% 7 20 20 2 0 0,0476 00,00% 8 20 20 20 0 0 00,00% 9 20 9 20 0,0500 0,0500 95,00% Ogólne 98 9 98 0,0350 0,0306 96,50% SUMA γ ˆ γ ϑ KaŜdą sekwencję obserwacj, e boru sekwencj ucących, podelono na grupy. Lcbę grup dobrano do modelu wypowed. JeŜel sekwencję obserwacj poyskano wypowed W, to podelono ją na lcbę grup równą lcbe stanów emsyjnych modelu wypowed Λ. Na podstawe tak wydelonych grup moŝna było estymować parametry model HMM, wykorystując algorytm estymacj parametrów modelu wypowed. W perwsej kolejnośc dokonano estymacj parametrów model wypowed, a następne dokonano roponawana sekwencj e boru sekwencj testowych. Estymacj parametrów wsystkch model jednostek akustycnych, łącne grupowanem sekwencj casowych, dokonywano w case około 3 mnut. Dokonano estymacj parametrów model wypowed na podstawe wynków grupowana sekwencj ucących herarchcną metodą grupowana rołącnego. Najwęksą skutecność roponawana, równą ϑ = 96% Buletyn Instytutu Automatyk Robotyk, 23/2006 35

T. Pałys uyskano dla łącena w grupy metodą średnej odległośc pry określanu odległośc pomędy punktam stosując metrykę Eukldesa. Średna stopa błędnego pretworena obserwacj była równa γ = 0, 04, a średn poom neufnośc roponana ˆ γ = 0,037. Scegółowe wynk predstawono w tab. 3. Tab. 4. Wynk roponawana sekwencj testowych po estymacj parametrów na podstawe grupowana nakładanem pry określanu odległośc pomędy: grupam metodą średnej odległośc, pomędy punktam według metryk Eukldesa R R ɶ R γ ˆ ˆ γ ϑ 0 20 9 9 0,0500 0 95,00% 20 9 2 0,0500 0,0952 95,00% 2 20 20 2 0 0,0476 00,00% 3 20 6 6 0,2000 0 80,00% 4 9 9 22 0 0,364 00,00% 5 20 9 9 0,0500 0 95,00% 6 9 9 9 0 0 00,00% 7 20 20 22 0 0,0909 00,00% 8 20 20 20 0 0 00,00% 9 20 9 9 0,0500 0 95,00% Ogólne 98 90 98 0,0400 0,0370 96,00% SUMA γ ˆ γ ϑ Zbadano równeŝ moŝlwość dokonana estymacj parametrów model wypowed na podstawe wynków grupowana sekwencj ucących herarchcną metodą grupowana nakładanem. W tym prypadku najwęksą skutecność roponawana, równą ϑ = 96% uyskano dla łącena w grupy metodą średnej odległośc pry określanu odległośc pomędy punktam stosując metrykę Eukldesa. Średna stopa błędnego pretworena obserwacj była równa γ = 0,04, a średn poom neufnośc roponana ˆ γ = 0,037. Wynk dośwadcena predstawono w tab. 4. 36 Buletyn Instytutu Automatyk Robotyk, 23/2006

Zastosowane metod grupowana sekwencj casowych 5. Podsumowane Głównym celem predstawonego w artykule eksperymentu była ocena moŝlwośc wykorystana metod grupowana sekwencj casowych do estymacj parametrów model HMM. Jako punkt odnesena pryjęto metodę Bauma Welcha. W śwetle predstawonych wynków moŝna sformułować następujące wnosk: ) astosowane metody grupowana sekwencj casowych powala dokonać estymacj parametrów model HMM, 2) jakość roponawana mowy pry astosowanu model uyskanych na podstawe grupowana obserwacj jest tego samego rędu, co pry wykorystanu metody Bauma Welcha, 3) cas estymacj jest klkanaśce ray mnejsy nŝ analogcny cas oblceń opartych na algorytme Bauma Welcha. Lteratura [] Evertt B., Landau S. Leese M.: Cluster Analyss, 4 th edton, Edward Arnold Publshers Ltd., London 200. [2] Koronack J., Ćwk J.: Statystycne systemy ucące sę, Wydawnctwa Naukowo Techncne, Warsawa 2005. [3] Kwatkowsk W.: Metody automatycnego roponawana worców, Instytut Automatyk Robotyk WAT, Warsawa 200, [4] Mathworks, Inc: Statstcs Toolbox User's Gude, http://www.mathworks.com/access/helpdesk/help/pdf_doc/stats/stats.pdf, MathWorks, 2005. [5] Pałys T.: Algorytmy grupowana sekwencj casowych, Buletyn Instytutu Automatyk Robotyk WAT, 23/2006. Warsawa, 2006. [6] Pałys T.: Zastosowane metody grupowana sekwencj casowych w roponawanu mowy na podstawe ukrytych model Markowa, Roprawa doktorska, WAT. Warsawa, 2006. [7] Wśnewsk A. M.: Automatycne roponawane mowy baujące na ukrytych modelach Markowa problemy metody, Buletyn Instytutu Automatyk Robotyk WAT, 2/2000, ss. 3-83. Warsawa, 2000. [8] Wśnewsk A. M.: Metody oceny systemów roponawana mówców, Buletyn Instytutu Automatyk Robotyk WAT, 3/2000, ss. 3-35, Warsawa, 2000. [9] Young S. J., Evermann G., Han, T., Kershaw D., Moore G., Odell J., Ollason D., Povey D., Valtchev V., Woodland P.: The HTK Book, Mcrosoft Corporaton, 2000. Buletyn Instytutu Automatyk Robotyk, 23/2006 37

T. Pałys Applcaton of Te Sequences Clusterng Methods n the Speech Recognton Based on Hdden Markov Models ABSTRACT: A problem of hdden Markov models formaton on the bass of recorded speech s consdered n ths paper. The key ssue s the desgnaton of a Markov model set. The assumpton s that each HMM state s assocated wth clusters of observatons. The clusters may be obtaned by gatherng of observatons sequences for a speech sgnal. KEYWORDS: HMM, Hdden Markov Model, estaton, speech recognton Recenent: prof. dr hab. nŝ. Włoder KWIATKOWSKI Praca wpłynęła do redakcj: 28.2.2006 38 Buletyn Instytutu Automatyk Robotyk, 23/2006