Zagadnienie optymalnych kryteriów identyfikacji osoby na podstawie analizy mowy

Zagadnienie optymalnych kryteriów identyfikacji osoby na podstawie analizy mowy Antoni Leon Dawidowicz 1 Agata Trawińska 2 1 Uniwersytet Jagielloński w Krakowie 2 Instytut Ekspertyz Sądowych w Krakowie XXXV Konferencja Statystyka Matematyczna Wisła 2009

Propozycje rozwia zania

Problem polega na identyfikacji osoby na podstawie jej wypowiedzi W każdej wypowiedzi można rozbić poszczególne samogłoski a,e,i,o,u na formanty

Kiedy byłoby fajnie? Gdyby każde wypowiedzenie danej samogłoski miało tę samą długość, wówczas można by było dla każdej samogłoski określić 4n-wymiarowy wektor losowy.

Gdzie są problemy? brakujące dane, co wynika głównie z jakości zapisu analizowanych wypowiedzi; różna liczebność wariantów poszczególnych samogłosek przy dostatecznie długiej wypowiedzi liczebność poszczególnych wariantów powinna odpowiadać frekwencyjności samogłosek właściwej dla języka polskiego; wybór treściowo tożsamych wypowiedzi trzech braci pozwolił natomiast zminimalizować problem zmienności układu czterech formantów, wynikającej z odmiennego prawo- i lewostronnego kontekstu fonetycznego samogłoski;

Gdzie są problemy? z kolei rejestracja ich wypowiedzi w sposób bezpośredni umożliwiła uwzględnienie czterech formantów z tą samą wagą istotności; rejestracja za pośrednictwem transmisji telefonicznej wymagałaby, z uwagi na charakterystykę pasma, przypisania formantom różnych wag relatywnie niższych dla formantów pierwszego i czwartego niż dla dwóch pozostałych, tj. formantów drugiego i trzeciego.

Gdzie są problemy?

Gdzie są problemy? Głownym problemem, jaki pojawia się przy próbie opracowania algorytmy identyfikacji mówcy na podstawie wybranych formantów wybranych samogłosek jest fakt, że te same samogłoski wypowiedziane przez tego samego mówcę w tym samym kontekście mają różną długość

Propozycje rozwiązania Można ciąg pomiarów traktować, jako pomiary pewnej funkcji regresji.jest to dość naturale, gdyż każda wypowiedź samogłoski jest pewną funkcją czasu. Niektórzy autorzy sugereowali zastosowanie regrsji wielomianowej.

Propozycje rozwiązania Regresja wielomianowa naszym zdaniem nie jest adekwatna do problemu Bardziej naturalna jest procedura noieparametryczna Estymator Nadarayi-Watsona ˆf (x) = ( ) x xk h ( ) nk=1 K x xk h nk=1 y k K gdzie K jest pewną krzywą dzwonową

Propozycje rozwiązania Przed zastosowaniem estymatora Nadarayi-Watsona można dokonać takiej zamiany zmienych tak, by jednostką czau był okres wypowiedzenia samogłoski, czyli uwolnić siȩ od problemów związanych z róż,nym czasem wypowiadania tej samej samołoski. Rzecz jasna należy odpowiednio zrelatywizować szerokość pasmah.

Dziękujemy za uwagę