Zagadnienie optymalnych kryteriów identyfikacji osoby na podstawie analizy mowy

Podobne dokumenty
Metody systemowe i decyzyjne w informatyce

Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści

MODELOWANIE SIŁ SKRAWANIA DREWNA

Regresyjne metody łączenia klasyfikatorów

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

EKONOMETRIA STOSOWANA PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Analiza przeżycia. Czym zajmuje się analiza przeżycia?

Mikroekonometria 13. Mikołaj Czajkowski Wiktor Budziński

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Metody systemowe i decyzyjne w informatyce

Imputacja brakujacych danych binarnych w modelu autologistycznym 1

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Efekt Lombarda. Czym jest efekt Lombarda?

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Pobieranie prób i rozkład z próby

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Analiza ryzyka nawierzchni szynowej Iwona Karasiewicz

Korelacja krzywoliniowa i współzależność cech niemierzalnych

Statystyka Małych Obszarów w badaniach próbkowych

STATYSTYKA MATEMATYCZNA

STATYSTYKA INDUKCYJNA. O sondaŝach ach i nie tylko

Przedmiotowy System Oceniania dla języka niemieckiego w szkołach ponadgimnazjalnych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

STATYSTYKA INDUKCYJNA. O sondażach i nie tylko

ESTYMACJA BŁĘDU PREDYKCJI I JEJ ZASTOSOWANIA

POMIARY STATYSTYCZNE SERII WAŻEŃ

Kurs Chemometrii Poznań 28 listopad 2006

Prawdopodobieństwo i statystyka r.

Kontekstowy model oceny efektywności nauczania dla pierwszego etapu edukacyjnego

Projekt Sieci neuronowe

SZCZEGÓŁOWE KRYTERIA OCENIANIA Z JĘZYKA NIEMIECKIEGO OBOWIĄZUJĄCE OD ROKU SZKOLNEGO 2019/2020. (dla uczniów po szkole podstawowej) OCENA CELUJĄCA

Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11

METODY STATYSTYCZNE W BIOLOGII

Kontekstowe modele efektywności nauczania po I etapie edukacyjnym

2. Empiryczna wersja klasyfikatora bayesowskiego

Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna

Pattern Classification

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

EKSPERTYZA ALKOHOLOGICZNA

Mikroekonometria 9. Mikołaj Czajkowski Wiktor Budziński

Kolokwium ze statystyki matematycznej

PRZEDMIOTOWY SYSTEM OCENIANIA Z JĘZYKA ANGIELSKIEGO dla gimnazjum przy Liceum im. Karola Holteia w Obornikach Śląskich

Optymalizacja harmonogramów budowlanych - szeregowanie zadań. Mgr inż. Aleksandra Radziejowska AGH Akademia Górniczo-Hutnicza w Krakowie

WSPIERANIE ZADAŃ ANALITYCZNYCH Z ZASTOSOWANIEM STATISTICA NA PRZYKŁADZIE BIOTON S.A.

Program XXXVI Konferencji "Statystyka Matematyczna Wisła 2010"

Zagadnienie klasyfikacji (dyskryminacji)

Informacja o Możliwości Jednoczesnego Studiowania Matematyki i Informatyki w Systemie Studiów Dwustopniowych.

PRZEDMIOTOWY SYSTEM OCENIANIA Z JĘZYKA ANGIELSKIEGO W II LICEUM OGÓLNOKSZTAŁCĄCYM IM. MIKOŁAJA KOPERNIKA W LESZNIE

Rola instytucji otoczenia biznesu w Wielkopolsce w kontekście przepływu wiedzy

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

SIEĆ NEURONOWA DO OCENY KOŃCOWEJ PRZEDSIĘWZIĘCIA (PROJEKTU)

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Metody systemowe i decyzyjne w informatyce

LABORATORIUM Z FIZYKI

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Liniowy model ekonometryczny Metoda najmniejszych kwadratów Laboratorium 1.

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

KLASA VII. (Ocenę wyższą otrzymuje uczeń, który spełnia wszystkie wymagania ocen niższych pozytywnych).

PRZEDMIOTOWE ZASADY OCENIANIA JĘZYK FRANCUSKI (poziom edukacyjny IV.O - podstawowy)

EGZAMIN LICENCJACKI NA KIERUNKU MATEMATYKA ROK AKADEMICKI 2018/2019

Podstawy statystyki matematycznej w programie R

Podstawy opracowania wyników pomiarów z elementami analizy niepewności statystycznych

Redukcja wariancji w metodach Monte-Carlo

WIEDZA K_W10 zna co najmniej jeden język obcy na poziomie średniozaawansowanym (B2) X1A_U10

Modelowanie glikemii w procesie insulinoterapii

Wymagania edukacyjne j. niemiecki kl.4

Czynniki lokalnego rozwoju gospodarczego w Polsce znaczenie polityk miejskich dr Julita Łukomska

PRZEDMIOTOWY SYSTEM OCENIANIA Z JĘZYKA HISZPAŃSKIEGO

ROLA INSTYTUCJI OTOCZENIA BIZNESU W WIELKOPOLSCE W KONTEKŚCIE PRZEPŁYWU WIEDZY. Agnieszka GRZELCZAK Katarzyna RAGIN-SKORECKA

Analiza niepewności pomiarów

Aproksymacja funkcji a regresja symboliczna

SYSTEM OCENIANIA Z JĘZYKÓW OBCYCH.

Porównanie modeli regresji. klasycznymi modelami regresji liniowej i logistycznej

Modelowanie krzywych i powierzchni

Synteza mowy. opracowanie: mgr inż. Kuba Łopatka

DOKUMENTACJA SYSTEMU ZARZĄDZANIA LABORATORIUM. Procedura szacowania niepewności

Spis treści 3 SPIS TREŚCI

MODUŁ KSZTAŁCENIA: Praktyczna nauka języka angielskiego: moduł 1

Opis wymaganych umiejętności na poszczególnych poziomach egzaminów DELF & DALF

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Statystyka opisowa. Wykład VI. Analiza danych jakośiowych

Rozpoznawanie obrazów

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Ewaluacja w polityce społecznej

- elementy aktywności: prace domowe, frekwencja, aktywność na zajęciach,

Wymagania edukacyjne z języka niemieckiego w roku szkolnym 2017/2018. Kryteria Oceniania

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

PRZYSZŁE ZMIANY SPOSOBU FINANSOWANIA ZADAŃ OŚWIATOWYCH

SIEĆ NEURONOWA DO OCENY KOŃCOWEJ PRZEDSIĘWZIĘCIA (PROJEKTU)

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Agnieszka Nowak Brzezińska

Szkolenie Analiza danych panelowych

Pozyskiwanie wiedzy z danych

Politechnika Gdańska Wydział Elektrotechniki i Automatyki Katedra Inżynierii Systemów Sterowania

STATYSTYKA MATEMATYCZNA

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

Transkrypt:

Zagadnienie optymalnych kryteriów identyfikacji osoby na podstawie analizy mowy Antoni Leon Dawidowicz 1 Agata Trawińska 2 1 Uniwersytet Jagielloński w Krakowie 2 Instytut Ekspertyz Sądowych w Krakowie XXXV Konferencja Statystyka Matematyczna Wisła 2009

Propozycje rozwia zania

Problem polega na identyfikacji osoby na podstawie jej wypowiedzi W każdej wypowiedzi można rozbić poszczególne samogłoski a,e,i,o,u na formanty

Problem polega na identyfikacji osoby na podstawie jej wypowiedzi W każdej wypowiedzi można rozbić poszczególne samogłoski a,e,i,o,u na formanty

Kiedy byłoby fajnie? Gdyby każde wypowiedzenie danej samogłoski miało tę samą długość, wówczas można by było dla każdej samogłoski określić 4n-wymiarowy wektor losowy.

Gdzie są problemy? brakujące dane, co wynika głównie z jakości zapisu analizowanych wypowiedzi; różna liczebność wariantów poszczególnych samogłosek przy dostatecznie długiej wypowiedzi liczebność poszczególnych wariantów powinna odpowiadać frekwencyjności samogłosek właściwej dla języka polskiego; wybór treściowo tożsamych wypowiedzi trzech braci pozwolił natomiast zminimalizować problem zmienności układu czterech formantów, wynikającej z odmiennego prawo- i lewostronnego kontekstu fonetycznego samogłoski;

Gdzie są problemy? brakujące dane, co wynika głównie z jakości zapisu analizowanych wypowiedzi; różna liczebność wariantów poszczególnych samogłosek przy dostatecznie długiej wypowiedzi liczebność poszczególnych wariantów powinna odpowiadać frekwencyjności samogłosek właściwej dla języka polskiego; wybór treściowo tożsamych wypowiedzi trzech braci pozwolił natomiast zminimalizować problem zmienności układu czterech formantów, wynikającej z odmiennego prawo- i lewostronnego kontekstu fonetycznego samogłoski;

Gdzie są problemy? brakujące dane, co wynika głównie z jakości zapisu analizowanych wypowiedzi; różna liczebność wariantów poszczególnych samogłosek przy dostatecznie długiej wypowiedzi liczebność poszczególnych wariantów powinna odpowiadać frekwencyjności samogłosek właściwej dla języka polskiego; wybór treściowo tożsamych wypowiedzi trzech braci pozwolił natomiast zminimalizować problem zmienności układu czterech formantów, wynikającej z odmiennego prawo- i lewostronnego kontekstu fonetycznego samogłoski;

Gdzie są problemy? z kolei rejestracja ich wypowiedzi w sposób bezpośredni umożliwiła uwzględnienie czterech formantów z tą samą wagą istotności; rejestracja za pośrednictwem transmisji telefonicznej wymagałaby, z uwagi na charakterystykę pasma, przypisania formantom różnych wag relatywnie niższych dla formantów pierwszego i czwartego niż dla dwóch pozostałych, tj. formantów drugiego i trzeciego.

Gdzie są problemy?

Gdzie są problemy? Głownym problemem, jaki pojawia się przy próbie opracowania algorytmy identyfikacji mówcy na podstawie wybranych formantów wybranych samogłosek jest fakt, że te same samogłoski wypowiedziane przez tego samego mówcę w tym samym kontekście mają różną długość

Propozycje rozwiązania Można ciąg pomiarów traktować, jako pomiary pewnej funkcji regresji.jest to dość naturale, gdyż każda wypowiedź samogłoski jest pewną funkcją czasu. Niektórzy autorzy sugereowali zastosowanie regrsji wielomianowej.

Propozycje rozwiązania Można ciąg pomiarów traktować, jako pomiary pewnej funkcji regresji.jest to dość naturale, gdyż każda wypowiedź samogłoski jest pewną funkcją czasu. Niektórzy autorzy sugereowali zastosowanie regrsji wielomianowej.

Propozycje rozwiązania Można ciąg pomiarów traktować, jako pomiary pewnej funkcji regresji.jest to dość naturale, gdyż każda wypowiedź samogłoski jest pewną funkcją czasu. Niektórzy autorzy sugereowali zastosowanie regrsji wielomianowej.

Propozycje rozwiązania Regresja wielomianowa naszym zdaniem nie jest adekwatna do problemu Bardziej naturalna jest procedura noieparametryczna Estymator Nadarayi-Watsona ˆf (x) = ( ) x xk h ( ) nk=1 K x xk h nk=1 y k K gdzie K jest pewną krzywą dzwonową

Propozycje rozwiązania Regresja wielomianowa naszym zdaniem nie jest adekwatna do problemu Bardziej naturalna jest procedura noieparametryczna Estymator Nadarayi-Watsona ˆf (x) = ( ) x xk h ( ) nk=1 K x xk h nk=1 y k K gdzie K jest pewną krzywą dzwonową

Propozycje rozwiązania Regresja wielomianowa naszym zdaniem nie jest adekwatna do problemu Bardziej naturalna jest procedura noieparametryczna Estymator Nadarayi-Watsona ˆf (x) = ( ) x xk h ( ) nk=1 K x xk h nk=1 y k K gdzie K jest pewną krzywą dzwonową

Propozycje rozwiązania Regresja wielomianowa naszym zdaniem nie jest adekwatna do problemu Bardziej naturalna jest procedura noieparametryczna Estymator Nadarayi-Watsona ˆf (x) = ( ) x xk h ( ) nk=1 K x xk h nk=1 y k K gdzie K jest pewną krzywą dzwonową

Propozycje rozwiązania Przed zastosowaniem estymatora Nadarayi-Watsona można dokonać takiej zamiany zmienych tak, by jednostką czau był okres wypowiedzenia samogłoski, czyli uwolnić siȩ od problemów związanych z róż,nym czasem wypowiadania tej samej samołoski. Rzecz jasna należy odpowiednio zrelatywizować szerokość pasmah.

Propozycje rozwiązania Przed zastosowaniem estymatora Nadarayi-Watsona można dokonać takiej zamiany zmienych tak, by jednostką czau był okres wypowiedzenia samogłoski, czyli uwolnić siȩ od problemów związanych z róż,nym czasem wypowiadania tej samej samołoski. Rzecz jasna należy odpowiednio zrelatywizować szerokość pasmah.

Dziękujemy za uwagę