Metoda weryfikacji mówcy na podstawie nieuzgodnionej wypowiedzi

Podobne dokumenty
Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści

4 Zasoby językowe Korpusy obcojęzyczne Korpusy języka polskiego Słowniki Sposoby gromadzenia danych...

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

Analiza składowych głównych. Wprowadzenie

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

SYSTEM BIOMETRYCZNY IDENTYFIKUJĄCY OSOBY NA PODSTAWIE CECH OSOBNICZYCH TWARZY. Autorzy: M. Lewicka, K. Stańczyk

KOMPRESJA STRATNA DŹWIĘKU

Testowanie modeli predykcyjnych

Lekcja 5: Sieć Kohonena i sieć ART

Technologia dynamicznego podpisu biometrycznego

AKUSTYKA MOWY. Podstawy rozpoznawania mowy część I

Rozpoznawanie obrazów na przykładzie rozpoznawania twarzy

Transformaty. Kodowanie transformujace

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA

Kodowanie transformacyjne. Plan 1. Zasada 2. Rodzaje transformacji 3. Standard JPEG

Sztuczna Inteligencja Tematy projektów Sieci Neuronowe

S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor

Krzysztof Ślot Biometria Łódź, ul. Wólczańska 211/215, bud. B9 tel

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Prof. Stanisław Jankowski

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

10. Redukcja wymiaru - metoda PCA

Widzenie komputerowe (computer vision)

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA Realizowany w roku akademickim 2016/2017

Omówienie różnych metod rozpoznawania mowy

Rozpoznawanie obrazów

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Komputerowe przetwarzanie sygnału mowy

Pattern Classification

58. Otwarte Seminarium z Akustyki, OSA '11, Gdańsk-Jurata, September 2011

Wydział Matematyki. Testy zgodności. Wykład 03

Podstawy Przetwarzania Sygnałów

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska

ALGORYTM RANDOM FOREST

ROZPOZNAWANIE GRANIC SŁOWA W SYSTEMIE AUTOMATYCZNEGO ROZPOZNAWANIA IZOLOWANYCH SŁÓW

SI w procesach przepływu i porządkowania informacji. Paweł Buchwald Wyższa Szkoła Biznesu

Wykład 3 Hipotezy statystyczne

Algorytm do rozpoznawania człowieka na podstawie dynamiki użycia klawiatury. Paweł Kobojek, prof. dr hab. inż. Khalid Saeed

BIOMETRIA WYKŁAD 8: BŁĘDY SYSTEMOW BIOMETRYCZNYCH

ZAAWANSOWANE ZAGADNIENIA ELEKTRONIKI

SPOTKANIE 2: Wprowadzenie cz. I

Biometryczna Identyfikacja Tożsamości

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

OKREŚLENIE WPŁYWU WYŁĄCZANIA CYLINDRÓW SILNIKA ZI NA ZMIANY SYGNAŁU WIBROAKUSTYCZNEGO SILNIKA

Metody systemowe i decyzyjne w informatyce

Materiały dydaktyczne: Maciej Krzymowski. Biometryka

Wykaz tematów prac magisterskich w roku akademickim 2018/2019 kierunek: informatyka

Przykład optymalizacji struktury sztucznej sieci neuronowej metodą algorytmów genetycznych

wiedzy Sieci neuronowe

ROZPOZNAWANIE SYGNAŁÓW FONICZNYCH

rozpoznawania odcisków palców

Testowanie hipotez statystycznych

Klasyfikacja LDA + walidacja

Statystyka matematyczna dla leśników

Optymalizacja ciągła

dr inż. Jacek Naruniec

Temat: Sztuczne Sieci Neuronowe. Instrukcja do ćwiczeń przedmiotu INŻYNIERIA WIEDZY I SYSTEMY EKSPERTOWE

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV

Biometryczna Identyfikacja Tożsamości

Algorytmy detekcji częstotliwości podstawowej

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Układy i Systemy Elektromedyczne

komputery? Andrzej Skowron, Hung Son Nguyen Instytut Matematyki, Wydział MIM, UW

Wstęp. osobniczo, takich jak odciski linii papilarnych, wygląd tęczówki oka, czy charakterystyczne cechy twarzy.

METODY INŻYNIERII WIEDZY

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład I dr inż. 2015/2016

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

AUTOMATYKA INFORMATYKA

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Sztuczne sieci neuronowe. Krzysztof A. Cyran POLITECHNIKA ŚLĄSKA Instytut Informatyki, p. 335

Programowanie celowe #1

Metody systemowe i decyzyjne w informatyce

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Testowanie hipotez statystycznych

Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j

Algorytmy metaheurystyczne Wykład 11. Piotr Syga

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

ALGORYTMY SZTUCZNEJ INTELIGENCJI

Metody kodowania wybranych cech biometrycznych na przykładzie wzoru naczyń krwionośnych dłoni i przedramienia. Mgr inż.

Przedmowa Wykaz oznaczeń Wykaz skrótów 1. Sygnały i ich parametry Pojęcia podstawowe Klasyfikacja sygnałów

PL B1. Sposób i układ pomiaru całkowitego współczynnika odkształcenia THD sygnałów elektrycznych w systemach zasilających

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

KATEDRA SYSTEMÓW MULTIMEDIALNYCH. Inteligentne systemy decyzyjne. Ćwiczenie nr 12:

ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU

Propozycje tematów prac magisterskich 2013/14 Automatyka i Robotyka - studia stacjonarne Pracowania Układów Elektronicznych i Przetwarzania Sygnałów

WYKŁAD 4 PLAN WYKŁADU. Sieci neuronowe: Algorytmy uczenia & Dalsze zastosowania. Metody uczenia sieci: Zastosowania

Analiza skupień. Analiza Skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania

9. Praktyczna ocena jakości klasyfikacji

METODY INŻYNIERII WIEDZY

Laboratorium EAM. Instrukcja obsługi programu Dopp Meter ver. 1.0

Adrian Horzyk

ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU

ALGORYTM UZUPEŁNIANIA BRAKUJĄCYCH DANYCH W ZBIORACH REJESTROWANYCH NA STACJACH MONITORINGU POWIETRZA

Oprogramowanie Systemów Obrazowania SIECI NEURONOWE

ciężkości. Długości celowych d są wtedy jednakowe. Do wstępnych i przybliżonych analiz dokładności można wykorzystywać wzór: m P [cm] = ± 0,14 m α

Transkrypt:

BIULETYN INSTYTUTU AUTOMATYKI I ROBOTYKI NR, 005 Metoda weryfikacji mówcy na podstawie nieuzgodnionej wypowiedzi Leszek GRAD Zakład Automatyki, Instytut Teleinformatyki i Automatyki WAT, ul. Kaliskiego, 00-908 Warszawa STRESZCZENIE: W artykule została przedstawiona metoda weryfikacji mówcy na podstawie nieuzgodnionej wypowiedzi (ang. text independent). Metoda ta oparta jest na metodzie niezależnej detekcji klas, zaliczanej do metod klasyfikacji minimalnoodległościowych. Zagadnienie weryfikacji mówcy cieszy się obecnie dużym zainteresowaniem, głównie ze względu na fakt praktycznego wykorzystania do zdalnego uwierzytelniania osób w systemach informatycznych. Współczesne systemy silnego uwierzytelniania, bazujące na cechach biometrycznych, dla zapewnienia dużej niezawodności zmuszone są do realizacji weryfikacji tożsamości na podstawie większej liczby cech, np. obrazu siatkówki oka, linii papilarnych. Takie podejście sprawia, że celowe staje się opracowywanie i rozwijanie metod weryfikacji na podstawie głosu, nawet w przypadku kiedy stosowane samodzielnie nie gwarantują wystarczającej niezawodności. Do podstawowych metod wykorzystywanych w zadaniach rozpoznawania osób na podstawie głosu należy zaliczyć: metodę ukrytych modeli Markowa [8] oraz metodę sztucznych sieci neuronowych. Zaproponowana w niniejszym artykule metoda niezależnej detekcji klas należy do grupy metod klasyfikacji minimalnoodległościowych. Jej cechą charakterystyczną jest to, że uwzględnia w procesie podejmowania decyzji rozproszenie wzorców. 93

L. Grad. Umiejscowienie zadania weryfikacji mówcy Zadania rozpoznawania w dziedzinie sygnału mowy można podzielić na rozpoznawanie mowy (treści wypowiedzi) oraz rozpoznawanie mówców (osób na podstawie próbki zarejestrowanego głosu) (rys. ). Rozpoznawanie mówcy może polegać na jego identyfikacji (w zamkniętym lub otwartym zbiorze mówców) lub weryfikacji. W przypadku identyfikacji mówcy w zbiorze zamkniętym, system określa, do której spośród osób zarejestrowanych w systemie należy badana próbka głosu. W przypadku identyfikacji w otwartym zbiorze mówców, możliwa jest decyzja o odrzuceniu próbki. Weryfikacja mówcy jest zadaniem potwierdzenia deklarowanej tożsamości. Weryfikacja oraz identyfikacja w otwartym zbiorze są zadaniami blisko ze sobą związanymi ze względu na metodę. Rozpoznawanie mówcy Rozpoznawanie mowy Identyfikacja mówcy Weryfikacja mówcy w zbiorze zamkniętym w zbiorze otwartym Rys.. Klasyfikacja zadań rozpoznawania w dziedzinie sygnału mowy Systemy rozpoznawania mówców można również podzielić, stosując jako kryterium wymagania systemu na wypowiedź. Podstawowy podział został pokazany na rysunku. Wyróżniamy systemy, które wymagają podania konkretnej wypowiedzi (hasła), oraz takie, których wymagania na wypowiedź są mniejsze (z ustalonym słownikiem, oczekujące na zdarzenie fonetyczne) lub nie 94 Biuletyn Instytutu Automatyki i Robotyki, /005

Metoda weryfikacji mówcy na podstawie nieuzgodnionej wypowiedzi ma ich praktycznie wcale. Pierwsze z nich można nazwać systemami z uzgodnioną wypowiedzią (ang. text dependent), a drugie systemami z nieuzgodnioną wypowiedzią (ang. text independent) [5]. Systemy rozpoznawania mówców z uzgodnioną wypowiedzią z nieuzgodnioną wypowiedzią z hasłem osobistym z hasłem ogólnym z ustalonym słownikiem zależne od zdarzenia bez ograniczeń Rys.. Podział systemów rozpoznawania mówców ze względu na wymagania stawiane wypowiedzi Prezentowana w artykule metoda weryfikacji mówcy nie stawia wymagań co do treści wypowiedzi, wymagane jest jedynie, aby wypowiedź zawierała okresy dźwięczne.. Ogólny schemat procesu weryfikacji mówcy Systemy weryfikacji mówcy w sposób jawny lub ukryty badają zgodność wypowiedzi ze wzorcem osoby, której tożsamość jest deklarowana. W przypadku jawnego badania zgodności wyróżnia się dwa etapy. W etapie pierwszym obliczana jest odległość od wzorca. Etap drugi polega na sprawdzeniu, czy odległość nie przekracza odległości granicznej, zwanej progiem. Jeśli tak, to użytkownik przechodzi weryfikację pozytywnie. Ogólny schemat weryfikacji mówcy przedstawiony został na rysunku 3. Biuletyn Instytutu Automatyki i Robotyki, /005 95

L. Grad Zarówno wzorce mówców, jak i wartości progowe, są wyznaczane w procesie treningu (uczenia) poprzedzającym właściwą pracę systemu. wypowiedź ocena zgodności ze decyzja {0,} wzorcem mówcy układ progowy Rys. 3. Ogólny schemat procesu weryfikacji mówcy 3. Wskaźniki oceny jakości systemu weryfikacji mówców W systemie weryfikacji mówcy wyróżnia się następujące zdarzenia: - prawidłową akceptację akceptację mówcy autentycznego (ma miejsce w przypadku gdy tożsamość: deklarowana i rzeczywista są zgodne i system zaakceptuje mówcę), - fałszywą akceptację akceptacją oszusta (ma miejsce w przypadku gdy tożsamość deklarowana nie jest zgodna z rzeczywistą, a system zaakceptuje mówcę), - fałszywe odrzucenie odrzucenie mówcy autentycznego (ma miejsce w przypadku gdy tożsamość: deklarowana i rzeczywista są zgodne, a system odrzuci mówcę), - prawidłowe odrzucenie odrzucenie oszusta (ma miejsce w przypadku gdy tożsamość deklarowana nie jest zgodna z rzeczywistą i system odrzuci mówcę). Zdarzeniami niepożądanymi w systemie weryfikacji mówców są: fałszywe odrzucenie oraz fałszywa akceptacja. Prawdopodobieństwa tych zdarzeń ocenia się na podstawie: stopy fałszywego odrzucenia oraz stopy fałszywej akceptacji. Sposób ich obliczania przedstawiono poniżej. Szczegółowy opis wskaźników oceny stosowanych w systemach rozpoznawania przedstawiono w [7]. 96 Biuletyn Instytutu Automatyki i Robotyki, /005

Metoda weryfikacji mówcy na podstawie nieuzgodnionej wypowiedzi Stopa fałszywego odrzucenia: N α = W, N 0 N i= ( ) u i gdzie: u i wypowiedź należąca do weryfikowanego mówcy, N liczba wypowiedzi mówcy. W ( u ) i gdy d = 0 gdy d ( ui) ( u ) i Θ, > Θ gdzie: i d u i funkcjonał zgodności wypowiedzi u i ze wzorcem mówcy, Θ wartość progowa. u wypowiedź mówcy, ( ) Stopa fałszywej akceptacji: M M j= ( ) β = W u j, M 0, gdzie: u j wypowiedź nienależąca do weryfikowanego mówcy (fałszywa), M liczba wypowiedzi fałszywych. Uniwersalnym miernikiem jakości działania sytemu weryfikacji mówcy, pozwalającym na porównywanie jakości działania różnych systemów weryfikacji, jest wskaźnik EER (ang. Equal Error Rate) wyznaczany jako wartość α ( ΘEER) = β( Θ EER ) uzyskiwana w punkcie przecięcia przebiegów: stopy fałszywego odrzucenia i stopy fałszywej akceptacji w funkcji progu Θ (rys. 4). Fakt przyjęcia takiego wskaźnika oceny nie oznacza, że wartość progowa Θ powinna być ustalana w punktach przecięcia wykresów stóp. Zwykle dąży się do zapewnienia większego bezpieczeństwa działania systemu i rzeczywisty próg jest przesunięty, tak aby prawdopodobieństwo fałszywej akceptacji było mniejsze. Biuletyn Instytutu Automatyki i Robotyki, /005 97

L. Grad α ( Θ) β( Θ) Θ EER Θ Rys. 4. Sposób określania wskaźnika EER 4. Ekstrakcja cech sygnału mowy Proponowana w artykule metoda wymaga dokonania parametrycznego opisu ramek sygnału mowy. Wcześniejsze badania autora [3] wskazują na to, że opis sygnału mowy wektorem współczynników liniowego kodowania predykcyjnego (LPC ang. Linear Predictive Coding) daje dobre rezultaty w zadaniach rozpoznawania mówców [3]. Przesłankami przemawiającymi za wyborem tego sposobu opisu są także: - współczynniki LPC są wykorzystywane do modelowania toru głosowego człowieka; należy oczekiwać, że modele te będą różne dla różnych osób; - metoda LPC zapewnia dużą dokładność aproksymacji sygnału mowy; współczynniki LPC stosowane są do kodowania głosu (standardy LPC-0, CELP); metoda LPC zapewnia duży stopień kompresji przy jednoczesnym zachowaniu dobrej wierności odtworzenia, potwierdziły to także wyniki porównania z nieliniowym modelem predykcji []; - istnieją ścisłe zależności pomiędzy współczynnikami LPC a parametrami uzyskiwanymi z widma sygnału. Opis sposobów wyznaczania współczynników LPC można znaleźć w []. 98 Biuletyn Instytutu Automatyki i Robotyki, /005

Metoda weryfikacji mówcy na podstawie nieuzgodnionej wypowiedzi 5. Metoda niezależnej detekcji klas w zadaniu weryfikacji mówcy Do rozwiązania zadania weryfikacji mówcy wykorzystano metodę niezależnej detekcji klas, zaliczaną do metod klasyfikacji minimalnoodległościowej [6]. Charakteryzuje ją to, że odległość do każdej klasy (zgodność ze wzorcem klasy) mierzona jest w sposób uwzględniający korelację i rozproszenie elementów z klasy. Do oceny zgodności wektora cech u z klasą wykorzystuje się liniowe, ortogonalne przekształcenie Karhunena-Loeve a (K-L) o macierzy przekształcenia T, utworzonej z wektorów własnych t i macierzy kowariancji ( u )( ) T j u u j u T [ t t..., ] T R= E w następujący sposób: =,, t p, p - długość wektora cech u j. Wektory u j należą do jednej klasy w zbiorze uczącym, a u jest wartością oczekiwaną elementów tej klasy. Ocena zgodności badanej cechy z zadaną klasą polega na obliczeniu różnicy badanej cechy u i wartości oczekiwanej u cech w klasie, tzn. wartości: u ~ = u u, a następnie na zastosowaniu do otrzymanej różnicy przekształcenia K-L: y = Tu~. Unormowanie oceny zgodności polega na unormowaniu składowych transformaty K-L w następujący sposób: z = [ z, z,..., z ] p T = y, λ y,..., λ y p λp T Jako funkcjonał oceny zgodności wektora cech u z klasą przyjmuje się kwadrat normy wektora z : k p p T y d( u ) = z z= zk =. k= k= λ k Biuletyn Instytutu Automatyki i Robotyki, /005 99

L. Grad Proces weryfikacji z wykorzystaniem niezależnej detekcji klas musi zostać poprzedzony procesem uczenia. Uczenie polega na wyznaczeniu dla każdej u, T, λ. klasy, na podstawie zbioru uczącego, trójki ( ) Określanie wzorca mówcy uczenie Poniżej przedstawiony został algorytm określania wzorców, zwany też procesem uczenia lub treningu.. Pozyskanie kilkunastosekundowego nagrania wypowiedzi mówcy, nazwanego wypowiedzią uczącą.. Podział wypowiedzi uczącej na segmenty czasowe o jednakowej długości. Długość segmentu powinna wynosić od kilkunastu do kilkudziesięciu milisekund. 3. Wyznaczenie dla każdego segmentu wektora cech w postaci wektora a współczynników LPC. Informacja o położeniu wektorów cech w czasie nie jest istotna z punktu widzenia proponowanej metody. Dlatego też otrzymane wektory traktowane są jako zbiór: A = a a,..,, gdzie N jest liczbą segmentów. { }, a N 4. Grupowanie wektorów cech. W procesie tym zbiór wektorów cech A, otrzymany z wypowiedzi uczącej, poddawany jest procesowi grupowania. W tym celu można wykorzystać jedną ze znanych metod grupowania. W wyniku procesu grupowania, zbiór A zostaje podzielony na L grup G i, i=,,..., L. Oznacza to, że z wypowiedzi uczącej każdego mówcy zostaje wyłonionych L grup cech. 5. Utworzenie wzorca mówcy. Dla każdej grupy G i, w procesie uczenia wyznaczyć należy trójkę( a i, Ti, λi). Wzorzec mówcy jest rozumiany jako zbiór L trójek ( a i, Ti, λi), i =,,..., L, z których każda stanowi wzorzec grupy wektorów cech. 00 Biuletyn Instytutu Automatyki i Robotyki, /005

Metoda weryfikacji mówcy na podstawie nieuzgodnionej wypowiedzi Przebieg procesu weryfikacji d wektora cech ze wzorcem mówcy jest wyznaczany w układzie niezależnej detekcji klas, zgodnie ze schematem przedstawionym na rysunku 5. Wskaźnik zgodności ( a) ocena zgodności ze wzorcem grupy G ~ a = a a y = T ~ a d p ( a) = i y λ i= i a ~ a = a a y = T ~ a d p ( a ) = y λ i i= i min ocena zgodności ze wzorcem grupy G : : d ( a) ~ a = a L a L y L = T ~ LaL d L p ( a ) = i= y λ Li Li ocena zgodności ze wzorcem grupy G L Rys. 5. Schemat oceny zgodności wektora cech ze wzorcem mówcy Ocena zgodności wypowiedzi A ze wzorcem mówcy jest dana wzorem: d M i M ( A ) d( a ), A= { a, a,..., a } = M i= gdzie M jest liczbą segmentów wydzielonych z wypowiedzi A. Odpowiedź systemu weryfikacji mówcy jest wyznaczana zgodnie z zależnością: ( A) ( A), gdy d Θ W ( A) =. 0, gdy d >Θ, Biuletyn Instytutu Automatyki i Robotyki, /005 0

L. Grad 6. Wyniki badań Badania weryfikacji mówców przeprowadzono z wykorzystaniem bazy nagrań Student. Baza ta zawiera 800 elementów. Słownik bazy składa się z 0 słów (tab..), 0 powtórzeń każdego słowa przez każdego z 7 mówców, czyli: 7 mówców x 0 słów x 0 powtórzeń = 800 elementów. Próbki sygnału mowy zostały nagrane przy pomocy komputera klasy PC z systemem operacyjnym Windows, wyposażonego w kartę muzyczną klasy Sound Blaster. Parametry akwizycji sygnału były następujące: częstotliwość próbkowania khz, kwantyzacja 6-bitowa. Tab.. Wykaz słów słownika bazy Student Lp. Słowo zero jeden 3 dwa 4 trzy 5 cztery 6 pięć 7 sześć 8 siedem 9 osiem 0 dziewięć broda Danuta 3 kałamarz 4 kapitan 5 mama 6 metoda 7 moda 8 sezam 9 szczęście 0 zdrowie Badania weryfikacji mówcy przeprowadzono przy następujących wartościach parametrów segmentacji czasowej i ekstrakcji parametrów: - szerokość okna czasowego 30 ms, - skok okna czasowego 0 ms, - liczba współczynników LPC p=0. 0 Biuletyn Instytutu Automatyki i Robotyki, /005

Metoda weryfikacji mówcy na podstawie nieuzgodnionej wypowiedzi Tab.. Podział słów ze słownika na zbiór uczący i testowy jeden dwa trzy cztery pięć sześć broda Zbiór uczący Danuta kałamarz kapitan mama szczęście metoda siedem osiem dziewięć moda sezam zdrowie Zbiór testowy Liczbę grup, na którą dzielono wektory cech w trakcie procesu uczenia, przyjęto równą [5]. Wypowiedzi uczące zostały utworzone ze słów słownika bazy Student zamieszczonych w lewej kolumnie tabeli. Pozostałe (zamieszczone w prawej kolumnie) zostały wykorzystane do testów. Ze słów słownika bazy utworzono wypowiedzi testowe (tab. 3.), które następnie podano na wejście systemu. Dla testu wygenerowanych zostało 450 wypowiedzi. Otrzymane wyniki przedstawione zostały w tabeli 4. Wyznaczone zostały indywidualne dla każdego mówcy progi układu decyzyjnego. Wskaźniki EER (stopa fałszywego odrzucenia równa stopie fałszywej akceptacji) wahały się dla poszczególnych mówców od 0,0 do 0,5. Wartość średnia dla siedmiu mówców wyniosła EER=0,07. Wynik należy uznać za zadowalający. Tab. 3. Wypowiedzi testowe Wypowiedzi testowe siedem_osiem_dziewięć osiem_dziewięć_moda dziewięć_moda_sezam moda_sezam_siedem sezam_siedem_zdrowie Tab. 4. Wyniki weryfikacji mówców z bazy Student Mówca A B C D E F G EER 0,35 0,030 0,05 0,50 0,00 0,045 0,00 Biuletyn Instytutu Automatyki i Robotyki, /005 03

L. Grad 7. Podsumowanie Zaproponowana w pracy metoda weryfikacji realizuje rozpoznawanie w przestrzeni współczynników LPC sygnału mowy. Wykorzystuje technikę grupowania oraz metodę niezależnej detekcji klas, opartą na transformacie Karhunena-Loeve`a. Cechuje się: dobrą skutecznością (wartość średnia EER=0,07), niską uciążliwością pozyskiwania danych do procesu uczenia (kilkunastosekundowa wypowiedź ucząca) oraz niskimi kosztami obliczeniowymi procesu uczenia i rozpoznawania. Literatura [] Basztura Cz. i inni: Metody parametryzacji sygnału mowy do automatycznego rozpoznawania głosów, Prace Naukowe ITiA Politechniki Wrocławskiej, nr 3, 990. [] Grad L.: Badania porównawcze zastosowania liniowego i nieliniowego modelu predykcji w analizie sygnału mowy, Biuletyn IAiR, nr 0, WAT, Warszawa, 999. [3] Grad L.: Badanie możliwości rozpoznawania mówcy na podstawie reprezentacji LPC sygnału mowy, Biuletyn IAiR, nr 3, WAT, Warszawa, 000. [4] Grad L.: Zastosowanie transformaty Karhunena-Loeve a do rozpoznawania mówcy, Biuletyn IAiR, nr 3, WAT, Warszawa, 000. [5] Grad L.: Rozpoznawanie mówcy metodą niezależnej detekcji klas, Rozprawa doktorska, WAT, 00. [6] Kwiatkowski W.: Metody automatycznego rozpoznawania wzorców, WAT, Warszawa, 00. [7] Wiśniewski A. M.: Metody oceny systemów rozpoznawania mówców, Biuletyn IAiR, nr 3, WAT, Warszawa, 000. [8] Wiśniewski A. M.: Niejawne modele Markowa w rozpoznawaniu mowy, Biuletyn IAiR, nr 7, WAT, Warszawa, 997. Recenzent: prof. dr hab. inż. Włodzimierz Kwiatkowski Praca wpłynęła do redakcji: 4..005 04 Biuletyn Instytutu Automatyki i Robotyki, /005