TWORZENIE MODELU AKUSTYCZNEGO NA POTRZEBY WERYFIKACJI MÓWCY PRZY UŻYCIU UKRYTYCH MODELI MARKOWA

Wielkość: px
Rozpocząć pokaz od strony:

Download "TWORZENIE MODELU AKUSTYCZNEGO NA POTRZEBY WERYFIKACJI MÓWCY PRZY UŻYCIU UKRYTYCH MODELI MARKOWA"

Transkrypt

1 MODELOWANIE INŻYNIERSKIE ISSN X 40, s , Gliwice 2010 TWORZENIE MODELU AKUSTYCZNEGO NA POTRZEBY WERYFIKACJI MÓWCY PRZY UŻYCIU UKRYTYCH MODELI MARKOWA IWONA WANAT MAREK IWANIEC Katedra Automatyzacji Procesów, Wydział Inżynierii Mechanicznej i Robotyki Akademia Górniczo-Hutnicza im. St. Staszica w Krakowie wanat@agh.edu.pl, iwaniec@agh.edu.pl Streszczenie. Artykuł porusza zagadnienia związane z wykorzystaniem głosu w celu weryfikacji mówców. Przedstawiono w nim poszczególne etapy konstrukcji systemu informatycznego, a w szczególności wstępną obróbkę danych, ekstraktor cech osobniczych oraz klasyfikator. Ponadto z danych głosowych zostały wyodrębnione współczynniki MFCC (ang. Mel Frequency Cepstrum Coefficients), obliczono również ich pierwszą i drugą pochodną. W ostatnim - trzecim etapie, jako narzędzie klasyfikujące, wykorzystano ukryte modele Markowa. Uzyskano bardzo wysoki współczynnik pozytywnej weryfikacji mówcy na poziomie 98%. 1. WSTĘP Biometria jest techniką pomiarową, w której źródłem danych są istoty żywe. Znajduje ona głównie zastosowanie w automatycznym rozpoznawaniu ludzi na podstawie ich cech behawioralnych (np. akcent, podpis odręczny, pisanie na klawiaturze) oraz cech fizjologicznych (np. linie papilarne, DNA, kształt ucha). Wypowiedź słowna, oprócz informacji o treści wypowiedzi, zawiera w sobie także informacje związane z wewnętrzną strukturą jej źródła. Biometrię głosową, której charakterystyką jest sygnał mowy, można wykorzystywać do identyfikacji danej osoby. Wymieniony rodzaj rozpoznawania mówcy jest podobny do procedury biometrycznej związanej z odciskami palców, gdyż głos każdego człowieka, podobnie jak linie papilarne, jest unikalny [6]. Sygnał mowy jest nośnikiem zarówno cech fizjologicznych, takich jak trakt głosowy lub częstotliwość tonu podstawowego, jak również cech behawioralnych, do których zalicza się akcent lub sposób wypowiadania określonych słów. Powyższe cechy, wyodrębniane z głosu, związane są przede wszystkim z budową organów artykulacyjnych, pewnymi przyzwyczajeniami nabytymi w trakcie nauki mówienia, a także z umiejętnością posługiwania się danym językiem. Dodatkowymi parametrami jakie mają wpływ na charakterystyki biometryczne mówców są: płeć, stan zdrowia, pora dnia, wiek, pochodzenie regionalne, język narodowy, itp.[1]. Rozpoznawanie znanych nam osób na podstawie głosu jest czynnością, która nie sprawia żadnych problemów w kontaktach międzyludzkich. Powszechność i naturalność tego

2 250 I. WANAT, M. IWANIEC zjawiska powoduje, iż nie zdajemy sobie sprawy jakie cechy wypowiedzi są wyodrębniane w tym naturalnym procesie. Obecnie, za pomocą metod numerycznych jesteśmy w stanie zautomatyzować ekstrakcję cech osobniczych i w bardzo krótkim czasie rozpoznać głos mówcy wśród tysięcy innych głosów. Zastosowanie takich systemów jest bardzo szerokie, począwszy od weryfikacji naszej tożsamości podczas przeprowadzania transakcji finansowych za pomocą telefonu, umożliwiania dostępu do zabezpieczonych obszarów, a skończywszy na potwierdzeniu tożsamości w systemach kryminalistyki. Analiza głosu jest przedmiotem badań specjalistów z wielu dziedzin: fonetyków, foniatrów, logopedów i specjalistów od telekomunikacji, ale pomimo trwających już dziesiątki lat badań, sygnał mowy wciąż uznawany jest za bardzo złożony i trudny do pełnej interpretacji [7][8]. Prezentowany w artykule system weryfikacji mówcy wykorzystuje biometrię głosu, która może być zastosowana w praktyce. W opisywanym programie zaimplementowano szereg znanych procedur ekstrakcji cech, a ich odpowiednie połączenie i przystosowanie do procesu weryfikacji pozwoliło osiągnąć bardzo dużą skuteczność systemu. Dodatkowo zastosowano, omawiane często w literaturze [1][4][5], ukryte modele Markowa, których parametry zostały zmodyfikowane tak, aby jakość weryfikacji była jak największa. W dalszej części artykułu opisane zostaną poszczególne etapy procesu weryfikacji, zaimplementowane w utworzonym przez autorów programie. 2. RODZAJE SYSTEMÓW ROZPOZNAWANIA MÓWCÓW Wyróżnić można różne rodzaje systemów rozpoznawania mówcy (rys. 1). W istniejących systemach rozpoznawania mówcy wyróżnia się dwa główne typy: weryfikację oraz identyfikację mówcy [1][4]. Oba powyższe typy różnią się od siebie przede wszystkim stosowaną teorią i techniką przetwarzania, jak również nakładem obliczeniowym. Rys.1 Podział przetwarzania mowy [2] Identyfikacja mówcy jest procesem decyzyjnym, w którym na wejście wprowadzamy tylko wektor cech wyekstrahowany z sygnału mowy, natomiast na wyjściu otrzymujemy tożsamość przypisaną do danych wejściowych. System ma za zadanie zaklasyfikowanie głosu danej osoby do jednego z N elementowego zbioru mówców. Należy zaznaczyć, iż istnieje możliwość identyfikacji w zbiorze zamkniętym lub w zbiorze otwartym. Przy zastosowaniu

3 TWORZENIE MODELU AKUSTYCZNEGO NA POTRZEBY WERYFIKACJI MÓWCY PRZY 251 identyfikacji w zbiorze zamkniętym system przypisuje głosowi wejściowemu jedną z N dopuszczalnych tożsamości. Tymczasem w przypadku identyfikacji w zbiorze otwartym możliwe jest podjęcie dodatkowej decyzji, jaką jest odrzucenie danego głosu i nieprzypisanie mu żadnej tożsamości. Weryfikacja mówcy jest także procesem decyzyjnym, w którym na wejściu wprowadzamy wektor cech, a rozpoznawana osoba podaje swoją tożsamość. W tym przypadku system ma podjąć binarną decyzję, czy nieoznaczony głos należy do deklarowanego mówcy czy też nie. Weryfikacja mówcy jest jednym z przypadków identyfikacji w zbiorze otwartym, gdzie zbiór mówców jest jednoelementowy. Należy zwrócić uwagę na jedną z ważnych charakterystyk systemów rozpoznawania mówców, jaką jest zależność od treści wypowiedzi, na podstawie której następuje proces decyzyjny. Rozróżnia się systemy zależne (ang. text-dependent) i niezależne od tekstu (ang. text-independent). W pierwszym przypadku skład lingwistyczny ciągu uczącego i wypowiedzi, za pomocą której dana osoba jest weryfikowana, są takie same. Natomiast gdy te dwie wypowiedzi różnią się od siebie (np. kolejnością), mówimy o systemie weryfikacji niezależnym od tekstu. Zaprezentowany w artykule system weryfikacji mówcy jest zależny od tekstu. Działanie systemu polega na stworzeniu modeli Markowa dla wszystkich dziesięciu cyfr, które w procesie decyzyjnym stanowią wzorzec głosu osoby weryfikowanej. W procesie weryfikacji użytkownik systemu wypowiada pięć losowo wybranych cyfr. Ogólną akceptację uzyskuje się, gdy trzy z pięciu cyfr zostaną zaakceptowane przez system, w przeciwnym wypadku użytkownik nie zostaje pozytywnie zweryfikowany. 3. PRZEBIEG PROCESU WERYFIKACJI MÓWCY Procedurę weryfikacji mówców można ogólnie podzielić na trzy etapy. Pierwszy etap obejmuje próbkowanie i wstępne przetwarzanie sygnału mowy. W drugim etapie następuje ekstrakcja cech osobniczych głosu, które stanowią ciąg uczący w procesie klasyfikacji, następujący w trzecim etapie [1][3][5]. Klasyfikacji dokonuje się na podstawie podobieństwa uzyskanych wartości cech próbek sygnału do ich odpowiedników określonych wcześniej (w tzw. procesie nauczania) dla poszczególnych osób. Schemat procedury weryfikacji mówcy przedstawiono na rys.2. Rys.2 Schemat procedury weryfikacji mówcy [2]

4 252 I. WANAT, M. IWANIEC 3.1 Przetwarzanie wstępne Wstępne przetwarzanie sygnału mowy jest bardzo ważnym etapem obróbki danych, gdyż poprzedza wprowadzenie sygnału na ekstraktor cech i ma fundamentalne znaczenie dla jakości procesu weryfikacji mówcy. Głównym celem obróbki wstępnej sygnału mowy jest uniezależnienie weryfikacji mówcy od ustawień sprzętu nagrywającego, czyli mikrofonu. Na tym etapie przeprowadzana jest filtracja, a także normalizacja, gdyż te dwie procedury w dużym stopniu niwelują różnice wynikające z różnych poziomów głośności oraz poziomu podawania sygnału mowy przez mikrofon. W przedstawianym systemie zastosowano standardowy proces preemfazy. W programie spełnia on ważną rolę, która polega na skalowaniu mocy sygnału, aby różne częstotliwości były na podobnym poziomie. Dodatkowo proces ten wzmacnia wysokie częstotliwości sygnału mowy o ponad 20 db, co skutkuje dużą odpornością na zakłócenia otoczenia. Jak już wspomniano, sygnał mowy jest poddawany procesowi filtracji. W aplikacji zastosowano cyfrowy filtr górnoprzepustowy o skończonej odpowiedzi impulsowej. Drugim krokiem wstępnego przetwarzania jest normalizacja, której zadaniem jest wzmocnienie użytecznej składowej sygnału poprzez wprowadzenie niewielkiego zniekształcenia nieliniowego. 3.2 Ekstraktor cech osobniczych Etap ekstrakcji cech osobniczych mówcy podzielono na dwa etapy. W pierwszym kroku obliczany jest ton krtaniowy danej osoby, a następnie, gdy przejdzie on weryfikację częstotliwości podstawowej, mówca przechodzi do drugiego etapu rozpoznawania. Ton krtaniowy jest związany z wibracjami więzadeł głosowych, czyli z budową narządu artykulacyjnego. Początkowo głośnia jest zamknięta, jednak przepływający strumień powietrza wymusza periodyczne otwieranie i zamykanie narządu. W zależności od cech danej osoby ton krtaniowy znajduje się w przedziale Hz. W trakcie drugiego etapu weryfikacji z sygnału mowy wyodrębniane są współczynniki MFCC (ang. Mel Frequency Cepstrum Coefficients). Powodem, dla którego wybrano powyższe współczynniki, jest potrzeba odzwierciedlania procesu percepcji przez ucho ludzkie, które postrzega częstotliwość sygnału dźwiękowego nieliniowo logarytmicznie. Wówczas, gdy zwiększymy częstotliwość sygnału dwukrotnie, ludzkie ucho postrzega to jako podniesienie tonu o oktawę do góry. Rys.3 Bank filtrów w częstotliwościowej skali mel W wyniku tego niskie częstotliwości powinny być oddalone od siebie o kilkanaście Hz, a wraz ze wzrostem częstotliwości ta odległość musi wzrastać. Przy zastosowaniu samej

5 TWORZENIE MODELU AKUSTYCZNEGO NA POTRZEBY WERYFIKACJI MÓWCY PRZY 253 transformaty Fouriera otrzymane widmo próbki jest liniowo rozłożone na osi częstotliwości. Jednak gdy dane widmo przemnożymy przez bank filtrów, w częstotliwościowej skali mel (rys.3) spowodujemy dodatkowe nieliniowe przekształcenie skali częstotliwości. Całość procedury obliczania współczynników MFCC przedstawiono na rys. 4. Rys. 4 Procedura obliczania współczynników Mel cepstrum W trakcie badania wpływu liczby współczynników na efektywność procesu weryfikacji stwierdzono, iż wykorzystanie 12 współczynników MFCC jest niesatysfakcjonujące. W związku z tym, po wyznaczeniu dla każdej ramki sygnału Q współczynników MFCC dodatkowo obliczono dla m-tej ramki parametr delta: c ( q) = c ( q) c ( q) (1) m m+ τ m τ oraz parametr delta-delta: c ( q) = c ( q) c ( q) (2) m m+ τ m τ gdzie q = 0, 1,, Q-1. Proces ten spowodował zwiększenie wektora cech do 36 parametrów. Delta oraz deltadelta współczynników MFCC przedstawiają ich dynamiczne zmiany, które dobrze identyfikują poszczególne jednostki mowy. Należy pamiętać, iż wspomniane dwa parametry liczone są dla odstępów czasowych równych dwóm chwilom czasowych. Zbyt małe odstępy mogą nie wychwycić wyraźnych zmian współczynników MFCC, natomiast duże mogą wyznaczyć różnicę między zbyt różnymi stanami. 3.3 Klasyfikator W niektórych przypadkach, metody dopasowania wzorców zapewniają w sposób wystarczający realizację zadania weryfikacji mówcy przy stosunkowo małych nakładach obliczeniowych. Wraz z pojawieniem się komputerów pojawiła się możliwość zastosowania złożonych algorytmów obliczeniowych. Szeroko stosowane metody oparte na funkcjach podobieństwa (np. metoda najbliższych sąsiadów) ustępują miejsca metodom analizy stochastycznej. Zamiast określania stopnia dopasowania wypowiedzi do wzorca mówcy obliczane jest prawdopodobieństwo uzyskania danej wypowiedzi przez opracowane modele akustyczne mówcy [4]. Przykładem opisanej metody jest modelowanie i rozpoznawanie mówcy za pomocą ukrytych modeli Markowa (ang. Hidden Markov Models HMM), należących do grupy stochastycznych modeli akustycznych sygnału mowy. Główną ideą ukrytych modeli Markowa jest traktowanie sygnału mowy jako sekwencji wektorów obserwacji, które z jednej strony stanowią ciąg uczący w tzw. procesie uczenia, gdy tworzony jest model akustyczny mówcy, a z drugiej strony są wyjściem modeli w tworzonym procesie weryfikacji. Dużą zaletą stosowanych modeli jest odporność systemów weryfikacji na zewnętrzne zakłócenia. Dzięki temu unika się stosowania skomplikowanych filtrów, które nie tylko zmniejszają wpływ zakłóceń, ale także w pewnym stopniu zniekształcają składowe sygnału niosące informacje o cechach osobniczych mówcy.

6 254 I. WANAT, M. IWANIEC Z punktu widzenia rozpoznawania mówcy najistotniejszą cechą modeli HMM jest możliwość modelowania sygnału mowy dla konkretnego mówcy. Realizację systemu weryfikacji mówcy podzielono na dwie fazy: 1) trening (tzw. proces uczenia), którego zadaniem jest estymacja parametrów zbioru modeli HMM za pomocą wypowiedzi uczących; 2) rozpoznawanie, w którym następuje obliczenie prawdopodobieństwa wygenerowania danej wypowiedzi przez konkretnego mówcę. W metodzie tej sygnał mowy traktowany jest jako ciąg kolejnych wektorów współczynników wyznaczanych w krótkich odcinkach czasu (tzw. ramkach), ponieważ zakłada się, iż sygnał mowy jest stacjonarny w czasie trwania jednej ramki. Dla konkretnej rozpoznawanej osoby, podane hasło przedstawiane jest jako ciąg T obserwacji O = {O 1,O 2,,O T }. W aplikacji dla każdej z cyfr tworzony jest oddzielny model. Model stanowi skończony automat, posiadający N stanów Q = {q 1,q 2,,q N }. HMM, reprezentowany przez automat skończony, definiowany jest jako tzw. trójka λ = <π, A, B>, gdzie: - π = [π 1, π 2,, π N ] stanowi opis rozkładu prawdopodobieństwa znalezienia się w stanie q k w chwili t =0, - A = [a ij ], i,j = 1,, N, jest macierzą obrazującą prawdopodobieństwo przejścia między stanami, - B = [b i (o j )], i = 1,, N, j = 1,, M (M liczba możliwych zdarzeń generowanych przez dany stan) jest macierzą obrazującą prawdopodobieństwo pojawienia się w j-tej obserwacji w stanie q i [4]: b o ) = P( o q ) (3) i ( j j i Rys.5 przedstawia przykładowy automat o trzech stanach reprezentujący model pewnego słowa. Rys. 5 Przykład modelu HMM, składającego się z trzech stanów wraz z określonymi prawdopodobieństwami przejść między poszczególnymi stanami 4. OPIS EKSPERYMENTÓW I UZYSKANE WYNIKI W stworzonej aplikacji pierwszą wykonywaną czynnością jest rejestracja użytkowników, polegająca na akwizycji sygnału mowy. Cyfrowy sygnał próbkowany jest z częstotliwością Hz. W następnym kroku obliczany jest ton krtaniowy. Jeżeli mówca uzyska pozytywną weryfikację tonu krtaniowego, ekstrahowane są obserwacje w postaci współczynników MFCC. Obserwacje stanowią ciąg uczący w trakcie procesu treningu, gdy tworzony jest model akustyczny dla konkretnego słowa danej osoby. Oznacza to, iż po każdym procesie uczenia, dla jednej osoby otrzymujemy 10 modeli akustycznych wszystkich cyfr. W początkowej fazie budowania systemu wykonano wiele badań związanych z ustawieniem odpowiednich parametrów (współczynników MFCC wraz z ich pierwszą i drugą pochodną oraz tonu krtaniowego). W eksperymentach wykorzystano bazę złożoną z 80 osób (30 kobiet, 50 mężczyzn). Pierwszym problemem było określenie liczby współczynników w wektorze cech osobniczych sygnału mowy. Na rys. 6 przedstawiono

7 TWORZENIE MODELU AKUSTYCZNEGO NA POTRZEBY WERYFIKACJI MÓWCY PRZY 255 krzywe weryfikacji trzech użytkowników, na którym kolejno zaznaczono sumaryczną odległość prawdopodobieństwa uzyskanego z modelu HMM dla cyfry jeden, po wyekstrahowaniu 12 współczynników MFCC oraz po dodaniu pierwszej i drugiej pochodnej współczynników MFCC do wektora obserwacji. W trakcie eksperymentów, do oceny opisywanego systemu wykorzystano stopę błędnych akceptacji FAR (ang. False Acceptance Rate) i błędnych odrzuceń FRR (ang. False Rejection Rate). Po analizie otrzymanych wyników okazało się, iż najlepszym rozwiązaniem jest zastosowanie 36 współczynników. Rys. 6 Sumaryczne odległości prawdopodobieństwa uzyskane na wyjściu z modelu HMM cyfry 1 dla każdego z trzech mówców przy zmiennej liczbie współczynników znajdujących się w wektorze cech Rys. 7 Wykres przedstawia sumaryczne odległości prawdopodobieństwa uzyskane na wyjściu z modelu HMM cyfry 1 dla zmiennej liczby próbek uczących. Zwiększenie liczby próbek do 10 spowodowało uzyskanie powtarzających się wyników weryfikacji dla danej osoby Ważnym parametrem programu, który należało zbadać, było określenie liczby próbek uczących. Na rys. 7 przedstawiono krzywe weryfikacji dla jednego użytkownika w zależności od liczby próbek uczących. Stwierdzono, iż optymalną wartością jest dziesięć próbek. Podczas eksperymentów wykazano znaczący wpływ pory dnia na jakość weryfikacji mówcy. Dlatego założono, że sygnały mowy, wykorzystywane do tworzenia modeli akustycznych, muszą być nagrywane w trzech porach dnia (rano, po południu i wieczorem).

8 256 I. WANAT, M. IWANIEC Po zakończeniu testów uzyskano średnią stopę niepoprawnej weryfikacji na poziomie 2%, natomiast średnia stopa poprawnej akceptacji wyniosła 98%. Należy zaznaczyć, iż nagrania były wykonywane w warunkach domowych oraz biurowych. 5. WNIOSKI Przedstawiony eksperyment miał na celu przede wszystkim dokonanie oceny przydatności i poprawności zaprezentowanych procedur weryfikacji mówcy. Uzyskana wysoka skuteczność w pełni potwierdza efektywność metody wyznaczania modeli akustycznych za pomocą ukrytych modeli Markowa. W przypadku przedstawionego systemu można mówić o przydatności stworzonej aplikacji w zastosowaniach praktycznych (np. potwierdzanie tożsamości w celu wykonania transakcji finansowych) jako dodatkowy moduł dla innych systemów weryfikacji osoby (np. rozpoznawanie na podstawie rysów twarzy użytkownika lub za pomocą karty tzw. chipowej). LITERATURA 1. Tadeusiewicz R.: Sygnał mowy. Warszawa: WKiŁ, Joseph P. Campbell: Speaker Recognition: a tutorial. In: Proceedings of the IEEE Vol. 85, No. 9, 1997, p Wolf J.J.: Efficient acoustic parameters for speaker recognition. J. Acoust. Soc. Amer. 1972, Vol. 51 No. 6 (part 2), p Furui S.: Recent advances in speaker recognition. Elselvier Science B.V., No. 18, 1997, p Doddington G.: Speaker recognition-identifying people by their voices. In: Proc. IEEE 1985, 73(11), p Jain, A. K., Ross, Arun; Prabhakar, Salil: An introduction to biometric recognition. In: IEEE Transactions on Circuits and Systems for Video Technology 2004, 14, p Niebudek-Bogusz E., Fiszer M., Kotyło P., Just M., Śliwińska-Kowalska M.: Ocena parametrów analizy akustycznej głosu u zdrowych kobiet. Otolaryngologia 2004, s Martin D.,Fitch J., Wolfe V.: Pathologic voice type and the acoustic prediction of severity. Journal of Speech and Hearing Research 1995, p CREATING THE SOUND MODEL FOR SPEAKER VERIFICATION USING HIDDEN MARKOV MODELS Summary. The article discusses issues related to the use of voice characteristics to verify the speakers. The various stages of system design are presented, in particular preliminary signal processing, extractor of individuals characteristics and classifier. MFCC coefficients are extracted from the voice data and then are calculated the first and second derivative of this coefficients. In the third stage, as a tool for classification, used hidden Markov models. A very high rate of positive verification of the speaker, at 98%, is achieved.

Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści

Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, 2011 Spis treści Przedmowa 11 Rozdział 1. WPROWADZENIE 13 1.1. Czym jest automatyczne rozpoznawanie mowy 13 1.2. Poziomy

Bardziej szczegółowo

Metoda weryfikacji mówcy na podstawie nieuzgodnionej wypowiedzi

Metoda weryfikacji mówcy na podstawie nieuzgodnionej wypowiedzi BIULETYN INSTYTUTU AUTOMATYKI I ROBOTYKI NR, 005 Metoda weryfikacji mówcy na podstawie nieuzgodnionej wypowiedzi Leszek GRAD Zakład Automatyki, Instytut Teleinformatyki i Automatyki WAT, ul. Kaliskiego,

Bardziej szczegółowo

PRAKTYCZNE ASPEKTY WYKORZYSTYWANIA SYSTEMÓW ROZPOZNAWANIA MOWY OPARTYCH NA HMM

PRAKTYCZNE ASPEKTY WYKORZYSTYWANIA SYSTEMÓW ROZPOZNAWANIA MOWY OPARTYCH NA HMM MODELOWANIE INŻYNIERSKIE ISSN 896-77X 40, s. 7-78, Gliwice 200 PRAKTYCZNE ASPEKTY WYKORZYSTYWANIA SYSTEMÓW ROZPOZNAWANIA MOWY OPARTYCH NA HMM AGNIESZKA MIETŁA, MAREK IWANIEC Katedra Automatyzacji Procesów,

Bardziej szczegółowo

Krzysztof Ślot Biometria Łódź, ul. Wólczańska 211/215, bud. B9 tel

Krzysztof Ślot Biometria Łódź, ul. Wólczańska 211/215, bud. B9 tel Krzysztof Ślot Biometria 9-924 Łódź, ul. Wólczańska 211/215, bud. B9 tel. 42 636 65 www.eletel.p.lodz.pl, ie@p.lodz.pl Wprowadzenie Biometria Analiza rejestrowanych zachowań i cech osobniczych (np. w celu

Bardziej szczegółowo

AKUSTYKA MOWY. Podstawy rozpoznawania mowy część I

AKUSTYKA MOWY. Podstawy rozpoznawania mowy część I AKUSTYKA MOWY Podstawy rozpoznawania mowy część I PLAN WYKŁADU Część I Podstawowe pojęcia z dziedziny rozpoznawania mowy Algorytmy, parametry i podejścia do rozpoznawania mowy Przykłady istniejących bibliotek

Bardziej szczegółowo

KATEDRA SYSTEMÓW MULTIMEDIALNYCH. Inteligentne systemy decyzyjne. Ćwiczenie nr 12:

KATEDRA SYSTEMÓW MULTIMEDIALNYCH. Inteligentne systemy decyzyjne. Ćwiczenie nr 12: KATEDRA SYSTEMÓW MULTIMEDIALNYCH Inteligentne systemy decyzyjne Ćwiczenie nr 12: Rozpoznawanie mowy z wykorzystaniem ukrytych modeli Markowa i pakietu HTK Opracowanie: mgr inż. Kuba Łopatka 1. Wprowadzenie

Bardziej szczegółowo

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H W O J S K O W A A K A D E M I A T E C H N I C Z N A W Y D Z I A Ł E L E K T R O N I K I Drukować dwustronnie P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H Grupa... Data wykonania

Bardziej szczegółowo

Technologia dynamicznego podpisu biometrycznego

Technologia dynamicznego podpisu biometrycznego Technologia dynamicznego podpisu biometrycznego Prof. Andrzej Czyżewski, Politechnika Gdańska VI Konferencja i Narodowy Test Interoperacyjności Podpisu Elektronicznego CommonSign 2016, 26 27. X. 2016 r.

Bardziej szczegółowo

Pattern Classification

Pattern Classification Pattern Classification All materials in these slides were taken from Pattern Classification (2nd ed) by R. O. Duda, P. E. Hart and D. G. Stork, John Wiley & Sons, 2000 with the permission of the authors

Bardziej szczegółowo

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Piotr Dalka Przykładowe algorytmy decyzyjne Sztuczne sieci neuronowe Algorytm k najbliższych sąsiadów Kaskada klasyfikatorów AdaBoost Naiwny

Bardziej szczegółowo

Omówienie różnych metod rozpoznawania mowy

Omówienie różnych metod rozpoznawania mowy Omówienie różnych metod rozpoznawania mowy Na podstawie artykułu: Comparative study of automatic speech recognition techniques Beniamin Sawicki Wydział Inżynierii Mechanicznej i Robotyki Inżynieria Akustyczna

Bardziej szczegółowo

System do sterowania ruchem kamery przemysłowej za pomocą komend głosowych

System do sterowania ruchem kamery przemysłowej za pomocą komend głosowych System do sterowania ruchem kamery przemysłowej za pomocą komend głosowych Dariusz Krala 1 1 Wydział Inżynierii Mechanicznej i Informatyki Kierunek Informatyka, Rok V {dariusz.krala}@gmail.com Streszczenie

Bardziej szczegółowo

PRZEWODNIK PO PRZEDMIOCIE

PRZEWODNIK PO PRZEDMIOCIE Nazwa przedmiotu: Kierunek: Informatyka Rodzaj przedmiotu: moduł specjalności obowiązkowy: Sieci komputerowe Rodzaj zajęć: wykład, laboratorium I KARTA PRZEDMIOTU CEL PRZEDMIOTU PRZEWODNIK PO PRZEDMIOCIE

Bardziej szczegółowo

BIOMETRIA. Napisz coś na klawiaturze, a powiem Ci. Wojciech Wodo Katedra Informatyki Wydział Podstawowych Problemów Techniki. Wrocław, r.

BIOMETRIA. Napisz coś na klawiaturze, a powiem Ci. Wojciech Wodo Katedra Informatyki Wydział Podstawowych Problemów Techniki. Wrocław, r. Wojciech Wodo Katedra Informatyki Wydział Podstawowych Problemów Techniki wojciech.wodo@pwr.edu.pl BIOMETRIA Napisz coś na klawiaturze, a powiem Ci czy jesteś tym, za kogo się podajesz Wrocław, 28.04.2016

Bardziej szczegółowo

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV Klasyfikatory: k-nn oraz naiwny Bayesa Agnieszka Nowak Brzezińska Wykład IV Naiwny klasyfikator Bayesa Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną

Bardziej szczegółowo

Agnieszka Nowak Brzezińska

Agnieszka Nowak Brzezińska Agnieszka Nowak Brzezińska jeden z algorytmów regresji nieparametrycznej używanych w statystyce do prognozowania wartości pewnej zmiennej losowej. Może również byd używany do klasyfikacji. - Założenia

Bardziej szczegółowo

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H W O J S K O W A A K A D E M I A T E C H N I C Z N A W Y D Z I A Ł E L E K T R O N I K I Drukować dwustronnie P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H Grupa... Data wykonania

Bardziej szczegółowo

Egzamin / zaliczenie na ocenę*

Egzamin / zaliczenie na ocenę* WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI Zał. nr 4 do ZW 33/01 KARTA PRZEDMIOTU Nazwa w języku polskim CYFROWE PRZETWARZANIE SYGNAŁÓW Nazwa w języku angielskim DIGITAL SIGNAL PROCESSING Kierunek studiów

Bardziej szczegółowo

ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU

ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU i klasyfikacja sygnału audio dr inż. Jacek Naruniec Sygnał mowy mózg (układ sterujący) głośnia (źródło dźwięku) rezonator akustyczny (filtr) sygnał mowy 2 Sygnał mowy

Bardziej szczegółowo

S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor

S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor S O M SELF-ORGANIZING MAPS Przemysław Szczepańczyk Łukasz Myszor Podstawy teoretyczne Map Samoorganizujących się stworzył prof. Teuvo Kohonen (1982 r.). SOM wywodzi się ze sztucznych sieci neuronowych.

Bardziej szczegółowo

ROZPOZNAWANIE SYGNAŁÓW FONICZNYCH

ROZPOZNAWANIE SYGNAŁÓW FONICZNYCH Przetwarzanie dźwięków i obrazów ROZPOZNAWANIE SYGNAŁÓW FONICZNYCH mgr inż. Kuba Łopatka, p. 628 klopatka@sound.eti.pg.gda.pl Plan wykładu 1. Wprowadzenie 2. Zasada rozpoznawania sygnałów 3. Parametryzacja

Bardziej szczegółowo

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów

Bardziej szczegółowo

dr inż. Jacek Naruniec

dr inż. Jacek Naruniec dr inż. Jacek Naruniec Przetwarzanie wstępne Wyznaczenie obszarów zainteresowania Ekstrakcja cech - dźwięk Klasyfikacja detekcja mowy okno analizy spektrogram filtr preemfazy wokodery (formantów, kanałowe,

Bardziej szczegółowo

2. Próbkowanie Sygnały okresowe (16). Trygonometryczny szereg Fouriera (17). Częstotliwość Nyquista (20).

2. Próbkowanie Sygnały okresowe (16). Trygonometryczny szereg Fouriera (17). Częstotliwość Nyquista (20). SPIS TREŚCI ROZDZIAŁ I SYGNAŁY CYFROWE 9 1. Pojęcia wstępne Wiadomości, informacje, dane, sygnały (9). Sygnał jako nośnik informacji (11). Sygnał jako funkcja (12). Sygnał analogowy (13). Sygnał cyfrowy

Bardziej szczegółowo

SYSTEM BIOMETRYCZNY IDENTYFIKUJĄCY OSOBY NA PODSTAWIE CECH OSOBNICZYCH TWARZY. Autorzy: M. Lewicka, K. Stańczyk

SYSTEM BIOMETRYCZNY IDENTYFIKUJĄCY OSOBY NA PODSTAWIE CECH OSOBNICZYCH TWARZY. Autorzy: M. Lewicka, K. Stańczyk SYSTEM BIOMETRYCZNY IDENTYFIKUJĄCY OSOBY NA PODSTAWIE CECH OSOBNICZYCH TWARZY Autorzy: M. Lewicka, K. Stańczyk Kraków 2008 Cel pracy projekt i implementacja systemu rozpoznawania twarzy, który na podstawie

Bardziej szczegółowo

Algorytm do rozpoznawania człowieka na podstawie dynamiki użycia klawiatury. Paweł Kobojek, prof. dr hab. inż. Khalid Saeed

Algorytm do rozpoznawania człowieka na podstawie dynamiki użycia klawiatury. Paweł Kobojek, prof. dr hab. inż. Khalid Saeed Algorytm do rozpoznawania człowieka na podstawie dynamiki użycia klawiatury Paweł Kobojek, prof. dr hab. inż. Khalid Saeed Zakres pracy Przegląd stanu wiedzy w dziedzinie biometrii, ze szczególnym naciskiem

Bardziej szczegółowo

8. Drzewa decyzyjne, bagging, boosting i lasy losowe

8. Drzewa decyzyjne, bagging, boosting i lasy losowe Algorytmy rozpoznawania obrazów 8. Drzewa decyzyjne, bagging, boosting i lasy losowe dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Drzewa decyzyjne Drzewa decyzyjne (ang. decision trees), zwane

Bardziej szczegółowo

Metody systemowe i decyzyjne w informatyce

Metody systemowe i decyzyjne w informatyce Metody systemowe i decyzyjne w informatyce Laboratorium JAVA Zadanie nr 2 Rozpoznawanie liter autorzy: A. Gonczarek, J.M. Tomczak Cel zadania Celem zadania jest zapoznanie się z problemem klasyfikacji

Bardziej szczegółowo

Ćwiczenie 4. Filtry o skończonej odpowiedzi impulsowej (SOI)

Ćwiczenie 4. Filtry o skończonej odpowiedzi impulsowej (SOI) Politechnika Wrocławska Wydział Elektroniki Mikrosystemów i Fotoniki Przetwarzanie sygnałów laboratorium ETD5067L Ćwiczenie 4. Filtry o skończonej odpowiedzi impulsowej (SOI) 1. Filtracja cyfrowa podstawowe

Bardziej szczegółowo

Agnieszka Nowak Brzezińska Wykład III

Agnieszka Nowak Brzezińska Wykład III Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe

Bardziej szczegółowo

Automatyka i Robotyka, V rok. promotor: dr Adrian Horzyk. Kraków, 3 czerwca System automatycznego rozpoznawania

Automatyka i Robotyka, V rok. promotor: dr Adrian Horzyk. Kraków, 3 czerwca System automatycznego rozpoznawania Automatyka i Robotyka, V rok Kraków, 3 czerwca 2009 promotor: dr Adrian Horzyk 1 2 i problemy 3 4 Technologie 5 Wyniki 6 Podział biometrii 7 cech opisujących parametry ludzi - A. K. Jain uniwersalność

Bardziej szczegółowo

Spacery losowe generowanie realizacji procesu losowego

Spacery losowe generowanie realizacji procesu losowego Spacery losowe generowanie realizacji procesu losowego Michał Krzemiński Streszczenie Omówimy metodę generowania trajektorii spacerów losowych (błądzenia losowego), tj. szczególnych procesów Markowa z

Bardziej szczegółowo

PRZEWODNIK PO PRZEDMIOCIE

PRZEWODNIK PO PRZEDMIOCIE Nazwa przedmiotu: Kierunek: Inżynieria Biomedyczna Rodzaj przedmiotu: obowiązkowy moduł kierunkowy ogólny Rodzaj zajęć: wykład, laboratorium I KARTA PRZEDMIOTU CEL PRZEDMIOTU CYFROWE PRZETWARZANIE SYGNAŁÓW

Bardziej szczegółowo

Komputerowe przetwarzanie sygnału mowy

Komputerowe przetwarzanie sygnału mowy Komputerowe przetwarzanie sygnału mowy Prof dr hab inż Bożena Kostek Katedra Systemów Multimedialnych Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska Komputerowe przetwarzanie sygnału

Bardziej szczegółowo

Agnieszka Nowak Brzezińska Wykład III

Agnieszka Nowak Brzezińska Wykład III Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe

Bardziej szczegółowo

ROZPOZNAWANIE GRANIC SŁOWA W SYSTEMIE AUTOMATYCZNEGO ROZPOZNAWANIA IZOLOWANYCH SŁÓW

ROZPOZNAWANIE GRANIC SŁOWA W SYSTEMIE AUTOMATYCZNEGO ROZPOZNAWANIA IZOLOWANYCH SŁÓW ROZPOZNAWANIE GRANIC SŁOWA W SYSTEMIE AUTOMATYCZNEGO ROZPOZNAWANIA IZOLOWANYCH SŁÓW Maciej Piasecki, Szymon Zyśko Wydziałowy Zakład Informatyki Politechnika Wrocławska Wybrzeże Stanisława Wyspiańskiego

Bardziej szczegółowo

Metodyka i system dopasowania protez słuchu w oparciu o badanie percepcji sygnału mowy w szumie

Metodyka i system dopasowania protez słuchu w oparciu o badanie percepcji sygnału mowy w szumie Metodyka i system dopasowania protez w oparciu o badanie percepcji sygnału mowy w szumie opracowanie dr inż. Piotr Suchomski Koncepcja metody korekcji ubytku Dopasowanie szerokiej dynamiki odbieranego

Bardziej szczegółowo

Podstawy Przetwarzania Sygnałów

Podstawy Przetwarzania Sygnałów Adam Szulc 188250 grupa: pon TN 17:05 Podstawy Przetwarzania Sygnałów Sprawozdanie 6: Filtracja sygnałów. Filtry FIT o skończonej odpowiedzi impulsowej. 1. Cel ćwiczenia. 1) Przeprowadzenie filtracji trzech

Bardziej szczegółowo

TADEUSZ KWATER 1, ROBERT PĘKALA 2, ALEKSANDRA SALAMON 3

TADEUSZ KWATER 1, ROBERT PĘKALA 2, ALEKSANDRA SALAMON 3 Wydawnictwo UR 2016 ISSN 2080-9069 ISSN 2450-9221 online Edukacja Technika Informatyka nr 4/18/2016 www.eti.rzeszow.pl DOI: 10.15584/eti.2016.4.46 TADEUSZ KWATER 1, ROBERT PĘKALA 2, ALEKSANDRA SALAMON

Bardziej szczegółowo

Sztuczna Inteligencja Tematy projektów Sieci Neuronowe

Sztuczna Inteligencja Tematy projektów Sieci Neuronowe PB, 2009 2010 Sztuczna Inteligencja Tematy projektów Sieci Neuronowe Projekt 1 Stwórz projekt implementujący jednokierunkową sztuczną neuronową złożoną z neuronów typu sigmoidalnego z algorytmem uczenia

Bardziej szczegółowo

KARTA PRZEDMIOTU. Techniki przetwarzania sygnałów, D1_3

KARTA PRZEDMIOTU. Techniki przetwarzania sygnałów, D1_3 KARTA PRZEDMIOTU 1. Informacje ogólne Nazwa przedmiotu i kod (wg planu studiów): Nazwa przedmiotu (j. ang.): Kierunek studiów: Specjalność/specjalizacja: Poziom kształcenia: Profil kształcenia: Forma studiów:

Bardziej szczegółowo

FFT i dyskretny splot. Aplikacje w DSP

FFT i dyskretny splot. Aplikacje w DSP i dyskretny splot. Aplikacje w DSP Marcin Jenczmyk m.jenczmyk@knm.katowice.pl Wydział Matematyki, Fizyki i Chemii 10 maja 2014 M. Jenczmyk Sesja wiosenna KNM 2014 i dyskretny splot 1 / 17 Transformata

Bardziej szczegółowo

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska. SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia

Bardziej szczegółowo

Ćwiczenie 3,4. Analiza widmowa sygnałów czasowych: sinus, trójkąt, prostokąt, szum biały i szum różowy

Ćwiczenie 3,4. Analiza widmowa sygnałów czasowych: sinus, trójkąt, prostokąt, szum biały i szum różowy Ćwiczenie 3,4. Analiza widmowa sygnałów czasowych: sinus, trójkąt, prostokąt, szum biały i szum różowy Grupa: wtorek 18:3 Tomasz Niedziela I. CZĘŚĆ ĆWICZENIA 1. Cel i przebieg ćwiczenia. Celem ćwiczenia

Bardziej szczegółowo

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA AMFETAMINY Waldemar S. Krawczyk Centralne Laboratorium Kryminalistyczne Komendy Głównej Policji, Warszawa (praca obroniona na Wydziale Chemii Uniwersytetu

Bardziej szczegółowo

EKSTRAKCJA CECH TWARZY ZA POMOCĄ TRANSFORMATY FALKOWEJ

EKSTRAKCJA CECH TWARZY ZA POMOCĄ TRANSFORMATY FALKOWEJ Janusz Bobulski Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska ul. Dąbrowskiego 73 42-200 Częstochowa januszb@icis.pcz.pl EKSTRAKCJA CECH TWARZY ZA POMOCĄ TRANSFORMATY FALKOWEJ

Bardziej szczegółowo

8. Neuron z ciągłą funkcją aktywacji.

8. Neuron z ciągłą funkcją aktywacji. 8. Neuron z ciągłą funkcją aktywacji. W tym ćwiczeniu zapoznamy się z modelem sztucznego neuronu oraz przykładem jego wykorzystania do rozwiązywanie prostego zadania klasyfikacji. Neuron biologiczny i

Bardziej szczegółowo

Transformata Fouriera

Transformata Fouriera Transformata Fouriera Program wykładu 1. Wprowadzenie teoretyczne 2. Algorytm FFT 3. Zastosowanie analizy Fouriera 4. Przykłady programów Wprowadzenie teoretyczne Zespolona transformata Fouriera Jeżeli

Bardziej szczegółowo

KAMERA AKUSTYCZNA NOISE INSPECTOR DLA SZYBKIEJ LOKALIZACJI ŹRÓDEŁ HAŁASU

KAMERA AKUSTYCZNA NOISE INSPECTOR DLA SZYBKIEJ LOKALIZACJI ŹRÓDEŁ HAŁASU KAMERA AKUSTYCZNA NOISE INSPECTOR DLA SZYBKIEJ LOKALIZACJI ŹRÓDEŁ HAŁASU Hałas staje się widoczny Zastosowanie innowacyjnych rozwiązań w systemie Noise Inspector pozwala na konwersję emisji dźwięku do

Bardziej szczegółowo

Biometryczna Weryfikacja (NIE inwigilacja)

Biometryczna Weryfikacja (NIE inwigilacja) Biometryczna Weryfikacja (NIE inwigilacja) Lucyna Szaszkiewicz Sales Director 23.06.2015 Warszawa Nip 123-456-78-19 Pesel 79110507431 Córka 10120212321 Syn 13021023175 Mąż 75071302113 REGON 123456785 TEL

Bardziej szczegółowo

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA Realizowany w roku akademickim 2016/2017

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA Realizowany w roku akademickim 2016/2017 Załącznik nr 4 do Uchwały Senatu nr 430/01/2015 SYLABUS DOTYCZY CYKLU KSZTAŁCENIA 2015-2017 Realizowany w roku akademickim 2016/2017 1.1. PODSTAWOWE INFORMACJE O PRZEDMIOCIE/MODULE Nazwa przedmiotu/ modułu

Bardziej szczegółowo

Automatyczne rozpoznawanie mowy. Autor: mgr inż. Piotr Bratoszewski

Automatyczne rozpoznawanie mowy. Autor: mgr inż. Piotr Bratoszewski Automatyczne rozpoznawanie mowy Autor: mgr inż. Piotr Bratoszewski Rys historyczny 1930-1950 pierwsze systemy Automatycznego rozpoznawania mowy (ang. Automatic Speech Recognition ASR), metody holistyczne;

Bardziej szczegółowo

Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl

Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl 1. Wstęp Aby skorzystać z możliwości RapidMinera w zakresie analizy tekstu, należy zainstalować Text Mining Extension. Wybierz: 1 Po

Bardziej szczegółowo

Biometria Głosu i HUB biometryczny w Banku Zachodnim WBK International Biometric Congress 2016 Józefów,

Biometria Głosu i HUB biometryczny w Banku Zachodnim WBK International Biometric Congress 2016 Józefów, Biometria Głosu i HUB biometryczny w Banku Zachodnim WBK International Biometric Congress 2016 Józefów, 31-05-2016 Marcin Lewandowski Pion Technologii, Obszar Rozwoju Systemów marcin.lewandowski@bzwbk.pl

Bardziej szczegółowo

Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej

Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej Autoreferat pracy doktorskiej pt. KOMPUTEROWE TECHNIKI ANALIZY INFORMACJI

Bardziej szczegółowo

Kompresja dźwięku w standardzie MPEG-1

Kompresja dźwięku w standardzie MPEG-1 mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 7, strona 1. Kompresja dźwięku w standardzie MPEG-1 Ogólne założenia kompresji stratnej Zjawisko maskowania psychoakustycznego Schemat blokowy

Bardziej szczegółowo

Wstęp. osobniczo, takich jak odciski linii papilarnych, wygląd tęczówki oka, czy charakterystyczne cechy twarzy.

Wstęp. osobniczo, takich jak odciski linii papilarnych, wygląd tęczówki oka, czy charakterystyczne cechy twarzy. 1. Wstęp. Dynamiczny rozwój Internetu, urządzeń mobilnych, oraz komputerów sprawił, iż wiele dziedzin działalności człowieka z powodzeniem jest wspieranych przez dedykowane systemy informatyczne. W niektórych

Bardziej szczegółowo

PRZEWODNIK PO PRZEDMIOCIE

PRZEWODNIK PO PRZEDMIOCIE Nazwa przedmiotu: ANALIZA I PRZETWARZANIE OBRAZÓW CYFROWYCH Kierunek: Informatyka Rodzaj przedmiotu: moduł specjalności obowiązkowy: Programowanie aplikacji internetowych Rodzaj zajęć: wykład, laboratorium

Bardziej szczegółowo

Układy stochastyczne

Układy stochastyczne Instytut Informatyki Uniwersytetu Śląskiego 21 stycznia 2009 Definicja Definicja Proces stochastyczny to funkcja losowa, czyli funkcja matematyczna, której wartości leżą w przestrzeni zdarzeń losowych.

Bardziej szczegółowo

Zaawansowane algorytmy DSP

Zaawansowane algorytmy DSP Zastosowania Procesorów Sygnałowych dr inż. Grzegorz Szwoch greg@multimed.org p. 732 - Katedra Systemów Multimedialnych Zaawansowane algorytmy DSP Wstęp Cztery algorytmy wybrane spośród bardziej zaawansowanych

Bardziej szczegółowo

SPOTKANIE 2: Wprowadzenie cz. I

SPOTKANIE 2: Wprowadzenie cz. I Wrocław University of Technology SPOTKANIE 2: Wprowadzenie cz. I Piotr Klukowski Studenckie Koło Naukowe Estymator piotr.klukowski@pwr.edu.pl 17.10.2016 UCZENIE MASZYNOWE 2/27 UCZENIE MASZYNOWE = Konstruowanie

Bardziej szczegółowo

Modelowanie jako sposób opisu rzeczywistości. Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka

Modelowanie jako sposób opisu rzeczywistości. Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka Modelowanie jako sposób opisu rzeczywistości Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka 2015 Wprowadzenie: Modelowanie i symulacja PROBLEM: Podstawowy problem z opisem otaczającej

Bardziej szczegółowo

Sposoby opisu i modelowania zakłóceń kanałowych

Sposoby opisu i modelowania zakłóceń kanałowych INSTYTUT TELEKOMUNIKACJI ZAKŁAD RADIOKOMUNIKACJI Instrukcja laboratoryjna z przedmiotu Podstawy Telekomunikacji Sposoby opisu i modelowania zakłóceń kanałowych Warszawa 2010r. 1. Cel ćwiczeń: Celem ćwiczeń

Bardziej szczegółowo

Wstęp do sieci neuronowych, wykład 03 Warstwy RBF, jednostka Adaline.

Wstęp do sieci neuronowych, wykład 03 Warstwy RBF, jednostka Adaline. Wstęp do sieci neuronowych, wykład 3 Warstwy, jednostka Adaline. Maja Czoków, Jarosław Piersa Wydział Matematyki i Informatyki, Uniwersytet Mikołaja Kopernika 211-1-18 1 Pomysł Przykłady Zastosowanie 2

Bardziej szczegółowo

Transpozer czasowy mowy

Transpozer czasowy mowy Transpozer czasowy mowy Politechnika Gdańska ul. Narutowicza 11/12 80-233 Gdańsk www.pg.gda.pl 1. Wprowadzenie Transpozer czasowy mowy został opracowany w celu wspierania rozumienia mowy przez osoby z

Bardziej szczegółowo

PL B BUP 16/04. Kleczkowski Piotr,Kraków,PL WUP 04/09

PL B BUP 16/04. Kleczkowski Piotr,Kraków,PL WUP 04/09 RZECZPOSPOLITA POLSKA (12) OPIS PATENTOWY (19) PL (11) 201536 (13) B1 (21) Numer zgłoszenia: 358531 (51) Int.Cl. G10L 21/02 (2006.01) H03G 3/00 (2006.01) Urząd Patentowy Rzeczypospolitej Polskiej (22)

Bardziej szczegółowo

CYFROWE PRZTWARZANIE SYGNAŁÓW (Zastosowanie transformacji Fouriera)

CYFROWE PRZTWARZANIE SYGNAŁÓW (Zastosowanie transformacji Fouriera) I. Wprowadzenie do ćwiczenia CYFROWE PRZTWARZANIE SYGNAŁÓW (Zastosowanie transformacji Fouriera) Ogólnie termin przetwarzanie sygnałów odnosi się do nauki analizowania zmiennych w czasie procesów fizycznych.

Bardziej szczegółowo

Symulacja sygnału czujnika z wyjściem częstotliwościowym w stanach dynamicznych

Symulacja sygnału czujnika z wyjściem częstotliwościowym w stanach dynamicznych XXXVIII MIĘDZYUCZELNIANIA KONFERENCJA METROLOGÓW MKM 06 Warszawa Białobrzegi, 4-6 września 2006 r. Symulacja sygnału czujnika z wyjściem częstotliwościowym w stanach dynamicznych Eligiusz PAWŁOWSKI Politechnika

Bardziej szczegółowo

Akwizycja i przetwarzanie sygnałów cyfrowych

Akwizycja i przetwarzanie sygnałów cyfrowych Akwizycja i przetwarzanie sygnałów cyfrowych Instytut Teleinformatyki ITI PK Kraków 21 luty 2011 Analiza czas - częstotliwość analiza częstotliwościowa: problem dla sygnału niestacjonarnego zwykła transformata

Bardziej szczegółowo

ALGORYTMY SZTUCZNEJ INTELIGENCJI

ALGORYTMY SZTUCZNEJ INTELIGENCJI ALGORYTMY SZTUCZNEJ INTELIGENCJI Sieci neuronowe 06.12.2014 Krzysztof Salamon 1 Wstęp Sprawozdanie to dotyczy ćwiczeń z zakresu sieci neuronowych realizowanym na przedmiocie: Algorytmy Sztucznej Inteligencji.

Bardziej szczegółowo

Praktyczne aspekty pomiarów zrozumiałości mowy dźwiękowych systemów ostrzegawczych

Praktyczne aspekty pomiarów zrozumiałości mowy dźwiękowych systemów ostrzegawczych Centrum Naukowo-Badawcze Ochrony Przeciwpożarowej im. Józefa Tuliszkowskiego Państwowy Instytut Badawczy Praktyczne aspekty pomiarów zrozumiałości mowy dźwiękowych systemów ostrzegawczych mgr inż. Urszula

Bardziej szczegółowo

Elementy modelowania matematycznego

Elementy modelowania matematycznego Elementy modelowania matematycznego Modelowanie algorytmów klasyfikujących. Podejście probabilistyczne. Naiwny klasyfikator bayesowski. Modelowanie danych metodą najbliższych sąsiadów. Jakub Wróblewski

Bardziej szczegółowo

Elementy modelowania matematycznego

Elementy modelowania matematycznego Elementy modelowania matematycznego Łańcuchy Markowa: zagadnienia graniczne. Ukryte modele Markowa. Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ KLASYFIKACJA STANÓW Stan i jest osiągalny

Bardziej szczegółowo

Widzenie komputerowe (computer vision)

Widzenie komputerowe (computer vision) Widzenie komputerowe (computer vision) dr inż. Marcin Wilczewski 2018/2019 Organizacja zajęć Tematyka wykładu Cele Python jako narzędzie uczenia maszynowego i widzenia komputerowego. Binaryzacja i segmentacja

Bardziej szczegółowo

Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.

Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa. Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa. Maja Czoków, Jarosław Piersa, Andrzej Rutkowski Wydział Matematyki i Informatyki, Uniwersytet Mikołaja Kopernika 2018-10-15 Projekt

Bardziej szczegółowo

Systemy uczące się wykład 2

Systemy uczące się wykład 2 Systemy uczące się wykład 2 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 19 X 2018 Podstawowe definicje Fakt; Przesłanka; Konkluzja; Reguła; Wnioskowanie. Typy wnioskowania

Bardziej szczegółowo

WYKORZYSTANIE SIECI NEURONOWEJ DO BADANIA WPŁYWU WYDOBYCIA NA SEJSMICZNOŚĆ W KOPALNIACH WĘGLA KAMIENNEGO. Stanisław Kowalik (Poland, Gliwice)

WYKORZYSTANIE SIECI NEURONOWEJ DO BADANIA WPŁYWU WYDOBYCIA NA SEJSMICZNOŚĆ W KOPALNIACH WĘGLA KAMIENNEGO. Stanisław Kowalik (Poland, Gliwice) WYKORZYSTANIE SIECI NEURONOWEJ DO BADANIA WPŁYWU WYDOBYCIA NA SEJSMICZNOŚĆ W KOPALNIACH WĘGLA KAMIENNEGO Stanisław Kowalik (Poland, Gliwice) 1. Wprowadzenie Wstrząsy podziemne i tąpania występujące w kopalniach

Bardziej szczegółowo

7. Szybka transformata Fouriera fft

7. Szybka transformata Fouriera fft 7. Szybka transformata Fouriera fft Dane pomiarowe sygnałów napięciowych i prądowych często obarczone są dużym błędem, wynikającym z istnienia tak zwanego szumu. Jedną z metod wspomagających analizę sygnałów

Bardziej szczegółowo

BIOMETRIA WYKŁAD 8: BŁĘDY SYSTEMOW BIOMETRYCZNYCH

BIOMETRIA WYKŁAD 8: BŁĘDY SYSTEMOW BIOMETRYCZNYCH BIOMETRIA WYKŁAD 8: BŁĘDY SYSTEMOW BIOMETRYCZNYCH KAŻDY SYSTEM BIOMETRYCZNY BĘDZIE POPEŁNIAŁ BŁĘDY.możliwe tylko do oszacowania teoretycznego Błąd popełniany jest wtedy kiedy fałszywa hipoteza zostaje

Bardziej szczegółowo

Jeśli X jest przestrzenią o nieskończonej liczbie elementów:

Jeśli X jest przestrzenią o nieskończonej liczbie elementów: Logika rozmyta 2 Zbiór rozmyty może być formalnie zapisany na dwa sposoby w zależności od tego z jakim typem przestrzeni elementów mamy do czynienia: Jeśli X jest przestrzenią o skończonej liczbie elementów

Bardziej szczegółowo

Materiały dydaktyczne: Maciej Krzymowski. Biometryka

Materiały dydaktyczne: Maciej Krzymowski. Biometryka Biometryka Biometryka Nauka o mierzalnych cechach fizycznych lub behawioralnych organizmów Ŝywych, z greckiego: "bios" = Ŝywy "metron" = mierzyć. Biometria Zespół metod słuŝących do sprawdzania toŝsamości

Bardziej szczegółowo

Technika analogowa. Problematyka ćwiczenia: Temat ćwiczenia:

Technika analogowa. Problematyka ćwiczenia: Temat ćwiczenia: Technika analogowa Problematyka ćwiczenia: Pomiędzy urządzeniem nadawczym oraz odbiorczym przesyłany jest sygnał użyteczny w paśmie 10Hz 50kHz. W trakcie odbioru sygnału po stronie odbiorczej stwierdzono

Bardziej szczegółowo

Wpływ nieliniowości elementów układu pomiarowego na błąd pomiaru impedancji

Wpływ nieliniowości elementów układu pomiarowego na błąd pomiaru impedancji Wpływ nieliniowości elementów układu pomiarowego na błąd pomiaru impedancji Wiesław Miczulski* W artykule przedstawiono wyniki badań ilustrujące wpływ nieliniowości elementów układu porównania napięć na

Bardziej szczegółowo

Rozpoznawanie obrazów na przykładzie rozpoznawania twarzy

Rozpoznawanie obrazów na przykładzie rozpoznawania twarzy Rozpoznawanie obrazów na przykładzie rozpoznawania twarzy Wykorzystane materiały: Zadanie W dalszej części prezentacji będzie omawiane zagadnienie rozpoznawania twarzy Problem ten można jednak uogólnić

Bardziej szczegółowo

Samochodowy system detekcji i rozpoznawania znaków drogowych. Sensory w budowie maszyn i pojazdów Maciej Śmigielski

Samochodowy system detekcji i rozpoznawania znaków drogowych. Sensory w budowie maszyn i pojazdów Maciej Śmigielski Samochodowy system detekcji i rozpoznawania znaków drogowych Sensory w budowie maszyn i pojazdów Maciej Śmigielski Rozpoznawanie obrazów Rozpoznawaniem obrazów możemy nazwać proces przetwarzania i analizowania

Bardziej szczegółowo

W celu obliczenia charakterystyki częstotliwościowej zastosujemy wzór 1. charakterystyka amplitudowa 0,

W celu obliczenia charakterystyki częstotliwościowej zastosujemy wzór 1. charakterystyka amplitudowa 0, Bierne obwody RC. Filtr dolnoprzepustowy. Filtr dolnoprzepustowy jest układem przenoszącym sygnały o małej częstotliwości bez zmian, a powodującym tłumienie i opóźnienie fazy sygnałów o większych częstotliwościach.

Bardziej szczegółowo

ZASTOSOWANIE TECHNOLOGII WIRTUALNEJ RZECZYWISTOŚCI W PROJEKTOWANIU MASZYN

ZASTOSOWANIE TECHNOLOGII WIRTUALNEJ RZECZYWISTOŚCI W PROJEKTOWANIU MASZYN MODELOWANIE INŻYNIERSKIE ISSN 1896-771X 37, s. 141-146, Gliwice 2009 ZASTOSOWANIE TECHNOLOGII WIRTUALNEJ RZECZYWISTOŚCI W PROJEKTOWANIU MASZYN KRZYSZTOF HERBUŚ, JERZY ŚWIDER Instytut Automatyzacji Procesów

Bardziej szczegółowo

Prof. Stanisław Jankowski

Prof. Stanisław Jankowski Prof. Stanisław Jankowski Zakład Sztucznej Inteligencji Zespół Statystycznych Systemów Uczących się p. 228 sjank@ise.pw.edu.pl Zakres badań: Sztuczne sieci neuronowe Maszyny wektorów nośnych SVM Maszyny

Bardziej szczegółowo

4 Zasoby językowe Korpusy obcojęzyczne Korpusy języka polskiego Słowniki Sposoby gromadzenia danych...

4 Zasoby językowe Korpusy obcojęzyczne Korpusy języka polskiego Słowniki Sposoby gromadzenia danych... Spis treści 1 Wstęp 11 1.1 Do kogo adresowana jest ta książka... 12 1.2 Historia badań nad mową i językiem... 12 1.3 Obecne główne trendy badań... 16 1.4 Opis zawartości rozdziałów... 18 2 Wyzwania i możliwe

Bardziej szczegółowo

Analiza sygnałów biologicznych

Analiza sygnałów biologicznych Analiza sygnałów biologicznych Paweł Strumiłło Zakład Elektroniki Medycznej Instytut Elektroniki PŁ Co to jest sygnał? Funkcja czasu x(t) przenosząca informację o stanie lub działaniu układu (systemu),

Bardziej szczegółowo

Podstawy automatycznego rozpoznawania mowy. Autor: mgr inż. Piotr Bratoszewski

Podstawy automatycznego rozpoznawania mowy. Autor: mgr inż. Piotr Bratoszewski Podstawy automatycznego rozpoznawania mowy Autor: mgr inż. Piotr Bratoszewski Rys historyczny 1930-1950 pierwsze systemy Automatycznego rozpoznawania mowy (ang. Automatic Speech Recognition ASR), metody

Bardziej szczegółowo

IMPLEMENTATION OF THE SPECTRUM ANALYZER ON MICROCONTROLLER WITH ARM7 CORE IMPLEMENTACJA ANALIZATORA WIDMA NA MIKROKONTROLERZE Z RDZENIEM ARM7

IMPLEMENTATION OF THE SPECTRUM ANALYZER ON MICROCONTROLLER WITH ARM7 CORE IMPLEMENTACJA ANALIZATORA WIDMA NA MIKROKONTROLERZE Z RDZENIEM ARM7 Łukasz Deńca V rok Koło Techniki Cyfrowej dr inż. Wojciech Mysiński opiekun naukowy IMPLEMENTATION OF THE SPECTRUM ANALYZER ON MICROCONTROLLER WITH ARM7 CORE IMPLEMENTACJA ANALIZATORA WIDMA NA MIKROKONTROLERZE

Bardziej szczegółowo

8. Analiza widmowa metodą szybkiej transformaty Fouriera (FFT)

8. Analiza widmowa metodą szybkiej transformaty Fouriera (FFT) 8. Analiza widmowa metodą szybkiej transformaty Fouriera (FFT) Ćwiczenie polega na wykonaniu analizy widmowej zadanych sygnałów metodą FFT, a następnie określeniu amplitud i częstotliwości głównych składowych

Bardziej szczegółowo

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo

Bardziej szczegółowo

Adam Korzeniewski - p. 732 dr inż. Grzegorz Szwoch - p. 732 dr inż.

Adam Korzeniewski - p. 732 dr inż. Grzegorz Szwoch - p. 732 dr inż. Adam Korzeniewski - adamkorz@sound.eti.pg.gda.pl, p. 732 dr inż. Grzegorz Szwoch - greg@sound.eti.pg.gda.pl, p. 732 dr inż. Piotr Odya - piotrod@sound.eti.pg.gda.pl, p. 730 Plan przedmiotu ZPS Cele nauczania

Bardziej szczegółowo

ALGORYTM RANDOM FOREST

ALGORYTM RANDOM FOREST SKRYPT PRZYGOTOWANY NA ZAJĘCIA INDUKOWANYCH REGUŁ DECYZYJNYCH PROWADZONYCH PRZEZ PANA PAWŁA WOJTKIEWICZA ALGORYTM RANDOM FOREST Katarzyna Graboś 56397 Aleksandra Mańko 56699 2015-01-26, Warszawa ALGORYTM

Bardziej szczegółowo

Projekt badawczy. Zastosowania technologii dynamicznego podpisu biometrycznego

Projekt badawczy. Zastosowania technologii dynamicznego podpisu biometrycznego Projekt badawczy Zastosowania technologii dynamicznego podpisu biometrycznego Multimodalny biometryczny system weryfikacji tożsamości klienta bankowego Warszawa, 27.10.2016 r. Projekt finansowany przez

Bardziej szczegółowo

WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU

WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU Zał. nr do ZW WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU Nazwa w języku polskim Analiza sygnałów Nazwa w języku angielskim Signal analysis Kierunek studiów (jeśli dotyczy): Matematyka stosowana

Bardziej szczegółowo

Opis efektów kształcenia dla modułu zajęć

Opis efektów kształcenia dla modułu zajęć Nazwa modułu: Techniki multimedialne Rok akademicki: 2015/2016 Kod: RIA-1-608-s Punkty ECTS: 2 Wydział: Inżynierii Mechanicznej i Robotyki Kierunek: Inżynieria Akustyczna Specjalność: - Poziom studiów:

Bardziej szczegółowo

ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU

ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU i klasyfikacja sygnału audio dr inż. Jacek Naruniec Sygnał mowy mózg (układ sterujący) głośnia (źródło dźwięku) rezonator akustyczny (filtr) sygnał mowy 2 Sygnał mowy

Bardziej szczegółowo