Klasyfikacja mówców oparta na modelowaniu GMM-UBM dla mowy o różnej jakości
|
|
- Karol Karczewski
- 8 lat temu
- Przeglądów:
Transkrypt
1 Artur Janicki Tomasz Staroszczyk Zakład Systemów Teletransmisyjnych Instytut Telekomunikacji Politechnika Warszawska Klasyfikacja mówców oparta na modelowaniu GMM-UBM dla mowy o różnej jakości Artykuł opisuje eksperymenty dotyczące niezależnej od tekstu klasyfikacji mówców z wykorzystaniem modeli GMM- UBM dla wąskopasmowego sygnału mowy o różnej jakości. Badania prowadzono dla mowy niekodowanej oraz dla mowy transkodowanej z użyciem kodeków stosowanych w telefonii stacjonarnej (G.711), mobilnej (GSM 06.10, GSM 06.60) i internetowej (Speex, G.723.1). Modele poszczególnych mówców zostały wygenerowane przez adaptację uniwersalnego modelu mówcy UBM do fraz uczących za pomocą algorytmu MAP (maximum a posteriori). Prowadzono eksperymenty w warunkach dopasowania, tzn. kiedy system był uczony i testowany na mowie o tej samej jakości, oraz niedopasowania, gdzie uczono i testowano na sygnałach o różnej jakości. Dla nagrań z bazy TIMIT osiągnięto dokładność klasyfikacji w granicach 81,5% - 93% w warunkach dopasowania; przy niedopasowaniu następowało obniżenie dokładności klasyfikacji, zwykle zależne od różnicy jakości. Wykazano, że model wygenerowany w oparciu o kodek Speex jest najbardziej skuteczny dla niedopasowanych warunków klasyfikacji. 1. Wstęp Systemy rozpoznawania mówców często mają za zadanie rozpoznać mówcę, którego głos został przetransmitowany przez kanał telekomunikacyjny. Tak się dzieje na przykład w przypadku systemu weryfikacji klientów banku składających telefoniczne dyspozycje. Systemy te przechowują matematyczne modele głosów klientów, z którymi porównywany jest głos telefonującego. Głos ten może być różnej jakości, gdyż modyfikowany jest przez kanał telekomunikacyjny. Elementem, który ma istotny wpływ na jakość, jest zastosowany kodek mowy. Inny kodek stosuje telefonia stacjonarna, inne są używane w telefonii komórkowej, a jeszcze inne w telefonii internetowej (VoIP). Niniejsza praca ma na celu pokazanie, jak zmienia się poprawność systemu rozpoznawania mówcy w koncepcji GMM-UBM dla sygnału mowy o różnej jakości. Jest to istotne z tego względu, że system nie ma zwykle możliwości sprawdzenia jaki kodek zastosowano w kanale telekomunikacyjnym, przez który uwierzytelnia się użytkownik. Badania ograniczono do sygnałów wąskopasmowych, tzn. próbkowanych z częstotliwością 8 khz. Rozpatrywano problem rozpoznawania mówcy niezależnego od tekstu, tzn. takiego, gdzie system testowany jest na innych frazach niż te, które wykorzystane zostały w procesie uczenia. Problematyka dotyczy rozpoznawania mówcy w zbiorze zamkniętym (w tym wypadku 462 mówców), jednak wnioski z eksperymentów można rozszerzyć na zagadnienia pokrewne, np. weryfikację mówcy, czyli sprawdzanie, czy mówca jest tym, za kogo się podaje. 2. Badania nad rozpoznawaniem mówców 2.1. Algorytm GMM-UBM Najbardziej rozpowszechnioną techniką modelowania mówcy w problemie rozpoznawania niezależnego od tekstu jest zastosowanie liniowej kombinacji rozkładów normalnych GMM (Gaussian Mixture Models). Model GMM jest tworzony dla każdego mówcy aby odwzorować
2 wielowymiarowy rozkład gęstości prawdopodobieństwa wektorów wyekstrahowanych na bazie sygnału mowy, np. wektorów współczynników MFCC (mel-cepstrum). Uczenie modelu GMM realizuje się najczęściej poprzez adaptację parametrów modelu mówcy uniwersalnego UBM (Universal Background Model) [10], za pomocą algorytmu MAP (maximum a posteriori). Technikę tę określa się często akronimem GMM-UBM. Algorytm MAP zapewnia modyfikację tylko tych komponentów modelu, które dobrze opisywane są przez dane uczące dla których zgromadzono wystarczającą ilość danych uczących. Komponenty niedostatecznie reprezentowane przez zbiór danych trenujących przejmowane są natomiast bezpośrednio z modelu UBM. Proces rozpoznawania mówcy (czyli testowania modelu) polega na obliczeniu prawdopodobieństwa (ściślej: logarytmu prawdopodobieństwa, log-likelihood) tego, że sygnał testujący pochodzi od danego mówcy, przy czym każdy z mówców reprezentowany jest przez odrębny model GMM. W przypadku klasyfikacji dla testowanej wypowiedzi przeglądane są zatem modele wszystkich mówców, a nagranie zostaje zaklasyfikowane do mówcy, dla którego osiągnięto najwyższą wartość tego prawdopodobieństwa Bazy nagrań wykorzystywane do eksperymentów z rozpoznawaniem mówcy W badaniach nad rozpoznawaniem mówcy wykorzystuje się różne bazy nagrań, m.in. w zależności od tego, jaka jakość sygnału mowy jest wymagana, a także jakie aspekty rozpoznawania są badane. Na przykład do eksperymentów z weryfikacją mówcy wskazane jest, aby była to baza wielosesyjna, tzn. taka, w której nagrania od mówców pochodzą z różnych sesji, oddalonych w czasie. Poniżej wymieniono najczęściej wykorzystywane bazy nagrań. NIST Speaker Recognition Evaluation 1999 [8] baza dla języka angielskiego, stworzona z myślą o eksperymentach z rozpoznawaniem mówcy, podobnie jak jej kolejne wersje w następnych latach. Zawiera 2728 pięciominutowych konwersacji, pochodzących łącznie od 640 mówców. TIMIT [5] baza stworzona wspólnie przez Massachusetts Institute of Technology (MIT), SRI International (SRI) i Texas Instruments (TI) dla 8 dialektów amerykańskiego języka angielskiego. Zawiera zdania bogate fonetycznie pochodzące od 630 mówców obojga płci, nagrane z jakością 16 bit/próbkę przy częstotliwości próbkowania 16 khz. Każdy mówca wypowiada 10 zdań (tak zwane zdania SX, SA i SI). PolyVar baza opracowana przez stowarzyszenie ELRA [4] dla języka francuskiego. Zawiera nagrania cyfr, liczb, pojedynczych słów dot. turystyki, dat, godzin, pochodzące od 72 mówców, którzy powtarzali sesje nagrań wielokrotnie (2-100 razy) i 71 mówców, którzy uczestniczyli w jednej sesji. Jakość telefoniczna Rozpoznawanie mówców dla mowy o różnej jakości W literaturze spotyka się zwykle badania dotyczące rozpoznawania mówców dla sygnałów szerokopasmowych lub dla mowy o jakości telefonicznej, co oznacza zwykle użycie kodeka G.711. Są jednak prace, które poświęcają więcej uwagi zagadnieniom różnic w jakości sygnałów wąskopasmowych i rozpatrują problem rozpoznawania mówcy dla mowy kodowanej. Przykładem jest [9], gdzie wykazano, że poprawność rozpoznawania mówcy dla kodeków GSM 06.10, G i G.729 zależy wyraźnie od jakości percepcyjnej kodeka. W [1] badano kodeki GSM i wykazano, że za spadek poprawności rozpoznawania mówcy odpowiedzialny jest w głównej mierze niski rząd predykcji w tych kodekach. Osiągnięto poprawność rozpoznawania 68,5% oraz 71,8%, odpowiednio dla GSM i GSM Badano jedynie warunki dopasowania, tzn. rozpoznawanie przeprowadzano dla tej samej jakości sygnału, dla której tworzono modele mówców. Kodek GSM badano też w [6] dla korpusu ARADIGIT, zawierającego
3 nagrania cyfr w języku arabskim pochodzące od 60 mówców. Uzyskano wówczas dokładność klasyfikacji na poziomie 78,06%. Inny projekt [12] dotyczył badania degradacji poprawności klasyfikacji mówców dla mowy transkodowanej kodekiem Speex [13], stosowanym w transmisji VoIP. Zasugerowano, że kodek Speex może być przydatny w tworzeniu modeli mówców, gdyż zapewnia stosunkowo wysoką poprawność rozpoznawania w warunkach niedopasowania. 3. Opis eksperymentu 3.1. Użyta baza nagrań W niniejszym badaniu wykorzystano bazę TIMIT. Wprawdzie nie jest ona dedykowana ściśle do eksperymentów z rozpoznawaniem mówcy, bo nie uwzględnia np. wielosesyjności, zawiera jednak nagrania wielu mówców (630) i używana była z powodzeniem w podobnych badaniach [1]. Zdecydowano, by zbiór zawarty w folderze TEST zawierający wybrane nagrania każdego z dialektów (łącznie 1680 nagrań pochodzących od 168 mówców) wykorzystać do utworzenia uniwersalnego modelu tła UBM. Nagrania w folderze nazwanym oryginalnie TRAIN wykorzystano zarówno do uczenia modeli (do tego użyto zdań SX, których każdy mówca wypowiada 5), jak i testowania (tu użyto zdań SA i SI). Eksperymenty prowadzono więc dla klasyfikacji 462 mówców Badane rodzaje jakości sygnału mowy Eksperymenty prowadzono dla różnej jakości sygnału mowy. Jeden z wariantów to: mowa niekodowana czyli oryginalne nagrania, ale przepróbkowane do częstotliwości 8 khz, by móc się porównywać z innymi kodekami telefonicznymi. Oprócz tego badano sygnał mowy przesłany w wykorzystaniem kodeków, występujących najczęściej w telefonii klasycznej (stacjonarnej i mobilnej) oraz internetowej: G.711 (PCM) opracowany w 1972 roku przez ITU międzynarodowy standard cyfrowej modulacji sygnałów mowy o prędkości transmisji 64 kbit/s, powszechnie stosowany w systemach telefonii stacjonarnej na całym świecie. Realizuje proces modulacji PCM o częstotliwości próbkowania 8 khz i rozdzielczości kwantyzacji 8 bit/próbkę, z kwantyzacją logarytmiczną A-law (stosowaną m.in. w Europie, użytą w tym projekcie) lub -law. G723.1 kodek mowy stosowany w telefonii VoIP (Voice over IP) przeznaczony do kompresji sygnału PCM o przepustowości 64 kbit/s do strumienia 5,3 kbit/s lub (jak użyto w tym badaniu) 6,4 kbit/s przez zastosowanie algorytmów kompresji stratnej MP-MLQ (Multi-Pulse Maximum Likelihood Quantization) oraz ACELP (Algebraic Code Excited Linear Prediction). GSM (GSM-FR, GSM Full Rate) - opracowany na początku lat 90. i nadal wykorzystywany standard kodowania mowy w systemie telefonii GSM o przepływności 13,2 kbit/s. Kompresja dźwięku realizowana w oparciu o algorytm RPE-LTP (Regular Pulse Excitation-Long Term Prediction). GSM (GSM-EFR, GSM-Enhanced Full Rate) ustandaryzowany w 1995 roku następca kodeka GSM 06.10, o przepływności 12,2 kbit/s. Realizowany w oparciu o algorytm ACELP (Algebraic Code Excited Linear Prediction), w pełni kompatybilny z kodekiem AMR-NB (Adaptive Multi-Rate - Narrow Band). Speex [13] kodek stratny przeznaczony do kompresji mowy głównie w zastosowaniach telefonii VoIP (Voice over IP), realizowany w oparciu o algorytm CELP i dostosowany do współpracy z sygnałami o częstotliwości próbkowania od 8 do 32 khz. W niniejszej pracy wykorzystano tryb wąskopasmowy najwyższej jakości kompresji (przepływność 42,2 kbit/s).
4 3.3. Proces klasyfikacji Eksperymenty prowadzono środowisku MATLAB z wykorzystaniem specjalistycznych bibliotek, takich jak Voicebox [2], h2m [3], bibliotekę G Speech Coder and Decoder, a także pakiet SoX [11] i emulator kodeka Speex [13]. Sygnał mowy sparametryzowano z wykorzystaniem 19 współczynników mel-cepstralnych (MFCC) z użyciem okna o długości 30 ms, stosując krok analizy 10 ms. Do zbioru współczynników MFCC dołączono tzw. współczynnik zerowy (zeroth cepstral coefficient). Proces klasyfikacji mówców zrealizowano w koncepcji GMM-UBM. Uniwersalny model tła (UBM) stworzono na podstawie nagrań pochodzących od 168 mówców obojga płci. Przyjęto liczbę komponentów M równą 64 i ograniczono się do diagonalnych macierzy kowariancji. Wektory średnie modelu zainicjalizowano metodą k-średnich, natomiast wagi oraz macierze kowariancji wyznaczono losowo. Uczenie zrealizowano z użyciem algorytmu EM (Expectation-Maximization). Dla każdego z pozostałych 462 mówców wytrenowano modele GMM poprzez adaptację modelu UBM algorytmem MAP, gdzie adaptacji podlegały jedynie wektory średnie modelu. Trenowanie przeprowadzono na bazie 5 zdań SX, co stanowi ok. 16 s sygnału mowy na mówcę. Pozostałe zdania (SA i SI) poddano klasyfikacji w ten sposób, że każde z nich przypisano do mówcy, którego model z największą wiarygodnością reprezentował zdanie testujące. Stosunek poprawnie sklasyfikowanych zdań do wszystkich 2310 testowanych zdań stanowił miarę poprawności klasyfikacji. Prowadzono eksperymenty z klasyfikacją w dwóch przypadkach: w warunkach dopasowania, to znaczy, że system klasyfikacji był uczony i trenowany na sygnałach o tej samej jakości (np. transkodowanej takim samym kodekiem), a także: w warunkach niedopasowania, kiedy system był testowany na mowie o innej jakości niż ta, dla której tworzono modele mówców. Zachowano jednak zasadę, że zdania uczące są nagrane z tą samą jakością, co mowa użyta do tworzenia modelu UBM. Warto zwrócić uwagę, że klasyfikowane zdania były dość krótkie (przeciętnie 3,2 s), co stanowiło dodatkowe utrudnienie. 4. Wyniki eksperymentów Tabela 1 przedstawia wyniki klasyfikacji dla warunków dopasowania oraz niedopasowania. Analiza wyników dla warunków dopasowania prowadzi do wniosków, które pojawiały się wcześniej ([9]) poprawność klasyfikacji jest silnie skorelowana z jakością mowy. Tabela 1. Wyniki klasyfikacji mówców dla systemów klasyfikacji mówców uczonych sygnałami o różnej jakości. Wytłuszczonym drukiem zaznaczono wyniki dla warunków dopasowania. uczenie\test niekod. G.711 G GSM GSM odch. Speex średnia stand. niekod. 93,03 92,25 58,66 53,64 80,91 91,78 78,17 14,54 G ,38 93,03 57,27 55,89 78,87 90,35 78,20 8,72 G ,75 76,41 81,52 71,39 81,00 82,60 77,49 4,26 GSM ,51 74,68 71,21 88,18 72,17 79,44 77,04 7,07 GSM ,51 79,44 73,72 54,55 90,04 84,07 79,93 8,94 Speex 91,34 90,61 70,30 68,01 81,39 92,21 82,31 9,08 Mowa niekodowana lub transkodowana przez kodery o wysokiej jakości (G.711, Speex) pozwala na wysoką poprawność klasyfikacji (powyżej 92%), natomiast wraz ze spadkiem jakości (kolejno kodeki: GSM 06.60, GSM 06.10, G.723.1) obserwujemy obniżanie poprawności. Najgorszy wynik
5 dokładność [%] (81,5%) dla warunków dopasowania uzyskano dla kodeka o najsłabszej jakości spośród testowanego zbioru, czyli dla G Stosując modele GMM z 64 rozkładami Gaussa uzyskano znaczną poprawę względem modeli używających 16 rozkładów, których użyto w [1]. Poprawa jest najwyraźniejsza dla sygnałów o słabszej jakości, tzn. w tym wypadku dla kodeków używanych w telefonii mobilnej. Tabela 2 prezentuje szczegóły porównania. Tabela 2. Porównanie wyników dla modeli GMM z 16 rozkładami Gaussa (na podstawie [1]) a wynikami z niniejszej pracy, dla 64 rozkładów. l. modeli \ jakość Analizując wyniki klasyfikacji dla warunków niedopasowania, można zauważyć, że zgodnie z oczekiwaniem następuje obniżenie dokładności klasyfikacji. Spadek ten jest najmniejszy, gdy różnica jakości między sygnałem użytym do uczenia i do testowania jest najmniejsza. Tak więc przy niedopasowaniu między mową niekodowaną (8 khz) a G.711 zmniejszenie dokładności klasyfikacji jest minimalne, dlatego że degradacja jakości wprowadzana przez kwantyzację logarytmiczną w G.711 jest bardzo mała. Słabo natomiast przebiega klasyfikacja dla mowy o jakości GSM 06.10, o ile modele mówców były uczone np. kodekiem G.711, a także, co jest pewnym zaskoczeniem, kodekiem GSM (odpowiednio 55,9% oraz 54,6%). Co ciekawe, niedopasowanie w drugą stronę (model tworzony dla GSM 06.60, zaś testowany mową GSM 06.10) powoduje mniejszą degradację klasyfikacja osiąga poprawność ponad 72% oryg. GSM GSM 8 khz (16 khz) GMM 16 [1] 97,80 86,90 68,50 71,80 GMM 64 99,00 93,03 88,18 90,04 niekod. G.711 G GSM GSM Speex niekod. G.711 G GSM GSM Speex kodek mowy użyty podczas testowania klasyfikacji Rys. 1. Prezentacja graficzna wyników klasyfikacji dla warunków dopasowania i niedopasowania. Rysunek 1 oraz średnie wartości, które prezentuje Tabela 1, pokazują, że kodek Speex jest najbardziej uniwersalny, jeśli chodzi o tworzenie modeli mówców odpornych na warunki
6 niedopasowania. System zrealizowany z wykorzystaniem mowy transkodowanej kodekiem Speex sprawuje się bardzo dobrze dla kodeka o wysokiej jakości (stosowany w telefonii stacjonarnej G.711), a także dla mowy transkodowanej kodekami GSM. Podobne wnioski przedstawione zostały w [12]. Stosunkowo dobrze w tym kontekście wypada też kodek GSM Z kolei kodek G wykazuje się najmniejszym rozrzutem poprawności dla sygnałów mowy o różnej jakości. 5. Podsumowanie i wnioski W pracy zaprezentowano wyniki eksperymentów z klasyfikacją mówców z użyciem metody GMM-UBM dla wąskopasmowego sygnału mowy o różnej jakości, to znaczy dla mowy niekodowanej oraz dla mowy transkodowanej z użyciem kodeków stosowanych w telefonii stacjonarnej, mobilnej i internetowej. W porównaniu do innych badań, w niniejszej pracy zastosowano modele GMM z większą liczbą rozkładów Gaussa, przebadano też więcej kodeków, a także badano szczegółowo warunki niedopasowania. Dla nagrań z bazy TIMIT osiągnięto dokładność klasyfikacji w granicach 81,5% - 93% dla warunków dopasowania. Wskazano też, że kodek Speex jest najbardziej uniwersalny w zakresie implementacji systemu rozpoznawania mówców, a jego poprawność rozpoznawania pozostaje wysoka dla mowy transkodowanej różnymi kodekami. Potencjalne przyszłe prace mogą obejmować testy dla innych kodeków, dla innych trybów pracy kodeka Speex, a także badanie wpływu zmienności głosu mówcy na poprawność klasyfikacji. Prowadzone są również prace dotyczące wykorzystania do klasyfikacji maszyny wektorów nośnych. 6. Literatura 1. L. Besacier, S. Grassi, A. Dufaux, M. Ansorge, F. Pellandini, GSM Speech Coding and Speaker Recognition, Proc. ICASSP 2000, ss , Istambuł, M. Brookes, VOICEBOX: Speech Processing Toolbox for MATLAB, dostępne na: 3. O. Cappé, h2m Toolkit, dostępne na: 4. ELRA - European Language Resources Association, dostępne na: 5. J. S. Garofolo et al., TIMIT Acoustic-Phonetic Continuous Speech Corpus, Linguistic Data Consortium, Philadelphia, A. Krobba, M. Debyeche, A. Amrouche, Evaluation of Speaker Identification System Using GSMEFR Speech Data, Proc International Conference on Design & Technology of Integrated Systems in Nanoscale Era, Hammamet, ss. 1-5, LDC - Linguistic Data Consortium, 8. A. Martin, M. Przybocki, The 1999 NIST Speaker Recognition Evaluation, Using Summed Two- Channel Telephone Data for Speaker Detection and Speaker Tracking, Proc. Eurospeech 1999, Budapeszt, T. Quatieri, E. Singer, R. Dunn, D. Reynolds, J. Campbell, Speaker and Language Recognition Using Speech Codec Parameters, Proc. Eurospeech 1999, vol. 2, ss , Budapeszt, D. Reynolds, W. Campbell, Text-Independent Speaker Recognition, w: Handbook of Speech Processing, ed. J. Benesty, M. Sondhi, Y. Huang, Springer, SoX - Sound exchange, dostępne na: A. Stauffer, A. Lawson, Speaker Recognition on Lossy Compressed Speech using the Speex Codec, Proc. Interspeech 2009, ss , Brighton (UK), Xiph-OSC: Speex: A free codec for free speech: Documentation, dostępne na:
METODY KODOWANIA SYGNAŁU MOWY DO ZASTOSOWAŃ W TELEKOMUNIKACJI
METODY KODOWANIA SYGNAŁU MOWY DO ZASTOSOWAŃ W TELEKOMUNIKACJI Maciej Kulesza pok. 726 Katedra Systemów Multimedialnych Plan wykładu Właściwości (charakterystyka) sygnału mowy Właściwości kodeków mowy Metody
Bardziej szczegółowoKwantowanie sygnałów analogowych na przykładzie sygnału mowy
Kwantowanie sygnałów analogowych na przykładzie sygnału mowy Treść wykładu: Sygnał mowy i jego właściwości Kwantowanie skalarne: kwantyzator równomierny, nierównomierny, adaptacyjny Zastosowanie w koderze
Bardziej szczegółowo58. Otwarte Seminarium z Akustyki, OSA '11, Gdańsk-Jurata, September 2011
109 ROZPOZNAWANIE MÓWCY W SYSTEMACH Z KODOWANIEM MOWY STEFAN BRACHMAŃSKI Politechnika Wrocławska, Instytut Telekomunikacji, Teleinformatyki i Akustyki Wybrzeże Wyspiańskiego 27, 50-370 Wrocław Stefan.brachmanski@pwr.wroc.pl
Bardziej szczegółowoKODOWANIE I KOMPRESJA SYGNAŁU MOWY
Akustyka mowy KODOWANIE I KOMPRESJA SYGNAŁU MOWY Katedra Systemów Multimedialnych, Politechnika Gdańska Autor: Grzegorz Szwoch, kwiecień 2011 Potrzeba kompresji mowy Cyfrowy sygnał mowy bez kompresji:
Bardziej szczegółowoPrzesył mowy przez internet
Damian Goworko Zuzanna Dziewulska Przesył mowy przez internet organizacja transmisji głosu, wybrane kodeki oraz rozwiązania podnoszące jakość połączenia głosowego Telefonia internetowa / voice over IP
Bardziej szczegółowoS O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor
S O M SELF-ORGANIZING MAPS Przemysław Szczepańczyk Łukasz Myszor Podstawy teoretyczne Map Samoorganizujących się stworzył prof. Teuvo Kohonen (1982 r.). SOM wywodzi się ze sztucznych sieci neuronowych.
Bardziej szczegółowoWybrane algorytmu kompresji dźwięku
[1/28] Wybrane algorytmu kompresji dźwięku [dr inż. Paweł Forczmański] Katedra Systemów Multimedialnych, Wydział Informatyki, Zachodniopomorski Uniwersytet Technologiczny w Szczecinie [2/28] Podstawy kompresji
Bardziej szczegółowoAnalogowa (para miedziana, radio, walkie-talkie, CB) Cyfrowa (ISDN, GSM, VoIP, DRB, DVB, Tetra, )
Transmisja mowy Analogowa (para miedziana, radio, walkie-talkie, CB) Modulacje: amplitudowa (AM), częstotliwościowa (FM), fazowa (PM) Wysokie zapotrzebowanie na pasmo (np. AM df>2f) Niska sprawność energetyczna
Bardziej szczegółowoP R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H
W O J S K O W A A K A D E M I A T E C H N I C Z N A W Y D Z I A Ł E L E K T R O N I K I Drukować dwustronnie P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H Grupa... Data wykonania
Bardziej szczegółowoSpis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
Bardziej szczegółowoPRACA DYPLOMOWA INŻYNIERSKA
AKADEMIA GÓRNICZO-HUTNICZA IM. STANISŁAWA STASZICA W KRAKOWIE Wydział Informatyki, Elektroniki i Telekomunikacji Katedra Elektroniki PRACA DYPLOMOWA INŻYNIERSKA Temat: Adaptacyjny system redukcji szumu
Bardziej szczegółowoAKUSTYKA MOWY. Podstawy rozpoznawania mowy część I
AKUSTYKA MOWY Podstawy rozpoznawania mowy część I PLAN WYKŁADU Część I Podstawowe pojęcia z dziedziny rozpoznawania mowy Algorytmy, parametry i podejścia do rozpoznawania mowy Przykłady istniejących bibliotek
Bardziej szczegółowoSeminarium DSP AGH. Przegląd technik zwiększających wydajność obliczeniową algorytmów weryfikacji mówcy opartych o modelowanie GMM-UBM oraz HMM
Seminarium DSP AGH Przegląd technik zwiększających wydajność obliczeniową algorytmów weryfikacji mówcy opartych o modelowanie GMM-UBM oraz HMM Michał Salasa 06.03.2014, Kraków Przedstawienie problemu Systemy
Bardziej szczegółowodr inż. Piotr Odya Parametry dźwięku zakres słyszanych przez człowieka częstotliwości: 20 Hz - 20 khz; 10 oktaw zakres dynamiki słuchu: 130 db
dr inż. Piotr Odya Parametry dźwięku zakres słyszanych przez człowieka częstotliwości: 20 Hz - 20 khz; 10 oktaw zakres dynamiki słuchu: 130 db 1 Sygnał foniczny poziom analogowy czas cyfrowy poziom czas
Bardziej szczegółowoAutomatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści
Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, 2011 Spis treści Przedmowa 11 Rozdział 1. WPROWADZENIE 13 1.1. Czym jest automatyczne rozpoznawanie mowy 13 1.2. Poziomy
Bardziej szczegółowoMetoda weryfikacji mówcy na podstawie nieuzgodnionej wypowiedzi
BIULETYN INSTYTUTU AUTOMATYKI I ROBOTYKI NR, 005 Metoda weryfikacji mówcy na podstawie nieuzgodnionej wypowiedzi Leszek GRAD Zakład Automatyki, Instytut Teleinformatyki i Automatyki WAT, ul. Kaliskiego,
Bardziej szczegółowoWykład II. Reprezentacja danych w technice cyfrowej. Studia Podyplomowe INFORMATYKA Podstawy Informatyki
Studia Podyplomowe INFORMATYKA Podstawy Informatyki Wykład II Reprezentacja danych w technice cyfrowej 1 III. Reprezentacja danych w komputerze Rodzaje danych w technice cyfrowej 010010101010 001010111010
Bardziej szczegółowoSelekcja cech osobniczych sygnału mowy z wykorzystaniem algorytmów genetycznych
Bi u l e t y n WAT Vo l. LXV, Nr 1, 2016 Selekcja cech osobniczych sygnału mowy z wykorzystaniem algorytmów genetycznych Kamil Kamiński, Andrzej P. Dobrowolski, Ewelina Majda-Zdancewicz Wojskowa Akademia
Bardziej szczegółowo4 Zasoby językowe Korpusy obcojęzyczne Korpusy języka polskiego Słowniki Sposoby gromadzenia danych...
Spis treści 1 Wstęp 11 1.1 Do kogo adresowana jest ta książka... 12 1.2 Historia badań nad mową i językiem... 12 1.3 Obecne główne trendy badań... 16 1.4 Opis zawartości rozdziałów... 18 2 Wyzwania i możliwe
Bardziej szczegółowoPomiary w technice studyjnej. TESTY PESQ i PEAQ
Pomiary w technice studyjnej TESTY PESQ i PEAQ Wprowadzenie Problem: ocena jakości sygnału dźwiękowego. Metody obiektywne - np. pomiar SNR czy THD+N - nie dają pełnych informacji o jakości sygnału. Ważne
Bardziej szczegółowoRozpoznawanie mówcy na podstawie transkodowanej mowy do interfejsów człowiek-maszyna. mgr inż. Radosław Weychan
Streszczenie rozprawy doktorskiej Rozpoznawanie mówcy na podstawie transkodowanej mowy do interfejsów człowiek-maszyna mgr inż. Radosław Weychan Instytut Automatyki i Robotyki Wydział Informatyki Politechnika
Bardziej szczegółowoPRAKTYCZNE ASPEKTY WYKORZYSTYWANIA SYSTEMÓW ROZPOZNAWANIA MOWY OPARTYCH NA HMM
MODELOWANIE INŻYNIERSKIE ISSN 896-77X 40, s. 7-78, Gliwice 200 PRAKTYCZNE ASPEKTY WYKORZYSTYWANIA SYSTEMÓW ROZPOZNAWANIA MOWY OPARTYCH NA HMM AGNIESZKA MIETŁA, MAREK IWANIEC Katedra Automatyzacji Procesów,
Bardziej szczegółowoProjekt Sieci neuronowe
Projekt Sieci neuronowe Chmielecka Katarzyna Gr. 9 IiE 1. Problem i dane Sieć neuronowa miała za zadanie nauczyć się klasyfikować wnioski kredytowe. W projekcie wykorzystano dane pochodzące z 110 wniosków
Bardziej szczegółowoRozpoznawanie i synteza mowy w systemach multimedialnych. Analiza i synteza mowy - wprowadzenie. Spektrogram wyrażenia: computer speech
Slajd 1 Analiza i synteza mowy - wprowadzenie Spektrogram wyrażenia: computer speech Slide 1 Slajd 2 Analiza i synteza mowy - wprowadzenie Slide 2 Slajd 3 Analiza i synteza mowy - wprowadzenie Slide 3
Bardziej szczegółowoSummary in Polish. Fatimah Mohammed Furaiji. Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling
Summary in Polish Fatimah Mohammed Furaiji Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling Zastosowanie symulacji wieloagentowej w modelowaniu zachowania konsumentów Streszczenie
Bardziej szczegółowoSztuczna Inteligencja Tematy projektów Sieci Neuronowe
PB, 2009 2010 Sztuczna Inteligencja Tematy projektów Sieci Neuronowe Projekt 1 Stwórz projekt implementujący jednokierunkową sztuczną neuronową złożoną z neuronów typu sigmoidalnego z algorytmem uczenia
Bardziej szczegółowoRozpoznawanie mówcy i emocji
Katedra Elektroniki, Zespół Przetwarzania Sygnałów www.dsp.agh.edu.pl http://rozpoznawaniemowy.blogspot.com/ Rozpoznawanie mówcy i emocji Bartosz Ziółko Wykorzystano materiały Davida Sierry, Wojciecha
Bardziej szczegółowoKATEDRA SYSTEMÓW MULTIMEDIALNYCH. Inteligentne systemy decyzyjne. Ćwiczenie nr 12:
KATEDRA SYSTEMÓW MULTIMEDIALNYCH Inteligentne systemy decyzyjne Ćwiczenie nr 12: Rozpoznawanie mowy z wykorzystaniem ukrytych modeli Markowa i pakietu HTK Opracowanie: mgr inż. Kuba Łopatka 1. Wprowadzenie
Bardziej szczegółowoSystemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład III 2016/2017
Systemy pomiarowo-diagnostyczne Metody uczenia maszynowego wykład III bogumil.konopka@pwr.edu.pl 2016/2017 Wykład III - plan Regresja logistyczna Ocena skuteczności klasyfikacji Macierze pomyłek Krzywe
Bardziej szczegółowoMetody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Laboratorium MATLAB Zadanie nr 2 Detekcja twarzy autorzy: A. Gonczarek, J.M. Tomczak Cel zadania Celem zadania jest zapoznanie się algorytmem gradientu prostego
Bardziej szczegółowoWydział Elektryczny. Katedra Telekomunikacji i Aparatury Elektronicznej. Instrukcja do pracowni specjalistycznej
Politechnika Białostocka Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej Instrukcja do pracowni specjalistycznej Temat ćwiczenia: Badanie własności koderów PCM zastosowanych do sygnałów
Bardziej szczegółowoOpisy efektów kształcenia dla modułu
Karta modułu - Technologia mowy 1 / 5 Nazwa modułu: Technologia mowy Rocznik: 2012/2013 Kod: RIA-1-504-s Punkty ECTS: 7 Wydział: Inżynierii Mechanicznej i Robotyki Poziom studiów: Studia I stopnia Specjalność:
Bardziej szczegółowoRedukcja kosztów połączeń telekomunikacyjnych przy wykorzystaniu central ISDN PABX
Andrzej Białas, Waldemar Fuczkiewicz Aksonet Poznań Wojciech Kabaciński Instytut Elektroniki i Telekomunikacji Politechnika Poznańska Redukcja kosztów połączeń telekomunikacyjnych przy wykorzystaniu central
Bardziej szczegółowoOpenAI Gym. Adam Szczepaniak, Kamil Walkowiak
OpenAI Gym Adam Szczepaniak, Kamil Walkowiak Plan prezentacji Programowanie agentowe Uczenie przez wzmacnianie i problemy związane z rozwojem algorytmów Charakterystyka OpenAI Gym Biblioteka gym Podsumowanie
Bardziej szczegółowoPubliczna Szkoła Podstawowa nr 14 w Opolu. Edukacyjna Wartość Dodana
Publiczna Szkoła Podstawowa nr 14 w Opolu Edukacyjna Wartość Dodana rok szkolny 2014/2015 Edukacyjna Wartość Dodana (EWD) jest miarą efektywności nauczania dla szkoły i uczniów, którzy do danej placówki
Bardziej szczegółowoWSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno
WSTĘP DO REGRESJI LOGISTYCZNEJ Dr Wioleta Drobik-Czwarno REGRESJA LOGISTYCZNA Zmienna zależna jest zmienną dychotomiczną (dwustanową) przyjmuje dwie wartości, najczęściej 0 i 1 Zmienną zależną może być:
Bardziej szczegółowoKształtowanie kompetencji personalnych i społecznych w szkole zawodowej drogą do sukcesu na rynku pracy
Wyniki cząstkowe testów ex ante z uczniami. We wszystkich pięciu uczestniczących w tym etapie projektu szkołach ponadgimnazjalnych rozpoczęły się zajęcia Innowacyjnego Programu Szkolnego Doradztwa Zawodowego.
Bardziej szczegółowoFormaty - podziały. format pliku. format kompresji. format zapisu (nośnika) kontener dla danych WAV, AVI, BMP
dr inż. Piotr Odya Formaty - podziały format pliku kontener dla danych WAV, AVI, BMP format kompresji bezstratna/stratna ADPCM, MPEG, JPEG, RLE format zapisu (nośnika) ściśle określona struktura plików
Bardziej szczegółowoPrzykładowe zadanie praktyczne
Przykładowe zadanie praktyczne Opracuj projekt realizacji prac związanych z uruchomieniem i testowaniem kodera i dekodera PCM z układem scalonym MC 145502 zgodnie z zaleceniami CCITT G.721 (załączniki
Bardziej szczegółowoMETODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
Bardziej szczegółowoRegresja logistyczna (LOGISTIC)
Zmienna zależna: Wybór opcji zachodniej w polityce zagranicznej (kodowana jako tak, 0 nie) Zmienne niezależne: wiedza o Unii Europejskiej (WIEDZA), zamieszkiwanie w regionie zachodnim (ZACH) lub wschodnim
Bardziej szczegółowoKompresja dźwięku w standardzie MPEG-1
mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 7, strona 1. Kompresja dźwięku w standardzie MPEG-1 Ogólne założenia kompresji stratnej Zjawisko maskowania psychoakustycznego Schemat blokowy
Bardziej szczegółowoAnaliza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU
Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów
Bardziej szczegółowoKOMPRESJA STRATNA SYGNAŁU MOWY. Metody kompresji stratnej sygnałów multimedialnych: Uproszczone modelowanie źródeł generacji sygnałów LPC, CELP
KOMPRESJA STRATNA SYGNAŁU MOWY Metody kompresji stratnej sygnałów multimedialnych: Uproszczone modelowanie źródeł generacji sygnałów LPC, CELP Śledzenie i upraszczanie zmian dynamicznych sygnałów ADPCM
Bardziej szczegółowoSpis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami
Spis treści Format WAVE Format MP3 Format ACC i inne Konwersja między formatami Formaty plików audio różnią się od siebie przede wszystkim zastosowanymi algorytmami kompresji. Kompresja danych polega na
Bardziej szczegółowoKondycja ekonomiczna drzewnych spółek giełdowych na tle innych branż
Annals of Warsaw Agricultural University SGGW Forestry and Wood Technology No 56, 25: Kondycja ekonomiczna drzewnych spółek giełdowych na tle innych branż SEBASTIAN SZYMAŃSKI Abstract: Kondycja ekonomiczna
Bardziej szczegółowoIntegracja systemu CAD/CAM Catia z bazą danych uchwytów obróbkowych MS Access za pomocą interfejsu API
Dr inż. Janusz Pobożniak, pobozniak@mech.pk.edu.pl Instytut Technologii Maszyn i Automatyzacji produkcji Politechnika Krakowska, Wydział Mechaniczny Integracja systemu CAD/CAM Catia z bazą danych uchwytów
Bardziej szczegółowoOptymalizacja systemów
Optymalizacja systemów Laboratorium - problem detekcji twarzy autorzy: A. Gonczarek, J.M. Tomczak, S. Zaręba, P. Klukowski Cel zadania Celem zadania jest zapoznanie się z gradientowymi algorytmami optymalizacji
Bardziej szczegółowoNiepewności pomiarów
Niepewności pomiarów Międzynarodowa Organizacja Normalizacyjna (ISO) w roku 1995 opublikowała normy dotyczące terminologii i sposobu określania niepewności pomiarów [1]. W roku 1999 normy zostały opublikowane
Bardziej szczegółowoSYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia
Bardziej szczegółowoAnaliza wariancji - ANOVA
Analiza wariancji - ANOVA Analiza wariancji jest metodą pozwalającą na podział zmienności zaobserwowanej wśród wyników eksperymentalnych na oddzielne części. Każdą z tych części możemy przypisać oddzielnemu
Bardziej szczegółowoALGORYTM RANDOM FOREST
SKRYPT PRZYGOTOWANY NA ZAJĘCIA INDUKOWANYCH REGUŁ DECYZYJNYCH PROWADZONYCH PRZEZ PANA PAWŁA WOJTKIEWICZA ALGORYTM RANDOM FOREST Katarzyna Graboś 56397 Aleksandra Mańko 56699 2015-01-26, Warszawa ALGORYTM
Bardziej szczegółowoMetody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Laboratorium JAVA Zadanie nr 2 Rozpoznawanie liter autorzy: A. Gonczarek, J.M. Tomczak Cel zadania Celem zadania jest zapoznanie się z problemem klasyfikacji
Bardziej szczegółowoTestowanie modeli predykcyjnych
Testowanie modeli predykcyjnych Wstęp Podczas budowy modelu, którego celem jest przewidywanie pewnych wartości na podstawie zbioru danych uczących poważnym problemem jest ocena jakości uczenia i zdolności
Bardziej szczegółowoSYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska
SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska DRZEWO REGRESYJNE Sposób konstrukcji i przycinania
Bardziej szczegółowoSpis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami
Spis treści Format WAVE Format MP3 Format ACC i inne Konwersja między formatami Formaty plików audio różnią się od siebie przede wszystkim zastosowanymi algorytmami kompresji. Kompresja danych polega na
Bardziej szczegółowoKARTA DO CENTRAL: MICRA, SIGMA I OPTIMA. ver. 4.00.xx
KARTA DO CENTRAL: MICRA, SIGMA I OPTIMA ver. 4.00.xx Centrale Platan Micra, Sigma i Optima oraz programy komputerowe: PLATAN MicraPC, PLATAN SigmaPC, PLATAN OptimaPC i PLATAN BilCent są produktami firmy:
Bardziej szczegółowoSpis treści Wstęp Estymacja Testowanie. Efekty losowe. Bogumiła Koprowska, Elżbieta Kukla
Bogumiła Koprowska Elżbieta Kukla 1 Wstęp Czym są efekty losowe? Przykłady Model mieszany 2 Estymacja Jednokierunkowa klasyfikacja (ANOVA) Metoda największej wiarogodności (ML) Metoda największej wiarogodności
Bardziej szczegółowoPRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: SYSTEMY KOMUNIKACJI MIĘDZYKOMPUTEROWEJ Kierunek: Mechatronika Rodzaj przedmiotu: obowiązkowy Rodzaj zajęć: wykład, laboratorium I KARTA PRZEDMIOTU CEL PRZEDMIOTU PRZEWODNIK PO PRZEDMIOCIE
Bardziej szczegółowoMaciej Piotr Jankowski
Reduced Adder Graph Implementacja algorytmu RAG Maciej Piotr Jankowski 2005.12.22 Maciej Piotr Jankowski 1 Plan prezentacji 1. Wstęp 2. Implementacja 3. Usprawnienia optymalizacyjne 3.1. Tablica ekspansji
Bardziej szczegółowodr inż. Jacek Naruniec
dr inż. Jacek Naruniec Przetwarzanie wstępne Wyznaczenie obszarów zainteresowania Ekstrakcja cech - dźwięk Klasyfikacja detekcja mowy okno analizy spektrogram filtr preemfazy wokodery (formantów, kanałowe,
Bardziej szczegółowoZagadnienie optymalnych kryteriów identyfikacji osoby na podstawie analizy mowy
Zagadnienie optymalnych kryteriów identyfikacji osoby na podstawie analizy mowy Antoni Leon Dawidowicz 1 Agata Trawińska 2 1 Uniwersytet Jagielloński w Krakowie 2 Instytut Ekspertyz Sądowych w Krakowie
Bardziej szczegółowo2.2 Opis części programowej
2.2 Opis części programowej Rysunek 1: Panel frontowy aplikacji. System pomiarowy został w całości zintegrowany w środowisku LabVIEW. Aplikacja uruchamiana na komputerze zarządza przebiegiem pomiarów poprzez
Bardziej szczegółowoTELEFONIA INTERNETOWA
Politechnika Poznańska Wydział Elektroniki i Telekomunikacji Katedra Sieci Telekomunikacyjnych i Komputerowych TELEFONIA INTERNETOWA Laboratorium TEMAT ĆWICZENIA INSTALACJA I PODSTAWY SERWERA ASTERISK
Bardziej szczegółowoSystemy i Sieci Telekomunikacyjne laboratorium. Modulacja amplitudy
Systemy i Sieci Telekomunikacyjne laboratorium Modulacja amplitudy 1. Cel ćwiczenia: Celem części podstawowej ćwiczenia jest zbudowanie w środowisku GnuRadio kompletnego, funkcjonalnego odbiornika AM.
Bardziej szczegółowoKwantyzacja wektorowa. Kodowanie różnicowe.
Kwantyzacja wektorowa. Kodowanie różnicowe. Kodowanie i kompresja informacji - Wykład 7 12 kwietnia 2010 Kwantyzacja wektorowa wprowadzenie Zamiast kwantyzować pojedyncze elementy kwantyzujemy całe bloki
Bardziej szczegółowoPDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych
Bardziej szczegółowoPorównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych
dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo
Bardziej szczegółowoMETODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA
METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA AMFETAMINY Waldemar S. Krawczyk Centralne Laboratorium Kryminalistyczne Komendy Głównej Policji, Warszawa (praca obroniona na Wydziale Chemii Uniwersytetu
Bardziej szczegółowoRozpoznawanie mówców metodą i-wektorów/plda na urządzeniach mobilnych
Rozpoznawanie mówców metodą i-wektorów/plda na urządzeniach mobilnych Autor: Radosław Białobrzeski Opiekun: prof. Andrzej Pacut Seminarium Zespołu Biometrii i Uczenia Maszynowego, 24.10.2017 1/27 1. Cel
Bardziej szczegółowoPodsumowanie wyników ankiety
SPRAWOZDANIE Kierunkowego Zespołu ds. Programów Kształcenia dla kierunku Informatyka dotyczące ankiet samooceny osiągnięcia przez absolwentów kierunkowych efektów kształcenia po ukończeniu studiów w roku
Bardziej szczegółowoANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU
ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU i klasyfikacja sygnału audio dr inż. Jacek Naruniec Sygnał mowy mózg (układ sterujący) głośnia (źródło dźwięku) rezonator akustyczny (filtr) sygnał mowy 2 Sygnał mowy
Bardziej szczegółowoZastosowania sieci neuronowych
Zastosowania sieci neuronowych klasyfikacja LABORKA Piotr Ciskowski zadanie 1. klasyfikacja zwierząt sieć jednowarstwowa żródło: Tadeusiewicz. Odkrywanie własności sieci neuronowych, str. 159 Przykład
Bardziej szczegółowoSprawozdanie z laboratoriów HTK!
Inżynieria akustyczna - Technologia mowy 2013 Błażej Chwiećko Sprawozdanie z laboratoriów HTK! 1. Przeznaczenie tworzonego systemu! Celem było stworzenie systemu służącego do sterowania samochodem. Zaimplementowane
Bardziej szczegółowoKlasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV
Klasyfikatory: k-nn oraz naiwny Bayesa Agnieszka Nowak Brzezińska Wykład IV Naiwny klasyfikator Bayesa Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną
Bardziej szczegółowo10. Redukcja wymiaru - metoda PCA
Algorytmy rozpoznawania obrazów 10. Redukcja wymiaru - metoda PCA dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. PCA Analiza składowych głównych: w skrócie nazywana PCA (od ang. Principle Component
Bardziej szczegółowoModulacja i kodowanie laboratorium. Modulacje Cyfrowe: Kluczowanie Amplitudy (ASK) i kluczowanie Fazy (PSK)
Modulacja i kodowanie laboratorium Modulacje Cyfrowe: Kluczowanie Amplitudy (ASK) i kluczowanie Fazy (PSK) Celem ćwiczenia jest opracowanie algorytmów modulacji i dekodowania dla dwóch rodzajów modulacji
Bardziej szczegółowoWYKŁAD 4. Podejmowanie decyzji dla modeli probabilistycznych Modelowanie Gaussowskie. autor: Maciej Zięba. Politechnika Wrocławska
Wrocław University of Technology WYKŁAD 4 Podejmowanie decyzji dla modeli probabilistycznych Modelowanie Gaussowskie autor: Maciej Zięba Politechnika Wrocławska Klasyfikacja Klasyfikacja (ang. Classification):
Bardziej szczegółowoREGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji
Statystyka i opracowanie danych Ćwiczenia 5 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ MODEL REGRESJI LINIOWEJ Analiza regresji
Bardziej szczegółowoKlasyfikator liniowy Wstęp Klasyfikator liniowy jest najprostszym możliwym klasyfikatorem. Zakłada on liniową separację liniowy podział dwóch klas między sobą. Przedstawia to poniższy rysunek: 5 4 3 2
Bardziej szczegółowoOprogramowanie Systemów Obrazowania SIECI NEURONOWE
SIECI NEURONOWE Przedmiotem laboratorium jest stworzenie algorytmu rozpoznawania zwierząt z zastosowaniem sieci neuronowych w oparciu o 5 kryteriów: ile zwierzę ma nóg, czy żyje w wodzie, czy umie latać,
Bardziej szczegółowoGSMONLINE.PL. UKE: Polacy o rynku telekomunikacyjnym w roku
GSMONLINE.PL UKE: Polacy o rynku telekomunikacyjnym w roku 2013 2013-12-13 UKE opublikowało raporty z badań w zakresie korzystania z usług telekomunikacyjnych. Uzyskane rezultaty zawierają opinie konsumentów
Bardziej szczegółowoRozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów
Rozdział : Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów W tym rozdziale omówione zostaną dwie najpopularniejsze metody estymacji parametrów w ekonometrycznych modelach nieliniowych,
Bardziej szczegółowoROADSHOW2016. Wprowadzenie. Rynek telekomunikacji w Polsce. Marcin Bieńkowski. kontakt: marcin.w.bienkowski@gmail.com
Wprowadzenie Rynek telekomunikacji w Polsce Marcin Bieńkowski kontakt: marcin.w.bienkowski@gmail.com Rynek telekomunikacyjny w Polsce W 2014 r. łączna wartość polskiego rynku telekomunikacyjnego wyniosła
Bardziej szczegółowoKryteria wyboru operatorów usług telefonicznych przez abonentów w Polsce
Roman Nierebiński Opisano czynniki, wpływające na wybór operatora usług telefonii stacjonarnej i komórkowej. Wskazano najczęściej wybieranych operatorów telefonicznych oraz podano motywy wyboru. telekomunikacja,
Bardziej szczegółowoAgnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
Bardziej szczegółowoSTATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe i teoria prawdopodobieństwa 3. Populacje i próby danych 4. Testowanie hipotez i estymacja parametrów 5. Najczęściej wykorzystywane testy statystyczne
Bardziej szczegółowoMetoda określania pozycji wodnicy statków na podstawie pomiarów odległości statku od głowic laserowych
inż. Marek Duczkowski Metoda określania pozycji wodnicy statków na podstawie pomiarów odległości statku od głowic laserowych słowa kluczowe: algorytm gradientowy, optymalizacja, określanie wodnicy W artykule
Bardziej szczegółowoPrzykładowe rozwiązanie zadania dla zawodu technik telekomunikacji
PROJEKT REALIZACJI PRAC ZWIĄZANYCH Z URUCHOMIENIEM I TESTOWANIEM KODERA I DEKODERA PCM ORAZ WYKONANIE PRAC OBEJMUJĄCYCH OPRACOWANIE WYNIKÓW POMIARÓW Z URUCHOMIENIA I SPRAWDZENIA DZIAŁANIA JEGO CZĘŚCI CYFROWEJ
Bardziej szczegółowoTechnologie Informacyjne
POLITECHNIKA KRAKOWSKA - WIEiK - KATEDRA AUTOMATYKI Technologie Informacyjne www.pk.edu.pl/~zk/ti_hp.html Wykładowca: dr inż. Zbigniew Kokosiński zk@pk.edu.pl Wykład: Generacja liczb losowych Problem generacji
Bardziej szczegółowoLABORATORIUM PODSTAW TELEKOMUNIKACJI
WOJSKOWA AKADEMIA TECHNICZNA im. Jarosława Dąbrowskiego w Warszawie Wydział Elektroniki LABORATORIUM PODSTAW TELEKOMUNIKACJI Grupa Podgrupa Data wykonania ćwiczenia Ćwiczenie prowadził... Skład podgrupy:
Bardziej szczegółowoPrzedmiotowy system oceniania wraz z określeniem wymagań edukacyjnych i szczegółowych kryteriów oceniania wiedzy i umiejętności dla przedmiotu
Przedmiotowy system oceniania wraz z określeniem wymagań edukacyjnych i szczegółowych kryteriów oceniania wiedzy i umiejętności dla przedmiotu FIZYKA MEDYCZNA 1 Informacje wstępne 1. Nauczyciel ocenia
Bardziej szczegółowoKodowanie i kompresja Streszczenie Studia Licencjackie Wykład 11,
1 Kwantyzacja skalarna Kodowanie i kompresja Streszczenie Studia Licencjackie Wykład 11, 10.05.005 Kwantyzacja polega na reprezentowaniu dużego zbioru wartości (być może nieskończonego) za pomocą wartości
Bardziej szczegółowoKlasyfikator. ˆp(k x) = 1 K. I(ρ(x,x i ) ρ(x,x (K) ))I(y i =k),k =1,...,L,
Klasyfikator Jedną z najistotniejszych nieparametrycznych metod klasyfikacji jest metoda K-najbliższych sąsiadów, oznaczana przez K-NN. W metodzie tej zaliczamy rozpoznawany obiekt do tej klasy, do której
Bardziej szczegółowoAlgorytm do rozpoznawania człowieka na podstawie dynamiki użycia klawiatury. Paweł Kobojek, prof. dr hab. inż. Khalid Saeed
Algorytm do rozpoznawania człowieka na podstawie dynamiki użycia klawiatury Paweł Kobojek, prof. dr hab. inż. Khalid Saeed Zakres pracy Przegląd stanu wiedzy w dziedzinie biometrii, ze szczególnym naciskiem
Bardziej szczegółowoRozpoznawanie obrazów
Rozpoznawanie obrazów Laboratorium Python Zadanie nr 1 Regresja liniowa autorzy: A. Gonczarek, J.M. Tomczak, S. Zaręba, M. Zięba, J. Kaczmar Cel zadania Celem zadania jest implementacja liniowego zadania
Bardziej szczegółowor. rok szkolny 2012/2013
04.04.2013r. rok szkolny 2012/2013 Do sprawdzianu po szkole podstawowej przystąpiło 71 uczniów. Wszyscy uczniowie pisali sprawdzian w wersji standardowej. Struktura arkusza sprawdzającego umiejętności
Bardziej szczegółowoJęzyk opisu sprzętu VHDL
Język opisu sprzętu VHDL dr inż. Adam Klimowicz Seminarium dydaktyczne Katedra Mediów Cyfrowych i Grafiki Komputerowej Informacje ogólne Język opisu sprzętu VHDL Przedmiot obieralny dla studentów studiów
Bardziej szczegółowoAnaliza wyników egzaminu gimnazjalnego z języka obcego nowożytnego w roku szkolnym 2014/2015
Analiza wyników egzaminu gimnazjalnego z języka obcego nowożytnego w roku szkolnym 2014/2015 Analiza wyników egzaminu gimnazjalnego z języka angielskiego na poziomie podstawowym Arkusz składał się z 40
Bardziej szczegółowo