Klasyfikacja mówców oparta na modelowaniu GMM-UBM dla mowy o różnej jakości

Wielkość: px
Rozpocząć pokaz od strony:

Download "Klasyfikacja mówców oparta na modelowaniu GMM-UBM dla mowy o różnej jakości"

Transkrypt

1 Artur Janicki Tomasz Staroszczyk Zakład Systemów Teletransmisyjnych Instytut Telekomunikacji Politechnika Warszawska Klasyfikacja mówców oparta na modelowaniu GMM-UBM dla mowy o różnej jakości Artykuł opisuje eksperymenty dotyczące niezależnej od tekstu klasyfikacji mówców z wykorzystaniem modeli GMM- UBM dla wąskopasmowego sygnału mowy o różnej jakości. Badania prowadzono dla mowy niekodowanej oraz dla mowy transkodowanej z użyciem kodeków stosowanych w telefonii stacjonarnej (G.711), mobilnej (GSM 06.10, GSM 06.60) i internetowej (Speex, G.723.1). Modele poszczególnych mówców zostały wygenerowane przez adaptację uniwersalnego modelu mówcy UBM do fraz uczących za pomocą algorytmu MAP (maximum a posteriori). Prowadzono eksperymenty w warunkach dopasowania, tzn. kiedy system był uczony i testowany na mowie o tej samej jakości, oraz niedopasowania, gdzie uczono i testowano na sygnałach o różnej jakości. Dla nagrań z bazy TIMIT osiągnięto dokładność klasyfikacji w granicach 81,5% - 93% w warunkach dopasowania; przy niedopasowaniu następowało obniżenie dokładności klasyfikacji, zwykle zależne od różnicy jakości. Wykazano, że model wygenerowany w oparciu o kodek Speex jest najbardziej skuteczny dla niedopasowanych warunków klasyfikacji. 1. Wstęp Systemy rozpoznawania mówców często mają za zadanie rozpoznać mówcę, którego głos został przetransmitowany przez kanał telekomunikacyjny. Tak się dzieje na przykład w przypadku systemu weryfikacji klientów banku składających telefoniczne dyspozycje. Systemy te przechowują matematyczne modele głosów klientów, z którymi porównywany jest głos telefonującego. Głos ten może być różnej jakości, gdyż modyfikowany jest przez kanał telekomunikacyjny. Elementem, który ma istotny wpływ na jakość, jest zastosowany kodek mowy. Inny kodek stosuje telefonia stacjonarna, inne są używane w telefonii komórkowej, a jeszcze inne w telefonii internetowej (VoIP). Niniejsza praca ma na celu pokazanie, jak zmienia się poprawność systemu rozpoznawania mówcy w koncepcji GMM-UBM dla sygnału mowy o różnej jakości. Jest to istotne z tego względu, że system nie ma zwykle możliwości sprawdzenia jaki kodek zastosowano w kanale telekomunikacyjnym, przez który uwierzytelnia się użytkownik. Badania ograniczono do sygnałów wąskopasmowych, tzn. próbkowanych z częstotliwością 8 khz. Rozpatrywano problem rozpoznawania mówcy niezależnego od tekstu, tzn. takiego, gdzie system testowany jest na innych frazach niż te, które wykorzystane zostały w procesie uczenia. Problematyka dotyczy rozpoznawania mówcy w zbiorze zamkniętym (w tym wypadku 462 mówców), jednak wnioski z eksperymentów można rozszerzyć na zagadnienia pokrewne, np. weryfikację mówcy, czyli sprawdzanie, czy mówca jest tym, za kogo się podaje. 2. Badania nad rozpoznawaniem mówców 2.1. Algorytm GMM-UBM Najbardziej rozpowszechnioną techniką modelowania mówcy w problemie rozpoznawania niezależnego od tekstu jest zastosowanie liniowej kombinacji rozkładów normalnych GMM (Gaussian Mixture Models). Model GMM jest tworzony dla każdego mówcy aby odwzorować

2 wielowymiarowy rozkład gęstości prawdopodobieństwa wektorów wyekstrahowanych na bazie sygnału mowy, np. wektorów współczynników MFCC (mel-cepstrum). Uczenie modelu GMM realizuje się najczęściej poprzez adaptację parametrów modelu mówcy uniwersalnego UBM (Universal Background Model) [10], za pomocą algorytmu MAP (maximum a posteriori). Technikę tę określa się często akronimem GMM-UBM. Algorytm MAP zapewnia modyfikację tylko tych komponentów modelu, które dobrze opisywane są przez dane uczące dla których zgromadzono wystarczającą ilość danych uczących. Komponenty niedostatecznie reprezentowane przez zbiór danych trenujących przejmowane są natomiast bezpośrednio z modelu UBM. Proces rozpoznawania mówcy (czyli testowania modelu) polega na obliczeniu prawdopodobieństwa (ściślej: logarytmu prawdopodobieństwa, log-likelihood) tego, że sygnał testujący pochodzi od danego mówcy, przy czym każdy z mówców reprezentowany jest przez odrębny model GMM. W przypadku klasyfikacji dla testowanej wypowiedzi przeglądane są zatem modele wszystkich mówców, a nagranie zostaje zaklasyfikowane do mówcy, dla którego osiągnięto najwyższą wartość tego prawdopodobieństwa Bazy nagrań wykorzystywane do eksperymentów z rozpoznawaniem mówcy W badaniach nad rozpoznawaniem mówcy wykorzystuje się różne bazy nagrań, m.in. w zależności od tego, jaka jakość sygnału mowy jest wymagana, a także jakie aspekty rozpoznawania są badane. Na przykład do eksperymentów z weryfikacją mówcy wskazane jest, aby była to baza wielosesyjna, tzn. taka, w której nagrania od mówców pochodzą z różnych sesji, oddalonych w czasie. Poniżej wymieniono najczęściej wykorzystywane bazy nagrań. NIST Speaker Recognition Evaluation 1999 [8] baza dla języka angielskiego, stworzona z myślą o eksperymentach z rozpoznawaniem mówcy, podobnie jak jej kolejne wersje w następnych latach. Zawiera 2728 pięciominutowych konwersacji, pochodzących łącznie od 640 mówców. TIMIT [5] baza stworzona wspólnie przez Massachusetts Institute of Technology (MIT), SRI International (SRI) i Texas Instruments (TI) dla 8 dialektów amerykańskiego języka angielskiego. Zawiera zdania bogate fonetycznie pochodzące od 630 mówców obojga płci, nagrane z jakością 16 bit/próbkę przy częstotliwości próbkowania 16 khz. Każdy mówca wypowiada 10 zdań (tak zwane zdania SX, SA i SI). PolyVar baza opracowana przez stowarzyszenie ELRA [4] dla języka francuskiego. Zawiera nagrania cyfr, liczb, pojedynczych słów dot. turystyki, dat, godzin, pochodzące od 72 mówców, którzy powtarzali sesje nagrań wielokrotnie (2-100 razy) i 71 mówców, którzy uczestniczyli w jednej sesji. Jakość telefoniczna Rozpoznawanie mówców dla mowy o różnej jakości W literaturze spotyka się zwykle badania dotyczące rozpoznawania mówców dla sygnałów szerokopasmowych lub dla mowy o jakości telefonicznej, co oznacza zwykle użycie kodeka G.711. Są jednak prace, które poświęcają więcej uwagi zagadnieniom różnic w jakości sygnałów wąskopasmowych i rozpatrują problem rozpoznawania mówcy dla mowy kodowanej. Przykładem jest [9], gdzie wykazano, że poprawność rozpoznawania mówcy dla kodeków GSM 06.10, G i G.729 zależy wyraźnie od jakości percepcyjnej kodeka. W [1] badano kodeki GSM i wykazano, że za spadek poprawności rozpoznawania mówcy odpowiedzialny jest w głównej mierze niski rząd predykcji w tych kodekach. Osiągnięto poprawność rozpoznawania 68,5% oraz 71,8%, odpowiednio dla GSM i GSM Badano jedynie warunki dopasowania, tzn. rozpoznawanie przeprowadzano dla tej samej jakości sygnału, dla której tworzono modele mówców. Kodek GSM badano też w [6] dla korpusu ARADIGIT, zawierającego

3 nagrania cyfr w języku arabskim pochodzące od 60 mówców. Uzyskano wówczas dokładność klasyfikacji na poziomie 78,06%. Inny projekt [12] dotyczył badania degradacji poprawności klasyfikacji mówców dla mowy transkodowanej kodekiem Speex [13], stosowanym w transmisji VoIP. Zasugerowano, że kodek Speex może być przydatny w tworzeniu modeli mówców, gdyż zapewnia stosunkowo wysoką poprawność rozpoznawania w warunkach niedopasowania. 3. Opis eksperymentu 3.1. Użyta baza nagrań W niniejszym badaniu wykorzystano bazę TIMIT. Wprawdzie nie jest ona dedykowana ściśle do eksperymentów z rozpoznawaniem mówcy, bo nie uwzględnia np. wielosesyjności, zawiera jednak nagrania wielu mówców (630) i używana była z powodzeniem w podobnych badaniach [1]. Zdecydowano, by zbiór zawarty w folderze TEST zawierający wybrane nagrania każdego z dialektów (łącznie 1680 nagrań pochodzących od 168 mówców) wykorzystać do utworzenia uniwersalnego modelu tła UBM. Nagrania w folderze nazwanym oryginalnie TRAIN wykorzystano zarówno do uczenia modeli (do tego użyto zdań SX, których każdy mówca wypowiada 5), jak i testowania (tu użyto zdań SA i SI). Eksperymenty prowadzono więc dla klasyfikacji 462 mówców Badane rodzaje jakości sygnału mowy Eksperymenty prowadzono dla różnej jakości sygnału mowy. Jeden z wariantów to: mowa niekodowana czyli oryginalne nagrania, ale przepróbkowane do częstotliwości 8 khz, by móc się porównywać z innymi kodekami telefonicznymi. Oprócz tego badano sygnał mowy przesłany w wykorzystaniem kodeków, występujących najczęściej w telefonii klasycznej (stacjonarnej i mobilnej) oraz internetowej: G.711 (PCM) opracowany w 1972 roku przez ITU międzynarodowy standard cyfrowej modulacji sygnałów mowy o prędkości transmisji 64 kbit/s, powszechnie stosowany w systemach telefonii stacjonarnej na całym świecie. Realizuje proces modulacji PCM o częstotliwości próbkowania 8 khz i rozdzielczości kwantyzacji 8 bit/próbkę, z kwantyzacją logarytmiczną A-law (stosowaną m.in. w Europie, użytą w tym projekcie) lub -law. G723.1 kodek mowy stosowany w telefonii VoIP (Voice over IP) przeznaczony do kompresji sygnału PCM o przepustowości 64 kbit/s do strumienia 5,3 kbit/s lub (jak użyto w tym badaniu) 6,4 kbit/s przez zastosowanie algorytmów kompresji stratnej MP-MLQ (Multi-Pulse Maximum Likelihood Quantization) oraz ACELP (Algebraic Code Excited Linear Prediction). GSM (GSM-FR, GSM Full Rate) - opracowany na początku lat 90. i nadal wykorzystywany standard kodowania mowy w systemie telefonii GSM o przepływności 13,2 kbit/s. Kompresja dźwięku realizowana w oparciu o algorytm RPE-LTP (Regular Pulse Excitation-Long Term Prediction). GSM (GSM-EFR, GSM-Enhanced Full Rate) ustandaryzowany w 1995 roku następca kodeka GSM 06.10, o przepływności 12,2 kbit/s. Realizowany w oparciu o algorytm ACELP (Algebraic Code Excited Linear Prediction), w pełni kompatybilny z kodekiem AMR-NB (Adaptive Multi-Rate - Narrow Band). Speex [13] kodek stratny przeznaczony do kompresji mowy głównie w zastosowaniach telefonii VoIP (Voice over IP), realizowany w oparciu o algorytm CELP i dostosowany do współpracy z sygnałami o częstotliwości próbkowania od 8 do 32 khz. W niniejszej pracy wykorzystano tryb wąskopasmowy najwyższej jakości kompresji (przepływność 42,2 kbit/s).

4 3.3. Proces klasyfikacji Eksperymenty prowadzono środowisku MATLAB z wykorzystaniem specjalistycznych bibliotek, takich jak Voicebox [2], h2m [3], bibliotekę G Speech Coder and Decoder, a także pakiet SoX [11] i emulator kodeka Speex [13]. Sygnał mowy sparametryzowano z wykorzystaniem 19 współczynników mel-cepstralnych (MFCC) z użyciem okna o długości 30 ms, stosując krok analizy 10 ms. Do zbioru współczynników MFCC dołączono tzw. współczynnik zerowy (zeroth cepstral coefficient). Proces klasyfikacji mówców zrealizowano w koncepcji GMM-UBM. Uniwersalny model tła (UBM) stworzono na podstawie nagrań pochodzących od 168 mówców obojga płci. Przyjęto liczbę komponentów M równą 64 i ograniczono się do diagonalnych macierzy kowariancji. Wektory średnie modelu zainicjalizowano metodą k-średnich, natomiast wagi oraz macierze kowariancji wyznaczono losowo. Uczenie zrealizowano z użyciem algorytmu EM (Expectation-Maximization). Dla każdego z pozostałych 462 mówców wytrenowano modele GMM poprzez adaptację modelu UBM algorytmem MAP, gdzie adaptacji podlegały jedynie wektory średnie modelu. Trenowanie przeprowadzono na bazie 5 zdań SX, co stanowi ok. 16 s sygnału mowy na mówcę. Pozostałe zdania (SA i SI) poddano klasyfikacji w ten sposób, że każde z nich przypisano do mówcy, którego model z największą wiarygodnością reprezentował zdanie testujące. Stosunek poprawnie sklasyfikowanych zdań do wszystkich 2310 testowanych zdań stanowił miarę poprawności klasyfikacji. Prowadzono eksperymenty z klasyfikacją w dwóch przypadkach: w warunkach dopasowania, to znaczy, że system klasyfikacji był uczony i trenowany na sygnałach o tej samej jakości (np. transkodowanej takim samym kodekiem), a także: w warunkach niedopasowania, kiedy system był testowany na mowie o innej jakości niż ta, dla której tworzono modele mówców. Zachowano jednak zasadę, że zdania uczące są nagrane z tą samą jakością, co mowa użyta do tworzenia modelu UBM. Warto zwrócić uwagę, że klasyfikowane zdania były dość krótkie (przeciętnie 3,2 s), co stanowiło dodatkowe utrudnienie. 4. Wyniki eksperymentów Tabela 1 przedstawia wyniki klasyfikacji dla warunków dopasowania oraz niedopasowania. Analiza wyników dla warunków dopasowania prowadzi do wniosków, które pojawiały się wcześniej ([9]) poprawność klasyfikacji jest silnie skorelowana z jakością mowy. Tabela 1. Wyniki klasyfikacji mówców dla systemów klasyfikacji mówców uczonych sygnałami o różnej jakości. Wytłuszczonym drukiem zaznaczono wyniki dla warunków dopasowania. uczenie\test niekod. G.711 G GSM GSM odch. Speex średnia stand. niekod. 93,03 92,25 58,66 53,64 80,91 91,78 78,17 14,54 G ,38 93,03 57,27 55,89 78,87 90,35 78,20 8,72 G ,75 76,41 81,52 71,39 81,00 82,60 77,49 4,26 GSM ,51 74,68 71,21 88,18 72,17 79,44 77,04 7,07 GSM ,51 79,44 73,72 54,55 90,04 84,07 79,93 8,94 Speex 91,34 90,61 70,30 68,01 81,39 92,21 82,31 9,08 Mowa niekodowana lub transkodowana przez kodery o wysokiej jakości (G.711, Speex) pozwala na wysoką poprawność klasyfikacji (powyżej 92%), natomiast wraz ze spadkiem jakości (kolejno kodeki: GSM 06.60, GSM 06.10, G.723.1) obserwujemy obniżanie poprawności. Najgorszy wynik

5 dokładność [%] (81,5%) dla warunków dopasowania uzyskano dla kodeka o najsłabszej jakości spośród testowanego zbioru, czyli dla G Stosując modele GMM z 64 rozkładami Gaussa uzyskano znaczną poprawę względem modeli używających 16 rozkładów, których użyto w [1]. Poprawa jest najwyraźniejsza dla sygnałów o słabszej jakości, tzn. w tym wypadku dla kodeków używanych w telefonii mobilnej. Tabela 2 prezentuje szczegóły porównania. Tabela 2. Porównanie wyników dla modeli GMM z 16 rozkładami Gaussa (na podstawie [1]) a wynikami z niniejszej pracy, dla 64 rozkładów. l. modeli \ jakość Analizując wyniki klasyfikacji dla warunków niedopasowania, można zauważyć, że zgodnie z oczekiwaniem następuje obniżenie dokładności klasyfikacji. Spadek ten jest najmniejszy, gdy różnica jakości między sygnałem użytym do uczenia i do testowania jest najmniejsza. Tak więc przy niedopasowaniu między mową niekodowaną (8 khz) a G.711 zmniejszenie dokładności klasyfikacji jest minimalne, dlatego że degradacja jakości wprowadzana przez kwantyzację logarytmiczną w G.711 jest bardzo mała. Słabo natomiast przebiega klasyfikacja dla mowy o jakości GSM 06.10, o ile modele mówców były uczone np. kodekiem G.711, a także, co jest pewnym zaskoczeniem, kodekiem GSM (odpowiednio 55,9% oraz 54,6%). Co ciekawe, niedopasowanie w drugą stronę (model tworzony dla GSM 06.60, zaś testowany mową GSM 06.10) powoduje mniejszą degradację klasyfikacja osiąga poprawność ponad 72% oryg. GSM GSM 8 khz (16 khz) GMM 16 [1] 97,80 86,90 68,50 71,80 GMM 64 99,00 93,03 88,18 90,04 niekod. G.711 G GSM GSM Speex niekod. G.711 G GSM GSM Speex kodek mowy użyty podczas testowania klasyfikacji Rys. 1. Prezentacja graficzna wyników klasyfikacji dla warunków dopasowania i niedopasowania. Rysunek 1 oraz średnie wartości, które prezentuje Tabela 1, pokazują, że kodek Speex jest najbardziej uniwersalny, jeśli chodzi o tworzenie modeli mówców odpornych na warunki

6 niedopasowania. System zrealizowany z wykorzystaniem mowy transkodowanej kodekiem Speex sprawuje się bardzo dobrze dla kodeka o wysokiej jakości (stosowany w telefonii stacjonarnej G.711), a także dla mowy transkodowanej kodekami GSM. Podobne wnioski przedstawione zostały w [12]. Stosunkowo dobrze w tym kontekście wypada też kodek GSM Z kolei kodek G wykazuje się najmniejszym rozrzutem poprawności dla sygnałów mowy o różnej jakości. 5. Podsumowanie i wnioski W pracy zaprezentowano wyniki eksperymentów z klasyfikacją mówców z użyciem metody GMM-UBM dla wąskopasmowego sygnału mowy o różnej jakości, to znaczy dla mowy niekodowanej oraz dla mowy transkodowanej z użyciem kodeków stosowanych w telefonii stacjonarnej, mobilnej i internetowej. W porównaniu do innych badań, w niniejszej pracy zastosowano modele GMM z większą liczbą rozkładów Gaussa, przebadano też więcej kodeków, a także badano szczegółowo warunki niedopasowania. Dla nagrań z bazy TIMIT osiągnięto dokładność klasyfikacji w granicach 81,5% - 93% dla warunków dopasowania. Wskazano też, że kodek Speex jest najbardziej uniwersalny w zakresie implementacji systemu rozpoznawania mówców, a jego poprawność rozpoznawania pozostaje wysoka dla mowy transkodowanej różnymi kodekami. Potencjalne przyszłe prace mogą obejmować testy dla innych kodeków, dla innych trybów pracy kodeka Speex, a także badanie wpływu zmienności głosu mówcy na poprawność klasyfikacji. Prowadzone są również prace dotyczące wykorzystania do klasyfikacji maszyny wektorów nośnych. 6. Literatura 1. L. Besacier, S. Grassi, A. Dufaux, M. Ansorge, F. Pellandini, GSM Speech Coding and Speaker Recognition, Proc. ICASSP 2000, ss , Istambuł, M. Brookes, VOICEBOX: Speech Processing Toolbox for MATLAB, dostępne na: 3. O. Cappé, h2m Toolkit, dostępne na: 4. ELRA - European Language Resources Association, dostępne na: 5. J. S. Garofolo et al., TIMIT Acoustic-Phonetic Continuous Speech Corpus, Linguistic Data Consortium, Philadelphia, A. Krobba, M. Debyeche, A. Amrouche, Evaluation of Speaker Identification System Using GSMEFR Speech Data, Proc International Conference on Design & Technology of Integrated Systems in Nanoscale Era, Hammamet, ss. 1-5, LDC - Linguistic Data Consortium, 8. A. Martin, M. Przybocki, The 1999 NIST Speaker Recognition Evaluation, Using Summed Two- Channel Telephone Data for Speaker Detection and Speaker Tracking, Proc. Eurospeech 1999, Budapeszt, T. Quatieri, E. Singer, R. Dunn, D. Reynolds, J. Campbell, Speaker and Language Recognition Using Speech Codec Parameters, Proc. Eurospeech 1999, vol. 2, ss , Budapeszt, D. Reynolds, W. Campbell, Text-Independent Speaker Recognition, w: Handbook of Speech Processing, ed. J. Benesty, M. Sondhi, Y. Huang, Springer, SoX - Sound exchange, dostępne na: A. Stauffer, A. Lawson, Speaker Recognition on Lossy Compressed Speech using the Speex Codec, Proc. Interspeech 2009, ss , Brighton (UK), Xiph-OSC: Speex: A free codec for free speech: Documentation, dostępne na:

METODY KODOWANIA SYGNAŁU MOWY DO ZASTOSOWAŃ W TELEKOMUNIKACJI

METODY KODOWANIA SYGNAŁU MOWY DO ZASTOSOWAŃ W TELEKOMUNIKACJI METODY KODOWANIA SYGNAŁU MOWY DO ZASTOSOWAŃ W TELEKOMUNIKACJI Maciej Kulesza pok. 726 Katedra Systemów Multimedialnych Plan wykładu Właściwości (charakterystyka) sygnału mowy Właściwości kodeków mowy Metody

Bardziej szczegółowo

Kwantowanie sygnałów analogowych na przykładzie sygnału mowy

Kwantowanie sygnałów analogowych na przykładzie sygnału mowy Kwantowanie sygnałów analogowych na przykładzie sygnału mowy Treść wykładu: Sygnał mowy i jego właściwości Kwantowanie skalarne: kwantyzator równomierny, nierównomierny, adaptacyjny Zastosowanie w koderze

Bardziej szczegółowo

58. Otwarte Seminarium z Akustyki, OSA '11, Gdańsk-Jurata, September 2011

58. Otwarte Seminarium z Akustyki, OSA '11, Gdańsk-Jurata, September 2011 109 ROZPOZNAWANIE MÓWCY W SYSTEMACH Z KODOWANIEM MOWY STEFAN BRACHMAŃSKI Politechnika Wrocławska, Instytut Telekomunikacji, Teleinformatyki i Akustyki Wybrzeże Wyspiańskiego 27, 50-370 Wrocław Stefan.brachmanski@pwr.wroc.pl

Bardziej szczegółowo

KODOWANIE I KOMPRESJA SYGNAŁU MOWY

KODOWANIE I KOMPRESJA SYGNAŁU MOWY Akustyka mowy KODOWANIE I KOMPRESJA SYGNAŁU MOWY Katedra Systemów Multimedialnych, Politechnika Gdańska Autor: Grzegorz Szwoch, kwiecień 2011 Potrzeba kompresji mowy Cyfrowy sygnał mowy bez kompresji:

Bardziej szczegółowo

Przesył mowy przez internet

Przesył mowy przez internet Damian Goworko Zuzanna Dziewulska Przesył mowy przez internet organizacja transmisji głosu, wybrane kodeki oraz rozwiązania podnoszące jakość połączenia głosowego Telefonia internetowa / voice over IP

Bardziej szczegółowo

S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor

S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor S O M SELF-ORGANIZING MAPS Przemysław Szczepańczyk Łukasz Myszor Podstawy teoretyczne Map Samoorganizujących się stworzył prof. Teuvo Kohonen (1982 r.). SOM wywodzi się ze sztucznych sieci neuronowych.

Bardziej szczegółowo

Wybrane algorytmu kompresji dźwięku

Wybrane algorytmu kompresji dźwięku [1/28] Wybrane algorytmu kompresji dźwięku [dr inż. Paweł Forczmański] Katedra Systemów Multimedialnych, Wydział Informatyki, Zachodniopomorski Uniwersytet Technologiczny w Szczecinie [2/28] Podstawy kompresji

Bardziej szczegółowo

Analogowa (para miedziana, radio, walkie-talkie, CB) Cyfrowa (ISDN, GSM, VoIP, DRB, DVB, Tetra, )

Analogowa (para miedziana, radio, walkie-talkie, CB) Cyfrowa (ISDN, GSM, VoIP, DRB, DVB, Tetra, ) Transmisja mowy Analogowa (para miedziana, radio, walkie-talkie, CB) Modulacje: amplitudowa (AM), częstotliwościowa (FM), fazowa (PM) Wysokie zapotrzebowanie na pasmo (np. AM df>2f) Niska sprawność energetyczna

Bardziej szczegółowo

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H W O J S K O W A A K A D E M I A T E C H N I C Z N A W Y D Z I A Ł E L E K T R O N I K I Drukować dwustronnie P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H Grupa... Data wykonania

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

PRACA DYPLOMOWA INŻYNIERSKA

PRACA DYPLOMOWA INŻYNIERSKA AKADEMIA GÓRNICZO-HUTNICZA IM. STANISŁAWA STASZICA W KRAKOWIE Wydział Informatyki, Elektroniki i Telekomunikacji Katedra Elektroniki PRACA DYPLOMOWA INŻYNIERSKA Temat: Adaptacyjny system redukcji szumu

Bardziej szczegółowo

AKUSTYKA MOWY. Podstawy rozpoznawania mowy część I

AKUSTYKA MOWY. Podstawy rozpoznawania mowy część I AKUSTYKA MOWY Podstawy rozpoznawania mowy część I PLAN WYKŁADU Część I Podstawowe pojęcia z dziedziny rozpoznawania mowy Algorytmy, parametry i podejścia do rozpoznawania mowy Przykłady istniejących bibliotek

Bardziej szczegółowo

Seminarium DSP AGH. Przegląd technik zwiększających wydajność obliczeniową algorytmów weryfikacji mówcy opartych o modelowanie GMM-UBM oraz HMM

Seminarium DSP AGH. Przegląd technik zwiększających wydajność obliczeniową algorytmów weryfikacji mówcy opartych o modelowanie GMM-UBM oraz HMM Seminarium DSP AGH Przegląd technik zwiększających wydajność obliczeniową algorytmów weryfikacji mówcy opartych o modelowanie GMM-UBM oraz HMM Michał Salasa 06.03.2014, Kraków Przedstawienie problemu Systemy

Bardziej szczegółowo

dr inż. Piotr Odya Parametry dźwięku zakres słyszanych przez człowieka częstotliwości: 20 Hz - 20 khz; 10 oktaw zakres dynamiki słuchu: 130 db

dr inż. Piotr Odya Parametry dźwięku zakres słyszanych przez człowieka częstotliwości: 20 Hz - 20 khz; 10 oktaw zakres dynamiki słuchu: 130 db dr inż. Piotr Odya Parametry dźwięku zakres słyszanych przez człowieka częstotliwości: 20 Hz - 20 khz; 10 oktaw zakres dynamiki słuchu: 130 db 1 Sygnał foniczny poziom analogowy czas cyfrowy poziom czas

Bardziej szczegółowo

Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści

Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, 2011 Spis treści Przedmowa 11 Rozdział 1. WPROWADZENIE 13 1.1. Czym jest automatyczne rozpoznawanie mowy 13 1.2. Poziomy

Bardziej szczegółowo

Metoda weryfikacji mówcy na podstawie nieuzgodnionej wypowiedzi

Metoda weryfikacji mówcy na podstawie nieuzgodnionej wypowiedzi BIULETYN INSTYTUTU AUTOMATYKI I ROBOTYKI NR, 005 Metoda weryfikacji mówcy na podstawie nieuzgodnionej wypowiedzi Leszek GRAD Zakład Automatyki, Instytut Teleinformatyki i Automatyki WAT, ul. Kaliskiego,

Bardziej szczegółowo

Wykład II. Reprezentacja danych w technice cyfrowej. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

Wykład II. Reprezentacja danych w technice cyfrowej. Studia Podyplomowe INFORMATYKA Podstawy Informatyki Studia Podyplomowe INFORMATYKA Podstawy Informatyki Wykład II Reprezentacja danych w technice cyfrowej 1 III. Reprezentacja danych w komputerze Rodzaje danych w technice cyfrowej 010010101010 001010111010

Bardziej szczegółowo

Selekcja cech osobniczych sygnału mowy z wykorzystaniem algorytmów genetycznych

Selekcja cech osobniczych sygnału mowy z wykorzystaniem algorytmów genetycznych Bi u l e t y n WAT Vo l. LXV, Nr 1, 2016 Selekcja cech osobniczych sygnału mowy z wykorzystaniem algorytmów genetycznych Kamil Kamiński, Andrzej P. Dobrowolski, Ewelina Majda-Zdancewicz Wojskowa Akademia

Bardziej szczegółowo

4 Zasoby językowe Korpusy obcojęzyczne Korpusy języka polskiego Słowniki Sposoby gromadzenia danych...

4 Zasoby językowe Korpusy obcojęzyczne Korpusy języka polskiego Słowniki Sposoby gromadzenia danych... Spis treści 1 Wstęp 11 1.1 Do kogo adresowana jest ta książka... 12 1.2 Historia badań nad mową i językiem... 12 1.3 Obecne główne trendy badań... 16 1.4 Opis zawartości rozdziałów... 18 2 Wyzwania i możliwe

Bardziej szczegółowo

Pomiary w technice studyjnej. TESTY PESQ i PEAQ

Pomiary w technice studyjnej. TESTY PESQ i PEAQ Pomiary w technice studyjnej TESTY PESQ i PEAQ Wprowadzenie Problem: ocena jakości sygnału dźwiękowego. Metody obiektywne - np. pomiar SNR czy THD+N - nie dają pełnych informacji o jakości sygnału. Ważne

Bardziej szczegółowo

Rozpoznawanie mówcy na podstawie transkodowanej mowy do interfejsów człowiek-maszyna. mgr inż. Radosław Weychan

Rozpoznawanie mówcy na podstawie transkodowanej mowy do interfejsów człowiek-maszyna. mgr inż. Radosław Weychan Streszczenie rozprawy doktorskiej Rozpoznawanie mówcy na podstawie transkodowanej mowy do interfejsów człowiek-maszyna mgr inż. Radosław Weychan Instytut Automatyki i Robotyki Wydział Informatyki Politechnika

Bardziej szczegółowo

PRAKTYCZNE ASPEKTY WYKORZYSTYWANIA SYSTEMÓW ROZPOZNAWANIA MOWY OPARTYCH NA HMM

PRAKTYCZNE ASPEKTY WYKORZYSTYWANIA SYSTEMÓW ROZPOZNAWANIA MOWY OPARTYCH NA HMM MODELOWANIE INŻYNIERSKIE ISSN 896-77X 40, s. 7-78, Gliwice 200 PRAKTYCZNE ASPEKTY WYKORZYSTYWANIA SYSTEMÓW ROZPOZNAWANIA MOWY OPARTYCH NA HMM AGNIESZKA MIETŁA, MAREK IWANIEC Katedra Automatyzacji Procesów,

Bardziej szczegółowo

Projekt Sieci neuronowe

Projekt Sieci neuronowe Projekt Sieci neuronowe Chmielecka Katarzyna Gr. 9 IiE 1. Problem i dane Sieć neuronowa miała za zadanie nauczyć się klasyfikować wnioski kredytowe. W projekcie wykorzystano dane pochodzące z 110 wniosków

Bardziej szczegółowo

Rozpoznawanie i synteza mowy w systemach multimedialnych. Analiza i synteza mowy - wprowadzenie. Spektrogram wyrażenia: computer speech

Rozpoznawanie i synteza mowy w systemach multimedialnych. Analiza i synteza mowy - wprowadzenie. Spektrogram wyrażenia: computer speech Slajd 1 Analiza i synteza mowy - wprowadzenie Spektrogram wyrażenia: computer speech Slide 1 Slajd 2 Analiza i synteza mowy - wprowadzenie Slide 2 Slajd 3 Analiza i synteza mowy - wprowadzenie Slide 3

Bardziej szczegółowo

Summary in Polish. Fatimah Mohammed Furaiji. Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling

Summary in Polish. Fatimah Mohammed Furaiji. Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling Summary in Polish Fatimah Mohammed Furaiji Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling Zastosowanie symulacji wieloagentowej w modelowaniu zachowania konsumentów Streszczenie

Bardziej szczegółowo

Sztuczna Inteligencja Tematy projektów Sieci Neuronowe

Sztuczna Inteligencja Tematy projektów Sieci Neuronowe PB, 2009 2010 Sztuczna Inteligencja Tematy projektów Sieci Neuronowe Projekt 1 Stwórz projekt implementujący jednokierunkową sztuczną neuronową złożoną z neuronów typu sigmoidalnego z algorytmem uczenia

Bardziej szczegółowo

Rozpoznawanie mówcy i emocji

Rozpoznawanie mówcy i emocji Katedra Elektroniki, Zespół Przetwarzania Sygnałów www.dsp.agh.edu.pl http://rozpoznawaniemowy.blogspot.com/ Rozpoznawanie mówcy i emocji Bartosz Ziółko Wykorzystano materiały Davida Sierry, Wojciecha

Bardziej szczegółowo

KATEDRA SYSTEMÓW MULTIMEDIALNYCH. Inteligentne systemy decyzyjne. Ćwiczenie nr 12:

KATEDRA SYSTEMÓW MULTIMEDIALNYCH. Inteligentne systemy decyzyjne. Ćwiczenie nr 12: KATEDRA SYSTEMÓW MULTIMEDIALNYCH Inteligentne systemy decyzyjne Ćwiczenie nr 12: Rozpoznawanie mowy z wykorzystaniem ukrytych modeli Markowa i pakietu HTK Opracowanie: mgr inż. Kuba Łopatka 1. Wprowadzenie

Bardziej szczegółowo

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład III 2016/2017

Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład III 2016/2017 Systemy pomiarowo-diagnostyczne Metody uczenia maszynowego wykład III bogumil.konopka@pwr.edu.pl 2016/2017 Wykład III - plan Regresja logistyczna Ocena skuteczności klasyfikacji Macierze pomyłek Krzywe

Bardziej szczegółowo

Metody systemowe i decyzyjne w informatyce

Metody systemowe i decyzyjne w informatyce Metody systemowe i decyzyjne w informatyce Laboratorium MATLAB Zadanie nr 2 Detekcja twarzy autorzy: A. Gonczarek, J.M. Tomczak Cel zadania Celem zadania jest zapoznanie się algorytmem gradientu prostego

Bardziej szczegółowo

Wydział Elektryczny. Katedra Telekomunikacji i Aparatury Elektronicznej. Instrukcja do pracowni specjalistycznej

Wydział Elektryczny. Katedra Telekomunikacji i Aparatury Elektronicznej. Instrukcja do pracowni specjalistycznej Politechnika Białostocka Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej Instrukcja do pracowni specjalistycznej Temat ćwiczenia: Badanie własności koderów PCM zastosowanych do sygnałów

Bardziej szczegółowo

Opisy efektów kształcenia dla modułu

Opisy efektów kształcenia dla modułu Karta modułu - Technologia mowy 1 / 5 Nazwa modułu: Technologia mowy Rocznik: 2012/2013 Kod: RIA-1-504-s Punkty ECTS: 7 Wydział: Inżynierii Mechanicznej i Robotyki Poziom studiów: Studia I stopnia Specjalność:

Bardziej szczegółowo

Redukcja kosztów połączeń telekomunikacyjnych przy wykorzystaniu central ISDN PABX

Redukcja kosztów połączeń telekomunikacyjnych przy wykorzystaniu central ISDN PABX Andrzej Białas, Waldemar Fuczkiewicz Aksonet Poznań Wojciech Kabaciński Instytut Elektroniki i Telekomunikacji Politechnika Poznańska Redukcja kosztów połączeń telekomunikacyjnych przy wykorzystaniu central

Bardziej szczegółowo

OpenAI Gym. Adam Szczepaniak, Kamil Walkowiak

OpenAI Gym. Adam Szczepaniak, Kamil Walkowiak OpenAI Gym Adam Szczepaniak, Kamil Walkowiak Plan prezentacji Programowanie agentowe Uczenie przez wzmacnianie i problemy związane z rozwojem algorytmów Charakterystyka OpenAI Gym Biblioteka gym Podsumowanie

Bardziej szczegółowo

Publiczna Szkoła Podstawowa nr 14 w Opolu. Edukacyjna Wartość Dodana

Publiczna Szkoła Podstawowa nr 14 w Opolu. Edukacyjna Wartość Dodana Publiczna Szkoła Podstawowa nr 14 w Opolu Edukacyjna Wartość Dodana rok szkolny 2014/2015 Edukacyjna Wartość Dodana (EWD) jest miarą efektywności nauczania dla szkoły i uczniów, którzy do danej placówki

Bardziej szczegółowo

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno WSTĘP DO REGRESJI LOGISTYCZNEJ Dr Wioleta Drobik-Czwarno REGRESJA LOGISTYCZNA Zmienna zależna jest zmienną dychotomiczną (dwustanową) przyjmuje dwie wartości, najczęściej 0 i 1 Zmienną zależną może być:

Bardziej szczegółowo

Kształtowanie kompetencji personalnych i społecznych w szkole zawodowej drogą do sukcesu na rynku pracy

Kształtowanie kompetencji personalnych i społecznych w szkole zawodowej drogą do sukcesu na rynku pracy Wyniki cząstkowe testów ex ante z uczniami. We wszystkich pięciu uczestniczących w tym etapie projektu szkołach ponadgimnazjalnych rozpoczęły się zajęcia Innowacyjnego Programu Szkolnego Doradztwa Zawodowego.

Bardziej szczegółowo

Formaty - podziały. format pliku. format kompresji. format zapisu (nośnika) kontener dla danych WAV, AVI, BMP

Formaty - podziały. format pliku. format kompresji. format zapisu (nośnika) kontener dla danych WAV, AVI, BMP dr inż. Piotr Odya Formaty - podziały format pliku kontener dla danych WAV, AVI, BMP format kompresji bezstratna/stratna ADPCM, MPEG, JPEG, RLE format zapisu (nośnika) ściśle określona struktura plików

Bardziej szczegółowo

Przykładowe zadanie praktyczne

Przykładowe zadanie praktyczne Przykładowe zadanie praktyczne Opracuj projekt realizacji prac związanych z uruchomieniem i testowaniem kodera i dekodera PCM z układem scalonym MC 145502 zgodnie z zaleceniami CCITT G.721 (załączniki

Bardziej szczegółowo

METODY STATYSTYCZNE W BIOLOGII

METODY STATYSTYCZNE W BIOLOGII METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne

Bardziej szczegółowo

Regresja logistyczna (LOGISTIC)

Regresja logistyczna (LOGISTIC) Zmienna zależna: Wybór opcji zachodniej w polityce zagranicznej (kodowana jako tak, 0 nie) Zmienne niezależne: wiedza o Unii Europejskiej (WIEDZA), zamieszkiwanie w regionie zachodnim (ZACH) lub wschodnim

Bardziej szczegółowo

Kompresja dźwięku w standardzie MPEG-1

Kompresja dźwięku w standardzie MPEG-1 mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 7, strona 1. Kompresja dźwięku w standardzie MPEG-1 Ogólne założenia kompresji stratnej Zjawisko maskowania psychoakustycznego Schemat blokowy

Bardziej szczegółowo

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów

Bardziej szczegółowo

KOMPRESJA STRATNA SYGNAŁU MOWY. Metody kompresji stratnej sygnałów multimedialnych: Uproszczone modelowanie źródeł generacji sygnałów LPC, CELP

KOMPRESJA STRATNA SYGNAŁU MOWY. Metody kompresji stratnej sygnałów multimedialnych: Uproszczone modelowanie źródeł generacji sygnałów LPC, CELP KOMPRESJA STRATNA SYGNAŁU MOWY Metody kompresji stratnej sygnałów multimedialnych: Uproszczone modelowanie źródeł generacji sygnałów LPC, CELP Śledzenie i upraszczanie zmian dynamicznych sygnałów ADPCM

Bardziej szczegółowo

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami Spis treści Format WAVE Format MP3 Format ACC i inne Konwersja między formatami Formaty plików audio różnią się od siebie przede wszystkim zastosowanymi algorytmami kompresji. Kompresja danych polega na

Bardziej szczegółowo

Kondycja ekonomiczna drzewnych spółek giełdowych na tle innych branż

Kondycja ekonomiczna drzewnych spółek giełdowych na tle innych branż Annals of Warsaw Agricultural University SGGW Forestry and Wood Technology No 56, 25: Kondycja ekonomiczna drzewnych spółek giełdowych na tle innych branż SEBASTIAN SZYMAŃSKI Abstract: Kondycja ekonomiczna

Bardziej szczegółowo

Integracja systemu CAD/CAM Catia z bazą danych uchwytów obróbkowych MS Access za pomocą interfejsu API

Integracja systemu CAD/CAM Catia z bazą danych uchwytów obróbkowych MS Access za pomocą interfejsu API Dr inż. Janusz Pobożniak, pobozniak@mech.pk.edu.pl Instytut Technologii Maszyn i Automatyzacji produkcji Politechnika Krakowska, Wydział Mechaniczny Integracja systemu CAD/CAM Catia z bazą danych uchwytów

Bardziej szczegółowo

Optymalizacja systemów

Optymalizacja systemów Optymalizacja systemów Laboratorium - problem detekcji twarzy autorzy: A. Gonczarek, J.M. Tomczak, S. Zaręba, P. Klukowski Cel zadania Celem zadania jest zapoznanie się z gradientowymi algorytmami optymalizacji

Bardziej szczegółowo

Niepewności pomiarów

Niepewności pomiarów Niepewności pomiarów Międzynarodowa Organizacja Normalizacyjna (ISO) w roku 1995 opublikowała normy dotyczące terminologii i sposobu określania niepewności pomiarów [1]. W roku 1999 normy zostały opublikowane

Bardziej szczegółowo

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska. SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia

Bardziej szczegółowo

Analiza wariancji - ANOVA

Analiza wariancji - ANOVA Analiza wariancji - ANOVA Analiza wariancji jest metodą pozwalającą na podział zmienności zaobserwowanej wśród wyników eksperymentalnych na oddzielne części. Każdą z tych części możemy przypisać oddzielnemu

Bardziej szczegółowo

ALGORYTM RANDOM FOREST

ALGORYTM RANDOM FOREST SKRYPT PRZYGOTOWANY NA ZAJĘCIA INDUKOWANYCH REGUŁ DECYZYJNYCH PROWADZONYCH PRZEZ PANA PAWŁA WOJTKIEWICZA ALGORYTM RANDOM FOREST Katarzyna Graboś 56397 Aleksandra Mańko 56699 2015-01-26, Warszawa ALGORYTM

Bardziej szczegółowo

Metody systemowe i decyzyjne w informatyce

Metody systemowe i decyzyjne w informatyce Metody systemowe i decyzyjne w informatyce Laboratorium JAVA Zadanie nr 2 Rozpoznawanie liter autorzy: A. Gonczarek, J.M. Tomczak Cel zadania Celem zadania jest zapoznanie się z problemem klasyfikacji

Bardziej szczegółowo

Testowanie modeli predykcyjnych

Testowanie modeli predykcyjnych Testowanie modeli predykcyjnych Wstęp Podczas budowy modelu, którego celem jest przewidywanie pewnych wartości na podstawie zbioru danych uczących poważnym problemem jest ocena jakości uczenia i zdolności

Bardziej szczegółowo

SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska

SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska SYSTEMY UCZĄCE SIĘ WYKŁAD 4. DRZEWA REGRESYJNE, INDUKCJA REGUŁ Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska DRZEWO REGRESYJNE Sposób konstrukcji i przycinania

Bardziej szczegółowo

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami Spis treści Format WAVE Format MP3 Format ACC i inne Konwersja między formatami Formaty plików audio różnią się od siebie przede wszystkim zastosowanymi algorytmami kompresji. Kompresja danych polega na

Bardziej szczegółowo

KARTA DO CENTRAL: MICRA, SIGMA I OPTIMA. ver. 4.00.xx

KARTA DO CENTRAL: MICRA, SIGMA I OPTIMA. ver. 4.00.xx KARTA DO CENTRAL: MICRA, SIGMA I OPTIMA ver. 4.00.xx Centrale Platan Micra, Sigma i Optima oraz programy komputerowe: PLATAN MicraPC, PLATAN SigmaPC, PLATAN OptimaPC i PLATAN BilCent są produktami firmy:

Bardziej szczegółowo

Spis treści Wstęp Estymacja Testowanie. Efekty losowe. Bogumiła Koprowska, Elżbieta Kukla

Spis treści Wstęp Estymacja Testowanie. Efekty losowe. Bogumiła Koprowska, Elżbieta Kukla Bogumiła Koprowska Elżbieta Kukla 1 Wstęp Czym są efekty losowe? Przykłady Model mieszany 2 Estymacja Jednokierunkowa klasyfikacja (ANOVA) Metoda największej wiarogodności (ML) Metoda największej wiarogodności

Bardziej szczegółowo

PRZEWODNIK PO PRZEDMIOCIE

PRZEWODNIK PO PRZEDMIOCIE Nazwa przedmiotu: SYSTEMY KOMUNIKACJI MIĘDZYKOMPUTEROWEJ Kierunek: Mechatronika Rodzaj przedmiotu: obowiązkowy Rodzaj zajęć: wykład, laboratorium I KARTA PRZEDMIOTU CEL PRZEDMIOTU PRZEWODNIK PO PRZEDMIOCIE

Bardziej szczegółowo

Maciej Piotr Jankowski

Maciej Piotr Jankowski Reduced Adder Graph Implementacja algorytmu RAG Maciej Piotr Jankowski 2005.12.22 Maciej Piotr Jankowski 1 Plan prezentacji 1. Wstęp 2. Implementacja 3. Usprawnienia optymalizacyjne 3.1. Tablica ekspansji

Bardziej szczegółowo

dr inż. Jacek Naruniec

dr inż. Jacek Naruniec dr inż. Jacek Naruniec Przetwarzanie wstępne Wyznaczenie obszarów zainteresowania Ekstrakcja cech - dźwięk Klasyfikacja detekcja mowy okno analizy spektrogram filtr preemfazy wokodery (formantów, kanałowe,

Bardziej szczegółowo

Zagadnienie optymalnych kryteriów identyfikacji osoby na podstawie analizy mowy

Zagadnienie optymalnych kryteriów identyfikacji osoby na podstawie analizy mowy Zagadnienie optymalnych kryteriów identyfikacji osoby na podstawie analizy mowy Antoni Leon Dawidowicz 1 Agata Trawińska 2 1 Uniwersytet Jagielloński w Krakowie 2 Instytut Ekspertyz Sądowych w Krakowie

Bardziej szczegółowo

2.2 Opis części programowej

2.2 Opis części programowej 2.2 Opis części programowej Rysunek 1: Panel frontowy aplikacji. System pomiarowy został w całości zintegrowany w środowisku LabVIEW. Aplikacja uruchamiana na komputerze zarządza przebiegiem pomiarów poprzez

Bardziej szczegółowo

TELEFONIA INTERNETOWA

TELEFONIA INTERNETOWA Politechnika Poznańska Wydział Elektroniki i Telekomunikacji Katedra Sieci Telekomunikacyjnych i Komputerowych TELEFONIA INTERNETOWA Laboratorium TEMAT ĆWICZENIA INSTALACJA I PODSTAWY SERWERA ASTERISK

Bardziej szczegółowo

Systemy i Sieci Telekomunikacyjne laboratorium. Modulacja amplitudy

Systemy i Sieci Telekomunikacyjne laboratorium. Modulacja amplitudy Systemy i Sieci Telekomunikacyjne laboratorium Modulacja amplitudy 1. Cel ćwiczenia: Celem części podstawowej ćwiczenia jest zbudowanie w środowisku GnuRadio kompletnego, funkcjonalnego odbiornika AM.

Bardziej szczegółowo

Kwantyzacja wektorowa. Kodowanie różnicowe.

Kwantyzacja wektorowa. Kodowanie różnicowe. Kwantyzacja wektorowa. Kodowanie różnicowe. Kodowanie i kompresja informacji - Wykład 7 12 kwietnia 2010 Kwantyzacja wektorowa wprowadzenie Zamiast kwantyzować pojedyncze elementy kwantyzujemy całe bloki

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo

Bardziej szczegółowo

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA AMFETAMINY Waldemar S. Krawczyk Centralne Laboratorium Kryminalistyczne Komendy Głównej Policji, Warszawa (praca obroniona na Wydziale Chemii Uniwersytetu

Bardziej szczegółowo

Rozpoznawanie mówców metodą i-wektorów/plda na urządzeniach mobilnych

Rozpoznawanie mówców metodą i-wektorów/plda na urządzeniach mobilnych Rozpoznawanie mówców metodą i-wektorów/plda na urządzeniach mobilnych Autor: Radosław Białobrzeski Opiekun: prof. Andrzej Pacut Seminarium Zespołu Biometrii i Uczenia Maszynowego, 24.10.2017 1/27 1. Cel

Bardziej szczegółowo

Podsumowanie wyników ankiety

Podsumowanie wyników ankiety SPRAWOZDANIE Kierunkowego Zespołu ds. Programów Kształcenia dla kierunku Informatyka dotyczące ankiet samooceny osiągnięcia przez absolwentów kierunkowych efektów kształcenia po ukończeniu studiów w roku

Bardziej szczegółowo

ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU

ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU i klasyfikacja sygnału audio dr inż. Jacek Naruniec Sygnał mowy mózg (układ sterujący) głośnia (źródło dźwięku) rezonator akustyczny (filtr) sygnał mowy 2 Sygnał mowy

Bardziej szczegółowo

Zastosowania sieci neuronowych

Zastosowania sieci neuronowych Zastosowania sieci neuronowych klasyfikacja LABORKA Piotr Ciskowski zadanie 1. klasyfikacja zwierząt sieć jednowarstwowa żródło: Tadeusiewicz. Odkrywanie własności sieci neuronowych, str. 159 Przykład

Bardziej szczegółowo

Sprawozdanie z laboratoriów HTK!

Sprawozdanie z laboratoriów HTK! Inżynieria akustyczna - Technologia mowy 2013 Błażej Chwiećko Sprawozdanie z laboratoriów HTK! 1. Przeznaczenie tworzonego systemu! Celem było stworzenie systemu służącego do sterowania samochodem. Zaimplementowane

Bardziej szczegółowo

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV Klasyfikatory: k-nn oraz naiwny Bayesa Agnieszka Nowak Brzezińska Wykład IV Naiwny klasyfikator Bayesa Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną

Bardziej szczegółowo

10. Redukcja wymiaru - metoda PCA

10. Redukcja wymiaru - metoda PCA Algorytmy rozpoznawania obrazów 10. Redukcja wymiaru - metoda PCA dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. PCA Analiza składowych głównych: w skrócie nazywana PCA (od ang. Principle Component

Bardziej szczegółowo

Modulacja i kodowanie laboratorium. Modulacje Cyfrowe: Kluczowanie Amplitudy (ASK) i kluczowanie Fazy (PSK)

Modulacja i kodowanie laboratorium. Modulacje Cyfrowe: Kluczowanie Amplitudy (ASK) i kluczowanie Fazy (PSK) Modulacja i kodowanie laboratorium Modulacje Cyfrowe: Kluczowanie Amplitudy (ASK) i kluczowanie Fazy (PSK) Celem ćwiczenia jest opracowanie algorytmów modulacji i dekodowania dla dwóch rodzajów modulacji

Bardziej szczegółowo

WYKŁAD 4. Podejmowanie decyzji dla modeli probabilistycznych Modelowanie Gaussowskie. autor: Maciej Zięba. Politechnika Wrocławska

WYKŁAD 4. Podejmowanie decyzji dla modeli probabilistycznych Modelowanie Gaussowskie. autor: Maciej Zięba. Politechnika Wrocławska Wrocław University of Technology WYKŁAD 4 Podejmowanie decyzji dla modeli probabilistycznych Modelowanie Gaussowskie autor: Maciej Zięba Politechnika Wrocławska Klasyfikacja Klasyfikacja (ang. Classification):

Bardziej szczegółowo

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji Statystyka i opracowanie danych Ćwiczenia 5 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ MODEL REGRESJI LINIOWEJ Analiza regresji

Bardziej szczegółowo

Klasyfikator liniowy Wstęp Klasyfikator liniowy jest najprostszym możliwym klasyfikatorem. Zakłada on liniową separację liniowy podział dwóch klas między sobą. Przedstawia to poniższy rysunek: 5 4 3 2

Bardziej szczegółowo

Oprogramowanie Systemów Obrazowania SIECI NEURONOWE

Oprogramowanie Systemów Obrazowania SIECI NEURONOWE SIECI NEURONOWE Przedmiotem laboratorium jest stworzenie algorytmu rozpoznawania zwierząt z zastosowaniem sieci neuronowych w oparciu o 5 kryteriów: ile zwierzę ma nóg, czy żyje w wodzie, czy umie latać,

Bardziej szczegółowo

GSMONLINE.PL. UKE: Polacy o rynku telekomunikacyjnym w roku

GSMONLINE.PL. UKE: Polacy o rynku telekomunikacyjnym w roku GSMONLINE.PL UKE: Polacy o rynku telekomunikacyjnym w roku 2013 2013-12-13 UKE opublikowało raporty z badań w zakresie korzystania z usług telekomunikacyjnych. Uzyskane rezultaty zawierają opinie konsumentów

Bardziej szczegółowo

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów Rozdział : Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów W tym rozdziale omówione zostaną dwie najpopularniejsze metody estymacji parametrów w ekonometrycznych modelach nieliniowych,

Bardziej szczegółowo

ROADSHOW2016. Wprowadzenie. Rynek telekomunikacji w Polsce. Marcin Bieńkowski. kontakt: marcin.w.bienkowski@gmail.com

ROADSHOW2016. Wprowadzenie. Rynek telekomunikacji w Polsce. Marcin Bieńkowski. kontakt: marcin.w.bienkowski@gmail.com Wprowadzenie Rynek telekomunikacji w Polsce Marcin Bieńkowski kontakt: marcin.w.bienkowski@gmail.com Rynek telekomunikacyjny w Polsce W 2014 r. łączna wartość polskiego rynku telekomunikacyjnego wyniosła

Bardziej szczegółowo

Kryteria wyboru operatorów usług telefonicznych przez abonentów w Polsce

Kryteria wyboru operatorów usług telefonicznych przez abonentów w Polsce Roman Nierebiński Opisano czynniki, wpływające na wybór operatora usług telefonii stacjonarnej i komórkowej. Wskazano najczęściej wybieranych operatorów telefonicznych oraz podano motywy wyboru. telekomunikacja,

Bardziej szczegółowo

Agnieszka Nowak Brzezińska Wykład III

Agnieszka Nowak Brzezińska Wykład III Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe i teoria prawdopodobieństwa 3. Populacje i próby danych 4. Testowanie hipotez i estymacja parametrów 5. Najczęściej wykorzystywane testy statystyczne

Bardziej szczegółowo

Metoda określania pozycji wodnicy statków na podstawie pomiarów odległości statku od głowic laserowych

Metoda określania pozycji wodnicy statków na podstawie pomiarów odległości statku od głowic laserowych inż. Marek Duczkowski Metoda określania pozycji wodnicy statków na podstawie pomiarów odległości statku od głowic laserowych słowa kluczowe: algorytm gradientowy, optymalizacja, określanie wodnicy W artykule

Bardziej szczegółowo

Przykładowe rozwiązanie zadania dla zawodu technik telekomunikacji

Przykładowe rozwiązanie zadania dla zawodu technik telekomunikacji PROJEKT REALIZACJI PRAC ZWIĄZANYCH Z URUCHOMIENIEM I TESTOWANIEM KODERA I DEKODERA PCM ORAZ WYKONANIE PRAC OBEJMUJĄCYCH OPRACOWANIE WYNIKÓW POMIARÓW Z URUCHOMIENIA I SPRAWDZENIA DZIAŁANIA JEGO CZĘŚCI CYFROWEJ

Bardziej szczegółowo

Technologie Informacyjne

Technologie Informacyjne POLITECHNIKA KRAKOWSKA - WIEiK - KATEDRA AUTOMATYKI Technologie Informacyjne www.pk.edu.pl/~zk/ti_hp.html Wykładowca: dr inż. Zbigniew Kokosiński zk@pk.edu.pl Wykład: Generacja liczb losowych Problem generacji

Bardziej szczegółowo

LABORATORIUM PODSTAW TELEKOMUNIKACJI

LABORATORIUM PODSTAW TELEKOMUNIKACJI WOJSKOWA AKADEMIA TECHNICZNA im. Jarosława Dąbrowskiego w Warszawie Wydział Elektroniki LABORATORIUM PODSTAW TELEKOMUNIKACJI Grupa Podgrupa Data wykonania ćwiczenia Ćwiczenie prowadził... Skład podgrupy:

Bardziej szczegółowo

Przedmiotowy system oceniania wraz z określeniem wymagań edukacyjnych i szczegółowych kryteriów oceniania wiedzy i umiejętności dla przedmiotu

Przedmiotowy system oceniania wraz z określeniem wymagań edukacyjnych i szczegółowych kryteriów oceniania wiedzy i umiejętności dla przedmiotu Przedmiotowy system oceniania wraz z określeniem wymagań edukacyjnych i szczegółowych kryteriów oceniania wiedzy i umiejętności dla przedmiotu FIZYKA MEDYCZNA 1 Informacje wstępne 1. Nauczyciel ocenia

Bardziej szczegółowo

Kodowanie i kompresja Streszczenie Studia Licencjackie Wykład 11,

Kodowanie i kompresja Streszczenie Studia Licencjackie Wykład 11, 1 Kwantyzacja skalarna Kodowanie i kompresja Streszczenie Studia Licencjackie Wykład 11, 10.05.005 Kwantyzacja polega na reprezentowaniu dużego zbioru wartości (być może nieskończonego) za pomocą wartości

Bardziej szczegółowo

Klasyfikator. ˆp(k x) = 1 K. I(ρ(x,x i ) ρ(x,x (K) ))I(y i =k),k =1,...,L,

Klasyfikator. ˆp(k x) = 1 K. I(ρ(x,x i ) ρ(x,x (K) ))I(y i =k),k =1,...,L, Klasyfikator Jedną z najistotniejszych nieparametrycznych metod klasyfikacji jest metoda K-najbliższych sąsiadów, oznaczana przez K-NN. W metodzie tej zaliczamy rozpoznawany obiekt do tej klasy, do której

Bardziej szczegółowo

Algorytm do rozpoznawania człowieka na podstawie dynamiki użycia klawiatury. Paweł Kobojek, prof. dr hab. inż. Khalid Saeed

Algorytm do rozpoznawania człowieka na podstawie dynamiki użycia klawiatury. Paweł Kobojek, prof. dr hab. inż. Khalid Saeed Algorytm do rozpoznawania człowieka na podstawie dynamiki użycia klawiatury Paweł Kobojek, prof. dr hab. inż. Khalid Saeed Zakres pracy Przegląd stanu wiedzy w dziedzinie biometrii, ze szczególnym naciskiem

Bardziej szczegółowo

Rozpoznawanie obrazów

Rozpoznawanie obrazów Rozpoznawanie obrazów Laboratorium Python Zadanie nr 1 Regresja liniowa autorzy: A. Gonczarek, J.M. Tomczak, S. Zaręba, M. Zięba, J. Kaczmar Cel zadania Celem zadania jest implementacja liniowego zadania

Bardziej szczegółowo

r. rok szkolny 2012/2013

r. rok szkolny 2012/2013 04.04.2013r. rok szkolny 2012/2013 Do sprawdzianu po szkole podstawowej przystąpiło 71 uczniów. Wszyscy uczniowie pisali sprawdzian w wersji standardowej. Struktura arkusza sprawdzającego umiejętności

Bardziej szczegółowo

Język opisu sprzętu VHDL

Język opisu sprzętu VHDL Język opisu sprzętu VHDL dr inż. Adam Klimowicz Seminarium dydaktyczne Katedra Mediów Cyfrowych i Grafiki Komputerowej Informacje ogólne Język opisu sprzętu VHDL Przedmiot obieralny dla studentów studiów

Bardziej szczegółowo

Analiza wyników egzaminu gimnazjalnego z języka obcego nowożytnego w roku szkolnym 2014/2015

Analiza wyników egzaminu gimnazjalnego z języka obcego nowożytnego w roku szkolnym 2014/2015 Analiza wyników egzaminu gimnazjalnego z języka obcego nowożytnego w roku szkolnym 2014/2015 Analiza wyników egzaminu gimnazjalnego z języka angielskiego na poziomie podstawowym Arkusz składał się z 40

Bardziej szczegółowo