Omówienie różnych metod rozpoznawania mowy
|
|
- Jadwiga Urbaniak
- 7 lat temu
- Przeglądów:
Transkrypt
1 Omówienie różnych metod rozpoznawania mowy Na podstawie artykułu: Comparative study of automatic speech recognition techniques Beniamin Sawicki Wydział Inżynierii Mechanicznej i Robotyki Inżynieria Akustyczna Kraków,
2 Mowa jako najbardziej intuicyjny kontroler najbliższego otoczenia człowieka Rozpoznanie i przetworzenie mowy ciągłej w czasie rzeczywistym Odporność na wpływ otoczenia i wszelkich zakłóceń Rozróżnianie konkretnych mówców i ich emocji Problemy: Powtarzalność mowy Brak wyraźnych granic pomiędzy fonemami i słowami Hałas Płeć, styl i prędkość mówienia, dialekty
3 Proces rozpoznawania mowy Stacjonarność sygnału generowanego przez trakt głosowy w czasie 10-20ms Fonemy, formowane w słowa i zdania Zbiór fonemów, charakterystyczny dla danego języka Sygnał mowy jako elektryczna reprezentacja fali akustycznej
4 Etap ekstrakcji cech sygnału Mel-frequency cepstral coefficients Skala melowa, określająca subiektywny odbiór wysokości dźwięku przez ludzkie ucho względem skali w hercach F mel = 1127log e 1 + f 700 Podział sygnału na ramki o długości 25-30ms z zakładką 10ms Zastosowanie okna Hamminga na każdej z ramek Transformata Fouriera na każdej z ramek Filtracja danych bankiem filtrów i obliczenie logarytmu energii Bezpośrednia transformata kosinusowa (DCT), której wynikiem są współczynniki MFC
5 Etap ekstrakcji cech sygnału Mel-frequency cepstral coefficients Mając na uwadze koartykulację fonemów, trwającą dłużej niż ramka (30ms), analizuje się również korelacje czasowe pomiędzy ramkami. Wektor cech MFCC zawiera: Cechy statyczne analiza poszczególnych ramek Cechy dynamiczne różnice między cechami statycznymi kolejnych ramek Cechy przyspieszenia różnice między cechami dynamicznymi Znormalizowany logarytm energii*
6 Etap ekstrakcji cech sygnału Dyskretna transformata falkowa (DWT) Uzyskiwanie informacji o przebiegu czasowym sygnału niestacjonarnego Model adekwatny dla ucha ludzkiego: Wąskie okno czasowe stosowane dla wysokich częstotliwości Szerokie okno czasowe stosowane dla niskich częstotliwości Podział sygnału: aproksymacja (LF) i detale (HF)
7 Etap ekstrakcji cech sygnału Dyskretna transformata falkowa (DWT) Usunięcie składowych wysokich częstotliwości niska częstotliwość sygnału mowy W porównaniu do MFCC, dobra rozdzielczość częstotliwościowa dla niskich częstotliwości; lepsza lokalizacja zjawisk przejściowych w dziedzinie czasu Stosowanie falek ortogonalnych Daubechies, Haar a oraz różnej ilości poziomów dekompozycji Wavelet packet transform dalsza dekompozycja
8 Etap ekstrakcji cech sygnału Liniowe kodowanie predykcyjne (LPC) Analiza w dziedzinie czasu, odwzorowująca rezonansową strukturę traktu głosowego Ramkowanie, okienkowanie i autokorelacja między ramkami sygnału wejściowego Aproksymacja każdej kolejnej próbki jako liniowa kombinacja N poprzednich próbek s n = P a k s n k k=1 Używane w kombinacji z DWT, rozwinięcie metody: Linear Predictive Cepstral Coefficients (LPCC)
9 Etap ekstrakcji cech sygnału Percepcyjna predykcja liniowa (PLP) Metoda PLP oparta na trzech charakterystykach: Rozdzielczość spektralna pasma krytycznego Regulacja krzywej jednakowej głośności Zastosowanie intensity-loudness power law Transformata Fouriera na okienkowanej ramce sygnału Filtracja skalą Barka (1 bark = 100 melów) Skala Barka obejmuje cały zakres częstotliwości z obszaru 24 pasm krytycznych, w których odbiór jednego dźwięku zależy od obecności innego dźwięku.
10 Etap ekstrakcji cech sygnału Percepcyjna predykcja liniowa (PLP) Po filtracji, sygnał ważony jest krzywą jednakowej głośności Kompresja sygnału przy użyciu intensity-loudness power law Odwrotna transformata Fouriera => analiza predykcji liniowej => analiza cepstralna Wyższa skuteczność algorytmu niż LPCC w przypadku środowiska o dużych zakłóceniach
11 Etap ekstrakcji cech sygnału RASTA-PLP RelAtive SpecTrA-preceptual linear prediction Scalenie techniki RASTA z metodą PLP, aby zmniejszyć podatność metody PLP na zakłócenia Czasowe właściwości przebiegu zakłóceń są odróżnialne od właściwości sygnału mowy Filtracja pasmowo-przepustowa energii obecnej w podpasmach wygładza zakłócenia Najskuteczniejsza metoda w przypadku mocno zniekształconych sygnałów
12 Etap ekstrakcji cech sygnału Algorytmy dodatkowe: Vector quantisation Principal component analysis Linear discriminant analysis
13 Etap klasyfikacji uzyskanych segmentów mowy Hidden Markov models Prawdopodobieństwo wygenerowania wypowiedzi poprzez wymowę konkretnego fonemu lub słowa Możliwe zmiany stanu, a ij Możliwe obserwacje, reprezentujące możliwy dźwięk, powstały podczas każdego ze stanów, b j (O t ) Dystrybucja prawdopodobieństwa stanu początkowego π λ = (A, b, π) A={a ij }, B={b j (O t )}, 1 i, j N,1 k M N liczba stanów M liczba obserwacji First-order three-state left-to-right HMM
14 Etap klasyfikacji uzyskanych segmentów mowy Hidden Markov models Ocena prawdopodobieństwa sekwencji wypowiedzi dla danego HMM Wybór najlepszej sekwencji modeli stanów Modyfikacja odpowiednich parametrów modeli dla lepszej reprezentacji wypowiedzi Słowa zawsze bazują na powiązaniach konkretnych fonemów. Stąd, dobre rozpoznanie konkretnych fonemów wiąże się z dobrym rozpoznaniem słów.
15 Etap klasyfikacji uzyskanych segmentów mowy Sztuczne sieci neuronowe Rozpoznawanie wzorców Faza treningu, umożliwiająca naukę systemu Zdolność do klasyfikacji nowych, nieznanych danych Niezdolne do uwydatnienia zmienności w czasie sygnału mowy Stosowane najczęściej w hybrydzie z HMM
16 Etap klasyfikacji uzyskanych segmentów mowy Sztuczne sieci neuronowe Perceptrony wielowarstwowe Sieci złożone z co najmniej trzech warstw: wejściowa, ukryta i wejściowa. Rezultat klasyfikacji odnosi się do neuronu o najwyższym uaktywnieniu. Samoorganizujące mapy Grupowanie danych w topograficzne mapy, od wielkowymiarowych przestrzeni wejściowych po niskowymiarowe przestrzenie cech SOM posiadają zdolność do rozróżniania głównych cech wprowadzonych do sieci danych, dzięki procesowi nauki.
17 Etap klasyfikacji uzyskanych segmentów mowy Sztuczne sieci neuronowe Radial basis functions Sieci złożone z trzech warstw: wejściowa, ukryta i wejściowa Tworzenie klastrów opartych na wprowadzonych wzorcach Funkcja Gaussa stosowana do obliczenia powiązania danych wejściowych z utworzonymi klastrami Rekurencyjne sieci neuronowe Sieci złożone z trzech warstw: wejściowa, ukryta i wejściowa Wyniki z odpowiednich węzłów są mnożone przez odpowiadające wagi i podane z powrotem do węzła Fuzzy neural network Powiązanie rozmytych systemów z sieciami neuronowymi Element jest powiązany w sieci z odpowiednim stopniem członkostwa, dzięki funkcji członkostwa
18 Analiza modeli językowych Poziomy analizy lingwistycznej języka: 1. Fonologia brzmienie, różnice w wymowie 2. Morfologia znaczenie składowych słowa 3. Poziom leksykalny interpretacja pojedynczych słów 4. Poziom syntaktyczny analiza słów w kontekście zdania 5. Poziom semantyczny znaczenia zdań 6. Rozmowa znaczenie całego tekstu 7. Poziom pragmatyczny analiza intencji, planów, celów. Analiza tematu wypowiedzi podczas interpretacji wieloznaczeniowego słowa
19 Analiza modeli językowych Implementacja poziomów w ASR poprzez zastosowanie Natural language processing Przetworzenie sygnału mowy w sekwencję fonemów; próba zrozumienia słów przez NLP ASR zwraca więcej niż jedno rozpoznanie danego słowa. Przy pomocy NLP można wybrać pasujące najlepiej do kontekstu Kombinacja NLP i ASR Należy brać pod uwagę nieprzestrzeganie zasad gramatyki, dialekty, styl mówienia
20 Analiza modeli językowych Implementacja poziomów w ASR poprzez zastosowanie Natural language processing Przetworzenie sygnału mowy w sekwencję fonemów; próba zrozumienia słów przez NLP ASR zwraca więcej niż jedno rozpoznanie danego słowa. Przy pomocy NLP można wybrać pasujące najlepiej do kontekstu Kombinacja NLP i ASR Należy brać pod uwagę nieprzestrzeganie zasad gramatyki, dialekty, styl mówienia
21 Porównanie wybranych algorytmów
22 Przykłady
23 Dziękuję za uwagę.
AKUSTYKA MOWY. Podstawy rozpoznawania mowy część I
AKUSTYKA MOWY Podstawy rozpoznawania mowy część I PLAN WYKŁADU Część I Podstawowe pojęcia z dziedziny rozpoznawania mowy Algorytmy, parametry i podejścia do rozpoznawania mowy Przykłady istniejących bibliotek
Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści
Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, 2011 Spis treści Przedmowa 11 Rozdział 1. WPROWADZENIE 13 1.1. Czym jest automatyczne rozpoznawanie mowy 13 1.2. Poziomy
4 Zasoby językowe Korpusy obcojęzyczne Korpusy języka polskiego Słowniki Sposoby gromadzenia danych...
Spis treści 1 Wstęp 11 1.1 Do kogo adresowana jest ta książka... 12 1.2 Historia badań nad mową i językiem... 12 1.3 Obecne główne trendy badań... 16 1.4 Opis zawartości rozdziałów... 18 2 Wyzwania i możliwe
ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU
ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU i klasyfikacja sygnału audio dr inż. Jacek Naruniec Sygnał mowy mózg (układ sterujący) głośnia (źródło dźwięku) rezonator akustyczny (filtr) sygnał mowy 2 Sygnał mowy
Automatyczne rozpoznawanie mowy. Autor: mgr inż. Piotr Bratoszewski
Automatyczne rozpoznawanie mowy Autor: mgr inż. Piotr Bratoszewski Rys historyczny 1930-1950 pierwsze systemy Automatycznego rozpoznawania mowy (ang. Automatic Speech Recognition ASR), metody holistyczne;
dr inż. Jacek Naruniec
dr inż. Jacek Naruniec Przetwarzanie wstępne Wyznaczenie obszarów zainteresowania Ekstrakcja cech - dźwięk Klasyfikacja detekcja mowy okno analizy spektrogram filtr preemfazy wokodery (formantów, kanałowe,
Podstawy automatycznego rozpoznawania mowy. Autor: mgr inż. Piotr Bratoszewski
Podstawy automatycznego rozpoznawania mowy Autor: mgr inż. Piotr Bratoszewski Rys historyczny 1930-1950 pierwsze systemy Automatycznego rozpoznawania mowy (ang. Automatic Speech Recognition ASR), metody
PARAMETRYZACJA SYGNAŁU MOWY. PERCEPTUALNE SKALE CZĘSTOTLIWOŚCI.
1 PARAMETRYZACJA SYGNAŁU MOWY. PERCEPTUALNE SKALE CZĘSTOTLIWOŚCI. mgr inż. Kuba Łopatka Katedra Systemów Multimedialnych p. 628, tel. 348-6332 PLAN WYKŁADU 1. Potrzeba i istota parametryzacji 2. Klasyfikacja
Przedmowa Wykaz oznaczeń Wykaz skrótów 1. Sygnały i ich parametry 1 1.1. Pojęcia podstawowe 1 1.2. Klasyfikacja sygnałów 2 1.3.
Przedmowa Wykaz oznaczeń Wykaz skrótów 1. Sygnały i ich parametry 1 1.1. Pojęcia podstawowe 1 1.2. Klasyfikacja sygnałów 2 1.3. Sygnały deterministyczne 4 1.3.1. Parametry 4 1.3.2. Przykłady 7 1.3.3. Sygnały
ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU
ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU i klasyfikacja sygnału audio dr inż. Jacek Naruniec Sygnał mowy mózg (układ sterujący) głośnia (źródło dźwięku) rezonator akustyczny (filtr) sygnał mowy 2 Sygnał mowy
2. Próbkowanie Sygnały okresowe (16). Trygonometryczny szereg Fouriera (17). Częstotliwość Nyquista (20).
SPIS TREŚCI ROZDZIAŁ I SYGNAŁY CYFROWE 9 1. Pojęcia wstępne Wiadomości, informacje, dane, sygnały (9). Sygnał jako nośnik informacji (11). Sygnał jako funkcja (12). Sygnał analogowy (13). Sygnał cyfrowy
KATEDRA SYSTEMÓW MULTIMEDIALNYCH. Inteligentne systemy decyzyjne. Ćwiczenie nr 12:
KATEDRA SYSTEMÓW MULTIMEDIALNYCH Inteligentne systemy decyzyjne Ćwiczenie nr 12: Rozpoznawanie mowy z wykorzystaniem ukrytych modeli Markowa i pakietu HTK Opracowanie: mgr inż. Kuba Łopatka 1. Wprowadzenie
Rozpoznawanie mowy dla języków semickich. HMM - HTK, CMU SPHINX-4, Simon
Rozpoznawanie mowy dla języków semickich HMM - HTK, CMU SPHINX-4, Simon Charakterystyka języków semickich Przykłady: arabski, hebrajski, amharski, tigrinia, maltański (280 mln użytkowników). Budowa spółgłoskowo
ROZPOZNAWANIE SYGNAŁÓW FONICZNYCH
Przetwarzanie dźwięków i obrazów ROZPOZNAWANIE SYGNAŁÓW FONICZNYCH mgr inż. Kuba Łopatka, p. 628 klopatka@sound.eti.pg.gda.pl Plan wykładu 1. Wprowadzenie 2. Zasada rozpoznawania sygnałów 3. Parametryzacja
System do sterowania ruchem kamery przemysłowej za pomocą komend głosowych
System do sterowania ruchem kamery przemysłowej za pomocą komend głosowych Dariusz Krala 1 1 Wydział Inżynierii Mechanicznej i Informatyki Kierunek Informatyka, Rok V {dariusz.krala}@gmail.com Streszczenie
Adaptacyjne Przetwarzanie Sygnałów. Filtracja adaptacyjna w dziedzinie częstotliwości
W Filtracja adaptacyjna w dziedzinie częstotliwości Blokowy algorytm LMS (BLMS) N f n+n = f n + α x n+i e(n + i), i= N L Slide e(n + i) =d(n + i) f T n x n+i (i =,,N ) Wprowadźmy nowy indeks: n = kn (
TRANSFORMATA FALKOWA 2D. Oprogramowanie Systemów Obrazowania 2016/2017
TRANSFORMATA FALKOWA 2D Oprogramowanie Systemów Obrazowania 2016/2017 Wielorozdzielczość - dekompozycja sygnału w ciąg sygnałów o coraz mniejszej rozdzielczości na wielu poziomach gdzie: s l+1 - aproksymata
Kompresja dźwięku w standardzie MPEG-1
mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 7, strona 1. Kompresja dźwięku w standardzie MPEG-1 Ogólne założenia kompresji stratnej Zjawisko maskowania psychoakustycznego Schemat blokowy
Przetwarzanie Sygnałów. Zastosowanie Transformaty Falkowej w nadzorowaniu
Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej Przetwarzanie Sygnałów Studia Podyplomowe, Automatyka i Robotyka Zastosowanie Transformaty Falkowej
Biometryczna Identyfikacja Tożsamości
c Adam Czajka, IAiIS PW, wersja: 6 grudnia 2015, 1/39 Adam Czajka Wykład na Wydziale Elektroniki i Technik Informacyjnych Politechniki Warszawskiej Semestr zimowy 2015/16 c Adam Czajka, IAiIS PW, wersja:
Metoda weryfikacji mówcy na podstawie nieuzgodnionej wypowiedzi
BIULETYN INSTYTUTU AUTOMATYKI I ROBOTYKI NR, 005 Metoda weryfikacji mówcy na podstawie nieuzgodnionej wypowiedzi Leszek GRAD Zakład Automatyki, Instytut Teleinformatyki i Automatyki WAT, ul. Kaliskiego,
Diagnostyka silnika synchronicznego oparta na analizie sygnałów akustycznych z zastosowaniem MFCC i klasyfikatora rozmytego
mgr inż. ADAM GŁOWACZ Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki Akademia Górniczo-Hutnicza w Krakowie Diagnostyka silnika synchronicznego oparta na analizie sygnałów akustycznych z
Komputerowe przetwarzanie sygnału mowy
Komputerowe przetwarzanie sygnału mowy Prof dr hab inż Bożena Kostek Katedra Systemów Multimedialnych Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska Komputerowe przetwarzanie sygnału
Technika audio część 2
Technika audio część 2 Wykład 12 Projektowanie cyfrowych układów elektronicznych Mgr inż. Łukasz Kirchner lukasz.kirchner@cs.put.poznan.pl http://www.cs.put.poznan.pl/lkirchner Wprowadzenie do filtracji
ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU
ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU obraz dr inż. Jacek Naruniec Analiza Składowych Niezależnych (ICA) Independent Component Analysis Dąży do wyznaczenia zmiennych niezależnych z obserwacji Problem opiera
Algorytmy detekcji częstotliwości podstawowej
Algorytmy detekcji częstotliwości podstawowej Plan Definicja częstotliwości podstawowej Wybór ramki sygnału do analizy Błędy oktawowe i dokładnej estymacji Metody detekcji częstotliwości podstawowej czasowe
LABORATORIUM AKUSTYKI MUZYCZNEJ. Ćw. nr 12. Analiza falkowa dźwięków instrumentów muzycznych. 1. PODSTAWY TEORETYCZNE ANALIZY FALKOWEJ.
LABORATORIUM AKUSTYKI MUZYCZNEJ. Ćw. nr 1. Analiza falkowa dźwięków instrumentów muzycznych. 1. PODSTAWY TEORETYCZNE ANALIZY FALKOWEJ. Transformacja falkowa (ang. wavelet falka) przeznaczona jest do analizy
HAŁASU Z UWZGLĘDNIENIEM ZJAWISK O CHARAKTERZE NIELINIOWYM
ZASTOSOWANIE SIECI NEURONOWYCH W SYSTEMACH AKTYWNEJ REDUKCJI HAŁASU Z UWZGLĘDNIENIEM ZJAWISK O CHARAKTERZE NIELINIOWYM WPROWADZENIE Zwalczanie hałasu przy pomocy metod aktywnych redukcji hałasu polega
1. Historia 2. Podstawy neurobiologii 3. Definicje i inne kłamstwa 4. Sztuczny neuron i zasady działania SSN. Agenda
Sieci neuropodobne 1. Historia 2. Podstawy neurobiologii 3. Definicje i inne kłamstwa 4. Sztuczny neuron i zasady działania SSN Agenda Trochę neurobiologii System nerwowy w organizmach żywych tworzą trzy
TWORZENIE MODELU AKUSTYCZNEGO NA POTRZEBY WERYFIKACJI MÓWCY PRZY UŻYCIU UKRYTYCH MODELI MARKOWA
MODELOWANIE INŻYNIERSKIE ISSN 1896-771X 40, s. 249-256, Gliwice 2010 TWORZENIE MODELU AKUSTYCZNEGO NA POTRZEBY WERYFIKACJI MÓWCY PRZY UŻYCIU UKRYTYCH MODELI MARKOWA IWONA WANAT MAREK IWANIEC Katedra Automatyzacji
Akwizycja i przetwarzanie sygnałów cyfrowych
Akwizycja i przetwarzanie sygnałów cyfrowych Instytut Teleinformatyki ITI PK Kraków 21 luty 2011 Analiza czas - częstotliwość analiza częstotliwościowa: problem dla sygnału niestacjonarnego zwykła transformata
Biometryczna Identyfikacja Tożsamości
Biometryczna Identyfikacja Tożsamości Wykład 9: Rozpoznawanie mówiącego Adam Czajka Wykład na Wydziale Elektroniki i Technik Informacyjnych Politechniki Warszawskiej Semestr letni 2015 c Adam Czajka, IAiIS
EKSTRAKCJA CECH TWARZY ZA POMOCĄ TRANSFORMATY FALKOWEJ
Janusz Bobulski Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska ul. Dąbrowskiego 73 42-200 Częstochowa januszb@icis.pcz.pl EKSTRAKCJA CECH TWARZY ZA POMOCĄ TRANSFORMATY FALKOWEJ
PRAKTYCZNE ASPEKTY WYKORZYSTYWANIA SYSTEMÓW ROZPOZNAWANIA MOWY OPARTYCH NA HMM
MODELOWANIE INŻYNIERSKIE ISSN 896-77X 40, s. 7-78, Gliwice 200 PRAKTYCZNE ASPEKTY WYKORZYSTYWANIA SYSTEMÓW ROZPOZNAWANIA MOWY OPARTYCH NA HMM AGNIESZKA MIETŁA, MAREK IWANIEC Katedra Automatyzacji Procesów,
9. Dyskretna transformata Fouriera algorytm FFT
Transformata Fouriera ma szerokie zastosowanie w analizie i syntezie układów i systemów elektronicznych, gdyż pozwala na połączenie dwóch sposobów przedstawiania sygnałów reprezentacji w dziedzinie czasu
S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor
S O M SELF-ORGANIZING MAPS Przemysław Szczepańczyk Łukasz Myszor Podstawy teoretyczne Map Samoorganizujących się stworzył prof. Teuvo Kohonen (1982 r.). SOM wywodzi się ze sztucznych sieci neuronowych.
Politechnika Śląska Wydział Automatyki, Elektroniki i Informatyki Instytut Informatyki
Politechnika Śląska Wydział Automatyki, Elektroniki i Informatyki Instytut Informatyki Rozprawa doktorska Komputerowe rozpoznawanie niepłynności mowy z zastosowaniem transformaty falkowej i sztucznych
NIEOPTYMALNA TECHNIKA DEKORELACJI W CYFROWYM PRZETWARZANIU OBRAZU
II Konferencja Naukowa KNWS'05 "Informatyka- sztuka czy rzemios o" 15-18 czerwca 2005, Z otniki Luba skie NIEOPTYMALNA TECHNIKA DEKORELACJI W CYFROWYM PRZETWARZANIU OBRAZU Wojciech Zając Instytut Informatyki
Metody i techniki sztucznej inteligencji / Leszek Rutkowski. wyd. 2, 3 dodr. Warszawa, Spis treści
Metody i techniki sztucznej inteligencji / Leszek Rutkowski. wyd. 2, 3 dodr. Warszawa, 2012 Spis treści Przedmowa do wydania drugiego Przedmowa IX X 1. Wstęp 1 2. Wybrane zagadnienia sztucznej inteligencji
Laboratorium Przetwarzania Sygnałów Biomedycznych
Laboratorium Przetwarzania Sygnałów Biomedycznych Ćwiczenie 2 Analiza sygnału EKG przy użyciu transformacji falkowej Opracowali: - prof. nzw. dr hab. inż. Krzysztof Kałużyński - inż. Tomasz Kubik Politechnika
Opis efektów kształcenia dla modułu zajęć
Nazwa modułu: Teoria i przetwarzanie sygnałów Rok akademicki: 2013/2014 Kod: EEL-1-524-s Punkty ECTS: 6 Wydział: Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej Kierunek: Elektrotechnika
Automatyczna tablica okulistyczna w oparciu o mel-cepstralną analizę sygnału mowy
Międzywydziałowa Szkoła Inżynierii Biomedycznej Projekt dyplomowy inżynierski Dorota Błaszczyk Nr albumu: 204312 Agnieszka Gielar Nr albumu: 125603 kierunek studiów: inżynieria biomedyczna Automatyczna
Akustyka muzyczna ANALIZA DŹWIĘKÓW MUZYCZNYCH
Akustyka muzyczna ANALIZA DŹWIĘKÓW MUZYCZNYCH Dźwięk muzyczny Dźwięk muzyczny sygnał wytwarzany przez instrument muzyczny. Najważniejsze parametry: wysokość związana z częstotliwością podstawową, barwa
SPOTKANIE 2: Wprowadzenie cz. I
Wrocław University of Technology SPOTKANIE 2: Wprowadzenie cz. I Piotr Klukowski Studenckie Koło Naukowe Estymator piotr.klukowski@pwr.edu.pl 17.10.2016 UCZENIE MASZYNOWE 2/27 UCZENIE MASZYNOWE = Konstruowanie
Przekształcenie Fouriera obrazów FFT
Przekształcenie ouriera obrazów T 6 P. Strumiłło, M. Strzelecki Przekształcenie ouriera ourier wymyślił sposób rozkładu szerokiej klasy funkcji (sygnałów) okresowych na składowe harmoniczne; taką reprezentację
Trening: Modyfikacja potencjału elektrycznego rejestrowanego na powierzchni skóry, a pochodzącego od aktywności neuronów kory mózgowej (protokół)
Neurofeedback-EEG Metoda terapeutyczna polegająca na podawaniu pacjentowi sygnałów zwrotnych o zmianach stanu aktywności elektrycznej mózgu, dzięki czemu może on nauczyć się świadomie modyfikować funkcje,
Ponieważ zakres zmian ciśnień fal akustycznych odbieranych przez ucho ludzkie mieści się w przedziale od 2*10-5 Pa do 10 2 Pa,
Poziom dźwięku Decybel (db) jest jednostką poziomu; Ponieważ zakres zmian ciśnień fal akustycznych odbieranych przez ucho ludzkie mieści się w przedziale od 2*10-5 Pa do 10 2 Pa, co obejmuje 8 rzędów wielkości
Podstawy Sztucznej Inteligencji (PSZT)
Podstawy Sztucznej Inteligencji (PSZT) Paweł Wawrzyński Uczenie maszynowe Sztuczne sieci neuronowe Plan na dziś Uczenie maszynowe Problem aproksymacji funkcji Sieci neuronowe PSZT, zima 2013, wykład 12
PL B BUP 16/04. Kleczkowski Piotr,Kraków,PL WUP 04/09
RZECZPOSPOLITA POLSKA (12) OPIS PATENTOWY (19) PL (11) 201536 (13) B1 (21) Numer zgłoszenia: 358531 (51) Int.Cl. G10L 21/02 (2006.01) H03G 3/00 (2006.01) Urząd Patentowy Rzeczypospolitej Polskiej (22)
Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania
Kodowanie podpasmowe Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania Zasada ogólna Rozkład sygnału źródłowego na części składowe (jak w kodowaniu transformacyjnym) Wada kodowania
Ćwiczenie 3,4. Analiza widmowa sygnałów czasowych: sinus, trójkąt, prostokąt, szum biały i szum różowy
Ćwiczenie 3,4. Analiza widmowa sygnałów czasowych: sinus, trójkąt, prostokąt, szum biały i szum różowy Grupa: wtorek 18:3 Tomasz Niedziela I. CZĘŚĆ ĆWICZENIA 1. Cel i przebieg ćwiczenia. Celem ćwiczenia
PRZETWARZANIE MOWY W CZASIE RZECZYWISTYM
PRZETWARZANIE MOWY W CZASIE RZECZYWISTYM Akustyka mowy opracowanie: M. Kaniewska, A. Kupryjanow, K. Łopatka PLAN WYKŁADU Zasada przetwarzania sygnału w czasie rzeczywistym Algorytmy zmiany czasu trwania
Biometryczna Identyfikacja Tożsamości
c Adam Czajka IAiIS PW 20 maja 2014 1/39 Adam Czajka Wykład na Wydziale Elektroniki i Technik Informacyjnych Politechniki Warszawskiej Semestr letni 2014 c Adam Czajka IAiIS PW 20 maja 2014 2/39 Rozpoznawanie
Kwantowanie sygnałów analogowych na przykładzie sygnału mowy
Kwantowanie sygnałów analogowych na przykładzie sygnału mowy Treść wykładu: Sygnał mowy i jego właściwości Kwantowanie skalarne: kwantyzator równomierny, nierównomierny, adaptacyjny Zastosowanie w koderze
Laboratorium Przetwarzania Sygnałów
PTS - laboratorium Laboratorium Przetwarzania Sygnałów Ćwiczenie 4 Transformacja falkowa Opracował: - prof. dr hab. inż. Krzysztof Kałużyński Zakład Inżynierii Biomedycznej Instytut Metrologii i Inżynierii
przetworzonego sygnału
Synteza falek ortogonalnych na podstawie oceny przetworzonego sygnału Instytut Informatyki Politechnika Łódzka 28 lutego 2012 Plan prezentacji 1 Sformułowanie problemu 2 3 4 Historia przekształcenia falkowego
Podstawy Przetwarzania Sygnałów
Adam Szulc 188250 grupa: pon TN 17:05 Podstawy Przetwarzania Sygnałów Sprawozdanie 6: Filtracja sygnałów. Filtry FIT o skończonej odpowiedzi impulsowej. 1. Cel ćwiczenia. 1) Przeprowadzenie filtracji trzech
KOMPUTEROWE TECHNIKI ANALIZY INFORMACJI ZAWARTEJ W SYGNAŁACH AKUSTYCZNYCH MASZYN ELEKTRYCZNYCH DLA CELÓW DIAGNOSTYKI STANÓW PRZEDAWARYJNYCH
1. Praca Adam Głowacz z roku 2013 str. 1-4 2. Praca Witold Głowacz z roku 2017 str. 1-4 AKADEMIA GÓRNICZO-HUTNICZA IM. STANISŁAWA STASZICA W KRAKOWIE AKADEMIA GÓRNICZO-HUTNICZA IM. STANISŁAWA STASZICA
Cyfrowe przetwarzanie i kompresja danych
Cyfrowe przetwarzanie i kompresja danych dr inż.. Wojciech Zając Wykład 5. Dyskretna transformata falkowa Schemat systemu transmisji danych wizyjnych Źródło danych Przetwarzanie Przesył Przetwarzanie Prezentacja
Zastosowanie współczynników HFCC jako cech sygnału mowy w automatycznej detekcji wad wymowy
Tomasz ZIELIŃSKI ), Paweł GAJDA ), Marcin STACHURA ) Robert WIELGAT 2), Daniel KRÓL 2), Tomasz WOŹNIAK 3), Stanisław GRABIAS 3) ) AKADEMIA GÓRNICZO-HUTNICZA, KATEDRA METROLOGII 2) PAŃSTWOWA WYŻSZA SZKOŁA
Transformata Laplace a to przekształcenie całkowe funkcji f(t) opisane następującym wzorem:
PPS 2 kartkówka 1 RÓWNANIE RÓŻNICOWE Jest to dyskretny odpowiednik równania różniczkowego. Równania różnicowe to pewne związki rekurencyjne określające w sposób niebezpośredni wartość danego wyrazu ciągu.
KOMPRESJA STRATNA DŹWIĘKU
ZESZYTY NAUKOWE 39-58 Leszek Grad 1 KOMPRESJA STRATNA DŹWIĘKU Streszczenie W artykule przedstawione zostały elementarne wiadomości z zakresu kompresji stratnej dźwięku. Przedstawiony został liniowy model
Politechnika Świętokrzyska. Laboratorium. Cyfrowe przetwarzanie sygnałów. Ćwiczenie 6. Transformata cosinusowa. Krótkookresowa transformata Fouriera.
Politechnika Świętokrzyska Laboratorium Cyfrowe przetwarzanie sygnałów Ćwiczenie 6 Transformata cosinusowa. Krótkookresowa transformata Fouriera. Cel ćwiczenia Celem ćwiczenia jest zapoznanie studentów
Transformaty. Kodowanie transformujace
Transformaty. Kodowanie transformujace Kodowanie i kompresja informacji - Wykład 10 10 maja 2009 Szeregi Fouriera Każda funkcję okresowa f (t) o okresie T można zapisać jako f (t) = a 0 + a n cos nω 0
Teoria sygnałów Signal Theory. Elektrotechnika I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny)
. KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Obowiązuje od roku akademickiego 2012/2013 Teoria sygnałów Signal Theory A. USYTUOWANIE MODUŁU W SYSTEMIE STUDIÓW
Metodyka i system dopasowania protez słuchu w oparciu o badanie percepcji sygnału mowy w szumie
Metodyka i system dopasowania protez w oparciu o badanie percepcji sygnału mowy w szumie opracowanie dr inż. Piotr Suchomski Koncepcja metody korekcji ubytku Dopasowanie szerokiej dynamiki odbieranego
Optymalizacja optymalizacji
7 maja 2008 Wstęp Optymalizacja lokalna Optymalizacja globalna Algorytmy genetyczne Badane czasteczki Wykorzystane oprogramowanie (Algorytm genetyczny) 2 Sieć neuronowa Pochodne met-enkefaliny Optymalizacja
Rozpoznawanie twarzy za pomocą sieci neuronowych
Rozpoznawanie twarzy za pomocą sieci neuronowych Michał Bereta http://torus.uck.pk.edu.pl/~beretam Praktyczna przydatność Bardzo szerokie praktyczne zastosowanie Ochrona Systemy bezpieczeństwa (np. lotniska)
Przetwarzanie sygnałów
Przetwarzanie sygnałów Ćwiczenie 5 Filtry o nieskończonej odpowiedzi impulsowej (NOI) Spis treści 1 Wprowadzenie 1 1.1 Filtry jednobiegunowe....................... 1 1.2 Filtry wąskopasmowe........................
Sieci neuronowe do przetwarzania informacji / Stanisław Osowski. wyd. 3. Warszawa, Spis treści
Sieci neuronowe do przetwarzania informacji / Stanisław Osowski. wyd. 3. Warszawa, 2013 Spis treści Przedmowa 7 1. Wstęp 9 1.1. Podstawy biologiczne działania neuronu 9 1.2. Pierwsze modele sieci neuronowej
Sztuczna Inteligencja Tematy projektów Sieci Neuronowe
PB, 2009 2010 Sztuczna Inteligencja Tematy projektów Sieci Neuronowe Projekt 1 Stwórz projekt implementujący jednokierunkową sztuczną neuronową złożoną z neuronów typu sigmoidalnego z algorytmem uczenia
Politechnika Wrocławska Wydział Elektroniki Mikrosystemów i Fotoniki Przetwarzanie sygnałów laboratorium ETD5067L
Politechnika Wrocławska Wydział Elektroniki Mikrosystemów i Fotoniki Przetwarzanie sygnałów laboratorium ETD5067L Ćwiczenie 4. Filtry o skończonej odpowiedzi impulsowej (SOI) 1. Filtracja cyfrowa podstawowe
Przekształcenie Fouriera i splot
Zastosowania Procesorów Sygnałowych dr inż. Grzegorz Szwoch greg@multimed.org p. 732 - Katedra Systemów Multimedialnych Przekształcenie Fouriera i splot Wstęp Na tym wykładzie: przekształcenie Fouriera
Temat: Sztuczne Sieci Neuronowe. Instrukcja do ćwiczeń przedmiotu INŻYNIERIA WIEDZY I SYSTEMY EKSPERTOWE
Temat: Sztuczne Sieci Neuronowe Instrukcja do ćwiczeń przedmiotu INŻYNIERIA WIEDZY I SYSTEMY EKSPERTOWE Dr inż. Barbara Mrzygłód KISiM, WIMiIP, AGH mrzyglod@ agh.edu.pl 1 Wprowadzenie Sztuczne sieci neuronowe
Przetwarzanie sygnałów
Przetwarzanie sygnałów Ćwiczenie 3 Filtry o skończonej odpowiedzi impulsowej (SOI) Spis treści 1 Filtracja cyfrowa podstawowe wiadomości 1 1.1 Właściwości filtru w dziedzinie czasu............... 1 1.2
METODY ANALIZY I ROZPOZNAWANIA INFORMACJI ZAWARTEJ W SYGNAŁACH PRĄDOWYCH I NAPIĘCIOWYCH SILNIKÓW ELEKTRYCZNYCH DLA DIAGNOSTYKI STANÓW PRZEDAWARYJNYCH
AKADEMIA GÓRNICZO-HUTNICZA IM. STANISŁAWA STASZICA W KRAKOWIE WYDZIAŁ ELEKTROTECHNIKI, AUTOMATYKI, INFORMATYKI I INŻYNIERII BIOMEDYCZNEJ mgr inż. Witold Głowacz PRACA DOKTORSKA METODY ANALIZY I ROZPOZNAWANIA
Opisy efektów kształcenia dla modułu
Karta modułu - Technologia mowy 1 / 5 Nazwa modułu: Technologia mowy Rocznik: 2012/2013 Kod: RIA-1-504-s Punkty ECTS: 7 Wydział: Inżynierii Mechanicznej i Robotyki Poziom studiów: Studia I stopnia Specjalność:
Cyfrowe przetwarzanie sygnałów. Wykład 10. Transformata cosinusowa. Falki. Transformata falkowa. dr inż. Robert Kazała
Cyfrowe przetwarzanie sygnałów Wykład 10 Transformata cosinusowa. Falki. Transformata falkowa. dr inż. Robert Kazała 1 Transformata cosinusowa Dyskretna transformacja kosinusowa, (DCT ang. discrete cosine
Test wydajności współczynników percepcyjnych w kontekscie rozpoznawania emocji
Tomasz Sapiński, Dorota Kamińska Politechnika Łódzka Test wydajności współczynników percepcyjnych w kontekscie rozpoznawania emocji Wprowadzenie Komunikacja interpersonalna to nieodzowny element ludzkiego
Technologie Mowy Bartosz Ziółko
www.dsp.agh.edu.pl http://rozpoznawaniemowy.blogspot.com/ Technologie Mowy Bartosz Ziółko 1 Technologie Mowy 2 Technologie Mowy 3 Technologie Mowy 4 Dane kontaktowe Dr inż. Jakub Gałka C2/419 Telefon 50-68
Szybka transformacja Fouriera (FFT Fast Fourier Transform)
Szybka transformacja Fouriera (FFT Fast Fourier Transform) Plan wykładu: 1. Transformacja Fouriera, iloczyn skalarny 2. DFT - dyskretna transformacja Fouriera 3. FFT szybka transformacja Fouriera a) algorytm
Ćwiczenie 4. Filtry o skończonej odpowiedzi impulsowej (SOI)
Politechnika Wrocławska Wydział Elektroniki Mikrosystemów i Fotoniki Przetwarzanie sygnałów laboratorium ETD5067L Ćwiczenie 4. Filtry o skończonej odpowiedzi impulsowej (SOI) 1. Filtracja cyfrowa podstawowe
2. STRUKTURA RADIOFONICZNYCH SYGNAŁÓW CYFROWYCH
1. WSTĘP Radiofonię cyfrową cechują strumienie danych o dużych przepływnościach danych. Do przesyłania strumienia danych o dużych przepływnościach stosuje się transmisję z wykorzystaniem wielu sygnałów
PRACA DYPLOMOWA Inżynierska
AKADEMIA GÓRNICZO-HUTNICZA IM. STANISŁAWA STASZICA W KRAKOWIE Wydział Informatyki, Elektroniki i Telekomunikacji Katedra Elektroniki PRACA DYPLOMOWA Inżynierska Temat: Narzędzie programowe do optymalizacji
Egzamin / zaliczenie na ocenę*
WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI Zał. nr 4 do ZW 33/01 KARTA PRZEDMIOTU Nazwa w języku polskim CYFROWE PRZETWARZANIE SYGNAŁÓW Nazwa w języku angielskim DIGITAL SIGNAL PROCESSING Kierunek studiów
Analiza sygnału mowy sterowana danymi dla rozpoznawania komend głosowych
Analiza sygnału mowy sterowana danymi dla rozpoznawania komend głosowych Włodzimierz Kasprzak 1, Adam B. Kowalski 1 Streszczenie W artykule omówiono podstawowe etapy analizy sygnału mowy "sterowanej danymi":
Wstęp do teorii sztucznej inteligencji Wykład II. Uczenie sztucznych neuronów.
Wstęp do teorii sztucznej inteligencji Wykład II Uczenie sztucznych neuronów. 1 - powtórzyć o klasyfikacji: Sieci liniowe I nieliniowe Sieci rekurencyjne Uczenie z nauczycielem lub bez Jednowarstwowe I
BIOMETRIA WYKŁAD 6 CECHY BIOMETRYCZNE: GŁOS
BIOMETRIA WYKŁAD 6 CECHY BIOMETRYCZNE: GŁOS Wykorzystanie mowy w technologii Automatyczne rozpoznawanie mowy Synteza mowy Rozpoznawania mówcy Rozpoznawanie emocji Generowanie emocji Synteza z ruchem ust
Diagnostyka procesów przemysłowych Kod przedmiotu
Diagnostyka procesów przemysłowych - opis przedmiotu Informacje ogólne Nazwa przedmiotu Diagnostyka procesów przemysłowych Kod przedmiotu 06.0-WE-AiRP-DPP Wydział Kierunek Wydział Informatyki, Elektrotechniki
4.1. Wprowadzenie...70 4.2. Podstawowe definicje...71 4.3. Algorytm określania wartości parametrów w regresji logistycznej...74
3 Wykaz najważniejszych skrótów...8 Przedmowa... 10 1. Podstawowe pojęcia data mining...11 1.1. Wprowadzenie...12 1.2. Podstawowe zadania eksploracji danych...13 1.3. Główne etapy eksploracji danych...15
NEURONOWA ANALIZA SPEKTRUM SYGNAŁU AKUSTYCZNEGO W OKREŚLANIU CECH FIZYCZNYCH ZIARNIAKÓW
Inżynieria Rolnicza 8(117)/2009 NEURONOWA ANALIZA SPEKTRUM SYGNAŁU AKUSTYCZNEGO W OKREŚLANIU CECH FIZYCZNYCH ZIARNIAKÓW Robert J. Tomczak, Jerzy Weres Instytut Inżynierii Rolniczej, Uniwersytet Przyrodniczy
Pomiary w technice studyjnej. TESTY PESQ i PEAQ
Pomiary w technice studyjnej TESTY PESQ i PEAQ Wprowadzenie Problem: ocena jakości sygnału dźwiękowego. Metody obiektywne - np. pomiar SNR czy THD+N - nie dają pełnych informacji o jakości sygnału. Ważne
Kodowanie transformacyjne. Plan 1. Zasada 2. Rodzaje transformacji 3. Standard JPEG
Kodowanie transformacyjne Plan 1. Zasada 2. Rodzaje transformacji 3. Standard JPEG Zasada Zasada podstawowa: na danych wykonujemy transformacje która: Likwiduje korelacje Skupia energię w kilku komponentach
Automatyczna predykcja. Materiały/konsultacje. Co to jest uczenie maszynowe? Przykład 6/10/2013. Google Prediction API, maj 2010
Materiały/konsultacje Automatyczna predykcja http://www.ibp.pwr.wroc.pl/kotulskalab Konsultacje wtorek, piątek 9-11 (uprzedzić) D1-115 malgorzata.kotulska@pwr.wroc.pl Co to jest uczenie maszynowe? Uczenie
Algorytm do rozpoznawania człowieka na podstawie dynamiki użycia klawiatury. Paweł Kobojek, prof. dr hab. inż. Khalid Saeed
Algorytm do rozpoznawania człowieka na podstawie dynamiki użycia klawiatury Paweł Kobojek, prof. dr hab. inż. Khalid Saeed Zakres pracy Przegląd stanu wiedzy w dziedzinie biometrii, ze szczególnym naciskiem
Transformata Fouriera i analiza spektralna
Transformata Fouriera i analiza spektralna Z czego składają się sygnały? Sygnały jednowymiarowe, częstotliwość Liczby zespolone Transformata Fouriera Szybka Transformata Fouriera (FFT) FFT w 2D Przykłady
KONCEPCJA WYKORZYSTANIA SZTUCZNYCH SIECI NEURONOWYCH W DIAGNOSTYCE PRZEKŁADNI ZĘBATYCH
ZESZYTY NAUKOWE POLITECHNIKI ŚLĄSKIEJ 2009 Seria: TRANSPORT z. 65 Nr kol. 1807 Piotr CZECH, Bogusław ŁAZARZ KONCEPCJA WYKORZYSTANIA SZTUCZNYCH SIECI NEURONOWYCH W DIAGNOSTYCE PRZEKŁADNI ZĘBATYCH Streszczenie.
WPROWADZENIE DO SZTUCZNEJ INTELIGENCJI
POLITECHNIKA WARSZAWSKA WYDZIAŁ MECHANICZNY ENERGETYKI I LOTNICTWA MEL WPROWADZENIE DO SZTUCZNEJ INTELIGENCJI NS 586 Dr inż. Franciszek Dul 15. WNIOSKOWANIE PROBABILISTYCZNE EWOLUCYJNE Wnioskowanie probabilistyczne
Synteza mowy. opracowanie: mgr inż. Kuba Łopatka
Synteza mowy opracowanie: mgr inż. Kuba Łopatka Synteza mowy (ang. TTS - Text-To-Speech ) zamiana tekstu w formie pisanej na sygnał akustyczny, którego brzmienie naśladuje brzmienie ludzkiej mowy. Podstawowe
Inteligentne metody rozpoznawania dźwięku
Politechnika Łódzka Wydział Fizyki Technicznej, Informatyki i Matematyki Stosowanej Kierunek Informatyka Praca magisterska Inteligentne metody rozpoznawania dźwięku Stanisław Kacprzak Promotor: prof. dr