Rozpoznawanie i synteza mowy w systemach multimedialnych. Analiza i synteza mowy - wprowadzenie. Spektrogram wyrażenia: computer speech
|
|
- Fabian Podgórski
- 7 lat temu
- Przeglądów:
Transkrypt
1 Slajd 1 Analiza i synteza mowy - wprowadzenie Spektrogram wyrażenia: computer speech Slide 1 Slajd 2 Analiza i synteza mowy - wprowadzenie Slide 2
2 Slajd 3 Analiza i synteza mowy - wprowadzenie Slide 3 Slajd 4 Pierwsze próby syntezy mowy Maszyna wymawiająca samogłoski z 1769 roku zbudowana przez Wolfganga Rittera von Kempelen (rekonstrukcja) Slide 4
3 Slajd 5 Pierwsze próby syntezy mowy Urządzenia do wymawiania spółgłosek plozyjnych : b i d (Wolfgang Ritter) Slide 5 Slajd 6 Pierwsze próby syntezy mowy Rezonatory (wibrujące piszczałki) Kratzensteina Slide 6
4 Slajd 7 Pierwsze próby syntezy mowy Przekroje kanału głosowego przy wymawianiu samogłosek i oraz u i odpowiadające im formanty (rezonanse) Slide 7 Slajd 8 Pierwsze próby syntezy mowy Najprostszy model kanału głosowego Slide 8
5 Slajd 9 Rozpoznawanie mowy oraz identyfikacja głosu Pomiar parametrów fizycznych kanału głosowego Slide 9 Slajd 10 Rozpoznawanie mowy oraz identyfikacja głosu Pomiar parametrów geometrycznych kanału głosowego Slide 10
6 Slajd 11 Rozpoznawanie mowy oraz identyfikacja głosu Poprawa jakości głosu metodą modulacji częstotliwościowej Slide 11 Slajd 12 Rozpoznawanie mowy oraz identyfikacja głosu Spektrogram wyrażenia two of five Spektrogram po modulacji częstotliwości (2-8 Hz) Slide 12
7 Slajd 13 Rozpoznawanie mowy oraz identyfikacja głosu Spektrogram w obecności szumu średniego natężenia Spektrogram po modulacji częstotliwości Slide 13 Slajd 14 Rozpoznawanie mowy oraz identyfikacja głosu Spektrogram w obecności silnego szumu Spektrogram po modulacji częstotliwości Slide 14
8 Slajd 15 Rozpoznawanie mowy oraz identyfikacja głosu Spektrogram w pomieszczeniu odbijającym głos Spektrogram po modulacji częstotliwości Slide 15 Slajd 16 Rozpoznawanie mowy oraz identyfikacja głosu Spektrogram w pomieszczeniu odbijającym głos (b. silny pogłos) Spektrogram po modulacji częstotliwości Slide 16
9 Slajd 17 Rozpoznawanie mowy Reguły Bayes,a: wyznaczanie prawdopodobieństw a posteriori w funkcji prawdopodobieństw a priori p ( W A) = p( AW ) p( W ) p( A) Slide 17 Slajd 18 Kompresja mowy Predykcja liniowa s + e n = a1sn 1 a2sn 2 L a psn p n (1) E N N p 2 = en = k n= 1 n= 1 k = 0 a s n k 2 a 0 = 1 Slide 18
10 Slajd 19 Rozpoznawanie mowy E a m = E = N n= 1 2s p n m k = 0 a s k n k = 0 Odwracając porządek sumowania p r mk k = 0 a k = 0 gdzie r mk = N n= 1 s n m s n k Slide 19 Slajd 20 Rozpoznawanie mowy Pamiętając, że a 0 =1 p r mk k = 1 a k = r m0 lub w postaci macierzowej R a = r czyli a = R 1 0 r 0 Slide 20
11 Slajd 21 Rozpoznawanie mowy oraz identyfikacja głosu Slide 21 Slajd 22 Rozpoznawanie mowy Filtr predykcyjny Filtr FIR (Finite Impulse Response): H N ( z) = k = 0 a k z k Odpowiedź impulsowa filtru FIR:, a, a, L a p Slide 22
12 Slajd 23 Rozpoznawanie mowy s n s( z) e( z) Przyjmując: A e n ( z p ) a z 1 a z 2 a z = L + p Z równania (1): e n n 1 = s + a s L 2 1 n 1 + a2sn a s p n p czyli: ( z) A( z) = e( z) s( z) s = ( z) ( z) e A Slide 23 Slajd 24 Rozpoznawanie mowy A z z z z 2 ( z) = z, z L L 1 2 zera A(z) 1 H p ( z) = A ( z) all-pole filter Slide 24
13 Slajd 25 Rozpoznawanie mowy oraz identyfikacja głosu Głoska dźwięczna i jej widmo oraz obwiednia zdefiniowana przez filtr 1/A(z) Slide 25 Slajd 26 Rozpoznawanie mowy oraz identyfikacja głosu Głoska bezdźwięczna i jej widmo oraz obwiednia zdefiniowana przez filtr 1/A(z) Slide 26
14 Slajd 27 Rozpoznawanie mowy oraz identyfikacja głosu Kształtowanie widma szumu: szum słyszalny i prawie niesłyszalny Slide 27 Slajd 28 Analiza kanału głosowego Slide 28
15 Slajd 29 Analiza kanału głosowego Slide 29 Slajd 30 Kanał głosowy Slide 30
16 Slajd 31 Kanał głosowy Równanie Webster a, czyli równanie natężenia (ciśnienia) fali dźwiękowej p(x,t) wzdłuż kanału: 2 p x A da dx p 1 = 2 x c 2 p 2 t A(x) jest przekrojem kanału głosowego między głośnią (x=0) a wargami x=l ~= 170 mm) Slide 31 Slajd 32 Lokalizacja położenia źródła dźwięku = 0 α 180 c t d Prawo pierwszej fali frontowej (Joseph Henry) i efekt Haas a Slide 32
17 Slajd 33 Lokalizacja położenia źródła dźwięku u 1 (t) t u 2 (t) t Continuity effect Slide 33 Slajd 34 Lokalizacja położenia źródła dźwięku 8kHz 300Hz, 3kHz 1kHz, 10kHz Slide 34
18 Slajd 35 Rozpoznawanie mowy Slide 35 Slajd 36 Rozpoznawanie mowy Slide 36
19 Slajd 37 Rozpoznawanie mowy Slide 37 Slajd 38 Rozpoznawanie mowy Slide 38
20 Slajd 39 Rozpoznawanie mowy Slide 39 Slajd 40 Rozpoznawanie mowy Przebieg funkcji cepstrum z zaznaczonym torem głosowym (1) oraz pobudzeniem krtaniowym (2) Slide 40
21 Slajd 41 Formaty dźwiękowe LPCM (Linear Pulse Code Modulation): udoskonalony PCM Częstotliwość próbkowania 48 khz 48 khz 48 khz 96 khz 96 khz 96 khz Rozdzielczość 16 bitów 20 bitów 24 bity 16 bitów 20 bitów 24 bity Ilość kanałów Strumień max. 6,144 Mb/s 5,76 Mb/s 5,76 Mb/s 6,144 Mb/s 5,76 Mb/s 4,608 Mb/s Slide 41 Slajd 42 MPEG AUDIO A. MPEG-1 audio, opisuje trzy warstwy kodowania dźwięku o następujących właściwościach: 1 lub 2 kanały dźwiękowe Częstotliwość próbkowania 32kHz, 44.1kHz lub 48kHz Przepustowość od 32kbps do 448kbps Slide 42
22 Slajd 43 B. MPEG-2 audio występuje w dwóch odmianach MPEG-2/LSF 1 lub 2 kanały dźwiękowe Dwa razy mniejszą częstotliwość próbkowania Przepustowość od 8 do 256 kbs MPEG-2/Multichannel Do 5 pełno-zakresowych kanałów dźwiękowych Częstotliwość próbkowania taką samą jak w MPEG-1 Rozdzielczość 16 bitów Większe przepustowości dochodzące do około 1 Mb/s do systemu 5+1 kanałów Slide 43 Slajd 44 Schemat blokowy układu kodera standardu MPEG-1 Slide 44
23 Slajd 45 Struktura zakodowanego strumienia danych MPEG-1 Slide 45 Slajd 46 Dolby Surround Slide 46
24 Slajd 47 Kodowanie Slide 47 Slajd 48 Dekodowanie Slide 48
25 Slajd 49 Dolby Pro Logic Slide 49 Slajd 50 Kodek Slide 50
26 Slajd 51 Dekodowanie Slide 51 Slajd 52 Dolby Digital Slide 52
27 Slajd 53 Rozpoznawanie mowy Kompatybilne miksowanie w dół Slide 53 Slajd 54 DTS firmy Digital Theater Systems DTS EX Slide 54
28 Slajd 55 DC DVD Slide 55 Slajd 56 Standard: Pojemność: Rodzaj płyty: DVD 5 DVD 9 DVD 10 DVD GB 8.5 GB 9.4 GB 17 GB jednostronna jednowarstwowa jednostronna dwuwarstwowa dwuwarstwowa jednostronna dwuwarstwowa dwustronna Slide 56
29 Slajd 57 Struktura warstw płyty DVD w zależności od standardu Slide 57
DŹWIĘK. Dźwięk analogowy - fala sinusoidalna. Dźwięk cyfrowy 1-bitowy 2 możliwe stany fala jest mocno zniekształcona
DŹWIĘK Dźwięk analogowy - fala sinusoidalna Dźwięk cyfrowy 1-bitowy 2 możliwe stany fala jest mocno zniekształcona Dźwięk cyfrowy 2-bitowy 2 bity 4 możliwe stany (rozdzielczość dwubitowa) 8 bitów - da
Bardziej szczegółowoKwantowanie sygnałów analogowych na przykładzie sygnału mowy
Kwantowanie sygnałów analogowych na przykładzie sygnału mowy Treść wykładu: Sygnał mowy i jego właściwości Kwantowanie skalarne: kwantyzator równomierny, nierównomierny, adaptacyjny Zastosowanie w koderze
Bardziej szczegółowoWielokanałowe systemy kodowania dźwięku
Wielokanałowe systemy kodowania dźwięku Początki dźwięku wielokanałowego Fantasound (1940) pokazy filmu Fantasia Walta Disneya dodatkowa taśma filmowa z dźwiękiem (zapis optyczny): L, C, P mechaniczne
Bardziej szczegółowoKOMPRESJA STRATNA SYGNAŁU MOWY. Metody kompresji stratnej sygnałów multimedialnych: Uproszczone modelowanie źródeł generacji sygnałów LPC, CELP
KOMPRESJA STRATNA SYGNAŁU MOWY Metody kompresji stratnej sygnałów multimedialnych: Uproszczone modelowanie źródeł generacji sygnałów LPC, CELP Śledzenie i upraszczanie zmian dynamicznych sygnałów ADPCM
Bardziej szczegółowoMODULACJE IMPULSOWE. TSIM W10: Modulacje impulsowe 1/22
MODULACJE IMPULSOWE TSIM W10: Modulacje impulsowe 1/22 Fala nośna: Modulacja PAM Pulse Amplitude Modulation Sygnał PAM i jego widmo: y PAM (t) = n= x(nt s ) Y PAM (ω) = τ T s Sa(ωτ/2)e j(ωτ/2) ( ) t τ/2
Bardziej szczegółowoWykład VI. Dźwięk cyfrowy. dr inż. Janusz Słupik. Gliwice, Wydział Matematyki Stosowanej Politechniki Śląskiej. c Copyright 2014 Janusz Słupik
Wykład VI Wydział Matematyki Stosowanej Politechniki Śląskiej Gliwice, 2014 c Copyright 2014 Janusz Słupik Kompresja dźwięku Kompresja dźwięku bezstratna podczas odtwarzania otrzymujemy wierne odwzorowanie
Bardziej szczegółowodr inż. Piotr Odya Parametry dźwięku zakres słyszanych przez człowieka częstotliwości: 20 Hz - 20 khz; 10 oktaw zakres dynamiki słuchu: 130 db
dr inż. Piotr Odya Parametry dźwięku zakres słyszanych przez człowieka częstotliwości: 20 Hz - 20 khz; 10 oktaw zakres dynamiki słuchu: 130 db 1 Sygnał foniczny poziom analogowy czas cyfrowy poziom czas
Bardziej szczegółowoFormaty DVD czwartek, 26 stycznia :00 - Poprawiony czwartek, 26 stycznia :40
Rok 1999 nazywany jest często Rokiem płyty DVD, bowiem w tym roku miała miejsce premiera nowego formatu cyfrowego zapisu obrazu i dźwięku na płycie DVD. Formaty DVD Autor: Stanisław Chrząszcz Wszyscy znamy
Bardziej szczegółowoTEORIA WYTWARZANIA DŹWIĘKÓW
1 TEORIA WYTWARZANIA DŹWIĘKÓW MOWY, FORMANTY, MODELOWANIE WYTWARZANIA DŹWIĘKÓW MOWY. mgr inż. Kuba Łopatka PLAN WYKŁADU 1. Teoria wytwarzania dźwięków mowy Ogólna teoria wytwarzania dźwięków mowy Ton krtaniowy
Bardziej szczegółowoTECHNIKI MULTIMEDIALNE
Studia Podyplomowe INFORMATYKA TECHNIKI MULTIMEDIALNE dr Artur Bartoszewski Karty dźwiękowe Karta dźwiękowa Rozwój kart dźwiękowych Covox Rozwój kart dźwiękowych AdLib Rozwój kart dźwiękowych Gravis Ultrasound
Bardziej szczegółowoWybrane metody kompresji obrazów
Wybrane metody kompresji obrazów Celem kodowania kompresyjnego obrazu jest redukcja ilości informacji w nim zawartej. Redukcja ta polega na usuwaniu informacji nadmiarowej w obrazie, tzw. redundancji.
Bardziej szczegółowoWielokanałowe systemy kodowania dźwięku
Wielokanałowe systemy kodowania dźwięku Początki dźwięku wielokanałowego Fantasound (1940) pokazy filmu Fantasia Walta Disneya dodatkowa taśma filmowa z dźwiękiem (zapis optyczny): L, C, P mechaniczne
Bardziej szczegółowoKodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania
Kodowanie podpasmowe Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania Zasada ogólna Rozkład sygnału źródłowego na części składowe (jak w kodowaniu transformacyjnym) Wada kodowania
Bardziej szczegółowoSystemy plezjochroniczne (PDH) synchroniczne (SDH), Transmisja w sieci elektroenergetycznej (PLC Power Line Communication)
Politechnika Śląska Katedra Elektryfikacji i Automatyzacji Górnictwa Systemy plezjochroniczne (PDH) synchroniczne (SDH), Transmisja w sieci elektroenergetycznej (PLC Power Line Communication) Opracował:
Bardziej szczegółowoKodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania
Kodowanie podpasmowe Plan 1. Zasada. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania Zasada ogólna Rozkład sygnału źródłowego na części składowe (jak w kodowaniu transformacyjnym) Wada kodowania
Bardziej szczegółowoFormaty plików audio
Formaty plików audio Spis treści 1.Formaty plików audio.... 2 Wav... 2 Aac... 2 AIFF... 2 Ogg... 2 Asf... 2 Mp1... 2 Mp2... 2 Mp3... 2 MP3PRO... 3 Mp4... 3 Wma... 3 Midi... 3 Ac3... 3 2. Różnica miedzy
Bardziej szczegółowoFormaty - podziały. format pliku. format kompresji. format zapisu (nośnika) kontener dla danych WAV, AVI, BMP
dr inż. Piotr Odya Formaty - podziały format pliku kontener dla danych WAV, AVI, BMP format kompresji bezstratna/stratna ADPCM, MPEG, JPEG, RLE format zapisu (nośnika) ściśle określona struktura plików
Bardziej szczegółowoZAKŁAD SYSTEMÓW ELEKTRONICZNYCH I TELEKOMUNIKACYJNYCH Laboratorium Podstaw Telekomunikacji WPŁYW SZUMÓW NA TRANSMISJĘ CYFROWĄ
Laboratorium Podstaw Telekomunikacji Ćw. 4 WPŁYW SZUMÓW NA TRANSMISJĘ CYFROWĄ 1. Zapoznać się z zestawem do demonstracji wpływu zakłóceń na transmisję sygnałów cyfrowych. 2. Przy użyciu oscyloskopu cyfrowego
Bardziej szczegółowo2. Próbkowanie Sygnały okresowe (16). Trygonometryczny szereg Fouriera (17). Częstotliwość Nyquista (20).
SPIS TREŚCI ROZDZIAŁ I SYGNAŁY CYFROWE 9 1. Pojęcia wstępne Wiadomości, informacje, dane, sygnały (9). Sygnał jako nośnik informacji (11). Sygnał jako funkcja (12). Sygnał analogowy (13). Sygnał cyfrowy
Bardziej szczegółowoSprawdzian wiadomości z jednostki szkoleniowej M3.JM1.JS3 Użytkowanie kart dźwiękowych, głośników i mikrofonów
Sprawdzian wiadomości z jednostki szkoleniowej M3.JM1.JS3 Użytkowanie kart dźwiękowych, głośników i mikrofonów 1. Przekształcenie sygnału analogowego na postać cyfrową określamy mianem: a. digitalizacji
Bardziej szczegółowoTechnika audio część 1
Technika audio część 1 Wykład 9 Technologie na urządzenia mobilne Łukasz Kirchner Lukasz.kirchner@cs.put.poznan.pl http://www.cs.put.poznan.pl/lkirchner Wprowadzenie technologii audio Próbkowanie Twierdzenie
Bardziej szczegółowoKompresja dźwięku w standardzie MPEG-1
mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 7, strona 1. Kompresja dźwięku w standardzie MPEG-1 Ogólne założenia kompresji stratnej Zjawisko maskowania psychoakustycznego Schemat blokowy
Bardziej szczegółowoBiometryczna Identyfikacja Tożsamości
c Adam Czajka, IAiIS PW, wersja: 6 grudnia 2015, 1/39 Adam Czajka Wykład na Wydziale Elektroniki i Technik Informacyjnych Politechniki Warszawskiej Semestr zimowy 2015/16 c Adam Czajka, IAiIS PW, wersja:
Bardziej szczegółowoPodstawowe informacje o płytach DVD
Płyty i odtwarzacze systemu DVD osiągnęły olbrzymi sukces w szczególności jeśli chodzi o odtwarzanie filmów wideo w systemach kina domowego. Dzięki dużej pojemności płyt DVD i szerokiemu wsparciu tej technologii
Bardziej szczegółowoWybrane algorytmu kompresji dźwięku
[1/28] Wybrane algorytmu kompresji dźwięku [dr inż. Paweł Forczmański] Katedra Systemów Multimedialnych, Wydział Informatyki, Zachodniopomorski Uniwersytet Technologiczny w Szczecinie [2/28] Podstawy kompresji
Bardziej szczegółowoBiometryczna Identyfikacja Tożsamości
Biometryczna Identyfikacja Tożsamości Wykład 9: Rozpoznawanie mówiącego Adam Czajka Wykład na Wydziale Elektroniki i Technik Informacyjnych Politechniki Warszawskiej Semestr letni 2015 c Adam Czajka, IAiIS
Bardziej szczegółowoAkustyka mowy wprowadzenie. Opracował: dr inż. Piotr Suchomski
Akustyka mowy wprowadzenie Opracował: dr inż. Piotr Suchomski Kontakt Katedra Systemów Multimedialnych Wydział ETI dr inż. Piotr M. Suchomski, pok. EA 730 e-mail: pietka@sound.eti.pg.gda.pl tel. 23-01
Bardziej szczegółowoStandardy zapisu i transmisji dźwięku
Standardy zapisu i transmisji dźwięku dr inż. Piotr Odya Katedra Systemów Multimedialnych Cyfrowe standardy foniczne AES/EBU (Audio Eng. Society and the European Broadcast Union) połączenie za pomocą złącza
Bardziej szczegółowoMETODY KODOWANIA SYGNAŁU MOWY DO ZASTOSOWAŃ W TELEKOMUNIKACJI
METODY KODOWANIA SYGNAŁU MOWY DO ZASTOSOWAŃ W TELEKOMUNIKACJI Maciej Kulesza pok. 726 Katedra Systemów Multimedialnych Plan wykładu Właściwości (charakterystyka) sygnału mowy Właściwości kodeków mowy Metody
Bardziej szczegółowo(12) TŁUMACZENIE PATENTU EUROPEJSKIEGO (19) PL (11) PL/EP 2311035. (96) Data i numer zgłoszenia patentu europejskiego: 06.07.2009 09793882.
RZECZPOSPOLITA POLSKA (12) TŁUMACZENIE PATENTU EUROPEJSKIEGO (19) PL (11) PL/EP 2311035 (96) Data i numer zgłoszenia patentu europejskiego: 06.07.2009 09793882.3 (13) (51) T3 Int.Cl. G10L 19/14 (2006.01)
Bardziej szczegółowoInformacje na temat produktu C: Instalacja
Informacje na temat produktu A: Analogowe wejścia i wyjścia B: Cyfrowe wejście i wyjście S/PDIF C: Wewnętrzne wejścia analogowe C A B Instalacja Przed przystąpieniem do instalacji: Jeśli karta główna posiada
Bardziej szczegółowo58. Otwarte Seminarium z Akustyki, OSA '11, Gdańsk-Jurata, September 2011
109 ROZPOZNAWANIE MÓWCY W SYSTEMACH Z KODOWANIEM MOWY STEFAN BRACHMAŃSKI Politechnika Wrocławska, Instytut Telekomunikacji, Teleinformatyki i Akustyki Wybrzeże Wyspiańskiego 27, 50-370 Wrocław Stefan.brachmanski@pwr.wroc.pl
Bardziej szczegółowoLEKCJA. TEMAT: Napędy optyczne.
TEMAT: Napędy optyczne. LEKCJA 1. Wymagania dla ucznia: Uczeń po ukończeniu lekcji powinien: umieć omówić budowę i działanie napędu CD/DVD; umieć omówić budowę płyty CD/DVD; umieć omówić specyfikację napędu
Bardziej szczegółowoPercepcja dźwięku. Narząd słuchu
Percepcja dźwięku Narząd słuchu 1 Narząd słuchu Ucho zewnętrzne składa się z małżowiny i kanału usznego, zakończone błoną bębenkową, doprowadza dźwięk do ucha środkowego poprzez drgania błony bębenkowej;
Bardziej szczegółowodr hab. inż. Artur Janicki pok. 407 Zakład Cyberbezpieczeństwa Instytut Telekomunikacji PW
dr hab. inż. Artur Janicki email: A.Janicki@tele.pw.edu.pl, pok. 407 Zakład Cyberbezpieczeństwa Instytut Telekomunikacji PW Kodowanie źródła podstawowe informacje Sygnał mowy informacje ogólne, jak powstaje
Bardziej szczegółowoWIDMO, ELEMENTY SKŁADOWE DŹWIĘKU, ZAPIS DŹWIĘKU, SYNTEZA ADDYTYWNA
WIDMO, ELEMENTY SKŁADOWE DŹWIĘKU, ZAPIS DŹWIĘKU, SYNTEZA ADDYTYWNA Kamila Tatarynowicz FALE PODŁUŻNE Fala podłużna fala, w której drgania odbywają się w kierunku zgodnym z kierunkiem jej rozchodzenia się.
Bardziej szczegółowodr inż. Artur Janicki pok. 414 Zakład Systemów Teletransmisyjnych Instytut Telekomunikacji PW
dr inż. Artur Janicki email: A.Janicki@tele.pw.edu.pl, pok. 414 Zakład Systemów Teletransmisyjnych Instytut Telekomunikacji PW Kodowanie źródła podstawowe informacje Sygnał mowy informacje ogólne, jak
Bardziej szczegółowoSpis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami
Spis treści Format WAVE Format MP3 Format ACC i inne Konwersja między formatami Formaty plików audio różnią się od siebie przede wszystkim zastosowanymi algorytmami kompresji. Kompresja danych polega na
Bardziej szczegółowoModulacja i kodowanie laboratorium. Modulacje Cyfrowe: Kluczowanie Amplitudy (ASK) i kluczowanie Fazy (PSK)
Modulacja i kodowanie laboratorium Modulacje Cyfrowe: Kluczowanie Amplitudy (ASK) i kluczowanie Fazy (PSK) Celem ćwiczenia jest opracowanie algorytmów modulacji i dekodowania dla dwóch rodzajów modulacji
Bardziej szczegółowoSpis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami
Spis treści Format WAVE Format MP3 Format ACC i inne Konwersja między formatami Formaty plików audio różnią się od siebie przede wszystkim zastosowanymi algorytmami kompresji. Kompresja danych polega na
Bardziej szczegółowoTechnika audio część 2
Technika audio część 2 Wykład 12 Projektowanie cyfrowych układów elektronicznych Mgr inż. Łukasz Kirchner lukasz.kirchner@cs.put.poznan.pl http://www.cs.put.poznan.pl/lkirchner Wprowadzenie do filtracji
Bardziej szczegółowoArchitektura systemów komputerowych. dr Artur Bartoszewski
Architektura systemów komputerowych dr Artur Bartoszewski Parametry dźwięku pasmo przenoszenia Pasmo przenoszenia (w elektroakustyce) zakres częstotliwości, w którym tłumienie sygnału jest nie większe
Bardziej szczegółowoPRZETWARZANIE MOWY W CZASIE RZECZYWISTYM
PRZETWARZANIE MOWY W CZASIE RZECZYWISTYM Akustyka mowy opracowanie: M. Kaniewska, A. Kupryjanow, K. Łopatka PLAN WYKŁADU Zasada przetwarzania sygnału w czasie rzeczywistym Algorytmy zmiany czasu trwania
Bardziej szczegółowoWPŁYW PRÓBKOWANIA I KWANTYZACJI NA JAKOŚĆ DŹWIĘKU
KATEDRA SYSTEMÓW MULTIMEDIALNYCH LABORATORIUM PRZETWARZANIA DŹWIĘKÓW I OBRAZÓW Ćwiczenie nr : WPŁYW PRÓBKOWANIA I KWANTYZACJI NA JAKOŚĆ DŹWIĘKU Opracowanie: mgr Marek Szczerba mgr inż. Piotr Odya mgr inż.
Bardziej szczegółowoPodstawy Przetwarzania Sygnałów
Adam Szulc 188250 grupa: pon TN 17:05 Podstawy Przetwarzania Sygnałów Sprawozdanie 6: Filtracja sygnałów. Filtry FIT o skończonej odpowiedzi impulsowej. 1. Cel ćwiczenia. 1) Przeprowadzenie filtracji trzech
Bardziej szczegółowoWymiana i Składowanie Danych Multimedialnych Mateusz Moderhak, EA 106, Pon. 11:15-12:00, śr.
Wymiana i Składowanie Danych Multimedialnych 2019 Mateusz Moderhak, matmod@biomed.eti.pg.gda.pl, EA 106, Pon. 11:15-12:00, śr. 12:15-13:00 Zaliczenie: 60% wykład, 40% laboratorium Zerówka w formie dwóch
Bardziej szczegółowoKompresja sekwencji obrazów
Kompresja sekwencji obrazów - algorytm MPEG-2 Moving Pictures Experts Group (MPEG) - 1988 ISO - International Standard Organisation CCITT - Comité Consultatif International de Téléphonie T et TélégraphieT
Bardziej szczegółowoKODOWANIE I KOMPRESJA SYGNAŁU MOWY
Akustyka mowy KODOWANIE I KOMPRESJA SYGNAŁU MOWY Katedra Systemów Multimedialnych, Politechnika Gdańska Autor: Grzegorz Szwoch, kwiecień 2011 Potrzeba kompresji mowy Cyfrowy sygnał mowy bez kompresji:
Bardziej szczegółowoAkwizycja i przetwarzanie sygnałów cyfrowych
Akwizycja i przetwarzanie sygnałów cyfrowych Instytut Teleinformatyki ITI PK Kraków 21 luty 2011 Kompresja sygnałów multimedialnych sygnały multimedialne jedne z najważniejszych typów sygnałow cyfrowych;
Bardziej szczegółowoAutomatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści
Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, 2011 Spis treści Przedmowa 11 Rozdział 1. WPROWADZENIE 13 1.1. Czym jest automatyczne rozpoznawanie mowy 13 1.2. Poziomy
Bardziej szczegółowoOd CD do DVD. Marcin LACEK Lackowski. Bartek Radzicki. Tomek SZYDŁO Szydłowski
Od CD do DVD daniel D DZBAŃSKI Marcin LACEK Lackowski Bartek Radzicki Tomek SZYDŁO Szydłowski Co jest DVD! DVD to w zasadzie nic innego, jak pojemniejszy kompakt.! Krążek DVD z wykładu nie różni się od
Bardziej szczegółowo2. STRUKTURA RADIOFONICZNYCH SYGNAŁÓW CYFROWYCH
1. WSTĘP Radiofonię cyfrową cechują strumienie danych o dużych przepływnościach danych. Do przesyłania strumienia danych o dużych przepływnościach stosuje się transmisję z wykorzystaniem wielu sygnałów
Bardziej szczegółowoKarta dźwiękowa. Architektura systemów komputerowych Ćwiczenie 3
Architektura systemów komputerowych Ćwiczenie 3 Karta dźwiękowa Cyfrowy zapis dźwięku Digitalizowanie dźwięku kompresja Budowa i działanie karty dźwiękowej ewolucja kart dźwiękowych Budowa karty dźwiękowej
Bardziej szczegółowo(12) TŁUMACZENIE PATENTU EUROPEJSKIEGO (19) PL (11) PL/EP (96) Data i numer zgłoszenia patentu europejskiego:
RZECZPOSPOLITA POLSKA (12) TŁUMACZENIE PATENTU EUROPEJSKIEGO (19) PL (11) PL/EP 1735779 Urząd Patentowy Rzeczypospolitej Polskiej (96) Data i numer zgłoszenia patentu europejskiego: 30.03.2005 05718592.8
Bardziej szczegółowoWzmacniacz sygnału 4K HDMI Extender, HDBaseT
Wzmacniacz sygnału 4K HDMI Extender, HDBaseT Instrukcja obsługi DS-55500 Ważna informacja dotycząca bezpieczeństwa Przed instalacją i obsługą urządzenia należy dokładnie zapoznać się z poniższymi zaleceniami
Bardziej szczegółowo4 Zasoby językowe Korpusy obcojęzyczne Korpusy języka polskiego Słowniki Sposoby gromadzenia danych...
Spis treści 1 Wstęp 11 1.1 Do kogo adresowana jest ta książka... 12 1.2 Historia badań nad mową i językiem... 12 1.3 Obecne główne trendy badań... 16 1.4 Opis zawartości rozdziałów... 18 2 Wyzwania i możliwe
Bardziej szczegółowoPARAMETRYZACJA SYGNAŁU MOWY. PERCEPTUALNE SKALE CZĘSTOTLIWOŚCI.
1 PARAMETRYZACJA SYGNAŁU MOWY. PERCEPTUALNE SKALE CZĘSTOTLIWOŚCI. mgr inż. Kuba Łopatka Katedra Systemów Multimedialnych p. 628, tel. 348-6332 PLAN WYKŁADU 1. Potrzeba i istota parametryzacji 2. Klasyfikacja
Bardziej szczegółowoNazwa handlowa / Producent / Nr katalogowy
Lp. Nazwa i opis przedmiotu zamówienia Nazwa handlowa / Producent / Nr katalogowy Ilość Wartość bez VAT VAT w zł oraz % Wartość z VAT 1. Liczba kanałów 1 (1 przetworniki A / D) Architektura Delta-Sigma
Bardziej szczegółowoAnalogowa (para miedziana, radio, walkie-talkie, CB) Cyfrowa (ISDN, GSM, VoIP, DRB, DVB, Tetra, )
Transmisja mowy Analogowa (para miedziana, radio, walkie-talkie, CB) Modulacje: amplitudowa (AM), częstotliwościowa (FM), fazowa (PM) Wysokie zapotrzebowanie na pasmo (np. AM df>2f) Niska sprawność energetyczna
Bardziej szczegółowoKompresja sekwencji obrazów - algorytm MPEG-2
Kompresja sekwencji obrazów - algorytm MPEG- Moving Pictures Experts Group (MPEG) - 988 ISO - International Standard Organisation CCITT - Comité Consultatif International de Téléphonie et TélégraphieT
Bardziej szczegółowoStandard DVD-Video. W³aœciwoœæ Laserdisc Video CD SVCD DVD-Video
Standard DVD-Video 1. Porównanie jakości formatów Video Standard DVD-Video opracowano po to, aby na jednej płycie o wymiarach płyty CD móc zapisać co najmniej dwie godziny wysokiej jakości cyfrowego sygnału
Bardziej szczegółowoPrzedmowa Wykaz oznaczeń Wykaz skrótów 1. Sygnały i ich parametry 1 1.1. Pojęcia podstawowe 1 1.2. Klasyfikacja sygnałów 2 1.3.
Przedmowa Wykaz oznaczeń Wykaz skrótów 1. Sygnały i ich parametry 1 1.1. Pojęcia podstawowe 1 1.2. Klasyfikacja sygnałów 2 1.3. Sygnały deterministyczne 4 1.3.1. Parametry 4 1.3.2. Przykłady 7 1.3.3. Sygnały
Bardziej szczegółowoKwantyzacja wektorowa. Kodowanie różnicowe.
Kwantyzacja wektorowa. Kodowanie różnicowe. Kodowanie i kompresja informacji - Wykład 7 12 kwietnia 2010 Kwantyzacja wektorowa wprowadzenie Zamiast kwantyzować pojedyncze elementy kwantyzujemy całe bloki
Bardziej szczegółowoHDV18A. Cyfrowy dekoder audio Podręcznik użytkownika
Cyfrowy dekoder audio Podręcznik użytkownika HDV18A Dziękujemy za zakup produktu. W celu zachowania optymalnej wydajności i bezpieczeństwa prosimy o zapoznanie się z poniższą instrukcją. Spis treści: I:
Bardziej szczegółowoBiometryczna Identyfikacja Tożsamości
c Adam Czajka IAiIS PW 20 maja 2014 1/39 Adam Czajka Wykład na Wydziale Elektroniki i Technik Informacyjnych Politechniki Warszawskiej Semestr letni 2014 c Adam Czajka IAiIS PW 20 maja 2014 2/39 Rozpoznawanie
Bardziej szczegółowoPrzedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2.
Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2. Technika obrazu 24 W.3. Normalizacja w zakresie obrazu cyfrowego
Bardziej szczegółowoPodstawy transmisji multimedialnych podstawy kodowania dźwięku i obrazu Autor Wojciech Gumiński
Podstawy transmisji multimedialnych podstawy kodowania dźwięku i obrazu Autor Wojciech Gumiński Podstawy transmisji multimedialnych Plan wykładu Wprowadzenie 1. Wprowadzenie 2. Ilość informacji 3. Kodowanie
Bardziej szczegółowoSemantyczne kodowanie mowy przy bardzo małych prędkościach transmisji.
POLITECHNIKA POZNAŃSKA WYDZIAŁ ELEKTRONIKI I TELEKOMUNIKACJI KATEDRA TELEKOMUNIKACJI MULTIMEDIALNEJ I MIKROELEKTRONIKI Semantyczne kodowanie mowy przy bardzo małych prędkościach transmisji. Damian Modrzyk
Bardziej szczegółowoProjektowanie układów scalonych do systemów komunikacji bezprzewodowej
Projektowanie układów scalonych do systemów komunikacji bezprzewodowej Część 1 Dr hab. inż. Grzegorz Blakiewicz Katedra Systemów Mikroelektronicznych Politechnika Gdańska Ogólna charakterystyka Zalety:
Bardziej szczegółowoKOMPRESJA STRATNA DŹWIĘKU
ZESZYTY NAUKOWE 39-58 Leszek Grad 1 KOMPRESJA STRATNA DŹWIĘKU Streszczenie W artykule przedstawione zostały elementarne wiadomości z zakresu kompresji stratnej dźwięku. Przedstawiony został liniowy model
Bardziej szczegółowoJęzyki Modelowania i Symulacji
Języki Modelowania i Symulacji Przetwarzanie sygnałów fonicznych Marcin Ciołek Katedra Systemów Automatyki WETI, Politechnika Gdańska 3 listopada 211 O czym będziemy mówili? 1 2 wavrecord wavplay y = wavrecord(n,
Bardziej szczegółowoProgram wykładu. informatyka + 2
Program wykładu 1. Jak słyszymy podstawy fizyczne i psychofizyczne, efekty maskowania 2. Sposoby zapisu sygnałów dźwiękowych 3. Sposoby kodowania sygnałów dźwiękowych ze szczególnym uwzględnieniem MP3
Bardziej szczegółowoWykład II. Reprezentacja danych w technice cyfrowej. Studia Podyplomowe INFORMATYKA Podstawy Informatyki
Studia Podyplomowe INFORMATYKA Podstawy Informatyki Wykład II Reprezentacja danych w technice cyfrowej 1 III. Reprezentacja danych w komputerze Rodzaje danych w technice cyfrowej 010010101010 001010111010
Bardziej szczegółowoPrzykładowe zadanie praktyczne
Przykładowe zadanie praktyczne Opracuj projekt realizacji prac związanych z uruchomieniem i testowaniem kodera i dekodera PCM z układem scalonym MC 145502 zgodnie z zaleceniami CCITT G.721 (załączniki
Bardziej szczegółowoSystemy multimedialne. Instrukcja 5 Edytor audio Audacity
Systemy multimedialne Instrukcja 5 Edytor audio Audacity Do sprawozdania w formacie pdf należy dołączyc pliki dźwiękowe tylko z podpunktu 17. Sprawdzić poprawność podłączenia słuchawek oraz mikrofonu (Start->Programy->Akcesoria->Rozrywka->Rejestrator
Bardziej szczegółowoPolitechnika Krakowska im. Tadeusza Kościuszki. Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2014/2015
Politechnika Krakowska im. Tadeusza Kościuszki Karta przedmiotu Wydział Inżynierii Lądowej obowiązuje studentów rozpoczynających studia w roku akademickim 01/015 Kierunek studiów: Transport Forma sudiów:
Bardziej szczegółowoANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU
ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU i klasyfikacja sygnału audio dr inż. Jacek Naruniec Sygnał mowy mózg (układ sterujący) głośnia (źródło dźwięku) rezonator akustyczny (filtr) sygnał mowy 2 Sygnał mowy
Bardziej szczegółowoCENNIK DETALICZNY styczeń Polpak Poland Sp. z o.o. Al. Jerozolimskie 333A Reguły k/warszawy.
CENNIK DETALICZNY styczeń 2017 Polpak Poland Sp. z o.o. Al. Jerozolimskie 333A 05-816 Reguły k/warszawy biuro@polpak.com.pl (22) 353-14-14 wzmacniacze MCA-20 Wielokanałowa końcówka mocy Wejścia analogowe:
Bardziej szczegółowoPrzygotowali: Bartosz Szatan IIa Paweł Tokarczyk IIa
Przygotowali: Bartosz Szatan IIa Paweł Tokarczyk IIa Dźwięk wrażenie słuchowe, spowodowane falą akustyczną rozchodzącą się w ośrodku sprężystym (ciele stałym, cieczy, gazie). Częstotliwości fal, które
Bardziej szczegółowoNeurobiologia na lekcjach informatyki? Percepcja barw i dźwięków oraz metody ich przetwarzania Dr Grzegorz Osiński Zakład Dydaktyki Fizyki IF UMK
Neurobiologia na lekcjach informatyki? Percepcja barw i dźwięków oraz metody ich przetwarzania Dr Grzegorz Osiński Zakład Dydaktyki Fizyki IF UMK IV Konferencja Informatyka w Edukacji 31.01 01.02. 2007
Bardziej szczegółowoCENNIK DETALICZNY styczeń Polpak Poland Sp. z o.o. Al. Jerozolimskie 333A Reguły k/warszawy.
CENNIK DETALICZNY styczeń 2017 Polpak Poland Sp. z o.o. Al. Jerozolimskie 333A 05-816 Reguły k/warszawy?biuro@polpak.com.pl (22) 353-14-14 Kino Domowe 2 wzmacniacze MCA-20 Wielokanałowa końcówka mocy Wejścia
Bardziej szczegółowoSystemy i Sieci Radiowe
Systemy i Sieci Radiowe Wykład 2 Wprowadzenie część 2 Treść wykładu modulacje cyfrowe kodowanie głosu i video sieci - wiadomości ogólne podstawowe techniki komutacyjne 1 Schemat blokowy Źródło informacji
Bardziej szczegółowoRekompresja DVD do AVI z dźwiękiem MP3 5.1 Aud-X w programie Gordian Knot. Wstęp
Rekompresja DVD do AVI z dźwiękiem MP3 5.1 Aud-X w programie Gordian Knot Wstęp Aud-X 5.1 Surround Codec służy do zapisu dźwięku wielokanałowego w plikach AVI, w sposób dużo efektywniejszy niż oryginalny
Bardziej szczegółowodr inż. Jacek Naruniec
dr inż. Jacek Naruniec Przetwarzanie wstępne Wyznaczenie obszarów zainteresowania Ekstrakcja cech - dźwięk Klasyfikacja detekcja mowy okno analizy spektrogram filtr preemfazy wokodery (formantów, kanałowe,
Bardziej szczegółowoPROGRAMOWANIE APLIKACJI MULTIMEDIALNYCH
PROGRAMOWANIE APLIKACJI MULTIMEDIALNYCH PRZETWARZANIE OBRAZÓW I DŹWIĘKÓW wykład 6 KOMPRESJA SYGNAŁÓW AKUSTYCZNYCH Prowadzący: Tomasz Kowalski Natura i percepcja dźwięków 2 Dźwięk - zarówno mowa, jak i
Bardziej szczegółowoPrzetwornik analogowo-cyfrowy
Przetwornik analogowo-cyfrowy Przetwornik analogowo-cyfrowy A/C (ang. A/D analog to digital; lub angielski akronim ADC - od słów: Analog to Digital Converter), to układ służący do zamiany sygnału analogowego
Bardziej szczegółowoModulacja i kodowanie laboratorium. Modulacje Cyfrowe: Kluczowanie Amplitudy (ASK)
Modulacja i kodowanie laboratorium Modulacje Cyfrowe: Kluczowanie Amplitudy (ASK) Celem ćwiczenia jest opracowanie algorytmu modulacji i dekodowania dla metody kluczowania amplitudy Amplitude Shift Keying
Bardziej szczegółowoWydział Elektryczny. Katedra Telekomunikacji i Aparatury Elektronicznej. Instrukcja do pracowni specjalistycznej
Politechnika Białostocka Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej Instrukcja do pracowni specjalistycznej Temat ćwiczenia: Numer ćwiczenia: 1-2 Badanie wybranych własności
Bardziej szczegółowoADAPTACYJNE PRZETWARZANIE SYGNAŁÓW LABORATORIUM. Ćwiczenie 4. Wybrane telekomunikacyjne zastosowania algorytmów adaptacyjnych
ADAPTACYJNE PRZETWARZANIE SYGNAŁÓW LABORATORIUM Ćwiczenie 4 Wybrane telekomunikacyjne zastosowania algorytmów adaptacyjnych 1. CEL ĆWICZENIA Celem niniejszego ćwiczenia jest zapoznanie studentów z dwoma
Bardziej szczegółowoAnaliza sygnału mowy pod kątem rozpoznania mówcy chorego. Anna Kosiek, Dominik Fert
Analiza sygnału mowy pod kątem rozpoznania mówcy chorego Anna Kosiek, Dominik Fert Wstęp: Analiza sygnału akustycznego była wykorzystywana w medycynie jeszcze przed wykorzystaniem jej w technice. Sygnał
Bardziej szczegółowoO sygnałach cyfrowych
O sygnałach cyfrowych Informacja Informacja - wielkość abstrakcyjna, która moŝe być: przechowywana w pewnych obiektach przesyłana pomiędzy pewnymi obiektami przetwarzana w pewnych obiektach stosowana do
Bardziej szczegółowoWprowadzenie do cyfrowej obróbki dźwięku
Wprowadzenie do cyfrowej obróbki dźwięku Na czym polega kompresja plików audio? Zapis dźwięku w formacie cyfrowym polega na zapisaniu kształtu sygnału w postaci ciągu liczb. Procedura powyższa nazywana
Bardziej szczegółowoAudio i video. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski
Audio i video R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski s-rg@siwy.il.pw.edu.pl Fale dźwiękowe Dźwięk jest drganiem powietrza rozchodzącym się w postaci fali. Fala ma określoną amplitudę i częstotliwość.
Bardziej szczegółowo(12) TŁUMACZENIE PATENTU EUROPEJSKIEGO (19) PL (11) PL/EP (96) Data i numer zgłoszenia patentu europejskiego:
RZECZPOSPOLITA POLSKA (12) TŁUMACZENIE PATENTU EUROPEJSKIEGO (19) PL (11) PL/EP 1869673 (96) Data i numer zgłoszenia patentu europejskiego: 03.04.2006 06740355.0 (13) (51) T3 Int.Cl. G10L 21/04 (2006.01)
Bardziej szczegółowoMatrycowy przełącznik sygnału HDMI z portami 4 x 2
Matrycowy przełącznik sygnału HDMI z portami 4 x 2 INSTRUKCJA OBSŁUGI DS-48300 Dziękujemy za zakup niniejszego produktu. Aby zapewnić optymalne działanie oraz bezpieczeństwo, należy uważnie przeczytać
Bardziej szczegółowoCENNIK DETALICZNY styczeń Polpak Poland Sp. z o.o. Al. Jerozolimskie 333A Reguły k/warszawy.
CENNIK DETALICZNY styczeń 2018 Polpak Poland Sp. z o.o. Al. Jerozolimskie 333A 05-816 Reguły k/warszawy?biuro@polpak.com.pl (22) 353-14-14 Kino Domowe 2 wzmacniacze MCA-20 Wielokanałowa końcówka mocy Wejścia
Bardziej szczegółowoPrzykładowe rozwiązanie zadania dla zawodu technik telekomunikacji
PROJEKT REALIZACJI PRAC ZWIĄZANYCH Z URUCHOMIENIEM I TESTOWANIEM KODERA I DEKODERA PCM ORAZ WYKONANIE PRAC OBEJMUJĄCYCH OPRACOWANIE WYNIKÓW POMIARÓW Z URUCHOMIENIA I SPRAWDZENIA DZIAŁANIA JEGO CZĘŚCI CYFROWEJ
Bardziej szczegółowoZakres wymaganych wiadomości do testów z przedmiotu Metrologia. Wprowadzenie do obsługi multimetrów analogowych i cyfrowych
Zakres wymaganych wiadomości do testów z przedmiotu Metrologia Ćwiczenie 1 Wprowadzenie do obsługi multimetrów analogowych i cyfrowych budowa i zasada działania przyrządów analogowych magnetoelektrycznych
Bardziej szczegółowoAutomatyczne rozpoznawanie mowy. Autor: mgr inż. Piotr Bratoszewski
Automatyczne rozpoznawanie mowy Autor: mgr inż. Piotr Bratoszewski Rys historyczny 1930-1950 pierwsze systemy Automatycznego rozpoznawania mowy (ang. Automatic Speech Recognition ASR), metody holistyczne;
Bardziej szczegółowoARKUSZ EGZAMINACYJNY ETAP PRAKTYCZNY EGZAMINU POTWIERDZAJĄCEGO KWALIFIKACJE ZAWODOWE CZERWIEC 2011
Zawód: technik urządzeń audiowizualnych Symbol cyfrowy zawodu: 313[04] Numer zadania: 1 Arkusz zawiera informacje prawnie chronione do momentu rozpoczęcia egzaminu 313[04]-01-112 Czas trwania egzaminu:
Bardziej szczegółowo