Kwantowanie sygnałów analogowych na przykładzie sygnału mowy

Podobne dokumenty
Wydział Elektryczny. Katedra Telekomunikacji i Aparatury Elektronicznej. Instrukcja do pracowni specjalistycznej

KOMPRESJA STRATNA SYGNAŁU MOWY. Metody kompresji stratnej sygnałów multimedialnych: Uproszczone modelowanie źródeł generacji sygnałów LPC, CELP

dr hab. inż. Artur Janicki pok. 407 Zakład Cyberbezpieczeństwa Instytut Telekomunikacji PW

dr inż. Artur Janicki pok. 414 Zakład Systemów Teletransmisyjnych Instytut Telekomunikacji PW

Wybrane algorytmu kompresji dźwięku

METODY KODOWANIA SYGNAŁU MOWY DO ZASTOSOWAŃ W TELEKOMUNIKACJI

Kwantyzacja wektorowa. Kodowanie różnicowe.

Analogowa (para miedziana, radio, walkie-talkie, CB) Cyfrowa (ISDN, GSM, VoIP, DRB, DVB, Tetra, )

MODULACJE IMPULSOWE. TSIM W10: Modulacje impulsowe 1/22

Przetwarzanie sygnałów w telekomunikacji

KODOWANIE I KOMPRESJA SYGNAŁU MOWY

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania

Podstawy transmisji multimedialnych podstawy kodowania dźwięku i obrazu Autor Wojciech Gumiński

Przetwarzanie analogowo-cyfrowe sygnałów

Kompresja dźwięku w standardzie MPEG-1

Kompresja danych DKDA (7)

Rozpoznawanie i synteza mowy w systemach multimedialnych. Analiza i synteza mowy - wprowadzenie. Spektrogram wyrażenia: computer speech

Przetwarzanie i transmisja danych multimedialnych. Wykład 9 Kodowanie podpasmowe. Przemysław Sękalski.

Przetwarzanie i transmisja danych multimedialnych. Wykład 6 Metody predykcyjne. Przemysław Sękalski.

Systemy plezjochroniczne (PDH) synchroniczne (SDH), Transmisja w sieci elektroenergetycznej (PLC Power Line Communication)

Podstawowe funkcje przetwornika C/A

Wybrane metody kompresji obrazów

Sprawdzian wiadomości z jednostki szkoleniowej M3.JM1.JS3 Użytkowanie kart dźwiękowych, głośników i mikrofonów

Próbkowanie sygnałów (ang. sampling) PRZETWARZANIE SYGNAŁÓW ANALOGOWYCH NA SYGNAŁY CYFROWE. Literatura. Cyfrowe Przetwarzanie Sygnałów

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania

Technika audio część 2

Jakości usług telekomunikacyjnych

JAKOŚĆ USŁUG TELEKOMUNIKACYJNYCH. Sławomir Kula Przemysław Dymarski Marcin Golański

Wykład VI. Dźwięk cyfrowy. dr inż. Janusz Słupik. Gliwice, Wydział Matematyki Stosowanej Politechniki Śląskiej. c Copyright 2014 Janusz Słupik

1. Kodowanie PCM 1.1 Informacje podstawowe

Pomiary w technice studyjnej. TESTY PESQ i PEAQ

Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2.

Technika audio część 1

Teoria przetwarzania A/C i C/A.

Przetwornik analogowo-cyfrowy

Instytut Telekomunikacji Wydział Elektroniki i Technik Informacyjnych.

MODULACJA. Definicje podstawowe, cel i przyczyny stosowania modulacji, rodzaje modulacji. dr inż. Janusz Dudczyk

Fundamentals of Data Compression

Wykład II. Reprezentacja danych w technice cyfrowej. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

Konwersja dźwięku analogowego do postaci cyfrowej

Kwantyzacja wektorowa. Plan 1. Zasada działania 2. Projektowanie. Algorytm LBG 3. Kwantyzatory strukturalne 4. Modyfikacje

dr inż. Piotr Odya Parametry dźwięku zakres słyszanych przez człowieka częstotliwości: 20 Hz - 20 khz; 10 oktaw zakres dynamiki słuchu: 130 db

WPŁYW PRÓBKOWANIA I KWANTYZACJI NA JAKOŚĆ DŹWIĘKU

Instytut Telekomunikacji Wydział Elektroniki i Technik Informacyjnych.

Sygnały, media, kodowanie

4 Zasoby językowe Korpusy obcojęzyczne Korpusy języka polskiego Słowniki Sposoby gromadzenia danych...

Pomiary i przyrządy cyfrowe

O sygnałach cyfrowych

Przygotowali: Bartosz Szatan IIa Paweł Tokarczyk IIa

Sztuczne sieci neuronowe. Krzysztof A. Cyran POLITECHNIKA ŚLĄSKA Instytut Informatyki, p. 335

Micha Strzelecki Metody przetwarzania i analizy obrazów biomedycznych (2)

Kodowanie i kompresja Streszczenie Studia dzienne Wykład 12,

Kodowanie podpasmowe

Sygnał a informacja. Nośnikiem informacji mogą być: liczby, słowa, dźwięki, obrazy, zapachy, prąd itp. czyli różnorakie sygnały.

Przetwarzanie sygnałów z zastosowaniem procesorów sygnałowych - opis przedmiotu

Systemy i Sieci Radiowe

Formaty - podziały. format pliku. format kompresji. format zapisu (nośnika) kontener dla danych WAV, AVI, BMP

1.5. Sygnały. Sygnał- jest modelem zmian w czasie pewnej wielkości fizycznej lub stanu obiektu fizycznego

Badanie jakości sygnałów audio

mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 1, strona 1.

KWANTYZACJA. kwantyzacja

Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j

2. STRUKTURA RADIOFONICZNYCH SYGNAŁÓW CYFROWYCH

Audio i video. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski

KOMPRESJA STRATNA DŹWIĘKU

Andrzej Leśnicki Laboratorium CPS Ćwiczenie 9 1/5 ĆWICZENIE 9. Kwantowanie sygnałów

ADAPTACYJNE PRZETWARZANIE SYGNAŁÓW LABORATORIUM. Ćwiczenie 4. Wybrane telekomunikacyjne zastosowania algorytmów adaptacyjnych

5/25/2017. Elementy teorii informacji. Co to jest informacja? Słownik Języka Polskiego: Elementy teorii informacji

Podstawy telekomunikacji. Kolokwium nr 2. Zagadnienia.

DŹWIĘK. Dźwięk analogowy - fala sinusoidalna. Dźwięk cyfrowy 1-bitowy 2 możliwe stany fala jest mocno zniekształcona

Cechy karty dzwiękowej

Przetwarzanie analogowocyfrowe

Przykładowe zadanie praktyczne

PROGRAMOWANIE APLIKACJI MULTIMEDIALNYCH

Rys. Podstawowy system przetwarzania cyfrowego sygnałów analogowych

Kodowanie i kompresja Streszczenie Studia Licencjackie Wykład 11,

Percepcja dźwięku. Narząd słuchu

Dźwięk podstawowe wiadomości technik informatyk

Akwizycja i przetwarzanie sygnałów cyfrowych

Kompresja Danych. Streszczenie Studia Dzienne Wykład 13, f(t) = c n e inω0t, T f(t)e inω 0t dt.

Sygnały otaczającego nas świata mają postać analogową.

Wymiana i Składowanie Danych Multimedialnych Mateusz Moderhak, EA 106, Pon. 11:15-12:00, śr.

WIDMO, ELEMENTY SKŁADOWE DŹWIĘKU, ZAPIS DŹWIĘKU, SYNTEZA ADDYTYWNA

Spis treści. 1. Cyfrowy zapis i synteza dźwięku Schemat blokowy i zadania karty dźwiękowej UTK. Karty dźwiękowe. 1

Teletransmisyjne systemy cyfrowe

Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści

Modulacja i kodowanie laboratorium. Modulacje Cyfrowe: Kluczowanie Amplitudy (ASK)

Zjawisko aliasingu. Filtr antyaliasingowy. Przecieki widma - okna czasowe.

Optymalizacja kodera mowy standardu LPC-10

2. Próbkowanie Sygnały okresowe (16). Trygonometryczny szereg Fouriera (17). Częstotliwość Nyquista (20).

Sieci neuronowe - projekt

Przykładowe rozwiązanie zadania dla zawodu technik telekomunikacji

58. Otwarte Seminarium z Akustyki, OSA '11, Gdańsk-Jurata, September 2011

Kompresja sekwencji obrazów - algorytm MPEG-2

Zaawansowane algorytmy DSP

KOMPUTEROWE SYSTEMY POMIAROWE

Podstawy kompresji stratnej+kwantyzacja

PODSTAWY TELEKOMUNIKACJI Egzamin I (za każde polecenie - 6 punktów)

mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 4, strona 1. GOLOMBA I RICE'A

1 ALGORYTMY KODOWANIA ŹRÓDŁOWEGO MOWY

Transkrypt:

Kwantowanie sygnałów analogowych na przykładzie sygnału mowy Treść wykładu: Sygnał mowy i jego właściwości Kwantowanie skalarne: kwantyzator równomierny, nierównomierny, adaptacyjny Zastosowanie w koderze PCM G.711 Kwantowanie wektorowe Kodowanie różnicowe, predykcja, kodery ADPCM Kodery telefonii komórkowej (CELP) Wokoder predykcyjny Przemysław Dymarski, Instytut Telekomunikacji Politechniki Warszawskiej dymarski@tele.pw.edu.pl

Literatura: K.Sayood Kompresja danych wprowadzenie, Wyd. RM, W-wa 00 A.Drozdek Wprowadzenie do kompresji danych R.Tadeusiewicz "Sygnał mowy W.Skarbek MULTIMEDIA algorytmy i standardy kompresji T.P.Zieliński «Cyfrowe przetwarzanie sygnałów od teorii do zastosowań», WKiŁ, Warszawa 005 T.P.Zieliński «Cyfrowe przetwarzanie sygnałów w telekomunikacji», PWN, Warszawa 014

1. Sygnał mowy i jego modele Badanie jakości sygnału mowy

Sygnał mowy

Próbkowanie sygnału analogowego Claude Shannon 1916-001 Próbkowanie idealne Harry Nyquist 1889-1976 Próbkowanie chwilowe Vladimir Kotelnikov 1908-005 Tw. o próbkowaniu (Shannon, Nyquist, Kotelnikow): Próbkowanie jest procesem bezstratnym (można odzyskać sygnał analogowy bez zniekształceń), jeśli częstotliwość próbkowania (tzn. liczba próbek na sekundę) jest większa niż B, gdzie B jest szerokością pasma sygnału analogowego. fs 1 B T

Ocena jakości mowy: metody subiektywne (odsłuchowe) MOS mean opinion score (oceny od 1 do 5) Wyrazistość logatomowa (%) = odtworzenie ze słuchu krótkich słów pozbawionych semantycznego znaczenia, np. tra, bru zastosowanie zdań nieprzewidywalnych semantycznie (SUS - Semantically Unpredictable Sentences), np. Umysł ugrzązł podczas marsowego wiadra

Metody obiektywne: SNR jako najprostszy obiektywny wskaźnik jakości

Metody obiektywne: SNR w ujęciu segmentowym

Maskowanie szumu widmo sygnału widmo szumu Metody obiektywne uwzględniające maskowanie: - PESQ (ITU-T P.86) - POLQA (ITU-T P.863) Wynik: MOS w skali 1-5

Kwantyzacja skalarna {x n } - zbiór próbek, {x* n } próbki skwantowane y 1 y, x* n y L x n

Kwantyzacja skalarna {x n } - zbiór próbek, {x* n } próbki skwantowane y 1 y, x* n y L Kwantyzacja jest procesem stratnym x n

Kwantyzacja równomierna Zwiększenie rozdzielczości o 1 bit na próbkę: -> podwojenie liczby poziomów -> -krotne zmniejszenie amplitudy błędu kwantyzacji -> 4-krotne zmniejszenie mocy błędu kwantyzacji 1 e -> 4-krotne (o 6 db) zwiększenie SNR 1 x e x SNR 3 L z 103 [ db] 0log10 z 10log10 SNR[ db] 10log x L (gdy nie ma przesterowania) Zasada 6 db/bit 1 z 1 z ( ) 1 L 3 L

Charakterystyki kwantyzatora równomiernego

Kwantyzacja nierównomierna (logarytmiczna) Zasada logarytmiczna: (x) proporcjonalne do x Zasady logarytmicznej nie można stosować dla x~0 gdyż wymagałoby to użycia nieskończonej liczby poziomów kwantyzacji. Z tego względu dla sygnałów o małej amplitudzie kwantyzator logarytmiczny przechodzi w równomierny (stosowane są dwa algorytmy: A i µ). Pociąga to za sobą spadek SNR dla tych sygnałów. Kwantyzatory logarytmiczne A i µ stosowane są w najpopularniejszym standardzie PCM G.711 (pasmo sygnału mowy 300-3400 Hz, częstotliwość próbkowania 8 khz, L=56 poziomów kwantyzacji, n=8 bitów na próbkę, przepływność binarna 64 kbit/s)

Charakterystyki kwantyzatorów a) równomierny b) logarytmiczny typu A c) logarytmiczny typu µ d) optymalny dla sygnału o mocy -5 db

Kwantyzacja adaptacyjna Zakres pracy z podąża za amplitudą sygnału 1. Adaptacja w przód (MPEG Audio) brak przesterowań opóźnienie przesyłanie z

Kwantyzacja adaptacyjna. Adaptacja wstecz (ADPCM) np. kwantyzator 4-poziomowy przesterowania brak opóźnień nie przesyła się z

Kwantyzator wektorowy VQ - vector quantizer P(f 1 ),...,P(f L ): komórki Voronoi a Georgij Voronij

Kwantyzator wektorowy VQ - vector quantizer xp( f ) x* f j j Przewaga VQ nad kwantyzatorem skalarnym: - wykorzystanie korelacji między kolejnymi N próbkami - wykorzystanie właściwości wielowymiarowej gęstości prawdopodobieństwa próbek

ADPCM (adaptive differential pulse code modulation) Modulator x n p x n * n n x n n -sygnał wejściowy -sygnał różnicowy (błąd predykcji) * x n p x n * n -sygnał predykcji -skwantowany syg. różnicowy * x n -sygnał wyjściowy Demodulator * x n * n en * n n -błąd kwantyzacji p x n e n * n n x * n x n x * n x n e n

ADPCM (adaptive differential pulse code modulation) SNR G x x e e p SNR SNR[ db] G [ db] SNR [ db] p q q Gp x -zysk predykcji (zależy od predyktora) SNR q e -SNR kwantyzatora (w kwantyzatorze adaptacyjnym zależy głównie od liczby poziomów kwantyzacji L)

Kodery CELP (Code Excited Linear Prediction) na przykładzie G.78 filtr syntezy (predykcyjny) dekoder koder - Operacje na wektorach N=5 -wymiarowych (stąd opóźnienie 0.65ms) - Przesyła się indeks wybranego wektora (j) w 7 bitach i wzmocnienie g w 3 bitach. Razem 10 bitów na N=5 próbek, czyli bity na próbkę, co daje przepływność binarną 8000=16000 bit/s

Wokodery od kilkuset do około 400 bit/s d=1: mowa dźwięczna d=0: mowa bezdźwięczna T 0 - okres tonu krtaniowego (okres drgań strun głosowych) Można wyróżnić więcej klas pobudzeń:

Porównanie standardów kodowania mowy