Kodowanie podpasmowe Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania
Zasada ogólna Rozkład sygnału źródłowego na części składowe (jak w kodowaniu transformacyjnym) Wada kodowania transformacyjnego sztuczny podział na bloki. Problemy z rekonstrukcją na krawędziach bloków Tutaj: sposób rozdziału rozkład na róŝne pasma częstotliwościowe za pomocą filtrów cyfrowych Kodowanie kaŝdego pasma oddzielnie Główny obszar zastosowań: kodowanie mowy (G.722), dźwięku (MPEG audio)
Filtry Filtry układy słuŝące wyodrębnieniu składowych o odpowiednich częstotliwościach Charakterystyka filtra funkcja przenoszenia modułu Rodzaje filtrów: Dolnoprzepustowe Górnoprzepustowe Środkowoprzepustowe Filtry cyfrowe działają na ciągi liczb (zwykle są to próbki sygnału ciągłego). Minimalna wymagana częstość próbkowania Uogólnione tw. Nyquista: aby odtworzyć dokładnie sygnał, który zawiera składowe o częstotliwościach pomiędzy f 1 a f 2 naleŝy go próbkować z częstością 2* f f f p ( ) 2 1
Kodowanie podpasmowe algorytm
Koder Kodowanie podpasmowe działanie Sygnał wejściowy wchodzi na bank filtrów analizujących rozkład na podpasma Podpróbkowanie w stosunku (szerokość całego pasma):(szerokość podpasma) Zgodne z reguła Nyquista Ogranicza całkowitą ilość próbek Kodowane podpasm Mechanizm kodowania (DPCM, ADPCM, kwantyzacja; VLC) Sposób rozdziału bitów Przesyłanie zakodowanego sygnału
Kodowanie podpasmowe działanie c.d. Dekoder Dekodowanie w podpasmach Uzupełnianie (wstawienie odpowiedniej ilości zer pomiędzy próbkami) Podanie na filtry syntetyczne Sumowanie zrekonstruowanych sygnałów podpasm
Percepcja dźwięku Podstawowe fakty Zakres słyszalności: 20 Hz 20 khz, największa czułość w zakresie 2 4 khz Czułość na dźwięk jest funkcją częstotliwości Człowiek przetwarza dźwięk w pewnych podpasmach, zwanych pasmami krytycznymi. Cały zakres akustyczny około 24 pasm krytycznych Szerokość pasma krytycznego stała dla małych, rośnie dla częstości > 500 Hz
Maskowanie Polega na przesłanianiu wraŝenia brzmienia dźwięków przez inne sąsiadujące w dziedzinie częstotliwości lub czasu. Maskowanie jednoczesne (częstotliwościowe) Silniejszy dźwięk zakłóca współbrzmiące słabsze dźwięki o zbliŝonych częstotliwościach Efekt tym większy im mniejsza separacja w częstotliwości
Maskowanie c.d. Maskowanie niejednoczesne (czasowe) silny dźwięk maskuje inne juŝ poza jego czasem trwania Premasking moŝe trwać kilka kilkanaście milisekund Postmasking do 200 ms Premasking mocniejsze dźwięki są przetwarzane szybciej niŝ słabsze Postmasking wysycenie, długi czas relaksacji neuronów
Maskowanie c.d. Łączne działanie obu typów maskowania Maskowanie pozwala na opuszczenie części danych bez szkody dla jakości dźwięku Łączny opis progu czułości jako funkcji częstotliwości oraz wpływu maskowania model psychoakustyczny.
Standard MPEG Opracowany na początku lat 90-tych jako standard kodowania video Zawiera definicję standardu kodowania audio trzy odmiany (warstwy) o coraz większej złoŝoności Działanie oparte na: Kodowaniu podpasmowym Modelu psychoakustycznym słyszenia (przydział bitów)
MPEG audio - działanie Dopuszcza sygnał wejściowy próbkowanych 32, 44.1 lub 48 khz Pozwala na obsługę 1 lub 2 kanałów audio w trybach: mono, dual-mono, joint-stereo, stereo Sekwencja przetwarzania sygnału Podział na ramki po 384 (warstwa 1) lub 3 x 384 (warstwa 2 i 3) próbki Skierowanie na bank 32 filtrów analizujących podział na 32 podpasma Dzisiątkowanie sygnału ramka elementarna w podpaśmie zawiera 12 próbek Zastosowanie modelu psychoakustycznego wyliczenie maskowania oraz progów kwantyzacji w kaŝdym z podpasm Kwantyzacja i kodowanie entropijne sygnału podpasm, uformowanie strumienia bitowego
MPEG audio działanie c.d. Działanie modelu psychoakustycznego: Niech po podziale na podpasma poziomy pierwszych podpasm wynoszą: Nr 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Poziom[dB] 0 8 12 10 6 2 10 60 35 20 15 2 3 5 3 1 Pasmo 8 poziom 60 db daje maskowanie: kanał 7 12 db, kanał 9 15 db Poziom w kanale 7 równy 10 db (< 12 db) kanał 7 moŝna pominąć Poziom w kanale 9 równy 35 db (> 15 db). Poziom maskowania wyznacza szerokość przedziału kwantyzacji do zakodowania efektywnie tylko 20 db; to wymaga 20 db/6 db/bit 4 bity (zamiast 6 bitów bez uwzględniania maskowania).
Warstwa 1 Warstwy MPEG-1 Filtry typu DCT, równy podział w częstotliwości Na filtr jest podawana 1 ramka jednocześnie ( ok. 8 msek) Tylko maskowanie jednoczesne Daje jakość CD dla bitrate 384 kbps (kompresja 4:1) Warstwa 2 Podaje na filtr 3 ramki jednocześnie (1152 próbek) Pozwala na uwzględnienie pewnych elementów maskowania czasowego Daje jakość CD dla bitrate 256 kbps (kompresja 6:1) Warstwa 3 (MP3) Lepsze filtry (nierównomierne w częstotliwości, zbliŝone do pasm krytycznych Model psychoakustyczny zawiera maskowanie czasowe Stosuje kodowanie Huffmana wyjść kwantyzatorów Daje jakość CD dla bitrate 128 kbps (kompresja 12:1)