Kodowanie transformacjne Plan. Zasada. Rodzaje transformacji 3. Standard JPEG
Zasada Zasada podstawowa: na danch wkonujem transformacje która: Likwiduje korelacje Skupia energi w kilku komponentach Kad z komponentów podlega kwantzacji i kodowaniu zgodnego z jego natur Najbardziej znana implementacja kodowanie stratne JPEG Ogóln schemat kodowania rsunek na nastpnej stronie
Ogóln schemat kodowania transformacjnego Transformacja T(x) Kwantzacja q Q() Kodowanie c C(q) Transf. Odwrotna X T - (Y) Dekwantzacja Y Q - (q) Dekodowanie q C - (c) T C odwracalne; Q nieodwracalna wprowadza zniekształcenia
Kodowanie transformacjne przkład wzrost 65 75 6 7 56 8 68 5 4 5 69 6 76 waga 7 88 5 7 3 3 6 8 53 48 4 64 Dane wkazuj korelacj: waga.5 wzrost Energia x + x - obie składowe istotne Przekształcenie likwidujce korelacje: 64 cos( α) sin( α) sin( α) x cos( α) x tan( α).5
Kodowanie transformacjne przkład c.d. 8 6 84 4 8 74 9 6 63 53 8 35 3 - -4-4 -6-7 -9-6 -9-5 Na wskutek transformacji: znika korelacja w danch energia zdominowana przez pierwsz składow Moem zaniedba drug składow i pomimo to uzska (prz rekonstrukcji) dobr aproksmacj danch
Kodowanie transformacjne przkład c.d. Rek. wzrost 68 75 6 68 53 8 65 45 34 6 6 57 67 5 Rek. waga 69 88 5 7 3 3 6 84 5 5 4 68 5 Dlaczego błd rekonstrukcji tak mał? Macierz A przekształcenia - unitarna. x wektor danch jego obraz; Y obraz po obciciu X rekonstrukcja obrazu po obciciu A x x A T Y A X X A T Y x X (x X) T (x X) ( Y) T A A T ( Y) ( Y) T ( Y) Uogólnienie: dłusze bloki danch odwracalna transformacja skupia wikszo energii (informacji) w kilku elementach moem zaniedba (lub kodowa mniej dokładnie) ubogie w informacje kompresja.
Główne etap procesu Transformacja Dzielim cig danch wejciowch na bloki o ustalonej długoci Kad z bloków oddzielnie poddajem odwracalnej transformacji W cigu przekształconm róne element maj róne własnoci statstczne (wkład do energii wariancja) Kwantzacja poddajem jej cig przekształcon Strategia kwantzacji zale od podanej redniej bitowej statstki rónch elementów efektu zniekształce współcznników przekształconego cigu na rekonstrukcj Mechanizm alokacji bitów Róne współcznniki mog b kodowane rónmi technikami Kodowanie binarne etkiet kwantzacji podlegaj jakiej metodzie kodowania binarnego (o stałej długoci Huffmana artmetczne).
Transformacje Ograniczam si do przekształce liniowch: n N i a n i xi A x Rozmiar N wzgld praktczne Wiksze N wiksza szansa na obcicie słabo zmiennch składowch wzrost złoonoci obliczeniowej (szbciej ni liniowo) moliwo zmian charakterstk sgnału wewntrz bloku Przekształcenie ortogonalne zachowanie norm A - A T A x (A x) T (A x) x T A T A x x T x x
Transformacje dwuwmiarowe Kodowanie transformacjne czsto uwane do kodowania obrazów. Obraz tablica dwuwmiarowa Ogólna transformacja liniowa bloku X (N x N): N i N j l k j i j i l k C X Y C macierz N x N Załoenie przekształcenie rozłczne: Y A A X A X A Y T T N i N j j l j i i k l k a X a Y Redukcja złoonoci obliczeniowej O(N 4 ) O(N 3 )
Transformacje c.d. Efektwno transformacji miara stopnia zagszczania energii. Moliw sposób pomiaru stosunek redniej artmetcznej wariancji współcznników do redniej geometrcznej: N N i i N i i TC N G / σ σ
Interpretacja przekształce Przekształcenia jednowmiarowe: Y A X X A T Y x x a a a a a a + a a Wnik: orginaln sgnał rozwijam w bazie kolumn macierz transponowanej (wiersz macierz transformacji). Współcznniki transformacji współcznniki tego rozwinicia. Przekształcenia dwuwmiarowe rozwinicie tablic sgnału w bazie macierz jeeli A[a a a... a N- ] macierz przekształcenia jednowmiarowego to macierz bazowa ij: b ij a i a j T
Interpretacja przekształce c.d. Przekształcenie dwuwmiarowe przkład A Macierze bazowe: b b b b T b b b b Y A A X + + + + + + + + +
Wane przekształcenia Przekształcenia Karhunena-Loevego (Hotellinga) KLT Zbudowane z wektorów własnch macierz autokorelacji R ij E[x n x n+ i-j ] Jest przekształceniem ortonormalnm Maksmalizuje G TC optmalne dla kodowania transformacjnego ALE: Zale od danch wliczenie skomplikowane Musi b wliczone dla kadego bloku oddzielnie KLT dla bloków -wmiarowch nie jest przekształceniem rozłcznm Autokorelacja nie jest znana odbiorc musi b przesłana dodatkowo KLT rzadko uwana w praktce bardziej popularne przekształcenia niezalene od danch
Wane przekształcenia c.d. Dskretne przekształcenie kosinusowe (DCT) a i j α i N ( j + ) iπ cos N α i dla i dla i > Kolejne wiersze coraz wsza czstotliwo (rsunek dla N8)
Wane przekształcenia c.d. Baza macierz dwuwmiarowch: Wzrost wariancji od b do b 77 : Własnoci DCT: Nie zale od danch Jest przekształceniem ortogonalnm Dla danch z du korelacj b. dobrze aproksmuje KLT Istniej efektwne sposob obliczania DCT (dla N8 zamiast 4 mnoe i 896 dodawa tlko 54 mnoe 464 dodawa i 6 przesuni
Wane przekształcenia c.d. DCT blisko zwizane z DFT i DST DST lepiej aproksmuje KLT dla małch korelacji DCT daje lepsze zagszczenie energii ni DFT dla wikszch korelacji
Alokacja bitów Ilo informacji niesiona przez róne współcznniki róna Sensownie jest przdzieli rón ilo bitów rónm współcznnikom Dwie metod: Na podstawie oszacowania wariancji współcznników Bez szacowania wariancji metoda progowa Ad.. Szacujem wariancje współcznników σ k Mam ustali ilo bitów R k przpisanch do poszczególnch współcznników b zminimalizowa zniekształcenie prz warunku (R podana rednia bitowa): R M M k R k
Alokacja bitów c.d. Zniekształcenie rekonstrukcji k-tego współcznnika zale od wariancji k-tego współcznnika i iloci poziomów kwantzacji N p. R k Warunek minimalizacja wraenia: J M M R k α σ λ MR R k k k Rozwizanie: R k R + log M ( σ ) i i σ Wnik niekoniecznie całkowit i dodatni gd R k ujemne kładziem zmniejszam równomiernie dodatnie współcznniki zaokrglam k / M k
Alokacja bitów c.d. Ad. Nie podejmujem deczji a priori na podstawie redniej statstki Specfikujem warto progowa jeeli współcznnik przekracza próg jest kwantzowan jeeli nie zaniedbwan Informacja o tm które współcznniki s zachowane przesłane jako informacja dodatkowa Szczególn przpadek kwantzacja stała w zerze
Standard JPEG Najbardziej znana metoda stratnej kompresji obrazów od 993 standard ISO Znakomita reprezentacja obrazów z bpp znona z.5 bpp Główne etap algortmu Tab. Huffmana Przesunicie poziomu 8 x 8 DCT Kwantzacja DC DPCM AC zigzac VLC VLC Tab. kwant Tab. Huffmana
Standard JPEG Kada ze składowch (RGB YIQ YUV) jest przetwarzana oddzielnie Krok pierwsz przesuwam warto piksela o p- (dla p8 o 8) Krok drugi podział na bloki o rozmiarze 8 x 8. Gd wmiar w którm kierunku nie jest wielokrotnoci 8 uzupełniam ostatni wiersz (kolumn) odpowiedni ilo raz. Wkonujem DCT Krok trzeci kwantzacja Kwantzacja stała w zerze Krok kwantzacji dla kadego współcznnika okrelon w tablic kwantzacji Q ij Przepis na kwantzacj l ij ij +. 5 Qij
Standard JPEG c.d. 56 57 58 58 55 58 59 56 5 5 5 5 5 5 48 5 39 39 39 4 4 43 4 43 5 7 8 3 9 8 7 7 4 4 5 6 5 5 4 4 3 4 6 8 9 9 8 7 9 5 4..3...9 -..5-3.4 -. -.5 -.8 -. -.6.4 5.5 4...5 -.3. -.8 -.5 -. 6..8 -.3 -.7 -.6.8 -.8 -.7-3.4. -...4 -.8 -.3. -5.7. -. -. -.5.3.8.3 37.8 -.5 -. -.6.4..3 4.6 -.4..8 -. -.4. -. 6.6 39.9 99 3 98 95 9 7 3 87 78 64 49 9 3 4 8 64 55 35 4 77 3 9 68 56 37 8 6 8 87 5 9 7 4 56 69 57 4 4 6 3 4 55 6 58 6 9 4 6 5 4 4 6 6 3-9
Standard JPEG c.d. Tabela kwantzacji oko ludzkie bardziej czułe na niskie czstoci ni na wsokie std taki dobór Q ij Sgnał DC wolno zmienn od bloku do bloku kodowanie DPCM. Rónice kodowane kodem Huffmana Sgnał AC zamienion na wektor o 63 składowch poprzez skanowanie zigzac
Standard JPEG c.d. Powstał wektor dua szansa na to e zawiera długie serie zer Gd kocowa sekwencja zawiera same zera wsłam smbol EOB po ostatnim niezerowm elemencie Wczeniejsze sekwencje kodujem jako Z/C gdzie Z liczba etkiet zerowch poprzedzajcch smbol za C kategoria smbolu niezerowego jaki mam zakodowa AC w naszm przkładzie: -9 3... Sekwencje Z/C kodujem wkorzstujc ustalone tablice kodowania Huffmana Zakodowanie całej sekwencji (DC i AC) naszego bloku wmaga 8 bitów czli 9/3 bpp.
Standard JPEG c.d. 3 3 9 9-8 9 8 8 8 4 9 9 8 7 7 4 4 3 3 3 9 9 8 8 8 7 4 4 4 4 39 38 38 37 5 5 5 5 5 49 49 48 59 59 58 57 57 56 55 55 Współcznnik jakoci przemnoenie tablic kwantzacji przez cznnik: 4 5 9 9 9 7 8 8 mniejsz od lepsza jako wiksza rednia bitowa wiksz od na odwrót 6 4 7 43 4 4 7 4 3 5 8 43 5 9 4 6 3 4 5 8 39 4 7 39 4 5 39 5 48 5 5 5 5 5 5 56 59 58 55 58 58 57 56
JPEG - przkład Podsumowanie:.5 bpp.5 bpp JPEG bardzo efektwn schemat kompresji obrazów naturalnch stopie kompresji lepsz ni : Prz niszch rednich bitowch widoczne efekt zblokowania