mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 8, strona 1. Kompresja video (MEG) Zasadniczy schemat kompresora video Typy ramek przy kompresji czasowej Analiza ramek przez syntezę Sposób detekcji ruchu Techniki przejęte z JEG Normy MEG-1 i MEG-2
mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 8, strona 2. Zasadniczy schemat kompresora video kompresja w dziedzinie czasu (międzyklatkowa) klatki różnicowe kompresja w dziedzinie przestrzeni wektory ruchu kompresja bezstratna transformata cosinusowa kwantyzacja współczynników różnica między klatkami estymacja wektorów ruchu predykcja wektorów ruchu kodowanie Huffmana kodowanie arytmetyczne
mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 8, strona 3. Typy ramek przy kompresji czasowej ramka I kompletna ramka poddana wyłącznie kompresji przestrzennej ramka ramka różnicowa, oparta na poprzedniej ramce I, oraz zestawie współczynników predykcji ruchu (lub wielu takich zestawach). ramka B ramka różnicowa, oparta na poprzedniej i następnej ramce I, oraz zestawie współczynników predykcji ruchu (lub wielu takich zestawach). ramka 3 (typu ) jest w dekoderze odtwarzana z: - kompletnej ramki 0, - współczynników ruchu dla ramek 1, 2 i 3. I 0 1 2 3 4 5 I 6 B 7 B 8 B 9 I 10 ramka 8 (typu B) jest w dekoderze odtwarzana z: - kompletnych ramek 6 i 10, - współczynników ruchu dla ramek 7, 8, 9.
mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 8, strona 4. Analiza ramek przez syntezę analiza synteza + - DCT kwantyzacja + + odwrotna DCT odwrotna kwantyzacja kompensacja ruchu detekcja ruchu bufor ramek kompresja bezstratna
mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 8, strona 5. Sposób detekcji ruchu makroblok = 16 x 16 pikseli Dla każdego makrobloku poszukiwany jest najbardziej podobny obszar (w obrębie ± 64 pikseli od oryginalnego położenia). Zamiast danych makrobloku przesyłany jest wektor przesunięcia oraz błąd predykcji (różnica między makroblokiem a najbardziej podobnym obszarem). Może się zdarzyć, że podobny makroblok nie zostanie znaleziony, wtedy makroblok jest przesyłany żywcem, bez wektora przesunięcia. poprzednia odtworzona ramka
mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 8, strona 6. Techniki przejęte z JEG Techniki te pojawiają się rzecz jasna przy kompresji przestrzennej. A oto cechy wspólne: Rozbicie sygnału na składową luminancyjną i dwie chrominancyjne (YcrCb). Zmniejszenie rozdzielczości chrominancji (4:2:0, a więc x2 w pionie i w poziomie). Zastosowanie transformaty DCT do koncentracji energii sygnału w małej ilości współczynników. Zbieranie współczynników DTC zygzakiem, co koncentruje zera na końcu. Kwantyzacja współczynników, zastosowanie różnych prógów dla różnych współczynników. Kompresja Huffmana na końcu. Należy jednak pamiętać o istotnych różnicach. Transformacie poddawane są nie bloki obrazu, a bloki obrazu resztkowego po usunięciu danych zawartych w wektorach predykcji ruchu. To może powodować inny rozkład widmowy energii -> inny rozkład częstości współczynników DCT -> inne alfabety kodowania Huffmana.
mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 7, strona 7. Norma MEG-1 i MEG-2 rzyjęło się uważać, że video MEG-1 ma rozmiary do 352 x 288 pikseli, nie jest to do końca prawda, standard dopuszcza do 4096 x 4096 pikseli, oczywiście przy znacznie większym bitrate niż standardowe 1536 kbit/s. MEG-2 pozwala dodatkowo na: Kompresję obrazów z przeplotem. Inne sposoby zbierania współczynników DCT oprócz zygzaka. Większe bitrate-y (większa rozdzielczość, lepsza jakość obrazu). Dźwięk wielokanałowy (MEG-1 ma tylko stereo). Możliwość dekodowania do niepełnej rozdzielczości. Możliwość dekodowania z niepełną szybkością (np. co drugą ramkę). oziomy MEG-2 Niski: 352 x 288, 30 fps, około 4 Mbit/s (odpowiada z grubsza MEG-1czy jakości VHS), Główny: 720 x 576, 30 fps, około 15 Mbit/s (odpowiada sygnałowi TV bez przeplotu), Wysoki 1440: 1440 x 1152, 60 fps, około 60 Mbit/s (aktualne HDTV), Wysoki: 1920 x 1152, 60 fps, około 80 Mbit/s.