Kompresja sekwencji obrazów

Podobne dokumenty
Kompresja sekwencji obrazów - algorytm MPEG-2

Założenia i obszar zastosowań. JPEG - algorytm kodowania obrazu. Geneza algorytmu KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG

Kompresja obrazów w statycznych - algorytm JPEG

KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG

Przetwarzanie i transmisja danych multimedialnych. Wykład 10 Kompresja obrazów ruchomych MPEG. Przemysław Sękalski.

Kodowanie i kompresja Streszczenie Studia Wieczorowe Wykład 10, 2007

Kompresja video (MPEG)

Wybrane metody kompresji obrazów

Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2.

Przedstawiamy Państwu tekst będący

Wymiana i Składowanie Danych Multimedialnych Mateusz Moderhak, EA 106, Pon. 11:15-12:00, śr.

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania

Nowoczesne metody emisji ucyfrowionego sygnału telewizyjnego

Akwizycja obrazów. Zagadnienia wstępne

PRACA DYPLOMOWA STUDIA PIERWSZEGO STOPNIA. Łukasz Kutyła Numer albumu: 5199

Wstęp do techniki wideo

dr inż. Piotr Odya dr inż. Piotr Suchomski

Zastosowanie kompresji w kryptografii Piotr Piotrowski

Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j

MPEG-7. Oficjalna nazwa - Coding of Audiovisual Objects. 1. Etapy rozwoju standardów w MPEG. ania

TECHNIKI MULTIMEDIALNE

10 Międzynarodowa Organizacja Radia i Telewizji.

Kodowanie źródeł sygnały video. Sygnał video definicja i podstawowe parametry

Sygnał a informacja. Nośnikiem informacji mogą być: liczby, słowa, dźwięki, obrazy, zapachy, prąd itp. czyli różnorakie sygnały.

Standardy telewizji kolorowej (SD)

dr inż. Piotr Odya. Kontener

Teoria przetwarzania A/C i C/A.

Kompresja dźwięku w standardzie MPEG-1

Cechy karty dzwiękowej

Audio i video. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski

NOWOCZESNE METODY EMISJI UCYFROWIONEGO SYGNAŁU TELEWIZYJNEGO

dr inż. Piotr Odya Kontener

dr inż. Piotr Odya Wprowadzenie

Inżynieria obrazów cyfrowych. Ćwiczenie 5. Kompresja JPEG

Kodowanie transformacyjne. Plan 1. Zasada 2. Rodzaje transformacji 3. Standard JPEG

Systemy plezjochroniczne (PDH) synchroniczne (SDH), Transmisja w sieci elektroenergetycznej (PLC Power Line Communication)

DŹWIĘK. Dźwięk analogowy - fala sinusoidalna. Dźwięk cyfrowy 1-bitowy 2 możliwe stany fala jest mocno zniekształcona

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami

Odtwarzanie i kompresja wideo

Transformata Fouriera

ANALIZA PORÓWNAWCZA METOD KOMPRESJI OBRAZÓW CYFROWYCH COMPARATIVE ANALYSIS OF METHODS OF COMPRESSION OF DIGITAL IMAGES

Krótki przegląd pierwszych standardów kompresji obrazów

INSTRUKCJA OBSŁUGI USB2.0 GRABBER

Program wykładu. 1. Systemy rejestracji obrazów technologie CCD, CMOS

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami

Python: JPEG. Zadanie. 1. Wczytanie obrazka

mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 1, strona 1.

Wprowadzenie do multimedialnych baz danych. Opracował: dr inż. Piotr Suchomski

Kodowanie transformujace. Kompresja danych. Tomasz Jurdziński. Wykład 11: Transformaty i JPEG

Cyfrowe przetwarzanie i kompresja danych. dr inż.. Wojciech Zając

Rozpoznawanie i synteza mowy w systemach multimedialnych. Analiza i synteza mowy - wprowadzenie. Spektrogram wyrażenia: computer speech

Zarządzanie infrastrukturą sieciową Modele funkcjonowania sieci

Konwersja dźwięku analogowego do postaci cyfrowej

O sygnałach cyfrowych

OPTYMALIZACJA PARAMETRÓW TRANSMISJI OBRAZU NA POTRZEBY SYSTEMU MONITOROWANIA PZR

Standardy zapisu i transmisji dźwięku

Wymagania techniczne TVP S.A. dotyczące audycji wyprodukowanych w standardzie HD w postaci pliku

Akwizycja i przetwarzanie sygnałów cyfrowych

Technologie Informacyjne

EGZAMIN MATURALNY Z INFORMATYKI MAJ 2013 POZIOM PODSTAWOWY CZĘŚĆ I WYBRANE: Czas pracy: 75 minut. Liczba punktów do uzyskania: 20 WPISUJE ZDAJĄCY

Joint Photographic Experts Group

1. Wprowadzenie 1.1. Zdefiniowanie problemu badawczego

Co to jest dźwięk. Dźwięk to wyrażenie słuchowe wywołane przez falę akustyczną. Ludzki narząd wyłapuje dźwięki z częstotliwością 16 do 20 Hz

Eksperymentalna analiza częstotliwości wyboru trybów zaawansowanego kodowania wizyjnego.

Telewizja część. Kodowanie barwnego obrazu telewizyjnego w systemie PAL Telewizja cyfrowa ogólna charakterystyka. w systemie PAL

Nasz cel: zapewnienie całodobowego dostępu zdalnego i sterowania kamerami. Dynamic Transcoding

Uwaga! Upadek! Opis zadania konkursowego

Transformaty. Kodowanie transformujace

dr inż. Piotr Odya Parametry dźwięku zakres słyszanych przez człowieka częstotliwości: 20 Hz - 20 khz; 10 oktaw zakres dynamiki słuchu: 130 db

Data wykonania Część praktyczna

2. STRUKTURA RADIOFONICZNYCH SYGNAŁÓW CYFROWYCH

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania

Wydział Elektryczny. Katedra Telekomunikacji i Aparatury Elektronicznej. Instrukcja do pracowni specjalistycznej

Przetwornik analogowo-cyfrowy

Fundamentals of Data Compression

Kwantyzacja wektorowa. Kodowanie różnicowe.

KAM-TECH sklep internetowy

Techniki Tworzenia Plików Filmowych

Przygotowali: Bartosz Szatan IIa Paweł Tokarczyk IIa

Dane obrazowe. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski

Instrukcja konfiguracji dekodera strumienia IP H.264 na sygnał: Video (BNC), VGA, YPbPr, HDMI typ. IN-IP-5904, IN-IP-5904-MP

Technika audio część 1

Kwantowanie sygnałów analogowych na przykładzie sygnału mowy

Formaty plików wideo DSI III

Spis treści. 1. Cyfrowy zapis i synteza dźwięku Schemat blokowy i zadania karty dźwiękowej UTK. Karty dźwiękowe. 1

Synchronizacja dźwięku i obrazu

Podstawy transmisji multimedialnych podstawy kodowania dźwięku i obrazu Autor Wojciech Gumiński

Podstawy grafiki komputerowej

W11 Kody nadmiarowe, zastosowania w transmisji danych

Wykład II. Reprezentacja danych w technice cyfrowej. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

xx + x = 1, to y = Jeśli x = 0, to y = 0 Przykładowy układ Funkcja przykładowego układu Metody poszukiwania testów Porównanie tabel prawdy

Niezawodność i diagnostyka systemów cyfrowych projekt 2015

Kompresja video. Plan 1. Korelacje czasowe 2. Standardy wideokonferencji 3. Standardy MPEG 4. Video w sieci ATM

Klasyfikacja metod kompresji

mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 4, strona 1. GOLOMBA I RICE'A

EGZAMIN MATURALNY W ROKU SZKOLNYM 2017/2018 INFORMATYKA

Charakterystyki oraz wyszukiwanie obrazów cyfrowych

Seria i7-n9500. Uwagi: 1.Urządzenia NVR są dostarczane bez dysków HDD 2.Należy używać dysków HDD zalecanych przez producenta.

Programowanie Układów Logicznych kod kursu: ETD6203. Szczegóły realizacji projektu indywidualnego W dr inż.

Sprawdzian wiadomości z jednostki szkoleniowej M3.JM1.JS3 Użytkowanie kart dźwiękowych, głośników i mikrofonów

Transkrypt:

Kompresja sekwencji obrazów - algorytm MPEG-2 Moving Pictures Experts Group (MPEG) - 1988 ISO - International Standard Organisation CCITT - Comité Consultatif International de Téléphonie T et TélégraphieT CCIR - Comité Consultatif de la Radiodiffusion Pierwszy raport z prac (MPEG-1) - 1990 dr inż.. Jacek Jarnicki 1 Pierwsza demonstracja wyników - 1991 Raport z opisem MPEG-2-1994 MPEG-1 - kodowanie sekwencji obrazów i dźwid więku dla potrzeb zapisu na dyskach kompaktowych i wizyjnych MPEG-2 - kodowanie sekwencji obrazów i dźwid więku głównie g dla potrzeb przekazu telewizyjnego dr inż.. Jacek Jarnicki 2 1

Potrzeba kompresji - proste oszacowanie: sekwencja obrazów w (film czarno-bia biały): - rozdzielczość 640 x 480 punktów, - 8 bitów w na punkt ( 256 stopni szarości ), - 25 klatek (ramek) na sekundę, - dźwięk k 44 khz,, 16 bitów w na próbk bkę,, stereo, 640 x 480 x 8 x 25 + 44 x 10 3 x 16 x 2» 60 Mb/s pojemność dysku kompaktowego: 640 MB = 5120 Mb fi ~ 85 s filmu dr inż.. Jacek Jarnicki 3 Norma MPEG-2 -dokumenty ISO/TEC DIS 13818-1 SYSTEM opisuje synchronizację i przełą łączanie sygnałów w dźwid więkowych i wizyjnych. ISO/TEC DIS 13818-2 VIDEO opisuje sposób b kodowania sygnału u video, udostępnia odświe wieżanie wraz z przeplotem. ISO/TEC DIS 13818-3 AUDIO opisuje kodowanie dźwięków, w, rozszerzenie dla kodowania wielu kanałów (dźwi więków surround,, dźwid więków w wielojęzycznych). ISO/TEC DIS 13818-4 Testy Porównawcze opisuje czynności ci służąs żące do określenia charakterystyki kodowania i dekodowania oraz do testowania zgodności z innymi częś ęściami standardu. dr inż.. Jacek Jarnicki 4 2

Norma MPEG-2 -dokumenty c.d. ISO/TEC DIS 13818-5 Symulacja Programowa jest opisem technicznym programowego wykonania pierwszych trzech częś ęści standardu. ISO/TEC DIS 13818-6 Rozszerzenie Systemu Komendy i Kontrola Cyfrowego Przetwarzania Mediów opisuje protokół dla aplikacji klient serwer. ISO/TEC DIS 13818-9 Specyfikacja Interfejsu do Przetwarzania Aplikacji Wysokiej Jakości w Czasie Rzeczywistym definiuje zależno ności czasowe dla transmisji MPEG-2 2 w czasie rzeczywistym. + Dodatki dr inż.. Jacek Jarnicki 5 Ogólny algorytm kompresji sekwencji obrazów 1. Próbkowanie i kwantowanie kolejnych ramek obrazu 2. Kodowanie ramek ramki Próbkowanie i kwantowanie ramki Kodowanie ramek strumień bitów dr inż.. Jacek Jarnicki 6 3

1. Próbkowanie i kwantowanie kolejnych ramek Wynik próbkowania i kwantowania ramki - trzy tablice liczb opisujące obraz w kategoriach modelu telewizyjnego ( YIQ lub YUV ). Stosuje się następuj pujące schematy próbkowania: 4:4:4 4:2:2 4:2:0 4:1:1 próbki luminancji próbki chrominancji dr inż.. Jacek Jarnicki 7 Typowe rozmiary tablic dla ramki (PAL- 625 linii): 4:4:4 Y 720 x 576 U 720 x 576 V 720 x 576 8 bitów/punkt 8 bitów/punkt 8 bitów/punkt 4:2:2 Y 720 x 576 U 360 x 576 V 360 x 576 8 bitów/punkt 8 bitów/punkt 8 bitów/punkt 4:2:0 Y 720 x 576 U 360 x 288 V 360 x 288 8 bitów/punkt 8 bitów/punkt 8 bitów/punkt TV 4:1:1 Y 720 x 576 U 180 x 576 V 180 x 576 8 bitów/punkt 8 bitów/punkt 8 bitów/punkt luminancja chrominancja chrominancja dr inż.. Jacek Jarnicki 8 4

2. Kodowanie ramek Określenie porządku kodowania Kodowanie kolejnych ramek według określonego porządku 2.1. Określenie porządku kodowania Przykładowy porządek kodowania ramek:... I I B B P B B PP B B I I... Ramka typu I (Intra) Ramka typu P (Predicted) Ramka typu B (Bidirectional) dr inż.. Jacek Jarnicki 9 2.1.1. Kodowanie ramek typu I (Intra) Ramki typu I koduje się używając c algorytmu JPEG. Jest to najdokładniejszy adniejszy sposób b kodowania ramek wykorzystywany w algorytmie MPEG-2. 2.1.2. Kodowanie ramek typu P (Predicted) Kodowanie obrazu przy pomocy wektorów w ruchu Założenia: ramki zostały y podzielone na mniejsze częś ęści (makrobloki), częś ęści te dalej będąb traktowane niezależnie, nie, ramki bliskie są do siebie dość podobne. dr inż.. Jacek Jarnicki 10 5

Podstawowa zasada: (x,y) kodowany makroblok ramka odniesienia m kod (x, y) (x o, y o ) [u, v]= [x o -x, y o -y] wektor ruchu m 0 o makroblok odniesienia Jeśli m o jest podobny do m kod, to w przybliżeniu m kod można zapisać jako m ( i, j) = m ( i + u, j v) kod o + dr inż.. Jacek Jarnicki 11 Tak więc, dla zakodowania makrobloku m kod przy założeniu, że e zapisana jest ramka odniesienia, wystarczy podać jedynie wektor ruchu [u,[ v]. v Zastosowanie powyższej zasady w praktyce wymaga jednak udzielenia odpowiedzi na szereg pytań. Jaki rozmiar powinien mieć makroblok? Która ramka jest ramką odniesienia? Poprzednia? Następna? Co to znaczy podobny makroblok? W jakim obszarze ramki odniesienia poszukiwać podobnego makrobloku? Co zrobić,, gdy nie ma podobnego makrobloku? dr inż.. Jacek Jarnicki 12 6

Kodowanie ramek typu P (Predicted)) c.d. Rozmiar makrobloku wynosi 16 X16 pikseli (norma MPEG-2). Ramką odniesienia jest najbliższa poprzednia ramka typu I lub P (norma MPEG-2). Co to znaczy podobny makroblok i w jakim obszarze go poszukiwać,, norma MPEG-2 2 nie precyzuje. Metoda poszukiwania wektora ruchu [u, v] zależy y w tym przypadku od implementacji. Jeżeli eli metoda poszukiwania wektora ruchu dopuszcza wynik negatywny, makroblok koduje się używając c algorytmu JPEG (norma MPEG-2). dr inż.. Jacek Jarnicki 13 Wyznaczanie wektora ruchu (przykład metody) ramka kodowana ramka odniesienia (x-64, y-64) (x-64, y+63) (x,y) kodowany makroblok kod (16 x 16) m kod (x,y) (x+63, y-64) m o (16 x 16) (x+63, y+63) obszar poszukiwania W obszarze poszukiwania bada się wszystkie możliwe położenia makrobloku m o i wybiera to, które minimalizuje kryterium d(u,v). dr inż.. Jacek Jarnicki 14 7

d 1 256 15 15 ( u,v) = mkod ( x + i, y + j) mo ( x + i + u, y + j + v) przy czym i= 0 j= 0 64 u,v 63 Liczby u,v są składowymi poszukiwanego wektora ruchu. Wektor ruchu [u,[ v] zawsze będzie b znaleziony. Bezpośrednie rozwiązanie zanie zadania poszukiwania [u,v]] dla jednego makrobloku wymaga obliczenia wartości funkcji d(u,v ), tyle razy ile pikseli zawiera obszar poszukiwania, czyli 16384 razy. Licząc c wartość d(u,v),, należy y równier wnież wykonać kilkaset operacji arytmetycznych. dr inż.. Jacek Jarnicki 15 Kodowanie ramek typu P - algorytm 1 o Podzielić kodowaną ramkę na makrobloki. 2 o Wykorzystując c ramkę odniesienia wyznaczyć wektory ruchu dla makrobloków. 3 o Dla zakodowanej przy pomocy wektorów w ruchu ramki wyznaczyć i zakodować błąd d predykcji. Na podstawie ramki odniesienia i wektorów ruchu, zrekonstruować kodowaną ramkę Obliczyć różnicę ramki źródłowej i ramki zrekonstruowanej - wynikiem jest tak zwany obraz błęb łędu predykcji. Zakodować obraz błęb łędu predykcji przy pomocy algorytmu JPEG (inna tablica kwantyzacji). dr inż.. Jacek Jarnicki 16 8

2.1.3. Kodowanie ramek typu B (Bidirectional) Ramkę typu B koduje się wykorzystując c najbliższe, poprzednią i następn pną ramkę typu I lub P. Przykładowo: T 1 T 2 T 1 T 2... II BB BB PP BB BB PP... T 1 T 2 T1 T 2 czas Dla różnych r ramek typu B czasy T 1 i T 2 mogą być różne. dr inż.. Jacek Jarnicki 17 Wyznacza się dwa wektory ruchu [u[ 1, v 1 ] i [u[ 2, v 2 ]. czas T 1 ramka odniesienia 1 (x, y) ramka odniesienia 2 T 2 (x, y) ramka kodowana (x,y) kodowany makroblok m kod (x 1, y 1 ) (x 2, y 2 ) m 2 [u 2, v 2 ]= [x 2 -x, y 2 -y] makroblok odniesienia [u 1, v 1 ]= [x 1 -x, y 1 -y] m 1 T T m kod 1 + T + T 2 ( i, j) = m ( i+ u, j+ v ) + m ( i + u, j v ) 1 makroblok odniesienia 2 1 1 1 2 2 2 T1 + T2 dr inż.. Jacek Jarnicki 18 9

Kodowanie ramek typu B - algorytm 1 o Podzielić kodowane ramki na makrobloki. 2 o Wykorzystując c ramki odniesienia wyznaczyć pary wektorów w ruchu dla makrobloków. 3 o Dla zakodowanej przy pomocy wektorów w ruchu ramki wyznaczyć i zakodować błąd d predykcji. Na podstawie ramek odniesienia i par wektorów w ruchu, zrekonstruować kodowaną ramkę Obliczyć różnicę ramki źródłowej i ramki zrekonstruowanej - wynikiem jest obraz błęb łędu predykcji. Zakodować obraz błęb łędu predykcji przy pomocy algorytmu JPEG. dr inż.. Jacek Jarnicki 19 3. Kolejność kodowania i dekodowania ramek Kodowanie:... II BB BB PP BB BB PP... 1 2 3 4 5 6 7 Zapis, transmisja, dekodowanie:... II PP BB BB PP BB BB... 1 4 2 3 7 5 6 dr inż.. Jacek Jarnicki 20 10

4. Ograniczenia systemu MPEG-2 Poziom Próbki/ Wiersze Ramki/ Ramki/ Próbki Próbki Mb/s Mb/s wiersz wiersz /ramkę /ramkę sekundę luminancji/s Wysoki 1920 1920 1152 1152 60 60 62.668.800 80 80 Wysoki 1440 1440 1152 1152 60 60 47.001.600 60 60 1440 1440 Główny 720 720 576 576 30 30 10.368.000 15 15 Niski Niski 352 352 288 288 30 30 3.041.280 4 dr inż.. Jacek Jarnicki 21 11