27 stycznia 2009

Podobne dokumenty
Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2.

Eksperymentalna analiza częstotliwości wyboru trybów zaawansowanego kodowania wizyjnego.

Kompresja sekwencji obrazów - algorytm MPEG-2

Kodowanie i kompresja Streszczenie Studia Wieczorowe Wykład 10, 2007

Przedstawiamy Państwu tekst będący

Kompresja video (MPEG)

Transkodowanie strumieni wizyjnych. wykorzystujące zaawansowane. techniki kompresji

1. Wprowadzenie 1.1. Zdefiniowanie problemu badawczego

MODEL EKSPERYMENTALNY OPISU TREŚCI WIZYJNYCH

Kompresja dźwięku w standardzie MPEG-1

Kompresja sekwencji obrazów

INSTALACJE TELEKOMUNIKACYJNE I TELETECHNICZNE W BUDOWNICTWIE

MPEG Wstęp. Multimedia Content Description Interface Oficjalna nazwa: (zwarty zapis) obiektów w multimedialnych.

Wstęp do techniki wideo

Wybrane metody kompresji obrazów

dr inż. Piotr Odya Wprowadzenie

Nowoczesne metody emisji ucyfrowionego sygnału telewizyjnego

Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j

Transmisja danych multimedialnych. mgr inż. Piotr Bratoszewski

Transkodowanie strumieni wizyjnych wykorzystujące zaawansowane techniki kompresji

NOWOCZESNE METODY EMISJI UCYFROWIONEGO SYGNAŁU TELEWIZYJNEGO

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania

DANE W SIECIACH TELEKOMUNIKACYJNYCH

mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 4, strona 1. GOLOMBA I RICE'A

dr inż. Jacek Naruniec

Obiektywne metody pomiaru jakości obrazu

Odtwarzanie i kompresja wideo

Kodowanie informacji o ruchu dla kompresji sekwencji trójwymiarowych

Algorytmy kompresji sekwencji wielowidokowych

Standardy telewizji kolorowej (SD)

Przesyłania danych przez protokół TCP/IP

Kwantowanie sygnałów analogowych na przykładzie sygnału mowy

Plan wykładu. Wyznaczanie tras. Podsieci liczba urządzeń w klasie C. Funkcje warstwy sieciowej

Wykład II. Reprezentacja danych w technice cyfrowej. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

Kwantyzacja wektorowa. Kodowanie różnicowe.

Zastosowanie kompresji w kryptografii Piotr Piotrowski

PRACA DYPLOMOWA STUDIA PIERWSZEGO STOPNIA. Łukasz Kutyła Numer albumu: 5199

Zygmunt Wróbel i Robert Koprowski. Praktyka przetwarzania obrazów w programie Matlab

Algorytmy kompresji sekwencji wielowidokowych

2. STRUKTURA RADIOFONICZNYCH SYGNAŁÓW CYFROWYCH

Kodowanie źródeł sygnały video. Sygnał video definicja i podstawowe parametry

MPEG-7. Oficjalna nazwa - Coding of Audiovisual Objects. 1. Etapy rozwoju standardów w MPEG. ania

Sieci komputerowe - Wstęp do intersieci, protokół IPv4

Sieci komputerowe - warstwa transportowa

Sieci Komputerowe Modele warstwowe sieci

Wprowadzenie do multimedialnych baz danych. Opracował: dr inż. Piotr Suchomski

Uproszczony opis obsługi ruchu w węźle IP. Trasa routingu. Warunek:

(12) TŁUMACZENIE PATENTU EUROPEJSKIEGO (19) PL (11) PL/EP (96) Data i numer zgłoszenia patentu europejskiego:

Adresy w sieciach komputerowych

TECHNIKI MULTIMEDIALNE

Sieci Komputerowe Mechanizmy kontroli błędów w sieciach

Kompresja obrazu ruchomego

Cyfrowe przetwarzanie i kompresja danych. dr inż.. Wojciech Zając

Wydział Informatyki, Elektroniki i Telekomunikacji Katedra Telekomunikacji

dr inż. Piotr Odya Kontener

(12) TŁUMACZENIE PATENTU EUROPEJSKIEGO (19) PL (11) (96) Data i numer zgłoszenia patentu europejskiego:

Modelowanie zaawansowanych koderów wizyjnych

Kodowanie transformacyjne. Plan 1. Zasada 2. Rodzaje transformacji 3. Standard JPEG

Urządzenia sieciowe. Część 1: Repeater, Hub, Switch. mgr inż. Krzysztof Szałajko

Serwery multimedialne RealNetworks

Procesory sygnałowe w przetwarzaniu grafiki

W11 Kody nadmiarowe, zastosowania w transmisji danych

CYFROWE PRZETWARZANIE SYGNAŁÓW

Aerotriangulacja. 1. Aerotriangulacja z niezależnych wiązek. 2. Aerotriangulacja z niezależnych modeli

Systemy i Sieci Radiowe

ADAPTACYJNE PRZETWARZANIE SYGNAŁÓW LABORATORIUM. Ćwiczenie 4. Wybrane telekomunikacyjne zastosowania algorytmów adaptacyjnych

(12) TŁUMACZENIE PATENTU EUROPEJSKIEGO (19) PL (11) PL/EP (96) Data i numer zgłoszenia patentu europejskiego:

Protokoły sieciowe model ISO-OSI Opracował: Andrzej Nowak

Rozdział. Propagacja samopodobieństwa w torze transmisji obrazu. 1. Wprowadzenie

Protokół wymiany sentencji, wersja 1

WYKORZYSTANIE MODELU SKORINGOWEGO DO AUTOMATYCZNEJ DIAGNOSTYKI NA PODSTAWIE ZAPISU WIDEO BRONCHOSKOPII

Cechy formatu PNG Budowa bloku danych Bloki standardowe PNG Filtrowanie danych przed kompresją Wyświetlanie progresywne (Adam 7)

dr inż. Piotr Odya. Kontener

DTC-350. VISUALmpeg PRO Analizator Sygnałów MPEG

BIBLIOTEKA PROGRAMU R - BIOPS. Narzędzia Informatyczne w Badaniach Naukowych Katarzyna Bernat

E.14.1 Tworzenie stron internetowych / Krzysztof T. Czarkowski, Ilona Nowosad. Warszawa, Spis treści

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami

GStreamer. Bogdan Kreczmer. Katedra Cybernetyki i Robotyki Wydziału Elektroniki Politechnika Wrocławska

DŹWIĘK. Dźwięk analogowy - fala sinusoidalna. Dźwięk cyfrowy 1-bitowy 2 możliwe stany fala jest mocno zniekształcona

Wpływ kompresji obrazów i map głębi na syntezę widoków w systemie wielowidokowym

mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 1, strona 1.

Szczegółowy opis przedmiotu zamówienia

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami

(12) TŁUMACZENIE PATENTU EUROPEJSKIEGO (19) PL (11) (96) Data i numer zgłoszenia patentu europejskiego:

Systemy operacyjne i sieci komputerowe Szymon Wilk Adresowanie w sieciach Klasy adresów IP a) klasa A

Załącznik nr 2a: Autoreferat

Założenia i obszar zastosowań. JPEG - algorytm kodowania obrazu. Geneza algorytmu KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG

Model OSI. mgr inż. Krzysztof Szałajko

Audio i video. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski

Warstwy i funkcje modelu ISO/OSI

Co Właściwie Dzieje Się w Środku Mojego Strumienia Transportowego MPEG-2???

Systemy bezpieczne i FTC (Niezawodne Systemy Cyfrowe)

Kompresja video. Plan 1. Korelacje czasowe 2. Standardy wideokonferencji 3. Standardy MPEG 4. Video w sieci ATM

INDEKSOWANIE DUŻYCH ZBIORÓW OBRAZÓW

(12) TŁUMACZENIE PATENTU EUROPEJSKIEGO (19) PL (11) PL/EP (96) Data i numer zgłoszenia patentu europejskiego:

Kodowanie predykcyjne

Micha Strzelecki Metody przetwarzania i analizy obrazów biomedycznych (2)

Przetwarzanie obrazów wykład 4

Kompresja danych DKDA (7)

PL B1. Advanced Digital Broadcast S.A., Pregny-Chambesy, CH BUP 21/04. KAMIL BURZYŃSKI, Zielona Góra, PL

Transkrypt:

SM@KRS 27 stycznia 2009 1 Advanced Video Coding H.264/AVC jest na dzień dzisiejszy najbardziej zaawansowanym standardem kompresji sekwencji wizyjnych. W stosunku do wykorzystywanego obecnie w telewizji cyfrowej standardu MPEG-2, oferuje on podobną jakość zakodowanego materiału przy dwukrotnie mniejszych prędkościach zakodowanych strumieni. Zysk ten osiągnięto dzięki wprowadzeniu szeregu narzędzi niedostępnych w MPEG-2, wśród których do najważniejszych należą: estymacja ruchu z dokładnością do 1/4 odstępu próbkowania obrazu, kodowanie predykcyjne makrobloków typu Intra, podział makrobloków typu Inter na partycje o mniejszych rozmiarach (predykcja międzyobrazowa w blokach 16x16, 16x8, 8x16, 8x8, 8x4, 4x8 oraz 4x4), predykcja międzyobrazowa przy użyciu kilku obrazów odniesienia, zastosowanie filtru deblokującego w pętli predykcji kodera, zaawansowana predykcja wektorów ruchu w makroblokach typu B (tryb Direct), kontekstowe adaptacyjne kodowanie arytmetyczne elementów strumienia binarnego (CAVLC, CABAC). Uwaga! Filtr deblokujący zastosowany w pętli predykcji usuwa efekty blokowe pojawiające się w obrazach predykcji przy silnej kompresji. W ten sposób redukuje się również błąd predykcji. 1

2 Strumieniowe przesyłanie danych Mozliwe typy strumieniowania: unicast rodzaj transmisji, w której dokładnie jeden punkt wysyła pakiety do dokładnie jednego punktu dla danego strumienia istnieje tylko jeden nadawca i jeden odbiorca. multicast sposób dystrybucji informacji, dla którego liczba odbiorców może być dowolna. Odbiorcy są widziani dla nadawcy jako pojedynczy grupowy odbiorca danego strumienia dostępny pod jednym adresem dla danej grupy multikastowej. Multicast różni się od unicastu zasadą działania i wynikającą stąd efektywnością. broadcast rozsiewczy (rozgłoszeniowy) tryb transmisji danych polegający na wysyłaniu przez jeden port (kanał informacyjny) pakietów, które powinny być odebrane przez wszystkie pozostałe porty przyłączone do danej sieci (domeny broadcastowej). 3 Ukrywanie błędów transmisji 3.1 Metody przestrzenne (wewnątrzobrazowe) Metody przestrzenne wykorzystuje się przede wszystkim do maskowania błędów w obrazach typu I czyli pierwszych obrazach GOP. Pożądany jest jak największy stopień odzyskania informacji, gdyż niepełna rekonstrukcja w wyniku zastosowania predykcji międzyobrazowej w obrazach typu P i B może doprowadzić do propagacji błędów. Synteza wewnątrzobrazowa wykorzystuje wyłącznie przestrzenną informację z obszarów nieuszkodzonych bądź odzyskanych. 3.1.1 Interpolacja dwukierunkowa Metoda interpolacji polega na przestrzennym uśrednianiu każdego punktu w makrobloku x k na podstawie wartości najbliższych punktów pochodzących z jego czterech sąsiednich, nieuszkodzonych makrobloków 3.1.2 Interpolacja przestrzenno-pionowa SVI Spatial vertical interpolation. Wykorzystuje ona jedynie informacje z makrobloków znajdujących się powyżej i poniżej uszkodzonego. 2

3.1.3 Metoda przestrzennej dyfuzji Proces dyfuzji redukuje efekt rozmycia, który wprowadza interpolacja, jednakże słabo rekonstruuje obszary z wieloma szczegółami lub krawędziami i liniami innymi niż pionowe (jest to charakterystyczne dla wszystkich metod przestrzennych). Ponadto metoda ta jest stosunkowo skomplikowana obliczeniowo i jakość odzyskanego obrazu nie równoważy wprowadzonego opóźnienia. 3.1.4 Metoda przestrzennego podziału z pasowaniem bloków Split match error concealment. Do określenia podobieństw obszarów (pasowania bloków) można wykorzystać podejście oparte na średniej bezwzględnej różnicy MAD (ang. mean absolute difference) pomiędzy estymowanymi sąsiednimi blokami (blok górny i blok dolny). W momencie określenia najbardziej pasujących bloków przeprowadza się proces rekonstrukcji jedną z trzech metod: (a) kopiowania, (b) dyfuzji, (c) interpolacji zawartości obrazu na podstawie dopasowanych bloków w uszkodzonych obszarach. 3.2 Metody czasowe (międzyobrazowe) 3.2.1 Metoda zerowego ruchu ZM (ang. zero motion) W metodzie ZM dokonuje się tzw. czasowego zastąpienia, to znaczy uszkodzony makroblok zastępuje się makroblokiem z tej samej pozycji (i, j) uprzednio zdekodowanej ramki. 3.2.2 Metoda czasowego pasowania bloków w przód/wstecz Temporal, forward backward block matching EC metod. Metoda czasowego pasowania bloków zapewnia wierniejsze odtworzenie utraconej zawartości obrazu w stosunku do poprzednie zaprezentowanych metod. Ze względu na wprowadzoną kompensację ruchu efekt blokowy praktycznie nie występuje. W obszarach gdzie się pojawia, stosuje się również 3

delikatną filtrację. Wadą metody jest natomiast duża złożoność obliczeniowa. Poszukiwanie najlepiej pasującego bloku wprowadza dość znaczne opóźnienia. Jednym ze sposobów ich zmniejszenia jest np. zastąpienie metody pełnego poszukiwania algorytmem poszukiwania logarytmicznego. 4 Strumień transportowy MPEG-2 4.1 Tablice Program Specific Information (PSI) PAT (Program Association Table). Zawiera listę programów dostępnych w strumieniu transportowym. Każdy z tych programów jest identyfikowany przez 16-bitową wartość program number. Każdy program jest powiązany z PIDem jego PMT. Pod program number = 0x0000 znajduje się PID wskazujący NIT. Jeżeli informacji tej tam nie ma, używana jest domyślna wartość 0x0010. Pakiety zawierające PAT zawsze mają PID 0x0000. PMT (Program Map Table) zawiera informacje o programie dla każdego programu jest jedno PMT. Zawiera PIDy i inne informacje dotyczące strumieni składowych programu CAT (Conditional Access Table) zawiera informacje dostępu warunkowego. Dokładny format niespecyfikowany w standardzie. NIT (Network Information Table) zawiera m.in. informacje o sieci i przesyłanych w niej strumieniach transportowych. Dokładny format niespecyfikowany w standardzie. TDT (Time and Date Table) data i czas UTC. 5 Bazy danych i MPEG-7 5.1 Założenia MPEG-7 Wymienialność metadanych niezależność od formatu danych i typu mediów Obiektowość opis obiektów multimedialnych (idea MPEG-4) Rozszerzalność dodawanie kolejnych elementów opisu Zróżnicowanie poziomów abstrakcji opisu 4

Ograniczona objętość (bitowa) opisu 5.2 Deksryptory 5.2.1 Deskryptory koloru DCD (Dominant Colour Descriptor) opis kolorów dominujących, do 8 najważniejszych kolorów w obrazie SCD (Scalable Colour Descriptor) skalowalny deskryptor koloru (histogram kolorów obraz) CLD (Color Layout Descriptor) opis barwy tła obrazu CSD (Color Structure Descriptor) przestrzenne rozmieszczenie barw w obrazie Deskryptor przestrzeni koloru (Color Space) Deskryptor kwantyzacji koloru (Color Quantization) 5.2.2 Deskryptory kształtu RSD (Region-based Shape Descriptor) opis grupy punktów stanowiących region CSD (Contour-based Shape Descriptor) opis krzywizny konturu obiektu 3D SD (3-D Shape Descriptor) opis kształtu obiektów trójwymiarowych 5.2.3 Deskryptory tekstury HTD (Homogeneous Texture Descriptor) opis jednolitych obszarów tekstury TBD (Texture Browning Descriptor) opis kierunkowości, regularności i ziarnistości EHD (Edge Histogram Descriptor) histogram krawędzi tekstur 6 Ciekawostki... 5