MPEG-7. Oficjalna nazwa - Coding of Audiovisual Objects. 1. Etapy rozwoju standardów w MPEG. ania

Podobne dokumenty
Kompresja sekwencji obrazów - algorytm MPEG-2

Kompresja sekwencji obrazów

Kompresja video (MPEG)

KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG

Kompresja obrazów w statycznych - algorytm JPEG

Wybrane metody kompresji obrazów

Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2.

Założenia i obszar zastosowań. JPEG - algorytm kodowania obrazu. Geneza algorytmu KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG

Plan wykładu. Akcelerator 3D Potok graficzny

Zastosowanie kompresji w kryptografii Piotr Piotrowski

Wprowadzenie do multimedialnych baz danych. Opracował: dr inż. Piotr Suchomski

Grafika rastrowa (bitmapa)-

Kodowanie i kompresja Streszczenie Studia Wieczorowe Wykład 10, 2007

Kodowanie transformacyjne. Plan 1. Zasada 2. Rodzaje transformacji 3. Standard JPEG

Cyfrowe przetwarzanie i kompresja danych. dr inż.. Wojciech Zając

Kompresja Kodowanie arytmetyczne. Dariusz Sobczuk

INTERAKTYWNA KOMUNIKACJA WIZUALNA. Flash - podstawy

Kompresja dźwięku w standardzie MPEG-1

Podstawy 3D Studio MAX

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania

Grafika rastrowa i wektorowa

Standardy telewizji kolorowej (SD)

FORMATY PLIKÓW GRAFICZNYCH

dr inż. Piotr Odya Kontener

Eksperymentalna analiza częstotliwości wyboru trybów zaawansowanego kodowania wizyjnego.

Krzysztof Leszczyński Adam Sosnowski Michał Winiarski. Projekt UCYF

Audio i video. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski

E.14.1 Tworzenie stron internetowych / Krzysztof T. Czarkowski, Ilona Nowosad. Warszawa, Spis treści

27 stycznia 2009

9. Podstawowe narzędzia matematyczne analiz przestrzennych

6. Organizacja dostępu do danych przestrzennych

Księgarnia internetowa Lubię to!» Nasza społeczność

Technologie Informacyjne

dr inż. Piotr Odya Wprowadzenie

Nowoczesne metody emisji ucyfrowionego sygnału telewizyjnego

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami

Niezawodność i diagnostyka systemów cyfrowych projekt 2015

Przetwarzanie i transmisja danych multimedialnych. Wykład 5 Kodowanie słownikowe. Przemysław Sękalski.

Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j

Wstęp do techniki wideo

Rzeczywistość rozszerzona w praktyce muzealnej

Formaty plików. graficznych, dźwiękowych, wideo

dr inż. Piotr Odya. Kontener

Grafika na stronie www

dr inż. Piotr Odya dr inż. Piotr Suchomski

Kompresja danych DKDA (7)

fazy tworzenia filmu preprodukcja szkice, rysunki, plany produkcji... produkcja nagrywanie scen postprodukcja montaż, korekcja, podkład dźwiękowy

PRÓBNY EGZAMIN MATURALNY Z INFORMATYKI

Akwizycja obrazów. Zagadnienia wstępne

Górnicki Mateusz 17681

dr hab. inż. Lidia Jackowska-Strumiłło, prof. PŁ Instytut Informatyki Stosowanej, PŁ

Dane obrazowe. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski

PRZEWODNIK PO PRZEDMIOCIE

Praktyczne zastosowanie grafiki komputerowej

REKLAMA INTERNETOWA WYMAGANIA TECHNICZNE

Veslava Osińska IINB UMK, Toruń. Multimedia w dokumentach

OpenGL przezroczystość

Joint Photographic Experts Group

Animowana grafika 3D. Opracowanie: J. Kęsik.

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami

Metoda Karnaugh. B A BC A

Technika mikroprocesorowa. Konsola do gier

EGZAMIN MATURALNY Z INFORMATYKI

mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 4, strona 1. GOLOMBA I RICE'A

Micha Strzelecki Metody przetwarzania i analizy obrazów biomedycznych (2)

Wielokanałowe systemy kodowania dźwięku

Kodowanie transformujace. Kompresja danych. Tomasz Jurdziński. Wykład 11: Transformaty i JPEG

Zadanie 1. Suma silni (11 pkt)

INFORMATYKA WSTĘP DO GRAFIKI RASTROWEJ

Dodawanie grafiki i obiektów

Wymiana i Składowanie Danych Multimedialnych Mateusz Moderhak, EA 106, Pon. 11:15-12:00, śr.

10.3. Typowe zadania NMT W niniejszym rozdziale przedstawimy podstawowe zadania do jakich może być wykorzystany numerycznego modelu terenu.

Nierówność Krafta-McMillana, Kodowanie Huffmana

Klasyfikacja metod kompresji

Opis efektów kształcenia dla modułu zajęć

Transformata Fouriera

Przedstawiamy Państwu tekst będący

GRAFIKA RASTROWA. WYKŁAD 1 Wprowadzenie do grafiki rastrowej. Jacek Wiślicki Katedra Informatyki Stosowanej

Multimedia i Interfejsy

1.2 Schemat blokowy oraz opis sygnałów wejściowych i wyjściowych

ADAPTACYJNE PRZETWARZANIE SYGNAŁÓW LABORATORIUM. Ćwiczenie 4. Wybrane telekomunikacyjne zastosowania algorytmów adaptacyjnych

EGZAMIN MATURALNY Z INFORMATYKI POZIOM PODSTAWOWY MAJ 2014 CZĘŚĆ I WYBRANE: Czas pracy: 75 minut. Liczba punktów do uzyskania: 20 WPISUJE ZDAJĄCY

Zadanie 1. Doskonała inaczej (6 pkt) Poniższy algorytm wyznacza wszystkie dzielniki liczby naturalnej n 1, mniejsze od n.

Spis treści. Konwencje zastosowane w książce...5. Dodawanie stylów do dokumentów HTML oraz XHTML...6. Struktura reguł...9. Pierwszeństwo stylów...

KINEMATYKA I DYNAMIKA CIAŁA STAŁEGO. dr inż. Janusz Zachwieja wykład opracowany na podstawie literatury

Wykład II. Reprezentacja danych w technice cyfrowej. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

Kompresja video. Plan 1. Korelacje czasowe 2. Standardy wideokonferencji 3. Standardy MPEG 4. Video w sieci ATM

Kodowanie Huffmana. Platforma programistyczna.net; materiały do laboratorium 2014/15 Marcin Wilczewski

Modelowanie i wstęp do druku 3D Wykład 1. Robert Banasiak

APLIKACJE - MULTIMEDIALNE

Innowacja pedagogiczna na zajęciach komputerowych w klasach 4e, 4f, 4g. Nazwa innowacji Programowy Zawrót Głowy

TECHNIKI MULTIMEDIALNE

Specyfikacja WMfono Authoring Studio

Grafika 2D. Animacja - wstęp. Wykład obejmuje podstawowe pojęcia związane z animacja komputerową. opracowanie: Jacek Kęsik

Koncepcja systemu AV Patio ASP

Kody splotowe. Zastosowanie

Spis treści. 1 Moduł Mapy 2

Techniki animacji komputerowej

Analiza skupień. Analiza Skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania

GRAFIKA KOMPUTEROWA. Plan wykładu. 1. Początki grafiki komputerowej. 2. Grafika komputerowa a dziedziny pokrewne. 3. Omówienie programu przedmiotu

Transkrypt:

MPEG-. Etapy rozwoju standardów w MPEG MPEG- CD-I, (99) MPEG- TV, DVD, HDTV, multimedia, (99) MPEG -... MPEG- DTV, interaktywne aplikacje graficzne i multimedialne wersja (V.) -.99 wersja (V.) ~ MPEG- " Multimedia Content Description Interface, (). MPEG- - ogólna charakterystyka Oficjalna nazwa - Coding of Audiovisual Objects Główne założenia standardu Ujednolicenie metod dostępu do różnego r typu usług. ug. Rozwinięta interaktywność (nie tylko stop/play/slow, ale równier wnież "interakcyjny dostęp" " do poszczególnych obiektów w sceny). Połą łączenie treści naralnych i szcznie generowanych Efektywna kompresja danych. Ochrona praw autorskich.. Ogólna zasada działania ania Strona kodera MPEG- "Scena audiowizualna" (Audiovisual( Scene) ) jest budowana z niezależnych nych obiektów, którymi mogą być: "Obiekty audio" (A) "Obiekty video" (V) Oba typy obiektów w mogą być naralne (Naral( Naral), lub generowane szcznie (Syntethic( Syntethic). Poszczególne obiekty i scena sąs w odpowiedni sposób b kodowane i informacja jest przesyłana do dekodera. Strona dekodera MPEG- Obiekty (A i V), po rozkodowaniu sąs umieszczane na scenie przez układ komponujący (Compositor( Compositor), który uwzględnia: charakter obiektów w i strukrę sceny wymagania wynikające z interaktywnego charakteru procesu

scena lektor tło meble prezentacja A/V postać głos biurko globus Ilustracja koncepcji opisu sceny (w nadajniku) i jej rekonstrukcji (w odbiorniku) Hierarchiczna strukra sceny z poprzedniego przykładu. Na co pozwala MPEG-? V. Przesyłanie obiektów w video z prędko dkością Kbit/s - Mbit/s Naralne obiekty video mogą być różne np. sekwencje video w polu prostokąta, ta, lub sekwencje video w polu o dowolnym kształcie Przesyłanie dźwid więku z prędko dkością Kbit/s - kbit/s/ /s/ch Jakość realnego dźwid więku lepsza niż MP Obiekty video mogą być generowane komputerowo np. animowane twarze ludzkie, obiekty szkieletowe (Meshes)) z ruchomą teksrą Dźwięki mogą być generowane komputerowo np. MIDI Możliwo liwość synchronizacji grafiki i teks animowanego V. Animacja twarzy ciała a ludzkiego Kompresja teksrowanych obiektów w szkieletowych -D Modelowanie charakterystyki pomieszczenia dla potrzeb dźwięku przestrzennego

. Architekra systemu. Klasyfikacja obiektów w MPEG- Norma wyróżnia klasy obiektów w pierwotnych: Mesh - dwuwymiarowa tablica punktów, w której każdy punkt jest opisywany wektorem, składowymi wektora mogą być np. kolor, przezroczystość ść,, położenie, Chain - jednowymiarowa tablica punktów, Light - źródło światła a (obiekt stosowany jedynie przy komponowaniu scen -D), Waveform - jednowymiarowa tablica próbek służąs żąca do tworzenia elementów w pierwotnych dla źródeł sygnałów audio. 9 Wszystkie inne obiekty AV sąs obiektami złożonymi, z onymi, powstającymi jako hierarchiczne strukry zbudowane z obiektów w pierwotnych lub złożonych. z onych.. Kodowanie i dekodowanie naralnych obiektów w video (VOP( VOP- Video Object Plane) Obiekty o kształcie regularnym (prostokątnym) tnym) Obiekty o dowolnym kształcie (nieregularne) Przykład algorytmu kodowania - obiekty o dowolnym kształcie, kodowaniu podlegają: kształt t obiek (shape( shape) ruch (motion( motion) teksra (texre( texre) Ogólny schemat algorytmu kodowania

Sposoby opisu kształ obiek i kodowanie kształ Sposoby opisu kształ Maska binarna nałożona ona na prostokąt t ograniczający cy obiekt Płaszczyzna alfa (Alpha( Plane) - mapa bitowa, ( - bitów w na punkt określaj lająca przezroczystość punk ( - nieprzezroczysty, całkowicie przezroczysty) Kodowanie kształ obiek Płaszczyzna alfa dzielona jest na bloki x punktów Bloki sąs dalej kodowane niezależnie przy pomocy drzew czwórkowych (Quadtree( Quadtree) Kodowanie bloku x punktów blok x punktów w dzielony jest na podbloki x punkty podbloki sąs numerowane według algorytmu dla poziomu drzewa czwórkowego 9 9 9 9 9 9 9 poziom poziom poziom poziom Niższy poziom powstaje z podziału u na cztery, bloków w wyższego poziomu. Przykładowo: Podbloki,,, poziomu, uzyskano z podbloku poziomu u. Podbloki,,, poziomu, otrzymano z podbloku poziomu.

Kodowanie ruchu Kodowanie ruchu odbywa się podobnie jak w algorytmie MPEG - przy pomocy wektorów w ruchu i kompensacji ruchu. Wyznaczanie wektorów w ruchu Prostokąt t ograniczający cy kształt t obiek jest gdy zachodzi taka potrzeba rozszerzany (z prawej strony i od dołu), tak aby jego rozmiary były y wielokrotności cią dla składowej Y i dla składowych U i V Jako kryterium służąs żące do poszukiwania wektora ruchu przyjmowana jest suma wartości bezwzględnych różnic r nazywana SAD (Sum of Absolute Difference). SAD dla danego makrobloku jest liczona tylko gdy odpowiedni punkt płaszczyzny p alfa ma wartość różną od. Płaszczyzna alfa opisująca kształt t jest też odpowiednio rozszerzana a w punktach rozszerzenia wpisywane sąs wartości Kodowanie teksry Ramki I (Intra( Intra) ) sąs kodowane przy pomocy algorytmu JPEG osobno dla składowych Y, U i V przy podziale na bloki x punktów w z poniższ szą modyfikacją. Dla obiektów w o dowolnym kształcie mogą zajść trzy przypadki - blok leży y całkowicie "wewnątrz" kształ - część bloku jest wspólna z kształtem tem obiek - blok leży y całkowicie "na zewnątrz" kształ W poszczególnych przypadkach postępuje puje się następuj pująco: jeśli blok leży y całkowicie "wewnątrz" kształ - normalne kodowanie JPEG jeśli część bloku jest wspólna z kształtem tem obiek - punkty, które nie należą do kształ sąs zerowane jeżeli eli blok leży y całkowicie "na zewnątrz" kształ to jest pomijany 9

Dekodowanie obiek. Działanie anie układu komponującego (Compositor( Compositor) Obiekty po zdekodowaniu i rekonstrukcji sąs przekazywane do układu komponującego, którego zadaniem jest ich odpowiednie umieszczenie na rekonstruowanej scenie. Przykład ad: Obiekt N jest nakładany adany na wcześniej umieszczony na scenie obiekt M,, w efekcie powstaje nowy obiekt P. M N P Jak wyznaczyć tablice Y,U,V dla nowego obiek? Tablice Y,U,V dla obiek P sąs wyznaczane ze wzoru: gdzie P, M P, N Przykładowo: Nα N = α M + N α N - tablice Y,U,V dla poszczególnych obiektów - płaszczyzna alfa dla obiek N N a = P = M N a = P = N 9. Kodowanie i animacja twarzy oraz ciała ludzkiego W normie MPEG- została a zdefiniowana specyfikacja metody opisu i animacji twarzy oraz ciała a ludzkiego. Animacja twarzy model geometryczny twarzy (siatka wieloboków w lub płaty powierzchni NURBS), określenie parametrów w animacji i sposobu ich kodowania, reguły y pozwalające na obliczanie deformacji modelu geometrycznego na podstawie parametrów w animacji.

Określenie parametrów w animacji Parametry animacji twarzy FAP (Face( Animation Parameters) ) pozwalają na celowe deformowanie modelu twarzy powodując odpoowiednią zmianę w stosunku do stanu neutralnego. MPEG- określa punkty charakterystyczne FAP (Face( Animation Points), które pozwalają dalej na zdefiniowanie odpowiednich parametrów w animacji. Twarz w stanie neutralnym Twarz z przodu i z profilu Punkty charakterystyczne pogrupowano i przypisano im parametry animacji: Szczegóły elementów twarzy : eyeballs, pupils, eyelids : eyebrow : cheeks : tongue : head rotation : outerlip positions 9: nose : ears Group : visemes and expressions : jaw, chin, inner lowerlip, cornerlips, midlip itd. Number of FAPs