dr inż. Piotr Odya Wprowadzenie

Podobne dokumenty
Klasyfikacja metod kompresji

Klasyfikacja metod kompresji

Zastosowania grafiki komputerowej

dr inż. Piotr Odya Kontener

Standardy telewizji kolorowej (SD)

dr inż. Piotr Odya. Kontener

Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j

Wybrane metody kompresji obrazów

Podstawy kompresji treści multimedialnych. Opracował: dr inż. Piotr Suchomski

Kompresja obrazu ruchomego

Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2.

Joint Photographic Experts Group

Cyfrowe przetwarzanie i kompresja danych. dr inż.. Wojciech Zając

Kompresja dźwięku w standardzie MPEG-1

Zastosowanie kompresji w kryptografii Piotr Piotrowski

Wstęp do techniki wideo

Kompresja sekwencji obrazów - algorytm MPEG-2

Nowoczesne metody emisji ucyfrowionego sygnału telewizyjnego

Założenia i obszar zastosowań. JPEG - algorytm kodowania obrazu. Geneza algorytmu KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG

Python: JPEG. Zadanie. 1. Wczytanie obrazka

Kodowanie źródeł sygnały video. Sygnał video definicja i podstawowe parametry

KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG

Krótki przegląd pierwszych standardów kompresji obrazów

TECHNIKI MULTIMEDIALNE

Kompresja video (MPEG)

Wymiana i Składowanie Danych Multimedialnych Mateusz Moderhak, EA 106, Pon. 11:15-12:00, śr.

Kompresja obrazów w statycznych - algorytm JPEG

Kodowanie transformacyjne. Plan 1. Zasada 2. Rodzaje transformacji 3. Standard JPEG

dr inż. Piotr Odya Parametry dźwięku zakres słyszanych przez człowieka częstotliwości: 20 Hz - 20 khz; 10 oktaw zakres dynamiki słuchu: 130 db

Kompresja sekwencji obrazów

NOWOCZESNE METODY EMISJI UCYFROWIONEGO SYGNAŁU TELEWIZYJNEGO

Przetwarzanie i transmisja danych multimedialnych. Wykład 10 Kompresja obrazów ruchomych MPEG. Przemysław Sękalski.

dr hab. inż. Lidia Jackowska-Strumiłło, prof. PŁ Instytut Informatyki Stosowanej, PŁ

Fundamentals of Data Compression

1. Wprowadzenie 1.1. Zdefiniowanie problemu badawczego

dr inż. Piotr Odya dr inż. Piotr Suchomski

Technologie cyfrowe semestr letni 2018/2019

Micha Strzelecki Metody przetwarzania i analizy obrazów biomedycznych (2)

mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 1, strona 1.

Formaty - podziały. format pliku. format kompresji. format zapisu (nośnika) kontener dla danych WAV, AVI, BMP

Kodowanie transformujace. Kompresja danych. Tomasz Jurdziński. Wykład 11: Transformaty i JPEG

FORMATY GRAFICZNE. Dobra ilustracja przychodzi w małym pliku. David Siegel, Tworzenie stron WWW. 1. Rodzaje plików graficznych

Grafika Komputerowa Wykład 1. Wstęp do grafiki komputerowej Obraz rastrowy i wektorowy. mgr inż. Michał Chwesiuk 1/22

Politechnika Świętokrzyska. Laboratorium. Cyfrowe przetwarzanie sygnałów. Ćwiczenie 6. Transformata cosinusowa. Krótkookresowa transformata Fouriera.

Kompresja Stratna i Bezstratna Przegląd Najważniejszych Formatów Graficznych

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania

NIEOPTYMALNA TECHNIKA DEKORELACJI W CYFROWYM PRZETWARZANIU OBRAZU

Przedstawiamy Państwu tekst będący

Waldemar Izdebski - Wykłady z przedmiotu SIT / Mapa zasadnicza 30

Podstawy transmisji multimedialnych podstawy kodowania dźwięku i obrazu Autor Wojciech Gumiński

Elementy grafiki komputerowej

ANALIZA PORÓWNAWCZA METOD KOMPRESJI OBRAZÓW CYFROWYCH COMPARATIVE ANALYSIS OF METHODS OF COMPRESSION OF DIGITAL IMAGES

Cechy formatu PNG Budowa bloku danych Bloki standardowe PNG Filtrowanie danych przed kompresją Wyświetlanie progresywne (Adam 7)

Kodowanie predykcyjne

Przetwarzanie obrazu cyfrowego

GRAFIKA RASTROWA. WYKŁAD 1 Wprowadzenie do grafiki rastrowej. Jacek Wiślicki Katedra Informatyki Stosowanej

Progresywny internetowy kodek falkowy

FORMATY GRAFICZNE. Dobra ilustracja przychodzi w małym pliku. David Siegel, Tworzenie stron WWW. 1. Rodzaje plików graficznych

Program wykładu. informatyka + 2

Kodowanie i kompresja Streszczenie Studia Wieczorowe Wykład 10, 2007

Procesory sygnałowe w przetwarzaniu grafiki

Odtwarzanie i kompresja wideo

Formaty plików graficznych

Cyfrowe przetwarzanie i kompresja danych

Bartosz Bazyluk WPROWADZENIE Wstęp do dwuwymiarowej grafiki komputerowej.

KOMPRESJA STRATNA OBRAZÓW. Paradygmat klasyczny. Kwantyzacja. Koncepcja podstawowa. PODSTAWY TECHNIK MULTIMEDIALNYCH A.Przelaskowski.

OPTYMALIZACJA PARAMETRÓW TRANSMISJI OBRAZU NA POTRZEBY SYSTEMU MONITOROWANIA PZR

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami

Transformaty. Kodowanie transformujace

Poradnik Kompresja JPEG r sekwencyjnej kompresji bazowej JPEG YCbCr RLE Baseline Optimized

Technologie cyfrowe. Artur Kalinowski. Zakład Cząstek i Oddziaływań Fundamentalnych Pasteura 5, pokój 4.15 Artur.Kalinowski@fuw.edu.

Wykład III: Kompresja danych. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

Wykład II. Reprezentacja danych w technice cyfrowej. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

Przetwarzanie obrazu

Technika audio część 2

9. Dyskretna transformata Fouriera algorytm FFT

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami

Psychoakustyka. Dźwięk zapisany w formie nieskompresowanej na przykład na CD zawiera więcej informacji niż jest w stanie przetworzyć ludzki mózg.

Kompresja Kodowanie arytmetyczne. Dariusz Sobczuk

Biocentrum Ochota infrastruktura informatyczna dla rozwoju strategicznych kierunków biologii i medycyny POIG /09

Bartosz Bazyluk GRAFIKA KOMPUTEROWA Wprowadzenie. Warunki zaliczenia. Grafika Komputerowa, Informatyka, I Rok

NOŚNIKI DŹWIĘKU I OBRAZU

Modele psychofizyczne w zastosowaniu do kompresji treści multimedialnych

Analiza obrazu. wykład 2. Marek Jan Kasprowicz Uniwersytet Rolniczy 2009

Systemy plezjochroniczne (PDH) synchroniczne (SDH), Transmisja w sieci elektroenergetycznej (PLC Power Line Communication)

Sieci neuronowe - projekt

Inżynieria obrazów cyfrowych. Ćwiczenie 5. Kompresja JPEG

KARTA PRZEDMIOTU. W5/1;W16/1 W5 Zna podstawowe metody przetwarzania wstępnego EP WM K_W9/3; obrazów barwnych.

Transformata Fouriera

1.5. Sygnały. Sygnał- jest modelem zmian w czasie pewnej wielkości fizycznej lub stanu obiektu fizycznego

Formaty plików graficznych

Program wykładu. 1. Systemy rejestracji obrazów technologie CCD, CMOS

mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 4, strona 1. GOLOMBA I RICE'A

(12) TŁUMACZENIE PATENTU EUROPEJSKIEGO (19) PL (11) PL/EP (96) Data i numer zgłoszenia patentu europejskiego:

Kompresja sekwencji wideo w systemie Linux

DŹWIĘK. Dźwięk analogowy - fala sinusoidalna. Dźwięk cyfrowy 1-bitowy 2 możliwe stany fala jest mocno zniekształcona

Formaty plików graficznych

Percepcyjne kodowanie dźwięku

Przedmowa Wykaz oznaczeń Wykaz skrótów 1. Sygnały i ich parametry Pojęcia podstawowe Klasyfikacja sygnałów

Transkrypt:

dr inż. Piotr Odya Wprowadzenie Dane multimedialne to przede wszystkim duże strumienie danych liczone w MB a coraz częściej w GB; Mimo dynamicznego rozwoju technologii pamięci i coraz szybszych transferów danych osiąganych w systemach komunikacyjnych istnieje potrzeba stosowania wydajnych algorytmów kompresji danych multimedialnych. Dzięki kompresji dostęp do danych jest szybszy. Kompresja wpływa na jakość dostarczanej informacji 1

Parametry a wielkość pliku obraz w SD (PAL) 720x576 pikseli x 25 ramek/s x 24 bity/piksel = = 248832000 bitów/s = 31104000 B/s = = 31,1MB/s -> ~1,87 GB/minutę -> ~112 GB/h obraz w HD 1920x1080 pikseli x 25 ramek/s x 24 bity/piksel = = 1244160000 bitów/s = 155520000 B/s = = 155,52MB/s -> ~9,3 GB/minutę -> ~560 GB/h Klasyfikacja metod kompresji Metody bezstratne Zakodowany strumień danych po dekompresji jest identyczny z oryginalnymi danymi przed kompresją, Metody stratne W wyniku kompresji część danych (mniej istotnych) jest bezpowrotnie tracona, dane po dekompresji nieznacznie różnią się od oryginalnych danych przed kompresją. 2

Kompresja bezstratna sygnał może być wielokrotnie poddawany kompresji i dekompresji niewielki stopień kompresji w przypadku danych multimedialnych typowy stopień kompresji 10-20% maksymalny stopień kompresji ok. 40-60% dla dźwięku metody bezstratne stosowane powszechnie od momentu pojawienia się nośnika Blu-ray Kompresja stratna Najczęściej wykorzystują niedoskonałości zmysłów percepcji człowieka -> kompresja perceptualna rekompresja sygnału prowadzi do znaczących strat jakości umożliwiają uzyskanie wysokiego stopnia kompresji nawet 90% bez dostrzegalnych różnic 3

Kompresja bezstratna Kodowanie długości serii, Metoda Huffmana, Kodowanie arytmetyczne, Metody słownikowe Kodowanie długości serii Metoda nie potrzebuje danych początkowych o danych wejściowych, Polega na zastępowaniu serii takich samych danych występujących po sobie rekordem danych zawierającym kod wzorca oraz liczbę jego wystąpień. Przykładem takiej metody jest metoda RLE (Run-Length Encoding) stosowana do kodowania obrazów. 4

Kompresji bezstratna RLE - ang. Run-Length Encoding - kodowanie długości serii; aaaaaaabbbaaaaaaaa aaaaaabbaabbaaaaaa aaaaabbbaaabbbaaaa Bez kompresji: 3 x 18 bajtów = 54 bajty Sposób kodowania: a7b3a8-6 bajtów a6b2a2b2a6-10 bajtów a5b3a3b3a4-10 bajtów Stopień kompresji: 2:1 Kompresja stratna Wielkość generowanych zniekształceń jest miarą jakości alg. kompresji; Na ogół uzyskiwane są większe stopnie kompresji; Algorytmy wykorzystują zaawansowane metody transformacji i kwantyzacji danych; Na ogół możliwe bardziej elastyczne sterowanie stopniem kompresji (jakością); 5

Podpróbkowanie jest stratne i polega na redukcji liczby bitów opisujących obraz skutkiem ubocznym jest równoczesne obniżenie jakości tego obrazu wykorzystuje zdolności ludzkiej percepcji do wypełnienia luk pomiędzy sąsiednimi pikselami. dekoder może również wstawiać piksele usunięte w wyniku podpróbkowania (interpolacja) rodzaje podpróbkowania: w kopii obrazu wykorzystana jest tylko część pikseli z obrazu oryginalnego grupa kilku pikseli zastępowana jest wartością średnią Podpróbkowanie -przykłady 6

Formaty obrazu JPEG (*.jpg) Joint Photographic Experts Group najpopularniejszy format kompresji obrazów (przede wszystkim zdjęć) opracowany na przełomie lat 80-tych i 90-tych typowo kompresja stratna transformata DCT (bloki 8x8 pikseli) zerowanie składowych odpowiadających za wyższe częstotliwości (kwantyzacja) kodowanie Huffmana działanie w systemie Y Cb Cr (najczęściej 4:2:2) Kompresja JPEG - algorytm DCT kwantyzacja kodowanie ciągów kodowanie entropijne macierze kwantyzacji macierze kodowania operacja DCT jest bezstratna kwantyzacja współczynników transformaty kosinusowej zmniejsza liczbę bitów, ale jednocześnie obniża jakość obrazu skwantowane wsp. transformaty są kodowane analogicznie do RLE kodowanie entropijne - najczęściej Huffmana 7

Kodowanie transformacyjne przekształcenie przestrzennej reprezentacji obrazu w dziedzinę częstotliwości w procesach przetwarzania obrazów stosuje się dyskretną transformację kosinusową DCT (ang. Discrete Cosine Transform) DCT IDCT Kompresja JPEG - algorytm Obraz dzielony jest na bloki 8x8 upraszcza operacje umożliwia zrównoleglenie obliczeń 8

Kompresja JPEG porządkowanie wg sekwencji zygzakowatej zapewnia, że współczynniki DCT o niższej częstotliwości (większe prawdopodobieństwo, iż wartości są niezerowe) są grupowane przed współczynnikami DCT o większej częstotliwości (większe prawdopodobieństwo, iż wartości są zerowe). Formaty obrazu JPEG (*.jpg) możliwość kodowania progresywnego kodowanie skalowalne jakościowo najpierw przesyłana składowa stała i współ. niskoczęstotliwościowe, następnie współ. odpowiedzialne za wyższe częstotliwości możliwość kodowania hierarchicznego kodowanie skalowalne przestrzennie stopniowe zwiększanie rozdzielczości przesyłanego obrazka możliwość użycia trybu bezstratnego możliwość zapisu dodatkowych informacji profil kolorów EXIF 9

Formaty obrazu JPEG (*.jpg) Kompresja obrazu ruchomego sygnał wizyjny można traktować jako sygnał o czterech wymiarach: atrybuty pojedynczego piksela rozdzielczość w poziomie rozdzielczość w pionie czas każdy z tych wymiarów może podlegać kompresji 10

Kompresja perceptualna można wyeliminować z sygnału część informacji, nie powodując jednocześnie pogorszenia jego subiektywnej jakości, bo oko nie jest doskonałym przetwornikiem oko jest bardziej wrażliwe na zmiany luminancji niż chrominancji przy gwałtownych zmianach obrazu, oko nie dostrzega wszystkich detali Kompresja obrazu ruchomego obraz ruchomy (animacja, wideo) powstaje z sekwencji obrazów statycznych w procesie kompresji wykorzystuje się metody kompresji obrazów statycznych metody kompresji wykorzystujące właściwości ruchu obiektów w kolejnych ramkach obrazu ruchomego. dwie płaszczyzny kompresji obrazu ruchomego: kompresja wewnątrzramkowa, kompresja międzyramkowa. 11

Kompresja wewnątrzramkowa polega na redukcji nadmiaru informacji przestrzennej w obrębie jednej ramki (ang. spatial redundancy reduction) służy głównie do kompresji pojedynczych obrazów nieruchomych może służyć do kodowania pojedynczych ramek w sekwencji sygnału wizyjnego. opiera się na analogicznych algorytmach, jak w przypadku obrazów nieruchomych Kompresja międzyramkowa kolejne obrazy w sekwencji niewiele się od siebie różnią możliwa jest redukcja nadmiaru informacji czasowej między kolejnymi ramkami sygnału wizyjnego redukcja nadmiaru informacji czasowej polega na wyszukaniu różnic między kolejnymi ramkami i odpowiednim ich kodowaniu metody kompresji międzyramkowej: kodowanie różnicowe (ang. difference coding), blokowe kodowanie różnicowe (ang. block based difference coding), kompensacja ruchu (ang. motion compesation). 12

Struktura ramek w MPEG ramki typu I (intra frames) zakodowane podobnie do JPEG, oparte na DCT używane jako swobodny punkt dostępu do strumienia danych MPEG rozpoczynają każdy GOP charakteryzują się najmniejszym współczynnikiem kompresji GOP I B B P B B P B B I B B P Struktura ramek w MPEG ramki typu P (predicted frames) zakodowane przy użyciu kodowania predykcyjnego w przód ramka odniesienia (I lub P) nie musi bezpośrednio poprzedzać danej ramki współczynnik kompresji ramek typu P jest znacznie większy niż dla ramek typu I GOP I B B P B B P B B I B B P 13

Struktura ramek w MPEG ramki typu B (bidirectional frames) zakodowane przy użyciu dwóch ramek referencyjnych: byłej i przyszłej (I lub P) współczynnik kompresji dla ramek typu B osiąga największe wartości konieczna zmiana kolejności transmisji obrazów (najpierw ramki odniesienia) GOP I B B P B B P B B I B B P I P BB P BB I BB P BB czas Struktura ramek 14

Przepływność CBR (Constant Bit Rate) - utrzymywana jest stała przepływność niezależnie od materiału wejściowego VBR (Variable Bit Rate) - chwilowa przepływność dostosowywana jest do sygnału wejściowego parametrem może być jakość sygnału po kompresji, wielkość pliku lub średnia przepływność (ABR) Dla zainteresowanych Marek Domański, Obraz cyfrowy, WKiŁ, Warszawa 2010. John C. Russ, The Image Processing Handbook, CRC Press, 2007. Nigel Chapman, Janny Chapman, Digital Multimedia, Wiley, 2009. 15