Podstawy kompresji treści multimedialnych. Opracował: dr inż. Piotr Suchomski

Podobne dokumenty

dr inż. Piotr Odya Wprowadzenie

Klasyfikacja metod kompresji

Klasyfikacja metod kompresji

Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j

Założenia i obszar zastosowań. JPEG - algorytm kodowania obrazu. Geneza algorytmu KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG

Kompresja dźwięku w standardzie MPEG-1

Cyfrowe przetwarzanie i kompresja danych. dr inż.. Wojciech Zając

Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2.

Wybrane metody kompresji obrazów

Joint Photographic Experts Group

KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG

Algorytmy kompresji. Kodowanie Huffmana, kodowanie arytmetyczne

dr inż. Piotr Odya Parametry dźwięku zakres słyszanych przez człowieka częstotliwości: 20 Hz - 20 khz; 10 oktaw zakres dynamiki słuchu: 130 db

Kodowanie transformacyjne. Plan 1. Zasada 2. Rodzaje transformacji 3. Standard JPEG

Kompresja obrazów w statycznych - algorytm JPEG

Formaty - podziały. format pliku. format kompresji. format zapisu (nośnika) kontener dla danych WAV, AVI, BMP

Zastosowania grafiki komputerowej

Kompresja Kodowanie arytmetyczne. Dariusz Sobczuk

mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 4, strona 1. GOLOMBA I RICE'A

Kompresja sekwencji obrazów - algorytm MPEG-2

Python: JPEG. Zadanie. 1. Wczytanie obrazka

Standardy telewizji kolorowej (SD)

Micha Strzelecki Metody przetwarzania i analizy obrazów biomedycznych (2)

dr inż. Piotr Odya Kontener

dr inż. Piotr Odya dr inż. Piotr Suchomski

Kodowanie transformujace. Kompresja danych. Tomasz Jurdziński. Wykład 11: Transformaty i JPEG

mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 1, strona 1.

dr inż. Piotr Odya. Kontener

Temat: Algorytm kompresji plików metodą Huffmana

Fundamentals of Data Compression

KOMPRESJA STRATNA I BEZSTRATNA

Kompresja sekwencji obrazów

Przetwarzanie obrazu cyfrowego

Zastosowanie kompresji w kryptografii Piotr Piotrowski

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania

Przetwarzanie i transmisja danych multimedialnych. Wykład 5 Kodowanie słownikowe. Przemysław Sękalski.

Wykład II. Reprezentacja danych w technice cyfrowej. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

Transformata Fouriera

Kompresja Stratna i Bezstratna Przegląd Najważniejszych Formatów Graficznych

1. Wprowadzenie 1.1. Zdefiniowanie problemu badawczego

GRAFIKA RASTROWA. WYKŁAD 1 Wprowadzenie do grafiki rastrowej. Jacek Wiślicki Katedra Informatyki Stosowanej

Kodowanie i kompresja Streszczenie Studia Wieczorowe Wykład 10, 2007

FORMATY GRAFICZNE. Dobra ilustracja przychodzi w małym pliku. David Siegel, Tworzenie stron WWW. 1. Rodzaje plików graficznych

WYKŁAD 13 ANALIZA I ROZPOZNANIE OBRAZU. Konstrukcja wektora cech z użyciem współczynników kształtu

INFORMATYKA WSTĘP DO GRAFIKI RASTROWEJ

ZESPÓŁ LABORATORIÓW TELEMATYKI TRANSPORTU ZAKŁAD TELEKOMUNIKACJI W TRANSPORCIE WYDZIAŁ TRANSPORTU POLITECHNIKI WARSZAWSKIEJ

Waldemar Izdebski - Wykłady z przedmiotu SIT / Mapa zasadnicza 30

Kompresja video (MPEG)

Grafika Komputerowa Wykład 2. Przetwarzanie obrazów. mgr inż. Michał Chwesiuk 1/38

Kwantyzacja wektorowa. Kodowanie różnicowe.

Kodowanie źródeł sygnały video. Sygnał video definicja i podstawowe parametry

Kodowanie Huffmana. Platforma programistyczna.net; materiały do laboratorium 2014/15 Marcin Wilczewski

dr hab. inż. Lidia Jackowska-Strumiłło, prof. PŁ Instytut Informatyki Stosowanej, PŁ

Podstawy kompresji danych

Wykład VI. Dźwięk cyfrowy. dr inż. Janusz Słupik. Gliwice, Wydział Matematyki Stosowanej Politechniki Śląskiej. c Copyright 2014 Janusz Słupik

Kody Tunstalla. Kodowanie arytmetyczne

Metody kompresji i przechowywania obrazów

Kodowanie predykcyjne

Grafika Komputerowa Wykład 1. Wstęp do grafiki komputerowej Obraz rastrowy i wektorowy. mgr inż. Michał Chwesiuk 1/22

Wybrane algorytmu kompresji dźwięku

teoria informacji Entropia, informacja, kodowanie Mariusz Różycki 24 sierpnia 2015

Podstawy transmisji multimedialnych podstawy kodowania dźwięku i obrazu Autor Wojciech Gumiński

Krótki przegląd pierwszych standardów kompresji obrazów

mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 3, strona 1.

Kompresja obrazu ruchomego

Modulacja i kodowanie. Labolatorium. Kodowanie źródłowe Kod Huffman a

teoria informacji Kanały komunikacyjne, kody korygujące Mariusz Różycki 25 sierpnia 2015

KODY SYMBOLI. Kod Shannona-Fano. Algorytm S-F. Przykład S-F

BIBLIOTEKA PROGRAMU R - BIOPS. Narzędzia Informatyczne w Badaniach Naukowych Katarzyna Bernat

Wymiana i Składowanie Danych Multimedialnych Mateusz Moderhak, EA 106, Pon. 11:15-12:00, śr.

Kompresja danych DKDA (7)

Kodowanie Shannona-Fano

Technologie cyfrowe semestr letni 2018/2019

Kodowanie i kompresja Streszczenie Studia Licencjackie Wykład 11,

FORMATY GRAFICZNE. Dobra ilustracja przychodzi w małym pliku. David Siegel, Tworzenie stron WWW. 1. Rodzaje plików graficznych

Nowoczesne metody emisji ucyfrowionego sygnału telewizyjnego

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami

6. Algorytmy ochrony przed zagłodzeniem dla systemów Linux i Windows NT.

Algorytmy kodowania entropijnego

Akwizycja i przetwarzanie sygnałów cyfrowych

Psychoakustyka. Dźwięk zapisany w formie nieskompresowanej na przykład na CD zawiera więcej informacji niż jest w stanie przetworzyć ludzki mózg.

Akwizycja obrazów. Zagadnienia wstępne

1.5. Sygnały. Sygnał- jest modelem zmian w czasie pewnej wielkości fizycznej lub stanu obiektu fizycznego

Inżynieria obrazów cyfrowych. Ćwiczenie 5. Kompresja JPEG

Grafika na stronie www

Kodowanie informacji

Transformaty. Kodowanie transformujace

Spis treści. Format WAVE Format MP3 Format ACC i inne Konwersja między formatami

Sieci neuronowe - projekt

Wydział Elektryczny. Katedra Telekomunikacji i Aparatury Elektronicznej. Instrukcja do pracowni specjalistycznej

Granica kompresji Kodowanie Shannona Kodowanie Huffmana Kodowanie ciągów Kodowanie arytmetyczne. Kody. Marek Śmieja. Teoria informacji 1 / 35

Sprawdzian wiadomości z jednostki szkoleniowej M3.JM1.JS3 Użytkowanie kart dźwiękowych, głośników i mikrofonów

Kompresja danych kodowanie Huffmana. Dariusz Sobczuk

Kwantowanie sygnałów analogowych na przykładzie sygnału mowy

Grafika komputerowa. Dla DSI II

Kompresja danych Streszczenie Studia Dzienne Wykład 10,

Wstęp do techniki wideo

Proste metody przetwarzania obrazu

TECHNIKI MULTIMEDIALNE

Transkrypt:

Podstawy kompresji treści multimedialnych Opracował: dr inż. Piotr Suchomski

Wprowadzenie Dane multimedialne to przede wszystkim duże strumienie danych liczone w MB a coraz częściej w GB; Mimo dynamicznego rozwoju technologii pamięci i coraz szybszych transferów danych osiąganych w systemach komunikacyjnych istnieje potrzeba stosowania wydajnych algorytmów kompresji danych multimedialnych. Dzięki kompresji dostęp do danych jest szybszy. Kompresja wpływa na jakość dostarczanej informacji

Klasyfikacja metod kompresji Metody bezstratne Zakodowany strumień danych po dekompresji jest identyczny z oryginalnymi danymi przed kompresją, Metody stratne W wyniku kompresji część danych (mniej istotnych) jest bezpowrotnie tracona, dane po dekompresji nieznacznie różnią się od oryginalnych danych przed kompresją.

Klasyfikacja metod kompresji Entropijne (ang. entropy coding) nie uwzględniają korelacji występujących w kodowanym strumeniu danych; Źródłowe (ang. source coding) w procesie kompresji wykorzystywana jest korelacja kodowanego strumienia danych; Hybrydowe (ang. hybrid coding) kombinacja metod entropijnych i źródłowych;

Entropia Podatność zbioru danych na kompresję można określić obliczając entropię danych wejściowych: n EWE P i 1 i 2 z log P z P(z i ) prawdopodobieństwo wystąpienia symbolu z i w strumieni danych. i

Entropia - interpretacja Wartość entropii jest nieujemna, Maksymalna wartość gdy prawdopodobieństwa wystąpienia wszystkich symboli w strumieniu danych są takie same. Generalnie wartość entropii określa minimalną długość kodu do kodowania jednego symbolu w strumieniu danych. Metoda kompresji jest tym skuteczniejsza im minimalna długość osiągniętego kodu dla pojedynczego symbolu jest zbliżona do wartości entropii.

Współczynnik kompresji Charakterystyczny parametr kompresji określający stopień redukcji dancyh wejściowych: K = L WY L WE L WE rozmiar danych przed kompresją, L WY rozmiar danych po kompresji

Kompresja bezstratna Kodowanie długości serii, Metoda Huffmana, Kodowanie arytmetyczne, Metody słownikowe

Kodowanie długości serii Metoda nie potrzebuje danych początkowych o danych wejściowych, Polega na zastępowaniu serii takich samych danych występujących po sobie rekordem danych zawierającym kod wzorca oraz liczbę jego wystąpień. Przykładem takiej metody jest metoda RLE (Run-Length Encoding) stosowana do kodowania obrazów.

Przykład kompresji RLE aaaaaaabbbaaaaaaaa aaaaaabbaabbaaaaaa aaaaabbbaaabbbaaaa Bez kompresji: 3 x 18 bajtów = 54 bajty Sposób kodowania: a7b3a8-6 bajtów a6b2a2b2a6-10 bajtów a5b3a3b3a4-10 bajtów Stopień kompresji: 2:1

Właściwości kodowania długości serii Osiągany niezbyt duży stopień kompresji, Bardzo szybka kompresja i dekompresja, Zakodowany strumień danych jest mało czuły na zakłócenia

Metoda Huffmana Opracowana w 1960 roku przez Davida Huffmana, opiera się na statystycznym rozkładzie prawdopodobieństwa wystąpienia symboli w strumieniu danych wejściowych. Celem metody jest redukcja nadmiarowości kodu do reprezentacji poszczególnych symboli. Podstawą metody jest budowa drzewa Huffmana. Drzewo budowane jest od liści do korzenia. Każdy liść reprezentuje pojedynczy symbol z dziedziny danych. Wartość liścia oznacza liczbę wystąpień symbolu w strumieniu danych.

Metoda Huffmana Do każdego znaku prowadzi tylko jedna droga. Jeżeli rozgałęzienia na prawą stronę oznaczone zostaną 0 a na lewą 1 to dla każdego znaku można określić unikatowy kod binarny. Dla danej serii danych można zbudować więcej niż jedno drzewo, co oznacza, że w czasie dekompresji potrzebne jest drzewo według, którego dane zostały zakodowane.

Metoda Huffmana

Metoda Huffmana - właściwości Jedna z najczęściej wykorzytywanych metod kodowania (również jako element kompresji stratnej), Osiągany stopień kompresji rzędu 20-40%, Działa niezależnie od typu danych, Wolniejsze działanie, ze względu na konieczność budowania drzewa (zwłaszcza w wersji adaptacyjnej), Duża czułość na zakłócenia, wymaga specjalnych zabezpieczeń, aby nie nastąpiło przekłamanie w danych zakodowanych.

Kodowanie arytmetyczne Podobnie jak metoda Huffmana opiera się na rozkładzie prawdopodobieństwa wystąpienia symbolu w strumieniu danych wejściowych. 1 symbol może opisywać ułamkową część bitu (1 bit może nieść więcej informacji niż o 1 znaku), Ideą tego kodu jest przedstawienie ciągu symboli jako podprzedziału przedziału jednostkowego [0,1) wyznaczonego rekursywnie na podstawie prawdopodobieństw wystąpienia tych symboli w strumieniu danych wejściowych. Ciąg kodowy reprezentujący kodowane symbole jest binarnym zapisem wartości z wyznaczonego w ten sposób przedziału.

Kodowanie arytmetyczne Metoda daje lepszy stopień kompresji niż metoda Huffmana o kilka, kilkanaście procent. Kodowanie arytmetyczne jest wolniejsze niż kodowanie Huffmana.

Metody słownikowe Polega na przeglądaniu danych wejściowych w poszukiwaniu fraz identycznych z tymi, które są w słowniku Jeśli taka fraza zostanie wykryta to w jej miejsce w strumieniu danych wyjściowych wpisywana jest sekwencja kodowa, która identyfikuje pozycję frazy w słowniku. Etap kompresji jest znacznie dłużysz niż etap dekompresji, bo wymaga czasochłonnych operacji przeszukiwania strumienia danych wejściowych w celu wyodrębnienia powtarzających się fraz (budowa słownika).

Metody słownikowe Obecnie najbardziej popularny algorytm to LZW (Lempel-Ziv-Welch). Podstawa działania takich formatów jak GIF, ZIP, ARJ, RAR.

Metody stratne Pozwalają uzyskać stopnie kompresji nawet do 90% Wykorzystują przede wszystkim charakterystykę psychofizjologiczną ludzkich zmysłów (słuchu i wzroku). Metody stratne pozwalają określić współczynnik kompresji powiązany z jakością kompresowanych danych (im lepsza jakość tym większy rozmiar).

Metody stratne Metody transformacyjne, Metody fraktalne.

Metody transformacyjne Wykorzystują różnego typu transformacje do dekorelacji danych. Operacje wykonywane są w dziedzinie częstotliwości. Najczęściej spotykane transformacje: Fouriera, kosinusowa, falkowa, Operacja transformacji jest procesem odwracalnym, Obraz dzielony jest na przylegające bloki NxN, W każdym bloku dokonywana jest operacja transformacji, Uzyskane współczynniki transformacji podlegają kwantyzacji (powstają dane o b.małej entropii), Uzyskane dane poddawane są kompresji bezstratnej

Kompresja JPEG Najpopularniejszy standard kompresji i format zapisu zdjęć (Joint Photographic Experts Group), Wykorzystuje transformację kosinusową DCT

Kompresja JPEG - algorytm Obraz dzielony jest na bloki 8x8 (uproszczenie operacji, możliwość zrównoleglenia obliczeń), Ponieważ oko ludzkie jest bardziej wyczulone na zmianę jasności niż koloru, dlatego przestrzeń barw RGB zamieniana jest w przestrzeń YUV (luminacja i składowe chrominancji), Następnie w każdym bloku dokonywana jest transformacja DCT, w wyniku której otrzymywana jest macierz wartości rzeczywistych

Kompresja JPEG - kwantyzacja Następnie dokonywana jest kwantyzacja, która odpowiada za stratność kompresji. Stosowana jest kwantyzacja równomierna połączona z progową selekcją próbek na bazie tablicy współczynników kwantyzacji. Tablica kwantyzacji ma również wymiar 8x8. Wyniki transformacji dzielone są przez współczynniki kwantyzacji. Dla każdego bloku stosowane są te same współczynniki kwantyzacji, W standardzie JPEG zdefiniowane są 4 tablice kwantyzacji (żadna nie jest obowiązkowa)

Kompresja JPEG - kwantyzacja Współczynniki kwantyzacji dla składowych chrominancji (UV) mają większą wartość niż współczynniki dla składowej luminacji, co oznacza, że po kwantyzacji większość tych współczynników zostanie wyzerowana i usunięta, Skalując współczynniki kwantyzacji można sterować współczynnikiem kompresji.

Kompresja JPEG Skwantowane współczynniki transformacji są komprymowane za pomocą metody bezstratnej Huffmana. Przed tym jednak współczynniki przepisywane są do 64 elementowego wektora za pomocą techniki Zig-Zag (chodzi o to aby niezerowe współczynniki były obok siebie).

Kompresja JPEG W pliku JPEG zapisywane są również tablice kwantyzacji oraz współczynnik skalowania. Wartości te są niezbędne do dekompresji danych.

Kompresja fraktalna Fraktale to zapisane matematycznie figury geometryczne, które wykazują cechy samopodobieństwa. Zazwyczaj używane do generowania obrazów. Od kilkunastu lat próbuje się wykonać operację odwrotną, czyli opracować metodę wyznaczania szeregu transformacji fraktalnych, które pozwalają wygenerować dany obraz. Można uzyskać stopnie kompresji nawet 1000:1

Kompresja fraktalna Do tej pory najlepsze rezultaty osiągnięto za pomocą zestawu funkcji iteracyjnych (IFS - Iterated Function System). Układ iterowanych odwzorowań definiuje się jako zbiór k odwzorowań zwężających w i (i=1, 2, 3,...,k), który oznacza się przez {X; w 1, w 2, w 3,..., w k }. w oznacza odwzorowanie afiniczne zwężające przestrzeń (X, ) w siebie

Kompresja fraktalna - algorytm Podział obrazu na rozłączne obszary R i, Dla każdego obszaru trzeba znaleźć dziedzinę D i, która będzie jego odwzorowaniem, Dla każdej wybranej pary (D i, R j ) wybrać możliwie najlepsze przekształcenie przeprowadzające D i w R j. Najczęstsze kryterium minimalizacja błędu średniokwadratowego

Kompresja fraktalna Bardzo wolny proces kompresji, trudna automatyzacja tego procesu. Szybka dekompresja, Wysoka jakość przy bardzo dużych stopniach kompresji 24-bit true color (250 kb) Fractal Image Format FIF (5,3kB) st. kompresji 45:1

Kompresja obrazu ruchomego Obraz ruchomy (animacja, wideo) powstaje z sekwencji obrazów statycznych. W procesie kompresji wykorzystuje się zarówno metody kompresji obrazów statycznych jak i specjalne metody kompresji wykorzystujące właściwości ruchu obiektów w kolejnych ramkach obrazu ruchomego. Dwie płaszczyzny kompresji obrazu ruchomego: Kompresja wewnątrzramkowa, Kompresja międzyramkowa.

Kompresja wewnątrzramkowa polega na redukcji nadmiaru informacji przestrzennej w obrębie jednej ramki (ang. spatial redundancy reduction). metody kompresji wewnątrzramkowej: podpróbkowanie (ang. sub-sampling) kwantyzacja (ang. quantization) kwantyzacja wektorowa (ang. vector quantization) kodowanie transformacyjne (ang. transform coding), Ramki, które podlegają kompresji wewnątrzramkowej to tzw. ramki kluczowe.

Podpróbkowanie kodowanie metodą podpróbkowania (ang. subsampling) jest stratne i polega na redukcji liczby punktów w obrazie. Skutkiem ubocznym jest równoczesne obniżenie jakości tego obrazu. rodzaje podpróbkowania: w kopii obrazu wykorzystana jest tylko część pikseli z obrazu oryginalnego. dla grupy kilku pikseli wyznaczana jest średnia wartość piksela. Następnie, wartości z grupy pikseli są zastępowane tą wartością średnią. Algorytm jest bardziej złożony, lecz jakość obrazu jest lepsza niż w pierwszym przypadku. wykorzystuje zdolności ludzkiej percepcji do wypełnienia luk pomiędzy sąsiednimi pikselami. dekoder może również wstawiać piksele usunięte w wyniku podpróbkowania (interpolacja)

Podpróbkowanie -przykłady

Kwantyzacja polega na redukcji bitów reprezentujących wartość piksela Cały zakres wartości pikseli jest podzielony na określoną liczbę przedziałów - stopni kwantyzacji. jeśli liczba bitów opisujących jeden piksel jest mała, to można wówczas mówić o kwantyzacji zgrubnej (ang. coarse quantization)

Kompresja międzyramkowa kolejne obrazy w sekwencji niewiele się od siebie różnią możliwa jest redukcja nadmiaru informacji czasowej między kolejnymi ramkami sygnału wizyjnego (ang. temporal redundancy reduction) redukcja nadmiaru informacji czasowej polega na wyszukaniu różnic między kolejnymi ramkami i odpowiednim ich kodowaniu metody kompresji międzyramkowej: podpróbkowanie (ang. sub-sampling), kodowanie różnicowe (ang. difference coding), blokowe kodowanie różnicowe (ang. block based difference coding), kompensacja ruchu (ang. motion compesation).

Podpróbkowanie podpróbkowanie można również zastosować do kompresji sekwencji ramek sygnału wizyjnego wybierana i kodowana może być np.: co druga ramka. po stronie dekodera następuje interpolacja, aby uzupełnić brakujące ramki.

Kodowanie różnicowe polega na porównaniu każdej ramki z ramką poprzednią oraz kodowaniu tylko tych pikseli, których wartość zmienia się jeśli kompresja ma być bezstratna, to wówczas każda zmiana wartości piksela musi być uwzględniona. Algorytm może się wtedy stać nieefektywny pod względem czasu przetwarzania, jak również objętość sygnału po kompresji może przewyższać objętość tego samego sygnału przed kompresja. w przypadku kompresji stratnej, nie każda zmiana wartości piksela jest brana pod uwagę. Do kodowania brane są tylko te piksele, dla których zmiany wartości są znaczne.

Blokowe kodowanie różnicowe cały obraz jest podzielony na nie zachodzące na siebie obszary - bloki i każdy blok jest porównywany ze swoim odpowiednikiem w ramce poprzedniej zmniejsza się czas obliczeń, gdyż aktualizacja zachodzi dla wszystkich pikseli w bloku. Dodatkowo, następuje redukcja liczby bitów koniecznych do adresacji pikseli/bloków (do aktualizacji)

Kompensacja ruchu polega na wykryciu zmian w położeniu pikseli oraz kodowaniu tylko tych zmian efektywność metody kompensacji ruchu zależy od stopnia, w jakim są spełnione następujące założenia: ruch obiektów w obrazie zachodzi jedynie w płaszczyźnie równoległej do płaszczyzny obiektu efekty powiększenia lub obrotu nie są uwzględniane jasność obiektów jest czasowo i przestrzennie jednakowa (jasność poszczególnych pikseli nie zmienia się w czasie oraz w obrębie obrazu) nie uwzględniane są wzajemne zakrywania się obiektów.

Kompensacja ruchu najczęściej używaną metodą kompensacji ruchu jest metoda dopasowania bloków obraz dzielony jest na jednakowe, nie zachodzące na siebie obszary pikseli bloki metoda ta opiera się na wykryciu zmiany położenia poszczególnych bloków. kompensacja predykcyjna kompensacja dwukierunkowa

Kompresja dźwięku O jakości zapisu cyfrowego sygnału dźwięku w technice PCM decydują dwa parametry: Rozdzielczość bitowa pojedynczej próbki dźwięku, Częstotliwość próbkowania. Jakość CD to 16 bitów na próbkę, częstotliwość próbkowania 44100 Hz oraz 2 kanały dźwięku co wymaga transferu danych ok. 172 kb/s. Typowe algorytmy kompresji bezstratnej pozwalają uzyskać stopień kompresji rzędu 10-20%, Format FLAC (Free Lossless Audio Codec) wykorzystujący liniową predykcję pozwala

Kompresja dźwięku kodowanie różnicowe Ponieważ w cyfrowym sygnale dźwięku kolejne próbki moją podobne wartości, dlatego opracowano kilka algorytmów kompresji, których podstawą jest odpowiednie kodowanie różnicy między kolejnymi próbkami. Wykorzystywane są przede wszystkim metody predykcyjne (ADPCM, G-726, LPC).

Kompresja dźwięku kodowanie dynamiki amplitudy dźwięku Ważną grupę metod kompresji dźwięku stanowią kodeki dynamiki amplitudy (u-law, A- law, µ-law, G-711). Można zaoszczędzić na przepływności bitowej przez zastosowanie nierównomiernej kwantyzacji amplitudy, która polega na tym, że duże poziomy amplitudy mają krótszy zapis bitowy niż amplitudy o niskim poziomie. Przeznaczanie większej dokładności zapisu niskich poziomów dźwięku pozwala znacznie ograniczyć szum kwantyzacji.

Kompresja dźwięku kodowanie perceptualne Największe stopnie kompresji uzyskuje się w metodach wykorzystujących właściwości ludzkiego słuchu, nawet do 90%. Podstawą tych metod jest zjawisko maskowania, które polega na tym, że dźwięki o niższej amplitudzie i zbliżonej częstotliwości są zagłuszane przez dźwięki o wyższej amplitudzie.

Ilustracja maskowania L[dB] f[hz]

Ilustracja maskowania L[dB] f[hz]

Ilustracja maskowania L[dB] trzeba użyć więcej bitów można użyć mniej bitów nie trzeba kodować f[hz]

Kompresja dźwięku kodowanie perceptualne Maskowanie u każdego człowieka zachodzi nieco inaczej, dlatego kodeki używają uśrednionego modelu psychakustycznego. Znając maskowane składowe dźwięku kodek usuwa je z sygnału. Najbardziej popularne kodeki wykorzystujące psychoakustyczne właściwości słuchu to: MPEG-1 warstwa 3 (MP3), kodek ATRAC, Dolby AC-3.

Dziękuję za uwagę