Wstęp Statyczne kody Huffmana Dynamiczne kody Huffmana Praktyka. Kodowanie Huffmana. Dawid Duda. 4 marca 2004

Podobne dokumenty

Nierówność Krafta-McMillana, Kodowanie Huffmana

Kompresja bezstratna. Entropia. Kod Huffmana

Kodowanie i kompresja Streszczenie Studia dzienne Wykład 9,

Definicja. Jeśli. wtedy

Kodowanie Huffmana. Platforma programistyczna.net; materiały do laboratorium 2014/15 Marcin Wilczewski

Granica kompresji Kodowanie Shannona Kodowanie Huffmana Kodowanie ciągów Kodowanie arytmetyczne. Kody. Marek Śmieja. Teoria informacji 1 / 35

Temat: Algorytm kompresji plików metodą Huffmana

0-0000, , , itd

Def. Kod jednoznacznie definiowalny Def. Kod przedrostkowy Def. Kod optymalny. Przykłady kodów. Kody optymalne

KODY SYMBOLI. Kod Shannona-Fano. Algorytm S-F. Przykład S-F

Kodowanie informacji

Kody Tunstalla. Kodowanie arytmetyczne

Teoria informacji i kodowania Ćwiczenia

KODY SYMBOLI. Materiały KODA, A.Przelaskowski. Koncepcja przedziałów nieskończonego alfabetu

Elementy teorii informacji i kodowania

Kompresja danych kodowanie Huffmana. Dariusz Sobczuk

Teoria Informacji - wykład. Kodowanie wiadomości

Kodowanie i entropia

teoria informacji Entropia, informacja, kodowanie Mariusz Różycki 24 sierpnia 2015

Algorytmy kodowania entropijnego

Kompresja Kodowanie arytmetyczne. Dariusz Sobczuk

Niech x 1,..., x n będzie ciągiem zdarzeń. ---

Podstawowe pojęcia. Teoria informacji

Kody Huffmana. Konrad Wypyski. 11 lutego 2006 roku

Entropia Kodowanie. Podstawy kompresji. Algorytmy kompresji danych. Sebastian Deorowicz

Przetwarzanie i transmisja danych multimedialnych. Wykład 3 Kodowanie Shannona Fano i Huffmana. Przemysław Sękalski.

Algorytmy kompresji. Kodowanie Huffmana, kodowanie arytmetyczne

Wygra Polska czy Brazylia, czyli o tym jak zwięźle zapisywać informacje

Algorytmy zachłanne. dr inż. Urszula Gałązka

Kodowanie i kompresja Tomasz Jurdziński Studia Wieczorowe Wykład Kody liniowe - kodowanie w oparciu o macierz parzystości

0 + 0 = 0, = 1, = 1, = 0.

Wstęp do programowania. Drzewa podstawowe techniki. Piotr Chrząstowski-Wachtel

ZADANIE 1. Rozwiązanie:

Algorytmy i struktury danych. wykład 8

Kompresja danych Streszczenie Studia Dzienne Wykład 10,

mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 4, strona 1. GOLOMBA I RICE'A

Modulacja i kodowanie. Labolatorium. Kodowanie źródłowe Kod Huffman a

Założenia i obszar zastosowań. JPEG - algorytm kodowania obrazu. Geneza algorytmu KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG

Wstęp do Programowania potok funkcyjny

Struktury danych i złożoność obliczeniowa Wykład 7. Prof. dr hab. inż. Jan Magott

Grafy (3): drzewa. Wykłady z matematyki dyskretnej dla informatyków i teleinformatyków. UTP Bydgoszcz

Teoria informacji i kodowania Ćwiczenia Sem. zimowy 2016/2017

Matematyka dyskretna - 7.Drzewa

teoria informacji Kanały komunikacyjne, kody korygujące Mariusz Różycki 25 sierpnia 2015

Podstawy kompresji danych

Algorytmy i struktury danych. Co dziś? Tytułem przypomnienia metoda dziel i zwyciężaj. Wykład VIII Elementarne techniki algorytmiczne

Wstęp do programowania. Drzewa. Piotr Chrząstowski-Wachtel

Algorytmy i Struktury Danych

Wykład 2. Poprawność algorytmów

ALGORYTMY I STRUKTURY DANYCH

operacje porównania, a jeśli jest to konieczne ze względu na złe uporządkowanie porównywanych liczb zmieniamy ich kolejność, czyli przestawiamy je.

Przetwarzanie i transmisja danych multimedialnych. Wykład 5 Kodowanie słownikowe. Przemysław Sękalski.

Rekurencje. Jeśli algorytm zawiera wywołanie samego siebie, jego czas działania moŝe być określony rekurencją. Przykład: sortowanie przez scalanie:

Kodowanie Shannona-Fano

Algorytmy i Struktury Danych, 2. ćwiczenia

Programowanie dynamiczne

Kody blokowe Wykład 2, 10 III 2011

7a. Teoria drzew - kodowanie i dekodowanie

E: Rekonstrukcja ewolucji. Algorytmy filogenetyczne

Algorytmy i. Wykład 5: Drzewa. Dr inż. Paweł Kasprowski

Zadanie 1 Przygotuj algorytm programu - sortowanie przez wstawianie.

Struktury danych i złożoność obliczeniowa Wykład 5. Prof. dr hab. inż. Jan Magott

Dynamiczne drzewa. Piotr Sankowski. - p. 1/27

Metody Kompilacji Wykład 3

Teoria Informacji i Metody Kompresji Danych

Instrukcje dla zawodników

Sortowanie - wybrane algorytmy

ZASADY PROGRAMOWANIA KOMPUTERÓW ZAP zima 2014/2015. Drzewa BST c.d., równoważenie drzew, kopce.

Luty 2001 Algorytmy (4) 2000/2001

Przepustowość kanału, odczytywanie wiadomości z kanału, poprawa wydajności kanału.

Modelowanie motywów łańcuchami Markowa wyższego rzędu

Wysokość drzewa Głębokość węzła

Wyszukiwanie binarne

Kodowanie informacji

Tadeusz Pankowski

Instrukcje dla zawodników

LZ77 LZ78. Kompresja danych. Tomasz Jurdziński. Wykład 5: kodowanie słownikowe

Zadanie: Wymyślić efektywną reprezentację par ciągów binarnych jako ciągów binarnych. Rozwiązanie: Propozycja wypracowana na ćwiczeniach

Laboratorium nr 7 Sortowanie

Każdy węzeł w drzewie posiada 3 pola: klucz, adres prawego potomka i adres lewego potomka. Pola zawierające adresy mogą być puste.

Kodowanie i kompresja Streszczenie Studia Licencjackie Wykład 11,

Kolejka priorytetowa. Często rozważa się kolejki priorytetowe, w których poszukuje się elementu minimalnego zamiast maksymalnego.

a) 7 b) 19 c) 21 d) 34

Poprawność semantyczna

Joint Photographic Experts Group

Wstęp do programowania

Jarosław Wróblewski Matematyka Elementarna, zima 2014/15

Kodowanie predykcyjne

Algorytm obejścia drzewa poszukiwań i zadanie o hetmanach szachowych

Urządzenia Techniki. Klasa I TI. System dwójkowy (binarny) -> BIN. Przykład zamiany liczby dziesiętnej na binarną (DEC -> BIN):

Drzewa spinające MST dla grafów ważonych Maksymalne drzewo spinające Drzewo Steinera. Wykład 6. Drzewa cz. II

prowadzący dr ADRIAN HORZYK /~horzyk tel.: Konsultacje paw. D-13/325

Drzewa binarne. Drzewo binarne to dowolny obiekt powstały zgodnie z regułami: jest drzewem binarnym Jeśli T 0. jest drzewem binarnym Np.

AKD Metody słownikowe

Łyżwy - omówienie zadania

Sortowanie. Kolejki priorytetowe i algorytm Heapsort Dynamiczny problem sortowania:

Wykład 2. Drzewa zbalansowane AVL i 2-3-4

2 Kryptografia: algorytmy symetryczne

Porządek symetryczny: right(x)

znalezienia elementu w zbiorze, gdy w nim jest; dołączenia nowego elementu w odpowiednie miejsce, aby zbiór pozostał nadal uporządkowany.

Transkrypt:

4 marca 2004

Podstawowe oznaczenia i definicje Wymagania wobec kodu Podstawowa idea Podsumowanie

Podstawowe oznaczenia i definicje Podstawowe oznaczenia i definicje: alfabet wejściowy: A = {a 1, a 2,..., a m } informacja własna litery: i(a) = log entropia (średnia informacja własna): 1 = log P(A) (1) P(A) H = P(A i )i(a i ) = P(A i ) log P(A i ) (2) Tw. Shannona: średnia ilość bitów przypadająca na jeden zakodowany symbol nie jest mniejsza od entropii źródła kod prefiksowy: kod, w którym żadne słowo kodowe nie jest prefiksem innego słowa kodowego

Wymagania wobec kodu Podstawowa idea Podsumowanie Co chcemy uzyskać: każdemu symbolowi z alfabetu chcemy przypisać jednoznacznie słowo kodowe symbolom rzadko występującym chcemy przypisać dłuższe słowa kodowe, a częściej występującym krótsze chcemy móc jednoznacznie dekodować zakodowane dane ale takich kodów jest wiele, który wybrać? no i jak wybrać, aby taki kod móc szybko zbudować?

Wymagania wobec kodu Podstawowa idea Podsumowanie Cel: optymalny kod spełniający wymienione wymagania. Kluczowe obserwacje: dla każdego jednoznacznie dekodowalnego kodu istnieje nie gorszy (w sensie średniej ilości bitów na symbol) kod prefiksowy w kodzie optymalnym częściej występującym symbolom będą odpowiadały krótsze słowa kodowe a rzadziej występującym dłuższe w kodzie optymalnym dwa symbole występujące najrzadziej będą miały słowa kodowe o tej samej długości

Wymagania wobec kodu Podstawowa idea Podsumowanie A P(A) c(a) a 2 0.4 c(a 2 ) a 1 0.2 c(a 1 ) a 3 0.2 c(a 3 ) a 4 0.1 c(a 4 ) a 5 0.1 c(a 5 ) c(a 4 ) = α 1 0 c(a 5 ) = α 1 1 A P(A) c(a) a 2 0.4 c(a 2 ) a 1 0.2 c(a 1 ) a 3 0.2 c(a 3 ) a 4 0.2 α 1 c(a 3 ) = α 2 0 c(a 4 ) = α 2 1 α 1 = α 2 1 A P(A) c(a) a 2 0.4 c(a 2 ) a 3 0.4 α 2 a 1 0.2 c(a 1 ) c(a 3 ) = α 3 0 c(a 1 ) = α 3 1 α 2 = α 3 0 A P(A) c(a) a 3 0.6 α 3 a 2 0.4 c(a 2 ) c(a 3 ) = 0 c(a 2 ) = 1 α 3 = 0 c(a 2 ) = 1 c(a 1 ) = 01 c(a 3 ) = 000 c(a 4 ) = 0010 c(a 5 ) = 0011

Wymagania wobec kodu Podstawowa idea Podsumowanie Algorytm konstrukcji drzewa Huffmana: 1. umieść m liści na liście L 2. dopóki lista L zawiera przynajmniej dwa elementy wykonuj 2.1 usuń z listy L dwa elementy x oraz y o najmniejszej wadze 2.2 stwórz nowy wierzchołek p, który będzie rodzicem x i y 2.3 ustaw wagę wierzchołka p na sumę wag x i y 2.4 umieść wierzchołek p na liście L

Wymagania wobec kodu Podstawowa idea Podsumowanie Algorytm Huffmana generuje optymalny kod, ale jaka jest jego średnia długość l? Twierdzenie: H(S) l H(S) + 1 (3)

Wymagania wobec kodu Podstawowa idea Podsumowanie Istnieje możliwość dokładniejszego oszacowania. Niech P max = max {P(a i )} m i=1 wówczas P max < 0.5 = l H(S) + P max P max 0.5 = l H(S) + P max + 0.086

Wymagania wobec kodu Podstawowa idea Podsumowanie Zalety: kod Huffmana minimalizuje sumę ważoną długości kodów, tj. jest optymalnym kodem prefiksowym procedura budowy drzewa Huffmana jest szybka i prosta w implementacji zarówno kodowanie jak i dekodowanie jest proste i efektywne Wady: do budowy drzewa konieczne są statystyki kodowanej wiadomości do przekazywanej/zapisywanej wiadomości trzeba dołączyć opis drzewa

Cel: stworzenie jednoprzebiegowego algorytmu kodującego Metoda: utrzymywanie drzewa Huffmana obliczonego zgodnie z częstościami wystąpień symboli w dotychczas przetworzonym fragmencie Co zyskamy: tylko jeden przebieg nie trzeba przesyłać drzewa Problem: jak szybko uaktualniać drzewo Huffmana?

Wierzchołkom w drzewie przypisujemy wagę, która dla liści jest równa ilości wystąpień kodowanego symbolu w dotychczasowym tekście, a dla wierzchołków wewnętrznych sumie wag dzieci. Niech M t = a i1 a i2... a ik będzie dotychczas przetworzonym fragmentem. Następna litera a ik+1 będzie zakodowana oraz odkodowana przy użyciu drzewa Huffmana dla M t. Główna trudność: jak szybko zmodyfikować drzewo dla M t aby otrzymać drzewo dla M t+1? Proste zwiększenie o 1 wagi wierzchołka i jego rodziców nie zawsze da drzewo Huffmana. Rozwiązanie: wykorzystać własność sąsiedztwa

Do wyprowadzenia algorytmu wykorzystamy pewną charakteryzację drzew Huffmana: Własność sąsiedztwa Drzewo binarne o p liściach oraz nieujemnych wagach wierzchołków w i jest drzewem Huffmana wtedy i tylko wtedy gdy: 1. waga każdego wierzchołka jest sumą wag jego dzieci 2. istnieje niemalejąca numeracja wierzchołków zgodna z niemalejącym uporządkowaniem według wagi taka, że dla 1 j p 1 wierzchołki 2j 1 i 2j są sąsiadami i ich wspólny rodzic ma wyższy numer

Rozwiązanie: aktualizacje drzewa wykonamy w dwóch fazach: 1. przekształcenie drzewa do takiej postaci, w której proste zwiększenie wagi odpowiednich wierzchołków nie zaburzy własności sąsiedztwa 2. zwiększenie wagi wierzchołka odpowiadającego przetwarzanemu symbolowi i jego rodzicom

Pytanie: co zrobić z drzewem, aby można było po prostu zwiększyć wagi wierzchołków? Odpowiedź: zaczynając od wierzchołka, który odpowiada kodowanemu symbolowi, zamieniać aktualny wierzchołek z wierzchołkiem o najwyższym numerze (w sensie numeracji z własności sąsiedztwa) spośród wierzchołków o tej samej wadze

procedure update; q := wierzchołek odpowiadający otrzymanej literze; if (q = wierzchołek 0) and (k < m - 1) then dodaj q dwoje dzieci (numeracja: lewe, prawe, rodzic) q := prawe dziecko if q jest sąsiadem wierzchołka 0 then zamień q z liściem o tej samej wadze i najw. zwiększ wagę q o 1 q := rodzic q numerze while q nie jest korzeniem zamień q z wierz. o tej samej wadze i najw. num. zwiększ wagę q o 1 q := rodzic q

Obserwacje: zamiany wierzchołków, wykonywane przez algorytm, nie powodują, że drzewo przestaje być drzewem Huffmana dla M t (co wynika z własności sąsiedztwa) po zwiększeniu odpowiednich wag (w drzewie otrzymanym przez wykonanie zamian) dostaniemy drzewo Huffmana dla M t+1 (co ponownie wynika z własności sąsiedztwa)

Ile nas to kosztuje? O ile więcej bitów wygeneruje algorytm FGK w porównaniu z klasycznymi kodami Huffmana? Odpowiedź: Jeżeli S jest ilością bitów wygenerowanych przez oryginalny algorytm Huffmana, S ilością bitów wygenerowanych przez algorytm FGK, a m rozmiarem alfabetu, to zachodzi: S 2S + m (4)

Pytanie: Czy można lepiej? Odpowiedź: Tak, używając algorytmu Vittera można mieć: S < S + m (5)

Podstawowa idea: ograniczyć ilość zamian, w których wierzchołek q porusza się w górę drzewa, do co najwyżej jednego przy każdym wywołaniu update konstruować drzewo w ten sposób, aby minimalizowało nie tylko sumę ważoną długości ścieżek w drzewie j w jl j, ale również sumę nieważoną długości ścieżek j L j oraz długość najdłuższej ścieżki max j {L j } - intuicyjnie powinno to ograniczyć długość słowa kodowego dla następnej litery

Klasyfikacja zamian: wierzchołek q przesuwa się do góry o jeden poziom wierzchołek q zamieniamy z wierzchołkiem z tego samego poziomu wierzchołek q zamieniamy z wierzchołkiem na niższym poziomie wierzchołek q zamieniamy z wierzchołkiem położonym o dwa poziomy wyżej

Niejawna numeracja Pomysł: numerować wierzchołki drzewa w sposób odpowiadający reprezentacji wizualnej: wierzchołki numerujemy w sposób zgodny z poziomami drzewa: wierzchołki na tym samym poziomie mają numery niższe niż te na następnym, wyższym poziomie wierzchołki na tym samym poziomie numerujemy rosnąco od lewej do prawej Gdy używamy niejawnej numeracji, nie będzie zamian typu. Oprócz tego, jeżeli wierzchołek przesuwa się do góry w zamianie typu, to ten, który przesuwa się w dół, jest liściem.

Niezmiennik algorytmu Kluczem do polepszenia algorytmu jest uniknięcie zamian typu poza pierwszą iteracją pętli while. Aby to zrobić będziemy utrzymywać następujący niezmiennik: dla każdej wagi w, wszystkie liście o wadze w poprzedzają w niejawnej numeracji wszystkie wierzchołki wewnętrzne o wadze w Można pokazać, że drzewo Huffmana, które spełnia ten niezmiennik, minimalizuje j L j oraz max j {L j }.

Kilka definicji: blok - klasa równoważności relacji na wierzchołkach drzewa: wierzchołki v i x są w relacji, jeśli mają tą samą wagę oraz obydwa są wierzchołkami lub obydwa są liśćmi (w algorytmie FGK nie zwracaliśmy uwagi na liście/wierzch. wewn.) lider bloku - wierzchołek o najwyższym numerze należący do bloku Bloki są połączone w listę w kolejności rosnącej wagi, blok liści zawsze poprzedza blok wierzchołków wewnętrznych o tej samej wadze.

procedure update; leaftoincrement := 0; q := wierzchołek odpowiadający otrzymanej literze; if (q = wierzchołek 0) and (k < m - 1) then dodaj q dwoje dzieci, prawe odpowiadające literze q := wierzchołek, który właśnie został tatusiem leaftoincrement := prawe dziecko q else zamień q z liderem jego bloku if q jest sąsiadem wierzchołka 0 then leaftoincrement := q; q := rodzic q while q nie jest korzeniem slideandincrement(q); if leaftoincrement 0 then slideandincrement(leaftoincrement);

procedure slideandincrement(p); wt := waga wierzchołka p; b := następny blok na liście po bloku wierzchołka p; if p jest liściem and b jest blokiem wierzch. wewn. o wadze wt or p jest wierzch. wewn. and b jest blokiem liści o wadze wt+1 then zjedź wierzch. p w drzewie w kierunku wierzch. z b p.weight := wt + 1; if p jest liściem then p := nowy rodzic p else p := dawny rodzic p

Podsumowanie długość danych zakodowanych algorytmem Vittera może się różnić od długości danych zakodowanych statycznym algorytmem Huffmana co najwyżej o długość alfabetu algorytm jest dosyć skomplikowany, ale Vitter opublikował jego wzorcową implementację algorytm wymaga specyficznych struktur danych, opisanych dokładnie w pracach Vittera

Wyniki testów Typ Rozmiar Stat. kody FGK Vitter pliku początkowy Huffmana Postscript 506197 334785 334907 334891 BMP 481078 448533 448821 448739 Poczta 1657081 1112169 1112278 1112264 Źródła w C 1331200 778081 778207 778182 WAV 1000000 763453 763933 763717

Współczynnik kompresji Typ Stat. kody FGK Vitter pliku Huffmana Postscript 0,6614 0,6616 0,6616 BMP 0,9323 0,9329 0,9328 Poczta 0,6712 0,6712 0,6712 Źródła w C 0,5845 0,5846 0,5846 WAV 0,7635 0,7639 0,7637 Średnio 0,7226 0,7229 0,7228

Gdzie szukać dalszych informacji: Khalid Sayood, Kompresja danych - wprowadzenie, wydawnictwo Read Me, kwiecień 2002. Jeffrey S. Vitter, Design and Analysis of Dynamic Huffman Codes, JACM Vol. 34, październik 1987. Jeffrey S. Vitter, Dynamic Huffman Coding, ACM Transactions on Mathematical Software Vol. 15, czerwiec 1989.

Długość kodów Huffmana Algorytm Huffmana generuje optymalny kod, ale jaka jest jego średnia długość l? Twierdzenie: H(S) l H(S) + 1 (6)

Długość kodów Huffmana Lemat (Kraft, McMillan): (McMillan) Niech C będzie jednoznacznie dekodowalnym kodem. Niech A = {a 1, a 2,..., a m } będzie alfabetem wejściowym oraz niech l i = C(a i ). Wówczas: m 2 l i 1 (7) i=1 (Kraft) Dla dowolnego ciągu dodatnich liczb całkowitych {l i } m i=1 spełniającego (7) istnieje jednoznacznie dekodowalny kod o długościach {l i } m i=1

Długość kodów Huffmana Wpierw pokażemy, że H(S) l. Prawdopodobieństwo wystąpienia litery a i oznaczmy przez P(a i ). Wtedy mamy: m l = P(a i )l i (8) H(S) l = = = = i=1 i=1 m P(a i ) log P(a i ) i=1 m ( [ 1 P(a i ) log m i=1 m i=1 P(a i ) ( [ 1 P(a i ) log P(a i ) ] [ 2 l i P(a i ) log P(a i ) m P(a i )l i i=1 ] l i ) ] [ ] ) log 2 l i

Długość kodów Huffmana Nierówność Jensena: dla każdej wklęsłej funkcji ( ) f (x) zachodzi: E [f (X )] f (E[X ]) (9) Ponieważ funkcja log jest wklęsła, wobec tego: m [ 2 l i ] [ m H(S) l = P(a i ) log log P(a i ) i=1 i=1 2 l i ] (10) Ponieważ kod jest optymalny, to z lematu Krafta-McMillana (7) mamy że m i=1 2 l i 1, a więc H(S) l 0 co kończy pierwszą część dowodu.

Długość kodów Huffmana Górna granica - wiemy, że kod jest optymalny, więc wystarczy pokazać istnienie kodu takiego, że l H(S) + 1. Zdefiniujmy: 1 l i = log (11) P(a i ) Ponieważ x. ɛ [0, 1). x = x + ɛ to zgodnie z (11) mamy: log 1 P(a i ) l 1 i log P(a i ) + 1 (12)

Długość kodów Huffmana Zauważmy, że z lewej nierówności z (12) mamy: 2 l i P(a i ) wobec czego, sumując obustronnie, otrzymujemy: m 2 l i i=1 m P(a i ) = 1 i=1 skąd z kolei, przez drugą część lematu Krafta-McMillana, istnieje jednoznacznie dekodowalny kod o długościach {l i }. Długość tego kodu możemy oszacować następująco: l = m P(a i )l i < i=1 co kończy dowód. m i=1 [ ] 1 P(a i ) log P(a i ) + 1 = H(S) + 1 (13)