Wprowadzenie. Algorytmy kompresji danych. Sebastian Deorowicz. Politechnika Śląska. Sebastian Deorowicz (PŚl) Wprowadzenie / 60
|
|
- Aleksandra Marcinkowska
- 9 lat temu
- Przeglądów:
Transkrypt
1 Wprowadzenie Algorytmy kompresji danych Sebastian Deorowicz Politechnika Śląska Sebastian Deorowicz (PŚl) Wprowadzenie / 60
2 Plan wykładu 1 Przedmiot Algorytmy Kompresji Danych Cel przedmiotu i jego program Literatura 2 Wprowadzenie do kompresji danych Początki kompresji Prosty algorytm kompresji 3 Metody porównań algorytmów kompresji Kryteria porównań Zestawy testowe 4 Podział algorytmów kompresji Metody specjalizowane i uniwersalne Metody stratne i bezstratne 5 Podstawowe definicje Autoinformacja Entropia Sebastian Deorowicz (PŚl) Wprowadzenie / 60
3 Plan wykładu 1 Przedmiot Algorytmy Kompresji Danych Cel przedmiotu i jego program Literatura 2 Wprowadzenie do kompresji danych Początki kompresji Prosty algorytm kompresji 3 Metody porównań algorytmów kompresji Kryteria porównań Zestawy testowe 4 Podział algorytmów kompresji Metody specjalizowane i uniwersalne Metody stratne i bezstratne 5 Podstawowe definicje Autoinformacja Entropia Sebastian Deorowicz (PŚl) Wprowadzenie / 60
4 Cel przedmiotu Celem przedmiotu jest poznanie współczesnych metod i algorytmów z dziedziny kompresji danych, a także zdobycie umiejętności praktycznego posługiwania się nimi Sebastian Deorowicz (PŚl) Wprowadzenie / 60
5 Wykładowcy i strona przedmiotu Sebastian Deorowicz wpisy Pokój: Sebastian.Deorowicz@polsl.pl WWW: Roman Starosolski Pokój: Roman.Starosolski@polsl.pl WWW: Strona przedmiotu Kurs: Algorytmy Kompresji Danych Hasło: akd Sebastian Deorowicz (PŚl) Wprowadzenie / 60
6 Program wykładów 1 Wprowadzenie do kompresji danych [SD] 2 Podstawy kompresji [SD] 3 Kodowanie Shannona Fano i Huffmana [RS] 4 Kodowanie arytmetyczne [RS] 5 Algorytmy słownikowe [SD] 6 Algorytm predykcji przez częściowe dopasowanie (PPM) [SD] 7 Transformata Burrowsa Wheelera (BWT) cz. 1 [SD] Sebastian Deorowicz (PŚl) Wprowadzenie / 60
7 Program wykładów 8 Transformata Burrowsa Wheelera cz. 2, Wybrane algorytmy specjalizowane cz. 1 [SD] 9 Algorytm kontekstowych drzew ważonych (CTW), Wybrane algorytmy specjalizowane cz. 2 [SD] 10 Bezstratna kompresja obrazów [RS] 11 Stratna kompresja obrazów [RS] 12 Stratna kompresja dźwięku [RS] 13 Kompresja wideo [RS] Sebastian Deorowicz (PŚl) Wprowadzenie / 60
8 Program laboratoriów 1 Podstawy kompresji: Badanie istniejących programów, bibliotek Implementacja algorytmu kompresji z wykorzystaniem bibliotek zlib, libbzip2 2 Modelowanie: Budowa adaptacyjnego probabilistycznego model niskiego rzędu Eksperymenty na jednym z plików z korpusu Calgary 3 Kompresja słownikowa: Implementacja różnych wersji algorytmu kompresji Ziva Lempela 4 Kodowanie arytmetyczne: Eksperymenty z istniejącymi implementacjami kodowania arytmetycznego Połączenie algorytmu kompresji Ziva Lempela z algorytmami kodowania arytmetycznego, klasycznym, RangeCoderem Sebastian Deorowicz (PŚl) Wprowadzenie / 60
9 Tematy projektów (zajęcia 5 7) Stworzenie specjalizowanych kompresorów dla różnego typu danych. Szczegółowe tematy zostaną podane w późniejszym terminie Sebastian Deorowicz (PŚl) Wprowadzenie / 60
10 Plan wykładu 1 Przedmiot Algorytmy Kompresji Danych Cel przedmiotu i jego program Literatura 2 Wprowadzenie do kompresji danych Początki kompresji Prosty algorytm kompresji 3 Metody porównań algorytmów kompresji Kryteria porównań Zestawy testowe 4 Podział algorytmów kompresji Metody specjalizowane i uniwersalne Metody stratne i bezstratne 5 Podstawowe definicje Autoinformacja Entropia Sebastian Deorowicz (PŚl) Wprowadzenie / 60
11 Literatura Literatura podstawowa A. Drozdek, Wprowadzenie do kompresji danych, WNT, Warszawa, 1999 K. Sayood, Kompresja danych. Wprowadzenie, READ ME, Warszawa 2002 W. Skarbek, Multimedia. Algorytmy i standardy kompresji, Akademicka Oficyna Wydawnicza PLJ, Warszawa, 1998 Literatura uzupełniająca K. Sayood (edytor), Lossless Compression Handbook, Academic Press, Elsevier Science, 2003 A. Moffat, A. Turpin, Compression and Coding Algorithms, Kluwer Academic Publishers, 2002 Sebastian Deorowicz (PŚl) Wprowadzenie / 60
12 Literatura Literatura podstawowa A. Drozdek, Wprowadzenie do kompresji danych, WNT, Warszawa, 1999 K. Sayood, Kompresja danych. Wprowadzenie, READ ME, Warszawa 2002 W. Skarbek, Multimedia. Algorytmy i standardy kompresji, Akademicka Oficyna Wydawnicza PLJ, Warszawa, 1998 Literatura uzupełniająca K. Sayood (edytor), Lossless Compression Handbook, Academic Press, Elsevier Science, 2003 A. Moffat, A. Turpin, Compression and Coding Algorithms, Kluwer Academic Publishers, 2002 Sebastian Deorowicz (PŚl) Wprowadzenie / 60
13 Literatura dostępna w Internecie Strony internetowe FAQ grupy comp.compression Strona Strona Strona Strona Sebastian Deorowicz (PŚl) Wprowadzenie / 60
14 Plan wykładu 1 Przedmiot Algorytmy Kompresji Danych Cel przedmiotu i jego program Literatura 2 Wprowadzenie do kompresji danych Początki kompresji Prosty algorytm kompresji 3 Metody porównań algorytmów kompresji Kryteria porównań Zestawy testowe 4 Podział algorytmów kompresji Metody specjalizowane i uniwersalne Metody stratne i bezstratne 5 Podstawowe definicje Autoinformacja Entropia Sebastian Deorowicz (PŚl) Wprowadzenie / 60
15 Czym jest kompresja i po co się ją stosuje? Definition Kompresja metoda reprezentowania danych w zwartej postaci Po co stosować kompresję? Oszczędność miejsca, pieniędzy, czasu transmisji itp. Prędkość wyszukiwania wyszukiwanie w tekście skompresowanym odpowiednim algorytmem może być szybsze niż wyszukiwanie w oryginalnym tekście (tekst wcale nie musi też oznaczać tekstu ludzkiego ale może np. być zapisem DNA) Sebastian Deorowicz (PŚl) Wprowadzenie / 60
16 Czym jest kompresja i po co się ją stosuje? Definition Kompresja metoda reprezentowania danych w zwartej postaci Po co stosować kompresję? Oszczędność miejsca, pieniędzy, czasu transmisji itp. Prędkość wyszukiwania wyszukiwanie w tekście skompresowanym odpowiednim algorytmem może być szybsze niż wyszukiwanie w oryginalnym tekście (tekst wcale nie musi też oznaczać tekstu ludzkiego ale może np. być zapisem DNA) Sebastian Deorowicz (PŚl) Wprowadzenie / 60
17 Początki kompresji Kompresja intuicyjnie Alfabet Morse a Kompresja naukowo C. E. Shannon, A Mathematical Theory of Communication, Bell System Technical Journal, 1948 (http: //cm.bell-labs.com/cm/ms/what/shannonday/shannon1948.pdf) C. E. Shannon, Prediction and entropy of printed English, Bell System Technical Journal, 1951 Sebastian Deorowicz (PŚl) Wprowadzenie / 60
18 Początki kompresji Kompresja intuicyjnie Alfabet Morse a Kompresja naukowo C. E. Shannon, A Mathematical Theory of Communication, Bell System Technical Journal, 1948 (http: //cm.bell-labs.com/cm/ms/what/shannonday/shannon1948.pdf) C. E. Shannon, Prediction and entropy of printed English, Bell System Technical Journal, 1951 Sebastian Deorowicz (PŚl) Wprowadzenie / 60
19 Claude Elwood Shannon ( ) Internet: E._Shannon Ważne daty 1948 Fundamentalna praca będącą początkiem teorii informacji 1949 Znaczący wkład w podstawy matematycznej teorii kryptografii 1949 Matematyczne podstawy teorii próbkowania Nyquista Dodatkowe informacje Miejsca pracy: University of Michigan, Bell Labs, MIT Wyróżnienia: Liczne doktoraty honoris causa i nagrody międzynarodowe Sebastian Deorowicz (PŚl) Wprowadzenie / 60
20 Model komunikacji Shannona Źródło Odbiorca Sebastian Deorowicz (PŚl) Wprowadzenie / 60
21 Model komunikacji Shannona Źródło Kanał transmisyjny Odbiorca Sebastian Deorowicz (PŚl) Wprowadzenie / 60
22 Model komunikacji Shannona Źródło Koder Kanał transmisyjny Dekoder Odbiorca Sebastian Deorowicz (PŚl) Wprowadzenie / 60
23 Model komunikacji Shannona Źródło szumu Źródło Koder Kanał transmisyjny Dekoder Odbiorca Sebastian Deorowicz (PŚl) Wprowadzenie / 60
24 Co może być źródłem? Źródła analogowe przykłady Termometr, barometr Struny głosowe Instrumenty muzyczne Źródła cyfrowe przykłady Klawiatura Telegraf Sebastian Deorowicz (PŚl) Wprowadzenie / 60
25 Co może być źródłem? Źródła analogowe przykłady Termometr, barometr Struny głosowe Instrumenty muzyczne Źródła cyfrowe przykłady Klawiatura Telegraf Sebastian Deorowicz (PŚl) Wprowadzenie / 60
26 Co kompresujemy? Mowa (np. w telefonii komórkowej, internetowej) Muzyka (np. utwory w formacie MP3) Dane video (np. filmy na DVD, w formacie DivX) Teksty (np. udostępniane w archiwach takich jak Project Gutenberg) Pliki wykonywalne (np. wersje instalacyjne oprogramowania) Bazy danych Sebastian Deorowicz (PŚl) Wprowadzenie / 60
27 Co może być kanałem komunikacyjnym? Powietrze Linie telefoniczne Ethernet CD, DVD Dyski magnetyczne Pamięć operacyjna Przestrzeń międzyplanetarna Sebastian Deorowicz (PŚl) Wprowadzenie / 60
28 Samuel Morse ( ) Internet: http: //en.wikipedia.org/wiki/samuel_morse Ważne daty 1837 Wynalezienie elektycznego telegrafu (niezależnie od Wheatstone a) 1838 Wprowadzenie kodu dziś zwanego kodem Morse a Dodatkowe informacje Już od 1838 roku istniały wątpliwości odnośnie pierwszeństwa wprowadzonego kodu i wiele wskazuje na to, że rzeczywistym jego wynalazcą był Alfred Vail Sebastian Deorowicz (PŚl) Wprowadzenie / 60
29 Alfabet Morse a Litery kodowane za pomocą kropek i kresek Stosowany w telegrafii Literom najczęściej występującym odpowiadają najkrótsze kody: e ( ), t ( ) Literom najrzadziej występującym odpowiadają najdłuższe kody: q ( ), j ( ) Sebastian Deorowicz (PŚl) Wprowadzenie / 60
30 Częstość występowania liter w języku angielskim i polskim Język angielski 1 Litera Częstość [%] e 12,70 t 9,06 a 8,17 o 7,51 i 6,97 n 6,75 s 6,33 h 6, k 0,77 j 0,15 x 0,15 q 0,10 z 0,07 Język polski 2 Litera Częstość [%] a 8,82 i 8,60 e 7,79 o 7,29 z 5,82 n 5,30 w 4,21 r 4, ś 0,79 ć 0,51 f 0,21 ń 0,16 ź 0,08 1 Źródło: 2 Źródło: Sebastian Deorowicz (PŚl) Wprowadzenie / 60
31 Częstość występowania liter w języku angielskim i polskim Język angielski 1 Litera Częstość [%] e 12,70 t 9,06 a 8,17 o 7,51 i 6,97 n 6,75 s 6,33 h 6, k 0,77 j 0,15 x 0,15 q 0,10 z 0,07 Język polski 2 Litera Częstość [%] a 8,82 i 8,60 e 7,79 o 7,29 z 5,82 n 5,30 w 4,21 r 4, ś 0,79 ć 0,51 f 0,21 ń 0,16 ź 0,08 1 Źródło: 2 Źródło: Sebastian Deorowicz (PŚl) Wprowadzenie / 60
32 Przykładowe rozmiary danych Pojedynczy obraz jakości telewizyjnej: 0,75 MB Negatyw zdjęcia 35mm ( pikseli, kolor 24-bitowy): 18 MB Zdjęcie rentgenowskie ( pikseli, 12 bitów/piksel): 45 MB Film wideo (100 min) jakości DVD bez kompresji: 180 GB Film wideo (100 min) jakości HD bez kompresji: 850 GB Film wideo (100 min) jakości UltraHD bez kompresji: 19 TB Program monitorowania globalnych zmian w środowisku (NASA, ESA) codziennie generowane jest 500 GB danych Sebastian Deorowicz (PŚl) Wprowadzenie / 60
33 Zalety stosowania kompresji Przesyłanie większej ilości danych w tym samym czasie (np. satelity telekomunikacyjne) Przesyłanie danych w krótszym czasie Praca większej liczby użytkowników na łączu o tej samej przepustowości (np. Internet) Duże rozmiary przechowywanych danych (rozmiary i koszty dysków twardych) Wygoda operowania plikami o mniejszych rozmiarach (film jakości DVD zajmuje jedną płytę DVD, a nie 20) Sebastian Deorowicz (PŚl) Wprowadzenie / 60
34 Wady stosowania kompresji Konieczność wykonania dekompresji przed użyciem danych Czasami wymagana jest duża moc obliczeniowa, aby kompresji/dekompresja mogła być wykonywana w czasie rzeczywistym Sebastian Deorowicz (PŚl) Wprowadzenie / 60
35 Plan wykładu 1 Przedmiot Algorytmy Kompresji Danych Cel przedmiotu i jego program Literatura 2 Wprowadzenie do kompresji danych Początki kompresji Prosty algorytm kompresji 3 Metody porównań algorytmów kompresji Kryteria porównań Zestawy testowe 4 Podział algorytmów kompresji Metody specjalizowane i uniwersalne Metody stratne i bezstratne 5 Podstawowe definicje Autoinformacja Entropia Sebastian Deorowicz (PŚl) Wprowadzenie / 60
36 RLE idea RLE (ang. Run Length Encoding) algorytm 1 Znajdź w sekwencji fragmenty powtarzających się symboli (serie) 2 Każdą serię o długości min. 2 zamień na podwójne wystąpienie powtarzanego symbolu i długość serii (nie trzeba już wliczać do niej tych 2 symboli) Sebastian Deorowicz (PŚl) Wprowadzenie / 60
37 RLE przykład Sekwencja oryginalna Sebastian Deorowicz (PŚl) Wprowadzenie / 60
38 RLE przykład Sekwencja oryginalna Sekwencja skompresowana Sebastian Deorowicz (PŚl) Wprowadzenie / 60
39 RLE historia i zastosowania Historia Pierwszy opis Golomb (1966) Zastosowania Niektóre formaty graficzne (np. PCX, TIFF) Część składowa niektórych bardziej skomplikowanych algorytmów kompresji Sebastian Deorowicz (PŚl) Wprowadzenie / 60
40 RLE historia i zastosowania Historia Pierwszy opis Golomb (1966) Zastosowania Niektóre formaty graficzne (np. PCX, TIFF) Część składowa niektórych bardziej skomplikowanych algorytmów kompresji Sebastian Deorowicz (PŚl) Wprowadzenie / 60
41 Plan wykładu 1 Przedmiot Algorytmy Kompresji Danych Cel przedmiotu i jego program Literatura 2 Wprowadzenie do kompresji danych Początki kompresji Prosty algorytm kompresji 3 Metody porównań algorytmów kompresji Kryteria porównań Zestawy testowe 4 Podział algorytmów kompresji Metody specjalizowane i uniwersalne Metody stratne i bezstratne 5 Podstawowe definicje Autoinformacja Entropia Sebastian Deorowicz (PŚl) Wprowadzenie / 60
42 Jak porównywać algorytmy kompresji? Dane testowe Istniejące zestawy danych testowych korpusy Własne dane testowe Kryteria oceny jakości kompresji Współczynnik kompresji Prędkość kompresji Prędkość dekompresji Problem Wiele kryteriów trudno wybrać jeden najlepszy algorytm Sebastian Deorowicz (PŚl) Wprowadzenie / 60
43 Jak porównywać algorytmy kompresji? Dane testowe Istniejące zestawy danych testowych korpusy Własne dane testowe Kryteria oceny jakości kompresji Współczynnik kompresji Prędkość kompresji Prędkość dekompresji Problem Wiele kryteriów trudno wybrać jeden najlepszy algorytm Sebastian Deorowicz (PŚl) Wprowadzenie / 60
44 Jak porównywać algorytmy kompresji? Dane testowe Istniejące zestawy danych testowych korpusy Własne dane testowe Kryteria oceny jakości kompresji Współczynnik kompresji Prędkość kompresji Prędkość dekompresji Problem Wiele kryteriów trudno wybrać jeden najlepszy algorytm Sebastian Deorowicz (PŚl) Wprowadzenie / 60
45 Miary kompresji Definition Stopień kompresji to stosunek rozmiaru pliku przed kompresją do rozmiaru pliku po kompresji, np. 4:1 Definition Współczynnik kompresji to wyrażony w procentach stosunek rozmiaru pliku po kompresji do rozmiaru pliku przed kompresją, np. 75% Definition Średnia bitowa to stosunek rozmiaru pliku po kompresji wyrażonego w bitach do rozmiaru pliku przed kompresją wyrażonego w symbolach (np. bajtach), np bit/symbol Sebastian Deorowicz (PŚl) Wprowadzenie / 60
46 Miary kompresji Definition Stopień kompresji to stosunek rozmiaru pliku przed kompresją do rozmiaru pliku po kompresji, np. 4:1 Definition Współczynnik kompresji to wyrażony w procentach stosunek rozmiaru pliku po kompresji do rozmiaru pliku przed kompresją, np. 75% Definition Średnia bitowa to stosunek rozmiaru pliku po kompresji wyrażonego w bitach do rozmiaru pliku przed kompresją wyrażonego w symbolach (np. bajtach), np bit/symbol Sebastian Deorowicz (PŚl) Wprowadzenie / 60
47 Miary kompresji Definition Stopień kompresji to stosunek rozmiaru pliku przed kompresją do rozmiaru pliku po kompresji, np. 4:1 Definition Współczynnik kompresji to wyrażony w procentach stosunek rozmiaru pliku po kompresji do rozmiaru pliku przed kompresją, np. 75% Definition Średnia bitowa to stosunek rozmiaru pliku po kompresji wyrażonego w bitach do rozmiaru pliku przed kompresją wyrażonego w symbolach (np. bajtach), np bit/symbol Sebastian Deorowicz (PŚl) Wprowadzenie / 60
48 Plan wykładu 1 Przedmiot Algorytmy Kompresji Danych Cel przedmiotu i jego program Literatura 2 Wprowadzenie do kompresji danych Początki kompresji Prosty algorytm kompresji 3 Metody porównań algorytmów kompresji Kryteria porównań Zestawy testowe 4 Podział algorytmów kompresji Metody specjalizowane i uniwersalne Metody stratne i bezstratne 5 Podstawowe definicje Autoinformacja Entropia Sebastian Deorowicz (PŚl) Wprowadzenie / 60
49 Zestawy testowe korpusy Czym są korpusy? Zestawy danych testowych stosowane do oceny efektywności kompresji Przygotowane przez naukowców zajmujących się daną dziedziną Stosowane w wielu publikacjach różnych autorów Po co stosować korpusy? Możliwość porównania różnych metod kompresji bez konieczności implementowania wszystkich Możliwość zorientowanie się w trakcie prowadzenia badań jak nasz nowy algorytm wypada na tle innych Sebastian Deorowicz (PŚl) Wprowadzenie / 60
50 Zestawy testowe korpusy Czym są korpusy? Zestawy danych testowych stosowane do oceny efektywności kompresji Przygotowane przez naukowców zajmujących się daną dziedziną Stosowane w wielu publikacjach różnych autorów Po co stosować korpusy? Możliwość porównania różnych metod kompresji bez konieczności implementowania wszystkich Możliwość zorientowanie się w trakcie prowadzenia badań jak nasz nowy algorytm wypada na tle innych Sebastian Deorowicz (PŚl) Wprowadzenie / 60
51 Korpusy przykłady Dane ogólnego przeznaczenia Obrazy Korpus Calgary (1989) Canterbury, Large Canterbury (1997) Silesia (2003) Archive Comparison Test (2002) Waterloo GreySet1 (8-bit, pikseli) Waterloo GreySet2 (8-bit, głównie pikseli) Waterloo ColorSet (24-bit, od pikseli do pikseli) Inne (np. obrazy o głębi 48-bit, medyczne) Sebastian Deorowicz (PŚl) Wprowadzenie / 60
52 Korpusy przykłady Dane ogólnego przeznaczenia Obrazy Korpus Calgary (1989) Canterbury, Large Canterbury (1997) Silesia (2003) Archive Comparison Test (2002) Waterloo GreySet1 (8-bit, pikseli) Waterloo GreySet2 (8-bit, głównie pikseli) Waterloo ColorSet (24-bit, od pikseli do pikseli) Inne (np. obrazy o głębi 48-bit, medyczne) Sebastian Deorowicz (PŚl) Wprowadzenie / 60
53 Korpus Calgary (1989) Plik Rozm. Zawartość Typ [KB] bib 109 Dane bibliograficzne dane tekstowe book1 751 Książka T. Hardy ego tekst angielski book2 597 Książka I. Wittena w formacie troffa tekst angielski geo 100 Dane geofizyczne dane binarne news 368 Zapis grup usenetowych tekst angielski obj1 21 Skompilowany kod dla Vaxa plik wykonywalny obj2 241 Skompilowany kod dla Apple Macintosh plik wykonywalny paper1 52 Artykuł nt. kompresji w formacie troffa tekst angielski paper2 80 Artykuł nt. bezp. w formacie troffa tekst angielski pic 501 Obraz zawierający tekst i grafikę obraz progc 37 Kod źródłowy w C program źródłowy progl 70 Kod źródłowy w Lispie program źródłowy progp 48 Kod źródłowy w Pascalu program źródłowy trans 92 Zapis sesji terminala z użyciem Emacsa tekst angielski Razem 3067 Sebastian Deorowicz (PŚl) Wprowadzenie / 60
54 Korpus Calgary cechy Zalety Duża popularność stosowany w wielu publikacjach Łatwość porównania z algorytmami, dla których znane są wyniki dla tego korpusu Wady Trochę przestarzały (1989) Niektóre pliki w formatach dziś już nie stosowanych Małe rozmiary plików Brak plików we współczesnych formatach Sebastian Deorowicz (PŚl) Wprowadzenie / 60
55 Korpus Calgary cechy Zalety Duża popularność stosowany w wielu publikacjach Łatwość porównania z algorytmami, dla których znane są wyniki dla tego korpusu Wady Trochę przestarzały (1989) Niektóre pliki w formatach dziś już nie stosowanych Małe rozmiary plików Brak plików we współczesnych formatach Sebastian Deorowicz (PŚl) Wprowadzenie / 60
56 Inne korpusy ogólnego przeznaczenia Zalety Dane o większych rozmiarach Lepsze odzwierciedlenie typów danych obecnie kompresowanych Wady Mała popularność Współczynniki kompresji często znane tylko dla niektórych metod Źle dobrane dane (np. korpus Canterbury) Sebastian Deorowicz (PŚl) Wprowadzenie / 60
57 Inne korpusy ogólnego przeznaczenia Zalety Dane o większych rozmiarach Lepsze odzwierciedlenie typów danych obecnie kompresowanych Wady Mała popularność Współczynniki kompresji często znane tylko dla niektórych metod Źle dobrane dane (np. korpus Canterbury) Sebastian Deorowicz (PŚl) Wprowadzenie / 60
58 Plan wykładu 1 Przedmiot Algorytmy Kompresji Danych Cel przedmiotu i jego program Literatura 2 Wprowadzenie do kompresji danych Początki kompresji Prosty algorytm kompresji 3 Metody porównań algorytmów kompresji Kryteria porównań Zestawy testowe 4 Podział algorytmów kompresji Metody specjalizowane i uniwersalne Metody stratne i bezstratne 5 Podstawowe definicje Autoinformacja Entropia Sebastian Deorowicz (PŚl) Wprowadzenie / 60
59 Metody specjalizowane i uniwersalne Metody specjalizowane Lepszy współczynnik kompresji Potrzeba stworzenia algorytmu dla konkretnych danych Koszty opracowania algorytmu mogą przewyższyć zyski z jego stosowania Metody uniwersalne Gorszy współczynnik kompresji (często tylko nieznacznie) Możliwość stosowania jednego algorytmu do danych różnych typów Sebastian Deorowicz (PŚl) Wprowadzenie / 60
60 Metody specjalizowane i uniwersalne Metody specjalizowane Lepszy współczynnik kompresji Potrzeba stworzenia algorytmu dla konkretnych danych Koszty opracowania algorytmu mogą przewyższyć zyski z jego stosowania Metody uniwersalne Gorszy współczynnik kompresji (często tylko nieznacznie) Możliwość stosowania jednego algorytmu do danych różnych typów Sebastian Deorowicz (PŚl) Wprowadzenie / 60
61 Metody specjalizowane sonda Galileo Sonda Galileo wysłana przez NASA w kierunku Jowisza W trakcie lotu wykryta awaria głównej anteny komunikacyjnej Możliwa komunikacja przez antenę pomocniczą z prędkością 16b/s (!) Poprawa prędkości komunikacji do 120b/s Zastosowanie specjalizowanej kompresji 10-krotne przyspieszenie prędkości przesyłu danych Sebastian Deorowicz (PŚl) Wprowadzenie / 60
62 Plan wykładu 1 Przedmiot Algorytmy Kompresji Danych Cel przedmiotu i jego program Literatura 2 Wprowadzenie do kompresji danych Początki kompresji Prosty algorytm kompresji 3 Metody porównań algorytmów kompresji Kryteria porównań Zestawy testowe 4 Podział algorytmów kompresji Metody specjalizowane i uniwersalne Metody stratne i bezstratne 5 Podstawowe definicje Autoinformacja Entropia Sebastian Deorowicz (PŚl) Wprowadzenie / 60
63 Metody stratne i bezstratne Metody stratne Po dekompresji nie otrzymujemy dokładnie tego samego co kompresowaliśmy Lepsze współczynniki kompresji Ograniczony zakres zastosowań Metody bezstratne Po dekompresji otrzymujemy dokładnie to samo co kompresowaliśmy Gorsze współczynniki kompresji Szeroki zakres zastosowań Sebastian Deorowicz (PŚl) Wprowadzenie / 60
64 Metody stratne i bezstratne Metody stratne Po dekompresji nie otrzymujemy dokładnie tego samego co kompresowaliśmy Lepsze współczynniki kompresji Ograniczony zakres zastosowań Metody bezstratne Po dekompresji otrzymujemy dokładnie to samo co kompresowaliśmy Gorsze współczynniki kompresji Szeroki zakres zastosowań Sebastian Deorowicz (PŚl) Wprowadzenie / 60
65 Metody bezstratne zastosowania Teksty Bazy danych Obrazy medyczne (!) Programy komputerowe Archiwizacja danych Sebastian Deorowicz (PŚl) Wprowadzenie / 60
66 Metody stratne zastosowania Obrazy Utwory muzyczne Mowa Dane wideo Sebastian Deorowicz (PŚl) Wprowadzenie / 60
67 A może tak zawsze kompresować stratnie? Teksty list do rodziców z kolonii: Mamo przyślij kasę Mamo przyślij kaszę Bazy danych stan konta: zł zł lub zł 200 zł Obrazy rentgenowskie błędna diagnoza Programy komputerowe program zawiesi się albo zacznie wykonywać błędne operacje Sebastian Deorowicz (PŚl) Wprowadzenie / 60
68 Plan wykładu 1 Przedmiot Algorytmy Kompresji Danych Cel przedmiotu i jego program Literatura 2 Wprowadzenie do kompresji danych Początki kompresji Prosty algorytm kompresji 3 Metody porównań algorytmów kompresji Kryteria porównań Zestawy testowe 4 Podział algorytmów kompresji Metody specjalizowane i uniwersalne Metody stratne i bezstratne 5 Podstawowe definicje Autoinformacja Entropia Sebastian Deorowicz (PŚl) Wprowadzenie / 60
69 Podstawowe definicje Definition Istnieje zbiór zdarzeń A = {a 1,..., a n } nazywany alfabetem. Elementy a i tego zbioru nazywamy symbolami Założenie Elementy zbioru A są używane do konstruowania sekwencji (komunikatów), tzn. sekwencja składa się z symboli Założenie Dla każdego symbolu a i znane jest prawdopodobieństwo p(a i ) jego wygenerowania, takie że: n p(a i ) = 1 i=1 Sebastian Deorowicz (PŚl) Wprowadzenie / 60
70 Podstawowe definicje Definition Istnieje zbiór zdarzeń A = {a 1,..., a n } nazywany alfabetem. Elementy a i tego zbioru nazywamy symbolami Założenie Elementy zbioru A są używane do konstruowania sekwencji (komunikatów), tzn. sekwencja składa się z symboli Założenie Dla każdego symbolu a i znane jest prawdopodobieństwo p(a i ) jego wygenerowania, takie że: n p(a i ) = 1 i=1 Sebastian Deorowicz (PŚl) Wprowadzenie / 60
71 Podstawowe definicje Definition Istnieje zbiór zdarzeń A = {a 1,..., a n } nazywany alfabetem. Elementy a i tego zbioru nazywamy symbolami Założenie Elementy zbioru A są używane do konstruowania sekwencji (komunikatów), tzn. sekwencja składa się z symboli Założenie Dla każdego symbolu a i znane jest prawdopodobieństwo p(a i ) jego wygenerowania, takie że: n p(a i ) = 1 i=1 Sebastian Deorowicz (PŚl) Wprowadzenie / 60
72 Autoinformacja definicja Definition Autoinformacja (informacja) związana z wygenerowaniem symbolu a i, którego prawdopodobieństwo wystąpienia wynosi p(a i ) jest definiowana jako: 1 I (a i ) = log k p(a i ) = log k p(a i ) Jednostki autoinformacji Jednostka, w której mierzona jest autoinformacja zależy od podstawy logarytmu: k = 2 bit (ang. bit [binary digit]), k = e nat (ang. nat [natural digit]), k = 10 hartley (od nazwiska Ralpha Hartleya, jednego z pionierów teorii informacji) Sebastian Deorowicz (PŚl) Wprowadzenie / 60
73 Autoinformacja definicja Definition Autoinformacja (informacja) związana z wygenerowaniem symbolu a i, którego prawdopodobieństwo wystąpienia wynosi p(a i ) jest definiowana jako: 1 I (a i ) = log k p(a i ) = log k p(a i ) Jednostki autoinformacji Jednostka, w której mierzona jest autoinformacja zależy od podstawy logarytmu: k = 2 bit (ang. bit [binary digit]), k = e nat (ang. nat [natural digit]), k = 10 hartley (od nazwiska Ralpha Hartleya, jednego z pionierów teorii informacji) Sebastian Deorowicz (PŚl) Wprowadzenie / 60
74 Podstawowe definicje założenia Założenie Jeśli nie będzie zaznaczone inaczej, to w trakcie wszystkich wykładów będziemy przyjmowali domyślnie jako jednostkę bit, a domyślną podstawą logarytmów będzie 2, tzn. log log 2 Sebastian Deorowicz (PŚl) Wprowadzenie / 60
75 Autoinformacja przykład rzutu monetą p(orzeł) = p(reszka) = 1 2 I (a i ) = log 1 p(a i ) = log p(a i) I (Orzeł) = I (Reszka) = 1 bit Sebastian Deorowicz (PŚl) Wprowadzenie / 60
76 Autoinformacja przykład rzutu fałszywą monetą p(orzeł) = 1 8 p(reszka) = 7 8 I (a i ) = log 1 p(a i ) = log p(a i) I (Orzeł) = 3 bit I (Reszka) = bit Sebastian Deorowicz (PŚl) Wprowadzenie / 60
77 Plan wykładu 1 Przedmiot Algorytmy Kompresji Danych Cel przedmiotu i jego program Literatura 2 Wprowadzenie do kompresji danych Początki kompresji Prosty algorytm kompresji 3 Metody porównań algorytmów kompresji Kryteria porównań Zestawy testowe 4 Podział algorytmów kompresji Metody specjalizowane i uniwersalne Metody stratne i bezstratne 5 Podstawowe definicje Autoinformacja Entropia Sebastian Deorowicz (PŚl) Wprowadzenie / 60
78 Entropia definicja Definition Entropia stowarzyszona ze zbiorem n niezależnych zdarzeń A = {a 1,..., a n } i ze zbiorem prawdopodobieństw ich zajścia P = {p(a 1 ),..., p(a n )} jest definiowana jako: Intuicja H(A) = n p(a i )I (a i ) = i=1 n p(a i ) log p(a i ) Innymi słowy entropia jest to średnia autoinformacja związana z eksperymentem losowym polegającym na wygenerowaniu symbolu przy założonych prawdopodobieństwach wygenerowania symboli z alfabetu i=1 Sebastian Deorowicz (PŚl) Wprowadzenie / 60
79 Entropia definicja Definition Entropia stowarzyszona ze zbiorem n niezależnych zdarzeń A = {a 1,..., a n } i ze zbiorem prawdopodobieństw ich zajścia P = {p(a 1 ),..., p(a n )} jest definiowana jako: Intuicja H(A) = n p(a i )I (a i ) = i=1 n p(a i ) log p(a i ) Innymi słowy entropia jest to średnia autoinformacja związana z eksperymentem losowym polegającym na wygenerowaniu symbolu przy założonych prawdopodobieństwach wygenerowania symboli z alfabetu i=1 Sebastian Deorowicz (PŚl) Wprowadzenie / 60
80 Entropia przykład rzutu monetą p(orzeł) = 1 2 p(reszka) = 1 2 n H(A) = p(a i ) log p(a i ) i=1 H(A) = bit bit = 1 bit 2 Sebastian Deorowicz (PŚl) Wprowadzenie / 60
81 Entropia przykład rzutu fałszywą monetą p(orzeł) = 1 8 p(reszka) = 7 8 n H(A) = p(a i ) log p(a i ) i=1 H(A) = bit bit = bit 8 Sebastian Deorowicz (PŚl) Wprowadzenie / 60
82 Entropia wykres dla alfabetu binarnego H 1 A = {a 1, a 2 } p(a 1 ) p p(a 2 ) 1 p p Sebastian Deorowicz (PŚl) Wprowadzenie / 60
83 Entropia cechy Cechy funkcji entropii Funkcja ciągła Funkcja symetryczna Dolne ograniczenie: 0 bit Górne ograniczenie: log n bit Sebastian Deorowicz (PŚl) Wprowadzenie / 60
84 Koniec Na dziś to wszystko... Sebastian Deorowicz (PŚl) Wprowadzenie / 60
Przetwarzanie i transmisja danych multimedialnych
Przetwarzanie i transmisja danych multimedialnych Przemysław Sękalski sekalski@dmcs.pl Politechnika Łódzka Katedra Mikroelektroniki i Technik Informatycznych DMCS 1 Organizacja zajęć Wykład: Laboratoria:
Bardziej szczegółowoKompresja Kodowanie arytmetyczne. Dariusz Sobczuk
Kompresja Kodowanie arytmetyczne Dariusz Sobczuk Kodowanie arytmetyczne (lata 1960-te) Pierwsze prace w tym kierunku sięgają początków lat 60-tych XX wieku Pierwszy algorytm Eliasa nie został opublikowany
Bardziej szczegółowoEntropia Kodowanie. Podstawy kompresji. Algorytmy kompresji danych. Sebastian Deorowicz
Algorytmy kompresji danych 2007 02 27 Plan wykładu 1 Modelowanie i kodowanie 2 Modelowanie i kodowanie Plan wykładu 1 Modelowanie i kodowanie 2 Modelowanie i kodowanie definicja stowarzyszona ze zbiorem
Bardziej szczegółowoPodstawowe pojęcia. Teoria informacji
Kodowanie i kompresja informacji - Wykład 1 22 luty 2010 Literatura K. Sayood, Kompresja danych - wprowadzenie, READ ME 2002 (ISBN 83-7243-094-2) Literatura K. Sayood, Kompresja danych - wprowadzenie,
Bardziej szczegółowoAKD Metody słownikowe
AKD Metody słownikowe Algorytmy kompresji danych Sebastian Deorowicz 2009 03 19 Sebastian Deorowicz () AKD Metody słownikowe 2009 03 19 1 / 38 Plan wykładu 1 Istota metod słownikowych 2 Algorytm Ziva Lempela
Bardziej szczegółowoPrzetwarzanie i transmisja danych multimedialnych. Wykład 2 Podstawy kompresji. Przemysław Sękalski.
Przetwarzanie i transmisja danych multimedialnych Wykład Podstawy kompresji Przemysław Sękalski sekalski@dmcs.pl Politechnika Łódzka Katedra Mikroelektroniki i Technik Informatycznych DMCS Zawartość wykładu.
Bardziej szczegółowoteoria informacji Entropia, informacja, kodowanie Mariusz Różycki 24 sierpnia 2015
teoria informacji Entropia, informacja, kodowanie Mariusz Różycki 24 sierpnia 2015 1 zakres materiału zakres materiału 1. Czym jest teoria informacji? 2. Wprowadzenie matematyczne. 3. Entropia i informacja.
Bardziej szczegółowoTemat: Algorytm kompresji plików metodą Huffmana
Temat: Algorytm kompresji plików metodą Huffmana. Wymagania dotyczące kompresji danych Przez M oznaczmy zbiór wszystkich możliwych symboli występujących w pliku (alfabet pliku). Przykład M = 2, gdy plik
Bardziej szczegółowoteoria informacji Kanały komunikacyjne, kody korygujące Mariusz Różycki 25 sierpnia 2015
teoria informacji Kanały komunikacyjne, kody korygujące Mariusz Różycki 25 sierpnia 2015 1 wczoraj Wprowadzenie matematyczne. Entropia i informacja. Kodowanie. Kod ASCII. Stopa kodu. Kody bezprefiksowe.
Bardziej szczegółowoWybrane metody kompresji obrazów
Wybrane metody kompresji obrazów Celem kodowania kompresyjnego obrazu jest redukcja ilości informacji w nim zawartej. Redukcja ta polega na usuwaniu informacji nadmiarowej w obrazie, tzw. redundancji.
Bardziej szczegółowoKodowanie predykcyjne
Kodowanie i kompresja informacji - Wykład 5 22 marca 2010 Motywacje W tekstach naturalnych symbole bardzo często zależa od siebie. Motywacje W tekstach naturalnych symbole bardzo często zależa od siebie.
Bardziej szczegółowoTIMKoD - Lab 1 - Przybliżenie języka naturalnego
TIMKoD - Lab 1 - Przybliżenie języka naturalnego 28 lutego 2018 Opis pliku z zadaniami Wszystkie zadania na zajęciach będą przekazywane w postaci plików.pdf, sformatowanych podobnie do tego dokumentu.
Bardziej szczegółowoPrzetwarzanie i transmisja danych multimedialnych. Wykład 3 Kodowanie Shannona Fano i Huffmana. Przemysław Sękalski.
Przetwarzanie i transmisja danych multimedialnych Wykład 3 Kodowanie Shannona Fano i Huffmana Przemysław Sękalski sekalski@dmcs.pl Politechnika Łódzka Katedra Mikroelektroniki i Technik Informatycznych
Bardziej szczegółowoWygra Polska czy Brazylia, czyli o tym jak zwięźle zapisywać informacje
Wygra Polska czy Brazylia, czyli o tym jak zwięźle zapisywać informacje Witold Tomaszewski Instytut Matematyki Politechniki Śląskiej e-mail: Witold.Tomaszewski@polsl.pl Je n ai fait celle-ci plus longue
Bardziej szczegółowomgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 4, strona 1. GOLOMBA I RICE'A
mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 4, strona 1. KOMPRESJA ALGORYTMEM ARYTMETYCZNYM, GOLOMBA I RICE'A Idea algorytmu arytmetycznego Przykład kodowania arytmetycznego Renormalizacja
Bardziej szczegółowoAlgorytmy kompresji. Kodowanie Huffmana, kodowanie arytmetyczne
Algorytmy kompresji Kodowanie Huffmana, kodowanie arytmetyczne Kodowanie arytmetyczne Peter Elias 1923-2001 Kodowanie arytmetyczne to metoda kodowania źródłowego dyskretnych źródeł sygnałów, stosowana
Bardziej szczegółowoAlgorytmy kodowania entropijnego
Algorytmy kodowania entropijnego 1. Kodowanie Shannona-Fano 2. Kodowanie Huffmana 3. Jednoznaczność kodów Huffmana. Kod o minimalnej wariancji 4. Dynamiczne kodowanie Huffmana Poprzedni wykład - podsumowanie
Bardziej szczegółowoZESPÓŁ LABORATORIÓW TELEMATYKI TRANSPORTU ZAKŁAD TELEKOMUNIKACJI W TRANSPORCIE WYDZIAŁ TRANSPORTU POLITECHNIKI WARSZAWSKIEJ
ZESPÓŁ ABORATORIÓW TEEMATYKI TRANSPORTU ZAKŁAD TEEKOMUNIKACJI W TRANSPORCIE WYDZIAŁ TRANSPORTU POITECHNIKI WARSZAWSKIEJ ABORATORIUM Telekomunikacji Kolejowej INSTRUKCJA DO ĆWICZENIA NR 5 Kompresja danych
Bardziej szczegółowoCyfrowe przetwarzanie i kompresja danych. dr inż.. Wojciech Zając
Cyfrowe przetwarzanie i kompresja danych dr inż.. Wojciech Zając Wykład 7. Standardy kompresji obrazów nieruchomych Obraz cyfrowy co to takiego? OBRAZ ANALOGOWY OBRAZ CYFROWY PRÓBKOWANY 8x8 Kompresja danych
Bardziej szczegółowoKompresja danych kodowanie Huffmana. Dariusz Sobczuk
Kompresja danych kodowanie Huffmana Dariusz Sobczuk Plan wykładu Kodowanie metodą Shannona-Fano Kodowanie metodą Huffmana Elementarny kod Golomba Kod Golomba Kod Rice a kompresja danych 2 Efektywny kod
Bardziej szczegółowoFundamentals of Data Compression
Załącznik nr 7 do Zarządzenia Rektora nr 10/12 z dnia 21 lutego 2012r. KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Obowiązuje od roku akademickiego 2012/2013
Bardziej szczegółowoWprowadzenie do informatyki i użytkowania komputerów. Kodowanie informacji System komputerowy
1 Wprowadzenie do informatyki i użytkowania komputerów Kodowanie informacji System komputerowy Kodowanie informacji 2 Co to jest? bit, bajt, kod ASCII. Jak działa system komputerowy? Co to jest? pamięć
Bardziej szczegółowoWYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU
Zał. nr do ZW WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU Nazwa w języku polskim Analiza sygnałów Nazwa w języku angielskim Signal analysis Kierunek studiów (jeśli dotyczy): Matematyka stosowana
Bardziej szczegółowoTeoria informacji i kodowania Ćwiczenia
Teoria informacji i kodowania Ćwiczenia Piotr Chołda, Andrzej Kamisiński Katedra Telekomunikacji Akademii Górniczo-Hutniczej Kod źródłowy Kodem źródłowym nazywamy funkcję różnowartościową, która elementom
Bardziej szczegółowoKodowanie i kompresja Streszczenie Studia dzienne Wykład 9,
1 Kody Tunstalla Kodowanie i kompresja Streszczenie Studia dzienne Wykład 9, 14.04.2005 Inne podejście: słowa kodowe mają ustaloną długość, lecz mogą kodować ciągi liter z alfabetu wejściowego o różnej
Bardziej szczegółowoKodowanie informacji
Kodowanie informacji Tomasz Wykład 4: kodowanie arytmetyczne Motywacja Podstawy i własności Liczby rzeczywiste Motywacje 1 średnia długość kodu Huffmana może odbiegać o p max + 0.086 od entropii, gdzie
Bardziej szczegółowoKompresja Stratna i Bezstratna Przegląd Najważniejszych Formatów Graficznych
Kompresja Stratna i Bezstratna Przegląd Najważniejszych Formatów Graficznych Idea Kompresji Kompresja danych - polega na zmianie sposobu zapisu informacji w taki sposób, aby zmniejszyć redundancję czyli
Bardziej szczegółowomgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 1, strona 1.
mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 1, strona 1. SYSTEMY MULTIMEDIALNE Co to jest system multimedialny? Elementy systemu multimedialnego Nośniki danych i ich wpływ na kodowanie Cele
Bardziej szczegółowoWYDZIAŁ MATEMATYKI KARTA PRZEDMIOTU
Zał. nr do ZW WYDZIAŁ MATEMATYKI KARTA PRZEDMIOTU Nazwa w języku polskim PODSTAWY TEORII INFORMACJI Nazwa w języku angielskim Introduction to Information Theory Kierunek studiów (jeśli dotyczy): Matematyka
Bardziej szczegółowoZałożenia i obszar zastosowań. JPEG - algorytm kodowania obrazu. Geneza algorytmu KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG
Założenia i obszar zastosowań KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG Plan wykładu: Geneza algorytmu Założenia i obszar zastosowań JPEG kroki algorytmu kodowania obrazu Założenia: Obraz monochromatyczny
Bardziej szczegółowoTechnologie cyfrowe. Artur Kalinowski. Zakład Cząstek i Oddziaływań Fundamentalnych Pasteura 5, pokój 4.15 Artur.Kalinowski@fuw.edu.
Technologie cyfrowe Artur Kalinowski Zakład Cząstek i Oddziaływań Fundamentalnych Pasteura 5, pokój 4.15 Artur.Kalinowski@fuw.edu.pl Semestr letni 2014/2015 Organizacja zajęć Wykład: czwartek 14:15 16:00,
Bardziej szczegółowoWedług raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j
Kompresja transformacyjna. Opis standardu JPEG. Algorytm JPEG powstał w wyniku prac prowadzonych przez grupę ekspertów (ang. Joint Photographic Expert Group). Prace te zakończyły się w 1991 roku, kiedy
Bardziej szczegółowoĆwiczenie nr 4: Kodowanie arytmetyczne, range coder
Algorytmy Kompresji Danych Laboratorium Ćwiczenie nr 4: Kodowanie arytmetyczne, range coder 1. Zapoznać się z opisem implementacji kodera entropijnego range coder i modelem danych opracowanym dla tego
Bardziej szczegółowoElementy teorii informacji i kodowania
i kodowania Entropia, nierówność Krafta, kodowanie optymalne Marcin Jenczmyk m.jenczmyk@knm.katowice.pl 17 kwietnia 2015 M. Jenczmyk Spotkanie KNM i kodowania 1 / 20 Niech S = {x 1,..., x q } oznacza alfabet,
Bardziej szczegółowoKlasyfikacja metod kompresji
dr inż. Piotr Odya Klasyfikacja metod kompresji Metody bezstratne Zakodowany strumień danych po dekompresji jest identyczny z oryginalnymi danymi przed kompresją, Metody stratne W wyniku kompresji część
Bardziej szczegółowoKlasyfikacja metod kompresji
dr inż. Piotr Odya Klasyfikacja metod kompresji Metody bezstratne Zakodowany strumień danych po dekompresji jest identyczny z oryginalnymi danymi przed kompresją, Metody stratne W wyniku kompresji część
Bardziej szczegółowoWykład III: Kompresja danych. Studia Podyplomowe INFORMATYKA Podstawy Informatyki
Studia Podyplomowe INFORMATYKA Podstawy Informatyki Wykład III: Kompresja danych 1 I. Reprezentacja danych w komputerze Rodzaje danych w technice cyfrowej 010010101010 001010111010 101101001001 2 Kompresja
Bardziej szczegółowoModuł 2 Użytkowanie komputerów i zarządzanie plikami wymaga od kandydata znajomości obsługi komputera osobistego.
Moduł 2 Użytkowanie komputerów i zarządzanie plikami wymaga od kandydata znajomości obsługi komputera osobistego. Kandydat winien wykazać się wiedzą i umiejętnościami w zakresie: - korzystania z głównych
Bardziej szczegółowoTechnologie cyfrowe semestr letni 2018/2019
Technologie cyfrowe semestr letni 2018/2019 Tomasz Kazimierczuk Dyski optyczne http://en.wikipedia.org/wiki/optical_disc CC BY-SA 3.0 Zapis audio CD Standardowa płyta CD: 333 000 sektorów Sektor: 2352
Bardziej szczegółowoTemat 5. 20 pytań Teoria informacji
Temat 5 20 pytań Teoria informacji Streszczenie Ile informacji znajduje się w tysiącstronicowej książce? Czy więcej informacji znajduje się w książce telefonicznej, na 1000 stron tradycyjnych wydruków
Bardziej szczegółowoZastosowanie kompresji w kryptografii Piotr Piotrowski
Zastosowanie kompresji w kryptografii Piotr Piotrowski 1 Plan prezentacji I. Wstęp II. Kryteria oceny algorytmów III. Główne klasy algorytmów IV. Przykłady algorytmów selektywnego szyfrowania V. Podsumowanie
Bardziej szczegółowoTeoria Informacji - wykład. Kodowanie wiadomości
Teoria Informacji - wykład Kodowanie wiadomości Definicja kodu Niech S={s 1, s 2,..., s q } oznacza dany zbiór elementów. Kodem nazywamy wówczas odwzorowanie zbioru wszystkich możliwych ciągów utworzonych
Bardziej szczegółowoGranica kompresji Kodowanie Shannona Kodowanie Huffmana Kodowanie ciągów Kodowanie arytmetyczne. Kody. Marek Śmieja. Teoria informacji 1 / 35
Kody Marek Śmieja Teoria informacji 1 / 35 Entropia Entropia określa minimalną statystyczną długość kodowania (przyjmijmy dla prostoty że alfabet kodowy A = {0, 1}). Definicja Niech X = {x 1,..., x n }
Bardziej szczegółowoTematy projektów Algorytmy Kompresji Danych (2006)
Tematy projektów Algorytmy Kompresji Danych (2006) Projekt nr 1 Temat: Kompresor plików w formacie.dbf Opracować algorytm kompresji plików w formacie.dbf. W algorytmie należy wykorzystać znajomość struktury
Bardziej szczegółowoJak zadać dobre pytanie, czyli czym jest informacja i jak ja
Jak zadać dobre pytanie, czyli czym jest informacja i jak ja zmierzyć Adam Doliwa doliwa@matman.uwm.edu.pl WYKŁAD Z CYKLU NIEZWYKŁA MATEMATYKA WYDZIAŁ MATEMATYKI I INFORMATYKI UWM Olsztyn, 28 września
Bardziej szczegółowoPrzygotowali: Bartosz Szatan IIa Paweł Tokarczyk IIa
Przygotowali: Bartosz Szatan IIa Paweł Tokarczyk IIa Dźwięk wrażenie słuchowe, spowodowane falą akustyczną rozchodzącą się w ośrodku sprężystym (ciele stałym, cieczy, gazie). Częstotliwości fal, które
Bardziej szczegółowoKompresja bezstratna. Entropia. Kod Huffmana
Kompresja bezstratna. Entropia. Kod Huffmana Kodowanie i bezpieczeństwo informacji - Wykład 10 29 kwietnia 2013 Teoria informacji Jeśli P(A) jest prawdopodobieństwem wystapienia informacji A to niech i(a)
Bardziej szczegółowoWykład II. Reprezentacja danych w technice cyfrowej. Studia Podyplomowe INFORMATYKA Podstawy Informatyki
Studia Podyplomowe INFORMATYKA Podstawy Informatyki Wykład II Reprezentacja danych w technice cyfrowej 1 III. Reprezentacja danych w komputerze Rodzaje danych w technice cyfrowej 010010101010 001010111010
Bardziej szczegółowoTechnologie cyfrowe semestr letni 2018/2019
Technologie cyfrowe semestr letni 2018/2019 Tomasz Kazimierczuk Kompresja Kompresja bezstratna: z postaci skompresowanej można odtworzyć całkowitą informację wejściową. Kompresja polega na zastosowaniu
Bardziej szczegółowoCo to jest dźwięk. Dźwięk to wyrażenie słuchowe wywołane przez falę akustyczną. Ludzki narząd wyłapuje dźwięki z częstotliwością 16 do 20 Hz
Dźwięk Co to jest dźwięk Dźwięk to wyrażenie słuchowe wywołane przez falę akustyczną. Ludzki narząd wyłapuje dźwięki z częstotliwością 16 do 20 Hz Próbkowanie Cyfrowy zapis dźwięku opiera się na procedurze
Bardziej szczegółowoKodowanie Huffmana. Platforma programistyczna.net; materiały do laboratorium 2014/15 Marcin Wilczewski
Kodowanie Huffmana Platforma programistyczna.net; materiały do laboratorium 24/5 Marcin Wilczewski Algorytm Huffmana (David Huffman, 952) Algorytm Huffmana jest popularnym algorytmem generującym optymalny
Bardziej szczegółowoKody Tunstalla. Kodowanie arytmetyczne
Kody Tunstalla. Kodowanie arytmetyczne Kodowanie i kompresja informacji - Wykład 3 8 marca 2010 Kody Tunstalla Wszystkie słowa kodowe maja ta sama długość ale jeden kod może kodować różna liczbę liter
Bardziej szczegółowoWstęp Statyczne kody Huffmana Dynamiczne kody Huffmana Praktyka. Kodowanie Huffmana. Dawid Duda. 4 marca 2004
4 marca 2004 Podstawowe oznaczenia i definicje Wymagania wobec kodu Podstawowa idea Podsumowanie Podstawowe oznaczenia i definicje Podstawowe oznaczenia i definicje: alfabet wejściowy: A = {a 1, a 2,...,
Bardziej szczegółowodr inż. Piotr Odya Wprowadzenie
dr inż. Piotr Odya Wprowadzenie Dane multimedialne to przede wszystkim duże strumienie danych liczone w MB a coraz częściej w GB; Mimo dynamicznego rozwoju technologii pamięci i coraz szybszych transferów
Bardziej szczegółowoTeoria informacji i kodowania Ćwiczenia Sem. zimowy 2016/2017
Kody źródłowe jednoznacznie dekodowalne Zadanie Ile najwięcej słów kodowych może liczyć kod binarny jednoznacznie dekodowalny, którego najdłuższe słowo ma siedem liter? (Odp. 28) Zadanie 2 Zbiór sześciu
Bardziej szczegółowoPrzetwarzanie i transmisja danych multimedialnych. Wykład 5 Kodowanie słownikowe. Przemysław Sękalski.
Przetwarzanie i transmisja danych multimedialnych Wykład 5 Kodowanie słownikowe Przemysław Sękalski sekalski@dmcs.pl Politechnika Łódzka Katedra Mikroelektroniki i Technik Informatycznych DMCS Przemysław
Bardziej szczegółowoKwantowanie sygnałów analogowych na przykładzie sygnału mowy
Kwantowanie sygnałów analogowych na przykładzie sygnału mowy Treść wykładu: Sygnał mowy i jego właściwości Kwantowanie skalarne: kwantyzator równomierny, nierównomierny, adaptacyjny Zastosowanie w koderze
Bardziej szczegółowoModulacja i kodowanie. Labolatorium. Kodowanie źródłowe Kod Huffman a
Modulacja i kodowanie Labolatorium Kodowanie źródłowe Kod Huffman a W tym ćwiczeniu zajmiemy się kodowaniem źródłowym (source coding). 1. Kodowanie źródłowe Głównym celem kodowanie źródłowego jest zmniejszenie
Bardziej szczegółowoDla człowieka naturalnym sposobem liczenia jest korzystanie z systemu dziesiętnego, dla komputera natomiast korzystanie z zapisu dwójkowego
Arytmetyka cyfrowa Dla człowieka naturalnym sposobem liczenia jest korzystanie z systemu dziesiętnego, dla komputera natomiast korzystanie z zapisu dwójkowego (binarnego). Zapis binarny - to system liczenia
Bardziej szczegółowoFORMATY PLIKÓW GRAFICZNYCH
FORMATY PLIKÓW GRAFICZNYCH Różnice między nimi. Ich wady i zalety. Marta Łukasik Plan prezentacji Formaty plików graficznych Grafika wektorowa Grafika rastrowa GIF PNG JPG SAV FORMATY PLIKÓW GRAFICZNYCH
Bardziej szczegółowoJęzyki i metodyka programowania. Reprezentacja danych w systemach komputerowych
Reprezentacja danych w systemach komputerowych Kod (łac. codex - spis), ciąg składników sygnału (kombinacji sygnałów elementarnych, np. kropek i kresek, impulsów prądu, symboli) oraz reguła ich przyporządkowania
Bardziej szczegółowoALGORYTMY BEZSTRATNEJ KOMPRESJI DANYCH
STUDIA INFORMATICA 2003 Volume 24 Number 1 (52) Roman STAROSOLSKI Politechnika Śląska, Instytut Informatyki ALGORYTMY BEZSTRATNEJ KOMPRESJI DANYCH Streszczenie. W artykule, po omówieniu podstawowych pojęć
Bardziej szczegółowoWprowadzenie Algorytm ByteRun ByteRun - przykład Algorytm RLE Przykład działania RLE Algorytm LZW Przykład kompresji LZW
mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 2, strona 1. PROSTE ALGORYTMY KOMPRESJI BEZSTRATNEJ Wprowadze Algorytm ByteRun ByteRun - przykład Algorytm RLE Przykład działania RLE Algorytm
Bardziej szczegółowoKOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG
KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG Joint Photographic Expert Group - 1986 ISO - International Standard Organisation CCITT - Comité Consultatif International de Téléphonie et Télégraphie Standard
Bardziej szczegółowodr hab. inż. Lidia Jackowska-Strumiłło, prof. PŁ Instytut Informatyki Stosowanej, PŁ
Wydział Elektrotechniki, Elektroniki, Informatyki i Automatyki Politechnika Łódzka Środowisko pracy grafików dr hab. inż. Lidia Jackowska-Strumiłło, prof. PŁ Instytut Informatyki Stosowanej, PŁ Formaty
Bardziej szczegółowomgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 3, strona 1.
mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 3, strona 1. KOMPRESJA ALGORYTMEM HUFFMANA I LZ77 Idea algorytmu Huffmana Huffman kontra LZW Sposób tworzenia słownika Etapy budowy drzewa kodu
Bardziej szczegółowoPodstawy kompresji danych
Podstawy kompresji danych Pojęcie kompresji W ogólności kompresja (kodowanie) jest procedurą (przekształceniem) zmiany reprezentacji wejściowego zbioru danych do postaci wymagającej mniejszej liczby bitów
Bardziej szczegółowoMOŻLIWOŚĆ WYBRANYCH METOD KOMPRESJI OBRAZÓW W DIGITALIZACJI ZBIORÓW BIBLIOTECZNYCH
Marcin BRODKA Politechnika Śląska Biblioteka Główna MOŻLIWOŚĆ WYBRANYCH METOD KOMPRESJI OBRAZÓW W DIGITALIZACJI ZBIORÓW BIBLIOTECZNYCH Charakterystycznym znakiem czasu jest nadmiar informacji. Dostarczana
Bardziej szczegółowoKodowanie informacji. Przygotował: Ryszard Kijanka
Kodowanie informacji Przygotował: Ryszard Kijanka Komputer jest urządzeniem służącym do przetwarzania informacji. Informacją są liczby, ale także inne obiekty, takie jak litery, wartości logiczne, obrazy
Bardziej szczegółowo1. Wprowadzenie 1.1. Zdefiniowanie problemu badawczego
Spis treści 3 Spis treści Spis ważniejszych oznaczeń... 7 1. Wprowadzenie... 9 1.1. Zdefiniowanie problemu badawczego... 9 1.2. Istniejące rozwiązania bezstratnej kompresji obrazów... 10 1.3. Cel i zakres
Bardziej szczegółowoNiech x 1,..., x n będzie ciągiem zdarzeń. ---
Matematyczne podstawy kryptografii, Ćw2 TEMAT 7: Teoria Shannona. Kody Huffmana, entropia. BIBLIOGRAFIA: [] Cz. Bagiński, cez.wipb.pl, [2] T. H. Cormen, C. E. Leiserson, R. L Rivest, Wprowadzenie do algorytmów,
Bardziej szczegółowoKwantyzacja wektorowa. Kodowanie różnicowe.
Kwantyzacja wektorowa. Kodowanie różnicowe. Kodowanie i kompresja informacji - Wykład 7 12 kwietnia 2010 Kwantyzacja wektorowa wprowadzenie Zamiast kwantyzować pojedyncze elementy kwantyzujemy całe bloki
Bardziej szczegółowoKompresja danych - wprowadzenie. 1. Konieczno kompresji 2. Definicja, typy kompresji 3. Modelowanie 4. Podstawy teorii informacji 5.
Kompresja danych - wprowadzenie. Konieczno kompresji. Definicja, typy kompresji. Modelowanie 4. Podstawy teorii informacji 5. Kodowanie Konieczno kompresji danych Due rozmiary danych Niewystarczajce przepustowoci
Bardziej szczegółowoFormaty kompresji audio
Formaty kompresji audio Kompresja bezstratna Kompresja bezstratna zachowuje pełną informację o przebiegu sygnału dźwiękowego. Polega ona na sprytnej zmianie sposobu zapisu danych, dzięki czemu zapis jest
Bardziej szczegółowoPrzykładowe zagadnienia na sprawdzian z wiedzy ogólnej. Linux to nazwa: A. Programu biurowego. B. Systemu operacyjnego. C. Przeglądarki internetowej.
Przykładowe zagadnienia na sprawdzian z wiedzy ogólnej Linux to nazwa: A. Programu biurowego. B. Systemu operacyjnego. C. Przeglądarki internetowej. Przycisk RESET znajdujący się na obudowie komputera,
Bardziej szczegółowoDefinicja. Jeśli. wtedy
Definicja Jeśli wtedy Cel kompresji: zredukowanie do minimum oczekiwanego (średniego) kosztu gdzie l i jest długością słowa kodu c i kodującego symbol a i Definicja Definicje Efektywność kodowania określamy
Bardziej szczegółowoGenerowanie ciągów bitów losowych z wykorzystaniem sygnałów pochodzących z komputera
Generowanie ciągów bitów losowych z wykorzystaniem sygnałów pochodzących z komputera Praca dyplomowa magisterska Opiekun: prof. nzw. Zbigniew Kotulski Andrzej Piasecki apiaseck@mion.elka.pw.edu.pl Plan
Bardziej szczegółowoWykład I: Kodowanie liczb w systemach binarnych. Studia Podyplomowe INFORMATYKA Podstawy Informatyki
Studia Podyplomowe INFORMATYKA Podstawy Informatyki Wykład I: Kodowanie liczb w systemach binarnych 1 Część 1 Dlaczego system binarny? 2 I. Dlaczego system binarny? Pojęcie bitu Bit jednostka informacji
Bardziej szczegółowoNiezawodność i diagnostyka systemów cyfrowych projekt 2015
Niezawodność i diagnostyka systemów cyfrowych projekt 2015 Jacek Jarnicki jacek.jarnicki@pwr.edu.pl Zajęcia wprowadzające 1. Cel zajęć projektowych 2. Etapy realizacji projektu 3. Tematy zadań do rozwiązania
Bardziej szczegółowoFormaty plików. graficznych, dźwiękowych, wideo
Formaty plików graficznych, dźwiękowych, wideo Spis treści: Wstęp: Co to jest format? Rodzaje formatów graficznych Właściwości formatów graficznych Porównanie formatów między sobą Formaty plików dźwiękowych
Bardziej szczegółowoO oszczędnym dziennikarzu, czyli czym jest
O oszczędnym dziennikarzu, czyli czym jest informacja i jak ja mierzymy? Adam Doliwa doliwa@matman.uwm.edu.pl WYKŁAD DLA MŁODZIEŻY WYDZIAŁ MATEMATYKI I INFORMATYKI UWM Olsztyn, 9 lutego 2016 r. Adam Doliwa
Bardziej szczegółowosortowanie na bazie wykorzystanie sortowania ze zliczaniem
sortowanie na bazie wykorzystanie sortowania ze zliczaniem sortowanie na bazie polega na sortowaniu fragmentów danych, cyfr, od cyfry najmniej znaczącej do najbardziej znaczącej.można np. sortować liczby
Bardziej szczegółowoTechniki multimedialne
Techniki multimedialne Digitalizacja podstawą rozwoju systemów multimedialnych. Digitalizacja czyli obróbka cyfrowa oznacza przetwarzanie wszystkich typów informacji - słów, dźwięków, ilustracji, wideo
Bardziej szczegółowoZESZYTY NAUKOWE NR 6(78) AKADEMII MORSKIEJ W SZCZECINIE
ISSN 1733-8670 ZESZYTY NAUKOWE NR 6(78) AKADEMII MORSKIEJ W SZCZECINIE Wojciech Maleika I N Ż Y N I E R I A R U C H U M O R S K I E G O 2 00 5 Badanie bezstratnych metod kompresji danych opisujących kształt
Bardziej szczegółowoStandardy wideo: technologie cyfrowe
STANDARDY WIDEO: TECHNOLOGIE CYFROWE 01 Standardy wideo: technologie cyfrowe Zapis i dystrybucja sygnału z użyciem kodeków (klasyfikacja, pod kątem przeznaczenia): archiwizacja i obróbka amatorska archiwizacja
Bardziej szczegółowoEtap I V Gminnego Konkursu Informatycznego.
Informacje wstępne. Etap I V Gminnego Konkursu Informatycznego. 1. Do każdego pytania w teście podane są 3 odpowiedzi, z których tylko jedna jest odpowiedzią prawidłową. 2. Na starcie każdy uczestnik otrzymuje
Bardziej szczegółowoKomputer IBM PC niezależnie od modelu składa się z: Jednostki centralnej czyli właściwego komputera Monitora Klawiatury
1976 r. Apple PC Personal Computer 1981 r. pierwszy IBM PC Komputer jest wart tyle, ile wart jest człowiek, który go wykorzystuje... Hardware sprzęt Software oprogramowanie Komputer IBM PC niezależnie
Bardziej szczegółowoObróbka grafiki cyfrowej
Obróbka grafiki cyfrowej 1 ROZDZIELCZOŚĆ (ang. resolution) - oznacza ilość malutkich punktów, które tworzą widzialny znak w druku bądź na ekranie monitora Typowe rozdzielczości monitorów komputerowych
Bardziej szczegółowoCzęść 1. system operacyjny i wstęp do operacji na plikach. Przygotował Mateusz Jureczko
Część 1. system operacyjny i wstęp do operacji na plikach Przygotował Mateusz Jureczko Powtórka poprzedniego modułu Krótki test 1) 2) 3) 4) 5) 6) 7) 8) 9) 10) 1) B 2)A 3)C 4)B 5)D 6)A 7)B 8)C 9)A 10)B
Bardziej szczegółowoPrzemysłowe Sieci Informatyczne (PSI) Wykład #3 kodowanie i wstęp do teorii informacji WYDZIAŁ ELEKTROTECHNIKI I AUTOMATYKI KATEDRA INŻYNIERII
Przemysłowe Sieci Informatyczne (PSI) Wykład #3 kodowanie i wstęp do teorii informacji WYDZIAŁ ELEKTROTECHNIKI I AUTOMATYKI KATEDRA INŻYNIERII SYSTEMÓW STEROWANIA Jarosław Tarnawski, dr inż. Gdańsk, marzec
Bardziej szczegółowoPrzetwarzanie sygnałów w telekomunikacji
Przetwarzanie sygnałów w telekomunikacji Prowadzący: Przemysław Dymarski, Inst. Telekomunikacji PW, gm. Elektroniki, pok. 461 dymarski@tele.pw.edu.pl Wykład: Wstęp: transmisja analogowa i cyfrowa, modulacja
Bardziej szczegółowoAkwizycja i przetwarzanie sygnałów cyfrowych
Akwizycja i przetwarzanie sygnałów cyfrowych Instytut Teleinformatyki ITI PK Kraków 21 luty 2011 Rewolucja cyfrowa i jej skutki Rewolucja cyfrowa - dane cyfrowe: podstawowy rodzaj informacji multimedialnych,
Bardziej szczegółowoDŹWIĘK. Dźwięk analogowy - fala sinusoidalna. Dźwięk cyfrowy 1-bitowy 2 możliwe stany fala jest mocno zniekształcona
DŹWIĘK Dźwięk analogowy - fala sinusoidalna Dźwięk cyfrowy 1-bitowy 2 możliwe stany fala jest mocno zniekształcona Dźwięk cyfrowy 2-bitowy 2 bity 4 możliwe stany (rozdzielczość dwubitowa) 8 bitów - da
Bardziej szczegółowoAudio i video. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski
Audio i video R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski s-rg@siwy.il.pw.edu.pl Fale dźwiękowe Dźwięk jest drganiem powietrza rozchodzącym się w postaci fali. Fala ma określoną amplitudę i częstotliwość.
Bardziej szczegółowoCała prawda o plikach grafiki rastrowej
~ 1 ~ Cała prawda o plikach grafiki rastrowej Grafika rastrowa to rodzaj grafiki zapisywanej na dysku w postaci bitmapy, czyli zbioru pikseli. W edytorach grafiki rastrowej możliwa jest edycja na poziomie
Bardziej szczegółowoTransformata Fouriera
Transformata Fouriera Program wykładu 1. Wprowadzenie teoretyczne 2. Algorytm FFT 3. Zastosowanie analizy Fouriera 4. Przykłady programów Wprowadzenie teoretyczne Zespolona transformata Fouriera Jeżeli
Bardziej szczegółowoElektronika i Telekomunikacja I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny)
Załącznik nr 7 do Zarządzenia Rektora nr 10/12 z dnia 21 lutego 2012r. KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Obowiązuje od roku akademickiego 2012/2013
Bardziej szczegółowoPrzedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2.
Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2. Technika obrazu 24 W.3. Normalizacja w zakresie obrazu cyfrowego
Bardziej szczegółowoGrafika rastrowa i wektorowa
Grafika rastrowa i wektorowa Jakie są różnice między grafiką rastrową a wektorową? Podaj przykłady programów do pracy z grafiką rastrową/wektorową? Czym są RGB, CMYK? Gdzie używamy modelu barw RGB/CMYK?
Bardziej szczegółowoInformacja. Informacja. Informacja. Informacja/wiadomość. Zbiór danych zebranych w celu ich przetworzenia i otrzymania wyników (nowych informacji).
Informacja Informacja Czynnik, któremu człowiek może przypisać określony sens (znaczenie) w celu wykorzystania do różnych celów. Wszystko to, co może być zużytkowane do bardziej sprawnego wyboru działań
Bardziej szczegółowo