1. Wprowadzenie 1.1. Zdefiniowanie problemu badawczego

Podobne dokumenty
Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j

Wybrane metody kompresji obrazów

Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2.

dr inż. Piotr Odya Wprowadzenie

Kompresja sekwencji obrazów - algorytm MPEG-2

Micha Strzelecki Metody przetwarzania i analizy obrazów biomedycznych (2)

Cyfrowe przetwarzanie i kompresja danych. dr inż.. Wojciech Zając

Kompresja sekwencji obrazów

Przetwarzanie i transmisja danych multimedialnych. Wykład 6 Metody predykcyjne. Przemysław Sękalski.

Fundamentals of Data Compression

Klasyfikacja metod kompresji

Wykład II. Reprezentacja danych w technice cyfrowej. Studia Podyplomowe INFORMATYKA Podstawy Informatyki

Kompresja Kodowanie arytmetyczne. Dariusz Sobczuk

PRACA DYPLOMOWA STUDIA PIERWSZEGO STOPNIA. Łukasz Kutyła Numer albumu: 5199

Kodowanie transformacyjne. Plan 1. Zasada 2. Rodzaje transformacji 3. Standard JPEG

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 4, strona 1. GOLOMBA I RICE'A

Przedmowa Wykaz oznaczeń Wykaz skrótów 1. Sygnały i ich parametry Pojęcia podstawowe Klasyfikacja sygnałów

Analiza metod wykrywania przekazów steganograficznych. Magdalena Pejas Wydział EiTI PW

Klasyfikacja metod kompresji

Algorytmy kodowania predykcyjnego

Adaptive wavelet synthesis for improving digital image processing

Krótki przegląd pierwszych standardów kompresji obrazów

Kodowanie i kompresja Streszczenie Studia Licencjackie Wykład 11,

27 stycznia 2009

dr inż. Jacek Naruniec

Kodowanie predykcyjne

WPROWADZENIE W PROBLEMATYKĘ I SPECYFIKĘ PRZEDMIOTU

* Big Index - Indeks dołączony do ProfiCD w formacie 25x24 cm. Usługa dotyczy negatywów i diapozytywów typu 135. Index zawiera 36 klatek.

Zastosowanie adaptacyjnego wielokontekstowego kodera arytmetycznego do bezstratnej kompresji dźwięku

Opis efektów kształcenia dla modułu zajęć

Technologie cyfrowe. Artur Kalinowski. Zakład Cząstek i Oddziaływań Fundamentalnych Pasteura 5, pokój 4.15 Artur.Kalinowski@fuw.edu.

4.1. Wprowadzenie Podstawowe definicje Algorytm określania wartości parametrów w regresji logistycznej...74

Spis treści. Wstęp Część I Internet rozwiązania techniczne... 13

INSTRUKCJA OBSŁUGI USB2.0 GRABBER

Formaty plików. graficznych, dźwiękowych, wideo

Zastosowanie stereowizji do śledzenia trajektorii obiektów w przestrzeni 3D

Kodowanie predykcyjne

Oprogramowanie. DMS Lite. Podstawowa instrukcja obsługi

Biocentrum Ochota infrastruktura informatyczna dla rozwoju strategicznych kierunków biologii i medycyny POIG /09

Eksperymentalna analiza częstotliwości wyboru trybów zaawansowanego kodowania wizyjnego.

Kompresja dźwięku w standardzie MPEG-1

Oprogramowanie IPCCTV. ipims. Podstawowa instrukcja obsługi

Kompresja video (MPEG)

TECHNIKI MULTIMEDIALNE

CZĘŚĆ III ZAMÓWIENIA. Opis przedmiotu zamówienia sprzętu audiowizualnego

Wymiana i Składowanie Danych Multimedialnych Mateusz Moderhak, EA 106, Pon. 11:15-12:00, śr.

Wielokanałowe systemy kodowania dźwięku

Seria i7-n9500. Uwagi: 1.Urządzenia NVR są dostarczane bez dysków HDD 2.Należy używać dysków HDD zalecanych przez producenta.

Kodowanie i kompresja Streszczenie Studia Wieczorowe Wykład 10, 2007

Grafika rastrowa (bitmapa)-

Oferta kamer IP Copyright Siemens AG 2010

Praca dyplomowa magisterska

Założenia i obszar zastosowań. JPEG - algorytm kodowania obrazu. Geneza algorytmu KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG

fazy tworzenia filmu preprodukcja szkice, rysunki, plany produkcji... produkcja nagrywanie scen postprodukcja montaż, korekcja, podkład dźwiękowy

Cechy formatu PNG Budowa bloku danych Bloki standardowe PNG Filtrowanie danych przed kompresją Wyświetlanie progresywne (Adam 7)

Mini kamera IP Wi-Fi ukryta w ZEGARKU CYFROWYM, DETEKCJA RUCHU, 1280x720, 4 GB, DZIEŃ/NOC, P2P, CLOCK WI-FI Camera

przetworzonego sygnału

Technologie cyfrowe semestr letni 2018/2019

Kodowanie podpasmowe. Plan 1. Zasada 2. Filtry cyfrowe 3. Podstawowy algorytm 4. Zastosowania

ViLab- program służący do prowadzenia obliczeń charakterystyki energetycznej i sporządzania świadectw charakterystyki energetycznej

Standardy telewizji kolorowej (SD)

ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU

DŹWIĘK. Dźwięk analogowy - fala sinusoidalna. Dźwięk cyfrowy 1-bitowy 2 możliwe stany fala jest mocno zniekształcona

Wstęp do techniki wideo

Aproksymacja funkcji a regresja symboliczna

Zastosowanie kompresji w kryptografii Piotr Piotrowski

Mini kamera IP Wi-Fi ukryta w ZEGARKU CYFROWYM, DETEKCJA RUCHU, 1280x720, P2P, zegarek z kamerą, CLOCK WI-FI Camera

Jak zrobić za pomocą programu SALSA-J kolorowy obrazek, mając trzy zdjęcia w barwach podstawowych?

E.14.1 Tworzenie stron internetowych / Krzysztof T. Czarkowski, Ilona Nowosad. Warszawa, Spis treści

Rejestrator cyfrowy, 8 kanałów VIDEO, 200 kl/s, FULL D1, H 264, AUDIO, LAN, VGA, USB, PTZ, HDMI, ALARM, K2 XVR-08D1

GRAFIKA RASTROWA. WYKŁAD 2 Oprogramowanie i formaty plików. Jacek Wiślicki Katedra Informatyki Stosowanej

mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 1, strona 1.

Kwantyzacja wektorowa. Kodowanie różnicowe.

Kamera do drzwi, WIZJER, JUDASZ, monitor LCD 3,5", dzwonek, zapis na karty micro SD, tryb DZIEŃ/NOC, DETEKCJA RUCHU, wersja STANDARD

Publiczne Technikum Informatyczne Computer College w Koszalinie

FORMATY PLIKÓW GRAFICZNYCH

Laboratorium. Cyfrowe przetwarzanie sygnałów. Ćwiczenie 9. Przetwarzanie sygnałów wizyjnych. Politechnika Świętokrzyska.

KAMERY BEZPRZEWODOWE

Grafika na stronie www

Sztuczne sieci neuronowe. Krzysztof A. Cyran POLITECHNIKA ŚLĄSKA Instytut Informatyki, p. 335

LABORATORIUM TELEMONITORINGU OBIEKTÓW I AGLOMERACJI. Temat: Metody anonimizacji obrazu

Video Recording Manager 2.0. Przegląd systemu

Instrukcja obsługi. Karta video USB + program DVR-USB/8F. Dane techniczne oraz treść poniższej instrukcji mogą ulec zmianie bez uprzedzenia.

MDH System Strona 1. Produkt z kategorii: Video Wizjery do drzwi

Kompresja JPG obrazu sonarowego z uwzględnieniem założonego poziomu błędu

ZESZYTY NAUKOWE NR 6(78) AKADEMII MORSKIEJ W SZCZECINIE

Kodowanie transformujace. Kompresja danych. Tomasz Jurdziński. Wykład 11: Transformaty i JPEG

Wielokanałowe systemy kodowania dźwięku

Dostawa oprogramowania. Nr sprawy: ZP /15

Minimalne wymagania dotyczące systemu komputerowego do odtwarzania treści 3D w projektorze BenQ:

Instrukcja instalacyjna do kart wizyjnych NVB-B/-BLV

PRZEWODNIK PO PRZEDMIOCIE

dr inż. Piotr Odya Kontener

Audio i video. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski

Summary in Polish. Fatimah Mohammed Furaiji. Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling

OFERTA 0001-CENA 3300 ZŁ

System wizyjny OMRON Xpectia FZx

Rozszerzenia plików graficznych do publkacji internetowych- Kasia Ząbek kl. 2dT

KOMPRESJA STRATNA SYGNAŁU MOWY. Metody kompresji stratnej sygnałów multimedialnych: Uproszczone modelowanie źródeł generacji sygnałów LPC, CELP

Transkrypt:

Spis treści 3 Spis treści Spis ważniejszych oznaczeń... 7 1. Wprowadzenie... 9 1.1. Zdefiniowanie problemu badawczego... 9 1.2. Istniejące rozwiązania bezstratnej kompresji obrazów... 10 1.3. Cel i zakres pracy... 12 1.4. Podstawy modelowania obrazów i sekwencji wideo... 16 1.5. Redukcja zakresu odcieni... 19 1.6. Domyślne założenia przyjęte w pracy... 19 2. Stała i statyczna predykcja liniowa... 21 2.1. Stałe modele predykcyjne... 21 2.2. Wyznaczanie współczynników predykcji metodą MMSE... 23 2.3. Dobór predyktora statycznego... 24 2.3.1. Metoda prostej selekcji oparta na predyktorach stałych... 24 2.3.2. Metoda uśredniania współczynników... 26 2.4. Metoda poszukiwania współczynników... 26 2.4.1. Pierwsza propozycja... 26 2.4.2. Druga propozycja... 30 2.4.3. Trzecia propozycja... 31 2.5. Wyznaczanie współczynników predykcji z wykorzystaniem algorytmów genetycznych 33 2.5.1. Wiadomości ogólne... 33 2.5.2. Podstawy projektowania algorytmu genetycznego... 34 2.5.3. Badania eksperymentalne... 36 2.6. Metody modelowania predykcyjnego z podziałem blokowym... 41 3. Adaptacyjna predykcja z przełączanym modelem... 43 3.1. Stałe predyktory nieliniowe... 43 3.1.1. Adaptacyjny predyktor medianowy... 43 3.1.2. Metoda predykcji z podziałem kontekstowym GAP... 45 3.1.3. Metoda predykcji z wagami gradientowymi... 46 3.1.4. Metoda predykcji oparta na logice rozmytej... 47 3.1.5. Propozycja metody wielokontekstowej... 48 3.2. Podział kontekstowy stosowany w złożonych metodach predykcyjnych... 50 3.2.1. Zasada efektywnego doboru kontekstu głównego... 50 3.2.2. Kontekst uzupełniający w metodzie statycznej predykcji liniowej... 52 3.2.3. Konteksty uzupełniające w metodzie ALCM... 53 3.2.4. Konteksty uzupełniające w metodzie CoBALP... 53 3.2.5. Konteksty uzupełniające w metodzie RLS... 54

4 Spis treści 4. Skumulowany błąd predykcji... 55 4.1. Metody korekcji skumulowanego błędu predykcji... 55 4.2. Typy podziałów wielokontekstowych... 57 4.2.1. Pierwsza metoda... 57 4.2.2. Druga metoda... 58 4.2.3. Trzecia metoda... 59 4.2.4. Czwarta metoda... 60 4.3. Mieszana metoda korekcji skumulowanego błędu predykcji... 60 4.4. Metoda statyczna z podziałem kontekstowym... 61 4.5. Dobór współczynników predykcji metodą minimalizacji średniej bitowej... 63 5. Metody prostej adaptacji modelu predykcji... 67 5.1. Wprowadzenie... 67 5.2. Podstawowa metoda adaptalcji LMS... 68 5.3. Metoda adaptacji ALCM i jej udoskonalenie... 71 5.4. Metoda adaptacji CoBALP i jej udoskonalenie... 72 5.5. Metoda mieszana M-LMS... 73 5.6. Analiza prostych metod adaptacyjnych... 75 6. Złożone metody adaptacji współczynników predykcji... 77 6.1. Metoda RLS... 77 6.2. Metoda OLS... 78 6.3. Metoda WLS... 79 6.4. Metoda AVE-WLS... 81 6.5. Metoda NLMS... 82 6.6. Analiza rezultatów badań... 84 6.7. Analiza złożoności obliczeniowej... 85 7. Zastosowanie sieci neuronowych...... 91 7.1. Adaptacyjna sieć neuronowa... 91 7.2. Analiza parametrów sieci AdNN... 94 7.3. Zwiększanie wydajności sieci AdNN... 97 8. Adaptacyjny koder arytmetyczny z podziałem kontekstowym...... 101 8.1. Długookresowa forma adaptacji rozkładu prawdopodobieństwa... 101 8.2. Podział kontekstowy w koderze arytmetycznym... 102 8.3. Kwantyzacja błędów predykcji... 104 8.4. Kodowanie bitu znaku... 106 9. Metoda mieszania predykcyjnego......... 107 9.1. Wprowadzenie... 107 9.2. Dobór subpredyktorów... 107 9.3. Zasada działania metody mieszania predykcyjnego... 108 9.4. Cechy szczególne metod Blend-13 i Blend-17... 109 9.5. Metoda dopasowania teksturowanego... 111 9.6. Metoda Blend-19... 115

Spis treści 5 9.7. Metoda Blend-20... 116 9.8. Metody Blend-24 oraz Blend-25... 120 9.8.1. Wprowadzenie... 120 9.8.2. Udoskonalenie metody TCM... 121 9.8.3. Trzecia metoda mieszania... 121 9.8.4. Dobór fazy obrotu... 122 9.8.5. Dobór parametrów kodera arytmetycznego... 123 9.9. Analiza efektywności proponowanych metod... 125 10. Zastosowania kodowania mieszanego......... 131 10.1. Wprowadzenie... 131 10.2. Kodowanie w trybie prawie bezstratnym... 131 10.3. Bezstratna kompresja obrazów astronomicznych i satelitarnych... 143 10.4. Bezstratna kompresja sekwencji wideo... 145 10.5. Kodowanie obrazów kolorowych... 149 10.5.1. Korygowanie błędów predykcji... 149 10.5.2. Dekorelacja transformacyjna... 149 10.5.3. Badania eksperymentalne... 152 11. Podsumowanie............... 157 Literatura... 163 Summary... 173 Zusammenfassung... 175

1.2. Istniejące rozwiązania bezstratnej kompresji obrazów 9 1. Wprowadzenie 1.1. Zdefiniowanie problemu badawczego W dobie w pełni cyfrowej struktury obróbki obrazów cyfrowych i sekwencji wideo istotnym problemem są wysokie wymagania pamięciowe związane z przechowywaniem danych wizyjnych. Zmniejszenie wymagań pamięciowych jest możliwe dzięki kompresji. Na przykład zapis 60 minut filmu jakości telewizyjnego standardu PAL (25 klatek na sekundę o rozdzielczości SD 720 576 pikseli, co daje 9,89 Mpikseli/s, gdy każdą ze składowych RGB traktujemy jako liczbę ośmiobitową) wymaga 104,28 GB miejsca na dysku (lub innym nośniku danych). Kompresję można podzielić na stratną i bezstratną, przy czym w tej pracy skupiono się głównie na tym drugim typie. Do istotnych zastosowań bezstratnej kompresji obrazów i sekwencji wideo należy między innymi archiwizacja obrazów medycznych 2D, 3D oraz 4D (trójwymiarowe sekwencje wideo) [52, 97, 100, 106, 144], astronomicznych, a także kompresja zdjęć satelitarnych [21, 69]. Ponadto często tryb bezstratny jest wymagany na etapie graficznej obróbki zdjęć, materiałów reklamowych oraz przy produkcji audycji telewizyjnych, filmów (ang. post-production [7]) itp. W takiej sytuacji nie można korzystać ze stratnych wersji metod kompresji, takich jak JPEG, JPEG2000 (dla obrazów statycznych) czy MPEG2, MPEG4 (dla sekwencji wideo). Choć te standardy mają odpowiednie tryby bezstratne, to nie można ich zaliczyć do kategorii najwydajniejszych, co zostało przebadane na wstępnym etapie, przed postawieniem tezy zawartej w tej pracy. Pewnym kompromisem między kodowaniem bezstratnym a stratnym jest tryb prawie bezstratny, pozwalający na zdefiniowanie maksymalnych błędów w obrazie zdekodowanym (patrz podrozdział 10.2). Nowym rodzajem zastosowań jest technologia slow motion video, służąca do zapisu nagrań z eksperymentów naukowych z dokładnością nawet do kilkudziesięciu tysięcy klatek na sekundę. Na przykład nagranie sekundy sekwencji wideo (sygnał luminancji osiem bitów/piksel) przy 1000 klatkach na sekundę i rozdzielczości SD 720 576 pikseli wymaga 3955 MB pojemności pamięci. Obecnie kamery w trybie slow motion zapisują obraz bez kompresji i czas trwania sekwencji jest ograniczony maksymalną pojemnością pamięci kamery. Nagrywanie i archiwizacja plików o większych rozmiarach staje się problemem, który może zostać rozwiązany przez wprowadzenie szybkich sprzętowych zrównoleglonych realizacji kompresji np. w trybie prawie bezstratnym, co w połączeniu z macierzą wydajnych dysków SSD, może pozwolić na zwiększenie funkcjonalności stanowiska badawczego wykorzystującego szybkozmienne zjawiska fizyczne. W przypadku stosowania współczesnych metod kompresji wykorzystuje się zwykle dwa etapy: dekompozycję danych oraz kompresję za pomocą jednej z wydajnych metod entropijnych, wśród których najefektywniejsze to kodowanie arytmetyczne i kodowanie Huffmana [98]. Problemem badawczym poruszanym w tej pracy będzie zatem analiza możliwości dalszego wzrostu efektywności bezstratnej kompresji obrazów w odniesieniu do istniejących

10 1. Wprowadzenie rozwiązań znanych z literatury. Rozpoczynając prace nad rozwojem nowych metod, należało bowiem odpowiedzieć na pytanie, czy słuszna jest opinia o tym, że zdecydowana większość problemów badawczych w zakresie bezstratnej kompresji obrazów została już rozwiązana? Takie argumenty bowiem pojawiały się w rozmowach autora z naukowcami, a potwierdzać to miała znacząco spadająca liczba publikacji dotyczących zagadnienia bezstratnej kompresji obrazów. Autor podjął się trudnego zadania, chcąc opracować nowe metody z wykorzystaniem najlepszych cech rozmaitych już istniejących rozwiązań. Projektowane tu metody będą wykorzystywać możliwość wspólnego stosowania wielu technik dekompozycji obrazu, jak i rozbudowaną metodę adaptacyjnego kodowania arytmetycznego. 1.2. Istniejące rozwiązania bezstratnej kompresji obrazów Nieustanne dążenie do uzyskania coraz większej efektywności bezstratnej kompresji obrazu prowadzi do opracowywania metod o wzrastającej złożoności implementacyjnej. Lata 90. XX wieku były okresem największej aktywności projektantów nowych metod. Do dziś za jedną z najefektywniejszych metod uznaje się zaprezentowaną w roku 1996 CALIC (ang. Context Based Adaptive Lossless Image Coding) [141]. Na owe czasy metoda ta okazała się zbyt wymagająca obliczeniowo w porównaniu z metodą LOCO-I, której modyfikacja stała się standardem JPEG-LS [136]. Wśród najefektywniejszych algorytmów o wysokiej złożoności implementacyjnej można wyróżnić prace trzech zespołów badawczych: metoda TMW (1997) [86] i jej późniejsze rozwinięcie TMW LEGO (2001) [87], WAVE-WLS (2002) [147] oraz najnowsza wersja MRP 0.5 zaprezentowana pod nazwą 'VBS & new-cost' (2005) [78]. Zakodowanie jedego obrazu z użyciem każdej z tych propozycji wymaga wielu minut (lub nawet godzin, jeśli nie dysponujemy najwydajnieszym obecnie procesorem dostępnym na rynku) pracy programu kodującego. Oprócz wspomnianych wcześniej metod wykorzystujących modelowanie predykcyjne istnieją także bezstratne wersje koderów falkowych stosowane zarówno do kodowania w trybie intraframe (np. JPEG2000 [72]), jak i interframe [91]. Jednak uzyskiwane wyniki nie dorównują najlepszym metodom predykcyjnym. Podobnie wygląda sytuacja z kodowaniem hierarchicznym wykorzystanym w metodzie typu HINT i pierwotnej wersji kodera CALIC [138]. Z tego względu w tej pracy cechy charakterystyczne tych metod nie zostaną omówione. Informacje o różnych podejściach do kodowania bezstratnego można znaleźć w pracach przeglądowych [18, 26, 82]. Obecnie dość powszechnie stosowanym formatem jest PNG ze względu na jego uniweralność w kodowaniu zarówno obrazów naturalnych, jak i sztucznie generowanych [93, 105]. Jednak jego efektywność jest niższa od metod takich jak JPEG-LS czy CALIC. Wersja PNG-crush koduje obraz kolejno dla wszystkich możliwych ustawień parametrów PNG, wybierając najlepszy rezultat. Wyniki działań tego oprogramowania, wraz z porównaniem efektywności innych metod znanych z literatury oraz opracowanych przez autora tej pracy, zaprezentowano w podsumowującej tab. 9.10. Warto przy tym zaznaczyć, że techniki oparte na kodowaniu słownikowym, takie jak choćby PNG czy archiwizery ogólnego