Falkowa interaktywna kompresja obrazów

Podobne dokumenty
ODRĘBNA KOMPRESJA WYŻSZYCH OKTAW ELEKTROKARDIOGRAMU

LABORATORIUM AKUSTYKI MUZYCZNEJ. Ćw. nr 12. Analiza falkowa dźwięków instrumentów muzycznych. 1. PODSTAWY TEORETYCZNE ANALIZY FALKOWEJ.

Cyfrowe przetwarzanie i kompresja danych

Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2.

REDUKCJA ZAKŁÓCE W SEKWENCJACH VIDEO, KODOWANYCH ZA POMOC KODEKA FALKOWEGO IMC-3DEZBC

CIĄGŁY MODEL SZUMU ELEKTROKARDIOGRAMU W DZIEDZINIE CZASOWO-CZĘSTOTLIWOŚCIOWEJ

0. OpenGL ma układ współrzędnych taki, że oś y jest skierowana (względem monitora) a) w dół b) w górę c) w lewo d) w prawo e) w kierunku do

Badanie prawdopodobieństwa dostrzeżenia obiektów z zastosowaniem analizy ścieżki wzrokowej

Kompresja dźwięku w standardzie MPEG-1

Automatyczne tworzenie trójwymiarowego planu pomieszczenia z zastosowaniem metod stereowizyjnych

Adaptive wavelet synthesis for improving digital image processing

Problematyka budowy skanera 3D doświadczenia własne

Cyfrowe przetwarzanie i kompresja danych. dr inż.. Wojciech Zając

Kamery wysokiej rozdzielczości firmy Bosch korzyści

Założenia i obszar zastosowań. JPEG - algorytm kodowania obrazu. Geneza algorytmu KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG

WideoSondy - Pomiary. Trzy Metody Pomiarowe w jednym urządzeniu XL G3 lub XL Go. Metoda Porównawcza. Metoda projekcji Cienia (ShadowProbe)

dr inż. Piotr Odya Wprowadzenie

WYDZIAŁ ELEKTRYCZNY. Optoelektroniczne pomiary aksjograficzne stawu skroniowo-żuchwowego człowieka

BIOCYBERNETYCZNE ASPEKTY PROCESU OBSERWACJI SCENY WSTĘPNA ANALIZA TRAJEKTORII RUCHU OCZU

Przetwarzanie obrazu

i ruchów użytkownika komputera za i pozycjonujący oczy cyberagenta internetowego na oczach i akcjach użytkownika Promotor: dr Adrian Horzyk

Innowacje wzmacniające system ochrony i bezpieczeństwa granic RP

Załącznik nr 1 WYMAGANIA DOTYCZĄCE OPISU I PRZEGLĄDU OBRAZÓW REJESTROWANYCH W POSTACI CYFROWEJ I. Wymagania ogólne

OPTYMALIZACJA HARMONOGRAMOWANIA MONTAŻU SAMOCHODÓW Z ZASTOSOWANIEM PROGRAMOWANIA W LOGICE Z OGRANICZENIAMI

ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU

Soczewkami nazywamy ciała przeźroczyste ograniczone dwoma powierzchniami o promieniach krzywizn R 1 i R 2.

Politechnika Gdańska Wydział Elektrotechniki i Automatyki Katedra Inżynierii Systemów Sterowania

KOMPRESJA SEKWENCJI WIZYJNYCH Z MAŁYM OPÓŹNIENIEM KODOWANIA

Synteza i obróbka obrazu. Tekstury. Opracowanie: dr inż. Grzegorz Szwoch Politechnika Gdańska Katedra Systemów Multimedialnych

Historia okulografii. Historia okulografii. Historia okulografii. Historia okulografii. Historia okulografii. Eyetracking = Okulografia

Przetwarzanie obrazów rastrowych macierzą konwolucji

PL B BUP 16/04. Kleczkowski Piotr,Kraków,PL WUP 04/09

LABORATORIUM Sygnałów, Modulacji i Systemów ĆWICZENIE 2: Modulacje analogowe

POSZUKIWANIE FALKOWYCH MIAR POTENCJAŁU INFORMACYJNEGO OBRAZÓW CYFROWYCH JAKO WSKAŹNIKÓW JAKOŚCI WIZUALNEJ

Akademia Górniczo-Hutnicza

Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j

Ćwiczenie 2: pomiar charakterystyk i częstotliwości granicznych wzmacniacza napięcia REGIONALNE CENTRUM EDUKACJI ZAWODOWEJ W BIŁGORAJU

Oferta kamer IP Copyright Siemens AG 2010

Rys. 1 Schemat układu obrazującego 2f-2f

Kompresja obrazów z wykorzystaniem kompresji fraktalnej i systemu funkcji iterowanych

Kompresja JPG obrazu sonarowego z uwzględnieniem założonego poziomu błędu

Aerotriangulacja. 1. Aerotriangulacja z niezależnych wiązek. 2. Aerotriangulacja z niezależnych modeli

Grafika Komputerowa Wykład 6. Teksturowanie. mgr inż. Michał Chwesiuk 1/23

Nasz cel: zapewnienie całodobowego dostępu zdalnego i sterowania kamerami. Dynamic Transcoding

Analiza obrazu. wykład 1. Marek Jan Kasprowicz Uniwersytet Rolniczy Marek Jan Kasprowicz Analiza obrazu komputerowego 2009 r.

TRANSFORMATA FALKOWA 2D. Oprogramowanie Systemów Obrazowania 2016/2017

EXTENDER VGA, transmisja VGA po skrętce, max zasięg 300 m, TRVGA-300-P

Ćwiczenie 3,4. Analiza widmowa sygnałów czasowych: sinus, trójkąt, prostokąt, szum biały i szum różowy

PL B1. System kontroli wychyleń od pionu lub poziomu inżynierskich obiektów budowlanych lub konstrukcyjnych

Implementacja filtru Canny ego

Przykładowe zadanie praktyczne

KAM-TECH sklep internetowy Utworzono : 13 listopad 2014

PRZETWARZANIE GRAFICZNYCH DANYCH EMPIRYCZNYCH DLA POTRZEB EDUKACJI SZTUCZNYCH SIECI NEURONOWYCH, MODELUJĄCYCH WYBRANE ZAGADNIENIA INŻYNIERII ROLNICZEJ

Pomiar jakości postrzeganej przez użytkownika dla usługi 3D IPTV

WYKŁAD 10. kodem pierwotnym krzywej jest ciąg par współrzędnych x, y kolejnych punktów krzywej: (x 1, y 1 ), (x 2, y 2 ),...

Strona 1 z 5 Wersja z dnia 9 grudnia 2010 roku

Akademia Górniczo-Hutnicza

MONITORING PRZESTRZENI ELEKTROMAGNETYCZNEJ

Szczegółowa charakterystyka przedmiotu zamówienia

Ćwiczenie 12 (44) Wyznaczanie długości fali świetlnej przy pomocy siatki dyfrakcyjnej

Przygotowała: prof. Bożena Kostek

Zagadnienia egzaminacyjne ELEKTRONIKA I TELEKOMUNIKACJA studia rozpoczynające się przed r.

Przetwarzanie Sygnałów. Zastosowanie Transformaty Falkowej w nadzorowaniu

2. STRUKTURA RADIOFONICZNYCH SYGNAŁÓW CYFROWYCH

10. Redukcja wymiaru - metoda PCA

Zmiana rozdzielczości ekranu

MSPO 2014: STABILIZOWANE GŁOWICE OPTOELEKTRONICZNE PCO

3GHz (opcja 6GHz) Cyfrowy Analizator Widma GA4063

Podstawy przetwarzania obrazów teledetekcyjnych. Format rastrowy

MODEL STANOWISKA DO BADANIA OPTYCZNEJ GŁOWICY ŚLEDZĄCEJ

Grafika Komputerowa Wykład 2. Przetwarzanie obrazów. mgr inż. Michał Chwesiuk 1/38

Waldemar Izdebski - Wykłady z przedmiotu SIT / Mapa zasadnicza 30

Próby ruchowe dźwigu osobowego

PL B1. WOJSKOWY INSTYTUT MEDYCYNY LOTNICZEJ, Warszawa, PL BUP 23/13

NIEOPTYMALNA TECHNIKA DEKORELACJI W CYFROWYM PRZETWARZANIU OBRAZU

Zmiana rozdzielczości ekranu

Rejestracja elektrokardiogramu ze zmienną częstotliwością próbkowania modulowaną zawartością sygnału

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 8 AiR III

1 Obsługa aplikacji sonary

Krótki przegląd pierwszych standardów kompresji obrazów

Audio i video. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski

Technika analogowa. Problematyka ćwiczenia: Temat ćwiczenia:

POMIARY WYBRANYCH PARAMETRÓW TORU FONICZNEGO W PROCESORACH AUDIO

Układ aktywnej redukcji hałasu przenikającego przez przegrodę w postaci płyty mosiężnej

Zakres wymaganych wiadomości do testów z przedmiotu Metrologia. Wprowadzenie do obsługi multimetrów analogowych i cyfrowych

Kodowanie i kompresja Streszczenie Studia Wieczorowe Wykład 10, 2007

IMPLEMENTATION OF THE SPECTRUM ANALYZER ON MICROCONTROLLER WITH ARM7 CORE IMPLEMENTACJA ANALIZATORA WIDMA NA MIKROKONTROLERZE Z RDZENIEM ARM7

GRAFIKA KOMPUTEROWA 10: Antyaliasing

Akwizycja i przetwarzanie sygnałów cyfrowych

Spośród licznych filtrów nieliniowych najlepszymi właściwościami odznacza się filtr medianowy prosty i skuteczny.

Metodyka i system dopasowania protez słuchu w oparciu o badanie percepcji sygnału mowy w szumie

Akwizycja obrazów HDR

Wzmacniacze napięciowe z tranzystorami komplementarnymi CMOS

KAMERA WANDAL V-CAM 430 (600TVL 3,6mm 0,01lxIR20)

BEZDOTYKOWY CZUJNIK ULTRADŹWIĘKOWY POŁOŻENIA LINIOWEGO

Informatyka I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) kierunkowy (podstawowy / kierunkowy / inny HES)

Akwizycja obrazów HDR

Projektowanie systemów pomiarowych

EKSTRAKCJA CECH TWARZY ZA POMOCĄ TRANSFORMATY FALKOWEJ

Transkrypt:

Falkowa interaktywna kompresja obrazów Piotr Augustyniak Akademia Górniczo-Hutnicza, al. Mickiewicza 30, 30-059 Kraków, august@agh.edu.pl Streszczenie: Artykuł przedstawia metodę kompresji obrazów z wykorzystaniem transformacji falkowej. Prezentowane rozwiązanie jest oparte na ciągłym pomiarze położenia gałki ocznej obserwatora, a nie zawartości kompresowanego obrazu. Jest to więc metoda subiektywna przeznaczona do kompresji obrazu obserwowanego w czasie rzeczywistym, a nie do obrazów archiwizowanych. Nieinwazyjny pomiar położenia gałki ocznej jest źródłem współrzędnych strefy zainteresowania obserwatora, które są wysyłane do zdalnego systemu akwizycji i kompresji obrazu. Kompresja polega na zachowaniu pełnej rozdzielczości obrazu w zakresie strefy zainteresowania obserwatora, i stopniowym jej zmniejszaniu w miarę oddalania się od krawędzi strefy. 1, Koncepcja strefy skupienia uwagi Koncepcja strefy zainteresowania obserwatora wywodzi się z fizjologii narządu wzroku, a szczególnie z niejednorodnej gęstości rozmieszczenia fotoreceptorów siatkówki [1].Systemy wizyjne niezależne od obserwatora dostarczają obrazu charakteryzowanego przez identyczną jakość w dowolnym jego miejscu [2-5]. System adaptacyjnej kompresji obrazu korzysta z możliwości dostarczenia obrazu o lokalnie obniżonej jakości w rejonach leżących poza strefą zainteresowania. Dostarczenie obrazu o niższej jakości - osiągnięte poprzez redukcję informacji o szczegółach - pozostaje niezauważone przez obserwatora tak długo, jak projekcja fragmentów obrazu leżących poza strefą zainteresowania w układzie optycznym oka trafia na obszary siatkówki o mniejszej gęstości fotoreceptorów [6]. Stała ruchliwość gałki ocznej związana z procesem pozyskiwania informacji przez system wzrokowy wymaga ciągłego uaktualniania pozycji gałki ocznej. Podczas ruchu gałki ocznej dla każdego kolejnego obrazu strefa zainteresowania obserwatora wyznaczana jest w innym miejscu, proces kompresji przebiega z użyciem innych współrzędnych. Ponieważ częstotliwość uaktualniania obrazów wyznaczona przez stosowany system wizyjny wynosi 25 Hz (tj. raz na 40 ms), pozycja gałki ocznej powinna być uaktualniana z tą właśnie częstotliwością. Zastosowanie systemu kompresji, którego działanie jest uzależnione od interakcji z obserwatorem, pomimo ograniczenia uniwersalności metody, może być rozważane w szerokiej gamie aplikacji począwszy od wąskopasmowych systemów zdalnego nadzoru wizyjnego, poprzez kontrolę ruchu i systemy wideotelefoniczne aż do bezzałogowych sond kosmicznych. Metoda kompresji posługuje się trzema parametrami wyznaczającymi: kształt strefy zainteresowania (okrągły lepiej odpowiada warunkom fizjologicznym, podczas gdy kwadratowy jest łatwiejszy do implementacji), stopień i dziedzinę uproszczenia obrazu poza strefą zainteresowania (redukcja rozdzielczości, dynamiki i barwy), rozmiar strefy zainteresowania zależny od odległości monitora wyświetlającego od oka obserwatora [7-9]. 2. Technika redukcji danych Poszukiwanie nowego celu skupienia uwagi jest uwarunkowane jakością obrazu poza bieżącą strefą zainteresowania. Dlatego redukcja informacji w tej strefie powinna być oparta na algorytmach skalowania, a nie tylko prostej decymacji (podpróbkowaniu) obrazu. W tej roli dobrze sprawdzają się filtry falkowe, które przy przestrzeganiu ortonormalności bazy dekompozycji dokonują bezstratnego podziału pasma obrazu na dwie połowy [10]. Dzięki

temu możliwe jest przesłanie całego obrazu w zredukowanej rozdzielczości, a następnie uzupełnienie go szczegółami należącymi do wyższych pasm tylko w obszarze strefy zainteresowania. Obrazy, podobnie jak krótkie sygnały, wymagają stosowania falek analizujących o nośnikach zwartych stosunkowo małej długości, co redukuje zasięg efektu brzegowego na obrazie. Użycie falek o zbyt krótkich nośnikach powoduje z kolei niewystarczającą separację sąsiadujących skal, co w przypadku obrazów może prowadzić do uwypuklenia mało istotnych szczegółów. W wyniku kompromisu uwzględniającego wszystkie powyższe uwagi wybrano falkę Daubechies 5 rzędu [11]. 3. System okoruchowy Nieinwazyjność jest podstawowym wymaganiem stosowanego systemu okoruchowego. Ponieważ śledzenie pozycji gałki ocznej jest prowadzone podczas aktywnej obserwacji sceny, może być zastosowana każda technika nie ograniczająca obserwatora. Nie jest wymagana wysoka prędkość ani szczególna dokładność pozycjonowania gałki ocznej, co stwarza możliwość zastosowania dowolnego taniego systemu okoruchowego opartego na analizie sekwencji obrazów wideo lub na pomiarze różnicowym natężenia światła w zakresie bliskiej podczerwieni odbitego od gałki ocznej. W opisywanym kompresorze zastosowano system Ober-2 [12-14] oparty na drugiej z wymienionych zasad, pracujący z wiązką światła 940 nm o natężeniu 5mW o częstotliwości 50 Hz i pozwalający na uzyskanie dokładności pozycjonowania gałki ocznej rzędu 0,02 deg. 4. Struktura systemu i przepływ informacji Podstawowa struktura systemu kompresji składa się z (rys. 1): kamery wysokiej rozdzielczości do akwizycji obrazu adaptacyjnego kodera falkowego dwukierunkowego kanału łączności dekodera falkowego i monitora wyświetlającego obraz, systemu pozycjonowania gałki ocznej. Rys. 1. Schemat blokowy falkowej adaptacyjnej kompresji obrazów

Ponieważ znacząca część obrazu jest transmitowana z rozdzielczością czterokrotnie mniejszą od oryginalnej zastosowanie systemu adaptacyjnego pozwala uzyskać współczynnik kompresji zbliżony do 16. W praktyce, wartość ta zależy od rozmiaru strefy zainteresowania obserwatora i w opisywanym systemie prototypowym wynosiła 12. Wątpliwości może budzić konieczność stosowania dwukierunkowego kanału łączności, ale ponieważ strumień informacji związany z pozycjonowaniem gałki ocznej nie przekracza 100 bps, sumaryczna ilość przesyłanych informacji jest znacznie zredukowana w porównaniu z transmisją wideo bez kompresji. 5. Zawartość obrazu skompresowanego. Zakładając akwizycję obrazu monochromatycznego o rozdzielczości 512 x 512 pikseli, dokonywana jest dwukrotne przeskalowanie obrazu prowadzące do uzyskania wersji uproszczonych o rozdzielczości odpowiednio: 256 x 256 i 128 x 128 pikseli. Przeskalowanie jest wykonywane z użyciem banku ortogonalnych filtrów falkowych zapewniających wysoką jakość obrazu. Następnie treść obrazu jest pobierana wierszami (co odpowiada skanowaniu liniowemu w telewizji). W zależności od pozycji i atrybutów krawędzi strefy zainteresowania do obrazu skompresowanego zaliczane są: pojedyncze piksele drugiego uproszczonego obrazu (o rozdzielczości 128 x 128) - poza strefą zainteresowania, pary pikseli pierwszego uproszczonego obrazu (o rozdzielczości 256 x 256) - na granicy strefy zainteresowania, czwórki pikseli obrazu oryginalnego (o rozdzielczości 512 x 512) - w obrębie strefy zainteresowania, Rys. 2. a) Szczegóły procedury kompresji i zawartość skompresowanego obrazu, b) przykładowy wektor współczynników falkowych dla wiersza a-a (trzy najwyższe skale). odcinki grubej linii oznaczają współczynniki włączone w reprezentację obrazu skompresowanego.

Rys. 3. Zbliżenie obrazu o zmiennym rozmiarze piksela na krawędzi strefy zainteresowania (powiększenie 10-krotne). Od lewej do prawej: najniższa rozdzielczość poza strefą zainteresowania (odpowiadająca obrazowi 128 x 128), rozdzielczość pośrednia na granicy sterfy zainteresowania (odpowiadająca obrazowi 256 x 256) oraz najwyższa rozdzielczość wewnątrz strefy zainteresowania (odpowiadająca obrazowi 512 x 512). Rys. 4. Porównanie obrazu oryginalnego i skompresowanego a) obraz oryginalny (512 x 512 = 262144 pikseli) b) obraz skompresowany składający się z: 4851 pikseli rozdzielczości oryginalnej, 960 pikseli pierwszego uproszczonego obrazu oraz 14655 pikseli drugiego uproszczonego obrazu (razem 20466 pikseli, współczynnik kompresji 12,8) 6. Dyskusja i wnioski Głównym celem raportowanych prac było zbadanie możliwości wykorzystania sygnału okoruchowego do wskazania strefy zainteresowania obserwatora w celu adaptacji falkowego kompresora obrazów. Wykorzystano jedynie dwukrotne uproszczenie obrazu oryginalnego, a redukcja danych wizyjnych wykorzystywała jedynie zmianę rozmiaru piksela. Osiągnięcie współczynnika kompresji rzędu 12 było bardzo łatwe, co stwarza nadzieję na podwojenie jej efektywności przy zastosowaniu bardziej dopracowanej metodologii. Prototypowy system został zbudowany w oparciu o komputer PC, lecz w docelowej aplikacji bardziej właściwe wydaje się użycie procesora sygnałowego. Przedstawiona metoda kompresji nie wykorzystuje żadnych informacji o zawartości treści wizyjnej obrazu, ani o podobieństwie obrazów w sekwencji wideo. Możliwe jest zatem jej połączenie z dotychczas używanymi metodami w celu osiągnięcia ponadprzeciętnych rezultatów.

Literatura [1] R. W. Gubisch Optical Performance of Human Eye. J. Opt. Soc. AM 57, pp 407-415, 1967 [2] J. W. Woods S. D. O Neil Subband Coding of Images IEEE Trans. on ASSP, Vol 32 No. 5, Oct 1986. [3] S. Lewis G. Knowles Image Compression Using 2-D Wavelet Transform, IEEE Trans on Image Processing Vol 1. No. 2, pp 244-250, April 1992 [4] N. Ranganathan S. G. Romaniuk K. R. Namuduri A Lossless Image Compression Algorithm using Variable Block Size Segmentation, IEEE Trans on Image Processing Vol 4. No. 10, pp 1396-1406, October 1995 [5] Y. Zhuang Adaptive Wavelet System for Image Representation Proc. of ICSP 96 Beiging, Vol. 1 pp. 291-294, 1996 [6] R. Smirnoff Simulated Bipolar Cells in Fovea of Human Retinea Biol. Cybern. 66, 123-135, 1991 [7] S. French A. W. Snyder D. G. Stavenga Image Degradation by an Irregular Retinal Mosaic Biol. Cybern 27 pp 229-233, 1977 [8] W. Snyder T. R. Bossomaier A Hughes Optical Image Quality and the Cone Mosaic Science NY 321 pp 499-501, 1986 [9] B. Fisher H. Weber Express Saccades and Visual Attention Behavioral and Brain Sciences Vol. 16, pp 553-610, 1995 [10] S. G. Mallat, A Theory for Multiresolution Signal Decomposition: The Wavelet Representation, IEEE Trans on PAMI, Vol. 11 No. 7, July 1989 [11] I Daubechies Ten Lectures on Wavelets SIAM CBMS-NSF Regional Conference Series in Applied Mathematics, 1992 [12] J. L. Barbur W. D. Thomson P. M. Forsyth A New System for the Simultaneous Measurements of Pupil Size and Two-Dimensional Eye Movements Clin. Vision Sci., 2(2), pp 131-142, 1987 [13] J. Ober J. Hajda M. Jamicki J. Loska System Pomiarowy Ruchu Oka Ober2 w Medycynie. Proc. Techniki Informatyczne w Medycynie UŚ, pp 123-132, 1997 [14] Y. Yamanobe S. Taira T. Morizono Eye Movement analysis system Using Computerized Image recognition Arches of otolayngology Vol. 116 pp 338-341, 1990