MODEL EKSPERYMENTALNY OPISU TREŚCI WIZYJNYCH
|
|
- Janina Borowska
- 5 lat temu
- Przeglądów:
Transkrypt
1 Piotr Owczarek Tomasz Rosiński Instytut Elektroniki i Telekomunikacji Politechnika Poznańska ul. Piotrowo 3A, Poznań powczarek@et.put.poznan.pl trosins@et.put.poznan.pl MODEL EKSPERYMENTALNY OPISU TREŚCI WIZYJNYCH Streszczenie: Artykuł ten zawiera prezentację wyników działania oprogramowania referencyjnego standardu ISO/IEC MPEG-7 experimentation Model (XM). Zawarto w nim przegląd wybranych deskryptorów części wizyjnej standardu MPEG-7. Przegląd uzupełniony został eksperymentami przeprowadzonymi z wykorzystaniem XM i analizą otrzymanych wyników. 1. WPROWADZENIE Międzynarodowy standard ISO/IEC 15938, określany akronimem MPEG-7 (ang. Moving Picture Experts Group), definiuje opisu zawartości danych multimedialnych. Opis ten dokonywany jest przy użyciu deskryptorów. Deskryptory zawierają parametry cech danych multimedialnych wyznaczone w procesie ekstrakcji. Standard MPEG-7 w szczególności zawiera definicję semantyki i składni deskryptorów wizyjnych odnoszących się do zawartości obrazów cyfrowych oraz sekwencji wizyjnych. Opisowi z wykorzystaniem deskryptorów podlegają tzw. obiekty wizyjne (ang. video object), które opisywane są przy użyciu następujących cech: koloru, kształtu, tekstury oraz ruchu, dlatego też deskryptory wizyjne standardu można podzielić na grupy odnoszące się do każdej z tych cech [1, ]. W niniejszym opracowaniu zostały przedstawione wybrane deskryptory koloru, kształtu i tekstury zdefiniowane w dokumencie standardu: Multimedia Content Description Interface Part 3 Visual [1]. Dokonany przegląd uzupełniony został wynikami testów przeprowadzonych przez autorów z wykorzystaniem Modelu Eksperymentalnego MPEG-7. Celem tych eksperymentów jest analiza cech funkcjonalnych Modelu Eksperymentalnego.. MODEL EKSPERYMENTALNY Model Eksperymentalny (ang. experimentation Model, XM) to oprogramowanie referencyjne (ang. Reference Software) implementujące standard MPEG-7, które zostało opracowane przez międzynarodową grupę naukowców zajmujących się przetwarzaniem obrazów oraz opisem danych, w celu prowadzenia badań i testów. Jego kod źródłowy został napisany w języku C++ i jest udostępniany poprzez serwer Politechniki w Monachium [7]. XM zawiera implementację zarówno części normatywnych standardu MPEG-7 jak również dodatkowych komponentów, niezbędnych do ekstrakcji opisu danych multimedialnych. W wyniku kompilacji kodu źródłowego XM uzyskuje się dwa rodzaje aplikacji: Służące do ekstrakcji opisu; Wyszukujące odpowiednią zawartość wizyjną na podstawie zdefiniowanego zapytania. W przeprowadzonych eksperymentach została użyta wersja 5.6 Modelu Eksperymentalnego. 3. DESKRYPTORY KOLORU Deskryptory koloru odgrywają rolę w modelu eksperymentalnym, stanowią one najliczniejszą grupę, w skład której wchodzą: Dominant Color Descriptor; Scalable Color Descriptor; Color Structure Descriptor; Color Layout Descriptor; GoP/GoF Color Descriptor. Oprócz deskryptorów opisujących treść obrazu pod względem koloru XM zawiera również dwa deskryptory pomocnicze: Color Space Descriptor (CSD) i Color Quantization Descriptor (CQD). Nie są one wykorzy-stywane jako samodzielne ale w połączeniu z innymi deskryptorami. CSD określa przestrzeń barw użytą przez inny deskryptor szczególnie przez Dominant Color Descriptor. CQD określa natomiast poziomy kwantyzacji dla potrzeb innych deskryptorów Dominant Color Descriptor (DCD) DCD umożliwia opis kolorów reprezentatywnych dla danego obrazu lub regionu, a co za tym idzie pozwala na efektywne przeszukiwanie nawet bardzo dużych baz danych []. DCD zdefiniować można jako następujący wektor: F={(c i,p i,v i),s}, i=1,,...,n (3.1) gdzie: N - liczba kolorów dominujących, c i - wektor określający wartości poszczególnych składowych w odpowiedniej przestrzeni barw, p i względny udział składowej opisanej wektorem c i <0;1>; p i =1 i w danym obrazie (wartości z zakresu ), v i - opcjonalny parametr opisujący wa-riancję wartości koloru w obszarze wokół badanego koloru (ang. Color Variance), s - spójność przestrzenną (ang. Spatial Coherency) dla badanego koloru dominującego [1]. Liczba kolorów dominujących może być różna dla poszczególnych obrazów, jednakże maksymalna liczba określona przez standard wynosi 8 co zostało przyjęte jako warunek wystarczający dla poprawnej klasyfikacji obrazu pod względem DCD [1]. Wyszukiwanie podobieństw z wykorzystaniem DCD polega na obliczeniu DCD dla każdego koloru dominu-
2 jącego w obrazie będącym zapytaniem, po czym wyliczana jest dla par obrazów (obraz zapytanie, obraz badany) następująca odległość: N 1 N D = p 1i i=1 j=1 p j N 1 N i=1 j=1 a 1i, j p 1i p j (3.) gdzie indeksy 1 i dotyczą deskryptorów obu obrazów a parametr a k,l oznacza współczynnik podobieństwa między dwoma kolorami c k i c l.dokładną definicję parametru a 1i,j zawiera standard [1]. Jak widać z powyższych zależności w najprostszej wersji opisu nie jest konieczne branie pod uwagę przy wyszukiwaniu wartości wariancji i spójności przestrzennej. Najczęściej same wartości prawdopodo-bieństwa oraz wektory c i dają zadowalające rezultaty. Jeżeli jednak wymagana jest wysoka dokładność procedury wyszukującej należy uwzględnić również wspomniane wartości v i oraz s i. Odpowiednie zależności znaleźć można w standardzie [1] tiff b.tiff a.jpg Rys.3.. Zestaw obrazów najbardziej podobnych do zapytania przy użyciu deskryptorów koloru Wyniki testów przeprowadzonych przez autorów wykazują dużą skuteczność wyszukiwania z zasto-sowaniem DCD oraz zgodność z subiektywnymi odczuciami obserwatora. Użyta została pełna wersja deskryptora zawierająca wartości v i oraz s i Testy te wykazały mały wpływ kodowania oraz zmian rozdzielczości i skalowania na skuteczność wyszukiwania. Tab.3.1. Wyniki wyszukiwania z zastosowaniem DCD tiff a.jpg d.tiff c.tiff a.tiff c.tiff a.tiff d.tiff Odległość wyznaczona na podstawie wzoru e e e e e+001 Tab przedstawia wyniki otrzymane podczas testów na przykładowych obrazach; jako zapytanie użyty został obraz tiff. Należy zwrócić uwagę na fakt iż implementacja DCD w XM obarczona jest pewnym błędem objawiającym się niezerową wartością odległości pomiędzy dwoma identycznymi obrazami. 3.. Scalable Color Descriptor (SCD) Scalable Color Descriptor to deskryptor oparty na transformacji Haara zastosowanej na wartościach histogramu koloru w przestrzeni HSV. Wartości histogramu są normalizowane i w sposób nieliniowy kwantowane do reprezentacji liczby czterobitowej naturalnej w każdym z podzakresów histogramu. Na powstałych wartościach wykonywana jest transformacja Haara. Zależnie od zdefiniowanych parametrów deskryptora wartości mogą być skalowane poprzez odrzucanie mniej znaczących bitów współczynników transformaty jak również przez zmianę liczby wyznaczonych współczynników transformaty Haara [1]. Amplitudy współczynników zapisywane są w postaci płaszczyzn bitowych uporządkowanych od najbardziej znaczących do najmniej znaczących spośród wszystkich. Reprezentacja taka umożliwia skalowalność rozwiązania przy przesyłaniu opisu w ograniczonym paśmie. Wynik działania deskryptora zawiera informacje o ilości bitów jakie zostały odrzucone w reprezentacji amplitudy współczynników. W szczególnym przypadku odrzuconych może zostać nawet 8 bitów co daje w efekcie opis zawierający jedynie znaki poszczególnych współczynników transformaty. Podejście takie daje bardzo zwarty i kompaktowy opis [1, 3]. Wyszukiwanie realizowane może być na dwa sposoby w przestrzeni współczynników Haara lub - po wyliczeniu transformaty odwrotnej - na wartościach histogramu. Sposób pierwszy jest bardziej efektywny jeśli chodzi o złożoność obliczeniową choć daje nieznacznie gorsze rezultaty. Porównywanie odbywa się w tej metodzie poprzez obliczenie odległości Hamminga - porównywane są dwa deskryptory a wynik takiego porównania to liczba bitów różniących te opisy. Tab. 3.. przedstawia wynik wyszukiwania dla zestawu testowego obrazów[1]. Podobnie jak w przypadku deskryptora DCD autorzy stwierdzili niewielki wpływ kompresji oraz skalowania obrazów na skuteczność wyszukiwania. Tab. 3.. Wyniki wyszukiwania z zastosowaniem SCD Odległość Hamminga wektorów opisu tiff a.jpg d.tiff c.tiff a.tiff b.tiff Color Structure Descriptor (CSD) CSD opisuje obraz zarówno pod względem rozkładu kolorów jak również ich struktury. W odróżnieniu od histogramu koloru deskryptor ten bierze pod uwagę informacje przez histogram nie uwzględniane strukturę przestrzenną koloru w badanym obrazie. Ekstrakcja deskryptora odbywa się w trzech fazach: obliczanie histogramu CS (ang. Colour Structure) w przestrzeni HMMD skwantowanej wektorowo; nieliniowa kwantyzacja poziomów zgodnie z właściwościami statystycznymi obrazu. Pierwszy krok ekstrakcji daje w wyniku specyficzny histogram związany ściśle ze strukturą koloru w obrazie [1], []. Wartości histogramu przedstawiają zatem nie tyle amplitudy w poszczególnych przedziałach co charakterystykę przestrzenną rozkładu koloru.
3 Wyszukiwanie dopasowujące realizowane jest poprzez obliczenie podobieństwa między wektorami. Przy założeniu że h A(i) i h B(i) będą odpowiednio wektorami zawierającymi wartości deskryptorów dla obrazu A i B miara odległości będzie przedstawiać się następującą zależnością: N dist A, B = h A i h B i (3.3) i=0 gdzie: N - jest liczbą przedziałów kwantowania (N=56), i indeks przedziału kwantowania []. Tab przedstawia wyniki przeprowadzonych prób eksperymentalnych z wykorzystaniem CSD. Testy wykazały iż opis nie jest wrażliwy na zmiany rozdzielczości obrazu czy też kompresję co pokrywa się z założeniem iż istotnym elementem opisu jest rozkład przestrzenny koloru w obrazie. Tab Wyniki wyszukiwania z zastosowaniem CSD Odległość L1 wektorów opisu dist(a,b) tiff a.jpg d.tiff c.tiff a.tiff b.tiff Color Layout Desriptor (CLD) CLD to deskryptor zawierający opis koloru niewrażliwy na zmiany rozdzielczości, pozwalający na bardzo szybkie wyszukiwanie obrazów. Został on opracowany w celu umożliwienia opisu rozkładu przestrzennego koloru w obrazie. Zasadniczą różnicą w stosunku do CSD jest fakt iż wynikiem działania deskryptora nie jest histogram kolorów lecz próbki transformaty DCT dla poszczególnych składowych przestrzeni YCbCr [4]. Ekstrakcja deskryptora odbywa się w czterech etapach: podział obrazu na 64 (8x8) bloki, znalezienie dla każdego bloku koloru reprezentatywnego i przedstawienie obrazu jako 64 jednorodne co do koloru bloki, z których każdy zawiera jedynie kolor reprezentatywny, obliczenie DCT dla każdej składowej Y, Cb, Cr, uzyskane współczynniki są szeregowane zgodnie z uporządkowaniem zygzakowatym. Następnie pewna ich liczba jest kwantowana w sposób nieliniowy (64 poziomy dla współczynników DC i 3 dla współczynników AC). Ponieważ standard dopuszcza skalowalność deskryptora, możliwa jest różna liczba współczynników biorących udział w procesie kwantyzacji. Zalecane jest użycie 1 współczynników - 6 dla luminancji i po 3 dla obu chrominancji, jednakże istnieje też możliwość wykorzystania schematu wykorzystującego 18 współczynników (po 6 dla luminancji i każdej z chrominancji), jak również dowolne kształtowanie opisu przez podanie liczby próbek, osobno dla luminancji i chrominancji (możliwe wartości to 3, 6, 10, 15, 1,8 i 64). W deskryptorze zawarta jest zatem definicja zastosowanego wzorca, określająca liczbę współczynników Y,Cb i Cr użytych w opisie [1]. Wyszukiwanie odbywa się poprzez obliczanie odległości Euklidesowej pomiędzy wartościami dwóch deskryptorów dla każdej składowej koloru z osobna []: Tab przedstawia wyniki przeprowadzonych prób eksperymentalnych z wykorzystaniem CLD. Tab Wyniki wyszukiwania z zastosowaniem SCD Odległość L wektorów opisu - D tiff a.jpg d.tiff c.tiff a.tiff b.tiff Przeprowadzony eksperyment wykazał dużą zgodność wyszukiwania z wykorzystaniem deskryptora CLD z subiektywną oceną podobieństwa obrazów oraz jego bardzo małą wrażliwość na zmiany rozdzielczości obrazu i zniekształcenia czy skalowanie. 4. DESKRYPTORY KSZTAŁTU Standard MPEG-7 definiuje trzy deskryptory związane z kształtem obiektu dwa dotyczące obiektów dwuwymiarowych (Region Based Shape Decsriptor, Contour Based Shape Descriptor) oraz jeden opisujący obiekty trójwymiarowe (3-D Shape Descriptor) Region-Based Shape Descriptor (RSD) Deskryptor ten opisuje kształt obiektu biorąc pod uwagę zarówno punkty obrysu jak i punkty wewnętrzne, a co za tym idzie można dzięki niemu uzyskać efektywny opis kształtu nawet wówczas gdy zawiera on obszary rozłączne lub dziury. Deskryptor działa na zasadzie opisu kształtu za pomocą szeregu dwuwymiarowych zespolonych ortogonalnych funkcji ART (ang. Angular Radial Transform) [1, 6] określonych zależnością: F nm = V nm,, f, = V nm, f, d d (4.1) gdzie F nm jest współczynnikiem transformaty ART rzędu n i m, f(ρ,θ) jest obrazem przedstawionym we współrzędnych biegunowych, V(ρ,θ) jest funkcją podstawową ART zdefiniowaną następującą zależnością : V nm, =A m R n. (4.) Funkcje bazowe - kątowa A m oraz promieniowa R n zdefiowane są zależnościami (8) i (9). A m = 1 exp jm, (4.3) R n ={ 1, n=0, cos n, n 0. (4.4) Proces ekstrakcji deskryptora przebiega w następujących fazach: wygenerowanie funkcji podstawowych używane
4 są trzy funkcje radialne i 1 funkcji kątowych, normalizacja rozmiaru danego kształtu, wyliczenie transformaty ART, normalizacja współczynników transformaty, kwantyzacja współczynników ART. Wynikiem działania powyższego algorytmu jest opis zawierający tablicę 35 znormalizowanych i skwantowanych współczynników ART zapisanych w postaci czterobitowej [1,, 5]. (a) (b) Rys. 4.. (a) Obraz użyty jako zapytanie, (b) pięć pierwszych obrazów wyszukanych przez RSD Tab Wyniki wyszukiwania z zastosowaniem CSD Odległość L1 wektorów opisu - D e e e e e-001 Tab. 4.1 przedstawia wyniki otrzymane podczas eksperymentów, a poszczególne obrazy przedstawia rys. 4.. Zestaw testowy zawierał 76 obrazów monochromatycznych. Jak wykazały testy deskryptor ten jest odporny na zmiany skali obiektu, jego pozycji oraz obrotu. Model Eksperymentalny wykorzystuje dla potrzeb wyszukiwania binarne maski obiektów jako zapytania. Wyszukiwanie dopasowujące korzysta z następującej definicji podobieństwa: D= M d [i] M q [i] (4.5) i gdzie M oznacza tablicę otrzymanych współczynników ART, indeksy d i q dotyczą odpowiednio obrazu badanego i obrazu będącego zapytaniem. 4.. Contour-Based Shape Descriptor (CSD) CSD oparty jest na przekształceniu CSS (ang. Curvature Scale Space). Polega ono na wyszukaniu wklęsłości i wypukłości kształtu przez wyznaczenie punktów przegięcia. Proces ten powtarzany jest dla konturów obrazu przeskalowanych w procesie wygładzania. W każdym z kroków przekształcenia wyznaczane są punkty zerowe funkcji krzywizny konturu [1]. Wartości deskryptora przedstawione są jako pary wektorów określających regularność kształtu i jego pukty charakterystyczne pod względem obwiedni, dla obrazów oryginalnego i po przeprowadzonej filtracji (wygładzaniu) oraz liczbę wartości szczytowych funkcji CSS wraz z maksymalną amplitudą. Zawarte są w nim również pozycje poszczególnych wartości szczytowych względem konturu obiektu [3]. Wyszukiwanie realizowane jest poprzez obliczenie odległości euklidesowej pomiędzy odpowiadającymi sobie pod względem położenia wartościami szczytowymi funkcji CSS. Reprezentacja cech konturu w taki sposób, w jaki przedstawiono powyżej jest odporna na zmiany położenia, orientacji, skalowanie i odbicia badanych kształtów oraz na zaszumienie samego konturu. W Modelu Eksperymentalnym przyjęte zostały następujące ograniczenia dotyczące deskryptora: kształty zdefiniowane zostały jako białe obiekty na czarnym tle; w przypadku gdy obraz zawiera więcej niż jeden kształt badany jest tylko kształt znaleziony jako pierwszy począwszy od górnego lewego narożnika obrazu [7]. W związku z powyższym obrazy należące do zestawu testowego zostały przedstawione jako negatywy obrazów z zestawu testowego RSD. (a) (b) Rys (a) Obraz użyty jako zapytanie, (b) pięć pierwszych obrazów wyszukanych przez CSD Tab. 4.. Wyniki wyszukiwania z zastosowaniem CSD Odległość L wartości szczytowych funkcji CSS Wyniki przeprowadzonego eksperymentu przedstawia rys. 4.3 oraz tab DESKRYPTORY TEKSTURY Tekstura obiektu wizyjnego to cecha, która jest użyteczna w wielu systemach przetwarzania obrazów, np. w analizie obrazów lotniczych i medycznych. Tekstura jest także cechą, która umożliwia wyszukiwanie obrazów (ang. image retrieval). W standardzie MPEG-7 zostały zdefiniowane trzy deskryptory tekstury obiektów wizyjnych [1]: Homogeneous Texture Descriptor HTD, który służy do opisu jednorodnych tekstur obiektów wizyjnych; Texture Browsing Descriptor TBD, który opisuje percepcyjne właściwości postrzegania tekstur; Edge Components Histogram Descriptor ECHD, który nie opisuje regionów o danych teksturach, lecz rozkład i kierunkowość krawędzi pomiędzy regionami o różnych teksturach w obrazie. Wyniki ekstrakcji cech tekstur przy użyciu deskryptorów HTD oraz TBD zostaną przedstawione odpowiednio w
5 podpunktach 5.1 i Homogeneous Texture Descriptor (HTD) Homogeneous Texture Descriptor służy do opisu jednorodnych tekstur obiektów wizyjnych. Metoda wykorzystywana do ekstrakcji tego deskryptora została zaproponowana w pracy [10] i polega na wyznaczeniu parametrów statystycznych każdego z kanałów dwuwymiarowego widma obrazu statycznego. Podział widma na rozłączne subpasma (Rys 5.1.) odbywa się przy użyciu zastawu filtrów zamodelowanych funkcją Gabora [10]: ( s ) ( r ), ) exp( )exp( ) (5.1) G s, r ( s s Oznaczenia użyte we wzorze 4.1: s, r indeksy subpasm; ω, θ argument pulsacji i kąta; σ, τ odchylenie standardowe argumentu pulsacji i kąta. Rys Podział widma na kanały dla obliczeń deskryptora HTD ( sporządzono na podstawie [1]) Deskryptor HTD dzieli widmo obrazu na 30 kanałów o sześciu kierunkach orientacji i pięciu zakresach częstotliwości (rys. 5.1). Dla każdego z kanałów wyznaczana jest średnia energia składników widma oraz ich wariancja. Składnia deskryptora HTD jest następująca [1]: HTD f, f, e,..., e, d,..., ] (5.) [ DC SD d 30 Użyte we wzorze 5. symbole oznaczają: f DC jednorodnie skwantowana wartość średniej luminancji obrazu; f SD jednorodnie skwantowana wartość odchylenia standardowego luminancji punktów obrazu od średniej; e i średnia wartość energii i-tego kanału; d i wartość dewiacji energii i-tego kanału. Ekstrakcja i wyszukiwanie na podstawie deskryptora HTD zostało przeprowadzone na monochromatycznych obrazach tekstur pochodzących ze zbioru testowego Brodatz [8] Do testów zostało użytych 97 różnych obrazów tego zbioru. Jako miara porównania wektorów w przestrzeni opisu została zastosowana norma L1: d x, y = x i y i (5.3) N x i i y i są wektorami opisu dwóch obrazów w przestrzeni opisu R n. Poniżej (tab. 5.1) zostały zaprezentowane rezultaty wyszukiwania dla zapytania będącego obrazem D00. W wyniku otrzymano uszeregowaną listę tekstur najbardziej odpowiadających zadanemu zapytaniu. Sześć obrazów o największym podobieństwie do zapytania przedstawia rys. 5.. D00 D40 D9 D9 D19 D67 Rys. 5.. Obrazy najbardziej podobnych tekstur do D00, wyszukiwanie na podstawie HTD Tab. 5.1 Wyniki wyszukiwania z zastosowaniem HTD dla obrazu D00 Lp. Obraz Odległość wektorów opisu d 1 D D D D D D Wyznaczone w procesie wyszukiwania obrazy (rys. 5.) różnią się znacznie zarówno luminancją jak i prezentowaną zawartością. W rezultacie porównania obrazów tekstur z użyciem deskryptora HTD otrzymujemy wyniki, które nie zawsze są zgodne z odczuciami percepcyjnymi. Jednakże wyznaczanie opisu HTD jest stosunkowo szybkie. 5.. Texture Browsing Descriptor (TBD) Texture Browsing Descriptor opisuje tekstury obiektów wizyjnych poprzez wyznaczenie parametrów odpowiadających ludzkiemu sposobowi postrzegania []. Składnia opisu deskryptora TBD jest następująca: TBD v, v, v, v, ] (5.4). [ v5 Użyte we wzorze 5.4 symbole oznaczają [1]: v 1 parametr regularności bądź strukturyzacji tekstury (ang. regularity); v v 3 parametry opisujące kierunkowość tekstury (ang. directionality); v 4 v 5 parametry opisujące ziarnistość tekstury (ang. coarseness). Algorytm ekstrakcji cech TBD został przedstawiony w [1, ] i także opiera się na filtracji widma z użyciem funkcji Gabora (wzór 5.1). Uzyskane w ten sposób kanały podlegają następnie szczegółowej analizie. Miara odległości d wektorów cech zostaje wyznaczona
6 zgodnie z algorytmem przedstawionym w [3]. W tab. 5. zostały przedstawione wyniki wyszukiwania z wykorzystaniem deskryptora TBD. Test został prze-prowadzony na 97 monochromatycznych obrazach tekstur ze zbioru Brodatz [9] dla zapytania będącego obrazem D00. Na rys. 5.3 przedstawiono sześć obrazów o największym podo-bieństwie do zapytania. D00 D9 D31 D58 D86 D99 Rys Obrazy najbardziej podobnych tekstur do D00, wyszukiwanie na podstawie TBD Tab. 5. Wyniki wyszukiwania z zastosowaniem HTD dla obrazu D00 Lp. Obraz Odległość wektorów opisu d 1 D D D D D D Deskryptor TBD ma na celu wyznaczenie opisu, który bardziej odpowiada percepcyjnym właściwościom postrzegania człowieka. Nie gwarantuje to jednak uzyskiwania zadowalających rezultatów wyszukiwania (rys 5.3). W przeprowadzonym teście uzyskaliśmy trzy obrazy tekstur (tab. 5.), które posiadają takie same wektory opisu, co zapytanie (tj. d = ). Pozostałe dwa obrazy różnią się nieznacznie (tj. d = ) Liczba parametrów deskryptora jest ograniczona do pięciu (wzór 5.4). Dodatkowo wartości poszczególnych parametrów są silnie kwantowane, co zapewnia bardzo ograniczoną objętość bitową deskryptora. Jednakże wpływa to bardzo niekorzystnie na precyzję wyszukiwania z użyciem TBD i ogranicza zakres jego zastosowań. Deskryptor TBD charakteryzuje się bardzo dużą złożonością obliczeniowa ekstrakcji opisu, co dyskwalifikuje zastosowanie tego deskryptora w aplikacjach działających w czasie rzeczywistym. 6. PODSUMOWANIE W niniejszym artykule zawarto przegląd wybranych deskryptorów wizyjnych standardu MPEG-7 oraz wyników ich ekstrakcji przy wykorzystaniu Modelu Eksperymentalnego. Użycie Modelu Eksperymentalnego w każdym z przeprowadzonych testów gwarantowało uzyskanie deskryptorów zgodnych ze składnią standardu. Zbiór danych wejściowych użytych do eksperymentów z poszczególnymi deskryptorami został odpowiednio wyselekcjonowany. Ocena trafności uzyskanych wyników miała charakter subiektywny i była w dużej mierze zależna od wykorzystanego zbioru danych testowych. Przeprowadzone eksperymenty dotyczyły opisu i wyszukiwania na podstawie deskryptora tylko jednej cechy. Jednakże w przypadku wyszukiwania w rzeczywistych zbiorach danych wizyjnych niezbędnym wydaje się tworzenie schematów opisu, które będą integrować odpowiednio dobrane grupy deskryptorów. W tym przypadku koniecznym jest przyporządkowanie odpowiednich wag ekstrahowanym deskryptorom. SPIS LITERATURY [1] ISO/IEC /FCD, Information technology Multimedia content description interface Part 3 Visual [] B.S. Manjunath, P. Salembier, T. Sikora, Introduction to MPEG-7, John Willey & Sons, Ltd. 00 [3] A. Yamada, M. Pickering, S. Jeannin, L. Cieplinski, J. R. Ohm, M. Kim, MPEG-7 Visual part of experimentation Model Version 10.0, ISO/IEC JTC1/SC9/WG11/N4063, March, 001 [4] B.S. Manjunath, J. R. Ohm, V. V. Vasudevan, A. Yamada, Color and Texture Descriptors, IEEE Transactions On Circuits and Systems for Video Technology, Vol 11, No. 6, June 001 [5] M. Bober, Mpeg-7 Visual Shape Desriptors IEEE Transactions On Circuits and Systems for Video Technology, Vol 11, No. 6, June 001 [6] T. Sikora, The MPEG-7 Visual Standard for Content Description An Overview, IEEE Transactions On Circuits and Systems for Video Technology, Vol 11, No. 6, June 001 [7] MPEG-7 XM Software v.5.6, Institute for Integrated Circuits, Technische Universität Munchen, Germany, June research/bv/topics/mmdb/e-mpeg7.html [8] P. Brodatz, Textures: A Photographic Album for Artists & Designers, Dover, New York, 1966 [9] J. R. Smith S. Chang, VisualSEEk: A Fully Automated Content-Based Image Query System, ACM Multimedia, 1996 [10] B. S. Manjunath, W. Y. Ma: Texture features for browsing and retrieval of image data, IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 18, no. 8, pp , 1996
dr inż. Jacek Naruniec email: J.Naruniec@ire.pw.edu.pl
dr inż. Jacek Naruniec email: J.Naruniec@ire.pw.edu.pl Coraz większa ilość danych obrazowych How much information, University of California Berkeley, 2002: przyrost zdjęć rentgenowskich to 17,2 PB rocznie
27 stycznia 2009
SM@KRS 27 stycznia 2009 1 Advanced Video Coding H.264/AVC jest na dzień dzisiejszy najbardziej zaawansowanym standardem kompresji sekwencji wizyjnych. W stosunku do wykorzystywanego obecnie w telewizji
Założenia i obszar zastosowań. JPEG - algorytm kodowania obrazu. Geneza algorytmu KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG
Założenia i obszar zastosowań KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG Plan wykładu: Geneza algorytmu Założenia i obszar zastosowań JPEG kroki algorytmu kodowania obrazu Założenia: Obraz monochromatyczny
KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG
KOMPRESJA OBRAZÓW STATYCZNYCH - ALGORYTM JPEG Joint Photographic Expert Group - 1986 ISO - International Standard Organisation CCITT - Comité Consultatif International de Téléphonie et Télégraphie Standard
INDEKSOWANIE DUŻYCH ZBIORÓW OBRAZÓW
Paweł Forczmański, Przemysław Szeptycki INDEKSOWANIE DUŻYCH ZBIORÓW OBRAZÓW Streszczenie W artykule zaprezentowane zostały wybrane metody indeksowania dużych zbiorów obrazów statycznych bazujące na autorskich
Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j
Kompresja transformacyjna. Opis standardu JPEG. Algorytm JPEG powstał w wyniku prac prowadzonych przez grupę ekspertów (ang. Joint Photographic Expert Group). Prace te zakończyły się w 1991 roku, kiedy
Przetwarzanie obrazu
Przetwarzanie obrazu Przegląd z uwzględnieniem obrazowej bazy danych Tatiana Jaworska Jaworska@ibspan.waw.pl www.ibspan.waw.pl/~jaworska Umiejscowienie przetwarzania obrazu Plan prezentacji Pojęcia podstawowe
Kompresja obrazów w statycznych - algorytm JPEG
Kompresja obrazów w statycznych - algorytm JPEG Joint Photographic Expert Group - 986 ISO - International Standard Organisation CCITT - Comité Consultatif International de Téléphonie et Télégraphie Standard
Detekcja kształtów i wybrane cechy obrazów konturowych
Informatyka, S2 sem. Letni, 2013/2014, wykład#7 Detekcja kształtów i wybrane cechy obrazów konturowych dr inż. Paweł Forczmański Katedra Systemów Multimedialnych, Wydział Informatyki ZUT 1 / 61 Proces
Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2.
Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2. Technika obrazu 24 W.3. Normalizacja w zakresie obrazu cyfrowego
Kodowanie transformacyjne. Plan 1. Zasada 2. Rodzaje transformacji 3. Standard JPEG
Kodowanie transformacyjne Plan 1. Zasada 2. Rodzaje transformacji 3. Standard JPEG Zasada Zasada podstawowa: na danych wykonujemy transformacje która: Likwiduje korelacje Skupia energię w kilku komponentach
Przetwarzanie obrazów rastrowych macierzą konwolucji
Przetwarzanie obrazów rastrowych macierzą konwolucji 1 Wstęp Obrazy rastrowe są na ogół reprezentowane w dwuwymiarowych tablicach złożonych z pikseli, reprezentowanych przez liczby określające ich jasność
BIBLIOTEKA PROGRAMU R - BIOPS. Narzędzia Informatyczne w Badaniach Naukowych Katarzyna Bernat
BIBLIOTEKA PROGRAMU R - BIOPS Narzędzia Informatyczne w Badaniach Naukowych Katarzyna Bernat Biblioteka biops zawiera funkcje do analizy i przetwarzania obrazów. Operacje geometryczne (obrót, przesunięcie,
Kompresja sekwencji obrazów - algorytm MPEG-2
Kompresja sekwencji obrazów - algorytm MPEG- Moving Pictures Experts Group (MPEG) - 988 ISO - International Standard Organisation CCITT - Comité Consultatif International de Téléphonie et TélégraphieT
Algorytmy decyzyjne będące alternatywą dla sieci neuronowych
Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Piotr Dalka Przykładowe algorytmy decyzyjne Sztuczne sieci neuronowe Algorytm k najbliższych sąsiadów Kaskada klasyfikatorów AdaBoost Naiwny
Cyfrowe przetwarzanie i kompresja danych
Cyfrowe przetwarzanie i kompresja danych dr inż.. Wojciech Zając Wykład 5. Dyskretna transformata falkowa Schemat systemu transmisji danych wizyjnych Źródło danych Przetwarzanie Przesył Przetwarzanie Prezentacja
Wyszukiwanie informacji w dużych zbiorach obrazów
informacji w dużych zbiorach obrazów Paweł Forczmański Katedra Systemów Multimedialnych, Wydział Informatyki, Zachodniopomorski Uniwersytet Technologiczny w Szczecinie 1 Wprowadzenie Obraz i dźwięk są
Parametryzacja obrazu na potrzeby algorytmów decyzyjnych
Parametryzacja obrazu na potrzeby algorytmów decyzyjnych Piotr Dalka Wprowadzenie Z reguły nie stosuje się podawania na wejście algorytmów decyzyjnych bezpośrednio wartości pikseli obrazu Obraz jest przekształcany
MPEG Wstęp. Multimedia Content Description Interface Oficjalna nazwa: (zwarty zapis) obiektów w multimedialnych.
MPEG-7 1. Wstęp Oficjalna nazwa: Multimedia Content Description Interface - 2001 Język opisu zawartości obiektów w multimedialnych MPEG-1, MPEG-2, MPEG- 4 - normowały y reprezentację (zwarty zapis) obiektów
W poszukiwaniu sensu w świecie widzialnym
W poszukiwaniu sensu w świecie widzialnym Andrzej Śluzek Nanyang Technological University Singapore Uniwersytet Mikołaja Kopernika Toruń AGH, Kraków, 28 maja 2010 1 Podziękowania Przedstawione wyniki powstały
Wprowadzenie do multimedialnych baz danych. Opracował: dr inż. Piotr Suchomski
Wprowadzenie do multimedialnych baz danych Opracował: dr inż. Piotr Suchomski Wprowadzenie bazy danych Multimedialne bazy danych to takie bazy danych, w których danymi mogą być tekst, zdjęcia, grafika,
Kompresja sekwencji obrazów
Kompresja sekwencji obrazów - algorytm MPEG-2 Moving Pictures Experts Group (MPEG) - 1988 ISO - International Standard Organisation CCITT - Comité Consultatif International de Téléphonie T et TélégraphieT
Akwizycja obrazów. Zagadnienia wstępne
Akwizycja obrazów. Zagadnienia wstępne Wykorzystane materiały: R. Tadeusiewicz, P. Korohoda, Komputerowa analiza i przetwarzanie obrazów, Wyd. FPT, Kraków, 1997 A. Przelaskowski, Techniki Multimedialne,
Transformata Fouriera
Transformata Fouriera Program wykładu 1. Wprowadzenie teoretyczne 2. Algorytm FFT 3. Zastosowanie analizy Fouriera 4. Przykłady programów Wprowadzenie teoretyczne Zespolona transformata Fouriera Jeżeli
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia
Klasyfikacja metod kompresji
dr inż. Piotr Odya Klasyfikacja metod kompresji Metody bezstratne Zakodowany strumień danych po dekompresji jest identyczny z oryginalnymi danymi przed kompresją, Metody stratne W wyniku kompresji część
Politechnika Świętokrzyska. Laboratorium. Cyfrowe przetwarzanie sygnałów. Ćwiczenie 6. Transformata cosinusowa. Krótkookresowa transformata Fouriera.
Politechnika Świętokrzyska Laboratorium Cyfrowe przetwarzanie sygnałów Ćwiczenie 6 Transformata cosinusowa. Krótkookresowa transformata Fouriera. Cel ćwiczenia Celem ćwiczenia jest zapoznanie studentów
Metody kodowania wybranych cech biometrycznych na przykładzie wzoru naczyń krwionośnych dłoni i przedramienia. Mgr inż.
Metody kodowania wybranych cech biometrycznych na przykładzie wzoru naczyń krwionośnych dłoni i przedramienia Mgr inż. Dorota Smorawa Plan prezentacji 1. Wprowadzenie do zagadnienia 2. Opis urządzeń badawczych
Joint Photographic Experts Group
Joint Photographic Experts Group Artur Drozd Uniwersytet Jagielloński 14 maja 2010 1 Co to jest JPEG? Dlaczego powstał? 2 Transformata Fouriera 3 Dyskretna transformata kosinusowa (DCT-II) 4 Kodowanie
dr inż. Piotr Odya dr inż. Piotr Suchomski
dr inż. Piotr Odya dr inż. Piotr Suchomski Podział grafiki wektorowa; matematyczny opis rysunku; małe wymagania pamięciowe (i obliczeniowe); rasteryzacja konwersja do postaci rastrowej; rastrowa; tablica
Ćwiczenie 4. Filtry o skończonej odpowiedzi impulsowej (SOI)
Politechnika Wrocławska Wydział Elektroniki Mikrosystemów i Fotoniki Przetwarzanie sygnałów laboratorium ETD5067L Ćwiczenie 4. Filtry o skończonej odpowiedzi impulsowej (SOI) 1. Filtracja cyfrowa podstawowe
10. Redukcja wymiaru - metoda PCA
Algorytmy rozpoznawania obrazów 10. Redukcja wymiaru - metoda PCA dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. PCA Analiza składowych głównych: w skrócie nazywana PCA (od ang. Principle Component
Diagnostyka obrazowa
Diagnostyka obrazowa Ćwiczenie szóste Transformacje obrazu w dziedzinie częstotliwości 1 Cel ćwiczenia Ćwiczenie ma na celu zapoznanie uczestników kursu Diagnostyka obrazowa z podstawowymi przekształceniami
0. OpenGL ma układ współrzędnych taki, że oś y jest skierowana (względem monitora) a) w dół b) w górę c) w lewo d) w prawo e) w kierunku do
0. OpenGL ma układ współrzędnych taki, że oś y jest skierowana (względem monitora) a) w dół b) w górę c) w lewo d) w prawo e) w kierunku do obserwatora f) w kierunku od obserwatora 1. Obrót dookoła osi
Cyfrowe przetwarzanie obrazów i sygnałów Wykład 8 AiR III
1 Niniejszy dokument zawiera materiały do wykładu z przedmiotu Cyfrowe Przetwarzanie Obrazów i Sygnałów. Jest on udostępniony pod warunkiem wykorzystania wyłącznie do własnych, prywatnych potrzeb i może
Kompresja dźwięku w standardzie MPEG-1
mgr inż. Grzegorz Kraszewski SYSTEMY MULTIMEDIALNE wykład 7, strona 1. Kompresja dźwięku w standardzie MPEG-1 Ogólne założenia kompresji stratnej Zjawisko maskowania psychoakustycznego Schemat blokowy
dr inż. Piotr Odya Wprowadzenie
dr inż. Piotr Odya Wprowadzenie Dane multimedialne to przede wszystkim duże strumienie danych liczone w MB a coraz częściej w GB; Mimo dynamicznego rozwoju technologii pamięci i coraz szybszych transferów
FFT i dyskretny splot. Aplikacje w DSP
i dyskretny splot. Aplikacje w DSP Marcin Jenczmyk m.jenczmyk@knm.katowice.pl Wydział Matematyki, Fizyki i Chemii 10 maja 2014 M. Jenczmyk Sesja wiosenna KNM 2014 i dyskretny splot 1 / 17 Transformata
Przetwarzanie obrazu
Przetwarzanie obrazu Przegląd z uwzględnieniem obrazowej bazy danych Tatiana Jaworska Jaworska@ibspan.waw.pl www.ibspan.waw.pl/~jaworska Umiejscowienie przetwarzania obrazu Plan prezentacji Pojęcia podstawowe
Transformaty. Kodowanie transformujace
Transformaty. Kodowanie transformujace Kodowanie i kompresja informacji - Wykład 10 10 maja 2009 Szeregi Fouriera Każda funkcję okresowa f (t) o okresie T można zapisać jako f (t) = a 0 + a n cos nω 0
Zbigniew JERZAK Adam KOTLIŃSKI. Studenci kierunku Informatyka na Politechnice Śląskiej w Gliwicach
Studenci kierunku Informatyka na Politechnice Śląskiej w Gliwicach Program zrealizowany na potrzeby Pracowni Komputerowej Analizy Obrazu i Mikroskopii Konfokalnej w Centrum Onkologii w Gliwicach Gliwice,
Rozpoznawanie obrazów na przykładzie rozpoznawania twarzy
Rozpoznawanie obrazów na przykładzie rozpoznawania twarzy Wykorzystane materiały: Zadanie W dalszej części prezentacji będzie omawiane zagadnienie rozpoznawania twarzy Problem ten można jednak uogólnić
Kompresja JPG obrazu sonarowego z uwzględnieniem założonego poziomu błędu
Kompresja JPG obrazu sonarowego z uwzględnieniem założonego poziomu błędu Mariusz Borawski Wydział Informatyki Zachodniopomorski Uniwersytet Technologiczny w Szczecinie Zbieranie danych Obraz sonarowy
Reprezentacja i analiza obszarów
Cechy kształtu Topologiczne Geometryczne spójność liczba otworów liczba Eulera szkielet obwód pole powierzchni środek cięŝkości ułoŝenie przestrzenne momenty wyŝszych rzędów promienie max-min centryczność
Wyszukiwanie obrazów 1
Wyszukiwanie obrazów 1 Wyszukiwanie według zawartości Wyszukiwanie wg zawartości jest procesem wyszukiwania w bazach danych (zbiorach dokumentów ) obiektów o treści najbardziej zbliżonej do zadanego wzorca.
Klasyfikacja metod kompresji
dr inż. Piotr Odya Klasyfikacja metod kompresji Metody bezstratne Zakodowany strumień danych po dekompresji jest identyczny z oryginalnymi danymi przed kompresją, Metody stratne W wyniku kompresji część
Metoda określania pozycji wodnicy statków na podstawie pomiarów odległości statku od głowic laserowych
inż. Marek Duczkowski Metoda określania pozycji wodnicy statków na podstawie pomiarów odległości statku od głowic laserowych słowa kluczowe: algorytm gradientowy, optymalizacja, określanie wodnicy W artykule
Grafika Komputerowa Wykład 2. Przetwarzanie obrazów. mgr inż. Michał Chwesiuk 1/38
Wykład 2 Przetwarzanie obrazów mgr inż. 1/38 Przetwarzanie obrazów rastrowych Jedna z dziedzin cyfrowego obrazów rastrowych. Celem przetworzenia obrazów rastrowych jest użycie edytujących piksele w celu
Wybrane metody kompresji obrazów
Wybrane metody kompresji obrazów Celem kodowania kompresyjnego obrazu jest redukcja ilości informacji w nim zawartej. Redukcja ta polega na usuwaniu informacji nadmiarowej w obrazie, tzw. redundancji.
Wydział Elektryczny. Katedra Telekomunikacji i Aparatury Elektronicznej. Instrukcja do pracowni specjalistycznej
Politechnika Białostocka Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej Instrukcja do pracowni specjalistycznej Temat ćwiczenia: Badanie własności koderów PCM zastosowanych do sygnałów
Kodowanie i kompresja Streszczenie Studia Wieczorowe Wykład 10, 2007
1 Kompresja wideo Kodowanie i kompresja Streszczenie Studia Wieczorowe Wykład 10, 2007 Dane wideo jako sekwencja skorelowanych obrazów (ramek). Specyfika danych wideo: drobne zmiany kolorów w kolejnych
Zastosowanie kompresji w kryptografii Piotr Piotrowski
Zastosowanie kompresji w kryptografii Piotr Piotrowski 1 Plan prezentacji I. Wstęp II. Kryteria oceny algorytmów III. Główne klasy algorytmów IV. Przykłady algorytmów selektywnego szyfrowania V. Podsumowanie
Obraz jako funkcja Przekształcenia geometryczne
Cyfrowe przetwarzanie obrazów I Obraz jako funkcja Przekształcenia geometryczne dr. inż Robert Kazała Definicja obrazu Obraz dwuwymiarowa funkcja intensywności światła f(x,y); wartość f w przestrzennych
Zastosowania obliczeń inteligentnych do wyszukiwania w obrazowych bazach danych
Zastosowania obliczeń inteligentnych do wyszukiwania w obrazowych bazach danych Tatiana Jaworska Jaworska@ibspan.waw.pl www.ibspan.waw.pl/~jaworska Istniejące systemy - Google Istniejące systemy - Google
Manipulator OOO z systemem wizyjnym
Studenckie Koło Naukowe Robotyki Encoder Wydział Automatyki, Elektroniki i Informatyki Politechnika Śląska Manipulator OOO z systemem wizyjnym Raport z realizacji projektu Daniel Dreszer Kamil Gnacik Paweł
Automatyczne tworzenie trójwymiarowego planu pomieszczenia z zastosowaniem metod stereowizyjnych
Automatyczne tworzenie trójwymiarowego planu pomieszczenia z zastosowaniem metod stereowizyjnych autor: Robert Drab opiekun naukowy: dr inż. Paweł Rotter 1. Wstęp Zagadnienie generowania trójwymiarowego
Reprezentacja i analiza obszarów
Cechy kształtu Topologiczne Geometryczne spójność liczba otworów liczba Eulera szkielet obwód pole powierzchni środek ciężkości ułożenie przestrzenne momenty wyższych rzędów promienie max-min centryczność
SYSTEM BIOMETRYCZNY IDENTYFIKUJĄCY OSOBY NA PODSTAWIE CECH OSOBNICZYCH TWARZY. Autorzy: M. Lewicka, K. Stańczyk
SYSTEM BIOMETRYCZNY IDENTYFIKUJĄCY OSOBY NA PODSTAWIE CECH OSOBNICZYCH TWARZY Autorzy: M. Lewicka, K. Stańczyk Kraków 2008 Cel pracy projekt i implementacja systemu rozpoznawania twarzy, który na podstawie
Inteligentna analiza danych
Numer indeksu 150946 Michał Moroz Imię i nazwisko Numer indeksu 150875 Grzegorz Graczyk Imię i nazwisko kierunek: Informatyka rok akademicki: 2010/2011 Inteligentna analiza danych Ćwiczenie I Wskaźniki
POPRAWIANIE JAKOŚCI OBRAZU W DZIEDZINIE PRZESTRZENNEJ (spatial image enhancement)
POPRAWIANIE JAKOŚCI OBRAZU W DZIEDZINIE PRZESTRZENNEJ (spatial image enhancement) Przetwarzanie obrazów cyfrowych w celu wydobycia / uwydatnienia specyficznych cech obrazu dla określonych zastosowań. Brak
EKSPLORACJA ZASOBÓW INTERNETU LABORATORIUM VIII WYSZUKIWANIE OBRAZÓW
EKSPLORACJA ZASOBÓW INTERNETU LABORATORIUM VIII WYSZUKIWANIE OBRAZÓW 1. Motywacja Strony internetowe zawierają 70% multimediów Tradycyjne wyszukiwarki wspierają wyszukiwanie tekstu Kolekcje obrazów: Dwie
Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
Cyfrowe przetwarzanie obrazów i sygnałów Wykład 9 AiR III
1 Na podstawie materiałów autorstwa dra inż. Marka Wnuka. Niniejszy dokument zawiera materiały do wykładu z przedmiotu Cyfrowe Przetwarzanie Obrazów i Sygnałów. Jest on udostępniony pod warunkiem wykorzystania
Diagnostyka obrazowa
Diagnostyka obrazowa Ćwiczenie szóste Transformacje obrazu w dziedzinie częstotliwości 1. Cel ćwiczenia Ćwiczenie ma na celu zapoznanie uczestników kursu Diagnostyka obrazowa z podstawowymi przekształceniami
Hierarchiczna analiza skupień
Hierarchiczna analiza skupień Cel analizy Analiza skupień ma na celu wykrycie w zbiorze obserwacji klastrów, czyli rozłącznych podzbiorów obserwacji, wewnątrz których obserwacje są sobie w jakimś określonym
S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor
S O M SELF-ORGANIZING MAPS Przemysław Szczepańczyk Łukasz Myszor Podstawy teoretyczne Map Samoorganizujących się stworzył prof. Teuvo Kohonen (1982 r.). SOM wywodzi się ze sztucznych sieci neuronowych.
Przekształcenia punktowe
Przekształcenia punktowe Przekształcenia punktowe realizowane sa w taki sposób, że wymagane operacje wykonuje sie na poszczególnych pojedynczych punktach źródłowego obrazu, otrzymujac w efekcie pojedyncze
Spośród licznych filtrów nieliniowych najlepszymi właściwościami odznacza się filtr medianowy prosty i skuteczny.
Filtracja nieliniowa może być bardzo skuteczną metodą polepszania jakości obrazów Filtry nieliniowe Filtr medianowy Spośród licznych filtrów nieliniowych najlepszymi właściwościami odznacza się filtr medianowy
Teoria sygnałów Signal Theory. Elektrotechnika I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny)
. KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Obowiązuje od roku akademickiego 2012/2013 Teoria sygnałów Signal Theory A. USYTUOWANIE MODUŁU W SYSTEMIE STUDIÓW
Elementy statystyki wielowymiarowej
Wnioskowanie_Statystyczne_-_wykład Spis treści 1 Elementy statystyki wielowymiarowej 1.1 Kowariancja i współczynnik korelacji 1.2 Macierz kowariancji 1.3 Dwumianowy rozkład normalny 1.4 Analiza składowych
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych
Zakres wymaganych wiadomości do testów z przedmiotu Metrologia. Wprowadzenie do obsługi multimetrów analogowych i cyfrowych
Zakres wymaganych wiadomości do testów z przedmiotu Metrologia Ćwiczenie 1 Wprowadzenie do obsługi multimetrów analogowych i cyfrowych budowa i zasada działania przyrządów analogowych magnetoelektrycznych
Automatyczna klasyfikacja zespołów QRS
Przetwarzanie sygnałów w systemach diagnostycznych Informatyka Stosowana V Automatyczna klasyfikacja zespołów QRS Anna Mleko Tomasz Kotliński AGH EAIiE 9 . Opis zadania Tematem projektu było zaprojektowanie
Wyznaczanie budżetu niepewności w pomiarach wybranych parametrów jakości energii elektrycznej
P. OTOMAŃSKI Politechnika Poznańska P. ZAZULA Okręgowy Urząd Miar w Poznaniu Wyznaczanie budżetu niepewności w pomiarach wybranych parametrów jakości energii elektrycznej Seminarium SMART GRID 08 marca
Micha Strzelecki Metody przetwarzania i analizy obrazów biomedycznych (2)
Micha Strzelecki Metody przetwarzania i analizy obrazów biomedycznych (2) Prezentacja multimedialna współfinansowana przez Unię Europejską w ramach Europejskiego Funduszu Społecznego w projekcie Innowacyjna
Kompresja danych DKDA (7)
Kompresja danych DKDA (7) Marcin Gogolewski marcing@wmi.amu.edu.pl Uniwersytet im. Adama Mickiewicza w Poznaniu Poznań, 22 listopada 2016 1 Kwantyzacja skalarna Wprowadzenie Analiza jakości Typy kwantyzatorów
Przekształcenia widmowe Transformata Fouriera. Adam Wojciechowski
Przekształcenia widmowe Transformata Fouriera Adam Wojciechowski Przekształcenia widmowe Odmiana przekształceń kontekstowych, w których kontekstem jest w zasadzie cały obraz. Za pomocą transformaty Fouriera
Kodowanie transformujace. Kompresja danych. Tomasz Jurdziński. Wykład 11: Transformaty i JPEG
Tomasz Wykład 11: Transformaty i JPEG Idea kodowania transformujacego Etapy kodowania 1 Wektor danych x 0,...,x N 1 przekształcamy (odwracalnie!) na wektor c 0,...,c N 1, tak aby: energia była skoncentrowana
2. Próbkowanie Sygnały okresowe (16). Trygonometryczny szereg Fouriera (17). Częstotliwość Nyquista (20).
SPIS TREŚCI ROZDZIAŁ I SYGNAŁY CYFROWE 9 1. Pojęcia wstępne Wiadomości, informacje, dane, sygnały (9). Sygnał jako nośnik informacji (11). Sygnał jako funkcja (12). Sygnał analogowy (13). Sygnał cyfrowy
Analiza obrazów - sprawozdanie nr 2
Analiza obrazów - sprawozdanie nr 2 Filtracja obrazów Filtracja obrazu polega na obliczeniu wartości każdego z punktów obrazu na podstawie punktów z jego otoczenia. Każdy sąsiedni piksel ma wagę, która
Pattern Classification
Pattern Classification All materials in these slides were taken from Pattern Classification (2nd ed) by R. O. Duda, P. E. Hart and D. G. Stork, John Wiley & Sons, 2000 with the permission of the authors
SYLABUS/KARTA PRZEDMIOTU
PAŃSTWOWA WYŻSZA SZKOŁA ZAWODOWA W GŁOGOWIE SYLABUS/KARTA PRZEDMIOTU. NAZWA PRZEDMIOTU Metody przetwarzania danych graficznych. NAZWA JEDNOSTKI PROWADZĄCEJ PRZEDMIOT Instytut Politechniczny. STUDIA kierunek
Teoria przetwarzania A/C i C/A.
Teoria przetwarzania A/C i C/A. Autor: Bartłomiej Gorczyński Cyfrowe metody przetwarzania sygnałów polegają na przetworzeniu badanego sygnału analogowego w sygnał cyfrowy reprezentowany ciągiem słów binarnych
PRACA DYPLOMOWA STUDIA PIERWSZEGO STOPNIA. Łukasz Kutyła Numer albumu: 5199
PRACA DYPLOMOWA STUDIA PIERWSZEGO STOPNIA Łukasz Kutyła Numer albumu: 5199 Temat pracy: Metody kompresji obrazu implementowane we współczesnych systemach telewizji cyfrowej opartej o protokół IP Cel i
Segmentacja przez detekcje brzegów
Segmentacja przez detekcje brzegów Lokalne zmiany jasności obrazu niosą istotną informację o granicach obszarów (obiektów) występujących w obrazie. Metody detekcji dużych, lokalnych zmian jasności w obrazie
CYFROWE PRZTWARZANIE SYGNAŁÓW (Zastosowanie transformacji Fouriera)
I. Wprowadzenie do ćwiczenia CYFROWE PRZTWARZANIE SYGNAŁÓW (Zastosowanie transformacji Fouriera) Ogólnie termin przetwarzanie sygnałów odnosi się do nauki analizowania zmiennych w czasie procesów fizycznych.
Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki
Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki Przetwarzanie Sygnałów Studia Podyplomowe, Automatyka i Robotyka. Wstęp teoretyczny Zmienne losowe Zmienne losowe
Monitorowanie i Diagnostyka w Systemach Sterowania na studiach II stopnia specjalności: Systemy Sterowania i Podejmowania Decyzji
Monitorowanie i Diagnostyka w Systemach Sterowania na studiach II stopnia specjalności: Systemy Sterowania i Podejmowania Decyzji Analiza składników podstawowych - wprowadzenie (Principal Components Analysis
Kodowanie i kompresja Streszczenie Studia dzienne Wykład 9,
1 Kody Tunstalla Kodowanie i kompresja Streszczenie Studia dzienne Wykład 9, 14.04.2005 Inne podejście: słowa kodowe mają ustaloną długość, lecz mogą kodować ciągi liter z alfabetu wejściowego o różnej
Rozwiązanie n1=n2=n=8 F=(4,50) 2 /(2,11) 2 =4,55 Fkr (0,05; 7; 7)=3,79
Test F =służy do porównania precyzji dwóch niezależnych serii pomiarowych uzyskanych w trakcie analizy próbek o zawartości analitu na takim samym poziomie #obliczyć wartość odchyleń standardowych dla serii
Testowanie hipotez statystycznych.
Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie
Analiza obrazu. wykład 1. Marek Jan Kasprowicz Uniwersytet Rolniczy Marek Jan Kasprowicz Analiza obrazu komputerowego 2009 r.
Analiza obrazu komputerowego wykład 1 Marek Jan Kasprowicz Uniwersytet Rolniczy 2009 Plan wykładu Wprowadzenie pojęcie obrazu cyfrowego i analogowego Geometryczne przekształcenia obrazu Przekształcenia
Zygmunt Wróbel i Robert Koprowski. Praktyka przetwarzania obrazów w programie Matlab
Zygmunt Wróbel i Robert Koprowski Praktyka przetwarzania obrazów w programie Matlab EXIT 2004 Wstęp 7 CZĘŚĆ I 9 OBRAZ ORAZ JEGO DYSKRETNA STRUKTURA 9 1. Obraz w programie Matlab 11 1.1. Reprezentacja obrazu
Elementy modelowania matematycznego
Elementy modelowania matematycznego Modelowanie algorytmów klasyfikujących. Podejście probabilistyczne. Naiwny klasyfikator bayesowski. Modelowanie danych metodą najbliższych sąsiadów. Jakub Wróblewski
Robert Susmaga. Instytut Informatyki ul. Piotrowo 2 Poznań
... Robert Susmaga Instytut Informatyki ul. Piotrowo 2 Poznań kontakt mail owy Robert.Susmaga@CS.PUT.Poznan.PL kontakt osobisty Centrum Wykładowe, blok informatyki, pok. 7 Wyłączenie odpowiedzialności
Wykład II. Reprezentacja danych w technice cyfrowej. Studia Podyplomowe INFORMATYKA Podstawy Informatyki
Studia Podyplomowe INFORMATYKA Podstawy Informatyki Wykład II Reprezentacja danych w technice cyfrowej 1 III. Reprezentacja danych w komputerze Rodzaje danych w technice cyfrowej 010010101010 001010111010
Python: JPEG. Zadanie. 1. Wczytanie obrazka
Python: JPEG Witajcie! Jest to kolejny z serii tutoriali uczący Pythona, a w przyszłości być może nawet Cythona i Numby Jeśli chcesz nauczyć się nowych, zaawansowanych konstrukcji to spróbuj rozwiązać
Sieci neuronowe - projekt
Sieci neuronowe - projekt Maciej Barański, Kamil Dadel 15 stycznia 2015 Streszczenie W ramach projektu został zrealizowany algorytm kompresji stratnej bazujący na działaniu samoorganizującej się sieci