EKSPLORACJA ZASOBÓW INTERNETU LABORATORIUM VIII WYSZUKIWANIE OBRAZÓW



Podobne dokumenty
MODELE KOLORÓW. Przygotował: Robert Bednarz

Teoria światła i barwy

Do opisu kolorów używanych w grafice cyfrowej śluzą modele barw.

PODSTAWY BARWY, PIGMENTY CERAMICZNE

WYKŁAD 11. Kolor. fiolet, indygo, niebieski, zielony, żółty, pomarańczowy, czerwony

Grafika Komputerowa Wykład 2. Przetwarzanie obrazów. mgr inż. Michał Chwesiuk 1/38

Parametryzacja obrazu na potrzeby algorytmów decyzyjnych

Grafika komputerowa. Dla DSI II

INFORMATYKA WSTĘP DO GRAFIKI RASTROWEJ

1.2 Logo Sonel podstawowe załoŝenia

Przetwarzanie obrazów rastrowych macierzą konwolucji

Kurs grafiki komputerowej Lekcja 2. Barwa i kolor

Pojęcie Barwy. Grafika Komputerowa modele kolorów. Terminologia BARWY W GRAFICE KOMPUTEROWEJ. Marek Pudełko

Marcin Wilczewski Politechnika Gdańska, 2013/14

GRAFIKA RASTROWA GRAFIKA RASTROWA

Modele i przestrzenie koloru

Akwizycja obrazów. Zagadnienia wstępne

Przetwarzanie obrazów Grafika komputerowa. dr inż. Marcin Wilczewski 2016/2017

Oświetlenie obiektów 3D

Grafika na stronie www

Laboratorium. Cyfrowe przetwarzanie sygnałów. Ćwiczenie 9. Przetwarzanie sygnałów wizyjnych. Politechnika Świętokrzyska.

Co to jest współczynnik oddawania barw?

1 LEKCJA. Definicja grafiki. Główne działy grafiki komputerowej. Programy graficzne: Grafika rastrowa. Grafika wektorowa. Grafika trójwymiarowa

Przekształcenia punktowe

Analiza obrazów - sprawozdanie nr 2

Ćwiczenie 6. Transformacje skali szarości obrazów

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 8 AiR III

enova Systemowe Kolorowanie list

Zasady edycji (cyfrowej) grafiki nieruchomej

Budowanie macierzy danych geograficznych Procedura normalizacji Budowanie wskaźnika syntetycznego

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 1 AiR III

Kolor, mat. pomoc. dla technologia inf. (c) M. Żabka (12 listopada 2007) str. 1

Ustawienia materiałów i tekstur w programie KD Max. MTPARTNER S.C.

GRAFIKA. Rodzaje grafiki i odpowiadające im edytory

GRAFIKA RASTROWA. WYKŁAD 1 Wprowadzenie do grafiki rastrowej. Jacek Wiślicki Katedra Informatyki Stosowanej

Cyfrowe Przetwarzanie Obrazów. Karol Czapnik

Raport. Bartosz Paprzycki UMK 2009/2010

Rozpoznawanie obrazów na przykładzie rozpoznawania twarzy

W poszukiwaniu sensu w świecie widzialnym

BARWA. Barwa postrzegana opisanie cech charakteryzujących wrażenie, jakie powstaje w umyśle;

Zbigniew JERZAK Adam KOTLIŃSKI. Studenci kierunku Informatyka na Politechnice Śląskiej w Gliwicach

TEORIA BARW (elementy) 1. Podstawowe wiadomości o barwach

Adam Korzeniewski p Katedra Systemów Multimedialnych

dr inż. Jacek Naruniec

Przetwarzanie obrazu

Wyszukiwanie obrazów 1

Zmienne zależne i niezależne

Przetwarzanie obrazów wykład 4

Posiadasz taki lub inny TV?

Przestrzenie barw. 1. Model RGB

Taśmy LED i akcesoria

Implementacja filtru Canny ego

Tajemnice koloru, część 1

Grafika 2D. Pojęcia podstawowe. opracowanie: Jacek Kęsik

Scenariusz zajęć pozalekcyjnych w ramach Innowacyjnej Szkoły Zawodowej

ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU

Photoshop. Podstawy budowy obrazu komputerowego

dr inż. Piotr Odya dr inż. Piotr Suchomski

Język JAVA podstawy. Wykład 5, część 3. Jacek Rumiński. Politechnika Gdańska, Inżynieria Biomedyczna

Wyższa Szkoła Informatyki Stosowanej i Zarządzania

Polecenie ŚWIATPUNKT - ŚWIATŁO PUNKTOWE

Proste metody przetwarzania obrazu

Dostosowuje wygląd kolorów na wydruku. Uwagi:

Janusz Ganczarski CIE XYZ

Wprowadzenie do technologii HDR

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Wybrane zagadnienia w pracy z danymi rastrowymi w ArcGIS Marcin Paź Esri Polska

BIBLIOTEKA PROGRAMU R - BIOPS. Narzędzia Informatyczne w Badaniach Naukowych Katarzyna Bernat

Komunikacja Człowiek-Komputer

POPRAWIANIE JAKOŚCI OBRAZU W DZIEDZINIE PRZESTRZENNEJ (spatial image enhancement)

6. Algorytmy ochrony przed zagłodzeniem dla systemów Linux i Windows NT.

Według raportu ISO z 1988 roku algorytm JPEG składa się z następujących kroków: 0.5, = V i, j. /Q i, j

Pełny raport kalibracyjny projektora:

Grafika 3D program POV-Ray - 1 -

Budowa i zasada działania skanera

1. Reprezentacja obrazu w komputerze

Rodzaje skanerów. skaner ręczny. skaner płaski. skaner bębnowy. skaner do slajdów. skaner kodów kreskowych

Grafika komputerowa dziedzina informatyki zajmująca się wykorzystaniem technik komputerowych do celów wizualizacji artystycznej oraz wizualizacji i

Gimp Grafika rastrowa (konwersatorium)

Pełny raport kalibracyjny telewizora:

Percepcja obrazu Podstawy grafiki komputerowej

0. OpenGL ma układ współrzędnych taki, że oś y jest skierowana (względem monitora) a) w dół b) w górę c) w lewo d) w prawo e) w kierunku do

Przetwarzanie obrazów wykład 6. Adam Wojciechowski

Pełny raport kalibracyjny telewizora:

Przeglądanie zdjęć satelitarnych Sentinel-2

Dzień dobry. Miejsce: IFE - Centrum Kształcenia Międzynarodowego PŁ, ul. Żwirki 36, sala nr 7

Zamiana reprezentacji wektorowej na rastrową - rasteryzacja

AUTOMATYKA INFORMATYKA

WYKŁAD 3. Przykłady zmian w obrazie po zastosowaniu Uniwersalnego Operatora Punktowego

Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2.

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 3 AiR III

Anna Barwaniec Justyna Rejek

Analiza obrazów. Segmentacja i indeksacja obiektów

Zmysły. Wzrok Węch Dotyk Smak Słuch Równowaga?

SYSTEM BIOMETRYCZNY IDENTYFIKUJĄCY OSOBY NA PODSTAWIE CECH OSOBNICZYCH TWARZY. Autorzy: M. Lewicka, K. Stańczyk

Podstawy Programowania Obiektowego

Przetwarzanie obrazów

Przewodnik po soczewkach

Transkrypt:

EKSPLORACJA ZASOBÓW INTERNETU LABORATORIUM VIII WYSZUKIWANIE OBRAZÓW 1. Motywacja Strony internetowe zawierają 70% multimediów Tradycyjne wyszukiwarki wspierają wyszukiwanie tekstu Kolekcje obrazów: Dwie największe: Corbis (Gates) oraz gettyimages (Getty) zawierają setki milionów obrazów astronomia - satelity NASA oraz ESA zbierają ponad petabajt danych dziennie czas, typ (x-ray, ultrafiolet, gamma, itd.), wydarzenia specjalne (konstelacje, zaćmienia) telewizja (program, rok, tytuł, osoba, słowa kluczowe, sekwencje przygotowane na specjalne wydarzenia) media (obrazy często nie mają odpowiednich adnotacji; trudno znaleźć obraz wyrażający określone uczucie, odnoszący się do konkretnego tematu) medycyna (x-ray, CRT, MRI) Dane bez adnotacji nie mogą być znalezione Tworzenie adnotacji jest bardzo kosztowne i zazwyczaj wymaga wiedzy eksperckiej 2. Różne sposoby wyszukiwania Wyszukiwanie przez przeglądanie (Yahoo): proste struktury wysokie koszty utrzymania, złożone zapytania cat and dog, black horse Wyszukiwanie przez słowa kluczowe: typowe podejście w większości współczesnych wyszukiwarek prosta implementacja istniejące rozwiązania wszystkie obrazy muszą posiadać adnotacje; nawet jeśli one istnieją, to nie odnoszą się do atrybutów, np. kolor konia

Wyszukiwanie przez podobieństwo: zapytanie zawiera obiekty referencyjne automatyczna analiza zawartości (tanie) Zapytanie przez przykład: zwykle łatwo znaleźć pierwsze dopasowanie trudno uzyskać wystarczająco dobre obiekty referencyjne system znajduje obiekty podobne do referencyjnych pod względem cech, które nie są dla nich istotne Zapytanie przez szkic: zapytanie rysowane/śpiewane/mówione przez użytkownika duża elastyczność, możliwość zdefiniowania dokładnego zapytania nie każdy jest dobry w rysowaniu/śpiewaniu Przestrzeń cech zależy od specyfiki przetwarzanych obiektów

3. Funkcja odległości (metryka) Jeśli składowe cech nie są skorelowane, najczęściej wykorzystuje się normę L p, p=1, 2,... Jeśli istnieje korelacja między cechami (np. czerwony-pomarańczowy dla histogramu kolorów), zależności między nimi powinny być wzięte pod uwagę i skompensowane z wykorzystaniem fukcji kwadratowej: Wybór funkcji ma wpływ na wyniki wyszukiwania: metryki nie powinny być stosowane bezpośrednio na wektorach cech opisujących obrazy. rozkład ich wartości może się bardzo różnić, np. składowa 1 w przedziale [0,1], składowa 2 w przedziale [100, 200] bez normalizacji wkład składowej 1 w funkcję odległości byłby pomijalny poprawka: rozkład składowych we wszystkich wymiarach powinien być podobny; można to uzyskać z wykorzystaniem rozkładu Gaussa (odejmujemy średnią, dzielimy przez odchylenie standardowe): Stosując to np. do normy L 1 uzyskujemy następującą metrykę:

4. Miara podobieństwa σ(q,pi ) w przedziale [0,1] σ(q,pi )=0 oznacza brak podobieństwa między q oraz pi σ(q,pi )=1 oznacza identyczność między q oraz pi Duży dystans oznacza niskie podobieństwo, mały dystans wysokie podobieństwo. 5. Proste cechy obrazów Kolor jest najważniejszy atrybutem wizualnym dla rozpoznawania obiektów. Obrazy zwykle składają się z małej liczby regionów o podobnych kolorach Tekstura (kierunkowość obrazu) opisuje powierzchnie obiektów oraz atrybuty fizyczne; tekstury są istotne dla rozpoznania obiektów naturalnych i sztucznych te drugie często posiadają linie poziome i pionowe Kształty ważne ze względu na rozpoznanie obiektów, ale zmieniają się znacząco w przypadku różnych perspektyw ich waga w badaniu podobieństwa jest niewielka

6. Przestrzenie barw RGB R red (czerwony), G green (zielony) i B blue (niebieski). Model wynikający z właściwości odbiorczych ludzkiego oka, w którym wrażenie widzenia dowolnej barwy można wywołać przez zmieszanie w ustalonych proporcjach trzech wiązek światła o barwie czerwonej, zielonej i niebieskiej Lab wynik badań nad postrzeganiem przez ludzkie oko różnicy między barwami barwy znajdujące się w przestrzeni Lab w jednakowej odległości E od siebie będą postrzegane jako jednakowo różniące się od siebie L jasność (luminacja miara natężenia oświetlenia padającego w danym kierunku) 0 to czarny, 100 to biały a barwa od zielonej (ujemne wartości) do magenty (dodatnie) b barwa od niebieskiej (ujemne wartości) do żółtej (dodatnie) LCH (HCL) nie kartezjański układ współrzędnych, ale kula L = Lightness (jasność) czarny 0, w środku 50, biały 100; C = Chroma (saturation, chromatyczność, nasycenie) 0 kolor nienasycone, 100 nasycony (czysty) h = hue (barwa) 0 (czerwony), 90 (żółty), 180 (zielony), 270 (niebieski)

7. Histogramy kolorów częstotliwość występowania kolorów referencyjnych wybór przestrzeni (RGB, Lab, LCH), kolorów referencyjnych (dużo dobra szczegółowość opisu, mało szybkie wyszukiwanie), definicja miary podobieństwa zwykle 64, 128 lub 256 kolorów; dla 64 (i=0,,63) kolorów w RGB wybór kolejne barwy: R i = 85 * int(i/16) G i = 85 * (int(i/4) MOD 4) B i = 85 * (i MOD 4) dla każdego piksela, kolor referencyjny jest określany jako najbliższy kolorowi rzeczywistemu liczbę wystąpień każdego koloru zazwyczaj normalizuje się przez liczbę pikseli 8. Momenty kolorów w przypadku kolorów miara podobieństwa powinna wziąć pod uwagę korelację między kolorami momenty kolorów momenty statystyczne dla różnych wymiarów kolorów (luminance, hue, saturation, R, G, B, itd.) dla przykładu dla modelu Lab dla P pikseli - 9-składowy wektor cech

9. Momenty tekstur Tekstura opisuje strukturę powierzchni i jej granularność Filtr Gabora filtry dla zbioru częstotliwości oraz orientacji typowo wykorzystuje się tylko jasność (luminance), by odwołać się do neutralnych własności koloru wykorzystanie szybkiej transformaty Fouriera metody statystyczne zliczają liczbę oraz intensywność pikseli, które pozostają po tej operacji

Macierz energii częstotliwości im jaśniejszy piksel, tym wyższa energia odpowiedniej częstotliwości centrum obrazuje niskie częstotliwości, boki wysokie wysokie częstotliwości występują jeśli obraz zawiera ostre przejścia między jasnym i ciemnym pozycja w przestrzeni częstotliwości określa orientację częstotliwości filtr przepuszczający niskie częstotliwości sprawia, że kontrast jest mniej ostry filtr przepuszczający wysokie częstotliwości jest wykorzystywany do wykrywania krawędzi

10. Złożone zapytania wiele obiektów referencyjnych (all images similar to image B and image C) różne cechy (all images that are similar to image A according to color and shape, all images similar to image D that contain the terms dolphin and whale ) Zapytania z wieloma (K) obiektami referencyjnymi Funkcje agregujące: Zapytania z wieloma (J) cechami Funkcje agregujące jak powyżej.

11. Zadanie do realizacji w grupach [8] Zadanie polega na zaimplementowaniu systemu wyszukiwania obrazów. W katalogu lab8 znajduje się baza obrazów (images.zip). Każdy z nich przetworzono w celu uzyskania następujących cech (każda z nich znajduje się w osobnym pliku w features.zip): ColorRGBCov: macierz momentów kolorów w przestrzeni RGB 9 składowych, ColorHCLCov: macierz momentów kolorów w przestrzeni HCL 9 składowych, ColorLabCov: macierz momentów kolorów w przestrzeni Lab 9 składowych, ColorHist64: histogram dla 64 kolorów 64 składowe, ColorHist256: histogram dla 256 kolorów 256 składowych, TextureLumGabor: luminance z filtru Gabora 30 składowych. Każda linia plików z cechami składa się nazwy pliku oraz kolejnych n składowych danej cechy (poszczególne składowe oddzielone są spacją). a) [4] Napisz program, który dla zadanego pojedynczego obrazu oraz pojedynczej cech, znajdzie 12 najbardziej podobnych obrazów z kolekcji. Nazwa obrazu oraz nazwa cechy (ColorHCLCov, ColorLabCov, itd.) mają być parametrami wywołania programu. Zaimplementuj normę L1 jako metrykę odległości oraz wykorzystaj rozkład Gaussa, aby znormalizować kolejne składowe cechy. Odchylenia standardowe wykorzystaj jako wagi w normie L1. Przekształć normę L1 do funkcji podobieństwa, w ten sposób że: dystans zerowy (obraz podobieństwo z samym sobą) = podobieństwo 1, a największy dystans z uzyskanych = podobieństwo 0, pomiędzy wykorzystaj liniową funkcję odwzorowania. Wynikiem ma być uporządkowana lista 12 nazw plików najbardziej podobnych wraz z miarami podobieństwa. Wywołanie: findimage obrazów cecha b) [4] Rozszerz program tak, aby umożliwić zapytania odwołujące się do kilku obrazów oraz cech oraz agregację wyników na tych dwóch poziomach z wykorzystaniem funkcji min, max lub ave. Agregacji dokonuj na ostatecznych miarach podobieństwa pary obrazów pod względem określonej cechy - znormalizowano je w poprzednim podpunkcie, więc można je porównywać dla różnych obrazów oraz różnych cech. Funkcje agregujące podaj osobno dla agregacji obrazów i cech, określ liczbę i listę plików oraz liczbę i listę cech, które mają być wzięte pod uwagę, np. Wywołanie: findimage {min, max, ave} 3 plik1 plik2 plik3 {min, max, ave} 2 ColorLabCov TextureLumGabor findimage funkcja_agregująca_dla_obrazów liczba_obrazów lista_obrazów funkcja_agregująca_dla_cech liczba_cech lista_cech Zwróć listę nazw 12 najbardziej podobnych plików wraz z miarami podobieństwa.

Jako rozwiązanie przesłane powinny zostać: kod źródłowy (nie ma ograniczeń co do języka) wyniki dla następujących zapytań w jednym pliku tekstowym: findimage 10049.jpeg ColorRGBCov findimage 1975.jpeg TextureLumGabor findimage 2136.jpeg ColorHist64 findimage max 1 11643.jpeg min 2 TextureLumGabor ColorHist256 findimage ave 2 3161.jpeg 2677.jpeg max 1 ColorHCLCov findimage max 2 3163.jpeg 3754.jpeg ave 3 ColorRGBCov ColorHist64 TextureLumGabor Zwróć uwagę, że zapytanie: findimage 10049.jpeg ColorRGBCov jest równoważne findimage {max, min, ave} 1 10049.jpeg {max, min, ave} 1 ColorRGBCov.