Zastosowania obliczeń inteligentnych do wyszukiwania w obrazowych bazach danych

Podobne dokumenty
Przetwarzanie obrazu

Przetwarzanie obrazu

KORELACJA MIĘDZY OBIEKTAMI GRAFICZNYMI JAKO ASPEKT WYSZUKIWANIA ICH W OBRAZOWEJ BAZIE DANYCH

Zastosowania obliczeń inteligentnych do wyszukiwania w obrazowych bazach danych

1. Wprowadzenie. 2. Struktura obrazowej bazy danych

Metody systemowe i decyzyjne w informatyce

Akwizycja i przetwarzanie sygnałów cyfrowych

2 1 3 c c1. e 1, e 2,..., e n A= e 1 e 2...e n [ ] M. Przybycień Matematyczne Metody Fizyki I

Cyfrowe przetwarzanie i kompresja danych

Transformaty. Kodowanie transformujace

Agnieszka Nowak Brzezińska

WEKTORY I WARTOŚCI WŁASNE MACIERZY. = λ c (*) problem przybliżonego rozwiązania zagadnienia własnego dla operatorów w mechanice kwantowej

Hierarchiczna analiza skupień

EKSTRAKCJA CECH TWARZY ZA POMOCĄ TRANSFORMATY FALKOWEJ

10. Redukcja wymiaru - metoda PCA

Algebra Liniowa 2 (INF, TIN), MAP1152 Lista zadań

WYKŁAD 12. Analiza obrazu Wyznaczanie parametrów ruchu obiektów

Formy kwadratowe. Mirosław Sobolewski. Wydział Matematyki, Informatyki i Mechaniki UW. wykład z algebry liniowej Warszawa, styczeń 2009

Kodowanie transformujace. Kompresja danych. Tomasz Jurdziński. Wykład 11: Transformaty i JPEG

ALGEBRA LINIOWA Z ELEMENTAMI GEOMETRII ANALITYCZNEJ

W poszukiwaniu sensu w świecie widzialnym

Kolejny krok iteracji polega na tym, że przechodzimy do następnego wierzchołka, znajdującego się na jednej krawędzi z odnalezionym już punktem, w

Wektory i wartości własne

i = [ 0] j = [ 1] k = [ 0]

1 Formy hermitowskie. GAL (Informatyka) Wykład - formy hermitowskie. Paweł Bechler

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 7 AiR III

Stosowana Analiza Regresji

Analiza skupień. Analiza Skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania

Macierze. Rozdział Działania na macierzach

Reprezentacja i analiza obszarów

Sztuczna inteligencja : Algorytm KNN

Elementy modelowania matematycznego

2. Próbkowanie Sygnały okresowe (16). Trygonometryczny szereg Fouriera (17). Częstotliwość Nyquista (20).

Wektory i wartości własne

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

MODELOWANIE PRZESTRZENI ZA POMOCĄ MULTIILOCZYNÓW WEKTORÓW

Detekcja kształtów i wybrane cechy obrazów konturowych

Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu

Akwizycja i przetwarzanie sygnałów cyfrowych

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 9 AiR III

Zaawansowane metody numeryczne

Wykład 12 i 13 Macierz w postaci kanonicznej Jordana , 0 A 2

5. Analiza dyskryminacyjna: FLD, LDA, QDA

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV

Lista. Przestrzenie liniowe. Zadanie 1 Sprawdź, czy (V, +, ) jest przestrzenią liniową nadr :

Przestrzeń unitarna. Jacek Kłopotowski. 23 października Katedra Matematyki i Ekonomii Matematycznej SGH

Prawdopodobieństwo i statystyka

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA

Reprezentacja i analiza obszarów

Co to jest wektor? Jest to obiekt posiadający: moduł (długość), kierunek wraz ze zwrotem.

Statystyka i eksploracja danych

Przekształcenia liniowe

Wyszukiwanie obrazów 1

Przekształcenia geometryczne. Mirosław Głowacki Wydział Inżynierii Metali i Informatyki Przemysłowej

dr Mariusz Grządziel 15,29 kwietnia 2014 Przestrzeń R k R k = R R... R k razy Elementy R k wektory;

Formy kwadratowe. Mirosław Sobolewski. Wydział Matematyki, Informatyki i Mechaniki UW. 14. wykład z algebry liniowej Warszawa, styczeń 2011

Podstawy robotyki. Wykład II. Robert Muszyński Janusz Jakubiak Instytut Informatyki, Automatyki i Robotyki Politechnika Wrocławska

Metody Przetwarzania Danych Meteorologicznych Ćwiczenia 14

Rozdział 5. Macierze. a 11 a a 1m a 21 a a 2m... a n1 a n2... a nm

1 Podobieństwo macierzy

Systemy uczące się Lab 4

Obraz jako funkcja Przekształcenia geometryczne

Rozwiązywanie układów równań liniowych metody dokładne Materiały pomocnicze do ćwiczeń z metod numerycznych

Adaptive wavelet synthesis for improving digital image processing

O MACIERZACH I UKŁADACH RÓWNAŃ

Wykład 10 Skalowanie wielowymiarowe

a 11 a a 1n a 21 a a 2n... a m1 a m2... a mn a 1j a 2j R i = , C j =

Rozpoznawanie obrazów

Algebra liniowa z geometrią

Skalowanie wielowymiarowe idea

Ważne rozkłady i twierdzenia c.d.

KADD Minimalizacja funkcji

Wyszukiwanie informacji w internecie. Nguyen Hung Son

3 1 + i 1 i i 1 2i 2. Wyznaczyć macierze spełniające własność komutacji: [A, X] = B

A,B M! v V ; A + v = B, (1.3) AB = v. (1.4)

φ(x 1,..., x n ) = a i x 2 i +

Zadania przygotowawcze, 3 kolokwium

= i Ponieważ pierwiastkami stopnia 3 z 1 są (jak łatwo wyliczyć) liczby 1, 1+i 3

METODY INŻYNIERII WIEDZY

Implementacja filtru Canny ego

Agnieszka Nowak Brzezińska Wykład III

[ A i ' ]=[ D ][ A i ] (2.3)

Spośród licznych filtrów nieliniowych najlepszymi właściwościami odznacza się filtr medianowy prosty i skuteczny.

Rozpoznawanie obiektów z użyciem znaczników

METODY INŻYNIERII WIEDZY

ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU

Zadania egzaminacyjne

Laboratorium Przetwarzania Sygnałów

przetworzonego sygnału

zadania z rachunku prawdopodobieństwa zapożyczone z egzaminów aktuarialnych

PRZYGOTOWANIE WSTĘPNE OBRAZU DO OBRAZOWEJ BAZY DANYCH

1 Wartości własne oraz wektory własne macierzy

Agnieszka Nowak Brzezińska Wykład III

Robert Susmaga. Instytut Informatyki ul. Piotrowo 2 Poznań

Układy równań i nierówności liniowych

Przekształcenie Fouriera obrazów FFT

Przegląd metod optymalizacji wielowymiarowej. Funkcja testowa. Funkcja testowa. Notes. Notes. Notes. Notes. Tomasz M. Gwizdałła

Diagonalizacja macierzy i jej zastosowania

Segmentacja przez detekcje brzegów

Transkrypt:

Zastosowania obliczeń inteligentnych do wyszukiwania w obrazowych bazach danych Tatiana Jaworska Jaworska@ibspan.waw.pl www.ibspan.waw.pl/~jaworska

Istniejące systemy - Google

Istniejące systemy - Google

Istniejące systemy - Google

Istniejące systemy - Google

Istniejące systemy CIRES i FIDS

Podstawowe pojęcia Content-BasedImage Retrieval(CBIR) obrazowa baza danych moduł odpowiedzialny za przetwarzanie obrazu baza danych interfejs użytkownika GUI silnik wyszukiwania

Schemat ogólny obrazowej bazy danych

Segmentacja obrazu metodą c-środków C = 5 C = 12

Idea algorytmu opartego na kolorach

Segmentacja obrazu oparta na kolorach

Wydzielenie obiektów

Tekstury a) tkanina b) kamień c) marmur d) korek Tekstura może być opisywana jako: Dwuwymiarowy proces Markowa Dwuwymiarowy histogram Korelacja transformat Fouriera tekstur z wcześniej przygotowanymi maskami

Dwuwymiarowe transformacje falkowe obrazu sprowadzają się do rzutowania obrazu na ustalony ortonormalny układu falek Ze względu na dyskretny charakter obrazów, będziemy się posługiwać falkami dyskretnymi. Dwuwymiarowy separowany układ falek ortonormalnych utworzony konwencjonalnie na podstawie układu jednowymiarowego ma postać: 4 ),,, (,, )} ( ), ( { Z m l k j m l k j y x ψ ψ Falki dwuwymiarowe gdzie ψ j,k (x) jest k-tą falką jednowymiarową na poziomie j-tym analizy wielorozdzielczej. Wykorzystując założenia analizy wielorozdzielczej można pokazać, że wyżej zaproponowany układ jest nadmiarowy i można go zredukować do następującego układu: gdzie: 3 ),, ( 3,, 2,, 1,, )}, ( ),, ( ),, ( { Z m k j m k j m k j m k j y x y x y x ψ ψ ψ ) ( ) ( ), ( ) ( ) ( ), ( ) ( ) ( ), ( 3 2 1 y x y x y x y x y x y x ψ ψ ψ φ ψ ψ ψ φ ψ = = =

Obiekt z fakturą

Mapa odległości oparta na transformacji falkowej Przekrój przez detale horyzontalne dla 100-tej kolumny (falka Haara, j=1)

Odległości liczone na podstawie dodatnich współczynników falkowych Odległości wyznaczone dla progu odcięcia 1% wartości maksymalnej dla całej macierzy detali horyzontalnych dodatnich. Przekrój przez 100-ną kolumnę

Odległości liczone na podstawie ujemnych współczynników falkowych Odległości wyznaczone dla progu odcięcia 1% wartości minimalnej dla całej macierzy detali horyzontalnych ujemnych. Przekrój przez 100-ną kolumnę

Mapa odległości wyznaczonych na podstawie horyzontalnych współczynników dodatnich

Mapa odległości wyznaczonych na podstawie horyzontalnych współczynników ujemnych

Mapa odległości wyznaczonych na podstawie wertykalnych współczynników dodatnich

Mapa odległości wyznaczonych na podstawie wertykalnych współczynników ujemnych

Parametry tekstury Na podstawie wykonanych map odległości można oszacować rozmiar pionowy dachówki na 15-20 falek czyli 30-40 pikseli, natomiast rozmiar pionowy na and 22-40 falek czyli 44-80 pikseli.

Różne deskryptory kształtu Definicja Obiekt Sposób kodowania Kod 2 2 ] ) ( [ ] ) ( [ ) ( y y x x r + = θ θ θ = = 1 0 2 )exp ( 1 N n N n j r N a θ θ π θ

Wielomiany Zernike a Ciąg wielomianów ortogonalnych nad dyskiem jednostkowym,, 0,1 V pq (r,θ) = 2 r = x + y 2 gdzie: jest długością wektora od środka dysku do punktu (x,y). Wielomiany o wartościach rzeczywistych gdzie p q jest parzyste, 0 q p i p 0. Niech s (p k)/2, wtedy wielomiany mogą być reprezentowane jako

Funkcje bazowe Zernike a

Momenty Zernike a Wtedy B pqk są współczynnikami tego wielomianu: Dwuwymiarowe momenty Zernike a rzędu p z powtórzeniami q dla obrazu o funkcji intensywności f(x,y) gdzie V * pq ( x, y) = Vp, q ( x, y)

Właściwości momentów Zernike a 1. Tak zdefiniowane momenty Zernike a są niezmiennicze względem rotacji. 2. Aby uzyskać niezmienniczość względem przesunięcia trzeba centrum obiektu umieścić w środku układu współrzędnych. 3. Natomiast niezmienniczość skali uzyskujemy poprzez skalowanie obiektu.

Przykład dopasowania dwóch obiektów na podstawie pierwszych 10 momentów Zernike a

Struktura bazy danych - Oracle

Biblioteka wzorców Biblioteka wzorców zawiera informację o wzorcowych wektorach cech obiektu graficznego, zakresie wartości i wagach przypisanych tym wartościom. Dla każdego obiektu mamy więc wzorcowy wektor cech P k z wagami µ ( ) [0,1] P f i k Każdy obiekt jest przyporządkowywany do określonej klasy z biblioteki wzorców poprzez szukanie najmniejszej odległości pomiędzy wektorami O i P 1 k r m m d( FO, Pk ) = µ P ( fi ) FO ( fi ) Pk ( f k i ) i= 1 Na tej podstawie każdy obiekt otrzymuje etykietę L k

Klasyfikacja obiektów ID=4 ID=31 ID=9 ID=25 ID=3 ID=24

Opis rozkładu przestrzennego obiektów graficznych na obrazie z użyciem analizy składowych głównych 1 W bazie danych mamy M klas obiektów oznaczonych etykietami L 1, L 2,, L M. Możemy zatem określić sygnaturę obrazu I i jako następujący wektor: Signature (I i ) = [nobc i1, nobc i2,, nobc im ] gdzie: nobc ik oznacza liczbę obiektów o ij o klasie L k w danym obrazie I i. Poza tą informacją rozpatrujemy też wzajemne położenie obiektów w obrazie w oparciu o analizę składowych głównych (PCA).

Opis rozkładu przestrzennego obiektów graficznych na obrazie z użyciem analizy składowych głównych 2 Porównujemy dwa obrazy składające się ze zbioru obiektów I i = {o i1, o i2,, o in } opisanych przez środki ciężkości C ij = (x ij, y ij ) i klasę L ij Formalnie obraz I składa się z n obiektów i k klas gdzie k N, ponieważ kilka obiektów może być tej samej klasy. Jako linię odniesienia do liczenia kąta pomiędzy obiektami wybieramy największą odległość między centroidami obiektów istniejącą na obrazie dist (C p,c q ) = max {dist (C i,c j ) i,j {1,2,,k} and L i L j } Następnie od tej linii liczymy kąty θ ij pomiędzy kolejnymi środkami ciężkości. W ten sposób metoda jest niezmiennicza względem obrotu.

Określenie kąta między obiektami przy wyznaczaniu macierzy do analizy składowych głównych 3 Otrzymujemy więc trójki (L i, L j, θ ij ), gdzie kąt jest liczony względem linii odniesienia. Dostajemy T = n(n-1)/2 takich trójek dla obrazów o n obiektach. Następnie poszukujemy wektorów własnych PCV i macierzy kowariancji zgodnie z metodą analizy składowych głównych.

Graficzne zapytanie do bazy poprzez GUI

Graficzne zapytanie do bazy poprzez GUI

Metoda wyszukiwania slajd 1 Obraz z bazy możemy oznaczyć jako I b = {o 1, o 2,, o }. Niech zapytaniem będzie obraz I q taki, że I q = {o 1, o 2,, o }. Aby odpowiedzieć na to zapytanie porównujemy z nim każdy obraz I b z bazy w następujący sposób. Najpierw określamy podobieństwo sim sgn pomiędzy I q i I b licząc odległość między sygnaturami obrazów: sim sgn (I q, I b ) = d (sgn q, sgn b ) np. analogicznie do liczenia termów w dokumentach tekstowych 0, 0 TF,, 0 Wtedy odległość tych wektorów można już policzyć metryką euklidesową. Jeśli to podobieństwo jest mniejsze od założonego progu wtedy obraz I b jest odrzucany z dalszych porównań.

Metoda wyszukiwania slajd 2 Jeśli to podobieństwo jest większe, to przechodzimy do następnego etapu i znajdujemy podobieństwo sim PCV między rozkładem przestrzennym obiektów w obrazach I q i I b licząc odległość euklidesową między wektorami PCV: sim 3 q b = b q 2 PCV ( I, I ) 1 ( PCVi PCVi ) i= 1 Jeśli z kolei to podobieństwo okaże się mniejsze od wartości progowej obraz I b jest odrzucany. W przeciwnym razie, przechodzimy do następnego kroku, w którym liczymy podobieństwo poszczególnych obiektów wchodzących w skład obu obrazów I q i I b. Dla każdego obiektu o wchodzącego w skład obrazu Iq, znajdujemy najbardziej podobny obiekt w tej samej klasie na obrazie I b.

Dopasowanie parami z eliminacją Dla każdego obiektu o L można obliczyć między obiektami: q b = q b simob ( oi, o j ) 1 ( F oil F o jl ) b j gdzie: l jest numerem cechy w wektorze cech F O poszczególnych obiektów. Może zajść jednak sytuacja przedstawiona na rysunku: q i l q sim ob ( o i, o 2 b j )

Koncepcja wyszukiwania slajd 3 Z powyższego algorytmu dostajemy wektor podobieństw pomiędzy zapytaniem I q i obrazem I b : sim( I q, I b ) = sim sim gdzie: n jest liczbą obiektów reprezentujących obraz I q. Porządkujemy obrazy I b względem zapytania I q, q b na podstawie ( o i, o ) sim ob j ob ob ( o M ( o q 1 q n, o, o b 1 b n ) )

Proponowane zagadnienia Identyfikacja obiektów na podstawie klasy wzorców Opracowanie reguł ułatwiających klasyfikację obiektów Porównywanie wielowymiarowych wzorców Implementacja miękkich metod wyszukiwania Przetestowanie różnych miar podobieństwa

Literatura Russ J. C.: The Image Processing Handbook, wyd. 2, CRC Press, 1994. Wojnar L., Kurzydłowski K., Szala J.: Praktyka analizy obrazu,polskie Towarzystwo Stereologiczne, Kraków, 2002. Artificial intelligence for Maximizing Content Based Image Retrieval, red. Zongmin Ma, Information Science Reference, NY, 2009. Deb S.: Multimedia Systems and Content-Based Image retrieval, Idea Group Publishing, Melbourne, 2004. Jaworska T., Object extraction as a basic process for content-based image retrieval (CBIR) system, Opto-Electronics Review, Vol. 15, Nr. 4, str. 184-195, 2007. Jaworska T., A Search-Engine Concept Based on Multi-Feature Vectors and Spatial Relationship,LECTURE NOTES IN ARTIFICIAL INTELLIGENCE nr 7022, str. 137 148, 2011.