ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU

Podobne dokumenty
Algorytmy estymacji stanu (filtry)

Analiza ruchu. Marek Wnuk < > ZPCiR I-6 PWr. MW: SyWizE p.1/22

ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU

Filtr Kalmana. Struktury i Algorytmy Sterowania Wykład 1-2. prof. dr hab. inż. Mieczysław A. Brdyś mgr inż. Tomasz Zubowicz

Parametryzacja obrazu na potrzeby algorytmów decyzyjnych

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Fuzja sygnałów i filtry bayesowskie

Pracownia Astronomiczna. Zapisywanie wyników pomiarów i niepewności Cyfry znaczące i zaokrąglanie Przenoszenie błędu

Optymalizacja ciągła

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania

KADD Minimalizacja funkcji

Ważne rozkłady i twierdzenia c.d.

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

Weryfikacja hipotez statystycznych

MODELE LINIOWE. Dr Wioleta Drobik

ZAJĘCIA II. Zmienne losowe, sygnały stochastyczne, zakłócenia pomiarowe

Wprowadzenie do analizy korelacji i regresji

Metoda określania pozycji wodnicy statków na podstawie pomiarów odległości statku od głowic laserowych

Elementy statystyki wielowymiarowej

Aproksymacja funkcji a regresja symboliczna

KADD Minimalizacja funkcji

Wykrywanie twarzy na zdjęciach przy pomocy kaskad

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

Analiza danych. TEMATYKA PRZEDMIOTU

Rozpoznawanie obrazów

Reprezentacja i analiza obszarów

Agnieszka Nowak Brzezińska

Rój cząsteczek. Particle Swarm Optimization. Adam Grycner. 18 maja Instytut Informatyki Uniwersytetu Wrocławskiego

Przetwarzanie obrazu

Filtrowanie tekstur. Kinga Laurowska

Prawdopodobieństwo i statystyka

Agnieszka Nowak Brzezińska Wykład III

Metody systemowe i decyzyjne w informatyce

i ruchów użytkownika komputera za i pozycjonujący oczy cyberagenta internetowego na oczach i akcjach użytkownika Promotor: dr Adrian Horzyk

Testowanie hipotez statystycznych.

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 7 AiR III

IX. Rachunek różniczkowy funkcji wielu zmiennych. 1. Funkcja dwóch i trzech zmiennych - pojęcia podstawowe. - funkcja dwóch zmiennych,

Promotor: dr Marek Pawełczyk. Marcin Picz

Kodowanie i kompresja Streszczenie Studia Licencjackie Wykład 11,

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Transformaty. Kodowanie transformujace

Zastosowanie stereowizji do śledzenia trajektorii obiektów w przestrzeni 3D

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota

WYKŁAD 9 METODY ZMIENNEJ METRYKI

Grafika 2D. Animacja Zmiany Kształtu. opracowanie: Jacek Kęsik

w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.

Algorytm Grovera. Kwantowe przeszukiwanie zbiorów. Robert Nowotniak

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Hierarchiczna analiza skupień

Reprezentacja i analiza obszarów

1 Równania nieliniowe

Symulacje komputerowe

REGRESJA LINIOWA Z UOGÓLNIONĄ MACIERZĄ KOWARIANCJI SKŁADNIKA LOSOWEGO. Aleksander Nosarzewski Ekonometria bayesowska, prowadzący: dr Andrzej Torój

Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2.

Wykład 6 Centralne Twierdzenie Graniczne. Rozkłady wielowymiarowe

Wektory, układ współrzędnych

Komputerowa Analiza Danych Doświadczalnych

Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Prawdopodobieństwo i rozkład normalny cd.

Rozdział 8. Regresja. Definiowanie modelu

CYFROWE PRZETWARZANIE SYGNAŁÓW

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Zamiana reprezentacji wektorowej na rastrową - rasteryzacja

Agnieszka Nowak Brzezińska Wykład III

Inżynierskie metody analizy numerycznej i planowanie eksperymentu / Ireneusz Czajka, Andrzej Gołaś. Kraków, Spis treści

Podstawowe modele probabilistyczne

Ekonometria. Zajęcia

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 9 AiR III

Prawdopodobieństwo i statystyka

Stacjonarne procesy gaussowskie, czyli o zwiazkach pomiędzy zwykła

Mechatronika i inteligentne systemy produkcyjne. Modelowanie systemów mechatronicznych Platformy przetwarzania danych

Politechnika Świętokrzyska. Laboratorium. Cyfrowe przetwarzanie sygnałów. Ćwiczenie 8. Filtracja uśredniająca i statystyczna.

Cyfrowe przetwarzanie obrazów i sygnałów Wykład 8 AiR III

Fotometria CCD 4. Fotometria profilowa i aperturowa

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV

Algorytmy metaheurystyczne Wykład 11. Piotr Syga

ROZWIĄZYWANIE RÓWNAŃ NIELINIOWYCH

KADD Metoda najmniejszych kwadratów funkcje nieliniowe

Filtracja pomiarów z głowic laserowych

Komputerowa Analiza Danych Doświadczalnych

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński

METODY STATYSTYCZNE W BIOLOGII

Implementacja filtru Canny ego

STATYSTYKA MATEMATYCZNA

Podstawy opracowania wyników pomiarów z elementami analizy niepewności pomiarowych

Kwantyzacja wektorowa. Kodowanie różnicowe.

Grafika Komputerowa Materiały Laboratoryjne

Aerotriangulacja. 1. Aerotriangulacja z niezależnych wiązek. 2. Aerotriangulacja z niezależnych modeli

3. KINEMATYKA Kinematyka jest częścią mechaniki, która zajmuje się opisem ruchu ciał bez wnikania w jego przyczyny. Oznacza to, że nie interesuje nas

Optymalizacja optymalizacji

Samochodowy system detekcji i rozpoznawania znaków drogowych. Sensory w budowie maszyn i pojazdów Maciej Śmigielski

Metody kodowania wybranych cech biometrycznych na przykładzie wzoru naczyń krwionośnych dłoni i przedramienia. Mgr inż.

166 Wstęp do statystyki matematycznej

Julia 4D - raytracing

Grupowanie Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 201/633

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Zmienne zależne i niezależne

Transkrypt:

ANALIZA SEMANTYCZNA OBRAZU I DŹWIĘKU Algorytmy śledzenia ruchu obiektów dr inż. Jacek Naruniec

Wprowadzenie Śledzenie ruchu Śledzenie punktu Metody deterministyczne Metody statystyczne (Kalman, filtry częsteczkowe, roje cząsteczek) Śledzenie kształtu Metody oparte na wzorcach Modele oparte na wielowidokowych modelach wyglądu Śledzenie sylwetki Dopasowywanie kształtu Ewolucja konturów Mean shift, CAMSHIFT 2

Wprowadzenie 3

Metody deterministyczne 2 2? 1 4 1 4?? 3 3? 4

Metody deterministyczne Operują na prostych założeniach specyfiki ruchu. Jest to zwykle podzbiór założeo: Pozycja obiektu nie zmienia się znacznie w przeciągu jednej dyskretnej chwili czasu Prędkośd i kierunek obiektu nie zmienia się znacząco w jednej chwili (gładkośd) Przy analizie zbioru punktów zakłada się, że prędkośd bliskich sobie obiektów jest podobna Odległości pomiędzy dwoma punktami są względnie stałe w obiektach 3D 5

Metody deterministyczne Możliwe założenia: Punkty mogą znikad i pojawiad się Punkty mogą zostad przysłonięte Analiza wymaga podania początkowych pozycji punktów 6

Metody deterministyczne Najprostsza minimalizowana funkcja kosztu: e( P k 1, n, P k, i, P k 1, m ) w d 1 P P k 1, n k 1, n P P k, i k, i P k, i P k, i P k 1, m P k 1, m w m 1 2 P P k 1, n k 1, n P P k, i k, i P k, i P k, i P k 1, m P k 1, m 1 2 gdzie P to wektor pomiędzy punktami n i i w k 1, npk, i chwilach czasu k-1 i k, w d to waga różnicy kierunku, w m to waga szybkości ruchu Jeśli punkt zostaje przysłonięty, to jego pozycja jest ekstrapolowana. Nie pozwala na pojawianie się/znikanie punktów *źródło: Salari Feature Point Correspondence in the Presence of Occlusion 7

Metody deterministyczne Rozwiązanie poprzez algorytm zachłanny 15 5 9 6 17 6 8 3 2 8

Metody deterministyczne Skuteczniejszy algorytm IPAN Trzy części algorytmu: Inicjalizacja Przetwarzanie kolejnych klatek obrazu Przetwarzanie koocowe Algorytm skutecznie radzi sobie z pojawianiem się i znikaniem punktów, przysłonięciami Ustawianie początkowych punktów wykonywane jest automatycznie Koszt połączeo wektorów jak poprzednio 9

Metody deterministyczne Inicjalizacja Wykonywana po zgromadzeniu 3 kolejnych klatek obrazu Analiza sąsiedztwa punktów drugiej klatki w pierwszej i trzeciej klatce Łączenie wektorów o najniższym koszcie Hipotezy sprawdzane w kierunkach do przodu i do tyłu Nie wszystkie punkty muszą zostad połączone *źródło: Tracking Feature Points: a New Algorithm + 10

Metody deterministyczne Przetwarzanie kolejnych klatek obrazu Analiza podobna jak przy inicjalizacji, zachowując utworzone wcześniej połączenia Punkty, które określone były dla F k-1 znikają Możliwośd wejścia nowych punktów *źródło: Tracking Feature Points: a New Algorithm + 11

Metody deterministyczne Poprawianie zgubionych trajektorii Przeprowadzane w dłuższym okresie czasu Analizowane są punkty o zgubionej trajektorii w większym otoczeniu *źródło: Tracking Feature Points: a New Algorithm + 12

Metody statystyczne Metody lokalizacji obarczone są błędami Predykcja ruchu także nie jest doskonała Algorytmy statystyczne dążą do estymacji pozycji obiektu zakładając niepewnośd modelu ruchu jak i pomiarów Zwykle dwuetapowa analiza: Predykcja na podstawie kilku poprzednich pozycji obiektu Korekcja na podstawie aktualnych pomiarów 13

Filtr Kalmana Estymacja stanu obiektu w procesie dynamicznym w dyskretnych chwilach czasu Założenie gaussowości rozkładu prawdopodobieostwa stanu systemu Proces opisany równaniem liniowym: i pomiarem: x k Ax k Bu w 1 k 1 k 1 z k Hx k v k chwila czasowa, w i v to szum predykcji i pomiaru. Są to zmienne niezależne o rozkładzie normalnym, zerowej średniej i kowariancji odpowiednio Q i R A macierz określająca stosunek aktualnego stanu do poprzedniego, z pominięciem pozostałych członów równania u, B dodatkowe parametry kontrolne modelu H analogicznie do A, tylko odnośnie pomiaru 14

Filtry cząsteczkowe Nie zakładają określonego rozkładu prawdopodobieostwa Jeśli nie można wyznaczyd równao filtru analitycznie, to prawdopodobieostwo stanu może byd reprezentowane poprzez losowo wybrany zbiór ważonych próbek Cząsteczkę definiuje się jako parę (x, π), gdzie xєr, a π w zakresie [0; 1+ jest wagą cząsteczki. Zbiór cząsteczek dobierany jest w ten sposób, aby waga i dowolnej cząsteczki odpowiadała prawdopodobieostwu rozkładu p(x) w punkcie x i. 15

Filtry cząsteczkowe Ponowne próbkowanie Splot z funkcją dynamiki Mnożenie przez obserwacje 16

Filtry cząsteczkowe 17 *źródło: J. MacCormick Stochastic Algorithms for Visual Tracking]

Filtry cząsteczkowe Wyznaczanie obrysu ramion i głowy Obrys reprezentowany przez krzywą sklejaną (spline) Prostopadle do kierunku krzywej znajdują się punkty kontrolne (cząsteczki) W prostopadłych do kierunku krzywej znajduje się wyniki pomiaru 18

Roje cząsteczek (PTO Particle Swarm Optimization) Także oparte na cząsteczkach Metoda wzoruje się na zachowaniu ptaków Można założyd, że stado poszukuje jedzenia i każdy z ptaków wie, jak blisko znajduje się celu Optymalna strategią stada będzie poruszanie się w kierunku tego ptaka, który znajduje się najbliżej pożywienia. W danym zagadnieniu cząsteczki reprezentują ptaki Cząsteczki posiadają własną pozycję i prędkośd i wagę 19

Roje cząsteczek Waga cząsteczki odpowiada bliskości pożywienia Metoda zakłada istnienie miary według których kierują się cząsteczki gbest - najlepszy globalny kierunek ruchu lbest najlepszy lokalny kierunek ruchu Algorytm: Losowo wybierz cząsteczki w obrazie Dopóki odpowiedni poziom funkcji kosztu nie zostanie osiągnięty: Uaktualnij pozycję punktu na podstawie wektora prędkości Uaktualnij wektor prędkości znając globalne i lokalne maksima: v i v i c r ( xˆ ) ( ˆ i xi c2r2 g x 1 1 i ) gdzie ω stała bezwładności, c 1 i c 2 określają stosunek wagi najlepszego kierunku lokalnego do globalnego, r 1 i r 2 to losowe wektory w zakresie [0..1] 20

Śledzenie punktu Metoda przepływu optycznego optical flow Zakłada ona, że luminancje pikseli odpowiadających sobie obiektów są niezmienne w kolejnych klatkach obrazu Podstawowa wersja algorytmu zaprojektowana była do śledzenia punktów. Dla każdego piksela znajdującego się w gęstym polu przepływu wyznacza się wektor przepływu (dx; dy) poprzez wyznaczenie rozwiązao równania Rozwiązania funkcji poszukiwane są w bliskim sąsiedztwie analizowanego punktu Metoda bardzo wrażliwa na szumy 21

Śledzenie punktu *źródło: B.Horn Determining Optical Flow + 22

Śledzenie kształtu Metody oparte na wzorcach Aktywne kształty, aktywne modele, aktywny wygląd, implicit Shape Model w okolicy danego obiektu - to już było Zwykle metody polegają na pobraniu informacji zlokalizowanego obiektu i dopasowanie tej informacji do kolejnej klatki obrazu 23

Śledzenie kształtu Informacje na podstawie których śledzony jest obiekt: Luminancje wszystkich pikseli Gradienty pikseli Histogram barw pikseli w oknie Wariancja, wartośd średnia 24

Śledzenie kształtu Najprostszy algorytm sprawdź różnicę luminancji prostokątów w każdym możliwym oknie Nieskuteczne ze względu na bardzo długi czas działania 25

Śledzenie kształtu Miara korelacji: Innymi słowy filtracja obrazu za pomocą danego wzorca 4 2 6 4 1 5 3 2 3 4 2 6 4 3 5 3 2 3 Konieczne przesunięcie wektorów o wartośd średnią wzorca Metoda podobna do Hit&Miss 26

Śledzenie kształtu Problem zmian intensywności pikseli Może wynikad z pojawieniem się nowego źródła światła, dostosowaniu czasu naświetlania kamery, itp. Kompensacja zmian oświetlenia Zastosowanie gradientu obrazu Normalizacja obrazu w( x, y) w( x, y) w 27

Śledzenie kształtu Możliwe ulepszenia systemu: Założenia o specyfice obiektu: Prędkości ruchu, gładkości, itp. W celu uniewrażliwienia się na tło - dopasowanie kształtu okna do kształtu obiektu 28

Śledzenie kształtu Problemy metod przepływu optycznego: Wrażliwośd na zmiany oświetlenia Błąd akumulacji dryftu Duża wrażliwośd na szumy Rozwiązania analityczne oparte na gradientach pikseli Metoda bardzo prosta 29

Śledzenie kształtu Rozszerzenie przepływu optycznego do prostokątnych obszarów metoda KLT (Kanade, Lee, Tomasi) Algorytm minimalizuje błąd SSD: 1+2w x 1+2w y d 30

Śledzenie kształtu KLT implementacja na piramidzie obrazów Znacznie przyspiesza działanie procesu dając dokładne wyniki 31

Śledzenie kształtu Algorytm KLT: 1. Wyznacz położenie punktu na najmniejszym obrazie piramidy 2. Wyznacz położenie punktu na wyższym poziomie piramidy poprzez wymnożenie parametrów przez 2 (u*2) 3. Doprecyzuj położenie okna na danym poziomie piramidy 4. Powtarzaj punkty 2-3 do momentu osiągnięcia najwyższego poziomu piramidy Rozmiar okna jest stały na wszystkich poziomach piramidy W celu uniknięcia dużej akumulacji błędu dryftu stosuje się podpikselową dokładnośd 32

Śledzenie kształtu Podpikselową dokładnośd otrzymuje się poprzez bilinearną interpolację: gdzie x i y to liczby rzeczywiste (nie całkowite), x 0 i y 0 to częśd całkowita x i y, natomiast α x i α y to pozostała częśd w zakresie [0..1] Wartośd piksela w obrazie I(x, y) w danym stopniu piramidy L: 33

Śledzenie kształtu KLT: Wybór dobrych punktów do śledzenia można przeprowadzid np. poprzez analizę wartości własnych macierzy Hessianu Bardzo skuteczne, szybkie implementacje Działa w czasie rzeczywistym Odporna na szumy Dobry opis algorytmu: J. Bouguet Pyramidal Implementation of the Lucas Kanade Feature Tracker Description of the algorithm 34

Śledzenie kształtu Blokowa estymacja ruchu Używane przede wszystkim w kompresji wideo Three step search: -7 0 +7-7 0 +7 *źródło: M.Jakubowski Selected Motion Estimation Algorithms Comparison + 35

Śledzenie kształtu Diamond search Nieograniczona ilośd kroków Poszukuje lokalnego minimum w okolicy punktu -7 0 +7-7 0 +7 *źródło: M.Jakubowski Selected Motion Estimation Algorithms Comparison + 36

Śledzenie kształtu Uproszczenie wykorzystanie obrazu całkowego Zamiast odejmowad wartośd każdego piksela można odejmowad wartości średnie Znaczny wzrost szybkości algorytmu Nieco gorsze wyniki Zastosowanie zależne od aplikacji 37

Mean shift Algorytm iteracyjny Pozwala na znalezienie lokalnych maksimów rozkładu gęstości punktów W algorytmie otrzymuje się początkową pozycję (estymatę) punktu oraz pewną funkcję jądra K np. gaussowską Punkt przesuwa się do średniej punktów w otoczeniu danego punktu: m( x) x i x i N ( x) N ( x) K( x i K( x i x) x x) i 38

Mean shift uproszczony przykład (bez wag) Punkty zainteresowania Klasyfikacja punktów w otoczeniu estymaty w punktach zainteresowania Przesunięcie punktu do średniej punktów w otoczeniu... Stabilizacja punktu = zakończenie algorytmu. 39

CAMSHIFT Rozszerzenie algorytmu mean-shift Mean shift zakłada stałą wielkośd okna analizy CAMSHIFT opiera się na prawdopodobieostwie koloru (np. skóry) Zerowy moment obszaru rozkładu obszar rozkładu znaleziony w oknie poszukiwao Zakłada zmienną wartośd jądra oraz zmienną wielkośd okna analizy 40

CAMSHIFT Algorytm: 1. Wybierz początkową pozycję okna poszukiwao 2. Wybierz początkową wielkośd okna analizy (np. 3 piksele) 3. Wykonaj algorytm mean-shift 4. Ustal wielkośd okna w zależności od funkcji zerowego momentu rozkładu 5. Powtarzaj kroki 3 i 4 do uzyskania stabilizacji średniej W przypadku analizy na żywo z kamery można pominąd krok 5. 41

CAMSHIFT 42

CAMSHIFT 43