Wykrywanie ludzkich na kolorowych obrazach ze złożonym tłem Lech Baczyński www.baczynski.com Na podstawie artykułu panów: Yanjiang Wang, Baozong Yuan i in.
Do czego przydatne jest wykrywanie (detekcja)? rozpoznawanie i identyfikacja "inteligentna" interakcja z komputerami przetwarzanie sekwencji wideo rozpoznawanie przechodniów, wykrywanie terrorystów na lotniskach itp. 2
Uwagi początkowe Autorzy prowadzili badania i testy głównie na zdjęciach z twarzami azjatów Wpływ światła na wyniki 3
Model kodowania koloru w celach detekcji RGB HSV Każdy z nich można przy pomocy obliczeń przekształcić na drugi 4
RGB 0..255 dla każdego koloru ponad 16 mln. kolorów zapis np. #FFFF00 - żółty #FFFFFF - biały #000000 - czarny #808080 - szary 5
Normalizacja RGB jasność I = R + G +B Normalizacja: r = R/I g = G/I b = B/I zatem r + g + b = 1 Dzięki temu kolor można wyrazić przy pomocy dwóch wartości - r i g 6
HSV 3 liczby: H - Hue - barwa S - Saturation - jasność V - Value - wartość 7
Eksperymentalne wyznaczenie wartości dla koloru skóry - rgb 0.36 < r < 0.465 0.28 < g < 0.363 8
Eksperymentalne wyznaczenie wartości dla koloru skóry - HSV 0 < H < 50 0.20 < S < 0.68 0.35 < V < 1.0 9
podobny w artykule pp. Karin Sobotka, Ioannis Pitas w pismie Signal Processing: Image Communication 10
Podejście agentowe Agent - Inteligentna jednostka, która może działać autonomicznie lub we współpracy z innymi. 11
Przykład działania 12
Zachowanie agenta: 13
Algorytm: a) równomiernie rozłożyć agentów na obrazku b) dla każdego policzyć wartości koloru (HSV) i porównać z wartościami równań określających kolor skóry c) jeżeli punkt ma odpowiedni kolor, i nie został odwiedzony przez agenta, agent "rodzi" czterech synów w czterech kierunkach. Punkt zostaje zaznaczony. 14
Algorytm c.d. d) jeżeli punkt był odwiedzony lub nie jest koloru skóry, agent przesuwa się losowo do jednego z sąsiednich punktów, a jego wiek zwiększany jest o 1. e) Jeżeli agent jest zbyt stary, zostaje usunięty. f) Jeżeli zbiór agentów jest pusty END, jeżeli nie GOTO b) 15
Przykład działania 16
Łączenie obszarów po wykryciu regionów następuje łączenie efektywny agent - wykrył region o kolorze skóry ARM - agent relationship matrix że jeżeli przynajmniej n (w artykule n=5) punktów zostało odwiedzone przez agentów z dwóch rodzin, te rodziny łączy się a ARM. Następnie obszary o kształtach nie przypominających są usuwane. 17
Punkty charakterystyczne 18
Wykrywanie oczu przy użyciu sieci neuronowych zastosowane rozwiązanie: 3-warstwowa sieć neuronowa z back propagation 128 (16 x 8) jednostek wejściowych jedna wyjściowa trening sieci neuronowej a BP na 160 obrazkach (100 i 60 nie-) Oczekiwany wynik - 1 dla oka, 0 dla nie-oka. 19
Wykrywanie oczu przy użyciu sieci neuronowych c.d. pierwszy krok - znajdowanie "punktów" charakterystycznych drugi - podawanie punktów wraz z okolicami (16 x 8) na wejście sieci neuronowej. Wyjście z sieci neuronowej: 0-1, jeżeli mniejsze niż 0.5 to nie oko, jeżeli większe to oko. 20
Wyniki testów 21
Wyniki testów c.d. 22
Mylnie rozpoznana twarz 23
Źródła Ilustracje pochodzą z artykułów: Yanjiang Wang, Baozong Yuan w Pattern Recognition Karin Sobotka, Ioannis Pitas w Signal Processing: Image Communication Tekst dostępny na www.baczynski.com 24
Kontakt Institute of Information Science,Northern Jiaotong University Beijing 100044 People' Republic of China Tel.: #86-10-63240616 E-mail: bzyuan (at)center.njtu.edu.cn (B.Yuan). 25
Dziękuję za uwagę Czy są jakieś pytania?