PRECYZYJNA ANALIZA RUCHU GAŁEK OCZNYCH



Podobne dokumenty
Harmonogramowanie projektów Zarządzanie czasem

Arkusz maturalny treningowy nr 7. W zadaniach 1. do 20. wybierz i zaznacz na karcie odpowiedzi poprawną odpowiedź.

DTR.ZL APLISENS PRODUKCJA PRZETWORNIKÓW CIŚNIENIA I APARATURY POMIAROWEJ INSTRUKCJA OBSŁUGI (DOKUMENTACJA TECHNICZNO-RUCHOWA)

Sterownik Silnika Krokowego GS 600

Metoda LBL (ang. Layer by Layer, pol. Warstwa Po Warstwie). Jest ona metodą najprostszą.

Politechnika Warszawska Wydział Matematyki i Nauk Informacyjnych ul. Koszykowa 75, Warszawa

1. Od kiedy i gdzie należy złożyć wniosek?

MATEMATYKA 4 INSTYTUT MEDICUS FUNKCJA KWADRATOWA. Kurs przygotowawczy na studia medyczne. Rok szkolny 2010/2011. tel

Udoskonalona wentylacja komory suszenia

Opis modułu analitycznego do śledzenia rotacji towaru oraz planowania dostaw dla programu WF-Mag dla Windows.

Projekt z dnia 2 listopada 2015 r. z dnia r.

NUMER IDENTYFIKATORA:

Instalacja. Zawartość. Wyszukiwarka. Instalacja Konfiguracja Uruchomienie i praca z raportem Metody wyszukiwania...

PROJEKT. w sprawie: wyboru Przewodniczącego Nadzwyczajnego Walnego Zgromadzenia Spółki

Podstawy programowania

Bazy danych. Andrzej Łachwa, UJ, /15

KONCEPCJA NAUCZANIA PRZEDMIOTU RACHUNKOWOŚĆ SKOMPUTERYZOWANA" NA WYDZIALE ZARZĄDZANIA UNIWERSYTETU GDAŃSKIEGO

Zadania. SiOD Cwiczenie 1 ;

Zarządzenie Nr 1469/2012

ANALOGOWE UKŁADY SCALONE

WYZNACZANIE PRZYSPIESZENIA ZIEMSKIEGO ZA POMOCĄ WAHADŁA REWERSYJNEGO I MATEMATYCZNEGO

Temat: Co to jest optymalizacja? Maksymalizacja objętości naczynia prostopadłościennego za pomocą arkusza kalkulacyjngo.

Stypendia USOS Stan na semestr zimowy 2013/14

Badanie bezszczotkowego silnika prądu stałego z magnesami trwałymi (BLDCM)

NOWELIZACJA USTAWY PRAWO O STOWARZYSZENIACH

PREFABRYKOWANE STUDNIE OPUSZCZANE Z ŻELBETU ŚREDNICACH NOMINALNYCH DN1500, DN2000, DN2500, DN3200 wg EN 1917 i DIN V

Zintegrowane Systemy Zarządzania Biblioteką SOWA1 i SOWA2 SKONTRUM

EGZAMIN MATURALNY Z MATEMATYKI

Matematyka z plusemdla szkoły ponadgimnazjalnej WYMAGANIA EDUKACYJNE Z MATEMATYKI W KLASIE TRZECIEJ LICEUM. KATEGORIA B Uczeń rozumie:

tel/fax lub NIP Regon

Technologie Informacyjne

KOMISJA WSPÓLNOT EUROPEJSKICH. Wniosek DECYZJA RADY

Bielsko-Biała, dn r. Numer zapytania: R WAWRZASZEK ISS Sp. z o.o. ul. Leszczyńska Bielsko-Biała ZAPYTANIE OFERTOWE

Projekty uchwał dla Zwyczajnego Walnego Zgromadzenia

Poniżej aktualny regulamin certyfikacji ośrodków jeździeckich. REGULAMI CERTYFIKACJI OŚRODKÓW JEŹDZIECKICH

enova Workflow Obieg faktury kosztowej

REGULAMIN STYPENDIALNY FUNDACJI NA RZECZ NAUKI I EDUKACJI TALENTY

14P2 POWTÓRKA FIKCYJNY EGZAMIN MATURALNYZ FIZYKI I ASTRONOMII - II POZIOM PODSTAWOWY

Temat: Czy świetlówki energooszczędne są oszczędne i sprzyjają ochronie środowiska? Imię i nazwisko

U Z A S A D N I E N I E

ZASADY WYPEŁNIANIA ANKIETY 2. ZATRUDNIENIE NA CZĘŚĆ ETATU LUB PRZEZ CZĘŚĆ OKRESU OCENY

40. Międzynarodowa Olimpiada Fizyczna Meksyk, lipca 2009 r. ZADANIE TEORETYCZNE 2 CHŁODZENIE LASEROWE I MELASA OPTYCZNA

Warszawa, r.

INFORMATOR -SPECJALIZACJE

Niezależnie od rodzaju materiału dźwiękowego ocenie podlegały następujące elementy pracy egzaminacyjnej:

Badanie silnika asynchronicznego jednofazowego

Soczewkowanie grawitacyjne 3

Zestawienie wartości dostępnej mocy przyłączeniowej źródeł w sieci RWE Stoen Operator o napięciu znamionowym powyżej 1 kv

Zarządzenie Nr W Wójta Gminy Siedlce z dnia 1 kwietnia 2015 roku. w sprawie powołania Gminnego Zespołu Zarządzania Kryzysowego.

Badania skuteczności działania filtrów piaskowych o przepływie pionowym z dodatkiem węgla aktywowanego w przydomowych oczyszczalniach ścieków

Opis programu do wizualizacji algorytmów z zakresu arytmetyki komputerowej

Elementy animacji sterowanie manipulatorem

GEO-SYSTEM Sp. z o.o. GEO-RCiWN Rejestr Cen i Wartości Nieruchomości Podręcznik dla uŝytkowników modułu wyszukiwania danych Warszawa 2007

ASD - ćwiczenia III. Dowodzenie poprawności programów iteracyjnych. Nieformalnie o poprawności programów:

Rodzaje i metody kalkulacji

ZAPYTANIE OFERTOWE. Nazwa zamówienia: Wykonanie usług geodezyjnych podziały nieruchomości

REGULAMIN KONKURSU NA PROJEKT LOGO KTO? NGO! POZARZĄDOWY SZCZECIN

Rozdział 6. Pakowanie plecaka. 6.1 Postawienie problemu

PROCEDURY OBOWIĄZUJĄCE NA ŚWIETLICY SZKOLNEJ

Wojewódzki Konkurs Przedmiotowy z Matematyki dla uczniów gimnazjów województwa śląskiego w roku szkolnym 2012/2013

PX319. Driver LED 1x2A/48V INSTRUKCJA OBSŁUGI

Załącznik do zarządzenia Rektora Krakowskiej Akademii im. Andrzeja Frycza Modrzewskiego Nr 8/2013 z 4 marca 2013 r.

ZAŁĄCZNIK NR 1. Zakres wiedzy i umiejętności oraz wykaz proponowanej bibliografii

BADANIE UMIEJĘTNOŚCI UCZNIÓW W TRZECIEJ KLASIE GIMNAZJUM CZĘŚĆ MATEMATYCZNO-PRZYRODNICZA

Nowe funkcjonalności

Przygotowały: Magdalena Golińska Ewa Karaś

DE-WZP JJ.3 Warszawa,

TEORIA GIER W EKONOMII WYKŁAD 1: GRY W POSTACI EKSTENSYWNEJ I NORMALNEJ

Procedura rekrutacji dzieci do Przedszkola nr 2 w Zawierciu

2) Drugim Roku Programu rozumie się przez to okres od 1 stycznia 2017 roku do 31 grudnia 2017 roku.

DECYZJA w sprawie czasowego zaprzestania działalności

Rekrutacją do klas I w szkołach podstawowych w roku szkolnym 2015/2016 objęte są dzieci, które w roku 2015 ukończą:

INSTRUKCJA DO PROGRAMU LICZARKA 2000 v 2.56

jest częściowe pokrycie wydatków związanych z wychowaniem dziecka, w tym z opieką nad nim i zaspokojeniem jego potrzeb życiowych.

PL B1. POLITECHNIKA LUBELSKA, Lublin, PL BUP 14/14

Implant ślimakowy wszczepiany jest w ślimak ucha wewnętrznego (przeczytaj artykuł Budowa ucha

UCHWAŁA NR IX / 72 / 15 RADY GMINY CHEŁMŻA. z dnia 26 sierpnia 2015 r.

7. REZONANS W OBWODACH ELEKTRYCZNYCH

Elementy cyfrowe i układy logiczne

Ogólnopolska konferencja Świadectwa charakterystyki energetycznej dla budynków komunalnych. Oświetlenie publiczne. Kraków, 27 września 2010 r.

Ćwiczenie: "Ruch harmoniczny i fale"

Gdynia: Księgowość od podstaw Numer ogłoszenia: ; data zamieszczenia: OGŁOSZENIE O ZAMÓWIENIU - usługi

HiTiN Sp. z o. o. Przekaźnik kontroli temperatury RTT 4/2 DTR Katowice, ul. Szopienicka 62 C tel/fax.: + 48 (32)

6. Projektowanie składu chemicznego stali szybkotn cych o wymaganej twardo ci i odporno ci na p kanie

Projekty uchwał na Nadzwyczajne Walne Zgromadzenie i3d S.A. z siedzibą w Gliwicach zwołane na dzień 10 grudnia 2013 r.:

Temat: Funkcje. Własności ogólne. A n n a R a j f u r a, M a t e m a t y k a s e m e s t r 1, W S Z i M w S o c h a c z e w i e 1

PAKIET MathCad - Część III

WYKŁAD 8. Postacie obrazów na różnych etapach procesu przetwarzania

TESTER LX 9024 (SYSTEM ALARMOWY IMPULSOWY) INSTRUKCJA OBSŁUGI

Zarządzenie Nr 325/09 Burmistrza Miasta Bielsk Podlaski z dnia 29 czerwca 2009 r.

KONKURS PRZEDMIOTOWY Z FIZYKI dla uczniów gimnazjów województwa lubuskiego 23 marca 2012 r. zawody III stopnia (finałowe)

Podstawowe działania w rachunku macierzowym

Regulamin Rekrutacji do Publicznego Przedszkola Centrum Rozwoju Dziecka Berek! we Wrocławiu. Rozdział I Postanowienia ogólne

Zapytanie ofertowe dotyczące wyboru wykonawcy (biegłego rewidenta) usługi polegającej na przeprowadzeniu kompleksowego badania sprawozdań finansowych

Szczegółowe zasady obliczania wysokości. i pobierania opłat giełdowych. (tekst jednolity)

Regulamin konkursu Konkurs z Lokatą HAPPY II edycja

PROCEDURA OCENY RYZYKA ZAWODOWEGO. w Urzędzie Gminy Mściwojów

REGULAMIN NABORU NA WOLNE STANOWISKA URZĘDNICZE. w III Liceum Ogólnokształcącym. im. M. Kopernika w Olsztynie

Wymiana nawierzchni chodników oraz dróg dojazdowych wokół budynku, rozbiórka i ponowny montaż prefabrykowanego muru oporowego

Co zrobić, jeśli uważasz, że decyzja w sprawie zasiłku mieszkaniowego lub zasiłku na podatek lokalny jest niewłaściwa

Transkrypt:

Paweł Zięba *, Mateusz Czapliński *, Mateusz Biliński PRECYZYJNA ANALIZA RUCHU GAŁEK OCZNYCH 1. WSTĘP Gwałtowny wzrost mocy obliczeniowej komputerów ma duży wpływ na technologię w dzisiejszych czasach, dając możliwości stosowania komputerów w wielu nowych dziedzinach. Niniejsza praca prezentuje wykorzystanie wspomnianych możliwości w zastosowaniu bardzo praktycznym sterowaniu komputerem za pomocą wzroku. Rozwiązanie takie jest bardzo potrzebne i można je wykorzystać w wielu dziedzinach: pomocy osobom niepełnosprawnym, marketingu, komputerowej rozrywce. Prezentowany system jest rozwinięciem wcześniej opublikowanych pomysłów [1]. Zasada jego działania opiera się na analizie obrazów oka ludzkiego, wykonanych przez kamerę podłączoną do komputera. Zestaw 4 diod LED, umieszczonych w narożnikach ekranu komputera, stwarza na oku refleksy, które są wykrywane na zarejestrowanym obrazie i pozwalają wyznaczyć układ odniesienia. Naprzemiennie z tymi diodami, system zapala piątą diodę, umieszczoną w osi obiektywu kamery (zob. rys. 1). Tak umieszczone światło wywołuje na obrazie z kamery tzw. efekt czerwonych oczu, który silnie wzmacnia widoczność źrenicy oka. Dzięki temu możliwe jest znalezienie położenia środka źrenicy, którego nałożenie na znaleziony w poprzednim etapie układ odniesienia pozwala wyznaczyć punkt na ekranie, w który wpatruje się użytkownik komputera. 2. SPRZĘT I POBIERANIE OBRAZU student, Koło Naukowe Informatyków Kernel, Wydział Fizyki i Informatyki Stosowanej AGH

Rys. 1. Sposób instalacji diod w narożnikach ekranu oraz w osi obiektywu kamery. Część sprzętowa omawianego systemu składa się z kamery oraz 5 czerwonych diod LCD (cztery z nich zamocowane w rogach ekranu, jedna w osi obiektywu kamery) połączonych z komputerem za pomocą kontrolera sterowanego przez złącze LPT (schemat układu na rysunku 2). Rys. 2. Schemat układu pośredniczącego w sterowaniu zapalaniem diod. Linie A oraz B sterują diodami w narożnikach ekranu (IRED1-4). Linia C steruje diodą umieszczoną w osi obiektywu kamery (INNA). Dioda RED informuje czy układ jest poprawnie zasilany. Kondensator C1 służy do filtrowania napięcia. 3. ANALIZA OBRAZU, ROZPOZNAWANIE KSZTAŁTÓW Aby móc na podstawie uzyskanych z kamery obrazów wyznaczyć kierunek patrzenia użytkownika, konieczne jest przeanalizowanie obrazu. Celem tego etapu jest znalezienie na obrazie punktów, w których odbija się światło diod LED z narożników ekranu oraz wyznaczenie położenia środka obrazu źrenicy oka użytkownika. Analizę prowadzi się na podstawie dwóch obrazów z kamery jeden z nich wykonuje się przy włączonych diodach umieszczonych w narożnikach ekranu, drugi przy włączonej diodzie leżącej w osi obiektywu kamery.

Kluczowym problemem jest tu wyznaczenie środka źrenicy oka. W tym celu niezbędne jest znalezienie elipsy, będącej jej brzegiem. Do wykonania tej procedury w opisywanym systemie stosowany jest algorytm genetyczny przedstawiony przez P. Ziębę [2]. Algorytm ten wymaga przeprowadzenia wstępnej obróbki danych wejściowych (ang. feature detection), której celem jest wyodrębnienie na obrazie szukanych obiektów. Wykonywane są następujące operacje: oba wejściowe obrazy poddawane są rozmyciu (redukcja szumów), następnie odejmowane od siebie (wyodrębnienie różnic wynikających z włączenia innych diod); dalej podlegają odcięciu (ang. threshold) w celu ponownej redukcji szumów; wreszcie aplikowany jest filtr Canny ego [3], służący do wykrywania krawędzi. Algorytm wykorzystywany do wyszukania obróconej elipsy, będącej krawędzią zarejestrowanego obrazu źrenicy, należy do kategorii tzw. algorytmów genetycznych. Są to algorytmy heurystyczne, których celem jest optymalizacja zadanej funkcji (funkcja dostosowania). Opierają się one na modelowaniu rozwoju populacji osobników podobnym jak w ewolucji gatunków w świecie rzeczywistym. W wykorzystywanym algorytmie genetycznym osobnikiem jest pojedyncza obrócona elipsa, której genotyp stanowi jej 5 parametrów (współrzędne środka, długości obu osi, kąt nachylenia osi wielkiej elipsy względem osi x). Funkcja dostosowania dla osobnika wyliczana jest na podstawie ilości białych pikseli obrazu (białym kolorem oznaczono piksele należące do krawędzi wykrytych przez filtr Canny ego) leżących w pobliżu elipsy, opisywanej w/w parametrami, oraz bliskości każdego z tych pikseli do niej. W opisywanym przypadku populacji elips, dobór naturalny (tzw. selekcja) jest niedeterministyczny, przy czym prawdopodobieństwo przetrwania osobnika jest proporcjonalne do jego wartości funkcji dostosowania. Krzyżowanie dwóch osobników prowadzi do powstania nowego osobnika, którego każdy współczynnik ma wartość losowaną z rozkładem jednorodnym z przedziału [a, b], gdzie a, b są wartościami tego współczynnika u osobników krzyżowanych. Wreszcie, aby zapobiec degeneracji populacji wprowadzane są do genotypu losowych osobników niedeterministyczne zaburzenia. Po odpowiednim dostrojeniu, algorytm okazuje się bardzo dobrze sobie radzić z odnajdywaniem elipsy na testowanych obrazach.

Rys. 3. Obraz oka, z zaznaczoną elipsą źrenicy znalezioną przez algorytm genetyczny. Rys. 4. Charakterystyczne punkty na oku przed dokonaniem mapowania. 4. MAPOWANIE NA EKRAN W ostatnim etapie, na podstawie współrzędnych czterech punktów p i = (x i, y i ) (gdzie i = 1,2,3,4) obrazu z kamery, w których odbijają się diody LED z narożników ekranu oraz współrzędnych punktu e = (e x, e y ), w którym znajduje się obraz środka źrenicy oka, wyznaczane są współrzędne ekranowe (w pikselach) punktu s = (s x, s y ), w który wpatrywał się użytkownik. Bazując na wcześniej wspomnianej metodzie [1], algorytm wykorzystywany w tym module opiera się na wielkości zwanej cross ratio. Dla współliniowych punktów A, B, C i D współczynnikiem cross ratio, oznaczaną jako (ABCD), nazywamy stosunek ich odległości wyrażony wzorem DB CA (ABCD) =. (1) DA CB Współczynnik cross ratio ma kluczową cechę, która pozwala na jego zastosowanie w opisywanym problemie, a mianowicie jest niezmiennikiem przekształceń perspektywicznych. W przedstawianym algorytmie założono, że oko ludzkie ma płaską powierzchnię (dokładniej: że znalezione przez nas punkty p i oraz e są współpłaszczyznowe). W takiej sytuacji, jeśli znajdzie się w płaszczyźnie oka cztery współliniowe punkty, można wyznaczyć ich cross ratio; następnie, znając punkty na monitorze komputera odpowiadające trzem spośród punktów z oka, można wyznaczyć punkt na ekranie odpowiadający czwartemu.

W omawianym zagadnieniu powyższą technikę należy zastosować dwukrotnie, osobno dla każdej współrzędnej ekranowej (poziomej oraz pionowej). Aby mieć komplet czterech punktów w obu przypadkach, konieczne jest znalezienie: punktu pomocniczego c, w którym przecinają się odcinki p 1 p 3 i p 2 p 4 (punkt ten odpowiada miejscu, gdzie odbijałaby się dioda umieszczona na środku ekranu komputera), przy poszukiwaniu współrzędnej poziomej (dla współrzędnej pionowej analogicznie): punktu pomocniczego k 1 przecięcia przedłużeń p 1 p 4 i p 1 p 3 (zob. rys. 4), punktów m 1 i m 2 wyznaczonych przez przecięcie odpowiednio ck 1 i ek 1 z odcinkiem p 1 p 2. Współczynnik cross ratio wyznaczony przez p 1, p 2, m 1 i m 2 należy przyjąć za równy współczynnikowi wyznaczonemu przez górne narożniki ekranu, środek górnej krawędzi ekranu (odpowiada m 1 ) oraz rzut szukanego punktu s na górną krawędź ekranu co bezpośrednio przekłada się na równanie, z którego można wyznaczyć s x. Podobnie należy postąpić dla współrzędnej s y. Rys. 5. Przykładowe wyniki działania programu. Prostokąt oznacza obszar ekranu. Duże cyfry oznaczają położenie punktów znalezionych na ekranie, małe cyfry położenie punktów wyznaczone przez system. W rzeczywistości otrzymane w ten sposób wyniki z różnych przyczyn (np. przyjętych uproszczeń) nie nadają się bezpośrednio do zastosowania. Dlatego koniecznym okazuje się przeprowadzenie dwóch dodatkowych kroków. Pierwszy zabieg, kalibracja, polega na wyznaczeniu czterech punktów w pobliżu narożników ekranu, o znanych współrzędnych ekranowych. Następnie należy zebrać próbkę kilku-kilkunastu wyników uzyskiwanych w momencie wpatrywania się użytkownika w każdy z tych punktów. Po uśrednieniu uzyskuje się cztery punkty odniesienia, które pozwalają zbudować drugie mapowanie, analogiczne do opisanego

powyżej, które znacznie poprawia skuteczność systemu. Kalibrację wykonuje się raz na sesję. Drugim krokiem jest oczyszczenie danych z błędnych wyników generowanych w przypadku mrugnięcia oka użytkownika. Skuteczną okazuje się tu bardzo prosta metoda, polegająca na odfiltrowaniu wyników, które po obu mapowaniach trafiają poza obszar ekranu komputera. 5. PODSUMOWANIE Opisany system, po skonstruowaniu przez autorów, okazał się działać skutecznie i spełniać postawione założenia (przykładowe wyniki zaprezentowane są na rysunku 5). Wykorzystanie stworzonego systemu poza warunkami laboratoryjnymi wymaga jednak jeszcze pewnych udoskonaleń. Sporym problemem w praktyce okazało się użycie diod LED ze spektrum światła widzialnego znacznym udogodnieniem byłoby skorzystanie z diod podczerwonych, wymagają one jednak czulszego układu rejestrującego kamery. Warto przeanalizować również możliwości dalszej poprawy trafności, na przykład poprzez uśrednienie kilku wyników. Referat pt. Precyzyjna analiza ruchu gałek ocznych autorstwa Pawła Zięby, Mateusza Czaplińskiego oraz Mateusza Bilińskiego, został wygłoszony na XLIV Sesji Studenckich Kół Naukowych Pionu Hutniczego AGH w Sekcji Informatyki Stosowanej oraz wyróżniony I nagrodą. Opiekun naukowy referatu: dr hab. inż. Witold Dzwinel. LITERATURA [1] Dong Hyun Yoo: Non-contact Eye Gaze Estimation System using Robust Feature Extraction and Mapping of Corneal Reflections, Korea Advanced Institute of Science and Technology, 2002 (niepublikowana). [2] Zięba P.: Wyszukiwanie elips za pomocą algorytmów genetycznych, Wydział Fizyki i Informatyki Stosowanej AGH, Kraków, 2007 (praca inżynierska, niepublikowana). [3] Canny J.: A Computational Approach To Edge Detection, IEEE Transactions on Pattern Analysis and Machine Intelligence, zesz. 8/1986.