Podstawy Technik Biometrycznych Semestr letni 215/216, wykład #6 Biometria podpisu odręcznego dr inż. Paweł Forczmański Katedra Systemów Multimedialnych, Wydzial Informatyki 1/26
Biometria behawioralna Rozwiązania biometryki behawioralnej nie są tak rozpowszechnione jak tej bazującej na danych fizjologicznych. Standardowe metody biometryczne wykorzystują biologiczne cechy danej osoby i na tej podstawie dokonują identyfikacji natomiast biometryka behawioralna analizuje pewne wzory codziennych zachowań: Dynamikę pisania na klawiaturze (keystroke dynamics) Odręczny podpis (handwritten signature) Wymowę (voice-based identification) 2/26
Identyfikacja głosowa W roku 196 Laboratorium Bella - system rejestrujący głos i identyfikujący ludzi z dokładnością rzędu 99% W 197 Texas Instruments - system ochrony bazujący na głosie przeznaczony dla amerykańskich pilotów. Dane, jakich dostarcza naturalna mowa, są łatwe do pozyskania. Użytkownik mówi swobodnie a system je identyfikuje W systemach, gdzie nie można zastosować kamer, specjalizowanych czytników, itp... 3/26
Keystroke dynamics Identyfikuje daną osobę po sposobie korzystania z klawiatury. Analizie podlega czas wprowadzenia całego tekstu oraz odstępy pomiędzy kolejnymi uderzeniami klawiszy. Na tej podstawie powstaje wzór zachowania danej osoby. Jest on przechowywany w specjalnej bazie. Wzór ten porównuje się z aktualnie uzyskanymi danymi dzięki czemu następuje weryfikacja tożsamości. Zalety: Nie wymaga specjalizowanego sprzętu (jest tania!); Niezależna od warunków zewnętrznych i otoczenia (działa tak samo na całym świecie); 4/26
Podpis odręczny Oryginał Podróbka 5/26
Dlaczego podpis? Zalety Zwyczajowy sposób potwierdzania tożsamości Zaawansowane urządzenia posiadają rysk Ludzie łatwo akceptują tę formę Łatwa, szybka, niski błąd fałszywej akcepracji, niskie obciążenie pamięciowe Wady Cecha zmienna, niezaprzeczalna Istnieją metody podrabiania 6/26
Cechy mówiące o indywidualności 7/26 Badania sugerują, że podpis związany jest z fizjologią: Pismo odręczne wynika i rozwija się w mózgu Sygnał (wyobrażenie) znaku lub słowa wysyłany jest z mózgu do ramienia i dłoni System pisma ręcznego = maszyna złożona z barku, ramion, dłoni, palców, pracuje jako dźwignia i podpora Podczas uczenia się, sygnały są przesyłane z powrotem do mózgu Siła i elastyczność mięśni, pozycja uchwytu pióra i ogólna postawa pisarza wpływają na wyjście Stan psychiczny podczas pisania, rodzaj powierzchni itp również mogą na nie wpływać Tak więc, każda osoba ma mały zakres naturalnej zmienności Ogólna charakterystyka lub cechy klas Ogólne: Wpływ kultury, trendów, stylu nauczyciela itp Klasa: świadome / nieświadome poszczególne zmiany Aksjomat Jest mało prawdopodobne, aby kiedykolwiek powielać dokładnie każdy podpis
Cechy mówiące o indywidualności 8/26
Podejścia Statyczne/Offline wczesne 197 s Tylko obraz podpsiu Bez specjalnego sprzętu, uzycie w każdej sytuacji Dużo danych Brak mozliwości śledzenia prędkości, stylu, nacisku Łatwiejsze do sfałszowania Dokładność ok. 95% Dynamiczne/Online wczesne 199 s Używa kształtu, prędkości, nacisku Wymaga specjalnej powierzchni, cyfrowego pióra itp. Dane w formie numerycznej, mała objętość Wykorzystuje analize prędkosci, kata nachylenia pióra, nacisku do oceny indywidualnych cech Dokładność ok. 99% Trudniejsze do sfałszowania 9/26
Urządzenia Technologia Sensory wrażliwe na nacisk zorganizowane w postaci regularnej siatki na płaskiej powierzchni W momencie nacisku przez pióro, siła nacisku jest obliczana Sensory są regularnie odczytywane w celu odnalezienia pozycji pióra Zapisywane są: nacisk, kąt nachylenia Odczyt w stałych odstępach czasu skutkuje sekwencja parametrów 1/26 SignatureGem SigLite ClipGem epad-id
Dane 11/26
Problemy Ludzie używają pełnych nazwisk, inicjałów, złozonych znaków Końcowe części podpisu zanikają, itp. Wg [Herbst99], wytrenowany ekspert posiada % FAR, 25% FRR. Niewytrenowany 5% FAR. Wg [Osborn29] wiele z charakterystyck podpisu nie mozę zostać nigdy sfałszowana Próbki podpsiu powinny być zbierane w dluższym okresie (nie podczas jednej sesji) Wg [Hilton92] najważniejszą cechą jest ruch 12/26
Pióro elektroniczne Electronic pen [LCI-SmartPen] 13/26
Tabety Digitising tablet by Wacom Technologies Digitising tablet [Hesy Signature Pad by BS Biometric Systems GmbH] 14/26
Typowy system Podpis wzorcowy: Pobieranie danych 15/26 Wstępna obróbka Ekstrakcja cech Porównywanie Metody minimalnoodległościowe Odległość pomiędzy wzorcem a podpisem testowym Jesli odległośc < prog akceptacja Ocena skuteczności Na fachowych i przypadkowych fałszerstwach Brak publicznych baz benchmarkowych
Weryfikacja podpisu ->Algorytm 1. Generowanie wzorca W praktyce mamy dostęp do niewielkiej liczby prawdziwych wzorców (zwykle nie więcej niż 6) i brak jest przykładów fałszywych podpisów 2. Porównanie na bazie wzorca Na wejściu podpis, na wyjściu poziom pewności (%- 1%) że podpis jest prawdziwy 22/26
Algorytm ->1. Generowanie wzorca Problemy: 1) Bardzo mało danych do uczenia Każda osoba - 6 podpisów 2) Wybór cech podpisu Istnieje ponad 1 cech podpisu, np.. szerokośc, wysokość, czas trwania, orientacja, wektor wsp. X, wektor wsp. Y, prędkość, krzywizna, nacisk itp. 23/26
Algorytm ->1. Generowanie wzorca Badania pokazują, że: 1) Najbardziej pewną cechą jest kształt podpisu 2) Kolejną pewną cechą jest prędkość pisania 3) Inne cechy nie są stabilne Aby zapisać kształt i prędkość, stosuje się sekwencję trójwy iar ową Sig i =[X i, Y i, V i ], gdzie V i to prędkość 24/26
Cechy Sekwencja wsp. X i Y 3 2 1-1 2.5 2 1.5 1.5 -.5-1 -1.5-2 2 4 6 8 1 12 14 16 18 3 2 1-1 -2-2 -3-2 -1.5-1 -.5.5 1 1.5 2 2.5 Oryginalny podpis -3 2 4 6 8 1 12 14 16 18 Projekcja wsp. X Projekcja wsp. Y 25/26
Porównywanie wzorca Porównanie cech 2.5 2 1.5 1.5 -.5-1 -1.5-2 2 4 6 8 1 12 14 16 18 X (oryginał) 3 2 1 2 1.5 1.5 -.5-1 -1.5-2 2 4 6 8 1 12 14 16 18 X (fałszywy) 2.5 2 1.5 1.5-1 -.5-2 -1-3 -2-1.5-1 -.5.5 1 1.5 2 2.5-1.5 26/26 Podpis -2-2 -1.5-1 -.5.5 1 1.5 2 Podpis
Porównywanie wzorca Inne cechy Pozycja X i Y mogą być niewystarczające. Mozna stosować dane przestrzenne opisujące kształt krzywizny podpisu, momenty, cechy krzywizny bazujące na elipsach itp. 5 4 3 2 1-1 -2-3 2 4 6 8 1 12 14 16 18 3.5 3 2.5 2 1.5 1.5 -.5 2 4 6 8 1 12 14 16 18 Moment oryginału Moment fałszywego podpisu Widoczne różnice! 27/26
Inne cechy Krzywizna elipsy -.1 -.2 -.3 -.4 -.5 -.6 -.7 -.8 -.9-1 2 4 6 8 1 12 14 16 18 S1 (oryginał) 1.3 1.2 1.1 1.9.8 -.6 -.65 -.7 -.75 -.8 -.85 -.9 -.95-1 2 4 6 8 1 12 14 16 18 S1 (fałszerstwo) 1.15 1.1 1.5 1.7.95.6.9.5.85 28/26.4 2 4 6 8 1 12 14 16 18 S2 (oryginał).8 2 4 6 8 1 12 14 16 18 S2 (fałszerstwo)
Porównywanie W obrębie segmentów 29/26
Algorytm ->2. Porównywanie Regresja liniowa 4 3 2 1-1 - 2 5 1 1 5 2 2 5 3 3 5 4 4 3 5 3 2 5 2 1 5 1 5-5 5 1 1 5 2 2 5 3 3 5 4 2 1 5 1 5-5 -1-1 5-2 5 1 1 5 2 2 5 3 3 5 4 3 5 3 2 5 2 1 5 1 5-5 5 1 1 5 2 2 5 3 3 5 4 4 3 2 1-1 -2 4 3 5 3 2 5 2 1 5 1 5-5 - 2-1 5-1 -5 5 1 1 5 2-5 5 1 1 5 2 2 5 3 3 5 Podobieństwo: 91% Podobieństwo: 31% 3/26
Algorytm ->2. Porównywanie Prosta regresja liniowa Zalety: niewrażliwa na zmiany skali i przesunięcia Wada: porównywanie 1-do-1 S1 S2 S2 S1 1-1 Dynamiczna 31/26
Algorytm ->2. Regresja dynamiczna Regresja dynamiczna (DTW) Ścieżka DTW to macierz n x m o minimalnym koszcie skumulowanym. Zaznaczony obszar to ograniczenie Y [ y, y2, y2,... y 1 m X [ x, x2, x3,... x 1 n ( y 2 pasuje do x 2, x 3, więc Y powiększa się o 2 elementy) Podobienswo=regresja(Y, X ) ] ] 32/26