Biometryczna Identyfikacja Tożsamości

Podobne dokumenty
Biometryczna Identyfikacja Tożsamości

BIOMETRIA WYKŁAD 8: BŁĘDY SYSTEMOW BIOMETRYCZNYCH

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Statystyka matematyczna dla leśników

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Wydział Matematyki. Testy zgodności. Wykład 03

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Testowanie hipotez statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych

Hipotezy statystyczne

Testowanie hipotez statystycznych

Hipotezy statystyczne

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

166 Wstęp do statystyki matematycznej

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Wykład 3 Hipotezy statystyczne

Statystyka Matematyczna Anna Janicka

Testowanie hipotez statystycznych

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Testowanie hipotez statystycznych.

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Statystyka matematyczna i ekonometria

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Wnioskowanie statystyczne. Statystyka w 5

STATYSTYKA MATEMATYCZNA

Weryfikacja hipotez statystycznych

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Statystyka matematyczna i ekonometria

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

STATYSTYKA

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych cd.

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Spis treści 3 SPIS TREŚCI

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

PDF created with FinePrint pdffactory Pro trial version

Testowanie hipotez statystycznych. Wprowadzenie

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

STATYSTYKA INDUKCYJNA. O sondażach i nie tylko

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO czȩść II

Biometryczna Identyfikacja Tożsamości

Prawdopodobieństwo i rozkład normalny cd.

METODY STATYSTYCZNE W BIOLOGII

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Własności statystyczne regresji liniowej. Wykład 4

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Weryfikacja hipotez statystycznych

Testowanie hipotez cz. I

Estymacja punktowa i przedziałowa

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

Definicje PN ISO Definicje PN ISO 3951 interpretacja Zastosowanie normy PN-ISO 3951:1997

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Kolokwium ze statystyki matematycznej

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Weryfikacja hipotez statystycznych

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska

Pobieranie prób i rozkład z próby

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

WNIOSKOWANIE STATYSTYCZNE

IV WYKŁAD STATYSTYKA. 26/03/2014 B8 sala 0.10B Godz. 15:15

Transkrypt:

c Adam Czajka IAiIS PW 3 czerwca 2014 1/49 Adam Czajka Wykład na Wydziale Elektroniki i Technik Informacyjnych Politechniki Warszawskiej Semestr letni 2014

c Adam Czajka IAiIS PW 3 czerwca 2014 2/49 Problem ewaluacji w biometrii Modelowanie niepewności Ocena procesów pozyskiwania próbek i rejestracji Ocena zgodności próbek Ocena systemów biometrycznych Ocena rozrzutu parametrów Wybrane uwagi praktyczne

c Adam Czajka IAiIS PW 3 czerwca 2014 3/49 Problem ewaluacji w biometrii Problem ewaluacji w biometrii Modelowanie niepewności Ocena procesów pozyskiwania próbek i rejestracji Ocena zgodności próbek Ocena systemów biometrycznych Ocena rozrzutu parametrów Wybrane uwagi praktyczne

c Adam Czajka IAiIS PW 3 czerwca 2014 4/49 Problem ewaluacji w biometrii Problem ewaluacji systemów biometrycznych Zaprojektowaliśmy i wykonaliśmy system biometryczny (urządzenia, algorytmy, procesy decyzyjne, itd.). Jesteśmy z niego dumni :-) Znaleźliśmy odbiorcę, i niedługo nadejdzie czas przekazania systemu. Jakie pytania będą (powinny) nas nurtować?

c Adam Czajka IAiIS PW 3 czerwca 2014 5/49 Problem ewaluacji w biometrii Problem ewaluacji systemów biometrycznych 1. Pomiary własności istot żywych niepewność: jak uwzględnić niepewność w opisie działania? 2. Ocena jakości systemu bazuje na eksperymencie: jaki eksperyment należy wykonać? 3. Decyzje zależą od progów decyzyjnych (odrzucanie próbek złej jakości, odrzucanie deklarowanych tożsamości): jakie powinny być wartości tych progów? 4. Eksperymenty wymagają biometrycznych baz danych: jaka powinna być liczność próbek w takiej bazie? 5. Wyliczyłem podstawowe parametry systemu (np. EER): jakie poziomy błędów mogę gwarantować mojemu odbiorcy?

c Adam Czajka IAiIS PW 3 czerwca 2014 6/49 Problem ewaluacji w biometrii Ocena biometrii wg ISO/IEC 19795 1. Ocena technologiczna: ocena off-line jednego lub więcej algorytmu dla tej samej modalności biometrycznej przy zastosowaniu istniejącej lub specjalnie utworzonej próby 2. Ocena w scenariuszu zastosowań: ocena off-line lub on-line w której funkcjonowanie systemu biometrycznego jest oceniane dla określonego scenariusza zastosowań z określoną grupą docelową 3. Ocena w warunkach operacyjnych: ocena on-line funkcjonowania systemu w trakcie normalnej eksploatacji w warunkach, do których był zaprojektowany

Problem ewaluacji w biometrii Ocena biometrii wg ISO/IEC 19795 Ocena technologiczna 1. Ocena technologiczna: ocena off-line jednego lub więcej algorytmu dla tej samej modalności biometrycznej przy zastosowaniu istniejącej lub specjalnie utworzonej próby najczęściej ocena wybranego komponentu systemu (np. algorytmu lub urządzenia) próba ustalona, pobrana przez uniwersalny sensor wynik zależy od środowiska i populacji, z której pobrano próbę próba nie powinna być znana twórcom testowanego komponentu wyniki powtarzalne znaczne niedoszacowanie błędów w stosunku do kompletnego systemu wykorzystującego testowany komponent i pracującego w warunkach operacyjnych Przykład: ocena weryfikacji algorytmu rozpoznawania tęczówki firmy XYZ c Adam Czajka IAiIS PW 3 czerwca 2014 7/49

c Adam Czajka IAiIS PW 3 czerwca 2014 8/49 Problem ewaluacji w biometrii Ocena biometrii wg ISO/IEC 19795 Ocena w scenariuszu zastosowań 2. Ocena w scenariuszu zastosowań: ocena off-line lub on-line w której funkcjonowanie systemu biometrycznego jest oceniane dla określonego scenariusza zastosowań z określoną grupą docelową testowanie kompletnego systemu środowisko testowe bliskie planowanemu każdy system powinien mieć własny sensor konieczne to samo środowisko i populacja do porównań systemów powtarzalność pod warunkiem kontroli scenariusza zwykle niedoszacowanie błędów w porównaniu do warunków operacyjnych Przykład: ocena weryfikacji systemu rozpoznawania tęczówki na symulowanym przejściu granicznym

c Adam Czajka IAiIS PW 3 czerwca 2014 9/49 Problem ewaluacji w biometrii Ocena biometrii wg ISO/IEC 19795 Ocena w warunkach operacyjnych 3. Ocena w warunkach operacyjnych: ocena on-line funkcjonowania systemu w trakcie normalnej eksploatacji w warunkach, do których był zaprojektowany autentyczna obsługa systemu, warunki, użytkownicy, itp. warunki mogą być nienadzorowane warunki mogą się zmieniać w nieprzewidziany sposób (zalecana rejestracja zmian) brak powtarzalności wyników najlepsza ocena funkcjonowania systemu (choć nie zawsze możliwa i często kosztowna) Przykład: program pilotażowy weryfikacji tęczówki na przejściu granicznym dla osób często podróżujących

c Adam Czajka IAiIS PW 3 czerwca 2014 10/49 Modelowanie niepewności Problem ewaluacji w biometrii Modelowanie niepewności Ocena procesów pozyskiwania próbek i rejestracji Ocena zgodności próbek Ocena systemów biometrycznych Ocena rozrzutu parametrów Wybrane uwagi praktyczne

W biometrii: populacja generalna = dane wszystkich potencjalnych użytkowników badanego systemu biometrycznego próba losowa = podzbiór danych użytkowników systemu (wykorzystywany do oceny danego systemu) próbka (wynik obserwacji zmiennej losowej) = próbka biometryczna c Adam Czajka IAiIS PW 3 czerwca 2014 11/49 Modelowanie niepewności Próba losowa 1. Populacja generalnax zmienna losowa (jedno- lub wielowymiarowa), której realizacje dostarczają nam wszystkich interesujących nas informacji o badanym zjawisku 2. Próba losowax 1,...,X n zmiennej losowejx wynik wielokrotnej obserwacji (próbkowania) zm. los.x jeśli próbkix 1,...,X n są niezależne (kolejne obserwacje nie są od siebie w jakikolwiek sposób uzależnione) mówimy, że próba losowa jest prosta (ang. i.i.d. = independent and identically-distributed)

c Adam Czajka IAiIS PW 3 czerwca 2014 12/49 Modelowanie niepewności Tworzenie próby losowej w biometrii 1. Prezentacja (ang. presentation) charakterystyki biometrycznej 2. Podejście (ang. attempt) złożone z jednej lub kilku prezentacji (np. w celu doboru najlepszej) 3. Transakcja (ang. transaction) złożona z jednego lub kilku podejść (zależy od polityki systemu)

c Adam Czajka IAiIS PW 3 czerwca 2014 13/49 Modelowanie niepewności Probabilistyka i statystyka 1. Probabilistyka rozkłady prawdopodobieństwa zmiennych losowych są znane obliczanie prawdopodobieństw zdarzeń na bazie znanych rozkładów 2. Statystyka dowolna funkcja próby losowejg(x 1,...,X n ) statystyka jest zmienną losową brak założeń o pełnej znajomości rozkładów prawdopodobieństwa zmiennych losowych wyciąganie wniosków dotyczących badanej cechy w populacji generalnej na podstawie próby losowej W biometrii: statystyka = funkcja, której dziedziną są dane biometryczne (na różnym etapie przetwarzania, np. wyniki porównania wielu próbek)

c Adam Czajka IAiIS PW 3 czerwca 2014 14/49 Modelowanie niepewności Estymacja 1. Szacowanie nieznanego parametru rozkładu za pomocą wartości statystyki (konkretnej liczby) 2. Estymator: dowolna statystykaθ ˆ n =g(x 1,...,X n ), której wartości wykorzystujemy do oceny nieznanego parametruθ 3. Pożądane cechy estymatorów nieobciążoność:eˆθ=θ zgodność: ǫ>0 lim n P( ˆ θ n θ <ǫ)=1 Przykłady estymatorów w biometrii średnia arytmetycznaˆm z wyników porównań tych samych tęczówek (estymator wartości oczekiwanejmzmiennej losowejx) FNMR (częstość fałszywego niedopasowania) FMR (częstość fałszywego dopasowania)

c Adam Czajka IAiIS PW 3 czerwca 2014 15/49 Ocena procesów pozyskiwania próbek i rejestracji Problem ewaluacji w biometrii Modelowanie niepewności Ocena procesów pozyskiwania próbek i rejestracji Ocena zgodności próbek Ocena systemów biometrycznych Ocena rozrzutu parametrów Wybrane uwagi praktyczne

c Adam Czajka IAiIS PW 3 czerwca 2014 16/49 Ocena procesów pozyskiwania próbek i rejestracji Niepowodzenie pozyskania próbki ang. Failure to Acquire (FTA) 1. Powody niemożności pozyskania próbki dane biometryczne nie mogły być zaprezentowane (choroba, zranienie, prezentacja niezgodna z regułami) zawiódł algorytm lub urządzenie (przekroczenie czasu, błąd) zawiodło przetwarzanie próbki (np. segmentacja, usuwanie zakłóceń, wyznaczanie cech) wyliczone cechy nie miały wystarczającej jakości 2. Empiryczny estymator prawdopodobieństwa niemożności pozyskania próbki: częstość FTA FTA= liczba podejść zakończonych niepowodzeniem liczba wszystkich podejść

c Adam Czajka IAiIS PW 3 czerwca 2014 17/49 Ocena procesów pozyskiwania próbek i rejestracji Niepowodzenie rejestracji ang. Failure to Enroll (FTE) 1. Powody niemożności rejestracji jak dla FTA, oraz dodatkowo: próbka nie została zaakceptowana w wyniku próbnej weryfikacji 2. Empiryczny estymator prawdopodobieństwa niemożności rejestracji: częstość FTE FTE= liczba rejestracji zakończonych niepowodzeniem liczba wszystkich rejestracji 3. Surowsze wymagania na etapie rejestracji zwiększają jakość rozpoznawania (w szczególności mniejsze FMR, FNMR), ale zmniejszają liczbę zarejestrowanych wzorców (większe FTE)

c Adam Czajka IAiIS PW 3 czerwca 2014 18/49 Ocena zgodności próbek Problem ewaluacji w biometrii Modelowanie niepewności Ocena procesów pozyskiwania próbek i rejestracji Ocena zgodności próbek Ocena systemów biometrycznych Ocena rozrzutu parametrów Wybrane uwagi praktyczne

Ocena zgodności próbek Rodzaje i dopasowanie próbek 1. Rodzaje próbek biometrycznych próbki własne: pochodzące z tej samej klasy próbki obce lub fałszerstwa bezwysiłkowe: pochodzące z innej klasy w takiej formie, w jakiej zostały pozyskane fałszerstwa zaawansowane: spreparowane specjalnie, aby imitować próbkę z badanej klasy 2. Dopasowanie próbek stopień podobieństwa/niepodobieństwa lub dopasowania/niedopasowania podobieństwo = 0 próbki całkowicie niedopasowane niepodobieństwo = 0 próbki identyczne nie zawsze jest łatwe przejście między podobieństwem i niepodobieństwem 3. Decyzja dopasowanie/niedopasowanie na podstawie porównania stopnia dopasowania/niedopasowania z progiem decyzyjnym c Adam Czajka IAiIS PW 3 czerwca 2014 19/49

Ocena zgodności próbek Testowanie hipotez 1. Hipotezy hipoteza zerowa (H 0 ) o H 0 weryfikujemy o zah 0 przyjmujemy tę hipotezę, dla której chcemy szukać podstaw do jej odrzucenia o przyjęcieh 0 nie oznacza jej prawdziwości, wynika jedynie z braku podstaw do jej odrzucenia hipoteza alternatywna (H 1 ) o H 1 jesteśmy skłonni przyjąć w momencie odrzuceniah 0 2. Rozpatrujemy najprostszy przypadek H 0 ih 1 są hipotezami prostymi, czyli: o precyzują rozkłady z których losowane są próby o możemy zakładać znajomość tych rozkładów c Adam Czajka IAiIS PW 3 czerwca 2014 20/49

c Adam Czajka IAiIS PW 3 czerwca 2014 21/49 Ocena zgodności próbek Testowanie hipotez Przykłady hipotez H 0 (zerowa) prosta o tęczówka X jest tęczówką A. Czajki H 1 (alternatywna) prosta o tęczówka X jest tęczówką J. Kowalskiego o tęczówka X jest tęczówką osoby z ustalonej grupy N osób H 1 (alternatywna) złożona o tęczówka X nie jest tęczówką A. Czajki

c Adam Czajka IAiIS PW 3 czerwca 2014 22/49 Ocena zgodności próbek Testowanie hipotez 3. Test statystyczny metoda przyporządkowująca realizacjom próby losowej decyzje przyjęcia bądź odrzucenia weryfikowanej hipotezy (z ustalonym prawdopodobieństwem) 4. Statystyka testowat statystyka wykorzystywana do oceny hipotezyh 0 zbiór wartości statystykit dzielimy na dwa dopełniające się podzbiory o R: zbiór krytyczny hipotezyh 0 (H 0 odrzucamy jeślit R) o A: zbiór przyjęć hipotezyh 0 (H 0 przyjmujemy jeślit A) Przykład statystyki testowej: znormalizowana odległość Hamminga binarnych kodów tęczówki

H 0 : realizacja pochodzi z rozkładu 0 statystyka testowat ma rozkładf T (t H 0 ) H 1 : realizacja pochodzi z rozkładu 1 statystyka testowat ma rozkładf T (t H 1 ) c Adam Czajka IAiIS PW 3 czerwca 2014 23/49 Ocena zgodności próbek Testowanie hipotez

c Adam Czajka IAiIS PW 3 czerwca 2014 24/49 Ocena zgodności próbek Testowanie hipotez Podejmując decyzje zawsze popełniamy błąd hipoteza decyzja brak podstaw do odrzucenia odrzucenie prawdziwa OK (1 α) błąd I rodzaju (α) fałszywa błąd II rodzaju (β) OK (1 β) gdzie1 α: poziom istotności,1 β: moc testu

c Adam Czajka IAiIS PW 3 czerwca 2014 25/49 Ocena zgodności próbek Testowanie hipotez Błędy decyzji biometrycznych próbka zgodność z wzorcem decyzja niezgodność z wzorcem zgodna z wzorcem OK (1-FNMR) FNM (FNMR) niezgodna z wzorcem FM (FMR) OK (1-FMR) gdzie FNMR: częstość błędnych niedopasowań, FMR: częstość błędnych dopasowań

c Adam Czajka IAiIS PW 3 czerwca 2014 26/49 Ocena zgodności próbek Ocena fałszywego niedopasowania ang. False Non-Match (FNM), False Non-Match Rate (FNMR) 1. FNM: błędne uznanie próbki za niezgodną z odpowiednim wzorcem klasy przy prezentacji próbek zgodnych z wzorcem 2. FNM odpowiada błędowi I rodzaju w testowaniu hipotez statystycznych (odrzucenie hipotezy prawdziwej) 3. Empiryczny estymator prawdopodobieństwa błędnego niedopasowania próbki: częstość błędnych niedopasowań, obliczany tylko dla próbek zgodnych z wzorcami FNMR= liczba podejść uznanych za niezgodne z wzorcami liczba wszystkich podejść 4. FNMR jest funkcją progu decyzyjnego

c Adam Czajka IAiIS PW 3 czerwca 2014 27/49 Ocena zgodności próbek Ocena fałszywego dopasowania ang. False Match (FM), False Match Rate (FMR) 1. FM: błędne uznanie próbki za zgodną z odpowiednim wzorcem klasy przy prezentacji próbek niezgodnych z wzorcem 2. FM odpowiada błędowi II rodzaju w testowaniu hipotez statystycznych (akceptacja hipotezy fałszywej) 3. Empiryczny estymator prawdopodobieństwa błędnego dopasowania próbki: częstość błędnych dopasowań, obliczany tylko dla próbek obcych i fałszerstw bezwysiłkowych FMR= liczba podejść uznanych za zgodne z wzorcami liczba wszystkich podejść 4. Do wyliczania FMR nie włącza się fałszerstw zaawansowanych 5. FMR, podobnie jak FNMR, jest funkcją progu decyzyjnego

c Adam Czajka IAiIS PW 3 czerwca 2014 28/49 Ocena systemów biometrycznych Problem ewaluacji w biometrii Modelowanie niepewności Ocena procesów pozyskiwania próbek i rejestracji Ocena zgodności próbek Ocena systemów biometrycznych Ocena rozrzutu parametrów Wybrane uwagi praktyczne

c Adam Czajka IAiIS PW 3 czerwca 2014 29/49 Ocena systemów biometrycznych Różnice w ocenie podejścia i transakcji 1. Ocena systemu polega na badaniu transakcji a nie pojedynczych podejść 2. Ocena dotyczy całego systemu, zatem powinna uwzględniać: możliwość niepozyskania próbki FTA (wtedy próba weryfikacja kończy się odrzuceniem) politykę decyzyjną systemu, w tym liczbę dopuszczalnych podejść dla każdej transakcji 3. Transakcję będziemy nazywać autentyczną, jeśli prezentowana próbka pochodzi z rozpatrywanej klasy; w przeciwnym razie nazwiemy ją fałszywą

c Adam Czajka IAiIS PW 3 czerwca 2014 30/49 Ocena systemów biometrycznych Ocena systemów weryfikacji Częstość fałszywego odrzucenia (ang. False Rejection Rate (FRR)) 1. FR: fałszywe odrzucenie (ang. false rejection); odrzucenie autentycznej transakcji, tzn. negatywna weryfikacja próbki pochodzącej z właściwej klasy 2. Empiryczny estymator prawdopodobieństwa błędnego odrzucenia próbki to częstość błędnych odrzuceń: FRR= liczba odrzuconych autentycznych transakcji liczba wszystkich transakcji 3. FRR jest funkcją polityki decyzyjnej; np. dla systemu z jednym podejściem w transakcji: FRR = FTA + (1-FTA) FNMR

c Adam Czajka IAiIS PW 3 czerwca 2014 31/49 Ocena systemów biometrycznych Ocena systemów weryfikacji Częstość fałszywej akceptacji (ang. False Acceptance Rate (FAR)) 1. FA: fałszywa akceptacja (ang. false acceptance); akceptacja fałszywej transakcji, tzn. pozytywna weryfikacja próbki pochodzącej z innej klasy 2. Empiryczny estymator prawdopodobieństwa błędnej akceptacji próbki to częstość błędnych akceptacji: FAR= liczba zaakceptowanych fałszywych transakcji liczba wszystkich transakcji 3. FAR, podobnie jak FRR, jest funkcją polityki decyzyjnej; np. dla systemu z jednym podejściem w transakcji: FAR = (1-FTA) FMR 4. W obliczaniu FAR nie uwzględnia się niepozyskanych próbek

c Adam Czajka IAiIS PW 3 czerwca 2014 32/49 Ocena systemów biometrycznych Ocena systemów weryfikacji Krzywa ROC (ang. Receiver Operating Characteristic) 1. Pierwotnie wykorzystywana do analizy sygnałów radarowych podczas II wojny światowej; obecnie często wykorzystywana w analizie testów medycznych 2. Połączenie estymatorów FAR i FRR (lub FMR i FNMR) w jedną krzywą parametryczną (parametrem jest wartość progu)

c Adam Czajka IAiIS PW 3 czerwca 2014 33/49 Ocena systemów biometrycznych Ocena systemów weryfikacji Krzywa ROC (ang. Receiver Operating Characteristic) Pole pod krzywą ROC to miara jakości klasyfikacji (w szczególności 1.0 dla idealnego klasyfikatora, 0.5 dla klasyfikatora losowego)

c Adam Czajka IAiIS PW 3 czerwca 2014 34/49 Ocena systemów biometrycznych Ocena systemów weryfikacji Krzywa DET (ang. Detection Error Tradeoff) Wartości estymatorów błędów wyrażone w skali odwrotnej dystrybuanty rozkładu normalnego (ang. normal deviate scale)

c Adam Czajka IAiIS PW 3 czerwca 2014 35/49 Ocena systemów biometrycznych Ocena systemów weryfikacji Własności DET 1. Dla rozkładów normalnych: proste na diagramie DET 2. Nachylenie prostych: iloraz wariancji rozkładów 3. Odległość prostych: różnica wartości średnich rozkładów 4. Dla klasyfikatora losowego zmiennych losowych o rozkładzie normalnym (o tych samych parametrach) DET jest prostą FAR=1-FRR (lub FMR=1-FNMR)

c Adam Czajka IAiIS PW 3 czerwca 2014 36/49 Ocena systemów biometrycznych Ocena systemów weryfikacji Porównanie ROC i DET dla tych samych ocen (przykład)

Ocena systemów biometrycznych Ocena systemów identyfikacji 1. Systemy zamknięte: wszyscy potencjalni użytkownicy zostali zarejestrowani częstość identyfikacji rzędur: stosunek liczby transakcji, w których zarejestrowany użytkownik znalazł się na liście najlepszychrkandydatów do liczby transakcji 2. Systemy otwarte: nie wszyscy potencjalni użytkownicy zostali zarejestrowani częstość identyfikacji rzęduroraz dodatkowo: częstość fałszywie negatywnej identyfikacji (ang. False Negative Identification Rate FNIR): proporcja transakcji identyfikacyjnych użytkowników zarejestrowanych, dla których właściwego identyfikatora nie ma na liście kandydatów częstość fałszywie pozytywnej identyfikacji (ang. False Positive Identification Rate FPIR): proporcja transakcji identyfikacyjnych użytkowników niezarejestrowanych, dla których lista kandydatów nie jest pusta c Adam Czajka IAiIS PW 3 czerwca 2014 37/49

c Adam Czajka IAiIS PW 3 czerwca 2014 38/49 Ocena systemów biometrycznych Ocena systemów identyfikacji Skumulowana charakterystyka dopasowania CMC (ang. Cumulative Match Characteristic): częstość identyfikacji rzędurwfunkcjir

c Adam Czajka IAiIS PW 3 czerwca 2014 39/49 Ocena rozrzutu parametrów Problem ewaluacji w biometrii Modelowanie niepewności Ocena procesów pozyskiwania próbek i rejestracji Ocena zgodności próbek Ocena systemów biometrycznych Ocena rozrzutu parametrów Wybrane uwagi praktyczne

c Adam Czajka IAiIS PW 3 czerwca 2014 40/49 Ocena rozrzutu parametrów Estymacja przedziałowa Pojęcie przedziału ufności 1. Estymator przedziałowy wyznaczają dwie zmienne losowe 2. Przedziały ufności otrzymane wartości estymatora przedziałowego na podstawie obserwacji próby końceθ 1,θ 2 przedziału ufności dla nieznanego parametruθsą funkcjami próby losowej, tzn.θ 1 =g 1 (X 1,...,X n ), θ 2 =g 2 (X 1,...,X n ) i nie zależą odθ prawdopodobieństwo pokrycia przez przedział θ 1,θ 2 szacowanego parametru θ wynosi 1 α (α to poziom istotności) uwaga: nie jest prawdą, żeθleży w ˆθ 1,ˆθ 2 obliczonym dla jednej obserwacji próby losowej z prawdopodobieństwem1 α

c Adam Czajka IAiIS PW 3 czerwca 2014 41/49 Ocena rozrzutu parametrów Estymacja przedziałowa Pojęcie przedziału ufności

Ocena rozrzutu parametrów Estymacja przedziałowa w biometrii Maksymalne prawdopodobieństwo popełnienia błędu 1. Niezależne wyniki porównań biometrycznych, przy niezmiennym, danym prawdopodobieństwie porażkip e można traktować jak próby Bernoulliego 2. Prawdopodobieństwo zaobserwowania don e błędów w próbie N c elementowej P(ξ N e )= N e n=0 N c! n!(n c n)! pn e(1 p e ) Nc n 3. Granicap + e przedziału ufności oraz założony poziom istotności α wiąże więc równanie N e n=0 N c! n!(n c n)! (p+ e) n (1 p + e) Nc n =α c Adam Czajka IAiIS PW 3 czerwca 2014 42/49

c Adam Czajka IAiIS PW 3 czerwca 2014 43/49 Ocena rozrzutu parametrów Estymacja przedziałowa w biometrii Maksymalne prawdopodobieństwo popełnienia błędu 4. Nie zaobserwowaliśmy błędu (z próby). Jaki jest najniższy, gwarantowany statystycznie dla założonegoα, błąd dla systemu biometrycznego? PrzyjmującN e =0 otrzymujemy: (1 p + e) Nc =α czyli N c ln(1 p + e)=ln(α) Przyjmując przykładowo 95% poziom ufności (α=0.05), zakładając, że ln(0.05) 3 oraz, że dla małychp + e otrzymujemy ln(1 p + e) p + e p + e = 3 N c (tzw. reguła trzech )

c Adam Czajka IAiIS PW 3 czerwca 2014 44/49 Ocena rozrzutu parametrów Estymacja przedziałowa w biometrii Maksymalne prawdopodobieństwo popełnienia błędu 5. Dla porównań zależnych, bądź w sytuacji zmiennegop e dla populacji testowej, nie możemy traktować wyników porównań jako prób Bernoulliego 6. Kiedy wyniki porównań w biometrii są zależne? te same obiekty uczestniczą w wielu porównaniach podczas szacowania wartości błędu FA (np. porównania krzyżowe, ang. cross-comparisons) wykonujemy wielokrotne próby dla tego samego użytkownika podczas szacowania błędu FR (np. użytkownik nie podejmuje prób po udanej weryfikacji, podejmuje natomiast kolejną próbę po odrzuceniu go przez system)

c Adam Czajka IAiIS PW 3 czerwca 2014 45/49 Wybrane uwagi praktyczne Problem ewaluacji w biometrii Modelowanie niepewności Ocena procesów pozyskiwania próbek i rejestracji Ocena zgodności próbek Ocena systemów biometrycznych Ocena rozrzutu parametrów Wybrane uwagi praktyczne

c Adam Czajka IAiIS PW 3 czerwca 2014 46/49 Wybrane uwagi praktyczne Zasady wykorzystania biometrycznych baz danych 1. Podział bazy danych na rozłączne zbiory: estymacyjny: do estymacji parametrów metod testowy: do przeprowadzania ewaluacji 2. Istnieje wiele możliwych podziałów bazy staramy się, aby wynikowe porównania były niezależne wymaga dużych zbiorów przy małych zbiorach lepiej analizować więcej zmiennych zależnych niż zbyt mało niezależnych właściwe metody statystyczne dla zbyt małych zbiorów, np. boostrap

c Adam Czajka IAiIS PW 3 czerwca 2014 47/49 Wybrane uwagi praktyczne Zasady wykorzystania biometrycznych baz danych Przykłady podziału bazy danych biometrycznych

Projektowanie rozpoznawania biometrycznego 1. EER nie najważniejsze punkt pracy wykorzystywany często w ocenie laboratoryjnej komponentów rozwiązania, rzadko w ocenie systemów komercyjnych najczęściej w testach wyliczana wartość FRR przy założonym poziomie FAR (zwykle niskim, np. FAR=0.001) 2. Różne punkty pracy systemu w zależności od zastosowania systemy o wysokim stopniu bezpieczeństwa: nacisk na małe wartości FAR (kosztem FRR) przeciwnie dla systemu o dużym stopniu wygody użytkowania: chęć zmniejszania FRR (kosztem FAR) metody testujące żywotność obiektów: małe FRR (dowolne FAR) ze względu na niemożność modelowania rozkładów dla fałszerstw zaawansowanych, oraz większe (z punktu widzenia odbioru technologii) konsekwencje zwiększania FRR niż ewentualnej próby fałszerstwa (dla niektórych systemów mało prawdopodobnego) c Adam Czajka IAiIS PW 3 czerwca 2014 48/49 Wybrane uwagi praktyczne

c Adam Czajka IAiIS PW 3 czerwca 2014 49/49 Co powinniśmy zapamiętać 1. Rodzaje ocen systemów biometrycznych 2. Podstawowe własności ocen technologicznych, ocen w scenariuszu i ocen w warunkach operacyjnych 3. Co to jest FTE, FTA i jak to policzyć? 4. Co to jest FMR i FNMR i czym różnią się od FAR i FRR? 5. Czy częstości FTE oraz FTA wpływają na FMR, FNMR, FAR lub FRR? 6. Co to jest krzywa ROC i krzywa DET? 7. Jak można scharakteryzować jakość systemu weryfikacji? 8. Jak można scharakteryzować jakość systemu identyfikacji (otwartego, zamkniętego)?