Psychofizyka. Pomiary detekcji sygnałów Porównanie modeli

Podobne dokumenty
Prawdopodobieństwo i rozkład normalny cd.

Statystyka matematyczna dla leśników

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Psychofizyka. Funkcje psychometryczne

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Wykład 9 Wnioskowanie o średnich

Psychometria PLAN NAJBLIŻSZYCH WYKŁADÓW. Co wyniki testu mówią nam o samym teście? A. Rzetelność pomiaru testem. TEN SLAJD JUŻ ZNAMY

Testowanie hipotez statystycznych cd.

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

STATYSTYKA MATEMATYCZNA, LISTA 3

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Testowanie hipotez statystycznych

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Hipotezy statystyczne

Hipotezy statystyczne

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Testowanie hipotez statystycznych.

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

SMOP - wykład. Rozkład normalny zasady przenoszenia błędów. Ewa Pawelec

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

Zadania ze statystyki cz.8. Zadanie 1.

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Prawdopodobieństwo i statystyka r.

Pobieranie prób i rozkład z próby

Weryfikacja hipotez statystycznych

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

METODY STATYSTYCZNE W BIOLOGII

Rozkłady statystyk z próby

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem.

Testy nieparametryczne

Zadania ze statystyki, cz.6

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

KORELACJE I REGRESJA LINIOWA

METODY STATYSTYCZNE W BIOLOGII

STATYSTYKA MATEMATYCZNA

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Psychofizyka. Klasyfikacja eksperymentów psychofizycznych

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

METODY STATYSTYCZNE W BIOLOGII

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Rozkład Gaussa i test χ2

STATYSTYKA MATEMATYCZNA

Jeśli powyższy opis nie jest zrozumiały należy powtórzyć zagadnienie standaryzacji zanim przejdzie się dalej!

Wydział Matematyki. Testy zgodności. Wykład 03

Sprawdzenie narzędzi pomiarowych i wyznaczenie niepewności rozszerzonej typu A w pomiarach pośrednich

Próbkowanie. Wykład 4 Próbkowanie i rozkłady próbkowe. Populacja a próba. Błędy w póbkowaniu, cd, Przykład 1 (Ochotnicy)

LISTA 4. 7.Przy sporządzaniu skali magnetometru dokonano 10 niezależnych pomiarów

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Statystyka matematyczna i ekonometria

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

WNIOSKOWANIE STATYSTYCZNE

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

Kolokwium ze statystyki matematycznej

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Wykład 3 Hipotezy statystyczne

Ważne rozkłady i twierdzenia

Sterowanie wielkością zamówienia w Excelu - cz. 3

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Weryfikacja hipotez statystycznych testy dla dwóch zbiorowości

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Metody Statystyczne. Metody Statystyczne.

Prawdopodobieństwo i statystyka

PDF created with FinePrint pdffactory Pro trial version

Testowanie hipotez statystycznych. Wprowadzenie

5 Błąd średniokwadratowy i obciążenie

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Metodologia badań psychologicznych. Wykład 12. Korelacje

Transkrypt:

Psychofizyka Pomiary detekcji sygnałów Porównanie modeli

Czym jest Teoria Detekcji Sygnałów (SDT)? W wielu przypadkach badań wydajnościowych proporcja poprawnych odpowiedzi (Pc) jest niewłaściwą lub nieinformacyjną wielkością Inną możliwością jest pomiar wielkości d (d prim) separacji rozkładów szumu dwóch bodźców wyrażonej w jednostkach odchylenia standardowego Model SDT próbuje wyjaśnić kształt PF wiążącej Pc z wartością bodźca. Obecność wewnętrznego szumu albo niepewności powoduje, że bodziec nie jest reprezentowany w mózgu jako pojedynczy punkt w przestrzeni bodźców, lecz jako losowa próbka z rozkładu zchcarakteryzowanego średnią i wariancją

N, m i M Próby tak/nie N=1 (jeden bodziec prezentowany w próbie) m= (dwie możliwe odpowiedzi) M=1 (jedna alternatywa bodźca) Próby takie samo/różne N= lub 4 (w zależności czy porównujemy jedną parę odpowiadając takie samo/różne, czy pary odpowiedając pierwsza/druga) m= (dwie możliwości odpowiedzi) M= (dwie alternatywy bodźca) Prawdopodobieństwa zgadywania γ = 1/m Próby z wymuszonym wyborem M-AFC lub M-IFC

Relacje między M, N i m w różnych ekperymentach psychofizycznych

Zalety pomiaru d Pomiar d może ujednolicić wyniki eksperymentów przeprowadzanych za pomocą różnych procedur M- AFC, dla których różna jest niepewność zgadywania Linearyzuje zależność od wartości bodźca Ułatwia porównywanie wydajności psychofizycznej w zależności od jakiegoś wymiaru (np. wieku)

Wartości Z i prawdopodobieństwa Standardowy rozkład normalny jest unormowanym rozkładem wyrażonym w jednostkach odchylenia standardowego (wartościach z)

Obliczanie d z wartości Pc dla M-AFC Założenia Brak uprzedzeń (bezstronność) obserwatora Wewnętrzna reprezentacja bodźców ma charakter rozkładu normalnego o stałej wariancji Rozważamy dwie reprezentacje braku bodźca (N) oraz obecności bodźca (S+N) Można także rozważyć bodźca (S1 i S) W każdej próbie reprezentacja wewnętrzna jest losową próbką z rozkładów

Strategia obserwatora Wybiera alternatywę o reprezentacji wewnętrznej o najwyższej wartości zasada decyzyjna Jak dobrze (z jaką wydajnością) taka zasada pozwoli odpowiadać obserwatorowi zmierzymy przez wartości Pc Wydajność będzie tym lepsza im bardziej odseparowane będą rozkłady N i S+N W przypadku ich pełnego odseparowania Pc=1 W przypadku ich pełnego pokrycia Pc=1/m Stopień odseparowania będzie zależał od wartości średnich N i S+N oraz odchylenia standardowego σ Standaryzując rozkłady (wyrażając w jednostkach z) różnica średnich będzie wartości d

Obliczanie Pc z d Załóżmy, że wartość zmysłowa bodźca S+N wynosi t Prawdopodobieństwo, że wartość zmysłowa dla bodźca N będzie niższa (prawidłowa odpowiedź) wyniesie Φ(t) w przypadku jednego źródła szumu (AFC) i Φ(t) M-1 w przypadku M-1 żródeł (M-AFC) Aby obliczyć wartość Pc dla każdej możliwej wartości zmysłowej danego bodźca musi obliczyć całkę:

Obliczanie d dla 1AFC Rozważmy próbę tak/nie, która jest skłonna do wykazywania uprzedzeń Jeśli pionowa linia oznacza kryterium, szary obszar gwarantować będzie odpowiedź tak : pf to proporcja błędów (fałszywych alarmów) ph to proporcja trafień

Obliczanie d dla 1AFC Oznaczmy jako c pozycję linii kryterium pf ph 1 1 c c c d d c z z pf ph c c d d z ph zpf

Obliczanie kryterium C dla 1AFC Kryterium określamy w jednostkach z Wysoka wartość oznacza kryterium restrykcyjne (mało trafień i mało błędów) Niska wartość oznacza luźne kryterium (dużo trafień i dużo błędów) Wartość kryterium zależy od wartości dla której przyjmiemy z=0 Konwencja określa że z=0 w połowie odległości między rozkładami S i S+N

Obliczanie kryterium C dla 1AFC Kryterium jest usytuowane dla bodźców N i S+N odpowiednio w punktach d d C z1 pf zpf C C z 1 ph zph z pf zph d d Ujemne C oznacza preferowanie odpowiedzi tak zaś dodatnie odpowiedzi nie

Obliczanie kryterium ln β dla 1AFC Inną metodą pomiaru kryterium jest logarytm naturalny stosunku wysokości dwóch rozkładów w punkcie C: Po uwzględnieniu funkcji Gaussa w powyższym wzorze otrzymujemy ln pf zph Cd Funkcja ta ma podobne właściwości do C z

Kryterium C Kryterium można też mierzyć jako stosunek C do d :

Obliczanie Pc max dla 1AFC Najwyższe Pc jest osiągane w ekperymencie 1AFC gdy obserwator jest nieuprzedzony (C=0) W takim przypadku z(ph)=-z(pf) i d =z(ph) z czego: Pc max d

Alternatywna metoda obliczenia d dla nieuprzedzonej próby AFC AFC- pokazujemy dwa bodźce i prosimy o wskazanie tego o większej wartości Obserwator więc mierzy różnicę między sygnałami S+N i N i jeśli jest dodatnia wskazuje poprawnie Różnica dwóch rozkładów normalnych o tej samej wariancji i średniej odpowiednio w 0 i d jest rozkładem normalnym o średniej równej d i wariancji równej (odchylenie standardowe ) Pc będzie szarym obszarem na wykresie: d Pc z czego: d' z Pc

Obliczanie d dla uprzedzonej próby AFC Weźmy pod uwagę próbę IFC z bodźcami X1 i X Jeśli obserwator jest uprzedzony (preferuje którąś z odpowiedzi) kryterium nie będzie równe zero i X1-X będzie większe lub mniejsze od C Aby obliczyć d należy sklasyfikować odpowiedzi w kontekście trafień i błędów (ph/pf) d C zph d C zpf z d ph zpf

Pozostałe parametry dla AFC C ln z z pf zph Wyrażenie na lnβ jest identyczne jak dla próby 1AFC (w liczeniu z definicji używamy rozkładów dla bodźców X1 i X, a nie dla różnic) Pc pf zph max d Cd

Próby takie samo/inne (AFC) Oznaczmy bodźce jako S1 i S Bodźce są ponadprogowe a obserwator nie musi widzieć czym się różnią Zakładamy że bodźce powodują powstanie wartości zmysłowych o rozkładzie normalnym Najlepszą strategią obserwatora jest porównanie wartości bodźców w obu parach Obserwator wybiera pierwszą parę jeśli różnica bezwzględna jest w niej większa X1-X > X3-X4

Obliczanie d dla prób takie Obserwator odpowiada 1 jeśli sygnał wewnętrzny znajdzie się w szarym obszarze Jest to odpowiedź prawidłowa jeśli przedstawiona była jedna z konfiguracji bodźców <S1,S,S1,S1>, <S1,S,S,S>, <S,S1,S1,S1>, <S,S1,S,S> Pc jest więc prawdopodobieństwem, że bodźce w powyższych konfiguracjach znajdą się w szarych obszarach Okręgi oznaczają rozłączne rozkłady podobieństwa o odchyleniu standardowym samo/inne (AFC)

Obliczanie d dla prób takie W każdym szarym obszarze mamy dwa prawdopodobieństwa: duże i małe Duże oznacza przypadki, gdy różnica bodźców odpowiada różnicy wartości wewnętrznych Małe oznacza przypadki, gdy różnica bodźców jest błędnie zostanie odczytana ale na tyle mocno, że i tak zostanie wskazana prawidłowa para d d Pc 1 Pc 1 d z samo/inne (AFC)

Model różnicowy (1AFC) Pokazujemy bodźce X1 i X i badany odpowiada że są różne jeśli X-X1 >k, gdzie k jest kryterium Jeśli bodziec S jest większy od bodźca S1 to z dużym prawdopodobieństwem badany stwierdzi, że X-X1>k, lecz istnieje też małe prawdopodobieństwo, że na skutek próbkowania stwierdzi, ze X1-X>k, a więc także poda prawidłową odpowiedź

Model różnicowy (1AFC) pf z k k pf k d k d ph

Metoda niezależnej obserwacji (1AFC) Najlepszą strategią przy próbie takie samo/różne z jedną parą bodźców jest odpowiadać różne gdy sygnały z bodźców S1 i S lezą po różnych stronach kryterium wyśrodkowanego pomiędzy rozkładami wartości zmysłowych dla tych bodźców Maksymalne Pc dla takiego kryterium będzie wynosiło: d Pc 1 d z z C ph zpf d Pc 1

Dopasowanie do wzorca Model niezależnej obserwacji (AFC) Model różnicowy (AFC) M-AFC (strategia różnicowa) Metoda Monte-Carlo losujemy wartość z bodźca wzorcowego (S1) i wzorca pasującego (S) oraz M-1 wartości z pozostałych bodźców porównywanych(si), jeśli różnica dla S1-S jest mniejsza od dowolnego S1- Si to próba określana jest jako poprawna, po wielu powtórzeniach otrzymujemy Pc

przerwa

Porównania modeli Wyniki badań psychofizycznych często różnią się między sobą z powodu różnic w warunkach ich przeprowadzania Niezbędne są więc kryteria oceny czy różnice te są rzeczywiste czy nie Aby ocenić czy zmienna X ma wpływ na wydajność jakiejś próby Adaptacja (w miarę obserwacji bodźca, między bodźcami) Szybkość przemieszczania bodźca Barwa bodźca Wielkość przestrzenna bodźca Itp

Adaptacja a wydajność? Czy różnice wynikają z wpływu adaptacji na wydajność czy też z niepewności pomiarowej? Wnioskowanie statystyczne Nie interesuje nas wydajność lecz jej zależność od adaptacji

Odchylenie standartowe

Odchylenie standartowe 68% pewności, że prawdziwa wartość mieści się w zakresie +/- σ 95% pewności jeśli zwiększymy zakres do +/- 1,96σ Jeśli punkty dla różnych wartości zmiennej X nie pokrywają się w ramach swoich odchyleń standartowych mało prawdopodobne jest aby ich różnice wynikały z niepewności pomiarowej

Stosunek podobieństw modele: 1PF: Wydajność (czułość na kontrast) nie zależy od adaptacji, wystarczy jedna PF do opisu danych niezależnie od wartości zmiennej X PF: dla każdej wartości zmiennej X (adaptacji) należy dopasować inną PF Dodatkowo zakładamy stabilność (wydajność nie zależy od numeru próby) oraz niezależność (wydajność nie zależy od poprzednich odpowiedzi) Zakładamy też że parametry γ (wsp. zgadywania) i λ (wsp. rozproszeń) są stałe oraz że PF ma kształt funkcji logistycznej

Modele Model PF jest pełniejszy (obejmuje mniejszą ilość warunków ograniczających restrykcji) Model 1PF jest węższy (obejmuje jeden warunek ograniczający więcej) Mówimy, że model węższy jest zagnieżdżony w modelu pełniejszym ponieważ stanowi jego szczególny przypadek

LR stosunek podobieństw Oba modele dopasowujemy metodą ML i porównujemy otrzymane podobieństwa

Stosunek podobieństw Stosunek podobieństw zawarty jest w zakresie 0-1, ponieważ model pełniejszy zawsze lepiej będzie opisywał dane dwie funkcje zawsze lepiej będą pasować niż jedna, chyba że obie serie danych są identyczne Współczynnik LR określa prawdopodobieństwo że model węższy określa prawidłowo PF obserwatora

LR stosunek podobieństw Symulacja daje LR na poziomie 63,6%

Stosunek podobieństw Wykonajmy wiele symulacji zakładając model węższy i sprawdźmy ile z nich będzie pasować gorzej niż dane od obserwatora Zgodnie z LR powinno to być 0,1% Po przeprowadzeniu 10000 prób 4 okazują się dawać LR gorsze od obserwatora, więc hipotezę o modelu węższym możemy odrzucić

Stosunek podobieństw

Logika Jeśli mniej prawdopodobieństwo dopasowania gorszego niż rzeczywiste jest mniejsze od 5% można stwierdzić, że dodatkowe założenie modelu węższego jest niesłuszne w stosunku do danych Jest to podobna sytuacja do zdań: Jeśli pamiętałby że dzisiaj jest nasza rocznica prawdopodobnie powiedziałby coś teraz. Jeśli nic dotąd nie powiedział prawdopodobnie zapomniał, że dziś jest nasza rocznica. Jeśli prostszy model byłby prawdziwy, stosunek podobieństw prawdopodobnie nie byłby tak mały jak jest. Jeśli jest tak mały jak jest to prawdopobnie prostszy model jest nieprawdziwy.

Inne porównania modeli Dotychczas rozważaliśmy dopasowanie PF w całości (tzn. zarówno nachylenia jak i progu). W modelach możemy założyć uwolnienie jedynie jednego z tych parametrów, a także uwolnienie pozostałych, np. współczynnika rozproszeń Można także jako model pełniejszy uznać model zakładające jedynie niezależność i stabilność tzw. model nasycony. W modelu takim nie zakładamy żadnego przebiegu funkcji, tzn. współczynniki Pc dla każdej wartości bodźca są wolnymi parametrami modelu. Porównywany model nazywamy w tym przypadku celowym.

Hipotezy proste i złożone Jeśli jakiś model nie ma wolnych parametrów (zakładamy, że znamy zależność dokładnie i ją weryfikujemy) hipotezę taką nazywamy prostą Jeśli model ma parametry zależne od danych (dopasowywane) jego hipotezę nazywamy złożoną

Test χ Jeśli w LR przetransformujemy w postaci tzw. Transformowanego stosunku podobieństw: TLR lnlr będzie on asymptotycznie rozłożony jak rozkład χ ze liczbą stopni swobody równą różnicy w ilości wolnych parametrów modeli pełniejszego i węższego

Kryteria informacyjne - AIC AIC An Information Criterion, Kryterium informacyjne Zwiększanie podobieństwa świadczy o coraz lepszym modelu Każdy nowy wolny parametr zwiększa LR Jednocześnie najlepsze modele mają jak najmniej parametrów i y; Mi Ki AIC LL Minimalizacja wsp. AIC świadczy o lepszym modelu K liczba wolnych parametrów w modelu LL() podobieństwo modelu M do serii danych θ

Kryteria informacyjne - BIC BIC Bayesian Information Criterion BIC i y; M i lnnk i LL Uwzględnia liczbę prób jako czynnik jeszcze mocniej obciążający dodawanie nowych parametrów (przy dużych próbach statystycznych)

Współczynnik Bayesa BF 1 y; M1p 1 y; M p L L Pozwala włączyć wstępne założenia co do przebiegu PF BF<1 wskazuje na bardziej prawdopodobny model i odwrotnie W przypadku tego kryterium nie musimy zakładać, że modele są zagnieżdżone d 1 d