Psychofizyka Funkcje psychometryczne
Wstęp Funkcje psychometryczne (PF) odnoszą się do zachowania badanego w danym zadaniu psychofizyczne (np. proporcja poprawnych odpowiedzi, proporcja prób określonych jako jaśniejsze) w wyniku pewnej charakterystyki fizycznej bodźca (np. kontrastu, długości). Zazwyczaj mierzymy PF w celu określenia jednego lub kilku parametrów sumujących to zachowanie (np. próg kontrastu, albo punkt subiektywnej równości) Funkcje psychometryczne stosujemy zarówno do opisu wyników badań opartych na wydajności jak i na ocenie.
Przegląd funkcji psychometrycznych Próg wykrycia kontrastu Zadanie 2IFC Metoda stałych bodźców Proporcja poprawnych odpowiedzi Bodźce w ułożone w równych odstępach logarytmicznych (możliwe także liniowe) 50 prób w każdym bodźców Kryterium:75% poprawnych odpowiedzi Funkcja logistyczna
Dopasowanie funkcji Funkcja logistyczna Parametr α psychometrycznej określa usytuowanie krzywej wzdłuż osi X Wartość bodźca dla którego uzyskano wynik będący w połowie odległości między górną i dolną asymptotą (w przykładzie 75%) Parametr β określa nachylenie krzywej Wartości (będące wynikiem eksperymentu) mogą jedynie zostać dopasowane, a więc przybliżone
Dopasowanie funkcji psychometrycznej Odchylenie standardowe (SE) SE progu SE nachylenia Miara (nie)dokładności dopasowania/określenia wartości α i β Dokładność dopasowania (deviance) Wartość p
Pomiar i dopasowanie funkcji psychometrycznej Wybór wartości bodźca Wybór funkcji przybliżającej dane Dopasowanie funkcji Szacowanie niepewności parametrów funkcji Określenie jakości dopasowania funkcji (goodness-of-fit)
Liczba prób Im więcej tym dokładniejszy pomiaropraty na parametrach dopasowania (próg, nachylenie, punkt subiektywnej równości) Mała ilość prób może powodować niezbieżność dopasowania PF Można określić, że 400 prób jest właściwą liczbą aby określić zarówno próg jak i nachylenie PF
Zakres wartości bodźca Jako regułę można przyjąć, że dla badań opartych na wydajności zakres bodźców powinien obejmować wartości od prawie niewykrywalnych do wykrywalnych w prawie 100% prób Oznacza to, że nie trzeba prezentować bodźców z całego zakresu wartości a jedynie pewien zbiór odpowiednio dobranych Metody adaptatywne
Rozmieszczenie liniowe czy logarytmiczne? Skala logarytmiczna pozwala na częstsze (bliższe sobie) bodźce o małych wartościach i rzadkie bodźce o wartościach dalekich od progu prawo Webera-Fechnera Skala logarytmiczna to nie wartości logarytmów lecz wartości oddzielone o interwały logarytmiczne (szereg geometryczny): x i 10 i 1 b loga log n 1 a
Rozmieszczenie liniowe czy logarytmiczne? Skala logarytmiczna pozwala objąć większy zakres wartości bodźca? Nie! Skala logarytmiczna pozwala na częstsze (bliższe sobie) bodźce o małych wartościach i rzadkie bodźce o wartościach dalekich od progu prawo Webera-Fechnera x i 10 i 1 b loga log n 1 a Logarytmiczność wartości należy uwzględnić przy dopasowywaniu PF
Rodzaje funkcji Dystrybuanta rozkładu normalnego Rozkład logistyczny Rozkład Weibulla Rozkład Gumbela Funkcja sekans hyperboliczny
Parametry rozkładu Parametr α określa usytuowanie krzywej wzdłuż osi X Wartość bodźca dla którego uzyskano wynik będący w połowie odległości między górną i dolną asymptotą (w przykładzie 75%) Parametr β określa nachylenie krzywej
Parametry rozkładu Parametr γ Stopień zgadywania Zazwyczaj równy odwrotności liczby bodźców przedstawionych do wyboru (2AFC -> γ=0,5) Przy dopasowaniu funkcją logistyczną procent poprawnych odpowiedzi dla α będzie wyrażony przez: 1 2
Parametry rozkładu Parametr λ Stopień rozproszeń (lapse rate) Przy małej liczbie bodźców obserwator odpowiada niezależnie od wartości bodźca - wynika to zmęczenia albo rozproszenia uwagi Wartość parametru λ wpływa na obniżenie górnej asymptoty PF do poziomu 1- λ Definiujemy ten parametr jako prawdopodobieństwo odpowiedzi niepoprawnej na skutek zmęczenia
Wybór funkcji A priori Wybieramy funkcję, która opisuje znaną teorię przetwarzania danego bodźca A posteriori Wybieramy funkcję, która najdokładniej można dopasować do danych
Metody dopasowania PF Pierwszym krokiem jest wybór kryterium dopasowania kiedy uważamy że funkcja lepiej opisuje dane Kryterium maksymalnego podobieństwa (ML) funkcja która najprawdopodobniej powtórzy dane eksperymentu dokładnie tak jak zrobiłby to obserwator Szcowanie Bayesa
Szacowanie niepewności Nawet jeśli wykonujemy doświadczenie w tych samych warunkach możemy uzyskać różne wyniki (np. z powodu szumów w mózgu) Analiza bootstrap Komputer na podstawie zebranych danych generuje losowo wiele hipotetycznych danych Każdy zestaw hipotetycznych danych jest następnie przybliżany daną funkcją Następnie liczonej jest odchylenie standardowe parametrów dopasowania
Szacowanie dobroci dopasowania Dobroć dopasowania jest miarą jak dobrze dopasowana PF przechodzi przez punkty danych Duża dobroć może wskazać która funkcja PF najlepiej opisuje dane Mała dobroć może wskazać na duży wpływ rozproszeń (lapse ratio), co mogło nie zostać uwzględnione przy dopasowaniu
przerwa
Teorie funkcji psychometrycznych Funkcja psychometryczna określa relację między zadaniem psychofizycznym (np. prawdopodobieństwem poprawnej odpowiedzi) a pewną charakterystyką bodźca (np. kontrastem) Funkcję taką oznaczymy Ψ(x). Funkcja ta w większości przypadków ma kształt sigmoidalny (S-kształtny) Zazwyczaj jednak chcemy zmierzyć nie tyle wydajność obserwatora (prawdopodobieństwo poprawnej odpowiedzi w zależności od wartości bodźca) ale mechanizm zmysłowy zapewniający tą wydajność, tj. funkcję F(x) prawdopodobieństwo wykrycia bodźca przez mechanizm zmysłowy (sensoryczny) w zależności od jego wartości
Teoria wysokiego progu Wyobraźmy sobie eksperyment 2IFC w którym obserwator musi wybrać z dwóch interwałów czasowych ten, który zawiera bodziec (S sygnał). Brak bodźca (drugi okres) nazwiemy szumem (N noise) Decyzja zostaje podjęta na podstawie "substancji zmysłowej zgromadzonej przez narządy zmysłów (np. wzrok) można to sobie wyobrazić jako pewien stopień aktywności neuronów
Substancja zmysłowa (sensory evidence) Wyobraźmy sobie eksperyment 2IFC w którym obserwator musi wybrać z dwóch interwałów czasowych ten, który zawiera bodziec (S sygnał). Brak bodźca (drugi okres) nazwiemy szumem (N noise) Decyzja zostaje podjęta na podstawie ilości "substancji zmysłowej zgromadzonej przez narządy zmysłów (np. wzrok) można to sobie wyobrazić jako pewien stopień aktywności neuronów Z powodu wewnętrznego i zewnętrznego szumu ilość "substancji zmysłowej fluktuuje losowo od jednej do drugiej prezentacji bodźca sprawiając że ten sam bodziec może wzbudzić jej różną ilość
Substancja zmysłowa Załóżmy, że ilość "substancji zmysłowej zależy liniowo od wartości bodźca, zaś fluktuacje mają rozkład normalny x x
Teoria wysokiego progu Mechanizm zmysłowy wykrywa bodziec jeśli wartość "substancji zmysłowej przekroczy pewną ustaloną wewnętrzną granicę próg Próg jest wystarczająco wysoki, aby w nieobecności bodźca nie mogło dojść do wykrycia sygnału sam szum nie może wygenerować sygnału Proces decyzyjny nie ma dostępu to poziomu "substancji zmysłowej wykrycie jest binarne, próg jest lub nie jest przekroczony Oznacza to, że wg tej teorii F(x) jest dystrybuantą rozkładu normalnego
Teoria wysokiego progu System zmysłowy nie generuje fałszywych alarmów Jeśli próg jest przekroczony system zawsze reaguje sygnałem Jeśli próg nie jest przekroczony obserwator zgaduje z prawdopodobieństwem 50% (w M-AFC z prawdopodobieństwem 1/m), oznaczmy to jako γ Dodatkowo uwzględniamy prawdopodobieństwo rozproszeń λ (niezauważona próba, błąd w wyborze odpowiedzi). Klasycznie definiujemy je jako prawdopodobieństwo błędu z powodu rozproszenia. Jako λ* oznaczymy samo prawdopodobieństwo rozproszeń (może mimo to zostać podana prawidłowa odpowiedź)
Teoria wysokiego progu
Teoria wysokiego progu Ψ(x;α,β,γ,λ) = γ + (1- λ- γ) F(x; α,β)
Teoria detekcji sygnałów (SDT) Według SDT nie ma czegoś takiego jak ustalony próg wewnętrzny. Mechanizm zmysłowy generuje pewien poziom sygnału w zależności od ilości zgromadzonej substancji zmysłowej Proces decyzji jest porównaniem sygnału z próby N i S. Z powodu szumu ilości substancji zmysłowej fluktuują, zaś każdy pomiar to próbka z rozkładu prawdopodobieństwa dla danego bodźca
Teoria detekcji sygnałów (SDT)
Teoria detekcji sygnałów (SDT) Załóżmy, że Średnia aktywność zmysłowa jest liniowo zależna od wartości bodźca: x x Wariancja jest niezależna od wartości bodźca i równa σ 2 Prawdopodobieństwo opisane jest rozkładem normalnym
Teoria detekcji sygnałów (SDT) Jeśli różnica substancji zmysłowej między wartością próbki z prezentowanego sygnału i szumu przekracza zero odpowiedź jest poprawna Różnica dwóch rozkładów normalnych jest rozkładem normalnym o dwa razy większej wariancji i średniej różnicowej N 2 2 2, N x, N x,2 Według SDT obserwator nigdy nie zgaduje Według tej teorii funkcja PF ma kształt określony przez górną połówkę dystrybuanty rozkładu normalnego. Aby uzyskać bardziej sigmoidalny kształt należy przyjąć (bardziej realistyczne) założenie o nieliniowości funkcji μ(x) i wyskalować skalę bodźców logarytmicznie
Szczegóły typów funkcji Ψ(x;α,β,γ,λ) = γ + (1- λ- γ) F(x; α,β) F(x; α,β) prawdopodobieństwo wykrycia bodźca przez mechanizm sensoryczny jako funkcja wartości bodźca α parametr lokalizacyjny (próg) β parametr stopnia zmian (nachylenie) γ prawdopodobieństwo poprawnej odpowiedzi gdy bodziec nie został wykryty λ prawdopodobieństwo odpowiedzi niepoprawnej niezależne od wartości bodźca
Dystrybuanta rozkładu normalnego Całka nie posiada rozwiązania analitycznego, ale jest rozwiązywalna numerycznie - zmiany α przy ustalonym β powodują przesuwanie funkcji β jest związane z odwrotności odchylenia standardowego i określa nachylenie PF Ponieważ i metoda nie opisuje dobrze zadań gdzie x=0 oznacza brak bodźca, chyba, że x będzie zlogarytmowane
Rozkład logistyczny Dobre przybliżenie dystrybuanty rozkładu normalnego (po transformacji ) Funkcja możliwa do wyliczenia analitycznego Także nie opisuje dobrze zadań gdzie x=0 oznacza brak sygnału dopóki x nie zostanie przetransformowane do postaci logarytmicznej
Rozkład Weibulla Wartość progowa (x=α) wynosi 1-1/e=0,6321 Nachylenie zależy zarówno od β jak i od α, chyba że zależna od log x
Rozkład Gumbela Posiada właściwości takie jak rozkład Weibulla, lecz jest określony także dla wartości ujemnych x (np. mierzonych w jednostkach logarytmicznych)
Sekans hiperboliczny Rzadko używany w literaturze psychofizycznej
Metody dopasowywania PF Dane z eksperymentu psychofizycznego są proporcjami poprawnych odpowiedzi mierzonymi w pewnej liczbie różnych natężeń bodźca x Każdy z tych punktów opiera się na pewnej (skończonej) liczbie prób, więc jedynie szacuje prawdziwą wartość prawdopodobieństwa z którym obserwator generuje prawidłową odpowiedź Prawdziwe wartości powinna dawać funkcja PF Zazwyczaj naszym celem jest wyznaczenie parametrów progu (α) i nachylenia (β) Stopień zgadywania γ jest znany (1/m), zaś stopień rozkojarzeń λ jest nieznany, ale można go uznać za małoznaczący (chyba że to on jest celem eksperymentu)
Rzut monetą Wyobraźmy sobie, że rzucamy monetą 10 razy i uzyskujemy wynik RROROORROR Prawdopodobieństwo uzyskania dokładnie takiego wyniku wynosi: gdzie a jest potencjalną wartością naszego parametru, p(y k a) jest prawdopodobieństwem uzyskania wyniku y w k-tej próbie dla przyjęcia wartości a dla naszego parametru, N jest liczbą prób
Rzut monetą Jest to prawdopodobieństwo przy założeniu a=0,4 L(0,4 y) jest prawdopodobieństwem uzyskania dokładnie wyniku y w N próbach jest to miara jakości doboru parametru a do danych y
Rzut monetą L(a y) będzie traktować jako funkcję parametru a. Maksymalizując ją znajdziemy najlepsze a Jeśli nie interesuje nas kolejność wyników tylko ich ilość musimy dodać do wzoru dwumian, jednakże powoduje on jedynie przeskalowanie wartości nie przesuwając wykresu
Maksymalne podobieństwo Zazwyczaj w próbach psychofizycznych chcemy wyznaczyć (dopasować) wartości dwóch parametrów, funkcję L zapiszemy więc jako Gdzie p(y k x k ;a,b) oznacza prawdopodobieństwo odpowiedzi y w k-tej próbie, wartości bodźca x oraz przy założeniu progu α=a i nachylenia β=b
Maksymalne podobieństwo
Maksymalne podobieństwo
Maksymalne podobieństwo Ponieważ prawdopodobieństwa wynikające z tej metody są bardzo małe (szczególnie dla dużych ilości prób) często używa się transformacji logarytmicznej:
Maksymalne podobieństwo Założenie stabilności Prawdopodobieństwo wskazania poprawnej odpowiedzi nie zależy od k (numeru próby) W rzeczywistości na skutek zmęczenia i uczenia się nie jest to prawdą Założenie niezależności Prawdopodobieństwo wskazania poprawnej odpowiedzi zależy jedynie od wartości bodźca w danej próbie W rzeczywistości obserwator po kilku nieudanych próbach może skupić się mocniej, zaś po szeregu udanych zdekoncentrować się
Stopień rozkojarzeń λ Stopień rozkojarzeń często zakłada się na poziomie 0, jednakże w tym przypadku (szczególnie przy dużych zakresach bodźców) przypadkowy błąd ma duży wpływ na wartość prawdopodobieństwa L Dlatego można dodać λ jako parametr rozkładu (często prowadzi to do braku zbieżności lub wartości bez sensu), założyć małą niezerową wartość λ lub zawęzić maksymalnie zakres prezentowanych bodźców
Szacowanie niepewności Szacunki, które otrzymamy z naszej próbki nie będą dokładnie równe prawdziwym parametrom (obesrwatora) Powtórzenie eksperymentu w identycznych warunkach będzie prowadzić do innych wartości Błąd próbkowania Jeśli przybliżymy rozrzut wyników w kolejnych eksperymentach rozkładem normalnym 68% wyników x znajdzie się w obszarze μ x ± σ x Mówimy, że jesteśmy w 68% pewni średnia jest pomiędzy μ x σ x a μ x + σ x
Metoda bootstrap Aby uzyskać odchylenie standardowe nie wykonując eksperymentu (próbki) setki razy możemy zasymulować wyniki Metoda parametryczna dopasowujemy PF (pierwotną) do danych, losujemy w każdym bodźcu poprawne/niepoprawne wskazania z prawdopodobieństwem określonym przez PF do uzyskanego nowego rozkładu dopasowujemy nową PF (wtórną) Robimy histogram, liczymy średnią i odchylenie standardowe parametrów PF (wtórnych) Metoda nieparametryczna Pomijamy pierwszy krok, a w drugim prawdopodobieństwo określają bezpośrednio dane
Metoda bootstrap
Odchylenie standartowe W odniesieniu do parametrów PF pierwotnej: W odniesieniu do parametrów PF wtórnych: α b jest parametrem b-tej próbki α g jest parametrem PF pierwotnej B jest liczbą próbek
Twierdzenie Bayesa Wyobraźmy sobie, że mamy pewną rzadką (0,0001% populacji) wadę genetyczną D Mamy także test H która ją wykrywa. Metoda ta ma 99% skuteczności 99% osób posiadających ową cechę genetyczną wykazuje pozytywny wynik testu P(D+ H+)=0,99 99% osób nie posiadających owej cechy ma wynik negatywny testu P(D- H-)=0,99 Jakie jest prawdopodobieństwo, że osoba u której wynik jest pozytywny p(h+ D-) jest zdrowa? p p H p D H H D p H p D H p H p D H
Twierdzenie Bayesa w zastosowaniu do podobieństwa p a, b y a L b a, b y p a, b L a, b y p a, b L(a,b y) jest naszą funkcją podobieństwa p(a,b) jest wstępnym rozkładem parametrów a,b (literatura, teoria, wcześniejsze badania) p(a,b L) jest rozkładem wtórną gęstością prawdopodobieństwa
Kryterium bayesiańskie N=20
Kryterium bayesiańskie Założenie wstępne jednopunktowe Gęstość prawdopodobieństwa także jednopunktowa Założenie wstępne jednorodne Gęstość prawdopodobieństwa równa funkcji poobieństwa Założenie wstępne jednorodne w ograniczonym zakresie a b b a L b a L b a p y y y,,, a b b a p b p b a p a p y y y y,,
Szacowanie niepewności Ponieważ w wyniku uzyskujemy funkcję gęstości prawdopodobieństwa możemy łatwo wyznaczyć prawdopodobieństwa, że a i b mają wartości w jakiś przedziałach (całkowanie (sumowanie) w granicach) Możemy także obliczyć odchylenie standardowe 2 SE a p a, b y a b