5. WNIOSKOWANIE PSYCHOMETRYCZNE

5. WNIOSKOWANIE PSYCHOMETRYCZNE Model klasyczny Gulliksena Wynik otrzymany i prawdziwy Błąd pomiaru Rzetelność pomiaru testem Standardowy błąd pomiaru Błąd estymacji wyniku prawdziwego Teoria Odpowiadania na Pozycje Testowe (IRT) Teoria Wyników Generycznych(uniwersalizacji).

Teorie rzetelności pomiaru Dwa modele psychometryczne opisu błędu pomiaru i rzetelność pomiaru: Klasyczna Teoria Testów (Gulliksen, 1950; Lord i Novick, 1968) oraz Teoria odpowiadania na pozycje Testowe (IRT) Nowoczesną formą KTT jest Teoria Wyników Generycznych.

W odniesieniu do wyniku testowego: 1.obserwowany (otrzymany) wynik testu 2.wynik prawdziwy 3.błąd pomiaru W odniesieniu do wariancji wyników testu: 1.wariancja wyników otrzymanych 2.wariancja wyników prawdziwych 3.wariancja błędu.

Wynik prawdziwy - średnia wyników otrzymanych w nieskończenie wielu niezależnych pomiarach cechy określonym testem u jednej osoby. Jest to średnia wszystkich potencjalnych wyników osoby przy pomiarze określonym testem.

Błąd pomiaru testowego - źródła Właściwości osoby badanej (techniki wypełniania testu, zdolność rozumienia instrukcji, znajomość specyficznego zachowania) Czynniki osoby badanej o incydentalnym charakterze (zdrowie, zmęczenie, motywacja, napięcie emocjonalne, warunki zewnętrzne światło, hałas, temperatura, itp.).

Założenie 1. Wszystkie błędy jakie otrzymalibyśmy, badając tę samą osobę nieskończenie wiele razy, mają rozkład normalny, a ich średnia wynosi zero M b = 0 Założenie o nieobciążoności narzędzia pomiarowego.

Założenie 2. Błąd pomiaru ma charakter losowy, a więc nie ma związku między wynikiem prawdziwym a błędem pomiaru r pb = 0 Założenie o niezależności, wynik prawdziwy i błąd są nieskorelowane.

Założenie 3. Jeżeli błąd pomiaru ma charakter losowy, to również nie możemy oczekiwać istnienia żadnego związku między błędami otrzymanymi w dwóch kolejnych badaniach tym samym testem, a więc r b1b2 = 0 Błędy różnych pomiarów są nieskorelowane.

Wariancja to w statystyce klasyczna miara zmienności. Intuicyjnie utożsamiana jest ze zróżnicowaniem zbiorowości. Jest to średnia arytmetyczna kwadratów odchyleń poszczególnych wartości cechy od wartości oczekiwanej.

Rzetelność - dokładność (precyzja) pomiaru badanej cechy; Pojęcie rzetelności jest bezpośrednio powiązane z pojęciem błędu pomiaru nie istnieje pomiar bez błędu, im większy jest błąd, tym mniejsza jest rzetelność pomiaru danymtestem Błąd obniża precyzję pomiaru zamiast wyniku prawdziwego otrzymujemy wynik zniekształcony przez błąd.

Interpretacja współczynnika rzetelności Współczynnik rzetelności wskazuje, jaka część wariancji wyników otrzymanychwynika z błędu lub ze zmienności wyników testu(niespójności odpowiedzi testowych), np. r tt =0,80 oznacza, że 80% zróżnicowania wyników uzyskanych z badania testem spowodowana została rzeczywistymi różnicami między ludźmi, a pozostałe 20% to efekt błędu pomiaru. Im mniejsze zróżnicowanie wyników testowych, tym niższa rzetelność testu.

Ocena rzetelności indywidualnego wyniku Współczynnik rzetelności testu parametr opisujący stopień precyzji wyników otrzymywanych za pomocą określonego testu Gdy interesuje nas test dla celów indywidualnej diagnozy, wtedy ważniejsza jest możliwość oceny wyniku prawdziwego konkretnej osoby Do tego celu przydatna jest znajomość standardowego błędu pomiaru.

Standardowy błąb łąd d pomiaru to odchylenie standardowe różnic r X - T Jest to błąb łąd, który popełniamy wtedy, gdy przyjmujemy, że e wynikiem prawdziwym danej osoby jest średni wynik, jaki uzyskałaby aby ta osoba w nieskończenie wielu pomiarach tym samym testem.

Interpretacja standardowego błędu wyników otrzymanych Wielokrotne badanie jednej osoby nie jest możliwe (ze względu na motywację oraz pamięć) z tegowzględu brany jest pod uwagę rozkład błędów pomiaru u wszystkich osób badanych (nie ma istotnej różnicy pomiędzy efektami losowymi w grupie wielu osób badanych jednorazowo oraz wielokrotnym badaniem jednej osoby ten sam model czynników losowych).

Standardowy błąd pomiaru wskazuje zakres wyników, w obrębie którego lokuje się wynik prawdziwy osoby badanej (z określonym prawdopodobieństwem) i jest identyczny dla wszystkich osób badanych (niezależnie od wyniku otrzymanego) Standardowy błąd pomiaru jest stosowany do wyznaczania przedziału ufności dla wyniku prawdziwego z określoną pewnością (0,99, 0,95) Musi być pomnożony przez wartość z rozkładu normalnego, czyli = 2,58 lub 1,96.

Przedziały y ufności Od wyniku otrzymanego odejmujemy oraz dodajemy pewną stałą wartość Ta stała a wartość jest równa r (z α/2 )(S bp ). z α0,05 = 1,96 z α0,01 = 2,58 z α0,001 = 3,29 Sbp = So (1 - rtt)

WAIS M=100, SD=15 rtt=0,90 Sb=15 1-0,90 = 15x0,316=4,74 dla poz. α0,05 1,96x4,74=9,29 dla poz. α0,01 2,58x4,74=12,23

wynik otrzymany II = 93 wynik prawdziwy: dla 95% ufności 84-102 dla 99% 81-105 105 Od wyniku otrzymanego odejmujemy (otrzymujemy dolną granicę przedziału) oraz do wyniku otrzymanego dodajemy (otrzymujmy górng rną granicę przedziału) pewną stałą wartość (błą łąd d pomiaru).

Teoria odpowiadania na pozycje testu (item response theory) Teoria IRT konkurencyjna do KTT -to zbiór twierdzeń opisujących sposób, w jaki osoba badana odpowiada na pozycje testu. Ustala się związek między odpowiedziami udzielanymi przez b. a zakładaną, nieobserwowalną cechą leżącą u podstaw zachowań testowych np. odpowiedzi w podskali Rozumienie (WAIS) -to funkcja hipotetycznej, nieobserwowalnejcechy, tj. rozumienia sytuacji i norm społecznych.

W klasycznej teorii testów (KTT) przyjmuje się, że związek między wynikiem prawdziwym (wynik stand. z ) a wynikiem otrzymanym w teście jest związkiem prostoliniowym (regresja liniowa) Przedziały ufności (zaznaczone linia przerywaną) są takie same dla wszystkich wyników, a wartość błędu pomiaru zależy od konkretnej badanej populacji.

W teorii odpowiadania na pozycje testu (IRT) związek między wynikiem prawdziwym a wynikiem otrzymanym nie jest związkiem liniowym, a szerokość przedziałów ufności jest inna w środku, a inna na krańcach rozkładu (przedziały są szersze dla skrajnych wyników) Błąd standardowy pomiaru nie jest związany z konkretną populacją, podobnie jak nie są z nią związane parametry opisujące pozycje testowe.

Teoria uniwersalizacji Teoria uniwersalizacji (wyników generycznych) wykorzystała koncepcję testów równoległych co pozwoliło zrezygnować z nietestowalnych założeń i twierdzeń na rzecz obserwowalnych Zależności(błędy mogą być skorelowane i może to być empirycznie stwierdzone).

Testy równoległe - pojęcie Testy równoległe:mierzą tę samą cechę z taką samą dokładnością M 1 = M 2 S 12 = S 2 2 Testy równoważne: mierzą tę samą cechę, ale nie tak samo dokładnie M1 # M2 Testy quasi-równoważne: mierzą tę samą cechę wraz z dodatkowym czynnikiem M 1 = M 2 + c

Podsumowanie Pomiar psychologiczny ma charakter pośredni Aby na podstawie obserwowanego zachowania osoby wyznaczyć pozycję jej cechy latentnej musimy dysponować modelem wiążącym konstruktpsychologiczny (cechę latentną) z poziomem zachowań.

W KTT wynik danej osoby w teście jest sumą dwóch składowych: wyniku prawdziwego danej osoby i błędu pomiaru Ograniczenia modelu -wynik prawdziwy określany jest tylko w stosunku do konkretnego zbioru pozycji testowych, a statystyczne właściwości pozycji testowych nie są bezpośrednio wiązane z zachowaniami testowymi.

W RIT buduje się modele wiążące poziom nieobserwowalnejcechy psychologicznej z odpowiedzią na każdą kolejną pozycję testową. Zaletą tych modeli jest to, że poziom mierzonej cechy może zostać oszacowany na podstawie każdej pozycji testowej pod warunkiem, że znane są jej parametry, a statystyczne właściwości tych pozycji są bezpośrednio wiązane z zachowaniami testowymi (Embredson, 2000).

Zagadnienia 1. Elementy składowe Klasycznej Teorii Testów 2. Elementy składowe wyniku otrzymanego 3. Co to jest wynik prawdziwy 4. Źródła a błęb łędu pomiaru testowego 5. Założenia dotyczące ce błęb łędu pomiaru 6. Pojecie rzetelności 7. Interpretacja współczynnika rzetelności 8. Standardowy błąb łąd d pomiaru 9. Od czego zależy y wielkość stand. błęb łędu pomiaru 10. Jak wyznaczamy przedziały y ufności 11. Teoria Odpowiadania na Pozycje Testowe różnice w stosunku do KTT 12. Teoria Uniwersalizacji pojęcie testów w równolegr wnoległych.