5. WNIOSKOWANIE PSYCHOMETRYCZNE

Podobne dokumenty
Psychometria PLAN NAJBLIŻSZYCH WYKŁADÓW. Co wyniki testu mówią nam o samym teście? A. Rzetelność pomiaru testem. TEN SLAJD JUŻ ZNAMY

15. PODSUMOWANIE ZAJĘĆ

Statystyka matematyczna dla leśników

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Rzetelność ma dwa aspekty: konsystencja (precyzja pomiaru) stabilność pomiaru (powtarzalność wyników)

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Wnioskowanie statystyczne. Statystyka w 5

Oszacowanie i rozkład t

10. Podstawowe wskaźniki psychometryczne

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Klasyczny model rzetelności H. Gulliksen (1950) X = T +E

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Psychometria Test jako narzędzie diagnozy psychologicznej. Podstawowe pojęcia. W 3

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

1. TESTY PSYCHOLOGICZNE

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

KORELACJE I REGRESJA LINIOWA

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

WSKAZÓWKI DO WYKONANIA SPRAWOZDANIA Z WYRÓWNAWCZYCH ZAJĘĆ LABORATORYJNYCH

STATYSTYKA MATEMATYCZNA

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

METODY STATYSTYCZNE W BIOLOGII

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Weryfikacja hipotez statystycznych

Prawdopodobieństwo i rozkład normalny cd.

Kontekstowe wskaźniki efektywności nauczania - warsztaty

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

166 Wstęp do statystyki matematycznej

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi

1 Podstawy rachunku prawdopodobieństwa

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

WNIOSKOWANIE STATYSTYCZNE

Zadania ze statystyki, cz.6

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Miary zmienności STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Estymacja punktowa i przedziałowa

Analiza niepewności pomiarów

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

Rozkłady statystyk z próby. Statystyka

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Pobieranie prób i rozkład z próby

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

ESTYMACJA PRZEDZIAŁOWA WYBRANYCH PARAMETRÓW

Testowanie hipotez statystycznych

WYKŁAD 8 ANALIZA REGRESJI

Teoria błędów. Wszystkie wartości wielkości fizycznych obarczone są pewnym błędem.

KARTA KURSU. (do zastosowania w roku akademickim 2015/16) Kod Punktacja ECTS* 3. Dr hab. Tadeusz Sozański

METODY STATYSTYCZNE W BIOLOGII

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

ZADANIA ROZRYWAJĄCE W TESTACH. 1. Co to jest zadanie rozrywające?

Podstawy opracowania wyników pomiarów z elementami analizy niepewności statystycznych

Rozkład Gaussa i test χ2

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Rozkłady statystyk z próby

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Zadania rozrywające w testach

METODY STATYSTYCZNE W BIOLOGII

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Liczba zadań a rzetelność testu na przykładzie testów biegłości językowej z języka angielskiego

JAK WYZNACZA SIĘ PARAMETRY WALIDACYJNE

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Spis treści 3 SPIS TREŚCI

PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

Rozkład normalny. Marcin Zajenkowski. Marcin Zajenkowski () Rozkład normalny 1 / 26

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyczne Metody Opracowania Wyników Pomiarów

Zajęcia 1. Rzetelność

POLITECHNIKA OPOLSKA

Ważne rozkłady i twierdzenia c.d.

Zadania ze statystyki cz.8. Zadanie 1.

Rozdział 8. Regresja. Definiowanie modelu

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

LABORATORIUM Z FIZYKI

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

ESTYMACJA. Przedział ufności dla średniej

Wprowadzenie do analizy korelacji i regresji

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

KURS STATYSTYKA. Lekcja 2 Przedziały ufności i estymacja przedziałowa ZADANIE DOMOWE. Strona 1

Estymacja parametrów rozkładu cechy

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Podstawowe funkcje przetwornika C/A

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

(narzędzie do pomiaru cech zachowania oprac. dr hab. Zbigniew Spendel)

3. Modele tendencji czasowej w prognozowaniu

Transkrypt:

5. WNIOSKOWANIE PSYCHOMETRYCZNE Model klasyczny Gulliksena Wynik otrzymany i prawdziwy Błąd pomiaru Rzetelność pomiaru testem Standardowy błąd pomiaru Błąd estymacji wyniku prawdziwego Teoria Odpowiadania na Pozycje Testowe (IRT) Teoria Wyników Generycznych(uniwersalizacji).

Teorie rzetelności pomiaru Dwa modele psychometryczne opisu błędu pomiaru i rzetelność pomiaru: Klasyczna Teoria Testów (Gulliksen, 1950; Lord i Novick, 1968) oraz Teoria odpowiadania na pozycje Testowe (IRT) Nowoczesną formą KTT jest Teoria Wyników Generycznych.

W odniesieniu do wyniku testowego: 1.obserwowany (otrzymany) wynik testu 2.wynik prawdziwy 3.błąd pomiaru W odniesieniu do wariancji wyników testu: 1.wariancja wyników otrzymanych 2.wariancja wyników prawdziwych 3.wariancja błędu.

Wynik prawdziwy - średnia wyników otrzymanych w nieskończenie wielu niezależnych pomiarach cechy określonym testem u jednej osoby. Jest to średnia wszystkich potencjalnych wyników osoby przy pomiarze określonym testem.

Błąd pomiaru testowego - źródła Właściwości osoby badanej (techniki wypełniania testu, zdolność rozumienia instrukcji, znajomość specyficznego zachowania) Czynniki osoby badanej o incydentalnym charakterze (zdrowie, zmęczenie, motywacja, napięcie emocjonalne, warunki zewnętrzne światło, hałas, temperatura, itp.).

Założenie 1. Wszystkie błędy jakie otrzymalibyśmy, badając tę samą osobę nieskończenie wiele razy, mają rozkład normalny, a ich średnia wynosi zero M b = 0 Założenie o nieobciążoności narzędzia pomiarowego.

Założenie 2. Błąd pomiaru ma charakter losowy, a więc nie ma związku między wynikiem prawdziwym a błędem pomiaru r pb = 0 Założenie o niezależności, wynik prawdziwy i błąd są nieskorelowane.

Założenie 3. Jeżeli błąd pomiaru ma charakter losowy, to również nie możemy oczekiwać istnienia żadnego związku między błędami otrzymanymi w dwóch kolejnych badaniach tym samym testem, a więc r b1b2 = 0 Błędy różnych pomiarów są nieskorelowane.

Wariancja to w statystyce klasyczna miara zmienności. Intuicyjnie utożsamiana jest ze zróżnicowaniem zbiorowości. Jest to średnia arytmetyczna kwadratów odchyleń poszczególnych wartości cechy od wartości oczekiwanej.

Rzetelność - dokładność (precyzja) pomiaru badanej cechy; Pojęcie rzetelności jest bezpośrednio powiązane z pojęciem błędu pomiaru nie istnieje pomiar bez błędu, im większy jest błąd, tym mniejsza jest rzetelność pomiaru danymtestem Błąd obniża precyzję pomiaru zamiast wyniku prawdziwego otrzymujemy wynik zniekształcony przez błąd.

Interpretacja współczynnika rzetelności Współczynnik rzetelności wskazuje, jaka część wariancji wyników otrzymanychwynika z błędu lub ze zmienności wyników testu(niespójności odpowiedzi testowych), np. r tt =0,80 oznacza, że 80% zróżnicowania wyników uzyskanych z badania testem spowodowana została rzeczywistymi różnicami między ludźmi, a pozostałe 20% to efekt błędu pomiaru. Im mniejsze zróżnicowanie wyników testowych, tym niższa rzetelność testu.

Ocena rzetelności indywidualnego wyniku Współczynnik rzetelności testu parametr opisujący stopień precyzji wyników otrzymywanych za pomocą określonego testu Gdy interesuje nas test dla celów indywidualnej diagnozy, wtedy ważniejsza jest możliwość oceny wyniku prawdziwego konkretnej osoby Do tego celu przydatna jest znajomość standardowego błędu pomiaru.

Standardowy błąb łąd d pomiaru to odchylenie standardowe różnic r X - T Jest to błąb łąd, który popełniamy wtedy, gdy przyjmujemy, że e wynikiem prawdziwym danej osoby jest średni wynik, jaki uzyskałaby aby ta osoba w nieskończenie wielu pomiarach tym samym testem.

Interpretacja standardowego błędu wyników otrzymanych Wielokrotne badanie jednej osoby nie jest możliwe (ze względu na motywację oraz pamięć) z tegowzględu brany jest pod uwagę rozkład błędów pomiaru u wszystkich osób badanych (nie ma istotnej różnicy pomiędzy efektami losowymi w grupie wielu osób badanych jednorazowo oraz wielokrotnym badaniem jednej osoby ten sam model czynników losowych).

Standardowy błąd pomiaru wskazuje zakres wyników, w obrębie którego lokuje się wynik prawdziwy osoby badanej (z określonym prawdopodobieństwem) i jest identyczny dla wszystkich osób badanych (niezależnie od wyniku otrzymanego) Standardowy błąd pomiaru jest stosowany do wyznaczania przedziału ufności dla wyniku prawdziwego z określoną pewnością (0,99, 0,95) Musi być pomnożony przez wartość z rozkładu normalnego, czyli = 2,58 lub 1,96.

Przedziały y ufności Od wyniku otrzymanego odejmujemy oraz dodajemy pewną stałą wartość Ta stała a wartość jest równa r (z α/2 )(S bp ). z α0,05 = 1,96 z α0,01 = 2,58 z α0,001 = 3,29 Sbp = So (1 - rtt)

WAIS M=100, SD=15 rtt=0,90 Sb=15 1-0,90 = 15x0,316=4,74 dla poz. α0,05 1,96x4,74=9,29 dla poz. α0,01 2,58x4,74=12,23

wynik otrzymany II = 93 wynik prawdziwy: dla 95% ufności 84-102 dla 99% 81-105 105 Od wyniku otrzymanego odejmujemy (otrzymujemy dolną granicę przedziału) oraz do wyniku otrzymanego dodajemy (otrzymujmy górng rną granicę przedziału) pewną stałą wartość (błą łąd d pomiaru).

Teoria odpowiadania na pozycje testu (item response theory) Teoria IRT konkurencyjna do KTT -to zbiór twierdzeń opisujących sposób, w jaki osoba badana odpowiada na pozycje testu. Ustala się związek między odpowiedziami udzielanymi przez b. a zakładaną, nieobserwowalną cechą leżącą u podstaw zachowań testowych np. odpowiedzi w podskali Rozumienie (WAIS) -to funkcja hipotetycznej, nieobserwowalnejcechy, tj. rozumienia sytuacji i norm społecznych.

W klasycznej teorii testów (KTT) przyjmuje się, że związek między wynikiem prawdziwym (wynik stand. z ) a wynikiem otrzymanym w teście jest związkiem prostoliniowym (regresja liniowa) Przedziały ufności (zaznaczone linia przerywaną) są takie same dla wszystkich wyników, a wartość błędu pomiaru zależy od konkretnej badanej populacji.

W teorii odpowiadania na pozycje testu (IRT) związek między wynikiem prawdziwym a wynikiem otrzymanym nie jest związkiem liniowym, a szerokość przedziałów ufności jest inna w środku, a inna na krańcach rozkładu (przedziały są szersze dla skrajnych wyników) Błąd standardowy pomiaru nie jest związany z konkretną populacją, podobnie jak nie są z nią związane parametry opisujące pozycje testowe.

Teoria uniwersalizacji Teoria uniwersalizacji (wyników generycznych) wykorzystała koncepcję testów równoległych co pozwoliło zrezygnować z nietestowalnych założeń i twierdzeń na rzecz obserwowalnych Zależności(błędy mogą być skorelowane i może to być empirycznie stwierdzone).

Testy równoległe - pojęcie Testy równoległe:mierzą tę samą cechę z taką samą dokładnością M 1 = M 2 S 12 = S 2 2 Testy równoważne: mierzą tę samą cechę, ale nie tak samo dokładnie M1 # M2 Testy quasi-równoważne: mierzą tę samą cechę wraz z dodatkowym czynnikiem M 1 = M 2 + c

Podsumowanie Pomiar psychologiczny ma charakter pośredni Aby na podstawie obserwowanego zachowania osoby wyznaczyć pozycję jej cechy latentnej musimy dysponować modelem wiążącym konstruktpsychologiczny (cechę latentną) z poziomem zachowań.

W KTT wynik danej osoby w teście jest sumą dwóch składowych: wyniku prawdziwego danej osoby i błędu pomiaru Ograniczenia modelu -wynik prawdziwy określany jest tylko w stosunku do konkretnego zbioru pozycji testowych, a statystyczne właściwości pozycji testowych nie są bezpośrednio wiązane z zachowaniami testowymi.

W RIT buduje się modele wiążące poziom nieobserwowalnejcechy psychologicznej z odpowiedzią na każdą kolejną pozycję testową. Zaletą tych modeli jest to, że poziom mierzonej cechy może zostać oszacowany na podstawie każdej pozycji testowej pod warunkiem, że znane są jej parametry, a statystyczne właściwości tych pozycji są bezpośrednio wiązane z zachowaniami testowymi (Embredson, 2000).

Zagadnienia 1. Elementy składowe Klasycznej Teorii Testów 2. Elementy składowe wyniku otrzymanego 3. Co to jest wynik prawdziwy 4. Źródła a błęb łędu pomiaru testowego 5. Założenia dotyczące ce błęb łędu pomiaru 6. Pojecie rzetelności 7. Interpretacja współczynnika rzetelności 8. Standardowy błąb łąd d pomiaru 9. Od czego zależy y wielkość stand. błęb łędu pomiaru 10. Jak wyznaczamy przedziały y ufności 11. Teoria Odpowiadania na Pozycje Testowe różnice w stosunku do KTT 12. Teoria Uniwersalizacji pojęcie testów w równolegr wnoległych.