^3» i > > 4 jest przedstawiona MODEL CECHY LATENTNEJ W ANALIZIE PSYCHOMETRYCZNEJ TESTÓW I POZYCJI TESTOWYCH ZMIENNE LATENTNEI ZMIENNE OBSERWOWALNE
|
|
- Amelia Baranowska
- 7 lat temu
- Przeglądów:
Transkrypt
1 X Konferencja z cyklu Diagnostyka edukacyjna IX 2004 Roman KONARSKI Instytut Psychologii Uniwersytet Gdański MODEL CECHY LATENTNEJ W ANALIZIE PSYCHOMETRYCZNEJ TESTÓW I POZYCJI TESTOWYCH Model wyniku zadania testowego (item response theory, IRT) oraz model konfirmacyjnej analizy czynnikowej (confirmatory factor analysis, CFA) dla zmiennych dyskretnych są specjalnymi przypadkami bardziej ogólnego modelu cechy latentnej (latent trait model, LTM) (Takane, de Leeuw, 1987; Bartholomew, Knott, 1999; McDonald, 1999). Na wstępie przedstawię podstawowe założenia modelu IRT i modelu CFA dla zmiennych dyskretnych oraz omówię relacje pomiędzy parametrami obu modeli psychometrycznych. Następnie na przykładach konkretnych danych empirycznych zaprezentuję możliwości zastosowania modelu cechy latentnej w typowej analizie psychometrycznej pozycji testowych. ZMIENNE LATENTNEI ZMIENNE OBSERWOWALNE W diagnostyce edukacyjnej problem pomiaru jest szczególnie złożony, gdyż zmienne nas interesujące nie są bezpośrednio obserwowalne. Takie konstrukty psychologiczne jak inteligencja, kompetencja lub wiedza są zmiennymi latentnymi, które posiadają znacznie empiryczne jedynie poprzez obserwowalne konsekwencje tych zmiennych (Homowska, 1989). Obserwowalne konsekwencje zmiennych latentnych nazywamy wskaźnikami, pozycjami testowymi, lub zadaniami testowymi. Zauważmy, że takie ujęcie relacji pomiędzy zmiennymi latentnymi i ich obserwowalnymi wskaźnikami implikuje określoną relację przyczynową, w której konstrukty teoretyczne przyjmują rolę zmiennych wyjaśniających, a wskaźniki przyjmują rolę zmiennych wyjaśnianych 1 (Borsboom, Mellenbergh, van Heerden, 2003). Relacja pomiędzy zmienną latentną 0 i jej wskaźnikami ylf y 2. ^3» i > > 4 jest przedstawiona za pomocą wykresu ścieżkowego w rysunku 1. Zgodnie z ogólno przyjętą konwencją 2, komponenty wykresu ścieżkowego są przedstawiane w następujący sposób: 1 Modele postulujące odwrotny kierunek relacji pomiędzy zmienną latentną i jej wskaźnikami były także formułowane (np., Bollen, Lennox, 1991). Tak zwane modele formatywne to modele dla wskaźników definicyjnych (Nowak, 1965), które s * prawdopodobnie bardziej odpowiednie dla takich konceptów socjob - gicznych jak status socjoekonomiczny. Ontologiczny charakter zmiennych latentnych i ich relacji ze zmiennymi obserwowalnymi jest dyskutowany w Borsboom i in. (2003). 2 Istnieje także alternatywna konwencja RAM (McArdle, McDonald, 1984). 47
2 Roman KONARSKI > zmienne obserwowalne (jakościowe lub ilościowe) są wskazane jako kwadrat i są nazwane literami rzymskimi (y); > zmienna latentna jest wskazana jako koło i jest nazwane literą grecką ( 0 ); > jednokierunkowa strzałka pomiędzy dwoma zmiennymi postuluje bezpośredni wpływ jednej zmiennej na drugą zmienną; > nieznane wartości parametrów modelu są oznaczone literami greckimi ( A, B ). Przykład przedstawiony na rysunku 1 ilustruje model jednoczynnikowy, w którym cecha wspólna (0 ) ma wskaźniki yu y 2» yi * i y * Ponadto błąd pomiarowy każdej zmiennej obserwowalnej jest oznaczone jako Gk. Relacja pomiędzy czynnikiem wspólnym i wskaźnikami jest oznaczona jako Xk. ^ 1 y * BA y * Rysunek 1. Wykres ścieżkowy modelu pomiarowego Wykres modelu pomiarowego na rysunku 1 skutecznie pokazuje związek pomiędzy zmienną latentną i jej obserwowalnymi wskaźnikami oraz demonstruje, że reakcja na daną pozycję testową jest wynikiem dwóch latentnych komponentów: pozycji danej osoby na skali cechy latentnej oraz (latentnego) błędu pomiarowego. Zależność pomiarowa przedstawiona na rysunku 1 ujawnia dalej, że informacja zawarta w pojedynczej pozycji testowej nie jest wystarczająca aby oszacować dwa latentne komponenty odpowiedzi na daną pozycję testową. Z tego względu wymagane jest posiadanie wielokrotnego pomiaru danej cechy latentnej. Informacja o danej cesze latentnej jest zawarta w strukturze relacyjnej zmiennych obserwowalnych. MODELE POMIAROWE Wczesny rozwój modelu cechy latentnej (LTM) możemy przypisać pracy Spearmana (1904) nad współczynnikiem korelacji oraz wysiłkom Lawleya (1943), który postulował, że odpowiedzi na pozycje testowe są wynikiem nieobserwowalnej (latentnej) cechy lub kompetencji danej osoby. Lord (1953) później sformalizował postulat Lawleya (1943) poprzez różnorodne modele matematyczne pozwalające na predykcję poprawnej odpowiedzi na zadanie testowe bazując na właściwościach danej pozycji testowej oraz poziomu cechy latentnej (kompetencjiwiedzy). 48
3 Model cechy latentnej w analizie psychometrycznej testów... Obecnie wyróżniamy cztery ogólne kategorie modeli zmiennej latentnej różniące się założeniami odnośnie skali zmiennej latentnej oraz skali pozycji testowych (Bartholomew, 1987; Borsboom i in., 2003). Bartholomew (1987) zaproponował klasyfikację modeli zmiennych latentnych, która jest przedstawiona w tabeli 1. Modele dla ciągłej zmiennej latentnej są nazywane modelami cechy latentnej (LTM) (Mellenbergh, 1994; Bartholomew, Knott, 1999). Analiza czynnikowa jest modelem pomiarowym dla relacji pomiędzy ciągłymi zmiennymi latentnymi i ciągłymi zmiennymi obserwowalnymi. Analiza czynnikowa została sformułowana jako formalny model statystyczny przez Lawleya i Maxwella (1963) oraz jako model konfirmacyjnej analizy czynnikowej (confirmatory factor analysis, CFA) przez Jóreskoga (1971). W późniejszych latach model CFA został rozszerzony do dyskretnych pozycji testowych przez Christoffersona (1975), Muthena (1984) oraz Jóreskoga (1990). Równolegle do rozwoju analizy czynnikowej, dzięki pracy Rascha (1960), Bimbauma (1968) oraz Lorda (1980), w tradycji edukacyjnej powstał model wyniku zadania testowego (item response theory, IRT). Początkowo, IRT określał relację pomiędzy ciągłą zmienną latentną i dychotomicznymi pozycjami testowymi. W późniejszych latach model IRT został rozszerzony, aby uwzględnić politomiczne pozycje testowe dzięki publikacjom Samejima (1969) oraz Bocka (1972). W równoległym programie badawczym, powstały modele statystyczne dla dyskretnych zmiennych latentnych (Lazarsfeld, 1950; Green, 1951; Lazarsfeld, Henry, 1968; Goodman, 1974). Wysiłki Lazarsfelda (1950), Lazarsfelda i Henrya (1968), oraz Goodmana (1974) zaowocowały analizą latentnych struktur (latent structure analysis, LSA). Gdy w modelu LSA zmienne obserwowalne są dyskretne, model taki jest nazywany modelem latentnych klas (latent class analysis, LCA) (Green, 1951). Gdy zaś w modelu LSA zmienne obserwowalne są ciągłe, model jest nazywany modelem latentnych profili (latent profile analysis, LPA) (Lazarsfeld, Henry, 1968; Bartholomew, 1987). Tabela 1. Klasyfikacja modeli zmiennych latentnych (Bartholomew, 1987) Zmienna latentna Zmienne obserwowalne Ciągła analiza czynnikowa Ciągłe Dyskretne analiza czynnikowa dla zmiennych dyskretnych teoria wyniku zadania testowego Dyskretna analiza latentnych profili analiza latentnych klas Początkowo modele pomiarowe przedstawione w tabeli 1 powstawały w oddzielnych tradycjach statystycznych, co sprzyjało podkreślaniu różnic pomiędzy tymi modelami. Modele te dzielą jednak wspólne założenia odnośnie cechy latentnej oraz zmiennych obserwowalnych. Dwa fundamentalne założenia modeli zmiennej latentnej to jednowymiarowość testu (unidimensionality) oraz lokalna (warunkowa) niezależność (local independence) (Bartholomew, 1987). Wymóg jednowymiarowości testu oznacza, że statystyczna zależność pomiędzy pozycjami testowymi może być wyjaśniona przez jedną zmienną latentną, co oznacza, że pozycje testowe są statystyczne zależne w całej populacji osób testowanych i jednocześnie są statystycznie niezależne w każdej podpopulacji osób testowanych, których członkowie są homogeniczni pod względem wartości cech latentnej. Ponieważ ta niezależność jest zdefinio- 49
4 Roman KONARSKI wana dla podpopulacji osób testowanych ulokowanych w danym punkcie na skali cechy latentnej, warunek ten nazywamy lokalną niezależnością (Crocker, Algina, 1986). Celem analizy zmiennej latentnej jest znalezienie (lub test a priori określonej) takiej zmiennej latentnej, która spełnia założenie lokalnej niezależności. Obecnie obserwujemy tendencją do rozważania tych modeli pomiarowych w tabeli 1 jako specjalnych przypadków bardziej ogólnego modelu zmiennych latentnych (Bartholomew, 1987; Bartholomew, Knott, 1999; McDonald, 1999; Borsboom, i in., 2003). W obecnym artykule skupimy się na relacji pomiędzy tale zwanym dwuparametrycznym modelem IRT i modelem CFA dla zmiennych dyskretnych. W ostatnich latach kilku autorów zademonstrowało formalną (np., Takane, de Leeuw, 1987; Bock, Gibbons, Muraki, 1988; Bartholomew, 1987) oraz empiryczną (np., Knol, Berger, 1991; Hoijtink, Rooks, Wilmink, 1991; Raju, Laffitte, Byme, 2002) ekwiwalencją pomiędzy tymi modelami statystycznymi. Na najbardziej ogólnym poziomie modele IRT i CFA różnią się zakresem wykorzystania informacji zawartej w danych. Model IRT jest tak zwanym modelem pełnej informacji (full-information model), ponieważ wykorzystuje całą informację zawartą we wzorcach odpowiedzi uzyskanych z p dychotomicznych pozycji testowych. Natomiast model CFA dla zmiennych dyskretnych jest nazywany modelem ograniczonej informacji (limited-information model), ponieważ wykorzystuje jedynie informacje zawarte w korelacjach tetrachorycznych pomiędzy parami p pozycji testowych. MODEL IRT W literaturze tematu wyróżnia się kilka modeli IRT (patrz Lord, 1980; Hambelton, Swaminathan, 1985). Modele te różnią się szczególną funkcją matematyczną wyjaśniającą prawdopodobieństwo poprawnej odpowiedzi na daną pozycję testową. My rozważymy jedynie tak zwany dwuparametryczny model logistyczny (two-parameter logistic model, 2PLM). Z formalnego punktu widzenia problem analizy cechy latentnej może być sformułowany następująco: analizowane dane są zawarte w macierzy danych zawierającej obserwacje dla próby n osób na p zmiennych obserwowalnych (pozycji testowych) y» yi 2 y \ P Y _ ^21? 22 yip, r 1 i * m y * i y «2 - ynp Element macierzy danych yik są zaobserwowaną wartością zmiennej losowej yk (k = 1, 2, p) dla osoby i ( = 1, 2,..., n). W konsekwencji możemy zdefiniować yt = [ yv y 2» * jako wektor p zmiennych obserwowalnych. W naszych rozważaniach zakładamy, że zmienne yk są dychotomiczne i kodowane w następujący sposób: 50
5 Model cechy latentnej w analiziepsychometrycznej testów... 1, dla poprawnej odpowiedzi y. [0, w przeciwnym razie W modelu IRT zakładamy, że odpowiedzi na pozycję testową mogą być wyjaśnione przez model matematyczny postulujący jedną zmienną łatentną. Ta latentna cecha (zdolność) 9 posiada skalę standardową normalną (ze średnią wartością zero i odchyleniem standardowym jeden) w zakresie plus minus nieskończoności (- «>, -H»). Prawdopodobieństwo podania poprawnej odpowiedzi 3 P (6 ) na dychotomiczne zadanie testowe jest monotonicznie rosnącą i nieliniową funkcją cechy latentnej 9. Centralnym konceptem modelu IRT jest krzywa charakterystyczna pozycji testowej (item charakteristic curve, ICC). Typowa krzywa ICC posiada kształt litery S 4 tak jak krzywe ICC przedstawione na rysunku 2. Wysokość krzywej ICC powyżej danego poziomu latentnej cechy 9 reprezentuje proporcję osób testowanych na tym poziome uzdolnień, którzy mogą odpowiedzieć poprawnie na daną pozycję testową. Jak możemy zauważyć na rysunku 2, krzywa ICC określa prawdopodobieństwo poprawnej odpowiedzi P {9 ) na pozycję testową jako funkcję cechy latentnej (0), leżącej u podłoża wyniku testowego, oraz parametrów pozycji testowej. 1.0 Proporcja osób udzielająca poprawnej odpowiedzi p(0 > Cecha latentna Rysunek 2. Krzywa charakterystyczna (ICC) pozycji testowej Obecnie dominującą parametryzacją krzywej ICC jest funkcja logistyczna (Lord, 1980). W logistycznym modelu dwuparametrycznym (2PLM) zakładamy, że prawdopodobieństwo udzielenia poprawnej odpowiedzi na daną pozycję testową k zależy od dwóch parametrów krzywej ICC 3 Znaczenie terminu poprawnej odpowiedzi jest arbitralne i ma szczególne zastosowanie w sprawdzających testach edukacyjnych. W psychologicznych testach diagnostycznych hjdzie się to odnosiło się do szczególnej kategorii odpowiedzi. 4 Inne funkcje są także możliwe, na przykład, funkcja krokowa (step function) taka jak we wzorcach odpowiedzi charakteryzowanych jako simplex lub perfect Guttman scale (Guttmon, 1944). 51
6 Roman KONARSKI Pk 1+ e -D * (fl- A ) gdzie stała Z) = 1,7 jest wartością maksymalizującą dopasowanie krzywej logistycznej do ogivy rozkładu normalnego (Lord, Novick, 1969). Parametr a jest określany mianem parametru mocy dyskryminacyjnej pozycji testowej, gdyż określa różnicą w prawdopodobieństwa poprawnej odpowiedzi P( 6) pomiędzy dwoma grupami osób ulokowanych dwóch na różnych poziomach cechy latentnej 0. Chociaż parametr mocy dyskryminacyjnej a jest teoretycznie zdefiniowany w przedziale (-oo, +oo), to pozycje z negatywną lub zerową mocą dyskryminacyjną są niepożądane, a pozycje z mocą dyskryminacyjną większą niż 2,0 są bardzo rzadko obserwowane (Hambelton, Swaminathan, 1985). Pozycje testowe, które nie są efektywne w dyskryminacji pomiędzy różnymi poziomami uzdolnień, posiadają relatywnie płaskie krzywe ICC i niskie wartości parametru a. Pozycje testowe, które są efektywne w dyskryminacji pomiędzy różnymi poziomami uzdolnień posiadają relatywnie strome krzywe ICC i wysokie wartości parametru a. Parametr 3 określa trudność pozycji testowej i zwykle znajduje się w zakresie ±2,0 (Hambelton, Swaminathan, 1985). Wartość parametru 3 oznacza poziom cechy latentnej, na którym prawdopodobieństwo poprawnej odpowiedzi na pozycję testową jest równe 50 procent. Wartości 3 blisko 2,0 charakteryzują łatwe pozycje testowe, natomiast wartości fi blisko 2,0 charakteryzują relatywnie trudne pozycje testowe. Pozycje testowe z wartością 3 około 0,0 posiadają średnią trudność. MODEL CFA DLA ZMIENNYCH DYSKRETNYCH Możliwość i zalety stosowania konfirmacyjnej analizy czynnikowej (CFA) w analizie psychometrycznej testów i pozycji testowych były od dawna rozpoznane (patrz Jóreskog, 1971). Jednak tradycyjne metody analizy czynnikowej zakładają normalność wielozmiennową (multivariate normality) rozkładu analizowanych pozycji testowych. Wiąże się to z faktem, iż tradycyjne metody wykorzystują jedynie informację zawartą w macierzy kowariancji (lub korelacji Pearsona) analizowanych zmiennych. W przypadku analizy dychotomicznych pozycji testowych założenie normalności jest w oczywisty sposób pogwałcone. W konsekwencji tradycyjna analiza zmiennych dychotomicznych (oraz politomicznych) prowadziła do wielu trudności numerycznych oraz artefaktów metodologicznych. Ograniczenia tradycyjnych metod analizy czynnikowej w przypadku analizy zmiennych dyskretnych zostały przezwyciężone poprzez wykorzystanie korelacji tetrachorycznych (lub polychorycznych w przypadku zmiennych porządkowych) oraz specjalistycznych metod estymacji (Christofferson, 1975; Muthćn, 1984, Joreskog, 1990; Bartholomew, 1987). W CFA dla zmiennych dyskretnych zakładamy, że dychotomiczna pozycja testowa yk odzwierciedla jedynie nieobserwowalną zmienną ciągłą y * 9 która posiada rozkład normalny oraz próg rk : * 1, jeżeli y\ > rk y k = A.... 0, jeżeli yk < rk 52
7 Model cechy latentnej w analizie psychometrycznej testów... Gdy wykorzystujemy macierz korelacji tetrachorycznych pomiędzy zmiennymi *,, * latentnymi yk możemy zastosować analizę czynnikowy ponieważ zmienne yk spełniają założenia odnośnie normalności rozkładu przyjmowane w modelu analizy czynnikowej yk ~ Tk + + k» gdzie yk jest latentną odpowiedzią na pozycje testową yk, Tk jest stałą regresji jest ładunkiem czynnikowym pozycji testowej na latentną cechę (czynnik) 0, Xk danej pozycji testowej na 6, a k reprezentuje błąd pomiarowy. Stosując standardowe założenia modelu analizy czynnikowej odnośnie rozkładu cechy latentnej wraz z założeniami odnośnie rozkładu błędu pomiarowego (patrz Evęritt, 1984), otrzymujemy macierz kowariancji S pomiędzy zmiennymi y * jako L, = AAr +T 2, y gdzie A jest wektorem ładunków czynnikowych a 2 jest diagonalną macierzą wariancji błędu pomiarowe. Ponieważ obserwujemy jedynie zmienne dyskretne y, nie jest możliwe zidentyfikowanie diagonalnych elementów implikowanej macierzy Zy W konsekwencji diagonalne elementy macierzy 2y a diagonalne elementy macierzy xp 2 = I- diag(aar ). są zdeterminowane jako są ustalone do wartości jeden, Parametry modelu CFA dla zmiennych dyskretnych są typowo szacowane za pomocą estymatora ważonych najmniejszych kwadratów (weighted least squares, WLS) 5. RELACJA POMIĘDZY PARAMETRAMI MODELI IRT i CFA Takane i de Leeuw (1987) oraz Bartholomew (1987) niezależnie zademonstrowali, że model 2PLM oraz model CFA dla zmiennych dyskretnych są formalne ekwiwalentne. Parametry modelu 2PLM OCk 1, 2,..., p) mogą być wyrażone w postaci parametrów modelu CFA Tk,Ą., i i fik (k = ak =\Wk oraz ft gdzie Xk jest ładunkiem czynnikowym pozycji testowej k, yfk jest pierwiastkiem wariancji błędu pomiarowego pozycji testowej k, a Tk jest stałą regresji pozycji testo - jako 3 Jóreskog i Moustaki (2001) oraz Oranje (2003) ostatnio porównali empiryczne zachowanie szeregu alternatywnych estymatorów. 53
8 Roman KONARSKI wej k. Możemy także wyrazić parametry modelu CFA w postaci parametrów modelu 2PLM \= a k ( l + a 2 k ) ~ l \ oraz + ait ' 2 V * = (!+«* ) 12 PRZYKŁAD ANALIZY POZYCJI TESTOWYCH Analiza pozycji testowych jest istotnym elementem procesu konstruowania testów. Ograniczenia klasycznych indeksów jakości pozycji testowych są od dawna dobrze udokumentowane w literaturze anglojęzycznej (patrz Allen i Yen, 1979 lub Crocker i Algina, 1986). Ostatnio, ograniczenia klasycznej teorii zostały także wskazane w literaturze polskojęzycznej (patrz Homowska, 2001 lub Kryniewski, 2003). Zastosowanie IRT w analizie pozycji testowych pozwala przezwyciężyć ograniczenia klasycznych wskaźników jakości zadań testowych. Analiza pozycji testowych oparta o RT polega na szacowaniu krzywych ICC analizowanych pozycji testowych (Lord, 1980; Hambelton, 1983). W naszym przykładzie analizy pozycji testowych posłużyliśmy się danymi pochodzącymi z podłużnego badania dzieci i młodzieży kanadyjskiej (National Longitudinal Survey of Children and Youth, NLSCY). Dane, które wykorzystaliśmy pochodzą z drugiej fali tego badania, przeprowadzonej na przełomie lat 1996 i Przeanalizowaliśmy sześć pozycji testowych mierzących cechę agresji fizycznej dla n = 3284 chłopców i dziewczynek w wieku od 8 do 9 lat. Respondent, którym była osoba najbardziej poinformowana na temat wyselekcjonowanego dziecka (w większości przypadków jedno z rodziców) odpowiadał czy każde z sześciu analizowanych zachowań agresywnych było zaobserwowane u danego dziecka. Pozycje testowe wraz z proporcją zaobserwowanych zachowań są pokazane w tabeli 2. Respondenci odpowiadali na 3-stopniwej skali Likerta: 1 = nigdy; 2 = czasami; 3 = często. Na potrzeby zaprezentowanych analiz psychometrycznych odpowiedzi respondentów zostały przekodowane w następujący sposób: 0 = nigdy; 1 = czasami lub często. 54
9 Model cechy latentnej w analiziepsychometrycznej testów... Tabela 2. Pozycje testowe oraz proporcja ( p) zaobserwowanych zachowań dla próby (n = 3284) dzieci w wieku od 8 do 9 lat Pozycja (&) Treść pozycji testowej Pk Q6G bije się z rówieśnikami 0,348 Q6X reaguje ze złością, gdy inne dziecko nienaumyślnie zrani goją (na przykład, gdy wpadnie na niegonią) 0,368 Q6AA fizycznie atakuje ludzi 0,151 Q6NN kopie, gryzie, uderza inne dzieci 0,149 Q6FF grozi ludziom 0,109 Q6JJ jest okrutny lub surowy w stosunku do innych 0,108 Analizę pozycji testowych rozpoczęliśmy od testu założenia jednowymiarowości 6. Hattie (1985) argumentuje, że model CFA dla zmiennych dyskretnych może być zastosowany do określona wymiarowości pozycji testowych. Test modelu jednoczynnikowego wykazał zadawalające dopasowanie modelu do danych 7 : (9) = 31,601, p < 0,001; RMSEA = 0,028. W konsekwencji, możemy przyjąć, że założenie jednowymiarowości testu jest spełnione. Szacunki parametrów modelu CFA oraz modelu IRT są przedstawione w tabeli 3. Tabela 3. Szacunki parametrów pozycji testowych dla modeli CFA i IRT Model CFA Model IRT Pozycja (k ) 4 wi ft Q6G 0,719 0,484-0,390 1,033 0,561 Q6X 0,689 0,526-0,338 0,950 0,466 Q6AA 0,918 0,157-1,033 2,317 2,607 Q6NN 0,867 0,248-1,041 1,741 2,090 Q6FF 0,832 0,308-1,232 1,499 2,220 Q6JJ 0,803 0,355-1,238 1,348 2,078 6 Wszystkie zaprezentowane analizy przeprowadziliśmy za pomocą pakietu statystycznego Mplus 1.04 (Muthen, Muthćn, 2000). 7 W typowych zastosowaniach CFA, obok testu chi-kwadrat c;ęsto stosuje się dodatkowe statystyki dobroci dopasowania (goodness - of-fit statistics ). Jedną taką statystyką jest RMSEA (Steiger, 1990). Zastosowanie dodatkowych statystyk dobroci dopasowania modelu jest uzasadnione przez wrażliwość testu chi-kwadrat na nieistotne błędy w specyfikacji modelu w dużych próbach badawczych. 55
10 Roman KONARSKI W następnym etapie analizy przetestowaliśmy hipotezę o równości krzywych charakterystycznych dla następujących par pozycji testowych: CQ6G i CQ6X, CQ6AA i CQ6NN, oraz CQ6FF i CQ6JJ. Jeżeli dwie pozycje testowe posiadają takie same ICC to z punktu widzenia parametrów trudności i mocy dyskryminacyjnej mogą być stosowane zamiennie. Test równości krzywych charakterystycznych jest przeprowadzony poprzez test modelu jednoczynnikowego, w którym ładunki czynnikowe oraz stałe regresji są ograniczone do równości dla każdej pary pozycji testowych: ^CQ6G =\Q6 X» ^CQ6 AA ~ ^CQ6 NN ^CQ6 FF == ^CQ6 JJ» 0raZ rcq 6G "^CQ6 X ZCQ 6 AA = ZCQ 6 NN TCQ 6 FF =TCQUJ Test * ych ograniczeń może być przeprowadzony poprzez porównanie statystyki testowej # otrzymanej z testu modelu, w którym określone ograniczenia są nałożone ze statystyką testową % otrzymaną z testu modelu bez takich ograniczeń. Test modelu z nałożonymi ograniczeniami równości krzywych ICC dla par pozycji testowych dał wielkości statystyki dopasowania X 2 (15) = 42,768, p < 0,001. Ta wielkość statystyki dopasowania modelu stanowi statystycznie nieistotny spadek w dopasowaniu modelu do danych, A^2(Adf = 6) = 11,167, p > 0,05. To potwierdza, że założenie o równych krzywych ICC dla par pozycji testowych jest uzasadnione. Szacunki parametrów modelu z nałożonymi ograniczeniami na parametry pozycji testowych są przedstawione w tabeli 4. Jak możemy zauważyć w tabeli 4, pozycje testowe Q6G i Q6X posiadają umiarkowane wielkości parametrów trudność oraz mocy dyskryminacyjnej. Natomiast pozycje Q6AA i Q6NN posiadają szacunki parametru mocy dyskryminacyjnej oraz parametru trudności przekraczające wielkość 2,0, którą Hambelton i Swaminathan (1985) uważają za ekstremalną dla typowych pozycji testowych. Tabela 4. Szacunki parametrów pozycji testowych dla modeli CFA i IRT z nałożonymi ograniczeniami na parametry modelu Model CFA Model IRT Pozycja (&) A l at Pt Q6G 0,704 0,505-0,365 0,991 0,514 Q6X 0,704 0,505-0,365 0,991 0,514 Q6AA 0,896 0,197-1,039 2,019 2,341 Q6NN 0,896 0,197-1,039 2,019 2,341 Q6FF 0,819 0,329-1,233 1,428 2,150 Q6JJ 0,819 0,329-1,233 1,428 2,150 56
11 Model cechy latentnej w analizie psychometrycznej testów... Wykresy krzywych ICC dla modelu IRT oraz funkcji regresji dla modelu CFA są pokazane na rysunku 3. Jak możemy zauważyć oba modele psychoraetryczne dają porównywalny obraz funkcjonowania analizowanych pozycji testowych. Pozycje Q6G i Q6X najlepiej różnicują dzieci charakteryzujące się umiarkowanym poziomem agresji, natomiast pozostałe pozycje testowe (Q6AA, Q6NN, Q6FF i Q6JJ) jedynie różnicują dzieci charakteryzujące się relatywnie wysokim poziomem agresji. p (e CQ6G i CQ6X IR CQ6AA i CQ6NN CQ6FF i CQ6JJ I I I I i y 2 1 ' 0-1 " -2 - CQ6G icq8x CQ6AA ł CQ6NN CQ6FFICQ6JJ CF. -, * -3 i 0.00 * Rysunek 3.Krzywe ICC dla modelu IRT oraz funkcje regresji dla modelu CFA LITERATURA Allen M.J., Yen W.M., (1979), Introduction to measurement theory. Monterey, CA: BrooksCole. Bartholomew D.J., (1987), Latent variable models and factor analysis. New York: Oxford University Press. Bartholomew D.J., Knott, M., (1999), Latent variable models and factor analysis (2nd ed.). London: Arnold Kendall s Library of Statistics. Bock R.D., (1972), Estimating item parameters and latent ability when responses are scored in two or more nominal categories.psychometrika, 37, Bock R.D., Gibbons R., Muraki E (1988), Full-information item factor analysis. Applied Psychological Measurement, 12, Bollen K., Lennox, R., (1991), Conventional wisdom on measurement: A structural equation perspective. Psychological Bulletin, 110,
12 Roman KONARSKI Borsboom D., Mellenbergh, van Heerden J., (2003), The theoretical status of latent variables. Psychological Review, 110, Christofferson A., (1975), Factor analysis of dichotomized variables. Psychometrika, 40, Goodman L.A., (1974), Exploratory latent structure analysis using both identifiable and unidentifiable parameters. Biometrika, 61, Green B.F. (1951). A general solution for the latent class model of latent structure analysis. Psychometrika, 16, Crocker L., Algina J., (1986), Introduction to classical and modem test theory. San Francisco, CA: Holt, Rinehart and Winston. Guttman L.A., (1944), A basis for scaling qualitative data. American Sociological Review, 9, Hambelton R.K. (Ed.)., (1983), Applications of item response theory. Vancouver, BC: Educational Research Institute of British Columbia. Hambelton R.K., Swaminathan H., (1985), Item response theory: Principles and applications. Boston: Kluwer-Nijhoff Publishing. Hattie J., (1985), Methodology review: Assessing unidimensionality of test and items. Applied Psychological Measurement, 9, Hoijtink H., Rooks G., Wilmink F.W, (1999), Confirmatory factor analysis of items with dichotomous response format using the multidimensional Rasch model. Psychological Methods, 4, Hornowska E., (1989), Operacjonalizacja wielkości psychologicznych. Założenia- struktura -konsekwencje. Wrocław:Ossolineum. Homowska E., (2001), Testy psychologiczne. Teoria i praktyka.warszawa: Scholar. Jdreskog K.G., (1971), Statistical analysis of sets of congeneric tests. Psychometrika, 36, Jbreskog K.G., (1990), New developments in LISREL: analysis of ordinal variables using polychoric correlations and weighted least squares. Quality & Quantity, 24, Jbreskog K.G., Mustaki I., (2001), Factor analysis of ordinal variables: A comparison of three approaches. Multivariate Behavioral Research, 36, Knol D.L., Berger M.P., (1991), Empirical comparison between factor analysis and multidimensional item response models. Multivariate Behavioral Research. 26, Kryniewski M., (2003), Klasyczne i probabilistyczne miary jakości zadania testowego- nowe możliwości, [w:] B. Niemierko (red.), Trafność pomiaru jako podstawa obiektywizacji egzaminów szkolnych. Łódź: Druk. Lawley D.N., (1943), On problems connected with item selection and test construction. Proceedings of the Royal Society of Edinburgh, 61, Lawley D.N., Maxwell A.E., (1963), Factor analysis as a statistical method. London: Butterworth. Lazarsfeld P.F., Henry N.W., (1968), Latent structure analysis. New York: Houghton-Miffli Lazarsfeld P.F., (1950), The logical and mathematical foundations of latent structure analysis, [w:] S.A. Stouffer, L. Guttman, E.A. Suchman, P.F, Lazarsfeld, S.A. Star, J.A. Clausen. (Eds.). Measurement and prediction. Princeton, NJ: Princeton University Press. Lord F.M., (1953), The relation of test score to the trait underlying the test.educational and Psychological Measurement, 13, Lord F.M., (1980), Applications of item response theory to practical testing problems. Hillsdale, NJ: LEA Publishers. Lord F.M., Novick, M.R., (1968), Statistical theories of mental test scores. New York: Addison Wesley. McDonald R.P, (1999), Test theory: A unified treatment.mahwah, NJ: Erlbaum. 58
13 Model cechy latentnej w analizie psychometryczjiej testów... McArdle J.J., McDonald R.P., (1984), Some Algebraic Properties of the Reticular Action Model. British Journal of Mathematical and Statistical Psychology, 37, Mellenbergh G.J., (1994), A unidimensional latent trait model for continuous item responses. Multivariate Behavioral Research, 29, Muthdn B.O., (1984), A general structural equation model with dichotomous, ordered categorical and continuous latent variable indicators.psychometrika, 49, Muthen L.K., Muthdn B.O., ( ), Mplus: Statistical analysis with latent variables. Los Angeles, CA: Muthen & Muthdn. Nowak S., (1965), Pojęcia i wskaźniki [w:] S. Nowak (red.), Studia z metodologii nauk społecznych. Warszawa: PWN. Oranje A., (2003), Comparison of estimation methods in factor analysis with categorized variables: Applications to NAEP data.educational Testing Service. Raju N.S., Laffitte L.J., Byrne B.M., (2002), Measurement equivalence: A comparison of methods based on confirmatory factor analysis and item response theory. Journal of Applied Psychology, 87, Rasch G., (1960), Probabilistic models for some intelligence and attainment tests. Copenhagen: The Danish Institute for Educational research. Samejima F., (1969), Estimation of latent ability using a response pattern of graded scores. Psychometrika, Monograph, 17. Spearman C., (1904), General intelligence objectively determined and measured. American Journal of Psychology, 15, Staiger J.H., (1999), Structural model evaluation and modification. An interval estimation approach..multivariate Behavioral Research, 25, Takane Y., de Leeuw J., (1987), On the relationship between item response theory and factor analysis of discredited variables.psychometrika, 52,
MODEL STRUKTURALNY RELACJI MIĘDZY SATYSFAKCJĄ
MODEL STRUKTURALNY RELACJI MIĘDZY SATYSFAKCJĄ I LOJALNOŚCIĄ WOBEC MARKI Adam Sagan Akademia Ekonomiczna w Krakowie, Katedra Analizy Rynku i Badań Marketingowych Wstęp Modelowanie strukturalne ma wielorakie
5. WNIOSKOWANIE PSYCHOMETRYCZNE
5. WNIOSKOWANIE PSYCHOMETRYCZNE Model klasyczny Gulliksena Wynik otrzymany i prawdziwy Błąd pomiaru Rzetelność pomiaru testem Standardowy błąd pomiaru Błąd estymacji wyniku prawdziwego Teoria Odpowiadania
Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;
LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny
Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe
Wprowadzenie do teorii ekonometrii Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe Zajęcia Wykład Laboratorium komputerowe 2 Zaliczenie EGZAMIN (50%) Na egzaminie obowiązują wszystkie informacje
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe i teoria prawdopodobieństwa 3. Populacje i próby danych 4. Testowanie hipotez i estymacja parametrów 5. Najczęściej wykorzystywane testy statystyczne
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
MODELE LINIOWE. Dr Wioleta Drobik
MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą
KORELACJE I REGRESJA LINIOWA
KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem
Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
Oszacowanie umiejętności teta oraz wyskalowanie osi w metodzie IRT dla potrzeb obliczania parametrów zadań
Sławomir Sapanowski Okręgowa Komisja Egzaminacyjna w Łodzi Oszacowanie umiejętności teta oraz wyskalowanie osi w metodzie IRT dla potrzeb obliczania parametrów zadań W ostatnim czasie wśród ekspertów zajmujących
WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno
WSTĘP DO REGRESJI LOGISTYCZNEJ Dr Wioleta Drobik-Czwarno REGRESJA LOGISTYCZNA Zmienna zależna jest zmienną dychotomiczną (dwustanową) przyjmuje dwie wartości, najczęściej 0 i 1 Zmienną zależną może być:
ćwiczenia 30 zaliczenie z oceną
Wydział: Psychologia Nazwa kierunku kształcenia: Psychologia Rodzaj przedmiotu: podstawowy Opiekun: dr Krzysztof Fronczyk Poziom studiów (I lub II stopnia): Jednolite magisterskie Tryb studiów: Stacjonarne
PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych
Wprowadzenie do analizy korelacji i regresji
Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących
Monte Carlo, bootstrap, jacknife
Monte Carlo, bootstrap, jacknife Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej: http://www.ssc.wisc.edu/~bhansen/econometrics/ Monte Carlo: rozdział 8.8, 8.9 Bootstrap: rozdział
Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego
Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Współczynnik korelacji opisuje siłę i kierunek związku. Jest miarą symetryczną. Im wyższa korelacja tym lepiej potrafimy
STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE
STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss
Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną. laboratoria 30 zaliczenie z oceną
Wydział: Psychologia Nazwa kierunku kształcenia: Psychologia Rodzaj przedmiotu: podstawowy Opiekun: dr Andrzej Tarłowski Poziom studiów (I lub II stopnia): Jednolite magisterskie Tryb studiów: Stacjonarne
Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii
SPIS TREŚCI Przedmowa... 11 Wykaz symboli... 15 Litery alfabetu greckiego wykorzystywane w podręczniku... 15 Symbole wykorzystywane w zagadnieniach teorii mnogości (rachunku zbiorów)... 16 Symbole stosowane
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y
Metacognitive Awarness Inventory. Kwestionariusz metapoznania The Metacognitive Questionnaire
Psychologia Spo eczna 2016 tom 11 4 (39) strony 509 526 Instytut Psychologii, Uniwersytet Gda ski metapoznawcze Ja odchylenia od racjonalno ci narz dzie do pomiaru MJ MJ-24 Metacognitive Awarness Inventory
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Początki. Items Response Theory (IRT) [Teoria Odpowiedzi na Zadania Testowe] Lata 50 XX wieku równolegle wymyślili: psychometra Frederic M.
PAZUR 205 Items Response Theory (IRT) [Teoria Odpowiedzi na Zadania Testowe] dr Paweł Kleka Instytut Psychologii UAM 205.04.24 Początki Lata 50 XX wieku równolegle wymyślili: psychometra Frederic M. Lord
WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno
WERYFIKACJA MODELI MODELE LINIOWE Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno ANALIZA KORELACJI LINIOWEJ to NIE JEST badanie związku przyczynowo-skutkowego, Badanie współwystępowania cech (czy istnieje
Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice
Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice Przedmowa do wydania polskiego Przedmowa CZĘŚĆ I. PODSTAWY STATYSTYKI Rozdział 1 Podstawowe pojęcia statystyki
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
laboratoria 24 zaliczenie z oceną
Wydział: Psychologia Nazwa kierunku kształcenia: Psychologia Rodzaj przedmiotu: podstawowy Opiekun: dr Andrzej Tarłowski Poziom studiów (I lub II stopnia): Jednolite magisterskie Tryb studiów: Niestacjonarne
Testowanie hipotez statystycznych
9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :
Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna
Regresja wieloraka Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna zmienna niezależna (można zobrazować
Własności statystyczne regresji liniowej. Wykład 4
Własności statystyczne regresji liniowej Wykład 4 Plan Własności zmiennych losowych Normalna regresja liniowa Własności regresji liniowej Literatura B. Hansen (2017+) Econometrics, Rozdział 5 Własności
Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu
Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)
Rodzaje testów. Testy. istnieje odpowiedź prawidłowa. autoekspresja brak odpowiedzi prawidłowej ZGADYWANIE TRAFNOŚĆ SAMOOPISU
Rodzaje testów Testy wiedza umiejętności zdolności właściwości poznawcze właściwości afektywne uczucia postawy osobowość emocje wierzenia istnieje odpowiedź prawidłowa autoekspresja brak odpowiedzi prawidłowej
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...
Natalia Neherbecka. 11 czerwca 2010
Natalia Neherbecka 11 czerwca 2010 1 1. Konsekwencje heteroskedastyczności i autokorelacji 2. Uogólniona MNK 3. Stosowalna Uogólniona MNK 4. Odporne macierze wariancji i kowariancji b 2 1. Konsekwencje
WYKŁAD 2: PSYCHOLOGIA POZNAWCZA JAKO NAUKA EKSPERYMENTALNA
WYKŁAD 2: PSYCHOLOGIA POZNAWCZA JAKO NAUKA EKSPERYMENTALNA Psychologia poznawcza dr Mateusz Hohol METODA NAUKOWA (1) problem badawczy (2) hipoteza (4) analiza danych (3) eksperyment (5) wniosek: potwierzenie
Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22
Spis treści Przedmowa do wydania pierwszego.... 11 Przedmowa do wydania drugiego.... 15 Wykaz symboli.... 17 Litery alfabetu greckiego wykorzystywane w podręczniku.... 17 Symbole wykorzystywane w zagadnieniach
Analiza regresji - weryfikacja założeń
Medycyna Praktyczna - portal dla lekarzy Analiza regresji - weryfikacja założeń mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof.
Psychometria PLAN NAJBLIŻSZYCH WYKŁADÓW. Co wyniki testu mówią nam o samym teście? A. Rzetelność pomiaru testem. TEN SLAJD JUŻ ZNAMY
definicja rzetelności błąd pomiaru: systematyczny i losowy Psychometria Co wyniki testu mówią nam o samym teście? A. Rzetelność pomiaru testem. rozkład X + błąd losowy rozkład X rozkład X + błąd systematyczny
Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski
Narzędzia statystyczne i ekonometryczne Wykład 1 dr Paweł Baranowski Informacje organizacyjne Wydział Ek-Soc, pok. B-109 pawel@baranowski.edu.pl Strona: baranowski.edu.pl (w tym materiały) Konsultacje:
Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska
Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska Anna Stankiewicz Izabela Słomska Wstęp- statystyka w politologii Rzadkie stosowanie narzędzi statystycznych Pisma Karla Poppera
Analiza korespondencji
Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy
W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.
W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne. dr hab. Jerzy Nakielski Katedra Biofizyki i Morfogenezy Roślin Plan wykładu: 1. Etapy wnioskowania statystycznego 2. Hipotezy statystyczne,
Latentna moc różnicująca zadań z testów matematycznych dla młodzieży uzdolnionej
XVI Konferencja Diagnostyki Edukacyjnej, Toruń 200 Elżbieta Ostaficzuk Mazowieckie Samorządowe Centrum Doskonalenia Nauczycieli Grażyna Śleszyńska Mazowieckie Samorządowe Centrum Doskonalenia Nauczycieli
ZADANIA ROZRYWAJĄCE W TESTACH. 1. Co to jest zadanie rozrywające?
Ewa Stożek OKE Łódź ZADANIA ROZRYWAJĄCE W TESTACH Na podstawie analizy danych empirycznych ze sprawdzianu i roku wyodrębniono zadania odpowiedzialne za dwumodalność rozkładu wyników tych testów. Takie
Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Regresja wielokrotna Model dla zależności liniowej: Y=a+b 1 X 1 +b 2 X 2 +...+b n X n Cząstkowe współczynniki regresji wielokrotnej: b 1,..., b n Zmienne niezależne (przyczynowe): X 1,..., X n Zmienna
Stanisław Cichocki. Natalia Nehrebecka
Stanisław Cichocki Natalia Nehrebecka 1 2 3 1. Wprowadzenie do danych panelowych a) Charakterystyka danych panelowych b) Zalety i ograniczenia 2. Modele ekonometryczne danych panelowych a) Model efektów
Metodologia badań psychologicznych. Wykład 12. Korelacje
Metodologia badań psychologicznych Lucyna Golińska SPOŁECZNA AKADEMIA NAUK Wykład 12. Korelacje Korelacja Korelacja występuje wtedy gdy dwie różne miary dotyczące tych samych osób, zdarzeń lub obiektów
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y
Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8
Stanisław Cichocki Natalia Nehrebecka Zajęcia 8 1. Testy diagnostyczne 2. Testowanie prawidłowości formy funkcyjnej modelu 3. Testowanie normalności składników losowych 4. Testowanie stabilności parametrów
Elementy statystyki wielowymiarowej
Wnioskowanie_Statystyczne_-_wykład Spis treści 1 Elementy statystyki wielowymiarowej 1.1 Kowariancja i współczynnik korelacji 1.2 Macierz kowariancji 1.3 Dwumianowy rozkład normalny 1.4 Analiza składowych
166 Wstęp do statystyki matematycznej
166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej
Regresja logistyczna (LOGISTIC)
Zmienna zależna: Wybór opcji zachodniej w polityce zagranicznej (kodowana jako tak, 0 nie) Zmienne niezależne: wiedza o Unii Europejskiej (WIEDZA), zamieszkiwanie w regionie zachodnim (ZACH) lub wschodnim
weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)
PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na
15. PODSUMOWANIE ZAJĘĆ
15. PODSUMOWANIE ZAJĘĆ Efekty kształcenia: wiedza, umiejętności, kompetencje społeczne Przedmiotowe efekty kształcenia Pytania i zagadnienia egzaminacyjne EFEKTY KSZTAŁCENIA WIEDZA Wykazuje się gruntowną
Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap
Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap Magdalena Frąszczak Wrocław, 21.02.2018r Tematyka Wykładów: Próba i populacja. Estymacja parametrów z wykorzystaniem metody
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re
Wykład 4 Wybór najlepszej procedury. Estymacja parametrów regresji z wykorzystaniem metody bootstrap. Wrocław, 22.03.2017r Wybór najlepszej procedury - podsumowanie Co nas interesuje przed przeprowadzeniem
Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku
Przykład 2 Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku Sondaż sieciowy analiza wyników badania sondażowego dotyczącego motywacji w drodze do sukcesu Cel badania: uzyskanie
Metody probabilistyczne
Metody probabilistyczne 13. Elementy statystki matematycznej I Wojciech Kotłowski Instytut Informatyki PP http://www.cs.put.poznan.pl/wkotlowski/ 17.01.2019 1 / 30 Zagadnienia statystki Przeprowadzamy
Zadania rozrywające w testach
Ewa Stożek Okręgowa Komisja Egzaminacyjna w Łodzi Zadania rozrywające w testach Na podstawie analizy danych empirycznych ze sprawdzianu i roku wyodrębniono zadania odpowiedzialne za dwumodalność rozkładu
Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.
Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ
Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ
Współczynnik korelacji Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Własności współczynnika korelacji 1. Współczynnik korelacji jest liczbą niemianowaną 2. ϱ 1,
Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa
Spis treści Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa Romuald Kotowski Katedra Informatyki Stosowanej PJWSTK 2009 Spis treści Spis treści 1 Wstęp Bardzo często interesujący
10. Podstawowe wskaźniki psychometryczne
10. Podstawowe wskaźniki psychometryczne q analiza własności pozycji testowych q metody szacowania mocy dyskryminacyjnej q stronniczość pozycji testowych q własności pozycji testowych a kształt rozkładu
( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:
ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość
Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka
Analiza współzależności zjawisk dr Marta Kuc-Czarnecka Wprowadzenie Prawidłowości statystyczne mają swoje przyczyny, w związku z tym dla poznania całokształtu badanego zjawiska potrzebna jest analiza z
Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.
tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1
Dodatek 3 Oprogramowanie przeznaczone do analizy IRT
Dodatek 3 Oprogramowanie przeznaczone do analizy IRT Paulina Skórska, Instytut Badań Edukacyjnych Karolina Świst, Instytut Badań Edukacyjnych W Tabeli D 3.1 przedstawiono opis oprogramowania przeznaczonego
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2
STATYSTYKA I DOŚWIADCZALNICTWO Wykład Parametry przedziałowe rozkładów ciągłych określane na podstawie próby (przedziały ufności) Przedział ufności dla średniej s X t( α;n 1),X + t( α;n 1) n s n t (α;
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8 Regresja wielokrotna Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X 1, X 2, X 3,...) na zmienną zależną (Y).
Zmienne zależne i niezależne
Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }
Kierunek i poziom studiów: Biologia, poziom drugi Sylabus modułu: Metody statystyczne w naukach przyrodniczych
Uniwersytet Śląski w Katowicach str. 1 Kierunek i poziom studiów: Biologia, poziom drugi Sylabus modułu: Metody statystyczne w naukach przyrodniczych kod modułu: 2BL_02 1. Informacje ogólne koordynator
Zależność. przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna),
Zależność przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna), funkcyjna stochastyczna Korelacja brak korelacji korelacja krzywoliniowa korelacja dodatnia korelacja ujemna Szereg korelacyjny numer
Regresja i Korelacja
Regresja i Korelacja Regresja i Korelacja W przyrodzie często obserwujemy związek między kilkoma cechami, np.: drzewa grubsze są z reguły wyższe, drewno iglaste o węższych słojach ma większą gęstość, impregnowane
Testowanie hipotez statystycznych. Wnioskowanie statystyczne
Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy
P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?
2 Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia czy pomiędzy zmiennymi istnieje związek/zależność. Stosujemy go w sytuacji, kiedy zmienna zależna mierzona jest na skali
Statystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje
Analiza współzależności zjawisk
Analiza współzależności zjawisk Informacje ogólne Jednostki tworzące zbiorowość statystyczną charakteryzowane są zazwyczaj za pomocą wielu cech zmiennych, które nierzadko pozostają ze sobą w pewnym związku.
PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROCŁAWIU RESEARCH PAPERS OF WROCŁAW UNIVERSITY OF ECONOMICS
PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROCŁAWIU RESEARCH PAPERS OF WROCŁAW UNIVERSITY OF ECONOMICS nr 469 207 Taksonomia 29 ISSN 899-392 Klasyfikacja i analiza danych teoria i zastosowania e-issn
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
Analiza składowych głównych. Wprowadzenie
Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących
WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ
WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ Dana jest populacja generalna, w której dwuwymiarowa cecha (zmienna losowa) (X, Y ) ma pewien dwuwymiarowy rozk lad. Miara korelacji liniowej dla zmiennych (X, Y
MODEL POMIAROWY SATYSFAKCJI I LOJALNOŚCI
MODEL POMIAROWY SATYSFAKCJI I LOJALNOŚCI Adam Sagan Akademia Ekonomiczna w Krakowie, Katedra Analizy Rynku i Badań Marketingowych Wstęp Zaletą stosowania konfirmacyjnej analizy czynnikowej (CFA) w porównaniu
ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x
ZJAZD 4 KORELACJA, BADANIE NIEZALEŻNOŚCI, ANALIZA REGRESJI Analiza korelacji i regresji jest działem statystyki zajmującym się badaniem zależności i związków pomiędzy rozkładami dwu lub więcej badanych
Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak
Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak Autor prezentuje spójny obraz najczęściej stosowanych metod statystycznych, dodatkowo omawiając takie
K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.
Sprawdzian 2. Zadanie 1. Za pomocą KMNK oszacowano następującą funkcję produkcji: Gdzie: P wartość produkcji, w tys. jp (jednostek pieniężnych) K wartość kapitału zaangażowanego w proces produkcji, w tys.
Testy nieparametryczne
Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia
Karta (sylabus) modułu/przedmiotu Inżynieria Materiałowa Studia II stopnia Specjalność: Inżynieria Powierzchni
Karta (sylabus) modułu/przedmiotu Inżynieria Materiałowa Studia II stopnia Specjalność: Inżynieria Powierzchni Przedmiot: Statystyczne Sterowanie Procesami Rodzaj przedmiotu: Obowiązkowy Kod przedmiotu:
Ekonometria Ćwiczenia 19/01/05
Oszacowano regresję stopy bezrobocia (unemp) na wzroście realnego PKB (pkb) i stopie inflacji (cpi) oraz na zmiennych zero-jedynkowych związanymi z kwartałami (season). Regresję przeprowadzono na danych
Testowanie hipotez statystycznych.
Bioinformatyka Wykład 9 Wrocław, 5 grudnia 2011 Temat. Test zgodności χ 2 Pearsona. Statystyka χ 2 Pearsona Rozpatrzmy ciąg niezależnych zmiennych losowych X 1,..., X n o jednakowym dyskretnym rozkładzie
Testowanie hipotez statystycznych.
Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie
Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału
Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału Magdalena Frąszczak Wrocław, 22.02.2017r Zasady oceniania Ćwiczenia 2 kolokwia (20 punktów każde) 05.04.2017 oraz 31.05.2017 2 kartkówki
Jak sprawdzić normalność rozkładu w teście dla prób zależnych?
Jak sprawdzić normalność rozkładu w teście dla prób zależnych? W pliku zalezne_10.sta znajdują się dwie zmienne: czasu biegu przed rozpoczęciem cyklu treningowego (zmienna 1) oraz czasu biegu po zakończeniu
Stanisław Cichocki. Natalia Nehrebecka. Wykład 9
Stanisław Cichocki Natalia Nehrebecka Wykład 9 1 1. Dodatkowe założenie KMRL 2. Testowanie hipotez prostych Rozkład estymatora b Testowanie hipotez prostych przy użyciu statystyki t 3. Przedziały ufności
Wykład 12 Testowanie hipotez dla współczynnika korelacji
Wykład 12 Testowanie hipotez dla współczynnika korelacji Wrocław, 23 maja 2018 Współczynnik korelacji Niech będą dane dwie próby danych X = (X 1, X 2,..., X n ) oraz Y = (Y 1, Y 2,..., Y n ). Współczynnikiem
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012
Wykład 3 Hipotezy statystyczne
Wykład 3 Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu obserwowanej zmiennej losowej (cechy populacji generalnej) Hipoteza zerowa (H 0 ) jest hipoteza