Wykorzystanie teorii odpowiedzi na wiązki zadań (Testlet Response Theory) w analizie wyników testów egzaminacyjnych
|
|
- Michalina Sowa
- 7 lat temu
- Przeglądów:
Transkrypt
1 Przemysław Majkut Maciej Koniewski Paulina Skórska Instytut Badań Edukacyjnych XXI Konferencja Diagnostyki Edukacyjnej, Bydgoszcz 2015 Wstęp Wykorzystanie teorii odpowiedzi na wiązki zadań (Testlet Response Theory) w analizie wyników testów egzaminacyjnych W testach egzaminacyjnych powszechnie wykorzystuje się wiązki zadań (testlets). Głównym elementem wiązki zadań jest rdzeń (np. fragment tekstu, wykres, mapa, rysunek lub inny element graficzny). Do treści zawartych w rdzeniu zadawane są pytania (zadania testowe). Odpowiedzi na nie są ze sobą związane, tzn. wybór jednej z odpowiedzi może sugerować poprawną odpowiedź na pozostałe pytania w ramach wiązki. Z tego powodu zadania zamknięte w wiązkę mogą generować wariancję wyników testu inną niż związaną z różnicami w poziomie badanej umiejętności (construct irrelevant variance, CIV), ponieważ złamane może być założenie o lokalnej niezależności w ramach wiązki zadań. Założenie o lokalnej niezależności zadań jest podstawowym założeniem teorii odpowiedzi na pozycje testowe (item response theory, IRT). Założenie to jest spełnione, gdy żadne z zadań w teście (treść zadania lub zestaw dostępnych odpowiedzi) nie stanowi wskazówki do prawidłowego rozwiązania innego zadania. Innymi słowy, gdy przy danym poziomie umiejętności ucznia odpowiedź na jedno zadanie jest statystycznie niezależna od odpowiedzi na inne zadanie. Złamanie założenia o lokalnej niezależności może prowadzić do błędnych oszacowań parametrów zadań i umiejętności uczniów (Li, Bolt i Fu, 2006). Wiązkowanie zadań w testach stanowi problem w przypadku szacowania parametrów zadań i poziomu umiejętności uczniów za pomocą modeli IRT. Wykorzystanie modeli IRT nie jest standardem postępowania w przypadku opracowywania wyników testów w ramach polskiego systemu egzaminów zewnętrznych. Są jednak na dużą skalę wykorzystywane w ramach projektów badawczych, realizowanych w Instytucie Badań Edukacyjnych (IBE). Jako najważniejsze polskie przykłady analiz wyników egzaminacyjnych z wykorzystaniem modeli IRT należy wskazać opracowywanie wskaźników edukacyjnej wartości dodanej (EWD, ewd.edu.pl) oraz porównywalnych wyników egzaminacyjnych (PWE, pwe.ibe.edu.pl). Jednym ze sposobów radzenia sobie ze złamaniem założenia o lokalnej niezależności w ramach wiązki zadań jest stosowanie modeli statystycznych uwzględniających powiązanie zadań testowych w wiązki. Modele tego typu zostały opracowane w ramach teorii odpowiedzi na wiązki zadań (testlet response theory, TRT, Wainer, Bradlow i Wang, 2007). 416
2 Zastosowania diagnozy edukacyjnej W polskiej literaturze naukowej brak jest opracowań dotyczących modeli TRT oraz sposobów ich wykorzystania w szacowaniu parametrów zadań i umiejętności uczniów. Prezentowany materiał jest pierwszą próbą starającą się wypełnić tę lukę. Zaprezentowane zostaną podstawowe informacje dotyczące modeli TRT. Dodatkowo porównane zostaną oszacowania parametrów zadań i umiejętności uczniów, wyliczone na podstawie modeli TRT i tradycyjnych modeli IRT. Zakres i korzyści stosowania wiązek zadań Twórcy standaryzowanych testów chętnie stosują wiązki zadań, ponieważ stanowią one efektywny sposób na przygotowywanie nowych zadań oraz są łatwe w procesie przeprowadzania testu. Tabela 1 prezentuje liczbę wiązek zadań w arkuszach z egzaminu gimnazjalnego z lat Wainer, Bradlow i Du (2000) podkreślają także, że za tworzeniem wiązek zadań przemawia redukcja atomistycznej natury pojedynczego zadania testowego. Pojedynczym zadaniom wielokrotnego wyboru (multiple choice questions, MCQ) zarzuca się często, że są oderwane od jakiegokolwiek kontekstu. Wiązki dostarczają kontekstowych informacji, dających głębszy i bardziej kompleksowy wgląd w naturę problemu rozwiązywanego przez ucznia. Zakłada się, że wiązki dobrze sprawdzają się w pomiarze procesów umysłowych, wiedzy i umiejętności wyższego rzędu i tych bardziej złożonych. Dzięki temu wiązki zadań w większym stopniu mogą reprezentować badaną umiejętność ucznia, co wpływa na podnoszenie trafności zarówno wiązki, jak i całego testu. Tabela 1. Wiązki zadań w arkuszach egzaminu gimnazjalnego w latach Część egzaminu Rok L. wiązek L. pytań Część egzaminu Rok L. wiązek L. pytań humanistyczna matematyka matematyczno-przyrodnicza j. polski humanistyczna przedmioty przyrodnicze matematyczno-przyrodnicza historia i WOS humanistyczna matematyka matematyczno-przyrodnicza j. polski humanistyczna przedmioty przyrodnicze matematyczno-przyrodnicza historia i WOS humanistyczna matematyka matematyczno-przyrodnicza j. polski humanistyczna przedmioty przyrodnicze matematyczno-przyrodnicza historia i WOS humanistyczna matematyka matematyczno-przyrodnicza j. polski humanistyczna przedmioty przyrodnicze matematyczno-przyrodnicza historia i WOS
3 XXI Konferencja Diagnostyki Edukacyjnej, Bydgoszcz 2015 Wiązki zadań mają także zalety dla uczniów. Najważniejsza to krótszy czas potrzebny na zapoznanie się z treścią zadań. Gdy istnieje wspólna treść do kilku zadań (wspólny rdzeń), uczeń zyskuje więcej czasu na zapoznanie się z nimi niż w sytuacji, gdy do każdego zadania podana jest osobna treść (Wainer, Bradlow i Wang, 2007). Negatywne skutki ignorowania wiązek zadań Ignorowanie wiązek zadań podczas szacowania parametrów zadań i umiejętności uczniów z użyciem modeli IRT może prowadzić do błędnych oszacowań rzetelności i błędów standardowych poziomu umiejętności uczniów (Bradlow, Wainer i Wang, 1999; Marais i Andrich, 2008; Sireci, Thissen i Wainer, 1991; Wainer i Wang, 2000; Yen, 1993). Ignorowanie wiązek zadań prowadzi także do niepoprawnego zrównywania wyników testów (Lee, Kolen, Frisbie i Ankenmann, 2002; Li, Bolt i Fu, 2005), błędnej interpretacji wielkości parametrów dyskryminacji zadań (Bradlow, Wainer i Wang, 1999; Wainer i Wang, 2000) oraz błędnej diagnozy zadań jako niedopasowanych do struktury danych (Marais i Andrich, 2008). Nawet jeśli oszacowania parametrów zadań, jak i poziomu umiejętności uczniów z modelu ignorującego oraz modelu uwzględniającego wiązkowanie zadań są zbliżone lub nawet identyczne, to funkcja informacyjna z modelu ignorującego wiązki zadań będzie niewłaściwa (Ip, 2010; Wainer i Wang, 2000). Negatywy efekt wiązkowania zadań dla szacowania parametrów zadań i poziomu umiejętności uczniów może zostać dodatkowo wzmocniony w sytuacji, gdy prawidłowa odpowiedź do zadań w wiązce jest oznaczona zawsze tym samym symbolem, np. A, A, A (Koniewski, Majkut i Skórska, 2014). Na przykładzie analizy wyników części egzaminu z historii i wiedzy o społeczeństwie z 2013 r. wykazano, że w wiązce trzech zadań, w której poprawne odpowiedzi oznaczone są takim samym symbolem, poprawna odpowiedź na dwa z nich obniża szansę na poprawną odpowiedź na trzecie zadanie w wiązce o 27-52%, przy kontroli poziomu umiejętności ucznia. Szansa udzielenia poprawnej odpowiedzi na trzecie zadanie w wiązce jest niższa w przypadku zadań o większej trudności. Dodatkowo, gdy cała wiązka zadań ma cechy, które wpływają na zróżnicowane funkcjonowanie zadań (differential item functioning, DIF), między grupami zdających o określonych cechach wykorzystywanie wiązek może prowadzić do uzyskiwania stronniczych wyników, silniej niż w przypadku pojedynczych pytań obciążonych efektem DIF. Dlatego nowo tworzone wiązki zadań powinny podlegać wnikliwej ocenie, zarówno treściowej, jak i statystycznej, na podstawie wyników pilotażu. Metody radzenia sobie z problemem łamania założenia o lokalnej niezależności w ramach wiązek zadań Negatywne konsekwencje złamania założenia o lokalnej niezależności w przypadku analiz IRT stały się impulsem do poszukiwania metod, które pozwalałaby na szacowanie parametrów zadań i uczniów z uwzględnieniem wiązkowania zadań. Można wyróżnić dwa typy metod analizy wiązek zadań: zorientowane na wynik i zorientowane na zadania (Wilson i Adams 1995). 418
4 Zastosowania diagnozy edukacyjnej W przypadku pierwszego typu metodą postępowania jest sumowanie punktów za zadania w ramach wiązki i tworzenie z nich jednego zadania, tzw. superzadania (Bishop i Omar, 2002; Marais i Andrich, 2008; Sireci, Thissen, Wainer, 1991; Zenisky i in., 2002). Do analizy takich zadań kodowanych politomicznie stosuje się jednowymiarowe modele IRT do zadań wielopunktowych (najczęściej generalized partial credit model, GPCM; Muraki, 1992). W przypadku krótkich testów rozwiązanie to ma tę wadę, że pomniejsza pulę zadań, na podstawie których szacowany jest poziom konstruktu głównego, przez co obniża precyzję jego pomiaru. Nie jest bowiem brany pod uwagę wzór odpowiedzi ucznia na zadania składające się na wiązkę (Yen, 1993). Stosowanie metody sumowania zadań jest krytykowane ze względu na negatywne konsekwencje stosowania tego podejścia (m.in. Eckes, 2014). Należy jednak wskazać, że niewątpliwą korzyścią jest tu prostota modelu i ekonomia obliczeń. Metoda ta stosowana jest w analizach prowadzonych w ramach przywołanych we wstępie projektów badawczych EWD i PWE. Metody analizy wyników testów z wiązkowaniem zorientowane na zadania zachowują informację o wzorze odpowiedzi ucznia na zadania składające się na wiązkę. Ich główną zasadą jest wprowadzanie dodatkowych wymiarów (czynników specyficznych wiązki, testlet factors), które pozwalają modelować wariancję specyficzną dla wiązki zadań równocześnie z wariancją właściwą dla czynnika głównego (Bradlow, Wainer i Wang, 1999; Wainer, Bradlow i Du, 2000). Nawet jeśli oszacowania parametrów zadań i poziomu umiejętności uczniów z modelu pomijającego wiązkowanie zadań byłyby takie same jak te z modelu uwzględniającego czynniki wiązek, to wyniki z jednowymiarowego modelu IRT obciążone są błędem. Funkcja informacyjna zadań powinna być bowiem uśredniona przez rozkłady czynników wiązek (Ip, 2010; Wainer i Wang, 2000). Dlatego wskazane jest korzystanie z modeli TRT w porównaniu z jednowymiarowymi modelami IRT, w przypadku zdiagnozowania silnych efektów wiązek. Modele Testlet Response Theory Popularnymi modelami przeznaczonymi do analizy wyników testów zawierających wiązki zadań są modele opracowane w ramach konfirmacyjnej analizy czynnikowej (confirmatory factor analysis, CFA) lub wielowymiarowej teorii odpowiedzi na zadania testowe (multidimensional item response theory, MIRT): 1. Model podwójnego czynnika (bifactor model; Gibbons i Hedeker, 1992), w którym każde zadanie testowe jest wskaźnikiem konstruktu głównego oraz dodatkowo ładuje jeden ze specyficznych wymiarów reprezentujących wiązkę zadań, do której dane zadanie należy. Konstrukt główny to zmienna latentna, będąca przedmiotem głównego zainteresowania (np. kompetencje matematyczne, językowe). Z kolei wymiary specyficzne uwzględniają dodatkowe zależności między zadaniami testowymi, wynikające z faktu ich powiązania w wiązki. Dla zadań kodowanych dychotomicznie3-parametryczny model podwójnego czynnika to P i (y = 1 θ g,θ 1,,θ k,,θ K ) = c i + (1-c i ) Φ (a ig θ g +a ik θ k -b i ), (1) gdzie Pi to prawdopodobieństwo prawidłowej odpowiedzi na zadanie testowe warunkowo ze względu na wartości parametrów zadania, wartości konstruktu 419
5 XXI Konferencja Diagnostyki Edukacyjnej, Bydgoszcz 2015 głównego θ g, oraz wektora wartości czynników specyficznych θ K, których jest tyle, ile wiązek zadań w teście. Parametr b i jest stałą regresji (parametrem trudności) dla zadania i; parametr a ig to ładunek (krzywa nachylenia regresji) dla zadania testowego na konstrukcie głównym oraz a ik to ładunki dla zadania na wymiarach specyficznych; c i to dolna asymptota. Aby model był identyfikowalny, średnia oraz wariancja każdego wymiaru (czynnika, θ) ustalane są odpowiednio na 0 oraz 1. Wszystkie wymiary w modelu traktowane są jako ortogonalne (niezależne). Możliwe jest zastosowanie tego modelu także do danych politomicznych przez zastosowanie adekwatnej funkcji łączącej zamiast funkcji logitowej lub probitowej (Fahrmeir i Tutz, 2001). Przez ustalenie parametru dolnej asymptoty na zero uzyskujemy model dwuparametryczny, natomiast przez ustalenie parametrów dyskryminacji zadań testowych na jeden lub inną stałą uzyskujemy model jednoparametryczny. 2. Model wiązki zadań (testlet model; Bradlow, Wainer i Wang, 1999) to model podwójnego czynnika mieszanych efektów, w którym ładunki (parametry dyskryminacji) zadań na wymiary specyficzne są zdefiniowane jako proporcjonalne do ładunków tych zadań na konstrukt główny w ramach każdej wiązki zadań (Li, Bolt i Fu, 2006), (2) gdzie γ k(i) to wektor wartości czynników specyficznych (zamiast θ K, notacja za: DeMars, 2012, s. 106) i tak jak we wzorze na model podwójnego czynnika oznacza wariancję wspólną dla zadań w ramach wiązki, która nie jest wyjaśniona przez konstrukt główny, jest stałą 1,7, pozwalającą przejść z metryki normalnej na logistyczną (Birbaum, 1962). Podobnie jak w poprzednim wzorze, przez ustalenie parametru dolnej asymptoty na zero uzyskujemy model dwuparametryczny; przez ustalenie parametrów dyskryminacji zadań testowych na jeden lub inną stałą uzyskujemy model jednoparametryczny. 3. W modelu z czynnikiem wyższego rzędu (higher order factor, HOF) zadania testowe ładują tylko wymiary specyficzne. Korelacje między wymiarami specyficznymi są modelowane przez czynnik wyższego rzędu. Model wiązki zadań jest formalnie tożsamy z modelem podwójnego czynnika z ograniczeniami, jak również z modelem z czynnikiem wyższego rzędu (Li, Bolt i Fu, 2006; Rijmen, 2010). W tradycji konfirmacyjnej analizy czynnikowej te relacje zostały także opisane jako modele dla zmiennych ciągłych (Yung, Thissen i McLeod, 1999). Autorzy ci wykazali, że model z czynnikiem wyższego rzędu jest formalnie ekwiwalentny z tzw. modelem hierarchicznym Schmida-Leimana (Schmid i Leiman, 1957). Jest to model podwójnego czynnika z ograniczeniami na ładunki czynnikowe zadań testowych w ramach wiązki, takimi, że są one proporcjonalne do ładunków tych zadań na konstrukt główny. Stąd też model wiązki zadań jest modelem z czynnikiem wyższego rzędu po transformacji Schmida-Leimana. 420
6 Wyniki i dyskusja Zastosowania diagnozy edukacyjnej W celu zilustrowania zastosowania modelowania wyników testów za pomocą modelów uwzględniających wiązki zadań wybrano wyniki części egzaminu gimnazjalnego z historii i wiedzy o społeczeństwie z 2014 r. dla losowej próbki 1000 uczniów, pobranej z ogólnopolskiej populacji zdających. Wybór testu z historii i wiedzy o społeczeństwie był podyktowany faktem, że od 2012 r. w polskich egzaminach gimnazjalnych w tej części egzaminu występowało najwięcej wiązek zadań. Test składał się z 33 zadań, z czego 14 tworzyło pięć wiązek: k1: z6.1, z6.2 ; k2: z8.1, z8.2, z8.3 ; k3: z10.1, z10.2, z10.3; k4: z15.1, z15.2, z15.3 ; k5: z22.1, z22.2, z22.3. Wszystkie zadania kodowane były dychotomicznie. Modelowanie efektów wiązek zadań, które są nieistotne, sprawia, że model jest niepotrzebnie skomplikowany i zwiększa błędy oszacowań parametrów zadań. Efekt wiązki zadań jest istotny, gdy złamane jest założenie o lokalnej niezależności w parach lub grupach zadań ujętych w wiązki. Dlatego analizę należy rozpocząć od identyfikacji zadań, dla których złamane jest założenie o lokalnej niezależności. Chen i Thissen (1997) zaproponowali statystykę, która obliczana jest przez porównanie obserwowanych i oczekiwanych częstości w ramach każdej pary zadań testowych. Statystyki te w przybliżeniu odpowiadają standaryzowanym wartościom i są wysokie, jeśli w parze zadań złamane zostało założenie o lokalnej niezależności. Ponieważ rozkład statystyki jest zbliżony, ale nie identyczny z rozkładem standaryzowanym Z, wartości statystyki powyżej 2 lub 3 nie należy uważać za wysokie. Za wskaźnik złamania założenia o lokalnej niezależności uznaje się wartości większe niż 10, a wartości między 5 a 10 jako wskazujące na taką możliwość (Cai, Thissen i du Toit, 2011). Statystyki obliczono w programie IRTPRO 2.1 (Cai, Thissen i du Toit, 2011). Statystyki powyżej 10 odnotowano tylko w grupach zadań z6.1, z6.2 ; z8.1, z8.2, z8.3 ; oraz z22.1, z22.2, z22.3. Spośród pięciu wiązek w teście, zidentyfikowano trzy, w których złamane zostało założenie o lokalnej niezależności. Wykazano, że model podwójnego czynnika, model wiązki zadań i model z czynnikiem wyższego rzędu są formalnie ekwiwalentne (Li i in., 2006; Rijmen, 2010). Dlatego jako przykład do analiz oszacowano model Rascha (jednoparametryczny) wiązki zadań (mod1; Wang i Wilson, 2005) oraz model dwuparametryczny podwójnego czynnika (mod2; Reise, 2012). Modele obliczono za pomocą pakietu TAM dla R. W mod1 szacowanych było 37 parametrów, tj. 33 parametry trudności zadań oraz wariancje czterech czynników (konstrukt główny i trzy czynniki specyficzne odpowiadające trzem wiązkom zadań). Z kolei w mod2 szacowane były 74 parametry, tj. 33 parametry trudności zadań oraz 41 parametrów dyskryminacji (dla zadań ładujących konstrukt główny i czynnik specyficzny po dwa parametry). DeMars (2012) porównała metody detekcji efektu wiązki zadań: (1) porównanie między modelem bez wiązek a modelem z wiązką; (2) porównanie między modelem z wszystkimi potencjalnymi wiązkami a modelem z wszystkimi potencjalnymi wiązkami za wyjątkiem jednej wiązki (porównanie all-but-one ); (3) testowanie jednowymiarowości struktury danych (Stout, 1987; 2005). Metoda 2 okazała się najskuteczniejsza. 421
7 422 XXI Konferencja Diagnostyki Edukacyjnej, Bydgoszcz 2015 W tabeli 2 porównano modele z trzema wiązkami wobec modeli, które ignorowały kolejno wiązkę k1, k2 lub k5. W tabeli podano liczbę parametrów szacowanych w modelach, wartości logarytmu funkcji największej wiarygodności (log-likelihood, LL), wartości kryterium informacyjnego Akaike a (AIC, Akaike, 1987), wartości skorygowanego Bayesowskiego kryterium informacyjnego Schwarza (sample adjusted BIC, SA-BIC, Schwarz, 1978; Sclove, 1987), rzetelność empiryczną (zwaną także brzegową) dla konstruktu głównego oraz wiązek zadań k1, k2 i k5, w których złamane było założenie o lokalnej niezależności. Statystyki AIC i SA-BIC są przekształceniami -2LL, stąd im niższe wartości, tym lepsze dopasowanie modelu do danych. SA-BIC uwzględnia karę za dodawanie parametrów opartą o wielkość próby. Liczne badania symulacyjne (m. in. Enders i Tofighi, 2008) sugerują użyteczność SA-BIC do porównywania modeli. Na przewagę SA-BIC nad innymi miarami w kontekście porównywania modeli uwzględniających wiązki zadań wskazała DeMars (2012). Tabela 2. Statystyki podsumowania porównania modeli all-but-one Krótka nazwa modelu L. parametrów LL AIC SA-BIC Rzetelność EAP dim1 k1 k2 k5 mod , , ,0 0,758 0,283 0,500 0,395 mod1-k , , ,1 0,763 nd 0,503 0,406 mod1-k , , ,6 0,779 0,292 nd 0,420 mod1-k , , ,4 0,755 0,287 0,507 nd mod , , ,5 0,806 0,381 0,473 0,633 mod2-k , , ,6 0,807 nd 0,473 0,631 mod2-k , , ,3 0,819 0,318 nd 0,628 mod2-k , , ,7 0,806 0,361 0,471 nd W modelu Rascha wiązki zadań największy efekt należy odnotować dla wiązki k2 (zadania z8.1, z8.2, z8.3 ). Natomiast po uwzględnieniu parametru dyskryminacji w modelu podwójnego czynnika to wiązka k5 (zadania z22.1, z22.2, z22.3 ) ma najsilniejszy efekt. Miary AIC i SA-BIC sugerują, że najlepsze modele to te, które uwzględniają wszystkie trzy wiązki zadań, zidentyfikowane jako istotne za pomocą statystyki. Stąd żadna z tych wiązek nie powinna być ignorowana. Oszacowania parametrów zadań, jak i pozycji uczniów na konstrukcie głównym (kompetencje historyczne i w zakresie wiedzy o społeczeństwie) zestawiono z oszacowaniami uzyskanymi z modeli 1PL (mod1pl) i 2PL (mod2pl), ignorujących fakt występowania wiązek zadań, oraz z modeli, w których zadania występujące w wiązkach potraktowano jako zadania politomiczne (odpowiednio mod1pcm oraz mod2gpcm). Modele obliczono w pakiecie mirt dla R. Jak wskazuje tabela 3, klasyczne modele IRT (zarówno jednoparametryczny model Rascha, jak i model dwuparametryczny) charakteryzują się najgorszym dopasowaniem do danych, w których zaobserwowano lokalną zależność zadań w wiązkach. Pozwalają to stwierdzić wartości AIC i SA-BIC, które dla tych modeli przyjmują najwyższe wartości. Wyniki te potwierdzają obecne w literaturze wnioski, zawierające podkreślenie, że klasyczne modele IRT nie odzwierciedlają adekwatnie struktury danych, w których występują wiązki zadań (Marais i Andrich, 2008).
8 Zastosowania diagnozy edukacyjnej Tabela 3. Statystyki podsumowania analizowanych modeli Krótka nazwa modelu mod1 mod1pl mod1pcm mod2 mod2pl mod2gpcm Opis modelu model Rascha wiązki zadań klasyczny model Rascha klasyczny Partial Credit Model model dwupar. podwójnego czynnika klasyczny model dwuparametryczny klasyczny Graded Partial Credit Model L. par. LL AIC SA-BIC Rzetelność EAP dim1 k1 k2 k , , ,0 0,758 0,283 0,500 0, , , ,3 0, , , ,6 0, , , ,5 0,806 0,381 0,473 0, , , ,0 0, , , ,1 0,759 Do analizowanych danych lepiej dopasowane są modele, które z problemem wiązek radzą sobie poprzez sumowanie punktów w wiązkach i tworzenie superzadań. Wskazują na to niższe wartości kryteriów AIC i SA-BIC dla klasycznego modelu PCM w porównaniu z modelem Rascha wiązki zadań oraz dla klasycznego modelu GPCM w porównaniu z modelem dwuparametrycznego podwójnego czynnika. W przypadku analizowanych danych modele traktujące wiązkę jako jedno zadanie wielopunktowe są najlepszym wyborem. W literaturze naukowej i badawczej podkreśla się, że wykorzystanie tych modeli może być problematyczne i prowadzić do obniżenia precyzji szacowania głównego konstruktu wskutek zmniejszenia puli zadań składających się na test (Yen, 1993). Wskazany problem dotyczy głównie krótkich testów, z dużą ilością wiązek i/lub wiązek, na które składa się duża liczba zadań. Analizowany test jest stosunkowo długi, a wiązki są niewielkie (maksymalnie trzy zadania w wiązce), więc stosowanie modeli przeznaczonych do zadań wielopunktowych jest wystarczające. Każdorazowo decyzja o wyborze między modelem z superzadaniami a modelami wiązki zadań powinna bazować na analizie dopasowania do konkretnych danych. Tabela 3 prezentuje także wartości pozwalające ocenić rzetelność głównego konstruktu. W wypadku klasycznych modeli IRT wskaźniki rzetelności brzegowej wynoszą odpowiednio 0,778 dla klasycznego modelu Rascha oraz 0,820 dla klasycznego modelu dwuparametrycznego. Są one wyższe niż wskaźniki rzetelności brzegowej oszacowanej dla modeli z superzadaniami i modeli wiązki zadań. Wyniki te potwierdzają wnioski z innych badań, tj. że problemem klasycznych modeli IRT jest przeszacowywanie rzetelności konstruktu głównego, sprawdzanego w teście (Sireci, Thissen i Wainer, 1991; Wainer i Wang, 2000). Właściwym indeksem rzetelności dla wyników testów, w których zastosowano wiązki zadań jest hierarchiczny współczynnik omega (coefficient omega hierarchical, Zinbarg i in., 1997; 2005), który wyniósł 0,841 dla modelu Rascha wiązki zadań oraz 0,870 dla modelu podwójnego czynnika. Hierarchiczny współczynnik omega definiuje się jako procent nieważonej wariancji surowych ocen czynnikowych, którą można przypisać czynnikowi głównemu. Dostępne dowody empiryczne wskazują, że stosowanie klasycznych modeli IRT ignorujących obecność wiązek zadań w strukturze danych może powodować problemy z poprawnością oszacowań parametrów zadań (Bradlow, nd nd 423
9 XXI Konferencja Diagnostyki Edukacyjnej, Bydgoszcz 2015 Wainer i Wang, 1999; Wainer i Wang, 2000). Jak wskazuje wykres 1, problem w niewielkim stopniu dotyczy modelu jednoparametrycznego Rascha, gdyż parametry trudności oszacowane w klasycznym modelu IRT i modelu wiązki zadań są wysoko ze sobą skorelowane. Wybór modelu w tym przypadku nie będzie powodował znacznych konsekwencji dla oszacowania parametrów zadań w teście. Może mieć to jednak poważne konsekwencje w przypadku modelu dwuparametrycznego, zwłaszcza dla oszacowania parametru trudności. Jak wskazuje wykres 2, korelacja parametrów trudności z klasycznego modelu IRT oraz modelu podwójnego czynnika jest słabsza. Na wykresie nie zaprezentowano jednego zadania, które stanowi przypadek odstający. Jest to trzecie i ostatnie zadanie z22.3, składające się na wiązkę. Z zadaniem można się zapoznać, pobierając arkusz egzaminacyjny ze strony cke.edu.pl. Analiza tego zadania ujawniła, że klasyczny model IRT szacuje trudność tego zadania jako wynoszącą 8,912, podczas gdy model wiązki wskazuje na trudność wynoszącą 4,467. Użycie klasycznego modelu IRT prowadziłoby do wniosku, że zadanie jest dwukrotnie trudniejsze niż pozwala stwierdzić model wiązki zadania. Klasyczny model IRT, ignorując strukturę danych, pomija fakt, że uczniowie, rozwiązując zadanie, mogli korzystać ze strategii eliminacji ich zadaniem było dopasowanie organów władzy (cztery możliwości) do trzech rodzajów uprawnień ustawodawczych. Odpowiadając na trzecie i ostatnie w wiązce zadanie, prawdopodobnie uczniowie wybierali odpowiedź nie z czterech możliwości dostępnych w zadaniu, ale z dwóch, które pozostały po rozwiązaniu dwóch poprzednich zadań w wiązce. W związku z tym zadanie było prostsze, gdyż nawet uczniowie posiadający niski poziom wiedzy z zakresu historii i WOS mieli wysokie prawdopodobieństwo zgadnięcia poprawnej odpowiedzi. Wykresy 1-3. Porównanie parametrów trudności w modelu Rascha wiązki zadań vs. modelu 1PL (wykres 1); w modelu podwójnego czynnika vs. modelu 2PL (wykres 2) oraz porównanie parametrów dyskryminacji w modelu podwójnego czynnika vs. modelu 2PL (wykres 3). Na wykresie 2 nie umieszczono parametru b dla zadania z22.3, który w modelu 2PL wyniósł 8,912, a w modelu podwójnego czynnika 4,467 Jak pokazuje wykres 4, wybór pomiędzy modelami klasycznymi IRT, modelami wiązki zadań i modelami z superzadaniami ma relatywnie niewielkie konsekwencje dla oszacowania poziomu umiejętności uczniów. Rozkład umiejętności uczniów jest podobny, niezależnie od wybranego modelu. Korelacje pomiędzy oszacowaniami parametrów uczniów pochodzących z różnych modeli są bardzo wysokie i wynoszą od 0,967 do
10 Zastosowania diagnozy edukacyjnej Wykres 4. Rozkłady umiejętności uczniów i ich korelacje w zastosowanych modelach Dla samych oszacowań parametrów uczniów wybór modelu w sytuacji występowania wiązek zadań w strukturze testu nie ma relatywnie dużego znaczenia, wpływa natomiast w widoczny sposób na błędy standardowe poziomu umiejętności uczniów. Jak pokazuje wykres 5, wybór modelu wiązki zadań wpływa na obniżenie błędów standardowych oszacowań poziomu umiejętności uczniów znajdujących się na krańcach rozkładu umiejętności, tj. wśród uczniów najzdolniejszych i najmniej zdolnych. Wybór modelu wiązki zadań będzie miał więc znaczenie w kontekście zwiększenia precyzji oszacowań umiejętności uczniów o najwyższych i najniższych umiejętnościach. 425
11 XXI Konferencja Diagnostyki Edukacyjnej, Bydgoszcz 2015 Wykres 5. Oszacowania błędów standardowych i parametrów uczniów w analizowanych modelach Podsumowanie Otrzymane rezultaty wskazują, że modele odpowiedzi na wiązki zadań są użyteczną metodą szacowania parametrów zadań i uczniów w testach egzaminacyjnych, wykorzystywanych w polskim systemie oświaty. Jednak zasadność ich zastosowania jest uzależniona od specyfiki danego testu. Użyteczność modeli TRT rośnie wraz ze zwiększaniem się liczby zadań w wiązkach i liczby samych wiązek w teście. Modele wiązki zadań wydają się także dokładniej szacować umiejętności uczniów o najniższych i najwyższych umiejętnościach niż klasyczne modele IRT. Z tego względu należy rozważyć szersze korzystanie z tego rodzaju modeli w przypadku analiz wykorzystujących wyniki polskich egzaminów zewnętrznych. Bibliografia 1. Akaike, H. (1987). Factor analysis and AIC. Psychometrika, 52, Birnbaum, A. (1962). On the Foundations of Statistical Inference. Journal of the American Statistical Association, 57(298), Bradlow, E. T., Wainer, H. i Wang, X. (1999). A Bayesian random effects model for testlets. Psychometrika, 64,
12 Zastosowania diagnozy edukacyjnej 4. Cai, L., Thissen, D. i du Toit, S. H. C. (2011). IRTPRO for Windows. [Computer software]. Lincolnwood, IL: Scientific Software International. 5. Chen, W.-H., Thissen, D. (1997). Local dependence indexes for item pairs using item response theory. Journal of Educational and Behavioral Statistics, 22, DeMars, Ch.E. (2012). Confirming Testlet Effects. Applied Psychological Measurement, 36(2), Eckes, T. (2014). Examining testlet effects in the TestDaF listening section: A testlet response theory modeling approach. Language Testing, 31(1), Enders, C.K., i Tofighi, D. (2008). The impact of misspecifying class-specific residual variances in growth mixture models. Structural Equation Modeling: A Multidisciplinary Journal, 15(1), Fahrmeir, L. i Tutz, G. (2001). Multivariate Statistical Modelling Based on Generalized Linear Models. Springer New York. 10. Gibbons, R., D., Hedeker, D., R., (1992). Full-information item bi-factor analysis. Psychometrika, 57, Ip, E. H. (2010). Interpretation of the three-parameter testlet response model and information function. Applied Psychological Measurement, 34, Koniewski, M., Majkut, P. i Skórska, P. (2014). Zróżnicowane funkcjonowanie zadań testowych ze względu na wersję testu. Edukacja, 1(126), Lee, G., Kolen, M. J., Frisbie, D. A. i Ankenmann, R. D. (2002). Comparison of dichotomous and polytomous item response models in equating scores from tests composed of testlets. Applied Psychological Measurement, 25, Li, Y., Bolt, D. M. i Fu, J. (2006). A comparison of alternative models for testlets. Applied Psychological Measurement, 30, Li, Y., Bolt, D. M. i Fu, J. (2005). A test characteristic curve linking method for the testlet model. Applied Psychological Measurement, 29, Linn, R. L., Levine, M. V., Hastings, C. N. i Wardrop, J. L. (1981). Item bias in a test of Reading comprehension. Applied Psychological Measurement, 5, Marais, I. i Andrich, D. (2008). Formalizing dimension and response violations of local independence in the unidimensional Rasch model. Journal of Applied Measurement, 9, Muraki, E. (1992). A generalized partial credit model: Application of an EM algorithm. Applied Psychological Measurement, 16, Reise, S. P. (2012). The rediscovery of bifactor measurement models. Multivariate Behavioral Research, 47, Rijmen, F. (2010). Formal Relations and an Empirical Comparison among the Bi Factor, the Testlet, and a Second Order Multidimensional IRT Model. Journal of Educational Measurement, 47, Schmid, J. i Leiman., J. N. (1957). The development of hierarchical factor solutions. Psychometrika, 22, Schwarz, G. (1978). Estimating the dimension of a model. Annals of Statistics, 6, Sclove, S. L. (1987). Application of model-selection criteria to some problems in multivariate analysis. Psychometrika, 52, Sireci, S. G., Thissen, D., Wainer, H. (1991). On the reliability of testlet-based tests. Journal of Educational Measurement, 28, Stout, W. (1987). A nonparametric approach for assessing latent trait unidimensionality. Psychometrika, 52, Stout, W. (2005). Dimtest (Version 2.0) [Computer software]. Champaign, IL: William Stout Institute for Measurement. 27. Wainer, H. i Kiely, G. L. (1987). Item clusters and computerized adaptive testing: A case for testlets. Journal of Educational Measurement, 24,
13 XXI Konferencja Diagnostyki Edukacyjnej, Bydgoszcz Wainer, H. i Lewis, C. (1990). Toward a psychometrics for testlets. Journal of Educational Measurement, 27, Wainer, H. i Wang, X. (2000). Using a new statistical model for testlets to score TOEFL. Journal of Educational Measurement, 37, Wainer, H., Bradlow, E. i Wang, X., (2007). Testlet Response Theory and Its Applications. Cambridge University Press. 31. Wainer, H., Bradlow, E. T. i Du, Z. (2000). Testlet response theory: An analog for the 3PL model useful in testlet-based adaptive testing. W W. J. van der Linden i C. A. W. Glas (red.), Computerized adaptive testing: Theory and practice ( ). Boston, MA: Kluwer-Nijhoff. 32. Wang,W.-C., Wilson, M. (2005). The Rasch testlet model. Applied Psychological Measurement, 29, Wilson, M., Adams, R. J. (1995). Rasch models for item bundles. Psychometrika, 60, Yen, W. M. (1993). Scaling performance assessments: Strategies for managing local item dependence. Journal of Educational Measurement, 30, Yung, Y., Thissen, D. i McLeod, L. D. (1999). On the relationship between the higherorder factor model and the hierarchical factor model. Psychometrika, 64, Zenisky, A., Hambleton, R. K., L. i Sireci, S. G. (2002). Identification and evaluation of local item dependencies in the Medical College Admissions Test. Journal of Educational Measurement, 39, Zinbarg, R.E., Barlow, D.H. i Brown, T.A. (1997). Hierarchical structure and general factor saturation of the anxiety sensitivity index: Evidence and implications. Psychological Assessment, 9, Zinbarg, R.E., Revelle, W., Yovel, I. i Li, W. (2005). Cronbach s α, Revelle s β, and McDonald s ωh: Their relations with each other and two alternative conceptualizations of reliability. Psychometrika, 70,
Zadania rozrywające w testach
Ewa Stożek Okręgowa Komisja Egzaminacyjna w Łodzi Zadania rozrywające w testach Na podstawie analizy danych empirycznych ze sprawdzianu i roku wyodrębniono zadania odpowiedzialne za dwumodalność rozkładu
Oszacowanie umiejętności teta oraz wyskalowanie osi w metodzie IRT dla potrzeb obliczania parametrów zadań
Sławomir Sapanowski Okręgowa Komisja Egzaminacyjna w Łodzi Oszacowanie umiejętności teta oraz wyskalowanie osi w metodzie IRT dla potrzeb obliczania parametrów zadań W ostatnim czasie wśród ekspertów zajmujących
ZADANIA ROZRYWAJĄCE W TESTACH. 1. Co to jest zadanie rozrywające?
Ewa Stożek OKE Łódź ZADANIA ROZRYWAJĄCE W TESTACH Na podstawie analizy danych empirycznych ze sprawdzianu i roku wyodrębniono zadania odpowiedzialne za dwumodalność rozkładu wyników tych testów. Takie
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2012
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2012 OPRACOWAŁY: ANNA ANWAJLER MARZENA KACZOR DOROTA LIS 1 WSTĘP W analizie wykorzystywany będzie model szacowania EWD.
Wielogrupowy Model IRT Analizy Symulacyjne
dr Artur Pokropek Instytut Badań Edukacyjnych Zespół EWD Regionalne i lokalne diagnozy edukacyjne Wielogrupowy Model IRT Analizy Symulacyjne Wstęp Każdy model statystyczny zawiera szereg założeń, niekiedy
Trafność testów egzaminacyjnych. Artur Pokropek, Tomasz Żółtak IFiS PAN
Trafność testów egzaminacyjnych Artur Pokropek, Tomasz Żółtak IFiS PAN Plan prezentacji EWD i trafność testów egzaminacyjnych Pięć postulatów trafności dla skal pomiarowych Wskaźniki egzaminacyjne a wyniki
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2013
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2013 OPRACOWAŁY: ANNA ANWAJLER MARZENA KACZOR DOROTA LIS 1 WSTĘP W analizie wykorzystywany będzie model szacowania EWD.
WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno
WSTĘP DO REGRESJI LOGISTYCZNEJ Dr Wioleta Drobik-Czwarno REGRESJA LOGISTYCZNA Zmienna zależna jest zmienną dychotomiczną (dwustanową) przyjmuje dwie wartości, najczęściej 0 i 1 Zmienną zależną może być:
5. WNIOSKOWANIE PSYCHOMETRYCZNE
5. WNIOSKOWANIE PSYCHOMETRYCZNE Model klasyczny Gulliksena Wynik otrzymany i prawdziwy Błąd pomiaru Rzetelność pomiaru testem Standardowy błąd pomiaru Błąd estymacji wyniku prawdziwego Teoria Odpowiadania
Początki. Items Response Theory (IRT) [Teoria Odpowiedzi na Zadania Testowe] Lata 50 XX wieku równolegle wymyślili: psychometra Frederic M.
PAZUR 205 Items Response Theory (IRT) [Teoria Odpowiedzi na Zadania Testowe] dr Paweł Kleka Instytut Psychologii UAM 205.04.24 Początki Lata 50 XX wieku równolegle wymyślili: psychometra Frederic M. Lord
Trafność egzaminów w kontekście metody EWD
Trafność egzaminów w kontekście metody EWD Aleksandra Jasińska (a.jasinska@ibe.edu.pl) Tomasz Żółtak (t.zoltak@ibe.edu.pl) Instytut Badań Edukacyjnych ul. Górczewska 8 01-180 Warszawa JESIENNA SZKOŁA EWD
Testowanie hipotez statystycznych
9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :
MODEL STRUKTURALNY RELACJI MIĘDZY SATYSFAKCJĄ
MODEL STRUKTURALNY RELACJI MIĘDZY SATYSFAKCJĄ I LOJALNOŚCIĄ WOBEC MARKI Adam Sagan Akademia Ekonomiczna w Krakowie, Katedra Analizy Rynku i Badań Marketingowych Wstęp Modelowanie strukturalne ma wielorakie
edukacyjne jako - wskaźniki efektywności nauczania
Tytuł: Edukacyjna wartość dodana. Porównywalne wyniki edukacyjne jako - wskaźniki efektywności nauczania Jakość oświaty jako efekt zarządzania strategicznego - szkolenie dla przedstawicieli jednostek samorządu
Szkolny raport ewaluacyjny
Szkolny raport ewaluacyjny Technikum Ekonomiczne nr 1 im. Mikołaja Kopernika Zespół Szkół Licealnych i Ekonomicznych nr 1 Śródmieście, ul. Stawki 10 Raport opracowany na podstawie wyników maturalnych z
Kontekstowe wskaźniki efektywności nauczania - warsztaty
Kontekstowe wskaźniki efektywności nauczania - warsztaty Przygotowała: Aleksandra Jasińska (a.jasinska@ibe.edu.pl) wykorzystując materiały Zespołu EWD Czy dobrze uczymy? Metody oceny efektywności nauczania
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
EDUKACYJNA WARTOŚĆ DODANA
ŚLĄSKIE TECHNICZNE ZAKŁADY NAUKOWE EDUKACYJNA WARTOŚĆ DODANA ANALIZA 1. INFORMACJE OGÓLNE. Wskaźnik EWD i wyniki egzaminacyjne rozpatrywane są wspólnie. W ten sposób dają nam one pełniejszy obraz pracy
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.
CZY UCZNIOWIE POWINNI OBAWIAĆ SIĘ NOWEGO SPOSOBU OCENIANIA PRAC EGZAMINACYJNYCH?
Aktualne problemy dydaktyki przedmiotów przyrodniczych CZY UCZNIOWIE POWINNI OBAWIAĆ SIĘ NOWEGO SPOSOBU OCENIANIA PRAC EGZAMINACYJNYCH? Marta Jaksender, Robert Zakrzewski*, Anna Wypych-Stasiewicz Uniwersytet
Dodatek 3 Oprogramowanie przeznaczone do analizy IRT
Dodatek 3 Oprogramowanie przeznaczone do analizy IRT Paulina Skórska, Instytut Badań Edukacyjnych Karolina Świst, Instytut Badań Edukacyjnych W Tabeli D 3.1 przedstawiono opis oprogramowania przeznaczonego
15. PODSUMOWANIE ZAJĘĆ
15. PODSUMOWANIE ZAJĘĆ Efekty kształcenia: wiedza, umiejętności, kompetencje społeczne Przedmiotowe efekty kształcenia Pytania i zagadnienia egzaminacyjne EFEKTY KSZTAŁCENIA WIEDZA Wykazuje się gruntowną
RAPORT WSKAŹNIK EDUKACYJNEJ WARTOŚCI DODANEJ PO EGZAMINIE GIMNAZJALNYM W ROKU SZKOLNYM 2012/2013
RAPORT WSKAŹNIK EDUKACYJNEJ WARTOŚCI DODANEJ PO EGZAMINIE GIMNAZJALNYM W ROKU SZKOLNYM 2012/2013 ZESPÓŁ SZKÓŁ NR 14 W BYDGOSZCZY GIMNAZJUM NR 37 INTEGRACYJNE Opracowanie A. Tarczyńska- Pajor na podstawie
Porównywalne między latami wyniki egzaminacyjne
Porównywalne między latami wyniki egzaminacyjne ZESPÓŁ ANALIZ OSIĄGNIĘĆ UCZNIÓW Instytut Badań Edukacyjnych Plan prezentacji 1. Zrównywanie wyników egzaminacyjnych w innych krajach 2. Po co nam zrównywanie
Metacognitive Awarness Inventory. Kwestionariusz metapoznania The Metacognitive Questionnaire
Psychologia Spo eczna 2016 tom 11 4 (39) strony 509 526 Instytut Psychologii, Uniwersytet Gda ski metapoznawcze Ja odchylenia od racjonalno ci narz dzie do pomiaru MJ MJ-24 Metacognitive Awarness Inventory
Szkolny raport ewaluacyjny
Szkolny raport ewaluacyjny XL Liceum Ogólnokształcące z Oddziałami Dwujęzycznymi im. Stefana Żeromskiego Wola, ul. Platynowa 1 Raport opracowany na podstawie wyników maturalnych z języka polskiego i matematyki
ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH
1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
Analiza wyników egzaminu gimnazjalnego 2015
Analiza wyników egzaminu gimnazjalnego 2015 Egzamin gimnazjalny został przeprowadzony od 21 do 23 kwietnia 2015 r. Składał się z trzech części. W części pierwszej humanistycznej gimnazjaliści rozwiązywali
Porównywalne między latami wyniki sprawdzianu
Porównywalne między latami wyniki sprawdzianu ZESPÓŁ ANALIZ OSIĄGNIĘĆ UCZNIÓW Instytut Badań Edukacyjnych Plan prezentacji 1.Po co nam zrównywanie wyników pomiędzy latami? 2.W jaki sposób przeprowadzono
Latentna moc różnicująca zadań z testów matematycznych dla młodzieży uzdolnionej
XVI Konferencja Diagnostyki Edukacyjnej, Toruń 200 Elżbieta Ostaficzuk Mazowieckie Samorządowe Centrum Doskonalenia Nauczycieli Grażyna Śleszyńska Mazowieckie Samorządowe Centrum Doskonalenia Nauczycieli
Analiza korespondencji
Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy
Porównywalne między latami wyniki egzaminacyjne
Porównywalne między latami wyniki egzaminacyjne ZESPÓŁ ANALIZ OSIĄGNIĘĆ UCZNIÓW Instytut Badań Edukacyjnych Henryk Szaleniec, Bartosz Kondratek Plan prezentacji 1.Po co nam zrównywanie wyników pomiędzy
Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA
Opis zakładanych efektów kształcenia na studiach podyplomowych Nazwa studiów: BIOSTATYSTYKA PRAKTYCZNE ASPEKTY STATYSTYKI W BADANIACH MEDYCZNYCH Typ studiów: doskonalące Symbol Efekty kształcenia dla studiów
Jak pracują szkoły. Co to jest metoda edukacyjnej wartości dodanej (EWD)?
Jak pracują szkoły Centralna Komisja Egzaminacyjna na stronie http://matura.ewd.edu.pl/ ogłosiła wskaźniki egzaminacyjne wyliczone oddzielnie dla liceów i techników na podstawie wyników egzaminu maturalnego
RAPORT ZBIORCZY z diagnozy umiejętności matematycznych
RAPORT ZBIORCZY z diagnozy umiejętności matematycznych przeprowadzonej w klasach szóstych szkół podstawowych Analiza statystyczna Wskaźnik Wartość wskaźnika Wyjaśnienie Liczba uczniów Liczba uczniów, którzy
ŚLĄSKIE TECHNICZNE ZAKŁADY NAUKOWE EDUKACYJNA WARTOŚĆ DODANA
ŚLĄSKIE TECHNICZNE ZAKŁADY NAUKOWE EDUKACYJNA WARTOŚĆ DODANA ANALIZA 2014_2016 INTERPRETACJA WYNIKÓW W ŚLĄSKICH TECHNICZNYCH ZAKŁADACH NAUKOWYCH Metoda EWD to zestaw technik statystycznych pozwalających
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012
RAPORT EDUKACYJNA WARTOŚĆ DODANA
RAPORT EDUKACYJNA WARTOŚĆ DODANA rok 2013 w Gimnazjum Katolickim Zespół Szkół Świętego Jana Bosko Opracowały: Marlena Kowalska, Katarzyna Harlejczyk Wykresy wygenerowano w programie Kalkulator EWD 100
Szkolny raport ewaluacyjny
Szkolny raport ewaluacyjny Szkoła Podstawowa nr 92 im. Jana Brzechwy Żoliborz, ul. Przasnyska 18a Raport opracowany na podstawie wyników sprawdzianu w szóstej klasie szkoły podstawowej z lat 2012-2016
Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Regresja wielokrotna Model dla zależności liniowej: Y=a+b 1 X 1 +b 2 X 2 +...+b n X n Cząstkowe współczynniki regresji wielokrotnej: b 1,..., b n Zmienne niezależne (przyczynowe): X 1,..., X n Zmienna
TEST HUMANISTYCZNY HISTORIA I WOS
TEST HUMANISTYCZNY HISTORIA I WOS Klasa GD A GD B Łącznie średni wynik punktowy,,9, średni wynik procentowy,5%,5%,5% WNIOSKI: Za rozwiązanie zadań z zakresu historii i wiedzy o społeczeństwie gimnazjaliści
Wyniki egzaminu gimnazjalnego rok szk. 2014/2015
Wyniki egzaminu gimnazjalnego rok szk. 2014/2015 W roku 2015 egzamin gimnazjalny odbył się w dniach 21, 22 i 23 kwietnia. Pierwszego dnia uczniowie rozwiązywali test z historii i wiedzy o społeczeństwie
Testy nieparametryczne
Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów
STATYSTYKA OD PODSTAW Z SYSTEMEM SAS. wersja 9.2 i 9.3. Szkoła Główna Handlowa w Warszawie
STATYSTYKA OD PODSTAW Z SYSTEMEM SAS wersja 9.2 i 9.3 Szkoła Główna Handlowa w Warszawie Spis treści Wprowadzenie... 6 1. Podstawowe informacje o systemie SAS... 9 1.1. Informacje ogólne... 9 1.2. Analityka...
Publiczne Gimnazjum im. Jana Pawła II w Wilczej Woli ANALIZA EGZAMINU GIMNAZJALNEGO 2013 Z UWZGLĘDNIENIEM EWD
Publiczne Gimnazjum im. Jana Pawła II w Wilczej Woli ANALIZA EGZAMINU GIMNAZJALNEGO 2013 Z UWZGLĘDNIENIEM EWD EDUKACYJNA WARTOŚĆ DODANA JAKO JEDNA Z MIAR JAKOŚCI NAUCZANIA Zasoby na wejściu Szkoła Jakość
Skalowanie wyników egzaminacyjnych
Skalowanie wyników egzaminacyjnych przygotował Tomasz Żółtak Jesienna Szkoła EWD, Warszawa 7..23 Plan prezentacji. Kłopoty z wynikami surowymi. 2. Proste rozwiązania normalizacja i standaryzacja. 3. Co
Psychometria PLAN NAJBLIŻSZYCH WYKŁADÓW. Co wyniki testu mówią nam o samym teście? A. Rzetelność pomiaru testem. TEN SLAJD JUŻ ZNAMY
definicja rzetelności błąd pomiaru: systematyczny i losowy Psychometria Co wyniki testu mówią nam o samym teście? A. Rzetelność pomiaru testem. rozkład X + błąd losowy rozkład X rozkład X + błąd systematyczny
Edukacyjna wartość dodana - wskaźnik efektywności nauczania
Edukacyjna wartość dodana - wskaźnik efektywności nauczania Jakość oświaty jako efekt zarządzania strategicznego - szkolenie dla przedstawicieli jednostek samorządu terytorialnego opracowała: Ewa Stożek
Monte Carlo, bootstrap, jacknife
Monte Carlo, bootstrap, jacknife Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej: http://www.ssc.wisc.edu/~bhansen/econometrics/ Monte Carlo: rozdział 8.8, 8.9 Bootstrap: rozdział
Próbny egzamin gimnazjalny w części matematyczno-przyrodniczej dnia r.
Próbny egzamin gimnazjalny w części matematyczno-przyrodniczej dnia 06.12.2007r. L.p. Klasa Liczba uczniów w klasie Liczba uczniów, którzy przystąpili do egzaminu Liczba uczniów nieobecnych 1. III a 14
Dlaczego należy uwzględniać zarówno wynik maturalny jak i wskaźnik EWD?
EWD co to jest? Metoda EWD to zestaw technik statystycznych pozwalających oszacować wkład szkoły w końcowe wyniki egzaminacyjne. Wkład ten nazywamy właśnie edukacyjną wartością dodaną. EWD jest egzaminacyjnym
Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa
Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2015
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2015 OPRACOWAŁY: ANNA ANWAJLER MARZENA KACZOR DOROTA LIS 1 WSTĘP Termin edukacyjna wartość dodana (EWD) oznacza zarówno
Kontekstowe modele efektywności nauczania po I etapie edukacyjnym
Kontekstowe modele efektywności nauczania po I etapie edukacyjnym Aleksandra Jasińska (a.jasinska@ibe.edu.pl) Instytut Badań Edukacyjnych ul. Górczewska 8 01-180 Warszawa Czy dobrze uczymy? Metody oceny
STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.
STATYSTYKA MATEMATYCZNA WYKŁAD 4 WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X. Wysuwamy hipotezy: zerową (podstawową H ( θ = θ i alternatywną H, która ma jedną z
Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów
Rozdział : Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów W tym rozdziale omówione zostaną dwie najpopularniejsze metody estymacji parametrów w ekonometrycznych modelach nieliniowych,
Wpływ wersji arkusza egzaminacyjnego na zróżnicowane funkcjonowanie zadań na przykładzie egzaminu gimnazjalnego
Paulina Skórska Uniwersytet Jagielloński XIX Konferencja Diagnostyki Edukacyjnej, Gniezno 2013 Maciej Koniewski Instytut Badań Edukacyjnych, Uniwersytet Jagielloński Przemysław Majkut Okręgowa Komisja
Analiza wyników egzaminu gimnazjalnego przeprowadzonego w roku szkolnym 2011/2012 w części matematyczno przyrodniczej z zakresu matematyki
Analiza wyników egzaminu gimnazjalnego przeprowadzonego w roku szkolnym 2011/2012 w części matematyczno przyrodniczej z zakresu matematyki Zestaw zadań egzaminacyjnych zawierał 23, w tym 20 zadań zamkniętych
EGZAMIN GIMNAZJALNY 2012 W SZKOŁACH DLA DOROSŁYCH W WOJEWÓDZTWIE ŚLĄSKIM. sesja wiosenna
EGZAMIN GIMNAZJALNY 2012 W SZKOŁACH DLA DOROSŁYCH W WOJEWÓDZTWIE ŚLĄSKIM sesja wiosenna Jaworzno 2012 SPIS TREŚCI 1. WPROWADZENIE... 3 2. WYNIKI SŁUCHACZY GIMNAZJÓW DLA DOROSŁYCH DOTYCZĄCE STANDARDOWYCH
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych
dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo
SPRAWDZIAN I EGZAMINY 2013 W SZKOŁACH ARTYSTYCZNYCH. w w o je w ó dztwie śląskim
SPRAWDZIAN I EGZAMINY 2013 W SZKOŁACH ARTYSTYCZNYCH w w o je w ó dztwie śląskim Jaworzno 2013 Spis treści I. WPROWADZENIE 4 II. SPRAWDZIAN 6 2.1. Wyniki uczniów szkół podstawowych artystycznych dotyczące
ZS 14 Rok szkolny 2013/2014
Edukacyjna Wartość Dodana ZS 14 Rok szkolny 2013/2014 Pojęcie: Edukacyjna wartość dodana Edukacyjną wartość dodaną można zdefiniować jako przyrost wiedzy uczniów w wyniku danego procesu edukacyjnego. Innymi
Kierunek i poziom studiów: Biologia, poziom drugi Sylabus modułu: Metody statystyczne w naukach przyrodniczych
Uniwersytet Śląski w Katowicach str. 1 Kierunek i poziom studiów: Biologia, poziom drugi Sylabus modułu: Metody statystyczne w naukach przyrodniczych kod modułu: 2BL_02 1. Informacje ogólne koordynator
Podstawowe definicje statystyczne
Podstawowe definicje statystyczne 1. Definicje podstawowych wskaźników statystycznych Do opisu wyników surowych (w punktach, w skali procentowej) stosuje się następujące wskaźniki statystyczne: wynik minimalny
Regresja logistyczna (LOGISTIC)
Zmienna zależna: Wybór opcji zachodniej w polityce zagranicznej (kodowana jako tak, 0 nie) Zmienne niezależne: wiedza o Unii Europejskiej (WIEDZA), zamieszkiwanie w regionie zachodnim (ZACH) lub wschodnim
Analiza składowych głównych. Wprowadzenie
Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących
Analiza regresji - weryfikacja założeń
Medycyna Praktyczna - portal dla lekarzy Analiza regresji - weryfikacja założeń mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof.
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
Położenie elipsy (szkoły) w układzie współrzędnych
Zachęcamy do zapoznania się z portalem http://ewd.edu.pl/ prezentującym tzw. Edukacyjną Wartość Dodaną. Strona przedstawia wybrane wyniki prac zespołu realizującego projekt Badania dotyczące rozwoju metodologii
Elementy statystyki wielowymiarowej
Wnioskowanie_Statystyczne_-_wykład Spis treści 1 Elementy statystyki wielowymiarowej 1.1 Kowariancja i współczynnik korelacji 1.2 Macierz kowariancji 1.3 Dwumianowy rozkład normalny 1.4 Analiza składowych
( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:
ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość
Szanowni Państwo! Dodatkowe informacje na temat badania Kompetencje 2018 znajdą państwo na naszej stronie internetowej (
Szanowni Państwo! Przesyłamy wyniki badania Kompetencje dla przyszłości 2018 - ogólnopolskiego badania umiejętności uczniów, które realizowaliśmy w szkołach podstawowych i gimnazjalnych w czerwcu 2018
Budowa modelu i testowanie hipotez
Problemy metodologiczne Gdzie jest problem? Obciążenie Lovella Dysponujemy oszacowaniami parametrów następującego modelu y t = β 0 + β 1 x 1 +... + β k x k + ε t Gdzie jest problem? Obciążenie Lovella
Analiza wyników egzaminu gimnazjalnego z języka obcego nowożytnego w roku szkolnym 2014/2015
Analiza wyników egzaminu gimnazjalnego z języka obcego nowożytnego w roku szkolnym 2014/2015 Analiza wyników egzaminu gimnazjalnego z języka angielskiego na poziomie podstawowym Arkusz składał się z 40
Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:
Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności
Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu
Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
Model EWD dla II etapu edukacyjnego.
Model EWD dla II etapu edukacyjnego. Na podstawie materiałów Pracowni EWD Instytut Badań Edukacyjnych Warszawa, 28-29.11.2014 r. Plan zajęć /moduł 9. i 10./ 1. Idea EWD 2. Model EWD dla II etapu 3. Prezentacja
Rozdział 1. Teoria odpowiedzi na pozycje testowe: jednowymiarowe modele dla cech ukrytych o charakterze ciągłym 1
Rozdział 1 Teoria odpowiedzi na pozycje testowe: jednowymiarowe modele dla cech ukrytych o charakterze ciągłym 1 Bartosz Kondratek, Instytut Badań Edukacyjnych Artur Pokropek, Instytut Badań Edukacyjnych
Wykład 9 Wnioskowanie o średnich
Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i
VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15
VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej
Analiza efektywności kształcenia w Gimnazjum nr 3 z oddziałami integracyjnym im. Tadeusza Kościuszki w Pabianicach w oparciu o wskaźnik EWD
Analiza efektywności kształcenia w Gimnazjum nr 3 z oddziałami integracyjnym im. Tadeusza Kościuszki w Pabianicach w oparciu o wskaźnik EWD październik 2015 r. 1 Spis treści Spis treści... 2 1. Wstęp...
ANALIZA WIELOPOZIOMOWA JAKO NARZĘDZIE WSPARCIA POLITYK PUBLICZNYCH
ANALIZA WIELOPOZIOMOWA JAKO NARZĘDZIE WSPARCIA POLITYK PUBLICZNYCH - Adrian Gorgosz - Paulina Tupalska ANALIZA WIELOPOZIOMOWA (AW) Multilevel Analysis Obecna od lat 80. Popularna i coraz częściej stosowana
Porównywalne między latami wyniki egzaminacyjne (PWE)
Porównywalne między latami wyniki egzaminacyjne (PWE) Celem ćwiczeń jest praktyczne zapoznanie się z porównywalnymi między latami średnimi wynikami egzaminu gimnazjalnego przeprowadzanego w latach 2002-2011
RAPORT Z EGZAMINU GIMNAZJALNEGO W ROKU SZKOLNYM 2014/2015
RAPORT Z EGZAMINU GIMNAZJALNEGO W ROKU SZKOLNYM 2014/2015 EGZAMIN GIMNAZJALNY 2015 CZĘŚĆ HUMANISTYCZNA CZĘŚĆ MATEMATYCZNO - PRZYRODNICZA JĘZYK POLSKI 90 MINUT HISTORIA I WOS 60 MINUT PRZEDMIOTY PRZYRODNICZE
METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA
METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA AMFETAMINY Waldemar S. Krawczyk Centralne Laboratorium Kryminalistyczne Komendy Głównej Policji, Warszawa (praca obroniona na Wydziale Chemii Uniwersytetu
Wykorzystanie danych egzaminacyjnych w ewaluacji szkół. materiały Pracowni EWD
Wykorzystanie danych egzaminacyjnych w ewaluacji szkół materiały Pracowni EWD Funkcje systemu egzaminacyjnego ocena osiągnięć szkolnych uczniów w świetle wymagań programowych (funkcja selekcyjna) diagnoza
Pomiar gotowości szkolnej uczniów za pomocą skali quasi-obserwacyjnej
Centralna Komisja Egzaminacyjna Pomiar gotowości szkolnej uczniów za pomocą skali quasi-obserwacyjnej Aleksandra Jasioska Zespół badawczy EWD, Centralna Komisja Egzaminacyjna Instytut Badao Edukacyjnych
Model 1: Estymacja KMNK z wykorzystaniem 4877 obserwacji Zmienna zależna: y
Zadanie 1 Rozpatrujemy próbę 4877 pracowników fizycznych, którzy stracili prace w USA miedzy rokiem 1982 i 1991. Nie wszyscy bezrobotni, którym przysługuje świadczenie z tytułu ubezpieczenia od utraty
Publiczne Gimnazjum im. Ks. Kardynała Stefana Wyszyńskiego w Choroszczy
Publiczne Gimnazjum im. Ks. Kardynała Stefana Wyszyńskiego w Choroszczy Analiza egzaminu gimnazjalnego 2013 wg wskaźników EWD Opracowanie Beata Gawryluk 1 S t r o n a I. Wstęp Metoda EWD to zestaw technik
Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1
Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie
weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)
PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na
TEST HUMANISTYCZNY HISTORIA I WOS
TEST HUMANISTYCZNY HISTORIA I WOS Klasa 3 GD A 3 GD B 3 GD C Łącznie średni wynik punktowy 3 5 3 średni wynik procentowy 73% 77% 73% 7% WNIOSKI: Za rozwiązanie zadań z zakresu historii i wiedzy o społeczeństwie
Kilka uwag o testowaniu istotności współczynnika korelacji
341 Zeszyty Naukowe Wyższej Szkoły Bankowej we Wrocławiu Nr 20/2011 Piotr Peternek Uniwersytet Ekonomiczny we Wrocławiu Marek Kośny Uniwersytet Ekonomiczny we Wrocławiu Kilka uwag o testowaniu istotności
Analiza edukacyjnej wartości dodanej dla Gimnazjum w Bolimowie w roku 2011
Analiza edukacyjnej wartości dodanej dla Gimnazjum w Bolimowie w roku 2011 W kwietniu 2011 roku na egzaminie gimnazjalnym arkusz standardowy rozwiązywało 42 uczniów. Z tej grupy uczniów udało się zestawić
Metody Ilościowe w Socjologii
Metody Ilościowe w Socjologii wykład 2 i 3 EKONOMETRIA dr inż. Maciej Wolny AGENDA I. Ekonometria podstawowe definicje II. Etapy budowy modelu ekonometrycznego III. Wybrane metody doboru zmiennych do modelu
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 9 i 10 1 / 30 TESTOWANIE HIPOTEZ STATYSTYCZNYCH