Trafność testów egzaminacyjnych. Artur Pokropek, Tomasz Żółtak IFiS PAN

Podobne dokumenty
Trafność egzaminów w kontekście metody EWD

Wykorzystanie danych egzaminacyjnych w ewaluacji szkół. materiały Pracowni EWD

Edukacyjna wartość dodana - wskaźnik efektywności nauczania

Rozwój metody edukacyjnej wartości dodanej w Polsce. Roman Dolata Instytut Badań Edukacyjnych

Dwuletnie maturalne wskaźniki EWD

Problem trafności metody EWD Artur Pokropek

edukacyjne jako - wskaźniki efektywności nauczania

ŚLĄSKIE TECHNICZNE ZAKŁADY NAUKOWE EDUKACYJNA WARTOŚĆ DODANA

Wybrane predyktory osiągnięć edukacyjnych gimnazjalistów

Czy inteligencja wpływa na wyniki egzaminu, a efektywne nauczanie rozwija inteligencję?

ZS 14 Rok szkolny 2013/2014

Publiczne Gimnazjum im. Jana Pawła II w Wilczej Woli ANALIZA EGZAMINU GIMNAZJALNEGO 2013 Z UWZGLĘDNIENIEM EWD

Ocena systemu egzaminów zewnętrznych przez nauczycieli szkół podstawowych i gimnazjów

EDUKACYJNA WARTOŚĆ DODANA

Położenie elipsy (szkoły) w układzie współrzędnych

Porównywalne między latami wyniki egzaminacyjne

Jak pracują szkoły. Co to jest metoda edukacyjnej wartości dodanej (EWD)?

Czy szkoły, w których uczniowie korzystają z korepetycji, mają wyższe EWD? Anna Hawrot Aleksandra Jasińska

EGZAMIN GIMNAZJALNY 2012 W SZKOŁACH DLA DOROSŁYCH W WOJEWÓDZTWIE ŚLĄSKIM. sesja wiosenna

Sprawdzian i egzamin na tle zmian w szkole podstawowej i gimnazjum. Krzysztof Konarzewski kris@medianet.pl

Dlaczego należy uwzględniać zarówno wynik maturalny jak i wskaźnik EWD?

Analiza wyników egzaminów zewnętrznych z wykorzystaniem edukacyjnej wartości dodanej. Opracowana dla uczniów Gimnazjum w Jaworzu

WYNIKI OGÓLNOPOLSKIEGO BADANIA UMIEJĘTNOŚCI TRZECIOKLASISTY, SPRAWDZIANU, EGZAMINU GIMNAZJALNEGO I MATURALNEGO W 2013 ROKU UCZNIÓW SZKÓŁ PROWADZONYCH

Wyniki edukacyjne Gimnazjum nr 1 w Łęcznej na podstawie. egzaminu gimnazjalnego z 2015 roku.

EDUKACYJNA WARTOŚC DODANA

Działanie 3.2. Rozwój systemu egzaminów zewnętrznych Priorytet III Wysoka jakośd systemu oświaty, Program Operacyjny KAPITAŁ LUDZKI

Metodologie badania efektywności szkół. Tomasz Żółtak IFiS PAN

EDUKACYJNA WARTOŚĆ DODANA 2014 G I M N A Z J U M P U B L I C Z N E W B I S K U P I C A C H

Wyniki nauczania. Ewa Halska

Analiza wyników egzaminów zewnętrznych z wykorzystaniem edukacyjnej wartości dodanej. Opracowana dla uczniów Gimnazjum nr 1 w Jaworzu

EDUKACYJNA WARTOŚĆ DODANA 2016 G I M N A Z J U M P U B L I C Z N E W B I S K U P I C A C H

EDUKACYJNA WARTOŚĆ DODANA 2013 GIMNAZJUM PUBLICZNE W BISKUPICACH

UWARUNKOWANIA OSIĄGNIĘĆ SZKOLNYCH GIMNAZJALISTÓW

Pomiar gotowości szkolnej uczniów za pomocą skali quasi-obserwacyjnej

ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2013

EDUKACYJNA WARTOŚĆ DODANA 2015 G I M N A Z J U M P U B L I C Z N E W B I S K U P I C A C H

EDUKACYJNA WARTOŚĆ. OPRACOWANIE : Zespół ds. EWD przy Śląskim Kuratorze Oświaty z wykorzystaniem materiałów zespołu badawczego przy

OGÓLNOPOLSKIE BADANIE UMIEJĘTNOŚCI TRZECIOKLASISTY SPRAWDZIAN PO SZKOLE PODSTAWOWEJ EGZAMIN GIMNAZJALNY EGZAMIN MATURALNY

Kontekstowy model oceny efektywności nauczania dla pierwszego etapu edukacyjnego

Wyniki egzaminu gimnazjalnego rok szk. 2014/2015

Analiza wyników egzaminów zewnętrznych z wykorzystaniem edukacyjnej wartości dodanej. Opracowana dla uczniów Gimnazjum w Jaworzu

Kontekstowe wskaźniki efektywności nauczania - warsztaty

Wyniki egzaminu gimnazjalnego rok 2016

ANALIZA WYNIKÓW EGZAMINU MATURALNEGO Z MATEMATYKI Z ROKU 2017 W LICEUM OGÓLNOKSZTAŁCĄCYM W STRZELINIE Z ZASTOSOWANIEM KALKULATORA EWD 100

Diagnozowanie i ewaluacja pracy szkoły

Psychometria PLAN NAJBLIŻSZYCH WYKŁADÓW. Co wyniki testu mówią nam o samym teście? A. Rzetelność pomiaru testem. TEN SLAJD JUŻ ZNAMY

PROGRAM OPERACYJNY KAPITAŁ LUDZKI Priorytet III, Działanie 3.2 Rozwój systemu egzaminów zewnętrznych

Analiza edukacyjnej wartości dodanej dla Gimnazjum w Bolimowie w roku 2011

ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2012

Polska Warszawa SP 24. Polski Matematyka Angielski

EDUKACYJNA WARTOŚĆ DODANA

Gimnazjum nr 1 w Jaworzu ANALIZA WYNIKÓW EGZAMINÓW ZEWNĘTRZNYCH Z WYKORZYSTANIEM EDUKACYJNEJ WARTOŚCI DODANEJ

ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2015

Edukacyjna wartość dodana

Model EWD dla II etapu edukacyjnego.

Raport. z analizy wyników egzaminu gimnazjalnego. metodą EWD

WYNIKI SPRAWDZIANU I EGZAMINU GIMNAZJALNEGO w roku 2011 szkół podstawowych i gimnazjów w Turku

RAPORT WSKAŹNIK EDUKACYJNEJ WARTOŚCI DODANEJ PO EGZAMINIE GIMNAZJALNYM W ROKU SZKOLNYM 2012/2013

RAPORT EDUKACYJNA WARTOŚĆ DODANA

Ćwiczenia z zakresu Kalkulatora EWD

do egzaminu przystąpiło 31 uczniów: 16 uczniów klasy IIIa 15 uczniów klasy IIIb 8 osób powtarzało klasę jeden lub więcej razy (25,8% piszących)

Porównywalne między latami wyniki egzaminacyjne

Badania panelowe osiągnięd edukacyjnych uczniów szkół podstawowych i gimnazjów a rozwój wskaźnika EWD

Analiza EWD Gimnazjum nr 2 w Ropczycach w porównaniu do pozostałych 4 gimnazjów znajdujących się na terenie miasta Ropczyce za lata

Zespół Szkół Nr1 w Olkuszu -szkoła sukcesu dla przedmiotów matematyczno-przyrodniczych

Wyniki sprawdzianu i egzaminu gimnazjalnego w 2015r. uczniów szkół w gminie Masłów

Roman Dolata Determinacja statusowa osiągnięć szkolnych oraz różnicowanie się szkół na poziomie podstawowym i gimnazjalnym

Organizacja i metodologia badania Ścieżki rozwoju edukacyjnego młodzieży szkoły pogimnazjalne

Publiczne Gimnazjum im. Ks. Kardynała Stefana Wyszyńskiego w Choroszczy

Skalowanie wyników egzaminacyjnych

Latentna moc różnicująca zadań z testów matematycznych dla młodzieży uzdolnionej

Egzaminy zewnętrzne

Kontekstowe modele efektywności nauczania po I etapie edukacyjnym

Czy inteligencja i inne czynniki (nie tylko) psychologiczne pozwalają zrozumieć różnice we wzroście osiągnieć szkolnych?

10. Podstawowe wskaźniki psychometryczne

TEST HUMANISTYCZNY HISTORIA I WOS

Podsumowanie pracy szkół w roku szkolnym 2016/2017 na podstawie wyników egzaminu oraz raportu zespołu ewaluacyjnego nadzoru pedagogicznego

EGZAMIN GIMNAZJALNY 2011 W SZKOŁACH DLA DOROSŁYCH W WOJEWÓDZTWIE ŚLĄSKIM. sesja wiosenna

Rodzaje testów. Testy. istnieje odpowiedź prawidłowa. autoekspresja brak odpowiedzi prawidłowej ZGADYWANIE TRAFNOŚĆ SAMOOPISU

5. WNIOSKOWANIE PSYCHOMETRYCZNE

OSIĄGNIĘCIA EDUKACYJNE UCZNIÓW WOJEWÓDZTWA LUBUSKIEGO W ŚWIETLE WYNIKÓW EGZAMINU GIMNAZJALNEGO

Publiczna Szkoła Podstawowa nr 14 w Opolu. Edukacyjna Wartość Dodana

Efektywność nauczania w gimnazjach w świetle umiejętności uczniów nabytych w szkole podstawowej

Liczba zadań a rzetelność testu na przykładzie testów biegłości językowej z języka angielskiego

Statystyczną ideę szacowania wskaźników EWD dobrze ilustrują dwa poniższe wykresy:

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

SPRAWDZIAN I EGZAMINY 2013 W SZKOŁACH ARTYSTYCZNYCH. w w o je w ó dztwie śląskim

Czy EWD jest dobrą miarą efektywności nauczania?

Szukanie struktury skali mierzącej problematyczne zachowania finansowe.

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

15. PODSUMOWANIE ZAJĘĆ

Analiza wyników egzaminu EWD POTENCJAŁ NA PODSTAWIE SPRAWDZIANU PO VI KLASIE

Zadania rozrywające w testach

Egzamin gimnazjalny 12, 13 i 14 kwietnia 2011r.

Wyniki sprawdzianu i egzaminu gimnazjalnego w 2016r. uczniów szkół w gminie Masłów

WYNIKI EGZAMINU GIMNAZJALNEGO

Szkolny raport ewaluacyjny

Gimnazjum Nr 123 z Oddziałami Dwujęzycznymi i Oddziałami Integracyjnymi im Jana Pawła II

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku

OFERTA SZKOLENIOWA 2015/16

Transkrypt:

Trafność testów egzaminacyjnych Artur Pokropek, Tomasz Żółtak IFiS PAN

Plan prezentacji EWD i trafność testów egzaminacyjnych Pięć postulatów trafności dla skal pomiarowych Wskaźniki egzaminacyjne a wyniki testów PISA Zewnętrzne kryteria trafności Dyskusja

EWD i trafność testów egzaminacyjnych Aby oszacować relatywny przyrost wiedzy uczniów w szkołach, niezbędne są pomiary umiejętności, w momencie gdy rozpoczynają i kończą oni naukę. Warunkiem koniecznym dla trafności EWD jest trafność tych pomiarów, czyli stopień, w jakim nadają się one do szacowania relatywnego przyrostu wiedzy. Nawet najbardziej wyrafinowane metody statystycznie nic nie pomogą, jeżeli podstawa szacowania EWD okaże się niedostosowana do celów, jakie są przed tym wskaźnikiem stawiane.

Pięć postulatów trafności dla skal pomiarowych W literaturze poświęconej trafności wskaźnika EWD pojawia się, pięć postulatów odnoszących się do skal pomiarowych wykorzystywanych w konstrukcji wskaźnika EWD (Linn 2008, Reckase 2008). Skale wykorzystywane w modelowaniu EWD powinny być zatem: () mierzone na skali interwałowej; (2) wysoce rzetelne ; (3) nieobciążone błędami systematycznymi; (4) mierzyć ten sam konstrukt (dla jednej miary EWD) ; (5) skonstruowane z zachowaniem odpowiedniej reprezentacji treści nauczania.

Wymóg interwałowego charakteru skal.04.04 Gęstość.03.02.0 Gęstość.03.02.0 0 50 00 50 Matura, skala umiejętności humanistycznych 0 50 00 50 Matura, skala umiejętności mat.-przyr. Gęstość.04.03.02.0 Gęstość.04.03.02.0 0 50 00 50 Matura, język polski 0 50 00 50 Matura, matematyka.04.04 Gęstość.03.02.0 Gęstość.03.02.0 0 50 00 50 Egzamin część humanistyczna 0 50 00 50 Egzamin część mat.-przyr.

Wymóg zadowalającej rzetelności Rzetelność jest fundamentalną własnością testu, która decyduje o precyzji pomiaru umiejętności uczniów. Jeżeli test nie jest rzetelny, precyzja oceny umiejętności ucznia na jego podstawie jest niewielka. Niska rzetelność testów łamie założenia modelowania wykorzystywanego w konstrukcji EWD i może prowadzić do poważnych błędów w wyliczaniu wskaźnika (por. Pokropek 200, 203). Istnieje kilka miar rzetelności testu, jednak zdecydowanie najpopularniejszą jest Alfa Cronbacha, stosowana w Klasycznej Teorii Testów (KTT). Jako alternatywną miarę rzetelności, posłużyliśmy się więc oszacowaniem na podstawie wyników dwuparametrycznego modelu IRT, estymowanego w odniesieniu do danych z egzaminu gimnazjalnego.

Wymóg zadowalającej rzetelności Egzamin Wskaźnik rzetelności Alfa IRT Matura wskaźnik humanistyczny - 0,84 Matura wskaźnik mat.-przyr. - 0,944 Matura język polski - 0,8 Matura matematyka - 0,934 EG wskaźnik humanistyczny 0,83 0,807 EG wskaźnik mat.-przyr. 0,899 0,9

Wymóg braku błędów systematycznych (zróżnicowane funkcjonowanie zadań) Test nie będzie trafny wtedy, gdy będzie mierzył coś, czego mierzyć nie powinien. Test oprócz zakładanej umiejętności szkolnej może na przykład mierzyć płeć ucznia. Dzieje się tak, gdy zadania w teście są stronnicze płciowo, tj. prawdopodobieństwo poprawnej odpowiedzi zależy nie tylko od poziomu umiejętności ucznia, ale również od płci osoby rozwiązującej zadanie. Do innych należą także: pochodzenie ucznia, status społeczno-ekonomiczny rodziny, wielkość miejscowości etc. W trafnym pomiarze cechy te nie powinny mieć znaczenia dla trudności zadania przy kontroli poziomu umiejętności ucznia.

Wymóg braku błędów systematycznych Do zbadania zróżnicowanego funkcjonowania zadań wykorzystywanych w pomiarach umiejętności, wykorzystywanych w modelowaniu EWD wybrana została prosta, ale efektywna metoda oparta na modelu regresji dla zmiennych porządkowych. Najpierw należy stworzyć wskaźnik umiejętności uczniów. Następnie estymowane są modele regresji dla zmiennych o charakterze porządkowym osobno dla każdego zadania w których zmienną wyjaśnianą jest poziom rozwiązania zadania (ile punktów zostało zdobytych przez ucznia), a zmiennymi wyjaśniającymi są: poziom umiejętności ucznia i zmienna, co do której mamy przypuszczenie, iż może być odpowiedzialna za stronniczy charakter zadania. ologit( ) π β β θ β ki = + + 0 2 G

Zróżnicowane funkcjonowanie zadań ze względu płeć uczniów (zadania faworyzujące dziewczęta zostały oznaczone symbolem +, natomiast zadania faworyzujące chłopców symbolem -.). B oznacza mały istotny dif, C duży istotny dif. Egzamin liczba zadań ogółem liczba zadań z dif % zadań B+ C+ B- C- B+ C+ B- C- Matura wskaźnik humanistyczny 24 3 5 0 3 2% 4% 0% 0% Matura wskaźnik mat.-przyr. 275 6 5 4 20 2% 5% 5% 7% Matura język polski 24 0 0 0 0% 4% 0% 0% Matura matematyka 45 2 0 3 4% 0% 7% 2% EG wskaźnik humanistyczny 47 0 0 2 5 0% 0% 4% % EG wskaźnik mat.-przyr. 49 5 3 6 0% 2% 6% 2%

Zróżnicowane funkcjonowanie zadań ze względu na lokalizację szkoły (zadania faworyzujące uczniów szkół wiejskich zostały oznaczone symbolem +, natomiast zadania faworyzujące uczniów szkół miejskich symbolem -.). B oznacza mały istotny dif, C duży istotny dif. Egzamin liczba zadań ogółem liczba zadań z dif % zadań B+ C+ B- C- B+ C+ B- C- Matura wskaźnik humanistyczny 24 0 8 4 5 0% 6% 3% 4% Matura wskaźnik mat.-przyr. 275 3 3 0 7 % 5% 0% 3% Matura język polski 24 0 2 4% 0% 8% 4% Matura matematyka 45 0 0 2% 0% 0% 2% EG wskaźnik humanistyczny 47 2 0 6 3 4% 0% 3% 6% EG wskaźnik mat.-przyr. 49 0 0 0 0 0% 0% 0% 0%

Zróżnicowane funkcjonowanie zadań ze względu na status społeczny rodziny (zadania faworyzujące grupę uczniów o niskim SES zostały oznaczone symbolem +, natomiast zadania faworyzujące grupę uczniów o wysokim SES symbolem -.). B oznacza mały istotny dif, C duży istotny dif. Egzamin liczba zadań ogółem liczba zadań z dif % zadań B+ C+ B- C- B+ C+ B- C- Matura wskaźnik humanistyczny 24 2 0 2 0 2% 0% 2% 0% Matura wskaźnik mat.-przyr. 275 0 0 4 4 0% 0% % % Matura język polski 24 0 0 0 0 0% 0% 0% 0% Matura matematyka 45 0 0 0 0 0% 0% 0% 0% EG wskaźnik humanistyczny 47 0 0 0 0 0% 0% 0% 0% EG wskaźnik mat.-przyr. 49 0 0 0 0 0% 0% 0% 0%

Wymóg pomiaru tego samego konstruktu Egzamin gimnazjalny cześć humanistyczna część matematyczno przyrodnicza Matura Wskaźnik humanistyczny Język polski Wskaźnik matematycznoprzyrodniczy Matematyka Wskaźnik EWD EWD humanistyczne EWD język polski EWD matematycznoprzyrodnicze EWD matematyka

Egzamin Wymóg pomiaru tego samego Matura wskaźnik humanistyczny () Matura wskaźnik mat.-przyr. (2) Matura język polski (3) Matura matematyka (4) EG wskaźnik humanistyczny (5) EG wskaźnik mat.-przyr (6) konstruktu Egzamin () (2) (3) (4) (5) (6) 0,86 (0,007) X 0,488 (0,08) 0,59 (0,07) 0,575 (0,07) 0,487 (0,08) X 0,487 (0,08) 0,842 (0,007) 0,453 (0,08) 0,547 (0,08) 0,528 (0,07) 0,447 (0,09) 0,822 (0,008) 0,573 (0,06)

Wymóg odpowiedniej reprezentacji zadań Postulat dużej liczby odpowiedniej jakości zadań w zderzeniu z ograniczeniami w zakresie czasu testowania jednego ucznia jest źródłem poważnego utrudnienia. Dlatego w pomiarach testowych nie będących egzaminami używa się schematów, w którym duża liczba zdań rozwiązywana jest przez ograniczoną populację uczniów tak, że nie wszyscy uczniowie rozwiązują wszystkie zadania (por. OECD 2009). Z podobną sytuacją mamy do czynienia w przypadku złożonych wskaźników maturalnych, poprzez które wiedza uczniów oceniana jest na podstawie kilkuset różnych zadań z różnych przedmiotów. Taka sytuacja niestety nie jest możliwa w przypadku egzaminu gimnazjalnego, w którym mamy do czynienia z dużo mniejszą liczbą zadań. Jednak korelacje między miarami maturalnymi (opartymi na dużej liczbie zadania) a miarami gimnazjalnymi (opartymi na stosunkowo niewielkiej liczbie zdań) są wysokie, to i reprezentacja treści na egzaminie gimnazjalnym powinna być przynajmniej zadowalająca.

Wskaźniki egzaminacyjne a wyniki testów PISA Matura PISA 2009 ON2 PISA 2009 ON Gimnazjum 20 200 2009 Rok Struktura egzaminu gimnazjalnego (poza językiem obcym) oraz testowania w PISA PISA Egzamin gimnazjalny Matura rozumienie czytanych tekstów (reading) cześć humanistyczna Wskaźnik humanistyczny Język polski biegłość w zakresie przedmiotów przyrodniczych część matematyczno przyrodnicza Wskaźnik matematycznoprzyrodniczy (science) biegłość matematyczna (math) Matematyka

Macierz korelacji między skalowanymi umiejętnościami PISA 2009 ON i egzaminem gimnazjalnym Test () (2) (3) (4) (5) PISA 2009 ON: math () PISA 2009 ON: reading (2) 0,889 (0,00) PISA 2009 ON: science (3) 0,955 (0,009) 0,925 (0,02) EG wskaźnik humanistyczny (4) 0,54 (0,02) 0.659 (0,05) 0,529 (0,04) EG wskaźnik mat.-przyr (5) 0,864 (0,02) 0,64 (0,07) 0.704 (0,0) 0,573 (0,06)

Macierz korelacji między skalowanymi umiejętnościami PISA 2009 ON2 i egzaminem maturalnym Test () (2) (3) (4) (5) (6) (7) PISA 2009 ON2: math () PISA 2009 ON2: reading (2) 0,806 (0,03) PISA 2009 ON2: science (3) 0,946 (0,00) 0,865 (0,04) Matura wskaźnik humanistyczny (4) 0,535 (0,05) 0,645 (0,09) 0,606 (0,025) Matura wskaźnik mat.-przyr. (5) 0,778 (0,05) 0,577 (0,00) 0,75 (0,06) 0,86 (0,007) Matura język polski (6) 0,497 (0,027) 0,62 (0,09) 0,558 (0,026) x 0,487 (0,08) Matura matematyka (7) 0,79 (0,05) 0,525 (0,020) 0,578 (0,023) 0,488 (0,08) x 0,453 (0,08)

Zewnętrzne kryteria trafności Dopełnieniem analizy trafności narzędzi pomiarowych jest analiza relacji między badanym narzędziem a zewnętrznymi kryteriami, które zgodnie z teorią powinny być z nim związane. Test Ravena (klasyczny test inteligencji) Skala odnosząca się do czytania skonstruowania została na podstawie baterii dziewięciu stwierdzeń: () czytam tylko wtedy, kiedy muszę; (2) czytanie to jedno z moich ulubionych zajęć; (3) lubię rozmawiać z innymi na temat książek; (3) trudno mi jest doczytać książkę do końca; (4) cieszę się, gdy dostaję w prezencie książkę; (4) czytanie to strata czasu; (5) lubię chodzić do księgarni lub biblioteki; (6) czytam tylko po to, aby uzyskać potrzebne informacje; (7) nie mogę czytać dłużej niż parę minut; (8) lubię wyrażać opinie na temat książek; (9) lubię wymieniać się książkami z innymi. Wszystkie pozycje zadawane na 4-punktowej skali: (a) zdecydowanie się nie zgadzam, (b) nie zgadzam się, (c) zgadzam się, (d) zdecydowanie się zgadzam.

Trafność egzaminów CKE w świetle innych kryteriów Egzamin Matura wskaźnik humanistyczny Matura wskaźnik mat.-przyr. Matura język polski Matura matematyka EG wskaźnik humanistyczny EG wskaźnik mat.-przyr. Korelacje latentne IQ czytanie 0,39 0,44 (0,023) (0,020) 0,64 0,069 (0,05) (0,02) 0,389 0,398 (0,024) (0,02) 0,675 0,097 (0,08) (0,022) 0,323 0,325 (0,026) (0,022) 0,68 0,64 (0,02) (0,022)

Podsumowanie Analiza testów wykorzystywanych do konstrukcji maturalnego wskaźnika EWD potwierdza jej trafność. Skale wykorzystywane do konstrukcji EWD spełniają wszystkie podstawowe kryteria trafności, wykazując jedynie drobne odstępstwa od wyznaczonych wzorców. Nie ma żadnych silnych dowodów na to, że skale wykorzystywane w EWD maturalnym mają charakter inny niż interwałowy. Każdy z badanych testów odznacza się przynajmniej przeciętną rzetelnością. Analiza zadań egzaminacyjnych sugeruje co prawda możliwość występowania stronniczości zadań, lecz tylko dla płci, co w przypadku modelowania EWD ma marginalny charakter. Wysokie korelacje między miarami na wejściu i na wyjściu świadczą przynajmniej o podobieństwie mierzonych konstruktów Korelacje z pomiarem PISA i zewnętrznymi kryteriami pozwalają wierzyć, iż skale, które powstały na podstawie zadań egzaminacyjnych, mierzą to, co było celem pomiaru.

Dziękujemy za uwagę! Artur Pokropek, Tomasz Żółtak IFiS PAN