WYKORZYSTANIE PROBABILISTYCZNYCH MODELI ZADANIA TESTOWEGO DO ZRÓWNYWANIA WYNIKÓW SPRAWDZIANU I BUDOWANIA BANKU ZA'$

Podobne dokumenty
8)<&,(- =<.$352*5$MOWANIA ICL DO SZACOWANIA PARAMETRÓW KRZYWEJ CHARAKTERYSTYCZNEJ ZADANIA

KLASYCZNA I PROBABILISTYCZNA TEORIA TESTU ANALIZA PORÓWNAWCZA

SYSTEM OCENIANIA NAUCZYCIELI BIOLOGII

o partnerstwie publiczno-prywatnym.

WYKORZYSTANIE MODELU DIALOGICZNEGO OCENIANIA W KOMUNIKOWANIU WYNIKÓW EGZA0,18=(:1 75=1(*2

KORELACJA WYNIKÓW POMIARÓW

NA TROPACH NAUCZYCIELSKICH SYSTEMÓW.6=7$à&(1,$&=</,2&ENIANIE WIELOKRYTERIALNE NA PODSTAWIE ANALIZY WYNIKÓW SPRAWDZIANÓW Z MATEMATYKI

ZAMIERZONE I NIEZAMIERZONE SKUTKI LEKCEWA)(1,$%à '8320,$58 1$35=<.àA'=,(0$785<=Ä- =<.A POLSKIEGO

320,$580,(- 712&,PRZYRODNICZYCH 8&=1,Ï:6=.2à<32'67AWOWEJ =$3202&=$'$35$.TYCZNYCH

NOWY EGZAMIN MATURALNY W REPUBLICE CZESKIEJ

Oszacowanie umiejętności teta oraz wyskalowanie osi w metodzie IRT dla potrzeb obliczania parametrów zadań

8&=(3275$), 2&(1,û6,(%,("-(/, GO TEGO NAUCZYMY!

1. PARAMETRY TECHNICZNE WAG NAJAZDOWYCH.

Spis treœci :VWS Poziom podstawowy Poziom rozszerzony R]ZL]DQLD áRZQLF]HN Literatura

O CZYM MÓWI EFEKT STANDARDOWY?

Zapis stenograficzny (1532) 187. posiedzenie.rplvml3rolw\nl6sráhf]qhml=gurzld w dniu 25 listopada 2004 r.

Jan Bień. Modelowanie obiektów mostowych w procesie ich eksploatacji

Piotr 7U\EDáD. Leasing 3RUDGQLN3U]HGVLELRU \

,67271(:à$&,:2&,NAUCZYCIELSKICH SYSTE0Ï:.6=7$à&(1,$,,&H ROZPOZNAWANIE W NA8&=$1,8- =<.Ï:2%&<CH

SENAT RZECZYPOSPOLITEJ POLSKIEJ V KADENCJA. Warszawa, dnia 3 sierpnia 2005 r. Druk nr 1074

Zapis stenograficzny (1530) 162. posiedzenie.rplvml6dpru]gx7hu\wruldoqhjr i AdmiQLVWUDFML3DVWZRZHM w dniu 25 listopada 2004 r.

Porównywalne między latami wyniki egzaminacyjne

Zapis stenograficzny (1537) 188. posiedzenie.rplvml3rolw\nl6sráhf]qhml=gurzld w dniu 30 listopada 2004 r.

STACJE ELEKTROENERGETYCZNE

Spis treœci WSTÊP... 3 KLUCZ ODPOWIEDZI BIBLIOGRAFIA

Zadania rozrywające w testach

Ewolucyjna optymalizacja wielokryterialna

ZADANIA ROZRYWAJĄCE W TESTACH. 1. Co to jest zadanie rozrywające?

SENAT RZECZYPOSPOLITEJ POLSKIEJ V KADENCJA SPRAWOZDANIE. KOMISJI 867$:2'$:67:$,35$:25='12&, oraz KOMISJI SPRAW ZAGRANICZNYCH

Porównywalne między latami wyniki egzaminacyjne

Zapis stenograficzny (1653) 27. posiedzenie Komisji Spraw Unii Europejskiej w dniu 25 lutego 2005 r.

5. WNIOSKOWANIE PSYCHOMETRYCZNE

Porównywalne między latami wyniki sprawdzianu

LABORATORIUM TECHNIKA CYFROWA 2 BADANIE PARAMETRÓW STATYCZNYCH I DYNAMICZNYCH BRAMEK LOGICZNYCH

8&+:$à$15;;;,,, RADY MIASTA TYCHY z dnia 31 marca 2005 r.

Skąd te garby? Czyli o tym, co może być powodem nienormalności rozkładu wyników sprawdzianu dla szóstoklasistów z kwietnia 2006 roku

Sterowanie wielkością zamówienia w Excelu - cz. 3

Marek Panfil. =$5='=$1,(1$/()12&,$0, :0$à<0,5('1,0 35=('6, %,2567:,(

KWIT WYWOZOWY/PODWOZOWY (KW)

Latentna moc różnicująca zadań z testów matematycznych dla młodzieży uzdolnionej

Trafność egzaminów w kontekście metody EWD

.à2327<=- =<.,(0. rozumienia czytanego tekstu nieliterackiego

Irena Zubel..V]WDáWRZDQLHVWUXNWXUSU]HVWU]HQQ\FK w krzemie PHWRGWUDZLHQLDDQL]RWURSRZHJR GR]DVWRVRZDZPLNURHOHNWUonice

Zespół Szkół Publicznych w Łasinie. Szkoła Podstawowa. Analiza statystyczna wyników sprawdzianu szóstoklasisty. kwiecień 2013

UMOWA NR RAP/130/2010

CZY ESEJ MATURALNY I WYPRACOWANIE 61,(=$67PIONE?

3URMHNWRZDQLHVFKHPDWyZ UHODF\MQ\FKED]GDQ\FK± 1RUPDOL]DFMD. =E\V]NR.UyOLNRZVNL ,QVW\WXW,QIRUPDW\NL3ROLWHFKQLNL3R]QDVNLHM 3R]QDXO3LRWURZR

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

52/$35=<.à$'2:<&+$RKUSZY EGZAMINACYJNYCH W KS=7$à72:$1,8 80,(- 712&,= PRZEDMIOTÓW HUMANISTYCZNYCH

,1)<1,(56.,(%$=<'$1<&+'/$0$à<&+35=('6, %,2567: ENGINEERING DATA BASES FOR SMALL ENTERPRISES


STOPNIE SZKOLNE PO0$*$- CZY PRZESZKADZA-:2&(1,$1,86=.2/NYM?

Model FSM w zastosowaniu do klasyfikacji.

52/$',$*12=<26,*1, û8&=1,ï: W PROCESIE BADANIA J$.2&,35$&<6=.2à<

Zawartość. Zawartość

UMOWA NR RAP/103/2010

WZÓR... OFERTA 25*$1,=$&-,32=$5='2:(-32'0,278-('1267., ORGANIZACYJNEJ* REALIZACJI ZADANIA PUBLICZNEGO.... (rodzaj zadania) w okresie od... do...

Kontekstowe wskaźniki efektywności nauczania - warsztaty

Pobieranie prób i rozkład z próby

Czy egzaminy zewnętrzne mogą pomóc szkole w rozwoju? Ewa Stożek Sulejówek, czerwiec 2013

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

STATYSTYKA MATEMATYCZNA

0,$67$,*0,1<67 6=(: :L]MD]UyZQRZD*RQHJRUR]ZRMXgminy. :VWUDWHJLL ]UyZQRZD*RQHJR UR]ZRMX PLDVWD LJPLQ\ 6WV]HZ OLGHU]\ JPLQ\ RSUDFRZDOL QDVWSXMFZL]MJPLQ\

: Autor: Ks. Wojciech Cichosz. 2. 7\WXá:\FKRZDQLHFKU]HFLMDVNLHZREHFSRVWPRGHUQLVW\F]QHMSURZRNDFML. 3. 'UyGáR*GDVN

Wyniki egzaminu gimnazjalnego rok szk. 2014/2015

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

PODSUMOWANIE EGZEMINU GIMNAZJALNEGO 2017/2018 MATEMATYKA

Aktualizacja z 20 sierpnia 2015 r.

Dlaczego należy uwzględniać zarówno wynik maturalny jak i wskaźnik EWD?

INFROMACJA o wynikach sprawdzianu przeprowadzonego 2 kwietnia 2009 roku w szóstych klasach szkół podstawowych na terenie województwa podlaskiego

Podstawowe definicje statystyczne

Szanowni Państwo! Dodatkowe informacje na temat badania Kompetencje 2018 znajdą państwo na naszej stronie internetowej (

&]HVáDZ'RPDVNL 8QLZHUV\WHW àyg]nl. Zastosowanie testów serii znaków w statystycznej kontroli procesu

ODWODNIENIA BUDOWLI KOMUNIKACYJNYCH

KARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Analiza wyników sprawdzianu szóstoklasisty z języka obcego nowożytnego w roku szkolnym 2014/2015

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

METODY STATYSTYCZNE W BIOLOGII

OKRĘGOWA KOMISJA EGZAMINACYJNA W GDAŃSKU WYDZIAŁ BADAŃ I ANALIZ STOPNIEŃ OPANOWANIA UMIEJĘTNOŚCI BADANYCH NA SPRAWDZIANIE W 2005 ROKU

Wykorzystanie wyników egzaminów zewnętrznych w pracy nauczycieli

0HWRG\HNVSORUDFMLGRVWSQHZ2UDFOHi Data Mining

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

Monte Carlo, bootstrap, jacknife

JAK DOROBEK NAUKOWY PROFESORA NIEMIERKI 2'0,(1,à2%/,&=('<'AKTYKI CHEMII

Porównywanie wyników egzaminów propozycja metody

STYL KIEROWANIA PROC(6(0.6=7$à&(1,$ -$.2.217(.6726,*1, û32=1$:&=<&+ I MOTYWACYJNYCH UCZNIÓW

Wynik punktowy uczniów ze sprawdzianu Opis dydaktyczny wyniku Klasa VIA Klasa VIB Klasa VIC Klasa VID 0 11 pkt NajniŜszy

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Czy nowy klucz punktowania ma wpływ na komunikowanie wyników sprawdzianu 2010 roku? (na podstawie analizy rozwiązań zadań 21. i 23.

ŚLĄSKIE TECHNICZNE ZAKŁADY NAUKOWE EDUKACYJNA WARTOŚĆ DODANA

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

3U]HNáDG\ I_j_\h^u. .OHPHQV+DQNLHZLF]LMHJRG]LHáR Grundzüge der Slavischen Philosophie. De_f_gkOZgd_\bqb_]hdgb]Z Grundzüge der Slavischen Philosophie

Wyniki egzaminu gimnazjalnego z języka angielskiego 2015

WSTĘPNA ANALIZA WYNIKÓW SPRAWDZIANU W SZÓSTEJ KLASIE W PUBLICZNEJ SZKOLE PODSTAWOWEJ W NARAMICACH W ROKU 2011

Transkrypt:

HENRYK SZALENIEC OKE Kraków WYKORZYSTANIE PROBABILISTYCZNYCH MODELI ZADANIA TESTOWEGO DO ZRÓWNYWANIA WYNIKÓW SPRAWDZIANU 2003 2005 I BUDOWANIA BANKU ZA'$ :VWS -HGQ\P]FHOyZZSURZDG]HQLDHJ]DPLQyZ]HZQWU]Q\FKE\áRRF]HNLZDQLH *H LFKZ\QLNLEGSU]\GDWQHGROHG]HQLD]PLDQHGXNDF\jQ\FKZVNDOLFDáHJR kraju i QDSU]HVWU]HQLZLHOXODW6WDW\VW\F]QHZVND(QLNLZ\QLNyZXF]QLyZZ\Ua- *RQH Z VNDOL SXQNWyZ VXURZ\FK OLF]ED SXQNWyZ ]D FDá\ WHVW X]\VNDQ\FK Soprzez zastosowanie tych arkuszy w poszczególnych lawdfk PRJ ]PLHQLDü VL z SRZRGXZDKDSR]LRPXEDGDQHMFechy w populacji. Z drugiej strony, wyniki X]\VNDQH ]D SRPRFUy*Q\FK DUNXV]\ HJ]DPLQDF\MQ\FK ]Eudowanych nawet QDMEDUG]LHMSRUyZQ\ZDOQLHMDNWRMHVWPR*OLZHGREDGDQLDW\FKVDP\FKXPLHMt- QRFL V Uy*QH FKRFLD* SRPLDU E\á SU]HSURZDG]RQ\ GOD WHM VDPHM SRSXODFML 2]QDF]DWR*HZ\QLNLGZyFKUy*Q\FKWHVWyZQLHVEH]SRUHGQLRSRUyZQywalne. :]JOGQH]PLDQ\ SR]LRPX RVLJQLü XF]QLyZ Z ZRMHZyG]WZDFK SRZLatach gminach i V]NRáDFKDQDZHWLNODVDFKQDXFzanych w tej samej szkole przez Uy*Q\FK QDXF]\FLHOLVVWRVXQNRZRáDWZRSRUyZQywalne w standardowej skali staninowej. W VNDOL QRUPRZDQHM FRURF]QLH GOD ND*GHJR HJ]DPLQX QD NUDMRZHM SRSXODFMLXF]QLyZSLV]F\FKGDQ\HJ]DPLQ]DSHZQLDMFXNáDGRGQLHVLHQLDGDM- F\ND*GHJRURNXUHGQLGODNUDMXUyZQVWDQLQyZ1LHVWHW\QLHPR*QDZWHQ VSRVyEGRNRQDüSRUyZQDSoGáX*Q\FKSRPLG]\NROHMQ\PLODWDPLGODFDáHJR NUDMXJG\*UHGQLZ\QLNGODFDáHMSRSXODFMLND*Gego roku jest taki sam i wynosi 5 staninów. Aby wynikigzyfkhj]dplqyzprjá\e\üvwrvrzdqh]dplhqqlhgrzqloskowania o RVLJQLFLDFK NROHMQ\FK SRSXODFML XF]QLyZ PXVLP\ GRNRQDü NDOLbrowania arkuszy zastosowanych w kolejnych latach, czyli takiego wyjustowania QDU]G]LSRPLDUXDE\PR*QDE\áRSRZLHG]LHü*HX]\VNDQH]DLFKSRPRFZ\Qi-

104 Henryk Szaleniec ki egzaminów z Uy*Q\FKODWVUyZQRZD*QH1LHVWHW\ZSRPLDU]HG\GDNW\F]Q\P QLHG\VSRQXMHP\SXQNWDPLVWDá\PLGODVNDOLMDNWRPDPLHMVFHZSU]\SDGNXSomiaru temperatury. EmSLU\F]QD VNDOD WHPSHUDWXU\ &HOVMXV]D ]RVWDáD RNUHORQD SU]H]SU]\MFLH o C dla temperatury topnienia lodu i 100 o C dla temperatury wrze- QLDZRG\SRGFLQLHQLHP1P 2 6NDOD)DKUHQKHLWD]DVWRVRZDQDZDngielskim czy amerykavnlp V\VWHPLH PLDU WH* MHVW RSDUWD QD GZyFK SXQNWDFK VWDá\FKDOH o F odpowiadawhpshudwxu]hplhv]dqlq\qlhjx]vdopldnlhpd 100 o F WHPSHUDWXU]HQRUPDOQHMOXG]NLHJRFLDáD6áXFKDMFZ.UDNRZLHSURJQR]\So- JRG\]:DV]\QJWRQXPXVLP\GRNRQDüSU]HOLF]HQLDQDSRGVWDZLHSU]HSURZDG]o- QHJRNLHG\]UyZQDQLDDQJequating) odczytów temperdwxu\zlhg]f*h o C to 32 o F, a 100 o C to 212 o )'ZDWHUPRPHWU\MHGHQ]HVNDO&HOVMXV]DDGUXJL]H VNDO)DKUHQKHLWDWRWDNMDNGZDUy*ne arkusze sprawdzianu z 2003 i 2005 r. z WUy*QLF*HGODSR]LRPXXPLHMWQRFLQLHPR*HP\RNUHOLüSXQNWyZVWDá\FK MDNZSU]\SDGNXSRPLDUXWHPSHUDWXU\'ODWHJRWH*]UyZQ\ZDQLDPXVLP\GRNo- Q\ZDü ]D ND*G\P UD]HP JG\ ]EXGXMHP\ QRZH QDU]G]LH SRPLDUX kolejny DUNXV] HJ]DPLQDF\MQ\ Z\NRU]\VWXMF DOER ZVSyOQH ]DGDQLD GOD GZyFK VSUDw- G]LDQyZ ]DGDQLD NRWZLF]FH DOER SUyE XF]QLyZ UR]ZL]XMF\FK GRGDWNRZ\ WHVW]DZLHUDMF\UHSUH]HQWDFM]DGD]RE\GZXWestów. 0LVOHY\SRGNUHOD 1 *HSURFHV]UyZQ\ZDQLDZ\QLNyZHJ]DPLQXMHVWFLOH ]ZL]DQ\] SURFHVHPWZRU]HQLDDUNXV]\HJ]DPLQDF\MQ\FK-H*HOL]UyZQDQLHGobrze funkcjonumh WR QDMF]FLHM GODWHJR *H SU]HVWU]HJDQR SURFHGXU\ GREUHJR NRQVWUXRZDQLDQDU]G]LHJ]DPLQDF\MQ\FK:DUXQNLHPNRQLHF]Q\PGRSU]HSUo- ZDG]HQLD SURFHVX ]UyZQ\ZDQLD Z\QLNyZ GZyFK HJ]DPLQyZ QLH]DOH*QLH RG wybranej metody, jest to, aby zastosowane na egzamindfkqdu]g]lde\á\]exgo- ZDQHGRSRPLDUXWHJRVDPHJR]DNUHVXXPLHMWQRFLL ZHGáXJW\FKVDP\FKVSHFy- ILNDFML VWDW\VW\F]Q\FK RSLVXMF\FK FKDUDNWHU\VW\NL WHVWX OLFzED L IRUPD ]DGD ádwzrü PRF Uy*QLFXMFD]DGD U]HWHOQRü RGFK\OHQLH VWDQGDUGRZH: SU]y- SDGNXHJ]DPLQyZ]HZQWU]Q\FKZDUXQHNWHQMHVWVSHáQLRQ\MH*HOL]HVSRá\DXWRr- VNLH DUNXV]\ HJ]DPLQDF\MQ\FK SRV]F]HJyOQ\FK RNUJRZ\FK NRPLVML HJ]DPLQD- F\MQ\FKZSHáQLSU]HVWU]HJDMXVWDOH&HQWUDlnej Komisji Egzaminacyjnej. W ogólnych zarysach ustalenia C.(SR]ZDODMQDX]\VNDQLHQDU]G]LPLe- U]F\FKWHQVDP]DNUHVXPLHMWQRFLZSRGREQ\VSRVyE1LHREHMPXMRQHMHGQDN WDNLFK SDUDPHWUyZ VWDW\VW\F]Q\FK MDN PRF Uy*QLFuMFD ]DGD ádwzrfl ]DGD i RGFK\OHQLHVWDQGDUGRZHGODFDáHJRWHVWX: SU]\V]áRFLZDUWRUR]ZD*\üX]XSHá- QLHQLH XVWDOH RJyOQRSROVNLFK UywQLH*Z zakresie wspomnianych parametrów VWDW\VW\F]Q\FKDUNXV]D=DGDQLHWRE\áRE\]QDF]QLHáDWZLHMV]HJG\E\QDV]V\stem egzaminów zezqwu]q\fk G\VSRQRZDá RGSRZLHGQLR ]DVREQ\P EDQNLHP ]DGD GOD ND*GHJR HJ]DPLQX%DQNX QLH GD VL MHGQDN XWZRU]\ü W\ONR SRSU]H] ]JURPDG]HQLH ]DGD L VNDWDORJRZDQLH LFK ZHGáXJ SRPLarowych parametrów. 3DUDPHWU\]DGDWDNLHMDNPRFUy*QLFXMFDLWUXGQRüPXV]E\üZ\NDOLEURZDQH ZWHMVDPHMSU]HG]LDáRZHMVNDOL]XVWalonym punktem Ä LMHGQRVWNSRPLDURZ 1 Mislevy R.J., Linking educational assessments: Concepts, issues, methods, and prospects, ETS Policy Information Center, Princeton, NJ 1992.

Wykorzystanie probabilistycznych modeli zadania testowego do zrównywania wyników... 105 7ZRU]HQLHEDQNX]DGDWRGUXJLHRERNOHG]HQLDWUHQGyZ]PLDQRVLJQLü w populacji zadanie, do którego konieczne jest zrównywania arkuszy egzaminacyjnych. :SUDNW\FHSRPLDURZHMVWRVRZDQHVQDMF]FLHMWU]\VWDW\VW\Fzne metody ]UyZQ\ZDQLDPHWRGDOLQLRZDPHWRGDUHGQLFKLPHWRGDHNZLFHQW\ORZDED]XMce na klasycznej teorii pomiaru, oraz szereg metod z wykorzystaniem probabilistycznej teorii wyniku zadania (Item Response Theory,57.D*GDPR*HE\ü ]DVWRVRZDQDGODUy*Q\FKSODQyZHNVSHU\PHQWDOQ\FKSRZL]DQLD]HVREDUNXV]\ egzaminacyjnych. Od trzech lat metoda ekwicentylowa z powodzeniem jest sto- VRZDQD SU]H] :\G]LDá 6SUDZG]LDQyZ &.( L SURI %ROHVáDZD 1LHPLHUN GR ]UyZQ\ZDQLDZ\QLNyZVSUDZG]LDQXZNROHMQ\FKODWDFKSU]\MPXMF za rok bazowy 2003 2 :\QLNLSURZDG]RQ\FKDQDOL]SR]ZROLá\]DXZD*\ü]DU\VoZXMF\VL RG U WUHQG Z]URVWX SR]LRPX RVLJQLü NROHMQ\FK URF]QLNyZ V]yVWRNODVi- VWyZVSRZRGRZDQ\SUDZGRSRGREQLHHIHNWHP]ZURWQ\PHJ]DPLQyZ]HZQWUznych. Równolegle z analizami prowadzonymi z wykorzystaniem metody ekwicen- W\ORZHMSRF]ZV]\RGUSURZDG]RQHVSUyE\]DVWRVRZDQLDGR]UyZQ\Za- QLDDUNXV]\PHWRGED]XMF\FKQDSUREDELOLVW\F]QHMWHRULLZ\QLNX]DGDQLD0HWo- G\WHRGZLHOXODWVV]HURNRVWRVoZDQHQDZLHFLHZ invw\wxfmdfksurzdg]f\fk EDGDQLD SRUyZQDZF]H L HJ]DPLQ\ ]HZQWU]QH : GDOV]HM F]FL WHJR DUW\NXáX VSUyEXMHP\ SU]HGVWDZLü GRZLDGF]HQLD X]\VNDQH SRGF]DV ]UyZQ\ZDQLD Z\Qików sprawdzianu 2004 i 2005 r. do rezultatów zarejestrowanych w 2003 r. 1. Krótkie wprowadzenie do probabilistycznej teorii zadania 3RHJ]DPLQLHG\VSRQXMHP\GODND*GHJRXF]QLDRNUHORQOLF]ESXQNWyZ NWyUHWHQX]\VNDá]DUR]ZL]DQLH]DGD]DZDUW\FKZDUNXV]XHJ]DPLQDF\jnym. 7OLF]ESXQNWyZQD]\ZDP\WH*]DREVHUZRZDQOLF]ESXQNWyZLMHVt ona naj- F]FLHMSRGVWDZZV]HONLFKDQDOL]ZNODV\F]QHMWHRULLSRPLDUXG\GDNW\F]QHJR *G\E\P\PLHOLPR*OLZRüSowtórzenia wiele razy tego samego testu dla danej RVRE\ZWDNLVSRVyEDE\Z\NOXF]\üHIHNW]DSDPLWDQLDUR]ZL]DWRRWU]\Pa- OLE\P\V]HUHJZ\QLNyZNWyUHPLDá\E\UR]NáDGQRUPDOQ\%\áE\WRLQG\ZLGXDl- Q\RJUDQLF]RQ\GRGDQHMRVRE\UR]NáDGZ\QLNyZ]WHVWXUHGQLDDU\WPHW\F]QD z tego prywatnegour]nádgxsxqnwyzqd]\zdqdmhvwz klasycznej teorii testu wynikiem prawdziwym. Wynik prawdziwy nie jest obserwowalny - MHVW SRMFLHP VWDW\VW\F]Q\PLQLHPDQLFZVSyOQHJR]SRMFLHPOLF]E\SXQNWyZNWyUDU]HF]y- ZLFLH RNUHOD Z\QLN GDQHJR XF]QLD :\QLN ]DREVHUZRZDQ\ WR MHGQD SUyED losowa z WDNLHJRUR]NáDGX5y*QLFDSRPLG]\Z\QLNLHP]DREVHUZRZDQ\PD wynikiem prawdziwym na]\zdvleághpsrpldux 2 Niemierko B., Zrównywanie wyników sprawdzianu 2004 do wyników sprawdzianu 2003, [w:] B. Niemierko, H. Szaleniec (red.), 'LDJQRVW\NDHGXNDF\MQD6WDQGDUG\Z\PDJDLQRUP\Westowe w diagnostyce edukacyjnej.udnyz WHQ*H Zrównywanie wyników sprawdzianu 2005 do wyników sprawdzianu 2003UDSRUWSU]HVáDQ\GR&.(

106 Henryk Szaleniec -H*HOL%HDWDL5RPHNX]\VNDOLUy*QHZ\QLNLZVSUDZG]LDQLHUQS i SNWWRQLHZLHP\F]\WDUy*QLFDSRFKRG]L]Uy*QLF\ZSR]LRPLHLFKXPLHMt- QRFLF]\WH*MHM(UyGáHPMHVWEáGSRPLDUX=PLHQQRüZ\QLNyZZFDáHMSRSXOa- FML SLV]F\FK WHVW MHVW VXPZDULDQFMLZ\Qików prawdziwych poszczególnych uczniów i ZDULDQFMLEáGyZSRPLarowych. war(x) = war(t) + war(e) gdzie: X ]PLHQQDR]QDF]DMFDZ\QLN]DREVHUZRZDQ\ZZ\QLNXWestowania, T E zmienna oznac]dmfdz\qlnsudzg]lz\ ]PLHQQDR]QDF]DMFDEáGSRPLDUX Stosunek wariancji wyniku prawdziwego war(t) do wariancji wyników za- REVHUZRZDQ\FKOLF]E\SXQNWyZZDU;GHILQLXMHU]HWHOQRüZ\QLNyZWHVWRZania. 2F]\ZLFLHQLHGDVLRV]DFRZDüU]HWHOQRFL]IRUPXá\GHILQLF\MQHM,VWQLHMHV]HUHJ PHWRGV]DFRZDQLDU]HWHOQRFLZ\QLNyZWHVWRZDQLDDOHZW\PDUW\NXOHQLHEG]Le- P\VLQLPL]DMPRZDü:\QLN]DREVHUZRZDQ\OLF]EDSXQNWyZZ\QLNSUDZG]iwy i U]HWHOQRü WRSRGVWDZRZHSRMFLDNODV\F]QHMWHRULLSRPLaru dydaktycznego. :SUREDELOLVW\F]QHMWHRULLZ\QLNX]DGDQLDFHQWUDOQ\PSRMFLHPMHVWQLHRbserwowalna cecha, która jest przedmiotem pomiaru (ang. latent variable). W SRPLDU]H G\GDNW\F]Q\P PR*H WR E\ü SRMHG\QF]D XPLHMtQRü OXE ]HVSyá XPLHMWQRFL &HFKD NWyUD ]PLHQLD VL Z VSRVyE FLJá\ RG PLQXV GR SOXV QLe- VNRF]RQRFLL PR*HE\üSU]HGVWDZLRQDQDRVLOLF]EU]HF]\ZLVW\FK:SUDNW\FH QDMF]FLHM MHVW WR SU]HG]LDá RG - GR 3XQNW Ä QD WHM SU]HG]LDáRZHM VNDOL Z\ELHUDQ\MHVWQDMF]FLHMZVSRVyEDUELWUDOQ\WDNDE\RGSRZLDGDáUHGQLHMWUXd- QRFLWHVWX&HOHPSRPLDUXMHVWXV]HUHJRZDQLHRVyEQDMEDUG]LHMSUHF\]\MQLHMDN WRMHVWPR*OLZH]HZ]JOGXQDZ\Uy*QLRQFHFK1DU]G]LHPGRWHJRXV]HUHJo- ZDQLDV]DGDQLDWHVWRZH3R]LRPWHMFHFK\WRNRQNUHWQ\SXQNWQa osi liczb rze- F]\ZLVW\FK:]GáX*WHMVDPHMRVLPR*QDXV]HUHJRZDü]DGDQLD]HZ]JOGXQDLFK poziom trudnofl Krzywa charakterystyczna zadania w modelu deterministycznym Krzywa charakterystyczna zadania w modelu probabilistycznym 5\V=DOH*QRüSUDZGRSRGRELHVWZDRGSRZLHG]LQD]DGDQLHRWUXGQoFL RGSRZLDGDMFHMSXQNWRZLQDVNDOLZ]DOH*QRFLRGSR]LRPXXPLeMWQRFLXF]QLD (w deterministycznym i probabilistycznym modelu odpowiedzi na zadanie)

Wykorzystanie probabilistycznych modeli zadania testowego do zrównywania wyników... 107 : NODV\F]QHM WHRULL SRPLDUX SUDZGRSRGRELHVWZR SRSUawnej odpowiedzi QD]DGDQLHPR*QDRSLVDü]DSRPRFGHWHUPLQLVW\F]QHJRPRGHOX-H*HOLSR]LRP XPLHMWQRFL5RPNDMHVWQL*V]\RGSR]LRPXWUXGQRFL]adania (por. rys. 1. i 2.), WRSUDZGRSRGRELHVWZRUR]ZL]DQLD]DGDQLDSU]H]WHVWRZDQHJRZ\QRVL1DWomiast, jh*holsr]lrpxplhmwqrfl%hdw\mhvwz\*v]\rgwuxgqrfl]dgdqld]dvwosowanego do pomiaru, to prawdopogrelhvwzrsrsudzqhmrgsrzlhg]lz\qrvl :PRGHOXSUREDELOLVW\F]Q\PSUDZGRSRGRELHVWZRSRSUDZQHMRGSRZLHG]L QD]DGDQLH]PLHQLDVLZVSRVyEFLJá\RG dla bardzo niskiego poziomu umie- MWQRFLGRGODEDUG]RZ\VRNLHJRSU]\MPXMFZDUWRüGODSR]LRPXXPLe- MWQRFLUyZQHMWUXGQRFL]DGDQLD2]QDF]DWRPLQ*HLVWQLHMHSHZQHSUDZGRSo- GRELHVWZRL*XF]HREDUG]RQLVNLPSR]LRPLHXPLHMWQRFLEDGDQHM przez zada- QLHUR]ZL*HMHSRSUDZQLH7DNVDPRQLHMHVWQLHSUDZGRSRGREQH*HXF]HRZysokim poziomie bagdqhmxplhmwqrflqlheg]lhsrwudilájrur]zl]dü 3RGZDOLQ\REHFQLHVWRVRZDQHMWHRULL,57VWZRU]\OLQLH]DOH*QLH*HRUJ5DVFK oraz Fred Lord. Georg RDVFKUR]ZLQáPDWHPDW\F]Q\PRGHOSRPLDUXED]XMFQD SUREDELOLVW\F]QHMUHODFMLSRPLG]\WUXGQRFL]DGania i poziomem cechy badanej tym zadaniem. Model Rascha w QDMSURVWV]\PSU]\SDGNXRGQRVLVLGRRNUHOHQLD ZDUXQNRZHJRSUDZGRSRGRELHVWZDSR]\W\ZQHMRGSRZiedzi na zadanie punkto- ZDQHMDNRIXQNFMLUy*QLF\SRPLG]\WUXGQRFL]DGDQLDDSR]LRPHPXPLHMt- QRFL GaQHJR XF]QLD 3UDZGRSRGRELHVWZR XG]LHOHQLD SRSUDZQHM RGSRZLHG]L i uzyskania 1 punktu przez ucznia n na zadanie ipr*hp\z\ud]lüpdwematycznie za poprfuyzqania (1). P ni [ I n - b i ) (1) 5yZQDQLHPR*HE\üGRNáDGQLHMSU]HGVWDZLRQH]DSRPRFIXQNFMLORJistycznej w QDVWSuMFHMSRVWDFL 3 QL [ QL = H θ Q L θ Q EL = θ E Q L, (2) + H gdzie: P ni SUDZGRSRGRELHVWZR *H GDQ\ XF]H X]\VND SXQNW ]D ]DGDQLH ÄL punktowane 0;1, x ni wynik punktowy ucznia n za zadanie i, b i SDUDPHWUWUXGQRFL]DGDQLDi, θ n SR]LRPXPLHMWQRFLXF]QLDn, e = 2,7183 odstawa logarytmów naturalnych. Punkt wyjfldgrvwzru]hqldpldu\sr]lrpxxplhmwqrflzprghox5dvfkd jest taki sam jak w klasycznej teorii pomiaru. Jest to obliczenie proporcji popraw- Q\FK RGSRZLHG]L QD ]DGDQLD Z WHFLH XG]LHORQ\FK SU]H] GDQHJR XF]QLD SU]\ punktowaniu 0;1 ádwzrüwhvwxgodxcznia) i proporcji poprawnych odpowiedzi QD GDQH ]DGDQLH XG]LHORQ\FK SU]H] ZV]\VWNLFK XF]QLyZ F]\OL ádwzrü GDQHJR zadania. Wyniki surozhzwhflhwzru]fhw\onrvndosru]gnrzv]duyzqr E

108 Henryk Szaleniec warunkiem koqlhf]q\pmdnz\vwduf]dmf\pgrrv]dfrzdqldsr]lrpx badanej umiemwqrfl θ n i WUXGQRFL ]DGDQLD E i. 5y*QLFD SRPLG]\ WUXGQRFL ]DGDQLD a SR]LRPHPXPLHMWQRFLRVRE\UR]ZL]XMFHM]DGDQLHMHVWSRGVWDZGRRV]DFo- ZDQLDSUDZGRSRGRELHVWZDUR]ZL]DQLDWHJR]DGDQLDSU]H]GDQRVRE/RJLND modelu jest stosunkrzrsurvwd'odzv]\vwnlfkur]zl]umf\fk]dgdqldzlnv]h MHVWSUDZGRSRGRELHVWZRRVLJQLFLDVXNFHVXSU]\UR]ZL]\ZDQLXáDWZ\FK]DGD QL*ZSU]\SDGNXUR]ZL]\ZDQLD]DGDWUXGQLHMV]\FK3LHUZV]\PNURNLHPRV]a- FRZDQLD SR]LRPX XPLHMWQRFL RVRE\ n jest przekv]wdáfhqlh SURSRUFML SRSUDwnych odpowiedzi w SUDZGRSRGRELHVWZRVXNFHVXNWyUHMHVWV]DFRZDQHSRSU]H] obliczenie ilorazu proporcji poprawnych odpowiedzi p GR SURSRUFML EáGQ\FK odpowiedzi (1-p). Logarytm naturalny z tego ilorazu stanowi w najprostszym prz\sdgnxrv]dfrzdqlhxplhmwqrflgdqhmrvre\'rnáddnie taka sama procedura SRZWDU]DQDMHVWGODRV]DFRZDQLDWUXGQRFL]DGD'ODGDQHJR]DGDQLDi obliczamy logarytm naturalny ilorazu proporcji poprawnych odpowiedzi na dane zadanie przez wszystkie osoby rozwl]xmfhrud]sursrufmleágq\fkrgsrzlhg]lrvyeurz- ZL]XMF\FKWR]DGDQLH1aVWSQLHWUXGQRü]DGDQLDb i LSR]LRPXPLHMWQRFLGDQHM osoby n ORNRZDQHVQDZVSyOQHMVNDOLLZ\UD*DQHZ jednostkach logarytmu naturalnego z SURSRUFMLQD]\ZDQ\FKORJLWUHGQLDZDUWRüORJLWSU]\MPRZDQDMHVWDUEi- WUDOQLHMDNR'RGDWQLHZDUWRFLORJLWR]QDF]DMSR]LRPEDGDQHMFHFK\ (np. umie- MWQRFLPDWHPaW\F]Q\FKEDGDQ\FKZVSUDZG]LDQLHZ\*V]\RGUHGQLHMD ujemne ZDUWRFL QL*V]\ 3U]HGVWDZLRQ\SRZ\*HMRSLVGRW\F]\PRGHOX5DVFKDNWyU\]DNáDGDMHGQa- NRZGODZV]\VWNLFK]DGDPRFUy*QLFXMFUyZQ7UXGQRü]DGDQLDMHVWMedynym szacozdq\psdudphwuhpgod]dgd 3U]HDQDOL]XMP\ WU]\ SU]\NáDG\ REOLF]DQLD SUDZGRSRGRELHVWZD SRSUDZQHM RGSRZLHG]LQD]DGDQLHRWUXGQRFLE i = 0 logit dla Romka i Beaty (rys. 2.), dla NWyU\FK]QDP\SR]LRPXPLHMWQoFLEDGDQ\FKGDQ\PWHVWHP 3U]\NáDG 5\V3U]\NáDGORNDOL]DFMLQDRVLXPLHMWQRFLSR]\FMLXF]QLyZ ]HZ]JOGXQDSo]LRPXPLHMWQRFLL]DGDQLD]HZ]JOGXQDMHJRWUXGQRü Dla %HDW\ SR]LRP XPLHMWQRFL θ n ORJLW-H*HOL SR]LRP XPLHMWQRFL Beaty jest o ORJLWZ\*V]\RGWUXGQRFL]DGDQLDWRUy*QLFDSRPLG]\SR]LRPHP XPLHMtQRFL L WUXGQRFL ]DGDQLD Z\UD*RQD Z jednostkach logit wyniesie 1 (rys. 3RGVWDZLDMFWHZDUWRFi do równania (2) otrzymujemy:

Wykorzystanie probabilistycznych modeli zadania testowego do zrównywania wyników... 109 P (1 0) 1 e 2,7183 ( xni = 1/ n (1), bi (0)) = = (1 0) 1 1+ 2,7183 1+ e = 0,73 ni θ (3) 2WU]\PDQ\ Z\QLN LQIRUPXMH QDV*H SUDZGRSRGRELHVWZR X]\VNDQLD SNW SU]H]%HDWZ\QRVL:DUWRSRGNUHOLü*HSRPLPRL*SR]LRPXPLHMWQRFL %HDW\MHVWZ\*V]\RGWUXGQRFL]DGDQLDWRLstnieje prawdosrgrelhvwzruyzqh *HX]\VNDRQD]DWR]DGDQLHSNW-H*HOLWHQPRGHOLGHDOQLHSU]ystaje do QDV]HJRSRPLDUXWRXF]QLyZRWDNLPSR]LRPLHXPLHMWQRFLMDN%HDWDX]yska za to zadanie 0 pkt. 3U]\NáDG 5R]ZD*P\XF]QLDNWyUHJRSR]LRPXPLHMWQRFLMHVWUyZQ\WUXGQRFL]DGania, czyli θ n - b i.d*gdolf]edsrgqlhvlrqdgrsrwjlgdmhz\qln (0 0) e 0 2,7183 P ( 1/ (0), (0)) 1 ni xni = θ n bi = = 0 = = 0,50 ( 0 0) 1+ 2,7183 1+ 1 (4) 1+ e 2EOLF]RQHSUDZGRSRGRELHVWZRSRSUDZQHMRGSRZLHG]LGODWDNLHJRXF]QLD wyniesie 0,5. W idealnym przypadku tylko 50% takich uczniów uzyska za to zadanie 1 pkt. 3U]\NáDG 5R]ZD*P\ MHV]F]H MHGHQ SU]\SDGHN RGSRZLDGDMF\ QD U\V SR]\FML 5RPNDNWyUHJRSR]LRPXPLHMWQRFLMHVWRORJLWQL*V]\RGWUXGQRFL]DGania (θ n - b i = -1). ( 1 0) e 1 2,7183 0,3679 Pn i ( xni = 1/ θ n ( 1), bi (0)) = = 1 = = 0,27 ( 1 0) 1+ 2,7183 1+ 0,3679 1 + e Dla5RPND]JRGQLH]DQDOL]RZDQ\PPRGHOHPSUDZGRSRGRELHVWZRSRSUDZQHM odpowiedzi na to zadanie wynosi tylko 0,27. 2EOLF]HQLD]DVWRVRZDQHZSU]\NáDGDFKE\á\VWRVXQNRZRáDWZHJG\*]QaOLP\ trudqrü ]DGDQLD L SR]LRP XPLHMWQRFL ZV]\VWNLFK WU]HFK XF]QLyZ 2V]acowanie WUXGQRFLZV]\VWNLFK]DGDZWHFLHLXPLHMWQRFLZV]\VWNLFKXF]QLyZMHVW]áR*onym i zaawansowanym matematycznie zadaniem, wymajdmf\pvshfmdolvw\f]qhjr oprogramowania komputerowego. 0RGHOHZ\NRU]\VWXMFHZLFHMQL*MHGHQSDUDPHWU W praktyce pomiarowej stosowanych jest wiele modeli w ramach teorii RGSRZLHG]LQD]DGDQLHWHVWRZH,57Uy*QLF\FKVLPDWHPDW\F]Q\PSU]HGVWa- ZLHQLHP IXQNFML FKDUDNWHU\VW\F]QHM]DGDQLD F]\ OLF]E SDUDPHWUyZ WZRU]F\FK

110 Henryk Szaleniec PRGHO.D*G\] PRGHOLVWRVXMHMHGHQOXEZLFHMSaraPHWUyZRSLVXMF\FK]DGDQLH RUD]MHGHQOXEZLFHMSDUDPHWUyZRSLVXMF\FKHJ]DPLQRZDQHJR3LHUZV]HSUyE\ analiz prowadzoqhe\á\z Polskim Systemie Egzaminacyjnym z zastosowaniem takich programów komputerowych, jak RUMM (Andrich-Australian Council for Education), MULTILOG (Multiple, Categorical Item Analysis and Test Scoring USA) i OPLM (One Parameter Logistic Model, opracowany w CITO przez N.D. Verhelsta, C.A.W. Glasa i H.H.F.M. Vertralen). Oprogramowanie to wykorzystuje jedno-, dwu- lub trójparametryczny model logivw\f]q\virupxárzdq\sr raz pierwszy przez A. Birnbauma. W opisie modelu matematycznego parametry VR]QDF]DQHPDá\PLOLWHUDPLDEF=JRGQLH]PRGHOHPSUDZGRSRGRELHVWZR udzielenia poprawnej odpowiedzi na zadanie egzaminacyjne przez ucznia o poziomiexplhmwqrflθ PR*HE\üSU]HGVWDZLRQHIXQNFMORJLVW\FzQ P 1+ e (1 c ) i ni ( θ n, bi ) = ci + Da i ( θ b i ) (5) gdzie: b i SDUDPHWUWUXGQRFL]DGDQLD a i PRFUy*QLFXMFD c i ZVSyáF]\QQLN]JDGywania odpowiedzi, D VWDáDVNDORZDQLDUyZQD e podstawa logarytmów naturalnych, θ n # SR]LRPEDGDQHMFHFK\XPLHMWQRFL Rys. 3 Krzywa charakterystyczna zadania wielokrotnego wyboru z XZ]JOGQLHQLHP wszystkich trzech parametrów a, b, c. Charakterystyka uzyskana z wykorzystaniem programu MultiLog dla jednego z zagdvsudzg]ldqx -HV]F]HUD]SRGNUHOP\*HZPRGHODFKED]XMF\FKQDSUREDELOLVW\F]QHMWHorii zadaqldlqdf]hmql*znodv\f]qhmwhrullsrplduxwuxgqrü]dgdz\ud*rqdmhvw w tej samej skali co poziopedgdqhmxplhmwqrfllpr*hsu]\mprzdüzduwrfl zarówqr XMHPQH MDN GRGDWQLH 2F]\ZLFLH SRQLHZD* VNDOD MHVW SU]HG]LDáRZD ]DZV]H PR*QD M SU]HNV]WDáFLü EH] XV]F]HUENX GOD SRPLDUX WDN DE\ SR]LRP umiemwqrfle\áz\ud*dq\w\onrzduwrfldplgrgdwqlpl

Wykorzystanie probabilistycznych modeli zadania testowego do zrównywania wyników... 111 PLHUZV]\P NURNLHP DQDOL]\ QLH]DOH*QLH RG Z\EUDQHJR PRGHOX MHVW RV]Dcowanie parametrów zadania (a, b, c). :\EUDQ\ GR DQDOL]\ PRGHO PR*H E\ü VWRVRZQ\ OXE QLH GR ]DVWosowania Z]JOGHP]ELRUXGDQ\FKHPSLU\F]Q\FK2]QDF]DWR*HPRGHOPR*HQLHZáDFiwie przewlg\zdü L Z\MDQLDü Z\QLNL HJ]DPLQX'ODWHJR MHGQ\P] QDMZD*QLHjszych kroków podczas stosowania teorii analizy zadania testowego do oceny wyników egzaplqyz MHVW RV]DFRZDQLH F]\ Z\EUDOLP\ ZáDFLZ\ PRGHO L F]\ w RJyOHPR*HP\]DVWRVRZDü,57GRDQDOL]\QDV]\ch danych. Procedury szaco- ZDQLD F]\ GDQH HPSLU\F]QH VSHáQLDM Z\PDJDQLD GDQHJR PRGHOX ]Z\NOH V LQWHJUDOQ F]FL SURJUDPyZ NRPSXWHURZ\FK XPR*OLZLDMF\FK SUDNW\F]QLH stosowanie IRT..LHG\PRGHOZáDFLZLHRSLVXMHGDQHHPSLU\F]QHX]\VNXMHP\RSLVV]HUHgu LVWRWQ\FK FHFK SRMHG\QF]\FK ]DGD MDN L HJ]DPLQRZDQ\FK XF]QLyZ NWyUH V SR*GDQHGODSRPLDUXG\GDNW\F]QHJR-H*HOLDUNXV]HJ]DPLQDF\MQ\]RVWDáWUDIQLH SU]\JRWRZDQ\GRGDQHJRHJ]DPLQXRUD]JG\Z\QLNLHJ]DPLQXVSHáQLDM]DáR*enia wybranego modelu, to, SRSLHUZV]HRV]DFRZDQ\SR]LRPXPLHMWQRFLHJ]a- PLQRZDQHJR MHVW QLH]DOH*Q\ RG ]DVWRVRZDQHJR DUNXV]D HJ]DPLQDF\MQHJR RUD] RV]DFRZDQHSDUDPHWU\]DGDQLDVQLH]DOH*QHRGJUXS\HJ]DPLQRZDQ\FKGDQ\P arkuszem egzaminaf\mq\p,qq\plvárz\sr]lrpxplhmwqrflrvzacowany na SRGVWDZLHUy*Q\FK]ELRUyZ]DGDPLHU]F\FKWVDPXPLHMWQRüMHVWZJUDQi- FDFKEáGXSRPLDURZHJRWDNLVDP3RGUXJLHSDUDPHWU\]DGDQLDRV]DFRZDQHQD SRVWDZLHUy*Q\FKJUXSHJ]DPLQRZDQ\FKVWDNLHVDPHZJUDQLFDFKEáGX]ZLzanego z wyborem puye\0r*hp\zlfsrzlhg]lhü*hgod,57sdudphwu\rslsumfh]dgdqlhmdnlsdudphwu\rslvxmfhsr]lrprvljqlüxf]qldvlqzduldqwhp QLH]PLHQQLNLHP1LH]DOH*QRüSDUDPHWUyZRVLJQLüHJ]DPLQRZDQHJRRGSa- UDPHWUyZ]DVWRVRZDQ\FK]DGDRUD]QLH]aOH*QRüSDUDPHWUyZ]DGDRGZ\ERUX próby egzaminowanych uczniów jest koronnym atutem teorii odpowiedzi na za- GDQLH WHVWRZH 7D QLH]DOH*QRü RVLJDQD MHVW SRSU]H] Z\NRU]\VWDQLH LQIRUPDFML o zadaniach do oszacozdqldsr]lrpxrvljqlüxf]qlyzl poprzez symultaniczne wykorzystanie informacji o RVLJQLFLDFKXF]QLyZGRRV]DFRZDQLDSDUDPHWUyZ zagd 0HWRG\V]DFRZDQLDSDUDPHWUyZ]DGD 3URFHGXU\V]DFRZDQLDSDUDPHWUyZ]DGDVVWRVXQNRZR]áR*RQHLZ\PDJa- M]DDZDQVRZDQHJRRSURJUDPRZDQLDNRPSXWHURZHJR1RUPDQ'9HUKHOVW wy- Uy*QLD F]WHU\ PHWRG\ OH*FH X podstaw analiz z wykorzystaniem modeli IRT 3. Pierwsza z metod, nazwana w skrócie ML PDNVLPXP SUDZGRSRGRELHVWZD (ang. Maximum LikelihoodSROHJDQDWDNLPZ\ERU]HSDUDPHWUyZ]DGDWUXd- QRFLL PRF\Uy*QLFuMFHM*HGDQHHPSLU\F]QHX]\VNDQH]WHVWXVZDUWRFLDPL 3 Verhelst N.D., Manual for relating Language Examinations to CEF, 2005.

112 Henryk Szaleniec zadanie 2. 7DE&]VWRüRGSRZLHG]LQD]DGDQLD 4 1 0 zadanie 1. 1 0 razem w zadaniu 2. 70 (2 pkt za test) 80 (1 pkt za test) 30 (1 pkt za test) 120 (0 pkt za test) Razem w zadaniu 1. 150 150 300 100 200 QDMEDUG]LHMSUDZGRSRGREQ\PLMDNWRMHVWW\ONRPR*OLZH-DNRüRV]DFRZDQLDW PHWRGSDUDPHWUyZ]DGDLVWRWQLH]DOH*\RGZLHONRFLSUyE\XF]QLyZ.ROHMQPHWRGMHVWPDNVLPXPáF]QHJRSUDZGRSRGRELHVWZD JML (ang. Joint Maximum Likelihood). : WHM PHWRG]LH V]DFRZDQH VáFznie parametry ]DGDL SR]LRPXPLHMWQRFLXF]QLyZ-H*HOLSU]\MPLHP\PRGHO5DVFKDZNWórym wszystnlh]dgdqldpdmwdnlvdpsdudphwuprf\uy*qlfxmfhmwrqsgod XF]QLyZUR]ZL]XMF\FK]DGDV]DFRZDQHEG]LHáF]QLHSDUDPHWUyZWUXd- QRFL]DGDL SDUDPHWUyZSR]LRPyZXPLHMWQRFL:UD]]HZ]URVWHPSUyE\ V]\ENRURQLHOLF]EDSDUDPHWUyZNRQLHF]Q\FKGRRV]DFRZDQLD Trzecia metoda to PDNVLPXP SUDZGRSRGRELHVWZD EU]HJRZHJR MML (ang. Marginal Maximum Likelihood). : PHWRG]LH WHM ]DNáDGD VL *H EDGDQD FHFKDPDUR]NáDGQRUPDOQ\ZSRSXODFML]NWyUHMP\G\VSRQuMHP\ORVRZSUyE W takim przysdgnx V]DFRZDQH V SDUDPHWU\ ]DGD L GZD SDUDPHWU\ UR]NáDGX normalnego w populacji UHGQLDLRGFK\Oenie standardowe. W praktyce to dru- JLH]DáR*HQLHQLHMHVWáaWZHGRVSHáQLHQLD Czwarta metoda to ZDUXQNRZH PDNVLPXP SUDZGRSRGRELHVWZD CML (ang. Conditional Maximum Likelihood). : WHM PHWRG]LH SDUDPHWU\ ]DGDV V]DFRZDQHQDSRGVWDZLH]DáR*HQLD*H]QDQHVOLF]E\SXQNWyZ]DWHVWGODND*GHM osoby i profhqwsrsudzq\fkrgsrzlhg]l]dnd*gh]dgdqlh19hukhovwloxvwuxmh podvwdz\whmphwrg\zqdmsurvwv]\psu]\sdgnxwhvwx]ár*rqhjr]gzyfk]dgd punktowanych 0 i 3U]HDQDOL]XMP\SU]\NáDGRZ\UR]NáDGRGSRZLHGzi na te zadania. -DNPR*QDRGF]\WDü]WDEHOLRVyEF]\OLSUyE\RGSRZLHG]LDáRSo- SUDZQLH QD ]DGDQLH 1D ]DGDQLH SRSUDZQLH RGSRZLHG]LDá FR WU]HFL XF]H Czyli zadanie 2. jest trudniejsze od zadania 1. Do takiej samej konnox]mlpr*qd GRMü Z LQQ\ VSRVyE DQDOL]XMF F]VWRü RGSRZLedzi na obydwa zadania uczniów, którzy za dwuzadaniowy test uzyskali tyle samo punktów, czyli 1. Po- QLHZD*ZUyGXF]QLyZ]Z\Qikiem 1 pkt jest mniej takich, którzy uzyskali ten Z\QLN]D]DGDQLHQL*]D]DGDQLHZQLRVNuMHP\*H]DGDQLHMHVWZ]JOGQLH trudniejsze od zadania 1. Wraz ze wzrovwhp OLF]E\ ]DGD WHJR W\SX Z]JOGQH SRUyZQDQLDVWDMVLEDUG]LHM]áR*one. 4 Ibidem.

Wykorzystanie probabilistycznych modeli zadania testowego do zrównywania wyników... 113 =DOHWWHMPHWRG\MHVWQLH]DOH*QRüRV]DFRZDQLDRGWHJRMDNVNRPSRQRZana jest próba uczniów do kalibracji. Np. rozdzielne próby uczniów mogur]zl- ]\ZDü]DPLDVWFDáHJRWHVWXW\ONRMHJRF]FLNWyUHQD]ZLHP\SRGWHVWDPL]DZLe- UDMFHZVSyOQH]DGDQLD5yZQLH*QLHMHVWLVWRWQHF]\SUyEDMHVWORVRZDF]\WH* QLH&HFKD WD MHVW F]VWR QD]\ZDQDQLH]DOH*QRFLRGSUyE\XF]QLyZQDNWyUHM zastosowaq\mhvwwhvwgrndoleudfml]dgd:d*qhmhvwmhgqdnde\zsuyelh]qdoh(- OLVL]DUyZQRXF]QLRZLHGODNWóU\FKND*GH]DGDQLHMHVWEDUG]RáDWZHMDNLWDF\ dla któu\fk ND*GH ]DGDQLH MHVW EDUG]R WUXGQH 2JUDQLF]HQLHP MHVW WR *H QLH wszystkie modele IRT moge\üsu]\whmphwrg]lh]dvwrvrzdqh0hwrgdwdpr*h E\üVWRVRZDQDW\ONRZMHGQRSDUDPHWU\F]Q\PPRGHOX5DVFKDJG]LHOLF]EDSXQktów jest po prosu równa liczbie poprawnie udzielonych odpowiedzi. W modelu GZXSDUDPHWU\F]Q\POLF]EDSXQNWyZGODXF]QLDMHVWZD*RQVXPDZaJDPLV SDUDPHWU\PRF\Uy*QLFXMFHM]DGDa i. 5R]ZL]DQLHPWHJRSUREOHPXMHVW]DVWRVRZDQLHMHGQRSDUDPHWU\F]QHJRORJistycznego modelu OPLM (ang. One Parameter Logistic Model). Formalnie jest to model do oszacowania dwóch parametrów, przy czym ry*qh SDUDPHWU\ PRF\ Uy*QiFXMFHM GOD SRV]F]HJyOQ\FK ]DGD V ]QDQH RV]DFRZDQH XSU]HGQLR L Z PRGHOXWUDNWRZDQHMDNRVWDáHDQLHMDNRSDUDPHWU\:WHQVSRVyEGZXSDUDPe- WU\F]Q\PRGHOVSURZDG]DQ\MHVWGRMHGQHJRSDUDPHWUXXPR*OLZLDMF]DVWRVRZanie metody ZDUXQNRZHJRPDNVLPXPSUDZGRSRGRELHVWZD&0/7RUR]ZL]a- QLH ]RVWDáR Z\NRU]yVWDQH SRGF]DV V]DFRZDQLD SDUDPHWUyZ ]DGD SRáF]RQHJR testu zawierajcego zadania ze sprawdzianów 2003, 2004 i 2005 r. 3. Zrównywanie wyników sprawdzianu 2003, 2004 i 2005 Wiele invw\wxfml]dmpxmf\fkvlwhvwrzdqlhpqdv]hurnvndoz\nru]\vwxmh PRGHOH,57GREXGRZDQLDEDQNyZ]DGDWZRU]HQLDWHVWyZ:W\FKLQVW\WXFMDFK Z\NRU]\VWXMHVL,57WDN*HGR]UyZQ\ZDQLDWHVWyZ:REydwu wymienionych procesach pierwszy etap, czyli szacowanie i kalibrowaqlhsdudphwuyz]dgdmhvw ZVSyOQ\'ODWHJRWH*]UyZQ\ZDQLHZ\QLNyZVWDáRVLSU]\F]\QNLHPGRVWZRU]e- QLD]DO*NXEDQNX]DGD]Z\NRU]\VWaniem programu komputerowego FastTest. 4. Procedura wykorzystana do zrównywania wyników sprawdzianów 2003 2005 =DVWRVRZDQD SURFHGXUD VNáDGD VL] GZyFK HWDSyZNWyUHPRJE\üSU]e- SURZDG]RQHQLH]DOH*QLH3LHUZV]\HWDSWRRV]DFRZDQLHSDUDPHWUyZ]DGD]DVWosowanych w sprawdzianach 2003, 2004 i 2005 r. z wykorzystaniem testek kotwi- F]F\FKL7HVWNDNRWZLF]FDE\áDWDNGREUDQDDE\GREU]HUe- SUH]HQWRZDáDVSUDZG]LDQ\L 2004 r., natomiast testka 2005 sprawdziany 2003 i 2005 r.

114 Henryk Szaleniec Rys. 4. Procedura zrównywania wyników sprawdzianu 2005 i 2004 r. do 2003 r. 'UXJLHWDSWRRV]DFRZDQLHUy*QLFUHGQLHMZDUWRFLSR]LRPXRVLJQLüGOD populacji szóstoklasistów w kolejnych latach: 2003, 2004 i 2005. Do analizy wy- EUDQRMHGQDNRZHSUyE\ORVRZHXF]QLyZND*GDSRSU]\SDGNyZ]SRSXOacji szóstoklasivwyzslv]f\fkznd*g\p]dqdol]rzdq\fkodwdunxsz standardowy A1. Na tym etapie analizy sprawg]ldq\]srv]f]hjyoq\fkodwvwdqrzlá\srgwhvw\ MHGQHJR SRáF]RQHJR WHVWX NWyUHJR SDUDPHWU\ ]DGD ]RVWDá\ Z\NDOLEURZDQH w WHQVSRVyEDE\UHGQLDSRáF]RQHJRWHVWXE\áDUyZQD:]DVWRVRZDQHMDQDOizie regresjl]plhqqqlh]doh*qe\ádzlhonrüpdmfdwu]\ndwhjrulhrnuhodmfh kolejno populacje szóstoklasistów 2003, 2004 i 2005 r. 5. Pierwszy etap analizy V]DFRZDQLHSDUDPHWUyZ]DGD 'RRV]DFRZDQLDSDUDPHWUyZ]DGDWZRU]F\FKVSUDZG]LDQ\QD]DNRF]HQLH klas VI w trzech kolejnych latach wykorzystano próby celowe uczniów klas V (2004 i 2005 r.) piv]f\fk WHVWNL NRWZLF]FH RUD] SUyE\ XF]QLyZ Z\ORVRZDQH z SRSXODFMLSLV]F\FKDUNXV]VWDQGDUGRZ\$ZWU]HFKNROHMQ\FKODWDFK'RSo- ZL]DQLD SDUDPHWUyZ ]DGD ]DVWRVRZDQR GZLH WHVWNL NRWZLF]FH ]DVWRVRZDQH wobec prób celowych uczniów klasy V w 2004 i w 2005 r. Obydwie testki zawie- UDá\UyZQLH*ZVSyOQH]DGDQLDNRWZLF]FH: F]FLUHSUH]HQWXMFHMVSUDZG]LDQ UUy*QLá\VLW\ONRQD]DGD : ]DGDQLDFK UR]ZLQLWHM RGSRZLHG]L Z\PDJDMF\FK Z\NRQDQLD ZLHOX F]\QQRFLMDNR]DGDQLHWHVWRZH]GHILQLXMHP\UyZQLH*F]\QQRüNWyUDZ\PDJDáD RGUEQ\FKG]LDáDL GODNWyUHMRNUHORQHE\á\NU\WHULDSXQNWowania. W ten sposób np. dla zadania 22. w sprawdzianie z 2003 r. szacowane b\ársdudphwuyzprf\ Uy*QLFXMFHMLSDUDPHWUyZWUXGQRFLF]\OLGODND*GHMF]\QQRFLNWyUDE\áDRFeniana w uczniowskim rozzl]dqlx 3U]\ WDNLP UR]XPLHQLX ]DGD VSUDZG]LDQ\ z 2003 i 2004 r. zawieraá\sr]dgddvsudzg]ldq]u ]DGD7HVWki NRWZLF]FH ]DSHZQLDMFH SRZL]DQLH ]H VRE VSUDZG]LDQyZ ]DZLHUDá\ RGSo- ZLHGQLRSRL]DGD 6SUDZG]LDQ\]WU]HFKNROHMQ\FKODWáF]QLHWZRU]QDU]G]LHGRVSUDZG]DQLD F]\QQRFL GDMF PR*OLZRü X]\VNDQLD PDNV\PDOQLH SNW =JRGQLH z SU]\MW QD X*\WHN WHJR DUW\NXáX GHILQLFM SRZLHP\ *H REHMPXM ]agd.d*g\ ] XF]QLyZ NWyUHJR Z\QLNL EUDQH E\á\ SRG XZDJ UR]ZL]\ZDá W\ONR F]ü ] W\FK ]DGD ]DZDUW\FK Z MHGQ\P ] SLFLX DUNXV]\ VSUDZG]LDQyZ OXE

Wykorzystanie probabilistycznych modeli zadania testowego do zrównywania wyników... 115 testek. Zarówno sprawdziany z kolejnych lat, MDN L WHVWNL LPR*HP\ ZVSyOQLH QD]\ZDü SRGWHVWDPL GX*HJR WHVWX REHMPXMFego zadania z trzech sprawdzianów. 5\VXQHN6WUXNWXUDSRáF]RQHJR]WU]HFKVSUDZG]LDQyZWHVWX]Z\NRU]ystaniem dwóch testek NRWZLF]F\FK]DVWRVRZDQ\FKGR]UyZQ\ZDQLD KD*G\] SRGWHVWyZ E\á UR]ZL]\ZDQ\ SU]H] Uy*QH JUXS\XF]QLyZ.D*G\ XF]HPLDáZ\QLNLMDNLHRWU]\PDáZ swoim podwhflhrud]rsxv]f]hqldgod]dgd z SRGWHVWyZZNWyU\FKQLHXF]HVWQLF]\á W tab. 2. przedstawiona jest struktura odpowiedzi uczniowskich na tesw]áo- *RQ\ ] ]DGD ]DZDUW\FK Z DUNXV]DFK VSUDZG]LDQyZ L U 8F]QLRZLH NWyU]\ SLVDOL VSUDZG]LDQ ZUPDMZ\QLNLGODSLHUZV]\FK ]DGDSRGF]DVJG\GODSR]RVWDá\FKPDMRSXV]F]HQLDDQJmissing) zazna- F]RQHF\IU6]yVWRNODVLFL, którzy pisali sprawdzian w UPDMRSXV]F]enia w pierwszych 39 zagdqldfksrqlhzd*]dgdqldvsudzg]ldqxu]df]\qdm VLRGSR]\FMLGRGODNWyU\FKZ\VWSXMZ]ELRU]HGDQ\FKLFKRGSRZLe- G]LOXE5yZQLH*GOD]aGDRGGRZLG]LP\F\IU\V\PEROL]XMFH RSXV]F]HQLD 3LWRNODVLFL ] U NWyU]\ SLVDOL WHVW UHSUH]HQWXMF\ ]DGDQLD z RE\GZXVSUDZG]LDQyZPDMOXEGOD]DGDZLFKWHFLHDGODSR]RVWDá\FK RSXV]F]HQLD]D]QDF]RQHG]LHZLWNDPL3RGREQLHZUHNRUGDFKGDQ\FK ze spraw- G]LDQX U GOD SLHUZV]\FK ]DGD ]DGDQLD VSUDZG]LDQX L U REVHUZXMHP\RSXV]F]HQLDR]QDF]RQHF\IULZDUWRFLV\PEROL]XMFHNRG\Rd- SRZLHG]LGODRVWDWQLFK]DGD: UHNRUGDFK]DZLHUDMF\FK]DSLVRGSRZLHG]L SLWRNODVLVWyZ]05 r. obserwujemy kody odpowieg]lgod]dgdwhvwnl]u (podtesty 2003 i 2005) i V\PEROHRSXV]F]HGODSR]RVWDá\FK]DGD

116 Henryk Szaleniec 7DE6WUXNWXUDRGSRZLHG]LXF]QLRZVNLFKQD]DGDQLDSRáF]RQHJRWHVWX zad. 1234567890123456789012345678901234567890123456789012345678901234567890123456789012345678901234567890123456789012345 Sprawdzian 2003 0110011011010101010000000001100000101009999999999999999999999999999999999999999999999999999999999999999999999999999 Sprawdzian 2003 1000100001101111100100000001101000000109999999999999999999999999999999999999999999999999999999999999999999999999999... Testka kl. V 04 9999999999911110010010001101111100000001100000000009999999999999999999999999999999999999999999999999999999999999999 Testka kl. V 04 9999999999911110010010001101111100000001100000000009999999999999999999999999999999999999999999999999999999999999999... Sprawdzian 2004 9999999999999999999999999999999999999991110101001010101011100010010000100000119999999999999999999999999999999999999 Sprawdzian 2004 9999999999999999999999999999999999999991100100010011100010000000001101000101009999999999999999999999999999999999999... Sprawdzian 2005 9999999999999999999999999999999999999999999999999999999999999999999999999999991001000001110011011010000000100100000 Sprawdzian 2005 9999999999999999999999999999999999999999999999999999999999999999999999999999991001000000001101011121000001101000001... Testka kl. V 05 99999999999999011111111111111111100100199999999999999999999999999999999999999999999900011011111000000011000090000900 Testka kl. V 05 99999999999999111111111111111100110001999999999999999999999999999999999999999999999000000101000100000000000000000009 Z tak zestawionej struktury ddq\fkqlhnrpsohwq\fk]dzlhudmf\fkrsxvz- F]HQLDGODND*GHJRXF]QLDSRVWDUDP\VLRV]DFRZDüSDUDPHWU\PRFUy*QLFXMF LWUXGQRüZV]\VWNLFK]DGDWZRU]F\FK-zadaniowy test. 7DE&KDUDNWHU\VW\NDSUyE]DVWRVRZDQ\FKGRV]DFRZDQLDSDUDPHWUyZ]DGD populacja rodzaj próby ZLHONRü próby zastosowane QDU]G]LD QXPHU\]DGDZ SRáF]RQ\P WHFLH V]yVWRNODVLFL losowa 1836 sprawdzian 2003 1-39 V]yVWRNODVLFL losowa 1836 sprawdzian 2004 40-78 SLWRNODVLFL losowa 1836 testka 2003-2004 1-5,8,10-12,14,15,17, 20, 22-26,28-37, 41-43, 45-47, 52-54,56-67,73-77 V]yVWRNODVLFL losowa 1836 sprawdzian 2005 79-1016 SLWRNODVLFL losowa 1836 testka 2003-2005 1-5, 7, 10-12,14,15, 17,20,22-26,28-37, 80-84,87,88,90,91,93,94,96, 98-101,103-107,109-114 'RMHGQRF]HVQHJRRV]DFRZDQLDSDUDPHWUyZ]DGDLXPLHMWQRFLXF]QLyZ ]DVWRVRZDQR ZVSRPQLDQ\ MX* ZF]HQLHM SURJUDP NRPSXWHURZ\ 23/0 W SLHUZV]\P NURNX RV]DFRZDQR ZVWSQH SDUDPHWU\ ]DGD ]anádgdmf VWDá i UyZQPRFUy*QLFXMF]DGDa = 1). W drugim kroku oszacowano parametry PRF\ Uy*QLFXMFHM ]DGD WDN DE\ ZDUWRFL HPSiryczne, proporcje poprawnych RGSRZLHG]L GOD Z\Uy*QLRQ\FK ]H Z]JOGX QD SR]LRP XPLHMWQRFL JUXS XF]QLyZE\á\QDMEDUG]LHM]JRGQH]NU]\Z\PLFKDUDNWHU\VW\F]Q\PL]DGDRSLVu- MF\PLSUDZGRSRGRELHVWZRSRSUDZQHMRGSRZLHG]L:NROHMQ\PNURNXGRNRQa- QR DQDOL]\ NU]\Z\FK FKDUDNWHU\VW\F]Q\FK GOD SRV]F]HJyOQ\FK]DGD NRWZLF]cych dla populacji szóstoklasistów i uczniów klas V. Rys. 6. przedstawia krzywe FKDUDNWHU\VW\F]QH]DGDZUD]] zaznaczeniem punktów empirycznych. 3U]\MU]\MP\VLWHUD]SU]\NáDGRPWHRUHW\F]Q\FKLHPSLU\F]Q\FKNU]\Z\FK FKDUDNWHU\VW\F]Q\FKGOD]DGDZVSyOQ\FK]DVWRVRZDQ\FKZPRGHOX1DRVLSoziomej wykresów przedstawiona jest skala WKHWDZVSyOQDGODWUXGQRFL]DGD i SR]LRPX XPLHMWQRFL XF]QLyZ 1D RVL SLRQRZHM PDP\ SUDZGRSRGRELHVWZR poprawnej odpowiedzi na zadanie od 0 do 1. Pogrubiona krzywa przedstawia RV]DFRZDQH QD SRGVWDZLH PRGHOX &0/ SUDZGRSRGRELHVWZR XG]LHOHQLD So-

Wykorzystanie probabilistycznych modeli zadania testowego do zrównywania wyników... 117 prawnej odpowiedzi przez uczniów o danym SR]LRPLH XPLHMWQRFL EDGDQ\FK sprawdzianem. Krzywe zaznaf]rqh MDQLHMV] OLQL Z\]QDF]DM REV]DU - SURFHQWRZHJRSR]LRPXXIQRFL3XQNW\]D]QDF]RQHQDZ\NUHVDFKSU]HGVWDZLDM dane empiryczne (zaobserzrzdqd WUXGQRü ]DGD Z 8 grupach, na które ze Z]JOGXQDSR]LRPXPLHMtQRFL]RVWDáDSRG]LHORQDSUyEDXF]QLyZ-DNPR*QD ]DXZD*\ü QD SRGVWDZLH U\VXQNX URzNáDG SR]LRPX XPLHMWQRFL SLWRNODVLVWyZ EDGDQ\FK W\PL ]DGDQLDPL SU]HVXQLW\ MHVW Z NLHUXQNX QL*V]\FK XPLHMWQRFL w stosunku do uczniów klasy VI. Populacja szóstoklasistów 2003 zadanie 10. (10) 3RSXODFMDSLWRNODVLVWyZ zadanie 10. (10) Populacja szóstoklasistów 2004 zadanie 17. (58) 3RSXODFMDSLWRNODVLVWyZ zadanie 17, (58) Rys. 6. Krzywe charakterystyczne zadania 10. ze sprawdzianu 2003 r. i zadania 17. ]HVSUDZG]LDQXU-DQLHMV]\PLOLQLDPL]D]QDF]RQRREV]DU-procentowego SUDZGRSRGRELHVWZD]JRGQRFLZ\QLNyZHPSiU\F]Q\FK]NU]\ZWHRUHW\F]Q -HGQDN SRGVWDZRZ LQIRUPDFM NWyU PR*HP\ RGF]\WDü ] Z\NUHVyZ MHVW dobre dopasowanie modelu do opisu zaobserwowanych danych empirycznych. 1LHZV]\VWNLH]DGDQLD]DVWRVRZDQHGRSRZL]DQLDDUNXV]\]WU]HFKVSUDZG]Lanów tak dobrze opiv\zdqhvsu]h]prgho'odzlnv]rfl]dgdgrsdvrzdqlh PRGHOXMHVWZ\VWDUF]DMFHDE\QLHXVuZDüLFK]DQDOL]\V]F]HJyOQLH*HPRGHO QLHMHVW]E\WF]Xá\QDQLeZLHONLHRGVWSVWZDRGWDNLHMVDPHMPRF\Uy*QLFXMFHM ]DGDZSRSXODFMLNODV9L9, Zadanie 15. w sprawdzianie 2005 r. jest zadaniem wielokrotnego wyboru. Jest wielfh SUDZGRSRGREQH*H XF]QLRZLH R QDMQL*V]\P SR]LRPLH XPLHMWQRFL X]\VNDOLZ\*V]\Z\QLNRGSU]HZLG\ZDQHJRQDVNXWHN]Jadywania.

118 Henryk Szaleniec Populacja szóstoklasistów 2005 zadanie 15. (93) 3RSXODFMDSLWRNODVLVWyZ zadanie 15. (93) 5\V3U]\NáDG]DGDQLDZNWyU\PSLWRNODVLFLRQDMQL*V]\PSR]LRPLH XPLHMWQRFLRVLJQOL]QDF]QLHZ\*V]\Z\QLNRGSU]HZLG\ZDQHJR na podstawie zastosowanego modelu -H*HOL]JRG]LP\VL*H]DVWRVRZDQ\PRGHODQDOL]\GREU]HRSLVXMHGDQHHPpiU\F]QH GOD SUyE ] SRSXODFML XF]QLyZ ELRUF\FK XG]LDá Z ]UyZQywaniu, to PR*HP\SU]\MU]HüVLZ\QLNRPWHVWXXWZRU]RQHJR]DUNXV]\L Rys. 7. przedvwdzld UHODFMH SRPLG]\ VNDO Z\QLNyZ VXURZ\FK RG GR a UH]XOWDWHPZ\UD*RQ\PZSU]HG]LDáRZHMVNDOLWKHWD]HUHGQL6NDOLNWyUDMHVW wspólna dla poziomu umiemwqrflxf]qlyzlgodwuxgqrfl]dgd :RVWDWQLPF]ZDUW\PNURNXWHMDQDOL]\SRXVWDOHQLXSDUDPHWUyZPRF\Uy*- QLFXMFHM ]DVWRVRZDQR PHWRG &0/ ZDUXQNRZH PDNVLPXP SUDZGRSRGRELH- VWZDGRRV]DFRZDQLDWUXGQRFL]DGD Tab. 4. Oszacowane parametr\]dgd ZVND(QLNPRF\Uy*QLFXMFHMa i WUXGQRFL]DGDb SU]\V]DFRZDQLXSDUDPHWUyZ]DGDZVND(QLNPRF\Uy*QLFXMFHM ]RVWDáXQRUPRZDQ\GRUHGQLHMJHRPHWU\F]QHMJ Identyfikator zadania 3DUDPHWU\]DGD trudqrül moc Uy*QLFXMFD PrzeskalowaneSDUDPHWU\]DGD áf]qlh w sprawdzianie a b a/g b*g 1 w_1 4-0.273 0.998-1.093 2 w_2 3 0.003 0.749 0.013 3 w_3 5-0.266 1.248-1.066... 112 i_25_4 5 0.411 1.248 1.645 113 i_25_5 6 0.166 1.497 0.667 114 i_25_6 6 0.143 1.497 0.573 Podsumowanie pierwszego etapu analizy $QDOL]D UH]XOWDWyZ]DPLHV]F]RQ\FK Z SRQL*V]HM WDEHOL SR]ZDOD]DXZD*\ü ni*v] ZDUWRü U]HWHOQRFL VSUDwdzianu 2005 r. w stosunku do sprawdzianu w SRSU]HGQLFKODWDFK0R*QDSUyERZDüWRZ\MDQLüHIHNWHPSXáDSXVSRZRGRZa-

Wykorzystanie probabilistycznych modeli zadania testowego do zrównywania wyników... 119 nym fakwhp*hwhvwe\ázw\purnxádwzlhmv]\z stosunku do poprzednich lat, co zmniejv]\árzduldqfmz\qlnyz Tab. 5. Charakterystyka wynikyzx]\vndq\fk]dsrprfwhvwyzlwhvwhn zastosowanych do zrównania Opis statystyczny Sprawdzian Uczniowie klas V 2003 2004 2005 2004 2005 Liczba obserwacji 1836 1836 1836 1836 1836 UHGQLDGODWKHWD 0,295 0,321 0,327 0,153 0,156 Wariancja dla oszacowanej ZDUWRFLWKeta Wariancja dla prawdziwej warto- FLWKHWD 0,106 0,103 0,090 0,084 0,072 0,087 0,90 0,071 0,77 0,065 5]HWHOQRü 0,825 0,878 0,792 0,918 0,904 Korelacja punktów surowych i oszacowanej warwrflwkhwd 0,953 0,985 0,942 0,992 0,978 ZastosRZDQ\ PRGHO SRPLDUX SR]ZROLá RV]DFRZDü UHODFMH SRPLG]\ ]DGa- QLDPL]DVWRVRZDQ\PLGRSRPLDUXDQLHREVHUZRZDOQ ]PLHQQ ž MDNMHVWSoziom XPLHMWQoFLEDGDQ\FKZVSUDZG]LDQLH %XGRZDQLHEDQNX]DGDGODVSUDZG]LDQX :\NDOLEURZDQHSDUDPHWU\]DGDSRáFzonego sprawdzianu z trzech lat zo- VWDá\ZSURZDG]RQHGREDQNX]DGD]Z\NRU]\VWDQLHPRSURJUDPRZDQLDNRPSuterowego FastTest opracowanego przez Assessment System Corporation. Na VWUXNWXUEDnNXVNáDGDVLWUHü]DGDQLDRUD]PHWU\F]NDND*GHJR]DGDQLDNWyUD REHMPXMHLGHQW\ILNDWRU]DGDQLDSU]\MWR]JRGQLH]R]QDF]HQLDPLZSRáF]onym WHFLH SRUU\VDXWRUDSU]\MWR&.(RSLVW\SX]DGDQLDSDUDPHWU\]adania ]JRGQH ],57 WUXGQRü b L PRF Uy*QLFXMF a SDUDPHWU\ ]DGD ]JRGQH z NODV\F]QWHRULWHVWXáDWZRüpPRFUy*QLFXMFZ\UD*RQZVND(QLNLHPr pb ). %DQNPR*HE\üV\VWHPDW\F]QLHUR]EXGRZ\ZDQ\SRSU]H]HPSLU\F]QH]DVWRVRZa- QLHWHVWyZNWyU\FK]DGDQLDNRWZLF]FHPRJVWDQRZLüMX*Z\NDOLEURZDQH]DGania ze sprawdzianów 2003 2005..RQVWUXXMFWHVW]Z\NDOLEURZDQ\FK]DGD]EDQNXPR*QDOHSLHMQL*WRPD PLHMVFHZGRW\FKF]DVRZHMSUDNW\FHSU]HZLG]LHüSDUDPHWU\NROHMQ\FKVSUDZG]La- QyZ 5R]EXGRZDQLH EDQNX ]DGD GR UR]PLDUyZ NWyUH SR]ZRO QD SUDNW\F]QH wykorzystanie go do tworzenia nowych arkuszy, wymaga systematycznego budowania i przeprowadzania testów w pogreq\ VSRVyE MDN PLDáR WR PLHMVFH w przypadku testek 2004 i -HVW WR GX*H L F]DVRFKáRQQH SU]HGVLZ]LFLH NWyUHMHGQDNMX*Z QDMEOL*V]\PF]DVLHSRZLQQRVWDüVLVWDáSUDNW\NZFHQWUDlnej i RNUJRZ\FK NRPLVMDFK HJ]DPLQDF\MQ\FK =QDMRPRü NV]WDáWX NU]\ZHM Lnformacyjnej dla arkusza egzaminacyjnego ma szczególne znaczenie na poziomie

120 Henryk Szaleniec egzaminów maturalnych 5 3RZLQQDRQDRVLJDüVZRMHPDNVLPXPZDUNXV]DFKQD poziom podstawowy dla θ RGSRZLDGDMFHJRSrogowi zaliczenia (30% punktów), SRQLHZD*EáGVWDQGDUGRZ\SoPLDUXRVLJDZWHG\VZRMHPLQLPXP Metryczka zadania w banku 3U]HZLG\ZDQDZLHONRüEáGXVWDQGDUGRZHJR GODZ\QLNyZXF]QLyZRUy*Q\PSR]LRPLH XPLHMWQRFLSLV]F\FKSRáF]ony test Zale*QRüSRPLG]\SR]LRPHPXPLHMtQRFL a spodziewanym procentem punktów ]DSRáF]ony test Krzywa informacyjna wygenerowana GODSRáczonego testu 5\V&KDUDNWHU\VW\NLWHVWXZ\JHQHURZDQHJR]Z\NDOLEURZDQ\FK]DGD znajdujf\fkvlzedqnx 7. Oszacowanie zpldqsr]lrpxrvljqlüv]yvwrnodvlvwyz na podstawie wyników sprawdzianu 2003 2005 $E\XVWDOLüUy*QLFHSRPLG]\ZVND(QLNDPLRVLJQLüXF]QLyZPLHU]RQ\FK VSUDZG]LDQHP Z NROHMQ\FK ODWDFK ]DVWRVRZDQR VWUXNWXUDOQ DQDOL] UHJUHVML zmiennej latenntnej (ang. Structural Analysis of Univariate Latent Variable) i programu komputerowego SAUL opracowanego w CITO przez N.D. Verhelsta i H.H.F.M. Verstralen. =DVWRVRZDQ\ SRSU]HGQLR PRGHO SRPLDUX SR]ZROLá RV]DFRZDü UHODFMH So- PLG]\ ]DGDQLDPL ]DVWRVRZDQ\PL GR SRPLDUX a nieobserwowalq ]PLHQQθ} 5 Szaleniec H.,.U]\ZDLQIRUPDF\MQD]DGDMDNRQDU]G]LHZNRQVWUXRZDQLXDUNXV]DHJ]DPLQacyjnego >Z@ % 1LHPLHUNR - %U]GN UHG Dwa rodzaje oceniania szkolnego. Ocenianie ZHZQWU]V]NROQH L ]HZQWU]QH D MDNRü V]NRá\ mateuldá\ 9,, RJyOQRSROVNLHM NRQIHUHQFML z cyklu Diagnostyka Edukacyjna, Katowice 2002.

Wykorzystanie probabilistycznych modeli zadania testowego do zrównywania wyników... 121 MDNMHVWSR]LRPXPLHMWQRFLEDGDQ\FKZVSUDZG]LDQLH0RGHOVWUXNWXUDOQ\So- ]ZDODQDRV]DFRZDQLHUHODFMLSRPLG]\]PLHQQθ a innymi zmiennymi, takimi jak np.: popuodfmh XF]QLyZ NRF]F\FK V]NRá SRGVWDZRZ ORNDOL]DFMD V]Nyá ZLHONRü V]Nyá VWRVRZDQH SURJUDP\ QDXF]DQLD LWS $E\ RV]DFRZDü UHODFM So- PLG]\ SR]LRPHP RVLJQLü EDGDQ\FK VSUDZG]LDQHP ]PLHQQD ]DOH*QD θ) a ]PLHQQ QLH]DOH*Q MDN V SRSXODFMH V]yVWRNODVLVWyZ Z kolejnych trzech latach, potrzeexmhp\qdzhmflxgzóch zbiorów danych: 1) SDUDPHWUyZ]DGD]DVWRVRZDQ\FKZNROHMQ\FKODWDFKZ\UD*RQ\FKMDNRZynik prawdziwy (wynik zaobserwowany EáG SRPLDUX SU]HGVWDZLonych w tej samej skali, 2) liczb punktów uzyskanych przez poszczególnych uczniów za te zadania w kolejnych populacjach. 0RFQVWURQWDNLHJRSRGHMFLDMHVWPR*OLZRü]DVWRVRZDQLDRV]DFRZDQ\FK áf]qlh GOD DUNXV]\ SDUDPHWUyZ ZV]\VWNLFK ]DGD ']LNL WHPX*HPRGHOSRPLDURZ\LPRGHOVWUXNWXUDOQ\VUR]VHSDURZDQHSUyEDVWRVowana do oszacowaniduhodfmlsrplg]\sr]lrphpxplhmwqrflv]yvwrnodvlvwyz a trzema kawhjruldpl]plhqqhmsrsxodfmdpr*hvluy*qlürg próby stosowanej do kalibrafml]dgd 1S PR*QD]DVWRVRZDü Z\QLNL QLH W\ONR z próby, ale i z FDáHMSRSXODFML0R*QDWH*Z\EUDüGRDQDOL]Z\QLNLMHGQHJRZo- MHZyG]WZDF]\WH*MHGQHMNRPLVMLHgzaminacyjnej. 8MHPQVWURQWDNLHJRSRGHMFLDMHVWLJQRURZDQLHEáGXRV]DFRZDQLDSDUa- PHWUyZ]DGDJG\*SDUDPHWU\WHVSU]HND]\ZDQHZSRVWDFLZ\QLNXSUDZG]LZego oszacowanego w programie OPLM. 'R DQDOL]\ Z\EUDQR NUDMRZ SUyE ORVRZ UyZQ SR 000 uczniów z SRáF]RQHM SRSXODFML V]yVWRNODVLVWyZ SLV]F\FK DUNXV] VWDQGDUGRZ\ $ZOatach 2003, 2004 i 2005. :V]\VWNLHHIHNW\VNRPXQLNRZDQHZWDNLHMVNDOL*HUHGQLDJHRPHWU\F]QD PRF\Uy*QLFXMFHMMHVWUyZQD VWDáDadditive parameter) = 1,1556 (SE = 0,0127; z = 91,153) wariancja sprawdzianu 2003 (reference variance) = 1,4320 (SE = 0,0141) odchylenie standardowe 2003 (ref. stand. dev.) = 1,1966 (SE = 0,0059) Populacja sprawdzianu Tab. 6. EfHNWJáyZQ\GOD]PLHQQHMSRSXODFMDVSUDZG]LDQX Efekt SE n z :LHONRüHIHNWX standardowego 2003 ustalony na 0-10 331-0 2004 0,092 0,018 10 174 5,190 0,077 2005 0,160 0,018 9495 8,760 0,133 Kontrast parami 2005 2004 0,067 0,018 3,718 0,056

122 Henryk Szaleniec 'RRV]DFRZDQLDLVWRWQRFLUy*QLFSR]LRPXRVLJQLüZ kolejnych latach zastosowano test t 6WXGHQWD2E\GZLHUy*QLFHZVWRVXQNXGRUVLVWRWQHQD po]lrplhlvwrwqrflθ 5y*QLFHSRPLG]\ODWDPLLMHVWLVWRWQD dla θ 0,05. 5\V(IHNWVWDQGDUGRZ\SU]\URVWXXPLHMWQRFLPLHU]RQ\FKVSUDZG]LDQHP w latach 2003 ]XZ]JOGQLHQLHPUR]ZDUVWZLHQLD]HZ]JOGXQDSáHü 3R]RVWDMH QDP WHUD] RGSRZLHG]LHü QD S\WDQLH F]\WHUy*QLFHV]QDF]FH Do tego potrzebna jest nam jednostka pomiarowa mierzonego efektu. W tym SU]\SDGNX]DMHGQRVWNSRPLDURZSU]\MWRRGFK\OHQLHVWDQGDUGRZHDQDOL]RZanej zmiennej podstawowej, które wynosi 1,1966. Ostatnia kolumna tab. 6. podaje ZLHONRüHIHNWXVWDQGDUGRZHJRGODSRSXODFMLL Podsumowanie 2V]DFRZDQD Uy*QLFD RVLJQLü EDGDQ\FK VSUDZG]LDQHP SRPLG]\ i 2004 r. wynosi prawie 7,7% odchylenia standardowego sprawdzianu 2003 r., a SRPLG]\LU 5,6% odchylenia standardowego. Oszacowany przy- URVWSR]LRPXRVLJQLüHIHNWVWDQGDUGRZ\SRPLG]\SRSXODFMDPLL to 13,3% odchylenia standardowego. &]\MHVWWRGX*\SU]\URVW" Trudno powie- G]LHü : kraju nie map\ *DGQHJR XNáDGX RGQLHVLHQLD :\QLN WHQ MHVW Z\VRFH ]ELH*Q\ ] UH]XOWDWHP MDNL RWU]\PDá SURI 1LHPLHUNR VWRVXMF HNZLFHQW\ORZ PHWRG]UyZQ\ZDQLD 6. Z ZQLRVNRZDQLHPRVWDá\PWUHQG]LHZ VNDOLFDáHJRNUDMX PXVLP\E\üMHGQDNEDUG]RRVWUR*QL'\VSRQXMHP\Z\QLNDPLGopiero z czterech ODW$QDOL]XMF]PLDQ\SR]LRPXRVLJQLüV]yVWRNODVLVWyZZ dwóch warstwach 6 Niemierko B., Zrównywanie wyników sprawdzianu 2005..., op. cit.

Wykorzystanie probabilistycznych modeli zadania testowego do zrównywania wyników... 123 FKáRSF\ dzihzf]wd]drevhuzrzdqrlvwrwqhuy*qlfhzg\qdplfhrv]dfrza- Q\FK]PLDQRVLJQLüZSRV]F]HJyOQ\FKZDUVWZDFK'ODFKáRSFyZ]DREVHUZo- ZDQRVáDEV]\SU]\URVWSRPLG]\LU efekt standardowy wynosi 5,4% LZLNV]\SRPLG]\LU2GSRZLHGQLRGODG]LHZF]WRV]D- FRZDQ\SU]\URVWZ\QRVLSRPLG]\LU3RPLG]\VSUDZG]La- QDPLLURV]DFRZDQDUy*QLFDGODG]LHZF]WZ\QRVLLMHVWQLeistotna statystycznie. W UR]ZD*DQ\PRNUHVLHG]LHZF]WDRVLJDá\Z\*V]HZ\QLNL i oszacowany efekt standardowy porównania wyników w warstwach wynosi 3UREOHPDW\NDWDZ\PDJDGDOV]\FKSRJáELRQ\FKEDGDMDNL rozszerzenia ich na poziom gimnazjalny. Zastosowanie mewrged]xmf\fkqdsuredelolvw\f]qhm WHRULL]DGDQLDGDMHGX*HPR*OLZRFLSURZaG]HQLDSRJáELRQ\FKDQDOL]NWyUHPR- JLVWRWQLHX]XSHáQLDüDQDOL]\SURZadzone z wykorzystaniem klasycznej teorii. :\PDJDM RQH MHGQDN EDUG]LHM U\JRU\VW\F]QeJR SU]HVWU]HJDQLD ZLHOX ]DáR*H NWyUHOH*XSRGVWDZNRQVWUXRZDQLDDUNXV]\HJ]DPLQDF\jnych.