Jerzy Nowik Uniwersytet Opolski Wersje rownolegle testow z matematyki w Wasach pocz jtkowych, czyli liczby tatwe i trudne W pralctyce nauczycielskiej oraz w masowych badaniach osiqgni?c szkolnych stosuje si? zazwyczaj prace klasowe, sprawdziany oraz testy w tzw. wersjach rownoleglych. Celem takiego dzialania, jak si? powszechnie sqdzi, jest podniesienie obiektywizmu oceny osiqgni?c ucznia przez zapewnienie samodzielnosci pracy uczniow albo uniemozliwienie niesamodzielnosci, zapobiezenie odpisywaniu - po prostu sciqganiu. Idea jak najbardziej sluszna, ale czy prawdziwa? Zobaczray to na kilku przykladach, najpierw jednak ustalmy, kiedy testy i sprawdziany mozna uznac za rownolegle. muszq: Boleslaw Niemierko definiuje wersje rownolegle testow jako takie, ktore: 1. zbudowane sq wedlug jednego planu testu, 2. dajq wyniki testowania o jednakowych srednich arytmetycznych, wariancjach i wspolczynnikach korelacji z dowolnq zmiennq. Aby spelnic te warunki dla testu, odpowiednie zadania w obu wersjach a) sprawdzac te same czynnosci, b) miec rowne wskazniki trudnosci i mocy roznicujqcej 1. W roku 1984 prowadzone byly pod kierunkiem prof. Boleslawa Niemierki Ogolnopolskie badania osiqgni? c uczniow. Aby zapewnic samodzielnosc pracy uczniow, zastosowano testy w dwoch wersjach rownoleglych. Przygotowujqc testy do badari staralismy si?, aby zadania w obu wersjach testow spelnialy warunki okreslone dla zadan rownoleglych. Ukladajqc zadania 1 B. Niemierko, H. Baliriska, J. Zarebska, Wersje rownolegle testow osiqgnigc szkolnych, Kwartalnik Pedagogiczny 1975, nr 4. 186
zwracalismy uwage na ich trafnosc wewnetrznq, czyli zgodnosc czynnosci wykonywanych przez ucznia z czynnosciami zaplanowanymi w planie- lcartotece testu. Wszystkie testy przed badaniami poddano dwukrotnej weryfikacji. Raz na tzw. probie najlatwiej dostepnej, a potem na probie losowej, reprezentatywnej dla planowanej pozniejszej proby badawczej dla badari wlasciwych. Wyniki badari pilotazowych wykorzystano do rekonstrukcji testow. W efekcie tych dzialari wersje testow roznily si najcz? sciej rysunkiem lub danymi liczbowymi w zadaniach. Uczyniono wszystko, aby testy zastosowane w badaniach byly najwyzszej jakosci 2. Badania przeprowadzono w klasach IV, VIII i maturalnych na probach liczqcych po okolo 4500 uczniow. Analizujqc wyniki sprawdzania, zauwazyli- 6my istnienie roznic w osiqgnifjciach uczniow rozwiqzujqcych wersje rownolegle testow. Dotyczylo to pewnych zadan we wszystkich badanych populacjach. W wi? kszosci przypadkow byly to zadania o charakterze rachunkowym. Oto kilka przykladow. Przyklad 1. (klasa IV) Oblicz wartosc wyrcizenici: 1 1-1 + 3-2 = 7+ 8-5 - 2 = Wydawac by si moglo, ze oba zadania sq jednakowo latwe. Nikt z nauczycieli, ktorych pytano o rownoleglosc zadan w wersjach testow, nie dostrzegl roznicy w trudnosci. Wskazniki latwosci ( p ) i mocy roznicujqcej ( rpb ) wyniosly odpowiednio: p = 0,60 p = 0,66 rpb - 0,32 rpb = 0,40 Stwierdzone roznice liczbowe nie sq wprawdzie zbyt duze, sq jednak statystycznie istotne. Rozpatrzmy jeszcze jeden przyklad z badari ogolnopolskich, a mianowicie zadanie z poziomu klasy maturalnej. Przyklad 2. (W nawiasach podane sq dane liczbowe wersji B) Podstciwq ostroslupa jest prostokqt o boluich dlugosci 3 i 4 (6 i 5). Jedna z krawgdzi bocznych jest prostopadta do ptaszczyzny podstawy, ncijdtuzsza zas ma miarq rownq 10 (13). Objqtosc tego ostroslupa jest rowna : A. 8V2I7 B. 60VI7 C. 20^37 D. 24V217 : A. 30^133, B. 60 Vj " C. 10^133, D. 18 (W37 2 Wyniki ogolnopolskich badan osiqgnigc uczniow, nauczycieli i szkol 1981-1988. Matematyka, Tom V, red. J. Nowik, IKN, Warszawa 1988. 187
Wskazniki latwosci zadari dla wersji przyj? ly wartosci: A: p - 0,41, B: p = 0,25. Wskazniki mocy roznicujqcej dla obu wersji byly jednakowe i wyniosly 0,26. Zadania w wersji A i B testu roznity si? jedynie wartosciami liczbowymi. Wydawac by si? moglo, ze na poziomie klasy maturalnej- na dwa miesi^ce przed mature- uzycie innych liczb w zadaniach nie powinno wplywac na jakosc rozwizizania zadania. Tak jednak nie jest. W rolcu 1989 przeprowadzono na Opolszczyznie wojewodzkie badania osi^gni?c szkolnych. Obj?to nimi 700 uczniow klas trzecich i tylu samo Idas czwartych 4. Oto kilka przykladow Przyklad 3. (klasa III) Oblicz: 17 + 9 = 9 + 17 = P = 0,73 p = 0,57 Nauczyciel nauczania poczqtkowego dostrzeze roznice trudnosci wynikajqce ze zmiany kolejnosci liczb w dzialaniach. Ale czy taka duza roznica jest uzasadniona na poziomie klasy m? Uczniowie majq, juz opanowanq wlasnosc przemiennosci dodawania. Nast? pny przyklad rozwiqzywany byl przez uczniow Idas trzecich i czwartych. Przyklad 4. (klasa III i IV) Zapisz zci pomocq cyfr liczbq: jeden tysiqc dwiescie kl. ID p = 0,48 kl. IV p = 0,62 dwa tysiq.ce trzydziesci piqc p - 0,68 P = 0,92 Zaobserwowane sytuacje spowodowaty, ze postawilismy hipotez? o istnieniu liczb latwych i trudnych dla ucznia uczqcego si? matematylci, zwlaszcza na poziomie nauczania poczqtkowego. 3 Uwarunkowania osiqgniqd uczniow z matematylci. Wyniki ogolnopolskich badan osiqgniqc uczniow, nauczycieli i szkol. Tom XI, red. J. Nowik, CDN, Warszawa 1990. 4 J. Nowik, Osiqgnigcia matematyczne uczniow klas trzecich, w: Osiqgniqcia uczniow klas poczqtkowych z jqzyka polskiego i matematylci w r. szk. 1988/89, IKN-ODN, Opole 1990; Osiqgnigcia uczniow klasy drugiej i czwartej szkofy podstawowej, red. J. Nowik, T. Slowikowska-Olejarczyk, IKN-ODN, Opole 1991. 188
W roku 1993 przeprowadzono badania, ktorych celem bylo znalezienie odpowiedzi na pytanie: Czy istniejq liczby tatwe i trudne dla uczniow klas mlodszych? Badania przeprowadzono na probie 300 uczniow (po 100 uczniow lclasy I, II i HI) na terenie wojewodztwa opolskiego. Badania mialy charalcter diagnostyczny. Zastosowano trzy testy sprawdzajqce sprawnosc rachunkowq o charakterze kompensacyjnym, tzn. test dla klasy II zawieral zadania rozwiqzywane przez uczniow klasy I, a test dla klasy HI zawieral zadania rozwiazywane przez uczniow klasy II. W pierwszej serii zadan zmieniono kolejnosc wykonywanych dzialari. Jak wplyn lo to na ich latwosc, ilustruje tabela. Przyklady 5-7 sprawdzaly sprawnosc rachunkowa i poprzedzone byly poleceniem: oblicz. Przyklad 5. (16-61 4 = 0.91 16-16+41 = 0,56 (20-101-9 = 0.86 20-110+81 = 0,68 (18-31-6 = 0.83 18-<3+6) = 0.65 (20-91+4 = 0,68 20-(9-4) = 0,55 Zadanie Latwosc p Zadanie Latwosc p Tabela 1 Porownujqc wartosci wskaznikow latwosci zadan w wersji A i B zauwazamy, ze znacznie latwiejsze sqi zdania, w ktorych nawiasy wlasciwie nie odgrywajq istotnej roli dla uzyskariia wynilcu. Gdyby uczen wykonal dzialania w takiej kolejnosci, w jakiej zapisane, to rozwittzujqc zadania w wersji A nie s^ popelni blf? du. Stqd wyzsza latwosc zadan w tej wersji. Jest to zgodne z oczekiwaniami. Przyklad 6. 72 : (28-2 10) = 72 : (43-7- 5) = p = 0,71 p = 0,51 W przyldadzie widoczna jest zmiana wartosci liczbowych w nawiasie. Ona wlasnie spowodowala istotna zmiane latwosci zadan. Na koniec jeszcze jeden przyklad, w ktorym zmieniono tylko dwie liczby. Przyklad 7. 16 : 2-20 : 4 = 18 : 2-24 : 4 = 189
p = 0,68 P = 0,79 p = 0,56 - klasa II p = 0,68 - klasa III Zaobserwowane wyniki pozwalajq stwierdzic, ze rozne liczby zastosowane w tych samych tresciowo zadaniach, mogq miec istotny wplyw na trudnosc i moc roznicujqcq zadan. Istnienie czynnika liczbowego roznicujqcego zadania, ktore sprawdzajq te same czynnosci-umiej tnosci, nie zawsze jest dostrzegane przez konstruktorow testow oraz nauczycieli ukladajacych sprawdziany matematyczne. Mimo to porownujq oni osiqgni? cia grup uczniow rozwiqzujqcych rozne wersje testow i sprawdzianow, uzywajqc cz sto stwierdzen typu: grupa A wypadla niezle, natomiast grupa B znacznie slabiej czy wr^cz fatalnie. Koncentracja konstruktorow testow na poszukiwaniu idealnej trafnosci wewn^trznej zadari rownoleglych spycha na plan dalszy analiz? stosowanych w zadaniach liczb, ktorymi rozniq si? wersje zadan. Nauczyciele nie dostrzegajq waznosci i roznic w trudnosci dla ucznia w ukladanych przez siebie zadaniach. Potwierdzajq to wynilci ankiety przeprowadzonej wsrod nauczycieli nauczania poczqtkowego. Badania przeprowadzono na stosunkowo niewielkiej liczbie badanych (po 100 uczniow z Idas I, II i HI) i uzyslcane wynild nie mogq bye podstawq do uogolnieri, ale potwierdzajq istnienie problemu. Bye moze, nie wymaga on dalszyeh badan, ale uswiadamia konstruktorom i nauczycielom dqzqcym do obiektywizacji oceny przez szukanie nowych form sprawdzania, potrzeby standaryzacji czy chocby wst? pnej weryfikaeji narzgdzi sprawdzania, a przynajmniej krytycyzmu wobec wlasnej pracy w przypadku, gdy osiqgni cia uczniow sprawdzane roznymi wersjami sq zroznicowane. Test osiqgni c szkolnych jest sprawdzanie osiqgni^c narz^dziem uwazanym za obiektywizujqce szkolnych. Tymczasem zastosowanie go w wersjach rownoleglych powoduje obnizenie obiektywizmu sprawdzania, o czym nie zawsze pamietajq jego uzytkownicy. Jest to jednak cena, jaka placimy za dqzenie do zagwarantowania samodzielnosci pracy uczniow lub moze raezej za utrudnienie niesamodzielnosci uczniow w czasie testowania. Zastosowanie wersji rownoleglych ma jednak rowniez zalety. Najwazniejsza to przyezynienie sie do podniesienia trafnosci sprawdzania 5. Przedstawione przyldady i rozwazania na temat wersji rownoleglych zadan sugerujq proste stwierdzenie: zawsze, gdy istniejq leu temu warunki, stosujmy testy i sprawdziany w jednej wersji. 5 B. Niemierko, Pomiar sprawdzajqcy w dyclaktyce, PWN, Warszawa 1990. 190