Można inaczej. Wykorzystanie IRT do konstrukcji testów osiągnięć szkolnych
|
|
- Seweryn Żurek
- 6 lat temu
- Przeglądów:
Transkrypt
1 Aleksandra Jasińska Michał Modzelewski Instytut Badań Edukacyjnych Regionalne i lokalne diagnozy edukacyjne Można inaczej. Wykorzystanie IRT do konstrukcji testów osiągnięć szkolnych Skonstruowanie dobrych testów osiągnięć szkolnych jest poważnym wyzwaniem teoretycznym i logistycznym. Opracowanie trafnych i rzetelnych narzędzi wymaga przede wszystkim starannego ich zaplanowania oraz systematyczności i konsekwencji w realizacji przyjętej koncepcji. W Polsce najważniejsze z punktu widzenia różnych funkcji - selekcyjnej, diagnostycznej, ewaluacyjnej, formatywnej - testy osiągnięć szkolnych są tworzone od 10 lat przez krajowy system egzaminów zewnętrznych. Mimo wieloletniego doświadczenia w tworzeniu testów jakość egzaminów zewnętrznych pozostawia wiele do życzenia. Ich wady coraz częściej wypunktowuje opinia publiczna, która zazwyczaj podaje w wątpliwość trafność fasadową zadań oraz całych egzaminów. Negatywne emocje budzi praktycznie każda edycja egzaminów państwowych. Odczucia opinii publicznej, sugerujące, że coś z polskimi egzaminami jest nie tak, zdają się potwierdzać specjalistyczne analizy prowadzone przez środowiska naukowe. Warto nadmienić, że badacze edukacyjni wciąż w zbyt małym stopniu poddają gruntownej analizie jakość egzaminów zewnętrznych. Nieliczne dostępne analizy skupiają się na wypunktowywaniu słabości psychometrycznych egzaminów - zwraca się uwagę na niską rzetelność testów oraz problem porównywalności wyników między wersjami egzaminu (Pokropek, 2011), problemem jest także brak jasnego sprecyzowania funkcji poszczególnych egzaminów (Dolata i in., 2004), monitorowanie jakości egzaminów i szkolnictwa utrudnia zaś brak systemowego rozwiązania, pozwalającego na porównywanie egzaminów między latami (Szaleniec i in., w druku, 2012) 1. Czasami zwraca się także uwagę na brak ustalonych standardów konstrukcji testów oraz procedur, które gwarantowałyby wysoką jakość narzędzi egzaminacyjnych (Dolata i in., 2004). Wydaje się bowiem, że problemy egzaminów, na które wskazuje intuicyjnie opinia publiczna, jak również bardziej specjalistyczne ich mankamenty dostrzegane przez badaczy, wynikają właśnie z przyjętej metody konstrukcji testów. Można argumentować, że to właśnie niewystarczające badania pilotażowe i związana z tym słabość analizy właściwości psychometrycznych zadań i testów, jeszcze zanim staną się narzędziami egzaminacyjnymi, przesądzają o niedostatecznej jakości ostatecznych narzędzi. Przy braku precyzyjnie określonych standardów i procedur, stworzenie dobrego psychometrycznie narzędzia służącego do pomiaru osiągnięć szkolnych jest rzeczywiście bardzo mało prawdopodobne. Istnieją jednak sposoby 1 Pracownia Analiz Osiągnięć Uczniów Instytutu Badań Edukacyjnych prowadzi badania mające na celu zrównanie wyników egzaminów z ubiegłych lat, jednak nie jest to rozwiązanie systemowe. Nie zapewnia ono możliwości przedstawienia na jednej skali wyników z kolejnych egzaminów, bez ponawiania badań. 157
2 XVIII Konferencja Diagnostyki Edukacyjnej, Wrocław 2012 pozwalające na utrzymanie kontroli nad jakością konstruowanego narzędzia. Standardy tworzenia i ewaluacji narzędzi do pomiaru dydaktycznego, opisane w Standards for Educational and Psychological Testing (AERA, APA, NCME; 1999), stosowane są przez najbardziej renomowane i doświadczone instytucje konstruujące testy kompetencji i osiągnięć szkolnych. Kluczowym etapem, pozwalającym na konstrukcję dobrego psychometrycznie narzędzia, jest badanie pilotażowe, które stanowi punkt centralny całego procesu. Instytut Badań Edukacyjnych w ramach Badania szkolnych uwarunkowań efektywności kształcenia w 2010 roku stanął przed możliwością zbliżenia się do światowych standardów w konstrukcji testów osiągnięć. W artykule tym przedstawione zostaną najważniejsze założenia i etapy konstrukcji narzędzi pomiarowych przyjęte przez zespół badawczy pracujący nad testami oraz rekomendacje płynące ze zdobytego doświadczenia. Ewaluacji zostanie poddane także zrealizowane badanie pilotażowe, aby pokazać znaczenie zastosowanych rozwiązań dla konstrukcji testów osiągnięć. Wnioski płynące z tego artykułu mogą dostarczyć argumentów dla myślenia o zmianach w polskim systemie egzaminacyjnym, a także mogą być inspirujące dla osób tworzących testy osiągnięć zarówno do celów badawczych, jak i dla potrzeb szkolnych. Badanie szkolnych uwarunkowań efektywności kształcenia (SUEK) 2 to studium podłużne, które ma na celu identyfikację kluczowych czynników szkolnych warunkujących efektywność kształcenia w szkołach podstawowych. Badanie rozpoczęło się w roku szkolnym 2010/11 i objęło kohortę rozpoczynającą naukę w III klasach szkół podstawowych. Będzie ono kontynuowane co najmniej do czasu, w którym badani uczniowie ukończą szkołę podstawową. Badanie wymagało przygotowania narzędzi do pomiaru kluczowej zmiennej zależnej, czyli poznawczych wyników kształcenia. Pierwszym krokiem było opracowanie testów osiągnięć szkolnych podsumowujących nauczanie na I etapie kształcenia. Etapy tworzenia testów osiągnięć szkolnych na potrzeby I pomiaru w badaniu SUEK Proces przygotowania testów osiągnięć szkolnych na potrzeby badania SUEK można podzielić na 12 etapów (por. Downing, 2006a). Pierwszym etapem było określenie ogólnych założeń dotyczących pomiaru. Zdefiniowano populację, która ma zostać poddana badaniu 3. Przyjęto teorię pomiaru, która rzutowała na sposób konstrukcji zadań testowych i schematów oceniania, wybór zadań po badaniu pilotażowym oraz skalowanie ostatecznych wyników z testów. Zdecydowano się na teorię odpowiedzi na zadanie testowe (item response theory, IRT) z uwagi na to, że jest to bardziej 2 Realizowane przez Pracownię Szkolnych Uwarunkowań Efektywności Kształcenia w Instytucie Badań Edukacyjnych. 3 Kohorta uczniów rozpoczynająca w roku szkolnym 2010/11 naukę w III klasie szkoły podstawowej. Są to uczniowie nieobjęci jeszcze reformą programową wprowadzoną rozporządzeniem Ministra Edukacji Narodowej z dnia 23 grudnia 2008 r. 158
3 Regionalne i lokalne diagnozy edukacyjne adekwatny model analizowania właściwości zadań i testów, niezwykle pomocny w konstruowaniu testów dostosowanych do potrzeb, a także umożliwiający precyzyjne porównanie wyników różnych wersji testów 4 oraz tworzenie skal pionowych 5. Założono, że wykorzystany zostanie najbardziej restrykcyjny model IRT, czyli model Rascha, który zakłada, że wszystkie zadania mają tak samo dobre właściwości pomiarowe (de Ayala, 2009, s ). Stworzenie testów z zadań spełniających założenie modelu Rascha jest niezwykle istotne z punktu widzenia komunikowania wyników w postaci informacji o osiągnięciu pewnego poziomu wiadomości i umiejętności 6, a także tworzenia tablic przeliczeniowych wyniku surowego na wynik przeskalowany 7, co umożliwia wykorzystywanie testów w diagnozie nauczycielskiej i porównanie otrzymanych wyników z określonymi normami. Charakter badania podłużnego SUEK wymagał tego, by skonstruowane na jego potrzeby testy były testami szerokiego zasięgu, czyli takimi, które pozwalają na zdobycie jak największej ilości informacji o całej badanej grupie. Testy osiągnięć szkolnych musiały być więc tak przygotowane, by umożliwiały precyzyjny pomiar umiejętności wszystkich uczniów, niezależnie od poziomu ich wiedzy. Z uwagi na to, że poziomem analizy, który jest najbardziej interesujący z punktu widzenia badania SUEK, jest poziom klas 8, priorytetem jest rzetelne określenie efektów kształcenia na poziomie badanych klas. Niemniej ważny jest także jak najdokładniejszy pomiar wyników indywidualnych z uwagi na to, że dostrzega się możliwość, by po zakończeniu projektu powstałe testy służyły celom diagnostycznym. Tak postawione cele pociągały za sobą konieczność określenia warunków w stosunku do kształtu i położenia krzywej informacyjnej testu oraz krzywej charakterystycznej testu 9. Spełnienie tych założeń wymagało dobrania do testu zadań z całego zakresu skali. Określając ogólne założenia pomiaru, sprecyzowano także wytyczne dotyczące praktycznej strony konstrukcji testów takie jak: forma arkuszy (papierowa, do samodzielnego wypełniania), czas przewidziany na rozwiązanie testu, szacunkową liczbę zadań, harmonogram projektu. Zdecydowano się także na stworzenie dwóch quasi-równoległych wersji testu, z pulą zadań wspólnych (kotwiczących), aby wydłużyć test, co miało na celu zwiększenie trafności pomiaru przez 4 Co miało znaczenie dla przygotowywanego pomiaru z uwagi na planowane skonstruowanie dwóch zakotwiczonych wersji testów. 5 W badaniu SUEK kolejne pomiary osiągnięć planuje się przedstawiać na zrównanych skalach pionowych. 6 Jest to możliwe dzięki temu, że w modelu Rascha uporządkowanie pytań ze względu na trudność jest takie samo dla każdego ucznia (każdego poziomu umiejętności), ponieważ krzywe charakterystyczne zadań się nie przecinają, a także umiejętności uczniów i trudności pytań są wyrażone na tej samej skali. 7 Surowa liczba punktów jest statystyką dostateczną (de Ayala, 2009, s. 25). 8 Efektywność nauczania przypisywana jest bowiem przede wszystkim klasie (to w klasie odbywa się nauczanie; wiele gromadzonych danych będą stanowiły zmienne z poziomu klasy), a w dalszej kolejności szkołom. 9 Środek krzywej charakterystycznej, wyznaczonej dla testu dla danego poziomu nauczania (w tym przypadku klas III) powinien znajdować się w punkcie oznaczającym średni poziom umiejętności badanych uczniów z tego etapu nauczania. Maksimum funkcji informacyjnej także powinno lokować się w tym punkcie, a ponadto pole pod krzywą informacyjną powinno być jak największe, a wartości jej funkcji jak najwyższe w jak najszerszym spektrum skali. 159
4 XVIII Konferencja Diagnostyki Edukacyjnej, Wrocław 2012 lepsze pokrycie zadaniami szerokiego spektrum treści i umiejętności nauczanych na danym etapie szkoły podstawowej, czyli lepsze oszacowanie wyników nauczania na poziomie klasy, a także podniesienie wiarygodności wyników dzięki utrudnieniu ściągania wśród uczniów podczas badania testowego. Na drugim etapie prac nad testami zdefiniowano obszary treści i umiejętności, które będą objęte pomiarem. Prace te opierały się na analizie podstawy programowej kształcenia ogólnego, krajowych, międzynarodowych i zagranicznych badań umiejętności oraz analizie wniosków płynących z projektu poświęconego nowej formule sprawdzianu dla klasy VI 10. Etap ten pozwolił na wyłonienie najważniejszych z punktu widzenia kształcenia w szkole podstawowej obszarów, w których zakresie będzie można wnioskować o wynikach nauczania, i zdefiniowanie skal pomiarowych. Opracowana koncepcja skal pomiarowych podlegała konsultacjom merytorycznym z ekspertami i została poddana zewnętrznej recenzji. Zebrane uwagi pozwoliły na dopracowanie ostatecznego kształtu koncepcji (Jasińska, 2012). Pomiar osiągnięć szkolnych w badaniu SUEK objął umiejętność czytania, świadomość językową i umiejętności matematyczne. Opis struktury każdego z trzech testów oraz wynikających z niej planów testów miał na celu zagwarantowanie różnorodności i reprezentatywności mierzonych treści i umiejętności, a tym samym zapewnienie trafności treściowej testu. Trzecim etapem było opracowanie planów testów dla każdej skali pomiarowej. Plany testów precyzują, ile zadań, mierzących jakie szczegółowe umiejętności powinno znaleźć się w teście. Proporcje zadań były ustalane na podstawie analizy podstawy programowej kształcenia ogólnego i programów nauczania. Kolejne dwa etapy obejmowały tworzenie zadań testowych, zgodnych z założeniami pomiaru i planami testów. Opracowano zasady konstrukcji zadań testowych i schematów oceniania oraz wskazówki dla autorów zadań, które były pomocne przy układaniu zadań spełniających założone kryteria. W tworzeniu tych wskazówek niezwykle pomocne były doświadczenia amerykańskie (Haladyna i in., 2002; Downing, 2006b). Równolegle ogłoszono konkurs na autorów zadań. Do współpracy zaproszono osoby, których nadesłane próbki autorskich zadań zostały najwyżej ocenione. Praca nad pozyskiwaniem zadań polegała na zamawianiu u autorów zadań mierzących konkretne umiejętności tak, by odpowiednio wypełnić plan testu, recenzowaniu ich na bieżąco i, jeśli to było wskazane, odsyłaniu do poprawy. Pula ostatecznie przyjętych zadań podlegała dodatkowej ocenie i korekcie podczas warsztatów z udziałem matematyków, polonistów, pedagogów wczesnoszkolnych, dydaktyków praktyków, koderów oraz członków zespołu badawczego. Ostatnim etapem prac nad zadaniami i zeszytami pilotażowymi była ich obróbka graficzna i skład. Na szósty etap prac nad testami składało się zaplanowanie i realizacja badania pilotażowego 823 przygotowanych zadań składających się na trzy skale pomiarowe. W przygotowaniu badania pilotażowego najważniejsze było odpowiednie podzielenie zadań na zeszyty testowe oraz opracowanie takiego planu 10 Nowa formuła sprawdzianu w klasie VI, projekt realizowany w latach przez CKE, koordynator: Anna Pregler. 160
5 Regionalne i lokalne diagnozy edukacyjne testowania (określającego, którzy uczniowie mają rozwiązywać które zeszyty testowe), który zapewni zrównoważone próbkowanie macierzowe, umożliwiające wspólne skalibrowanie zadań z jednego testu oraz jak najdokładniejsze oszacowanie parametrów psychometrycznych zadań i każdego z trzech testów. Plan testowania musiał uwzględniać także fakt, iż badanie pilotażowe było realizowane z udziałem uczniów klas III i V 11. Aby podnieść trafność fasadową testu pilotażowego, zdecydowano, że uczniowie klas III nie będą rozwiązywali zadań najtrudniejszych, a uczniowie klasy V - zadań najłatwiejszych. Biorąc pod uwagę wszystkie założenia oraz liczbę przygotowanych zadań do każdego z trzech testów, przygotowano do badania pilotażowego 44 zeszyty testowe. Plan testowania został ostatecznie przygotowany tak, by każdy zeszyt testowy występował z każdym innym dla pewnej grupy uczniów. Równoważył także prawdopodobieństwo rozwiązywania w próbie każdego zeszytu testowego. Ponadto uwzględniał różną kolejność rozwiązywania zeszytów testowych w poszczególnych dniach testowania. Każdy uczeń rozwiązywał 4 zeszyty z jednego testu. Realizację badania powierzono wykonawcy zewnętrznemu wyłonionemu w drodze przetargu publicznego. Kolejnym etapem była analiza danych z badania pilotażowego mająca na celu wybór zadań o najlepszych właściwościach pomiarowych. Analizy wykonano przy pomocy oprogramowania ConQuest Wykorzystano model Rascha dla zadań punktowanych 0-1 oraz Partial Credit Model dla zadań wielopunktowych. Wszystkie zadania w ramach każdego testu były skalowane jednocześnie. Analizy polegały na wielokrotnym powtarzaniu następujących kroków: łączne wyskalowanie zadań z danego testu, usunięcie z analiz kilku zadań najsłabiej dopasowanych do założonego modelu lub skrócenie skali punktowej dla zadań źle dopasowanych, ponowne wyskalowanie zadań z danego testu 13. Podejmując decyzję o usunięciu zadań, brano pod uwagę: dopasowanie zadania do modelu (miary dopasowania: INFIT - weighted fit, OUTFIT - unweighted fit; kształt empirycznych krzywych charakterystycznych zadań w stosunku do krzywych wynikających z modelu), trudność zadania, wnioski wyprowadzane z analizy dystraktorów, wnioski wyprowadzane z analiz efektów zróżnicowanego funkcjonowania zadania DIF (differential item functioning). Analizy doprowadziły do utworzenia banku zadań o wystarczająco 11 Badanie było realizowane na ogólnopolskiej losowej próbie 80 szkół podstawowych w klasach III i V (łącznie przebadano 281 klas, co dało 5454 uczniów) w roku szkolnym 2010/11. Okienko testowe było na początku II semestru. Harmonogram pracy nad testami niestety nie pozwolił na realizację badania pilotażowego w czasie najbardziej wskazanym - na dokładnie rok przed planowanym pomiarem zasadniczym (czyli na początku roku szkolnego 2010/11). Dlatego zdecydowano się objąć badaniem uczniów trochę młodszych oraz trochę starszych, ze świadomością tego, że nie jest to rozwiązanie idealne. Wybór klasy V był podyktowany tym, że część zadań przygotowywanych do pierwszego pomiaru osiągnięć miała być z założenia zadaniami kotwiczącymi dla kolejnych pomiarów obejmujących uczniów po zakończeniu nauki w klasie IV. Istniała więc konieczność przetestowania ich na populacji uczniów starszych. Takie zdefiniowanie populacji uczniów objętych badaniem pilotażowym było jednak korzystne z powodu możliwości przetestowania zadań wśród uczniów o bardzo zróżnicowanych umiejętnościach. 12 Margaret L. Wu i in., ACER ConQuest version 2.0: Generalised Item Response Modelling Software, ACER Press, Australian Council for Educational Research, Usunięcie każdego zadania powoduje zmiany w oszacowaniu parametrów pozostałych zadań (zmiana definicji mierzonej cechy, szacowanie umiejętności uczniów i parametrów zadań na podstawie trochę innego zestawu danych). Dlatego ważne jest to, by usuwanie zadań z analiz było czynione w małych krokach. 161
6 XVIII Konferencja Diagnostyki Edukacyjnej, Wrocław 2012 dobrych właściwościach pomiarowych, dopasowanych do założonego modelu analiz, który stanowił podstawę konstrukcji testów do badania zasadniczego. Tworzenie ostatecznych wersji testów, czyli ósmy etap prac, polegał na takim wyborze zadań o najlepszych właściwościach psychometrycznych, by mierzyły one założone przez plany testów wiadomości i umiejętności, a także by były jak najlepiej dostosowane do prognozowanego rozkładu umiejętności uczniów w populacji docelowej oraz miały odpowiednio zróżnicowaną trudność 14. Każda propozycja testu była skalowana, aby móc ocenić i porównać ją z innymi. Po ustaleniu ostatecznej puli zadań tworzących test osiągnięć, podzielono zadania na dwie quasi-równoległe wersje z pulą zadań kotwiczących. Podziału dokonywano w taki sposób, by zarówno zadania kotwiczące, jak i zadania w każdej wersji testu stanowiły reprezentatywną próbką planu testu, a także by obie wersje miały taką samą trudność. W ten sposób powstały trzy testy zawierające od 43 do 51 zadań (od 29 do 33 zadań przypadających na wersję). Zadania z każdego testu rozłożono na dwa zeszyty testowe dla każdej wersji. Harmonogram projektu uniemożliwiał przeprowadzenie badania standaryzacyjnego dla powstałych testów. Testy przygotowane w opisany sposób zostały wykorzystane w badaniu zasadniczym, które można potraktować także jako badanie ewaluacyjne przyjętej procedury ich konstrukcji. Był to dziewiąty etap prac nad testami. Badanie to zostało przeprowadzone na ogólnopolskiej, losowej próbie 174 szkół podstawowych w listopadzie 2011 roku. Badaniem zostało objętych 5156 uczniów rozpoczynających naukę w klasie IV. Ostatnie trzy etapy konstrukcji testów osiągnięć zawierały analizę danych z badania zasadniczego, mającą na celu oszacowanie ostatecznych parametrów zadań, wyskalowanie testów i obliczenie wyników dla uczniów biorących udział w badaniu oraz opracowanie raportu technicznego wraz z normami wykonania podsumowującego proces powstawania i właściwości stworzonych testów (Jarnutowska i in., w przygotowaniu). Znaczenie badania pilotażowego dla konstrukcji testów osiągnięć szkolnych Jak wynika z powyższego opisu kolejnych etapów prac, narzędzia, jakimi są testy osiągnięć szkolnych stworzone na potrzeby Badania szkolnych uwarunkowań efektywności kształcenia, są narzędziami zaprojektowanymi. Z zadań przetestowanych na etapie badania pilotażowego skonstruowano docelowe testy, co do których sformułowano określone hipotezy dotyczące ich jakości i właściwości psychometrycznych. Przyjrzyjmy się dwóm z tych najważniejszych, a dotyczących zakresu stosowalności i dopasowaniu testów do modelu. Po ponownym wyskalowaniu zadań wchodzących w skład zasadniczych testów, bazując już na wynikach badania na populacji docelowej, można było ocenić, na ile udało się te założenia udowodnić. W pilotażu na każde zadanie odpowiedziało około 300 uczniów, pochodzili oni jednak z dwóch różnych populacji, które stanowiły niejako warunki brzegowe dla zamierzonej populacji. 14 Aby krzywa informacyjna testu była jak najwyższa w jak najszerszym obszarze poziomu umiejętności uczniów. 162
7 Regionalne i lokalne diagnozy edukacyjne Przy konstrukcji testów przyjęto założenie, że docelowe narzędzia powinny dostarczać najwięcej informacji w takim przedziale umiejętności, który zdefiniować można jako średni poziom badanej umiejętności - uczniowie, którzy bowiem zakończyli edukację na pierwszym etapie kształcenia, znajdują się w kontekście poziomu swoich umiejętności gdzieś pomiędzy uczniami na początku klasy trzeciej a uczniami na początku klasy piątej szkoły podstawowej. Czy udało się zatem odtworzyć rozkład trudności zadań w badaniu zasadniczym? Czy skonstruowane testy rzeczywiście mierzą założony obszar umiejętności? IRT dostarcza narzędzia, które pozwala odpowiedzieć na te pytania. Krzywa informacyjna testu jest przydatnym narzędziem pozwalającym graficznie przedstawić zdolność testu do szacowania poziomu umiejętności w różnych jej zakresach (de Ayala, 2009, s ). Im większa wartość funkcji informacyjnej, tym większa precyzja pomiaru badanej cechy. W zależności od uwzględnionych w teście zadań, przyjętego modelu estymacji, krzywa informacyjna dla testu może przybierać różne kształty. Narzędzie to pozwala więc dosłownie na projektowanie własności pomiarowych testu, w zależności od potrzeb - wystarczy określić pożądany kształt krzywej. Krzywa informacyjna dla idealnego testu osiągałaby wysoką wartość maksimum dla średniego wyniku w populacji i utrzymywałaby wysoki wynik aż po skraje skali. Znaczyłoby to - przy zachowaniu założeń modelu - że test pozwala na bardzo dokładny pomiar umiejętności wśród wszystkich członków badanej populacji, niezależnie od ich poziomu umiejętności. Narzędzie takie musiałoby składać się z bardzo wielu zadań, o bardzo zróżnicowanej trudności 15. Algorytm używany przez program ConQuest 2.0 przedstawia wyniki estymacji parametrów zadań na skali logitowej, przyjmując jako punkt zero średnią trudność zadań w teście. Po oszacowaniu parametrów zadań program estymuje średni poziom umiejętności w populacji na podstawie wyników uczniów w próbie. Zakłada się, że rozkład umiejętności w populacji jest normalny. Jaki kształt krzywej informacyjnej testu jest więc pożądany w przypadku testów dla badania SUEK? Chęć zbliżenia się do ideału testu nakreślonego powyżej, i założenie jako celu pomiaru jak najdokładniejszego zmierzenia poziomu umiejętności uczniów w całej populacji, prowadzą nas do wniosku, że najlepszą krzywą jest krzywa w kształcie rozciągniętego wszerz dzwonu, która osiąga maksimum dla średniego wyniku w populacji. Test o takiej krzywej pozwala na najdokładniejsze rozróżnienie poziomu umiejętności uczniów w obszarze, który jest najgęściej zaludniony, dostarcza więc najwięcej informacji dla największej części populacji. Rysunki 1. i 2. przedstawiają porównanie krzywych informacyjnych dla testu z matematyki z etapu pilotażu i badania zasadniczego. W tabeli 1. umieszczono zaś zestawienie średnich wyników uczniów dla każdego z testów z obu tych etapów. 15 Należy jednak pamiętać, że dokładność pomiaru, wraz z czasem potrzebnym na jego przeprowadzenie, z zasady znajdują się w relacji monotonicznie rosnącej: im więcej zadań w teście, tym dokładniejszy pomiar. Jednym ze sposobów na zwiększenie precyzji pomiaru, przy zachowaniu rozsądnego czasu badania, stanowi testowanie adaptatywne: poziom umiejętności badanego szacowany jest na bieżąco, a każde kolejne zadanie dobierane jest ze względu poprzednie odpowiedzi badanego. W ten sposób narzędzie zatacza coraz węższe okrążenia wokół najpewniejszego oszacowania poziomu umiejętności badanego, aż do osiągnięcia pożądanego stopnia precyzji. 163
8 XVIII Konferencja Diagnostyki Edukacyjnej, Wrocław 2012 Rysunek 1. Krzywa informacyjna dla testu z matematyki z etapu pilotażu Rysunek 2. Krzywa informacyjna dla testu z matematyki dla badania zasadniczego Tabela 1. Porównanie średnich wyników uczniów w testach SUEK z etapu pilotażu i badania zasadniczego Etap / Rodzaj testu Test umiejętności matematycznych Test czytania Test świadomości językowej Pilotaż 0,182 0,745-0,041 Badanie zasadnicze 0,263 0,512-0,117 Krzywe informacyjne dla pozostałych testów wyglądają bardzo podobnie do krzywych dla testu matematycznego - oznacza to, że rozkład względnej trudności zadań oszacowany na podstawie badania pilotażowego potwierdził się w badaniu zasadniczym. Należy przy tym przypomnieć, że badanie pilotażowe obejmowało o wiele więcej zadań i że każdy uczeń rozwiązywał na tym etapie tylko niewielką próbkę z nich. Pomimo tego, dzięki zastosowaniu modelu Rascha, zadania testowane często na różnych podpróbach uczniów, można było połączyć w jedno narzędzie, a ich parametry nie uległy wielkiej zmianie. W związku z tym, narzędzie, które zostało zaprojektowane z najlepszych psychometrycznie zadań, nietestowane w całości na żadnej podróbce uczniów (żaden z uczniów w pilotażu nie zetknął się z całą wiązką zadań, które weszły do zasadniczego narzędzia), potwierdziło w badaniu zasadniczym swoje dobre właściwości pomiarowe. Można jednak zauważyć, że przewidywane średnie umiejętności uczniów nie wypadają ściśle w punkcie zero, zarówno w pilotażu, jak i w badaniu zasadniczym. Pierwszą informacją, jaką należy z tego porównania średnich wywnioskować, to fakt, że przewidywana na etapie pilotażu średnia umiejętność uczniów w docelowej populacji, nie odbiega znacząco - z wyłączeniem 164
9 Regionalne i lokalne diagnozy edukacyjne testu czytania - od tej uzyskanej na podstawie danych z badania zasadniczego. Przyjęte założenie o średniej umiejętności uczniów w docelowej populacji okazało się w dużej mierze słuszne. Choć testy skonstruowane po analizie danych z pilotażu nie były idealnie dopasowane do zakładanej (a nie badanej, dodajmy) populacji, to odchylenia te były z zasady niewielkie i wynikały z nałożenia na siebie kilku ograniczeń - dobrego dopasowania zadań do restrykcyjnego modelu, ścisłych planów testów oraz dostępności zadań o zróżnicowanej trudności. To właśnie brak dobrych psychometrycznie zadań o wysokiej trudności w teście czytania uniemożliwił stworzenie narzędzia lepiej dopasowanego do badanej populacji. Jak się jednak okazało, w przypadku testu czytania niedopasowanie to zmniejszyło się po ostatecznym oszacowaniu średniej w interesującej nas populacji. Kolejnym problemem, którym się zajmiemy, to dopasowanie zadań do modelu. Tylko zadania, które wykazywały wysoki poziom zgodności z przewidywaniami modelu Rascha mogły zostać włączone do ostatecznego narzędzia. Czy zadania, które zachowywały się dobrze na etapie pilotażu, nie straciły tej własności w docelowej populacji? Miary dopasowań INFIT i OUTFIT, które były brane pod uwagę przy włączaniu zadań do testu, zdają sprawę ze zgodności przewidywań modelu i danych empirycznych. Gdy miary te osiągają jeden, przyjmuje się, że zadanie jest dobrze dopasowane do modelu. W praktyce dopuszcza się jednak pewne rozchwianie wartości tych statystyk (de Ayala, 2009, s ). Na etapie badania pilotażowego zadania, których wartości dla miar dopasowania wahały się od ok. 0,8 do ok. 1,2, uważano za odpowiednio dobrze dopasowane. Rysunek 3. przedstawia wykresy skrzynkowe dla miar dopasowania z etapu pilotażu i badania zasadniczego. Rysunek 3. Wykres skrzynkowy dla miar dopasowania dla testów (prefiks C - czytanie, M - matematyka, P - test świadomości językowej) dla dwóch etapów (sufiks p - pilotaż, z - badanie zasadnicze) Wykres ten przedstawia rozkład statystyk dopasowania: dolna granica każdej skrzynki odpowiada wartości dla pierwszego kwartyla, gruba linia wewnątrz skrzynki przedstawia medianę, górny bok skrzynki to trzeci kwartyl. Wąsy rozciągają się do wartości maksymalnej i minimalnej dla każdej zmiennej 165
10 XVIII Konferencja Diagnostyki Edukacyjnej, Wrocław 2012 lub maksymalnie do wartości wyznaczonej przez następujący przedział: <Q1-1,5*IQR; Q3 + 1,5*IQR>, gdzie Q1, Q3 to odpowiednio wartości dla pierwszego i trzeciego kwartyla, a IQR to wartość rozstępu ćwiartkowego. Wartości odstające oznaczone są kółkami. Widzimy, że miary dopasowań dla zadań w większości utrzymują się w założonych granicach (oznaczonych na wykresie poziomymi przerywanymi liniami). Oznacza to, że przewidywania dla dopasowania zadań testowych do modelu w bardzo dużym stopniu potwierdziły się na etapie badania zasadniczego. Na etapie tym jednakże, kilka zadań w teście matematycznym i jedno zadanie w teście czytania wykroczyło poza wyznaczone limity. Część zadań, które nie wykazują się dobrym dopasowaniem do modelu na etapie badania zasadniczego, zachowano ze względu na potrzebę respektowania planu testu. Zadania rażąco odbiegające od przewidywań modelu nie zostały zaś ostatecznie wzięte pod uwagę przy szacowaniu poziomu umiejętności uczniów z docelowej populacji (dotyczy to po jednym zadaniu z testu matematycznego i testu czytania). Należy jeszcze raz podkreślić, że w związku z brakiem badania standaryzacyjnego, ostateczne oszacowania parametrów dla zadań i ocena jakości narzędzia zostały przeprowadzone na podstawie wyników badania zasadniczego. Dopiero na tym etapie, zadania wybrane na podstawie danych z pilotażu zostały faktycznie ułożone obok siebie w formie papierowych zeszytów. Dopiero na tym etapie, na każde zadanie kotwiczące odpowiedziało ponad 5000 uczniów z docelowej populacji, a na każde zadanie specyficzne dla wersji około połowa tej liczby. Jednak pomimo tak wielu różnic w okolicznościach przeprowadzania badania pilotażowego i zasadniczego, zaprojektowane na podstawie wyników pilotażu narzędzie okazało się spełniać w bardzo wysokim stopniu pokładane w nim nadzieje - zadania wykazują dużą zgodność z przewidywaniami modelu, testy mierzą umiejętności z dużą dokładnością w szerokich zakresach. Owocem długiego, przemyślanego i złożonego procesu tworzenia testów osiągnięć szkolnych są narzędzia z pewnością nie doskonałe, ale będące silnym świadectwem, że gdy chodzi o możliwość stworzenia dobrego narzędzia do pomiaru efektów kształcenia, to istnieją metody, które zbliżają nas do jej zrealizowania. Rekomendacje Na zakończenie warto podzielić się kilkoma spostrzeżeniami dotyczącymi tworzenia testów osiągnięć szkolnych. Na pierwszy plan wysuwa się kwestia założeń dotyczących pomiaru: dokładna wizja końcowego narzędzia, jego formy, zakresu stosowalności i celu pomiaru. Jasna koncepcja testu pozwala wytyczyć drogę prowadzącą do wytworzenia narzędzia o pożądanych własnościach. Drugim, równie ważnym etapem jest pozyskanie dobrych zadań. W Polsce wciąż cierpimy na brak profesjonalnych autorów zadań do testów osiągnięć. Na szczęście nie jest tak, jak wielu osobom może się wydawać, że dobrym autorem zadań trzeba się urodzić - tworzenia dobrych zadań można się nauczyć. Niestety problematyka pomiaru osiągnięć szkolnych na uniwersytetach w Polsce nie ma silnego zaplecza naukowego. Nie organizuje się studiów, które kształciłyby studentów w tym kierunku. Po drugie, należy zwrócić uwagę na 166
11 Regionalne i lokalne diagnozy edukacyjne empiryczną stronę oceny zadań - dobre zadanie to takie, które faktycznie dobrze mierzy założony konstrukt. Oczywiście nie znaczy to, że ocena jakościowa jest zbędna - tylko z pomocą oka eksperta jesteśmy w stanie określić, czy zadanie jest trafne, czy jest w ogóle w stanie mierzyć to, co chcemy zmierzyć - jednakże ocena, na ile dobrze to robi, jest już kwestią, którą można rozstrzygnąć tylko na drodze empirii, czyli sprawdzając je w badaniu pilotażowym. Warto w tym miejscu wspomnieć o potrzebie jak najlepszego dopracowywania zadań jeszcze na etapie przed pilotażem. W związku z tym, że badanie pilotażowe - zorganizowane w opisany powyżej sposób - pozwala na przetestowanie wielu zadań, nie warto dopuszczać do niego zadań ewidentnie słabych konstrukcyjnie, na zasadzie: jeśli jest słabe, to nie wejdzie do ostatecznej puli zadań. Przewidywania te bardzo często się sprawdzają, jednakże, kierując się taką zasadą, zmarnowaliśmy właśnie miejsce w puli zadań pilotażowych na zadanie, którego nie mieliśmy zamiaru używać, tylko dlatego, że nie dopracowaliśmy się lepszego na jego miejsce. Bardzo dobrym pomysłem, wydłużającym niestety czas potrzebny na przygotowanie narzędzia i zwiększającym koszty, jest wprowadzenie dwuetapowego pilotażu, gdzie - pomiędzy kolejnymi edycjami pilotażu - na bazie faktycznych odpowiedzi uczniów jesteśmy w stanie ulepszyć zadania lub klucze kodowe, służące ocenie zadań otwartych. Pracownia SUEK wykorzystała do przygotowania narzędzia szczególny przypadek modelu IRT - model Rascha. Model ten posiada bardzo cenne zalety pozwalające na konstrukcję narzędzia w zależności od potrzeb - niektóre zostały zaprezentowane w tekście. Nie jest jednak tak, że autorzy są przekonani, że metoda ta jest jedyną słuszną metodą pozwalającą na konstruowanie dobrych narzędzi psychometrycznych. Główną tezą postawioną w tekście jest przekonanie, że dobre narzędzie jest owocem przemyślanego procesu, w którym kolejne decyzje dotyczące tworzenia testu nie są podejmowane arbitralnie, lecz wynikają z metody, dostarczającej obiektywnych, empirycznych przesłanek dla rzetelnej oceny postępów i jednoznacznych procedur zapewniania jakości wytwarzanemu produktowi. Pracownia SUEK podjęła się konstrukcji testów osiągnięć od podstaw nie tylko dlatego, że posiadanie dobrego i rzetelnego narzędzia służącego pomiarowi osiągnięć szkolnych jest konieczne dla powodzenia Badania szkolnych uwarunkowań efektywności kształcenia, ale też dlatego, żeby pokazać na gruncie polskim, że można stworzyć testy osiągnięć we w pełni zaplanowany i przemyślany sposób i że to się opłaca. Słowem, że można inaczej. Bibliografia: 1. AERA, APA, NCME (1999), Standards for Educational and Psychological Testing. 2. de Ayala R. J. (2009), The Theory and Practice of Item Response Theory, New York London, The Guilford Press. 3. Dolata R., Putkiewicz E., Wiłkomirska A. (2004), Reforma egzaminu maturalnego 167
12 XVIII Konferencja Diagnostyki Edukacyjnej, Wrocław oceny i rekomendacje, Warszawa, Wydawnictwo Instytutu Spraw Publicznych. 4. Downing S. M. (2006a), Twelve Steps for Effective Test Develpopment [w:] Handbook of Test Development, S. M. Downing, T. M. Haladyna (red.), Lawrence Erlbaum Associates Publishers. 5. Downing S. M. (2006b), Selected-Response Item Formats in Test Development [w:] Handbook of Test Development, S. M. Downing, T. M. Haladyna (red.), Lawrence Erlbaum Associates Publishers. 6. Haladyna T., Downing S., Rodriguez M. (2002), A Review of Multiple-Choice Item- Writing Guidelines for Classroom Assessment Applied Measurement in Education, Applied Measurement in Education, 15(3), Jarnutowska E., Jasińska A., Modzelewski M. [w przygotowaniu], Testy osiągnięć szkolnych dla uczniów po pierwszym etapie kształcenia. Badanie szkolnych uwarunkowań efektywności kształcenia, Raport techniczny, dostęp na stronie: 8. Jasińska A. (2012), Koncepcja testów osiągnięć szkolnych uczniów szkół podstawowych. Badanie szkolnych uwarunkowań efektywności kształcenia, dostęp na stronie: 9. Pokropek A. (2011), Matura z języka polskiego. Wybrane problemy psychometryczne [w:] Ewaluacja w edukacji: koncepcje, metody, perspektywy. Materiały XVII Konferencji Diagnostyki Edukacyjnej, Niemierko B., Szmigel M.K. (red.), Kraków, Polskie Towarzystwo Diagnostyki Edukacyjnej. 10. Szaleniec H., Grudniewska M., Kondratek B., Kulon F., Pokropek A. [w druku, 2012], Zrównanie egzaminu gimnazjalnego dla lat , Edukacja nr 3 (119). 168
Trafność egzaminów w kontekście metody EWD
Trafność egzaminów w kontekście metody EWD Aleksandra Jasińska (a.jasinska@ibe.edu.pl) Tomasz Żółtak (t.zoltak@ibe.edu.pl) Instytut Badań Edukacyjnych ul. Górczewska 8 01-180 Warszawa JESIENNA SZKOŁA EWD
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2012
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2012 OPRACOWAŁY: ANNA ANWAJLER MARZENA KACZOR DOROTA LIS 1 WSTĘP W analizie wykorzystywany będzie model szacowania EWD.
Polska Warszawa SP 24. Polski Matematyka Angielski
120 100 80 60 Polska Warszawa SP 24 40 20 0 Polski Matematyka Angielski EGZAMINY ZEWNĘTRZNE: Nie spełniają zadania nałożonego przez ustawę o systemie oświaty. Nie dostarczają informacji, których w powszechnym
Kontekstowe wskaźniki efektywności nauczania - warsztaty
Kontekstowe wskaźniki efektywności nauczania - warsztaty Przygotowała: Aleksandra Jasińska (a.jasinska@ibe.edu.pl) wykorzystując materiały Zespołu EWD Czy dobrze uczymy? Metody oceny efektywności nauczania
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2013
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2013 OPRACOWAŁY: ANNA ANWAJLER MARZENA KACZOR DOROTA LIS 1 WSTĘP W analizie wykorzystywany będzie model szacowania EWD.
PUBLICZNA SZKOŁA PODSTAWOWA NR 7 IM. MIKOŁAJA KOPERNIKA W ZIELONEJ GÓRZE EWD
PUBLICZNA SZKOŁA PODSTAWOWA NR 7 IM. MIKOŁAJA KOPERNIKA W ZIELONEJ GÓRZE EWD NA PODSTAWIE WYNIKÓW TESTU OBUT 2012 ORAZ SPRAWDZIANU 2015 Opracowanie: Agnieszka Konieczna Listopad 2015 Wstęp 1 Ocena pracy
RAPORT EDUKACYJNA WARTOŚĆ DODANA
RAPORT EDUKACYJNA WARTOŚĆ DODANA rok 2013 w Gimnazjum Katolickim Zespół Szkół Świętego Jana Bosko Opracowały: Marlena Kowalska, Katarzyna Harlejczyk Wykresy wygenerowano w programie Kalkulator EWD 100
w pierwszym okresie nauki w gimnazjum
Wojdedh Walczak Ośrodek Pedagogiczno-Wydawniczy CHEJRON w Łodzi Związek pomiędzy dwoma typami oceniania w podstawowej a wynikami osiąganymi przez uczniów w pierwszym okresie nauki w gimnazjum Wstęp Niniejsze
Pomiar osiągnięć szkolnych uczniów u progu II etapu edukacyjnego. (etap III badania, cz. 2)
Pomiar osiągnięć szkolnych uczniów u progu II etapu edukacyjnego (etap III badania, cz. 2) 1. Wprowadzenie W badaniu osiągnięć szkolnych uczniów u progu II etapu edukacyjnego (początek czwartek klasy szkoły
Porównywalne między latami wyniki sprawdzianu
Porównywalne między latami wyniki sprawdzianu ZESPÓŁ ANALIZ OSIĄGNIĘĆ UCZNIÓW Instytut Badań Edukacyjnych Plan prezentacji 1.Po co nam zrównywanie wyników pomiędzy latami? 2.W jaki sposób przeprowadzono
Wykorzystanie danych egzaminacyjnych w ewaluacji szkół. materiały Pracowni EWD
Wykorzystanie danych egzaminacyjnych w ewaluacji szkół materiały Pracowni EWD Funkcje systemu egzaminacyjnego ocena osiągnięć szkolnych uczniów w świetle wymagań programowych (funkcja selekcyjna) diagnoza
Raport dla szkoły Z BADANIA PODŁUŻNEGO W SZKOŁACH PODSTAWOWYCH. Efektywność nauczania na I etapie edukacyjnym
ͳ Raport dla szkoły Z BADANIA PODŁUŻNEGO W SZKOŁACH PODSTAWOWYCH Efektywność nauczania na I etapie edukacyjnym Dane szkoły Nr identyfikacyjny: Nazwa szkoły: Miejscowość: Adres: Instytut Badań Edukacyjnych
Interpretacja wyników standaryzowanych testów osiągnięć szkolnych na przykładzie skali 100/15
Interpretacja wyników standaryzowanych testów osiągnięć szkolnych na przykładzie skali 100/15 Michał Modzelewski Roman Dolata Zespół Szkolnych Uwarunkowań Efektywności Kształcenia Warszawa, 28 listopada
5. WNIOSKOWANIE PSYCHOMETRYCZNE
5. WNIOSKOWANIE PSYCHOMETRYCZNE Model klasyczny Gulliksena Wynik otrzymany i prawdziwy Błąd pomiaru Rzetelność pomiaru testem Standardowy błąd pomiaru Błąd estymacji wyniku prawdziwego Teoria Odpowiadania
Oszacowanie umiejętności teta oraz wyskalowanie osi w metodzie IRT dla potrzeb obliczania parametrów zadań
Sławomir Sapanowski Okręgowa Komisja Egzaminacyjna w Łodzi Oszacowanie umiejętności teta oraz wyskalowanie osi w metodzie IRT dla potrzeb obliczania parametrów zadań W ostatnim czasie wśród ekspertów zajmujących
EGZAMIN GIMNAZJALNY 2012 W SZKOŁACH DLA DOROSŁYCH W WOJEWÓDZTWIE ŚLĄSKIM. sesja wiosenna
EGZAMIN GIMNAZJALNY 2012 W SZKOŁACH DLA DOROSŁYCH W WOJEWÓDZTWIE ŚLĄSKIM sesja wiosenna Jaworzno 2012 SPIS TREŚCI 1. WPROWADZENIE... 3 2. WYNIKI SŁUCHACZY GIMNAZJÓW DLA DOROSŁYCH DOTYCZĄCE STANDARDOWYCH
PROGRAM OPERACYJNY KAPITAŁ LUDZKI Priorytet III, Działanie 3.2 Rozwój systemu egzaminów zewnętrznych
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego PROGRAM OPERACYJNY KAPITAŁ LUDZKI Priorytet III, Działanie 3.2 Rozwój systemu egzaminów zewnętrznych EWD jako
Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0
Nazwa przedmiotu: Kierunek: Matematyka - Statystyka matematyczna Mathematical statistics Inżynieria materiałowa Materials Engineering Rodzaj przedmiotu: Poziom studiów: forma studiów: obowiązkowy studia
Porównywalne między latami wyniki egzaminacyjne
Porównywalne między latami wyniki egzaminacyjne ZESPÓŁ ANALIZ OSIĄGNIĘĆ UCZNIÓW Instytut Badań Edukacyjnych Henryk Szaleniec, Bartosz Kondratek Plan prezentacji 1.Po co nam zrównywanie wyników pomiędzy
EWD EDUKACYJNA WARTOŚĆ DODANA
EWD EWD EDUKACYJNA WARTOŚĆ DODANA Jest narzędziem statystycznym, używanym do analizy wyników sprawdzianu w ewaluacji pracy szkół, Pozwala na wyciągnięcie wniosków dotyczących efektywności nauczania oraz
Publiczna Szkoła Podstawowa nr 14 w Opolu. Edukacyjna Wartość Dodana
Publiczna Szkoła Podstawowa nr 14 w Opolu Edukacyjna Wartość Dodana rok szkolny 2014/2015 Edukacyjna Wartość Dodana (EWD) jest miarą efektywności nauczania dla szkoły i uczniów, którzy do danej placówki
Analiza wyników egzaminów i diagnoz
Zespół Szkół Medycznych w Bydgoszczy rok szkolny 2012/2013 Analiza wyników egzaminów i diagnoz Cel ewaluacji: Zebranie informacji, czy do analizy wyników sprawdzianu i egzaminów wykorzystuje się różnorodne
Kontekstowe modele efektywności nauczania po I etapie edukacyjnym
Kontekstowe modele efektywności nauczania po I etapie edukacyjnym Aleksandra Jasińska (a.jasinska@ibe.edu.pl) Instytut Badań Edukacyjnych ul. Górczewska 8 01-180 Warszawa Czy dobrze uczymy? Metody oceny
EDUKACYJNA WARTOŚĆ DODANA
ŚLĄSKIE TECHNICZNE ZAKŁADY NAUKOWE EDUKACYJNA WARTOŚĆ DODANA ANALIZA 1. INFORMACJE OGÓLNE. Wskaźnik EWD i wyniki egzaminacyjne rozpatrywane są wspólnie. W ten sposób dają nam one pełniejszy obraz pracy
Latentna moc różnicująca zadań z testów matematycznych dla młodzieży uzdolnionej
XVI Konferencja Diagnostyki Edukacyjnej, Toruń 200 Elżbieta Ostaficzuk Mazowieckie Samorządowe Centrum Doskonalenia Nauczycieli Grażyna Śleszyńska Mazowieckie Samorządowe Centrum Doskonalenia Nauczycieli
Trafność testów egzaminacyjnych. Artur Pokropek, Tomasz Żółtak IFiS PAN
Trafność testów egzaminacyjnych Artur Pokropek, Tomasz Żółtak IFiS PAN Plan prezentacji EWD i trafność testów egzaminacyjnych Pięć postulatów trafności dla skal pomiarowych Wskaźniki egzaminacyjne a wyniki
Zadania rozrywające w testach
Ewa Stożek Okręgowa Komisja Egzaminacyjna w Łodzi Zadania rozrywające w testach Na podstawie analizy danych empirycznych ze sprawdzianu i roku wyodrębniono zadania odpowiedzialne za dwumodalność rozkładu
Sposoby prezentacji problemów w statystyce
S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki
W jakim stopniu uczniowie opanowali umiejętność Wykorzystywania wiedzy w praktyce? Analiza zadań otwartych z arkusza Sprawdzian 2012
Jerzy Matwijko Okręgowa Komisja Egzaminacyjna w Krakowie W jakim stopniu uczniowie opanowali umiejętność Wykorzystywania wiedzy w praktyce? Analiza zadań otwartych z arkusza Sprawdzian 2012 W Pracowni
Publiczne Gimnazjum im. Jana Pawła II w Wilczej Woli ANALIZA EGZAMINU GIMNAZJALNEGO 2013 Z UWZGLĘDNIENIEM EWD
Publiczne Gimnazjum im. Jana Pawła II w Wilczej Woli ANALIZA EGZAMINU GIMNAZJALNEGO 2013 Z UWZGLĘDNIENIEM EWD EDUKACYJNA WARTOŚĆ DODANA JAKO JEDNA Z MIAR JAKOŚCI NAUCZANIA Zasoby na wejściu Szkoła Jakość
Wykorzystanie wyników maturalnych do organizacji procesów edukacyjnych
Wykorzystanie wyników maturalnych do organizacji procesów edukacyjnych Opracowanie: Olga Cupiał na podstawie materiałów ORE JAK WYKORZYSTAĆ WYNIKI SPRAWDZIANU, EGZAMINU ZEWNĘTRZNEGO DO ROZWOJU PRACY SZKÓŁ
RAPORT ZBIORCZY z diagnozy Matematyka PP
RAPORT ZBIORCZY z diagnozy Matematyka PP przeprowadzonej w klasach drugich szkół ponadgimnazjalnych Analiza statystyczna Wskaźnik Wartość wskaźnika Wyjaśnienie Liczba uczniów Liczba uczniów, którzy przystąpili
Testy osiągnięć szkolnych TOS3: przykład narzędzia skonstruowanego z wykorzystaniem modelu Rascha. Aleksandra Jasińska, Michał Modzelewski
Edukacja 2014, 2(127), 85 107 ISSN 0239-6858 Testy osiągnięć szkolnych TOS3: przykład narzędzia skonstruowanego z wykorzystaniem modelu Rascha Aleksandra Jasińska, Michał Modzelewski Instytut Badań Edukacyjnych*
Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA
Opis zakładanych efektów kształcenia na studiach podyplomowych Nazwa studiów: BIOSTATYSTYKA PRAKTYCZNE ASPEKTY STATYSTYKI W BADANIACH MEDYCZNYCH Typ studiów: doskonalące Symbol Efekty kształcenia dla studiów
Podnoszenie efektywności kształcenia
Podnoszenie efektywności kształcenia Efektywność to rezultat podjętych działań, opisany relacją uzyskanych efektów do poniesionych nakładów Efektywność - sprawność - oznacza "robienie rzeczy we właściwy
ZADANIA ROZRYWAJĄCE W TESTACH. 1. Co to jest zadanie rozrywające?
Ewa Stożek OKE Łódź ZADANIA ROZRYWAJĄCE W TESTACH Na podstawie analizy danych empirycznych ze sprawdzianu i roku wyodrębniono zadania odpowiedzialne za dwumodalność rozkładu wyników tych testów. Takie
Ewaluacja sprawdzianu 2009 klas szóstych szkoły podstawowej na podstawie sprawozdania sporządzonego przez OKE w Jaworznie
Zespół Szkolno - Przedszkolny w Rudzicy im. Jana Pawła II Ewaluacja sprawdzianu 2009 klas szóstych szkoły podstawowej na podstawie sprawozdania sporządzonego przez OKE w Jaworznie Rudzica 2009 SPIS TREŚCI
Model EWD dla II etapu edukacyjnego.
Model EWD dla II etapu edukacyjnego. Na podstawie materiałów Pracowni EWD Instytut Badań Edukacyjnych Warszawa, 28-29.11.2014 r. Plan zajęć /moduł 9. i 10./ 1. Idea EWD 2. Model EWD dla II etapu 3. Prezentacja
CZY UCZNIOWIE POWINNI OBAWIAĆ SIĘ NOWEGO SPOSOBU OCENIANIA PRAC EGZAMINACYJNYCH?
Aktualne problemy dydaktyki przedmiotów przyrodniczych CZY UCZNIOWIE POWINNI OBAWIAĆ SIĘ NOWEGO SPOSOBU OCENIANIA PRAC EGZAMINACYJNYCH? Marta Jaksender, Robert Zakrzewski*, Anna Wypych-Stasiewicz Uniwersytet
Porównywalne między latami wyniki egzaminacyjne
Porównywalne między latami wyniki egzaminacyjne ZESPÓŁ ANALIZ OSIĄGNIĘĆ UCZNIÓW Instytut Badań Edukacyjnych Plan prezentacji 1. Zrównywanie wyników egzaminacyjnych w innych krajach 2. Po co nam zrównywanie
Szanowni Państwo! Dodatkowe informacje na temat badania Kompetencje 2018 znajdą państwo na naszej stronie internetowej (
Szanowni Państwo! Przesyłamy wyniki badania Kompetencje dla przyszłości 2018 - ogólnopolskiego badania umiejętności uczniów, które realizowaliśmy w szkołach podstawowych i gimnazjalnych w czerwcu 2018
ANALIZA JAKOŚCIOWA I ILOŚCIOWA TESTÓW SZKOLNYCH MATERIAŁ SZKOLENIOWY
ANALIZA JAKOŚCIOWA I ILOŚCIOWA TESTÓW SZKOLNYCH MATERIAŁ SZKOLENIOWY Instrukcja przeprowadzania analiz badań edukacyjnych i sporządzania raportów po badaniach. Cele prowadzenia analiz jakościowych i ilościowych
RAPORT EWALUACYJNY. Zespół ds. ewaluacji: Aneta Czerwiec Agnieszka Cichecka Marzena Litwa
Publiczne Gimnazjum w Uwielinach im. Żołnierzy AK- Bohaterów Lasów Chojnowskich Rok szkolny 2014/2015 RAPORT EWALUACYJNY Realizacja przez szkołę wniosków z analizy wyników sprawdzianów, egzaminu gimnazjalnego
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2015
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2015 OPRACOWAŁY: ANNA ANWAJLER MARZENA KACZOR DOROTA LIS 1 WSTĘP Termin edukacyjna wartość dodana (EWD) oznacza zarówno
Analiza ilościowa i jakościowa wyników egzaminu gimnazjalnego z matematyki 2017r
Analiza ilościowa i jakościowa wyników egzaminu gimnazjalnego z matematyki 2017r Matematykę uczniowie rozwiązywali w drugim dniu egzaminu Test zawierał zarówno zdania zamknięte jednokrotnego wyboru, jak
PODSTAWOWE FIGURY GEOMETRYCZNE
TEST SPRAWDZAJĄCY Z MATEMATYKI dla klasy IV szkoły podstawowej z zakresu PODSTAWOWE FIGURY GEOMETRYCZNE autor: Alicja Bruska nauczyciel Szkoły Podstawowej nr 1 im. Józefa Wybickiego w Rumi WSTĘP Niniejsze
Kontekstowy model oceny efektywności nauczania dla pierwszego etapu edukacyjnego
Kontekstowy model oceny efektywności nauczania dla pierwszego etapu edukacyjnego Aleksandra Jasińska-Maciążek (a.jasinska@ibe.edu.pl) Instytut Badań Edukacyjnych Jak ocenić efektywność nauczania? Modele
ZS 14 Rok szkolny 2013/2014
Edukacyjna Wartość Dodana ZS 14 Rok szkolny 2013/2014 Pojęcie: Edukacyjna wartość dodana Edukacyjną wartość dodaną można zdefiniować jako przyrost wiedzy uczniów w wyniku danego procesu edukacyjnego. Innymi
Egzaminy zewnętrzne dla rozwoju szkoły
Egzaminy zewnętrzne dla rozwoju szkoły Który obrazek bardziej kojarzy się z rozwojem szkoły? Wskaźniki wzrostu czy informacja zwrotna? Rozliczanie czy rozwój? Plan prezentacji Ewaluacyjne wskaźniki egzaminacyjne
Dlaczego należy uwzględniać zarówno wynik maturalny jak i wskaźnik EWD?
EWD co to jest? Metoda EWD to zestaw technik statystycznych pozwalających oszacować wkład szkoły w końcowe wyniki egzaminacyjne. Wkład ten nazywamy właśnie edukacyjną wartością dodaną. EWD jest egzaminacyjnym
ANALIZA WYNIKÓW EGZAMINU MATURALNEGO Z MATEMATYKI Z ROKU 2017 W LICEUM OGÓLNOKSZTAŁCĄCYM W STRZELINIE Z ZASTOSOWANIEM KALKULATORA EWD 100
ANALIZA WYNIKÓW EGZAMINU MATURALNEGO Z MATEMATYKI Z ROKU 2017 W LICEUM OGÓLNOKSZTAŁCĄCYM W STRZELINIE Z ZASTOSOWANIEM KALKULATORA EWD 100 OPRACOWANA PRZEZ ZESPÓŁ: BOŻENA BUŁA JOLANTA BURTIN BEATA MALSKA
Raport z ewaluacji wewnętrznej za rok 2017/2018
Szkoła Podstawowa im. red. Jana Ciszewskiego w Waleńczowie ul. Szkolna 19 42-151 Waleńczów tel. 034 318 71 08 e-mail: spwalenczow@vp.pl Raport z ewaluacji wewnętrznej za rok 2017/2018 Przedmiot ewaluacji:
ŚLĄSKIE TECHNICZNE ZAKŁADY NAUKOWE EDUKACYJNA WARTOŚĆ DODANA
ŚLĄSKIE TECHNICZNE ZAKŁADY NAUKOWE EDUKACYJNA WARTOŚĆ DODANA ANALIZA 2014_2016 INTERPRETACJA WYNIKÓW W ŚLĄSKICH TECHNICZNYCH ZAKŁADACH NAUKOWYCH Metoda EWD to zestaw technik statystycznych pozwalających
Problem trafności metody EWD Artur Pokropek
Problem trafności metody EWD Artur Pokropek Wydział Pedagogiczny UW Instytut Socjologii UW Empiryczna analiza trafności Analiza trafności EWD na podstawie badań: Uczestnicy procesu egzaminacyjnego o egzaminie
Analiza efektywności kształcenia w Gimnazjum nr 3 z oddziałami integracyjnym im. Tadeusza Kościuszki w Pabianicach w oparciu o wskaźnik EWD
Analiza efektywności kształcenia w Gimnazjum nr 3 z oddziałami integracyjnym im. Tadeusza Kościuszki w Pabianicach w oparciu o wskaźnik EWD październik 2015 r. 1 Spis treści Spis treści... 2 1. Wstęp...
PROJEKT EWALUACJI PROGRAMU NAUCZANIA. Bożena Belcar
PROJEKT EWALUACJI PROGRAMU NAUCZANIA ETAPY PROCESU EWALUACJI I. Projektowanie II. Prowadzenie badań i gromadzenie danych III. Analiza danych oraz interpretacja wyników badań; wnioski IV. Raport ewaluacyjny
Analiza wyników sprawdzianu 2016
Zespół Szkolno - Przedszkolny w Rudzicy im. Jana Pawła II Analiza wyników sprawdzianu 2016 Opracowała: Magdalena Balcy SPIS TREŚCI 1. Informacje wstępne... 3 2. Wyniki uczniów Zespołu Szkolno Przedszkolnego
Rodzaje testów. Testy. istnieje odpowiedź prawidłowa. autoekspresja brak odpowiedzi prawidłowej ZGADYWANIE TRAFNOŚĆ SAMOOPISU
Rodzaje testów Testy wiedza umiejętności zdolności właściwości poznawcze właściwości afektywne uczucia postawy osobowość emocje wierzenia istnieje odpowiedź prawidłowa autoekspresja brak odpowiedzi prawidłowej
EDUKACYJNA WARTOŚĆ DODANA
EDUKACYJNA WARTOŚĆ DODANA -nowe spojrzenie na wyniki egzaminów zewnętrznych w gimnazjach Jolanta Gołaszewska Na podstawie materiałów opracowanych przez Zespół EWD www.ewd.edu.pl Co to jest metoda edukacyjnej
Wyniki sprawdzianu zewnętrznego klas szóstych uczniów SP10 w latach 2008-2012 na tle miasta, województwa, kraju:
Efekty różnorodnych działań przygotowujących uczniów do sprawdzianu zewnętrznego analiza oferty zajęć wspierających oraz materiałów przygotowywanych przez nauczycieli Dzięki zaangażowaniu nauczycieli,
SPRAWDZIAN I EGZAMINY 2013 W SZKOŁACH ARTYSTYCZNYCH. w w o je w ó dztwie śląskim
SPRAWDZIAN I EGZAMINY 2013 W SZKOŁACH ARTYSTYCZNYCH w w o je w ó dztwie śląskim Jaworzno 2013 Spis treści I. WPROWADZENIE 4 II. SPRAWDZIAN 6 2.1. Wyniki uczniów szkół podstawowych artystycznych dotyczące
WYNIKI SPRAWDZIANU I EGZAMINU GIMNAZJALNEGO w roku 2011 szkół podstawowych i gimnazjów w Turku
WYNIKI SPRAWDZIANU I EGZAMINU GIMNAZJALNEGO w roku 2011 szkół podstawowych i gimnazjów w Turku SPRAWDZIAN W roku 2011 do sprawdzianu przystąpiło 284 uczniów. Podczas sprawdzianu jest oceniany poziom opanowania
Szkoła Podstawowa nr 51 w Gdyni PRZEDMIOTOWY SYSTEM OCENIANIA Z TECHNIKI
Szkoła Podstawowa nr 51 w Gdyni PRZEDMIOTOWY SYSTEM OCENIANIA Z TECHNIKI Uczeń otrzymuje ocenę: celującą gdy: Wymagania edukacyjne - pracuje systematycznie, - wykonuje wszystkie zadania samodzielnie, starannie
Przemysław Majkut Gimnazjum N analiza efektów kształcenia na podstawie wyników egzaminów zewnętrznych
Przemysław Majkut Gimnazjum N analiza efektów kształcenia na podstawie wyników egzaminów zewnętrznych Opis szkoły Opisywane gimnazjum znajduje się w niewielkiej miejscowości, liczącej niewiele ponad tysiąc
EUROPEJSKIE STANDARDY STOSOWANIA TESTÓW W BIZNESIE. Urszula Brzezińska, Dział Merytoryczny, Pracownia Testów Psychologicznych PTP
EUROPEJSKIE STANDARDY STOSOWANIA TESTÓW W BIZNESIE Urszula Brzezińska, Dział Merytoryczny, Pracownia Testów Psychologicznych PTP DLACZEGO STANDARDY STOSOWANIA TESTÓW W BIZNESIE SĄ WAŻNE? Kto może być kompetentnym
Ewaluacja opisowa osiągnięć uczniów szkół ponadgimnazjalnych z matematyki i z języka polskiego
298 XVII Konferencja Diagnostyki Edukacyjnej, Kraków 2011 Elżbieta Ostaficzuk Mazowieckie Samorządowe Centrum Doskonalenia Nauczycieli Alina Komorowska Mazowieckie Samorządowe Centrum Doskonalenia Nauczycieli
edukacyjne jako - wskaźniki efektywności nauczania
Tytuł: Edukacyjna wartość dodana. Porównywalne wyniki edukacyjne jako - wskaźniki efektywności nauczania Jakość oświaty jako efekt zarządzania strategicznego - szkolenie dla przedstawicieli jednostek samorządu
Analiza sprawdzianu 2010 klas szóstych szkoły podstawowej
Zespół Szkolno - Przedszkolny w Rudzicy im. Jana Pawła II Analiza sprawdzianu 2010 klas szóstych szkoły podstawowej Skład zespołu opracowującego raport: mgr Magdalena Balcy mgr Barbara Gawlik mgr Ilona
Metody: sesja plakatowa, ćwiczenia, dyskusja, porównanie w parach, metaplan
Moduł IV Ocenianie dr Anna Sternicka Sesja I Funkcje oceny szkolnej i oceniania (4 godz.) a. wyjaśnienie funkcji oceny szkolnej i celów oceniania b. charakterystyka oceniania wspomagającego i sumującego
Jak statystyka może pomóc w odczytaniu wyników sprawdzianu
16 Jak statystyka może pomóc w odczytaniu wyników sprawdzianu Wyniki pierwszego ważnego egzaminu sprawdzianu w klasie szóstej szkoły podstawowej mogą w niebagatelny sposób wpływać na losy pojedynczych
RAPORT Z EWALUACJI WEWNĘTRZNEJ PRZEPROWADZONEJ W ZESPOLE SZKOLNO PRZEDSZKOLNYM W NOWEJ WSI EŁCKIEJ W ROKU SZKOLNYM 2012/2013
RAPORT Z EWALUACJI WEWNĘTRZNEJ PRZEPROWADZONEJ W ZESPOLE SZKOLNO PRZEDSZKOLNYM W NOWEJ WSI EŁCKIEJ W ROKU SZKOLNYM 2012/2013 Obszar: 1. EFEKTY DZIAŁALNOŚCI DYDAKTYCZNEJ, WYCHOWAWCZEJ I OPIEKUŃCZEJ ORAZ
Analiza, interpretacja i wykorzystanie wyników sprawdzianu w klasie szóstej szkoły podstawowej do podnoszenia jakości pracy szkoły Słupsk, 2015 r.
Analiza, interpretacja i wykorzystanie wyników sprawdzianu w klasie szóstej szkoły podstawowej do podnoszenia jakości pracy szkoły Słupsk, 2015 r. str. 1 Wprowadzenie Na podstawie rozporządzenia Ministra
Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.
Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w
Wykorzystanie wyników egzaminów zewnętrznych w pracy nauczycieli
Wojewódzki Ośrodek Doskonalenia Nauczycieli w Skierniewicach al. Niepodległości 4 96-100 Skierniewice www.wodnskierniewice.eu wodn@skierniewice.com.pl Placówka posiada akredytację ŁKO CERTYFIKAT PN-EN
IV. Moduł: Narzędzia monitorowania podstawy programowej
IV. Moduł: Narzędzia monitorowania podstawy programowej Zasady tworzenia narzędzi monitorowania Punktem wyjścia do prawidłowego przeprowadzenia monitorowania musi być wyraźnie określony cel badania. monitorowanie
RAPORT z diagnozy umiejętności matematycznych
RAPORT z diagnozy umiejętności matematycznych przeprowadzonej w klasach czwartych szkoły podstawowej 1 Analiza statystyczna Wskaźnik Liczba uczniów Liczba punktów Łatwość zestawu Wyjaśnienie Liczba uczniów,
SYSTEM DIAGNOZY I MONITOROWANIA rozwoju kompetencji matematycznej, informatycznej i przedsiębiorczości
SYSTEM DIAGNOZY I MONITOROWANIA rozwoju kompetencji matematycznej, informatycznej i przedsiębiorczości koncepcja i opracowanie: Elżbieta Obal-Dyrek, Monika Szypuła System diagnozy i monitorowania rozwoju
EGZAMIN GIMNAZJALNY 2011 W SZKOŁACH DLA DOROSŁYCH W WOJEWÓDZTWIE ŚLĄSKIM. sesja wiosenna
EGZAMIN GIMNAZJALNY 2011 W SZKOŁACH DLA DOROSŁYCH W WOJEWÓDZTWIE ŚLĄSKIM sesja wiosenna Jaworzno 2011 SPIS TREŚCI 1. WPROWADZENIE... 3 2. OGÓLNE WYNIKI UZYSKANE PRZEZ SŁUCHACZY GIMNAZJÓW DLA DOROSŁYCH
Badania biegłości laboratorium poprzez porównania międzylaboratoryjne
Badania biegłości laboratorium poprzez porównania międzylaboratoryjne Dr inż. Maciej Wojtczak, Politechnika Łódzka Badanie biegłości (ang. Proficienty testing) laboratorium jest to określenie, za pomocą
Analiza EWD dla Publicznego Gimnazjum w Lutyni w roku blok humanistyczny
Analiza EWD dla Publicznego Gimnazjum w Lutyni w roku 2016 - blok humanistyczny EWD wyliczana jest jako miara agregatowa na podstawie wyników egzaminów egzaminacyjnych grup uczniów, a interpretowana jako
PLAN EWALUACJI WEWNĘTRZNEJ
Szkoła Podstawowa im. Antoniego Sewiołka w Czułowie PLAN EWALUACJI WEWNĘTRZNEJ Wymaganie: Uczniowie nabywają wiadomości i umiejętności określone w podstawie programowej Opracował zespół do spraw : Elżbieta
FORMY KONTROLI OSIĄGNIĘĆ UCZNIÓW W ŚWIETLE REFORMY EDUKACJI. Lublin. sprawdziany mają zadania głównie badające wiadomości.
Maria PEDRYC-WRONA Pracownia Metodyki Biologii Instytut Biologii UMCS Lublin FORMY KONTROLI OSIĄGNIĘĆ UCZNIÓW W ŚWIETLE REFORMY EDUKACJI Kontrola osiągnięć.uczniów jest integralną częścią procesu dydaktycznego.
RAPORT ZBIORCZY z diagnozy umiejętności matematycznych
RAPORT ZBIORCZY z diagnozy umiejętności matematycznych przeprowadzonej w klasach szóstych szkół podstawowych Analiza statystyczna Wskaźnik Wartość wskaźnika Wyjaśnienie Liczba uczniów Liczba uczniów, którzy
UNIWERSYTET ŚLĄSKI WYDZIAŁ MATEMATYKI, FIZYKI I CHEMII Studia podyplomowe Analiza Instrumentalna
UNIWERSYTET ŚLĄSKI WYDZIAŁ MATEMATYKI, FIZYKI I CHEMII Studia podyplomowe Analiza Instrumentalna D O K U M E N T Y K I E R U N K O W E G O Z E S P O Ł U Z A P E W N I A N I A J A K O Ś C I K S Z T A Ł
FISZKA KONKURSU PODSTAWOWE INFORMACJE O KONKURSIE
Załącznik do uchwały nr 47 KM PO WER z dnia 10 lutego 2016 r. w sprawie zatwierdzenia szczegółowych kryteriów wyboru projektów dla konkursu dotyczącego Monitorowania losów absolwentów w ramach zmian do
ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH
1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza
WYNIKI OGÓLNOPOLSKIEGO BADANIA UMIEJĘTNOŚCI TRZECIOKLASISTY, SPRAWDZIANU, EGZAMINU GIMNAZJALNEGO I MATURALNEGO W 2013 ROKU UCZNIÓW SZKÓŁ PROWADZONYCH
WYNIKI OGÓLNOPOLSKIEGO BADANIA UMIEJĘTNOŚCI TRZECIOKLASISTY, SPRAWDZIANU, EGZAMINU GIMNAZJALNEGO I MATURALNEGO W 2013 ROKU UCZNIÓW SZKÓŁ PROWADZONYCH PRZEZ GMINĘ MIEJSKĄ MIELEC STATYSTYKA SZKOLNA ROK SZKOLNY
PRZEDMIOTOWY SYSTEM OCENIANIA Z TECHNIKI w klasach IV VI
Publiczna Szkoła Podstawowa im. Stefana Batorego w Brodach PRZEDMIOTOWY SYSTEM OCENIANIA Z TECHNIKI w klasach IV VI Przedmiotowy System Oceniania opracowany został w oparciu o: podstawę programową przedmiotu
Wyniki egzaminu gimnazjalnego rok szk. 2014/2015
Wyniki egzaminu gimnazjalnego rok szk. 2014/2015 W roku 2015 egzamin gimnazjalny odbył się w dniach 21, 22 i 23 kwietnia. Pierwszego dnia uczniowie rozwiązywali test z historii i wiedzy o społeczeństwie
(narzędzie do pomiaru cech zachowania oprac. dr hab. Zbigniew Spendel)
TEST PSYCHOLOGICZNY/ PEDAGOGICZNY (narzędzie do pomiaru cech zachowania oprac. dr hab. Zbigniew Spendel) 1. Jest narzędziem diagnostycznym posługiwanie się nim musi być uzasadnione celem postępowania diagnostycznego
TRUDNE DECYZJE Jak wybrać dobrą szkołę?
TRUDNE DECYZJE Jak wybrać dobrą szkołę? Białystok, 11 marca 2011 r. TRUDNE DECYZJE Jak wybrać dobrą szkołę? System oceniania zewnętrznego CELE OCENIANIA ZEWNĘTRZNEGO: EGZAMIN GIMNAZJALNY diagnozowanie
Aleksandra Jasińska-Maciążek, Ewa Stożek Wykorzystanie kalkulatora EWD 100 w analizie wyników egzaminacyjnych
Aleksandra Jasińska-Maciążek, Ewa Stożek Wykorzystanie kalkulatora EWD 100 w analizie wyników egzaminacyjnych Narzędzia analityczne, wykorzystujące wskaźniki EWD dla gimnazjów Jednoroczne wskaźniki EWD
Oszacowanie i rozkład t
Oszacowanie i rozkład t Marcin Zajenkowski Marcin Zajenkowski () Oszacowanie i rozkład t 1 / 31 Oszacowanie 1 Na podstawie danych z próby szacuje się wiele wartości w populacji, np.: jakie jest poparcie
PRZEDMIOTOWE OCENIANIE Z MATEMATYKI
PRZEDMIOTOWE OCENIANIE Z MATEMATYKI Przedmiotowe ocenianie z matematyki jest zgodne z Rozporządzeniem Ministra Edukacji Narodowej z dnia 10 czerwca 2015r. w sprawach oceniania, klasyfikowania, promowania
Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
Jakość edukacji matematycznej na półmetku kształcenia w szkołach ponadgimnazjalnych
Elżbieta Ostaficzuk Mazowieckie Samorządowe Centrum Doskonalenia Nauczycieli Andrzej Wawrzyniak Honorowy doradca metodyczny m. st. Warszawy Andrzej Werner Doradca metodyczny m. st. Warszawy Jakość edukacji
Opracowanie: Iwona Remik, Małgorzata Budaj, Elżbieta Idziak, Katarzyna Łysiak, Elżbieta Łukomska
Opracowanie: Iwona Remik, Małgorzata Budaj, Elżbieta Idziak, Katarzyna Łysiak, Elżbieta Łukomska I. WSTĘP Spis treści II. KONTRAKT Z UCZNIAMI III. OBSZARY AKTYWNOŚCI UCZNIÓW IV. ANALIZA PODSTAW PROGRAMOWYCH
RAPORT Z EWALUACJI PRAKTYK PEDAGOGICZNYCH REALIZOWANYCH W RAMACH PROJEKTU
RAPORT Z EWALUACJI PRAKTYK PEDAGOGICZNYCH REALIZOWANYCH W RAMACH PROJEKTU PRAKTYKI PEDAGOGICZNE GWARANTEM SKUTECZNEGO KSZTAŁCENIA PRZYSZŁYCH NAUCZYCIELI W ROKU AKADEMICKIM 2013/2014 1. WSTĘP Ewaluacja
Udział punktów możliwych do uzyskania w zależności od kategorii standardów przedstawia tabela.
Wprowadzenie Na podstawie rozporządzenia Ministra Edukacji Narodowej z dnia 30 kwietnia 2007 roku w sprawie warunków i sposobu oceniania, klasyfikowania i promowania uczniów i słuchaczy oraz przeprowadzania
Co nowego na sprawdzianie po szkole podstawowej w 2015 roku
Co nowego na sprawdzianie po szkole podstawowej w 2015 roku fot. Shutterstock / Olesya Feketa 1 Od nowej podstawy programowej do nowej formuły sprawdzianu Rozpoczynający się rok szkolny będzie dla II etapu