A. Nowe pola diagnostyki edukacyjnej. Anna Dubiecka, Henryk Szaleniec, Dorota Węziak
|
|
- Piotr Milewski
- 8 lat temu
- Przeglądów:
Transkrypt
1 A. Nowe pola diagnostyki edukacyjnej Anna Dubiecka, Henryk Szaleniec, Dorota Węziak 1 i 2 Okręgowa Komisja Egzaminacyjna Kraków 3 Instytut Statystyki i Demografii SGH Efekt egzaminatora Wstęp W egzaminach zewnętrznych w Polsce prace uczniowskie oceniane są przez niezależnych zewnętrznych egzaminatorów przy zastosowaniu procedury oceniania kryterialnego. W tym przypadku najistotniejsze znaczenie dla rzetelności egzaminu (w zakresie zależnym od komisji egzaminacyjnych) ma stabilność posługiwania się kryteriami przez egzaminatorów oceniających prace uczniowskie oraz zapobieganie ewentualnym błędom systematycznym. Schemat oceniania, procedura oceniania i egzaminator, jeżeli nie są poddawane ciągłemu monitorowaniu, mogą stanowić istotne źródła potencjalnych błędów obciążających wyniki egzaminu. W latach autorzy przeprowadzili badania mające na celu zarejestrowanie zróżnicowania surowości egzaminatorów sprawdzianu punktujących zadania otwarte w hierarchicznej strukturze koordynacji procesu oceniania. Wyniki tych badań dostarczają informacji, które mogą mieć praktyczne znaczenie dla planowania monitorowania jakości oceniania zadań otwartych. Badania przeprowadzono bezpośrednio przed przystąpieniem egzaminatorów do właściwego oceniania, dzięki czemu można było wykorzystać wstępne wyniki do doskonalenia pracy egzaminatorów. W kolejnych rozdziałach artykułu autorzy przybliżają terminologię związaną z efektem egzaminatora, przedstawiają model zastosowany w badaniach i prezentują wyniki. Przeprowadzone analizy wykazały istnienie zróżnicowania poziomów surowości egzaminatorów zarówno na poziomie indywidualnym, jak i na poziomie zespołu, czy też ośrodka koordynacji oceniania. 98 wydawnictwo_kor_ok.indd :51:21
2 Anna Dubiecka, Henryk Szaleniec, Dorota Węziak, Efekt egzaminatora Potencjalne źródła błędu w ocenianiu prac egzaminacyjnych 99 Akt oceniania oznacza proces, w który zaangażowany jest egzaminator podejmujący decyzję o poziomie lub stopniu, w jakim oceniany demonstruje lub posiada cechę, która jest przedmiotem oceniania. Egzaminator posługuje się schematem oceniania, którego nieodłączną częścią jest skala (określona w modelu oceniania), jako narzędziem do podejmowania decyzji. Egzaminator, posługując się skalą oceniania, przypisuje egzaminowanym pozycje na skali w zależności od poziomu cechy (umiejętności), która jest przedmiotem pomiaru. Popham (1990) podkreśla, że są trzy potencjalne źródła błędów, które powinny być monitorowane podczas oceniania: schemat oceniania, procedura oceniania i oceniający (egzaminator). W jaki sposób schemat oceniania może wprowadzać błąd pomiaru w procesie oceniania? Na przykład pomimo starannego procesu moderowania oceniania nie wszyscy egzaminatorzy w ten sam sposób rozumieją to, co jest przedmiotem oceniania. Taka sytuacja ma miejsce, gdy czynność będąca przedmiotem oceny nie jest jasno określona. Inna sytuacja może dotyczyć niezbyt jasnego zdefiniowania skali dla danego kryterium lub sytuacji, gdy poszczególne stopnie skali zachodzą na siebie i są trudne dla egzaminatorów do rozdzielenia (Szaleniec, 2001). Również wtedy, kiedy granice pomiędzy poszczególnymi kategoriami są nieostre, egzaminatorzy często mają dylemat z zakwalifikowaniem odpowiedzi do poszczególnych kategorii wzdłuż skali określonej w schemacie oceniania. W jaki sposób procedury oceniania mogą wpływać na wprowadzanie błędu? Jest szereg aspektów związanych z procedurami oceniania, które mogą przysparzać problemów oceniającym. Procedura oceniania może wymagać od egzaminatora oceny jednocześnie zbyt wielu czynności (ocenianie eseju, rozprawki, złożonego zadania matematycznego), co powoduje trudność w klarownym pamiętaniu różnic pomiędzy tymi czynnościami i stopniami skali. Jeżeli ocenianie trwa wiele godzin każdego dnia (jak to ma miejsce w koordynowanym ocenianiu w naszym kraju) i przez wiele dni (soboty i niedziele), niektórzy egzaminatorzy mogą czuć się bardziej zmęczeni niż inni. Niektórzy są bardziej sprawni rano, inni po południu, jeszcze inni potrafią być tak samo sprawni przez wiele godzin i wiele dni. W jaki sposób egzaminator może być źródłem błędów w ocenianiu? Egzaminator podczas oceniana zaangażowany jest w bardzo złożony i podatny na błędy proces. Thorndike i Hagen (1977) zwracają uwagę, że proces oceniania przypomina model czarnej skrzynki. Znane jest to, co na wejściu i rezultat. Sam proces zachodzący pomiędzy danymi na wejściu (obserwacja zapisanego efektu pracy ucznia na egzaminie) i rezultatem oceniania (przyznana liczba punktów) jest mało poznawalny. Procesy poznawcze towarzyszące ocenianiu w złożony sposób zależne są zarówno od przeszłych doświadczeń nauczycielskich, od re- wydawnictwo_kor_ok.indd :51:21
3 A. Nowe pola diagnostyki edukacyjnej zultatów szkolenia poprzedzającego ocenianie, jak i od cech osobowościowych danego egzaminatora. Zanim przejdziemy do opisu badań prowadzących do określenia wpływu egzaminatora na wynik Sprawdzianu w szóstej klasie szkoły podstawowej, spróbujemy najpierw zdefiniować pojęcie efektu egzaminatora. Scullen, Mount i Goff (2000) definiują efekt egzaminatora jako szeroką kategorię efektów generujących wariancję wyników oceniania, która nie wynika ze zmienności poziomu ocenianej cechy, lecz jej źródłem są egzaminatorzy. Do najczęściej spotykanych efektów należą: 1. łagodność lub surowość oceniania, 2. efekt halo, 3. tendencja centralna w ocenianiu, 4. tendencja ocen ekstremalnych. W tym artykule zajmiemy się tylko pierwszą kategorią efektów, gdyż była ona przedmiotem badań prowadzonych przez autorów na populacji egzaminatorów oceniających prace Sprawdzianu w OKE Kraków. Guilford definiuje łagodność oceniania jako stałą cechę związaną raczej z osobowością egzaminatora występującą niezależnie od sytuacji egzaminacyjnej. Rezultat oceny łagodnego egzaminatora powoduje, że przeciętny wynik oceniania jest powyżej średniej wartości ocenianej cechy zgodnie z ustalonymi zewnętrznymi kryteriami. O surowości oceniania będziemy natomiast mówić w przypadku, gdy przeciętny wynik oceniania jest poniżej średniej wartości ocenianej zgodnie z ustalonymi zewnętrznymi kryteriami cechy. Można wyróżnić trzy podejścia do badania efektu łagodności i surowości oceniania. 1. Porównanie wyniku danego egzaminatora ze środkiem skali. 2. Analiza wariancji w poszukiwaniu statystycznej różnicy oceniania poszczególnych egzaminatorów. 3. Analiza skośności rozkładu częstości wyniku oceniania danej cechy. W przeprowadzonych badaniach do zmierzenia i porównania surowości egzaminatorów wstępnie autorzy wykorzystywali wszystkie trzy wymienione podejścia. Głównie jednak zastosowano analizę wariancji (hierarchiczny model regresyjny) a ponadto wieloczynnikowe skalowanie Rascha (Many Facet Rasch Model). Wieloczynnikowe skalowanie Rascha wykorzystuje logitową transformację ogólnej sumy punktów tradycyjnie stanowiącej podstawę do przekształcenia oceny w miarę o charakterze interwałowym. Pozwala ono uzyskać wyrażone w tej samej skali oceny zarówno stopnia surowości oceniających, trudności zadań, jak i poziomu wiedzy uczniów (Węziak, 2005; Myford, Wolfe, 2006). 100 wydawnictwo_kor_ok.indd :51:21
4 Anna Dubiecka, Henryk Szaleniec, Dorota Węziak, Efekt egzaminatora Krótkie wprowadzenie do wieloczynnikowego skalowania Rascha Zastosowany model wieloczynnikowego skalowania Rascha wiąże prawdopodobieństwo P poprawnej odpowiedzi udzielanej przez poszczególnych egzaminowanych z czterema zmiennymi takimi jak: wskaźnik poziomu umiejętności egzaminowanego B, wskaźnik trudności zadania D, wskaźnik trudności na progach na skali punktowania zadania F i wskaźnik surowości oceniania R. Opis matematyczny modelu przedstawia funkcja: P ln P nikj ni( k 1) j B n D i R j F k gdzie: P nikj prawdopodobieństwo przyznania przez j-tego egzaminatora k-tej kategorii punktowej za rozwiązanie zadania i przez n-tego egzaminowanego, R j oszacowanie surowości oceniania j-tego egzaminatora, F k oszacowanie k-tego progu, D i oszacowanie trudności i-tego zadania 1, B n oszacowanie poziomu wiedzy n-tego egzaminowanego. Wieloczynnikowe skalowanie Rascha zakłada, że wynik uzyskiwany przez egzaminowanego jest nie tylko funkcją poziomu jego wiedzy (B) i trudności rozwiązywanego zadania (D), ale również sposobu oceniania zadań przez sędziego/egzaminatora (R). Parametry F k w modelu odpowiadają punktom przejścia między k-tą i k+1 kategorią punktową. Kategorie punktowania indeksowane są tylko po k, ponieważ założono, że struktura skali punktowej jest jednakowa dla wszystkich zadań rozwiązywanych przez ucznia. W przypadku sprawdzianu mamy do czynienia z różną długością skali dla poszczególnych zadań. To ostatnie założenie można jednak uchylić, ponieważ dostępne obecnie oprogramowanie pozwala prowadzić analizy także w przypadku zróżnicowanego punktowania zadań. Jednak w tym artykule, w szczególności w jego części teoretycznej, pozostaniemy przy modelu sformułowanym przy założeniu jednakowej punktacji zadań egzaminacyjnych. Prawidłowe zastosowanie skalowania Rascha uzależnione jest od występowania dwóch podstawowych cech badanego testu lub sprawdzianu: 1. jednowymiarowości, która oznacza, że zależności między zadaniami testu są wyjaśniane przez tylko jedną zmienną latentną (np. poziom wiedzy, kompetencje); 2. lokalnej niezależności (local independence), a więc odpowiedź na rozwiązywane zadanie nie jest zależna od odpowiedzi na inne zadania. 1 W skalowaniu Rascha i innych modelach IRT również przyjęła się konwencja charakteryzowania zadania poziomem jego trudności w przeciwieństwie do klasycznej teorii testu, gdzie raczej zadania charakteryzuje się za pomocą stopnia współczynnika łatwości. 101 wydawnictwo_kor_ok.indd :51:21
5 A. Nowe pola diagnostyki edukacyjnej Te dwa podstawowe założenia sprawdzane są za pomocą odpowiednich statystyk dopasowania 2, których konstrukcja opiera się na porównaniu obserwowanych w wyniku badania rezultatów z rezultatami oczekiwanymi wynikającymi z założeń metody 3. Statystyki dopasowania wykorzystywane są również do wykrywania nietypowych układów odpowiedzi. Jak już wcześniej wspomniano, wszystkie mierzone parametry wyrażane są w tej samej skali, a więc są względem siebie porównywalne. Jednostka tej skali nazywana jest logitem 4. Dodatkowo każde oszacowanie otrzymywane jest wraz z odpowiadającym mu standardowym błędem szacunku, co ułatwia pomiar rzetelności narzędzia pomiarowego. Zwyczajowo 0 dla skali ustalane jest w punkcie odpowiadającym średniej trudności zadań w teście, a pozostałe parametry szacowane są względem niego. Pozwala to na umieszczenie na jednej skali metrycznej wszystkich typów oszacowanych parametrów i bezpośrednie ich porównanie. Opis przeprowadzonych badań W każdej sesji egzaminacyjnej przed rozpoczęciem oceniania egzaminatorzy odbywają wstępne szkolenie połączone z oceną przykładowych prac uczniowskich w ramach moderowania oceniania. W celu praktycznego wdrożenia efektów szkolenia oraz na użytek badań przygotowano 15 prac uczniowskich, zróżnicowanych ze względu na poziom rozwiązania zadań. Każdy egzaminator oceniał prace pięciu uczniów. W trakcie badań poszukiwano odpowiedzi na następujące pytania: 1. Jak wielkie jest zróżnicowanie surowości oceniania pomiędzy poszczególnymi egzaminatorami? 2. Czy wynik oceniania zależy od ośrodka koordynacji? 3. Czy wynik oceniania zależy od zespołu, w którym pracuje egzaminator? 4. Czy wynik zależy od treści zadania i jego schematu oceniania? Badania zostały zaplanowane na okres dwóch lat. Populację stanowili egzaminatorzy zatrudnieni do oceniania sprawdzianu w OKE Kraków. Zestaw 15 prac planowanych do oceny został przygotowany poprzez wybór autentycznych rozwiązań uczniowskich. Do rejestracji wyników punktowania przygotowano 2 Odpowiednie wzory Czytelnik znajdzie w artykule J. M. Linacre, What do Infit and Outfit, Mean-square and Standardized mean?, Rasch Measurement Transactions 16:2, Autumn 2002, 3 Założenia te mówią, że: po pierwsze, jest bardziej prawdopodobne, że osoby, które uzyskały wyższą sumę punktów, rozwiążą poprawnie poszczególne zadania niż osoby z niższą sumą punktów; po drugie, jest bardziej prawdopodobne, że zostaną rozwiązane poprawnie zadania łatwiejsze niż zadania trudniejsze. 4 Logit logarytm naturalny szansy. 102 wydawnictwo_kor_ok.indd :51:21
6 Anna Dubiecka, Henryk Szaleniec, Dorota Węziak, Efekt egzaminatora karty odpowiedzi pozwalające identyfikować trzy zmienne: z1 egzaminator, z2 zespół egzaminatorów, z3 ośrodek koordynacji oceniania. Ze względu na to, że tylko ci egzaminatorzy, którzy uzyskali wysoką zgodność punktowania z wynikami sędziów kompetentnych, mogli przystąpić do oceniania prac uczniowskich, zapewniono egzaminatorom samodzielność pracy oraz wysoką motywację. Wstępne wyniki analizy dokonanej podczas szkolenia egzaminatorów zostały natychmiast wykorzystane jako informacja zwrotna kierowana do poszczególnych egzaminatorów przed przystąpieniem do oceniania w danej sesji egzaminacyjnej (odpowiednio 2005 r. i 2006 r.). W dalszej części tekstu skupimy się na rezultatach badań z 2006 roku, w których uczestniczyło 1349 egzaminatorów pracujących w 80 zespołach zorganizowanych w 24 ośrodki koordynacji oceniania. Tabela 1. Opis populacji egzaminatorów uczestniczących w badaniach w 2006 roku w podziale na ośrodki koordynacji Województwo Liczba egzaminatorów Udział (%) Liczba ośrodków koordynacji Liczba zespołów Udział (%) Lubelskie (LO) Małopolskie (MO) Podkarpackie (PO) SUMA Uczniowie, których prace oceniano w ramach eksperymentu, nazwani zostali symbolami A01 A05, B01 B05 oraz C01 C05. W schemacie oceniania 5 zadań otwartych zostało rozbite na 18 odrębnych czynności. Dla każdej czynności zdefiniowano odrębnie kryterium zaliczenia opanowania jej oraz skalę. Dla 16 czynności została przyjęta skala 0-1 a dla dwóch skala 0, 1, 2. Tabela 2. przedstawia wyniki oszacowania trudności poszczególnych czynności wyrażonej w jednostkach logit. 103 wydawnictwo_kor_ok.indd :51:21
7 A. Nowe pola diagnostyki edukacyjnej Tabela 2. Zadania otwarte arkusza standardowego sprawdzianu 2006 i ich punktacja Kod czynności Liczba punktów Trudność w jednostkach logit Z_21_ ,61 Z_21_ ,15 Z_21_ ,33 Z_21_ ,01 Z_21_ ,54 Z_21_ ,66 Z_22_ ,34 Z_23_ ,21 Z_24_ ,1 Z_25_ ,27 Z_25_ ,07 Poziomy trudności poszczególnych czynności wchodzących w skład zadań otwartych arkusza standardowego Sprawdzianu 2006 wykorzystanych w badaniach oszacowano na wynikach 10% prostej próby losowej wylosowanej z krajowej populacji wszystkich uczniów piszących arkusz standardowy (A1). Wykorzystano do tego celu wszystkie zadania składające się na Sprawdzian (czyli na podstawie wyników właściwego egzaminu, a nie badań). Dla uproszczenia i większej czytelności, w dalszej części tekstu wyodrębnione w Sprawdzianie części zadań sprawdzające określone czynności będziemy również nazywać zadaniami. Podczas kalibracji narzucono warunek, aby średnia trudność wszystkich zadań składających się na Sprawdzian, łącznie z zadaniami zamkniętymi, wyniosła 0. W wyniku przyjęcia takiego warunku średnia trudność zadań otwartych, których ocenianie analizowano w badaniach wyniosła 0,255 logita z odchyleniem standardowym 1,036 logita. Wszystkie zadania (z wyjątkiem zadania z_22_1) wykorzystane w badaniach wykazywały akceptowalną zgodność z założeniami metody skalowania (wartości OMS i IMS w granicach <0,7; 1,3>) (T. G. Bond, 2001). Jedynie w przypadku zadania z_22_1 wychwycono zbytnie zróżnicowanie przyznanych za nie punktów. Przyczyny takiej sytuacji należałoby upatrywać w punktacji przewidzianej za to zadanie. Zakładano punktację (i taki warunek narzucono przy estymacji modelu), podczas gdy rozkład punktów w rzeczywistości przyznawanych był raczej rozkładem dwupunktowym (0-2). 104 wydawnictwo_kor_ok.indd :51:22
8 Anna Dubiecka, Henryk Szaleniec, Dorota Węziak, Efekt egzaminatora Skala trudności zadań wykorzystanych w badaniach przedstawiona została na rysunku 1. Zadania uszeregowane zostały według stopnia trudności mierzonego w jednostkach logit. Kolejność zadań w legendzie do rysunku 1. wynika z kolejności wystąpienia zadań na osi trudność łatwość zadania. Im wyżej na osi znajduje się zadanie, tym było ono trudniejsze. Z zadań wykorzystanych w badaniach najtrudniejsze były zadania z_21_5 oraz z_21_6, zaś zdecydowanie najłatwiejsze było zadanie z_25_1. Pod względem łatwości wyróżniały się również zadania: z_25_3, z_25_2, z_25_4, których położenie na osi trudność łatwość zadania jest wyraźnie zbliżone do bieguna dolnego (łatwe). Rysunek 1. Oszacowane trudności zadań otwartych w arkuszu standardowym, Sprawdzianu 2006 Rzetelność wykalibrowanej skali trudność łatwość zadania była bliska 1, co pozwoliło uznać wyniki uczniów oszacowane za pomocą tejże skali za wiarygodne i wysoce rzetelne. Uzasadnia to również wykorzystanie zadań z tego egzaminu do sprawdzenia jakości oceniania Sprawdzianu w sesji 2006 przez zewnętrznych egzaminatorów zatrudnionych przez OKE Kraków. Do następnych analiz przyjęto założenie, że oszacowanie poziomów surowości oceniania 105 wydawnictwo_kor_ok.indd :51:22
9 A. Nowe pola diagnostyki edukacyjnej egzaminatorów mierzone wybranymi zadaniami (otwartymi) w wykalibrowanej skali jest wiarygodne. Dlatego też w procesie kalibracji poziomów surowości egzaminatorów za stałe i znane (takie jak w tabeli 2.) przyjęto poziomy trudności zadań. Przypomnijmy, że szacowany w kolejnym etapie model uwzględniał 3 zmienne: 1 surowość egzaminatorów, 2 poziom umiejętności uczniów, 3 trudność zadań. Przy czym trudności zadań zostały zakotwiczone na wartościach oszacowanych na wynikach 10% próby losowej wszystkich uczniów piszących Sprawdzian, a więc ich wartości nie były estymowane. Jednocześnie narzucono skalę odpowiedzi osobną dla zadań pytań punktowanych 0-1 (wspólną) oraz osobną dla zadań punktowanych 0-1-2, przy czym w tym drugim przypadku osobną dla każdego z dwóch pytań. Analizę prowadzono, stosując program Facets for Windows Version No Ustalenia metodologiczne wobec przyjętego modelu Ponieważ proces oceniania organizowany jest w hierarchicznej strukturze koordynacji obejmującej ośrodki koordynacji, zespoły egzaminatorów i indywidualnych egzaminatorów, zebrane w wyniku badań dane również charakteryzowała hierarchiczna struktura. Egzaminatorzy zgrupowani byli w zespoły, a zespoły podporządkowane były odpowiednim ośrodkom koordynacji. Podczas oceniania przez każdego egzaminatora pięciu tych samych prac uczniowskich egzaminatorzy pracowali samodzielnie bez możliwości konsultowania się. Dlatego też szacując parametry modelu, przyjęto niezależność procesu oceniania egzaminatorów względem siebie w obrębie jednego zespołu. Dopiero po oszacowaniu charakterystyk egzaminatorów (poziomu ich surowości R j ) za pomocą skalowania Rascha porównano wartości wskaźnika poziomu surowości oceniania pomiędzy poszczególnymi zespołami, jak i ośrodkami koordynacji. Dzięki zastosowaniu skalowania Rascha było to możliwe i metodologicznie uprawnione, ponieważ cecha surowość oceniania, choć z natury rzeczy jakościowa i nie bezpośrednio obserwowalna 5, została skwantyfikowana 6. 5 pomiar cech ukrytych (latentnych) dokonywany jest poprzez mierzenie ich wskaźników; w przypadku oszacowania surowości oceniania egzaminatorów takimi wskaźnikami były liczby punktów przyznane przez poszczególnych egzaminatorów za każde oceniane zadanie egzaminacyjne; przyznane oceny w trakcie procedury obliczeniowej skorygowane zostały o poziom trudności poszczególnych zadań (Di) i poziom wiedzy reprezentowany przez poszczególnych uczniów (Bn). 6 cecha surowość oceniania powstała w wyniku skalowania Rascha ma charakter cechy ciągłej, interwałowej, o sztucznie ustalonym punkcie zerowym; miara tej cechy wyrażona jest w jednostkach zwanych logitem. wydawnictwo_kor_ok.indd :51:22
10 Anna Dubiecka, Henryk Szaleniec, Dorota Węziak, Efekt egzaminatora Analizę przeprowadzono, narzucając wartości średnich oszacowań poziomu surowości egzaminatorów równe zero czyli r i = 0. Oszacowania trudności zadań egzaminacyjnych przyjęto za stałe i znane (oszacowane wcześniej). Natomiast oszacowania poziomu umiejętności uczniów pozostawiono bez narzucania żadnych warunków ograniczających. Przedstawione poniżej wyniki uzyskano, wykorzystując do kalibracji obu skal surowość oceniania oraz poziom umiejętności wszystkie ich elementy składowe. Oznacza to, że nie usunięto z analizy uczniów, dla których uzyskane oszacowania nie spełniały któregoś z kryteriów dopasowania. Usuwania z analizy egzaminatorów oceniających w sposób bardzo nietypowy nawet nie rozważano, ponieważ to właśnie te informacje leżały w obrębie głównych zainteresowań autorów badań. Pozostawienie elementów znacząco niedopasowanych jest kwestią dyskusyjną. Jednak zdecydowano się na taki krok ze względu na fakt, że uzyskiwane w wyniku skalowania Rascha wyniki porównać można do zespołu naczyń połączonych usunięcie jednego elementu pociąga za sobą zmianę wartości wszystkich pozostałych i co chyba ważniejsze, również zmianę ich jakości dopasowania, a tym samym dopasowania wszystkich danych do całego szacowanego modelu. Przyjęta ścieżka postępowania nie wyklucza jednak przeprowadzenia analizy w inny sposób. Analiza wyników badań Analiza rozkładów trzech zmiennych występujących w modelu Zestawienie wyników przeprowadzonej analizy w kompleksowy sposób prezentuje rysunek 2. Przedstawiono na nim łącznie wartości wszystkich oszacowanych parametrów modelu. Pierwsza kolumna na rysunku (skala) przedstawia wspólną przedziałową skalę dla szacowanych zmiennych (jednostką jest logit), druga kolumna (uczeń) pokazuje poziom umiejętności uczniów im wyżej na osi znalazł się uczeń, tym wyższe jego umiejętności. Trzecia kolumna (egzaminator) prezentuje rozkład charakterystyk egzaminatorów. Im wyżej ulokował się egzaminator, tym surowiej na tle grupy oceniał. Czwarta kolumna odpowiada poziomowi trudności zadań egzaminacyjnych im wyżej na osi znalazło się zadanie, tym było trudniejsze. Dwie ostatnie kolumny prezentują punktację zastosowaną do oceny zadań ocenianych na skali trójstopniowej. Analizując dane przedstawione na rysunku 2. warto zauważyć stosunkowo niewielkie, w porównaniu do pozostałych rozkładów, zróżnicowanie rozkładu poziomów surowości egzaminatorów. Rozkład ten jest najbardziej zwarty, co jest bardzo pożądanym wynikiem z punktu widzenia oczekiwanych cech egzaminatorów oceniających prace uczniów. Dokładniejsza analiza poziomów surowości przeprowadzona zostanie w rozdziale: Analiza surowości egzaminatorów. Na podstawie analizy rysunku 2. można zauważyć również, że zróżnicowanie rozkładów poziomu umiejętności uczniów, jak i poziomów trudności zadań 107 wydawnictwo_kor_ok.indd :51:22
11 A. Nowe pola diagnostyki edukacyjnej były porównywalne, choć zdecydowanie wśród uczniów wyróżnia się zdający o kodzie A01. Uczeń ten wykonał poprawnie wszystkie zadania z tym, że w zadaniu matematycznym zastosował nietypową metodę obliczania procentów. Możemy przypuszczać, że nauczyciele, którzy nie są matematykami, mogli nie uznawać tej metody za poprawną. Rozkłady trudności zadań i poziomu umiejętności badanych uczniów wyraźnie różnią się od siebie położeniem na skali. Zdecydowanie wyżej na osi skali wykalibrowanej w jednostkach logit znajduje się rozkład poziomów umiejętności uczniów, dla którego wartość średnia wynosi 1,44 logita, podczas gdy średnia trudność zadań otwartych, wykorzystanych w badaniach, wyniosła 1,036 logita. Posługując się wartościami przeciętnymi, możemy uznać, że dla omawianej grupy 15 uczniów zestaw pytań był stosunkowo łatwy, biorąc jako punkt odniesienia ich przeciętny poziom umiejętności. Rysunek 2. Rezultaty szacowania poziomu umiejętności uczniów, surowości egzaminatorów i trudności zadań 108 wydawnictwo_kor_ok.indd :51:22
12 Anna Dubiecka, Henryk Szaleniec, Dorota Węziak, Efekt egzaminatora Analiza surowości egzaminatorów Głównym celem badań było sprawdzenie zróżnicowania surowości punktowania zadań otwartych przez egzaminatorów usytuowanych w hierarchicznej strukturze moderowania procesu oceniania. Ze względu na dużą liczbę egzaminatorów biorących udział w badaniach przedstawione zostaną jedynie zbiorcze wyniki oszacowań ich surowości (tabela 3.). Tabela 3. Zbiorcze statystyki oszacowań surowości egzaminatorów Średnia (w jednostkach logit) -0,0013 Odchylenie standardowe 0,1168 Współczynnik asymetrii 1,244 Wartość minimalna -0,4 Wartość maksymalna 0,74 Typowy obszar zmienności 1 <-0,1181; 0,1155> Obszar obserwacji nietypowych (1) 2 <-0,4; -0,2349) oraz (0,2323; 0,74> Obszar obserwacji nietypowych (2) 3 <-0,4; -0,35170,3526) oraz (0,3491; 0,74> Odsetek obserwacji w obszarze nietypowym (1) Odsetek obserwacji w obszarze nietypowym (2) 1,3% (17 egzaminatorów) oraz 4,3% (58 egzaminatorów) 0,1% (2 egzaminatorów) oraz 1,6% (22 egzaminatorów) Przeciętny poziom surowości egzaminatorów wyniósł -0,0013, co jest wynikiem narzucenia przy estymacji modelu warunku o średnim poziomie surowości równym 0. Oszacowane poziomy surowości mieszczą się w granicach od -0,4 logita do 0,74 logita, a więc zróżnicowanie poziomów surowości mierzone rozstępem wyniosło 1,14 logita, co jest wynikiem dobrym. Maksymalne odchylenie poziomu surowości od średniego poziomu surowości zaobserwowane zostało tylko u dwóch egzaminatorów (0,71 do 0,74 logita). Ci dwaj egzaminatorzy oceniali wybrane 5 zadań najsurowiej spośród wszystkich badanych. Najłagodniejsi egzaminatorzy zaleźli się w przedziale od -0,40 do 0,31 logita. Warto zauważyć, że poziom surowości dla 75 (5,6%) egzaminatorów zatrudnionych przez OKE Kraków do oceny sprawdzianu w wiosennej sesji egzaminacyjnej 2006 różnił się więcej niż dwa odchylenia standardowe od średniej, zaś dla 1,7% (24) egzaminatorów o więcej niż trzy odchylenia standardowe. Wśród nietypowych zachowań przeważały odchylenia powyżej średniej, co oznacza, że nietypowe zachowania egzaminatorów występowały raczej w kierunku zbytniej surowości niż łagodności. Natomiast rozkład poziomów surowości wszystkich egzaminatorów charakteryzowała dosyć silna asymetria prawostronna Oznacza to, że wśród egzaminatorów dominowali ci, którzy oceniali łagodniej niż egzaminator o przeciętnej surowości. 109 wydawnictwo_kor_ok.indd :51:22
13 A. Nowe pola diagnostyki edukacyjnej Rysunek 3. Rozkład poziomu surowości egzaminatorów Aby dokładniej przyjrzeć się poziomom surowości egzaminatorów, dokonano porównań przeciętnych poziomów między poszczególnymi zespołami oraz ośrodkami koordynacji oceniania. Średni poziom surowości oceniania dla całego zespołu prawdopodobnie ma związek z cechami osobowościowymi przewodniczącego i ze sposobem koordynacji oceniania w jego zespole. Taka hipoteza wymaga jednak weryfikacji w dalszych badaniach. Rysunek 4. Średnie poziomy surowości zespołów egzaminatorów Pewne światło na to zagadnienie może rzucić analiza rozstępu zmienności surowości w poszczególnych zespołach. 110 wydawnictwo_kor_ok.indd :51:23
14 Anna Dubiecka, Henryk Szaleniec, Dorota Węziak, Efekt egzaminatora Rysunek 5. Rozstęp poziomu surowości egzaminatorów w poszczególnych zespołach Jak można zauważyć, analizując rysunek 5., w niektórych zespołach rozstęp surowości egzaminatorów jest stosunkowo mały. Takie zjawisko częściej zostało zaobserwowane w zespołach o niskiej średniej surowości zespołu egzaminatorów. W przypadku jednego zespołu okazało się, że żaden z jego członków nie charakteryzował się surowością o dodatnim oszacowaniu, co więcej, poziom surowości dla każdego z nich był poniżej średniej, co oznacza, że wszyscy egzaminatorzy z tego zespołu charakteryzowali się mniejszą niż przeciętna surowością (większą łagodnością). I jeszcze na koniec rzut oka na zróżnicowanie surowości oceniania pomiędzy ośrodkami koordynacji. Rysunek 6. Zróżnicowanie średniej surowości egzaminatorów pomiędzy ośrodkami koordynacji oceniania 111 wydawnictwo_kor_ok.indd :51:23
15 A. Nowe pola diagnostyki edukacyjnej Wyniki analizy regresji W celu zbadania, w jakim stopniu poziomy surowości egzaminatorów wynikają z przynależności poszczególnych egzaminatorów do zespołów i ośrodków koordynacji, oszacowany został model regresji hierarchicznej, w którym zmienną objaśnianą była surowość egzaminatora. Oszacowany model uwzględniał jedynie efekt stały i nie zawierał żadnej zmiennej objaśniającej. Tabela 4. Podział wariancji wskaźnika surowości oceniania na indywidualną i wynikającą z przynależności do ośrodka koordynacji oceniania i do zespołu egzaminatorów Efekt stały Współczynnik Błąd standardowy Krytyczny poziom istotności γ 00 wyraz wolny Efekt losowy Wariancja na poziomie indywidualnym Wariancja Błąd standardowy Krytyczny poziom istotności Wariancja na poziomie grupowym ośrodek Wariancja na poziomie grupowym zespół w ramach ośrodka Przeprowadzone analizy wykazały istnienie zróżnicowania poziomów surowości egzaminatorów zarówno na poziomie zespołu, jak i na poziomie ośrodka, co sugeruje istnienie trójstopniowej hierarchii w danych. Wyniki prezentuje tabela 4. Przedstawione w niej wariancje pokazują wielkość zróżnicowania surowości egzaminatorów między sobą (wariancja na poziomie indywidualnym), między zespołami w obrębie ośrodków (wariancja poziomie drugim), między ośrodkami (wariancja na poziomie trzecim). Okazało się, że 88,99% zróżnicowania wynika z różnic indywidualnych między samymi egzaminatorami, 3,68% z przynależności do zespołu podlegającego odpowiedniemu ośrodkowi koordynacji, zaś 7,15% z podlegania ośrodkowi koordynacji. Wartość wyrazu wolnego w tabeli 4. odpowiada przeciętnej wartości poziomu surowości egzaminatorów. Wartość ta różni się nieznacznie od średniej surowości policzonej bez uwzględniania hierarchicznej struktury danych (-0,0014). Różnica jest mała, bo zróżnicowanie na poziomach zespołów i ośrod- wydawnictwo_kor_ok.indd :51:23
16 Anna Dubiecka, Henryk Szaleniec, Dorota Węziak, Efekt egzaminatora ków jest niewielkie, nie ma zatem w tym przypadku większego znaczenia, w jaki sposób obliczana jest wartość przeciętna. Podkreślić trzeba jednak, że gdyby wartość współczynnika korelacji międzygrupowej była wyższa, wtedy bardziej wiarygodnym miernikiem tendencji centralnej byłaby średnia liczona z uwzględnieniem struktury hierarchicznej. Przeprowadzone analizy pokazały, że choć egzaminatorzy nie różnili się mocno między sobą poziomami surowości w wartościach bezwzględnych, to jednak niepokojący pozostaje fakt, wykrycia wpływu przynależności do odpowiedniego zespołu i odpowiedniego ośrodka koordynacji na poziom surowości oceniania. Choć wpływ ten był niewielki, to jednak okazał się statystycznie istotny. Istnieje możliwość wyjaśnienia źródeł zróżnicowania w poziomach surowości egzaminatorów, w tym celu jednak konieczne byłoby uwzględnienie dodatkowych informacji deskryptywnych o egzaminatorach, zespołach egzaminatorów, jak i ośrodkach koordynacji a także wszelkich innych podmiotach, co do których istnieje podejrzenie, że mogły mieć wpływ na zróżnicowanie poziomu surowości oceniania. Podsumowanie Przeprowadzona analiza wyników badań pokazała, że choć występują różnice między poziomami surowości egzaminatorów, to całkowita rozpiętość poziomów surowości wyniosła tylko 1,14 logita. Dodać trzeba, że 98,3% badanych egzaminatorów charakteryzowało się poziomem surowości w granicach dwóch odchyleń standardowych od średniej, a więc takich, których nie uznaje się za nietypowe. Chociaż zróżnicowanie poziomów surowości było niezbyt duże, to przeważali w badanej grupie egzaminatorzy oceniający łagodniej niż egzaminator przeciętny. Np. uczeń, którego praca została zakodowana C05 powinien uzyskać wynik 11 punktów. Taki wynik przyznało tej pracy 65 procent z 431 egzaminatorów. 13 procent egzaminatorów przyznało o 1 punkt mniej i 12 procent o jeden punkt więcej. O trzy punkty mniej oceniło tę pracę tylko 2 egzaminatorów, czyli 0,5 procent. W tym zespole zarejestrowano jednocześnie15 najłagodniejszych egzaminatorów (3,5 procent), którzy za tę pracę przyznali co najmniej 3 punkty więcej, niż powinien ten uczeń uzyskać. W badaniach sprawdzono również, czy egzaminatorzy nie byli stronniczy w procesie oceniania. Rozumowanie przeprowadzono dwukierunkowo, sprawdzając stronniczość w stosunku do uczniów, jak i do zadań. Okazało się, że najczęściej ze stronniczym (obciążonym) sposobem oceny spotkał się uczeń A01, który w zadaniu 21. w nietypowy sposób obliczał procenty. W przypadku zadań były to: z_21_5 wymagające obliczenia, jaki procent powierzchni działki przeznaczono na pasiekę, z_21_6 obliczenie powierzchni pasieki oraz z_25_2 polegające na wyjaśnieniu, dlaczego wybrana do opisu przez ucznia osoba zasługuje na szacunek. 113 wydawnictwo_kor_ok.indd :51:24
17 A. Nowe pola diagnostyki edukacyjnej Optymistyczny jest jednak fakt, że nie wykryto żadnych regularności w interakcjach egzaminator-zadanie. Oznacza to, że jeśli nawet któryś egzaminator bywał stronniczy, nie dotyczyło to żadnych wybranych zadań ani żadnych wybranych uczniów. Jakie znaczenie mogą mieć przeprowadzone badania dla doskonalenia egzaminów zewnętrznych w Polsce? W kontekście otrzymanych wyników warto przemyśleć koordynację oceniania w skali kraju. W badaniach uczestniczyli egzaminatorzy Sprawdzianu, którym poświęcono szczególnie wiele troski w przygotowaniu ich do porównywalnego oceniania. Powstaje pytanie, jak ten problem wygląda na poziomie maturalnym i egzaminów potwierdzających kwalifikacje zawodowe? Z obserwacji poczynionych podczas wglądów maturzystów do swoich prac wynika podejrzenie, że na poziomie maturalnym, w niektórych przedmiotach zróżnicowanie surowości oceniania pomiędzy zespołami może być znacznie większe. Aby zminimalizować efekt surowości/łagodności egzaminatora warto już dziś podjąć kilka działań, które można podzielić na 3 kategorie: szkoleniowe, organizacyjne i statystyczne. 1. Szkolenie egzaminatorów, aby byli świadomi występowania efektu surowości/ łagodności oceniania i umieli przeciwdziałać tej tendencji. Przy tej okazji warto przedstawić, z jakimi konsekwencjami dla egzaminowanych wiąże się brak kontroli tego efektu. 2. Zwrócenie uwagi na klarowne zdefiniowanie poszczególnych umiejętności, których opanowanie badano podczas egzaminu. Jeżeli to jest możliwe, powinniśmy dostarczyć jak najwięcej przykładów prac uczniowskich, które pozwoliłyby na uświadomienie, jakiemu poziomowi umiejętności odpowiadają poszczególne stopnie stosowanej skali. 3. Zgromadzenie do szkoleń przykładów prac egzaminacyjnych, które mogą egzemplifikować poszczególne stopnie skali wykorzystywanej w ocenianiu każdego zadania. 4. Skompletowanie zespołów nauczycieli oceniających w ten sposób, aby surowym egzaminatorom towarzyszyli raczej łagodniejsi weryfikatorzy i na odwrót. 5. Monitorowanie efektu egzaminatora w poszczególnych sesjach egzaminacyjnych. 6. Wykorzystanie metod statystycznych do korekty oceniania skrajnie surowych i skrajnie łagodnych egzaminatorów. 114 wydawnictwo_kor_ok.indd :51:24
18 Anna Dubiecka, Henryk Szaleniec, Dorota Węziak, Efekt egzaminatora Bibliografia: 1. Guilford J. P., Psychometric methods, New York, McGraw, Linacre J. M., Many Facet Rasch Measurement, Mesa Press, Chicago Myford C. M., Wolfe W. W., Detecting and Measuring Rater Efects Using Many-Facet Rasch Measurement in, Journal of Applied Measurement, Constructing Variables Volume 5, nr 2, Noizet G., Caverni J. P., Psychologiczne aspekty oceniania osiągnięć szkolnych., PWN, Warszawa Popham W. J., Modern Educational Measurement. W, A practitioner s perspective. Englewood Cliffs, New York, Prentice Hall Scullen S. E., Mount M. K., Goff M., Understanding the latent structure of job performance ratings. Journal of Applied Psychology, 85, Szaleniec H., Zastosowanie teorii analizy zadania testowego (IRT) w procesie oceniania zewnętrznego, [w:] Niemierko B., Szmigel M. K. [red]. Teoria i praktyka oceniania zewnętrznego. IV ogólnopolska konferencja z cyklu Diagnostyka Edukacyjna. Pandit, Kraków Trevor G., Bond, Christie M. Fox., Applaying The Rasch Model, Fundamental Measurement in Human Sciences. Lawrence Erlbaum Associates, Publischer, London Thorndike R. L. Hagen E. P., Measurement and evaluation in psychology and education, John Wiley and Sons, New York Węziak D., Zastosowanie wieloczynnikowego skalowania Rascha do porównania sposobu oceniania egzaminatorów, [w:] Niemierko B., Szyling G. [red]. Holistyczne i analityczne metody diagnostyki edukacyjnej. Perspektywy informatyczne egzaminów szkolnych. XI krajowa konferencja z cyklu Diagnostyka Edukacyjna. Fundacja Rozwoju Uniwersytetu Gdańskiego, Gdańsk Objaśnienia: 1. Typowy obszar zmienności zdefiniowano jako obszar zawierający wyniki odchylające się od średniej o nie więcej niż jedno odchylenie standardowe. 2. Obszar obserwacji nietypowych (1) zdefiniowano jako obszar zawierający wyniki odchylające się od średniej o więcej niż dwa odchylenia standardowe. 3. Obszar obserwacji nietypowych (2) zdefiniowano jako obszar zawierający wyniki odchylające się od średniej o więcej niż trzy odchylenia standardowe. 115 wydawnictwo_kor_ok.indd :51:24
CZY UCZNIOWIE POWINNI OBAWIAĆ SIĘ NOWEGO SPOSOBU OCENIANIA PRAC EGZAMINACYJNYCH?
Aktualne problemy dydaktyki przedmiotów przyrodniczych CZY UCZNIOWIE POWINNI OBAWIAĆ SIĘ NOWEGO SPOSOBU OCENIANIA PRAC EGZAMINACYJNYCH? Marta Jaksender, Robert Zakrzewski*, Anna Wypych-Stasiewicz Uniwersytet
ANALIZA JAKOŚCIOWA I ILOŚCIOWA TESTÓW SZKOLNYCH MATERIAŁ SZKOLENIOWY
ANALIZA JAKOŚCIOWA I ILOŚCIOWA TESTÓW SZKOLNYCH MATERIAŁ SZKOLENIOWY Instrukcja przeprowadzania analiz badań edukacyjnych i sporządzania raportów po badaniach. Cele prowadzenia analiz jakościowych i ilościowych
Porównanie dwóch rozkładów normalnych
Porównanie dwóch rozkładów normalnych Założenia: 1. X 1 N(µ 1, σ 2 1), X 2 N(µ 2, σ 2 2) 2. X 1, X 2 są niezależne Ocena µ 1 µ 2 oraz σ 2 1/σ 2 2. Próby: X 11,..., X 1n1 ; X 21,..., X 2n2 X 1, varx 1,
Kontekstowe wskaźniki efektywności nauczania - warsztaty
Kontekstowe wskaźniki efektywności nauczania - warsztaty Przygotowała: Aleksandra Jasińska (a.jasinska@ibe.edu.pl) wykorzystując materiały Zespołu EWD Czy dobrze uczymy? Metody oceny efektywności nauczania
E-ocenianie jako innowacja technologiczna i jakościowa w systemie egzaminów zewnętrznych
XXI Konferencja Diagnostyki Edukacyjnej, Bydgoszcz 2015 Dorota Jurdzińska Okręgowa Komisja Egzaminacyjna we Wrocławiu Elżbieta Modrzewska Okręgowa Komisja Egzaminacyjna w Jaworznie E-ocenianie jako innowacja
Skąd te garby? Czyli o tym, co może być powodem nienormalności rozkładu wyników sprawdzianu dla szóstoklasistów z kwietnia 2006 roku
Anna Dubiecka, Skąd te garby? Anna Dubiecka Okręgowa Komisja Egzaminacyjna w Krakowie Skąd te garby? Czyli o tym, co może być powodem nienormalności rozkładu wyników sprawdzianu dla szóstoklasistów z kwietnia
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2012
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2012 OPRACOWAŁY: ANNA ANWAJLER MARZENA KACZOR DOROTA LIS 1 WSTĘP W analizie wykorzystywany będzie model szacowania EWD.
RAPORT ZBIORCZY z diagnozy umiejętności matematycznych
RAPORT ZBIORCZY z diagnozy umiejętności matematycznych przeprowadzonej w klasach szóstych szkół podstawowych Analiza statystyczna Wskaźnik Wartość wskaźnika Wyjaśnienie Liczba uczniów Liczba uczniów, którzy
Porównywanie populacji
3 Porównywanie populacji 2 Porównywanie populacji Tendencja centralna Jednostki (w grupie) według pewnej zmiennej porównuje się w ten sposób, że dokonuje się komparacji ich wartości, osiągniętych w tej
Zadania rozrywające w testach
Ewa Stożek Okręgowa Komisja Egzaminacyjna w Łodzi Zadania rozrywające w testach Na podstawie analizy danych empirycznych ze sprawdzianu i roku wyodrębniono zadania odpowiedzialne za dwumodalność rozkładu
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Czy egzamin gimnazjalny jest dobrym prognostykiem sukcesu na maturze z fizyki i astronomii?
Krystyna Feith, Czy egzamin gimnazjalny jest dobrym prognostykiem... Krystyna Feith Okręgowa Komisja Egzaminacyjna w Łodzi Czy egzamin gimnazjalny jest dobrym prognostykiem sukcesu na maturze z fizyki
Henryk SZALENIEC, WEWNĄTRZSZKOLNE I ZEWNĘTRZSZKOLNE. podkarpackim i lubelskim rozszerzyła ofertę egzaminacyjną w stosunku do wersji
Maria Krystyna SZMIGEL, Henryk SZALENIEC, Wiesław SROKOSZ Okręgowa Komisja Egzaminacyjna Kraków WEWNĄTRZSZKOLNE I ZEWNĘTRZSZKOLNE ZASTOSOWANIE SCHEMATU OCENIANIA NA PRZYKŁADZIE EGZAMINU MATURALNEGO Z GEOGRAFII
Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:
Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2013
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2013 OPRACOWAŁY: ANNA ANWAJLER MARZENA KACZOR DOROTA LIS 1 WSTĘP W analizie wykorzystywany będzie model szacowania EWD.
Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.
Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w
Statystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje
5. WNIOSKOWANIE PSYCHOMETRYCZNE
5. WNIOSKOWANIE PSYCHOMETRYCZNE Model klasyczny Gulliksena Wynik otrzymany i prawdziwy Błąd pomiaru Rzetelność pomiaru testem Standardowy błąd pomiaru Błąd estymacji wyniku prawdziwego Teoria Odpowiadania
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Informacja o wynikach sprawdzianu w 2011 roku
Wydział Badań i Analiz OKE w Krakowie Informacja o wynikach sprawdzianu w 2011 roku 5 kwietnia 2011 roku po raz dziesiąty uczniowie w całym kraju pisali sprawdzian w szóstej klasie szkoły podstawowej.
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych
Wprowadzenie do analizy korelacji i regresji
Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących
W jakim stopniu uczniowie opanowali umiejętność Wykorzystywania wiedzy w praktyce? Analiza zadań otwartych z arkusza Sprawdzian 2012
Jerzy Matwijko Okręgowa Komisja Egzaminacyjna w Krakowie W jakim stopniu uczniowie opanowali umiejętność Wykorzystywania wiedzy w praktyce? Analiza zadań otwartych z arkusza Sprawdzian 2012 W Pracowni
Analiza skal punktowania zadań matura z matematyki 2007
Badania międzynarodowe i wzory zagraniczne w diagnostyce edukacyjnej dr Dorota Węziak-Białowolska Szkoła Główna Handlowa w Warszawie Analiza skal punktowania zadań matura z matematyki 2007 Wprowadzenie
OKRĘGOWA KOMISJA EGZAMINACYJNA W GDAŃSKU WYDZIAŁ BADAŃ I ANALIZ STOPNIEŃ OPANOWANIA UMIEJĘTNOŚCI BADANYCH NA SPRAWDZIANIE W 2005 ROKU
STOPNIEŃ OPANOWANIA UMIEJĘTNOŚCI BADANYCH NA SPRAWDZIANIE W 2005 ROKU W kwietniu 2005 roku Okręgowa Komisja Egzaminacyjna w Gdańsku po raz czwarty przeprowadziła dla uczniów klasy szóstej szkół podstawowych
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
RAPORT z diagnozy umiejętności matematycznych
RAPORT z diagnozy umiejętności matematycznych przeprowadzonej w klasach pierwszych szkół ponadgimnazjalnych 1 Analiza statystyczna Wskaźnik Liczba uczniów Liczba punktów Łatwość zestawu Wyjaśnienie Liczba
166 Wstęp do statystyki matematycznej
166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej
Zadania ze statystyki, cz.6
Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z
Wersje arkuszy egzaminacyjnych a niesamodzielność pracy uczniów
XIII Konferencja Diagnostyki Edukacyjnej Uczenie się i egzamin w oczach uczniów. Łomża, 5-7.10.2007 Jakub Lis i Piotr Świędrych Okręgowa Komisja Egzaminacyjna we Wrocławiu Wersje arkuszy egzaminacyjnych
Ewaluacja sprawdzianu 2009 klas szóstych szkoły podstawowej na podstawie sprawozdania sporządzonego przez OKE w Jaworznie
Zespół Szkolno - Przedszkolny w Rudzicy im. Jana Pawła II Ewaluacja sprawdzianu 2009 klas szóstych szkoły podstawowej na podstawie sprawozdania sporządzonego przez OKE w Jaworznie Rudzica 2009 SPIS TREŚCI
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)
Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej) 1 Podział ze względu na zakres danych użytych do wyznaczenia miary Miary opisujące
RAPORT ZBIORCZY z diagnozy Matematyka PP
RAPORT ZBIORCZY z diagnozy Matematyka PP przeprowadzonej w klasach drugich szkół ponadgimnazjalnych Analiza statystyczna Wskaźnik Wartość wskaźnika Wyjaśnienie Liczba uczniów Liczba uczniów, którzy przystąpili
STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE
STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss
5 marca 2015 r. Uzasadnienie
Uzasadnienie 5 marca 2015 r. Rozporządzenie Ministra Edukacji Narodowej z dnia 22 marca 2012 r. w sprawie warunków wynagradzania egzaminatorów za udział w przeprowadzaniu sprawdzianu i egzaminów oraz nauczycieli
Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25
Testowanie hipotez Marcin Zajenkowski Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Aby porównać ze sobą dwie statystyki z próby stosuje się testy istotności. Mówią one o tym czy uzyskane
ZADANIA ROZRYWAJĄCE W TESTACH. 1. Co to jest zadanie rozrywające?
Ewa Stożek OKE Łódź ZADANIA ROZRYWAJĄCE W TESTACH Na podstawie analizy danych empirycznych ze sprawdzianu i roku wyodrębniono zadania odpowiedzialne za dwumodalność rozkładu wyników tych testów. Takie
RAPORT z diagnozy umiejętności matematycznych
RAPORT z diagnozy umiejętności matematycznych przeprowadzonej w klasach czwartych szkoły podstawowej 1 Analiza statystyczna Wskaźnik Liczba uczniów Liczba punktów Łatwość zestawu Wyjaśnienie Liczba uczniów,
Zadania ze statystyki cz.8. Zadanie 1.
Zadania ze statystyki cz.8. Zadanie 1. Wykonano pewien eksperyment skuteczności działania pewnej reklamy na zmianę postawy. Wylosowano 10 osobową próbę studentów, których poproszono o ocenę pewnego produktu,
Analiza sprawdzianu 2010 klas szóstych szkoły podstawowej
Zespół Szkolno - Przedszkolny w Rudzicy im. Jana Pawła II Analiza sprawdzianu 2010 klas szóstych szkoły podstawowej Skład zespołu opracowującego raport: mgr Magdalena Balcy mgr Barbara Gawlik mgr Ilona
Zróżnicowanie łagodności egzaminatorów między okręgowymi komisjami egzaminacyjnymi
Filip Kulon Mateusz Żółtak Instytut Badań Edukacyjnych Wstęp XX Konferencja Diagnostyki Edukacyjnej, Gdańsk 2014 Zróżnicowanie łagodności egzaminatorów między okręgowymi komisjami egzaminacyjnymi Łagodność
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
Porównywalne między latami wyniki egzaminacyjne
Porównywalne między latami wyniki egzaminacyjne ZESPÓŁ ANALIZ OSIĄGNIĘĆ UCZNIÓW Instytut Badań Edukacyjnych Henryk Szaleniec, Bartosz Kondratek Plan prezentacji 1.Po co nam zrównywanie wyników pomiędzy
SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.
SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:
Analiza sprawdzianu 2011 klas szóstych szkoły podstawowej
Zespół Szkolno - Przedszkolny w Rudzicy im. Jana Pawła II Analiza sprawdzianu 2011 klas szóstych szkoły podstawowej Opracowała: mgr Magdalena Balcy SPIS TREŚCI 1. Informacje wstępne... 3 2. Charakterystyka
Trafność egzaminów w kontekście metody EWD
Trafność egzaminów w kontekście metody EWD Aleksandra Jasińska (a.jasinska@ibe.edu.pl) Tomasz Żółtak (t.zoltak@ibe.edu.pl) Instytut Badań Edukacyjnych ul. Górczewska 8 01-180 Warszawa JESIENNA SZKOŁA EWD
Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0
Nazwa przedmiotu: Kierunek: Matematyka - Statystyka matematyczna Mathematical statistics Inżynieria materiałowa Materials Engineering Rodzaj przedmiotu: Poziom studiów: forma studiów: obowiązkowy studia
Zróżnicowanie wyników egzaminu maturalnego z geografii na poziomie podstawowym w latach
dr Mariola Tracz Akademia Pedagogiczna w Krakowie Uczenie się i egzamin w oczach nauczyciela Zróżnicowanie wyników egzaminu maturalnego z geografii na poziomie podstawowym w latach 2005-2008 Wprowadzenie
Statystyka i Analiza Danych
Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania analizy wariancji w opracowywaniu wyników badań empirycznych Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki -
edukacyjne jako - wskaźniki efektywności nauczania
Tytuł: Edukacyjna wartość dodana. Porównywalne wyniki edukacyjne jako - wskaźniki efektywności nauczania Jakość oświaty jako efekt zarządzania strategicznego - szkolenie dla przedstawicieli jednostek samorządu
EDUKACYJNA WARTOŚĆ DODANA
ŚLĄSKIE TECHNICZNE ZAKŁADY NAUKOWE EDUKACYJNA WARTOŚĆ DODANA ANALIZA 1. INFORMACJE OGÓLNE. Wskaźnik EWD i wyniki egzaminacyjne rozpatrywane są wspólnie. W ten sposób dają nam one pełniejszy obraz pracy
1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:
Wariancja z populacji: Podstawowe miary rozproszenia: 1 1 s x x x x k 2 2 k 2 2 i i n i1 n i1 Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel: 1 k 2 s xi x n 1 i1 2 Przykład 38,
Informacja o wynikach egzaminu maturalnego 2007 zdających w województwach: lubelskim, małopolskim i podkarpackim
OKRĘGOWA KOMISJA EGZAMINACYJNA W KRAKOWIE WYDZIAŁ BADAŃ I ANALIZ Fot. Anna Rappe Informacja o wynikach egzaminu maturalnego 2007 zdających w województwach: lubelskim, małopolskim i podkarpackim Kraków,
Raport dla szkoły Z BADANIA PODŁUŻNEGO W SZKOŁACH PODSTAWOWYCH. Efektywność nauczania na I etapie edukacyjnym
ͳ Raport dla szkoły Z BADANIA PODŁUŻNEGO W SZKOŁACH PODSTAWOWYCH Efektywność nauczania na I etapie edukacyjnym Dane szkoły Nr identyfikacyjny: Nazwa szkoły: Miejscowość: Adres: Instytut Badań Edukacyjnych
Wykorzystanie wyników egzaminów zewnętrznych w pracy nauczycieli
Wojewódzki Ośrodek Doskonalenia Nauczycieli w Skierniewicach al. Niepodległości 4 96-100 Skierniewice www.wodnskierniewice.eu wodn@skierniewice.com.pl Placówka posiada akredytację ŁKO CERTYFIKAT PN-EN
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki
Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...
Analiza wyników egzaminu maturalnego z matematyki na poziomowe podstawowym
Analiza wyników egzaminu maturalnego z matematyki na poziomowe podstawowym Do egzaminu maturalnego w II Liceum Ogólnokształcącego im. Mikołaja Kopernika w Cieszynie z matematyki na poziomie podstawowym
Porównywalne między latami wyniki egzaminacyjne
Porównywalne między latami wyniki egzaminacyjne ZESPÓŁ ANALIZ OSIĄGNIĘĆ UCZNIÓW Instytut Badań Edukacyjnych Plan prezentacji 1. Zrównywanie wyników egzaminacyjnych w innych krajach 2. Po co nam zrównywanie
WYNIKI EGZAMINOWANIA ZEWNĘTRZNEGO W ROKU SZK. 2010/2011
WYNIKI EGZAMINOWANIA ZEWNĘTRZNEGO W ROKU SZK. 2010/2011 Do egzaminów zewnętrznych w minionym roku szkolnym przystąpiło : 13 uczniów kończących klasę 6 szkoły podstawowej 17 absolwentów gimnazjum 9 absolwentów
EGZAMIN GIMNAZJALNY 2012 W SZKOŁACH DLA DOROSŁYCH W WOJEWÓDZTWIE ŚLĄSKIM. sesja wiosenna
EGZAMIN GIMNAZJALNY 2012 W SZKOŁACH DLA DOROSŁYCH W WOJEWÓDZTWIE ŚLĄSKIM sesja wiosenna Jaworzno 2012 SPIS TREŚCI 1. WPROWADZENIE... 3 2. WYNIKI SŁUCHACZY GIMNAZJÓW DLA DOROSŁYCH DOTYCZĄCE STANDARDOWYCH
Czy gimnazjaliści rzeczywiście coraz gorzej piszą?
XVII Konferencja Diagnostyki Edukacyjnej, Kraków 2011 Elżbieta Modrzewska Okręgowa Komisja Egzaminacyjna w Jaworznie Hanna Wylężek Okręgowa Komisja Egzaminacyjna w Jaworznie Czy gimnazjaliści rzeczywiście
Prognozowanie przez uczniów wyniku próbnego egzaminu
XIII Konferencja Diagnostyki Edukacyjnej Uczenie się i egzamin w oczach uczniów. Łomża, 5 7..27 Anna Dubiecka, Jacek Stańdo 2 Matematyka 2_Gimnazjum, WSiP 2 Centrum Nauczania Matematyki i Fizyki, Politechnika
I.1.1. Technik optyk 322[16]
I.1.1. Technik optyk 322[16] Do egzaminu zostało zgłoszonych: 197 Przystąpiło łącznie: 188 przystąpiło: 188 przystąpiło: ETAP PISEMNY ETAP PRAKTYCZNY zdało: 182 (96,8%) zdało: 145 (77,1%) DYPLOM POTWIERDZAJĄCY
Analiza wariancji. dr Janusz Górczyński
Analiza wariancji dr Janusz Górczyński Wprowadzenie Powiedzmy, że badamy pewną populację π, w której cecha Y ma rozkład N o średniej m i odchyleniu standardowym σ. Powiedzmy dalej, że istnieje pewien czynnik
Czy egzamin gimnazjalny jest dobrym prognostykiem sukcesu na maturze z fizyki i astronomii?
Krystyna Feith OKE w Łodzi Czy egzamin gimnazjalny jest dobrym prognostykiem sukcesu na maturze z fizyki i astronomii? Kiedy w maju 22 roku 54 838 gimnazjalistów w OKE w Łodzi przystąpiło do egzaminu zewnętrznego
opracowała Elżbieta Siwek
SPRAWDZIAN PO KLASIE SZÓSTEJ 2012 Analiza wyników sprawdzianu przeprowadzonego w dniu 5 kwietnia 2012 roku w Szkole Podstawowej Nr 6 im Henryka Sienkiewicza w Pruszkowie W dniu 3 kwietnia 2012 roku do
Czy nowy klucz punktowania ma wpływ na komunikowanie wyników sprawdzianu 2010 roku? (na podstawie analizy rozwiązań zadań 21. i 23.
XVI Konferencja Diagnostyki Edukacyjnej, Toruń 2010 Jadwiga Kubat Okręgowa Komisja Egzaminacyjna w Krakowie Jerzy Matwijko Okręgowa Komisja Egzaminacyjna w Krakowie Czy nowy klucz punktowania ma wpływ
Jak statystyka może pomóc w odczytaniu wyników sprawdzianu
16 Jak statystyka może pomóc w odczytaniu wyników sprawdzianu Wyniki pierwszego ważnego egzaminu sprawdzianu w klasie szóstej szkoły podstawowej mogą w niebagatelny sposób wpływać na losy pojedynczych
RAPORT z diagnozy Matematyka na starcie
RAPORT z diagnozy Matematyka na starcie przeprowadzonej w klasach czwartych szkoły podstawowej Analiza statystyczna Wyjaśnienie Wartość wskaźnika Liczba uczniów Liczba uczniów, którzy przystąpili do sprawdzianu
ANALIZA WYNIKÓW EGZAMINU MATURALNEGO Z MATEMATYKI Z ROKU 2017 W LICEUM OGÓLNOKSZTAŁCĄCYM W STRZELINIE Z ZASTOSOWANIEM KALKULATORA EWD 100
ANALIZA WYNIKÓW EGZAMINU MATURALNEGO Z MATEMATYKI Z ROKU 2017 W LICEUM OGÓLNOKSZTAŁCĄCYM W STRZELINIE Z ZASTOSOWANIEM KALKULATORA EWD 100 OPRACOWANA PRZEZ ZESPÓŁ: BOŻENA BUŁA JOLANTA BURTIN BEATA MALSKA
Stanisław Cichocki Natalia Nehrebecka. Zajęcia 11-12
Stanisław Cichocki Natalia Nehrebecka Zajęcia 11-12 1. Zmienne pominięte 2. Zmienne nieistotne 3. Obserwacje nietypowe i błędne 4. Współliniowość - Mamy 2 modele: y X u 1 1 (1) y X X 1 1 2 2 (2) - Potencjalnie
10. Podstawowe wskaźniki psychometryczne
10. Podstawowe wskaźniki psychometryczne q analiza własności pozycji testowych q metody szacowania mocy dyskryminacyjnej q stronniczość pozycji testowych q własności pozycji testowych a kształt rozkładu
ANALIZA WYNIKÓW OKE W KRAKOWIE WOJEWÓDZTWO LUBELSKIE 514[01] DYPLOM. przystąpiło zdało przystąpiło zdało otrzymało
FRYZJER 51[1] ANALIZA WYNIKÓW OKE W KRAKOWIE WOJEWÓDZTWO LUBELSKIE Do egzaminu zgłoszonych zostało: 5 Przystąpiło łącznie: 5 51[1] DYPLOM ZASIĘG ETAP PISEMNY ETAP PRAKTYCZNY POTWIERDZAJĄCY KWALIFIKACJE
586 (66,6%) 601 (87,4%) Tabela 1. Wyniki egzaminu potwierdzającego kwalifikacje zawodowe dla zawodu mechanik-monter maszyn i urządzeń
2.1. Mechanik-monter maszyn i urządzeń 723[02] Do egzaminu zgłoszonych zostało: 1 053 Przystąpiło łącznie: 915 880 88 ETAP PISEMNY ETAP PRAKTYCZNY 58 (,%) 01 (87,4%) DYPLOM POTWIERDZAJĄCY KWALIFIKACJE
Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )
Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału
STRESZCZENIE. rozprawy doktorskiej pt. Zmienne jakościowe w procesie wyceny wartości rynkowej nieruchomości. Ujęcie statystyczne.
STRESZCZENIE rozprawy doktorskiej pt. Zmienne jakościowe w procesie wyceny wartości rynkowej nieruchomości. Ujęcie statystyczne. Zasadniczym czynnikiem stanowiącym motywację dla podjętych w pracy rozważań
OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp
tel.: +48 662 635 712 Liczba stron: 15 Data: 20.07.2010r OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA z wykorzystaniem programu obliczeniowego Q maxp DŁUGIE
Zadania rozrywające w testach na przykładzie zadań maturalnych z matematyki
Ewa Stożek, Henryk Dąbrowski OKE Łódź Zadania rozrywające w testach na przykładzie zadań maturalnych z matematyki Na podstawie analizy danych empirycznych z egzaminu maturalnego z matematyki 5 i 6 roku
MODELE LINIOWE. Dr Wioleta Drobik
MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą
max ilość punktów w standardzie biologia PP 2012
Biologia PP Analiza wyników egzaminu maturalnego z biologii (poziom podstawowy) w roku szkolnym 2011/2012 z uwzględnieniem stopnia realizacji standardów wymagań maturalnych. I.Opis arkusza : Arkusz egzaminacyjny
Rodzaje testów. Testy. istnieje odpowiedź prawidłowa. autoekspresja brak odpowiedzi prawidłowej ZGADYWANIE TRAFNOŚĆ SAMOOPISU
Rodzaje testów Testy wiedza umiejętności zdolności właściwości poznawcze właściwości afektywne uczucia postawy osobowość emocje wierzenia istnieje odpowiedź prawidłowa autoekspresja brak odpowiedzi prawidłowej
Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi
Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska D syst D śr m 1 3 5 2 4 6 śr j D 1
parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,
诲 瞴瞶 瞶 ƭ0 ƭ 瞰 parametrów strukturalnych modelu Y zmienna objaśniana, = + + + + + X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, α 0, α 1, α 2,,α k parametry strukturalne modelu, k+1 parametrów
Raport z ewaluacji wewnętrznej. Publicznej Szkoły Podstawowej w Sieciechowie
Raport z ewaluacji wewnętrznej Publicznej Szkoły Podstawowej w Sieciechowie Obszar :1 Efekty działalności dydaktycznej, wychowawczej i opiekuńczej oraz innej działalności statutowej. Wymaganie:1.1 Analizuje
4118 (76,9%) 3538 (85,7%) Tabela 1. Wyniki egzaminu potwierdzającego kwalifikacje zawodowe dla zawodu mechanik pojazdów samochodowych
2.1. Mechanik 723[04] Do egzaminu zgłoszonych zostało: 6845 Przystąpiło łącznie: 5506 5353 4126 ETAP PISEMNY ETAP PRAKTYCZNY 4118 (76,9%) 3538 (85,7%) DYPLOM POTWIERDZAJĄCY KWALIFIKACJE ZAWODOWE otrzymało:
Podstawowe definicje statystyczne
Podstawowe definicje statystyczne 1. Definicje podstawowych wskaźników statystycznych Do opisu wyników surowych (w punktach, w skali procentowej) stosuje się następujące wskaźniki statystyczne: wynik minimalny
Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1
Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie
w pierwszym okresie nauki w gimnazjum
Wojdedh Walczak Ośrodek Pedagogiczno-Wydawniczy CHEJRON w Łodzi Związek pomiędzy dwoma typami oceniania w podstawowej a wynikami osiąganymi przez uczniów w pierwszym okresie nauki w gimnazjum Wstęp Niniejsze
W1. Wprowadzenie. Statystyka opisowa
W1. Wprowadzenie. Statystyka opisowa dr hab. Jerzy Nakielski Zakład Biofizyki i Morfogenezy Roślin Plan wykładu: 1. O co chodzi w statystyce 2. Etapy badania statystycznego 3. Zmienna losowa, rozkład
Analiza wyników egzaminu gimnazjalnego przeprowadzonego w roku szkolnym 2011/2012 w części matematyczno przyrodniczej z zakresu matematyki
Analiza wyników egzaminu gimnazjalnego przeprowadzonego w roku szkolnym 2011/2012 w części matematyczno przyrodniczej z zakresu matematyki Zestaw zadań egzaminacyjnych zawierał 23, w tym 20 zadań zamkniętych
OKRĘGOWA KOMISJA EGZAMINACYJNA W ŁODZI INFORMACJE O WYNIKACH UCZNIÓW ROZWIĄZUJĄCYCH ARKUSZE NIESTANDARDOWE
OKRĘGOWA KOMISJA EGZAMINACYJNA W ŁODZI INFORMACJE O WYNIKACH UCZNIÓW ROZWIĄZUJĄCYCH ARKUSZE NIESTANDARDOWE SPRAWDZIAN W ROKU 2008 SPIS TREŚCI 1.DANE STATYSTYCZNE UCZNIÓW ROZWIĄZUJĄCYCH DOSTOSOWANE ARKUSZE
218 (71%) 259 (92,5%) Tabela 1. Wyniki egzaminu potwierdzającego kwalifikacje zawodowe dla zawodu monter instalacji i urządzeń sanitarnych
2.1. Monter instalacji i urządzeń sanitarnych 713[02] Do egzaminu zgłoszonych zostało: 448 Przystąpiło łącznie: 364 307 280 ETAP PISEMNY ETAP PRAKTYCZNY 218 (71%) 259 (92,5%) DYPLOM POTWIERDZAJĄCY KWALIFIKACJE
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI Test zgodności i analiza wariancji Analiza wariancji Test zgodności Chi-kwadrat Sprawdza się za jego pomocą ZGODNOŚĆ ROZKŁADU EMPIRYCZNEGO Z PRÓBY Z ROZKŁADEM HIPOTETYCZNYM
Porównywalne między latami wyniki sprawdzianu
Porównywalne między latami wyniki sprawdzianu ZESPÓŁ ANALIZ OSIĄGNIĘĆ UCZNIÓW Instytut Badań Edukacyjnych Plan prezentacji 1.Po co nam zrównywanie wyników pomiędzy latami? 2.W jaki sposób przeprowadzono
Przemysław Majkut Gimnazjum N analiza efektów kształcenia na podstawie wyników egzaminów zewnętrznych
Przemysław Majkut Gimnazjum N analiza efektów kształcenia na podstawie wyników egzaminów zewnętrznych Opis szkoły Opisywane gimnazjum znajduje się w niewielkiej miejscowości, liczącej niewiele ponad tysiąc
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012
RAPORT WSKAŹNIK EDUKACYJNEJ WARTOŚCI DODANEJ PO EGZAMINIE GIMNAZJALNYM W ROKU SZKOLNYM 2012/2013
RAPORT WSKAŹNIK EDUKACYJNEJ WARTOŚCI DODANEJ PO EGZAMINIE GIMNAZJALNYM W ROKU SZKOLNYM 2012/2013 ZESPÓŁ SZKÓŁ NR 14 W BYDGOSZCZY GIMNAZJUM NR 37 INTEGRACYJNE Opracowanie A. Tarczyńska- Pajor na podstawie