Metody statystyczne wykorzystywane w szacowaniu trzyletnich wskaźników egzaminacyjnych
|
|
- Kacper Wilk
- 7 lat temu
- Przeglądów:
Transkrypt
1 Artur Pokropek 1 Instytut Filozofii i Socjologii Polskiej Akademii Nauk Metody statystyczne wykorzystywane w szacowaniu trzyletnich wskaźników egzaminacyjnych Wstęp Trzyletni wskaźnik egzaminacyjny publikowany przez Centralną Komisję Egzaminacyjną został opracowany przez grupę odpowiedzialną za metodologię szacowania wskaźnika Edukacyjnej Wartości Dodanej 2. Wskaźnik ten został przychylnie odebrany przez osoby zainteresowane poszerzaniem swojej wiedzy o pracy szkół. Forma graficzna, w jakiej przedstawiany jest wskaźnik, powoduje, iż jego pobieżna interpretacja jest intuicyjna, nie sprawia większych problemów i nie wymaga specjalistycznej wiedzy statystycznej, a jedynie wyobraźni i zdrowego rozsądku. Pod pozorami tej prostoty kryją się jednak wyrafinowane procedury statystyczne, starannie wybrane i przetestowane po to, by przedstawiany wynik był jak najbardziej dokładny, trafny oraz rzetelny. W artykule tym przybliżone zostaną kulisy szacowania omawianego wskaźnika na tyle dokładnie, aby pozwolić czytelnikowi odtworzyć i zrozumieć kolejne kroki analiz statystycznych używanych podczas szacowaniu wskaźnika trzyletniego. Szacowanie omawianego wskaźnika egzaminacyjnego można podzielić na cztery etapy: 1. Normalizacja wyników egzaminacyjnych za pomocą metody ekwicentylowej. 2. Szacowanie wyników końcowych za pomocą modeli wielopoziomowych. 3. Szacowanie wskaźnika edukacyjnej wartości dodanej za pomocą modeli wielopoziomowych. 4. Przedstawianie wyników w dwuwymiarowej przestrzeni przy uwzględnieniu niepewności szacowania. W kolejnych częściach tego artykułu przedstawiony zostanie każdy z tych kroków. Zaczniemy od zrównywania opartego na metodzie ekwicentylowej, jednak z uwagi na to, iż metoda ta jest stosunkowo dobrze znana w polskich badaniach edukacyjnych, poświęcone jej zostanie stosunkowo mało miejsca. Kluczowymi punktami, które zostaną bardziej szczegółowo opisane, są punkty drugi i trzeci. Stanowią one bowiem rdzeń szacowanego wskaźnika. Skupimy się tu na modelowaniu, za pomocą którego uzyskujemy wyniki końcowe oraz wyniki wskaźnika edukacyjnej wartości dodanej. Jako odwołanie do punktu 1 artur.pokropek@gmail.com 2 Do której należy autor tego tekstu. Bliższe informacje patrz: 137
2 XV Konferencja Diagnostyki Edukacyjnej, Kielce 2009 drugiego i trzeciego, poruszona zostanie również kwestia estymacji Bayesowskich, wykorzystywanych w szacowaniu trzyletnich wskaźników egzaminacyjnych. W punkcie czwartym omówiona zostanie koncepcja graficznego prezentowania wskaźników ze szczególnym uwzględnieniem przesłanek statystycznych wiążących się z takim sposobem prezentacji wyników. 1. Przy normalizacji wyników za pomocą metody ekwicentylowej warto zdefiniować dwie funkcje. Niech F(x) będzie kumulatywną funkcją gęstości rozkładu zmiennej losowej X (reprezentującej wynik egzaminu), a funkcja P(x) funkcją wyznaczająca rangę pozycyjną 3 tak, że: P(x) = 100{F(x*-1)=[x-(x*-0,5)][F(x*)-F(x*)-F(x*-1)]}; =0 dla x < -0,5 (1.1) =100 dla x max(x)+0,5 gdzie: -0,5 x < max(x) + 0,5; x*: to najbliższa liczba całkowita wartości x tak, że: x* - 0,5 <= x < x* + 0,5; max(x): to maksymalna do uzyskania liczba punktów. Funkcja P(x) zdefiniowania w równaniu (1.1) jest receptą na przekształcenie wyniku surowego na rangę pozycyjną, czyli dzięki niej można umieścić wynik na kumulatywnej skali wyników. Oznacza to zrelatywizowanie danego wyniku do pozycji w rozkładzie skumulowanym. Graficzna reprezentacja tej funkcji przedstawiona została na rysunku 1.1. Na krzywej wyrażającej kształt funkcji kwadratami zaznaczono również 51 punktów odpowiadających 51 możliwym do uzyskania wynikom egzaminacyjnym (przykład odwołuje się do części matematyczno-przyrodniczej egzaminu gimnazjalnego 2009; skala tego testu wynosi od 0-50). Na rysunku zaznaczono również przykładowe przekształcenie wyniku surowego równego 30 punktom. Można odczytać, że 63,8% uczniów uzyskało wynik 30 punktów lub gorszy. 3 Dalsze informacje patrz: M. J. Kolen i R. L. Brennan, Test Equating, Scaling and Linking Methods and Practices Second Edition, Springer, New York
3 Rysunek 1.1. Funkcja wyznaczająca rangę pozycyjną dla egzaminu gimnazjalnego 2009, część matematyczno-przyrodnicza Rysunek 1.2. Funkcja przekształcenia liniowego wyznaczająca wynik po normalizacji Jeżeli podzielimy rozkład gęstości na 100 równych części (percentyle), wynik ten będzie miał rangę 64. Jeżeli jednak rozkład gęstości podzielimy na 1000 równych części, ranga będzie wynosić 638. Wybór dokładności, z jaką przenosimy wyniki surowe na rangi, nie jest bez znaczenia. Im mniejsza liczba podziałów rozkładu kumulatywnego, czyli mniejsza ilość rang, tym rozkład wyników wyrażonych w rangach będzie bardziej przypominał rozkład normalny. Ceną tego jest jednak dokładność szacowania wyników. Przy podziale rozkładu skumulowanego na
4 XV Konferencja Diagnostyki Edukacyjnej, Kielce 2009 części będziemy mieli tylko 10 rang w stosunku do 51 punktów. W przypadku podziału rozkładu skumulowanego na 100 części uzyskujemy (w zależności od rodzaju i edycji egzaminu gimnazjalnego) około 40 unikalnych rang. Dzieje się tak dlatego, że rzadkie wyniki, szczególnie na skrajach rozkładów, sklejają się ze sobą. Nawet podział rozkładu skumulowanego na 1000 części nie gwarantuje tego, że kategorie się nie skleją. Można to prześledzić na rysunku 1.1, gdzie rangi zdefiniowane są na podstawie podziału rozkładu skumulowanego na 1000 części. Pięć najniższych wyników egzaminacyjnych uzyskuje identyczną, najniższą rangę. Jednak właśnie ten podział okazał się najbardziej optymalny przy zachowaniu dostatecznej równowagi między dokładnością pomiaru a normalizacją. Tak uzyskana ranga przedstawiona zostaje na skali o średniej 100 i odchyleniu standardowym 15. Aby przekształcić uzyskane rangi na taką skalę (tak jak jest to pokazane na rysunku 1.2), musimy odwołać się do liniowej funkcji przekształcającej uzyskaną rangę p = P(x) na skalę o zadanych parametrach (czyli średniej 100 i odchyleniu standardowym 15). Możemy to zrobić, odwołując się do prostego przekształcenia liniowego, które możemy zapisać jako funkcję L(p): (1.2) gdzie: σ p to odchylenie standardowe wyniku wyrażonego w rangach p μ p to średnia wyniku wyrażonego w rangach p. Graficzną reprezentację funkcji L(p) można znaleźć na rysunku 1.2. Na tym rysunku można też zaobserwować przekształcenie wcześniej omawianej rangi 638 na skalę o średniej 100 i odchyleniu standardowym 15, w której ranga ta ma wartość 105,32. Na rysunku 1.3 i 1.4 przedstawiono rozkłady egzaminu gimnazjalnego przed normalizacją i po niej. W tabeli 1.1 przedstawiono wartości punktowe przed normalizacją i po niej. 140
5 Rysunek 1.3. Rozkład egzaminu gimnazjalnego 2009, cześć matematyczno przyrodnicza przed normalizacją Rysunek 1.4. Rozkład egzaminu gimnazjalnego 2009, cześć matematyczno przyrodnicza po normalizacji 141
6 XV Konferencja Diagnostyki Edukacyjnej, Kielce 2009 Tabela 1.1 Wyniki surowe i po normalizacji egzaminu gimnazjalnego 2009, cześć matematyczno-przyrodnicza WS WN WS WN WS WN WS WN WS WN 0/1 53, , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ,04 WS WN Wynik surowy Wynik znormalizowany 2. Do szacowania wyników końcowych danego gimnazjum, czyli wyniku średniego z trzech kolejnych lat, wykorzystywane jest modelowanie wielopoziomowe. Stosuje się tutaj tak zwany model pusty, w którym wykorzystywane są informacje o wynikach poszczególnych uczniów oraz informacja o pogrupowaniu ich w szkołach. Aby przywołać informacje o pogrupowaniu uczniów do klasycznego równania opisującego średni wynik uczniów w populacji z uwzględnieniem błędu pomiaru: gdzie: y i to wynik i-tego ucznia β 0 to średnia wyników w populacji e wyraz błędu, i Wprowadzamy indeks j oznaczający szkołę j. Równanie wygląda wtedy następująco: y i = β 0 + e 1 (2.1) Poziom jednostki (1): y ij = β 0j + r 1j (2.1) gdzie: Poziom szkoły (2): β 0j = γ 00 + u oj 142
7 Gdy wprowadziliśmy informację o pogrupowaniu, analiza stała się analizą, w której bierzemy pod uwagę dwa poziomy rzeczywistości - poziom jednostek (uczniów) i poziom grup, do których owe jednostki należą (poziom szkół). Można to zapisać w jednym równaniu. Równanie to podzielmy na dwie części: tak zwaną część stałą i część losową, gdzie część losowa zamknięta została w nawiasie kwadratowym: y ij = γ 00 + [u oj + r 1j ] (2.2) Model 2.2 to prosty, dwupoziomowy model, który został wykorzystany do obliczania wskaźnika wyniku egzaminacyjnego danej szkoły, gdzie i-te pomiary są obiektami pierwszego poziomu, a dane jednostki j są obiektami z drugiego poziomu (szkoła); γ 00 oznacza tutaj wartość oczekiwaną dla populacji (efekt stały niezmienny w kontekście całej populacji), natomiast β 0j jest parametrem składającym się z części stałej γ 00 charakteryzującej wynik dla populacji, oraz części losowej - opisującej zróżnicowanie parametrów między grupami, wyrażanej za pomocą u 0j. Czasami, szczególnie w teoriach testów, parametr ten określa się jako wynik prawdziwy lub zmienną ukrytą, świadczącą o prawdziwym poziomie umiejętności, prawdziwej wartości inteligencji czy prawdziwej wartości, którą to próbujemy odkryć za pomocą zawodnych narzędzi. Całkowity błąd przewidywania e i znany z równania (2.1) można teraz przedstawić jako sumę błędu na poziomie jednostkowym r ij oraz grupowym u j tak, że: e i = r ij + u j (Zostało to przedstawione na rysunku 2.1) Zakładamy tutaj, że r ij ma rozkład normalny w populacji pomiarów (uczniów). Ponadto u j, jako odchylenie od populacyjnej średniej, dla j-tych przedmiotów, ma rozkład normalny w całej populacji wyników prawdziwych o średniej zero i odchyleniu standardowym τ 00. Rysunek 2.1. Relacje między błędami, efektem stałym w populacji i wynikiem prawdziwym dla obiektu j 143
8 XV Konferencja Diagnostyki Edukacyjnej, Kielce 2009 Założenia są zatem analogicznie jak w klasycznej regresji liniowej z tym, że w rozbiciu na dwa poziomy. Ponadto zakłada się, że błędy są od siebie niezależne: E( ur i ij ) = 0 (2.3) E( uu ) = 0 ( i j) (2.4) i j E( r r ) = E( r r ) = E( r r ) = 0 ( i j; t s) (2.5) it is it jt it js Pomiary y 1j, y 2j są niezależne od siebie w grupie pomiarów dla grupy. Zależność ich widziana jest dopiero na wyższym poziomie, gdzie patrzymy na wszystkie wyniki zagnieżdżone w grupach, do których przynależą jednostki obserwacji, ich zależność odzwierciedlana jest przez błąd u i. Dlatego wariancję wartości y ij można zapisać następująco, co również obrazowo przedstawia rysunek 2.1: (2.6) Po co wprowadzać takie komplikacje, zamiast liczyć średnią w klasyczny sposób dla poszczególnych szkół i traktować ją jako wartość oczekiwaną? Odpowiedź jest prosta: średnią traktujemy jako wartość oczekiwaną pracy szkoły i ważnym aspektem staje się dla nas estymowanie błędu szacowania. Klasyczne szacowanie wartości oczekiwanej (poprzez średnią) i błędów standardowych nie jest w tym przypadku optymalne. Klasyczne szacowanie wartości oczekiwanej jest optymalne tylko warunkowo, to znaczy wtedy, gdy odnosi się do jednej szkoły. Gdy estymujemy średnią standardową dla grupy szkół, najbardziej optymalne okazują się Bayesowskie predykcje 4 a posteriori. Predykcje te w przypadku oszacowań punktowych dają minimalną kwadratową funkcję błędu oszacowania i mówi się o nich, iż są BLUP, czyli Best Linear Unbiased Predictors (najlepsze liniowe nieobarczone błędem predykcje) dla całej populacji. Mają też optymalne, czyli najniższe poprawne, błędy standardowe, dzięki którym wyznaczane są przedziały ufności. 5 Wszystko to za cenę warunkowego obciążenia. Predykcje te wykazują pewien konserwatywny (czyli ukierunkowany w stronę średniej) błąd na poziomie szkół dla placówek o niewielkiej liczbie uczniów i/lub skrajnych wartościach średniej ( b ). Podstawową ideą, jaka kryje się za Bayesowskimi metodami wyniku końcowego, jest użycie dwóch typów informacji: (1) o jednostkach należących do j-tej grupy oraz (2) informacji o całym rozkładzie u j (czy de facto o rozkładzie średniej: β 0j = β 0 + u j ) w całej populacji: średniej równej 0 i odchyleniu standardowym τ j 4 Konwencjonalnie o estymatorach Bayesowskich mówi się jako o predyktorach. 5 Rabe-Hesketh, Sophia i Anders Skrondal, Multilevel and Longitudinal Modeling Using Stata. College Station, Texas: Stata Press Publication StataCorp LP. 2008; s
9 Klasyczny estymator wartości oczekiwanej dla grupy j, a w języku modelowania wielopoziomowego stała regresji wielopoziomowej (β 0j = β 0 + u j ), to oczywiście klasycznie liczona średnia 6 : (2.7) Zaś estymator dla całej populacji, czyli średnia populacyjna, to oczywiście: (2.8) Gdzie n j oznacza liczebność j-tej grupy, N to liczebność badanych grup; M to całkowita liczebność populacji. Estymator Bayesowski jest średnią ważoną dwóch estymatorów: grupowego i populacyjnego tak, że 7 : (2.9) gdzie: (2.10) Jak widać zatem z równań (2.9 i 2.10), na różnicę między estymatorem klasycznym i predyktorem Bayesowskim dla j-tej grupy wpływają 4 elementy: 1. Zróżnicowanie predyktorów grupowych w całej populacji charakteryzowane przez τ Zróżnicowanie wewnątrzgrupowe: σ 2 3. Wielkość grupy: n j 4. Różnica między średnią w populacji a klasycznym estymatorem wyników końcowych w grupie. W praktyce dwa ostatnie punkty mają największy wpływ na różnicę między oszacowaniem klasycznym a Bayesowskim. Czyli liczebność grupy j (w naszym wypadku szkoły) oraz jej odległość od średniej populacyjnej. Im szkoła mniejsza, a wynik jej bardziej oddalony od średniej populacyjnej, tym korekta związana 6 W tym wypadku średnia jest też tożsama z estymatorem MLE. 7 Snijders, Tom A.B. i Roel J. Bosker, Multilevel Analysis. Thousand Oaks London New Delhi: Sage 2004, s
10 XV Konferencja Diagnostyki Edukacyjnej, Kielce 2009 z użyciem predyktora Bayesowskiego jest większa. Będąc bardziej dosłownym, można powiedzieć, iż w wypadku małych i oddalonych od średniej populacyjnej szkół predyktor Bayesowski będzie ściągał wyniki ku średniej. Przedstawione to zostało na rysunkach 2.2 i 2.3. Na pierwszym z tych rysunków widać, że największe różnice między klasycznym estymatorem a predyktorem Bayesowskim dotyczą szkół, w których w przeciągu 3 lat uczyło się mniej niż 100 uczniów. Poniżej tego progu różnice niezwykle maleją po to, by powyżej 400 jednostek obserwacji stać się marginalnymi i oscylować wokół 0,5 punktu 8 (na skali średnia 100, odchylenie standardowe 15). Natomiast na rysunku 2.3 widać, iż różnice między klasycznym estymatorem a predyktorem Bayesowskim rosną wraz z oddalaniem się wyników szkół od średniej populacyjnej (100). Największy zysk ze stosowania estymatorów Bayesowskich to korekcja błędów standardowych oszacowań. Błędy standardowe predyktorów Bayesowskich można zapisać w następujący sposób: (2.11) Rysunek 2.2. Różnice między estymatorem klasycznym i Bayesowskim a liczebnością grupy 8 Różnice oscylują wokół punktu 0,5 a nie 0,0, ponieważ prezentowane poprawki odnoszą się do szkół o liczebności +30. Natomiast rozkład predyktorów grupowych w populacji, a zatem τ 00 estymowana jest dla wszystkich szkół. Ponieważ wielkość szkoły jest skorelowana z wynikami, średnia różnic wyższa jest od zera. 146
11 Rysunek 2.3. Różnice między estymatorem klasycznym i Bayesowskim a porównanie dla różnych wyników estymatora klasycznego Rysunek 2.4. Różnice między klasycznym błędem standardowym i błędem standardowym dla predyktora Bayesowskiego a liczebność uczniów 147
12 XV Konferencja Diagnostyki Edukacyjnej, Kielce 2009 Rysunek 2.5. Różnice między klasycznym błędem standardowym i błędem standardowym dla predyktora Bayesowskiego a zróżnicowanie wyników W wypadku błędów standardowych, oprócz informacji o rozkładzie wyników we wszystkich szkołach, korekta błędów zależy przede wszystkim od dwóch czynników: wielkości szkoły i zróżnicowania wyników uzyskiwanych przez uczniów w szkołach. Pokazują to rysunki 2.4 i 2.5. Na rysunku 2.4 widać wyraźnie, iż największe korekty (w obie strony) dotyczą szkół, w których mamy stosunkowo niewiele obserwacji (poniżej 100). Im szkoły liczniejsze, tym korekty stają się coraz bardziej marginalne. Rysunek 2.5 pokazuje, jak korekty Bayesowskie zależą od zróżnicowania wyników wewnątrz szkoły. Gdy zróżnicowanie mierzone odchyleniem standardowym zbliża się do zróżnicowania średniego w populacji, korekty są niewielkie. Gdy zróżnicowanie w szkołach jest wyższe niż średnie zróżnicowanie w populacji, korekta jest dodatnia (czyli błąd standardowy predykcji Bayesowskich jest mniejszy niż klasyczny błąd standardowy), gdy zróżnicowanie w szkołach jest niższe niż średnia w całej populacji, korekta jest ujemna (czyli błąd standardowy predykcji Bayesowskich jest większy niż klasyczny błąd standardowy). Podobnie jak same predyktory, Bayesowskie błędy są optymalne, czyli w sposób optymalny minimalizują popełnienie błędu podczas wnioskowania statystycznego. 3. Naturalnym rozszerzeniem dla modelu zaprezentowanego wcześniej, w którym szacowany był predyktor wyników końcowych, jest dodanie zmiennej niezależnej x lub wektora zmiennych niezależnych, opisującego związek liniowy ze zmienną Y parametrem β 1j lub wektorem parametrów: β. Na model taki można patrzeć jako na rozszerzenie modelu pustego o zmienną wyjaśniającą lub rozszerzenie klasycznej regresji jednej zmiennej o informacje dotyczące 148
13 pogrupowania jednostek. Model z efektem losowym dla stałej regresji zapisujemy następująco (zapis dla jednej zmiennej niezależnej): Poziom jednostki (1): y ij = β 0j + β 1j x ij + r ij (3.1) gdzie: Poziom szkoły (2): β 0j = γ 00 + u 0j β 1j = γ 00 Jak widać, w tym modelu współczynnik nachylenia β 1j uznajemy za stałą dla wszystkich grup, tak jak w klasycznej regresji, i zapisujemy jako: β 1j = γ 10, jednak pozostajemy przy założeniu z poprzedniego modelu związanym ze stałą regresji, którą traktujemy jako zmienną losową. Do wyrazu wolnego (stałej regresji) dołączony zostanie efekt losowy: β 1j = γ 00 + u oj. Tak jak w modelu 2.2. Cały model można przedstawić w jednym równaniu liniowym w następujący sposób: y ij = γ 00 + γ 10 x ij + u oj + r ij (3.2) Ilustracją dla tego modelu jest poniższy rysunek. Jak widać, zależność między Y i X jest stała dla całej populacji; tym, co różnicuje j te grupy, jest efekt losowy u 0j, który wyraża to, iż w różnych grupach przewidujemy różne, warunkowe wartości oczekiwane. Mówiąc obrazowo, model ten pozwala na to, by wyraz wolny zmieniał się w zależności od danej grupy, przesuwając w ten sposób krzywą regresji o u oj. Jak widać na rysunku, krzywa regresji dla grupy j (zaznaczona linią przerywaną) jest przesunięta w dół względem krzywej dla całej populacji (linia ciągła). Rysunek 2.6. Ilustracja efektu losowego dla stałej regresji (za Rabe-Hesketh, Sophia i Anders Skrondal: s. 96) 149
14 XV Konferencja Diagnostyki Edukacyjnej, Kielce 2009 Załóżmy, że zmienną wyjaśnianą jest wynik egzaminu gimnazjalnego, a zmienną wyjaśniającą sprawdzian po szkole podstawowej. W przypadku modelu wielopoziomowego możemy zapisać to następująco, lekko reorganizując równanie 3.2: y ij = (γ 00 + u 0j ) + γ 10 x ij + r ij (3.3) Zastanówmy się teraz, co tutaj oznacza u ij. Jest ot efekt szkoły szacowany dla indywidualnego wyniku y ij, a precyzyjniej relatywny efekt szkoły w stosunku do wartości przewidywanej dla całej populacji szkół γ 00. Ale to nie wszystko. Jest to efekt warunkowy, czyli przy założeniu, że wszystkie inne czynniki pozostają bez zmian, pozostaną zawieszone. W naszym wypadku tym innym czynnikiem wyrażonym explicite jest wartość wyniku sprawdzianu po szkole podstawowej. Wartość u j jest zatem tym, co szkoła dodała (lub dodałaby, gdyby chodzili do niej inni uczniowie) bez względu na to, jakie wyniki otrzymali ze sprawdzianu po szkole podstawowej. To w edukacji nazywamy wartością dodaną. Dzięki modelom wielopoziomowym możliwe jest zatem estymowanie wartości dodanej dla szkół. Oczywiście modele szacowania EWD trzyletniego są bardziej skomplikowane, lecz skomplikowanie to wyraża się przede wszystkim w użyciu większej liczby zmiennych niezależnych zwiększających dopasowanie modelu do danych. 9 W tabeli 2.1 można znaleźć listę zmiennych niezależnych wykorzystanych modelowaniu trzyletniego wskaźnika EWD. Tabela 2.1. Lista zmiennych niezależnych zawarta w wektorze X Oznaczenie Opis Uwagi X 1 wynik sprawdzianu po szkole podstawowej zmienna ciągła X 2 płeć zmienna 0-1 X 3 dysleksja na sprawdzianie po szkole podstawowej zmienna 0-1 X 4 dysleksja na egzaminie gimnazjalnym zmienna 0-1 X 3 *X 4 dysleksja_spr*dysleksja_gim interakcja (zmienna 0-1) X 5 czy rok 2008? zmienna 0-1 X 6 czy rok 2009? zmienna 0-1 X 5 *X 1 rok 2008*spr interakcja X 6 *X 1 rok 2009*spr interakcja X 5 *X 1 2 rok 2008*spr 2 interakcja X 6 *X 1 2 rok 2009*spr 2 interakcja X 5 *X 1 3 rok 2008*spr 3 interakcja X 6 *X 1 3 rok 2009*spr 3 interakcja 9 Więcej informacji o zmiennych niezależnych w modelach edukacyjnej wartości dodanej można znaleźć w: R. Dolata (red.), Edukacyjna wartość dodana jako metoda oceny efektywności nauczania na podstawie wyników egzaminów zewnętrznych, CKE, Warszawa
15 Metoda obliczania edukacyjnej wartości dodanej na podstawie modeli wielopoziomowych ma kilka zasadniczych zalet. Niestety omówienie ich wykracza poza ramy tej publikacji. W skrócie można powiedzieć, iż podobnie jak w przypadku Bayesowskich predyktorów wyników końcowych, otrzymujemy optymalne oszacowania wskaźnika efektywności pracy szkół oraz optymalne oszacowania błędów standardowych. Warto podkreślić, iż wszystkie wzory i zależności pokazane w punkcie 2. stosują się również do wskaźnika edukacyjnej wartości dodanej. Nie będziemy zatem powtarzać tych przykładów. 4. Ostatnim elementem niezbędnym do prezentacji wskaźnika trzyletniego jest połączenie informacji o wynikach końcowych i wskaźniku wartości dodanej. Jako że efektem zestawienia tych dwóch wskaźników ma być forma graficzna przedstawiona w dwuwymiarowym układzie współrzędnych, najwłaściwszym rozwiązaniem jest tutaj posłużenie się funkcją wiarygodności, a precyzyjniej złożeniem dwóch funkcji wiarygodności: wyniku egzaminu końcowego i wskaźnika edukacyjnej wartości dodanej dla danej szkoły. W obu wypadkach zakładamy, że funkcja wiarygodności w obydwu sytuacjach ma rozkład normalny i odchylenie standardowe proporcjonalne do błędu standardowego szacowanego wskaźnika; natomiast maksimum funkcji wiarygodności odpowiada punktowemu oszacowaniu wskaźnika. Poprzez złożenie takich dwóch funkcji otrzymujemy dwuwymiarową funkcję wiarygodności, tak jak zostało to przedstawione na rysunku 4.1. Rysunek 4.1. Dwuwymiarowa funkcja wiarygodności 151
16 XV Konferencja Diagnostyki Edukacyjnej, Kielce 2009 Kształt tej dwuwymiarowej funkcji gęstości wiarygodności da się opisać za pomocą macierzy kowariancji K tak, że: (4.1) gdzie: υ 01 jest wariancją pierwszej funkcji wiarygodności proporcjonalną do błędu standardowego wyznaczanego wskaźnika wyników końcowych υ 10 jest wariancją drugiej funkcji wiarygodności proporcjonalną do błędu standardowego wyznaczanego wskaźnika edukacyjnej wartości dodanej υ 00 = υ 11 to kowariancja między funkcjami wiarygodności, proporcjonalna do korelacji wskaźnika końcowego i indywidualnych reszt regresji wielopoziomowej. Wierzchołek tej dwuwymiarowej funkcji wiarygodności wyznacza nam najbardziej wiarygodny łączny wynik końcowy i wynik edukacyjnej wartości dodanej dla dwuwymiarowej przestrzeni. Zaś kształt funkcji wiarygodności opisany macierzą kowariancji wykorzystany zostaje do określenia 95-procentowego przedziału ufności. Mówiąc obrazowo, dwuwymiarowa funkcja wiarygodności zostaje odcięta w taki sposób, by pozostało tylko 5% gęstości tej funkcji. Można sobie wyobrazić, że to, co zostaje po odcięciu owych 95%, rozkładu gęstości to przekrój pienia w kształcie elipsy o wymiarach modelowanych przez macierzy kowariancji K. Eliptyczny kształt przekroju pienia swym polem wyznacza 95% pole ufności, w którym znajduje się wynik prawdziwy, w centrum tego pola zaś wynik najbardziej wiarygodny. Podsumowanie Efektem końcowym procedur statystycznych przedstawianych w powyższych punktach jest graficzne przedstawienie wskaźnika trzyletniego, tak jak zostało przedstawione to na rysunku 5.1. Wszystkie wyniki podawane są w punktach znormalizowanych za pomocą procedury przedstawionej w punkcie 1. Oś pozioma reprezentuje wyniki końcowe szacowane tak, jak opisano to w punkcie 2. Oś pionowa reprezentuje wskaźniki edukacyjnej wartości dodanej szacowane tak, jak zostało to przedstawione w punkcie 3. Pozycje szkoły reprezentuje eliptyczne pole ufności, opisane w punkcie 4. Szare pola informują o zawierającym się w nich procencie szkół. Pola te zostały wyznaczone za pomocą odległości Mahalanobisa i można je traktować analogiczne do powierzchni ufności w punkcie 4. z tym, że powierzchni ufności odnoszącej się do populacji szkół, a nie uczniów jednej szkoły. 152
17 Rysunek 5.1. Graficzne przedstawienie trzyletniego wskaźnika egzaminacyjnego: przykład Bibliografia: 1. R. Cole (red.), Relative difficulty of examinations in different subjects, CEM Centre, Durham University R. Dolata (red.), Edukacyjna wartość dodana jako metoda oceny efektywności nauczania na podstawie wyników egzaminów zewnętrznych, CKE, Warszawa M. J. Kolen i R. L. Brennan, Test Equating, Scaling and Linking Methods and Practices Second Edition, Springer, New York S. W. Raudenbush i A.S. Bryk, Hierarchical Linear Models, Sage, Thousand Oaks- London-New Delhi A. Skrondal i S. Rabe-Hesketh, Generalized Latent Variable Modeling, A CRC Press Company, Boca Raton-London-New York-Washington, D. C A. Skrondal i S. Rabe-Hesketh, Multilevel and Longitudinal Modeling Using Stata. College Station, Texas: Stata Press Publication StataCorp LP Snijders, Tom A. B. i Roel J. Bosker, Multilevel Analysis. Thousand Oaks London New Delhi: Sage
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2013
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2013 OPRACOWAŁY: ANNA ANWAJLER MARZENA KACZOR DOROTA LIS 1 WSTĘP W analizie wykorzystywany będzie model szacowania EWD.
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2012
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2012 OPRACOWAŁY: ANNA ANWAJLER MARZENA KACZOR DOROTA LIS 1 WSTĘP W analizie wykorzystywany będzie model szacowania EWD.
RAPORT WSKAŹNIK EDUKACYJNEJ WARTOŚCI DODANEJ PO EGZAMINIE GIMNAZJALNYM W ROKU SZKOLNYM 2012/2013
RAPORT WSKAŹNIK EDUKACYJNEJ WARTOŚCI DODANEJ PO EGZAMINIE GIMNAZJALNYM W ROKU SZKOLNYM 2012/2013 ZESPÓŁ SZKÓŁ NR 14 W BYDGOSZCZY GIMNAZJUM NR 37 INTEGRACYJNE Opracowanie A. Tarczyńska- Pajor na podstawie
EDUKACYJNA WARTOŚĆ DODANA
EDUKACYJNA WARTOŚĆ DODANA -nowe spojrzenie na wyniki egzaminów zewnętrznych w gimnazjach Jolanta Gołaszewska Na podstawie materiałów opracowanych przez Zespół EWD www.ewd.edu.pl Co to jest metoda edukacyjnej
Dlaczego należy uwzględniać zarówno wynik maturalny jak i wskaźnik EWD?
EWD co to jest? Metoda EWD to zestaw technik statystycznych pozwalających oszacować wkład szkoły w końcowe wyniki egzaminacyjne. Wkład ten nazywamy właśnie edukacyjną wartością dodaną. EWD jest egzaminacyjnym
Analiza wyników egzaminacyjnych 2013
Analiza wyników egzaminacyjnych 2013 z wykorzystaniem wskaźników edukacyjnej wartości dodanej (EWD) 1. Zestawienie ogólne wskaźników EWD dla egzaminu 2013 Wskaźniki EWD dla tegorocznego egzaminu gimnazjalnego
Metody obliczania edukacyjnej wartości dodanej dla szkół kończących się egzaminem maturalnym
Artur Pokropek Uniwersytet Warszawski Uczenie się i egzamin w oczach nauczyciela Metody obliczania edukacyjnej wartości dodanej dla szkół kończących się egzaminem maturalnym Wstęp Wskaźnik edukacyjnej
Statystyczną ideę szacowania wskaźników EWD dobrze ilustrują dwa poniższe wykresy:
1 Metoda EWD (edukacyjna wartość dodana) to zestaw technik statystycznych pozwalających zmierzyć wkład szkoły w wyniki nauczania. By można ją zastosować, potrzebujemy wyników przynajmniej dwóch pomiarów
TRUDNE DECYZJE Jak wybrać dobrą szkołę?
TRUDNE DECYZJE Jak wybrać dobrą szkołę? Białystok, 11 marca 2011 r. TRUDNE DECYZJE Jak wybrać dobrą szkołę? System oceniania zewnętrznego CELE OCENIANIA ZEWNĘTRZNEGO: EGZAMIN GIMNAZJALNY diagnozowanie
Czy egzaminy zewnętrzne mogą pomóc szkole w rozwoju? Ewa Stożek Sulejówek, czerwiec 2013
Czy egzaminy zewnętrzne mogą pomóc szkole w rozwoju? Ewa Stożek Sulejówek, czerwiec 2013 Wyniki egzaminu zewnętrznego 15 pkt 31% 6 stanin 29. centyl 101 na skali (100;15) 28,3 pkt 47% p = 0,75 7. stanin
ZS 14 Rok szkolny 2013/2014
Edukacyjna Wartość Dodana ZS 14 Rok szkolny 2013/2014 Pojęcie: Edukacyjna wartość dodana Edukacyjną wartość dodaną można zdefiniować jako przyrost wiedzy uczniów w wyniku danego procesu edukacyjnego. Innymi
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
KORELACJE I REGRESJA LINIOWA
KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem
Publiczne Gimnazjum im. Jana Pawła II w Wilczej Woli ANALIZA EGZAMINU GIMNAZJALNEGO 2013 Z UWZGLĘDNIENIEM EWD
Publiczne Gimnazjum im. Jana Pawła II w Wilczej Woli ANALIZA EGZAMINU GIMNAZJALNEGO 2013 Z UWZGLĘDNIENIEM EWD EDUKACYJNA WARTOŚĆ DODANA JAKO JEDNA Z MIAR JAKOŚCI NAUCZANIA Zasoby na wejściu Szkoła Jakość
Analiza edukacyjnej wartości dodanej dla Gimnazjum w Bolimowie w roku 2011
Analiza edukacyjnej wartości dodanej dla Gimnazjum w Bolimowie w roku 2011 W kwietniu 2011 roku na egzaminie gimnazjalnym arkusz standardowy rozwiązywało 42 uczniów. Z tej grupy uczniów udało się zestawić
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Nowa miara edukacyjna EWD
Projekt współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego. Nowa miara edukacyjna EWD Materiały dla jednostek samorządu terytorialnego Anna Rappe Centralna Komisja
5. WNIOSKOWANIE PSYCHOMETRYCZNE
5. WNIOSKOWANIE PSYCHOMETRYCZNE Model klasyczny Gulliksena Wynik otrzymany i prawdziwy Błąd pomiaru Rzetelność pomiaru testem Standardowy błąd pomiaru Błąd estymacji wyniku prawdziwego Teoria Odpowiadania
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y
EWD EDUKACYJNA WARTOŚĆ DODANA
EWD EWD EDUKACYJNA WARTOŚĆ DODANA Jest narzędziem statystycznym, używanym do analizy wyników sprawdzianu w ewaluacji pracy szkół, Pozwala na wyciągnięcie wniosków dotyczących efektywności nauczania oraz
EDUKACYJNA WARTOŚC DODANA
EDUKACYJNA WARTOŚC DODANA Termin ten oznacza metodę ale i wskaźnik liczbowy wyliczony tą metodą. Metody EWD to metody statystyczne pozwalające na podstawie wyników egzaminu gimnazjalnego (czyli wyników
Kontekstowe wskaźniki efektywności nauczania - warsztaty
Kontekstowe wskaźniki efektywności nauczania - warsztaty Przygotowała: Aleksandra Jasińska (a.jasinska@ibe.edu.pl) wykorzystując materiały Zespołu EWD Czy dobrze uczymy? Metody oceny efektywności nauczania
Edukacyjna wartość dodana: Czy nasza szkoła dobrze uczy?
Edukacyjna wartość dodana: Czy nasza szkoła dobrze uczy? rok szkolny 2014/2015 Metoda EWD to zestaw technik statystycznych pozwalających określić wkład szkoły w wyniki nauczania. Wyniki egzaminacyjne uczniów
EDUKACYJNA WARTOŚĆ DODANA
ŚLĄSKIE TECHNICZNE ZAKŁADY NAUKOWE EDUKACYJNA WARTOŚĆ DODANA ANALIZA 1. INFORMACJE OGÓLNE. Wskaźnik EWD i wyniki egzaminacyjne rozpatrywane są wspólnie. W ten sposób dają nam one pełniejszy obraz pracy
STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE
STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej
Trzyletni wskaźnik egzaminacyjny EWD
Trzyletni wskaźnik egzaminacyjny EWD Trzyletni wskaźnik EWD lub inaczej trzyletni wskaźnik egzaminacyjny to łączna prezentacja wyniku egzaminacyjnego i edukacyjnej wartości dodanej dla szkoły z trzech
RAPORT Z EGZAMINU GIMNAZJALNEGO 2012 Edukacyjna Wartość Dodana Trzyletnie wskaźniki egzaminacyjne
RAPORT Z EGZAMINU GIMNAZJALNEGO 2012 Edukacyjna Wartość Dodana Trzyletnie wskaźniki egzaminacyjne By ułatwić statystyczną interpretację pozycji gimnazjum, w układzie współrzędnych wyrysowano dwie elipsy.
Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe
Wprowadzenie do teorii ekonometrii Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe Zajęcia Wykład Laboratorium komputerowe 2 Zaliczenie EGZAMIN (50%) Na egzaminie obowiązują wszystkie informacje
Publiczna Szkoła Podstawowa nr 14 w Opolu. Edukacyjna Wartość Dodana
Publiczna Szkoła Podstawowa nr 14 w Opolu Edukacyjna Wartość Dodana rok szkolny 2014/2015 Edukacyjna Wartość Dodana (EWD) jest miarą efektywności nauczania dla szkoły i uczniów, którzy do danej placówki
Komputerowa Analiza Danych Doświadczalnych
Komputerowa Analiza Danych Doświadczalnych Prowadząca: dr inż. Hanna Zbroszczyk e-mail: gos@if.pw.edu.pl tel: +48 22 234 58 51 konsultacje: poniedziałek, 10-11, środa: 11-12 www: http://www.if.pw.edu.pl/~gos/students/kadd
Analiza niepewności pomiarów
Teoria pomiarów Analiza niepewności pomiarów Zagadnienia statystyki matematycznej Dr hab. inż. Paweł Majda www.pmajda.zut.edu.pl Podstawy statystyki matematycznej Histogram oraz wielobok liczebności zmiennej
Trafność testów egzaminacyjnych. Artur Pokropek, Tomasz Żółtak IFiS PAN
Trafność testów egzaminacyjnych Artur Pokropek, Tomasz Żółtak IFiS PAN Plan prezentacji EWD i trafność testów egzaminacyjnych Pięć postulatów trafności dla skal pomiarowych Wskaźniki egzaminacyjne a wyniki
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
WYKŁAD 8 ANALIZA REGRESJI
WYKŁAD 8 ANALIZA REGRESJI Regresja 1. Metoda najmniejszych kwadratów-regresja prostoliniowa 2. Regresja krzywoliniowa 3. Estymacja liniowej funkcji regresji 4. Testy istotności współczynnika regresji liniowej
Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów
Rozdział : Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów W tym rozdziale omówione zostaną dwie najpopularniejsze metody estymacji parametrów w ekonometrycznych modelach nieliniowych,
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y
Oszacowanie i rozkład t
Oszacowanie i rozkład t Marcin Zajenkowski Marcin Zajenkowski () Oszacowanie i rozkład t 1 / 31 Oszacowanie 1 Na podstawie danych z próby szacuje się wiele wartości w populacji, np.: jakie jest poparcie
Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
Modele DSGE. Jerzy Mycielski. Maj Jerzy Mycielski () Modele DSGE Maj / 11
Modele DSGE Jerzy Mycielski Maj 2008 Jerzy Mycielski () Modele DSGE Maj 2008 1 / 11 Modele DSGE DSGE - Dynamiczne, stochastyczne modele równowagi ogólnej (Dynamic Stochastic General Equilibrium Model)
Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:
Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
166 Wstęp do statystyki matematycznej
166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej
Analiza korespondencji
Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy
PROGRAM OPERACYJNY KAPITAŁ LUDZKI Priorytet III, Działanie 3.2 Rozwój systemu egzaminów zewnętrznych
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego PROGRAM OPERACYJNY KAPITAŁ LUDZKI Priorytet III, Działanie 3.2 Rozwój systemu egzaminów zewnętrznych EWD jako
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.
Raport dla szkoły Z BADANIA PODŁUŻNEGO W SZKOŁACH PODSTAWOWYCH. Efektywność nauczania na I etapie edukacyjnym
ͳ Raport dla szkoły Z BADANIA PODŁUŻNEGO W SZKOŁACH PODSTAWOWYCH Efektywność nauczania na I etapie edukacyjnym Dane szkoły Nr identyfikacyjny: Nazwa szkoły: Miejscowość: Adres: Instytut Badań Edukacyjnych
EWD w krakowskich gimnazjach z bardzo wysokimi wynikami egzaminu
Anna Rappe Okręgowa Komisja Egzaminacyjna w Krakowie EWD w krakowskich gimnazjach z bardzo wysokimi wynikami egzaminu W Krakowie, podobnie jak w każdym wielkim mieście, jest grupa szkół ciesząca się bardzo
5 Błąd średniokwadratowy i obciążenie
5 Błąd średniokwadratowy i obciążenie Przeprowadziliśmy 200 powtórzeń przebiegu próbnika dla tego samego zestawu parametrów modelowych co w Rozdziale 1, to znaczy µ = 0, s = 10, v = 10, n i = 10 (i = 1,...,
K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.
Sprawdzian 2. Zadanie 1. Za pomocą KMNK oszacowano następującą funkcję produkcji: Gdzie: P wartość produkcji, w tys. jp (jednostek pieniężnych) K wartość kapitału zaangażowanego w proces produkcji, w tys.
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
EDUKACYJNA WARTOŚĆ. OPRACOWANIE : Zespół ds. EWD przy Śląskim Kuratorze Oświaty z wykorzystaniem materiałów zespołu badawczego przy
EDUKACYJNA WARTOŚĆ DODANA OPRACOWANIE : Zespół ds. EWD przy Śląskim Kuratorze Oświaty z wykorzystaniem materiałów zespołu badawczego przy CKE pod kierunkiem dr. hab. R. Dolaty (Wydział Pedagogiczny Uniwersytetu
Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)
Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej) 1 Podział ze względu na zakres danych użytych do wyznaczenia miary Miary opisujące
Wykorzystanie danych egzaminacyjnych w ewaluacji szkół. materiały Pracowni EWD
Wykorzystanie danych egzaminacyjnych w ewaluacji szkół materiały Pracowni EWD Funkcje systemu egzaminacyjnego ocena osiągnięć szkolnych uczniów w świetle wymagań programowych (funkcja selekcyjna) diagnoza
STATYSTYKA MATEMATYCZNA
STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe i teoria prawdopodobieństwa 3. Populacje i próby danych 4. Testowanie hipotez i estymacja parametrów 5. Najczęściej wykorzystywane testy statystyczne
Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).
Statystyka i opracowanie danych Ćwiczenia 12 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA WIELORAKA Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych
Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 5 Mikołaj Czajkowski Wiktor Budziński Zadanie 1. Wykorzystując dane me.medexp3.dta przygotuj model regresji kwantylowej 1. Przygotuj model regresji kwantylowej w którym logarytm wydatków
Pobieranie prób i rozkład z próby
Pobieranie prób i rozkład z próby Marcin Zajenkowski Marcin Zajenkowski () Pobieranie prób i rozkład z próby 1 / 15 Populacja i próba Populacja dowolnie określony zespół przedmiotów, obserwacji, osób itp.
Wielogrupowy Model IRT Analizy Symulacyjne
dr Artur Pokropek Instytut Badań Edukacyjnych Zespół EWD Regionalne i lokalne diagnozy edukacyjne Wielogrupowy Model IRT Analizy Symulacyjne Wstęp Każdy model statystyczny zawiera szereg założeń, niekiedy
Rozkład normalny, niepewność standardowa typu A
Podstawy Metrologii i Technik Eksperymentu Laboratorium Rozkład normalny, niepewność standardowa typu A Instrukcja do ćwiczenia nr 1 Zakład Miernictwa i Ochrony Atmosfery Wrocław, listopad 2010 r. Podstawy
Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński
Wstęp do teorii niepewności pomiaru Danuta J. Michczyńska Adam Michczyński Podstawowe informacje: Strona Politechniki Śląskiej: www.polsl.pl Instytut Fizyki / strona własna Instytutu / Dydaktyka / I Pracownia
Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ
Współczynnik korelacji Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Własności współczynnika korelacji 1. Współczynnik korelacji jest liczbą niemianowaną 2. ϱ 1,
Mikroekonometria 3. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 3 Mikołaj Czajkowski Wiktor Budziński Zadanie 1. Wykorzystując dane me.hedonic.dta przygotuj model oszacowujący wartość kosztów zewnętrznych rolnictwa 1. Przeprowadź regresję objaśniającą
Kolokwium ze statystyki matematycznej
Kolokwium ze statystyki matematycznej 28.05.2011 Zadanie 1 Niech X będzie zmienną losową z rozkładu o gęstości dla, gdzie 0 jest nieznanym parametrem. Na podstawie pojedynczej obserwacji weryfikujemy hipotezę
10. Podstawowe wskaźniki psychometryczne
10. Podstawowe wskaźniki psychometryczne q analiza własności pozycji testowych q metody szacowania mocy dyskryminacyjnej q stronniczość pozycji testowych q własności pozycji testowych a kształt rozkładu
Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25
Testowanie hipotez Marcin Zajenkowski Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Aby porównać ze sobą dwie statystyki z próby stosuje się testy istotności. Mówią one o tym czy uzyskane
Zadania ze statystyki, cz.6
Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z
PUBLICZNA SZKOŁA PODSTAWOWA NR 7 IM. MIKOŁAJA KOPERNIKA W ZIELONEJ GÓRZE EWD
PUBLICZNA SZKOŁA PODSTAWOWA NR 7 IM. MIKOŁAJA KOPERNIKA W ZIELONEJ GÓRZE EWD NA PODSTAWIE WYNIKÓW TESTU OBUT 2012 ORAZ SPRAWDZIANU 2015 Opracowanie: Agnieszka Konieczna Listopad 2015 Wstęp 1 Ocena pracy
Interpretacja wyników standaryzowanych testów osiągnięć szkolnych na przykładzie skali 100/15
Interpretacja wyników standaryzowanych testów osiągnięć szkolnych na przykładzie skali 100/15 Michał Modzelewski Roman Dolata Zespół Szkolnych Uwarunkowań Efektywności Kształcenia Warszawa, 28 listopada
WSKAZÓWKI DO WYKONANIA SPRAWOZDANIA Z WYRÓWNAWCZYCH ZAJĘĆ LABORATORYJNYCH
WSKAZÓWKI DO WYKONANIA SPRAWOZDANIA Z WYRÓWNAWCZYCH ZAJĘĆ LABORATORYJNYCH Dobrze przygotowane sprawozdanie powinno zawierać następujące elementy: 1. Krótki wstęp - maksymalnie pół strony. W krótki i zwięzły
LABORATORIUM Z FIZYKI
LABORATORIUM Z FIZYKI LABORATORIUM Z FIZYKI I PRACOWNIA FIZYCZNA C w Gliwicach Gliwice, ul. Konarskiego 22, pokoje 52-54 Regulamin pracowni i organizacja zajęć Sprawozdanie (strona tytułowa, karta pomiarowa)
Estymacja punktowa i przedziałowa
Temat: Estymacja punktowa i przedziałowa Kody znaków: żółte wyróżnienie nowe pojęcie czerwony uwaga kursywa komentarz 1 Zagadnienia 1. Statystyczny opis próby. Idea estymacji punktowej pojęcie estymatora
Wyniki egzaminu gimnazjalnego rok szk. 2014/2015
Wyniki egzaminu gimnazjalnego rok szk. 2014/2015 W roku 2015 egzamin gimnazjalny odbył się w dniach 21, 22 i 23 kwietnia. Pierwszego dnia uczniowie rozwiązywali test z historii i wiedzy o społeczeństwie
1 Podstawy rachunku prawdopodobieństwa
1 Podstawy rachunku prawdopodobieństwa Dystrybuantą zmiennej losowej X nazywamy prawdopodobieństwo przyjęcia przez zmienną losową X wartości mniejszej od x, tzn. F (x) = P [X < x]. 1. dla zmiennej losowej
ŚLĄSKIE TECHNICZNE ZAKŁADY NAUKOWE EDUKACYJNA WARTOŚĆ DODANA
ŚLĄSKIE TECHNICZNE ZAKŁADY NAUKOWE EDUKACYJNA WARTOŚĆ DODANA ANALIZA 2014_2016 INTERPRETACJA WYNIKÓW W ŚLĄSKICH TECHNICZNYCH ZAKŁADACH NAUKOWYCH Metoda EWD to zestaw technik statystycznych pozwalających
Wprowadzenie do analizy korelacji i regresji
Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących
Statystyka i Analiza Danych
Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania wybranych technik regresyjnych do modelowania współzależności zjawisk Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki
ANALIZA WIELOPOZIOMOWA JAKO NARZĘDZIE WSPARCIA POLITYK PUBLICZNYCH
ANALIZA WIELOPOZIOMOWA JAKO NARZĘDZIE WSPARCIA POLITYK PUBLICZNYCH - Adrian Gorgosz - Paulina Tupalska ANALIZA WIELOPOZIOMOWA (AW) Multilevel Analysis Obecna od lat 80. Popularna i coraz częściej stosowana
Rozkład normalny. Marcin Zajenkowski. Marcin Zajenkowski () Rozkład normalny 1 / 26
Rozkład normalny Marcin Zajenkowski Marcin Zajenkowski () Rozkład normalny 1 / 26 Rozkład normalny Krzywa normalna, krzywa Gaussa, rozkład normalny Rozkłady liczebności wielu pomiarów fizycznych, biologicznych
Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )
Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału
Prawdopodobieństwo i rozkład normalny cd.
# # Prawdopodobieństwo i rozkład normalny cd. Michał Daszykowski, Ivana Stanimirova Instytut Chemii Uniwersytet Śląski w Katowicach Ul. Szkolna 9 40-006 Katowice E-mail: www: mdaszyk@us.edu.pl istanimi@us.edu.pl
SMOP - wykład. Rozkład normalny zasady przenoszenia błędów. Ewa Pawelec
SMOP - wykład Rozkład normalny zasady przenoszenia błędów Ewa Pawelec 1 iepewność dla rozkładu norm. Zamiast dodawania całych zakresów uwzględniamy prawdopodobieństwo trafienia dwóch wartości: P x 1, x
Stosowana Analiza Regresji
Model jako : Stosowana Analiza Regresji Wykład XI 21 Grudnia 2011 1 / 11 Analiza kowariancji Model jako : Oprócz czynnika o wartościach nominalnych chcemy uwzględnić wpływ predyktora o wartościach ilościowych
Matematyka ubezpieczeń majątkowych r.
Matematyka ubezpieczeń majątkowych 3..007 r. Zadanie. Każde z ryzyk pochodzących z pewnej populacji charakteryzuje się tym że przy danej wartości λ parametru ryzyka Λ rozkład wartości szkód z tego ryzyka
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA Powtórka Powtórki Kowiariancja cov xy lub c xy - kierunek zależności Współczynnik korelacji liniowej Pearsona r siła liniowej zależności Istotność
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2015
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2015 OPRACOWAŁY: ANNA ANWAJLER MARZENA KACZOR DOROTA LIS 1 WSTĘP Termin edukacyjna wartość dodana (EWD) oznacza zarówno
Analiza regresji - weryfikacja założeń
Medycyna Praktyczna - portal dla lekarzy Analiza regresji - weryfikacja założeń mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof.
Ważne rozkłady i twierdzenia c.d.
Ważne rozkłady i twierdzenia c.d. Funkcja charakterystyczna rozkładu Wielowymiarowy rozkład normalny Elipsa kowariacji Sploty rozkładów Rozkłady jednostajne Sploty z rozkładem normalnym Pobieranie próby
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012
Elementy statystyki wielowymiarowej
Wnioskowanie_Statystyczne_-_wykład Spis treści 1 Elementy statystyki wielowymiarowej 1.1 Kowariancja i współczynnik korelacji 1.2 Macierz kowariancji 1.3 Dwumianowy rozkład normalny 1.4 Analiza składowych
Zawansowane modele wyborów dyskretnych
Zawansowane modele wyborów dyskretnych Jerzy Mycielski Uniwersytet Warszawski grudzien 2013 Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 1 / 16 Model efektów
Podstawy opracowania wyników pomiarów z elementami analizy niepewności statystycznych
Podstawy opracowania wyników pomiarów z elementami analizy niepewności statystycznych Dr inż. Marcin Zieliński I Pracownia Fizyczna dla Biotechnologii, wtorek 8:00-10:45 Konsultacje Zakład Fizyki Jądrowej
Rozdział 8. Regresja. Definiowanie modelu
Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność
Edukacyjna Wartość Dodana
Edukacyjna Wartość Dodana RAPORT EWD ZA ROK SZKOLNY 2013/2014 Gimnazjum nr 7 im. Konstytucji 3 Maja Opracowała: Marzena Mrzygłód Koszalin, 5 września 2014 r. 1. Wyniki absolwentów ze sprawdzianu po szkole
Model EWD dla II etapu edukacyjnego.
Model EWD dla II etapu edukacyjnego. Na podstawie materiałów Pracowni EWD Instytut Badań Edukacyjnych Warszawa, 28-29.11.2014 r. Plan zajęć /moduł 9. i 10./ 1. Idea EWD 2. Model EWD dla II etapu 3. Prezentacja
Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r
Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów
Metoda największej wiarygodności
Metoda największej wiarygodności Próbki w obecności tła Funkcja wiarygodności Iloraz wiarygodności Pomiary o różnej dokładności Obciążenie Informacja z próby i nierówność informacyjna Wariancja minimalna
Klasyfikacja w oparciu o metrykę budowaną poprzez dystrybuanty empiryczne na przestrzeni wzorców uczących
Klasyfikacja w oparciu o metrykę budowaną poprzez dystrybuanty empiryczne na przestrzeni wzorców uczących Cezary Dendek Wydział Matematyki i Nauk Informacyjnych PW Plan prezentacji Plan prezentacji Wprowadzenie