Zrównywanie wyników egzaminów zewnętrznych z wykorzystaniem modeli IRT
|
|
- Bogdan Kania
- 6 lat temu
- Przeglądów:
Transkrypt
1 Bartosz Kondratek Instytut Badań Edukacyjnych Ewaluacja w edukacji: koncepcje, metody, perspektywy Zrównywanie wyników egzaminów zewnętrznych z wykorzystaniem modeli IRT Wprowadzenie Mimo wysiłków twórców arkuszy egzaminacyjnych, aby utrzymać stały poziom trudności egzaminów zewnętrznych, nie sposób uniknąć występowania fluktuacji trudności między kolejnymi sesjami. Niezależnie od zmian trudności egzaminów między sesjami mogą również występować zmiany w poziomie umiejętności uczniów. W konsekwencji pokrywania się (ang. confounding) tych dwóch zjawisk nieobciążone porównywanie wyników uczniów między sesjami nie jest możliwe bez zastosowania statystycznej procedury zrównywania wyników (ang. test equating), która rozdzielałaby różnice w trudności testów od różnic w poziomie umiejętności uczniów. Rysunek 1. Średnie z egzaminu gimnazjalnego na przestrzeni lat Przykładowo średnie wyniki egzaminu gimnazjalnego w latach zmieniały się w zakresie od 24 do 28 oraz od 27 do 33 dla części matematyczno-przyrodniczej oraz humanistycznej odpowiednio (rys. 1.). Bez zrównania wyników nie jesteśmy w stanie stwierdzić, w jakim stopniu zaobserwowane zmiany średnich są konsekwencją różnic w trudnościach testów, a w jakim odzwierciedlają zmiany w poziomie umiejętności uczniów. Uniemożliwia to wyznaczenie trendu zmian poziomu umiejętności jak i porównywanie wyników pojedynczych uczniów przystępujących do egzaminów w różnych latach. Problem jest zatem doniosły. 427
2 XVII Konferencja Diagnostyki Edukacyjnej, Kraków 2011 W artykule zostaną przybliżone podstawowe metody zrównywania wyników obserwowanych z wykorzystaniem modeli IRT (Item Response Theory) dla planu nierównoważnych grup z testem kotwiczącym (ang. Nonequivalent Groups with Anchor Test, NEAT). Następnie zostanie opisany prosty eksperyment Monte Carlo, ilustrujący właściwości zrównywania IRT metodą kalibracji łącznej. Zrównywanie wyników w planie NEAT Plan NEAT jest podstawowym planem zbierania danych umożliwiającym zrównanie wyników dwóch różnych testów, X oraz Y, rozwiązywanych przez rozłączne populacje, P oraz Q. Schematycznie przedstawiono go w tab. 1. Tabela 1. Plan nierównoważnych grup z testem kotwiczącym Populacja Test X Y A P Q Odpowiedzi uczniów na testy X oraz Y w sposób bezpośredni pozwalają oszacować dystrybuanty Fx P oraz Fx Q, jednak nie mamy informacji o dystrybuantach Fx Q oraz Fx P opisujących rozkład wyników testu X w populacji Q oraz testu Y w populacji P. Aby oszacować Fx Q oraz Fx P dane muszą być połączone (ang. linked), co w planie NEAT następuje poprzez wykorzystanie dodatkowego zestawu zadań rozwiązywanego przez uczniów z obu populacji nosi on nazwę kotwicy (ang. anchor) i w tab. 1. został oznaczony literą A. Kotwica może stanowić odrębny test, może również być zbiorem zadań znajdujących w tym samym arkuszu co zrównywane testy, ale nie uwzględnianych przy obliczaniu punktacji w testach X oraz Y. Dla ustalenia wagi przyjmijmy, że testem bazowym, do którego pragniemy odnosić wyniki drugiego testu, jest test X. Zadaniem stojącym przed procedurą zrównywania jest oszacowanie dystrybuanty Fx Q opisującej rozkład testu X w populacji Q, w której nigdy nie był on administrowany. Znając dystrybuantę Fx Q możemy wyznaczyć ekwicentylową funkcję zrównującą eq x (ang. equating function) przypisującą każdemu wynikowi y w teście Y jego odpowiednik x w teście X: Górny lewy indeks (cont) przy dystrybuantach został wprowadzony na oznaczenie uciąglenia i wygładzenia dystrybuant. Operacja taka jest konieczna, ponieważ wynik w teście jest zmienną dyskretną i odpowiadająca mu dystrybuanta ma postać funkcji skokowej takiej funkcji nie można odwracać. Najpopularniejszymi metodami uciąglania skokowych dystrybuant jest lokalna interpolacja liniowa oraz wygładzanie za pomocą estymatora jądrowego (kernel smoothing). Pogłębiony przegląd pierwszego podejścia można znaleźć u Kolen & Brennan (2004), a drugiego u von Davier et. al. (2004). Za szczególny, zdegenerowany, sposób wygładzania dystrybuant w równaniu (1) można również uznać (Dorans et. al., 2011) zrównywanie liniowe, które jest oparte jedynie na dwóch pierwszych momentach rozkładów: (1) 428
3 Ewaluacja w edukacji: koncepcje, metody, perspektywy Zrównywanie wyników z wykorzystaniem IRT Bez wprowadzania dodatkowych założeń dotyczących modelu pomiarowego leżącego u podstaw udzielania odpowiedzi na zadania testu zrównanie wyników dla planu NEAT jest możliwe np. poprzez zastosowanie zrównywania łańcuchowego (ang. chained equating) lub post-stratyfikacyjnego (ang. poststratified equating). Czytelnik zainteresowany tymi metodami może sięgnąć do wspomnianej monografii von Davier et. al. (2004). Niniejszy artykuł zajmie się natomiast metodami opartymi na IRT, w których mechanizm udzielania odpowiedzi na zadania testów jest modelowany explicite. W IRT odpowiedzi na zadania testu u i są zmiennymi losowymi opisanymi poprzez parametry charakteryzujące właściwości zadań oraz ukrytą zmienną losową θ modelującą poziom umiejętności uczniów. Zmienna θ może być wielowymiarowa (również w kontekście zrównywania Reckase, 2009), jednak my skoncentrujemy się na rozwiązaniach z pojedynczym wymiarem. Rozkład θ najczęściej przyjmuje się jako normalny N(μ, σ 2 ). Jednowymiarowym modelem dla zadań ocenianych dychotomicznie jest, przykładowo, dwuparametryczny model logistyczny (2PLM), w którym prawdopodobieństwo udzielenia prawidłowej odpowiedzi na zadanie i w zależności od poziomu umiejętności θ jest określone funkcją, nomen omen, dwójki parametrów β i =(a i,b i ): Szczegółowe omówienie właściwości modelu danego wzorem (2) można znaleźć u Kondratka (2007) oraz praktycznie w każdym innym tekście wprowadzającym do tematyki IRT. Dla dychotomicznych zadań funkcja ρ i (θ) w elegancki sposób pozwala określić prawdopodobieństwo dowolnej odpowiedzi (czyli 0 lub 1) w zależności od θ: (2) co przy uwzględnieniu założenia o jednowymiarowości testu (precyzyjniej: lokalnej niezależności Lord & Novick, 1968), pozwala przedstawić prawdopodobieństwo dowolnego wektora odpowiedzi u na wszystkie n zadań testu w zależności od θ jako następujący produkt: Całkując powyższe warunkowe prawdopodobieństwo przez rozkład umiejętności, otrzymujemy sparametryzowane modelem IRT prawdopodobieństwo uzyskania dowolnego wektora odpowiedzi w danym teście w określonej populacji: 429
4 XVII Konferencja Diagnostyki Edukacyjnej, Kraków 2011 Rozkład wektora odpowiedzi podany wzorem (3) określa wszystkie statystyczne właściwości testu w populacji, jednak do zrównania testów potrzebny jest jedynie rozkład wyniku sumarycznego. Konkretnie, dla wyznaczenia funkcji zrównującej (1) potrzeba prawdopodobieństw określających dystrybuanty: (3) (4a) (4b) Uzyskanie prawdopodobieństw P(Y=y Q) oraz P(X=x Q) z rozkładów wektorów odpowiedzi: (5a) 430 (5b) oznacza rozpatrzenie wszystkich takich wektorów odpowiedzi uy oraz ux, które dają sumaryczny wynik y oraz x. Rekursywny algorytm pozwalający na rozwiązanie tego kombinatorycznego problemu został podany przez Lorda i Wingersky ego (1983). Alternatywnie, w celu uniknięcia konieczności numerycznego całkowania skomplikowanych funkcji można na bazie parametrów modelu IRT wygenerować wystarczająco dużą liczbę wektorów odpowiedzi uy oraz ux i zliczyć proporcję wektorów dających określone wyniki sumaryczne (Glas & Béguin, 1996). Ostatecznie, wyzwaniem, z jakim trzeba się zmierzyć, chcąc zrównać ze sobą testy X oraz Y z wykorzystaniem IRT, jest umieszczenie wszystkich parametrów modelu, β y, β x, μ Q, σ 2 Q, μ P, σ 2 P na wspólnej skali. W planie NEAT koniecznej do tego celu informacji dostarcza link utworzony przez test kotwiczący A rozwiązywany przez uczniów z obu populacji. W literaturze można znaleźć różne podejścia do tego problemu, z których najbardziej prominentne to: 1. Kalibracja łączna (ang. concurrent callibration), która wykorzystuje zdolność procedury stosowanej do estymacji parametrów IRT do radzenia sobie z brakiem danych występującym w modelu NEAT. Parametry β A,β y, β x, μ Q, σ 2 Q, μ P, σ 2 P są oszacowane jednocześnie i znajdują się na wspólnej skali bez konieczności stosowania dodatkowych przekształceń. 2. Kalibracja oddzielna (ang. separate callibration), w której w pierwszym kroku dla każdej populacji niezależnie szacowane są parametry testów rozwiązywanych przez uczniów z nich pochodzących. Następnie, uzyskane w pierwszym kroku zestawy parametrów β A P, β X P, oraz β A Q, β Y Q i arbitralnie ustalone dla identyfikacji modelu wartości μ oraz σ 2 sprowadza się
5 Ewaluacja w edukacji: koncepcje, metody, perspektywy do wspólnej skali. Sprowadzenie do wspólnej skali opiera się na fakcie, że β A P i β A Q są parametrami tego samego testu i powinny w wyniku przeskalowania mieć takie same wartości. Przeskalowanie parametrów odbywa się poprzez liniową funkcję, której parametry można uzyskać wieloma sposobami. Najważniejsze z nich to metody: średnia/średnia, średnia/sigma, metoda Haebary, metoda Stockinga-Lorda ich opis można znaleźć u Kolen & Brennan (2004). 3. Metoda ustalonych parametrów (ang. fixed parameters) wymaga również przeprowadzenia dwóch kalibracji. Przy czym w pierwszym kroku kalibruje się test i kotwicę tylko w jednej z populacji, załóżmy P, uzyskując parametry β A P, β X P, μ P, σ 2 P. Następnie, przy kalibracji testu i kotwicy w populacji Q, parametry kotwicy ustala się na wartościach z pierwszego kroku, β A Q = β A P. W drugim kroku z danych estymuje się zatem jedynie parametry β Y Q. W ten sposób wszystkie parametry β A,β y, β x, μ Q, σ 2 Q, μ P, σ 2 P znajdują się na wspólnej skali, ustalonej w kroku pierwszym. Wymienione metody sprowadzania parametrów IRT do wspólnej skali dla planu NEAT były wielokrotnie porównywane poprzez symulacje. Badania Hanson & Béguin (1999) oraz Kang & Petersen (2009) wskazują na dużą zgodność między wymienionymi metodami z wyjątkiem kalibracji oddzielnej z przeskalowaniem średnia/średnia lub średnia/sigma (wypadały gorzej). Oczywiście wnioski wyciągane z takich badań są ograniczone do konkretnych warunków eksperymentalnych (wielkość próby, parametry testu itp.) lub szczegółów implementacji algorytmów szacujących parametry IRT w użytym oprogramowaniu. Przykład zrównania wyników z wykorzystaniem kalibracji łącznej Model IRT dla planu NEAT stanowi jednoznaczny opis wszystkich probabilistycznych właściwości testów A, X, Y w obu analizowanych populacjach. Oznacza to, że przyjmując określone wartości dla parametrów β A,β y, β x, μ Q, σ 2 Q, μ P, σ 2 P możemy generować odpowiedzi uczniów wylosowanych z P lub Q na dowolny z trzech testów A, X, Y. Stwarza to możliwość przeprowadzenia eksperymentu Monte Carlo sprawdzającego efektywność danej metody zrównywania wyników testowych w planie NEAT. W dalszej części, jako ilustracja możliwości zrównywania wyników obserwowanych z wykorzystaniem IRT, opisane zostaną wyniki takiego eksperymentu. Zmienne niezależne w przeprowadzonym eksperymencie były dwie i każda z nich przyjmowała dwa poziomy: 1. wielkość próby: N =1 000 lub N = uczniów z każdej populacji; 2. średnia θ w populacji Q:μ Q =0.4 lub μ Q =0.8. Ustalonymi warunkami w eksperymencie były: 1. parametry β A,β y, β x, opisujące właściwości testów w modelu 2PLM (2): tab. 2; 2. rozkład θ w populacji P: μ P =0 oraz σ 2 P=1; 3. wariancja θ w populacji Q: σ 2 Q=1; 4. metoda sprowadzania parametrów modelu do wspólnej skali: łączna kalibracja z wykorzystaniem programu MIRT (Glas, 2010); 5. liczba replikacji dla każdej kombinacji poziomów zmiennych. niezależnych: R =
6 XVII Konferencja Diagnostyki Edukacyjnej, Kraków 2011 Jako zmienną zależną przyjęto dobroć oszacowania rozkładu testu X populacji Q w porównaniu do dobroci oszacowania rozkładu testu Y w populacji Q, gdzie dobroć rozumiana jest zarówno jako wariancja, jak i obciążenie estymatora. Zaproponowane zrelatywizowanie miary efektywności zrównywania wymaga pewnego komentarza. Rozkład testu X populacji Q oraz rozkład testu Y w populacji Q zostały określone dystrybuantami (4b) oraz (4a). Oba rozkłady są konieczne do wyznaczenia funkcji zrównującej (1), jednak kwintesencja procesu zrównywania dotyczy pierwszego z wspomnianych rozkładów, tj. FX Q żaden uczeń z populacji Q faktycznie nie rozwiązuje ani jednego zadania z testu X. Koncentrując się jedynie na dobroci oszacowania rozkładu FX Q, zgubilibyśmy jednak istotny kontekst, mianowicie, że szacowany z ograniczonej próby rozkład FY Q też jest obarczony błędem. Jakość oszacowania FY Q stanowi kryterium mówiące o tym, jak dobrze można oszacować rozkład odpowiedzi, gdy dane są bezpośrednio dostępne i dopiero przy uwzględnieniu tej informacji możemy stwierdzić, o ile gorsze jest pośrednie (poprzez wykorzystanie łącza zadaniami kotwiczącymi A) oszacowanie rozkładu FX Q. Tabela 2. Parametry zadań użyte do generowania danych symulacyjnych Parametry dla testów X oraz Y Parametry dla testu A zad. a i b i zad. a i b i zad. a i b i zad. a i b i Należy również skomentować podstępny dobór parametrów dla testów X oraz Y widoczny w tabeli 2. Oba testy mają po 40 zadań o identycznych parametrach, zatem testy X oraz Y są sobie w pełni równoważne. W tej sytuacji żadne zrównywanie nie jest faktycznie potrzebne uczeń z populacji Q w teście X powinien dostać dokładnie tyle punktów, ile dostał w teście Y, a rozkład FX Q jest dokładnie taki sam jak rozkład FY Q. Nie znając prawdziwych wartości parametrów, jednak tego nie wiemy, a ponieważ średnie μ θ P oraz μ θ Q są różne, na poziomie obserwacyjnym uzyskamy różne rozkłady wyników sumarycznych w X oraz Y rozkłady testu X dla μ θ P =0 oraz testu Y dla μ θ Q =0.4 lub μ θ Q =0.8 ukazano na rys. 2. Do stwierdzenia równoważności testów X oraz Y trzeba zastosować procedurę zrównującą wyniki. 432
7 Ewaluacja w edukacji: koncepcje, metody, perspektywy Rysunek 2. Rozkłady wyników w testach X oraz Y w zależności od μ θ Ustalenie identycznych parametrów dla testów X oraz Y ma natomiast bardzo duże znaczenie w kontekście zrelatywizowanej oceny dobroci oszacowania FX Q względem dobroci oszacowania FY Q. Bez identyczności testów X oraz Y ewentualne różnice między dobrocią oszacowania FX Q oraz FY Q mogłyby wynikać nie tylko z tego, czy rozkład jest szacowany bezpośrednio/pośrednio, ale także z różnic w psychometrycznych właściwościach dwóch testów. Omówienie wyników przeprowadzonych symulacji rozpoczniemy od zanalizowania dokładności, z jaką zastosowana metoda IRT potrafi oszacować średnie wyników sumarycznych: μx Q oraz μy Q. Jeżeli oznaczymy poprzez oszacowanie średniej μx Q uzyskane w replikacji r, to następująca średnia: stanowi oszacowanie Monte Carlo wartości oczekiwanej rozpatrywanego estymatora. Oszacowanie Monte Carlo wariancji estymatora obliczane jest w następujący sposób: Analogicznie można określić oraz s 2. Otrzymane średnie i wariancje estymatorów oraz zebrano w tab. 3. Wspomniana tabela zawiera również prawdziwe wartości μx Q oraz μy Q wyliczone na podstawie założonych parametrów odpowiadają one rozkładom na rys. 2. Można również zauważyć, że w konsekwencji równoważności testów mamy μx Q=μY Q przy ustalonej wartości μ θ Q. Dla wszystkich warunków eksperymentalnych oszacowane średnie oraz sugerują brak obciążenia estymatorów do pierwszego miejsca po przecinku. Najsilniejsze sygnały o występowaniu obciążenia na drugim miejscu po przecinku pojawiają się, paradoksalnie, przy oszacowaniu μy Q, czyli dla średniej w teście 433
8 XVII Konferencja Diagnostyki Edukacyjnej, Kraków 2011 faktycznie administrowanym uczniom z Q i to przy większej próbie N= Analizując rozproszenie estymatora, widzimy, że wariancja s 2 ( ) dla N=1 000 jest tylko nieznacznie większa niż wariancja s 2 ( ), a dla próby N= stosunek tych wariancji jest poniżej 2 : 1. Uwzględniając, że między N=1 000 a N= wariancje różnią się o ponad rząd wielkości, należy stwierdzić, że wariancja oszacowania średniej w teście zależy przede wszystkim od wielkości próby, a nie od tego, czy test był lub nie był w danej populacji rozwiązywany. Ogólne spostrzeżenie jest takie, że zastosowana procedura zrównywania pozwala dla uczniów z populacji Q oszacować średnią w teście nierozwiązywanym przez nich (μx Q) praktycznie równie dobrze jak w teście faktycznie przez nich rozwiązywanym (μy Q ). Tabela 3. Oszacowania średniego wyniku sumarycznego w testach X oraz Y w populacji Q w zależności od warunków eksperymentalnych (opis w tekście) N μ θ Q μx Q s 2 ( ) μy Q s 2 ( ) Założonym celem symulacji było sprawdzenie zdolności procedury zrównywania wyników do oszacowania całego rozkładu testu X w populacji Q, a nie tylko jego średniej. Analogicznie do oraz obliczono dla każdego wyniku x w teście X oraz y w teście Y oszacowanie Monte Carlo wartości oczekiwanej estymatorów proporcji: oraz (gdzie px Q oraz py Q są skróconym zapisem prawdopodobieństw pojawiających się z prawej strony wzorów na dystrybuanty (4a) i (4b) lub na wykresie na rys. 2. Podobnie obliczono oszacowania Monte Carlo wariancji estymatorów proporcji: s 2 ( ) oraz s 2 ( ) Od proporcji oraz odjęto prawdziwe (wynikające z założonych parametrów β y, β x, μ Q, σ 2 Q) wartości oraz (rys. 2.), uzyskując oszacowania Monte Carlo obciążenia estymatorów proporcji: B( ) oraz B( ). Uzyskane obciążenia estymatorów proporcji zebrano na wykresie na rys. 3., a wariancje estymatorów proporcji zebrano na wykresie na rys. 4. Rysunek 3. Obciążenie estymatorów oraz w zależności od wartości wyniku 434
9 Ewaluacja w edukacji: koncepcje, metody, perspektywy sumarycznego dla różnych warunków eksperymentalnych Wykres z obciążeniami (rys. 3.) potwierdza obserwację poczynioną dla średniej (tab. 3.), że dla ustalonej wartości μ θ Q takie czynniki jak wielkość próby oraz to, czy test był, czy nie był faktycznie rozwiązywany przez uczniów z Q nie miały praktycznie żadnego znaczenia dla obciążenia estymatora. Cztery analizowane krzywe obciążeń dla μ θ Q=0.04 praktycznie pokrywają się ze sobą, tak samo dla μ θ Q =0.08. Bardzo interesujące jest występowanie istotnego obciążenia estymatora, zmieniającego się w zależności od wyniku sumarycznego. Obciążenie zmienia dwukrotnie swój kierunek dla najniższych i najwyższych wyników w teście proporcje są zaniżone, natomiast dla wyników przeciętnych są zawyżone. Maksimum zawyżenia proporcji przypada w rejonie średniego wyniku sumarycznego w teście, tj. (tab. 3.) w rejonie dla μ θ Q =0.04 oraz w rejonie dla μ θ Q =0.08 stąd dwie wiązki krzywych na rys. 3. są przesunięte względem siebie. Lokalnie znaczne obciążenie umknęło przy analizie zdolności procedury zrównywania do oszacowania średniej w teście (tab. 3.), właśnie ponieważ obciążenie proporcji zmienia swój znak i znosi się przy obliczaniu średniej. Wykres obciążeń sugeruje, że oszacowana za pomocą programu MIRT wariancja μ 2 θ Q była ujemnie obciążona rozkład θ w populacji Q legł w procesie estymacji zbytniemu skurczeniu względem parametrów β y oraz β x i uzyskaliśmy zbyt dużą koncentrację uczniów o przeciętnych wynikach z niedoszacowaniem udziału uczniów o wynikach skrajnych. Wykres z wariancjami (rys. 4.) natomiast potwierdza, że wariancja oszacowań zależy przede wszystkim od wielkości próby (por. tab. 3.). Dla warunku N= mamy wiązkę czterech wariancji niewykraczających ponad wartość , gdy dla warunku N=1 000 odpowiednie wariancje są od kilku do kilkunastu razy większe. W dalszej kolejności istotnym czynnikiem wpływającym na wielkość wariancji oszacowań proporcji jest, czy dany test był administrowany w populacji, czy też proporcje obliczono na podstawie łącza stworzonego przez test kotwiczącya. Dla ustalonego N wariancje s 2 ( ) były dla większości punktów sumarycznych większe od odpowiadających im s 2 ( ) to też jest zgodne z obserwacjami poczynionymi dla średniej w całym teście (tab. 3.). Rysunek 4. Wariancja estymatorów oraz w zależności od wartości wyniku sumarycznego dla różnych warunków eksperymentalnych 435
10 XVII Konferencja Diagnostyki Edukacyjnej, Kraków 2011 Obserwujemy także specyficzną zmienność wariancji w zależności od wyniku sumarycznego: najniższe wariancje przypadają dla wyników skrajnych oraz dla wyników zbliżonych do średniego wyniku w danym teście. Oba zjawiska łatwo można wytłumaczyć poprzez odwołanie się do klasycznego wzoru na wariancję estymatora proporcji: p(1-p)/n. Na skrajach rozkładu wyników sumarycznych proporcje są bardzo małe, co się przekłada na to, że p(1-p) przyjmuje niewielkie wartości. W centrum rozkładu wyrażenie p(1-p) jest relatywnie większe, jednak znajduje się tam również dużo wyników (n) powodujących, że proporcja jest oszacowana z większą precyzją. Wnioski Z przeprowadzonego symulacyjnego badania właściwości zrównywania z wykorzystaniem kalibracji łącznej modelu IRT można dojść do następujących konkluzji: 1. Zastosowana metoda zrównywania szacuje parametry rozkładu testu X uczniów z populacji Q w planie NEAT (tab. 1.) porównywalnie dobrze do tego, jak szacuje parametry rozkładu testu Y dla tej samej populacji. 2. Ze względu na obciążenie oszacowań największej wiarygodności parametrów modelu IRT (Lord, 1983) oszacowania proporcji wyników sumarycznych również wykazują obciążenie. Na poziomie wyniku średniego obciążenia się znoszą, jednak może mieć to istotne znaczenie na poziomie konkretnych sumarycznych wyników, czyli na poziomie, na którym liczona jest funkcja zrównująca dana wzorem (1). Potencjalne niebezpieczeństwo obciążenia samej funkcji zrównującej może jednak być załagodzone przez fakt, że obciążenia dla rozkładu testu Y mają podobny wzór jak obciążenia dla rozkładu X i mimo występujących obciążeń FY Q oraz FX Q samo przekształcenie zrównujące może być nieobciążone. Problem wymaga dalszych badań. 3. Oszacowania proporcji sumarycznych wyników wykazują zmienną wariację. Oznacza to, że błąd zrównywania powinien być raportowany w sposób warunkowy. Bibliografia: 1. Dorans, N. J. & Moses, T. P. & Eignor, D. R. (2011). Equating Test Scores: Toward Best Practices. In von Davier, A. A. (Ed.), Statistical Models for Test Equating, Scaling, and Linking (pp ). New York, NY: Springer-Verlag. 2. Glas C. A. (2010). Preliminary Manual of the software program Multidimensional Item Response Theory (MIRT). (University of Twente) 3. Glas C. A. W. & Béguin A. A. (1996). Appropriateness of IRT Observed-Score Equating (Research Report ). 4. Hanson, B. A. & Béguin A. A. (1999). Separate Versus Concurent Estimation of IRT Item Parameters in the Common Item Equating Design (ACT Research Report Series, ). Iowa City, IA: ACT, Inc. 436
11 Ewaluacja w edukacji: koncepcje, metody, perspektywy 5. Kang, T., Petersen N. (2009). Linking Item Parameters to a Base Scale (ACT Research Report Series, ). Iowa City, IA: ACT, Inc. 6. Kolen, M. J., & Brennan R. L. (2004). Test equating, scaling, and linking: Method and practice (2nd ed.). New York, NY: Springer-Verlag. 7. Kondratek B. (2007). Teoria odpowiadania na pozycje testowe oraz klasyczna teoria testów. Porównanie w kontekście modelowania statystycznego sytuacji eksperymentalnej badania testem. Egzamin, 9, Lord, F. M. (1983). Statistical bias in maximum likelihood estimators of item parameters. Psychometrika, 48 (3), Lord, F. M. & Novick, M. R. (1968). Statistical Theories of Mental Test Scores. Reading, Massachusetts: Addison-Wesley. 10. Lord, F. M., Wingersky, M. S. (1983). Comparison of IRT Observed-Score and True- Score Equatings. ETS Research Report: ETS-RR ONR. 11. Reckase, M. D. (2009). Multidimensional Item Response Theory. New York, NY: Springer-Verlag. 12. von Davier, A. A., Holland, P. W., & Thayer, D. T. (2004). The kernel method of test equating. New York, NY: Springer-Verlag. 437
Wielogrupowy Model IRT Analizy Symulacyjne
dr Artur Pokropek Instytut Badań Edukacyjnych Zespół EWD Regionalne i lokalne diagnozy edukacyjne Wielogrupowy Model IRT Analizy Symulacyjne Wstęp Każdy model statystyczny zawiera szereg założeń, niekiedy
Porównywalne między latami wyniki sprawdzianu
Porównywalne między latami wyniki sprawdzianu ZESPÓŁ ANALIZ OSIĄGNIĘĆ UCZNIÓW Instytut Badań Edukacyjnych Plan prezentacji 1.Po co nam zrównywanie wyników pomiędzy latami? 2.W jaki sposób przeprowadzono
Porównywalne między latami wyniki egzaminacyjne
Porównywalne między latami wyniki egzaminacyjne ZESPÓŁ ANALIZ OSIĄGNIĘĆ UCZNIÓW Instytut Badań Edukacyjnych Plan prezentacji 1. Zrównywanie wyników egzaminacyjnych w innych krajach 2. Po co nam zrównywanie
Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa
Spis treści Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa Romuald Kotowski Katedra Informatyki Stosowanej PJWSTK 2009 Spis treści Spis treści 1 Wstęp Bardzo często interesujący
Porównywalne między latami wyniki egzaminacyjne
Porównywalne między latami wyniki egzaminacyjne ZESPÓŁ ANALIZ OSIĄGNIĘĆ UCZNIÓW Instytut Badań Edukacyjnych Henryk Szaleniec, Bartosz Kondratek Plan prezentacji 1.Po co nam zrównywanie wyników pomiędzy
Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów
Rozdział : Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów W tym rozdziale omówione zostaną dwie najpopularniejsze metody estymacji parametrów w ekonometrycznych modelach nieliniowych,
Monte Carlo, bootstrap, jacknife
Monte Carlo, bootstrap, jacknife Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej: http://www.ssc.wisc.edu/~bhansen/econometrics/ Monte Carlo: rozdział 8.8, 8.9 Bootstrap: rozdział
Oszacowanie umiejętności teta oraz wyskalowanie osi w metodzie IRT dla potrzeb obliczania parametrów zadań
Sławomir Sapanowski Okręgowa Komisja Egzaminacyjna w Łodzi Oszacowanie umiejętności teta oraz wyskalowanie osi w metodzie IRT dla potrzeb obliczania parametrów zadań W ostatnim czasie wśród ekspertów zajmujących
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2012
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2012 OPRACOWAŁY: ANNA ANWAJLER MARZENA KACZOR DOROTA LIS 1 WSTĘP W analizie wykorzystywany będzie model szacowania EWD.
Pobieranie prób i rozkład z próby
Pobieranie prób i rozkład z próby Marcin Zajenkowski Marcin Zajenkowski () Pobieranie prób i rozkład z próby 1 / 15 Populacja i próba Populacja dowolnie określony zespół przedmiotów, obserwacji, osób itp.
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2013
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2013 OPRACOWAŁY: ANNA ANWAJLER MARZENA KACZOR DOROTA LIS 1 WSTĘP W analizie wykorzystywany będzie model szacowania EWD.
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012
Autorzy: Bartosz Kondratek Filip Kulon Artur Pokropek Henryk Szaleniec Dorota Węziak-Białowolska
Warszawa, październik 2012 Autorzy: Bartosz Kondratek Filip Kulon Artur Pokropek Henryk Szaleniec Dorota Węziak-Białowolska Wydawca: Instytut Badań Edukacyjnych ul. Górczewska 8 01-180 Warszawa tel. (22)
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl
Metody probabilistyczne
Metody probabilistyczne 13. Elementy statystki matematycznej I Wojciech Kotłowski Instytut Informatyki PP http://www.cs.put.poznan.pl/wkotlowski/ 17.01.2019 1 / 30 Zagadnienia statystki Przeprowadzamy
RAPORT WSKAŹNIK EDUKACYJNEJ WARTOŚCI DODANEJ PO EGZAMINIE GIMNAZJALNYM W ROKU SZKOLNYM 2012/2013
RAPORT WSKAŹNIK EDUKACYJNEJ WARTOŚCI DODANEJ PO EGZAMINIE GIMNAZJALNYM W ROKU SZKOLNYM 2012/2013 ZESPÓŁ SZKÓŁ NR 14 W BYDGOSZCZY GIMNAZJUM NR 37 INTEGRACYJNE Opracowanie A. Tarczyńska- Pajor na podstawie
Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:
Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności
Matematyka ubezpieczeń majątkowych r.
Matematyka ubezpieczeń majątkowych 3..007 r. Zadanie. Każde z ryzyk pochodzących z pewnej populacji charakteryzuje się tym że przy danej wartości λ parametru ryzyka Λ rozkład wartości szkód z tego ryzyka
Kontekstowe wskaźniki efektywności nauczania - warsztaty
Kontekstowe wskaźniki efektywności nauczania - warsztaty Przygotowała: Aleksandra Jasińska (a.jasinska@ibe.edu.pl) wykorzystując materiały Zespołu EWD Czy dobrze uczymy? Metody oceny efektywności nauczania
Zadania ze statystyki, cz.6
Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
Ważne rozkłady i twierdzenia c.d.
Ważne rozkłady i twierdzenia c.d. Funkcja charakterystyczna rozkładu Wielowymiarowy rozkład normalny Elipsa kowariacji Sploty rozkładów Rozkłady jednostajne Sploty z rozkładem normalnym Pobieranie próby
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Testowanie hipotez statystycznych
9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :
Wyniki egzaminu gimnazjalnego na wspólnej skali
Edukacja 2012, 3 (119), 9-30 ISSN 0239-6858 Wyniki egzaminu gimnazjalnego 2002 2010 na wspólnej skali HENRYK SZALENIEC*, MAGDALENA GRUDNIEWSKA*, BARTOSZ KONDRATEK*, FILIP KULON*, ARTUR POKROPEK* W artykule
Wnioskowanie bayesowskie
Wnioskowanie bayesowskie W podejściu klasycznym wnioskowanie statystyczne oparte jest wyłącznie na podstawie pobranej próby losowej. Możemy np. estymować punktowo lub przedziałowo nieznane parametry rozkładów,
Spacery losowe generowanie realizacji procesu losowego
Spacery losowe generowanie realizacji procesu losowego Michał Krzemiński Streszczenie Omówimy metodę generowania trajektorii spacerów losowych (błądzenia losowego), tj. szczególnych procesów Markowa z
Mikroekonometria 6. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 6 Mikołaj Czajkowski Wiktor Budziński Metody symulacyjne Monte Carlo Metoda Monte-Carlo Wykorzystanie mocy obliczeniowej komputerów, aby poznać charakterystyki zmiennych losowych poprzez
Metody Obliczeniowe w Nauce i Technice
Metody Obliczeniowe w Nauce i Technice 15. Obliczanie całek metodami Monte Carlo Marian Bubak Department of Computer Science AGH University of Science and Technology Krakow, Poland bubak@agh.edu.pl dice.cyfronet.pl
R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych
R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych Przykłady: Błąd pomiarowy Wzrost, wydajność Temperatura ciała Zawartość różnych składników we
Prawdopodobieństwo i statystyka r.
Zadanie. Niech (X, Y) ) będzie dwuwymiarową zmienną losową, o wartości oczekiwanej (μ, μ, wariancji każdej ze współrzędnych równej σ oraz kowariancji równej X Y ρσ. Staramy się obserwować niezależne realizacje
Testowanie hipotez statystycznych.
Bioinformatyka Wykład 4 Wrocław, 17 października 2011 Temat. Weryfikacja hipotez statystycznych dotyczących wartości oczekiwanej w dwóch populacjach o rozkładach normalnych. Model 3. Porównanie średnich
Spis treści Wstęp Estymacja Testowanie. Efekty losowe. Bogumiła Koprowska, Elżbieta Kukla
Bogumiła Koprowska Elżbieta Kukla 1 Wstęp Czym są efekty losowe? Przykłady Model mieszany 2 Estymacja Jednokierunkowa klasyfikacja (ANOVA) Metoda największej wiarogodności (ML) Metoda największej wiarogodności
... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).
Egzamin ze Statystyki Matematycznej, WNE UW, wrzesień 016, zestaw B Odpowiedzi i szkice rozwiązań 1. Zbadano koszt 7 noclegów dla 4-osobowej rodziny (kwatery) nad morzem w sezonie letnim 014 i 015. Wylosowano
Publiczne Gimnazjum im. Ks. Kardynała Stefana Wyszyńskiego w Choroszczy
Publiczne Gimnazjum im. Ks. Kardynała Stefana Wyszyńskiego w Choroszczy Analiza egzaminu gimnazjalnego 2013 wg wskaźników EWD Opracowanie Beata Gawryluk 1 S t r o n a I. Wstęp Metoda EWD to zestaw technik
Testowanie hipotez statystycznych.
Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.
TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe
Wykład z analizy danych: powtórzenie zagadnień z rachunku prawdopodobieństwa
Wykład z analizy danych: powtórzenie zagadnień z rachunku prawdopodobieństwa Marek Kubiak Instytut Informatyki Politechnika Poznańska Plan wykładu Podstawowe pojęcia rachunku prawdopodobieństwa Rozkład
Sterowanie wielkością zamówienia w Excelu - cz. 3
Sterowanie wielkością zamówienia w Excelu - cz. 3 21.06.2005 r. 4. Planowanie eksperymentów symulacyjnych Podczas tego etapu ważne jest określenie typu rozkładu badanej charakterystyki. Dzięki tej informacji
5 Błąd średniokwadratowy i obciążenie
5 Błąd średniokwadratowy i obciążenie Przeprowadziliśmy 200 powtórzeń przebiegu próbnika dla tego samego zestawu parametrów modelowych co w Rozdziale 1, to znaczy µ = 0, s = 10, v = 10, n i = 10 (i = 1,...,
Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014
Estymacja przedziałowa - przedziały ufności dla średnich Wrocław, 5 grudnia 2014 Przedział ufności Niech będzie dana próba X 1, X 2,..., X n z rozkładu P θ, θ Θ. Definicja Przedziałem ufności dla paramertu
5. WNIOSKOWANIE PSYCHOMETRYCZNE
5. WNIOSKOWANIE PSYCHOMETRYCZNE Model klasyczny Gulliksena Wynik otrzymany i prawdziwy Błąd pomiaru Rzetelność pomiaru testem Standardowy błąd pomiaru Błąd estymacji wyniku prawdziwego Teoria Odpowiadania
Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 5 Mikołaj Czajkowski Wiktor Budziński Zadanie 1. Wykorzystując dane me.medexp3.dta przygotuj model regresji kwantylowej 1. Przygotuj model regresji kwantylowej w którym logarytm wydatków
Zawansowane modele wyborów dyskretnych
Zawansowane modele wyborów dyskretnych Jerzy Mycielski Uniwersytet Warszawski grudzien 2013 Jerzy Mycielski (Uniwersytet Warszawski) Zawansowane modele wyborów dyskretnych grudzien 2013 1 / 16 Model efektów
Czy polska szkoła uczy coraz skuteczniej?
Czy polska szkoła uczy coraz skuteczniej? Artur Pokropek Wstęp. Czyli problem porównywalności Ciekawość (fot. Artur Pokropek ) (fot. mars.nasa.gov) Chcemy wiedzieć Chcemy wiedzieć jak działa system edukacyjny
Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki
Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki Przetwarzanie Sygnałów Studia Podyplomowe, Automatyka i Robotyka. Wstęp teoretyczny Zmienne losowe Zmienne losowe
Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału
Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału Magdalena Frąszczak Wrocław, 22.02.2017r Zasady oceniania Ćwiczenia 2 kolokwia (20 punktów każde) 05.04.2017 oraz 31.05.2017 2 kartkówki
Analiza regresji - weryfikacja założeń
Medycyna Praktyczna - portal dla lekarzy Analiza regresji - weryfikacja założeń mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof.
Instytut Politechniczny Państwowa Wyższa Szkoła Zawodowa. Diagnostyka i niezawodność robotów
Instytut Politechniczny Państwowa Wyższa Szkoła Zawodowa Diagnostyka i niezawodność robotów Laboratorium nr 6 Model matematyczny elementu naprawialnego Prowadzący: mgr inż. Marcel Luzar Cele ćwiczenia:
Mikroekonometria 12. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 12 Mikołaj Czajkowski Wiktor Budziński Dane panelowe Co jeśli mamy do dyspozycji dane panelowe? Kilka obserwacji od tych samych respondentów, w różnych punktach czasu (np. ankieta realizowana
Prawdopodobieństwo i rozkład normalny cd.
# # Prawdopodobieństwo i rozkład normalny cd. Michał Daszykowski, Ivana Stanimirova Instytut Chemii Uniwersytet Śląski w Katowicach Ul. Szkolna 9 40-006 Katowice E-mail: www: mdaszyk@us.edu.pl istanimi@us.edu.pl
Prawa wielkich liczb, centralne twierdzenia graniczne
, centralne twierdzenia graniczne Katedra matematyki i ekonomii matematycznej 17 maja 2012, centralne twierdzenia graniczne Rodzaje zbieżności ciągów zmiennych losowych, centralne twierdzenia graniczne
Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn
Wykład 10 Estymacja przedziałowa - przedziały ufności dla średniej Wrocław, 21 grudnia 2016r Przedział ufności Niech będzie dana próba X 1, X 2,..., X n z rozkładu P θ, θ Θ. Definicja 10.1 Przedziałem
EDUKACYJNA WARTOŚĆ DODANA
ŚLĄSKIE TECHNICZNE ZAKŁADY NAUKOWE EDUKACYJNA WARTOŚĆ DODANA ANALIZA 1. INFORMACJE OGÓLNE. Wskaźnik EWD i wyniki egzaminacyjne rozpatrywane są wspólnie. W ten sposób dają nam one pełniejszy obraz pracy
Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne
Wykład 4 Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym 2. Rozkłady próbkowe 3. Centralne twierdzenie graniczne Przybliżenie rozkładu dwumianowego rozkładem normalnym Niech Y ma rozkład
dla t ściślejsze ograniczenie na prawdopodobieństwo otrzymujemy przyjmując k = 1, zaś dla t > t ściślejsze ograniczenie otrzymujemy przyjmując k = 2.
Zadanie. Dla dowolnej zmiennej losowej X o wartości oczekiwanej μ, wariancji momencie centralnym μ k rzędu k zachodzą nierówności (typu Czebyszewa): ( X μ k Pr > μ + t σ ) 0. k k t σ *
STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów
STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów
WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno
WSTĘP DO REGRESJI LOGISTYCZNEJ Dr Wioleta Drobik-Czwarno REGRESJA LOGISTYCZNA Zmienna zależna jest zmienną dychotomiczną (dwustanową) przyjmuje dwie wartości, najczęściej 0 i 1 Zmienną zależną może być:
Statystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje
b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:
ROZWIĄZANIA I ODPOWIEDZI Zadanie A1. Można założyć, że przy losowaniu trzech kul jednocześnie kolejność ich wylosowania nie jest istotna. A więc: Ω = 20 3. a) Niech: - wśród trzech wylosowanych opakowań
Inteligentna analiza danych
Numer indeksu 150946 Michał Moroz Imię i nazwisko Numer indeksu 150875 Grzegorz Graczyk Imię i nazwisko kierunek: Informatyka rok akademicki: 2010/2011 Inteligentna analiza danych Ćwiczenie I Wskaźniki
Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość
Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę
Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.
Prawdopodobieństwo i statystyka 3..00 r. Zadanie Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX 4 i EY 6. Rozważamy zmienną losową Z. X + Y Wtedy (A) EZ 0,
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Testowanie hipotez statystycznych.
Bioinformatyka Wykład 9 Wrocław, 5 grudnia 2011 Temat. Test zgodności χ 2 Pearsona. Statystyka χ 2 Pearsona Rozpatrzmy ciąg niezależnych zmiennych losowych X 1,..., X n o jednakowym dyskretnym rozkładzie
Wykład z analizy danych: estymacja punktowa
Wykład z analizy danych: estymacja punktowa Marek Kubiak Instytut Informatyki Politechnika Poznańska Cel wykładu Model statystyczny W pewnej zbiorowości (populacji generalnej) obserwowana jest pewna cecha
Stanisław Cichocki Natalia Nehrebecka. Wykład 7
Stanisław Cichocki Natalia Nehrebecka Wykład 7 1 1. Metoda Największej Wiarygodności MNW 2. Założenia MNW 3. Własności estymatorów MNW 4. Testowanie hipotez w MNW 2 1. Metoda Największej Wiarygodności
Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2
Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2 Dr hab. inż. Agnieszka Wyłomańska Faculty of Pure and Applied Mathematics Hugo Steinhaus Center Wrocław University of Science and
Próbkowanie. Wykład 4 Próbkowanie i rozkłady próbkowe. Populacja a próba. Błędy w póbkowaniu, cd, Przykład 1 (Ochotnicy)
Wykład 4 Próbkowanie i rozkłady próbkowe µ = średnia w populacji, µ=ey, wartość oczekiwana zmiennej Y σ= odchylenie standardowe w populacji, σ =(Var Y) 1/2, pierwiastek kwadratowy wariancji zmiennej Y,
Metody probabilistyczne
Metody probabilistyczne Teoria estymacji Jędrzej Potoniec Bibliografia Bibliografia Próba losowa (x 1, x 2,..., x n ) Próba losowa (x 1, x 2,..., x n ) (X 1, X 2,..., X n ) Próba losowa (x 1, x 2,...,
AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej ROZKŁAD NORMALNY ROZKŁAD GAUSSA
AKADEMIA GÓRNICZO-HUTNICZA Wydział Matematyki Stosowanej KATEDRA MATEMATYKI TEMAT PRACY: ROZKŁAD NORMALNY ROZKŁAD GAUSSA AUTOR: BARBARA MARDOSZ Kraków, styczeń 2008 Spis treści 1 Wprowadzenie 2 2 Definicja
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
Oszacowanie i rozkład t
Oszacowanie i rozkład t Marcin Zajenkowski Marcin Zajenkowski () Oszacowanie i rozkład t 1 / 31 Oszacowanie 1 Na podstawie danych z próby szacuje się wiele wartości w populacji, np.: jakie jest poparcie
Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne)
Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne) Przygotował: Dr inż. Wojciech Artichowicz Katedra Hydrotechniki PG Zima 2014/15 1 TABLICE ROZKŁADÓW... 3 ROZKŁAD
Biostatystyka, # 3 /Weterynaria I/
Biostatystyka, # 3 /Weterynaria I/ dr n. mat. Zdzisław Otachel Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, p. 221 bud. CIW, e-mail: zdzislaw.otachel@up.lublin.pl
Statystyka w przykładach
w przykładach Tomasz Mostowski Zajęcia 10.04.2008 Plan Estymatory 1 Estymatory 2 Plan Estymatory 1 Estymatory 2 Własności estymatorów Zazwyczaj w badaniach potrzebujemy oszacować pewne parametry na podstawie
SMOP - wykład. Rozkład normalny zasady przenoszenia błędów. Ewa Pawelec
SMOP - wykład Rozkład normalny zasady przenoszenia błędów Ewa Pawelec 1 iepewność dla rozkładu norm. Zamiast dodawania całych zakresów uwzględniamy prawdopodobieństwo trafienia dwóch wartości: P x 1, x
STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE
STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Szkolny raport ewaluacyjny
Szkolny raport ewaluacyjny Szkoła Podstawowa nr 92 im. Jana Brzechwy Żoliborz, ul. Przasnyska 18a Raport opracowany na podstawie wyników sprawdzianu w szóstej klasie szkoły podstawowej z lat 2012-2016
Prawdopodobieństwo i statystyka r.
Prawdopodobieństwo i statystyka 9.06.999 r. Zadanie. Rzucamy pięcioma kośćmi do gry. Następnie rzucamy ponownie tymi kośćmi, na których nie wypadły szóstki. W trzeciej rundzie rzucamy tymi kośćmi, na których
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r
Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów
O ŚREDNIEJ STATYSTYCZNEJ
Od średniej w modelu gaussowskim do kwantyli w podstawowym modelu nieparametrycznym IMPAN 1.X.2009 Rozszerzona wersja wykładu: O ŚREDNIEJ STATYSTYCZNEJ Ryszard Zieliński XII Międzynarodowe Warsztaty dla
Agata Boratyńska Statystyka aktuarialna... 1
Agata Boratyńska Statystyka aktuarialna... 1 ZADANIA NA ĆWICZENIA Z TEORII WIAROGODNOŚCI Zad. 1. Niech X 1, X 2,..., X n będą niezależnymi zmiennymi losowymi z rozkładu wykładniczego o wartości oczekiwanej
Wstęp do Metod Systemowych i Decyzyjnych Opracowanie: Jakub Tomczak
Wstęp do Metod Systemowych i Decyzyjnych Opracowanie: Jakub Tomczak 1 Wprowadzenie. Zmienne losowe Podczas kursu interesować nas będzie wnioskowanie o rozpatrywanym zjawisku. Poprzez wnioskowanie rozumiemy
MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ
MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ Opracowała: Milena Suliga Wszystkie pliki pomocnicze wymienione w treści
Matematyka ubezpieczeń majątkowych 1.10.2012 r.
Zadanie. W pewnej populacji każde ryzyko charakteryzuje się trzema parametrami q, b oraz v, o następującym znaczeniu: parametr q to prawdopodobieństwo, że do szkody dojdzie (może zajść co najwyżej jedna
Metody Rozmyte i Algorytmy Ewolucyjne
mgr inż. Wydział Matematyczno-Przyrodniczy Szkoła Nauk Ścisłych Uniwersytet Kardynała Stefana Wyszyńskiego Podstawowe operatory genetyczne Plan wykładu Przypomnienie 1 Przypomnienie Metody generacji liczb
Estymacja punktowa i przedziałowa
Temat: Estymacja punktowa i przedziałowa Kody znaków: żółte wyróżnienie nowe pojęcie czerwony uwaga kursywa komentarz 1 Zagadnienia 1. Statystyczny opis próby. Idea estymacji punktowej pojęcie estymatora
Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe
Wprowadzenie do teorii ekonometrii Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe Zajęcia Wykład Laboratorium komputerowe 2 Zaliczenie EGZAMIN (50%) Na egzaminie obowiązują wszystkie informacje
Przykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych
Rozdział 1 Zmienne losowe, ich rozkłady i charakterystyki 1.1 Definicja zmiennej losowej Niech Ω będzie przestrzenią zdarzeń elementarnych. Definicja 1 Rodzinę S zdarzeń losowych (zbiór S podzbiorów zbioru
LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.
LABORATORIUM 4 1. Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz. I) WNIOSKOWANIE STATYSTYCZNE (STATISTICAL INFERENCE) Populacja
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych
Zmienne zależne i niezależne
Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }
Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych
dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 7 i 8 1 / 9 EFEKTYWNOŚĆ ESTYMATORÓW, próba