Wykład 4 Testy zgodności. dystrybuanta rozkładu populacji dystrybuanty rozkładów dwóch populacji rodzaj rozkładu wartości parametrów.

Podobne dokumenty
L.Kowalski zadania z rachunku prawdopodobieństwa-zestaw 4 ZADANIA - ZESTAW 4

Zmienne losowe typu ciągłego. Parametry zmiennych losowych. Izolda Gorgol wyciąg z prezentacji (wykład III)

Wykład 3 Hipotezy statystyczne

Badanie zależności cech

Programowanie nieliniowe optymalizacja funkcji wielu zmiennych

25. RÓWNANIA RÓŻNICZKOWE PIERWSZEGO RZĘDU. y +y tgx=sinx

Testowanie hipotez statystycznych.

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

12. FUNKCJE WIELU ZMIENNYCH. z = x + y jest R 2, natomiast jej

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Wydział Matematyki. Testy zgodności. Wykład 03

Zmienna losowa. M. Przybycień Rachunek prawdopodobieństwa i statystyka

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

Weryfikacja hipotez statystycznych

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

f x f y f, jest 4, mianowicie f = f xx f xy f yx

Spis treści 3 SPIS TREŚCI

RACHUNEK CAŁKOWY FUNKCJI DWÓCH ZMIENNYCH

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

Rozkłady statystyk z próby

STATYSTYKA

PODSTAWOWE ROZKŁADY PRAWDOPODOBIEŃSTWA. Piotr Wiącek

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

PDF created with FinePrint pdffactory Pro trial version

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Własności statystyczne regresji liniowej. Wykład 4

Równania różniczkowe

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 1-2

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Wykład 14. Testowanie hipotez statystycznych - test zgodności chi-kwadrat. Generowanie liczb losowych.

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

KURS FUNKCJE WIELU ZMIENNYCH

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

RÓWNANIA RÓŻNICZKOWE WYKŁAD 5

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

3.3. UKŁADY RÓWNAŃ LINIOWYCH. Równanie liniowe z dwiema niewiadomymi. Równaniem liniowym z dwiema niewiadomymi x i y nazywamy równanie postaci

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

WNIOSKOWANIE STATYSTYCZNE

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

Wykład 10 Testy jednorodności rozkładów

PRÓBNY EGZAMIN MATURALNY

Rozdział 1. Wektory losowe. 1.1 Wektor losowy i jego rozkład

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Przestrzenie liniowe w zadaniach

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

Przenoszenie niepewności

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

Weryfikacja hipotez statystycznych

Literatura. Leitner R., Zacharski J., Zarys matematyki wyŝszej dla studentów, cz. III.

Pochodna funkcji wykład 5

Przykład 1. (A. Łomnicki)

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Scenariusz lekcji matematyki z wykorzystaniem komputera

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

LISTA 4. 7.Przy sporządzaniu skali magnetometru dokonano 10 niezależnych pomiarów

Metody probabilistyczne opracowane notatki 1. Zdefiniuj zmienną losową, rozkład prawdopodobieństwa. Przy jakich założeniach funkcje: F(x) = sin(x),

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Ekstrema funkcji dwóch zmiennych

Przedziały ufności i testy parametrów. Przedziały ufności dla średniej odpowiedzi. Interwały prognoz (dla przyszłych obserwacji)

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Analiza wariancji. dr Janusz Górczyński

Równania różniczkowe cząstkowe

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

RÓWNANIA RÓŻNICZKOWE WYKŁAD 3

Wykład 3 Jednowymiarowe zmienne losowe

Testowanie hipotez statystycznych

Rozkłady zmiennych losowych

KORELACJE I REGRESJA LINIOWA

3.2. Podstawowe własności funkcji. Funkcje cyklometryczne, hiperboliczne. Definicję funkcji f o dziedzinie X i przeciwdziedzinie Y mamy w 3A5.

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Modelowanie zależności. Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski

X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

zadania z rachunku prawdopodobieństwa zapożyczone z egzaminów aktuarialnych

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Powtórzenie wiadomości z rachunku prawdopodobieństwa i statystyki.

Statystyczna analiza danych

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Projekt Era inżyniera pewna lokata na przyszłość jest współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego

Z funkcji zdaniowej x + 3 = 7 można otrzymać zdania w dwojaki sposób:

Przestrzeń probabilistyczna

Projekt Era inżyniera pewna lokata na przyszłość jest współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego

Przykład 1 W przypadku jednokrotnego rzutu kostką przestrzeń zdarzeń elementarnych

Testowanie hipotez statystycznych

Transkrypt:

Wkład Test zgodności. Test zgodności służą do werikacji hipotez mówiącch, że a dstrbuanta rozkładu populacji ma określoną z gór postać unkcjną b dstrbuant rozkładów dwóch populacji nie różnią się w sposób istotn. Test te wmagają z reguł dużej prób. Należ zauważć, że pojęcie zgodności rozkładów obejmuje zarówno rodzaj rozkładu jak i wartości parametrów. Hipotezę o zgodności rozkładów odrzuca się zarówno wted, gd nieodpowiednia jest postać unkcjna rozkładu, jak i wted gd wartość choćb jednego z parametrów jest różna od zakładanej w H.

Wsuwam hipotezę, że badana cecha ma w populacji generalnej określon rozkład, któr nazwam rozkładem teoretcznm. Szacujem z prób niezbędne do określenia rozkładu teoretcznego parametr. Następnie stosujem odpowiedni test zgodności. Jeśli hipoteza zostanie odrzucona na danm poziomie istotności to możem wsunąć hipotezę dotczącą innego rozkładu teoretcznego. Test zgodności test Pearsona o Stawiam hipotezę zerową: Populacja ma dan rozkład teoretczn o Na podstawie wników dużej prób obliczam:

obl k i n i np np i i gdzie n i -liczność i-tego przedziału n p i - hipotetczna liczność i-tego przedziału p i -prawdopodobieństwo wznaczone przez hipotetczną dstrbuantę, że zmienna losowa jest zawarta w przedziale o liczebności n i 3 o Odcztujem z tablic rozkładu chi-kwadrat wartość dla ustalonego poziomu istotności i k- stopni swobod lub k--l, gdzie l jest liczbą szacowanch parametrów. o Porównujem i tak, że < to odrzucam H, a gd jest przeciwna nierówność mówim, że nie ma podstaw do odrzucenia. Uwaga:

Prawdopodobieństwo p i wznaczam wg zależności: p =F p i = P{ i- i }=F i -F i- -i=,,k- p k =-F k- gdzie k to liczba klas. Jeśli rozkładem teoretcznm jest rozkład normaln o nieznanch parametrach to dokonujem standarzacji: s F s F s U s P p i U i U i i i U ma rozkład N,. Przkład. W celu sprawdzenia cz kostka do gr jest smetrczna wkonano rzutów i otrzmano:

Liczba oczek Liczba rzutów 3 3 33 6 Na poziomie istotności =, zwerikować hipotezę, że każda liczba oczek w rzucie tą kostką ma takie samo prawdopodobieństwo wrzucenia. Rozwiązanie: H : rozkład liczb oczek jest równomiern Obliczam prawdopodobieństwo teoretcznep i oraz liczność teoretczną np i : Liczba Liczba p i np i oczek rzutów n i 3 3 33 6

Porównujem liczność teoretczną i empirczną n i. n i np i n i -np i -9 3-6 - 33 3 Wznaczam składniki. n i -np i -9-6 - 3

Podsumowując ostatnią kolumnę otrzmujem =,. Ustalam teraz liczbę stopni swobod. Skoro k=6 to liczba stopni swobod wnosi k-=. Stąd dla =, wartość krtczna Reasumując: i H należ odrzucić razem z elerną kostką. Przkład: Zbadano 3 wbranch losowo -sekundowch odcinków czasowch prac pewnej centrali teleonicznej i otrzmano następując empirczn rozkład liczb zgłoszeń: Liczba Liczba zgłoszeń odcinków 8 3

Na poziomie istotności =, zwerikować hipotezę, że rozkład liczb zgłoszeń jest rozkładem Poissona. Rozwiązanie: Ponieważ nie spreczowano wartości parametru dla tego rozkładu a jest on wartością oczekiwaną to skorzstam z estmatora. Obliczam więc najpierw ów parametr z prób: Nasza hipoteza zerowa ma postać: H : rozkład liczb zgłoszeń jest rozkładem Poissona z parametrem Obliczam teraz prawdopodobieństwa teoretczne i teoretczną liczność:

np i,83,9,3 93,3,6 79,,,6 9, -,83+,3+,6+,+,6=,8 8, Teraz kolej na składniki. n i np i n i -n p i,9 -,9 93,3 6,7 8 79,,8-9,,8 8,,6

Podsumowując ostatnią kolumnę otrzmujem =,8 Ustalam teraz liczbę stopni swobod. Skoro k=6 oraz oszacowano jeden parametr to liczba stopni swobod wnosi k--=. Stąd dla =, wartość krtczna Reasumując: odrzucenia H. i nie ma podstaw do Rozkład liczb zgłoszeń jest zbliżon do rozkładu Poissona z parametrem Nie oznacza to, że przjmujem H!!!! Przkład: Koszt materiałowe prz produkcji pewnego wrobu bł w wlosowanch zakładach następujące:

koszt Liczba zakładów - 7-3 3- - 3-6 9 6-7 7-8 8-9 6 9- Na poziomie istotności =, zwerikować hipotezę, że rozkład kosztów jest N,. Rozwiązanie: H : rozkład kosztów jest N,. Ab skorzstać ze standarzacji szukam wartości środkowej każdej klas i standarzowanej : Koszt i - -,7-3 3 -, 3- -,7 - -, -6 6,3 6-7 7,8 7-8 8,3 8-9 9,8 9-,3

Teraz obliczam prawdopodobieństwo teoretczne: Fu i p i -,7,7,7 -,,,-,7=,73 -,7,,69 -,,7,787,3,679,97,8,788,7,3,93,,8,967,68,3 -,967=,393 oraz składniki : p i np i,7,7=,38,,73 8,636,3,69,8,,787, 3,,97 3,66,9,7,,, 3,8,68 7,96,,393,36, Podsumowując ostatnią kolumnę otrzmujem =,

Ustalam teraz liczbę stopni swobod. Skoro k=9 to liczba stopni swobod wnosi k-=8. Stąd dla =, wartość krtczna Reasumując: odrzucenia H. i nie ma podstaw do Rozkład kosztów jest zbliżon do rozkładu N, Nie oznacza to, że przjmujem H!!!! Zmienne losowe wielowmiarowe. De.. Dana jest przestrzeń probabilistczna Ω,S,P. W tej przestrzeni określone są zmienne losowe,,, n. Uporządkowan układ wektor,,, n nazwam zmienną losową n-wmiarową. De..

Rozkładem prawdopodobieństwa zmiennej losowej,,, n nazwam prawdopodobieństwa postaci: P{,,, n A}, gd AR n. De.3. Dstrbuantą zmiennej losowej,,, n nazwam unkcję F:R n [,] określoną wzorem: Fr,r,,r n =P{ <r,, n <r n }. Zmienną losową, nazwam zmienną losową dwuwmiarową. De.. Zmienna losowa, ma rozkład tpu skokowego jeśli przjmuje przeliczalną liczbę wartości i, k, i,k=,,3, odpowiednio z prawdopodobieństwami p ik, prz czm p ik i, k i, k P, i k

De.. Zmienna losowa, ma rozkład tpu ciągłego, jeśli istnieje unkcja, spełniająca warunki:,, dla każdego,r R, dd taka, że P{ a, b, c d} b a d c,. Funkcję, nazwam gęstością prawdopodobieństwa. dd De.6. Niech Fs,t jest dstrbuantą zmiennej losowej,. Funkcje: F F s t lim t lim s F s, t F s, t

nazwam dstrbuantami brzegowmi odpowiednio zmiennej losowej i zmiennej losowej. Wznaczają one jednoznacznie rozkład brzegowe. Jeśli, ma rozkład tpu skokowego to prawdopodobieństwa brzegowe określone są wzorami: p p i k P{ P{ i k } } k i p p ik ik Jeśli, ma rozkład tpu ciągłego o gęstości, to gęstości brzegowe określone są wzorami:

Przkład:,, d d Rozkład prawdopodobieństwa liczb treningów drużn piłkarskich w ciągu tgodnia i liczb meczów wgranch w sezonie zawiera tabela: 3,,,,,6 3,,8,3 Znaleźć dstrbuantę i rozkład brzegowe. Rozwiązanie: Rozkład brzegowe: 3 P{= i },,,8,,,6, 3,,8,3, P{= k },,,3,6

Dstrbuanta Fs,t=P{<s,<t} t,],],],3] 3,] s -,],],,8,8,8,3],,,3,8 3,,,, F s F t Przkład. Zmienna losowa, ma rozkład o gęstości:, A gd gd,,,, [,] [,] Znaleźć wartość A i rozkład brzegowe. Rozwiązanie:

A A A A Add Rozkład brzegowe: d d,,,,

De.7.niezależne zmienne losowe Zmienne losowe i są niezależne wted i tlko wted, gd dla każdego s,tr F s, t F s F t. Jeśli, jest tpu skokowego to i są niezależne wted i tlko wted, gd dla każdego i,k=,,3, p ik p i p k Jeśli, jest tpu ciągłego to i są niezależne wted i tlko wted, gd dla każdego,r,. Przkład. Sprawdzić niezależność zmiennch losowch i o rozkładzie łącznm: a

- -,,3,, Rozkład brzegowe: - P{= k } -,,3,,,, P{= i },,7, Niech =- i =-. P{=-}=, P{=-}=, P{=-,=-}=, P{=-}P{=-} Zmienne losowe zależne. b

tm poza gd [,] [,],, Rozkład brzegowe:,,,, d d Dla każdego,r Stąd zmienne losowe i są niezależne! Parametr dla par zmiennch losowch. De.7.

Kowariancją zmiennch losowch i nazwam wrażenie : gdzie cov,=e[-e-e]=e -E E, E i, j i j p ij lub E R, dd De.8. Współcznnikiem korelacji zmiennch losowch i nazwam wrażenie:, cov, D D

Tw..własności wartości oczekiwanej c.d. Jeśli zmienne losowe i są niezależne i istnieje E, E i E to E =E E. Uwaga: Jeśli zmienne losowe są niezależne to cov,=. Tw..własności wariancji c.d. Jeśli istnieje E, E i E[-E-E] to D +=D +D +cov, oraz D -=D +D -cov,. Ponadto, gd zmienne losowe i są niezależne to D +=D -=D +D.

Tw. 3.własności współcznnika korelacji., = a+b,c+d, a, b, c, d R., 3., = wted i tlko wted, gd istnieją stałe a, b takie, że P{=a+b}=. Jeśli zmienne losowe i są niezależne, to,=. Przkład. Wznaczć współcznnik korelacji dla zmiennej losowej, o rozkładzie: a - -,,3,, Rozwiązanie:

- P{= k } -,,3,,,, P{= i },,7, Obliczam: E=-,+,=-, E=-,+,= E =,+,=,3 E =,+,= D =,3--, =,9 D =-= E =- -,+,=,3 cov,=e -E E=,3,6

b tm poza gd [,] [,],, Rozwiązanie: Sprawdzam, cz, jest gęstością. 8 d d d d dd Gęstości brzegowe:,,,, d d Parametr:

3 6 8 3 8 3 3 3 9 6 3 8 3 3 3 3 3 d E d E d E d E

,6 336 8 37, 9 8 3, cov 3 3 6 3 3 3 8 36 6 9 3 6 37 6 8 3 3 3 dd E D D