Wkład Test zgodności. Test zgodności służą do werikacji hipotez mówiącch, że a dstrbuanta rozkładu populacji ma określoną z gór postać unkcjną b dstrbuant rozkładów dwóch populacji nie różnią się w sposób istotn. Test te wmagają z reguł dużej prób. Należ zauważć, że pojęcie zgodności rozkładów obejmuje zarówno rodzaj rozkładu jak i wartości parametrów. Hipotezę o zgodności rozkładów odrzuca się zarówno wted, gd nieodpowiednia jest postać unkcjna rozkładu, jak i wted gd wartość choćb jednego z parametrów jest różna od zakładanej w H.
Wsuwam hipotezę, że badana cecha ma w populacji generalnej określon rozkład, któr nazwam rozkładem teoretcznm. Szacujem z prób niezbędne do określenia rozkładu teoretcznego parametr. Następnie stosujem odpowiedni test zgodności. Jeśli hipoteza zostanie odrzucona na danm poziomie istotności to możem wsunąć hipotezę dotczącą innego rozkładu teoretcznego. Test zgodności test Pearsona o Stawiam hipotezę zerową: Populacja ma dan rozkład teoretczn o Na podstawie wników dużej prób obliczam:
obl k i n i np np i i gdzie n i -liczność i-tego przedziału n p i - hipotetczna liczność i-tego przedziału p i -prawdopodobieństwo wznaczone przez hipotetczną dstrbuantę, że zmienna losowa jest zawarta w przedziale o liczebności n i 3 o Odcztujem z tablic rozkładu chi-kwadrat wartość dla ustalonego poziomu istotności i k- stopni swobod lub k--l, gdzie l jest liczbą szacowanch parametrów. o Porównujem i tak, że < to odrzucam H, a gd jest przeciwna nierówność mówim, że nie ma podstaw do odrzucenia. Uwaga:
Prawdopodobieństwo p i wznaczam wg zależności: p =F p i = P{ i- i }=F i -F i- -i=,,k- p k =-F k- gdzie k to liczba klas. Jeśli rozkładem teoretcznm jest rozkład normaln o nieznanch parametrach to dokonujem standarzacji: s F s F s U s P p i U i U i i i U ma rozkład N,. Przkład. W celu sprawdzenia cz kostka do gr jest smetrczna wkonano rzutów i otrzmano:
Liczba oczek Liczba rzutów 3 3 33 6 Na poziomie istotności =, zwerikować hipotezę, że każda liczba oczek w rzucie tą kostką ma takie samo prawdopodobieństwo wrzucenia. Rozwiązanie: H : rozkład liczb oczek jest równomiern Obliczam prawdopodobieństwo teoretcznep i oraz liczność teoretczną np i : Liczba Liczba p i np i oczek rzutów n i 3 3 33 6
Porównujem liczność teoretczną i empirczną n i. n i np i n i -np i -9 3-6 - 33 3 Wznaczam składniki. n i -np i -9-6 - 3
Podsumowując ostatnią kolumnę otrzmujem =,. Ustalam teraz liczbę stopni swobod. Skoro k=6 to liczba stopni swobod wnosi k-=. Stąd dla =, wartość krtczna Reasumując: i H należ odrzucić razem z elerną kostką. Przkład: Zbadano 3 wbranch losowo -sekundowch odcinków czasowch prac pewnej centrali teleonicznej i otrzmano następując empirczn rozkład liczb zgłoszeń: Liczba Liczba zgłoszeń odcinków 8 3
Na poziomie istotności =, zwerikować hipotezę, że rozkład liczb zgłoszeń jest rozkładem Poissona. Rozwiązanie: Ponieważ nie spreczowano wartości parametru dla tego rozkładu a jest on wartością oczekiwaną to skorzstam z estmatora. Obliczam więc najpierw ów parametr z prób: Nasza hipoteza zerowa ma postać: H : rozkład liczb zgłoszeń jest rozkładem Poissona z parametrem Obliczam teraz prawdopodobieństwa teoretczne i teoretczną liczność:
np i,83,9,3 93,3,6 79,,,6 9, -,83+,3+,6+,+,6=,8 8, Teraz kolej na składniki. n i np i n i -n p i,9 -,9 93,3 6,7 8 79,,8-9,,8 8,,6
Podsumowując ostatnią kolumnę otrzmujem =,8 Ustalam teraz liczbę stopni swobod. Skoro k=6 oraz oszacowano jeden parametr to liczba stopni swobod wnosi k--=. Stąd dla =, wartość krtczna Reasumując: odrzucenia H. i nie ma podstaw do Rozkład liczb zgłoszeń jest zbliżon do rozkładu Poissona z parametrem Nie oznacza to, że przjmujem H!!!! Przkład: Koszt materiałowe prz produkcji pewnego wrobu bł w wlosowanch zakładach następujące:
koszt Liczba zakładów - 7-3 3- - 3-6 9 6-7 7-8 8-9 6 9- Na poziomie istotności =, zwerikować hipotezę, że rozkład kosztów jest N,. Rozwiązanie: H : rozkład kosztów jest N,. Ab skorzstać ze standarzacji szukam wartości środkowej każdej klas i standarzowanej : Koszt i - -,7-3 3 -, 3- -,7 - -, -6 6,3 6-7 7,8 7-8 8,3 8-9 9,8 9-,3
Teraz obliczam prawdopodobieństwo teoretczne: Fu i p i -,7,7,7 -,,,-,7=,73 -,7,,69 -,,7,787,3,679,97,8,788,7,3,93,,8,967,68,3 -,967=,393 oraz składniki : p i np i,7,7=,38,,73 8,636,3,69,8,,787, 3,,97 3,66,9,7,,, 3,8,68 7,96,,393,36, Podsumowując ostatnią kolumnę otrzmujem =,
Ustalam teraz liczbę stopni swobod. Skoro k=9 to liczba stopni swobod wnosi k-=8. Stąd dla =, wartość krtczna Reasumując: odrzucenia H. i nie ma podstaw do Rozkład kosztów jest zbliżon do rozkładu N, Nie oznacza to, że przjmujem H!!!! Zmienne losowe wielowmiarowe. De.. Dana jest przestrzeń probabilistczna Ω,S,P. W tej przestrzeni określone są zmienne losowe,,, n. Uporządkowan układ wektor,,, n nazwam zmienną losową n-wmiarową. De..
Rozkładem prawdopodobieństwa zmiennej losowej,,, n nazwam prawdopodobieństwa postaci: P{,,, n A}, gd AR n. De.3. Dstrbuantą zmiennej losowej,,, n nazwam unkcję F:R n [,] określoną wzorem: Fr,r,,r n =P{ <r,, n <r n }. Zmienną losową, nazwam zmienną losową dwuwmiarową. De.. Zmienna losowa, ma rozkład tpu skokowego jeśli przjmuje przeliczalną liczbę wartości i, k, i,k=,,3, odpowiednio z prawdopodobieństwami p ik, prz czm p ik i, k i, k P, i k
De.. Zmienna losowa, ma rozkład tpu ciągłego, jeśli istnieje unkcja, spełniająca warunki:,, dla każdego,r R, dd taka, że P{ a, b, c d} b a d c,. Funkcję, nazwam gęstością prawdopodobieństwa. dd De.6. Niech Fs,t jest dstrbuantą zmiennej losowej,. Funkcje: F F s t lim t lim s F s, t F s, t
nazwam dstrbuantami brzegowmi odpowiednio zmiennej losowej i zmiennej losowej. Wznaczają one jednoznacznie rozkład brzegowe. Jeśli, ma rozkład tpu skokowego to prawdopodobieństwa brzegowe określone są wzorami: p p i k P{ P{ i k } } k i p p ik ik Jeśli, ma rozkład tpu ciągłego o gęstości, to gęstości brzegowe określone są wzorami:
Przkład:,, d d Rozkład prawdopodobieństwa liczb treningów drużn piłkarskich w ciągu tgodnia i liczb meczów wgranch w sezonie zawiera tabela: 3,,,,,6 3,,8,3 Znaleźć dstrbuantę i rozkład brzegowe. Rozwiązanie: Rozkład brzegowe: 3 P{= i },,,8,,,6, 3,,8,3, P{= k },,,3,6
Dstrbuanta Fs,t=P{<s,<t} t,],],],3] 3,] s -,],],,8,8,8,3],,,3,8 3,,,, F s F t Przkład. Zmienna losowa, ma rozkład o gęstości:, A gd gd,,,, [,] [,] Znaleźć wartość A i rozkład brzegowe. Rozwiązanie:
A A A A Add Rozkład brzegowe: d d,,,,
De.7.niezależne zmienne losowe Zmienne losowe i są niezależne wted i tlko wted, gd dla każdego s,tr F s, t F s F t. Jeśli, jest tpu skokowego to i są niezależne wted i tlko wted, gd dla każdego i,k=,,3, p ik p i p k Jeśli, jest tpu ciągłego to i są niezależne wted i tlko wted, gd dla każdego,r,. Przkład. Sprawdzić niezależność zmiennch losowch i o rozkładzie łącznm: a
- -,,3,, Rozkład brzegowe: - P{= k } -,,3,,,, P{= i },,7, Niech =- i =-. P{=-}=, P{=-}=, P{=-,=-}=, P{=-}P{=-} Zmienne losowe zależne. b
tm poza gd [,] [,],, Rozkład brzegowe:,,,, d d Dla każdego,r Stąd zmienne losowe i są niezależne! Parametr dla par zmiennch losowch. De.7.
Kowariancją zmiennch losowch i nazwam wrażenie : gdzie cov,=e[-e-e]=e -E E, E i, j i j p ij lub E R, dd De.8. Współcznnikiem korelacji zmiennch losowch i nazwam wrażenie:, cov, D D
Tw..własności wartości oczekiwanej c.d. Jeśli zmienne losowe i są niezależne i istnieje E, E i E to E =E E. Uwaga: Jeśli zmienne losowe są niezależne to cov,=. Tw..własności wariancji c.d. Jeśli istnieje E, E i E[-E-E] to D +=D +D +cov, oraz D -=D +D -cov,. Ponadto, gd zmienne losowe i są niezależne to D +=D -=D +D.
Tw. 3.własności współcznnika korelacji., = a+b,c+d, a, b, c, d R., 3., = wted i tlko wted, gd istnieją stałe a, b takie, że P{=a+b}=. Jeśli zmienne losowe i są niezależne, to,=. Przkład. Wznaczć współcznnik korelacji dla zmiennej losowej, o rozkładzie: a - -,,3,, Rozwiązanie:
- P{= k } -,,3,,,, P{= i },,7, Obliczam: E=-,+,=-, E=-,+,= E =,+,=,3 E =,+,= D =,3--, =,9 D =-= E =- -,+,=,3 cov,=e -E E=,3,6
b tm poza gd [,] [,],, Rozwiązanie: Sprawdzam, cz, jest gęstością. 8 d d d d dd Gęstości brzegowe:,,,, d d Parametr:
3 6 8 3 8 3 3 3 9 6 3 8 3 3 3 3 3 d E d E d E d E
,6 336 8 37, 9 8 3, cov 3 3 6 3 3 3 8 36 6 9 3 6 37 6 8 3 3 3 dd E D D