Statystyka Matematycza Aa Jacka wykład II, 3.05.016 PORÓWNANIE WIĘCEJ NIŻ DWÓCH POPULACJI TESTY NIEPARAMETRYCZNE
Pla a dzsaj 1. Porówywae węcej ż dwóch populacj test jedoczykowej aalzy waracj (ANOVA). Testy zgodośc test Kołmogorowa test Kołmogorowa-Smrowa (dla dwóch próbek) test Kołmogorowa-Llleforsa test zgodośc ch-kwadrat róże wersje 3. Testy ezależośc test ch-kwadrat
Porówywae dwóch węcej populacj Zastaawamy sę, czy populacje są pod pewym względam take same : testy parametrycze: badamy rówość kokretych parametrów rozkładów testy eparametrycze: sprawdzamy, czy rozkłady są take same
Uwaga a otację: x coś zawsze ozacza kwatyl rzędu coś
Testy dla węcej ż dwóch populacj Nawe podejśce: testowae param Uwaga: w tym przypadku p-stwo popełea błędu I rodzaju jest wększe, ż założoy pozom stotośc!
Przypadek welu populacj Przypuśćmy, że mamy k prób losowych... 1,1,,1 k,1,, k, 1,,, oraz wszystke,j są ezależe (1,...,k, j1,.., ),j ~N(m, σ ) e zamy m 1, m,..., m k, a σ 1,,,...,,...,,..., 1 k,, k, oz. 1 + +...+ k
Test aalzy waracj (ANOVA) a pozome stotośc α H 0 : µ 1 µ... µ k H 1 : H 0 (tz. e wszystke µ są rówe) Test lorazu warogodośc ze statystyką: ma obszar krytyczy dla k test ANOVA jest rówoważy testow t dla dwóch populacj ) 1, ( ~ ) /( ) ( 1) /( ) ( 1 1, 1 k k F k k F k j j k k k j j j j 1 1 1, 1, 1 1, 1 )} 1, ( ) ( : { * 1 k k F x F x K > α
Test aalzy waracj terpretacja mamy k ( + j j ) ( ) 1 1 j k, (, j ) 1 1 1 k Sum of Squares (SS) Sum of Squares Betwee (SSB) Sum of Squares Wth (SSW) 1 1 1 k k 1 ( k ( j j 1 1, ) k ) estymator waracj mędzygrupowej estymator waracj wewątrz grup
Test aalzy waracj tabela źródło zmeośc sumy kwadratów lczba stop swobody wartość statystyk F mędzy grupam wewątrz grup SSB k-1 SSW -k w sume SS -1 F
Test aalzy waracj przykład Rocze spożyce czekolady w trzech mastach: A, B, C a podstawe losowych prób A 8, B 10, C 9 kosumetów. Czy średe spożyce zależy od masta? 1 7 A B C średa z próby 11 10 7 waracja z próby 3,5,8 3 (11 8+ 10 10+ 7 9) SSB (11 9,3) SSW F 75,63/ 73,7/ 4 1,31 8+ (10 9,3) 3,5 7+,8 9+ 3 8 a F 0,99 9,3 73,7 10+ (7 9,3) (,4) 5,61 75,63 odrzucamy H 0 o rówośc średch 9
Test aalzy waracj tabela przykład źródło zmeośc sumy kwadratów lczba stop swobody wartość statystyk F mędzy grupam wewątrz grup 75,63 73,7 4 w sume 149,33 6 1,31
Testy eparametrycze Badamy, czy zmea pochodz z kokretego rozkładu (testy zgodośc). Badamy, czy rozkłady zmeych są take same Badamy, czy zmee/cechy są ezależe (test ezależośc)
Test zgodośc Kołmogorowa Model: 1,,..., są próbą IID z rozkładu o dystrybuace F. H 0 : F F 0 (F 0 ustaloa) H 1 : H 0 (tz. dystrybuata jest jakaś a) Jeśl F 0 jest cągła, to testujemy statystyką D gdze D + + supt R F ( t) F0( t) max{ D, D max 1,..., F0( x: ), D max 1,..., F0( x: zaś F (t) -ta dystrybuata emprycza } ) 1
Test zgodośc Kołmogorowa cd. Postać testu: odrzucamy H 0 gdy: D > c(α, ) dla pewej wartośc krytyczej c(α, ). Tw. Przy prawdzwej H 0 rozkład statystyk D e zależy od rozkładu F 0. Problem: Te rozkład wymaga tablcowaa, w zasadze dla każdego z osoba Tw. W gracy P( D d) K( d) + k ( 1) k moża stosować przyblżee dla 100 k e d
Test zgodośc Kołmogorowa cd. Tablca rozkładu asymptotyczego K(d) 1-α 0,8 0,9 0,95 0,99 kwatyl K(d) c(, α) dla 100 1,07 1, 1,36 1,63 1,07/ 1,/ 1,36/ 1,63/
Test zgodośc Kołmogorowa przykład Czy próba 0,4085 0,567 0,3751 0,839 0,0846 0,8306 0,664 0,3086 0,366 0,795 pochodz z rozkładu jedostajego U(0,1)? Źródło: W. Nemro
Test zgodośc Kołmogorowa przykład cd. :10 (-1)/10 /10 /10 - F( :10 ) F( :10 -/10) 0,0846 0 0,1 0,0154 0,0846 0,3086 0,1 0, -0,1086 0,086 0,366 0, 0,3-0,066 0,166 0,3751 0,3 0,4 0,049 0,0751 0,4085 0,4 0,5 0,0915 0,0085 0,567 0,5 0,6 0,0733 0,067 0,664 0,6 0,7 0,0736 0,064 0,795 0,7 0,8 0,0048 0,095 0,8306 0,8 0,9 0,0694 0,0306 0,839 0,9 1 0,1671-0,0671 D 0,086 c(10; 0,9) 0,369 e ma podstaw do odrzucea hpotezy o jedostajośc rozkładu
Test zgodośc Kołmogorowa Smrowa Model: 1,,..., są próbą IID z rozkładu o dystrybuace F, Y 1, Y,..., Y m są próbą IID z rozkładu o dystrybuace G. H 0 : F G H 1 : H 0 (tz. dystrybuaty są róże) Jeśl F ( G) jest cągła, to testujemy statystyką D sup F ( t) G ( ), m t R m t gdze F (t) -ta dystrybuata emprycza perwszej próbk, a G m (t) m-ta dystrybuata emprycza drugej próbk
Test zgodośc Kołmogorowa Smrowa cd. Postać testu: odrzucamy H 0 gdy: D,m > c(α,,m) dla pewej wartośc krytyczej c(α,, m). Tw. Przy prawdzwej H 0 rozkład statystyk D,m e zależy od rozkładu F (a G). Tw. W gracy P( m + k D + m, m d) K( d) ( 1), m k przyblżee OK dla,m 100 e k d
Test zgodośc Kołmogorowa Llleforsa Model: 1,,..., są próbą IID z rozkładu o dystrybuace F. H 0 : F jest dystrybuatą rozkładu ormalego (o ezaych parametrach) H 1 : H 0 (tz. dystrybuata jest jakaś a) Testujemy statystyką gdze a }, max{ + D D D z D z D 1 max, max,..., 1 1,..., + Φ S z : 1 1 1 1 1 ) (, S
Test zgodośc Kołmogorowa Llleforsa cd. Postać testu: odrzucamy H 0 gdy: D > D (α) dla pewej wartośc krytyczej D (α). Tw. Przy prawdzwej H 0 rozkład statystyk D e zależy od kokretego rozkładu orm. Problem: Te rozkład wymaga tablcowaa e jest zaa postać aaltycza... Stosoway zwł. dla próbek o lczebośc do 30, kedy jest lepszy ż test zgodośc chkwadrat
Test zgodośc Kołmogorowa Llleforsa wartośc krytycze Źródło: H. Lllefors
Test zgodośc ch-kwadrat Model: 1,,..., są próbą IID z rozkładu dyskretego o k wartoścach (oz. 1,..., k). H 0 : prawdopodobeństwa w rozkładze to 1 3... k P() p 1 p p 3... p k H 1 : H 0 (tz. rozkład jest jakś y) Ozaczmy rezultat dośwadczea jako 1 3... k N N 1 N N 3... N k gdze N ozacza lczbę uzyskaych wyków wartośc. N 1 j 1 j etykety
Test zgodośc ch-kwadrat postać testu Ogóla postać testu: χ u as: ( wartosc obserwowaa- wartoscoczekwaa) wartoscoczekwaa χ N p k ( - ) 1 p Tw. Przy prawdzwośc H 0 rozkład w/w statystyk χ zmerza do rozkładu χ o k-1 stopach swobody χ (k-1) przy Procedura: odrzucamy H 0 gdy χ > c, gdze c χ 1-α(k-1) jest kwatylem rzędu 1- α rozkładu χ o k-1 stopach swobody
Test zgodośc ch-kwadrat przykład Czy kość jest rzetela? Na pozome α0,05 150 rzutów. Wyk: H 0 : (N 1, N, N 3, N 4, N 5, N 6 ) H 1 : H 0 1 3 4 5 6 N 15 7 36 17 6 9 ~Mult(150, 1/6, 1/6, 1/6, 1/6, 1/6, 1/6) χ (15 5) 5 + (7 5) 5 + (36 5) 5 + (17 5) 5 + (6 5) 5 + (9 5) 5 1,4 10,05(5) 11,7 χ odrzucamy H 0. Źródło: W. Nemro
Test zgodośc ch-kwadrat z ezaym parametrem Model: 1,,..., są próbą IID z rozkładu dyskretego o k wartoścach (oz. 1,..., k). H 0 : prawdopodobeństwa w rozkładze to H 1 : H 0 1 3... k P() p 1 (θ) p (θ) p 3 (θ)... p k (θ) przy czym θ jest ezaym parametrem wymaru d. (tz. rozkład jest jakś y)
Test zgodośc ch-kwadrat z ezaym parametrem postać testu Statystyk testowe kostruujemy aalogcze jak poprzedo, przy czym wartośc oczekwae wylczamy w oparcu o estymatory NW parametrów θ. Zmea sę tylko lczba stop swobody w rozkładze: Tw. Przy prawdzwej H 0 rozkład statystyk χ zmerza do rozkładu χ o k-d-1 stopach swobody χ (k-d-1) przy
Test zgodośc ch-kwadrat ucąglee Lepsze są testy Kołmogorowa, ale moża róweż stosować test ch-kwadrat Model: 1,,..., są próbą IID z rozkładu cągłego. H 0 : Rozkład zaday jest dystrybuatą F H 1 : H 0 (tz. rozkład jest jakś y) Wystarczy rozbć zbór wartośc zmeej a rozłącze przedzały zlczać obserwacje, które wpadły do poszczególych przedzałów. P-stwa oczekwae są zae (wykają z F). Dalej: test ch-kwadrat
Test zgodośc ch-kwadrat uwag praktycze Test powe być stosoway dla dużych prób Lczebośc klas (oczekwae) e mogą być za małe (<5). Jeśl za małe, ależy pogrupować obserwacje Przedzały klas w wersj cągłej ustalae dowole, ale warto zadbać o rówomere rozłożee p-stw teoretyczych.
Test ezależośc ch-kwadrat Model: ( 1,Y 1 ),..., (,Y ) są próbą IID z rozkładu dwuwymarowego o r*s wartoścach (oz. zborem {1,..., r} {1,..., s}). Nech rozkład teoretyczy zaday będze przez Ozaczmy Iteresuje as hpoteza o ezależośc Y: H 0 : p j H 1 : H 0 P(, Y j) 1,..., r j p s j 1 p j, p j pj p p j 1,..., s, j 1,..., r r 1 p j 1,..., s
Test ezależośc ch-kwadrat cd. Rozkład empryczy opsay jest dwuwymarową tabelką (tzw. tablca kotygecj) \j 1... s N 1 N 11 N 1 N 1s N 1 N 1 N N s N... r N r1 N r N rs N r N j N 1 N N s
Test ezależośc ch-kwadrat postępowae Szczególy przypadek testu zgodośc z (r-1) + (s-1) parametram do wyestymowaa: Statystyka testowa: χ N 1 j 1 j j ma rozkład ch-kwadrat z (r-1)(s-1) stopam swobody (przy prawdzwej H 0 ) r s ( N j N N N / / )
Test ezależośc ch-kwadrat przykład Badamy zależość gustów muzyczych poglądów poltyczych, a pozome α 0,05 Poperam Ne poperam Razem Słucham dsco-polo 5 10 35 Słucham rocka 0 0 40 Słucham muzyk klasyczej 15 10 5 Razem 60 40 100 χ (5 60 * 35/100) (0 60 * 40/100) (15 60 * 5/100) + + 60 * 35/100 60 * 40/100 60 * 5/100 (10 40 * 35/100) (0 40 * 40/100) (10 40 * 5/100) + + + 40 * 35/100 40 * 40/100 40 * 5/100 χ1 0,05((1)(31)) χ0,95() odrzucamy H 0. Źródło: W. Nemro 5,99 3,57
Radomzacja testu Czasem może e być testu o pozome stotośc rówym dokłade α (p. dla zmeych o rozkładach dyskretych). Wówczas rozwązaem jest radomzacja. (TJNM, o le jest, mus być zradomzoway). p. lczba orłów w 8 rzutach, H 0 : p ½, H 1 : p <½, α0,05: x 0 1 3 4 5 6 7 8 p 0,004 0,03 0,11 0, 0,7 0, 0,11 0,03 0,004 suma p 0,004 0,04 0,15 0,36 0,64 0,86 0,97 0,996 1,000 1 odrzucamy, > OK, : p1/11 odrzucamy