1 STATYSTYKA OPISOWA I PROJEKTOWANIE EKSPERYMENTU dr iż Krzysztof Bryś Pojȩcia wstȩpe populacja - ca ly zbiór badaych przedmiotów lub wartości. próba - skończoy podzbiór populacji podlegaj acy badaiu. próba losowa - próba losowaa (ajczȩściej) zgodie z rozk ladem rówomierym, tz. wylosowaie każdej próby jest jedakowo prawdopodobe. cechy: mierzale, iemierzale badaa cecha = zmiea losowa X Poszukiway: rozk lad cechy w populacji = rozk lad zmieej losowej X próba -elemetowa = ci ag iezależych zmieych losowych (X 1,..., X ) o jedakowym rozk ladzie (takim jak poszukiway rozk lad zmieej losowej X). Etapy badaia statystyczego 1) Przygotowaie (formatowaie) badaia (określeie celu, rodzaju, potrzebych parametrów wejściowych badaia). ) Przeprowadzeie badaia (wylosowaie próby i określeie wartości badaych cech w próbie). 3) Zebraie uzyskaych podczas badaia daych. 4) Opis i wioskowaie statystycze (obliczeie parametrów, estymacja, weryfikacja hipotez). 5) Przedstawieie wyików. Szeregi statystycze 1) Szereg wyliczaj acy uporz adkoway: (x 1, x,..., x ) przy czym x 1 x... x. ) Szereg rozdzielczy puktowy: (x 1, x,..., x k ), ( 1,,..., k ), gdzie x 1 < x <... < x k oraz dla każdego i = 1,,..., k: i -liczba realizacji (obserwacji) wartości x i, k i =. 3) Szereg rozdzielczy przedzia lowy: (y 0 ; y 1 >, (y 1 ; y >,..., (y k 1 ; y k ), ( 1,,..., k ), gdzie y 0 < y 1 < y <... < y k 1 < y k oraz dla każdego i = 1,,..., k: i -liczba realizacji (obserwacji) wartości ależ acej do przedzia lu (y i 1 ; y i ), k i =. Wszystkie wartości ależ ace do przedzia lu (y i 1 ; y i >, i = 1,,..., k utożsamia siȩ z jego środkiem x i. Regu ly wyzaczaia liczby przedzia lów (klas): k, k 5 log. Miary po lożeia rozk ladu 1) Średia z próby x Parametry empirycze x = 1 x i x = 1 k i x i ) Domiata (moda, wartość modala) D = pukt, w którym fukcja prawdopodobieństwa osi aga ajwiȩksz a wartość
ajczȩściej wystȩpuj aca wartość, - dla szeregu rozdzielczego puktowego: pukt, dla którego liczebość (czȩstość) osi aga ajwiȩksz a wartość, - dla szeregu rozdzielczego przedzia lowego (wzór iterpolacyjy): D = x 0d + d d 1 ( d d 1 ) + ( d d+1 ) h d, gdzie x 0d - pocz atek przedzia lu zawieraj acego domiatȩ (przedzia lu o ajwiekszej liczebości), h d - szerokość przedzia lu zawieraj acego domiatȩ (przedzia lu o ajwiekszej liczebości), d - liczebość przedzia lu zawieraj acego domiatȩ (ajwieksza liczebość), d 1 - liczebość przedzia lu poprzedzaj acego przedzia l zawieraj acy domiatȩ, d+1 - liczebość przedzia lu astȩpego po przedziale zawieraj acym domiatȩ. 3) Dystrybuata empirycza (czȩstość skumulowaa F (x) F (x) = 1 {i : x i < x, i = 1,..., } F (x) = i:x i <x 4) Kwatyl empiryczy rzȩdu p x p, : (pukt w którym dystrybuata empirycza po raz pierwszy osi aga wartość iemiejsz a iż p) x p, = x p - dla szeregu rozdzielczego puktowego: i x p, = x q gdzie q = mi{r : p - dla szeregu rozdzielczego przedzia lowego (wzór iterpolacyjy): r x p, = x 0p + (p i ) hp, x i <x 0p p gdzie x 0p - pocz atek przedzia lu zawieraj acego x p, (przedzia lu w którym dystrybuata empirycza po raz pierwszy osi aga wartość iemiejsz a iż p), h p -szerokość przedzia lu zawieraj acego x p,, p -liczebość przedzia lu zawieraj acego x p,, x i <x 0p i - liczebość skumulowaa dla przedzia lu poprzedzaj acego przedzia l zawieraj acy x p, (suma liczebości przedzia lów poprzedzaj acych) Mediaa: Me = kwatyl rzȩdu 1 Kwartyl doly: Q 1 = kwatyl rzȩdu 1 4 Kwartyl góry: Q 3 = kwatyl rzȩdu 3. 4 i } Miary rozproszeia rozk ladu 5) Wariacja z próby s s = 1 (x i x)
3 6) Odchyleie stadardowe z próby s = s. 7) Wspó lczyik zmieości V = s x 100%. s = 1 k i (x i x) 8) Rozstȩp R = różica miȩdzy ajwiȩksz a i ajmiejsz a wartości a w próbie. 9) Wspó lczyik asymetrii A s : A s = 1 s ( 1 (x 3 i x) 3 ) A s = 1 s ( 1 k 3 i (x i x) 3 ) 10) Kurtoza (wspó lczyik skupieia) A s : K = 1 s ( 1 (x 4 i x) 4 ) 11) Wspó lczyik skośości A 1 : K = 1 s ( 1 k 4 i (x i x) 4 ) A 1 = x D s Estymacja puktowa estymator parametru Θ - statystyka (fukcja próby), której wartość zależy od rzeczywistej wielkości parametru Θ rozk ladu populacji. estymacja puktowa - szacowaie iezaej wartości parametru Θ a podstawie próby; polega a wyzaczeiu z próby wartości u estymatora U parametru Θ i przyjmowaiu tej wartości za oszacowaie Θ. Estymatory wartości oczekiwaej: średia z próby x, mediaa z próby x 0.5,. Estymatory wariacji: wariacja z próby s, s 1 = 1 s (lepszy dla rozk ladu N(m, σ)). Estymacja przedzia lowa Przedzia lem ufości dla parametru θ a poziomie ufości 1 α azywamy przedzia l (θ 1, θ ) spe liaj acy waruki a) θ 1, θ s a fukcjami próby, b) P (θ 1 < θ < θ ) = 1 α Uwagi: 1) Przedzia l ufości zmieia siȩ wraz z prób a.
) Niezaa wartość parametru może być albo ie być w utworzoym przedziale ufości. 3) Moza stworzyć ieskończeie wiele przedzia lów ufości a daym poziomie ufości. 4) Czȩstość wystȩpowaia prób, dla których zbudoway przedzia l ufości a poziomie ufości 1 α zawiera ieza a wartość parametru θ wyosi w przybliżeiu 1 α (dla dużej liczby próbek). 4 Kostrukcja przedzia lu ufości: 1) Wybieramy estymator U = U (θ), którego rozk lad dok lady lub asymptotyczy jest zay. ) Dla daego α (0, 1) dobieramy liczby a, b tak aby P (a U b) = 1 α. (ajczȩściej dobieramy symetryczie tz. tak by P (U < a) = P (U > b) = α ) 3) Jeśli ierówość a U b da siȩ zast apić przez θ 1 θ θ, to przedzia l ufości jest postaci: (θ 1, θ ) Zagadieie miimalej liczości próby Niech -maksymaly dopuszczaly b l ad oszacowaia (maksymaly dopuszczaly promień przedzia lu ufości). - przy szacowaiu wartości oczekiwaej m Korzystamy z Modelu 3 (zak ladaly, ze 100): Promień przedzia lu ufości=u 1 α σ/ a zatem (u 1 α σ/ ) - przy szacowaiu wskaźika struktury p (prawdopodobieństwa sukcesu w schemacie Beroulliego) Promień przedzia lu ufości= u 1 α Przypuszczala wartość p: p 0 = Z badań lub przyjmuje siȩ p 0 = 1. Z (1 Z ) a zatem (u 1 α ) Z (1 Z ). jest wyzaczaa z badaia wstȩpego (pilotażowego), szacowaa a podstawie wyików poprzedich Weryfikacja hipotez statystyczych za pomoc a testów istotości. hipoteza statystycza- przypuszczeie dotycz ace iezaego rozk ladu badaej cechy populacji. hipoteza parametrycza- hipoteza statystycza dotycz aca wartości parametru rozk ladu badaej cechy. weryfikacja- odpowiedź a pytaie czy hipoteza statystycza jest prawdziwa. test statystyczy- regu la postȩpowaia, która daej próbie przyporz adkowuje decyzjȩ przyjȩcia lub odrzuceia badaej hipotezy H 0 - hipoteza zerowa (podlega badaiu) H 1 - hipoteza alteratywa test istotości- test statystyczy, w którym wioskowaie odbywa siȩ przy za lożeiu, że hipoteza H 0 jest prawdziwa. Pozwala jedyie odrzucić H 0 (tz. przyj ać H 1 ). W przypadku weryfikacji hipotez za pomoc a testów istotości wskazae jest stawiaie jako H 0 hipotez co do których zachodzi podejrzeie o ich fa lszywości! Typy b lȩdów pope liaych przy weryfikacji hipotez: b l ad 1-go rodzaju - odrzuceie prawdziwej hipotezy H 0 b l ad -go rodzaju - przyjȩcie fa lszywej hipotezy H 0 poziom istotości α - prawdopodobieństwo pope lieia b lȩdu 1-go rodzaju β - prawdopodobieństwo pope lieia b lȩdu -go rodzaju moc testu = 1 β - prawdopodobieństwo odrzuceia fa lszywej hipotezy H 0.
Jedyy b l ad jaki moża pope lić weryfikuj ac hipotezȩ za pomoc a testu istotości to b l ad 1-go rodzaju! Zbiór krytyczy W - zbiór wartości taki, że przy za lożeiu, że H 0 jest prawdziwa: P (u W ) = α, gdzie u -obliczoa wartość statystyki testowej W praktyce α < 0.01; 0.1 >. Uwagi: 1) Przy za lożeiu, że H 1 prawdziwa: P (u W ) > α ) Jeśli a poziomie istotości α 1 odrzucamy H 0, to a poziomie α < α 1 może ie być podstaw do odrzuceia H 0. Algorytm weryfikacji hipotez za pomoc a testu istotości: 1. Wybieramy model.. Obliczamy wartość statystyki testowej u. 3. Budujemy zbiór krytyczy W (w zależości od postaci H 1 ). 4. Jeśli u W, to odrzucamy H 0 a poziomie istotości α. W przeciwym przypadku mówimy, że ie ma podstaw do odrzuceia H 0. krytyczy poziom istotości α k - poziom istotości, przy którym astȩpuje zmiaa decyzji weryfikacyjej: jeśli α < α k to mówimy, że ie ma podstaw do odrzuceia H 0 a poziomie istotości α jeśli α > α k to odrzucamy H 0 a poziomie istotości α. Testy zgodości S luż a do weryfikacji zgodości pomiȩdzy rozk ladem zbioru wartości w próbie a pewym teoretyczym rozk ladem prawdopodobieństwa o dystrybuacie F 0 (gȩstości prawdopodobieństwa f 0 ). Weryfikowaa hipoteza ma postać: H 0 : F = F 0 albo H 0 : f = f 0 przeciw H 1 : F F 0 albo H 1 f f 0, gdzie F - iezaa dystrybuata (f - iezaa gȩstość prawdopodobieństwa) zmieej losowej X reprezetuj acej bada a cechȩ. Test zgodości chi-kwadrat Pearsoa 5 Dzielimy zbiór wartości daej próby a roz l acze przedzia ly I 1,..., I k. Przy za lożeiu, że hipoteza H 0 jest prawdziwa, p j = P (X I j ) = F 0 (α j ) F 0 (α j 1 ), gdzie I j = (α j 1 ; α j ) dla j = 1,..., k. Obliczamy wartość statystyki testowej: χ = k ( j p j ) p j, gdzie j jest liczb a obserwacji ależ acych do przedzia lu I j, które zaobserwao w próbie, = k j=1 j jest liczb a wszystkich obserwacji w próbie, p j azywamy hipotetycz a liczb a obserwacji z przedzia lu I j (jest to liczba obserwacji, które powiy ależeć do I j gdyby H 0 by la prawdziwa). Jeśli obliczoa wartość statystyki χ ależy do zbioru krytyczego W = (χ (α, k 1); + ), to odrzucamy H 0 : F = F 0 i przyjmujemy H 1 : F F 0. W przeciwym przypadku mówimy, że ie ma podstaw do odrzuceia H 0.