22 marca 2011
Przestrzeń statystyczna - podstawowe zadania statystyki Zdarzeniom losowym określonym na pewnej przestrzeni zdarzeń elementarnych Ω można zazwyczaj na wiele różnych sposobów przypisać jakieś prawdopodobieństwa. Trójka (Ω, F, P), gdzie P jest rodzina funkcji prawdopodobieństwa nazywamy przestrzenia statystyczna.
Przestrzeń statystyczna s luży do opisu możliwych mechanizmów rzadz acych eksperymentem losowym. Wybór przestrzeni statystycznej jest zazwyczaj kompromisem miedzy prostota modelu a jego adekwatnościa.
Przyk lad Oznaczmy przez p prawdopodobieństwo otrzymania or la przy jednokrotnym rzucie moneta. Wówczas Ω = {O, R}, F = {, {O}, {R}, {O, R}} oraz P = {p : 0 p 1}
Jednym z podstawowych zadań statystyki jest podanie metod, które umożliwiaja identyfikacje rozk ladu prawdopodobieństwa, rzadz acego eksperymentem losowym, na podstawie obserwacji jego wyniku X
Poj ecie próby prostej i statystyki W dalszej cześci wyk ladu zostanie pokazane, że wielokrotne powtarzanie eksperymentu może znacznie u latwić identyfikacje opisujacego go rozk ladu prawdopodobieństwa. Zebrane wyniki eksperymentu np. X 1, X 2,... X n (gdzie X 1, X 2,... (zmienne losowe) nazywamy próba losowa Jeżeli rozk lady zmiennych losowych X 1, X 2,... sa niezależne, to mamy do czynienia z prosta próba losowa.
Przyk lady prób losowych 1 wyniki rzutów moneta; 2 wyniki rzutów kostka; 3 czas obs lugi klientów przy kasie; 4 d lugość piór pawia.
Poj ecie próby prostej i statystyki Z każda próba losowa można zwiazać funkcje T o wartościach rzeczywistych, każda taka funkcje nazywamy statystyka
Przyk lady statystyk 1 X 2 S 2 = 1 n ni=1 (X i X ) 2 3 mo, me, d, X min, X max.
Przyk lady statystyk Średnia z próby Niech X 1, X 2,... X n bedzie próba losowa. Średnia z próby nazywamy statystyke X n = 1 n X i n Uwaga i=1 Średnia jako funkcja próby losowej jest zmienna losowa
Podstawowe w lasności średniej z próby 1 Jeżeli EX 1 =... = EX n = µ, to E X n = µ 2 Jeżeli X 1,..., X n jest próba prosta oraz EX i = µ i VarX i = σ 2 < dla i = 1, 2,..., n, to Var X n = Var( 1 ni=1 n X i ) = 1 n σ2 3 Jeżeli X 1, X 2,..., X n sa zmiennymi losowymi z rozk ladu normalnego N(µ, σ), to X jest zmienna losowa o rozk ladzie N(µ, σ/ n)
Podstawowe w lasności średniej z próby dnorm(y, 0, 1) 0.0 0.2 0.4 0.6 0.8 1.0 N(0,1) N(0,0.5) 3 2 1 0 1 2 3 y
W lasności średniej - prawo wielkich liczb Niech X bedzie zmienna losowa taka, że EX = µ i o skończonej wariancji i niech X 1,..., X n bedzie prosta próba losowa z rozk ladu zmiennej X. Wówczas X n E[X ] n.
Przyk lad zastosowania prawa wielkich liczb - rzut moneta Nich X 1, X 2,... X n, bed a to wyniki kolejnych rzutów moneta. Z prawa wielkich liczb wiemy, że X E[X ] = p. Stad średnia arytmetyczna z próby jest oszacowaniem (estymatorem) parametru p.
Zadanie Wygeneruj n-krotny rzut moneta dla n = 50, 500, 5000. Nastepnie oblicz średnia dla każdego z tych przypadków a nastepnie porównaj wyniki.
Uwaga Prawo wielkich liczb nie daje żadnej odpowiedzi na pytanie jak liczna powinna być próba aby przybliżenie nieznanej wartości oczekiwanej by lo dobre.
Oszacowanie parametru µ na podstawie próby X 1, X 2,..., X n z rozk ladu N (µ, σ).
Rozk lad średnich z próby i b l ad standardowy Wniosek z Centralnego Twierdzenia Granicznego Jeśli z populacji o jakimkolwiek rozk ladzie ze średnia µ i odchyleniem standardowym σ pobieramy próby o dużej liczebności N, to rozk lad średnich z tych prób bedzie rozk ladem normalnym o średniej µ i odchyleniu standardowym σ/ N. Zatem dla dowolnych a, b, a b i zmiennej losowej Z o standardowym rozk ladzie normalnym zachodzi P(a X µ σ/ n b) P(a Z b) = Φ(b) Φ(a) dla n daż acych do nieskończoności, gdzie Φ jest funkcja dystrybuanty standardowego rozk ladu normalnego.
Uwaga Liczba σ/ N nazywana jest b l edem standardowym nie opisuje ona odchylenia pomiarów od średnich, ale odchylenie średnich z prób N - elementowych od średniej z populacji.
Uwaga 1 Nie ma uniwersalnej regu ly mówiacej dla jak dużych n przybliżenie prawdopodobieństwa P(a X µ σ/ b) przez n rozk lad normalny jest dobre. 2 W praktyce czesto zdarza sie, że dok ladne wartości parametrów µ i σ nie sa znane.
Estymacja przedzia lowa W praktyce zdarza si e, że zamiast szacowania wartości nieznanego parametru (przy pomocy estymatorów) decydujemy si e na podanie przedzia lu, do którego z pewnym prawdopodobieństwem należy szacowany przez nas parametr.
Przedzia ly ufności dla wartości oczekiwanej Niech X 1, X 2,..., X n b edzie to próba losowa przy czym prarametr µ jest nieznany natomiast parametr σ jest znany. Bezpośrednio z Centralnego Twierdzenia Granicznego otrzymujemy, że P( X a α σ/ n µ X + a α σ/ n) = 1 α Jest to przedzia l ufności dla parametru µ utworzony na podstawie próby losowej X 1, X 2,... X n na poziomie istotności 1 α Uwaga W zagadnieniach praktycznych najcz eściej parametr σ nie jest znany.
Przyk lad - rzut moneta Rzucamy 100 razy moneta symetryczna. 1 Oblicz 0.9, 0.95, 0.99 przedzia ly ufności (co prawda parametr µ = p = 1/2 jest znany ale cel wy l acznie szkoleniowy). 2 W jakim przedziale z prawdopodobieństwem 0.95 zawieraja sie średnie arytmetyczne z takiego eksperymentu?
Zadanie Za lóżmy, że w wyniku mierzenia wielu tysiecy czaszek kozicy alpejskiej znamy średnia d lugość czaszki doros lego osobnika, która wynosi 200mm, z odchyleniem standardowym 15.0mm. Dane te traktujemy jak parametry, a rozk lad tych d lugości przyjmujemy za zgodny z rozk ladem normalnym. Wyobraźmy sobie, że z populacji wszystkich kozic losujemy próby po 36 osobników każda, mierzymy d lugości ich czaszek i obliczamy średnia dla każdej takiej próby. W jakich granicach (w mm) zmieści sie 50.36% średnich z prób 36 elementowych skupionych wokó l średniej z populacji?
Zadanie Dostawca sa laty gwarantuje, że średnia zawartość o lowiu w jego sa lacie nie przekracza 0.10ppm. Kupujacy poleci l sprawdzić 16 losowo i niezależnie wybranych próbek sa laty (10g suchej masy każda) i otrzyma l w nich średnia zawartość o lowiu wynoszac a 0.11ppm z odchyleniem standardowym 0.02ppm. Przy za lożeniu, że zawartość o lowiu w sa lacie przy tych steżeniach ma rozk lad normalny, ustal czy ta gwarancja jest uczciwa.
Zadanie Policzono jaja z lożone w 20 jamkach legowych przez ślimaka winniczka, otrzymujac średnia 30.8 jaj w jamce, z odchyleniem standardowym 6.2 dla średniej liczby jaj w jamce legowej oblicz 1 95% przedzia l ufności; 2 99% przedzia l ufności.
Estymacja przedzia lowa wartości oczekiwanej (parametr σ nie jest znany). Niech X 1, X 2,..., X n bedzie próba prosta z rozk ladu normalnego N(µ, σ) o nieznanych µ i σ. Zmienna losowa t = X µ S n n 1 ma rozk lad t Studenta o n 1 stopniach swobody. Niech t(α, n 1) oznacza kwantyl rz edu α tego rozk ladu. Wówczas P(t( α 2, n 1) < X µ S n α n 1 < t(1, n 1)) = 1 α. 2