Zmienne losowe, statystyki próbkowe Wrocław, 2 marca 2015
Zasady zaliczenia 2 kolokwia (każde po 20 punktów) projekt (20 punktów) aktywność
Zasady zaliczenia 2 kolokwia (każde po 20 punktów) projekt (20 punktów) aktywność oceny 1 [30, 36) - dst 2 [36, 42) - dst + 3 [42, 48) - db 4 [48, 54) - db + 5 [54, 60) - bdb
Program wykładu 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału. 2 Hipoteza statystyczna, test statystyczny, poziom istotności, p-wartość i moc testu. 3 Testowanie hipotez statystycznych o wartości średniej oraz dla wariancji z populacji o rozkładzie normalnym. 4 Testowanie hipotez statystycznych dla proporcji. 5 Problem dwóch prób: porównywanie średnich i wariancji z populacji o rozkładach normalnych. 6 Test Studenta i jego odmiana dla porównań parami. 7 Testy rangowe (Wilcoxona, Fishera-Yatesa, van der Waerdena, medianowy). 8 Testowanie zgodności z rozkładem normalnym. 9 Testy zgodności (testy Kołmogorowa, Kołmogorowa-Smirnowa, χ 2 -zgodności). 10 Testy χ 2 Pearsona niezależnosci i jednorodności. 11 Testowanie hipotez dla współczynnika korelacji. 12 Porównanie k średnich (analiza wariancji). 13 Analiza wariancji - testy post-hoc. 14 Porównywanie testów. Teoria Neymana Pearsona.
Literatura Bartoszewicz J., Wykłady ze statystyki matematycznej, PWN, Warszawa 1989 Gajek L., Kałuszka M., Wnioskowanie statystyczne, WNT, Warszawa 2000, wyd. IV. Koronacki, J. Mielniczuk J., Statytyka dla studentów kierunków technicznych i przyrodniczych, WNT, Warszawa, 2004 Krzyśko M., Statystyka matematyczna, Wyd. UAM, Poznan, 1996. Lehmann E.L.,Testowanie hipotez statystycznych, PWN, Warszawa 1968.
Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału
Zmienna losowa Zmienna losowa to taka funkcja X określona na zbiorze zdarzeń elementarnych o wartościach liczbowych, dla której dane są prawdopodobieństwa przyjmowania przez X wartości z dowolnego zbioru.
Zmienna losowa Zmienna losowa to taka funkcja X określona na zbiorze zdarzeń elementarnych o wartościach liczbowych, dla której dane są prawdopodobieństwa przyjmowania przez X wartości z dowolnego zbioru. Zmienne losowe dzielimy na: dyskretne (typu skokowego) - zmienna przyjmuje dowolne wartości ze zbioru skończonego albo przeliczalnego typu ciągłego - zmienna przyjmuje dowolne wartości z określonego przedziału
Zmienna losowa Zmienna losowa to taka funkcja X określona na zbiorze zdarzeń elementarnych o wartościach liczbowych, dla której dane są prawdopodobieństwa przyjmowania przez X wartości z dowolnego zbioru. Zmienne losowe dzielimy na: dyskretne (typu skokowego) - zmienna przyjmuje dowolne wartości ze zbioru skończonego albo przeliczalnego typu ciągłego - zmienna przyjmuje dowolne wartości z określonego przedziału Zmienne losowe oznaczamy dużymi literami, np.: X, Y, Z, natomiast małymi literami (x, y, z) oznaczamy wartości zmiennych losowych.
Rozkład zmiennej losowej Definicja: Rozkład zmiennej losowej Dystrybuantą rozkładu zmiennej losowej X nazywamy funkcję F X (t) zdefiniowaną dla wszystkich t jako F X (t) = P(ω : X (ω) t)
Rozkład zmiennej losowej Definicja: Rozkład zmiennej losowej Dystrybuantą rozkładu zmiennej losowej X nazywamy funkcję F X (t) zdefiniowaną dla wszystkich t jako F X (t) = P(ω : X (ω) t) Własności dystrybuanty F X jest niemalejąca lim t F X (t) = 1 lim t F X (t) = 0 F X jest prawostronnie ciągła
Rozkład zmiennej losowej Warto zauważyć, że dla ciągłej zmiennej losowej i dowolnych liczb a, b R P(X a) = F X (a) P(X a) = 1 F X (a) P(a X b) = F X (b) F X (a)
Gęstość zmiennej losowej Definicja: Funkcją gęstości rozkładu dyskretnej zmiennej losowej X nazywamy funkcję f X (t) zdefiniowaną dla wszystkich t jako f X (t) = P(ω : X (ω) = t) Definicja: Funkcją gęstości rozkładu ciągłej zmiennej losowej X nazywamy funkcję f X (t) zdefiniowaną dla wszystkich t jako F X (t) = t f X (s)ds
Własności gęstości zmiennej losowej Uwaga! d dt F X (t) = f X (t) Każda funkcja, będąca gęstością prawdopodobieństwa, wyznacza jednoznacznie pewną dystrybuantę, a tym samym rozkład prawdopodobieństwa pewnej zmiennej.
Własności gęstości zmiennej losowej Uwaga! d dt F X (t) = f X (t) Każda funkcja, będąca gęstością prawdopodobieństwa, wyznacza jednoznacznie pewną dystrybuantę, a tym samym rozkład prawdopodobieństwa pewnej zmiennej. Twierdzenie Funkcja f (x) jest gęstością pewnej zmiennej losowej wtedy i tylko wtedy, gdy 1 f (x) 0 2 f (t)dt = 1
Próba losowa Definicja: Wektor zmiennych losowych X = (X 1, X 2,... X n ) nazywamy próbą losową rozmiaru n z rozkładu o gęstości f X (x) jeśli X 1, X 2,..., X n są niezależnymi zmiennymi losowymi o wspólnym rozkładzie z gęstością f (x)
Próba losowa Definicja: Wektor zmiennych losowych X = (X 1, X 2,... X n ) nazywamy próbą losową rozmiaru n z rozkładu o gęstości f X (x) jeśli X 1, X 2,..., X n są niezależnymi zmiennymi losowymi o wspólnym rozkładzie z gęstością f (x) Niech X 1, X 2,..., X n będą niezależnymi zmiennymi losowymi o gęstościach f (x 1 ), f (x 2 ),..., f (x n ) odpowiednio. Gęstość łączna wektora losowego X wygląda następująco: n f (x) = f (x 1, x 2,..., x n ) = f (x 1 )f (x 2 ) f (x n ) = f (x i ), natomiast dystrubuanta łączna: F (x) = F (x 1, x 2,..., x n ) = F (x 1 )F (x 2 ) F (x n ) = i=1 n F (x i ) i=1
Statystyki próbkowe Niech X = (X 1, X 2,... X n ) będzie n elementową próbą losową. Definicja: Średnią z próby nazywamy statystykę: Definicja: X = 1 n X i n i=1 Wariancją z próby nazywamy statystykę: S 2 = 1 n 1 n (X i X ) 2 i=1
Rozkłady statystyk próbkowych Jeżeli X = (X 1, X 2,... X n ) jest próbą losową z rozkładu normalnego, tj X i N(µ, σ 2 ) to: X = 1 n n X i N(µ, σ 2 /n) i=1 ns 2 σ 2 χ2 (n 1) Zmienne X i S 2 są niezależnymi zmiennymi losowymi
Rozkłady statystyk próbkowych Twierdzenie Niech X 1, X 2,... X n będzie n elementową próbą losową, o średniej EX i = µ, i wariancji VarX i = σ 2 < Wówczas: 1 E X = µ 2 Var X = σ2 n 3 ES 2 = σ 2 4 VarS 2 = 2 n 1 σ4
Statystki dostateczne Definicja Statystyka T nazywa się statystyką dostateczną dla θ (statystyką dostateczną dla P), jeżeli dla każdej wartości t tej statystyki rozkład warunkowy P( T = t) nie zależy od θ.
Statystki dostateczne Definicja Statystyka T nazywa się statystyką dostateczną dla θ (statystyką dostateczną dla P), jeżeli dla każdej wartości t tej statystyki rozkład warunkowy P( T = t) nie zależy od θ. Twierdzenie (kryterium faktoryzacji) Statystyka T jest dostateczna wtedy i tylko wtedy, gdy gęstość rozkładu prawdopodobieństwa próby X 1, X 2,..., X n można przedstawić w postaci f θ (x 1, x 2,, x n ) = g θ (T (x 1, x 2,..., x n ))h(x 1, x 2,, x n ), gdzie funkcja h nie zależy od θ, a funkcjag θ, zależna od θ, zależy od x 1, x 2,, x n tylko poprzez wartość statystyki T.
Wykładnicze rodziny rozkładów Definicja Rodzina rozkładów prawdopodobieństwa {P θ, θ Θ} nazywa się wykładniczą rodziną rozkładów, gdy gęstości tych rozkładów są postaci: n f (x; θ) = C(θ) exp Q j (θ)t j (x) h(x), j=1 gdzie Q j, T j, j = 1, 2,..., k, C i h są pewnymi funkcjami.