Biostatystyka, # 4 /Weterynaria I/ dr n. mat. Zdzisªaw Otachel Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowa«Matematyki i Informatyki ul. Gª boka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl materiaªy: http://kzmi.up.lublin.pl/ zotachel/wet konsultacje: poniedziaªek 11.30-13.30, wtorek 10-12 Lublin, 2019
Zmienne losowe niezale»ne Zmienne losowe X i Y nazywamy niezale»nymi, je»eli dowolne zdarzenie okre±lone za pomoc zmiennej X nie zale»y od jakiegokolwiek zdarzenia zdeniowanego za pomoc zmiennej Y, czyli prawdopodobie«stwo iloczynu tych zdarze«równa si iloczynowi prawdopodobie«stw. Analogicznie okre±la si niezale»no± dowolnej ilo±ci zmiennych, nawet niesko«czonego ci gu zmiennych losowych.
Przykªad 1 W do±wiadczeniu D interesuj nas 2 zdarzenia: A (sukces) i A (pora»ka). Powtarzamy D raz za razem. Dla i = 1, 2,... deniujemy zmienne losowe: X i = 1, je»eli sukces w i-tym do±wiadczeniu, w przeciwnym razie X i = 0. Ci g X 1, X 2,... jest ci giem niezale»nych zmiennych losowych.
Wªasno±ci warto±ci oczekiwanej i wariancji zmiennych losowych Niech X, Y b d zmiennymi losowymi okre±lonymi na tej samej przestrzeni prawdopodobie«stwa; przez C oznaczymy staª zmienn losow - przyjmuj c jedn warto± c z prawdopodobie«stwem 1; α, β b d dowolnymi liczbami rzeczywistymi. EC = c, VarC = 0; E(X + Y ) = EX + EY, E(αX ) = αex ; je»eli X, Y s niezale»ne, to EXY = EX EY ; Var(X + C) = VarX, Var(αX ) = α 2 VarX ; je»eli X, Y s niezale»ne, to Var(X + Y ) = VarX + VarY.
Rozkªad normalny Jest najcz ±ciej spotykanym rozkªadem ci gªym w zjawiskach przyrodniczych. Je±li jaka± wielko± jest sum lub ±redni bardzo wielu losowych czynników, to jej rozkªad jest na ogóª normalny. Z tego powodu ma du»e znaczenie w metodach statystycznych. Zmienna losowa o tym rozkªadzie przyjmuje wszystkie warto±ci rzeczywiste. Funkcja g sto±ci prawdopodobie«stwa rozkªadu normalnego dla zmiennej losowej X maj cej warto± oczekiwan EX = µ i odchylenie standardowe DX = σ > 0 ma posta : f (x) = 1 σ (x µ) 2 2π e 2σ 2. Fakt ten b dzie zapisywany symbolicznie: X N(µ, σ).
Wªasno±ci funkcji g sto±ci prawdopodobie«stwa rozkªadu normalnego Wykresem funkcji g sto±ci jest tzw. krzywa Gaussa maj ca ksztaªt dzwonu; jest ona symetryczna wzgl dem prostej x = µ (tj. prostej prostopadªej do osi x w punkcie x = µ); w punkcie x = µ funkcja g sto±ci osi ga maksimum równe 1/σ 2π; pole gury ograniczonej krzyw Gaussa a osi x jest równe 1; zmiana parametrów µ i σ powoduje zmian poªo»enia i ksztaªtu krzywej, np. wi ksza warto± σ powoduje,»e ksztaªt dzwonu staje si "szerszy" i "ni»szy" (maleje skupienie rozkªadu);
Krzywa Gaussa
Wªasno±ci funkcji g sto±ci rozkªadu normalnego - cd. Warto± oczekiwana i wariancja rozkªadu normalnego X N(µ, σ): D 2 X = EX = + Prawo trzech sigm: + 1 x σ (x µ) 2 2π e 2σ 2 dx = µ, (x µ) 2 1 σ (x µ) 2 2π e 2σ 2 dx = σ 2. P(µ σ < X < µ + σ) = 0, 6827, P(µ 2σ < X < µ + 2σ) = 0, 9545, P(µ 3σ < X < µ + 3σ) = 0, 9973.
Rozkªad normalny standardowy N(0, 1) To rozkªad normalny z parametrami µ = 0 i σ = 1. Funkcja g sto±ci prawdopodobie«stwa f (x) = 1 2π e x2 2. Dystrybuanta ma wªasno± : F ( u) = 1 F (u)
Warto±ci krytyczne rozkªadu N(0, 1) W zastosowaniach statystycznych wykorzystuje si tzw. warto±ci krytyczne tego rozkªadu. To takie liczby (dodatnie) u α, które dla ustalonego prawdopodobie«stwa α speªniaj zale»no± : gdzie U N(0, 1). P( U > u α ) = α,
Warto±ci krytyczne rozkªadu normalnego standardowego
Rozkªad normalny w Excelu 2013 Warto±ci funkcji g sto±ci i dystrybuanty tego rozkªadu zwracaj funkcje ROZKŠ.NORMALNY i ROZKŠ.NORMALNY.S (dla rozkªadu standardowego). Parametry rozkªadu podstawiamy za ±redni (µ) i odchylenie_std (σ). Warto±ci funkcji g sto±ci dla argumentu x dostajemy kªad c 0 jako skumulowany, w przeciwnym razie (skumulowany=1) dostajemy warto±ci dystrybuanty. Funkcje ROZKŠ.NORMALNY.ODWR i ROZKŠ.NORMALNY.S.ODWR odwracaj dystrybuanty tych rozkªadów, t.j. dla podanego prawdopodobie«stwa p zwracaj x o wªasno±ci: F (x) = p. W szczególno±ci, warto±ci krytyczne u α liczy formuªa: ROZKŠ.NORMALNY.S.ODWR(1-α/2).
Rozkªady i ich charakterystyki 0 < p, q < 1, p + q = 1, n - liczba naturalna µ, σ - liczby rzeczywiste, σ > 0 Rozkªad Funkcja rozkªadu/g sto± EX VarX dwupunktowy p 0 = q, p 1 = p p pq Bernoulliego p k = n! k!(n k)! pk q n k, k = 0, 1,... np npq Poissona p k = exp( λ) λk k!, k = 0, 1,... λ λ ] normalny f (x) = 1 exp 2πσ [ (x µ)2 2σ 2 µ σ 2
Standaryzacja Je»eli zmienna losowa X ma pewien rozkªad z warto±ci oczekiwan µ i odchyleniem standardowym σ, to dla zmiennej losowej Y = X µ σ EY = 0, DY = 1. Przeksztaªcenie Y nazywa si standaryzacj zmiennej losowej X. Dla rozkªadu normalnego mamy fakt mocniejszy: Je»eli X N(µ, σ), to U = X µ σ N(0, 1).
Statystyki Matematycznie przez prób losow (prost ) n-elementow rozumie si ci g niezale»nych zmiennych losowych X 1, X 2,..., X n o takim samym rozkªadzie prawdopodobie«stwa jak badana cecha X, natomiast ci g liczb x 1, x 2,..., x n b d cy efektem pomiaru cechy X na elementach wylosowanych z populacji, to warto±ci zmiennych losowych X 1, X 2,..., X n. Dowoln funkcj tych zmiennych losowych nazwiemy statystyk. ±rednia arytmetyczna z próby, wariancja z próby, czy ogólnie dowolna charakterystyka próby (momenty, kwartyle, kurtoza, skosno± ) jest statystyk. Ka»da statystyka jest zmienn losow i ma okre±lony rozkªad zale»ny od rozkªadu cechy X.
Rozkªad χ 2 (chi-kwadrat) Jest to rozkªad sumy kwadratów V = X 2 1 + + X 2 r r niezale»nych zmiennych losowych X i N(0, 1), i = 1,..., r; fakt ten b dziemy zapisywa V χ 2 (r) lub V = χ 2 ; parametrem tego rozkªadu jest liczba naturalna r - ilo± stopni swobody; zmienna losowa χ 2 przyjmuje tylko warto±ci nieujemne, st d g sto± i dystrybuanta f (x), F (x) = 0 dla x < 0; Eχ 2 = r, Varχ 2 = 2r; ksztaªt funkcji g sto±ci zmienia si od skrajnie asymetrycznego przy maªej warto±ci ilo±ci stopni swobody r do ksztaªtu symetrycznego kapelusza, gdy ilo± stopni swobody ro±nie.
Warto±ci krytyczne rozkªadu χ 2 W zastosowaniach statystycznych wykorzystuje si tzw. warto±ci krytyczne tego rozkªadu. To takie liczby (dodatnie) χ 2 α,r, które dla ustalonego prawdopodobie«stwa α i podanej ilo±ci stopni swobody r speªniaj zale»no± : P(χ 2 > χ 2 α,r ) = α.
Warto±ci krytyczne rozkªadu χ 2 - rys.
Rozkªad χ 2 w Excelu 2013 Warto±ci krytyczne χ 2 α,r rozkªadu chi kwadrat zwraca funkcja ROZKŠ.CHI.ODWR.PS, dokªadniej: ROZKŠ.CHI.ODWR.PS(α; r) = χ 2 α,r, gdzie α = P(χ 2 > χ 2 α,r ),a r to ilo± stopni swobody dla rozkªadu. Funkcja ROZKŠ.CHI podaje dla dodatniego argumentu x warto± dystrybuanty F (x) = P(χ 2 < x) lub funkcji g sto±ci prawdopodobie«stwa f (x) (zale»nie od warto±ci 1/0 przeª cznika skumulowany) dla ustalonej ilo±ci stopni swobody r. Natomiast funkcja ROZKŠ.CHI.ODWR odwraca dystrybuant, a ROZKŠ.CHI.PS podaje warto± prawostronnego prawdopodobie«stwa P(χ 2 > x) = 1 F (x) dla argumentu x.
Rozkªad t-studenta (W. Gosset, 1908, pseudonim Student) Rozkªad t-studenta ma zmienna losowa Z = X V /r, gdzie X N(0, 1) i V χ 2 (r) s niezale»nymi zmiennymi losowymi; fakt ten b dzie zapisywany Z t(r) lub Z = t; parametrem tego rozkªadu jest liczba naturalna r - ilo± stopni swobody; Et = 0 (istnieje dla r > 1), Vart = r r 2 (istnieje dla r > 2); zmienna losowa o tym rozkªadzie przyjmuje wszystkie warto±ci rzeczywiste; ksztaªt funkcji g sto±ci jest analogiczny do ksztaªtu g sto±ci rozkªadu N(0, 1), ale jest bardziej spªaszczony - ma "grubsze ogony"; gdy r, to g sto± t-studenta d»y do g sto±ci N(0, 1).
Warto±ci krytyczne rozkªadu t-studenta W zastosowaniach statystycznych wykorzystuje si tzw. warto±ci krytyczne tego rozkªadu. To takie liczby (dodatnie) t α,r, które dla ustalonego prawdopodobie«stwa α i podanej ilo±ci stopni swobody r speªniaj zale»no± : P( t > t α,r ) = α.
Warto±ci krytyczne rozkªadu t-studenta - cd.
Rozkªad t-studenta w Excelu 2013 Funkcja ROZKŠ.T.DS(x;r) podaje warto± prawd. dwustronnego P( T > x), a funkcja ROZKL.T.PS(x;r) - warto± prawd. prawostronnego P(T > x) dla argumentu x. Warto±ci krytyczne t α,r rozkªadu t-studenta zwraca funkcja ROZKŠ.T.ODWR.DS, dokªadniej, ROZKŠ.T.ODWR.DS(α; r) = t α,r, gdzie α = P( T > t α,r ), a r - to ilo± stopni swobody rozkªadu. Funkcja ROZKŠ.T podaje dla argumentu x warto± dystrybuanty F (x) = P(T < x) lub funkcji g sto±ci prawdopodobie«stwa f (x) (zale»nie od warto±ci 1/0 przeª cznika skumulowany) dla ustalonej ilo±ci stopni swobody r. Funkcja ROZKŠ.T.ODWR odwraca dystrybuant rozkªadu T.
Rozkªad F Snedecora Rozkªad F Snedecora o (n, m) stp swobody (F (n, m) w skrócie) to rozkªad ilorazu F = X /n Y /m, gdzie X χ 2 (n), Y χ 2 (m) s niezale»ne. Jest to rozkªad ilorazu X 1 2+ +X n 2 n : Y 1 2+ +Y m 2 m, gdzie X 1,..., X n, Y 1,..., Y m N(0, 1) s niezale»ne; EF (n, m) = 4; m m 2, m > 2, VarF (n, m) = 2m2 (n+m 2) n(m 2) 2 (m 4), m > je»eli P(F (n, m) F α (n, m)) = α dla 0 < α < 1 tj. F α (n, m) - warto± krytyczna rozkªadu F (n, m), to F α (n, m) = 1 F 1 α (m, n).
Rozkªad F w Excelu 2013 Warto±ci krytyczne F α (n, m) rozkªadu F zwraca funkcja ROZKŠ.F.ODWR.PS, dokªadniej: ROZKŠ.F.ODWR.PS(α; n; m) = F α (n, m), gdzie α = P(F > F α (n, m)), a (n, m), to para stopni swobody dla rozkªadu. Funkcja ROZKŠ.F podaje dla dodatniego argumentu x warto± dystrybuanty F (x) = P(F < x) lub funkcji g sto±ci prawdopodobie«stwa f (x) (zale»nie od warto±ci 1/0 przeª cznika skumulowany) dla ustalonej pary stopni swobody (n, m). Natomiast funkcja ROZKŠ.F.ODWR odwraca dystrybuant, a ROZKŠ.F.PS podaje warto± prawostronnego prawdopodobie«stwa P(F > x) = 1 F (x) dla argumentu x.
Twierdzenie Fishera Je»eli X 1,..., X n s niezale»nymi zmiennymi losowymi o jednakowym rozkªadzie normalnym N(µ, σ), to: zmienne losowe X = 1 n X i i S 2 = 1 n (X i n n X ) 2 i=1 i=1 s niezale»ne, X N(µ, σ/ n), ns 2 /σ 2 χ 2 (n 1).