STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne 6. Testy nieparametryczne 7. Korelacja i regresja liniowa i nieliniowa 8. Analiza wariancji Copyright 2010, Joanna Szyda
WSTĘP 1. Zmienna losowa 2. Funkcja (gęstości) prawdopodobieństwa 3. Dystrybuanta 4. Statystyki opisowe 5. Standaryzacja zmiennej losowej 6. Przykładowe rozkłady
ZMIENNA LOSOWA random variable (mat.) funkcja, przyjmuje różne wartości wartości są określone przez przypadek X PRZYJĘTA WARTOŚĆ x Przykłady? DYSKRETNA (SKOKOWA) niektóre wartości (przeważnie liczby naturalne) CIĄGŁA (teoretycznie) wszystkie wartości z określonego zakresu liczb rzeczywistych
DYSKRETNA random variable CIĄGŁA liczba szczeniąt w miocie X X=x czyli X=7 X { 1, 2, 3, 4, 5, 6, 7, 8, 9 } wysokość konia w kłębie W W=w czyli W=167 W [ 150, 190 ]
Zmienna losowa przyjmuje różne wartości (np. zmienna dyskretna X wartości x i ) z różnym prawdopodobieństwem (Przykład???) Jak można określić to prawdopodobieństwo? Przy pomocy funkcji matematycznej
FUNKCJA PRAWDOPODOBIEŃSTWA FUNKCJA GĘSTOŚCI PRAWDOPODOBIEŃSTWA
FUNKCJA (GĘSTOŚCI) PRAWDOPODOBIEŃSTWA probability (density) function DYSKRETNA CIĄGŁA funkcja prawdopodobieństwa jakie jest prawdopodobieństwo uzyskania danej wartości X { 1, 2, 3, 4, 5, 6, 7, 8, 9 } P(X=x i ) urodzenie 5 szczeniąt P(X=5) funkcja gęstości prawdopodobieństwa jakie jest prawdopodobieństwo uzyskania wartości z danego przedziału W [ 150, 190 ] f(w) wys. w kłębie [ 160, 165 ] 165 160 w 0. 12 f dw
FUNKCJA (GĘSTOŚCI) PRAWDOPODOBIEŃSTWA probability (density) function P(X=x) f (w) DYSKRETNA CIĄGŁA 0.25 0.20 9 i1 P X 1 x i f wdw 1 0.15 0.10 0.05 0.00 1 2 3 4 5 6 7 8 9 liczba szczeniąt x wysokość w kłębie w
Z poprzedniego wykładu: Dla jednej zmiennej określamy tzw. prawdopodobieństwo brzegowe A dla dwóch zmienych?
P(x,y) FUNKCJA (GĘSTOŚCI) PRAWDOPODOBIEŃSTWA DWÓCH ZMIENNYCH f (w,z) DYSKRETNA CIĄGŁA w y x z prawdopodobieństwo łączne, warunkowe
Zbiór wartości funkcji prawdodobieństwa to ROZKŁAD PRAWDOPODOBIEŃSTWA ZMIENNEJ LOSOWEJ lub krótko ROZKŁAD ZMIENNEJ LOSOWEJ znany rozkład możliwość analizy statystycznej
DYSTRYBUANTA
DYSTRYBUANTA cumulative distribution function dystrybuanta DYSKRETNA jakie jest prawdopodobieństwo uzyskania wartości mniejszej lub równej x X { 1, 2, 3, 4, 5, 6, 7, 8, 9 } F(x) = P(Xx) urodzenie maks 5 szczeniąt F(5)=P(X5)=0.40 dystrybuanta CIĄGŁA jakie jest prawdopodobieństwo uzyskania wartości mniejszej lub równej w W [ 150, 190 ] F w w wdw max wys. w kłębie 170 F 170 f 170 f wdw 0. 69
DYSTRYBUANTA P(Xx) cumulative distribution function F (w) DYSKRETNA CIĄGŁA F 1 1.20 1.00 9 i1 P X 1 x i 0.80 0.60 0.40 F 0 0.20 0.00 1 2 3 4 5 6 7 8 9 maks. liczba szczeniąt x wysokość w kłębie w
DYSTRYBUANTA - zastosowanie P(Xx) DYSKRETNA pr. urodzenia 1 szczeniaka: F(1)=P(X1)=0.03 pr. urodzenia maks. 9 szczeniaków: F(9)=P(X9)=1 pr. urodzenia maks. 3 szczeniaków: F(3)=P(X3)=0.03+0.04+0.06 pr. urodzenia 4 lub 5 szczeniaków: F(5)-F(3) 1.20 1.00 0.80 0.60 0.40 0.20 0.00 1 2 3 4 5 6 7 8 9 maks. liczba szczeniąt x
DYSTRYBUANTA - zastosowanie F (w) pr. wystąpienia osobnika o wys. w kłębie maks. 155 cm: F(155)=P(W155)=0.11 pr. wystąpienia osobnika o wys. w kłębie maks. 190 cm: F(190)=P(W190)=1.00 pr. wystąpienia osobnika o wys. w kłębie 160-170 cm: F(170)-F(160)=0.32 pr. wystąpienia osobnika o wys. w kłębie pow. 165 cm: 1-F(165)=0.62 CIĄGŁA wysokość w kłębie P( a x b) F( b) F( a) w
STATYSTYKI OPISOWE
WARTOŚĆ OCZEKIWANA I WARIANCJA wartość oczekiwana wariancja Jak opisać rozkład zmiennej losowej modalna mediana
WARTOŚĆ OCZEKIWANA expected value Wartość oczekiwana E(X) liczba, wokół której skupiają się poszczególne wartości zmiennej losowej wartość średnia DYSKRETNA E(X)=5.72 szczeniąt - w miotach liczba urodzonych szczeniąt jest bliska 5 E 9 X i1 p i x i E(X)=0.03*1 + 0.04*2 + 0.06*3 + 0.10*4 + 0.17*5 + 0.22*6 + 0.23*7 + 0.10*8 + 0.05*9 CIĄGŁA E(W)=167 cm - większość koni ma wys. w kłębie ok. 167 cm E W wf wdw
WARIANCJA variance Wariancja 2 X V(X), Var(X), liczba określająca rozproszenie wartości zmiennej wokół wartości oczekiwanej, miara zmienności V X, s. d. X, X DYSKRETNA odchylenie standardowe CIĄGŁA V EX E 2 V ( X ) EW EW 2 ( X ) X
ZMIENNA STANDARYZOWANA Standaryzacja zmiennej X stara zmienna nowa zmienna z X E X V (X ) Z i X mają taki sam typ rozkładu E(Z) = 0 Var(Z) = 1 Znaczenie: uniwersalność rozkładu i dystrybuanty zmiennnej standaryzowanej, wykorzystuje się w analizach tablice statystyczne dla tzw. rozkładu normalnego F(z) = F(x)
MEDIANA P(X=x) f (w) median Mediana liczba, która dzieli funkcję na połowy DYSKRETNA P(X m) ½ i P(X m) ½ 0.25 CIĄGŁA F(w)=½ 0.20 0.15 0.10 0.05 0.00 1 2 3 4 5 6 7 8 9 liczba szczeniąt x wysokość w kłębie w
P(X=x) f (w) MODALNA Modalna wartość, która występuje najczęściej mode DYSKRETNA wartość x o najwyższym prawdopodobieństwie 0.25 CIĄGŁA wartość w dla której f(w) jest najwyższe 0.20 0.15 0.10 0.05 0.00 1 2 3 4 5 6 7 8 9 liczba szczeniąt x wysokość w kłębie w
STATYSTYKI OPISOWE w. oczekiwana modalna mediana rozkład symetryczny 1 2 3 4 5 6 7 modalna mediana w. oczekiwana 1 2 3 4 5 6 7 rozkład skośny
STATYSTYKI OPISOWE 1 2 3 4 5 6 7 duża wariancja 1 2 3 4 5 6 7 mała wariancja
PRZYKŁADOWE ROZKŁADY
ROZKŁAD NORMALNY x f x N e 2,, 1 x 1 2 2 2 E(x) = mediana = modalna Bardzo często spotykany w danych biologicznych Np. wydajność mleka Np. masa ciała prosięcia w 4 tygodniu życia
ROZKŁAD DWUMIANOWY (BERNOULLIEGO) f q E k k k Var 1 n B( n, k, p) k p, k [0, n] nk npq p k q nk Liczba "sukcesów" (k) w n próbach Np. liczba kurek wśród piskląt uzyskanych z 10 jaj Dla dużej liczby prób kształt zbliżony do rozkładu normalnego
2 0, 1 2 2 1 2 1 2 k k x Var x E t x k x k k k x f k k ROZKŁAD t Kształt zależny od stopni swobody Dla wielu stopni swobody zbliżony do rozk. normalnego
ROZKŁAD 2 Skośny 2 x f x k k 2 2 2 x (0, ] E 2 k x Var x Kształt zależny od liczby stopni swobody k 2k k 1 e x 2
1. Zmienna losowa 2. Funkcja (gęstości) prawdopodobieństwa 3. Dystrybuanta 4. Statystyki opisowe 5. Standaryzacja zmiennej losowej 6. Przykładowe rozkłady