STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne 6. Testy nieparametryczne 7. Korelacja i regresja liniowa i nieliniowa 8. Analiza wariancji Copyright 2010, Joanna Szyda
WSTĘP 1. Zmienna losowa 2. Funkcja (gęstości) prawdopodobieństwa 3. Dystrybuanta 4. Statystyki opisowe 5. Standaryzacja zmiennej losowej 6. Przykładowe rozkłady
ZMIENNA LOSOWA random variable (mat.) funkcja, przyjmuje różne wartości wartości są określone przez przypadek X PRZYJĘTA WARTOŚĆ x Przykłady? DYSKRETNA (SKOKOWA) niektóre wartości (przeważnie liczby naturalne) CIĄGŁA (teoretycznie) wszystkie wartości z określonego zakresu liczb rzeczywistych
DYSKRETNA random variable CIĄGŁA liczba szczeniąt w miocie X X=x czyli X=7 X { 1, 2, 3, 4, 5, 6, 7, 8, 9 } wysokość konia w kłębie W W=w czyli W=167 W [ 150, 190 ]
Zmienna losowa przyjmuje różne wartości (np. zmienna dyskretna X wartości x i ) z różnym prawdopodobieństwem (Przykład???) Jak można określić to prawdopodobieństwo? Przy pomocy funkcji matematycznej
FUNKCJA PRAWDOPODOBIEŃSTWA FUNKCJA GĘSTOŚCI PRAWDOPODOBIEŃSTWA
FUNKCJA (GĘSTOŚCI) PRAWDOPODOBIEŃSTWA probability (density) function DYSKRETNA funkcja prawdopodobieństwa jakie jest prawdopodobieństwo uzyskania danej wartości X { 1, 2, 3, 4, 5, 6, 7, 8, 9 } P(X=x i ) urodzenie 5 szczeniąt P(X=5) CIĄGŁA funkcja gęstości prawdopodobieństwa jakie jest prawdopodobieństwo uzyskania wartości z danego przedziału W [ 150, 190 ] f(w) wys. w kłębie [ 160, 165 ] 165 160 w 0. 12 f dw
FUNKCJA (GĘSTOŚCI) PRAWDOPODOBIEŃSTWA probability (density) function DYSKRETNA CIĄGŁA 9 i1 P X 1 x i f wdw 1 wysokość w kłębie w
Z poprzedniego wykładu: Dla jednej zmiennej określamy tzw. prawdopodobieństwo brzegowe A dla dwóch zmienych?
FUNKCJA (GĘSTOŚCI) PRAWDOPODOBIEŃSTWA DWÓCH ZMIENNYCH DYSKRETNA CIĄGŁA w y x z prawdopodobieństwo łączne, warunkowe
Zbiór wartości funkcji prawdodobieństwa to ROZKŁAD PRAWDOPODOBIEŃSTWA ZMIENNEJ LOSOWEJ lub krótko ROZKŁAD ZMIENNEJ LOSOWEJ znany rozkład możliwość analizy statystycznej
DYSTRYBUANTA
DYSTRYBUANTA dystrybuanta DYSKRETNA jakie jest prawdopodobieństwo uzyskania wartości mniejszej lub równej x X { 1, 2, 3, 4, 5, 6, 7, 8, 9 } F(x) = P(Xx) urodzenie maks 5 szczeniąt F(5)=P(X5)=0.40 cumulative distribution function dystrybuanta CIĄGŁA jakie jest prawdopodobieństwo uzyskania wartości mniejszej lub równej w W [ 150, 190 ] F w w wdw max wys. w kłębie 170 F 170 f 170 f wdw 0. 69
DYSTRYBUANTA DYSKRETNA cumulative distribution function CIĄGŁA F 1 9 i1 P X 1 x i F 0 wysokość w kłębie w
DYSTRYBUANTA - zastosowanie pr. urodzenia 1 szczeniaka: F(1)=P(X1)=0.03 pr. urodzenia maks. 9 szczeniaków: F(9)=P(X9)=1 pr. urodzenia maks. 3 szczeniaków: F(3)=P(X3)=0.03+0.04+0.06 pr. urodzenia 4 lub 5 szczeniaków: F(5)-F(3) DYSKRETNA
DYSTRYBUANTA - zastosowanie CIĄGŁA pr. wystąpienia osobnika o wys. w kłębie maks. 155 cm: F(155)=P(W 155)=0.11 pr. wystąpienia osobnika o wys. w kłębie maks. 190 cm: F(190)=P(W 190)=1.00 pr. wystąpienia osobnika o wys. w kłębie 160-170 cm: F(170)-F(160)=0.32 pr. wystąpienia osobnika o wys. w kłębie pow. 165 cm: 1-F(165)=0.62 wysokość w kłębie w P(a x b) F(b) F(a)
STATYSTYKI OPISOWE
WARTOŚĆ OCZEKIWANA I WARIANCJA wartość oczekiwana wariancja Jak opisać rozkład zmiennej losowej modalna mediana
WARTOŚĆ OCZEKIWANA expected value DYSKRETNA E(X)=5.72 szczeniąt - w miotach liczba urodzonych szczeniąt jest bliska 5 Wartość oczekiwana E(X) liczba, wokół której skupiają się poszczególne wartości zmiennej losowej wartość średnia E(X)=0.03*1 + 0.04*2 + 0.06*3 + 0.10*4 + 0.17*5 + 0.22*6 + 0.23*7 + 0.10*8 + 0.05*9 CIĄGŁA E(W)=167 cm - większość koni ma wys. w kłębie ok. 167 cm 9 E X EW wf wdw i1 p i x i
WARIANCJA variance Wariancja 2 X V(X), Var(X), liczba określająca rozproszenie wartości zmiennej wokół wartości oczekiwanej, miara zmienności V X, s. d. X, X odchylenie standardowe DYSKRETNA CIĄGŁA V EX E 2 V ( X ) EW EW 2 ( X ) X
ZMIENNA STANDARYZOWANA Standaryzacja zmiennej X stara zmienna nowa zmienna z X E X V (X ) Z i X mają taki sam typ rozkładu E(Z) = 0 Var(Z) = 1 Znaczenie: uniwersalność rozkładu i dystrybuanty zmiennnej standaryzowanej, wykorzystuje się w analizach tablice statystyczne dla tzw. rozkładu normalnego F(z) = F(x)
MEDIANA median Mediana liczba, która dzieli funkcję na połowy DYSKRETNA P(X m) ½ i P(X m) ½ CIĄGŁA F(w)=½ wysokość w kłębie w
MODALNA Modalna wartość, która występuje najczęściej mode DYSKRETNA wartość x o najwyższym prawdopodobieństwie CIĄGŁA wartość w dla której f(w) jest najwyższe wysokość w kłębie w
STATYSTYKI OPISOWE w. oczekiwana modalna mediana rozkład symetryczny modalna mediana w. oczekiwana rozkład skośny
STATYSTYKI OPISOWE duża wariancja mała wariancja
PRZYKŁADOWE ROZKŁADY
ROZKŁAD NORMALNY x f x N e 2,, E(x) = mediana = modalna 1 x 1 2 2 2 Bardzo często spotykany w danych biologicznych Np. wydajność mleka Np. masa ciała prosięcia w 4 tygodniu życia
ROZKŁAD DWUMIANOWY (BERNOULLIEGO) f q E k k k Var 1 n B( n, k, p) p k p, k [0, n] nk npq k q nk Liczba "sukcesów" (k) w n próbach Np. liczba kurek wśród piskląt uzyskanych z 10 jaj Dla dużej liczby prób kształt zbliżony do rozkładu normalnego
2 0, 1 2 2 1 2 1 2 k k x Var x E t x k x k k k x f k k ROZKŁAD t Kształt zależny od stopni swobody Dla wielu stopni swobody zbliżony do rozk. normalnego
ROZKŁAD 2 Skośny E 2 k x Var x k 2k k 1 2 x f x k k 2 2 2 x (0, ] Kształt zależny od liczby stopni swobody e x 2
1. Zmienna losowa 2. Funkcja (gęstości) prawdopodobieństwa 3. Dystrybuanta 4. Statystyki opisowe 5. Standaryzacja zmiennej losowej 6. Przykładowe rozkłady