STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Zmienne losowe i teoria prawdopodobieństwa 3. Populacje i próby danych 4. Testowanie hipotez i estymacja parametrów 5. Najczęściej wykorzystywane testy statystyczne I. Najczęściej wykorzystywane testy statystyczne II 7. Regresja liniowa 8. Regresja nieliniowa 9. Określenie jakości dopasowania równania regresji liniowej i nieliniowej 10. Korelacja 11. Elementy statystycznego modelowania danych 12. Porównywanie modeli 13. Analiza wariancji 14. Analiza kowariancji 15. Podsumowanie dotychczasowego materiału, wspólna analiza przykładów, dyskusja
WSTĘP 1. Korelacja liniowa Pearsona obliczanie testowaie korelacja wielokrotna 2. Korelacja rangowa Spearmana obliczanie Testowanie 3. Inne miary korelacji
WSPÓŁCZYNNIK KORELACJI PEARSONA
WSPÓŁCZYNNIK KORELACJI PEARSONA - definicja r y n n i1 y y i n 2 y y i i1 i1 oryginalne odchylenia masa tłuszcz masa tłuszcz 89 28 9. 1.7 odchylenia od średniej: 88 27 8. 0.7 24-13.4-2.3 n 59 23-20.4-3.3 i yi y 93 29 13. 2.7 73 25 -.4-1.3 i1 82 29 2. 2.7 77 25-2.4-1.3 100 30 20. 3.7 7 23-12.4-3.3 średnia: 79.4 2.3 0.000 0.000 i i 2
WSPÓŁCZYNNIK KORELACJI PEARSONA - definicja r y n n i1 y y i n 2 y y i i1 i1 i i 2 1. Miara zależności pomiędzy 2ma zmiennymi (,y) 2. Założenia: ciągłe wartości zmiennych normalny rozkład zmiennych mierzy zależność liniową 3. Wartości [ -1, 1 ]
WSPÓŁCZYNNIK KORELACJI PEARSONA - przykłady 20 15 y10 5 0 20 15 y10 5 20 r y = -1 r y = -0.9 y10 5 0 0 5 10 15 20 0 5 10 15 20 r y = -0.5 20 r y = 1 15 y10 5 15 0 0 5 10 15 20 0 0 5 10 15 20
WSPÓŁCZYNNIK KORELACJI PEARSONA - przykłady 2 21 1 y11 1 r y = 0.81 3 7 11 15 19 2 21 1 y11 1 r y = 0.81 3 7 11 15 19 2 21 1 y11 1 r y = 0.81 3 7 11 15 19 2 21 1 y11 1 r y = 0.81 3 7 11 15 19
WSPÓŁCZYNNIK KORELACJI PEARSONA - przykłady PRÓBA DANYCH MASA CIAŁA ZAW. TŁUSZCZU 89 28 88 27 24 59 23 93 29 73 25 82 29 r = 0.94 77 25 100 30 7 23
WSPÓŁCZYNNIK KORELACJI PEARSONA - testowanie 1. Hipotezy H 0 : brak korelacji między masą ciała, a zaw. tłuszczu H 1 : istnieje korelacja między masą ciała, a zaw. tłuszczu H 0 : r = 0 H 1 : r 0 2. Założone maksymalne prawdopodob. błędu a MAX = 0.01 3. Test: t = r n 2 1 r 2 ~t n 2 4. Prawdopodobieństwo błędu dla t=7.47 wynosi a T =0.00007 5. a MAX > a T. H 1 7. Występuje dodatnia korelacja między masą ciała, a zawartością tłuszczu
WSPÓŁCZYNNIK KORELACJI WIELOKROTNEJ - definicja 1. Miara jak daną zmienną można przewidzieć stosując liniową funkcję innych zmiennych 2. Mierzy jedynie siłę lecz nie kierunek zmian 3. Wartości [ 0, 1 ]
WSPÓŁCZYNNIK KORELACJI SPEARMANA
WSPÓŁCZYNNIK KORELACJI SPEARMANA - definicja y 1. Miara zależności pomiędzy 2ma zmiennymi (,y) 2. Brak założeń dotyczących rozkładu zmiennych 3. Brak założeń dotyczących liniowej zależności pomiędzy zmiennymi 4. Mierzy zależność monotoniczną 5. Wykorzystuje ranking obserwacji i1 1 2 N n N d 2 i 1 różnica w rankingu zmiennych i y. Wartości [ -1, 1 ]
WSPÓŁCZYNNIK KORELACJI SPEARMANA - przykłady 2 21 1 y11 1 y = 0.818 3 7 11 15 19 2 21 1 y11 1 y = 0.91 3 7 11 15 19 2 21 1 y11 1 y = 0.991 3 7 11 15 19 2 21 1 y11 1 y = 0.500 3 7 11 15 19
WSPÓŁCZYNNIK KORELACJI SPEARMANA- przykłady objętość [cm 3 ] częstotliwość [Hz] 170 529 2040 5 2440 473 2550 41 2730 45 2740 532 3010 484 3080 527 3370 488 PRÓBA DANYCH 1. 18 samców Fregata magnificens 2. Powiązanie objętości worka z częstotliwością wydawanego dźwięku 3740 485 = - 0.7
WSPÓŁCZYNNIK KORELACJI SPEARMANA - testowanie 1. Hipotezy H 0 : brak korelacji między objętością, a częstotliwością H 1 : istnieje korelacja między objętością, a częstotliwością H 0 : = 0 H 1 : 0 2. Założone maksymalne prawdopodob. błędu a MAX = 0.01 3. Test: 4. Prawdopodobieństwo błędu dla t=-4.8 wynosi a T =0.00019 5. a MAX > a T. H 1 t N 2 1 2 ~ t N 7. Występuje ujemna korelacja między objętością worka, a częstotliwością dźwięku 2
y y y WSPÓŁCZYNNIK KORELACJI PEARSONA vs. SPEARMANA y y y y y y 1 3 1 1 1 0 1 1 1 10 1 10 2 4 2 2 2 3 2 2 2 8 2 3 5 3 3 3 3. 3 3 3 7 3 4 4 4 4 4 3.7 4 4 4.5 4 3 5 7 5 5 5 3.9 5 5 5 5 1 8 4.4 2 7 9 7 7 7 4.1 7 7 7 7.1 7 5 8 10 8 8 8 4.2 8 8 8 8 8 9 11 9 9 9 9 9 9 9 8.5 9 8 10 12 10 10 10 14 10 10 10 9 10 9 P S P S P S 14 12 10 8 14 12 10 8 14 12 10 8 4 4 4 2 2 2 0 0 1 2 3 4 5 7 8 9 10 11 0 0 1 2 3 4 5 7 8 9 10 11 0 0 1 2 3 4 5 7 8 9 10 11
INNE MIARY KORELACJI
WSPÓŁCZYNNIK TAU (Kendall) τ = n c n d n(n 1) 2 objęt ość [cm 3 ] częstotliw ość [Hz] Ranga 1 Ranga 2 # zgodnych rang # niezgodn ych rang 170 529 1 1 2 15 2040 5 2 18 0 1 2440 473 3 10 9 2550 41 4 7 7 2730 45 5 8 2740 532 17 9 12 3010 484 7 12 3 8 3080 527 8 15 0 10 3370 488 9 14 0 9 3740 485 10 13 0 8 4910 478 11 11 0 7 5090 434 12 5 1 4 5091 48 13 9 0 5 5380 449 14 0 4 5850 425 15 4 0 3 730 389 1 1 2 0 990 421 17 3 0 1 790 41 18 2 Suma rang 3 123 Miara korelacji oparta na rangach τ [ 1,1] τ = 3 123 18(18 1) 2 τ = 0.57
WSPÓŁCZYNNIK TAU (Kendall) 1. Hipotezy H 0 : brak korelacji między objętością, a częstotliwością H 1 : istnieje korelacja między objętością, a częstotliwością H 0 : t = 0 H 1 : t 0 2. Założone maksymalne prawdopodob. błędu a MAX = 0.01 3. Test: z = 4. Prawdopodobieństwo błędu dla z=-3.30 wynosi a T =0.001 5. a MAX > a T τ 0 2(2n + 5) 9n(n 1) = 0.57 0.17 = 3.30 ~N(0,1). H 1 7. Występuje ujemna korelacja między objętością, a częstotliwością
WSPÓŁCZYNNIK GAMMA (Goodman i Kruskal) γ = n c n d Miara korelacji oparta na rangach n c + n d Podobna do t γ [ 1,1] 3. Test: z = 3γ n(n 1) 2(2n + 5) = 3 0.55 17.49 9.0 = 3.17 ~N(0,1) 4. Prawdopodobieństwo błędu dla z=-3.17 wynosi a T =0.002 5. a MAX > a T. H 1 7. Występuje ujemna korelacja między objętością, a częstotliwością
LITERATURA
1. Korelacja liniowa Pearsona obliczanie testowaie korelacja wielokrotna 2. Korelacja rangowa Spearmana obliczanie Testowanie 3. Inne miary korelacji