STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Teoria prawdopodobieństwa i elementy kombinatoryki 3. Zmienne losowe 4. Populacje i próby danych 5. Testowanie hipotez i estymacja parametrów 6. Test t 7. Test 2 8. Test F 9. Testy nieparametryczne 10. Podsumowanie dotychczasowego materiału, wspólna analiza przykładów, dyskusja 11. Korelacja 12. Regresja liniowa i nieliniowa 13. Określenie jakości dopasowania równania regresji liniowej i nieliniowej 14. Analiza wariancji 15. Podsumowanie dotychczasowego materiału, wspólna analiza przykładów, dyskusja
WSTĘP 1. Korelacja liniowa Pearsona obliczanie testowanie 2. Korelacja rangowa Spearmana obliczanie testowanie 3. Współczynnik podobieństwa Jaccarda obliczanie testowanie Copyright 2017, Joanna Szyda
WSPÓŁCZYNNIK KORELACJI PEARSONA Copyright 2010, Joanna Szyda
WSPÓŁCZYNNIK KORELACJI PEARSONA - definicja r xy n n i1 x x y y i n 2 x x y y i i1 i1 i i 2 1. Miara zależności pomiędzy 2ma zmiennymi (x,y) 2. Założenia: ciągłe wartości zmiennych normalny rozkład zmiennych zależność liniowa 3. Wartości [ -1, 1 ] Copyright 2010, Joanna Szyda
WSPÓŁCZYNNIK KORELACJI PEARSONA - definicja oryginalne odchylenia masa tłuszcz masa tłuszcz 89 28 9.6 1.7 88 27 8.6 0.7 66 24-13.4-2.3 59 23-20.4-3.3 93 29 13.6 2.7 r xy n n i1 x x y y i n 2 x x y y i i1 i1 i i 2 73 25-6.4-1.3 82 29 2.6 2.7 77 25-2.4-1.3 100 30 20.6 3.7 67 23-12.4-3.3 odchylenia od średniej: n x i x yi y i1 średnia: 79.4 26.3 0.000 0.000 Copyright 2013, Joanna Szyda
WSPÓŁCZYNNIK KORELACJI PEARSONA - przykłady 20 15 r xy = -1 20 15 r xy = -0.9 y 10 y 10 5 5 0 0 5 10 15 20 x 0 0 5 10 15 20 x 20 15 r xy = -0.5 20 15 r xy = 1 y 10 y 10 5 5 0 0 5 10 15 20 x 0 0 5 10 15 20 x Copyright 2010, Joanna Szyda
WSPÓŁCZYNNIK KORELACJI PEARSONA - przykłady 26 21 16 y 11 6 1 r xy = 0.816 3 7 11 15 19 x 26 21 16 y 11 6 1 r xy = 0.816 3 7 11 15 19 x 26 21 16 y 11 6 1 r xy = 0.816 3 7 11 15 19 x 26 21 16 y 11 6 1 r xy = 0.816 3 7 11 15 19 x Copyright 2010, Joanna Szyda
WSPÓŁCZYNNIK KORELACJI PEARSONA - przykłady PRÓBA DANYCH MASA CIAŁA ZAW. TŁUSZCZU 89 28 88 27 66 24 59 23 93 29 73 25 82 29 r mt = 0.94 77 25 100 30 67 23 Copyright 2010, Joanna Szyda
WSPÓŁCZYNNIK KORELACJI PEARSONA - testowanie 1. Hipotezy H 0 : brak korelacji między masą ciała, a zaw. tłuszczu H 1 : istnieje korelacja między masą ciała, a zaw. tłuszczu H 0 : r mt = 0 H 1 : r mt 0 2. Założone maksymalne prawdopodob. błędu a MAX = 0.01 3. Test: t r tm N 2 1 r 2 tm ~ t N 2 4. Prawdopodobieństwo błędu dla t=7.47 wynosi a T =0.00007 5. a MAX > a T 6. H 1 7. Występuje dodatnia korelacja między masą ciała, a zaw. tłuszczu Copyright 2010, Joanna Szyda
WSPÓŁCZYNNIK KORELACJI WIELOKROTNEJ - definicja 1. Miara jak daną zmienną można przewidzieć stosując liniową funkcję innych zmiennych 2. Mierzy jedynie siłę lecz nie kierunek zmian 3. Wartości [ 0, 1 ] 2 zmienne: n zmiennych: Copyright 2017, Joanna Szyda
WSPÓŁCZYNNIK KORELACJI SPEARMANA
WSPÓŁCZYNNIK KORELACJI SPEARMANA - definicja xy 6 i1 1 2 N n N d 2 i 1 różnica w rankingu zmiennych x i y 1. Miara zależności pomiędzy 2ma zmiennymi (x,y) 2. Brak założeń dotyczących rozkładu zmiennych 3. Brak założeń dotyczących liniowej zależności 4. Test nieparametryczny 5. Wykorzystuje ranking obserwacji 6. Wartości [ -1, 1 ] Copyright 2015, Joanna Szyda
WSPÓŁCZYNNIK KORELACJI SPEARMANA - przykłady 26 21 16 y 11 6 1 xy = 0.818 3 7 11 15 19 x 26 21 16 y 11 6 1 xy = 0.691 3 7 11 15 19 x 26 21 16 y 11 6 1 xy = 0.991 3 7 11 15 19 x 26 21 16 y 11 6 1 xy = 0.500 3 7 11 15 19 x Copyright 2010, Joanna Szyda
WSPÓŁCZYNNIK KORELACJI SPEARMANA- przykłady objętość [cm 3 ] częstotliwość [Hz] 1760 529 2040 566 2440 473 2550 461 2730 465 2740 532 3010 484 3080 527 3370 488 PRÓBA DANYCH 1. 18 samców Fregata magnificens 2. Powiązanie objętości worka z częstotliwością wydawanego dźwięku 3740 485 ct = - 0.76 Copyright 2010, Joanna Szyda
WSPÓŁCZYNNIK KORELACJI SPEARMANA - testowanie 1. Hipotezy H 0 : brak korelacji między objętością, a częstotliwością H 1 : istnieje korelacja między objętością, a częstotliwością H 0 : ct = 0 H 1 : ct 0 2. Założone maksymalne prawdopodob. błędu a MAX = 0.01 3. Test: t 4. Prawdopodobieństwo błędu dla t=-4.68 wynosi a T =0.00019 5. a MAX > a T N 2 1 2 ~ t N 2 6. H 1 7. Występuje ujemna korelacja między objętością worka, a częstotliwością dźwięku Copyright 2010, Joanna Szyda
Współczynnik podobieństwa Jaccarda
Współczynnik podobieństwa Jaccarda - definicja N 11 liczba przypadków, gdy obie zmienne = 1 [1,1] N 10 liczba przypadków [1,0] N 01 liczba przypadków [0,1] 1. Miara zależności pomiędzy zmiennymi binarnymi 2. Zmienne o rozkładzie dwumianowym 3. Rozkład statystyki nie jest znany 4. Wartości [ 0, 1 ] Copyright 2017, Joanna Szyda
Współczynnik podobieństwa Jaccarda - przykład Wysoka ekspresja genów związanych z jednostkami chorobowymi gen Fragile X Alzheimer s syndrome disease ADAM 10 1 1 ADCYAP1R1 1 0 AKT 1 1 0 APBB1 1 1 APP 1 1 CYP19A1 1 0 EGFR 1 0 ESR1 1 0 FKBP4 1 0 HBA1/HBA2 1 1 MAPK1 1 0 MMP2 1 1 NDE1 1 0 NFAT C4 1 1 NRP1 1 0 Pkc(s) 1 1 TP53 1 1 FDFT 1 0 1 LSS 0 1 mir-103 0 1 mir-125b-5p 0 1 UCHL1 0 1 Copyright 2017, Joanna Szyda
Współczynnik podobieństwa Jaccarda - przykład 1. Hipotezy H 0 : brak korelacji między genetyczną determinacją choroby 1 i choroby 2 H 1 : istnieje korelacja między genetyczną determinacją choroby 1 i choroby 2 H 0 : J = 0 H 1 : J > 0 Copyright 2017, Joanna Szyda
PRZYKŁADY Z LITERATURY
PRZYKŁAD Z LITERATURY t N 2 2 1 ~ tn 2 Copyright 2011, Joanna Szyda
PRZYKŁAD Z LITERATURY Copyright 2011, Joanna Szyda
PRZYKŁAD Z LITERATURY Copyright 2017, Joanna Szyda
KORELACJA Copyright 2011 Joanna Szyda