STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Zmienne losowe i teoria prawdopodobieństwa 3. Populacje i próby danych 4. Testowanie hipotez i estymacja parametrów 5. Najczęściej wykorzystywane testy statystyczne I 6. Najczęściej wykorzystywane testy statystyczne II 7. Regresja liniowa 8. Regresja nieliniowa 9. Określenie jakości dopasowania równania regresji liniowej i nieliniowej 10. Korelacja 11. Elementy statystycznego modelowania danych 1. Porównywanie modeli 13. Analiza wariancji 14. Analiza kowariancji 15. Podsumowanie dotychczasowego materiału, wspólna analiza przykładów, dyskusja
WSTĘP 1. Test t. Test Manna-Whitneya 3. Test Wilcoxona Zakres stosowania Definicja Przykład
WSTĘP TEST HIPOTEZY PRÓBA DANYCH
TEST T
TEST T - ZAKRES STOSOWANIA 1. Porównanie średnich arytmetycznych. Dane ciągłe 3. Rozkład normalny 4. Podobne wariancje 5. Warianty testu: Pojedyncza próba H 0 : = 1.0 Dwie niezależne próby H 0 : A = B Dwie sparowane próby H 0 : A = B
TEST T POJEDYNCZA PRÓBA BMD SEX 0.97 1 0.73 1 0.87 1 0.94 1 1.0 1 0.76 1 0.78 1 1.01 1 0.8 1 0.76 1 0.87 1 0.7 1 0.91 1.0 0.87 1. Badanie osteoporozy PRÓBA DANYCH. Medical Research Council, Cambridge 3. Gęstość kości [g/cm ] 40 zdrowych osób dorosłych
TEST T POJEDYNCZA PRÓBA 1. Określenie hipotez H 0 i H 1 H 0 : średnia gęstość kości w populacji wynosi 1.0 g/cm H 1 : średnia gęstość kości w populacji różni się od 1.0 g/cm H 0 : = 1.0 H 1 : 1.0. Ustalenie poziomu istotności MAX = 0.05 3. Wybór i obliczenie wartości testu statystycznego Excel: przykład
TEST T POJEDYNCZA PRÓBA 4. Określenie rozkładu testu t x 1.0 ˆ x x 1.0 ˆ x N ~ t N 1 5. Obliczenie wartości t t 0.0000000000 Excel: przykład 6. Decyzja t < max H 0 H 1 średnia gęstość kości w populacji różni się od 1.0 g/cm
TEST T - ZAKRES STOSOWANIA 1. Porównanie średnich arytmetycznych. Dane ciągłe 3. Rozkład normalny 4. Podobne wariancje This is probably the most widely used statistical test of all time. Richard Lowry 5. Warianty testu: Pojedyncza próba H 0 : = 1.0 Dwie niezależne próby H 0 : A = B Dwie sparowane próby H 0 : A = B
TEST T DWIE NIEZALEŻNE PRÓBY BMD SEX 0.97 1 0.73 1 0.87 1 0.94 1 1.0 1 0.76 1 0.78 1 1.01 1 0.8 1 0.76 1 0.87 1 0.7 1 0.91 1.0 0.87 1. Badanie osteoporozy PRÓBA DANYCH. Medical Research Council, Cambridge 1. Gęstość kości [g/cm] 40 zdrowych osób dorosłych. Wartości znane dla mężczyzn i kobiet
TEST T DWIE NIEZALEŻNE PRÓBY 1. Określenie hipotez H 0 i H 1 H 0 : gęstość kości kobiet jest taka sama jak mężczyzn H 1 : gęstość kości kobiet jest różna niż mężczyzn H 0 : K = M H 1 : K M. Ustalenie poziomu istotności MAX = 0.05 3. Wybór i obliczenie wartości testu statystycznego
TEST T DWIE NIEZALEŻNE PRÓBY 3. Wybór i obliczenie wartości testu statystycznego Excel: przykład
TEST T DWIE NIEZALEŻNE PRÓBY 4. Określenie rozkładu testu 5. Obliczenie wartości t t 0.0466 Excel: przykład 6. Decyzja t < max H 0 H 1 gęstość kości u mężczyzn jest inna niż u kobiet,, jest wyższa
TEST T - ZAKRES STOSOWANIA 1. Porównanie średnich arytmetycznych. Dane ciągłe 3. Rozkład normalny 4. Podobne wariancje 5. Warianty testu: Pojedyncza próba H 0 : = 1.0 Dwie niezależne próby H 0 : A = B Dwie sparowane próby H 0 : A = B
TEST T DWIE SPAROWANE PRÓBY PRÓBA DANYCH Low CCT High CCT 0.0 14.3 13.9 13.8 18.3 15.8 1.1 33.4 0.1 0.3 4.4 19.9 0. 14.3 11.6 11.4 8.8 5.1 18.5 4.1 1. Badanie ciśnienia w gałce ocznej. Ciśnienie w gałkach tej samej osoby 3. Podział oczu pod względem grubości rogówki (low CCT i high CCT)
TEST T DWIE SPAROWANE PRÓBY 1. Określenie hipotez H 0 i H 1 H 0 : ciśnienie w gałce ocznej nie zależy od grubości rogówki H 1 : ciśnienie w gałce ocznej zależy od grubości rogówki H 0 : L = H H 1 : L H. Ustalenie poziomu istotności MAX = 0.05 3. Wybór i obliczenie wartości testu statystycznego t D N i1, D N i1 D i N 1 D N x 1i x i N Excel: przykład
TEST T DWIE SPAROWANE PRÓBY 3. Wybór i obliczenie wartości testu statystycznego D N i1 x 1i N x i 4.5 10 0.45 t N i1 D N D D i N 1 0.45 10 88.1 10 1 0.5
TEST T DWIE SPAROWANE PRÓBY 4. Określenie rozkładu testu t N i1 D N D D i N 1 ~ t N 1 5. Obliczenie wartości t t 0.8071 Excel: przykład 6. Decyzja t > max H 0 H 1 ciśnienie w gałce ocznej nie zależy od grubości rogówki
TEST MANNA-WHITNEYA
TEST MANNA-WHITNEYA - ZAKRES STOSOWANIA 1. Porównanie średnich arytmetycznych. Dane ciągłe lub porządkowe (rangi) 3. Dane nie mają rozkładu normalnego 4. Dwie niezależne próby
TEST MANNA-WHITNEYA ŚREDNIE WYSOKIE 5.5 6.0 6.0 7.0 5.0 7.5 7.0 6.0 5.5 7.5 6.0 8.0 7.0 11.0 6.0 9.0 8.0 8.0 7.0 11.0 6.0 8.0 7.0 8.0 6.0 7.0 8.0 7.0 6.0 7.0 7.0 9.0 PRÓBA DANYCH 1. Długość krewetki w zależności od zasolenia wody 3. Długość krewetki [mm] w wieku 4 tygodni N N 10 8 6 4 0 8 6 4 0 1 3 4 5 6 7 8 9 DŁUGOŚĆ 1 3 4 5 6 7 8 9 10 11 DŁUGOŚĆ
TEST MANNA-WHITNEYA 1. Określenie hipotez H 0 i H 1 H 0 : długość krewetki nie zależy do zasolenia wody H 1 : długość krewetki zależy od zasolenia wody H 0 : H = M H 1 : H M. Ustalenie poziomu istotności MAX = 0.05 3. Wybór i obliczenie wartości testu statystycznego U n n 1 n n 1 n1 n 1 1 min n 1n r, n1n i1 i1 i r1 i Excel: przykład
TEST MANNA-WHITNEYA 3. Wybór i obliczenie wartości testu statystycznego U U 46, 10 46 n n 1 n n 1 n1 n 1 1 min n1n r, 1 i n n r i1 i1 16 17 min16*16 min 1617 18, 16*16 346 1i
TEST MANNA-WHITNEYA 4. Określenie rozkładu testu Test nieparametryczny brak rozkładu Dla n 1 n > 0 aproksymowany przez rozkład normalny: U z ~ N U U U U, 1 U n n U n1n n1 n 1 1 ~ N 0,1 brak tablic tablice
TEST MANNA-WHITNEYA 4. Określenie rozkładu testu z n n 1 U n1n 46 16*16 n n 1 16*1633 1 1 1 3.09 ~ N 0,1 5. Obliczenie wartości t : t 0.00 Excel: przykład lub porównanie z wartością krytyczną: U 0.05, n 16, 16 181 1 n Ut 46
TEST MANNA-WHITNEYA 6. Decyzja t < max U t < U H 0 H 1 UWAGA!!! długość krewetki zależy od zasolenia wody
TEST WILCOXONA
ZAKRES STOSOWALNOŚCI TESTU WILCOXONA 1. Test nieparametryczny. Dane ciągłe lub porządkowe (rangi) 3. Dane nie mają rozkładu normalnego 4. Porównywane dwu zależnych = sparowanych prób danych
TEST WILCOXONA NR OWCY BEZ JAGN Z JAGN 1 7.00 55.50 6.35 43.80 3 55.77 66.80 4 59.98 68.00 5 51.60 57.88 6 61.48 61.90 7 5.57 45.40 8 5.50 56.67 9 56.43 73.30 10 60.13 77.50 11 48.60 63.53 1 4.90 54.50 13 53.50 55.58 14 70.43 91.10 15 47.10 64.05 16 50.08 71.40 PRÓBA DANYCH 1. Próba danych zachowanie się pokarmowe owiec. Dane zebrano w latach 1994-1996 w stadzie owiec utrzymywanym u podnóża Rocky Mountains w Kanadzie 3. Różnice w czasie pasienia się owcy z jagnięciem i bez 4. % czasu spędzanego na pasieniu się
TEST WILCOXONA NR OWCY BEZ JAGN Z JAGN PRÓBA DANYCH 1 7.00 55.50 6.35 43.80 3 55.77 66.80 4 59.98 68.00 5 51.60 57.88 6 61.48 61.90 7 5.57 45.40 8 5.50 56.67 9 56.43 73.30 10 60.13 77.50 11 48.60 63.53 1 4.90 54.50 13 53.50 55.58 14 70.43 91.10 15 47.10 64.05 16 50.08 71.40 N 3 1 0-5 -0-15 -10-5 0 5 10 15 0 RÓŻNICA W CZASIE
TEST WILCOXONA 1. Określenie hipotez H 0 i H 1 H 0 : czas pasienia się owcy nie zależy od obecności jagnięcia H 1 : czas pasienie się owcy zależy od obecności jagnięcia H 0 : J = B H 1 : J B. Ustalenie poziomu istotności MAX = 0.05 3. Wybór i obliczenie wartości testu statystycznego W min n 1 i1 N n1 r i, ri in 1 Excel: przykład
TEST WILCOXONA 3. Wybór i obliczenie wartości testu statystycznego W min n 1 i1 N n in 1 r i, r 1 i 9 9 min 107,
TEST WILCOXONA 4. Określenie rozkładu testu Test nieparametryczny brak rozkładu Dla N > 15 aproksymowany przez rozkład normalny: W ~ N, z z z W W N W W N N 1 N 1 4 ~ 16*17 9 4 16*17*33 4 W N 1 4 W N 0,1.0 ~ ~ N 0,1 N 0,1
TEST WILCOXONA 5. Obliczenie wartości t : t 0.0437 Excel: przykład lub porównanie z wartością krytyczną: W 0.05, N 16 9 Wt 9 6. Decyzja t < max W t = W H 0 H 1? czas pasienie się owcy nie/zależy od obecności jagnięcia?
PORÓWNANIE DWU PRÓB PRÓBY ZALEŻNE ROZKŁAD INNY NIŻ NORMALNY TEST WILCOXONA
PORÓWNANIE DWU PRÓB PRÓBY NIEZALEŻNE ROZKŁAD INNY NIŻ NORMALNY TEST MANNA-WHITNEYA
PORÓWNANIE DWU PRÓB PRÓBY ZALEŻNE ROZKŁAD NORMALNY TEST T
PORÓWNANIE DWU PRÓB PRÓBY NIEZALEŻNE ROZKŁAD NORMALNY TEST T