STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 3. Zmienne losowe 4. Populacje i próby danych 5. Testowanie hipotez i estymacja parametrów 6. Test t 7. Test 8. Test F 9. Testy nieparametryczne 10.Podsumowanie dotychczasowego materiału, wspólna analiza przykładów, dyskusja 11.Korelacja 1.Regresja liniowa i nieliniowa 13.Określenie jakości dopasowania równania regresji liniowej i nieliniowej 14.Analiza wariancji 15.Podsumowanie dotychczasowego materiału, wspólna analiza przykładów, dyskusja
WSTĘP Testy testy dla tablic kontyngencji 1. Zakres stosowalności. Klasyfikacja jednoczynnikowa 3. Klasyfikacja dwuczynnikowa 4. Test McNemara 5. Test ilorazu szans Copyright 015, Joanna Szyda
ZAKRES STOSOWALNOŚCI TESTÓW Testowanie zależności pomiędzy kategoriami 1. Dane w formie częstości ilość obserwacji w danej kategorii (%, średnia, prawdopodobieństwo, ). Dane podzielone na kategorie nominalne, porządkowe, (ciągłe ) 3. Nie należy stosować testów gdy: Oczekiwana częstotliwość dla pewnych kategorii jest mała ( < 5 ) Copyright 014, Joanna Szyda
TEST KLASYFIKACJA JEDNOCZYNNIKOWA One-way classification
TEST KLASYFIKACJA JEDNOCZYNNIKOWA KOLOR Biały CZĘSTOŚĆ Żółty Żółty 8 Żółty Czerwony Czerwony 5 Żółty Biały Żółty 4 Żółty Żółty SUMA Czerwony 17 Biały Czerwony Żółty Czerwony Czerwony Biały Żółty Biały 1. Klasyfikacja danych wg pojedynczego kryterium. Kolor kwiatów krokusa PRÓBA DANYCH Copyright 010, Joanna Szyda
TEST KLASYFIKACJA JEDNOCZYNNIKOWA 1. Określenie hipotez H 0 i H 1 H 0 : częstości wystąpienia kolorów są jednakowe H 1 : częstości wystąpienia kolorów są różne H 0 : n B = n Ż = n C H 1 : n B n Ż n C. Ustalenie poziomu istotności MAX = 0.05 3. Wybór i obliczenie wartości testu statystycznego i i bi bi żó żó cz cz n n n n n n n n N K obs exp obs exp obs exp obs exp i bi żó cz i1 nexp nexp nexp nexp Copyright 010, Joanna Szyda
TEST KLASYFIKACJA JEDNOCZYNNIKOWA n i i obs exp i1 i nexp N K n liczebność klasy zaobserwowana w próbie danych liczebność klasy oczekiwana dla H 0 n i exp N K i 1 N n i obs K H 0 n obs = n exp = 0 H 1 n obs n exp > 0 Excel: przykład Copyright 010, Joanna Szyda
TEST KLASYFIKACJA JEDNOCZYNNIKOWA 3. Wybór i obliczenie wartości testu statystycznego N K bi bi żó żó cz cz n n n n n n n n obs n i1 exp 4 5.7 8 5.7 5 5.7 5.7 exp 5.7 obs n exp bi exp 5.7 obs n exp żó exp 1.53 obs n exp cz exp 4. Określenie rozkładu testu: ~ K 1 5. Obliczenie wartości t : t 0.47 Excel: przykład 6. Decyzja: t > max H 0 H 1 częstości wystąpienia kolorów są jednakowe Copyright 010, Joanna Szyda
TEST KLASYFIKACJA DWUCZYNNIKOWA Two-way classification
TEST KLASYFIKACJA DWUCZYNNIKOWA 1. Klasyfikacja danych wg dwu kryteriów PRÓBA DANYCH. Liczebność słoni w Parku Narodowym Mikumi, Tanzania Pora samotny samiec grupa samców kategoria grupa rodzinna grupa rodzinna + samiec sucha 43 4 196 7 deszczowa 9 17 195 8 Copyright 010, Joanna Szyda
TEST KLASYFIKACJA DWUCZYNNIKOWA 1. Określenie hipotez H 0 i H 1 H 0 : pora roku nie wpływa na zmiany liczebności słoni w poszczególnych kategoriach (oba kryteria są niezależne) H 1 : pora roku wpływa na zmiany liczebności słoni w poszczególnych kategoriach (oba kryteria są zależne) H 0 : n Di = n Si dla i=1 4 H 1 : n Di n Si. Ustalenie poziomu istotności MAX = 0.05 3. Wybór i obliczenie wartości testu statystycznego N K M i1 ij ij D _1 D _1 S _ 4 S _ 4 n n n n n n N obs exp ij j1 nexp obs n exp D _1 exp obs n exp S _ 4 exp Copyright 010, Joanna Szyda
TEST KLASYFIKACJA DWUCZYNNIKOWA n N N ij ij obs exp i1 j1 ij nexp K M n liczebność klasy oczekiwana dla H 0 n ij exp N K i1 n N i. obs N M j1 n N. j obs N N K NM i. n obs i1 j1 N n. j obs samot ny samie c grupa samc ów grupa rodzin na grupa rodzin na + samie c suma sucha 43 4 196 7 50 deszc zowa 9 17 195 8 31 suma 135 1 391 15 56 sucha deszczo deszczo wa samotn y samiec grupa samców 135*50 1*50 56 56? grupa rodzinn a grupa rodzinn a + samiec sucha 60.5 9.34 173.93 6.67 wa 74.95 11.66 17.07 8.33 Copyright 010, Joanna Szyda
TEST KLASYFIKACJA DWUCZYNNIKOWA 3. Wybór i obliczenie wartości testu statystycznego 43 60.05 9 74.95 4 9.34 17 11.66 196 173.93 195 17.07 7 6.67 8 8.33 19.30 N K N M i1 j1 exp 60.05 173.93 n ij obs n n ij exp 74.95 17.07 9.34 6.67 11.66 8.33 4. Określenie rozkładu testu: K 1 M 1 ~ 3 5. Obliczenie wartości t : 0. 000 t Excel: przykład Copyright 010, Joanna Szyda
TEST KLASYFIKACJA DWUCZYNNIKOWA 6. Decyzja: t < max H 0 H 1 liczebność poszczególnych grup słoni różni się w zależności od pory roku Copyright 010, Joanna Szyda
TEST MCNEMARA McNemar's test
TEST McNEMARA PRÓBA DANYCH 1. Wzrost bakterii Mycobacterium tuberculosis na pożywkach (A / B). Próbki pobrane od 50 chorych 3. Dane sparowane (ten sam pacjent) B A wzrost brak wz. wzrost 17 1 brak wz. 5 16 Copyright 011, Joanna Szyda
TEST McNEMARA 1. Określenie hipotez H 0 i H 1 H 0 : rodzaj pożywki nie wpływa na wzrost bakterii (oba kryteria są niezależne) H 1 : rodzaj pożywki wpływa na wzrost bakterii (oba kryteria są zależne) H 0 : n 1 = n 1 H 1 : n 1 n 1. Ustalenie poziomu istotności MAX = 0.05 3. Wybór i obliczenie wartości testu statystycznego n n 1 1 n n 1 1 Copyright 010, Joanna Szyda
TEST McNEMARA 3. Wybór i obliczenie wartości testu statystycznego 1 5 1 5 4. Określenie rozkładu testu:.88 ~ 1 50 obserwacji 1 st. swobody! obserwacje sparowane 5. Obliczenie wartości t : t 0.08956 6. Decyzja: t > max H 0 H 1 rodzaj pożywki nie wpływa na wzrost bakterii Copyright 010, Joanna Szyda
TEST ILORAZU SZANS Odds ratio test
TEST ILORAZU SZANS PRÓBA DANYCH 1. Związek występowania raka przełyku ze spożywaniem alkoholu. Zbadano 975 osób Wystąpienie raka przełyku Spożycie alkoholu w ilości powyżej 80 g/dzień Rak przełyku tak nie Spożycie alkoholu >80 g/4h 96 109 80 g/4h 104 666 Copyright 014, Joanna Szyda
TEST ILORAZU SZANS 1. Określenie hipotez H 0 i H 1 H 0 : prawdopodobieństwo wystąpienie raka przełyku nie zależy od ilości spożywanego alkoholu H 1 : prawdopodobieństwo wystąpienie raka przełyku zależy od ilości spożywanego alkoholu H 0 : P(r) alk = P(r) n_alk H 1 : P(r) alk P(r) n_alk. Ustalenie poziomu istotności MAX = 0.05 Copyright 015, Joanna Szyda
TEST ILORAZU SZANS 3. Wybór i obliczenie wartości testu statystycznego Rak przełyku Tak nie Szansa P(r) Spożycie alkoholu >80 g/4h 96 109 90/109 80 g/4h 104 666 104/666 Copyright 015, Joanna Szyda
TEST ILORAZU SZANS 4. Określenie rozkładu testu: 5. Obliczenie wartości t : 6. Decyzja: t < max H 0 H 1 prawdopodobieństwo wystąpienie raka przełyku zależy od ilości spożywanego alkoholu Excel: przykład Copyright 015, Joanna Szyda
Copyright 011 Joanna Szyda
QUIZ KTÓREJ WERSJI TESTU UŻYĆ? Gavin et al. (1994) J. Ped. Psy. 4: 355-365 Badanie obejmuje osoby hospitalizowane z powodu astmy Badano 60 hospitalizowanych osób - etap 1 Po roku na ponowne badania zgłosiło się 30 (z 60) osób etap Porównywano liczebności 30 osób, które zgłosiły się na ponowne badania z 30 osobami, które się nie zgłosiły, w zależności od płci, wieku, rasy, itd. Copyright 010, Joanna Szyda
QUIZ KTÓREJ WERSJI TESTU UŻYĆ?
QUIZ KTÓREJ WERSJI TESTU UŻYĆ? 1. Klasyfikacja pojedyncza. Klasyfikacja podwójna 3. Test McNemara
QUIZ KTÓREJ WERSJI TESTU UŻYĆ? Spencer et al. (1998) Am. J. Psychiatry 155: 693-695 Czy lek tomoxetina wpływa na ADHD Badano 1 osób w wieku 19-60 lat Etap 1: Dzień 0: rejestracja symptomów ADHD podawanie placebo przez 3 tygodnie Dzień 1 rejestracja symptomów ADHD >30% zmniejszenie nasilenia ADHD = poprawa Etap : podawanie tomoxetiny przez 3 tygodnie Dzień 1 rejestracja symptomów ADHD >30% zmniejszenie nasilenia ADHD = poprawa Copyright 010, Joanna Szyda
QUIZ KTÓREJ WERSJI TESTU UŻYĆ?
QUIZ KTÓREJ WERSJI TESTU UŻYĆ? 1. Klasyfikacja pojedyncza. Klasyfikacja podwójna 3. Test McNemara
QUIZ KTÓREJ WERSJI TESTU UŻYĆ? Junca et al. (014) Plos One DOI:10.1371/journal.pone.0097333 Analiza wpływu wybranych czynników środowiskowych na zachowanie pszczół Eksperyment obejmował 40 osobników Cecha: SER = sting extension response (wysunięcie żądła) po stymulacji cieplnej Copyright 015, Joanna Szyda
QUIZ KTÓREJ WERSJI TESTU UŻYĆ? test
QUIZ KTÓREJ WERSJI TESTU UŻYĆ? 1. Klasyfikacja pojedyncza. Klasyfikacja podwójna 3. Test McNemara
QUIZ KTÓREJ WERSJI TESTU UŻYĆ? Uemura et al. (001) NEJM 345: 784-789 Powiązanie chorób układu pokarmowego z zakażeniem Helicobacter pylori Badano 155 pacjentów Copyright 010, Joanna Szyda
QUIZ KTÓREJ WERSJI TESTU UŻYĆ?
QUIZ KTÓREJ WERSJI TESTU UŻYĆ? 1. Klasyfikacja pojedyncza. Klasyfikacja podwójna 3. Test McNemara