Rozkłady dwuwymiarowe. Tablice dwudzielcze. Przykład (wstępny):

Rozkłady dwuwymiarowe Rozkłady brzegowe Rozkłady warunkowe Niezależność Kowariancja Współczynnik korelacji (Przykłady na tablicy) Tablice dwudzielcze Najprostsze tablice 2x2 : dwa rzędy i dwie kolumny Dane jakościowe z czterema klasami, które można połączyć w pary. Dwie typowe sytuacje: Dwie niezależne próby; w każdej obserwujemy jedną cechę o dwu wartościach Jedna próba; obserwujemy dwie różne cechy, z których każda może przyjmować dwie wartości. Przykład sytuacji 1 Próby to lekarstwo i placebo (lub dowolne dwa zabiegi); obserwowana zmienna to poprawa lub brak poprawy. próby samce" i samice" (dowolne dwie grupy, które chcemy porównać); obserwowana zmienna np. kolor oczu, ``fioletowe i czerwone. Przykład sytuacji 2 obserwujemy kolor oczu" (czerwone/fioletowe) i kształt skrzydła" (normalny/mniejszy) Oberwujemy, czy ludzie palą i czy ćwiczą 4 klasy; obserwacje w tabeli 2x2 Kszatłt skrzydła : Kolor oczu czerwone normalne 39 11 mniejsze 18 32 fioletowe Testujemy niezależność zmiennych definiujących rzędy i kolumny. W tym przypadku będzie to odpowiadać testowaniu hipotezy, czy oba geny leżą na innych chromosomach. Obserwowane Przykład (wstępny): zabieg Lekarstwo Placebo Wynik Poprawa 15 4 19 Brak poprawy 11 17 28 Suma 26 21 47 Suma p 1 = P(P L)-p-stwo, że nastąpi poprawa, jeżeli pacjent bierze lekarstwo p 2 = P(P Pl)-p-stwo, że nastąpi poprawa, jeżeli pacjent bierze placebo H 0 : p 1 = p 2 H A : p 1 p 2 ( lub p 1 > p 2 ) Poziom istotności α =0.01 1

W przeciwieństwie do testu zgodności, nie mamy hipotetycznych wartości dla p. Zamiast tego H 0 mówi, że oba p-stwa warunkowe są takie same, i.e. wynik i ``zabieg to zmienne niezależne H A mówi, że p-stwa warunkowe są różne, co oznacza, że zmienne ``zabieg i wynik są zależne. ˆp 1 = ˆp 2 = Jakich wartości oczekiwalibyśmy, gdyby H 0 była prawdziwa? Poprawa nastąpiła u 19 pacjentów. Jest to 19/47 = 40.4% wszystkich badanych. 26 pacjentów brało lekarstwo. Jeżeli H 0 jest prawdziwa, to u około 40.4% z nich powinna nastąpić poprawa. Podobnie liczba pacjentów, u których nastąpiła poprawa mimo, że brali placebo powinna być bliska... Ponadto oczekujemy, że nie nastąpiła poprawa u... osób biorących lekarstwo i u... osób biorących placebo. Te oczekiwane wartości umieszczamy w podobnej tabeli. Oczekiwane zabieg Suma Lekarstwo Placebo Wynik Poprawa 10.5 8.5 19 Brak poprawy 15.5 12.5 28 Suma 26 21 47 Łączymy obie tabele: Ogólnie: E = (suma w rzędzie)(suma w kolumnie)/(całkowita suma ) Dla każdej z czterech klas. Aby stosować test chi-kwadrat, w każdej klasie E powinno być nie mniejsze niż 5. Oberwowane (Oczekiwane) zabieg Suma Lekarstwo Placebo Wynik Poprawa 15 (10.5) 4 (8.5) 19 Brak poprawy 11 (15.5) 17 (12.5) 28 Suma 26 21 47 2

Czy u pacjentów biorących lekarstwo poprawa występuje częściej niż u pacjentów biorących placebo? p 1 = p-stwo poprawy u pacjentów biorących lekarstwo p 2 = p-stwo poprawy u pacjentów biorących placebo H 0 : p 1 = p 2 ; p-stwo poprawy jest takie samo w obu grupach (albo: wynik i zabieg są niezależne). H A : p 1 > p 2 ; p-stwo poprawy jest większe u pacjentów biorących lekarstwo Stosujemy test χ 2 dla niezależności X 2 s = Σ (O-E) 2 /E przy H 0 ma rozkład χ 2 1. Testujemy na poziomie istotności α = 0.01; odrzucamy H 0 gdy X 2 s >... [używamy kolumny 0.02 bo alternatywa jest kierunkowa] [Ponieważ alternatywa jest kierunkowa musimy wykonać kolejny krok] pˆ... 1 pˆ 2... Χ 2 s =... ˆp 1 ˆp 2 Stopnie swobody df = 1 dla tabeli 2x2. Ogólnie (#rzędów-1)(#kolumn-1) Wniosek:... Wartości krytyczne: Gdy H A jest niekierunkowa szukamy w kolumnie α, gdy jest kierunkowa w kolumnie 2α. Co oznacza odrzucenie H 0? Czasami trzeba być ostrożnym przy formułowaniu wniosków. Gdy odrzucamy H 0, to mamy przesłanki, aby przypuszczać, że zmienne nie są niezależne. To jednak nie zawsze odpowiada związkowi przyczynowemu! Nasze badanie wskazuje, że stan pacjentów biorących lekarstwo częściej się poprawia, niż stan pacjentów biorących placebo. Tutaj kontrolowaliśmy zabieg, więc możemy przypuszczać, że istnieje związek przyczynowy. Gdybyśmy jednak testowali niezależność koloru oczu i kształtu skrzydeł u muszek owocówek nie moglibyśmy stwierdzić związku przyczynowego (np. Kolor oczu wpływa na kształt skrzydeł??). Możemy tylko powiedzieć, że oba fenotypy są zmiennymi zależnymi. 3

Przykład z muszkami (krzyżówka wsteczna CcNn z ccnn) Uzupełniamy tabelkę wartościami oczekiwanymi przy Ho Kolor oczu Suma Kolor oczu czerwone fioletowe Rozmiar skrzydła czerwone fioletowe normalne 39 11 mniejsze 18 32 Kształt skrzydła normalne 39 ( ) 11 ( ) 50 mniejsze 18 ( ) 32 ( ) 50 Suma 57 43 100 Czy w badanej populacji muszek kolor oczu i kształt skrzydła są zmiennymi niezależnymi? p 1 = Pr(czerwone oczy normalne skrzydła), p 2 = Pr(czerwone oczy mniejsze skrzydła), H 0 : p 1 = p 2 ; kolor oczu i rozmiar skrzydła są niezależne H A : p 1 p 2 ; kolor oczu i rozmiar skrzydła są zmiennymi zależnymi Można obliczyć, że: ˆp 1 ˆp 2 Zastosujemy test chi-kwadrat dla niezależności Χ 2 s = Σ (O-E) 2 /E ma przy H 0 rozkład χ 2 1. Testujemy na poziomie α = 0.05; odrzucamy gdy Χ 2 s > 3.84 = Χ 2 krytyczne X 2 =... Wniosek:... Nie możemy jednak powiedzieć, że czerwone oczy powodują, że muszka ma normalne skrzydła. Prawidłowy wniosek to obserwacja, że kolor oczu i kształt skrzydła są zmiennymi zależnymi, albo że u muszek z normalnymi skrzydłami częściej występują czerwone oczy niż u muszek z mniejszymi skrzydłami. Nie możemy formułować wniosku przyczynowego, ponieważ nie kontrolujemy analizowanych zmiennych, a jedynie je obserwujemy. [W tym wypadku zależność wynika z faktu, że geny determinujące kształt oczu i rozmiar skrzydła leżą na jednym chromosomie.] Tablice wielodzielcze: r k r rzędów, k kolumn: r k Analiza analogiczna do tablic 2 2. Przykład: 3 4 (r = 3 ; k = 4 ) 4

Kolor oczu Brązowe Szare/ Zielone Niebies kie Kolor włosów Brązowe Czarne Jasne 438 (331.7) 1387 (1212.3) 807 (1088.0) 288 (154.1) 746 (563.3) 189 (505.6) 115 (356.5) 946 (1303.0) 1768 (1169.5) Rude 16 (14.6) 53 (53.4) 47 (48.0) Suma 857 3132 2811 Suma 2632 1223 2829 116 6800 Czy kolor oczu i włosów są zmiennymi zależnymi? H 0 : Kolor włosów i kolor oczu to zmienne niezależne H A : Kolor oczu i kolor włosów to zmienne zależne Wykonujemy test niezależności chi-kwadrat Χ 2 = Σ(O-E) 2 /E ma przy H 0 rozkład χ 2 6. df = (r-1)(k-1) = (2)(3) = 6 Testujemy na poziomie α =.0005. Wartość krytyczna χ 2 6 =... Χ 2 s =... Wniosek... Estymator dla Pr(Oczy niebieskie) =... Estymator dla Pr(Oczy niebieskie włosy brązowe) =... Estymator dla Pr(Oczy niebieskie czarne włosy) =... Estymator dla Pr(Oczy niebieskie jasne włosy) =... Estymator dla Pr(Oczy niebieskie rude włosy) =... Testowanie niezależności odpowiada testowaniu, że odpowiednie p-stwa warunkowe są te same w każdej klasie. Gdy testujemy niezależność w dużych tabelach, to na ogół nie zapisujemy H 0 za pomocą prawdopodobieństw warunkowych. Przypomnienie założeń: Próby losowe Obserwacje niezależne "E" w każdej komórce musi być 5 Dokładny test Fishera Stosujemy dla małych rozmiarów prób Przykład : ECMO ECMO to ``nowa procedura służąca ratowaniu noworodków cierpiących na poważne zaburzenia pracy układu oddechowego. CMT konwencjonalna terapia 5

Zabieg Wynik CMT ECMO Suma Zgon 4 1 5 Życie 6 28 34 Suma 10 29 39 H 0 : wynik nie zależy od zabiegu Znajdziemy warunkowe prawdopodobieństwo zaobserwowanych wyników przy ustalonych ``sumach w rzędach i kolumnach (przy H 0 ). Przypomnijmy symbol Newtona - n k Na tyle sposobów można wybrać zbiór k elementowy ze zbioru n elementowego Na ile sposobów dokładnie 4 dzieci spośród 5 z tych które miały umrzeć mogło przypadkowo zostać przyporządkowanych do grupy CMT:... Na ile sposobów dokładnie 6 dzieci spośród 34 z tych które miały przeżyć mogło przypadkowo zostać przyporządkowanych do grupy CMT:... H A : ECMO jest lepsza niż CMT Przypadki bardziej ekstremalne w kierunku alternatywy # liczba śmierci = CMT:4, ECMO:1 CMT:5, ECMO:0 Na ile sposobów 10 dzieci spośród 39 mogło przypadkowo zostać przyporządkowanych do grupy CMT:... P-wartość =... Wniosek:... 6