Podstawy statystycznego modelowania danych - Wykªad 7 Tomasz Suchocki ANOVA
Plan wykªadu Analiza wariancji 1. Rys historyczny 2. Podstawy teoretyczne i przykªady zastosowania 3. ANOVA w pakiecie R Tomasz Suchocki, Podstawy... Wykªad 7 2/42
Historia 1. ANalysis Of VAriance ANOVA metoda statystyki matematycznej badanie obserwacji zale»nych od jednego lub wielu czynników porównywanie wielu ±rednich Tomasz Suchocki, Podstawy... Wykªad 7 3/42
Historia 2. Sir Ronald Fisher (1890 1962) statystyk i genetyk instytut bada«rolniczych w Rothamsted koªo Harpenden 1918 - The Correlation Between Relatives on the Supposition of Mendelian Inheritance pierwsze zastosowania zostaªy opublikowanne w 1921 roku szeroko stosowana od 1925 roku po ukazaniu si ksi»ki Statistical Methods for Research Workers Tomasz Suchocki, Podstawy... Wykªad 7 4/42
Historia Tomasz Suchocki, Podstawy... Wykªad 7 5/42
Podstawy teoretyczne Analiza wariancji jednoczynnikowa wieloczynnikowa interakcje?! Analiza kowariancji Tomasz Suchocki, Podstawy... Wykªad 7 6/42
Podstawy teoretyczne - ANOVA jednoczynnikowa Jak to dziaªa? 1. Hipoteza zerowa Nie ma ró»nic pomi dzy grupami! To tylko bª d! 2. Hipoteza alternatywna Istniej ró»nice pomi dzy grupami, które nie s spowodowane przez bª dy! 3. Statystyka F Oblicz statystyk F dla odpowiedniego modelu. Tomasz Suchocki, Podstawy... Wykªad 7 7/42
Podstawy teoretyczne - ANOVA jednoczynnikowa Jednoczynnikowa analiza wariancji: Y ij = µ + α i + ɛ ij j = 1,..., n i oraz i = 1,..., k α i efekt czynnika i ɛ ij niezale»ne zmienne o identycznych rozkªadach normalnych N (0, σ 2 ) Tomasz Suchocki, Podstawy... Wykªad 7 8/42
Podstawy teoretyczne - ANOVA jednoczynnikowa Model mo»na zapisa w innej postaci: Y ij = µ i + ɛ ij µ i = µ + α i Tomasz Suchocki, Podstawy... Wykªad 7 9/42
Podstawy teoretyczne - ANOVA jednoczynnikowa Model mo»na zapisa w innej postaci: Y ij = µ i + ɛ ij µ i = µ + α i zatem Y ij N (µ i, σ 2 ) Tomasz Suchocki, Podstawy... Wykªad 7 9/42
Podstawy teoretyczne - ANOVA jednoczynnikowa Model mo»na zapisa w innej postaci: Y ij = µ i + ɛ ij µ i = µ + α i zatem Y ij N (µ i, σ 2 ) Testujemy hipotezy: H 0 : µ 1 = µ 2 =... = µ k = µ H 0 : α 1 = α 2 =... = α k = 0 Tomasz Suchocki, Podstawy... Wykªad 7 9/42
Podstawy teoretyczne - ANOVA jednoczynnikowa Model mo»na zapisa w innej postaci: Y ij = µ i + ɛ ij µ i = µ + α i zatem Y ij N (µ i, σ 2 ) Testujemy hipotezy: H 0 : µ 1 = µ 2 =... = µ k = µ H 0 : α 1 = α 2 =... = α k = 0 A jak posta ma hipoteza alternatywna? Tomasz Suchocki, Podstawy... Wykªad 7 9/42
Podstawy teoretyczne - ANOVA jednoczynnikowa Hipoteza alternatywna: H 1 : i,j µ i µ j Tomasz Suchocki, Podstawy... Wykªad 7 10/42
Podstawy teoretyczne - ANOVA jednoczynnikowa Hipoteza alternatywna: H 1 : i,j µ i µ j Ale które ±rednie si ró»ni? testy post hoc - porównuj wszystkie pary ±rednich Tomasz Suchocki, Podstawy... Wykªad 7 10/42
Podstawy teoretyczne - ANOVA jednoczynnikowa Statystyka F: F = k i=1 n 2 i (Y i Y ) k i=1 n ( i 2 n k Y j=1 ij Y i ) k 1 gdzie Y = 1 n k i=1 n i j=1 Y ij Y i = 1 ni n i j=1 Y ij statystyka F ma rozkªad F Snedecora z k 1 i n k stopniami swobody Tomasz Suchocki, Podstawy... Wykªad 7 11/42
Podstawy teoretyczne - ANOVA jednoczynnikowa Testy post hoc: Test HSD Tukeya Test Studenta-Newmana-Keulsa Test LSD Fishera Test Scheego Tomasz Suchocki, Podstawy... Wykªad 7 12/42
Przykªad - ANOVA jednoczynnikowa Obecno± witaminy D 3 wpªywa na aktywno± genu CD14, co powoduje uruchomieniem procesu wykorzystywanego w terapii przeciwnowotworowej u chorych na bialaczk. Podanie witaminy D 3 w odpowiednio wysokim st»eniu powoduje mi dzy innymi odwapnienie ko±ci. Chcemy sprawdzi, czy istniej analogi witaminy D 3 o podobnym wpªywie na ekspresj genu CD14 ale bez skutków ubocznych. Tomasz Suchocki, Podstawy... Wykªad 7 13/42
Przykªad - ANOVA jednoczynnikowa Zbiór danych, dotyczy 66 lini komórkowych pobranych od dzieci chorych na ostr biaªaczk szpikow. Ka»da z linii komórkowych zostaªa poddana dziaªaniu kilku substancji, by zobaczy, jak dana substancja dziaªa na aktywno± genu CD14. Liczony byª % komórek z obecnym receptorem CD14. Kolejne kolumny zawieraj : zmienn mutacja - czy w danej lini komórkowej wyst puje mutacja genu zwi zanego z biaªaczk (cztery grupy: mutacja w genie CBFα, mutacja w FTL-3, mutacja w innym genie lub brak mutacji); pomiar % obecno±ci CD14 w komórkach hodowlanych bez ingerencji innej substancji; pomiar % obecno±ci CD14 w komórkach hodowlanych dla okre- ±lonego molowego st»enia witaminy D 3 lub jej analoga 1906 lub 2191. Tomasz Suchocki, Podstawy... Wykªad 7 14/42
Przykªad - ANOVA jednoczynnikowa Tomasz Suchocki, Podstawy... Wykªad 7 15/42
Przykªad - ANOVA jednoczynnikowa Tomasz Suchocki, Podstawy... Wykªad 7 16/42
Przykªad - ANOVA jednoczynnikowa Hipoteza zerowa: ±redni poziom receptora CD14 po podaniu analoga 2191 nie zale»y od mutacji H 0 : i,j µ i = µ j Tomasz Suchocki, Podstawy... Wykªad 7 17/42
Przykªad - ANOVA jednoczynnikowa Hipoteza zerowa: ±redni poziom receptora CD14 po podaniu analoga 2191 nie zale»y od mutacji H 0 : i,j µ i = µ j Hipoteza alternatywna: ±redni poziom receptora CD14 po podaniu analoga 2191 jest ró»ny przynajmniej dla dwóch mutacji H 1 : i,j µ i µ j Tomasz Suchocki, Podstawy... Wykªad 7 17/42
Przykªad - ANOVA jednoczynnikowa Wyniki: Tomasz Suchocki, Podstawy... Wykªad 7 18/42
Przykªad - ANOVA jednoczynnikowa Pomi dzy którymi mutacjami s istotne ró»nice: Tomasz Suchocki, Podstawy... Wykªad 7 19/42
Przykªad - ANOVA jednoczynnikowa Diagnostyka modelu: Tomasz Suchocki, Podstawy... Wykªad 7 20/42
Przykªad - ANOVA jednoczynnikowa Diagnostyka modelu cd.: Tomasz Suchocki, Podstawy... Wykªad 7 21/42
Podstawy teoretyczne - ANOVA wieloczynnikowa Wieloczynnikowa analiza wariancji: Y ijm = µ + α i + β j + γ ij + ɛ ijm j = 1,..., r, i = 1,..., k oraz m = 1,..., n i,j α i efekt czynnika i β j efekt czynnika j γ ij interakcja pomi dzy czynnikami α i i β j ɛ ijm niezale»ne zmienne o identycznych rozkªadach normalnych N (0, σ 2 ) Tomasz Suchocki, Podstawy... Wykªad 7 22/42
Podstawy teoretyczne - ANOVA wieloczynnikowa Hipotezy zerowe H 0 : α 1 = α 2 =... = α k = 0 H 0 : β 1 = β 2 =... = β r = 0 H 0 : i j γ i,j = 0 Hipotezy alternatywne H A : i α i 0 H A : j β j 0 H A : i j γ i,j 0 Tomasz Suchocki, Podstawy... Wykªad 7 23/42
Przykªad - ANOVA wieloczynnikowa Zbiór danych dotyczy 98 osób. Dla ka»dej z nich mamy informacj o genotypach dwóch markerów typu SNP. Dokªadna struktura kolumn prezentuje si nast puj co: genotyp SNP w genie kodujacym biaªko kompleksu Nfκβ genotyp SNP w genie CD28 genotyp genu koduj cego jeden z inferonów IFN (tutaj mamy informacj, czy pacjent jest hetero-, czy homozygot ) nat»enie objawów maniakalnych nat»enie objawów znieksztaªcenia postrzegania rzeczywisto±ci nat»enie objawów depresyjnych nat»enie objawów negatywnych (niewidzenie rzeczy istniej cych) nat»enie ª cznych objawów Tomasz Suchocki, Podstawy... Wykªad 7 24/42
Przykªad - ANOVA wieloczynnikowa Tomasz Suchocki, Podstawy... Wykªad 7 25/42
Przykªad - ANOVA wieloczynnikowa interaction.plot Tomasz Suchocki, Podstawy... Wykªad 7 26/42
Przykªad - ANOVA wieloczynnikowa Tomasz Suchocki, Podstawy... Wykªad 7 27/42
Przykªad - ANOVA wieloczynnikowa Tomasz Suchocki, Podstawy... Wykªad 7 28/42
Przykªad - ANOVA wieloczynnikowa Tomasz Suchocki, Podstawy... Wykªad 7 29/42
Przykªad - ANOVA wieloczynnikowa Model z interakcj, czy bez? Tomasz Suchocki, Podstawy... Wykªad 7 30/42
Przykªad - ANOVA wieloczynnikowa Wyniki: Tomasz Suchocki, Podstawy... Wykªad 7 31/42
Przykªad - ANOVA wieloczynnikowa Testy post hoc: Tomasz Suchocki, Podstawy... Wykªad 7 32/42
Przykªad - ANOVA jednoczynnikowa Diagnostyka modelu: Tomasz Suchocki, Podstawy... Wykªad 7 33/42
Analiza kowariancji Analiza kowariancji ª czy: analiz wariancji analiz korelacji analiz regresji Tomasz Suchocki, Podstawy... Wykªad 7 34/42
Analiza kowariancji Gªówny cel metody: odpowiedzie na pytanie czy analizowany czynnik (zmienna posiadaj ca kilka poziomów) wpªywa w sposób istotny na badan cech Ró»nice w porównaniu do analizy wariancji: mo»liwo± wyeliminowania wpªywu innej cechy (zmienna towarzysz ca) maj cej wpªyw na cech badan Tomasz Suchocki, Podstawy... Wykªad 7 35/42
Analiza kowariancji Posta modelu: y ij = µ + α i + β (x ij x) + e ij, gdzie y - badana cecha α - czynni do±wiadczalny β - wspóªczynnik regresji pomi dzy zmiennymi x - zmienna towarzysz ca Tomasz Suchocki, Podstawy... Wykªad 7 36/42
Analiza kowariancji - Przykªad Na poziom hemoglobiny w organizmie ma wpªyw pªe wiek pacjenta Rozwa»my model, gdzie poziom hemoglobiny jest zmienn zale»n, natomiast czynnikiem do±wiadczalnym jest pªe. W tym przypadku nie uwzgl dniamy wpªywu wieku pacjenta na poziom hemoglobiny. W analizie kowariancji mo»emy zastosowa nast puj cy model: hemoglobina - zmienna zale»na pªe - czynnik do±wiadczalny wiek - zmienna towarzysz ca Tomasz Suchocki, Podstawy... Wykªad 7 37/42
Analiza kowariancji - przykªad 2 Tomasz Suchocki, Podstawy... Wykªad 7 38/42
Analiza kowariancji Tomasz Suchocki, Podstawy... Wykªad 7 39/42
Analiza kowariancji Tomasz Suchocki, Podstawy... Wykªad 7 40/42
Analiza kowariancji Tomasz Suchocki, Podstawy... Wykªad 7 41/42
Dzi kuj za uwag Tomasz Suchocki, Podstawy... Wykªad 7 42/42