Podstawy statystycznego modelowania danych - Wykªad 7

Podobne dokumenty
Pakiety statystyczne - Wykªad 8

Modele liniowe i mieszane na przykªadzie analizy danych biologicznych - Wykªad 1

Modele liniowe i mieszane na przykªadzie analizy danych biologicznych - Wykªad 6

Elementy statystyki STA - Wykład 5

Metody statystyczne w biologii - Wykªad 8. Uniwersytet Przyrodniczy we Wrocªawiu Katedra Genetyki i Ogólnej Hodowli Zwierz t

Elementarna statystyka Wnioskowanie o regresji (Inference 2 czerwca for regression) / 13

Analiza wariancji - ANOVA

Statystyczna analiza danych (molekularnych) analiza wariancji ANOVA

1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe

Ekonometria. wiczenia 2 Werykacja modelu liniowego. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Ekonometria - wykªad 8

Modele liniowe i mieszane na przykªadzie analizy danych biologicznych - Wykªad 1

Modele wielorównaniowe. Estymacja parametrów

Podstawy statystycznego modelowania danych Analiza prze»ycia

STATYSTYCZNE MODELOWANIE DANYCH BIOLOGICZNYCH

Testy post-hoc. Wrocław, 6 czerwca 2016

MODEL HAHNFELDTA I IN. ANGIOGENEZY NOWOTWOROWEJ Z UWZGL DNIENIEM LEKOOPORNO CI KOMÓREK NOWOTWOROWYCH

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 11 DOŚWIADCZENIE JEDNOCZYNNIKOWE W UKŁADZIE CAŁKOWICIE LOSOWYM PORÓWNANIA SZCZEGÓŁOWE

Matematyka i statystyka matematyczna dla rolników w SGGW

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Pakiety statystyczne Wykªad 14

Metody probablistyczne i statystyka stosowana

Analiza wariancji i kowariancji

Informatyka w selekcji - Wykªad 1

Ekonometria - wykªad 1

Testowanie hipotez statystycznych.

In»ynierskie zastosowania statystyki wiczenia

Matematyka z elementami statystyki

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

Elementarna statystyka Dwie próby: porównanie dwóch proporcji (Two-sample problem: comparing two proportions)

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Wykład 5 Teoria eksperymentu

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Modele wielorównaniowe. Problem identykacji

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Statystyka matematyczna - ZSTA LMO

Biostatystyka, # 5 /Weterynaria I/

Analiza wariancji - ANOVA

Testowanie hipotez statystycznych.

Egzamin z ekonometrii - wersja ogólna

Rozwini cia asymptotyczne dla mocy testów przybli»onych

MODELE LINIOWE i MIESZANE

Ekonometria. wiczenia 4 Prognozowanie. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Jednoczynnikowa analiza wariancji

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

STATYSTYCZNE MODELOWANIE DANYCH BIOLOGICZNYCH

Przykªadowe analizy. Grzegorz Kemski. 26 listopada 2008

Ekonometria Bayesowska

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

1 Estymacja przedziałowa

EGZAMIN MAGISTERSKI, r Matematyka w ekonomii i ubezpieczeniach

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Biostatystyka, # 4 /Weterynaria I/

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

5. (8 punktów) EGZAMIN MAGISTERSKI, r Matematyka w ekonomii i ubezpieczeniach

Metody Statystyczne. Metody Statystyczne. #8 Błąd I i II rodzaju powtórzenie. Dwuczynnikowa analiza wariancji

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Ekonometria. wiczenia 8 Modele zmiennej jako±ciowej. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Testowanie hipotez statystycznych

Problem dwóch prób: porównywanie średnich i wariancji z populacji o rozkładach normalnych. Wrocław, 23 marca 2015

Dodatek 3. Wielowymiarowe modele GARCH model DCC-GARCH

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Elementarna statystyka Test Istotno±ci (Tests of Signicance)

Porównanie dwóch rozkładów normalnych

EGZAMIN MAGISTERSKI, r Matematyka w ekonomii i ubezpieczeniach

Porównanie wielu rozkładów normalnych

Zadanie 1. (8 punktów) Dana jest nast puj ca macierz: M =

Elementarna statystyka Test Istotno±ci

Elementy Modelowania Matematycznego Wykªad 1 Prawdopodobie«stwo

Korelacja krzywoliniowa i współzależność cech niemierzalnych

Ekonometria. wiczenia 3 Autokorelacja, heteroskedastyczno±, wspóªliniowo± Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Wykªad 6: Model logitowy

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Metody bioinformatyki (MBI)

Testowanie hipotez statystycznych cd.

Porównywanie wielowymiarowych wektorów warto±ci ±rednic

Statystyczna analiza danych w programie STATISTICA. Dariusz Gozdowski. Katedra Doświadczalnictwa i Bioinformatyki Wydział Rolnictwa i Biologii SGGW

Wst p do ekonometrii II

Analiza wariancji. dr Janusz Górczyński

Statystyka w analizie i planowaniu eksperymentu

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Metody numeryczne i statystyka dla in»ynierów

Spis treści Wstęp Estymacja Testowanie. Efekty losowe. Bogumiła Koprowska, Elżbieta Kukla

Informatyka w selekcji - Wykªad 4

Stacjonarne szeregi czasowe

Weryfikacja hipotez statystycznych testy dla dwóch zbiorowości

Stosowana Analiza Regresji

Wykład 5 Problem dwóch prób - testowanie hipotez dla równości średnich

Testowanie hipotez statystycznych

STATYSTYKA MATEMATYCZNA WYKŁAD października 2009

Ekonometria Bayesowska

Na podstawie dokonanych obserwacji:

Karta (sylabus) modułu/przedmiotu Inżynieria Materiałowa Studia II stopnia Specjalność: Inżynieria Powierzchni

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Wykład 7 Testowanie zgodności z rozkładem normalnym

Transkrypt:

Podstawy statystycznego modelowania danych - Wykªad 7 Tomasz Suchocki ANOVA

Plan wykªadu Analiza wariancji 1. Rys historyczny 2. Podstawy teoretyczne i przykªady zastosowania 3. ANOVA w pakiecie R Tomasz Suchocki, Podstawy... Wykªad 7 2/42

Historia 1. ANalysis Of VAriance ANOVA metoda statystyki matematycznej badanie obserwacji zale»nych od jednego lub wielu czynników porównywanie wielu ±rednich Tomasz Suchocki, Podstawy... Wykªad 7 3/42

Historia 2. Sir Ronald Fisher (1890 1962) statystyk i genetyk instytut bada«rolniczych w Rothamsted koªo Harpenden 1918 - The Correlation Between Relatives on the Supposition of Mendelian Inheritance pierwsze zastosowania zostaªy opublikowanne w 1921 roku szeroko stosowana od 1925 roku po ukazaniu si ksi»ki Statistical Methods for Research Workers Tomasz Suchocki, Podstawy... Wykªad 7 4/42

Historia Tomasz Suchocki, Podstawy... Wykªad 7 5/42

Podstawy teoretyczne Analiza wariancji jednoczynnikowa wieloczynnikowa interakcje?! Analiza kowariancji Tomasz Suchocki, Podstawy... Wykªad 7 6/42

Podstawy teoretyczne - ANOVA jednoczynnikowa Jak to dziaªa? 1. Hipoteza zerowa Nie ma ró»nic pomi dzy grupami! To tylko bª d! 2. Hipoteza alternatywna Istniej ró»nice pomi dzy grupami, które nie s spowodowane przez bª dy! 3. Statystyka F Oblicz statystyk F dla odpowiedniego modelu. Tomasz Suchocki, Podstawy... Wykªad 7 7/42

Podstawy teoretyczne - ANOVA jednoczynnikowa Jednoczynnikowa analiza wariancji: Y ij = µ + α i + ɛ ij j = 1,..., n i oraz i = 1,..., k α i efekt czynnika i ɛ ij niezale»ne zmienne o identycznych rozkªadach normalnych N (0, σ 2 ) Tomasz Suchocki, Podstawy... Wykªad 7 8/42

Podstawy teoretyczne - ANOVA jednoczynnikowa Model mo»na zapisa w innej postaci: Y ij = µ i + ɛ ij µ i = µ + α i Tomasz Suchocki, Podstawy... Wykªad 7 9/42

Podstawy teoretyczne - ANOVA jednoczynnikowa Model mo»na zapisa w innej postaci: Y ij = µ i + ɛ ij µ i = µ + α i zatem Y ij N (µ i, σ 2 ) Tomasz Suchocki, Podstawy... Wykªad 7 9/42

Podstawy teoretyczne - ANOVA jednoczynnikowa Model mo»na zapisa w innej postaci: Y ij = µ i + ɛ ij µ i = µ + α i zatem Y ij N (µ i, σ 2 ) Testujemy hipotezy: H 0 : µ 1 = µ 2 =... = µ k = µ H 0 : α 1 = α 2 =... = α k = 0 Tomasz Suchocki, Podstawy... Wykªad 7 9/42

Podstawy teoretyczne - ANOVA jednoczynnikowa Model mo»na zapisa w innej postaci: Y ij = µ i + ɛ ij µ i = µ + α i zatem Y ij N (µ i, σ 2 ) Testujemy hipotezy: H 0 : µ 1 = µ 2 =... = µ k = µ H 0 : α 1 = α 2 =... = α k = 0 A jak posta ma hipoteza alternatywna? Tomasz Suchocki, Podstawy... Wykªad 7 9/42

Podstawy teoretyczne - ANOVA jednoczynnikowa Hipoteza alternatywna: H 1 : i,j µ i µ j Tomasz Suchocki, Podstawy... Wykªad 7 10/42

Podstawy teoretyczne - ANOVA jednoczynnikowa Hipoteza alternatywna: H 1 : i,j µ i µ j Ale które ±rednie si ró»ni? testy post hoc - porównuj wszystkie pary ±rednich Tomasz Suchocki, Podstawy... Wykªad 7 10/42

Podstawy teoretyczne - ANOVA jednoczynnikowa Statystyka F: F = k i=1 n 2 i (Y i Y ) k i=1 n ( i 2 n k Y j=1 ij Y i ) k 1 gdzie Y = 1 n k i=1 n i j=1 Y ij Y i = 1 ni n i j=1 Y ij statystyka F ma rozkªad F Snedecora z k 1 i n k stopniami swobody Tomasz Suchocki, Podstawy... Wykªad 7 11/42

Podstawy teoretyczne - ANOVA jednoczynnikowa Testy post hoc: Test HSD Tukeya Test Studenta-Newmana-Keulsa Test LSD Fishera Test Scheego Tomasz Suchocki, Podstawy... Wykªad 7 12/42

Przykªad - ANOVA jednoczynnikowa Obecno± witaminy D 3 wpªywa na aktywno± genu CD14, co powoduje uruchomieniem procesu wykorzystywanego w terapii przeciwnowotworowej u chorych na bialaczk. Podanie witaminy D 3 w odpowiednio wysokim st»eniu powoduje mi dzy innymi odwapnienie ko±ci. Chcemy sprawdzi, czy istniej analogi witaminy D 3 o podobnym wpªywie na ekspresj genu CD14 ale bez skutków ubocznych. Tomasz Suchocki, Podstawy... Wykªad 7 13/42

Przykªad - ANOVA jednoczynnikowa Zbiór danych, dotyczy 66 lini komórkowych pobranych od dzieci chorych na ostr biaªaczk szpikow. Ka»da z linii komórkowych zostaªa poddana dziaªaniu kilku substancji, by zobaczy, jak dana substancja dziaªa na aktywno± genu CD14. Liczony byª % komórek z obecnym receptorem CD14. Kolejne kolumny zawieraj : zmienn mutacja - czy w danej lini komórkowej wyst puje mutacja genu zwi zanego z biaªaczk (cztery grupy: mutacja w genie CBFα, mutacja w FTL-3, mutacja w innym genie lub brak mutacji); pomiar % obecno±ci CD14 w komórkach hodowlanych bez ingerencji innej substancji; pomiar % obecno±ci CD14 w komórkach hodowlanych dla okre- ±lonego molowego st»enia witaminy D 3 lub jej analoga 1906 lub 2191. Tomasz Suchocki, Podstawy... Wykªad 7 14/42

Przykªad - ANOVA jednoczynnikowa Tomasz Suchocki, Podstawy... Wykªad 7 15/42

Przykªad - ANOVA jednoczynnikowa Tomasz Suchocki, Podstawy... Wykªad 7 16/42

Przykªad - ANOVA jednoczynnikowa Hipoteza zerowa: ±redni poziom receptora CD14 po podaniu analoga 2191 nie zale»y od mutacji H 0 : i,j µ i = µ j Tomasz Suchocki, Podstawy... Wykªad 7 17/42

Przykªad - ANOVA jednoczynnikowa Hipoteza zerowa: ±redni poziom receptora CD14 po podaniu analoga 2191 nie zale»y od mutacji H 0 : i,j µ i = µ j Hipoteza alternatywna: ±redni poziom receptora CD14 po podaniu analoga 2191 jest ró»ny przynajmniej dla dwóch mutacji H 1 : i,j µ i µ j Tomasz Suchocki, Podstawy... Wykªad 7 17/42

Przykªad - ANOVA jednoczynnikowa Wyniki: Tomasz Suchocki, Podstawy... Wykªad 7 18/42

Przykªad - ANOVA jednoczynnikowa Pomi dzy którymi mutacjami s istotne ró»nice: Tomasz Suchocki, Podstawy... Wykªad 7 19/42

Przykªad - ANOVA jednoczynnikowa Diagnostyka modelu: Tomasz Suchocki, Podstawy... Wykªad 7 20/42

Przykªad - ANOVA jednoczynnikowa Diagnostyka modelu cd.: Tomasz Suchocki, Podstawy... Wykªad 7 21/42

Podstawy teoretyczne - ANOVA wieloczynnikowa Wieloczynnikowa analiza wariancji: Y ijm = µ + α i + β j + γ ij + ɛ ijm j = 1,..., r, i = 1,..., k oraz m = 1,..., n i,j α i efekt czynnika i β j efekt czynnika j γ ij interakcja pomi dzy czynnikami α i i β j ɛ ijm niezale»ne zmienne o identycznych rozkªadach normalnych N (0, σ 2 ) Tomasz Suchocki, Podstawy... Wykªad 7 22/42

Podstawy teoretyczne - ANOVA wieloczynnikowa Hipotezy zerowe H 0 : α 1 = α 2 =... = α k = 0 H 0 : β 1 = β 2 =... = β r = 0 H 0 : i j γ i,j = 0 Hipotezy alternatywne H A : i α i 0 H A : j β j 0 H A : i j γ i,j 0 Tomasz Suchocki, Podstawy... Wykªad 7 23/42

Przykªad - ANOVA wieloczynnikowa Zbiór danych dotyczy 98 osób. Dla ka»dej z nich mamy informacj o genotypach dwóch markerów typu SNP. Dokªadna struktura kolumn prezentuje si nast puj co: genotyp SNP w genie kodujacym biaªko kompleksu Nfκβ genotyp SNP w genie CD28 genotyp genu koduj cego jeden z inferonów IFN (tutaj mamy informacj, czy pacjent jest hetero-, czy homozygot ) nat»enie objawów maniakalnych nat»enie objawów znieksztaªcenia postrzegania rzeczywisto±ci nat»enie objawów depresyjnych nat»enie objawów negatywnych (niewidzenie rzeczy istniej cych) nat»enie ª cznych objawów Tomasz Suchocki, Podstawy... Wykªad 7 24/42

Przykªad - ANOVA wieloczynnikowa Tomasz Suchocki, Podstawy... Wykªad 7 25/42

Przykªad - ANOVA wieloczynnikowa interaction.plot Tomasz Suchocki, Podstawy... Wykªad 7 26/42

Przykªad - ANOVA wieloczynnikowa Tomasz Suchocki, Podstawy... Wykªad 7 27/42

Przykªad - ANOVA wieloczynnikowa Tomasz Suchocki, Podstawy... Wykªad 7 28/42

Przykªad - ANOVA wieloczynnikowa Tomasz Suchocki, Podstawy... Wykªad 7 29/42

Przykªad - ANOVA wieloczynnikowa Model z interakcj, czy bez? Tomasz Suchocki, Podstawy... Wykªad 7 30/42

Przykªad - ANOVA wieloczynnikowa Wyniki: Tomasz Suchocki, Podstawy... Wykªad 7 31/42

Przykªad - ANOVA wieloczynnikowa Testy post hoc: Tomasz Suchocki, Podstawy... Wykªad 7 32/42

Przykªad - ANOVA jednoczynnikowa Diagnostyka modelu: Tomasz Suchocki, Podstawy... Wykªad 7 33/42

Analiza kowariancji Analiza kowariancji ª czy: analiz wariancji analiz korelacji analiz regresji Tomasz Suchocki, Podstawy... Wykªad 7 34/42

Analiza kowariancji Gªówny cel metody: odpowiedzie na pytanie czy analizowany czynnik (zmienna posiadaj ca kilka poziomów) wpªywa w sposób istotny na badan cech Ró»nice w porównaniu do analizy wariancji: mo»liwo± wyeliminowania wpªywu innej cechy (zmienna towarzysz ca) maj cej wpªyw na cech badan Tomasz Suchocki, Podstawy... Wykªad 7 35/42

Analiza kowariancji Posta modelu: y ij = µ + α i + β (x ij x) + e ij, gdzie y - badana cecha α - czynni do±wiadczalny β - wspóªczynnik regresji pomi dzy zmiennymi x - zmienna towarzysz ca Tomasz Suchocki, Podstawy... Wykªad 7 36/42

Analiza kowariancji - Przykªad Na poziom hemoglobiny w organizmie ma wpªyw pªe wiek pacjenta Rozwa»my model, gdzie poziom hemoglobiny jest zmienn zale»n, natomiast czynnikiem do±wiadczalnym jest pªe. W tym przypadku nie uwzgl dniamy wpªywu wieku pacjenta na poziom hemoglobiny. W analizie kowariancji mo»emy zastosowa nast puj cy model: hemoglobina - zmienna zale»na pªe - czynnik do±wiadczalny wiek - zmienna towarzysz ca Tomasz Suchocki, Podstawy... Wykªad 7 37/42

Analiza kowariancji - przykªad 2 Tomasz Suchocki, Podstawy... Wykªad 7 38/42

Analiza kowariancji Tomasz Suchocki, Podstawy... Wykªad 7 39/42

Analiza kowariancji Tomasz Suchocki, Podstawy... Wykªad 7 40/42

Analiza kowariancji Tomasz Suchocki, Podstawy... Wykªad 7 41/42

Dzi kuj za uwag Tomasz Suchocki, Podstawy... Wykªad 7 42/42