Elementy statystyki STA - Wykład 5

Podobne dokumenty
Statystyczna analiza danych (molekularnych) analiza wariancji ANOVA

Testy post-hoc. Wrocław, 6 czerwca 2016

Wykład 5 Teoria eksperymentu

Analiza wariancji - ANOVA

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Matematyka i statystyka matematyczna dla rolników w SGGW

1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 11 DOŚWIADCZENIE JEDNOCZYNNIKOWE W UKŁADZIE CAŁKOWICIE LOSOWYM PORÓWNANIA SZCZEGÓŁOWE

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Analiza wariancji i kowariancji

Porównanie wielu rozkładów normalnych

Wykład dla studiów doktoranckich IMDiK PAN. Biostatystyka I. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Testowanie hipotez statystycznych.

Statystyka w analizie i planowaniu eksperymentu

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Jednoczynnikowa analiza wariancji

Testowanie hipotez statystycznych.

Analiza wariancji. dr Janusz Górczyński

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Testowanie hipotez statystycznych

Statystyka matematyczna dla leśników

Zadania ze statystyki cz.8. Zadanie 1.

JEDNOCZYNNIKOWA ANALIZA WARIANCJI, ANOVA

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Statystyka. #6 Analiza wariancji. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2015/ / 14

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Spis treści Wstęp Estymacja Testowanie. Efekty losowe. Bogumiła Koprowska, Elżbieta Kukla

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Analiza wariancji. Źródło: Aczel A. D. Statystyka w zarządzaniu. Barbara Gładysz

Analizy wariancji ANOVA (analysis of variance)

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Statystyka i Analiza Danych

Przykład 1. (A. Łomnicki)

Testowanie hipotez statystycznych

Analiza wariancji, część 2

Testowanie hipotez statystycznych

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych cd.

Wykład 11 Testowanie jednorodności

Statystyczna analiza danych

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Analiza wariancji. Źródło: Aczel A. D. Statystyka w zarządzaniu. Barbara Gładysz

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Analiza wariancji - ANOVA

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Testowanie hipotez statystycznych

Hipotezy statystyczne

Hipotezy statystyczne

Wykład 12 Testowanie hipotez dla współczynnika korelacji

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Stosowana Analiza Regresji

Wydział Matematyki. Testy zgodności. Wykład 03

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Prawdopodobieństwo i statystyka

Testy dla dwóch prób w rodzinie rozkładów normalnych

Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Statystyka matematyczna. Wykład VI. Zesty zgodności

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Wykład 8 Dane kategoryczne

Pakiety statystyczne - Wykªad 8

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Modele liniowe i mieszane na przykªadzie analizy danych biologicznych - Wykªad 1

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

1 Estymacja przedziałowa

Testowanie hipotez statystycznych

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Weryfikacja hipotez statystycznych

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

JEDNOCZYNNIKOWA ANOVA

Wykład 3 Hipotezy statystyczne

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Autor: Dariusz Piwczyński 1 Ćwiczenie. Analiza zmienności złożona. Testy wielokrotnych porównań

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Testowanie hipotez statystycznych

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

ANALIZA METROLOGICZNA WYNIKÓW BADAŃ NA PRZYKŁADZIE ŁOŻYSK ŚLIZGOWYCH

Analiza wariancji w analizie regresji - weryfikacja prawdziwości przyjętego układu ograniczeń Problem Przykłady

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

STATYSTYKA

Wykład 9 Testy rangowe w problemie dwóch prób

Transkrypt:

STA - Wykład 5 Wydział Matematyki i Informatyki Uniwersytet im. Adama Mickiewicza 1

ANOVA 2

Model jednoczynnikowej analizy wariancji Na model jednoczynnikowej analizy wariancji możemy traktować jako uogólnienie modelu dwóch prób prostych niezależnych o jednakowych wariancjach, na przypadek k, (k > 2) prób niezależnych. gdzie X ij = µ i + ε ij, j = 1,..., n i, i = 1, 2,... k X ij j-ta obserwacja badanej cechy X w i-tej grupie, µ i wartość oczekiwana (średnia, "prawdziwa" wartość) badanej cechy X w i-tej grupie, ε ij błędy. 3

Założenia O błędach zakładamy, że: sa niezależne (dokładnie: sa niezależnymi zmiennymi losowymi), maja wartość oczekiwana równa zero (nie ma błędu systematycznego), tzn. E(ε ij ) = 0, j = 1,..., n i, i = 1, 2,... k, maja jednakowa, stała i niezerowa wariancję, tzn. Var(ε ij ) = σ 2, j = 1,..., n i, i = 1, 2... k. Uwaga: Model ma k + 1 parametrów: µ 1,... µ k i σ 2. 4

Test ANOVA dla k prób niezależnych Rozważamy model jednoczynnikowej analizy wariancji z dodatkowym założeniem normalności rozkładów błędów. Hipoteza zerowa: wartości oczekiwane (średnie) badanej cechy w k grupach nie różnia się istotnie: H 0 : µ 1 = µ 2 = = µ k. Hipoteza alternatywna: co najmniej dla jednej pary grup, wartości oczekiwane (średnie) badanej cechy różnia się istotnie: H 1 : H 0. 5

Jednoczynnikowa ANOVA Wartość statystyki testowej obliczamy ze wzoru: F = SSA k 1 / SSE n k, gdzie SSA = k n i ( x i x) 2, SSE = i=1 k n i (x ij x i ) 2, i=1 j=1 x i = 1 n i n i j=1 x ij, x = 1 n k n i x ij, n = i=1 j=1 k n i. Przy braku istotnych różnic statystyka ta ma rozkład F z k 1 i n k stopniami swobody. i=1 6

Tabela analizy wariancji Tradycyjnie wyniki analizy wariancji przedstawiamy w postaci tabeli. Źródło Suma Liczba stopni Średnie Statystyka zmienności kwadratów swobody kwadraty testowa Pomiędzy grupami SSA k 1 MSA F Wewnatrz grup SSE n k MSE Całość SST n 1 MST MSA = SSA/(k 1), MSE = SSE/(n k), MST = SST /(n 1). 7

Test Bartletta Założenie jednorodności wariancji błędów możemy zweryfikować testem Bartletta (przy dodatkowym założeniu normalności rozkładu błędów). Hipoteza zerowa: H 0 : σ 2 1 = σ 2 2 = = σ 2 k Hipoteza alternatywna: H 1 : H 0 Statystyka testowa: gdzie B = 1 k C (n k) ln MSE (n i 1) ln Si 2, C = 1 + i=1 1 [ k 1 3(k 1) n i 1 1 ]. n k i 1 Rozkład statystyki testowej: B H0 χ 2 (k 1), (graniczny) 8

Jednoczynnikowa ANOVA układy doświadczalne Na test jednoczynnikowej analizy wariancji możemy patrzeć jak na badanie istotności wpływu czynnika A na majac a charakter ilościowy i ciagły cechę X. Czynnik występuje na k poziomach które oznaczamy A 1, A 2,..., A k. Poziomy czynnika A nazywamy obiektami doświadczalnymi. Obiekty doświadczalne sa kontrolowane przez eksperymentatora, przy czym każdy z nich jest zwiazany z pewna liczba tzw. jednostek doświadczalnych. Liczba jednostek doświadczalnych zwiazana z określonym obiektem nazywana jest liczba replikacji tego obiektu. Kojarz ac różne obiekty z jednostkami doświadczalnymi, eksperymentator kreuje różne populacje, które pragnie porównać na podstawie obserwacji badanej w doświadczeniu cechy X. 9

Układ całkowicie losowy Model jednoczynnikowej analizy wariancji zwiazany jest z układem doświadczalnym zwanym "układem całkowicie losowym". W eksperymencie badamy jaki wpływ na badana cechę populacji X ma "czynnik" A. Czynnik A posiada k poziomów A 1, A 2,..., A k. Każdy poziom czynnika jest obiektem doświadczalnym. Z i-tym obiektem zwiazanych jest n i jednostek doświadczalnych. Model dla układu całkowicie losowego zapisujemy w postaci: X ij = µ + α i + ε ij, gdzie µ średnia ogólna, α i efekt i tego obiektu, k i=1 α i = 0, ε ij błędy. j = 1,..., n i, i = 1, 2,... k Uwaga: Założenia dotyczace błędów sa identyczne jak w modelu jednoczynnikowej analizy wariancji. 10

Hipoteza zerowa: czynnik A ma istotny wpływ na cechę X: H 0 : α 1 = α 2 = = α k. Hipoteza alternatywna: czynnik A nie ma istotnego wpływu na cechę X: H 1 : H 0. Statystyka testowa: F = SSA k 1 / SSE n k SSA = k n i ( X i. X.. ) 2, SSE = i=1 k n i (X ij X i. ) 2, i=1 j=1 X i. = 1 n i n i j=1 X ij, X.. = 1 n k n i k X ij, n = n i. i=1 j=1 i=1 Rozkład statystyki testowej: F H0 F(k 1, n k) 11

Tabela analizy wariancji Tradycyjnie wyniki analizy wariancji przedstawiamy w postaci tabeli. Źródło Suma Liczba stopni Średnie Statystyka zmienności kwadratów swobody kwadraty testowa Obiekty SSA k 1 MSA F Bład SSE n k MSE Całość SST n 1 MST MSA = SSA/(k 1), MSE = SSE/(n k), MST = SST /(n 1). 12

ANOVA Analysis of Variance Sir Ronald A. Fisher (1890-1962) 13

Porównania wielokrotne (post hoc) Procedury porównań wielokrotnych stosujemy wtedy, gdy zostanie odrzucona hipoteza zerowa w teście analizy wariancji!!! Procedura LSD Fishera. Polega na testowaniu, dla każdej pary (i, j), i, j = 1, 2,..., k, i j, oddzielnie hipotezy zerowej: H 0 : µ i = µ j, przeciwko hipotezie alternatywnej H 1 : µ i µ j. Statystyka testowa: t = X i. X j. MSE ni n j n i + n j. Rozkład statystyki testowej: t H0 t(n k) 14

Porównania wielokrotne (post hoc) Procedura HSD Tukey a. Niech n 1 = n 2 = = n k = m. Polega na testowaniu, jednocześnie dla wszystkich par (i, j), i, j = 1, 2,..., k, i j, hipotez zerowych: H 0 : µ i = µ j, przeciwko hipotezom alternatywnym Statystyka testowa: H 1 : µ i µ j. q = X i. X j. m. MSE Rozkład statystyki testowej: q H0 q(k, k(m 1)) 15

HSD Honestly Significant Difference John Wilder Tukey (1915-2000) 16

Układ losowych bloków kompletnych W celu wyeliminowania niejednorodności jednostek eksperymentalnych możemy pogrupować je w bloki. Grupowanie to podporzadkowane jest zasadzie, zgodnie z która naturalna zmienność jednostek wewnatrz każdego bloku powinna być możliwie najmniejsza, podczas gdy zmienność jednostek pochodzacych z różnych bloków może być duża. W ten sposób stwarzamy porównywanym obiektom bardziej wyrównane warunki i równocześnie ograniczamy w doświadczeniu wpływ naturalnej zmienności jednostek eksperymentalnych na wielkość wariancji błędu. 17

Układ losowych bloków kompletnych Model dla układu losowych bloków kompletnych zapisujemy w postaci: X ij = µ + α i + β j + ε ij, i = 1,..., k, j = 1,..., b, gdzie µ średnia ogólna, α i efekt i tego obiektu, k i=1 α i = 0, β j efekt j tego bloku, b j=1 β j = 0, ε ij błędy. Uwaga: Założenia dotyczace błędów sa identyczne jak w modelu jednoczynnikowej analizy wariancji. 18

Hipoteza zerowa: czynnik A ma istotny wpływ na cechę X: H 0 : α 1 = α 2 = = α k. Hipoteza alternatywna: czynnik A nie ma istotnego wpływu na cechę X: H 1 : H 0. Statystyka testowa: F = SSA/ SSE b 1 k SSA = b ( X i. X.. ) 2, SSE = i=1 k b (X ij X i. X.j + X.. ) 2, i=1 j=1 X i. = 1 b X ij, X.j = 1 k b j=1 k X ij, X.. = 1 n i=1 k b X ij, n = kb. i=1 j=1 Rozkład statystyki testowej: F H0 F(k 1, (k 1)(b 1)) 19

Tabela analizy wariancji Źródło Suma Liczba stopni Średnie Statystyka zmienności kwadratów swobody kwadraty testowa Obiekty SSA k 1 MSA F Bloki SSB b 1 MSB Bład SSE (k 1)(b 1) MSE Całość SST kb 1 MST MSA = SSA/(k 1), MSB = SSB/(b 1), MSE = SSE/(k 1)(b 1), MST = SST /(kb 1). 20

R Funkcje zwiazane z analiza wariancji ): aov procedura główna, bartlett.test test Bartletta, LSD.test(agricolae) procedura LSD Fishera, HSD.test(agricolae) procedura HSD Tukeya. 21