Analizy wariancji ANOVA (analysis of variance)

Podobne dokumenty
LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

ANALIZA WARIANCJI - KLASYFIKACJA JEDNOCZYNNIKOWA

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Analiza wariancji. dr Janusz Górczyński

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Przykład 1. (A. Łomnicki)

Testy nieparametryczne

Statystyka i Analiza Danych

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Analiza wariancji i kowariancji

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Statystyka. #6 Analiza wariancji. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2015/ / 14

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Wprowadzenie do analizy dyskryminacyjnej

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Elementy statystyki STA - Wykład 5

Rozkłady statystyk z próby

Analiza wariancji - ANOVA

JEDNOCZYNNIKOWA ANOVA

Rozdział 8. Regresja. Definiowanie modelu

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

ANALIZA WARIANCJI - KLASYFIKACJA WIELOCZYNNIKOWA

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Jednoczynnikowa analiza wariancji

Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś.

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

1 Estymacja przedziałowa

Ćwiczenie komputerowe 2 testy t-studenta. Program Statistica

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Opracowywanie wyników doświadczeń

Wykład 3 Hipotezy statystyczne

Testy post-hoc. Wrocław, 6 czerwca 2016

ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ

Wydział Matematyki. Testy zgodności. Wykład 03

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Testowanie hipotez statystycznych

1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

KORELACJE I REGRESJA LINIOWA

Matematyka i statystyka matematyczna dla rolników w SGGW

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Wykorzystanie testu Levene a i testu Browna-Forsythe a w badaniach jednorodności wariancji

Badanie normalności rozkładu

Estymacja parametrów w modelu normalnym

Analiza wariancji - ANOVA

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Zawartość. Zawartość

WNIOSKOWANIE STATYSTYCZNE

Zadania ze statystyki cz.8. Zadanie 1.

Weryfikacja hipotez. Etap I. Formułowanie hipotezy zerowej H 0 oraz związanej z nią hipotezy alternatywnej H 1.

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 11 DOŚWIADCZENIE JEDNOCZYNNIKOWE W UKŁADZIE CAŁKOWICIE LOSOWYM PORÓWNANIA SZCZEGÓŁOWE

Ćwiczenie: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności.

Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

Wykład dla studiów doktoranckich IMDiK PAN. Biostatystyka I. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Spis treści. Księgarnia PWN: Bruce M. King, Edward W. Minium - Statystyka dla psychologów i pedagogów. Wstęp Wprowadzenie...

Zadania ze statystyki, cz.6

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Oszacowanie i rozkład t

POLITECHNIKA WARSZAWSKA

Wykład 9 Wnioskowanie o średnich

Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.

PDF created with FinePrint pdffactory Pro trial version

Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Wykład 5 Teoria eksperymentu

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Rozkłady statystyk z próby. Statystyka

Analiza wpłat na rachunek 51 Funduszu Ubezpieczeń Społecznych w 2015 r. z zastosowaniem wariancji jednoczynnikowej oraz ANOVY efektów głównych

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Analiza wariancji (ANalysis Of Variance - ANOVA)

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Testowanie hipotez statystycznych

You created this PDF from an application that is not licensed to print to novapdf printer (

Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2000, 2008

Wnioskowanie statystyczne. Statystyka w 5

Transkrypt:

ANOVA

Analizy wariancji ANOVA (analysis of variance) jest to metoda równoczesnego badania istotności różnic między wieloma średnimi z prób pochodzących z wielu populacji (grup).

Model jednoczynnikowy analiza wariancji z klasyfikacją pojedynczą Jednoczynnikowa ANOVA. Jest to technika badania wyników (doświadczeń, obserwacji), które zależą od jednego czynnika np. metody leczenia, metody produkcji, rodzaju zastosowanych materiałów itp. Czynniki te nazywane są: predyktorami jakościowymi czynnikami grupującymi, lub klasyfikacyjnymi.

ANOVA Założenia: Danych jest k populacji o rozkładzie normalnym N(m i, i ). Zakłada się, że wariancje wszystkich k populacji są równe tzn. 1 2 = 2 2 =... n 2 (lecz nie muszą być znane). Z każdej z tych populacji wylosowano niezależne próby o liczebnościach wynoszących odpowiednio n i. Wyniki prób oznaczone są przez x ij.

Hipotezy H 0 : m 1 = m 2 =... = m r (średnie we wszystkich populacjach są identyczne) H 1 : m i m j dla co najmniej jednej pary wskaźników i, j.

Obliczamy średnią x~ dla wszystkich grup - ze wszystkich wartości x i,j k i n i x~ 1 x i n ij n i 1 j 1 k i 1 n i

1. Dla poszczególnych prób oblicza się średnie dla każdej grupy x i 1 n i n i j 1 x ij

Międzygrupowa suma kwadratów Sumy kwadratów odchyleń średnich poszczególnych grup od średniej globalnej Jest miarą całkowitego zróżnicowania średnich - zmienność międzygrupowa. SS m k i 1 ( x i ~ x ) 2 n i

Zmienność wewnątrz grup Zmienność wynikająca z błędu, czyli tej części odchylenia standardowego, której nie możemy przypisać różnicy między grupami SS b k n i i 1 j 1 ( x ij x i 2 )

Tablica analizy wariancji ANOVA Źródło Zmienności Suma kwadratów (SS) Stopnie swobody (df) Wariancja (MS) F Między populacja mi (grupami) SS m k-1 sˆ 2 1 SS m k 1 ŝ ŝ 2 1 2 2 Wewnątrz grup SS b n-k sˆ 2 2 SS n b k

Z tablic rozkładu F Fishera (Snedecora) odczytuje się wartość krytyczną F dla ustalonego poziomu istotności oraz dla odpowiedniej liczby k-1 oraz n-k stopni swobody. Obszar krytyczny prawostronny wyznaczony przez relację P( F F ) = Jeśli F < F oznacza to, że nie ma podstaw do odrzucenia hipotezy zerowej czyli wartości średnie badanych populacji są takie same.

ANOVA w Statistica Dane Zmn1 Zmn2 1 1 9.1 2 1 8.9 3 1 8.4 4 1 12.8 5 1 8.7 6 1 9.2 7 1 7.6 8 1 8.6 9 1 8.9 10 1 7.9 11 2 10 12 2 10.2 13 2 9.8 14 2 11.6 15 2 9.5 16 2 9.2 17 2 8.6 18 2 10.3 19 2 9.4 20 2 8.5

ANOVA w Statistica

Definicja zmiennych

Kody zmiennych grupujących

Pojedyncze tabele

Analiza średnich i odchyleń Przed rozpoczęciem właściwej analizy należy: wyświetlić wartości średnich i odchyleń standardowych w poszczególnych podgrupach - Tabele statystyk, utworzyć Wykresy interakcji, wykresy ramkawąsy, Sprawdzić założenia

Tabela statystyk Dla metody 4 - średnia różni się znacznie od średniej dla pozostałych metod.

Założenia AVOVY 1. Mierzalność zmiennych losowych 2. Normalność zmiennych losowych w każdej z rozważanych k populacji 3. Niezależnośc zmiennych losowych 4. Jednorodność wariancji w grupach.

Testy normalności rozkładu Test chi-kwadrat Test W Shapiro i Wilka Test Kołmogorowa i Smirnowa Test zgodności chi-kwadrat Pearsona Wykres normalności Wykresy ramka-wąsy

Test W Shapiro i Wilka Test Shapiro-Wilka jest preferowanym testem normalności ze względu na jego dużą moc w porównaniu z innymi testami. Można go stosować do małych prób.

Test Kołmogorowa i Smirnowa Test ten opiera się na porównaniu procentów skumulowanych zaobserwowanych z oczekiwanymi. Jako wartość testu podawana jest maksymalna różnica bezwzględna pomiędzy zaobserwowanymi i oczekiwanymi procentami skumulowanymi. Test ten wymaga znajomości parametrów rozkładu (średniej i odchylenia standardowego całej populacji). Gdy ich nie znamy, a tak jest najczęściej, stosujemy test Kołmogorowa i Smirnowa z poprawką Lillieforsa

Wykresy normalności Wybrana zmienna jest wykreślona na wykresie rozrzutu względem wartości "oczekiwanych dla rozkładu normalnego". Jeśli obserwowane dane podlegają rozkładowi normalnemu, wtedy wszystkie wartości powinny układać się wzdłuż linii prostej (tutaj dystrybuanta rozkładu normalnego). Jeśli nie podlegają rozkładowi normalnemu, wówczas będą odchylać się od prostej.

2.0 Wykres normalności Zmn1 (Arkusz3 2v*10c) 1.5 1.0 Oczekiwana normalna 0.5 0.0-0.5-1.0-1.5-2.0 180 200 220 240 260 280 300 Wartość obserwowana

Wykresy ramkowe 1. Mediana/kwartyle/rozstęp : punkt centralny - mediana, ramka - kwartyle, wąsy - rozstęp 2. Średnia/Bł.std/Odch.std: punkt centralny - średnia, ramka - błąd standardowy, wąsy - odchylenie standardowe 3. Średnia/Odch.Std/1.96*odch.std.: punkt centralny - średnia, ramka - odchylenie standardowe, wąsy - 95% przedział ufności dla poszczególnych obserwacji wokół średniej 4. Średnia/ Bł.std /1.96* Bł.std.: punkt centralny - średnia, ramka - błąd standardowy, wąsy - 95% przedział ufności dla wartości średniej

270 Wykres ramka-wąsy Zmn1 wzglzmn2 260 250 240 230 220 210 200 190 180 170 Zmn1 Zmn2 Średnia ±Błąd std ±1.96*Błąd std

320 Wykres ram ka-wąsy Zmn1 wzglzmn2 300 280 260 240 220 200 180 160 140 Zmn1 Zmn2 Mediana 25%-75% Min.-Maks. Interpretacja: niesymetryczne położenie mediany zmiennej Zmn1" wskazujące na asymetrię prawostronną. Asymetria taka wyklucza rozkład normalny. Rozkład normalny jest bowiem idealnie symetryczny.

280 Wykres ramka-wąsy Zmn1 wzglzmn2 260 240 220 200 180 160 140 Zmn1 Zmn2 Średnia ±Błąd std ±Odch.std

270 Wykres ramka-wąsy Zmn1 wzglzmn2 260 250 240 230 220 210 200 190 180 170 Zmn1 Zmn2 Średnia ±Błąd std ±1.96*Błąd std Interpretacja: Ponieważ przedziały ufności zachodzą na siebie, średnie nie różnią się istotnie

320 Wykres ramka-wąsy: 300 280 260 240 Zmn2 220 200 180 160 140 120 100 1 2 Zmn1 Średnia ±Błąd std ±1.96*Błąd std Interpretacja: wąsy ramek nie zachodzą na siebie, zatem można odrzucić hipotezę o równości średnich

Punkty odstające 32 Wykres ramka-wąsy (testt-studenta - ozon.sta 2v*12c) 30 28 26 24 22 20 18 16 14 12 Zmn1 Średnia = 15.8333 ±Błąd std = (14.4636, 17.2031) ±1.96*Błąd std = (13.1486, 18.5181) Ekstremalne

Jednorodność wariancji Test F Test Levene a Test Browna-Forsya tha

Sprawdzenie warunków

Test Levene a

Wyniki analizy wariancji Możemy odrzucić hipotezę o równości średnich, i to na poziomie równym 0,017.

Wykres interakcji 13 W ykres średnich i przedz. ufności (95.00% ) Zmn2 12 11 W artości 10 9 8 7 1 2 3 4 Zmn1

Wykres interakcji Na tym wykresie liniowym mamy przedstawione punkty odpowiadające wartościom średnich w poszczególnych podgrupach. Wykres ten potwierdza wniosek o odrzuceniu hipotezy zerowej.

Testy post-hoc Jeżeli analiza wariancji wykaże istotności różnic między rozpatrywanymi średnimi, to należy wtedy koniecznie przeprowadzić dokładniejsze badania różnic między średnimi z poszczególnych grup. Wykorzystujemy do tego celu specjalne testy post-hoc zwane też testami wielokrotnych porównań.

Przykład 2. Badano zawartość kofeiny w 4 gatunkach kawy zielonej (% wagi). Kawa arabica Kawa robusta Kawa kongijska Kawa liberyjska 1,46 1,52 1,54 1,52 1,51 1,48 1,49 1,53 1,52 1,50 1,48 1,47 1,50 1,49 1,53 1,48 1,52 1,52 1,51 1,51

Gatunek Kofeina 1 Arabica 1,46 2 Arabica 1,51 3 Arabica 1,52 4 Arabica 1,50 5 Arabica 1,52 6 Robusta 1,52 7 Robusta 1,48 8 Robusta 1,50 9 Robusta 1,49 10 Robusta 1,52 11 Kongijska 1,54 12 Kongijska 1,49 13 Kongijska 1,48 14 Kongijska 1,53 15 Kongijska 1,51 16 Liberyjska 1,52 17 Liberyjska 1,53 18 Liberyjska 1,47 19 Liberyjska 1,48 20 Liberyjska 1,51

1. Tabele statystyk. Analiza danych

Analiza przedziałów ufności dla średnich - skategoryzowane wykresy ramka-wąsy 109 Skategor. wykres ramka-wąsy: Kofeina 108 107 106 Kofeina 105 104 103 102 101 100 Arabica Robusta Gatunek Kongijska Liberyjska Średnia ±Błąd std ±1.96*Błąd std

Wykresy interakcji analiza średnich i przedziałów ufności 112 Wykres średnich i przedz. ufności (95.00%) Kofeina 110 108 Wartości 106 104 102 100 98 Arabica Robusta Kongijska Liberyjska Gatunek Kofeina

2. Normalność rozkładu Skategoryzowane wykresy ramka-wąsy 110 Skategor. wykres ramka-wąsy: Kofeina 109 108 107 106 Kofeina 105 104 103 102 101 100 Arabica Robusta Gatunek Kongijska Liberyjska Mediana 25%-75% Min.-Maks.

Skategoryzowane histogramy 3 Histogram: Kofeina Gatunek: Arabica Kofeina = 5*1*normal(x; 103.2; 2.2804) Gatunek: Robusta Kofeina = 5*1*normal(x; 102.2; 1.3038) Gatunek: Kongijska Kofeina = 5*1*normal(x; 105.4; 2.4083) Gatunek: Liberyjska Kofeina = 5*1*normal(x; 105.2; 3.5637) 2 1 Liczba obs. 0 3 1,52 1,48 1,50 1,46 1,54 1,49 1,51 Gatunek: Arabica 1,53 1,47 1,52 1,48 1,50 1,46 1,54 1,49 1,51 Gatunek: Robusta 1,53 1,47 2 1 0 1,52 1,48 1,50 1,49 1,46 1,51 1,54 1,53 1,47 1,52 1,48 1,50 1,49 1,46 1,51 1,54 1,47 1,53 Gatunek: Kongijska Kofeina Gatunek: Liberyjska

Skategoryzowane wykresy normalności Oczekiwana normalna Wykres prawdopodob Kofeina 1.4 1.2 1.0 0.8 0.6 0.4 0.2 0.0-0.2-0.4-0.6-0.8-1.0-1.2-1.4 100 101 102 103 104 105 106 107 108 109 110 100 101 102 103 104 105 106 107 108 109 110 Oczekiwana normalna Gatunek: Arabica 1.4 1.2 1.0 0.8 0.6 0.4 0.2 0.0-0.2-0.4-0.6-0.8-1.0-1.2-1.4 100 101 102 103 104 105 106 107 108 109 110 Gatunek: Robusta 100 101 102 103 104 105 106 107 108 109 110 Gatunek: Kongijska Gatunek: Liberyjska

Test Levene a Badanie jednorodności wariancji

Test Browna-Forsythe a

Analiza wariancji Ponieważ p > alfa, zatem nie ma podstaw do odrzucenia hipotezy zerowej o równości średnich. Badania są zakończone.