Statystyka i Analiza Danych



Podobne dokumenty
Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Przykład 1. (A. Łomnicki)

Analiza wariancji. dr Janusz Górczyński

Zadania ze statystyki cz.8. Zadanie 1.

WPROWADZENIE DO ANALIZY WARIANCJI

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2000, 2008

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

ANALIZA WARIANCJI - KLASYFIKACJA JEDNOCZYNNIKOWA

Statystyka. #6 Analiza wariancji. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2015/ / 14

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Analizy wariancji ANOVA (analysis of variance)

Analiza wariancji i kowariancji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Statystyka matematyczna dla leśników

JEDNOCZYNNIKOWA ANOVA

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Efekt główny Efekt interakcyjny efekt jednego czynnika zależy od poziomu drugiego czynnika Efekt prosty

Spis treści. Księgarnia PWN: Bruce M. King, Edward W. Minium - Statystyka dla psychologów i pedagogów. Wstęp Wprowadzenie...

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

ANALIZA WARIANCJI - KLASYFIKACJA WIELOCZYNNIKOWA

Elementy statystyki STA - Wykład 5

Opracowywanie wyników doświadczeń

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Statystyka i Analiza Danych

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Oszacowanie i rozkład t

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Wprowadzenie do analizy korelacji i regresji

Wykład 3 Hipotezy statystyczne

Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Metodologia badań psychologicznych. Wykład 12. Korelacje

Weryfikacja hipotez statystycznych

Analiza niepewności pomiarów

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

KARTA KURSU. (do zastosowania w roku akademickim 2015/16) Kod Punktacja ECTS* 3. Dr hab. Tadeusz Sozański

Weryfikacja hipotez statystycznych testy dla dwóch zbiorowości

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych.

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Prawdopodobieństwo i rozkład normalny cd.

Analiza wariancji - ANOVA

Metody Statystyczne. Metody Statystyczne

Badania eksperymentalne

Analiza wariancji, część 2

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

Analiza wariancji - ANOVA

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

Testy nieparametryczne

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

WNIOSKOWANIE STATYSTYCZNE

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

Żródło:

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

Wnioskowanie statystyczne. Statystyka w 5

Testowanie hipotez statystycznych.

Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

KARTA KURSU. Kod Punktacja ECTS* 1

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

KORELACJE I REGRESJA LINIOWA

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Metody Statystyczne. Metody Statystyczne. #8 Błąd I i II rodzaju powtórzenie. Dwuczynnikowa analiza wariancji

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Spis treści 3 SPIS TREŚCI

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Wykład 2: Tworzenie danych

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

Wykład 5 Teoria eksperymentu

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

, a ilość poziomów czynnika A., b ilość poziomów czynnika B. gdzie

Jednoczynnikowa analiza wariancji

Transkrypt:

Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014

Zastosowania analizy wariancji w opracowywaniu wyników badań empirycznych Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki - Warsztaty - Statystyka i Analiza Danych

Plan wystąpienia Analiza wariancji metoda analizy danych czy coś więcej Trochę o źródłach zmienności Bez obliczeń się nie obejdzie Przykład analizy wyników eksperymentu jednoczynnikowego Opracowanie wyników eksperymentu dwuczynnikowego z powtarzanymi pomiarami i efektem interakcji Analiza wyników eksperymentu zaplanowanego w układzie losowanych bloków (eliminacja niepożądanej zmienności systematycznej)

Co oznacza termin: analiza wariancji? W węższym znaczeniu analizę wariancji można traktować jako uogólnienie testów istotności różnic pomiędzy wartościami oczekiwanymi w przypadku dwóch populacji W szerszym znaczeniu analiza wariancji obejmuje techniki analizy danych wykorzystywane w ramach działu statystycznej analizy stosowanej określanego terminem planowanie doświadczeń (ang. experimental design)

Planowanie eksperymentu trzy podstawowe decyzje Wybór zmiennej zależnej Ustalenie czynnika (ów) eksperymentalnych Dobór jednostek eksperymentalnych

Źródła zmienności wyników Zmienność powodowana przez czynniki eksperymentalne (pożądana) Zmienność związana z błędem pomiaru zmiennej zależnej (niepożądana) Zmienność wynikająca ze zróżnicowania materiału badawczego (niepożądana)

Rodzaje zmienności wyników Zmienność systematyczna, zaplanowana (pożądana) Zmienność przypadkowa (z którą można sobie poradzić) Zmienność systematyczna, niepożądana (może uniemożliwić wykazanie efektu, na którym zależy badaczowi)

Analiza wariancji od kuchni (bez obliczeń się nie obejdzie) Z punktu widzenia badacza wśród czynników mających wpływ na zmienność wyników eksperymentu możemy wyróżnić czynniki główne i czynniki uboczne Jeśli eksperyment ma być naukową metodą rozwiązywania problemów badawczych, to powinien być tak zaplanowany by przy analizie jego wyników można było oddzielić wpływ czynników głównych i czynników ubocznych

Umowną miarą całkowitej zmienności wyników eksperymentu jest suma kwadratów odchyleń poszczególnych wyników od średniej ogólnej: p SK calk = (y ij y) 2 i=1 n j=1 Analiza wariancji (ANOVA) polega na podziale całkowitej zmienności wyników eksperymentu na dwa składniki, odpowiadające zmienności spowodowanej przez czynniki główne (zmienność międzygrupowa) oraz zmienności przypisanej czynnikom ubocznym (zmienność wewnątrzgrupowa).

Liczbową miarą pierwszego składnika jest suma kwadratów odchyleń średnich grupowych od średniej ogólnej, nazywana międzygrupową sumą kwadratów: SK między = n (y i y) 2 p i=1 Liczbową miarą drugiego składnika jest suma kwadratów odchyleń poszczególnych pomiarów w grupach od odpowiednich średnich grupowych, nazywana wewnątrzgrupową suma kwadratów odchyleń: p SK wewn = (y ij y i ) 2 n i=1 j=1

Z poszczególnymi źródłami zróżnicowania wyników eksperymentu są związane odpowiednie liczby stopni swobody Wynoszą one odpowiednio: df cala = p n - 1 df między = p - 1 df wewn = p (n - 1)

W następnym etapie oblicza się tzw. średnie kwadraty odchyleń będące nieobciążonymi estymatorami wariancji z próby. Aby obliczyć wartość średniego kwadratu dla danego źródła zmienności sumy kwadratów dzieli się przez odpowiednie liczby stopni swobody: ŚK cala = ŚK cala df cala ŚK między = ŚK między df między ŚK wewn = ŚK wewn df wewn

ANOVA jednoczynnikowa jest metodą statystyczną, która umożliwia ocenę prawdopodobieństwa tego, że różnice między średnimi wyników p (p > 2) grup porównawczych nie są dziełem przypadku Formalnie hipoteza zerowa orzeka, że wartości średnich grupowych p populacji są takie same (równe wartości średniej ogólnej), czyli: H 0 : μ 1 = μ 2 =... = μ p = μ Hipoteza alternatywna (H 1 ) mówi, że w populacji średnie grupowe nie są równe, czyli : H 1 : nieprawda, że H 0

Miarą rozbieżności między hipotetycznym a rzeczywistym stanem rzeczy (czyli rozbieżności między H 0 a H 1 ) jest w ANOVA stosunek (iloraz) średnich kwadratów: ŚK między ŚK wewn Jeżeli poziomy czynnika głównego nie mają wpływu na pomiary zmiennej zależnej, to iloraz powinien być równy jedności Jeżeli jednak poziomy czynnika głównego oddziałują w sposób zróżnicowany na zmienną zależną, czyli inaczej mówiąc jeżeli H 0 jest fałszywa wówczas powyższy iloraz będzie większy od jedności. O ile większy, to zależy od różnicy między zaobserwowanymi (zmierzonymi) średnimi grupowymi

Interesująca nas miara rozbieżności między stanem rzeczy wynikającym z hipotezy zerowej a stanem rzeczy wynikającym z danych eksperymentalnych, czyli iloraz średnich kwadratów ma postać statystyki F: F = ŚK między ŚK wewn o odpowiednio stopniach swobody p-1 i p (n-1) Ocenę prawdziwości hipotezy zerowej dokonuje się w oparciu o te same zasady jak w przypadku innych testów

Podstawowe założenia ANOVA Zmienna zależna powinna być wyrażona przynajmniej na skali przedziałowej Zmienna zależna powinna podlegać rozkładowi normalnemu w obrębie grup porównawczych Wariancje w obrębie różnych grup układu powinny być równe; założenie to jest określane jako założenie o jednorodności (homogeniczności) wariancji

Jednoczynnikowa analiza wariancji (przykład analizy w STATISTICA) Problem badawczy: Ocena zróżnicowania odsetka zębów objętych próchnicą przy stosowaniu czterech różnych substancji słodzących Badana zbiorowość: 48 samic szczurów w wieku 6 tyg.

Sprawdzenie założeń normalność rozkładu

Sprawdzenie założeń równość wariancji

Ocena istotności efektu zróżnicowania test F

Graficzna ilustracja efektu zróżnicowania

Porównania szczegółowe testy post-hoc

Graficzna ilustracja danych surowych

Dwuczynnikowa analiza wariancji (przykład analizy w STATISTICA) Problem badawczy: Ocena wpływu dwóch różnych leków na przebieg i efekty leczenia Badana zbiorowość: Pacjenci hospitalizowani z rozpoznaniem zespołu maniakalno-depresyjnego o przebiegu depresji

Ocena istotności efektów testy F

Graficzna ilustracja efektów prostych

Graficzna ilustracja efektu interakcji

Porównania zaplanowane szczegółowych różnic

Analiza wariancji dla układu blokowego (przykład analizy w STATISTICA) Problem badawczy: Ocena skuteczności różnych sposobów zwalczania chwastów w przypadku uprawy ziemniaków

Ocena istotności efektu zróżnicowania test F (bez uwzględnienia bloków)

Graficzna ilustracja efektu zróżnicowania

Porównania szczegółowe testy post-hoc (bez uwzględnienia bloków)

Porównania szczegółowe testy post-hoc (bez uwzględnienia bloków)

Ocena istotności efektu zróżnicowania test F (z uwzględnieniem bloków)

Porównania szczegółowe testy post-hoc (z uwzględnieniem bloków)

Porównania szczegółowe testy post-hoc (z uwzględnieniem bloków)

Dziękuję za uwagę! janusz.watroba@statsoft.pl