1 Analiza wariancji H 1 : 1 6= 2 _ 1 6= 3 _ 1 6= 4 _ 2 6= 3 _ 2 6= 4 _ 3 6= 4

Podobne dokumenty
1 Wieloczynnikowa analiza wariancji

1 Rekodowanie w podgrupach i obliczanie wartości w podgrupach

1 Miary asymetrii i koncentracji

1 Rozk ad normalny. Szczególnym przypadkiem jest standardowy rozk ad normalny N (0; 1), wartości

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

1 Praktyczne metody wyznaczania podstawowych miar przy zastosowaniu programu EXCEL

Statystyczna analiza danych z wykorzystaniem pakietów SPSS i Statistica Skrypt dla studentów 2012 rok

1 Praktyczne metody wyznaczania podstawowych miar bez zastosowania komputerów

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Wyk ad II. Stacjonarne szeregi czasowe.

1 Wieloczynnikowa analiza wariancji ciag ¾ dalszy

Pochodne cz ¾astkowe i ich zastosowanie.

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

1 Testy statystyczne. 2 Rodzaje testów

1 Przygotowanie ankiety

Ekstrema funkcji wielu zmiennych.

Analizy wariancji ANOVA (analysis of variance)

Opracowywanie wyników doświadczeń

Zadanie 1. Analiza Analiza rozkładu

Jednoczynnikowa analiza wariancji

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

Analiza wariancji - ANOVA

Wyznaczniki, macierz odwrotna, równania macierzowe

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Wielowymiarowa analiza danych z wykorzystaniem pakietów SPSS i Statistica Skrypt dla studentów 2012 rok

Testy nieparametryczne

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie

1 Próba a populacja. Nasze rozwa zania zaczniemy od przedyskutowania podstawowych poj ¾eć statystycznych,

Wprowadzenie do analizy dyskryminacyjnej

Równania ró znicowe wg A. Ostoja - Ostaszewski "Matematyka w ekonomii. Modele i metody".

Sposoby prezentacji problemów w statystyce

Stochastyczne Metody Analizy Danych. PROJEKT: Analiza kluczowych parametrów turbin wiatrowych

ANALIZA WARIANCJI - KLASYFIKACJA JEDNOCZYNNIKOWA

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Bardzo silnie z poj ¾eciem populacji statystycznej zwiazane ¾ jest poj ¾ecie próby statystycznej.

Przetwarzanie i analiza danych z wykorzystaniem pakietów SPSS i Statistica Skrypt dla studentów 2012 rok

1 Poj ¾ecie szeregu czasowego

Porównanie wyników grupy w odniesieniu do norm Test t dla jednej próby

O zgodności procedur jednoczesnego testowania zastosowanych do problemu selekcji zmiennych w modelu liniowym

Moduł. Rama 2D suplement do wersji Konstruktora 4.6

Statystyka matematyczna

Testowanie hipotez statystycznych.

1 Regresja liniowa cz. I

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Wykorzystanie testu Levene a i testu Browna-Forsythe a w badaniach jednorodności wariancji

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Weryfikacja hipotez statystycznych

1 Estymacja przedziałowa

Wprowadzenie do równań ró znicowych i ró zniczkowych.

1 Testy statystyczne. 2 Rodzaje testów

ANALIZA WARIANCJI - KLASYFIKACJA WIELOCZYNNIKOWA

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

ZARZĄDZANIE DANYMI W STATISTICA

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Badanie normalności rozkładu

Statystyka matematyczna dla leśników

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

System zarządzania bazą danych (SZBD) Proces przechodzenia od świata rzeczywistego do jego informacyjnej reprezentacji w komputerze nazywać będziemy

Wykład dla studiów doktoranckich IMDiK PAN. Biostatystyka I. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Testowanie hipotez statystycznych.

Wykład 10 Testy jednorodności rozkładów

AUTOR MAGDALENA LACH

1 Testy statystyczne. 2 Rodzaje testów

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 3

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Analiza wariancji - ANOVA

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Statystyka w analizie i planowaniu eksperymentu

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

Statystyka w analizie i planowaniu eksperymentu

166 Wstęp do statystyki matematycznej

Ćwiczenie: Badanie normalności rozkładu. Wyznaczanie przedziałów ufności.

Podstawowe operacje i rodzaje analiz dostępne w pakiecie Statistica

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak

Ocena ryzyka kredytowego

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Metody Statystyczne. Metody Statystyczne

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

Testowanie hipotez statystycznych

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

Wykład 3 Hipotezy statystyczne

Testowanie hipotez statystycznych

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

Zadania ze statystyki cz.8. Zadanie 1.

Analiza wariancji i kowariancji

Wykład 4: Statystyki opisowe (część 1)

STATYSTYKA POWTORZENIE. Dr Wioleta Drobik-Czwarno

W statystyce stopień zależności między cechami można wyrazić wg następującej skali: n 1

Funkcje dwóch zmiennych

Transkrypt:

Studia podyplomowe w zakresie technik internetowych i komputerowej analizy danych Statystyczna analiza danych Adam Kiersztyn 5 godzin lekcyjnych 2012-02-04 13.00-17.00 1 Analiza wariancji Na wst¾epie zapoznamy si¾e z metoda¾ pozwalajac ¾ a¾ porównywać średnie w kilku grupach. Do tego typu analiz s u zy jednoczynnikowa analiza wariancji, tzw. jednoczynnikowa ANOVA. W pliku czasdojazdu.sav mamy informacje o czasie dojazdu na uczelnie na kolejne zjazdy. Chcemy zwery kować hipotez ¾e o równości średnich czasów dojazdu w poszczególnych okresach czasu. Postawmy zatem hipotezy H 0 : 1 = 2 = 3 = 4 wobec hipotezy alternatywnej, która jest zaprzeczeniem H 0, tzn. H 1 : 1 6= 2 _ 1 6= 3 _ 1 6= 4 _ 2 6= 3 _ 2 6= 4 _ 3 6= 4 Zgodnie ze stosowna¾ teoria¾ powinniśmy sprawdzić, czy poszczególne próby pochodza¾ z populacji o rozk adzie normalnym. Przypomnijmy sobie jak sprawdzić, czy nasz próba ma rozk ad normalny. Wybieramy AnalizanOpis statystycznyneksploracja danych. Nast ¾epnie post ¾epujemy jak na poni zszych rysunkach 1

Jako wynik otrzymujemy raport, w którym najistotniejszym punktem jest tabela atwo jest stwierdzić, ze za o zenie o normalności rozk adu jest spe nione. W naszym przekonaniu umacnia nas dodatkowo analiza wykresów. W klasycznej analizie wariancji dodatkowym za o zeniem jest równość wariancji. Warunek ten sprawdzamy za pomoca¾ chocia zby testu Levene a. Sprawdzenia tego dokonamy równolegle z testowaniem naszej g ównej hipotezy. Zanim przystapimy ¾ do testowania hipotezy musimy przygotować sobie nasze dane. W programie SPSS w jednej zmiennej powinny znajdować si ¾e wartości obserwacji natomiast w innej zmiennej czynnik grupujacy. ¾ Dlatego dalszej analizy dokonamy na pliku czasdojazdu1.sav, w którym nasze wartości sa¾ ju z odpowiednio przygotowane. 2

Wybieramy z menu jednoczynnikowa¾ ANOVA jak na poni zszym rysunku Jako zmienna¾ zale zna¾ obieramy czas, natomiast jako czynnik zmienna¾ czynnik jak na rysunku i przechodzimy na kart¾e opcje 3

W oknie Opcje wybieramy interesujace ¾ nas wskaźniki Jako wynik otrzymujemy raport, w którym mamy nast ¾epujace ¾ dane 4

z których wynika, ze za o zenie jednorodności wariancji jest spe nione oraz nie ma podstaw do odrzucenia hipotezy H 0 o równości wariancji. Ponadto zgodnie, z tym co wybraliśmy na karcie opcje otrzymaliśmy wykres reprezentujacy ¾ poszczególne średnie. Mo zemy na nim atwo sprawdzić s uszność naszego osadu. ¾ 5

Teraz spróbujemy stwierdzić, w której grupie jest najwy zsza średnia i pomi ¾edzy, którymi parami wyst ¾epuje statystycznie istotna ró znica pomi ¾edzy średnimi. W tym celu wykorzystamy test post-hoc 6

Mamy do dyspozycji wiele testów skorzystamy jednak z testu zaproponowanego przez twórc¾e analizy wariancji, tj testu NIR. Wybór ten jest jak najbardziej uzasadniony poniewa z ju z wiemy, ze wariancje sa¾ równe. W wynikowym raporcie z atwościa¾ odnajdujemy tabel ¾e 7

Analiza powy zszej tabeli pozwala nam stwierdzić, ze pomi ¾edzy zadna¾ para¾ nie wyst ¾epuje statystycznie istotna ró znica dla średnich. Ponadto najwy zsza średnia jest w drugiej grupie a najni zsza w 3. Teraz nadszed czas na analogiczne rozwa zania w programie Statistica. Skorzystamy z ju z przygotowanego pliku czasdojazdu. W programie Statistica testy ANOVA mo zna odszukać w kilku miejscach. Nam w zupe ności wystarczy na razie modu dost ¾epny menu StatystykanStatystyki podstawowe i tabele. 8

Po wskazaniu odpowiednich zmiennych przechodzimy dalej i mamy okienko, w którym mamy kilka testów zwiazanych ¾ 9

z analiza¾ wariancji Na zak adce "Testy ANOVA" mamy m. in. do dyspozycji testy jednorodności wariancji (1), jak równie z skategoryzowane wykresy normalności (2) pozwalajace ¾ sprawdzić nam za o zenia klasycznej analizy wariancji. 10

Domyślnie przy wyborze wykresów skategoryzowanych mamy jedynie same wykresy, jednak po dwukrotnym klikni ¾eciu w obszar wykresu mo zemy wybrać opcj ¾e wyświetlajac ¾ a¾ wyniki testu Shapiro-Wilka. 11

Oczywiście jeśli ktoś woli mieć wyznaczony histogramy z na o zonymi wynikami testu badajacego ¾ normalność to mo zna skorzystać z zak adki Statystyki opisowe. Dość ciekawym sposobem wizualizacji danych jest wykres interakcji dost¾epny na zak adce podstawowe. Jako wynik otrzymujemy wykres, na którym oprócz śred- 12

nich zaznaczone sa¾ 95% przedzia y ufności dla średniej. Jeśli b ¾edziemy dysponowali zapasem czasu to powrócimy do tematu i omówimy nieco bardziej skomplikowane zagadnienie jakim jest wieloczynnikowa analiza wariancji. 2 Testowanie niezale zności W wielu przypadkach interesuje nas sprawdzenie, czy istnieja¾ zale zności pomi ¾edzy pewnymi próbami. Mo zemy np. wyobrazić sobie sytuacj ¾e, ze chcemy sprawdzić czy istnieje zale zność pomi ¾edzy ocenami z "Podstaw statystyki matematycznej" oraz "Podstaw statystyki opisowej". W pliku ocenypodstawy.sav mamy informacje o ocenach pewnej grupy studentów. Chcemy dokonać wery kacji nast¾epujacych ¾ hipotez H 0 : oceny z "Podstaw statystyki matematycznej" i oceny z "Podstaw statystyki opisowej" sa¾ niezale zne H 1 : istnieje zale zność pomi¾edzy ocenami 13

W klasycznej statystyce do wery kacji hipotez o niezale zności stosuje si¾e test niezale zności X 2. W programie SPSS odnajdujemy go w nieco zaskakujacym ¾ miejscu Jedna¾ z naszych zmiennych wskazujemy jako zmienna¾ w wierszu, druga¾ jako kolumn ¾e (jest to bez znaczenia), w oknie statystyki wskazujemy test chikwadrat. 14

Jako wynik otrzymujemy raport, w którym mamy odpowiedź na interesujace ¾ nas pytanie, tabele krzy zowe zale zności pomi ¾edzy poszczególnymi ocenami oraz dość interesujacy ¾ wykres reprezentujacy ¾ zale zności opisane w tabeli krzy zowej. 15

W programie Statistica test ten odnajdujemy w cz ¾eści Statystyki podsta- 16

wowe i tabele. Po określeniu interesujacych ¾ nas zmiennych w zak adce opcje wybieramy stosowny test oraz w zak adce Wi ¾ecej wybieramy dok adne tabele dwudzielcze 17

Dość interesujace ¾ wyniki otrzymujemy wybierajac ¾ na zak adce Wi ¾ecej Histogramy skategoryzowane oraz Wykresy interakcji liczności. W pierwszym przypadku otrzymujemy histogramy dla poszczególnych wartości jednej zmiennej. 18

W naszym konkretnym przypadku sa¾ to histogramy zmiennej pso dla poszczególnych wartości psm. W drugim przypadku mamy natomiast 19

zobrazowane w sposób liniowy analogiczne zale zności. 20