GRUPY NIEZALEŻNE Chi kwadrat Pearsona GRUPY ZALEŻNE (zmienne dwuwartościowe) McNemara Q Cochrana

Podobne dokumenty
P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

Hipoteza: Dziewczynki częściej niż chłopcy mają sprecyzowane plany dotyczące dalszego kształcenia (dlaczego?)

Badanie zależności skala nominalna

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Test U Manna-Whitneya : Test H Kruskala-Wallisa Test Wilcoxona

Testy t-studenta są testami różnic pomiędzy średnimi czyli służą do porównania ze sobą dwóch średnich

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Wydział Matematyki. Testy zgodności. Wykład 03

Żródło:

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Metodologia badań psychologicznych. Wykład 12. Korelacje

Zadania ze statystyki cz.5 I rok socjologii miary związków między zmiennymi jakościowymi

Badanie zależności pomiędzy zmiennymi

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Statystyka matematyczna dla leśników

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku

Metody Statystyczne. Metody Statystyczne

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Wykład 3 Hipotezy statystyczne

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Testy nieparametryczne

Żródło:

TESTY NIEPARAMETRYCZNE 1/5

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT. Anna Rajfura 1

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Wnioskowanie statystyczne. Statystyka w 5

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Regresja logistyczna (LOGISTIC)

JEDNOCZYNNIKOWA ANOVA

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

METODOLOGIA BADAŃ HUMANISTYCZNYCH METODYKA NAUCZANIA JĘZYKA OBCEGO CZ.II

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

Zadania ze statystyki cz.8. Zadanie 1.

Analiza korespondencji

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Zadania ze statystyki, cz.6

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Wykład 8 Dane kategoryczne

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Metody Statystyczne. Metody Statystyczne. #8 Błąd I i II rodzaju powtórzenie. Dwuczynnikowa analiza wariancji

RAPORT WSKAŹNIK EDUKACYJNEJ WARTOŚCI DODANEJ PO EGZAMINIE GIMNAZJALNYM W ROKU SZKOLNYM 2012/2013

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Dwuczynnikowa ANOVA dla prób niezależnych w schemacie 2x2

Źródło: opracowanie własne 49,1 50,5 0,4. liczba. tak nie brak odpowiedzi

Rozkłady statystyk z próby. Statystyka

2. Młodzież szkół gimnazjalnych i ponadgimnazjalnych Miasta Rzeszowa wobec problematyki przemocy w szkole

Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA

Statystyka. Wykład 7. Magdalena Alama-Bućko. 3 kwietnia Magdalena Alama-Bućko Statystyka 3 kwietnia / 36

Testowanie hipotez statystycznych

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Korelacja krzywoliniowa i współzależność cech niemierzalnych

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

ANALIZA DWUZMIENNOWA. czyli ABC KOREALCJI

Przykład 1. (A. Łomnicki)

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Statystyka matematyczna Test χ 2. Wrocław, r

Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

Analiza współzależności zjawisk

Testowanie hipotez statystycznych

Weryfikacja hipotez statystycznych

STATYSTYKA OPISOWA. Dr Alina Gleska. 12 listopada Instytut Matematyki WE PP

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Wykład 12 Testowanie hipotez dla współczynnika korelacji

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8

1 Estymacja przedziałowa

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Weryfikacja hipotez statystycznych

Transkrypt:

GRUPY NIEZALEŻNE Chi kwadrat Pearsona Testy stosujemy w sytuacji, kiedy zmienna zależna mierzona jest na skali nominalnej Liczba porównywanych grup (czyli liczba kategorii zmiennej niezależnej) nie ma znaczenia Test można stosować dla zmiennej zależnej mierzonej na skali porządkowej, ale nie powinna mieć ona zbyt wielu kategorii. GRUPY ZALEŻNE (zmienne dwuwartościowe) McNemara - porównania rozkładu dwóch zmiennych dla tych samych badanych Q Cochrana - porównania rozkładu więcej niż dwóch zmiennych dla tych samych badanych Pomimo, że są to testy z grupy najsłabszych (prawdopodobieństwo, że test nie pozwoli odrzucić hipotezy zerowej jeśli jest ona fałszywa - badacz popełnia błąd beta - jest większe niż w przypadku testów dla zmiennych porządkowych i ilościowych) to często są to jedyne testy, które można zastosować. 1

1. Czy kategoria wieku różnicuje gatunek lubianych filmów? 2. Czy kierunek studiów różnicuje posiadanie partnera/partnerki? 3. Czy korzystanie z mediów społecznościowych jest rożne? 4. Czy ludzie częściej słodzą kawę czy herbatę? 5. Czy miejsce zamieszkania różnicuje miejsce wypoczynku? 6. Czy od cech osobowości zależy styl ubierania się? 7. Czy płeć różnicuje kolor włosów? 8. Czy po w każdym roku mieszkania w akademiku studenci są zadowoleni ze współlokatorów? 9. Czy po wysłuchaniu reklamy zmienia się gotowość do kupienia produktu (kupię/nie kupię)? 10. Czy posiadanie partnera/partnerki różnicuje wybór spędzenia weekendu? 11. Czy słodzenie kawy różnicuje bycie optymistą? 12. Czy korzystanie ze środków lokomocji jest różne? 13. Czy studenci i wykładowcy różnią się opinią o zmianach w szkolnictwie wyższym (pozytywne/negatywne)? 14. Czy studiujący i niestudiujący preferują inne sklepy internetowe? 15. Czy zmienia się gotowość do głosowania na partię w każdym roku 4- letniej kadencji? Statystyka testu chi kwadrat wyznacza wielkość różnicy między rozkładem empirycznym i teoretycznym Wartość statystyki chi Pearsona ( ) jest informacją Im większa jak bardzo wartośc rozkład empiryczny różni się od teoretycznego Im większa wartość tym większa szansa na stwierdzenie różnicy między rozkładami czyli istnienie związku między zmiennymi Im mniejsza próba tym silniejszy musi być związek, aby okazał się istotny statystycznie, dla dużych prób nawet słaby związek może być istotny statystycznie 2

P-wartość (prawdopodobieństwo popełnienia błędu przy odrzuceniu prawdziwej hipotezy zerowej ) p<0,05 hipotezę zerową odrzucamy (wynik można uogólnić na populację!) p>0,05 - nie ma podstaw do odrzucenia hipotezy zerowej Wartość statystki Liczba stopni swobody (n-1)*(k-1) Określa wielkość tabeli P-wartość w tabeli testu chi-kwadrat równą zero (,000 ) należy interpretować jako prawdopodobieństwo bardzo bliskie zeru Liczebności empiryczne Liczebności teoretyczne (oczekiwane) Ocena Dz. Chł. 1 0,8% 1 0,8% 27 29,5% 43 29,5% 21 22,8% 33 22,8% 4 5,1% 8 5,1% 23 24,9% 36 24,9% 2 1,7% 2 1,7% 10 11,4% 17 11,4% 3 3,8% 6 3,8% 91 146 Ograniczenia testu chi kwadrat wynikające z liczebności teoretycznych Uwaga: Liczebności w tabeli wartości teoretycznych podane zostały po zaokrągleniu do całości. Procent komórek z liczebnością mniejszą niż 5 Minimalna liczebność oczekiwana 6 komórek z 16 czyli 37,5% komórek (6) ma liczebność mniejszą niż 5. Minimalna liczebność oczekiwana wynosi 1 3

Wyniki analiz uzyskane w programie statystycznym przyjmujemy jeżeli spełnione są dwa warunki: - co najwyżej 20% komórek ma liczebność oczekiwaną mniejszą niż 5 - minimalna liczebność oczekiwana jest większa od 1 Powyższe informacje znajdują się pod tabelą Testu Chi-kwadrat NIE TAK Poprawki są liczone dla tabel 2x2 4

Test chi kwadrat nie mierzy ani siły ani kierunku związku Kierunek zależności odczytujemy z tabeli krzyżowej Siła związku na ile poprawnie można w przybliżeniu oszacować wartości w poszczególnych polach tabeli krzyżowej Siłę związku możemy zinterpretować na podstawie wartości współczynników korelacji nominalnej/porządkowej <0 brak związku,1 całkowita zależność> C kontyngencji (tabele n x n) Maksymalna wartość górna zależy od rozmiaru tabeli. Dla n= 2 C max =0,707, dla n=3 C max =0,816, dla n=4 C max =0,866 phi Yula (tabele 2 x 2) Jest miarą koncentracji przypadków na przekątnej V Cramera (k x n) Wartości procentowe w tabeli porównujemy wierszami Zmienna niezależna w kolumnie, Zmienna zależna w wierszu, Procentujemy w kierunku zmiennej niezależnej (procenty od kolumny) P: Czy płeć różnicuje Plany edukacyjne? H: Płeć różnicuje plany edukacyjne Różnice między dziewczętami i chłopcami w zakresie precyzji planów edukacyjnych są nieistotne statystycznie. Hipoteza nie została potwierdzona w badaniach. 5

P: Czy wykształcenie ojca różnicuje wybór szkoły przez dziecko? H: Im wyższe wykształcenie ojca tym częściej uczniowie wybierają kształcenie ogólne. Poziom wykształcenia ojca istotnie statystycznie różnicuje wybór szkoły przez dziecko (chi=11,26, df=4, p<0,05). Im wyższe wykształcenie ojca tym częściej (wyższe odsetki) uczniowie wybierają kształcenie w liceach ogólnokształcących. Istotnie statystycznie częściej kształcenie w liceach wybierają uczniowie, których ojcowie mają wyższe wykształcenie (76,0%) Im wyższe wykształcenie ojca tym niższe odsetki uczniów wybierających kształcenie w technikum. Wśród uczniów, których ojcowie mają wykształcenie wyższe tylko 12,0% planuje kontynuować naukę w technikum. Kształcenie zawodowe jest wybierane przez uczniów tak samo często bez względu na wykształcenie ojca. Korelacja między wykształceniem ojca a wyborem szkoły jest słaba C=0,26 (p<0,05) Wyniki badań wzmacniają/potwierdzają hipotezę. P: Czy płeć różnicuje ocenę przygotowania do egzaminu gimnazjalnego? H: Dziewczynki i chłopcy różnią się oceną przygotowania do egzaminu gimnazjalnego. Płeć różnicuje ocenę przygotowania do egzaminu gimnazjalnego (chi=23,33, df=1, p<0,001). Prawie 4 na pięciu chłopców (79,0%) dobrze oceniło swoje przygotowanie do egzaminu, podczas gdy taką opinię ma połowa dziewcząt (49,6%). Korelacja między płcią a ocena przygotowania do egzaminu gimnazjalnego jest przeciętna (Phi=0,31, p<0,001) Hipoteza została potwierdzona w badaniach. 6

P: Czy po przeprowadzeniu egzaminu zmieniła się ocena przygotowania do testu gimnazjalnego? H: Ocena przygotowania do egzaminu zmienia się po jego przeprowadzeniu. Przeprowadzenie egzaminu gimnazjalnego nie powoduje zmiany oceny o przygotowaniu się do testu. 84% uczniów pozostało przy swojej ocenie. Istnieje wysoka korelacja pomiędzy oceną przygotowania przed i po egzaminie (Phi=0,67, p<0,001). Ocenę przygotowania po teście w 44,89% można przewidzieć na podstawie znajomości opinii przed testem. Hipoteza nie została potwierdzona w badaniach. P: Czy gotowość do działań na rzecz szkoły zmienia się w kolejnych latach nauki w gimnazjum? H: Gotowość do działań na rzecz szkoły zmienia się w kolejnych latach nauki w gimnazjum. Analiza danych z wykorzystaniem testu Q Cochrana dla prób zależnych pozwoliła stwierdzić, że gotowość do działań na rzecz szkoły zmieniła się. W kolejnych latach rosną odsetki badanych gotowych podjąć taką działalność. Na podstawie dalszych analiz (porównań wielokrotnych pomiędzy latami nauki z wykorzystaniem testu McNemara) ustalono, że różnica pomiędzy gotowością deklarowaną w klasie czwartej i piątej jest nieistotna statystycznie. Częstość deklarowania gotowości do działań na rzecz szkoły w klasie 6 różni się istotnie statystycznie od deklaracji z klasy piątej (chi=12,81, df=1 *, p<0,001) i czwartej (chi=13,02, df=1, p<0,001) Badania potwierdziły hipotezę. * W wynikach SPPS dla testu McNemaranie jest podawane df, ale tabele są zawsze 2x2 więc łatwo policzyć, że df=(2-1)x(2-1)=1 14 7