Badanie zależności skala nominalna

Podobne dokumenty
P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

GRUPY NIEZALEŻNE Chi kwadrat Pearsona GRUPY ZALEŻNE (zmienne dwuwartościowe) McNemara Q Cochrana

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Badanie zależności pomiędzy zmiennymi

Zadania ze statystyki cz.5 I rok socjologii miary związków między zmiennymi jakościowymi

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

STATYSTYKA OPISOWA. Dr Alina Gleska. 12 listopada Instytut Matematyki WE PP

Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka

Ć w i c z e n i e 3 : W i z u a l i z a c j a d a n y c h - w y k r e s y S t r o n a 1

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

Gimnastyka artystyczna

KORELACJE (zmienne ilościowe i porządkowe)

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną. laboratoria 30 zaliczenie z oceną

Analiza korespondencji

Hipoteza: Dziewczynki częściej niż chłopcy mają sprecyzowane plany dotyczące dalszego kształcenia (dlaczego?)

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Statystyka. Wykład 8. Magdalena Alama-Bućko. 23 kwietnia Magdalena Alama-Bućko Statystyka 23 kwietnia / 38

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Regresja logistyczna (LOGISTIC)

Ekonometria. Zajęcia

ANALIZA KORELACJI Korelacja między zmiennymi X i Y jest miarą siły liniowego związku między tymi zmiennymi.

STATYSTYKA MATEMATYCZNA

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

Statystyka. Wykład 7. Magdalena Alama-Bućko. 3 kwietnia Magdalena Alama-Bućko Statystyka 3 kwietnia / 36

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Korelacja krzywoliniowa i współzależność cech niemierzalnych

Wyniki badań PBQ i MAAS wykonanych w lipcu-październiku 2015

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

Analiza współzależności zjawisk

laboratoria 24 zaliczenie z oceną

Analiza. logarytmiczno-liniowa Teoria i zastosowania z wykorzystaniem programu R. Justyna Brzeziƒska

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

Spis treści. Księgarnia PWN: Bruce M. King, Edward W. Minium - Statystyka dla psychologów i pedagogów. Wstęp Wprowadzenie...

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Zjawisko dopasowania w sytuacji komunikacyjnej. Patrycja Świeczkowska Michał Woźny

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

TABELE WIELODZIELCZE

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Prognozowanie na podstawie modelu ekonometrycznego

Dysleksja jest dla inteligentnych?

Badania eksperymentalne

Wykład 8 Dane kategoryczne

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

Analiza korelacji

Statystyka. Tematyka wykładów. Przykładowe pytania. dr Tomasz Giętkowski wersja /13:40

Metody statystyczne w pedagogice Kod przedmiotu

Przykład 1. (A. Łomnicki)

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

W statystyce stopień zależności między cechami można wyrazić wg następującej skali: n 1

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

You created this PDF from an application that is not licensed to print to novapdf printer (

Analiza autokorelacji

KORELACJE I REGRESJA LINIOWA

Sposoby prezentacji problemów w statystyce

Graficzna prezentacja danych statystycznych

Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT. Anna Rajfura 1

Analiza Współzależności

PDF created with FinePrint pdffactory Pro trial version

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Analiza wariancji jednej zmiennej (UNIANOVA)

Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice

Test t-studenta dla jednej średniej

author: Andrzej Dudek

Analiza wariancji. dr Janusz Górczyński

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

ANALIZA DWUZMIENNOWA. czyli ABC KOREALCJI

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Wykład 3 Hipotezy statystyczne

Dwuczynnikowa ANOVA dla prób niezależnych w schemacie 2x2

Statystyka. Wykład 9. Magdalena Alama-Bućko. 7 maja Magdalena Alama-Bućko Statystyka 7 maja / 40

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

Testy nieparametryczne

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie

KARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Ścieżki dostępu do STATISTICA

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35

Przypomnienie: Ćwiczenie 1.

Analizy wariancji ANOVA (analysis of variance)

Podstawy statystyki matematycznej w programie R

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Rysunek 1. Wykształcenie respondentek

Egzamin z ekonometrii wersja IiE, MSEMat Pytania teoretyczne

ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Transkrypt:

Badanie zależności skala nominalna I. Jak kształtuje się zależność miedzy płcią a wykształceniem? II. Jak kształtuje się zależność między płcią a otyłością (opis BMI)? III. Jak kształtuje się zależność między wykształceniem a otyłością (opis BMI)? Badanie zależności między płcią a wykształceniem Wykonaj wykresy kołowe:

W raporcie edytujesz wykres: otrzymujesz:

Podobnie z wykształceniem: oraz wykres słupkowy:

otrzymujesz: Dokonaj analizy opisowej na podstawie wykonanych wykresów. Co można powiedzieć o strukturze badanej grupy ze względu na płeć i wykształcenie? Przeprowadź analizę zależności z wykorzystaniem tabeli krzyżowej UWAGA!!! W razie konieczności korzystaj z pomocy: Procedura Tabele krzyżowe pozwala tworzyć dwu- i wieloczynnikowe tabele, a także udostępnia wiele testów i miar skojarzenia dla tabel dwuczynnikowych. Struktura tabeli oraz fakt, czy kategorie są uporządkowane, decyduje o tym, którego testu lub miary należy użyć. Statystyki związane z tabelami krzyżowymi i miary skojarzenia są obliczane tylko dla tabel dwuczynnikowych. Po zdefiniowaniu zawartości wierszy, kolumn i warstw (zmienna kontrolna) procedura tabeli krzyżowej tworzy odrębny zestaw odpowiednich statystyk i miar dla każdego czynnika definiującego warstwę (lub dla każdej kombinacji wartości dwóch lub większej liczby zmiennych kontrolnych). Na przykład jeśli płeć jest czynnikiem definiującym warstwę w tabeli przedstawiającej zależność zmiennej zamężna/żonaty (tak, nie) od zmiennej jakość życia (bardzo ciekawe, spokojne, nudne), to wyniki dla tabeli dwuczynnikowej dla kobiet są obliczane oddzielnie od tych dla mężczyzn i przedstawione jako panele umieszczone jeden po drugim. Przykład. Czy klienci pochodzący z małych firm mogą przynosić więcej zysków przy sprzedaży usług (takich jak szkolenia i doradztwo) niż klienci z dużych firm? Z tabeli krzyżowej można się przekonać, że większość małych firm (poniżej 500 zatrudnionych) daje wysoką zyskowność sprzedaży usług, natomiast większość dużych firm (więcej niż 2 500 zatrudnionych) daje niską zyskowność.

Statystyki i miary siły związku. Test chi-kwadrat Pearsona, iloraz wiarygodności chi-kwadrat, test związku liniowego, test dokładny Fishera, chi-kwadrat z poprawką Yatesa, współczynnik r Pearsona, współczynnik rho Spearmana, współczynnik kontyngencji, phi, V Craméra, współczynniki lambda symetryczne i asymetryczne, współczynniki tau Goodmana i Kruskala, współczynnik niepewności, gamma, współczynnik d Somersa, tau-b Kendalla, tau-c Kendalla, eta, kappa Cohena, oszacowanie ryzyka względnego, iloraz szans, test McNemara, statystyki Cochrana i Mantela-Haenszela. Wszystkie te pojęcia, testy są wyjaśnione w pomocy. Wybierz tabele krzyżowe: Wybierz płeć w wierszach a wykształcenie w kolumnach:

W Statystyki zaznacz: W raporcie otrzymujesz: Informacja o analizowanych danych Obserwacje Uwzględnione Wykluczone Ogółem N Procent N Procent N Procent Płeć * Wykształcenie 208 100,0% 0,0% 208 100,0% Liczebność Tabela krzyżowa Płeć * Wykształcenie Wykształcenie licencjat maturalne średnie wyższe Ogółem Płeć 1 0 0 0 0 1 kobieta 0 9 24 14 28 75 mężczyzna 0 25 31 29 47 132 Ogółem 1 34 55 43 75 208

Testy Chi-kwadrat Wartość df Istotność asymptotyczna (dwustronna) Chi-kwadrat Pearsona 211,012 a 8,000 Iloraz wiarygodności 15,709 8,047 N Ważnych obserwacji 208 a. 46,7% komórek (7) ma liczebność oczekiwaną mniejszą niż 5. Minimalna liczebność oczekiwana wynosi,00. Miary symetryczne Wartość Istotność przybliżona Nominalna przez Nominalna Phi 1,007,000 V Kramera,712,000 N Ważnych obserwacji 208 Zwróć uwagę na tabelę z testami chi-kwadrat: Jeśli istotność (zaznaczona w kółeczku wartość krytyczna istotności) jest mniejsza niż założona (np. 0,05), to odrzucana jest hipoteza o niezależności badanych zmiennych. Oznacza to, że płeć i poziom wykształcenia są ze sobą powiązane, są zależne. Wartość współczynników Yule a (Phi) oraz V Kramera potwierdzają ten wniosek.

Badanie zależności między płcią a otyłością Podobnie postępujesz jak w poprzednim badaniu. Najpierw wykonaj wykresy oraz zinterpretuj je. Wykresy kołowe pokazują strukturę rozkładu wartości badanej cechy (zmiennej) w badanej populacji. Na wykonanym wykresie można zauważyć, że kobiety mają wagę w normie lub nadwagę, jednak w zdecydowanej większości w normie. Ponad połowa mężczyzn ma wagę poza normą. Mężczyźni są bardziej zróżnicowani pod względem odchyleń od wagi, cechuje ich niedowaga, nadwaga oraz wszystkie typy otyłości. Na podstawie analizy wzrokowej wykresu można stwierdzić zależność między płcią a otyłością (występowaniem nieprawidłowości w masie ciała).

W celu potwierdzenia tego wniosku wykonaj test niezależności przy wykorzystaniu tabel krzyżowych: Testy Chi-kwadrat Wartość df Istotność asymptotyczna (dwustronna) Chi-kwadrat Pearsona 118,692 a 12,000 Iloraz wiarygodności 94,319 12,000 N Ważnych obserwacji 208 a. 61,9% komórek (13) ma liczebność oczekiwaną mniejszą niż 5. Minimalna liczebność oczekiwana wynosi,01. Miary symetryczne Wartość Istotność przybliżona Nominalna przez Nominalna Phi,755,000 V Kramera,534,000 N Ważnych obserwacji 208 Testy niezależności potwierdzają, że istnieje związek między płcią a otyłością w badanej grupie osób. Badanie zależności między wykształceniem a otyłością (BMI) Wykonaj samodzielnie

Badanie zależności skala porządkowa I. Badanie zależności opisu odległości od otyłości (opis BMI). II. Badanie zależności miejsca zamieszkania od wykształcenia. Badanie zależności opisu odległości od otyłości Rekoduj zmienne do skali porządkowej: Wykonaj wykres zależności:

Analiza wzrokowa wykresu sugeruje, że nie istnieje zależność między odległością a otyłością. W celu dokładnego zbadania zależności zbadaj wartość współczynnika korelacji rang Spearmana:

Otrzymujesz: Korelacje ranga odległości ranga wskaźnika BMI rho Spearmana ranga odległości Współczynnik korelacji 1,000,030 Istotność (dwustronna).,673 N 207 204 ranga wskaźnika BMI Współczynnik korelacji,030 1,000 Istotność (dwustronna),673. N 204 204 Wartość współczynnika korelacji rang Spearmana wynosi 0,030, graniczna istotność 0,673. Oznacza to, że nie ma podstaw (na poziomie istotności mniejszym niż graniczna istotność, np. 0,05) do odrzucenia hipotezy o zerowej wartości współczynnika korelacji rang Spearmana brak związku między badanymi zmiennymi. Badanie zależności miejsca zamieszkania od wykształcenia Wykonaj samodzielnie

Badanie zależności skala ilościowa I. Badanie zależności między wagą a wzrostem II. Badanie zależności między wagą a wzrostem z uwzględnieniem płci III. Badanie zależności między odległością od miejsca pracy a wagą IV. Badanie zależności między odległością od miejsca pracy, wagą i liczbą punktów na egzaminie Badanie zależności między wagą a wzrostem Wykonaj wykres rozrzutu punktów empirycznych w z linią dopasowania:

Otrzymujesz: Zbadaj korelację:

Otrzymujesz: Korelacje Wzrost Waga Wzrost Korelacja Pearsona 1,470 ** Istotność (dwustronna),000 N 205 205 Waga Korelacja Pearsona,470 ** 1 Istotność (dwustronna),000 N 205 207 **. Korelacja jest istotna na poziomie 0.01 (dwustronnie). Wartość współczynnika korelacji wynosi 0,470 i jest istotnie różna od zera (na poziomie istotności mniejszym od granicznego). ** w tabeli wskazują istotne wartości współczynników korelacji. Oznacza to, że istnieje zależność między wagą i wzrostem w badanej grupie osób. Badanie zależności wagi i wzrostu z uwzględnieniem płci Wykonaj samodzielnie (podpowiedź: należy podzielić dane na podzbiory) Badanie zależności między odległością od miejsca pracy a wagą Wykonaj samodzielnie w domu

Badanie zależności między odległością od miejsca pracy, wagą i liczbą punktów na egzaminie Wykonaj analizę korelacji z uwzględnieniem wszystkich wymienionych zmiennych: Otrzymujesz: Korelacje Odległość od miejsca pracy Waga Punkty na egzaminie Odległość od miejsca pracy Korelacja Pearsona 1 -,057 1,000 ** Istotność (dwustronna),411,000 N 207 207 207 Waga Korelacja Pearsona -,057 1 -,057 Istotność (dwustronna),411,411 N 207 207 207 Punkty na egzaminie Korelacja Pearsona 1,000 ** -,057 1 Istotność (dwustronna),000,411 N 207 207 207 **. Korelacja jest istotna na poziomie 0.01 (dwustronnie).

Istotna zależność występuje między odległością od miejsca pracy a zdobytymi punktami na egzaminie. Występuje bardzo silna korelacja dodatnia. Wartość współczynnika korelacji wynosi 1 świadczy o zależności funkcyjnej, co pokazuje poniższy wykres. Brak istotnej (liniowej) zależności korelacyjnej między wagą a pozostałymi zmiennymi.