Zadania ze statystyki cz.5 I rok socjologii miary związków między zmiennymi jakościowymi

Podobne dokumenty
Badanie zależności skala nominalna

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

GRUPY NIEZALEŻNE Chi kwadrat Pearsona GRUPY ZALEŻNE (zmienne dwuwartościowe) McNemara Q Cochrana

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

Badanie zależności pomiędzy zmiennymi

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Statystyka. Wykład 8. Magdalena Alama-Bućko. 23 kwietnia Magdalena Alama-Bućko Statystyka 23 kwietnia / 38

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8

STATYSTYKA OPISOWA. Dr Alina Gleska. 12 listopada Instytut Matematyki WE PP

Wydział Matematyki. Testy zgodności. Wykład 03

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

Statystyka. Wykład 7. Magdalena Alama-Bućko. 3 kwietnia Magdalena Alama-Bućko Statystyka 3 kwietnia / 36

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Analiza. logarytmiczno-liniowa Teoria i zastosowania z wykorzystaniem programu R. Justyna Brzeziƒska

Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT. Anna Rajfura 1

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Spis treści 3 SPIS TREŚCI

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Analiza korespondencji

Analiza współzależności zjawisk

Wykład 12: Tablice wielodzielcze

STATYSTYKA I DOŚWIADCZALNICTWO

Testy nieparametryczne

Analiza współzależności dwóch cech II

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Zawartość. Zawartość

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Statystyka. Tematyka wykładów. Przykładowe pytania. dr Tomasz Giętkowski wersja /13:40

Zadania ze statystyki, cz.6

Rozkłady statystyk z próby. Statystyka

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Xi B ni B

Analiza składowych głównych. Wprowadzenie

Statystyka matematyczna. Wykład VI. Zesty zgodności

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

Wnioskowanie statystyczne. Statystyka w 5

Wykład 3 Hipotezy statystyczne

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35

KARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4

Korelacja krzywoliniowa i współzależność cech niemierzalnych

Statystyka. Wykład 9. Magdalena Alama-Bućko. 7 maja Magdalena Alama-Bućko Statystyka 7 maja / 40

Statystyka matematyczna i ekonometria

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Zjawisko dopasowania w sytuacji komunikacyjnej. Patrycja Świeczkowska Michał Woźny

Badanie zależności zmiennych kolumnowej i wierszowej:

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

STATYSTYKA MATEMATYCZNA

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

Rozkłady dwuwymiarowe. Tablice dwudzielcze. Przykład (wstępny):

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

TABLICE PODSTAWOWYCH ROZKŁADÓW PRAWDOPODOBIEŃSTWA. T4. Tablica kwantyli rozkładu chi-kwadrat (I część - poziomy kwantyli 0,5)

Często spotykany jest również asymetryczny rozkład gamma (Г), opisany za pomocą parametru skali θ i parametru kształtu k:

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

WYKORZYSTYWANE W ANALIZIE WYNIKÓW METOD WYCENY OBSZARÓW CHRONIONYCH. Dr Dariusz Kayzer

Statystyka. Podstawowe pojęcia: populacja (zbiorowość statystyczna), jednostka statystyczna, próba. Cechy: ilościowe (mierzalne),

Analiza Współzależności

Badanie zgodności z określonym rozkładem. F jest dowolnym rozkładem prawdopodobieństwa. Test chi kwadrat zgodności. F jest rozkładem ciągłym

Statystyka matematyczna Test χ 2. Wrocław, r

Badania eksperymentalne

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

Przyjmuje dowolne wartości z określonego przedziału (skończonego lub nie). Zmienne ciągłe: wzrost, czas rozwiązana testu, kwota dochodu

Analiza współzależności dwóch cech I

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

L.Kowalski zadania ze statystyki matematycznej-zestaw 2 ZADANIA - ZESTAW 2

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

Testowanie hipotez statystycznych.

Wykład 11 Testowanie jednorodności

Skalowanie wielowymiarowe idea

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

1 Podstawy rachunku prawdopodobieństwa

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Przyjmuje dowolne wartości z określonego przedziału (skończonego lub nie). Zmienne ciągłe: wzrost, czas rozwiązana testu, kwota dochodu

Zadania ze statystyki cz.8. Zadanie 1.

Regresja logistyczna (LOGISTIC)

Statystyka matematyczna dla leśników

MATEMATYKA3 Mathematics3. Elektrotechnika. I stopień ogólnoakademicki. studia stacjonarne. Katedra Matematyki dr Zdzisław Piasta

Dwuczynnikowa ANOVA dla prób niezależnych w schemacie 2x2

KORELACJE I REGRESJA LINIOWA

Szkolenie Statystyka w medycynie

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Zmienna losowa dwuwymiarowa i korelacja

POJĘCIA WSTĘPNE. STATYSTYKA - nauka traktująca o metodach ilościowych badania prawidłowości zjawisk (procesów) masowych.

Z poprzedniego wykładu

Test t-studenta dla jednej średniej

Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.

LISTA 4. 7.Przy sporządzaniu skali magnetometru dokonano 10 niezależnych pomiarów

Przygotowanie danych

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Transkrypt:

Zadania ze statystyki cz.5 I rok socjologii miary związków między zmiennymi jakościowymi Zadanie 1 Zdaniem wielu komentatorów, kobiety częściej niż mężczyźni głosują na partię rządzącą. Wyniki badań przedstawia tabela poniżej. Należy sprawdzić czy istnieje związek między płcią a głosowaniem w ostatnich wyborach na PO lub PIS. kobieta mężczyzna PO 350 160 PIS 280 150 Zadanie 2 Czy kolor oczu ma znaczenie na wybór partnera? Ten problem został zbadany a wyniki rozkładu cech (kolor oczu badanego i kolor oczu partnera) prezentuje poniższa tabela. Należy ustalić, czy istnieje związek między kolorem oczu osób w związkach oraz siłę tego związku, wykorzystując współczynniki oparte na chi-kwadrat. partner badany zielone niebieskie brązowe zielone 15 12 22 niebieskie 12 28 10 brązowe 29 14 11 Zadanie 3 Dla danych z tabeli z zadania 2 należy ustalić jaka będzie wielkość redukcji błędu przewidywania, jeśli będziemy chcieli przewidzieć wybór partnera ze względu na kolor oczu, wykorzystując współczynnik Lambda. Zadanie 4 W pewnym badaniu podjęto się analizy problemu relacji między krajem zamieszkania emigrantów z Polski a sektorem zatrudnienia. Należy ustalić, w oparciu o współczynnik Tau Goodmana-Kruskala, czy silnej sektor zatrudnienia determinuje wybór kraju emigracji, czy też kraj emigracji silniej wpływa na wybór sektora pracy. Niemcy Wielka Bryt. Holandia budownictwo 13 14 39 usługi 17 48 11 nauka i eduk 47 13 8 opieka zdrow. 7 16 13

Zadanie 5 Czy poziom zadowolenia z życia ma znaczenie dla uczestniczenia w różnego rodzaju aktywności obywatelskiej? Proszę zbadać, wykorzystując współczynniki Gamma i d Somersa, czy istnieje związek między poziomem zadowolenia a poziomem aktywności. poziom aktywności obywatelskiej poziom zadowolenia z życia wysoki średni niski wysoki 20 30 10 średni 30 25 15 niski 20 30 40 Zadanie 6 Czy istnieje związek między miejscem zamieszkania a wysokością dochodów? W tabeli poniżej przedstawiono procentowy udział mieszkańców w rozkładzie dochodów. Czy miejsce zamieszania wpływa na dochody? Jak silna jest to zależność? wieś miasto 0-2000 45 35 2001-4000 25 45 4001-6000 20 10 powyżej 6000 10 10 PODSUMOWANIE WYKŁADU Test χ² chi-kwadrat i mierniki oparte na χ² chi-kwadrat Test χ² (chi kwadrat), inaczej nazywany testem niezależności, bada odstępstwa rozkładu empirycznego zmiennych z rozkładem teoretycznym (oczekiwanym), zakładającym pełną niezależność zmiennych. Idea χ² opiera się na poszukiwaniu takiego rozkładu liczebności, który wskazywałby na niezależność rozkładów dwóch zmiennych względem siebie (rozkład oczekiwany). Rozkład empiryczny dwóch zmiennych to łączny rozkład współzmienności dwóch zmiennych, pochodzący z pomiarów Rozkład teoretyczny (oczekiwany) to rozkład warunkowy pochodzący z analizy rozkładów brzegowych zmiennych.

n i. liczebność brzegowa i tej kategorii pierwszej zmiennej (np. w kolumnie) n.j liczebność brzegowa j tej kategorii drugiej zmiennej (np. w wierszu) Przykład: Oto mamy rozkład empiryczny, z rozkładem warunkowym a, b, c, i d: Tworzymy dla tego rozkładu rozkład teoretyczny (oczekiwany) Następnie porównujemy oba rozkłady, sumujemy ostatnią kolumnę i otrzymujemy χ² chikwadrat a ta a ta (a ta)² b tb b tb (b tb)² c tc c tc (c tc)² d td d - td (d td)²

Związek między zmiennymi występuje wtedy, gdy wartość testu χ² (chi kwadrat) jest większa od zera. Brak związku (pełna niezależność dwóch zmiennych) między zmiennymi wyznaczona jest wartością zero testu χ² (chi kwadrat). Wadą testu χ² jest uzależnienie wysokości wyniku od wielkości badanej grupy (od liczebności rozkładów brzegowych i warunkowych). Im większa grupa, a tym samym większa liczebność rozkładów brzegowych i warunkowych, tym większa wartość testu χ² dla tego samego związku między zmiennymi. Mierniki oparta na chi kwadrat Współczynniki oparte na koncepcji PRE (proporcjonalnej redukcji błędu przewidywania Współczynnik λ Guttmana (Lambda) Jeżeli będziemy chcieli przewidzieć, jak zmienna niezależna X wpływa na zmienną Y (będziemy chcieli określić wielkość błędu przewidywania wartości zmiennej Y na podstawie wartości zmiennej X), to współczynnik obliczymy:

Miernik λ Guttmana pokazuje wielkość redukowanego błędu popełnianego przy przewidywaniu jednej zmiennej (Y) na podstawie drugiej zmiennej (X). Wartość miernika λ Guttmana zawiera się w przedziale od 0 do 1 Współczynnik τ Goodmana-Kruskala (Tau) Współczynnik τ Goodmana-Kruskala (Tau) mówi w jakim stopniu znajomość rozkładu cechy X pozwala zredukować oczekiwaną liczbę błędów przy przewidywaniu rozkładu cechy Y. Współczynniki dla zmiennych mierzonych na skali porządkowej. Współczynnik γ (Gamma) Goodmana-Kruskala Miara d Somersa Współczynnik τb (Tau-be) Kendalla

Gdzie dla każdego z tych mierników: Mierniki te opierają się na sposobie uporządkowania danych w tabeli kontyngencji: - P uporządkowanych zgodnie z kierunkiem kategorii; - Q uporządkowanych przeciwnie do kierunku uporządkowania kategorii - B braku uporządkowania rozkładów brzegowych (kolumnowych lub wierszowych). Informują o stopniu uporządkowania danych w tabeli kontyngencji w kierunku zgodnym z rozkładem kategorii zmiennych (+) lub przeciwnym (-). Przykład: Pary uporządkowane zgodnie z kierunkiem uporządkowania kategorii cechy to a i d, pary uporządkowane w kierunku przeciwnym do kierunku uporządkowania cechy to pary b i c. W takim razie: Inny przykład. Rozważając wszystkie pary iloczynów o zgodnym i przeciwnym kierunku uporządkowania, tabelę większą niż 2x2, będziemy traktować jak serię takich tabel (2x2)

Tym samym: