Badanie zależności pomiędzy zmiennymi



Podobne dokumenty
Korelacja krzywoliniowa i współzależność cech niemierzalnych

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

Badanie zależności skala nominalna

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT. Anna Rajfura 1

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

GRUPY NIEZALEŻNE Chi kwadrat Pearsona GRUPY ZALEŻNE (zmienne dwuwartościowe) McNemara Q Cochrana

Testowanie hipotez statystycznych.

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

STATYSTYKA OPISOWA. Dr Alina Gleska. 12 listopada Instytut Matematyki WE PP

Zadania ze statystyki cz.5 I rok socjologii miary związków między zmiennymi jakościowymi

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Wykład 12 Testowanie hipotez dla współczynnika korelacji

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Statystyka. Wykład 7. Magdalena Alama-Bućko. 3 kwietnia Magdalena Alama-Bućko Statystyka 3 kwietnia / 36

ĆWICZENIE 11 NIEPARAMETRYCZNE TESTY ISTOTNOŚCI

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Badania eksperymentalne

Analiza korelacji

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

Statystyka. Tematyka wykładów. Przykładowe pytania. dr Tomasz Giętkowski wersja /13:40

Statystyka. Wykład 8. Magdalena Alama-Bućko. 23 kwietnia Magdalena Alama-Bućko Statystyka 23 kwietnia / 38

Wszystkie wyniki w postaci ułamków należy podawać z dokładnością do czterech miejsc po przecinku!

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

KORELACJE I REGRESJA LINIOWA

Weryfikacja hipotez statystycznych

Statystyczna analiza danych

1 Estymacja przedziałowa

Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11

ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna

Metody Statystyczne. Metody Statystyczne

Wykład 3 Hipotezy statystyczne

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Zawartość. Zawartość

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

LISTA 4. 7.Przy sporządzaniu skali magnetometru dokonano 10 niezależnych pomiarów

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Zmienna losowa dwuwymiarowa i korelacja

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA, LISTA 3

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

ĆWICZENIE 11 ANALIZA KORELACJI I REGRESJI

Statystyka matematyczna Test χ 2. Wrocław, r

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Spis treści 3 SPIS TREŚCI

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Pytanie: Kiedy do testowania hipotezy stosujemy rozkład normalny?

Statystyka matematyczna dla leśników

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Testowanie hipotez statystycznych

Analiza współzależności zjawisk

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

Estymacja punktowa i przedziałowa

Zależność. przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna),

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Rozkłady dwuwymiarowe. Tablice dwudzielcze. Przykład (wstępny):

Statystyka. Wykład 9. Magdalena Alama-Bućko. 7 maja Magdalena Alama-Bućko Statystyka 7 maja / 40

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Wydział Matematyki. Testy zgodności. Wykład 03

NIEZALEŻNOŚĆ i ZALEŻNOŚĆ między cechami Test chi-kwadrat, OR, RR

Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

Testy nieparametryczne

Statystyka. #6 Analiza wariancji. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2015/ / 14

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Zadania ze statystyki, cz.6

Analiza autokorelacji

Wykład 11 Testowanie jednorodności

Badanie zgodności z określonym rozkładem. F jest dowolnym rozkładem prawdopodobieństwa. Test chi kwadrat zgodności. F jest rozkładem ciągłym

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Hipoteza: Dziewczynki częściej niż chłopcy mają sprecyzowane plany dotyczące dalszego kształcenia (dlaczego?)

Test t-studenta dla jednej średniej

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Transkrypt:

Badanie zależności pomiędzy zmiennymi

Czy istnieje związek, a jeśli tak, to jak silny jest pomiędzy np. wykształceniem personelu a jakością świadczonych usług? Ogólnie szukamy miary zależności (współzależności), korelacji»współczynnik

Etapy badań: 1) Określenie liczby zmiennych oraz zdefiniowanie skal, w jakich są wyrażone ) określenie wielkości próby 3) wylosowanie próby z populacji 4) pomiar zmiennych opisujących badane obiekty 5) wyszczególnienie możliwych współczynników 6) wybór współczynnika optymalnego 7) obliczenie współczynników 8) testowanie istotności współczynnika (hipoteza zerowa: brak zależności pomiędzy zmiennymi.

Współczynniki siły związku: 1) współczynnik Φ (phi) Yule a: Mierzy siłę związku pomiędzy dwiema zmiennymi, mierzonymi na skalach niemetrycznych nominalnych Przykład: Badamy czy zmiana opakowania lub nowa reklama nasilają popyt? Badamy rynek poprzez np. krótki sondaż wśród sprzedawców: zmienna X rodzaj opakowania (1 nowe, 0 stare), Y zachowanie rynku (1 wzrost popytu, 0 brak wzrostu popytu)

Otrzymujemy: X 0 1 Y 1 a b a+b 0 c d c+d a+c b+d N

Współczynnik Yule a: Φ = ad bc ( a + b)( a + c)( b + d)( c + d ) 0 Φ 1

Jeśli rozkłady brzegowe są równe albo jeśli liczebność pól leżących na tej samej przekątnej jest zerowa to współczynnik Yule a równy jest 1. Testowanie: Za pomocą testu χ dla df=1 stopni swobody. H 0 : Φ = 0 χ χ α / (test dwustronny ) χ χ α (test jednostron ny) χ = ( a + b N ( ad )( a + c )( bc ) b + d )( c + d )

Współczynnik Q-Kendalla: Jeśli zmienne są zdychotomizowane (np. wartości powyżej mediany przyjmują wartość 1, a poniżej 0) to lepiej stosować współczynnik Q-Kendalla: Q = ad ad + bc bc

Współczynnik korelacji C Pearsona (współczynnik kontygencji) Służy do badania siły związku między zmiennymi mierzonymi na skali nominalnej X 1 0 Y a b c a+b+c 1 d e f d+e+f 0 g h i g+h+i a+d+g b+e+h c+f+i N

Współczynnik C Pearsona: χ C = χ + N χ = df = ( w 1)( k 1) F E ij ij w k i= 1 j= 1 ( F ij E E ij - obserwowane - teoretyczne ij )

Hipoteza zerowa: H o : C=0 Testujemy podobnie jak współczynnik Yule a dla przyjętej powyżej liczby stopni swobody. Uwaga:bez testowania istotności można ulec złudzeniu dużej wartości współczynnika gdyż jego wartość silnie zależy od liczby wierszy i kolumn najwyższe wartości osiągane są dla macierzy kwadratowych.

Przykład Wartoś ci obserwowane 1 0 ni. 0 10 15 45 0,45 1 10 5 10 5 0,5 0 0 15 15 30 0,3 30 30 40 100 n.j 0,3 0,3 0,4 1 Wartoś ci teoretyczne 1 0 ni. 13,5 13,5 18 0,45 1 7,5 7,5 10 0,5 0 9 9 1 0,3 100 n.j 0,3 0,3 0,4 1 nice pomiędzy wartoś ciami obserwowanymi a teoretycznymi 1 0 6,5-3,5-3 1,5 -,5 0 0-9 6 3

Przykład c.d. Różnice pomiędzy wartoś ciami obserwowanymi a teoretycznymi 1 0 6,5-3,5-3 1,5 -,5 0 0-9 6 3 1 0 3,1963 0,907407 0,5 1 0,833333 0,833333 0 0 9 4 0,75 wartość chi-kwadrat 19,9537037 wartość C-Pearsona 0,40785419

Przykład c.d. - testowanie Hiopoteza Ho: C = 0 df = (w-1)(k-1)= x = 4 obliczona wartość chi-kwadrat= 19,9537 p-value wartoś ci obserw. chi= 0,00051 Wniosek: hipotezę Ho odrzucamy

Współczynnik V Cramera: Mierzy siłę związku pomiędzy zmiennymi, których pomiary wyrażone są na skalach nominalnych (podobnie jak C Pearsona): V = N min χ (( w 1), ( k 1) ) 0 V 1

Współczynnik V-Cramera dla poprzedniego przykładu V= 0,31586 Testowanie jak poprzednio: hipotezę Ho odrzucamy na rzecz hipotezy alternatywnej (związek pomiędzy X i Y istnieje) Uwaga: Współczynnik V-Cramera nie zależy od ilości kolumn i wierszy, a więc jest bliższy prawdziwej wielkości korelacji liniowej.

Współczynnik korelacji rang Spearmana Ma zastosowanie w ocenie siły związku pomiędzy zmiennymi, które mierzono na skali porządkowej lub których wartości zostały porangowane. Wygodny i łatwy w stosowaniu istnieją podobne jak np. Kendalla nie tak jednak proste.

Współczynnik korelacji Spearmana (c.d.) r S = 6 1 i= 1 3 N N d i N ( 1 N 5 r S 1),

Testowanie współczynnika Spearmana Hipoteza zerowa: H o : r s = 0. - dla 5 <= N <= 30 istnieją specjalne tablice, tzw. tablice L Guilforda, - dla N > 30 przy pomocy testu t-studenta 0 N stopniach swobody (Używać oprogramowania) t = r S N 1 r S

Przykład pomiar smakowitości: W badaniu sensorycznym pewnych produktów spożywczych zastosowano skalę pięciopunktową na wygląd ogólny (Y) oraz smakowitość (X). Pobrano próbę o liczebności n=15 i po jej zbadaniu otrzymano:

Wyniki badań: Wygląd ogólny Smakowitość d i d i 3 1 1 3 3 0 0 1 1 1 4 4 0 0 3 1 1 5 4 1 1 4 3 1 1 5 5 0 0 0 0 4 4 3 1 1 3 4-1 1 1 1 1 4 3 1 1 0 0 13

Testowanie: r S = 1 15 6 13 (15 1) = 0,98 t = r S N 1 r S = 0,98 13 0,0396 = 17,756

Inne współczynniki korelacji: Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku: - T- Czuprowa, - Lambda, - Rang Kendalla (tau), - Z serii gamma, - Korelacji dwuseryjnej, - Korelacji punktowo-dwuseryjnej, - Punktowo-czteropolowej phi, - W Kendalla, - Korelacji częściowej Kendalla.