Badanie zależności pomiędzy zmiennymi
Czy istnieje związek, a jeśli tak, to jak silny jest pomiędzy np. wykształceniem personelu a jakością świadczonych usług? Ogólnie szukamy miary zależności (współzależności), korelacji»współczynnik
Etapy badań: 1) Określenie liczby zmiennych oraz zdefiniowanie skal, w jakich są wyrażone ) określenie wielkości próby 3) wylosowanie próby z populacji 4) pomiar zmiennych opisujących badane obiekty 5) wyszczególnienie możliwych współczynników 6) wybór współczynnika optymalnego 7) obliczenie współczynników 8) testowanie istotności współczynnika (hipoteza zerowa: brak zależności pomiędzy zmiennymi.
Współczynniki siły związku: 1) współczynnik Φ (phi) Yule a: Mierzy siłę związku pomiędzy dwiema zmiennymi, mierzonymi na skalach niemetrycznych nominalnych Przykład: Badamy czy zmiana opakowania lub nowa reklama nasilają popyt? Badamy rynek poprzez np. krótki sondaż wśród sprzedawców: zmienna X rodzaj opakowania (1 nowe, 0 stare), Y zachowanie rynku (1 wzrost popytu, 0 brak wzrostu popytu)
Otrzymujemy: X 0 1 Y 1 a b a+b 0 c d c+d a+c b+d N
Współczynnik Yule a: Φ = ad bc ( a + b)( a + c)( b + d)( c + d ) 0 Φ 1
Jeśli rozkłady brzegowe są równe albo jeśli liczebność pól leżących na tej samej przekątnej jest zerowa to współczynnik Yule a równy jest 1. Testowanie: Za pomocą testu χ dla df=1 stopni swobody. H 0 : Φ = 0 χ χ α / (test dwustronny ) χ χ α (test jednostron ny) χ = ( a + b N ( ad )( a + c )( bc ) b + d )( c + d )
Współczynnik Q-Kendalla: Jeśli zmienne są zdychotomizowane (np. wartości powyżej mediany przyjmują wartość 1, a poniżej 0) to lepiej stosować współczynnik Q-Kendalla: Q = ad ad + bc bc
Współczynnik korelacji C Pearsona (współczynnik kontygencji) Służy do badania siły związku między zmiennymi mierzonymi na skali nominalnej X 1 0 Y a b c a+b+c 1 d e f d+e+f 0 g h i g+h+i a+d+g b+e+h c+f+i N
Współczynnik C Pearsona: χ C = χ + N χ = df = ( w 1)( k 1) F E ij ij w k i= 1 j= 1 ( F ij E E ij - obserwowane - teoretyczne ij )
Hipoteza zerowa: H o : C=0 Testujemy podobnie jak współczynnik Yule a dla przyjętej powyżej liczby stopni swobody. Uwaga:bez testowania istotności można ulec złudzeniu dużej wartości współczynnika gdyż jego wartość silnie zależy od liczby wierszy i kolumn najwyższe wartości osiągane są dla macierzy kwadratowych.
Przykład Wartoś ci obserwowane 1 0 ni. 0 10 15 45 0,45 1 10 5 10 5 0,5 0 0 15 15 30 0,3 30 30 40 100 n.j 0,3 0,3 0,4 1 Wartoś ci teoretyczne 1 0 ni. 13,5 13,5 18 0,45 1 7,5 7,5 10 0,5 0 9 9 1 0,3 100 n.j 0,3 0,3 0,4 1 nice pomiędzy wartoś ciami obserwowanymi a teoretycznymi 1 0 6,5-3,5-3 1,5 -,5 0 0-9 6 3
Przykład c.d. Różnice pomiędzy wartoś ciami obserwowanymi a teoretycznymi 1 0 6,5-3,5-3 1,5 -,5 0 0-9 6 3 1 0 3,1963 0,907407 0,5 1 0,833333 0,833333 0 0 9 4 0,75 wartość chi-kwadrat 19,9537037 wartość C-Pearsona 0,40785419
Przykład c.d. - testowanie Hiopoteza Ho: C = 0 df = (w-1)(k-1)= x = 4 obliczona wartość chi-kwadrat= 19,9537 p-value wartoś ci obserw. chi= 0,00051 Wniosek: hipotezę Ho odrzucamy
Współczynnik V Cramera: Mierzy siłę związku pomiędzy zmiennymi, których pomiary wyrażone są na skalach nominalnych (podobnie jak C Pearsona): V = N min χ (( w 1), ( k 1) ) 0 V 1
Współczynnik V-Cramera dla poprzedniego przykładu V= 0,31586 Testowanie jak poprzednio: hipotezę Ho odrzucamy na rzecz hipotezy alternatywnej (związek pomiędzy X i Y istnieje) Uwaga: Współczynnik V-Cramera nie zależy od ilości kolumn i wierszy, a więc jest bliższy prawdziwej wielkości korelacji liniowej.
Współczynnik korelacji rang Spearmana Ma zastosowanie w ocenie siły związku pomiędzy zmiennymi, które mierzono na skali porządkowej lub których wartości zostały porangowane. Wygodny i łatwy w stosowaniu istnieją podobne jak np. Kendalla nie tak jednak proste.
Współczynnik korelacji Spearmana (c.d.) r S = 6 1 i= 1 3 N N d i N ( 1 N 5 r S 1),
Testowanie współczynnika Spearmana Hipoteza zerowa: H o : r s = 0. - dla 5 <= N <= 30 istnieją specjalne tablice, tzw. tablice L Guilforda, - dla N > 30 przy pomocy testu t-studenta 0 N stopniach swobody (Używać oprogramowania) t = r S N 1 r S
Przykład pomiar smakowitości: W badaniu sensorycznym pewnych produktów spożywczych zastosowano skalę pięciopunktową na wygląd ogólny (Y) oraz smakowitość (X). Pobrano próbę o liczebności n=15 i po jej zbadaniu otrzymano:
Wyniki badań: Wygląd ogólny Smakowitość d i d i 3 1 1 3 3 0 0 1 1 1 4 4 0 0 3 1 1 5 4 1 1 4 3 1 1 5 5 0 0 0 0 4 4 3 1 1 3 4-1 1 1 1 1 4 3 1 1 0 0 13
Testowanie: r S = 1 15 6 13 (15 1) = 0,98 t = r S N 1 r S = 0,98 13 0,0396 = 17,756
Inne współczynniki korelacji: Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku: - T- Czuprowa, - Lambda, - Rang Kendalla (tau), - Z serii gamma, - Korelacji dwuseryjnej, - Korelacji punktowo-dwuseryjnej, - Punktowo-czteropolowej phi, - W Kendalla, - Korelacji częściowej Kendalla.