Wykład 7. Opis współzaleŝności zjawisk 1. Wprowadzenie. 2. Prezentacja materiału statystycznego.
Rodzaje współzaleŝności zjawisk 1. WspółzaleŜność funkcyjna określonym wartościom jednej zmiennej jest ściśle przyporządkowana jedna odmiana drugiej zmiennej. 2. WspółzaleŜność stochastyczna określonym wartościom jednej zmiennej jest przyporządkowanych wiele odmian drugiej zmiennej.
3. WspółzaleŜność korelacyjna określonym wartościom jednej zmiennej odpowiadają ściśle określone średnie wartości drugiej zmiennej. Przykład współzaleŝności funkcyjnej X powierzchnia glazury w m² Y wynagrodzenie w zł 1 50 2 100 3 150 Całkowite wynagrodzenie za pracę Y=50X.
Przykład współzaleŝności stochastycznej X miesięczna produkcja cukru (w tonach) 10 17 Y koszty stałe (w tys. zł) 122 90 107 213 256 141 216 Koszty stałe są uzaleŝnione nie tylko od wielkości produkcji, ale takŝe, np.: od wynagrodzenia członków zarządu,, amortyzacji, lokalizacji cukrowni, itd.
Przykład współzaleŝności korelacyjnej X wykształcenie podstawowe 1326 średnie 1913 wyŝsze 2289 Y średnie wynagrodzenie miesięczne (w zł) ZauwaŜmy, Ŝe jeŝeli mamy do czynienia z zaleŝnością korelacyjną, to jest ona zawsze i stochastyczna. Nie zawsze jest jednak na odwrót, tzn. jeśli istnieje współzaleŝność stochastyczna, to i korelacyjna. Oto przykład:
WspółzaleŜność stochastyczna X - płeć Y ocena z egzaminu męŝczyźni 3,5 4 3 Brak współzaleŝności korelacyjnej X- płeć Y średnia ocena z egzaminu męŝczyźni 3,5 kobiety 4 5 kobiety 3,5 3 2
Podejścia w analizie współzaleŝności zjawisk: 1. Jakościowe określa związki przyczynowo skutkowe między zmiennymi. WspółzaleŜność dwustronna przyczyna skutek skutek przyczyna X Y X kwoty wydawane na reklamę, Y przychody.
WspółzaleŜność jednostronna przyczyna skutek X Y X wiek, Y staŝ pracy. WspółzaleŜność pozorna X Y Z X wielkość strat po przejściu huraganu, Y liczba osób usuwających skutki huraganu, Z moc huraganu.
2. Ilościowe: Analiza korelacji określa siłę i kierunek zaleŝności między badanymi cechami; Analiza regresji słuŝy do badania mechanizmu powiązań między cechami, którego wyrazem jest funkcja regresji.
Prezentacja materiału statystycznego szereg korelacyjny x i x 1 y i y 1 x 2 x n n M i= 1 x i y 2 M y n n i= 1 y i
diagramy korelacyjne y y x x brak koleracji korelacja liniowa dodatnia
y y x korelacja liniowa ujemna korelacja krzywoliniowa x
tablica korelacyjna jest to tablica skonstruowana w ten sposób, iŝ w poszczególnych wierszach podajemy warianty cechy X, natomiast w kolumnach warianty cechy Y.
x i x 1 x 2 y j y1 y2 n11 n12 n 21 n22 y l n 1l n 2l n i n ij = l n 1 n 2 j= 1 x k nk1 n k 2 n kl n k n k j = n ij i= 1 n 1 n 2 n l n
Przykład Mamy następujący szereg korelacyjny obrazujący zaleŝność między liczbą reklamacji X a tygodniowymi obrotami sklepów obuwniczych Y (w tys. zł): x i 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 y j 1,5 4,5 6,9 8,3 11, 2 6,2 6,3 7,4 8,7 9,6 9,9 10, 4 11, 2 13, 0 18, 9 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 11, 7 12, 0 13, 2 14, 6 15, 2 16, 3 17, 0 19, 6 19, 9 22, 5 25, 6 26, 3 26, 7 28, 2 29, 7
4 4 4 4 4 4 4 4 4 4 10,4 11,0 12,3 13,3 15,6 18,6 20,0 21,1 21,4 22,7 4 4 4 4 4 4 4 4 4 4 22,9 24,0 24,5 25,0 25,7 27,2 27,4 28,7 28,9 29,8 Zbudujemy na ich podstawie tablicę korelacyjną i omówimy, jakich obliczeń i obserwacji moŝemy dokonać na jej podstawie.
Tablica korelacyjna liczby reklamacji X i obrotów sklepów Y wygląda następująco: x i y j [0 10) 5 [10 20) 15 [20 30) 25 n i 1 4 1-5 2 6 4-10 3-9 6 15 4-6 14 20 n j 10 20 20 50
W tablicy korelacyjnej są zawarte dwa rodzaje rozkładów: rozkłady brzegowe i rozkłady warunkowe. Rozkład brzegowy przedstawia strukturę jednej cechy bez względu na kształtowanie się drugiej z nich. W powyŝszej tablicy występują dwa rozkłady brzegowe (w ostatniej kolumnie i ostatnim wierszu), odpowiednio dla cechy X i Y. Chcąc je opisać moŝemy posłuŝyć się parametrami średnią arytmetyczną i wariancją (lub odchyleniem standardowym).
Dla naszego przykładu średnia liczba reklamacji (niezaleŝnie od wielkości obrotów) wyniosła 3 reklamacje, zaś wariancja 1,02 reklamacji². Obliczając pierwiastek z wariancji otrzymujemy odchylenie standardowe, które wynosi 1,01 reklamacji i oznacza, Ŝee we wszystkich analizowanych sklepach liczba reklamacji róŝniła się os średniej liczby reklamacji o 1,01 reklamacji. Natomiast średnie obroty wszystkich sklepów (niezaleŝnie od liczby złoŝonych reklamacji)
wyniosły 17 tys. zł z wariancją 57,14 tys. zł², czyli odchylały się od średnich obrotów średnio o 7,56 tys. zł. Rozkłady warunkowe prezentują strukturę jednej cechy przy nałoŝonym warunku na druga z nich. Mamy zatem 3 rozkłady warunkowe liczby reklamacji (tyle było odmian wielkości obrotów) i 4 rozkłady warunkowe obrotów (tyle było odmian liczby reklamacji). Wartości ich poszczególnych parametrów przedstawiają następujące tabelki:
xi y j 2 S y 5 15 25 j y j 1 7 20,00 xi 1,6 3,0 3,7 2 9 26,67 3 19 25,71 2 S xi 0,27 0,74 0,22 4 22 22,11
Na podstawie ustalonych średnich warunkowych moŝna określić kształt oraz siłę i (niekiedy) kierunek związku. SłuŜy temu tzw. wykres regresji empirycznej. W układzie współrzędnych nanosimy punkty przyporządkowujące średnie warunkowe jednej zmiennej przy kolejnych warunkach kształtowania się drugiej z nich i łączymy je linią łąmaną.
Skrajne przypadki kształtowania się regresji empirycznej:
Dla naszego przykładu wykres wygląda następująco: