Wykład 5. Opis struktury zbiorowości 1. Miary asymetrii. 2. Miary koncentracji.
Przykład Zbadano stawkę godzinową (w zł) pracowników dwóch branŝ, otrzymując następujące charakterysty ki liczbowe: Stawka godzinowa Odsetek pracowników BranŜa A BranŜa B 6-8 5 10 8-10 5 25 10-12 25 25 12-14 25 5 14-16 10 5 Średnia 11 11 arytmetyczna Wariancja 4,8 4,8 Odchylenie standardowe 2,19 2,19 V(x) 20% 20%
Na podstawie histogramów moŝna łatwo stwierdzić, Ŝe pomimo takiej samej średniej arytmetycznej jak i zróŝnicowania stawki godzinowej, istnieją róŝnice w strukturach badanych zbiorowości. 40 5 0 25 20 15 BranŜa A BranŜa B 10 5 0 6-8 8-10 10-12 12-14 14-16
Miary asymetrii (skośności) słuŝą do określenia kierunku zróŝnicowania zmiennej.
Współczynnik skośności Pearsona W s = x D s( x), gdzie x D s( x) - średnia arytmetyczna - dominanta - odchylenie standardowe
Współczynnik asymetrii (klasyczny): µ W = A s x ( ), gdzie µ - trzeci moment centralny, który wyznaczamy z następujących wzorów:
dla szeregu szczegółowego µ ( x x) N dla szeregu punktowego µ N i= = 1 k i= = 1 i ( x x ) n N dla szeregu przedziałowego µ = k i= 1 i ( x& x) i N i n i.
Współczynnik asymetrii (pozycyjny) mierzy wyłącznie skośność w centralnej części rozkładu, bierze pod uwagę jedynie połowę jednostek środkowych: ( ) ( ). 2 1 1 1 1 Q Q M Q Q Q Q Q M M Q W p + = =
Kierunek asymetrii W W W S S S, W, W < A P, W, W > A P, W, W = A P 0 - rozkład o asymetrii lewostronnej (ujemnej), 0 - rozkład o asymetrii prawostronnej (dodatniej); 0 - rozkład symetryczny, W S 1, W > > A 2- rozkład skrajnie asymetryczny.
Siła asymetrii WS WA WP Siła asymetrii 0,0-0,2 0,0-0,4 0,0-0,2 bardzo słaba 0,2-0,4 0,4-0,8 0,2-0,4 słaba 0,4-0,6 0,8-1,2 0,4-0,6 umiarkowana 0,6-0,8 1,2-1,6 0,6-0,8 silna 0,8 i > 1,6 i > 0,8-1,0 bardzo silna
Miary koncentracji dotyczą jedynie rozkładów symetrycznych i odpowiadają na pytanie: czy wartości cechy są rozproszone w zbiorowości, czy teŝ charakteryzuje je skupienie wokół wartości średniej arytmetycznej? Wówczas zjawisko to nazywane jest kurtozą. Koncentracja moŝe być równieŝ rozpatrywana jako nierównomierny podział ogólnej sumy wartości cechy między poszczególne jednostki zbiorowości.
Kurtoza oznacza płaskość lub spiczastość rozkładu w stosunku do drugiego. Między zróŝnicowaniem a kurtozą istnieje ścisła zaleŝność.
Im rozkład jest bardziej rozproszony, tym charakteryzuje się mniejszym skupieniem wokół średniej mówimy wówczas, Ŝe rozkład jest platokuryczny, i odwrotnie, im mniejsze rozproszenie, tym większe skupienie wokół średniej wtedy mamy rozkład leptokuryczny.
Współczynnik kurtozy: gdzie µ 4 µ W K = s 4 4, jest czwarty moment centralny, który obliczamy ze wzorów:
dla szeregu szczegółowego µ 4 ( x x) N dla szeregu punktowego µ 4 N i= = 1 k i= = 1 i 4 ( x x ) 4 n N dla szeregu przedziałowego µ 4 = k i= 1 i ( x& x) i N 4 i n i.
Porównujemy otrzymaną wartość współczynnika z kurtozą charakterystyczną dla pewnego bardzo waŝnego rozkładu w statystyce, zwanego rozkładem normalnym. W tym rozkładzie współczynnik kurtozy jest równy, więc: W K < W K = > W K rozkład platokuryczny, rozkład normalny, rozkład leptokuryczny.
Współczynnik ekscesu (eksces) to: W e = W K W e W e W e < = > 0 0 0 rozkład platokuryczny, rozkład normalny, rozkład leptokuryczny.
Koncentracja wartości cechy (rozpatrywana jako nierównomierny podział sumy wartości cechy miedzy poszczególne jednostki zbiorowości). Krzywa (wielobok) Lorenza (krzywa koncentracji Lorenza) w kwadracie o boku 100 zaznacza się na jego podstawie skumulowane odsetki jednostek, zaś na jego prawym boku skumulowany odsetek wartości cechy. Łącząc powstałe punkty otrzymuje się krzywą Lorenza.
Przekątna kwadratu nosi nazwę linii równomiernego rozdziału, a powierzchnia pomiędzy linią równomiernego rozdziału a krzywą Lorenza jest powierzchnią koncentracji.
Współczynnik koncentracji Giniego: K = a 5000, gdzie a jest to pole miedzy linią równomiernego rozkładu a krzywą Lorenza. K 0,1 Gdy K=0 mamy brak koncentracji, a gdy K=1 mamy do czynienia z koncentracją zupełną.
Przykład PoniŜsze dane przedstawiają informacje na temat liczby miast i ludności w miastach w Polsce w dniu 1.12.2000: Grupy miast wg liczby ludności w tys. Liczba miast Liczba ludnośc i w tys. Odsete k miast Odsetek ludności Skumulowane odsetki miast ludności Do 5 287 882,9 2,6,7 2,6,7 5-10 181 1285,2 20,6 5,4 5,2 9,1 10-20 18 2680,2 20,8 11,2 74,0 20, 20-50 17 4224,9 15,6 17,7 89,6 8,0 50-100 50 59,4 5,7 14,1 95, 52,1 100-200 2 04,5 2,6 12,7 97,9 64,8 200 i więcej 19 840,4 2,1 5,2 100 100 Razem 880 2876,5 100 100 x x