Rachunek prawdopodobieństwa i statystyka Współczynnik zmienności Klasycznym współczynnikiem (wskaźnikiem) zmienności zmiennej losowej X nazywamy wyrażenie gdzie E(X) 0. v k z (X) = D(X) E(X), Klasyczny współczynnik zmienności jest miarą rozproszenia, rozrzutu, dyspersji rozkładu względem wartości oczekiwanej. Oczywiście 0 v k z (X). Często podaje się klasyczny współczynnik zmienności w ujęciu procentowym. Wtedy 0 v k z (X) 00%. Im wartość tego współczynnika jest mniejsza tym rozproszenie (rozrzut, zmienność) jest mniejsze. Można też powiedzieć, że wtedy wartości zmiennej są bardziej skupione wokół wartości oczekiwanej. x k 5 p k Ponieważ E(X) =, 5, D(X) =, 7, więc v k z (X) = co oznacza średnią (przeciętną) zmienność., 7, 5 0, 9 = 9%, Zmienna losowa X ma rozkład jednostajny o gęstości Ponieważ E(X) =, D(X) =, więc 0 dla x <, dla x 7, 0 dla x > 7. v k z (X) = 0, = %, co oznacza również średnią (przeciętną) zmienność, ale słabszą niż w poprzednim przykładzie.
Pozycyjnym współczynnikiem (wskaźnikiem) zmienności zmiennej losowej X nazywamy wyrażenie v p z(x) = Q(X) Me(X), gdzie Me(X) 0, Q(X) = [Q (X) Q (X)] - odchylenie ćwiartkowe. Pozycyjny współczynnik zmienności jest miarą rozproszenia, rozrzutu, dyspersji rozkładu względem mediany. Oczywiście 0 v p z(x). Często podaje się pozycyjny współczynnik zmienności w ujęciu procentowym. Wtedy 0 v p z(x) 00%. x k 5 7 0 p k 0, 0, 0, 5 0, Ponieważ Me(X) = 7, Q (X) = 7, Q (x) = 5, Q(X) = [7 5] =, więc v p z(x) = 7 0, = %, co oznacza dość słabą zmienność, czyli wartości są mocno skupione wokół mediany. Dla porównania E(X) =, 7, D(X) =,, skąd v k z (X) 0, = %, czyli zmienność wokół wartości oczekiwanej jest słaba. e x dla x 0. Ponieważ Me(X) = ln, Q (X) = ln, Q (x) = ln, Q(X) = więc v p z(x) = ln 0, 79 = 79%, ln co oznacza silną zmienność, czyli wartości są słabo skupione wokół mediany. [ ln ln ] = ln, Dla porównania E(X) =, D(X) =, skąd vk z (X) = = 00%, czyli zmienność wokół wartości oczekiwanej jest bardzo silna. Współczynnik asymetrii Mówimy, że zmienna losowa ma rozkład symetryczny względem prostej x = a, jeżeli. w przypadku zmiennej losowej skokowej o punktach skokowych x k dla każdego punktu x i a istnieje taki punkt x j a, że P (X = x i ) = P (X = x j ) oraz a x i = x j a,
. w przypadku zmiennej losowej ciągłej o gęstości f(x) zachodzi f(a x) = f(a + x) dla każdego x w punktach ciągłości funkcji f. Prostą o równaniu x = a nazywamy osią symetrii rozkładu. Jeżeli takie a nie istnieje, to mówimy o asymetrii rozkładu. W statystyce bada głównie się asymetrię względem wartości oczekiwanej. Słowo asymetria zastępuje się czasem słowem skośność. Współczynnikiem asymetrii rozkładu zmiennej losowej X nazywamy wyrażenie w a (X) = µ D (X), gdzie µ - moment centralny trzeciego rzędu, który można obliczyć według wzoru µ = m m m + m, gdzie m k = E(X k ) - momenty zwykłe k-tego rzędu, k =,, oraz D(X) = µ, µ = m m. Jeżeli w a (X) > 0, to mówimy, że rozkład ma asymetrię prawostronną (dodatnią). Jeżeli w a (X) < 0, to mówimy, że rozkład ma asymetrię lewostronną (ujemną). Jeżeli w a (X) = 0, to mówimy, że rozkład jest symetryczny. Współczynnik asymetrii mierzy zatem kierunek asymetrii oraz jej siłę: im w a (X) jest większe tym asymetria jest silniejsza. x k 5 7 0 p k 0, 0, 0, 5 0, Wiemy już, że m = E(X) =, 7. Analogicznie można obliczyć m = E(X ) = 9, 9, m = E(X ) = 97,, skąd µ =,. Ponadto µ = 5, 0, D(X) =, 8, więc ostatecznie w a (X) =, 0, 7 = 7%, (, 8) czyli mamy słabą asymetrię lewostronną tego rozkładu. Ponieważ teraz mamy wzory m k = + e x dla x 0. + x k f(x) dx = x k e x dx, k =,,, 0
z których obliczamy kolejno m =, m =, m =, skąd µ =. Ponadto µ =, czyli D(X) =, więc ostatecznie wa(x) = ( ) = = 00%, czyli mamy bardzo silną asymetrię prawostronną tego rozkładu. W wielu przypadkach korzysta się klasycznego współczynnika asymetrii postaci v k a(x) = E(X) Do(X), D(X) który jest interpolacyjnym przybliżeniem współczynnika w a (X). x k 5 7 0 p k 0, 0, 0, 5 0, Mamy tutaj E(X) =, 7, D(X) =, 8, Do(X) = 7, zatem v k a(x) =, 7 7, 8 0, = %, co oznacza, że mamy dość słabą asymetrię lewostronną rozkładu. e x dla x 0. Mamy tutaj E(X) =, ale Do(X) nie możemy wyznaczyć, gdyż funkcja f nie ma maksimum lokalnego. Posłużymy się wzorem Pearsona. Ponieważ Me(X) = ln, więc Wobec powyższego mamy Do(X) E(X) [E(X) Me(X)] = + ln 0, 0. va(x) k = ( + ln ) 0, 9 = 9%, co oznacza, że mamy silną asymetrię prawostronną rozkładu. Określa się także pozycyjny współczynnik asymetrii według wzoru va(x) p = [Q (x) Me(X)] [Me(x) Q (X)]. Q(X)
x k 5 7 0 p k 0, 0, 0, 5 0, Mamy tutaj Me(X) = 7, Q (X) = 5, Q (X) = 7, Q(X) =, zatem v p a(x) = [7 7] [7 5] co oznacza, że mamy silną asymetrię lewostronną rozkładu. = = 00%, e x dla x 0. Mamy tutaj Me(X) = ln, Q (X) = ln, Q (x) = ln, Q(X) = ln, zatem v p a(x) = [ ln ln ] [ ln ln ] ln = ln ln co oznacza, że mamy słabą asymetrię prawostronn a rozkładu. 0, = %, 5