Statystyka opisowa. Wykªad II. e-mail:e.kozlovski@pollub.pl
Spis tre±ci Mediana i moda 1 Mediana i moda 2 3 4
Mediana i moda Median m e (warto±ci ±rodkow ) próbki x 1,..., x n nazywamy ±rodkow liczb w uporz dkowanej próbce x (1) x (2)... x (n) Median wyznaczamy jako x ( n+1 2 ) gdy n nieparzyste m e = x ( n 2 ) +x ( n 2 +1 ) 2 gdy n parzyste natomiast median dla szeregu rozdzielczego wyznaczamy ( ) m e = x l + b m 1 n 2 n i n m gdzie x l lewy koniec klasy zawieraj cej median, m numer klasy zawieraj cy median, n liczebno± próbki, n i liczebno± i tej klasy, b dªugo± klasy. i=1
Mod (dominant ) m o próbki x 1,..., x n o powtarzaj cych si warto±ciachnazywamy najcz ±ciej powtarzj c si warto±, o ile istnieje (nie b d ca x min ani te» x max ). Mod w szeregu rozdzielczym wyznaczamy n l n l 1 m o = x l + (n l n l 1 ) + (n l n l+1 ) b gdzie x l lewy koniec klasy modalnej, n l liczebno± klasy modalnej, n l 1 i n l+1 liczebno±ci s siednich klas, b dªugo± klasy. Je»eli w szeregu rozdzielczym najliczniejszymi s obie skrajnie klasy, to szereg rozdzielczy nazywamy antymodalnym typu U, a ±rodek najmniej licznej klasy nazywamy antymod. Gdy w szeregu rodzielczym najliczniejsza jest jedna ze skarjnych klas, to szereg rozdzielczy nazywamy antymodalnym typu J. Szereg w którym wyst puj dwie jednakowo liczne klasy i najliczniejsze nie b d ce skrajnymi nazywamy dwumodalnym.
Mediana i moda Najprostrz miar rozproszenia (rozrzutu) próbki x 1,..., x n jest rozst p R. Nie informuje jednak ona jak w przedziale x min, x max rozªo»one s poszczególne warto±ci próbki. Wariancj s 2 próbki x 1,..., x n nazywamy ±redni arytmetyczn kwadratów odchyle«poszczególnych warto±ci x i od ±redniej arytmetycznej x próbki s 2 = 1 n n (x j x) 2 dla szeregu rozdzielczego wariancj wyznaczamy s 2 = 1 n k (x j x) 2 n j
Pierwiastek z wariancji nazywamy odchyleniem standardowym s = 1 n (x j x) 2 n dla szeregu rozdzielczego wariancj wyznaczamy s = 1 k (x j x) 2 n j n
Odchyleniem przeci tmym d 1 od warto±ci ±redniej x próbki x 1,..., x n nazywamy ±redni arytmetyczn warto±ci bezwzgl dnych odchyle«poszczególnych warto±ci x i od ±redniej arytmetycznej x próbki d 1 = 1 n n x j x lub d 1 = 1 n k x j x n j Odchyleniem przeci tmym d 2 od mediany m e próbki x 1,..., x n nazywamy ±redni arytmetyczn warto±ci bezwzgl dnych odchyle«poszczególnych warto±ci x i od ±redniej arytmetycznej x próbki d 2 = 1 n n x j m e lub d 2 = 1 n k x j m e n j
Kwantyle Mediana i moda Niech x (1) x (2)... x (n) oznacza uporz dkowan próbk x 1,..., x n. Warto±ci w uporz dkowanej próbce dzielimy na 2 grupy: do pierwszej zaliczamy mniejsze od mediany i median. natomiast do drugiej median i warto±ci wi ksze od mediany. Kwantylem dolnym Q 1 nazywamy median pierwszej grupy, natomiast kwantylem górnym Q 3 nazywamy median drugiej grupy warto±ci. Odchylenie wiartkowe wyznaczamy jako Q = Q 3 Q 1 2
Mediana i moda Momentem zwykªym m l rz du l próbki x 1,..., x n nazywamy ±redni arytmetyczn l tych pot g warto±ci elementów (±rodków klas) próbki m l = 1 n n x l j lub m l = 1 n k x l jn j Momentem centralnym M l rz du l próbki x 1,..., x n nazywamy ±redni arytmetyczn l tych pot g odchyle«warto±ci elementów (±rodków klas) od ±redniej arytmetycznej x próbki M l = 1 n n (x j x) l lub M l = 1 n (pierwszy moment centralny wynosi zero). k (x j x) l n j
Moment absolutny zwykªy a l rz du l próbki x 1,..., x n okre±lamy wzorem a l = 1 n x j l lub a l = 1 n n k x j l n j Moment absolutny centralny b l rz du l próbki x 1,..., x n okre±lamy jako b l = 1 n x j x l lub b l = 1 n n k x j x l n j
Mediana i moda Dla rozkªadów symetrycznych wszystkie momenty centralne rz dów nieparzystych s równe zero. Wspóªczynnik asymetrii (sko±no±ci) wyznaczamy jako g = M 3 s 3 W przypadku gdzy g = 0 to badany szereg jest symetryczny. W przypadku gdzy g > 0 to szereg jest bardziej "rozªo»ony na prawo" od warto±ci ±redniej (natomiast bardziej skoncentronawy na lewo od ±redniej), natomiast g < 0 to szereg jest bardziej "rozªo»ony na lewo" od warto±ci ±redniej (natomiast bardziej skoncentronawy na prawo od ±redniej).
Wspóªczynnik koncentacji (skupienia, kurtoza) wyznaczamy jako K = M 4 s 4 Im wspóªczynnik koncentracji jest wi kszy, tym szereg jest bardziej skoncentrowany. Warto± K 3 okre±lamy jako eksces (wspóªczynnik spªaszczenia). Dla rozkªadu normalnego N (0, 1) warto± K 3 = 0
Wspóªczynnik zmienno±ci wyznaczamy jako v = s x 100% Wspóªczynnik nierównomierno±ci wyznaczamy jako H = d 1 x 100%
Przykªad 1. Dla szeregu rozdzielczego postaci x i n i 1 5.1 2 2 5.2 2 3 5.3 2 4 5.4 3 5 5.5 3 6 5.6 8 7 5.7 2 22 oblicz warto± ±redni, mod, median, wariancj, odchylenia standardowe, odchylenie przeci tne od ±redniej oraz wspóªczynniki: zmienno±ci, nierównomierno±ci, asymetrii, koncentracji, eksces.
Warto± ±rednia x = 120.1 22 5.46 moda wynosi m 0 = 5.6, mediana natomiast m e = x (11)+x (12) 2 = 5.5+5.5 2 = 5.5, wariancja i odchylenia standardowe wynosz odpowiednio odchylenie przeci tne od ±redniej s 2 = 0.7332 0.033327 22 s = 0.033327 0.182558 d 1 = 3.46 22 0.157273
wspóªczynniki: zmienno±ci, nierównomierno±ci, asymetrii, koncentracji, eksces v = 0.182558 100% 3.34% 5.46 H = 0.157273 100% 2.88% g = K = 5.46 0.08751 22 K 3 = 0.7984 0.182558 3 0.65378 0.053798 22 0.182558 4 2.2016
Przykªad 2. Dla szeregu rozdzielczego przediaªowego postaci przedziaªy x i n i 1 (1.5; 2.5) 2 1 2 (2.5; 3.5) 3 3 3 (3.5; 4.5) 4 5 4 (4.5; 5.5) 5 8 5 (5.5; 6.5) 6 2 6 (6.5; 7.5) 7 1 20 oblicz warto± ±redni, mod, median, wariancj, odchylenia standardowe, odchylenie przeci tne od ±redniej oraz wspóªczynniki: zmienno±ci, nierównomierno±ci, asymetrii, koncentracji, eksces.
Moda wynosi mediana natomiast m 0 = 4.5 + m e = 4.5 + 1 8 8 5 (8 5) + (8 2) = 4.8333 ( 20 2 ) (1 + 3 + 5) = 4.625 wariancja i odchylenia standardowe wynosz odpowiednio odchylenie przeci tne od ±redniej s 2 = 27 20 1.35 s = 1.35 1.1619 d 1 = 19 20 = 0.95
wspóªczynniki: zmienno±ci, nierównomierno±ci, asymetrii, koncentracji, eksces v = 1.1619 100% 24.53% 4.5 H = 0.95 100% 19.19% g = K = 4.5 3 20 K 3 = 0.14 1.1619 3 0.095629 104.25 20 1.1619 4 2.86