I. MIARY POŁOŻENIA charakteryzują średni lub typowy poziom wartości cechy, wokół nich skupiają się wszystkie pozostałe wartości analizowanej cechy. I.1. Średnia arytmetyczna x = x 1 + x + + x n n = 1 n n x i Interpretacja fizyczna: Gdyby jednakowe odważniki zawiesić na pręcie w miejscach wyznaczonych przez współrzędne x i, i = 1,..., n to punkt x wyznacza środek ciężkości, w którym należałoby pręt podeprzeć, aby zachować równowagę. Uniwersytet Zielonogórski 1
Przykład: Obserwacja czasu wykonywania 5 detali (w min): robotnik A: 1, 15, 15, 18, 0, robotnik B: 10, 10, 1, 1, 15, 15, 18, 0, 1, 1. x B = x A = 1 + 15 + 15 + 18 + 0 5 = 80 5 = 16 min 10 + 10 + 1 + 1 + 15 + 15 + 18 + 0 + 1 + 1 5 Średnia ważona - w szeregach rozdzielczych: x = 1 n x 1 n k n i x i = k n i ẋ i = k x i φ i k ẋ i φ i dla punktowych dla przedziałowych = 154 10 gdzie: ẋ i środek i-tego przedziału klasowego (uznajemy go za reprezentanta typowego dla klasy). = 15,4 min Uniwersytet Zielonogórski
Własności średniej arytmetycznej: 1. n x = n x i (szczegółowy) lub n x = k n ix i (rozdzielczy),. x min x x max, 3. n (x i x) = 0 lub k n i(x i x) = 0, 4. jest wrażliwa na skrajne wartości odstające cechy: Przykład: W pewnej firmie zarobki 8 pracowników osiągnęły 500 zł miesięcznie. Księgowa i kierownik otrzymali po 000 zł, a właściciel wypłacił sobie 10 000 zł. x = 8 500 + 000 + 10000 11 = 1636 zł wynik mylący! Uniwersytet Zielonogórski 3
I.. Średnia harmoniczna - odwrotność średniej arytmetycznej odwrotności wartości zmiennej x: n x h = n 1, (sz. szczegółowy) x i n x h = k, (sz. rozdzielczy) n i x i Stosowana gdy cecha jest wskaźnikiem natężenia, np.: prędkość pojazdu w km/h, pracochłonność w min/szt., cena jednostkowa w zł/szt. Przykład: Kierowca jadąc z Krakowa nad morze pokonał 600 km z prędkością 75 km/h. Będąc już mocno zmęczony osiągnął w trasie powrotnej prędkość 37,5 km/h. Wyznaczyć prędkość średnią. Wg średniej arytmetycznej 75 + 37,5 x = = 56,5 km/h, kierowca przez 4 h (8h w jedną i 16h z powrotem) pokonałby 56,5 4 = 1350 km/h! Uniwersytet Zielonogórski 4
Prawidłowy wynik to x h = 1 75 + 1 37,5 = 50 km/h (= 100km/4h), I.3. Średnia geometryczna ( n ) 1/n x g = n x 1 x... x n = x i Stosowana przy badaniu średniego tempa zmian zjawisk, gdy wielkości są opisywane dynamicznie. Przykład: W trzech kolejnych okresach liczba ludności pewnego miasta wynosiła 5000, 7500, 850. Obliczyć średni przyrost względny ludności. Przyrosty względne w kolejnych okresach: x 1 = 7500 5000 = 1,5, x = 850 7500 = 1,1, x g = 1,5 1,1 = 1,845 (5000 1,845 = 850) Uniwersytet Zielonogórski 5
Podczas, gdy średnia arytmetyczna x = 1,5 + 1,1 = 1,3 (źle, bo 5000 1,3 1,3 = 8450!) I.4. Modalna (dominanta, moda) - wartość cechy, która występuje najczęściej. Przykład: Dla zarobków w wymienionej wcześniej firmie (8 500zł, 000zł, 10000zł) modalna wynosi: Mo = 500 zł i lepiej niż średnia arytmetyczna odzwierciedla przeciętną płacę w firmie. Największą wadą modalnej jest niestabilność. Przykład: Dla liczb,,4,6,8,0 modalna wynosi. Wystarczy zamienić pierwszą na 0 i modalna przyjmie wartość skrajną 0! Uniwersytet Zielonogórski 6
I.5. Kwantyle - wartości cechy badanej zbiorowości, które dzielą ją na określone części pod względem liczby jednostek. Kwantyl rzędu p dzieli zbiorowość na dwie części zawierające p 100% i (1 p) 100% jej elementów. mediana (wartość połówkowa) - podział na części (rząd p = 1 ), kwartyle - podział na 4 części (p = k 4, k = 1,..., 4), decyle - podział na 10 części (p = k 10, k = 1,..., 10), percentyle - podział na 100 części (p = k 100, k = 1,..., 100). 5% jednostek 5% jednostek 5% jednostek 5% jednostek Q 1 mediana Q 3 Me kwartyl pierwszy posortowany szereg statystyczny = Q kwartyl drugi kwartyl trzeci Uniwersytet Zielonogórski 7
A) Procedura wyznaczania wartości dowolnego kwantyla rzędu p = k N (N - liczba części, k - kolejny numer kwantyla): 1 Uporządkuj n-elementowy zbiór danych w kolejności rosnącej. Oblicz indeks i kwantyla wg wzoru: i = nk N. 3.1 Jeżeli i nie jest liczbą całkowitą, zaokrąglij ją do następnej całkowitej. Znajdź tą pozycję w uporządkowanym zbiorze. Jej wartość jest poszukiwanym kwantylem: λ k = x i. 3. Jeżeli i jest liczbą całkowitą, znajdź wartość średnią na pozycjach i i i + 1: λ k = x i + x i+1. B) Procedura określenia numeru kwantyla (np. percentyla P k ) dla zadanej wartości x: k = liczba wart. poniżej x + 0,5 n 100 Uniwersytet Zielonogórski 8
Przykład: Znaleźć medianę, kwartyle i 7 decyl w następującym szeregu: 13, 11, 10, 13, 11, 10, 8, 1, 9, 9, 8, 9. Któremu percentylowi odpowiada wartość 1? Szereg po posortowaniu: 8, 8, 9, 9, 9, 10, 10, 11, 11, 1, 13, 13. i Q1 = 1 1 4 = 3 Q 1 = x 3 + x 4 i Q = 1 = 6 Me = Q = x 6 + x 7 i Q3 = 3 1 4 i D7 = 7 1 10 = 9 Q 3 = x 9 + x 10 = 8,4 D 7 = x 9 = 11 x = 1 k = 9 + 0,5 1 = 9 + 9 = 9 10 + 10 = = 10 11 + 1 = = 11,5 100 = 79,167 79 percentyl Uniwersytet Zielonogórski 9
Przykład: Dla zarobków w wymienionej wcześniej firmie (8 500zł, 000zł, 10000zł) mediana wynosi: i = 5,5 Me = (500 + 500)/ = 500 zł i podobnie jak modalna dobrze odzwierciedla przeciętną płacę. W szeregu rozdzielczym przedziałowym: Me = x m + ( m 1 n n i ) hm n m, gdzie: m - numer przedziału, w którym występuje mediana, x m - początek przedziału, w którym występuje mediana, h m - długość przedziału mediany, n m - liczebność przedziału mediany. Uniwersytet Zielonogórski 10
II. MIARY ZMIENNOŚCI Przykład: W dwóch grupach wyprodukowanych rezystorów zmierzono rezystancję (w Ω): Gr. I: 145, 15, 130, 155, 140, 150, 135 Gr. II: 115, 150, 100, 180, 140, 165, 130 Średnia i mediana są dla obu grup jednakowe i wynoszą 140!!! II.1.1. Rozstęp R = x max x min Prosta, ale niedoskonała, bo łatwo znaleźć dwa różne szeregi o jednakowych rozstępach. II.1.. Rozstęp międzykwartylowy i odchylenie ćwiartkowe R Q = Q 3 Q 1, Q = (Me Q 3) (Me Q 1 ) = R Q Uniwersytet Zielonogórski 11
II..1. Wariancja s = 1 n s = 1 n n (x i x), (sz. szczegółowy), k n i (x i x), (sz. rozdzielczy). II... Odchylenie standardowe Ściśle powiązana z wariancją, ale wyskalowana w jednostkach wielkości zmiennej. s = s Przykład: Dla przytoczonych dwóch grup rezystorów: Gr. I: s I = 10, 8 Ω Gr. II: s II = 7, 83 Ω Druga grupa charakteryzuje się znacznie większym rozproszeniem. Uniwersytet Zielonogórski 1
Reguła trzech sigm (dla rozkładu normalnego lub zbliżonego do normalnego) 68% 95% -3s -s -s 99,7% x +s +s +3s II.3. Współczynnik zmienności V = s x 100% Stosowany do porównywania zmienności w co najmniej dwóch grupach danych, uniezależniając się od jednostek miar. Uniwersytet Zielonogórski 13
III. MIARY ASYMETRII Przykład: W trzech 100 osobowych grupach badano czas reakcji na lek: Czas reakcji Gr. 1 Gr. Gr. 3 10-0 10 5 10 0-30 0 35 5 30-40 40 5 5 40-50 0 5 35 50-60 10 10 5 Średnia i wariancja są identyczne dla wszystkich grup i wynoszą x = 35 i s = 10. 40 40 40 30 30 30 0 0 0 10 10 10 0 0 0 Gr. 1 Gr. Gr. 3 Uniwersytet Zielonogórski 14
Trzy możliwe sytuacje: x = Me = Mo - rozkład symetryczny, x > Me > Mo - rozkład o asymetrii prawostronnej, x < Me < Mo - rozkład o asymetrii lewostronnej, III.1. Współczynnik skośności (asymetrii) x Mo A S = s W rozważanym przykładzie: Gr. 1: A S = 0 - rozkł. symetryczny, Gr. : A S = 0,317 > 0 - asymetria prawostronna, Gr. 3: A S = 0,317 < 0 - asymetria lewostronna. IV. MIARY KONCENTRACJI IV.1. Kurtoza (Współczynnik skupienia) K = m { 1 n 4 s 4, m 4 = n (x i x) 4 (sz. szczegółowy) 1 k n n i(x i x) 4 (sz. rozdzielczy) Uniwersytet Zielonogórski 15