Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej) 1
Podział ze względu na zakres danych użytych do wyznaczenia miary Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy Miary opisujące rozkład badanej cechy statystycznej, które obliczamy na podstawie tylko niektórych wartości cechy, zajmujących szczególną pozycję w szeregu statystycznym Podział ze względu na opisywane cechy rozkładu Opisują średni lub typowy poziom wartości cechy. Określają tą wartość cechy, wokół której skupiają się wszystkie pozostałe wartości badanej cechy. Wśród nich można wyróżnić miary tendencji centralnej wskazujące położenie centralnych (przeciętnych) wartości cechy w rozkładzie (rozproszenia, rozrzutu, dyspersji) miary opisujące jak bardzo zróżnicowane są wartości cechy w zbiorowości (skośności) miary opisujące asymetrię rozkładu cechy w zbiorowości 2
Miary klasyczne Miary pozycyjne Miary tendencji centralnej Miary zróżnicowania średnia arytmetyczna średnia geometryczna średnia harmoniczna inne średnie odchylnie przeciętne wariancja odchylenie standardowe klasyczny współczynnik zmienności dominanta mediana kwantyle Rozstęp (max-min) pozycyjny współczynnik zmienności Miary skośności klasyczny współczynnik asymetrii pozycyjny współczynnik asymetrii kurtoza Klasyczno-pozycyjny współczynnik skośności Pearsona x Suma wszystkich wartości cechy (zmiennej) podzielona przez liczbę wszystkich jednostek zbiorowości x i i-ta wartość cechy (zmiennej) N liczebność 3
może być obliczona tylko dla zmiennych ilościowych wielkość abstrakcyjna, tzn. jej wartość nie musi występować w szeregu statystycznym na podstawie którego była wyznaczana (badany o średnim wzroście nie istnieje ) jest wielkością mianowaną wyrażoną w takich jednostkach miary jak badana cecha (średnia zarobków jest wyrażona np. w zł, tak jak wartości zmiennej płaca) spełniona jest relacja minimum < średnia < maksimum jest wrażliwa na wartości odstające Średnia 6 7 8 3 2 4 5 5, 6 7 8 3 2 4 5 11,4 Średniej arytmetycznej nie należy wyznaczać jeśli: zbiorowość jest niejednorodna czyli nie wszystkie badane jednostki posiadają badaną cechę występują wartości odstające, nietypowe (ekstremalne) rozkłady są skrajnie asymetryczne, siodłowe lub wielomodalne - większość wartości cechy jest wtedy stosunkowo odległa od średniej 4
D Wartość najczęściej występująca w zbiorze wartości cechy charakteryzuje typowe jednostki w zbiorowości jedyna miara położenia, którą można wyznaczyć dla zmiennych nominalnych w zbiorze wartości może występować więcej niż jedna wartość dominanty jeśli nie można wyznaczyć średniej (np. z powodu występowania wartości odstających) wyznacza się wartość dominanty Liczba nb N 1 1 12 2 4 3 3 4 1 Wyniki sprawdzianu Niedostateczny 5 Dopuszczający 4 Studenci najczęściej opuścili jedne zajęcia (D =1). N Dostateczny 7 Dobry 1 Bardzo dobry 1 Wykształcenie N Zawodowe 7 Średnie 3 Wyższe 22 Typowy badany ma wykształcenie wyższe (D = Wyższe ) Uczniowie najczęściej otrzymali ocenę dobrą lub bardzo dobrą (dwie wartości modalne) (D = dobry, D = bardzo dobry ) 5
Me Taka wartość cechy (zmiennej), że co najmniej połowa jednostek zbiorowości ma wartości nie większe (czyli mniejsze lub równe) od tej wartości i równocześnie co najmniej połowa jednostek zbiorowości ma wartości nie mniejsze (większe lub równe) od tej wartości Wartość cechy (zmiennej) w szeregu uporządkowanym, powyżej i poniżej której znajduje się jednakowa liczba obserwacji Egzamin PJ (9,5): 3, 5, 6, 7, 11, 15 16, 17, 18 Me=11 Co najmniej połowa zdających uzyskała co najwyżej 11 punktów, co najmniej połowa zdających uzyskała przynajmniej 11 punktów Jeśli liczba obserwacji w próbie jest parzysta, wówczas mediana jest wyznaczana jako średnia z dwóch wartości leżących pośrodku Egzamin PJ (1,5-6): 1, 3, 5, 6, 7, 11, 15 16, 17, 18 Me=9 Połowa zdających uzyskała mniej niż 9 punktów, druga połowa zdających uzyskała więcej niż 9 punktów 6
Interpretacja mediany jako wartości, która dzieli zbiorowość na pół czyli dwie równoliczne części (mówimy, że połowa wartości jest mniejsza, połowa wartości większa od mediany) jest uproszczeniem! 1) nie da się podzielić zbiorowości o nieparzystej liczbie jednostek na pół 2) wartość mediany może występować w zbiorze wielokrotnie Me=11 Egzamin PJ (16,8-9): 1, 3, 4, 4, 5, 6, 7, 11, 11, 11, 11, 13, 15 16, 17, 18 W praktyce, kiedy zbiory danych są liczne dopuszcza się taką interpretację 7
Wartości jednostek Liczba jednostek Wartości cechy (zmiennej), które dzielą zbiorowość na określone części pod względem liczby jednostek dzielą zbiorowość na 4 części dzielą zbiorowość na 1 części dzielą zbiorowość na 1 części Q Dzielą zbiorowość na 4 części: Pierwszy kwartyl (Q1), taka wartość jednostki, która dzieli zbiorowość, tak, że 25% jednostek jest od niej mniejszych, 75% większych Drugi kwartyl (Q2), wartość jednostki, że 5% jednostek jest od niej mniejszych, 5% większych (mediana!) Trzeci kwartyl (Q3), taka wartość jednostki, że 75% jednostek jest od niej mniejszych, 25% większych min Q1 Q2 Q3 max 25% 5% 75% 8
9
Dzieci Podstawowe Średnie Wyższe 3 1 2 1 1 2 2 3 3 2 1 4 2 1 3 Podstawowe Średnie Wyższe Średnia 2 2 2 Mediana 3 2 1 Dominanta 2 4 Niezależnie od wykształcenia średnia liczba dzieci jest taka sama Im wyższe wykształcenie, tym badani mają mniej dzieci Im wyższe wykształcenie tym większa typowa (najczęściej występująca) liczba dzieci 1
d 7 Zarobki w zespole A 6 5 4 Odchylenie przeciętne (163zł) Średnia (45zł) 3 2 1 1 2 3 4 5 6 7 8 9 1 11 7 Zarobki w zespole B 6 5 4 Odchylenie przeciętne (56zł) Średnia (45zł) 3 2 1 1 2 3 4 5 6 7 8 9 1 11 d 18 16 14 12 1 8 6 4 15 1 12 14 Res. 1 Res. 2 Res. 3 Res. 4 Res. 5 Res. 6 Res. 7 Res. 8 N=8 x i Res. 1 15 Res. 2 1 Res. 3 12 Res. 4 14 Res. 5 16 Res. 6 8 Res. 7 15 Res. 8 6 Suma 96 Średnia 12 x i -x 3-2 2 4-4 3-6 16 x i -x 3 2 2 4 4 3 6 24 3 8 15 6 x=12 d=3 11
d Średnia arytmetyczna wartości bezwzględnych odchyleń (różnic) poszczególnych wartości cechy od średniej Odchylenie przeciętne jest miarą rozrzutu. Mówi o tym, o jaką wartość różnią się przeciętnie wartości cechy (zmiennej) od średniej. Im większa wartość odchylenia tym większe zróżnicowanie wartości zmiennej S 2 Średnia arytmetyczna kwadratów odchyleń (różnic) poszczególnych wartości cechy od średniej 12
S Odchylenie standardowe jest pierwiastkiem kwadratowym z wariancji S 7 6 5 4 3 2 1 Zarobki w zespole A Odchylenie standardowe (195zł) Odchylenie przeciętne (163zł) Średnia (45zł) 1 2 3 4 5 6 7 8 9 1 11 7 6 5 4 3 2 1 Zarobki w zespole B Odchylenie standardowe (76 zł) Odchylenie przeciętne (56zł) Średnia (45zł) 1 2 3 4 5 6 7 8 9 1 11 13
S Odchylenie standardowe jest miarą rozrzutu. Mówi o tym, jak wartości cechy (zmiennej) są rozrzucone wokół średniej. Im większa wartość odchylenia tym większe zróżnicowanie wartości zmiennej, im mniejsze odchylenie tym mniejsze zróżnicowanie Im mniejsza wartość odchylenia tym obserwacje są bardziej skupione wokół średniej, im większa wartość odchylenia tym obserwacje są bardziej oddalone od średniej 1 zł zł średnia Odchylenie od średniej Odchylenie standardowe 5 zł 5 zł średnia Odchylenie od średniej Odchylenie standardowe 28 14
S Rozkład temperatur latem Rozkład temperatur w ciągu roku Wzrost wśród pierwszaków Wzrost wśród studentów Oszczędności Kobiety: x=1zł, s=1zł Mężczyźni: x=15zł, s=1zł Wynik testu 1) x=6%, s=1% 2) x=6%, s=25% 1) x=5%, d=3% 2) x=5%, d=6% 1) x=6%, M=7% 2) x=6%, M=4% V S V S klasyczny współczynnik zmienności S - odchylenie standardowe x - średnia Klasyczny współczynnik zmienności informuje jaki procent średniej arytmetycznej stanowi odchylenie standardowe Wartość KWZ Zróżnicowanie cechy -2% Słabe 2-4% Umiarkowane 4-6% Silne Powyżej 6% Bardzo silne Silne lub bardzo silne zróżnicowanie cechy wskazuje, że zbiorowość jest niejednorodna, w takiej sytuacji średnia arytmetyczna jest niemiarodajną miarą ma małą wartość poznawczą. 15
7 6 5 4 3 2 1 Zarobki w zespole A Odchylenie standardowe (195zł) Średnia (45zł) Klasyczny współczynnik zmienności 48% 1 2 3 4 5 6 7 8 9 1 11 7 6 5 4 3 2 1 Zarobki w zespole B Odchylenie standardowe (76 zł) Średnia (45zł) Klasyczny współczynnik zmienności 19% 1 2 3 4 5 6 7 8 9 1 11 Reguła trzech sigm (odchyleń standardowych) mówi, że dla rozkładu normalnego: 68,3% wartości cechy leży w odległości jednego odchylenia standardowego od średniej arytmetycznej 95,5% wartości cechy leży w odległości dwóch odchyleń od średniej 99,7% wartości cechy leży w odległości trzech odchyleń standardowych od średniej arytmetycznej 16
średnia: µ= 1 odchylenie standardowe: =15 68,3% populacji ma iloraz inteligencji mieszczący się w przedziale 85-115 (1±15) 95,5% populacji ma iloraz inteligencji mieszczący się w przedziale 7-13 (1±2*15) 99,7% populacji ma iloraz inteligencji mieszczący się w przedziale 55-145 (1±3*15) średnia: µ= 4, odchylenie standardowe: =,3 68,3% studentów ma średnią z sesji mieszczącą się w przedziale 3,7-4,3 95,5% studentów ma średnią z sesji mieszczącą się w przedziale 3,4-4,6 99,7% studentów ma średnią z sesji mieszczącą się w przedziale 3,1-4,9 17