Statystyka opisowa PRZEDMIOT: PODSTAWY STATYSTYKI PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA
Statystyka opisowa = procedury statystyczne stosowane do opisu właściwości próby (rzadziej populacji) Pojęcia: statystyka, estymator = wartość w próbie, ozn. lierami greckimi, np. M parametr = wartość w populacji, ozn. literami łacińskimi, np. 2
Co obejmuje statystyka opisowa: Miary położenia (klasyczne i pozycyjne) określenie przeciętnego poziomu (miary tendencji centralnej) i rozmieszczenia wartości zmiennej Miary zmienności (rozproszenia, dyspersji) określenie granic obszaru zmienności wartości zmiennej Miary asymetrii i koncentracji określenie skupienia i spłaszczenia (w stosunku do krzywej normalnej) oraz stopnia odejścia od idealnej symetrii 3
Wstępna analiza danych: Rozkład liczebności rozkład zmiennej w próbie: wartość x częstość Jak to oceniamy? Tabele liczności i histogramy Pojedyncze wartości czy przedziały klasowe? To zależy od liczby różnych wartości, jakie przyjmuje zmienna, np.: Typ temperamentu a Iloraz inteligencji Prezentacja graficzna: histogramy, wieloboki liczebności. 4
LICZEBNOŚĆ Przykład 1. Przeprowadzono diagnozę typów temperamentu w grupie sportowców. Uzyskano następujące wyniki: CH, CH, CH, CH, CH, CH, CH, S, S, S, S, M, F (oznaczenia: CH = choleryk, S = sangwinik, M = melancholik, F = flegmatyk) 8 Typ temperamentu (x) Liczebność (f) % liczebności Choleryk 7 54 Sangwinik 4 31 Melancholik 1 8 Flegmatyk 1 8 7 6 5 4 3 2 1 0 CH S M F TYP TEMPERAMENTU histogram 5
Przykład 2. Przeprowadzono pomiar inteligencji wśród pracowników pewnej firmy. Uzyskano następujące wyniki: 134, 131, 129, 126, 125, 124, 123, 122, 122, 119, 118, 118, 117, 116, 115, 115, 114, 114, 113, 112, 112, 112, 111, 111, 111, 110, 109, 109, 108, 108, 108, 108, 107, 106, 106, 106, 106, 105, 105, 104, 104, 103, 103, 103, 102, 101, 100, 99, 98, 98, 96, 95, 93, 92, 87 IQ przedziały klasowe Liczebność % liczebności Liczebność skumulowana Skumulowany % liczebności 130-134 2 4 55 100 125-129 3 5 53 96 120-124 4 7 50 91 115-119 7 13 46 84 110-114 10 18 39 71 105-109 13 24 29 53 100-104 8 15 16 29 95-99 5 9 8 15 90-94 2 4 3 5 85-89 1 2 1 2 6
Zasady tworzenia przedziałów klasowych: przedziały powinny mieć taki rozmiar, by 10-20 przedziałów objęło całość wyników; wielkość przedziału powinna być równa: 1, 3, 5, 10 lub 20 pkt.; należy zaczynać przedział od wartości, która stanowi wielokrotność tego przedziału (np. 3 6 9 itd..; 5 10 15 itd.); przedziały trzeba uporządkować wg wielkości wyników, które zawierają; najwyżej powinny się znajdować wyniki największe (nie dotyczy to zmiennych nominalnych). 7
85-89 90-94 95-99 100-104 105-109 110-114 115-119 120-124 125-129 130-134 85-89 90-94 95-99 100-104 105-109 110-114 115-119 120-124 125-129 130-134 Liczebność Liczebność Ad. Przykład 2. 14 14 12 12 10 10 8 8 6 6 4 4 2 2 0 0 IQ (przedziały klasowe) IQ (przedziały klasowe) histogram wielobok liczebności 8
Miary tendencji centralnej Miary tendencji centralnej i pozycyjne miary położenia: modalna (dominanta, moda) Mo mediana Me średnia arytmetyczna M, X średnia arytmetyczna ważona Mw, Xw średnia geometryczna M g, X g średnia harmoniczna M h, X h kwantyle (kwartyle, decyle, percentyle) 9
Dobór miary tendencji centralnej do rodzaju zmiennej Która z miar tendencji centralnej będzie najbardziej adekwatna dla następujących zmiennych? a) Typy temperamentu wśród polityków pewnej partii b) Poziom asertywności uczniów klas I bydgoskich liceów, oceniany przez wychowawców na skali 0 5 (gdzie 0 oznacza minimalne nasilenie asertywności, zaś 5 nasilenie maksymalne) c) Oceny końcowe z poszczególnych przedmiotów wśród studentów psychologii I roku w semestrze zimowym d) Czas (w minutach) rozwiązywania zbioru zadań logicznych przez kandydatów do pracy w pewnej firmie z branży IT Miary tendencji centralnej 10
Miary tendencji centralnej Dobór miary tendencji centralnej do rodzaju zmiennej Miara tend. centralnej: Modalna Mediana Średnia arytm. Zmienna: Nominalna Porządk. Interwał. Ilorazowa + + + + + + + _ + + ale 11
Miary zmienności Miary zmienności (rozproszenia): rozstęp Ro wariancja Sx 2 odchylenie standardowe Sx, SD odchylenie przeciętne Op współczynnik zmienności V (stosujemy go, gdy chcemy porównać zmienność dwóch rozkładów) rozstęp kwartylowy 12
Miary zmienności Reguła trzech sigm (dla rozkładu normalnego lub zbliżonego do normalnego): 1 odchylenie standardowe 68,27% próby 2 odchylenia standardowe 95,45% próby 3 odchylenia standardowe 99,73% próby 68,27% 95,45% 99,73% 13
Miary zmienności Rozstęp kwartylowy określa długość tej części przedziału zmienności cechy, w której znajduje się 50% środkowych obserwacji Kwartyle są jednym z rodzajów kwantyli, tzn. wartości cech badanej zbiorowości, które dzielą tę zbiorowość na określone części pod względem liczby jednostek. Najczęściej stosuje się następujące kwantyle: kwartyle podział na 4 części decyle podział na 10 części percentyle (centyle) podział na 100 części 25 % wartości 25 % wartości 25 % wartości 25 % wartości Q 1 Mediana Q 3 Rozstęp kwartylowy 50% wartości Rozstęp (100% wartości) 14
Przykład 15
Miary asymetrii i koncentracji Asymetria (skośność) rozkładu - A Asymetrię można określić, porównując średnią, medianę i modalną: rozkład symetryczny: M = Me = Mo rozkład o asymetrii prawostronnej (prawoskośny): M > Me > Mo rozkład o asymetrii lewostronnej (lewoskośny): M < Me < Mo Współczynnik asymetrii (skośności) określa kierunek i siłę asymetrii Współczynnik asymetrii a typ rozkładu: rozkład symetryczny: A = 0 rozkład o asymetrii prawostronnej: A > 0 (dodatni) rozkład o asymetrii lewostronnej (lewoskośny): A < 0 (ujemny) Im większa wartość współczynnika asymetrii, tym większa skośność. Najczęściej współczynnik ten przyjmuje wartości z przedziału [-1; 1], lecz przy dużej asymetrii mogą to być wartości większe. 16
Miary asymetrii i koncentracji Koncentracja wartości zmiennej wokół średniej Kurtoza (K) najpopularniejsza miara koncentracji Im wyższa wartość kurtozy, tym bardziej wysmukły jest rozkład, tzn. tym większa koncentracja wartości zmiennej wokół średniej K > 0 K < 0 rozkład bardziej wysmukły rozkład bardziej spłaszczony 17
DZIĘKUJĘ ZA UWAGĘ