Podstawowe pojęcia Zbiorowość statystyczna zbiór jednostek (obserwacji) nie identycznych, ale stanowiących logiczną całość Zbiorowość (populacja) generalna skończony lub nieskończony zbiór jednostek, które zamierzamy poddać obserwacji Próba część (podzbiór) zbiorowości generalnej, która jest badana pod względem ustalonej cechy Próba losowa próba do której losowo wybrano jednostki Cecha badana właściwość jednostek zbiorowości, która może służyć do odróżnienia poszczególnych obserwacji Własności próby Ma określoną liczebność () Jednorodność należy do zbiorowości generalnej Reprezentatywność względem zbiorowości generalnej Cechy statystyczne dzielimy na Jakościowe opisują jakości elementów zbiorowości, np. kolor oczu, wykształcenie, marka samochodu Ilościowe wartości liczbowe - skokowe wartości są oddalone od siebie, np. liczba dzieci w rodzinie, - ciągłe wartości są w przedziale liczbowym, np. wzrost człowieka
Opis próby - statystyka opisowa Uporządkowanie próby i prezentacja graficzna Parametry próby Porównania prób pod względem poziomu, zmienności i skośności Cecha jakościowa Cecha jakościowa
Cecha jakościowa 5 3 6 6 0,5 0,35 0,875 0,375 Cecha jakościowa Cecha jakościowa - umaszczenie umaszczenie liczba psów % psów n i w i czarne 8 3, biszkoptowe 3 55,4 czekoladowe 7,5 RAZEM 56 00,0 czarne biszkoptowe czekoladowe 3
Cecha ilościowa skokowa wielkość miotu 4 6 8 7 9 7 6 8 5 7 5 7 9 8 0 8 7 9 6 8 5 9 6 7 5 8 8 7 6 7 6 0 7 8 6 9 9 8 7 8 Uporządkowanie cechy ilościowej skokowej 4 5 5 5 5 6 6 6 6 6 6 6 7 7 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 8 8 8 9 9 9 9 9 9 0 0 Cecha ilościowa skokowa szereg rozdzielczy punktowy x i n i w i 4 0,05 5 4 0,00 6 7 0,75 7 0 0,50 8 0 0,50 9 6 0,50 0 0,050 razem 40 0 8 6 4 0 4 5 6 7 8 9 0 4
Średnia arytmetyczna (ważona) x i n i w i 4 0,05 5 4 0,00 6 7 0,75 7 0 0,50 8 0 0,50 9 6 0,50 0 0,050 razem 40 k x i n i i (4 5 4 6 7 7 0 80 9 6 0 ) 40 (4 40 0 4 70 80 54 0) 90 7,5 40 Cecha ilościowa parametry Dzielimy na parametry: Poziomu (tendencji centralnej) Zmienności (zróżnicowania, dyspersji) Asymetrii (skośności) Kurtozy (kształtu) Koncentracji Oraz dzielimy na Klasyczne Pozycyjne Cecha ilościowa - parametry Średnia arytmetyczna j x j ( x x... x 4 6 8 7 9 7 6 8 5 7 5 7 9 8 0 8 7 9 6 8 5 9 6 7 5 8 8 7 6 7 6 0 7 8 6 9 9 8 7 8 ) (4 40 6 8... 7 8) 90 7,5 40 5
Średnia - własności Średnia arytmetyczna 4 7 5 odchylenie - - 4 0 5 7 3 Kwantyle w tym mediana wartość środkowa Me=7 4 5 6 7 8 9 0 6 6 6 3 36 Q =6 Q 3 =8 Dominanta wartość modalna, występującą najczęściej 0 8 6 4 D=7? D=8? 0 4 5 6 7 8 9 0 6
Rozstęp i odchylenie ćwiartkowe RS = x max x min Q x = 0,5 x (Q 3 - Q ) Wariancja i odchylenie standardowe S j ( x) j j j j j S S S 39 (4 7,5)... (8 7,5) 8,5, 09 39 S =,445 Wskaźnik (współczynnik) zmienności służy do porównań zróżnicowania w zbiorowościach S x V 00% x,445 V 0,993 7,5 7
Współczynnik asymetrii (skośności) ocenia asymetrię rozkładu próby A j ( x S 3 j x ) 3 ( D) A" S A=-0,303 Porównania prób średnia 7,8 867,8 odch.st. 4 4 V 0,5 0,005 Porównania prób średnia 7,8 867,8 odch.st. 4 95, V 0,5 0,5 8
Porównania prób średnia 7,50 5,0 odch.st.,446 4,60 V 0,99 0,84 A -0,30 0,650 x i p i 0, Rozkład wartości cechy 5 0,46 7 0,3 suma x i w i (p i ) 0,3 Rozkład wartości cechy 4 0,5 7 0, 0 0, 9
Wariancja x i n i w i 6 0,3 4 0 0,5 7 0, 0 0, suma 0 Cecha ilościowa ciągła wydajność dzienna 4 7 4 4 6 8 6 8 8 0 306 4 4 6 9 6 8 8 00 6 4 6 9 6 4 8 9 0 6 45 6 5 6 4 8 9 0 0 3 4 6 5 6 4 8 8 5 4 9 4 6 4 6 4 8 8 30 4 6 4 4 4 6 0 4 4 9 0 4 3 8 4 8 0 4 3 8 8 6 8 6 6 0 8 6 0 8 6 8 6 4 0 0 4 8 6 8 6 8 0 0 6 8 0 30 0 8 8 8 4 8 8 0 6 8 8 7 8 6 8 0 6 8 6 Wykres rozrzutu Cecha ilościowa ciągła wydajność dzienna Wartości uporządkowane 0
Cecha ilościowa ciągła szereg rozdzielczy przedziałowy (x 0i ; x i > n i w i ( ; 6> 54 0,3553 ( 6;> 5 0,3355 (;6> 5 0,645 (6;> 4 0,09 (;6> 6 0,0395 (6;3> 0,03 Razem 5 Histogram Tworzenie przedziałowego szeregu rozdzielczego Liczba przedziałów (górna granica): k=+3 x log Rozpiętość przedziału: (x max -x min )/k k 0 4,90 40 5,8 60 6,33 80 6,7 00 7,00 0 7,4 40 7,44 60 7,6 80 7,77 00 7,90 Rozpiętość przedziału:,64 x Q x x -/3 Qx=5 Qx=0 0 4,86 9,45 40 3,86 5,44 60 3,37 3,49 80 3,06,5 00,84,38 0,68 0,70 40,54 0,7 60,43 9,73 80,34 9,35 00,6 9,03 Q Q 3 Średnia arytmetyczna j x j ( x... x ) (4 6... 5 ) 506 9,9079 5 5
(x 0 ;x ) n i (0;> 4 (;4> (4;6> 7 (6;8> 9 (8;0> 46 (0;> 36 (;4> 30 (4;6> 6 (6;8> 9 (8;0> Średnia ( 4 3 57 7 9 9 46 00 36 330 56 79 9 ) (4 33 85 03 44 396 390 40 53 38) 00 956 9,78 00 Średnia arytmetyczna przedziałowy szereg rozdzielczy o (x 0i ; x i > x i n i w i ( ; 6> 3,5 54 0,3553 ( 6;> 8,5 5 0,3355 (;6> 3,5 5 0,645 (6;> 8,5 4 0,09 (;6> 3,5 6 0,0395 (6;3> 8,5 0,03 Razem 5 k o i 5 x i n i 506 9,9079 5 (89 433,5 337,5 59 4 57) 5 (3,5 54 8,5 53,5 5 8,5 4 3,5 6 8,5 ) 5 47 9,337 Kwantyle w tym mediana wartość środkowa Me=8
(x 0i ; x i > n i ( ; 6> 54 ( 6;> 5 (;6> 5 (6;> 4 (;6> 6 (6;3> Razem 5 Kwantyle Me x Me0 n Me Me ni h 76 54 Me 6 5 6 5 6,57 8,57 5 5 Me (x 0 ;x ) n i (0;> 4 (;4> (4;6> 7 (6;8> 9 (8;0> 46 (0;> 36 (;4> 30 (4;6> 6 (6;8> 9 (8;0> Kwantyle 00 6 39 Me 8 8 8,696 9,696 46 46 (x 0i ; x i > n i ( ; 6> 54 ( 6;> 5 (;6> 5 (6;> 4 (;6> 6 (6;3> Razem 5 Dominanta D x D0 n n D D ( nd nd ) ( nd nd h ) D 54 0 54 D 5 5 4,737 5,737 (54 0) (54 5) 57 3
(x 0 ;x ) n i (0;> 4 (;4> (4;6> 7 (6;8> 9 (8;0> 46 (0;> 36 (;4> 30 (4;6> 6 (6;8> 9 (8;0> Dominanta D x D0 n n D D ( nd nd ) ( nd nd h ) 46 9 7 D 8 8 8,6 9,6 (46 9) (46 36) 7 D Wariancja przedziałowy szereg rozdzielczy (x 0i ; x i > o x i n i w i ( ; 6> 3,5 54 0,3553 ( 6;> 8,5 5 0,3355 (;6> 3,5 5 0,645 (6;> 8,5 4 0,09 (;6> 3,5 6 0,0395 (6;3> 8,5 0,03 Razem 5 9,337 {(3,5 54 8,5 53,5 5 8,5 4 3,5 6 8,5 ) 47 } 5 5 {(66,5 3684,75 4556,5 479,5 333,5 64,5) 309,796} 5 35,9086 Przy użyciu danych wyjściowych S =36,0709 S = 6,0059 Wskaźnik (współczynnik) zmienności służy do porównań zróżnicowania w zbiorowościach S x V 00% x 6,0059 V 0,606 9,9079 4
Współczynnik asymetrii (skośności) ocenia asymetrię rozkładu próby A j ( x S 3 j x ) 3 ( D) A" S A =,7 A = 0,6945 Przedział typowej zmienności S; S Czy liczba 0 jest typowa? średnia 7,50 9,908 odch.st.,446 6,006 7,5,446 ; 7,5,446 5,804 ; 8,696 9,908 6,006;9,908 6,006 3,90 ;5,94 Przykład Uszeregować według poziomu cechy i wielkości zmienności trzy próby o podanych parametrach parametr Próba I Próba II Próba III średnia 4, 3,9 4,5 odch.st. 0,5 0,46 0,5 V 6,%,8%,3 5