Próba własności i parametry
Podstawowe pojęcia Zbiorowość statystyczna zbiór jednostek (obserwacji) nie identycznych, ale stanowiących logiczną całość Zbiorowość (populacja) generalna skończony lub nieskończony zbiór jednostek, które zamierzamy poddać obserwacji Próba część (podzbiór) zbiorowości generalnej, która jest badana pod względem ustalonej cechy Próba losowa losowo wybrane jednostki Cecha badana właściwość jednostek zbiorowości, która może służyć do odróżnienia poszczególnych obserwacji
Własności próby Ma określoną liczebność (n) Jednorodność należy do populacji generalnej Reprezentatywność względem populacji generalnej
Cechy statystyczne dzielimy na Jakościowe opisują jakości elementów zbiorowości, np. kolor oczu, wykształcenie, marka samochodu Ilościowe wartości liczbowe - skokowe wartości są oddalone od siebie, np. liczba dzieci w rodzinie, - ciągłe wartości są w przedziale liczbowym, np. wzrost człowieka
Opis próby - statystyka opisowa Uporządkowanie próby Prezentacja graficzna Parametry próby Porównania prób pod względem poziomu, zmienności i skośności
Cecha jakościowa - umaszczenie umaszczenie liczba psów % psów n i w i czarne 8 3, biszkoptowe 3 55,4 czekoladowe 7,5 RAZEM 56 00,0 czarne biszkoptowe czekoladowe
Przykłady zastosowań Żródło: Instytut Spraw Publicznych
Cecha ilościowa skokowa wielkość miotu 4 6 8 7 9 7 6 8 5 7 5 7 9 8 0 8 7 9 6 8 5 9 6 7 5 8 8 7 6 7 6 0 7 8 6 9 9 8 7 8
Uporządkowanie cechy ilościowej skokowej 4 5 5 5 5 6 6 6 6 6 6 6 7 7 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 8 8 8 9 9 9 9 9 9 0 0
Cecha ilościowa skokowa szereg rozdzielczy punktowy i n i w i 4 0,05 5 4 0,00 6 7 0,75 7 0 0,50 8 0 0,50 9 6 0,50 0 0,050 razem 40
Cecha ilościowa ciągła wydajność dzienna 4 7 4 4 6 8 6 8 8 0 306 4 4 6 9 6 8 8 0 0 6 4 6 9 6 4 8 9 0 6 4 5 6 5 6 4 8 9 0 0 3 4 6 5 6 4 8 8 5 4 9 4 6 4 6 4 8 8 30 4 6 4 4 4 6 0 4 4 9 0 4 3 8 4 8 0 4 3 8 8 6 8 6 6 0 8 6 0 8 6 8 6 4 0 0 4 8 6 8 6 8 0 0 6 8 0 30 0 8 8 8 4 8 8 0 6 8 8 7 8 6 8 0 6 8 6 Wykres rozrzutu
Cecha ilościowa ciągła wydajność dzienna Wartości uporządkowane
Cecha ilościowa ciągła szereg rozdzielczy przedziałowy ( 0i ; i > n i w i < ; 6> 54 0,3553 ( 6;> 5 0,3355 (;6> 5 0,645 (6;> 4 0,09 (;6> 6 0,0395 (6;3> 0,03 Razem 5 Histogram
Tworzenie przedziałowego szeregu rozdzielczego Liczba przedziałów (górna granica): k=+3,3log lub k 5log Rozpiętość przedziału: ( ma - min )/k k 0 5,3 40 6,3 60 6,9 80 7,3 00 7,6 0 7,9 40 8, 60 8,3 80 8,5 00 8,6 0 8,8 40 8,9 60 9,0
Cecha ilościowa - parametry Dzielimy na parametry: Poziomu (tendencji centralnej) Zmienności (zróżnicowania, dyspersji) Asymetrii (skośności) Kurtozy (kształtu) Koncentracji Oraz dzielimy na: Klasyczne Pozycyjne
Średnia arytmetyczna j j (... ) 4 6 8 7 9 7 6 8 5 7 5 7 9 8 0 8 7 9 6 8 5 9 6 7 5 8 8 7 6 7 6 0 7 8 6 9 9 8 7 8 40 (4 6 8... 7 8) 40 90 7,5 5 (4 6... 5 ) 5 506 9,9079
Średnia arytmetyczna (ważona) i n i w i 4 0,05 5 4 0,00 6 7 0,75 7 0 0,50 8 0 0,50 9 6 0,50 0 0,050 razem 40 k i i n i (4 5 4 67 70 80 96 0 ) 40 (4 0 4 70 80 54 0) 90 7,5 40 40
Średnia arytmetyczna przedziałowy szereg o rozdzielczy 5 506 9,9079 ( 0i ; i > i n i w i ( ; 6> 3,5 54 0,3553 ( 6;> 8,5 5 0,3355 (;6> 3,5 5 0,645 (6;> 8,5 4 0,09 (;6> 3,5 6 0,0395 (6;3> 8,5 0,03 Razem 5 k i i n i o (3,5 54 8,5 53,5 5 8,5 4 3,5 6 8,5 ) 5 (89 433,5 337,5 59 4 57) 47 9,337 5 5
Kwantyle w tym mediana wartość środkowa Me=7 Me=8
( 0i ; i > n i ( ; 6> 54 ( 6;> 5 (;6> 5 (6;> 4 (;6> 6 (6;3> Razem 5 Mediana Me Me0 n Me Me n i h 76 54 Me 6 5 6 5 6,57 8,57 5 5 Me
( 0 ; ) n i (0;> 4 (;4> (4;6> 7 (6;8> 9 (8;0> 46 (0;> 36 (;4> 30 (4;6> 6 (6;8> 9 (8;0> Mediana 00 6 39 Me 8 8 8,696 9,696 46 46
Dominanta wartość modalna, występująca najczęściej D=7? D=8 D=8??
Dominanta ( 0i ; i > n i ( ; 6> 54 ( 6;> 5 (;6> 5 (6;> 4 (;6> 6 D D0 n n D D ( nd nd ) ( nd nd h ) D (6;3> Razem 5 54 0 54 D 5 5 4,737 (54 0) (54 5) 57 5,737
( 0 ; ) n i (0;> 4 (;4> (4;6> 7 (6;8> 9 (8;0> 46 (0;> 36 (;4> 30 (4;6> 6 (6;8> 9 (8;0> Dominanta D D0 n n D D ( nd nd ) ( nd nd h ) 46 9 7 D 8 8 8,6 9,6 (46 9) (46 36) 7 D
Wariancja i odchylenie standardowe S j j j j j j ) ( 09, 8,5 39 7,5) (8... 7,5) (4 39 S S S S =,445 S =36,0709 S = 6,0059
Wariancja i odchylenie standardowe S k i n i ( i ) i n i w i 4 0,05 5 4 0,00 6 7 0,75 7 0 0,50 8 0 0,50 9 6 0,50 0 0,050 razem 40 S 39 (4 7,5) 4(5 7,5) 7(6 7,5) 0(8 7,5) 6(9 7,5) (0 7,5) 8,5, 09 39 0(7 7,5)
Przedział typowej zmienności S; S Czy liczba 0 jest typowa? średnia 7,50 9,908 odch.st.,446 6,006 7,5,446;7,5,446 5,804;8,696 9,908 6,006;9,908 6,006 3,90;5,94
Wskaźnik (współczynnik) zmienności służy do porównań zróżnicowania w zbiorowościach V S 00% V,445 7,5 9,93% V 6,0059 9,9079 60,6%
Współczynnik asymetrii (skośności) ocenia asymetrię rozkładu próby A j ( S j 3 ) 3 A" ( S D) A =,7 A=-0,303 A = 0,69
Jeśli chodzi o wynagrodzenia Polaków to o ile średnia osiągnęła w 0 r. (w firmach zatrudniających powyżej 9 osób) poziom 3895,7 zł brutto, czyli,78 tys. zł na rękę, o tyle mediana zarobków Polaków, która wyznacza precyzyjną granicę między bogatszą a biedniejszą połową społeczeństwa, wyniosła wówczas 35, zł brutto (, tys. zł na rękę). ajczęściej spotykanym w polskiej gospodarce AD 0 wynagrodzeniem (w języku statystyki dominantą) było zaś 89, zł brutto czyli niecałe 600 na rękę. A" ( D) S
( ) do najbiedniejszych 0 proc. pracowników kwalifikowały w 0 r. zarobki poniżej,6 tys. zł brutto (pensja minimalna wynosiła wówczas,5 tys. zł brutto). ajzamożniejsze 0 proc. zaczynało się zaś od poziomu 6,5 tys. (4,6 tys. na rękę). Więcej niż 0 tys. zł. brutto miesięcznie zarabiało już tylko 3,47 proc. zatrudnionych. Jakie to kwantyle?
Współczynnik kurtozy (kształtu) ocenia kształt wykresu rozkładu próby K j ( S 4 j ) 4 3 K =,044 K=-0,47
Kurtoza przyjmuje wartości dodatnie (K>0) jeśli wartości rozkładu skupione są wokół średniej, a mało jest wartości skrajnych (bardzo niskich lub bardzo wysokich). Jeśli w zbiorze jest dużo skrajnych wartości, znacznie oddalonych od średniej kurtoza przyjmuje wartości ujemne (K<0). Kurtoza rozkładu normalnego wynosi 0. Statystykaopisowa.com
Porównania prób średnia 7,50 9,908 odch.st.,446 6,006 V 0,99 0,606 A -0,30,7 W -0,47,044
Współczynnik koncentracji Współczynnik koncentracji to proporcja pola pomiędzy linią równomiernego podziału i krzywą koncentracji Lorenza (opisuje stopień koncentracji/ nierównomierności podziału globalnego zasobu cechy)
Współczynnik koncentracji grupa dochodu częstość empiryczna kumulowana częstość liczba wartość osób zarobków osób zarobków osób zarobków do 5 tys. 34 800 0,468 0,057 0,468 0,057 od 5 do 0 tys. 56 800 0,3 0,8 0,780 0,84 0 do 00 tys 59 3800 0,8 0,70 0,898 0,454 00 do 00 tys. 35 3700 0,070 0,6 0,968 0,76 powyżej 00 tys. 6 4000 0,03 0,84 500 400 Pole trójkąta: 0,5 0,468 0,057=0,033 Pole trapezu. 0,5 (0,057+0,84) 0,3=0,0376 Pole trapezu. 0,5 (0,84+0,454) 0,8=0,0377 Pole trapezu 3. 0,5 (0,454+0,76) 0,070=0,040 Pole trapezu 4. 0,5 (0,76+) 0,03=0,075 0,033 0,0376 0,0377 0,040 0,075 K 0,5 0,57 0,5 0,34
Przykład Uszeregować według poziomu cechy i wielkości zmienności trzy próby o podanych parametrach parametr Próba I Próba II Próba III średnia 4, 3,9 4,5 odch.st. 0,5 0,46 0,5 V 6,%,8%,3
Przykłady I 4 4 4 6 3 3 6 3 0 4 6 8 4 4 4 4 6 4 6 3 3 7 3 7 4 3 4 5 5 6 0 3 3 II 3,3 4, 5,7 3, 3,7 3, 3,5 3,4 5, 5,9 3,9 4,,6 4, 5,7 4,3 5,8 4, 5,6 3, 4,,9 4,8 4,4 3, 5,8 3, 3,6 4,7 4,8 4,8 5, 3, 5,7 5,4 5, 4, 3, 4, 5, j j (... ) 4,3 4, 3
S j j j j j j ) ( S S 4,369 S 947 S 0,,09 S 97 0, S
i n i w i 0,05 6 0,5 3 9 0,5 4 0,75 5 0,05 6 6 0,5 7 0,05 8 0,05 0 0,05 razem 40 ( 0i ; i > i n i w i,60-3,5,875 5 0,5 3,5-3,70 3,45 9 0,5 3,70-4,5 3,975 8 0, 4,5-4,80 4,55 6 0,5 4,80-5,35 5,075 4 0, 5,35-5,90 5,65 8 0, razem 40 k i i n i k o i i n i 4,3 4,4
) ( k i i i n S ) ( k i i i n S o 0,94 S,09 S 4,369 S 884 S 0,
i n i w i F( i ) 0,05 0,05 6 0,5 0,75 3 9 0,5 0,4 4 0,75 0,675 5 0,05 0,75 6 6 0,5 0,875 7 0,05 0,95 8 0,05 0,95 0 0,05 suma 40 Me=? D=? V=? A =?
i n i w i F( i ) 0,05 0,05 6 0,5 0,75 3 9 0,5 0,4 4 0,75 0,675 5 0,05 0,75 6 6 0,5 0,875 7 0,05 0,95 8 0,05 0,95 0 0,05 suma 40 V,09 4,3 *00% 4,3 4 A,09 0,435 48,6% Me=4 D=4
( 0i ; i > i n i w i F( i ),60-3,5,875 5 0,5 0,5 3,5-3,70 3,45 9 0,5 0,35 3,70-4,5 3,975 8 0, 0,55 4,5-4,80 4,55 6 0,5 0,7 4,80-5,35 5,075 4 0, 0,8 5,35-5,90 5,65 8 0, razem 40 Me=? D=? V=?