Analza struktury zborowośc statystycznej.analza tendencj centralnej. Średne klasyczne Średna arytmetyczna jest parametrem abstrakcyjnym. Wyraża przecętny pozom badanej zmennej (cechy) w populacj generalnej: Tablca. Welkość a) szereg szczegółowy Przykład. ogródka dzałkowego [ar] -ta wartość zmennej (wartość zmennej, którą ma -ta jednostka statystyczna), lczebność populacj generalnej. W tablcy. zameszczono szereg szczegółowy obrazujący powerzchnę ogródków dzałkowych spółdzeln Pod mastem wg stanu pod konec 009 r. Oblcz przecętną powerzchnę ogródka w tej spółdzeln.,,7 3, 3 4,4 4 5,0 5 5,7 6 6,3 7 6,3 8 6,4 9 7,8 0 7,9 8, 8, 3 9,0 4 0,3 5,4 6,5 7,8 8 3,0 9 Macej Stępńsk 3,5 0 Razem 55,6 b) szereg rozdzelczy oparty na cesze zmennej skokowej k -ta wartość badanej zmennej, n (średna arytmetyczna ważona) n częstość, z jaką występuje -ta wartość zmennej, Przykład. Korzystając z szeregu rozdzelczego dotyczącego lczby osób zameszkujących w wynajmowanych meszkanach oblcz średną lczbę meszkańców na jeden wynajmowany lokal (tablca 3. z tematu Etapy badana statystycznego ) zameszkują cych osób Tablca. meszkań n k lczba wartośc (warantów) badanej zmennej (cechy), 0 3 0 lczebność populacj generalnej. 3 6 3 6 8 4 4 6 5 4 0 6 3 8 7 7 8 6 9 9 0 0 Razem 30 33 Macej Stępńsk *n
c) szereg rozdzelczy oparty na cesze cągłej lub nny szereg posadający przedzały klasowe k Przykład.3 ' n Korzystając z szeregu rozdzelczego dotyczącego powerzchn wynajmowanych meszkań oblcz średną powerzchnę lokalu (tablca 3. z tematu Etapy badana statystycznego) Tablca.3 środek -tego przedzału klasowego, Powerzchna meszkana n lczebność -tego przedzału klasowego, [m meszkań ] n mn ma k lczba przedzałów klasowych, - ' *n lczebność populacj generalnej. 30-40 6 35 0 40-50 7 45 35 Suma odchyleń wartośc zmennej od średnej arytmetycznej jest równa zero, czyl odchylena te wzajemne sę znoszą: 50-60 60-70 70-80 5 3 5 55 65 75 75 95 375 80-90 85 70 ( ) 0 90-00 95 90 Razem 30 730 Suma wartośc zmennej wszystkch jednostek zborowośc statystycznej jest równa loczynow średnej arytmetycznej lczebnośc populacj. Średną arytmetyczną zawsze można oblczyć dla szeregu szczegółowego. W przypadku szeregów rozdzelczych muszą to być szereg o zamknętych przedzałach klasowych. Macej Stępńsk 3 Średna geometryczna G naczej G -ta wartość badanej zmennej, lczebność populacj generalnej. 3 K Średną geometryczną stosuje sę, gdy występują względne duże różnce pomędzy wartoścam zmennej.. Średne pozycyjne Średne pozycyjne, to take średne, których wartość wynka z pozycj, którą zajmują w uporządkowanym szeregu statystycznym. Medana Medana jest wartoścą zmennej, którą w uporządkowanym szeregu statystycznym posada środkowa jednostka. mn Me ma 50% 50% Wartość medany nterpretuje sę tak, że połowa jednostek badanej zborowośc ma wartośc zmennej ne wększe od medany, a druga połowa ne mnejsze. Macej Stępńsk 4
a) szereg szczegółowy M M e e + + + gdy lczebność populacj generalnej jest lczbą neparzystą, gdy lczebność populacj generalnej jest lczbą parzystą. b) szereg rozdzelczy oparty na cesze skokowej Medanę wyznacza sę na podstawe lczebnośc kumulacyjnej. Medana jest tą wartoścą zmennej, której lczebność kumulacyjna obejmuje jednostkę o numerze ; c) szereg rozdzelczy z przedzałam klasowym Wartość medany szacuje sę na podstawe wzoru nterpolacyjnego, po uprzednm zbudowanu lczebnośc kumulacyjnej: ncum Me 0 + c0 n0 0 dolna granca przedzału, w którym znajduje sę medana, n 0 prosta lczebność przedzału medany, c 0 rozpętość przedzału medany, n cum- lczebność kumulacyjna przedzału poprzedzającego przedzał medany. Macej Stępńsk 5 Przedzał medany to ten, którego lczebność kumulacyjna obejmuje jednostkę o numerze. Medanę można oblczać zarówno dla szeregów rozdzelczych o zamknętych, jak otwartych przedzałach klasowych. Zabeg tak ne jest możlwy jedyne w przypadku skrajne asymetrycznych rozkładów. Kwartyl perwszy Kwartyl perwszy jest wartoścą zmennej, którą w uporządkowanym szeregu statystycznym posada jednostka zajmująca pozycję. 4 Kwartyl perwszy wyznacza sę analogczne do medany. W zwązku z tym, że materał statystyczny prezentowany jest najczęścej w postac szeregów o zamknętych przedzałach klasowych, podane formuł oblczenowych ogranczone tu zostane jedyne do takego właśne przypadku. Stosuje sę następujący wzór nterpolacyjny: 4 ncum Q 0 + c0 n0 0 dolna granca przedzału, w którym znajduje sę kwartyl perwszy, n 0 prosta lczebność przedzału kwartyla perwszego, c 0 rozpętość przedzału kwartyla perwszego, n cum- lczebność kumulacyjna przedzału poprzedzającego przedzał kwartyla perwszego. Przedzał kwartyla perwszego to przedzał, którego lczebność kumulacyjna obejmuje jednostkę o numerze 4. Kwartyl perwszy dostarcza nformacj, że 5% jednostek badanej zborowośc statystycznej ma wartośc zmennej ne wększe od kwartyla perwszego, a 75% - ne mnejsze. Macej Stępńsk 6 3
Kwartyl trzec Kwartyl trzec jest wartoścą zmennej, którą w uporządkowanym szeregu statystycznym posada 3 jednostka zajmująca pozycję. 4 Wzór nterpolacyjny dla szeregu rozdzelczego z przedzałam klasowym ma postać: 3 4 ncum Q3 0 + c0 n0 0 dolna granca przedzału, w którym znajduje sę kwartyl trzec, n 0 prosta lczebność przedzału kwartyla trzecego, c 0 rozpętość przedzału kwartyla trzecego, n cum- lczebność kumulacyjna przedzału poprzedzającego przedzał kwartyla trzecego. 3 Przedzał kwartyla trzecego to przedzał, którego lczebność kumulacyjna obejmuje jednostkę o numerze. 4 Kwartyl trzec dostarcza nformacj, że 75% jednostek badanej zborowośc statystycznej ma wartośc zmennej ne wększe od kwartyla trzecego, a 5% - ne mnejsze. Z obrazu grafcznego przedstawającego położene kwartyl w ramach przedzału zmennośc badanej zmennej wynka, że połowa jednostek zborowośc statystycznej przyjmuje wartośc od Q do Q 3 mn Q Q 3 ma 50% Macej Stępńsk 7 Decyl -ty Jeżel populacje generalne są bardzo lczne /lub chcemy dowedzeć węcej na temat rozkładu w skrajnych regonach obszaru zmennośc badanej cechy, wówczas wyróżnene kwartyl może okazać sę newystarczające. Stosuje sę wówczas decyle, które dzelą zborowość na subpopulacje dzesęcoprocentowe. W tym celu posługuje sę wzorem nterpolacyjnym (dla szeregów z przedzałam klasowym): 0 ncum D 0 + c0 Dla,,.,9 n0 0 dolna granca przedzału, w którym znajduje sę -ty decyl, n 0 prosta lczebność przedzału -tego decyla, c 0 rozpętość przedzału -tego decyla, n cum- lczebność kumulacyjna przedzału poprzedzającego przedzał -tego decyla. W analogczny sposób konstruuje sę wzór przeprowadza oblczena w przypadku centyl, z tą różncą, że wówczas dochodz do podzału zborowośc generalnej na 00 subpopulacj. Macej Stępńsk 8 4
Domnanta/Modalna Domnanta, zwana równeż modalną, jest tą wartoścą zmennej, która w badanej populacj generalnej występuje z najwększą częstoścą. W przypadku szeregów rozdzelczych z przedzałam klasowym, wartość domnanty szacujemy na podstawe wzoru nterpolacyjnego. Jest ona wtedy wartoścą abstrakcyjną, charakteryzującą rozkład. n0 n D 0 + c n n + n n ( ) ( ) 0 0 0 + 0 dolna granca przedzału domnanty; n 0 lczebność przedzału domnanty; n - lczebność przedzału poprzedzającego przedzał domnanty; n + lczebność przedzału następującego po przedzale domnanty; c 0 rozpętość przedzału medany. Przedzał domnanty to ten, który ma maksymalną lczebność prostą. Domnantę można oblczać tylko dla szeregów rozdzelczych o tej samej rozpętośc przedzałów. W nnych przypadkach oblczane domnanty jest bardzej skomplkowane wymaga spełnena dodatkowych warunków. Szereg może być natomast szeregem o otwartych przedzałach klasowych. Jak okaże sę podczas analzy asymetr, wzajemne położene mar średnch może być równe (DMe ). ajczęścej jednak występuje sytuacja, w której D>Me> albo D<Me<. Macej Stępńsk 9. Analza rozproszena czyl dyspersj Analza rozproszena pozwala odpowedzeć na pytane, w jakm stopnu jednostk zborowośc statystycznej są zróżncowane pod względem wartośc badanej zmennej, czyl jak kształtuje sę podobeństwo jednostek lub ch rozproszene..odchylene standardowe Odchylene standardowe jest parametrem, który nformuje, o le, średno rzecz borąc, wartośc zmennej odchylają sę n plus lub n mnus od średnej arytmetycznej. Odchylene standardowe oznacza sę symbolem σ (σ to warancja). a) szereg szczegółowy σ ( ) -ta wartość zmennej,,,, ; σ średna arytmetyczna; lczebność populacj generalnej. b) szereg rozdzelczy oparty na cesze skokowej k ( ) n -ta wartość zmennej,,,, k; n częstość, z jaką występuje -ta wartość zmennej; k lczba wartośc badanej zmennej. Macej Stępńsk 0 5
σ c) szereg rozdzelczy z przedzałam klasowym k ( ' ) n środek -tego przedzału klasowego,,,, k; n lczebność -tego przedzału klasowego; k lczebność przedzałów klasowych. Podobne jak w przypadku średnej arytmetycznej, odchylene standardowe dla szeregów rozdzelczych z przedzałam kasowym możemy oblczyć tylko w przypadku, gdy wszystke przedzały klasowe są zamknęte. Gdy rozkład badanej zmennej jest normalny, jej funkcja gęstośc ma postać: f ( ) σ ( ) e (rysunek na tablcy) σ π Można wówczas wyznaczyć tzw. typowy obszar zmennośc: ( σ +σ ) TYP ; Obszar ten zajmuje 68,6% jednostek badanej zborowośc. Oznacza to, że 68,6% jednostek zborowośc generalnej przyjmuje wartośc z typowego obszaru. Macej Stępńsk. Odchylene ćwartkowe. Jeżel z przyczyn formalnych ne możemy oblczyć odchylena standardowego (szereg o otwartych przedzałach klasowych), to marą rozproszena staje sę odchylene ćwartkowe (Q). Q 3 Q Q Q kwartyl perwszy, Q 3 kwartyl trzec. Odchylene ćwartkowe nformuje, jak duża jest połowa obszaru zmennośc środkowych 50% jednostek zborowośc statystycznej. Można też powedzeć, że odchylene to nformuje, jake jest przecętne odchylene od medany..3 Współczynnk zmennośc Odchylene standardowe odchylene ćwartkowe to bezwzględne mary dyspersj. Wyrażane są one w tych samych jednostkach, w których wyrażana jest badana zmenna. Stosuje sę równeż względne mary dyspersj. Służą one ocene ntensywnośc rozproszena, a także celow porównywana dwóch lub węcej zborowośc. To współczynnk zmennośc (V Z ). Dla mar klasycznych, współczynnk zmennośc ma postać: σ σ V Z najczęścej wyraża sę go w procentach V Z 00% Współczynnk zmennośc nformuje, jaką częścą średnej arytmetycznej jest odchylene standardowe. Im mnejsza wartość parametru, tym wartośc zmennej są bardzej do sebe podobne zblżone do wartośc średnej. Macej Stępńsk 6
Jeżel ne można wyznaczyć parametrów klasycznych, dysponujemy natomast średnm pozycyjnym, wówczas wzór ma postać: V Z Q M ( 00% ) e Informuje on, jaką częścą medany jest odchylene ćwartkowe. ska wartość współczynnka nformuje o dużym skupenu wartośc zmennej wokół medany. ależy jednak pamętać, że mara ta odnos sę jedyne do środkowej połowy jednostek badanej zborowośc. 3. Analza asymetr Analza asymetr zmerza do udzelena odpowedz na pytane, czy w badanej zborowośc przeważają jednostk, których wartośc zmennej są mnejsze od średnej, czy jednostk przyjmujące wartośc zmennej wększe od średnej. Badane może równeż wykazać równowagę, czyl symetrę rozkładu. 3. Asymetra w przypadku szeregów o zamknętych przedzałach klasowych Gdy oblczona została średna arytmetyczna, wówczas podstawowym współczynnkem asymetr jest parametr, który wyznacza sę przy użycu następującego wzoru: A S D σ Możlwe są trzy waranty wynków, które odpowadają różnym charakterom rozkładu. Kedy A S 0, wtedy mamy do czynena z rozkładem dealne symetrycznym. Domnanta, średna arytmetyczna medana mają wówczas dentyczne wartośc (rysunek na tablcy). jednostek mających wartośc zmennej nższe od średnej równa sę lczbe jednostek o wyższej od średnej wartośc zmennej. Macej Stępńsk 3 A S > 0 Wówczas średna arytmetyczna jest wększa od domnanty ( >D). Rozkład charakteryzuje sę asymetrą dodatną, prawostronną (rysunek na tablcy). Przeważają w nm jednostk, dla których wartośc zmennej są mnejsze od średnej. A S < 0 Średna arytmetyczna jest mnejsza od domnanty ( <D). Mamy zetem do czynena z asymetrą lewostronną, ujemną. Węcej jest jednostek, które przyjmują wartośc zmennej wększe od średnej. Współczynnk A S przyjmuje na ogół wartośc z przedzału <-,>. Im wartość jest blższa zeru, tym mnejsza jest sła asymetr. W marę wzrostu wartośc bezwzględnej współczynnka sła asymetr rośne. 3. Asymetra w przypadku szeregów o otwartych przedzałach klasowych Jeśl z przyczyn obektywnych ne można oblczyć mar klasycznych, a dysponujemy maram pozycyjnym, wówczas współczynnk asymetr wyznaczany jest w oparcu o następujący wzór: Q + Q3 Me A S Q Analogczne do sytuacj w przypadku szeregów o zamknętych przedzałach klasowych, współczynnk zmennośc może meć: a) wartość równą 0; rozkład jest wtedy symetryczny; b) wartość dodatną; rozkład jest asymetryczny dodatno, prawostronne; przeważają jednostk o nskch wartoścach zmennej w ramach obszaru jej zmennośc; c) wartość ujemną; wtedy rozkład wykazuje sę asymetrą ujemną, lewostronną. Przeważają w nm jednostk o wysokch wartoścach zmennej w ramach obszaru jej zmennośc. Macej Stępńsk 4 7
Zadane. a podstawe materału statystycznego znajdującego sę w ponższym szeregu szczegółowym, oblcz,, V Z, Me, Q, Q 3 Q. σ Welkość ogródka dzałkowego [ar],,7 3, 3 4,4 4 5,0 5 5,7 6 6,3 7 6,3 8 6,4 9 7,8 0 7,9 8, 8, 3 9,0 4 0,3 5,4 6,5 7,8 8 3,0 9 3,5 0 Razem 55,6 Welkość ogródka dzałkowego [ar] ( -śr ) ( -śr ), -5,68 3,64,7-5,08 5,8064 3, 3-4,68,904 4,4 4-3,38,444 5,0 5 -,78 7,784 5,7 6 -,08 4,364 6,3 7 -,48,904 6,3 8 -,48,904 6,4 9 -,38,9044 7,8 0 0,0 0,0004 7,9 0, 0,044 8, 0,4 0,764 8, 3 0,4 0,764 9,0 4,,4884 0,3 5,5 6,3504,4 6 3,6 3,044,5 7 3,7 3,8384,8 8 5,0 5,004 3,0 9 5, 7,484 3,5 0 5,7 3,784 55,6,4E-4 30,05 Macej Stępńsk 5 Zadane. Przeprowadź wszechstronną analzę struktury wynajmowanych meszkań pod względem lczby meszkańców: zameszkują cych osób meszkań n zameszkują cych osób meszkań *n (-śr) (-śr) * n n 0 3 3 3 6 4 4 5 4 6 3 7 8 9 0 Razem 30 0 3 0 9,6544 58,9633,7878,7878 3 6 5,9 7,7633 3 6 8,0544,367 4 4 6 0,878 0,75 5 4 0 0,3,844 6 3 8,4544 7,3633 7 7 6,5878 6,5878 8 6,7 5,44 9 9 0,8544 0,8544 0 0 30,9878 30,9878 57,544 57,544 Razem 30 33 5,3667 Macej Stępńsk 6 8
Zadane 3. Przeprowadź wszechstronną analzę struktury gospodarstw domowych pod względem lczby posadanych telefonów komórkowych: pryw atnych telefonów Lczebnośc kom. w w zględne gospodarst w e domow ym 0 0,048 0,074 0, 3 0,69 4 0,8 5 0,3 6 0,083 7 węcej 0,075 Razem,00 pryw atnych Lczebnośc telefonów Lczebnośc kumulacyjne kom. w w zględne w zględne gospodarst [%] w e domow ym 0 0,048 4,8% 0,074,% 0, 3,3% 3 0,69 50,% 4 0,8 7,0% 5 0,3 84,3% 6 0,083 9,5% 7 węcej 0,075 00,0% Razem,00 Macej Stępńsk 7 Zadane 4. Przeprowadź wszechstronną analzę struktury wynajmowanych meszkań pod względem ch powerzchn: Powerzchn a meszkana meszkań [m ] n mn ma - 30-40 6 40-50 7 50-60 5 60-70 3 70-80 5 80-90 90-00 Razem 30 Powerzchn a meszkana [m ] mn - ma meszkań ' ' *n ('-śr)*n n 30-40 6 35 0 308,6667 40-50 7 45 35 3, 50-60 5 55 75 35,5556 60-70 3 65 95 6,3333 70-80 5 75 375 50, 80-90 85 70 494, 90-00 95 90 787,5556 Razem 30 730 086,6667 Macej Stępńsk 8 9
Zadane 5. Welkość gospodarstw rolnych w Polsce w 000 r. (gosp. ndywd.) Welkość gospodarstwa [ha] gospodarstw n Lczebność Lczebność kumulacyjna,0-,99 448 7 3,83% 3,83%,00-4,99 63 609 3,6% 56,45% 5,00-9,99 447 677 3,80% 80,5% 0-4,99 85 668 9,87% 90,% 5,00 węcej 85 757 9,88% 00,00% 880 88 Welkość gospodarstw rolnych w Polsce w 00 r. (gosp. ndywd.) Welkość gospodarstwa [ha] gospodarstw n Lczebność Lczebność kumulacyjna,0-,99 56 836 6,48% 6,48%,00-4,99 69 46 3,5% 58,73% 5,00-9,99 46 50,85% 80,59% 0-4,99 8 505 9,35% 89,94% 5,00 węcej 96 403 0,06% 00,00% 95 76 Welkość gospodarstw rolnych w Polsce w 007 r. (gosp. ndywd.) Welkość gospodarstwa [ha] gospodarstw n Lczebność Lczebność kumulacyjna,0-,99 4 533 3,4% 3,4%,00-4,99 63 978 34,03% 57,45% 5,00-9,99 399 869,6% 79,6% 0-4,99 66 435 9,3% 88,84% 5,00 węcej 0 50,6% 00,00% 804 065 Macej Stępńsk 9 Zadane 6. Przeprowadź wszechstronną analzę struktury wartośc koszyka dóbr kupowanych w dnu 30 V 00 w markece sec Alfa w mejscowośc Słońce (Regon Północny): Wartość koszyka ( ) [zł] ' Lczebnoś ć (n ) 0-30 5,40 30-40 35 7,90 40-50 45 9,30 50-60 55 5,0 60-70 65 8,30 70-80 75 38,40 80-90 85 7,0 90-00 95,30 Macej Stępńsk 0 0
Zadane 7. Przeprowadź wszechstronną analzę struktury wartośc koszyka dóbr kupowanych w dnu 30 V 00 w markece sec Alfa w mejscowośc Ksężyc (Regon Centralny) w mejscowośc Mars (Regon Połudnowy) Regon Centralny Regon Połudnowy Wartość koszyka ( ) ' Lczebnoś ć (n ) 0-30 5 3,50 30-40 35 8,0 40-50 45 9,0 50-60 55 4,0 60-70 65 9,80 70-80 75 6,80 80-90 85 5,80 90-00 95,60 00,00 Wartość koszyka ( ) ' Lczebnoś ć (n ) 0-30 5 7,0 30-40 35 9,80 40-50 45 9,40 50-60 55 5,80 60-70 65 6,40 70-80 75 9,50 80-90 85 8,70 90-00 95 3,0 00,00 Macej Stępńsk Zadane 8. Przeprowadź analzę struktury weku posłów na sejm I, II III kadencj w kraju Słońce z wykorzystanem parametrów klasycznych. Jak zmenała sę struktura weku w poszczególnych kadencjach? Struktura weku posłów na sejm I Kadencj w kraju Słońce Struktura weku posłów na sejm II Kadencj w kraju Słońce Struktura weku posłów na sejm III Kadencj w kraju Słońce Wek posłów ( ) ' posłów (n ) 0-9 5 9 30-39 35 9 40-49 45 50-59 55 0 60-69 65 7 SUMA 460 Wek posłów ( ) ' posłów (n ) 0-9 5 7 30-39 35 57 40-49 45 64 50-59 55 78 60-69 65 4 70-79 75 SUMA 460 Wek posłów ( ) ' posłów (n ) 0-9 5 7 30-39 35 84 40-49 45 68 50-59 55 46 60-69 65 5 70-79 75 3 SUMA 460 Macej Stępńsk
Zadane 9. Czy zaszły zmany w modelu spożyca owoców śweżych w Regone Północnym? Zadane 0. Mesęczne spożyce śweżych owoców w gospodarwstwach domowych Regonu Północnego Okres Parametry I półrocze 009 r. II półrocze 009 r. I półrocze 00 r. [kg] 3, 3, 3,5 D [kg],7 3, 3,7 σ [kg] 0,9, V z [%] 9,03 35,48 8,57 A S 0,44 0-0, Porównać dwa województwa pod względem wydatków przeznaczonych w roku 008 na publkacje ksążkowe (poza podręcznkam szkolnym) w gospodarstwe domowym. Zadane. Wydatk na publkacje ksążkowe (poza podręcznkam szkolnym) w 008 r. Parametry Województwo A Województwo B [zł] 50 00 D [zł] 70 90 σ [zł] 7 V z [%] 53,33% A S Porównaj dwa województwa pod względem weku pracownków zatrudnonych w ksęgarnach w dnu 30 lstopada 009 w mejscowośc Ksężyc. Woj. A: Me 3 lat, Q lat, Q 0 lat. Woj. B: Q 0 lat, Q 3 4 lata, A s -,8 Macej Stępńsk 3