Statystyka Opsowa 2014 część 1 Katarzyna Lubnauer
Lteratura: 1. Statystyka w Zarządzanu Admr D. Aczel 2. Statystyka Opsowa od Podstaw Ewa Waslewska 3. Statystyka, Lucjan Kowalsk. 4. Statystyka opsowa, Meczysław Sobczyk Są trzy rodzaje kłamstw: kłamstwa, przeklęte kłamstwa statystyk. Benjamn Dsrael - premer Welkej Brytan (w latach 1868 1874-1880) Katarzyna Lubnauer 2
Podstawowe pojęca Populacja = zborowość statystyczna to zbór elementów (ludz, przedmotów, zwerząt tp.) objętych badanem statystycznym, powązanych ze sobą logczne, mających wspólne cechy, ale jednocześne nedentycznych ze względu na badaną cechę statystyczną. Aby populację określć jednoznaczne charakteryzujemy ją pod względem: rzeczowym (np. kto? Studenc; co? - Zapałk.) czasowym (kedy? - 02.2014r) przestrzennym (terytoralnym - zebran w sal, w pudełku) Te cechy populacj mają charakter stały są wspólne dla badanej populacj Katarzyna Lubnauer 3
Statystyka dzel sę na dwa dzały: Statystyka opsowa to dzał statystyk zajmujący sę metodam opsu danych statystycznych uzyskanych podczas badana statystycznego. Dane dotyczą całej badanej populacj. Statystyka opsowa zajmuje sę: Gromadzenem danych Prezentacją danych Analzą nterpretacją danych Katarzyna Lubnauer 4
Statystyka matematyczna to dzał statystyk, który zajmuje sę uogólnanem wynków badana częśc zborowośc (tzw. próby) na całą zborowość. Statystyka matematyczna wykorzystuje do badań modele probablstyczne. Badane statystyczne może być: pełne (obejmuje całą populację), częścowe (obejmuje część populacj próbę). Które są lepsze dlaczego? Dlaczego ne robmy zawsze badań pełnych? Katarzyna Lubnauer 5
Żona wysyła męża - polcjanta do sklepu po zapałk: - Tylko kup dobre zapałk, żeby sę dobrze palły - dodaje. Po kwadranse polcjant wraca, kładze pudełko na stole mów zadowolony: - Bardzo dobre zapałk. Wypróbowałem w sklepe. Wszystke sę palą. Def. Próba jest podzborem wynków pomarów wybranych z populacj. Próbę nazywamy próbą losową, jeżel każda możlwa próba złożona z n elementów mała taką samą szansę, że zostane wybrana. Próba pownna być reprezentatywna tzn. rozkład warantów badanej cechy w próbe pownen być zblżony do rozkładu w całej populacj, temu służy jej losowość. Katarzyna Lubnauer 6
Nas nteresuje badane całej populacj. Np. analza spsu powszechnego, badane wynków studentów na egzamne. Badanem populacj na podstawe próby zajmą sę Państwo na statystyce matematycznej. Katarzyna Lubnauer 7
Def. Cecha to właścwość elementów populacj ze względu na którą prowadzmy badane statystyczne. Przykład1 Badamy czas spędzany przez studentów codzenne na fb. Cechy to wynk tego dośwadczena podawane w mnutach. Przykład 2 Zapałk, badamy czy sę zapalają, czy ne. Mamy dwa wynk: tak lub ne Zaproponujce nne cechy badane w obu przypadkach. Waranty to wartośc cechy (cecha pownna meć przynajmnej dwa waranty). Zwyczajowo oznaczamy je x. Katarzyna Lubnauer 8
Rodzaje cech: Merzalne (loścowe), czyl lczby. Mogą być cągłe lub skokowe. Przykład1 Czas spędzany przez Państwa na Fb, wzrost, zarobk, waga torebk z cukrem, tp. Katarzyna Lubnauer 9
Jakoścowe (nemerzalne) Mogą być nomnalne porządkowe Przykład2 Wykształcene: podstawowe, średne, wyższe. Masa cała mała, średna, duża waga (porządkowe). Studenc: kolor oczu, grupa krw, palene paperosów, grupa krw (nomnalne), Katarzyna Lubnauer 10
Cechy zmenne Merzalne (loścowe) Nemerzalne (jakoścowe) cągłe skokowe Nomnalne porządkowe Na potrzeby naszego wykładu założymy, że badana cecha jest merzalna. Katarzyna Lubnauer 11
Sposoby prezentacj danych lczbowych. Dane statystyczne prezentujemy zwykle w postac Szeregu prostego (szczegółowego) (stosujemy w przypadku małej lczby danych) Szeregu rozdzelczego: punktowego (stosujemy gdy dane sę powtarzają, dla cech skokowych) przedzałowego (stosujemy gdy danych jest dużo sę ne powtarzają (ale mogą) lub zawsze dla cech cągłych) Wykresu Katarzyna Lubnauer 12
Def. Szereg szczegółowy to materał statystyczny uporządkowany wyłączne wg wartośc badanej cechy. Przykład: Wynk badana średnej ocen studentów bolog 3 roku w 2013r Szereg szczegółowy, uporządkowany rosnąco: 3,2; 3,2; 3,2; 3,2; 3,2; 3,2; 3,2; 3,2; 3,2; 3,2; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 4,0; 4,0; 4,0; 4,0; 4,0; 4,0; 4,0; 4,0; 4,0; 4,0; 4,0; 4,0; 4,0; 4,0; 4,0; 4,0; 4,0; 4,0; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,3; 4,3; 4,3; 4,3; 4,3; 4,3; 4,3; 4,3; 4,3; 4,3; 4,3; 4,3; 4,3; 4,3; 4,3; 4,3; 4,3; 4,7; 4,7; 4,7; 4,7; 4,7; 4,7; 4,7; 4,7; 4,7; 4,7; 4,7; 4,7; 5,0; 5,0; 5,0; 5,0; 5,0; Katarzyna Lubnauer 13
Def. Szereg rozdzelczy jest statystycznym sposobem prezentacj danych z próby. Uzyskuje sę go dzeląc dane statystyczne na pewne kategore podając lczebność lub częstość zborów danych przypadających na każdą z tych kategor. Jeśl mamy szereg rozdzelczy punktowy to wypsujemy wartośc cech (waranty) x przypsujemy m częstość występowana n. Ważnym danym dotyczącym warantów badanej cechy są najwększa najmnejsza wartośc z populacj: x max, x mn Katarzyna Lubnauer 14
Przykład: Wynk badana średnej ocen studentów bolog 3 roku w 2013r Szereg szczegółowy, uporządkowany rosnąco: 3,2; 3,2; 3,2; 3,2; 3,2; 3,2; 3,2; 3,2; 3,2; 3,2; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 4,0; 4,0; 4,0; 4,0; 4,0; 4,0; 4,0; 4,0; 4,0; 4,0; 4,0; 4,0; 4,0; 4,0; 4,0; 4,0; 4,0; 4,0; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,1; 4,3; 4,3; 4,3; 4,3; 4,3; 4,3; 4,3; 4,3; 4,3; 4,3; 4,3; 4,3; 4,3; 4,3; 4,3; 4,3; 4,3; 4,7; 4,7; 4,7; 4,7; 4,7; 4,7; 4,7; 4,7; 4,7; 4,7; 4,7; 4,7; 5,0; 5,0; 5,0; 5,0; 5,0; Przedstawmy w postac szeregu rozdzelczego punktowego: Średna ocen Lczba studentów 3,2 10 3,5 12 4,0 17 4,1 27 4,3 17 4,7 12 5 5 Razem 100 Katarzyna Lubnauer 15
Waranty, które wyróżnamy w szeregu rozdzelczym to klasy. Ilość klas będzemy oznaczać k. k 1 n n Katarzyna Lubnauer 16
Jeżel wynków jest bardzo dużo, lub przyjmują wartośc w sposób cągły stosujemy szereg rozdzelczy przedzałowy, np. badamy wzrost studentek z bolog, mamy dokładną marę wynk dostajemy z dokładnoścą do mnmetra. Dzelmy je węc na przedzały np. o długośc 5 cm (na le jake przedzały pownnśmy podzelć odpowem późnej). Jeśl mamy szereg rozdzelczy przedzałowy to wypsujemy przedzały wartośc cech (warantów) 1 występowana n. [ x, x ) przypsujemy m częstość Katarzyna Lubnauer 17
Szereg rozdzelczy przedzałowy dla wzrostu grupy stu studentek Wzrost x Lczba studentów n [145;150) 3 [150;155) 7 [155;160) 12 [160;165) 23 [165;170) 28 [170;175) 15 [175;180) 8 [180;185) 3 [185;190) 1 Razem 100 Katarzyna Lubnauer 18
Szereg rozdzelczy przedzałowy wykres słupkowy Katarzyna Lubnauer 19
Szereg rozdzelczy przedzałowy wykres lnowy Katarzyna Lubnauer 20
Def. Przedzały, na które dzelmy szereg rozdzelczy nazywamy klasam, lczebność -tej klasy oznaczymy : n Zasady wyznaczana klas w szeregu rozdzelczym przedzałowym: Przystępując do konstrukcj szeregu rozdzelczego przedzałowego musmy pamętać o tym, żeby podzał na klasy był: wyczerpujący (tzn. ne pomjał żadnego wynku) rozłączny (tzn. przedzały muszą być rozłączne) Konstrukcja szeregu rozdzelczego przedzałowego przebega w 3 etapach: Ustalene lczby klas Ustalene rozpętośc przedzałów klasowych Ustalene granc przedzałów klasowych Katarzyna Lubnauer 21
Lczba obserwacj N 40-60 60-100 100-200 200-500 Lczba zalecanych klas k 6-8 7-10 9-12 11-17 Przykład #: Pytamy 50 studentów o czas spędzany codzenne przy komputerze, otrzymujemy następujące wynk w postac szeregu szczegółowego (prostego): 26, 48, 60, 66, 72, 84, 90, 96, 108, 114, 126, 126, 126, 132, 138, 138, 144, 144, 150, 156, 162, 168, 168, 168, 168, 174, 174, 175, 180, 180, 192, 192, 192, 198, 198, 204, 210, 210, 222, 240, 246, 258, 258, 270, 276, 282, 294, 300, 324, 364 n=50 Katarzyna Lubnauer 22
Własnośc Lczbę klas możemy wyznaczać też ze wzoru: k n Długość klasy, rozpętość klas. Zwykle klasy mają tą samą rozpętość r wyznaczamy ją ze wzoru: r R x x max k k mn Katarzyna Lubnauer 23
Przykład #. Dla lczebnośc próby 50 będzemy mel 7 klas, bo Długość z klasy polczymy ze wzoru: 50 = 7,07 r R 364 26 48, 3 50 k 7 Uwaga: r berzemy na ogół z nadmarem, jeżel przyblżamy, żeby meć pewność, że wszystke wartośc próby sę zmeszczą. Katarzyna Lubnauer 24
Są od tej reguły wyjątk. Czasem lepej wząć nerówne długośc klas, np. gdy mamy pewne wynk mocno odbegające od pozostałych. Przykład * Zarobk koszykarzy wyrażone w tys. Złotych wynoszą: 7,8, 9, 10, 10, 10, 11, 12, 12, 14, 15, 15, 15, 17,17, 17, 20, 21, 21, 21, 22, 25, 30, 90, 100. Mamy n=25, a zatem k=5, sprawdźmy co sę stane gdy wyznaczymy równe klasy. r xmax xmn 100 7 18,6 19 k 5 Klasa Lczebność klasy [7, 26) 22 [26,45) 1 [45,64) 0 [64,83) 0 [83, 101) 2 Katarzyna Lubnauer 25
Jak wdzmy, z takego szeregu nc sę ne dowem, tu trzeba zrobć zmenne długośc klas. Zapszę raczej nformacje w takej postac: Klasa Lczebność klasy [7, 13) 9 [13,19) 7 [19,25) 5 [25,31) 2 [31, 101) 2 Stworzyłam osobną klasę dla wynków odbegających od normy (90,100), następne pozostałe wynk podzelłam na 4 równe klasy. Katarzyna Lubnauer 26
Przykład #: Pytamy 50 studentów o czas spędzany codzenne przy komputerze, otrzymujemy następujące wynk w postac szeregu szczegółowego (prostego): 26, 48, 60, 66, 72, 84, 90, 96, 108, 114, 126, 126, 126, 132, 138, 138, 144, 144, 150, 156, 162, 168, 168, 168, 168, 174, 174, 175, 180, 180, 192, 192, 192, 198, 198, 204, 210, 210, 222, 240, 246, 258, 258, 270, 276, 282, 294, 300, 324, 364 n=50 Pamętają Państwo ten przykład? Zrobmy dla nego szereg rozdzelczy przedzałowy. Katarzyna Lubnauer 27
Grance przedzałów Granca lewa perwszej klasy pownna być równe najmnejszemu wynkow z populacj lub mnejsze, następne klasy wyznaczamy dodając rozstęp. Przykład # Poneważ rozpętość klasy mocno zaokrąglłam w górę węc przyjmę x1 25 Klasa [ x, x 1) Lczebność klasy n [25, 75) 5 [75,125) 5 [125,175) 18 [175, 225) 11 [225, 275) 5 [275, 325) 5 [325,375) 1 Razem 50 Katarzyna Lubnauer 28
Przydatnym narzędzem bywają lczebnośc skumulowane. Lczebność skumulowaną -tej klasy lczymy sumując lczebnośc klas od perwszej do t-ej. sk n nm m 1 Klasa Lczebność klasy Lczebność skumulowana sk [ x, x 1 ) n n [25, 75) 5 5 [75,125) 5 10 [125,175) 18 28 [175, 225) 11 39 [225, 275) 5 44 [275, 325) 5 49 [325,375) 1 50 Katarzyna Lubnauer 29
Wskaźnk struktury Def. Wskaźnkem struktury - tej klasy, (częstoścą względną, frakcją) nazywamy lczbę określającą jaką część zborowośc stanow dana klas. Czyl jaką częścą lczebnośc próby jest lczebność klasy. Wskaźnk struktury lczymy ze wzoru: n - lczebność -tej klasy. w n n Katarzyna Lubnauer 30
Uwaga: k 1 w 1 oraz 0 1 w k bo 1 n n Przykład # Klasa Lczebność klasy Częstość [ x, x 1) n [25, 75) 5 0,1 [75,125) 5 0,1 [125,175) 18 0,36 [175, 225) 11 0,22 [225, 275) 5 0,1 [275, 325) 5 0,1 [325,375) 1 0,02 Razem 50 1 Katarzyna Lubnauer 31 w
Wygodnym narzędzem może być też skumulowany wskaźnk struktury. Def. Wskaźnkem skumulowanym struktury (częstoścą względną skumulowaną) - tej klasy nazywamy stosunek lczebnośc wszystkch klas do - tej włączne, do lczebnośc całej próby. Skumulowany wskaźnk struktury lczymy z jednego ze wzorów: w sk 1 n m 1 n gdze m m n oznacza lczebność klasy m w sk w m 1 m gdze w m oznacza częstość klasy m w sk n n sk gdze sk n oznacza lczebność skumulowaną klasy m Katarzyna Lubnauer 32
Uwaga Częstośc względne skumulowane są wartoścam tzw. dystrybuanty emprycznej. Przykład # Klasa Lczebność klasy Częstość Częstośc względne skumulowane [ x, x 1) [25, 75) 5 0,1 0,1 [75,125) 5 0,1 0,2 [125,175) 18 0,36 0,56 [175, 225) 11 0,22 0,78 [225, 275) 5 0,1 0,88 [275, 325) 5 0,1 0.98 [325,375) 1 0,02 1 Razem 50 1 n w w sk w m 1 m Katarzyna Lubnauer 33