Statystyka powtórzeie (I semestr) Rafał M. Frąk
TEORIA
Statystyka Statystyka zajmuje się badaiem procesu zbieraia oraz iterpretacji daych liczbowych lub jakościowych. Przedmiotem statystyki są metody badaia prawidłowości występujących w zjawiskach masowych.
Rodzaje cech statystyczych cechy mierzale - cechy statystycze, których wartości są liczbami wyzaczoymi w aturaly sposób przy pomocy pomiaru lub policzeia (p. zarobki) - wyrożiamy cechy mierzale ciągłe i ieciągłe cechy iemierzale (tj. jakościowe) - cechy statystycze, których aturale wartości ie są liczbami, mogą być jedak przedstawioe przy pomocy liczb (zakodowae) (p. kolor oczu)
Badaie statystycze DEFINICJA: - Jest to każde badaie zbiorowości statystyczej przeprowadzoe przy pomocy metod statystyczych. CEL: - Pozyskaie całościowego obrazu dotyczącego rozmiaru i struktury badaej zbiorowości oraz wystepujących w iej zależości i związków.
Etapy badaia statystyczego dokoaie obserwacji statystyczej (zebraie daych) opracowaie zebraych daych dokoaie prezetacji daych (w postaci tabelaryczej i graficzej) aaliza statystycza wioskowaie statystycze.
Metoda statystycza Jest to swoisty sposób badaia liczbowego specjalego typu zbiorowości. Metody statystycze stosowae są przy zbieraiu daych, ich opracowywaiu, aalizie, wioskowaiu i iterpretacji wyików. Metoda statystycza obejmuje ie tylko sposoby postępowaia, ale i rówież określoe techiki badawcze.
Metody statystycze M e t o d y b a d a ń s t a t y s t y c z y c h Pełe - spis - rejestracja bieżąca - sprawozdawczość C z ę ś c i o w e - m e t o d ą r e p e r e z e t a c y j - b a d a i a m o o g r a f i c z e - b a d a i a a k i e t o w e ą S z a c u k i
Narzędzia prezetacji daych statystyczych Tablice statystycze Wykresy statystycze, p.: - histogram - wykres skrzykowy - wykres rozrzutu - piramida populacyja Opisy słowe (iterpretacje i kokluzje)
Rodzaje miar statystyczych średie - wyzaczają przecięta wartość cechy statystyczej miary zróżicowaia (lub zmieości, rozproszeia, dyspersji) - wyzaczają siłę zróżicowaia wartości cechy statystyczej miary asymetrii (skośości) - wyzaczają siłę skupieia wartości cechy statystyczej bliżej dolej lub górej graicy zbioru wartości miary spłaszczeia (kocetracji) - wyzaczają siłę skupieia wartości cechy statystyczej wokół wartości przeciętej
Kształt rozkładu ormalego Rozkład ormaly jest rozkładem ajczęściej występującym w aturze, p. dla cech statystyczych takich jak: - wzrost człowieka - iteligecja mierzoa testami f(x) a b x Krzywa ormala jest rozkładem symetryczym Pole powierzchi pod krzywą ormalą pomiędzy puktami a oraz b wyrażoe w procetach, iformuje as jaki procet obserwacji zawiera się między a oraz b
Rodzaje średich Średie klasycze skostruowae jedyie dla skali metryczej: - arytmetycza - geometrycza - harmoicza - kwadratowa Średie pozycyje: - wartość modala (dla wszystkich typów skali) - wartość środkowa (skala porządkowa, metrycza) - kwartyle, percetyle, decyle (skala porządkowa, metrycza)
Średie pozycyje - Moda (domiata) Moda jest to wartość cechy statystyczej ajlicziej reprezetowaa w zbiorze obserwacji, czyli wartość występująca z ajwiększą częstością. Moda musi być pojedyczą wartością. Jeśli w zbiorze obserwacji ie istieje pojedycza wartość cechy statystyczej występująca ajczęściej, to moda ie istieje w tej zbiorowości.
Średie pozycyje - Mediaa (wartość środkowa) Mediaa jest to wartość cechy statystyczej, dzieląca zbiór obserwacji a 2 liczebie rówe części (zbiór obserwacji o wartościach miejszych lub rówych oraz zbiór obserwacji o wartościach większych lub rówych od wartości mediay).
Średie pozycyje - Kwartyle Kwartyl dzieli uporządkoway co do wartości zbiór obserwacji idywidualych a 2 części (zbiór obserwacji o wartościach miejszych oraz zbiór obserwacji o wartościach większych od kwartyla): - kwartyl pierwszy Q 1 (zway rówież dolym) dzieli zbiór obserwacji w stosuku 25% : 75% - kwartyl trzeci Q 3 (zway rówież górym) dzieli zbiór obserwacji w stosuku 75% : 25% W myśl tego rozumowaia mediaę moża uzać za kwartyl drugi Q 2, gdyż dzieli zbiór obserwacji w stosuku 50% : 50% ( pół a pół )
Miary zróżicowaia miary zróżicowaia zwae rówież miarami zmieości, rozproszeia lub dyspersji pozwalają określić jakie jest zróżicowaie wartości cechy statystyczej w zbiorze obserwacji (jak moco rozproszoe są poszczególe obserwacje)
Reguła trzech sigm Odchyleie stadardowe iterpretuje się zwykle w oparciu o własości rozkładu ormalego: w przedziale od średia-3s do średia+3s zawiera się 99,73% obserwacji, w przedziale od średia-2s do średia+2s zawiera się 95,45% obserwacji, w przedziale od średia-s do średia+s zawiera się 68,28% obserwacji.
OZNACZENIA i WZORY
Ozaczeia { e 1, e,..., e} 2 -elemetowa zbiorowość statystycza X, Y, Z. cechy statystycze x, y, z wartości cech statystyczych xi wartość, jaką przyjmuje cecha a i-tym elemecie zbiorowości
Ozaczeia x& k. Zwykle rezyguje się z bezpośrediego operowaia przedziałami, gdyż jest to iewygode. Zamiast przedziałami posługujemy się ich reprezetatami liczbowym zwykle są to środki przedziałów p. dla k - tego przedzialu (170,180]: x = k 175
Ozaczeia x& k. W te sam sposób ozacza się wariaty cechy, co pozwala uzyskać pewą jedolitość ozaczeń i wzorów
Częstości względe w k = k
Częstości skumulowae = s 1 1 + sk = sk 1 k
Częstości względe skumulowae w = w s 1 1 w + sk = wsk 1 w k
Średia arytmetycza - Dla małej zbiorowości statystyczej (bez koieczości grupowaia daych w przedziały): x = i = i = 1 1 x ozacza i tą obserwację ze zbioru i x i obserwacji idywidualych. - Dla zbiorowości statystyczej (wartości cechy pogrupowae w przedziały: o ozacza k ty wariat cechy lub xk środek k-tego przedziału. x = 1 k = K k = 1 o k x k K ozacza ilość wariatów cechy statystyczej
Wyzaczaie mody dla rozkładu ciągłego ( ) ( ) dlugosc przedzialu z moda przedziale z moda liczebosc przedzialu astepujacego po z moda przedzial liczebosc przedzialu poprzedzajacego liczebosc przedzialu z moda przedzialu z moda dola graica 1 1 1 1 1 + + + + d d d d d d d d d d d o x x M
Wyzaczaie mediay dla rozkładu ciągłego dlugosc przedzialu z mediaa liczebosc przedzialu z mediaa mediay poprzedzajacych przedzial przedzialow dla liczebosc skumulowaa przedzialu z mediaa dola graica 2 1 1 1 1 1 + + = = d d k k d d d k k d e x x M
PRZYKŁADY ZADAŃ
ZADANIE 1 Losowo wybraych pracowików firmy ABC zapytao o markę ich samochodu i otrzymao astępujące wyiki, zestawioe w tabeli roboczej Wariat k w k sk w sk BMW 2 Fiat 12 Peugeot 7 Skoda 12 Reault 8 RAZEM ------------ ------------
ZADANIE 1 Uzupełij brakujące wartości w tabeli roboczej, a więc oblicz astępujące wielkości: - częstości względe, - liczebości skumulowae,. - częstości względe skumulowae. Przedstaw daą zbiorowość graficzie a histogramie i wyzacz modę.
ZADANIE 2 Pogrupuj astępujące wartości cechy X (Xzarobki pracowicze w firmie ABC) w przedziały. 900, 1300, 1100, 900, 1100, 900, 1100, 900,. 1000, 1200, 1000, 1200, 900, 1100 - Przedstaw zbiór przedziałów w tabeli roboczej. - Oblicz średią arytmetyczą daej cechy statystyczej w omawiaej zbiorowości (korzystając z tabeli roboczej).
Moda ZADANIE 3A Przebadao zbiorowość osób pod kątem cechy statystyczej X marka posiadaego samochodu: Przypadek 1: Fiat, Toyota, Citroe, Toyota, Ford, Fiat, Peugeot, Fiat, Citroe, Peugeot, Peugeot, BMW, Toyota, Fiat Przypadek 2: Citroe, Toyota, BMW, Toyota, Fiat, Peugeot, Citroe, Fiat, Citroe, Peugeot, Toyota Wyzacz modę w tej zbiorowości.
Moda ZADANIE 3B Przebadao zbiorowość pracowików pod kątem cechy statystyczej X wyagrodzeie i otrzymao astępujące kategorie zarobków: [1000, 1200) 5 osób ; [1200, 1400) 3 osoby [1400, 1600) 6 osób ; [1600, 1800] 1 osoba Wyzacz modę w tej zbiorowości.
Mediaa ZADANIE 4A Przebadao zbiorowość pracowików pewej firmy pod kątem cechy statystyczej X wyagrodzeie: Przypadek 1: 1300, 1100, 1300, 1200, 1400 Przypadek 2: 1000, 1200, 1500, 1100 Wyzacz mediaę w tej zbiorowości.
Mediaa ZADANIE 4B Przebadao zbiorowość pracowików pod kątem cechy statystyczej X wyagrodzeie i otrzymao astępujące kategorie zarobków: [1000, 1200) 2 osoby ; [1200, 1400) 5 osób [1400, 1600) 8 osób ; [1600, 1800] 3 osoby Wyzacz mediaę w tej zbiorowości.