Elemety statystyki opisowej Izolda Gorgol wyciąg z prezetacji (wykład I) Populacja statystycza, badaie statystycze Statystyka matematycza zajmuje się opisywaiem i aalizą zjawisk masowych za pomocą metod rachuku prawdopodobieństwa. Celem badań statystyczych jest pozaie prawidłowości ilościowych i jakościowych w masowych zjawiskach losowych i opisywaie ich za pomocą liczb. Badae zbiory azywamy populacjami statystyczymi. Badać moża wszystkie elemety daej populacji statystyczej, zwaej też populacją (zbiorowością) geeralą, albo tylko ich część, zwaą próbką statystyczą (próbką). W pierwszym przypadku badaie jest komplete i ie ma potrzeby używaia elemetów rachuku prawdopodobieństwa. W drugim przypadku badaie jest częściowe. Próbka losowa Zadaiem statystyki jest wioskowaie o własościach całej populacji Z a podstawie iformacji o tych własościach elemetów pewego skończoego podzbioru Z tej populacji (Z Z), zwaego próbką. Próbka Z powia staowić reprezetację populacji Z, tz. częstość występowaia w próbce każdej z badaych cech ie powia zaczie różić się od częstości występowaia tych cech w populacji geeralej. Elemety próbki Z zazwyczaj losuje się spośród elemetów populacji Z. Otrzymaa próbka osi azwę próbki losowej. Próbka losowa prosta -elemetowa to próbka -elemetowa wylosowaa z populacji, przy czym każdy -elemetowy podzbiór populacji geeralej ma takie same szase (takie samo prawdopodobieństwo) wylosowaia. Cechy statystycze Elemety populacji geeralej mogą mieć róże właściwości, które podlegają obserwacji statystyczej. Nazywamy je cechami statystyczymi. Niektóre cechy mają charakter ilościowy (p. wiek, waga, wzrost) i azywamy je cechami mierzalymi, ie posiadają charakter jakościowy (p. płeć, kolor oczu, zawód) i azywamy je cechami iemierzalymi. W przypadku cechy iemierzalej zazwyczaj przypisuje się badaym elemetom wartości liczbowe (p. umerujemy kolory) i wtedy cecha iemierzala staje się cechą mierzalą. Zadaie statystyki opisowej Badaa cecha X jest zmieą losową, której rozkład, zway rozkładem cechy w populacji jest ajczęściej iezay. Statystyka ograicza się do badaia próbki losowej wylosowaej z populacji geeralej. Statystyka opisowa zajmuje się wstępym opracowaiem próbki bez posługiwaia się rachukiem prawdopodobieństwa. Empiryczy rozkład cechy Podstawą badań statystyczych skończoej zbiorowości jest określeie empiryczego, tz. zaobserwowaego w tej zbiorowości, rozkładu zaobserwowaej cechy. Rozkład empiryczy to rozkład cechy w próbie. Określeie empiryczego rozkładu polega a przyporządkowaiu kolejym wartościom przyjmowaym przez cechę odpowiedio zdefiiowaych częstości ich występowaia. Parametry rozkładu empiryczego azywamy parametrami empiryczymi, zaś parametry rozkładu cechy X parametrami teoretyczymi. Badaie statystycze rozpoczya się od wyzaczeia rozkładu empiryczego. Szereg rozdzielczy Rozkład empiryczy bada się ajczęściej tworząc tzw. szereg rozdzielczy. Szeregiem rozdzielczym uporządkoway wg wielkości zbiór wartości badaej cechy w próbie.
Szereg rozdzielczy szczegółowy tworzy się poprzez grupowaie powtarzających się wartości badaej cechy w próbie. Gdy liczba obserwacji jest duża ( 30), to szereg rozdzielczy przedziałowy tworzy się poprzez grupowaie zaobserwowaych wartości w tzw. klasach. Klasy są przedziałami, ajczęściej jedakowej długości, które tworzy się przyjmując upraszczające założeie, że wszystkie wartości zajdujące się w daej klasie są idetycze z tzw. środkiem klasy. Ustalaie liczby klas Istieje kilka reguł ustalaia orietacyjie liczby k klas w zależości od liczości próbki: k 5 l lub k = + 3, 3 l lub k =. Moża rówież korzystać z poiższych orietacyjych daych: liczba pomiarów liczba klas k 30 60 6 8 60 00 7 0 00 00 9 00 500 7 500 500 6 5 Nawet przy dużo licziejszej próbce ie stosuje się większej liczby klas iż 30. Rozstęp, długość klasy Niech x, x,..., x będzie -elemetową próbką prostą o zadaych wartościach. Rozstępem badaej cechy X w tej próbce azywamy liczbę R = x max x mi, gdzie x max, x mi ozaczają, odpowiedio, ajwiększą i ajmiejszą liczbę w ciągu x, x,..., x. Rozstęp jest zatem długością ajkrótszego przedziału, w którym mieszczą się wszystkie wartości próbki. Jeżeli R jest rozstępem próbki, zaś k liczbą klas, to jako długość klasy przyjmuje się b R, tak jedak, by bk R. k Dokładość przy ustalaiu graic klas Pukty staowiące graice poszczególych klas ustala się zwykle z dokładością do α, gdzie α ozacza dokładość, z jaką wyzaczoo wartości w próbce. Jeśli więc dla jedakowo dokładych wartości w próbce dae liczbowe są podawae jako całkowite wielokrotości ajwiększej liczby a, to ależy przyjąć jako graice klas liczby postaci la + α, gdzie l są liczbami całkowitymi. Dolą graicę pierwszej klasy otrzymujemy wg wzoru x mi α. Liczbę wartości próbki zawartych w i-tej klasie azywamy liczością (liczebością) i-tej klasy i ozaczamy symbolem i. Oczywiście i =. i Jeżeli liczość próbki x, x,..., x kwalifikuje ją do podziału a klasy, to dokouje się grupowaia. Otrzymuje się szereg rozdzielczy przedziałowy, który staowią pary liczb: środki kolejych klas ẋ i oraz ich liczości i, gdzie i {,,..., k}. Szereg rozdzielczy moża rówież przedstawić w postaci histogramu. Na osi poziomej zazacza się środki klas, albo też graice poszczególych klas, a a osi pioowej liczości klas i albo częstości klas w i = i.
Miary średie Miary średie pozwalają określić tzw. tedecję cetralą, czyli przecięty poziom. Miary średie (wartości przecięte) służą do określaia tej wartości zmieej, wokół której skupiają się wszystkie pozostałe wartości zmieej. Miary średie dzielą się a: średie klasycze (średia arytmetycza, średia harmoicza, średia geometrycza); średie pozycyje (mediaa, moda). Średia arytmetycza Średią arytmetyczą x liczb x, x,..., x azywamy liczbę określoą wzorem x = x i. Jeżeli wyik pomiaru x i wystąpił i razy, gdzie i {,,..., k} oraz i =, to średią arytmetyczą ważoą azywamy liczbę x = x i i. Jeżeli dae są pogrupowae w szeregu rozdzielczym przedziałowym, to x = ẋ i i. Średia harmoicza Średią harmoiczą h różych od zera liczb x, x,..., x azywamy liczbę określoą wzorem ( ) h =, o ile 0. x i x i Jeżeli wyik pomiaru x i wystąpił i razy, gdzie i {,,..., k} oraz ważoą azywamy liczbę h = ( ) i. x i i =, to średią harmoiczą Średia geometrycza Średią geometryczą g liczb dodatich x, x,..., x azywamy liczbę określoą wzorem g = x i. Jeżeli wyik pomiaru x i wystąpił i razy, gdzie i {,,..., k} oraz ważoą azywamy liczbę g = x x k k. i =, to średią geometryczą Mediaa Mediaą (wartością środkową) Me próbki x, x,..., x azywamy środkową liczbę w uporządkowaej iemalejąco próbce x () x () x (), gdy jest liczbą ieparzystą, albo średią arytmetyczą dwóch środkowych liczb, gdy jest liczbą parzystą, tz. Me = x ( + ), gdy jest ieparzyste, x ( ) +x ( + ), gdy jest parzyste. 3
Mediaa Jeżeli dae są pogrupowae w szeregu rozdzielczym przedziałowym, to ( ) Me = x l + b m i, gdzie x l - lewy koiec klasy zawierającej mediaę, m - umer klasy zawierającej mediaę, - liczość próbki, i - liczość i-tej klasy, b - długość klasy. m Moda Modą (domiatą, wartością ajczęstszą) Mo próbki x,..., x o powtarzających się wartościach azywamy ajczęściej powtarzającą się wartość, o ile istieje i ie jest to x mi ai x max. Jeżeli dae są pogrupowae w szeregu rozdzielczym przedziałowym, to Mo = x l + l l ( l l ) + ( l l+ ) b, gdzie x l - dola graica klasy modalej (klasy, w której zajduje się moda), l - liczość klasy modalej, l, l+ - liczości sąsiedich klas, b - długość klasy. Moda zależy od sposobu podziału a klasy. Miary rozproszeia Miary rozproszeia (zmieości) służą do badaia zróżicowaia wartości, czyli tzw. dyspersji. Podstawowe miary rozproszeia to: rozstęp, wariacja, odchyleie stadardowe. Rozstęp Rozstępem w próbce o wartościach x,..., x azywamy liczbę R = x max x mi. Wariacja Wariacją s próbki x,..., x azywamy średią arytmetyczą kwadratów odchyleń poszczególych wartości x i od średiej arytmetyczej x i próbki, tz. X s = (x i x). Jeżeli wyik pomiaru x i wystąpił i razy, gdzie i {,,..., k} oraz i =, to s = (x i x) i. Jeżeli dae są pogrupowae w szeregu rozdzielczym przedziałowym, to s = (ẋ i x) i. Praktyczy wzór do obliczeń: s = x (x). 4
Odchyleie stadardowe Odchyleiem stadardowym azywamy liczbę s = s. Odchyleie stadardowe określa w przybliżeiu, o ile wszystkie jedostki statystycze daej populacji różią się średio od wartości średiej arytmetyczej badaej zmieej. współczyik zmieości typowy obszar zmieości Ie charakterystyki Współczyikiem zmieości azywamy liczbę Współczyik zmieości v = s x 00%. Typowy obszar zmieości Typowy obszar zmieości cechy statystyczej to obszar, w którym mieści się około 3 wszystkich jedostek badaej populacji. Typowy obszar zmieości określa wzór x s < x typ < x + s. Zając typowy obszar zmieości moża podzielić jedostki daej populacji a typowe (tz. występujące stosukowo często) i ietypowe (tz. występujące stosukowo rzadko). 5