Statystyka opisowa. Wykład I. e-mail:e.kozlovski@pollub.pl
Spis treści Elementy statystyku opisowej 1 Elementy statystyku opisowej 2 3
Elementy statystyku opisowej Definicja Statystyka jest to nauka o metodach badania prawidłowości występujących w zbiorowościach.
Elementy statystyku opisowej Definicja Statystyka jest to nauka o metodach badania prawidłowości występujących w zbiorowościach. Statystyka matematyczna zajmuje się opisywaniem i analizą zjawisk masowych za pomoca metod rachunku prawdopodobieństwa.
Elementy statystyku opisowej Definicja Statystyka jest to nauka o metodach badania prawidłowości występujących w zbiorowościach. Statystyka matematyczna zajmuje się opisywaniem i analizą zjawisk masowych za pomoca metod rachunku prawdopodobieństwa. Statystyka opisowa zajmuje się wstępnym opracowaniem próbki bez posługiwania się rachunkiem prawdopodobieństwa.
Metody statystyki: opis statystyczny wnioskowanie statystyczne
Metody statystyki: opis statystyczny wnioskowanie statystyczne Opis statystyczny jest to liczbowy opis badanych zbiorowości: opis tabelkowy (szeregi, tablice) opis graficzny (wykresy) opis parametryczny (charakterystyki liczbowe, parametry, średnie, dominanta, mediana).
Metody statystyki: opis statystyczny wnioskowanie statystyczne Opis statystyczny jest to liczbowy opis badanych zbiorowości: opis tabelkowy (szeregi, tablice) opis graficzny (wykresy) opis parametryczny (charakterystyki liczbowe, parametry, średnie, dominanta, mediana). Wnioskowanie statystyczne wykorzystuje się, gdy badaniu statystycznemu nie jest poddawana cała zbiorowość (tzw. populacja), tylko część tej zbiorowości wybrana na drodze losowania (tzw. próba losowa). Wnioskowanie statystyczne polega na uogólnieniu wyników otrzymanych w badaniu próby losowej na całą populację, z której ta próba pochodzi.
Podmiotem badania statystycznego jest zbiorowość statystyczna. Zbiorowość statystyczna (zwana także populacją lub populacją generalną) jest to jednoznacznie określony zbiór osób, przedmiotów lub zdarzeń poddanych badaniom statystycznych. Elementy badanej zbiorowości nazywamy jednostkami statystycznymi. Jednostki wchodzące w skład badanej zbiorowości odznaczają się pewnymi właściwościami, które nazywają się cechami statystycznymi (stałe lub zmienne). Wśród metod analizy statystycznej można wyróżnić trzy podstawowe:
Podmiotem badania statystycznego jest zbiorowość statystyczna. Zbiorowość statystyczna (zwana także populacją lub populacją generalną) jest to jednoznacznie określony zbiór osób, przedmiotów lub zdarzeń poddanych badaniom statystycznych. Elementy badanej zbiorowości nazywamy jednostkami statystycznymi. Jednostki wchodzące w skład badanej zbiorowości odznaczają się pewnymi właściwościami, które nazywają się cechami statystycznymi (stałe lub zmienne). Wśród metod analizy statystycznej można wyróżnić trzy podstawowe: metody analizy struktury zbiorowości
Podmiotem badania statystycznego jest zbiorowość statystyczna. Zbiorowość statystyczna (zwana także populacją lub populacją generalną) jest to jednoznacznie określony zbiór osób, przedmiotów lub zdarzeń poddanych badaniom statystycznych. Elementy badanej zbiorowości nazywamy jednostkami statystycznymi. Jednostki wchodzące w skład badanej zbiorowości odznaczają się pewnymi właściwościami, które nazywają się cechami statystycznymi (stałe lub zmienne). Wśród metod analizy statystycznej można wyróżnić trzy podstawowe: metody analizy struktury zbiorowości metody analizy współzależności
Podmiotem badania statystycznego jest zbiorowość statystyczna. Zbiorowość statystyczna (zwana także populacją lub populacją generalną) jest to jednoznacznie określony zbiór osób, przedmiotów lub zdarzeń poddanych badaniom statystycznych. Elementy badanej zbiorowości nazywamy jednostkami statystycznymi. Jednostki wchodzące w skład badanej zbiorowości odznaczają się pewnymi właściwościami, które nazywają się cechami statystycznymi (stałe lub zmienne). Wśród metod analizy statystycznej można wyróżnić trzy podstawowe: metody analizy struktury zbiorowości metody analizy współzależności metody analizy dynamiki (tzn. zmiana zjawisk w czasie).
Właściwości wspólne (identyczne) jednostek statystycznych wchodzących w skład jednej zbiorowości, nazywamy cechami stałymi. Wyróżniamy trzy rodzaje cech stałych: cecha rzeczowa co lub kto jest przedmiotem badania cecha przestrzenna gdzie występują i skąd pochodzą jednostki badania cecha czasowa z jakiego okresu lub momentu pochodzą jednostki badani
Właściwości wspólne (identyczne) jednostek statystycznych wchodzących w skład jednej zbiorowości, nazywamy cechami stałymi. Wyróżniamy trzy rodzaje cech stałych: cecha rzeczowa co lub kto jest przedmiotem badania cecha przestrzenna gdzie występują i skąd pochodzą jednostki badania cecha czasowa z jakiego okresu lub momentu pochodzą jednostki badani Cechy zmienne to właściwości, którymi różnią się poszczególne jednostki statystyczne. Wyróżniamy następujące rodzaje cech zmiennych: cechy jakościowe (opisowe/niemierzalne) nie dają się zmierzyć, lecz tylko pisać słownie cecha (liczbowe lub mierzalne) dają się zmierzyć, wynik pomiaru wyrażamy za pomocą liczb w odpowiednich wymiarach (jednostkach)
Klasyfikacja badań Ze względu na regularność przeprowadzanych badań statystycznych wyróżniamy: badania ciągłe
Klasyfikacja badań Ze względu na regularność przeprowadzanych badań statystycznych wyróżniamy: badania ciągłe badania okresowe
Klasyfikacja badań Ze względu na regularność przeprowadzanych badań statystycznych wyróżniamy: badania ciągłe badania okresowe badania doraźne
Etapy badań programowanie badania obejmuje następujące czynności przygotowawcze: określenie przedmiotu badania (zbiorowości statystycznej) określenie zakresu badania (cech zmiennych) określenie metody działania (pełne lub częściowe).
Etapy badań programowanie badania obejmuje następujące czynności przygotowawcze: określenie przedmiotu badania (zbiorowości statystycznej) określenie zakresu badania (cech zmiennych) określenie metody działania (pełne lub częściowe). obserwacje statystyczne polegają na gromadzeniu informacji o cechach zmiennych u wszystkich jednostek zbiorowości (badania pełne lub w próbie badanie częściowe). Uzyskany w ten sposób zbiór danych nazywamy materiałem statystycznym.
Etapy badań programowanie badania obejmuje następujące czynności przygotowawcze: określenie przedmiotu badania (zbiorowości statystycznej) określenie zakresu badania (cech zmiennych) określenie metody działania (pełne lub częściowe). obserwacje statystyczne polegają na gromadzeniu informacji o cechach zmiennych u wszystkich jednostek zbiorowości (badania pełne lub w próbie badanie częściowe). Uzyskany w ten sposób zbiór danych nazywamy materiałem statystycznym. opracowanie i prezentacja wyników obserwacji statystycznej polega na gromadzeniu surowego materiału, który następnie jest opracowywany (celowi temu służy podporządkowanie danych klasyfikacja cech zmiennych) i odpowiednio prezentowany (w formie szeregów, tablic lub wykresów).
Etapy badań programowanie badania obejmuje następujące czynności przygotowawcze: określenie przedmiotu badania (zbiorowości statystycznej) określenie zakresu badania (cech zmiennych) określenie metody działania (pełne lub częściowe). obserwacje statystyczne polegają na gromadzeniu informacji o cechach zmiennych u wszystkich jednostek zbiorowości (badania pełne lub w próbie badanie częściowe). Uzyskany w ten sposób zbiór danych nazywamy materiałem statystycznym. opracowanie i prezentacja wyników obserwacji statystycznej polega na gromadzeniu surowego materiału, który następnie jest opracowywany (celowi temu służy podporządkowanie danych klasyfikacja cech zmiennych) i odpowiednio prezentowany (w formie szeregów, tablic lub wykresów). analiza statystyczna wykorzystuje metody opisów statystycznych i metody wnioskowania statystycznego do wykrycia prawidłowości (lub nieprawidłowości) występujących w danej zbiorowości.
Szereg rozdzielczy Definicja Szeregiem rozdzielczym nazywamy uporządkowany i pogrupowany materiał statystyczny. Niech x 1,..., x n będzie n elementową próbką, gdzie n <= 30 oraz elemnty powtarzają się. Jako klasy definiujemy rózne elementy z tej próby. Liczbę elementów próbki zawartych i i tej klasie nazywamy liczebnością i oznaczany jako n j. Oczywiście k j=1 n j = n.
Otrzymany szereg przedstawiamy w postaci histogramu, gdzie na osi poziomej zaznaczamy klasy x j, j = 1,..., k, a na osi pionowej liczebność n j. Na osi pionowej czasami zaznaczamy częstotliwość w j = n j n lub procenty v j = w j b Łącząc punkty o współrzędnych (x 1 b, 0), (x 1, w 1 ), (x 2, w 2 ),..., (x k, w k ), (x k + b, 0) lub ( 1 b, 0), (x 1, v 1 ), ( 2, v 2 ),..., (x k, v k ), (x k + b, 0) otrzymujemy łamaną częstości.
Przykład 1. Dla populacji 5.3, 5.2, 5.7, 5.6, 5.6, 5.5, 5.4, 5.1, 5.5, 5.7, 5.6, 5.6, 5.6, 5.6, 5.6, 5.4, 5.6, 5.5, 5.1, 5.2, 5.4, 5.3 utwórz szereg rozdzielczy, narysuj histogram i łamaną częstości. Rozwiązanie. Zatem szereg rozdzielczy jest postaci x i n i w i 1 5.1 2 0.09 2 5.2 2 0.09 3 5.3 2 0.09 4 5.4 3 0.14 5 5.5 3 0.14 6 5.6 8 0.36 7 5.7 2 0.09 22 1
Rysunek: Histogram. Rysunek: Łamana częstości.
Szereg rozdzielczy przedziałowy Rozstępem badanej cechy X nazywamy różnicę R = x max x min gdzie x max i x min oznaczają odpowiednio wartość największą i najmniejszą w próbce. Przy większej liczebności próbki (n 30) wartości próbki grupujemy w klasy (przedziału o jednakowej długości, gdzie zakładamy że wartości znajdujące się w danej klasie są identyczne ze środkiem tej klasy).
Liczbę klas k ustalamy w zależności od liczebności próby k ln n, k 1 + 3.322 ln n, k n Długość klasy określamy jako b R k (przybliżenie z nadmiarem, czyli bk R). Punkty stanowiące granice klas ustala się zwykle z dokładnością do 1 2α, gdzie α oznacza dokładność. Klasy ustalamy jako (x min 12 α + bj, x min 12 ) α + b (j + 1) gdzie j = 0,..., k 1.
Jeżeli liczebność n 30 (dokonujemy podziału na klasy) to dokonuje się grupowania, w wyniku którego otrzymujemy szereg rzdzielczy, pary liczb: środki klas x j oraz liczebność n j. Sposób w jaki liczebności są rozłożone w poszczególnych klasach nazywamy rozkładem liczebności badanej cechy. Otrzymany szereg przedstawiamy w postaci histogramu, gdzie na osi poziomej zaznaczamy środki klas x j, j = 1,..., k (lub granice klas ( xj 1 2 b, x j + 1 2 b) ) a na osi pionowej liczebność n j. Na osi pionowej czasami zaznaczamy częstotliwość w j = n j n lub procenty v j = w j b Łącząc punkty o współrzędnych ( x 1 b, 0), ( x 1, w 1 ), ( x 2, w 2 ),..., ( x k, w k ), ( x k + b, 0) lub ( x 1 b, 0), ( x 1, v 1 ), ( x 2, v 2 ),..., ( x k, v k ), ( x k + b, 0) otrzymujemy łamaną częstości.
Przykład 2. Zapotrzebowanie na dobro (w tys. szt.) w kolejnych miesiącach I.2006 VI.2008 kształtowało się na poziomie: 53, 54, 57, 50, 68, 49, 59, 62, 54, 55, 52, 52, 55, 47, 53, 61, 64, 54, 57, 59, 53, 58, 59, 51, 49, 45, 47, 52, 50, 51. Utwórz szereg rozdzielczy, narysuj histogram i łamaną częstości. Rozwiązanie. Dla powyższej próbki mamy x min = 45 oraz x max = 68 natomiast rozstęp R = 23. Jako liczbę klas k = 6 ( k 30 ), natomiast długość klasy b = 4 ( ) b 23 6 a dokładność przyjmujemy α = 1 (ponieważ wyniki mamy z dokładnością do wartości jednostkowych). Zgodnie z powyższym szereg rozdzielczy jest postaci klasy x i n i w i 1 (44.5; 48.5) 46.5 3 0.1 2 (48.5; 52.5) 50.5 9 0.3 3 (52.5; 56.5) 54.5 8 0.27 4 (56.5; 60.5) 58.5 6 0.2 5 (60.5; 64.5) 62.5 3 0.1 6 (64.5; 68.5) 66.5 1 0.03 30
Rysunek: Histogram. Rysunek: Łamana częstości.
Średnią arytmetyczną liczb x 1,..., x n nazywamy x = 1 n lub średnią arytmetyczną warzoną x = 1 n n i=1 x i k x i n i i=1 gdzie n i liczebość wyniku (lub klasy) x i.
Średnią geometryczną dodatnich liczb liczb x 1,..., x n nazywamy ḡ = n n x i = n x 1... x n i=1 lub średnią geometryczną ważoną ḡ = k n i=1 x ni i gdzie n i liczebość wyniku (lub klasy) x i. = n x n1 1... xn k n
Średnią harmoniczną liczb x 1,..., x n różnych od zera nazywamy h = lub średnią harmoniczną warzoną h = ( 1 n ( 1 n n 1 x i=1 i k i=1 n i x i gdzie n i liczebość wyniku (lub klasy) x i. ) 1 ) 1
Przykład 3. Średnia arytmetyczna dla zbiorowości z przykładu 1 x i n i x i n i 1 46.5 3 139.5 2 50.5 9 454.5 3 54.5 8 436 4 58.5 6 351 5 62.5 3 187.5 6 66.5 1 66.5 30 1635 wynosi x = 1635 30 = 54.5