Przedmiot i rola statystyki

Podobne dokumenty
Statystyka opisowa. Wykład I. Elementy statystyki opisowej

POJĘCIA WSTĘPNE. STATYSTYKA - nauka traktująca o metodach ilościowych badania prawidłowości zjawisk (procesów) masowych.

Statystyka w pracy badawczej nauczyciela

Podstawowe pojęcia statystyczne

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Wykład ze statystyki. Maciej Wolny

Wykład Prezentacja materiału statystycznego. 2. Rodzaje szeregów statystycznych.

Statystyka matematyczna i ekonometria

Wprowadzenie Pojęcia podstawowe Szeregi rozdzielcze STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP.

Statystyka Matematyczna Anna Janicka

Analiza struktury i przeciętnego poziomu cechy

W1. Wprowadzenie. Statystyka opisowa

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

Statystyka. Wykład 1. Magdalena Alama-Bućko. 20 lutego Magdalena Alama-Bućko Statystyka 20 lutego / 19

Zagadnienia: wprowadzenie podstawowe pojęcia. Doświadczalnictwo. Anna Rajfura

Statystyka. Wykład 1. Magdalena Alama-Bućko. 26 lutego Magdalena Alama-Bućko Statystyka 26 lutego / 34

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

Podstawowe pojęcia cd. Etapy badania statystycznego

Próba własności i parametry

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

STATYSTYKA. dr Agnieszka Figaj

zbieranie porządkowanie i prezentacja (tabele, wykresy) analiza interpretacja (wnioskowanie statystyczne)

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

Sposoby prezentacji problemów w statystyce

Badania Statystyczne

STATYSTYKA OPISOWA. Przykłady problemów: - badanie opinii publicznej na temat preferencji wyborczych;

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Statystyka i analiza danych pomiarowych Podstawowe pojęcia statystyki Cz. 1. Tadeusz M. Molenda Instytut Fizyki, Uniwersytet Szczeciński

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka i analiza danych pomiarowych Podstawowe pojęcia statystyki cz. 2. Tadeusz M. Molenda Instytut Fizyki, Uniwersytet Szczeciński

STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE

Literatura. Podgórski J., Statystyka dla studiów licencjackich, PWE, Warszawa 2010.

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

Po co nam charakterystyki liczbowe? Katarzyna Lubnauer 34

SIGMA KWADRAT CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE)

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład Przedmiot statystyki

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka. Opisowa analiza zjawisk masowych

Statystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39

Statystyczne metody analizy danych. Agnieszka Nowak - Brzezińska

Statystyka matematyczna dla leśników

Statystyka. Podstawowe pojęcia: populacja (zbiorowość statystyczna), jednostka statystyczna, próba. Cechy: ilościowe (mierzalne),

Wykład z dnia 8 lub 15 października 2014 roku

Wykład 3: Prezentacja danych statystycznych

Wykład 2. Statystyka opisowa - Miary rozkładu: Miary położenia

Miary statystyczne w badaniach pedagogicznych

You created this PDF from an application that is not licensed to print to novapdf printer (

Badania sondażowe. Schematy losowania. Agnieszka Zięba. Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Przedmiot statystyki. Graficzne przedstawienie danych.

Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl

Przedmiotowe Zasady Oceniania III LO w Łomży. Statystyka. Klasa II-III

Analiza współzależności zjawisk

STATYSTYKA OPISOWA. Dr Alina Gleska. 12 listopada Instytut Matematyki WE PP

Statystyka Opisowa WK Andrzej Pawlak. Intended Audience: PWR

Wykład 10: Elementy statystyki

STATYSTYKA wykłady. L.Gruszczyński Elementy statystyki dla socjologów Dr. Pactwa pon. i wtorek 09:30 11:00 (pok. 217) I. (08.X)

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Typy szeregów statystycznych

Graficzna prezentacja danych statystycznych

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Statystyczny opis danych

Rodzaje badań statystycznych

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35

166 Wstęp do statystyki matematycznej

Estymacja punktowa i przedziałowa

Wykład 5: Statystyki opisowe (część 2)

Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka

Wydział Matematyki. Testy zgodności. Wykład 03

Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Spis treści 3 SPIS TREŚCI

Analiza korespondencji

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

METODOLOGIA BADAŃ HUMANISTYCZNYCH METODYKA NAUCZANIA JĘZYKA OBCEGO CZ.II

Wykład 4: Statystyki opisowe (część 1)

Analiza statystyczna w naukach przyrodniczych

STATYSTYKA OPISOWA. Wykład 1

Z poprzedniego wykładu

Ćwiczenia 1-2 Analiza rozkładu empirycznego

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

Rozdział 1. Analiza Struktury. Jan Żółtowski. Problem 1.1. Lp. Pytanie Odpowiedź

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

BADANIE MARKETINGOWE

Statystyka. Wykład 3. Magdalena Alama-Bućko. 6 marca Magdalena Alama-Bućko Statystyka 6 marca / 28

1 Podstawy rachunku prawdopodobieństwa

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Wprowadzenie do analizy korelacji i regresji

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Transkrypt:

Statystyka

Przedmiot i rola statystyki Statystyka jest dziedziną nauki zajmującą się metodami ilościowymi opisu zjawisk lub procesów masowych. Zjawisko jest masowe, gdy dotyczy wystarczająco dużej liczby jednostek. Wówczas to daje się zaobserwować pewne prawidłowości. Na każde zjawisko oddziaływują dwie grupy przyczyn: przyczyny główne, które wpływają na powstanie prawidłowości, przyczyny uboczne, które powodują odchylenia od niej.

Przyjęcie studenta na wyższą uczelnię Dla studenta jest zjawiskiem jednostkowym

Przyjęcie studenta na wyższą uczelnię Dla administracji uczelni jest zjawiskiem masowym

Przyczyna główna - dobrze zdany egzamin maturalny. Przyczyna uboczna - zwycięstwo w olimpiadzie wiedzy o gospodarce i przedsiębiorczości.

Badania statystyczne a podejmowanie decyzji Posiadanie rzetelnych, dokładnych i wyczerpujących informacji, których dostarczają badania statystyczne jest jednym z warunków ułatwiających podejmowanie decyzji. DECYZJA INFORMACJA PROCES DECYZYJNY POLECENIE KONTROLA DZIAŁANIE

Podstawowe pojęcia statystyczne

Zbiorowość statystyczna To zbiór dowolnych jednostek (np. ludzi, przedmiotów, przedsiębiorstw, obszarów geograficznych), które mają przynajmniej jedną wspólną właściwość, a różnią się z innych punktów widzenia. Wśród zbiorowości wyróżniamy: Zbiorowość pełną (populację generalną) zbiór wszystkich jednostek, co do których chcemy wnioskować o charakterystykach ich właściwości. Może ona być skończona (populacja podmiotów gospodarczych zarejestrowanych w systemie REGON) lub nieskończona (populacja owadów w pewnej okolicy). Zbiorowość częściowa (próba) pewien podzbiór populacji generalnej, którego elementy zostały dobrane w sposób losowy. Symbolem n oznacza się liczebność próby, natomiast przez N liczebność populacji generalnej.

Przykład Poddając samochody osobowe tzw. crash testom doprowadza się do zderzenia samochodu, uszkadzając go przy tym znacznie. W ten sposób testuje się nowe rozwiązania techniczne, mające poprawić bezpieczeństwo jazdy. Oczywiście testowanie każdego auta, które schodzi z linii produkcyjnej nie miałoby sensu, dlatego też wybiera się próbę (określoną liczbę sztuk) aut i poddaje się je testom. Wyniki otrzymane dla próby uogólnia się następnie na całą populację aut, w których zastosowano dane rozwiązanie techniczne.

Jednostka statystyczna Poszczególne elementy składowe badanej zbiorowości (lub próby) noszą nazwę jednostek statystycznych (jednostek badania, obserwacji). W celu jednoznacznego określenia, jakie jednostki będą stanowiły zbiorowość statystyczną, niezbędne jest określenie jednostki statystycznej pod względem: rzeczowym (przedmiotowym) co badamy, czasowym z jakiego okresu pochodzą obserwacje, terytorialnym (przestrzennym, geograficznym) z jakiego obszaru, zakresowym jakie informacje o jednostkach będą gromadzone.

Cechy Statystyczne

Cechy Statystyczne Jednostki wchodzące w skład zbiorowości (pełnej czy częściowej) odznaczają się pewnymi własnościami. Własności te nazywamy cechami statystycznymi. Cechy statystyczne można podzielić na: stałe, czyli wspólne dla wszystkich jednostek badanej zbiorowości wykorzystywane wyłącznie do precyzyjnego zdefiniowania badanej zbiorowości statystycznej, zmienne, czyli te, dzięki którym poszczególne jednostki różnią się między sobą wykorzystywane w analizie statystycznej. Jeśli cechę oznaczymy przez X, to jej warianty (wartości, odmiany) oznaczamy przez xi, gdzie i oznacza numer wariantu.

Podział Cech Statystycznych Cechy Statystyczne Mierzalne Niemierzalne Ciągłe Skokowe Porządkowe Nominalne

Cechy mierzalne Cechy mierzalne (inaczej ilościowe) to takie, które mogą przyjmować określone wartości wyrażone przy pomocy liczb (w postaci jednostek fizycznych - w sztukach, kilogramach, złotych itp.). Są to na przykład wiek (w latach), wzrost (w cm), wynagrodzenie (w zł). Cechy mierzalne dzieli się na ciągłe i skokowe (dyskretne). Cechy skokowe (o zmienności skokowej) mogą przyjmować określone wartości ze skończonych lub przeliczalnych zbiorów liczbowych, bez wartości pośrednich (np. liczba osób w gospodarstwie domowym, liczba przebytych chorób zakaźnych). Cechy ciągłe (o zmienności ciągłej) mogą przyjmować każdą wartość z określonego przedziału liczbowego (np. wiek, wzrost, koszt, prędkość).

Cechy niemierzalne Cechy niemierzalne (inaczej jakościowe) charakteryzują się tym, że ich wariantów nie można zmierzyć przy pomocy liczb, można je wyrazić tylko słownie. Są to na przykład płeć (kobieta, mężczyzna), kolor (biały, czarny, niebieski itp.), wykształcenie (podstawowe, zasadnicze zawodowe, średnie, wyższe). Cechy niemierzalne dzieli się na porządkowe i nominalne. Cechy porządkowe to takie, których warianty można ustawić w pewnej kolejności (uporządkować), np. wykształcenie, ocena ze sprawowania, stan rynku (bessa, hossa). Cechy nominalne to cechy niemierzalne, dla których nie ma hierarchii ich wariantów, np. kolor, płeć, marka samochodu.

Przykład W pewnej niewielkiej firmie produkcyjnej zbadano pracujących tam sześciu pracowników. Zarejestrowano ich wiek, płeć, liczbę osób na utrzymaniu. Badano zatem pracowników pod względem następujących cech statystycznych: wiek (w latach) cecha ilościowa (mierzalna), ciągła (gdyż mamy do czynienia z procesem ciągłym, który trwa); zarejestrowano następujące warianty tej cechy: 18, 23, 51, 44, 39 i 51, płeć cecha jakościowa (niemierzalna), nominalna; cecha ta ma dwa warianty: kobieta (jeden pracownik), mężczyzna (pięciu pracowników), Liczba osób na utrzymaniu cecha ilościowa (mierzalna), skokowa; zarejestrowane; warianty tej cechy: 1, 2, 3, 4, gdyż dwóch pracowników ma na utrzymaniu po 1 i 2 osoby.

Podział metod statystycznych Metody Statystyczne Kryterium formalnostatystyczne Metody opisu statystycznego Metody wnioskowania statystycznego Estymacja Weryfikacja hipotez Kryterium zakresowoprzedmiotowe Metody analizy struktury Metody analizy współzależności Metody analizy dynamiki Metody analizy szeregów czasowych

Działy Statystyki Kierując się kryterium formalno-statystycznym wyróżnia się dwa działy statystyki: Statystykę opisową, która zajmuje się opracowaniem danych o obserwowanej zbiorowości, dokonując jej uporządkowanego opisu z różnych punktów widzenia; proponuje szereg miar w sposób syntetyczny charakteryzujących badaną zbiorowość; pozwala na opis tylko jednostek objętych badaniem, bez uogólniania wyników na populację, Wnioskowanie statystyczne, które pozwala ustalić prawidłowości i charakteryzować populację generalną na podstawie zredukowanej liczby danych (z próby), przy zastosowaniu praw rachunku prawdopodobieństwa. Dzięki niemu możliwe jest określenie błędu jaki popełniamy, uogólniając wyniki z próby na całą zbiorowość.

Badanie statystyczne Badaniem statystycznym nazywamy ogół prac, których celem jest poznanie prawidłowości charakteryzujących określoną zbiorowość. Sprowadza się ono do zebrania, odpowiedniego przetworzenia i analizy informacji na temat badanej zbiorowości statystycznej z punktu widzenia wybranych cech statystycznych, charakteryzujących jednostki należące do tej populacji. Przed przystąpieniem do badania statystycznego należy wyraźnie sprecyzować jego cel. Od tego zależy bowiem, jakie jednostki statystyczne poddane będą badaniu, jakiej zbiorowości będą stanowić elementy i pod względem jakich cech będą badane.

Podział badań statystycznych Badanie Statystyczne Pełne (całkowite, generalne) obejmuje wszystkie jednostki określonej zbiorowości Spisy statystyczne Rejestracje statystyczne Sprawozdawczość statystyczna Częściowe (niepełne) obejmuje tylko wybraną część populacji generalnej próbę Losowy Dobór próby Celowy Warstwowy Prosty za pomocą: Losowania Za pomocą tablicy liczb losowych Systematyczny Wielostopniowy Dobór jednostek typowych Dobór proporcjonalny Dobór przez eliminację

Opracowanie i Prezentacja Danych Statystycznych

Grupowanie danych statystycznych Grupowanie statystyczne ma na celu podział zbiorowości na grupy jednostek podobnych względem siebie. Dobrze zbudowane szeregi statystyczne zapewniają właściwy obraz struktury zbiorowości, większą precyzję miar statystycznych charakteryzujących badaną zbiorowość, a także pozwalają łatwiej i szybciej uchwycić relacje zachodzące między badanymi zjawiskami. Rozróżniamy dwa rodzaje grupowania: Grupowanie proste, polegające na podziale zbiorowości ze względu na jedną cechę, Grupowanie złożone, przeprowadzane ze względu na kilka cech równocześnie.

Szeregi Statystyczne Grupowanie proste prowadzone jest w postaci szeregów statystycznych inaczej zwanych rozkładami empirycznymi. Szeregi Statystyczne Szeregi szczegółowe Szeregi rozdzielcze (strukturalne) Cech mierzalnych Szeregi rozdzielcze punktowe Szeregi rozdzielcze przedziałowe o przedziałach zamkniętych o przedziałach otwartych Cech niemierzalnych Szeregi przestrzenne (geograficzne) Szeregi czasowe Momentów Okresów

Szereg Szczegółowy To uporządkowany niemalejąco lub nierosnąco ciąg wartości badanej cechy statystycznej. Uporządkowanie to następuje tylko według wartości badanej cechy. Jeśli przez x i oznaczymy warianty cechy, to szereg szczegółowy można zapisać następująco: x 1, x 2, x 3,, x N.

Przykład Dwudziestu uczniów zapytano, ile godzin spędzają dziennie przed komputerem. Udzielili oni następujących odpowiedzi: 2,5 3 0,5 1 6 7 3,5 3 3 2 4 4,5 5 5 5 1,5 5 2,5 0,5 5 W badaniu mamy do czynienia z cechą statystyczną: liczba godzin spędzonych dziennie przed komputerem. Jest to cecha mierzalna ciągła. Zbiorowość (populację) statystyczną tworzą poszczególne jednostki badania, czyli poszczególni uczniowie. Informacje statystyczne o wartości cechy dla każdej z jednostek tworzą indywidualny szereg wartości cech (surowy materiał statystyczny). Po uporządkowaniu otrzymujemy szereg szczegółowy: 0,5 0,5 1 1,5 2 2,5 2,5 3 3 3 3,5 4 4,5 5 5 5 5 5 6 7

Szereg Rozdzielczy Inaczej zwany szeregiem strukturalnym jest to zbiór wartości liczbowych uporządkowanych (rosnąco w przypadku cechy mierzalnej lub porządkowej) według wariantów badanej cechy mierzalnej lub niemierzalnej, przy czym poszczególnym wariantom cechy przyporządkowane są odpowiadające im liczebności. Zbiorowość statystyczną dzieli się w ten sposób na klasy według określonej cechy z podaniem liczebności każdej z wyodrębnionych klas. Zliczanie jednostek posiadających ten sam wariant cechy wykonujemy poprzez zliczanie bezpośrednie, sposobem kreskowym albo korzystając z odpowiedniego oprogramowania.

Liczebności absolutne Liczebności poszczególnych k klas, wyróżnione na etapie zliczania to absolutne liczebności cząstkowe albo inaczej częstości (niektórzy mówią krótko liczebności). Przez liczebności absolutne (zwane też bezwzględnymi), oznaczane symbolem n i, rozumiemy liczbę rzeczywistych obserwacji odpowiadających danemu wariantowi cechy. Suma poszczególnych liczebności cząstkowych daje liczebność całej zbiorowości, czyli N: N = n 1 + n 2 + + n k = k i=1 n i. Szereg rozdzielczy zbudowany z wykorzystaniem liczebności absolutnych nosi nazwę szeregu prostego.

Liczebności względne Liczebności względne (tak zwane wskaźniki struktury) oznaczamy symbolem w i. Określają one, jaki udział w całej zbiorowości mają jednostki statystyczne posiadające dany wariant cechy. Obliczamy je wzorem: w i = n i N, i = 1,2,, k. Mają one następujące własności: 0 w i 1, w 1 + w 2 + + w k = k i=1 w i = 1.

Liczebności skumulowane Niekiedy badacza interesuje, jaka liczebność odpowiada wszystkim klasom od pierwszej do danej włącznie, a więc jaka jest liczebność jednostek statystycznych posiadających dany wariant cechy lub niższy. Informacji takich dostarczają liczebności skumulowane. Liczebności absolutne skumulowane, oznaczane przez n isk, wskazują ile jednostek statystycznych ma dany wariant cechy lub niższy (słabszy). Liczebności względne skumulowane, oznaczane przez w isk, wskazują, jaka część (odsetek) jednostek statystycznych ma dany wariant cechy lub niższy (słabszy).

Liczebności skumulowane Szereg rozdzielczy o tak przedstawionych liczebnościach określa się mianem szeregu rozdzielczego skumulowanego lub dystrybuanty empirycznej. n isk = n 1 + n 2 + + n i = w isk = w 1 + w 2 + + w i = i l=1 n l, i l=1 w l, gdzie i = 1,2,, k.

Przykład - szereg rozdzielczy dla cechy niemierzalnej nominalnej Uczniów pewnej klasy zapytano, jaki jest ich ulubiony kolor. Trzech uczniów lubi kolor zielony, pięciu niebieski, ośmiu czerwony, trzech różowy, siedmiu biały, dwóch czarny. Numer klasy, i Ulubiony kolor, x i Liczba uczniów, n i Udział uczniów, w i Procent uczniów, w i (w %) 1 Zielony 3 0,11 11 2 Niebieski 5 0,18 18 3 Czerwony 8 0,29 29 4 Różowy 3 0,11 11 5 Biały 7 0,25 25 6 Czarny 2 0,07 7 Razem 28 1,00 100

Przykład - szereg rozdzielczy dla cechy niemierzalnej porządkowej Badając strukturę 40 pracowników pewnego przedsiębiorstwa pod względem wykształcenia stwierdzono, że: ośmiu z nich ma wykształcenie wyższe, dwudziestu - średnie, dziesięciu - zawodowe, a dwóch pozostałych - podstawowe. Numer klasy, i Ulubiony kolor, xi Liczba pracowników, ni Częstości skumulowane, nisk Udział pracowników, wi Częstości względne skumulowane, wisk 1 Podstawowe 2 2 0,05 0,05 2 Zawodowe 10 12 0,25 0,30 3 Średnie 20 32 0,50 0,80 4 Wyższe 8 40 0,20 1,00 Razem 40 x 1,00 x

Szeregi rozdzielcze dla cech mierzalnych Wśród szeregów rozdzielczych budowanych dla cech mierzalnych wyróżnia się: Szeregi rozdzielcze punktowe (o przedziałach jednostkowych), Szeregi rozdzielcze przedziałowe (z przedziałami klasowymi)

Szeregi rozdzielcze punktowe Informacje statystyczne grupuje się w szeregi rozdzielcze punktowe wówczas, gdy badamy cechę skokową i ma ona niewiele wariantów. Wówczas ten typ szeregu czyni prezentację bardziej przejrzystą i czytelną. xi x1 x2 x3 xk Razem ni n1 n2 n3 nk N

Przykład 60 uczniów zapytano o liczbę rodzeństwa. Uzyskano następujące informacje: 0, 2, 3, 0, 1, 1, 0, 1, 5, 1, 1, 0, 0, 0, 0, 2, 2, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 3, 2, 7, 2, 1, 1, 0, 0, 3, 2, 5, 4, 4. 2, 1, 3, 6, 2, 1, 0, 0, 0, 0, 2, 3, 1, 2, 1, 1, 1, 0, 0, 0. Numer klasy, i Liczba rodzeństwa, xi Liczba uczniów, ni Częstości skumulowane, nisk Udział uczniów, wi Częstości względne skumulowane, 1 0 21 21 0,35 0,35 2 1 18 39 0,30 0,65 3 2 10 49 0,17 0,82 4 3 5 54 0,08 0,90 5 4 2 56 0,03 0,93 6 5 2 58 0,03 0,96 7 6 1 59 0,02 0.98 8 7 1 60 0,02 1,00 Razem 60 x 1,00 x wisk

Szeregi rozdzielcze przedziałowe (z przedziałami klasowymi) Zaleca się je budować w sytuacji, gdy badana cecha jest ciągła albo jest cechą skokową o wielu wariantach. Wówczas na wstępie warianty cechy grupuje się w przedziały klasowe, a zadaniem badacza jest zakwalifikowanie każdej jednostki statystycznej do odpowiedniego przedziału. Ostatecznie, otrzymujemy liczebności cząstkowe poszczególnych przedziałów klasowych, wskazujące na to, ile bądź jaki odsetek jednostek badania przyjmuje wartości cechy z danego przedziału.

Szeregi rozdzielcze przedziałowe (z przedziałami klasowymi) Każdy przedział ma dwie granice: dolną x 0i oraz górną x 1i. Różnicę między górną i dolną granicą i-tego przedziału klasowego nazywamy rozpiętością przedziału klasowego i oznaczamy przez h i hi = x1i x0i. Przykładowo dla przedziału klasowego 40 50 mamy: x 0i = 40, x 1i = 50, h i = 50 40 = 10.

Szeregi rozdzielcze przedziałowe (z przedziałami klasowymi) W szczególnych przypadkach, granice początkowych i/lub końcowych przedziałów w szeregu mogą być otwarte (nie mieć dolnej lub górnej granicy), np. poniżej 10, powyżej 80. Tak skonstruowane przedziały określamy jako otwarte lub niedomknięte. Numer klasy Przedział klasowy 1 Poniżej 5 2 5 10 3 10 15 4 15 20 5 20 lub więcej

Szeregi rozdzielcze przedziałowe (z przedziałami klasowymi) Budując szeregi rozdzielcze przedziałowe należy najpierw zdecydować o liczbie przedziałów, ich rozpiętości i sposobie określenia granic przedziałów. Teoria statystyki nie podaje jednoznacznych wzorców budowy szeregów rozdzielczych przedziałowych. Podstawowym warunkiem, jaki trzeba spełnić budując taki szereg, jest dbałość o rozłączność klasyfikacji zbiorowości (poszczególne przedziały nie mogą zachodzić na siebie) oraz o to, aby była ona przeprowadzona w sposób wyczerpujący (wyróżnione klasy powinny obejmować wszystkie jednostki badanej zbiorowości).

Schemat postępowania przy budowaniu przedziałowego szeregu rozdzielczego

I. Ustalenie liczby klas Liczba przedziałów klasowych zależy od obszaru zmienności cechy, tj. różnicy między najmniejszą a największą wartością cechy, od liczebności zbiorowości oraz od stopnia szczegółowości informacji jaki chcemy uzyskać w wyniku badania statystycznego. Zaleca się, aby liczbę przedziałów zwiększać w miarę zwiększania liczebności zbiorowości oraz rozszerzania obszaru zmienności cechy. Należy jednak robić to z ogromnym wyczuciem: zbyt mało przedziałów utrudniona identyfikacja prawidłowości w zbiorowości, zbyt dużo przedziałów mniejsza przejrzystość.

I. Ustalenie liczby klas Liczbę klas k można oszacować korzystając z następującego wzoru: k N, gdzie N oznacza liczbę obserwacji w całej zbiorowości statystycznej. Zalecana liczba klas w zależności od N N k Do 15 3 4 16 31 4 5 32 63 5 6 64 127 6 7 128 255 7 8 256 511 8 9 Powyżej 512 10

II. Ustalenie początku pierwszego przedziału klasowego x 01 Za początek pierwszego przedziału klasowego zwykle przyjmuje się najniższą wartość cechy w badanej zbiorowości. Można też przyjąć liczbę nieco niższą, np. gdy najniższa wartość jest ułamkiem, można przyjąć za x 01 najbliższą mniejszą od x min liczbę całkowitą, gdzie x min oznacza najmniejszą wartość w zbiorowości. x 01 = 1 x min = 1,7 0 1 2 3

III. Ustalenie rozpiętości przedziałów klasowych Rozpiętość przedziałów klasowych można wyznaczyć ze wzoru: h = x max x min. k Najlepiej, jeśli jest ona jednakowa dla wszystkich przedziałów klasowych. h h h x 01 x 11 = x 02 x 12 = x 03 x 13

IV. Budowanie przedziałów klasowych Budujemy przedziały klasowe domykając je zgodnie z rozpiętością przedziałów klasowych. Należy uważać, aby żadna jednostka statystyczna nie znalazła się poza szeregiem statystycznym. Zaleca się, aby przedziały klasowe dla cech ciągłych zazębiały się: górna granica danego przedziału była taka sama jak dolna granica przedziału następnego, przy czym obserwację równą tej granicy zalicza się zwykle do przedziału następnego. W przypadku cech skokowych zaleca się, aby granice te się nie pokrywały. x 0i, x 1i ) x 0i+1, x 1i+1 )

V. Przyporządkowanie poszczególnych jednostek do przedziałów klasowych Zliczamy poszczególne jednostki statystyczne o wartościach cechy z danego przedziału, obliczając w ten sposób liczebności cząstkowe. Cecha ciągła Cecha skokowa x 0i x 1i n i x 0i x 1i n i 0 5 = 0,5) 9 0 4 = {0,1,2,3,4} 9 5 10 = 5,10) 15 5 9 = {5,6,7,8,9} 15 10 15 = 10,15) 22 10 14 = {10,11,12,13,14} 22 15 20 = 15,20) 11 15 19 = {15,16,17,18,19} 11 20 25 = 20,25) 3 20 24 = {20,21,22,23,24} 3 Razem 60 Razem 60

Przykład Poniższe dane o podregionach Polski z roku 2007 wykorzystamy do pogrupowania podregionów ze względu na liczbę miast i produkcji sprzedanej przemysłu. Źródło: Bank Danych regionalnych, www.stat.gov.pl L.p. Województwo Podregion Liczba miast Produkcja sprzedana przemysłu (w mln zł) 1 łódzki 11 5806,4 2 łódzkie m. Łódź 1 10497,3 3 piotrkowski 10 12043,0 64 elbląski 19 7520,9 65 warmińsko-mazurskie ełcki 10 3079,6 66 olsztyński 20 8221,2

Przykład W badaniu tym jednostki statystyczne stanowią poszczególne podregiony Polski. Badamy je pod względem dwóch cech: liczby miast (cecha mierzalna skokowa) oraz produkcji sprzedanej przemysłu (cecha mierzalna ciągła). Źródło: Bank Danych regionalnych, www.stat.gov.pl L.p. Województwo Podregion Liczba miast Produkcja sprzedana przemysłu (w mln zł) 1 łódzki 11 5806,4 2 łódzkie m. Łódź 1 10497,3 3 piotrkowski 10 12043,0 64 elbląski 19 7520,9 65 warmińsko-mazurskie ełcki 10 3079,6 66 olsztyński 20 8221,2

Przykład Część 1. Grupowanie podregionów według liczby miast. Liczba miast jest cechą skokową. W przypadku badanych podregionów ma ona zbyt wiele wariantów, aby grupowanie w szereg rozdzielczy punktowy było właściwe. Zbudujemy więc szereg rozdzielczy przedziałowy. Ponieważ badamy 66 podregionów, to szacujemy liczbę klas k 66 = 8,12 8.

Przykład Niektóre miasta mają status podregionu, stąd najmniejsza wartość badanej cechy będzie równa 1. Taki będzie zatem początek pierwszego przedziału klasowego. Stałą rozpiętość przedziałów klasowych szacujemy na h = 31 1 8,12 Źródło: Bank Danych regionalnych, www.stat.gov.pl L.p. Województwo Podregion = 3,69 4. Liczba miast Produkcja sprzedana przemysłu (w mln zł) 1 łódzkie łódzki 11 5806,4 2 m. Łódź 1 10497,3 59 kujawsko-pomorskie włocławski 31 11589,9

Przykład Przystępujemy do budowy szeregu rozdzielczego. Numer klasy i Liczba miast xi Liczba podregionów ni 1 1 4 7 2 5 8 8 3 9 12 16 4 13 16 14 5 17 20 11 6 21 24 5 7 25 28 3 8 29 32 2 Razem 66

Przykład Część 2. Grupowanie podregionów według produkcji sprzedanej przemysłu. Przystępując do grupowania podregionów względem tej cechy warto zmienić jej jednostkę tak, aby posługiwać się mniejszymi liczbami. W tym celu wyraziliśmy wartość produkcji w miliardach złotych. Źródło: Bank Danych regionalnych, www.stat.gov.pl L.p. Województwo Podregion Liczba miast Produkcja sprzedana przemysłu (w mld zł) 1 łódzki 11 5,8064 2 łódzkie m. Łódź 1 10,4973 3 piotrkowski 10 12,043

Przykład Liczba klas w tym przypadku nie zmieni się, gdyż w dalszym ciągu badamy te same podregiony, a zatem k = 8. Najmniejszą produkcję odnotowano w podregionie bielskim 1367,3 mln zł, a największą w Warszawie 88399,9 mln zł. Stałą rozpiętość przedziałów ustalimy na poziomie: h = 88399,9 1367,3 8,12 = 10718,3 mln zł 11 mld zł. Za początek pierwszego przedziału klasowego, czyli x01 przyjmujemy 1 mld zł.

Przykład Numer klasy i Produkcja sprzedana przemysłu (w mld zł) xi Liczba podregionów 1 1 12 41 2 12 23 19 3 23 34 3 4 34 45 2 5 45 56 0 6 56 67 0 7 67 78 0 8 78 89 1 Razem 66 Zbudowany szereg nie najlepiej reprezentuje dane produkcji w poszczególnych regionach: produkcja Warszawy wyraźnie przewyższa inne regiony pod względem produkcji. ni

Przykład W takiej sytuacji nie warto trzymać się sztywno reguł statystycznych. Przedziały, w których odnotowano największe skupienie podregionów lepiej jest podzielić na mniejsze, zaś podregion nietypowy (m. Warszawa) zaliczyć do ostatniego, otwartego przedziału: Numer klasy i Produkcja sprzedana przemysłu (w mld zł) xi Liczba podregionów 1 Poniżej 5 9 2 5 10 24 3 10 15 19 4 15 20 6 5 20 30 4 6 30 lub więcej 4 Razem 66 ni

Uwagi Jeżeli liczebność w przedziale otwartym nie przekracza 5% badanej zbiorowości, to taki przedział można domknąć szerokością przedziału sąsiedniego. Należy proponować przedziały klasowe w taki sposób, aby największa liczba jednostek posiadała wartości cechy ze środkowego przedziału (środkowej klasy). Jeśli nie ma przeciwskazań, rozpiętości przedziałów klasowych powinny być jednakowe.

Graficzna prezentacja danych Najczęściej wykorzystuje się następujące typy wykresów: Wykresy słupkowe, Wykresy kołowe, Wykresy liniowe, Kartogramy, Wykresy w układzie współrzędnych (histogramy, krzywe liczebności, diagramy).

Wykres słupkowy 16 Liczba miast w podregionach polski Liczba podregionów 12 8 4 0 1-4 5-8 9-12 13-16 17-20 21-24 25-28 29-32 Liczba miast

Histogram Produkcja sprzedana przemysłu w podregionach Liczba podregionów 0 5 10 15 20 25 30 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 Produkcja sprzedana przemysłu w mld zł

Histogram częstości względnych Produkcja sprzedana przemysłu w podregionach Liczba podregionów 0 0,1 0,2 0,3 0,4 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 Produkcja sprzedana przemysłu w mld zł