STATYSTYKA OPISOWA Wykład 1
LITERATURA Literatura podstawowa Literatura uzupełniająca 2
LITERATURA Literatura podstawowa: Zeliaś A., Pawełek B., Wanat S., Metody statystyczne. Zadania i sprawdziany, PWE, Warszawa, 2002. Statystyka ogólna w zadaniach, Red. M. Woźniak. Kraków: AE, 2004 Sobczyk M, Statystyka, PWN, Warszawa 2005 3
LITERATURA Literatura uzupełniająca: Aczel A.D., Statystyka w zarządzaniu: pełny wykład. Warszawa: PWN, 2000 Podgórski J., Statystyka dla studiów licencjackich, PWE, Warszawa 2004. Steczkowski J., Opis statystyczny, WSIiZ, Rzeszów 2005. Kot S.M., Jakubowski J., Sokołowski A., Statystyka. Podręcznik dla studiów ekonomicznych, Difin, Warszawa 2007. Metody statystyczne w analizie działalności przedsiębiorstwa, red. E. Nowak, PWE, Warszawa 2001. Zeliaś A., Metody statystyczne. Warszawa: PWE, 2000 4
5 TREŚCI PROGRAMOWE
TREŚCI PRGRAMOWE Istota i przedmiot statystyki: krótka historia, definicja statystyki, cele badań statystycznych, podział statystyki. organizacja badań statystycznych, skale pomiarowe. Podstawowe pojęcia (zbiorowość i jednostka statystyczna, cechy statystyczne), populacja generalna i próbna). Grupowanie statystyczne i prezentacja danych statystycznych (szeregi i tablice statystyczne, metody graficznej prezentacji danych). 6
TREŚCI PRGRAMOWE Metody opisu struktury zbiorowości: Miary położenia (średnia arytmetyczna, geometryczna, harmoniczna, modalna, mediana, kwantyle). Miary zmienności (wariancja, odchylenie standardowe, odchylenie przeciętne, odchylenie ćwiartkowe, współczynniki zmienności). Obszary zmienności. Miary asymetrii, Miary spłaszczenia i koncentracji. Analiza współzależności dwóch zmiennych ilościowych (korelacja i regresja liniowa). Analiza współzależności więcej niż dwóch zmiennych ilościowych (korelacja wieloraka i cząstkowa, regresja wieloraka). 7
TREŚCI PRGRAMOWE Analiza zależności dla cech niemierzalnych (korelacja rang Spearmana i Kendalla, współczynniki zależności oparte na statystyce chi-kwadrat). Metody analizy dynamiki zjawisk ekonomicznych: analiza dynamiki na podstawie indeksów i przyrostów, mechaniczne i analityczne metody wyodrębniania trendu. Elementy prognozowania szeregów czasowych. 8
ISTOTA I PRZEDMIOT STATYSTYKI Krótka historia Definicja statystyki Cele i zadania statystyki Podział statystyki 9
Geneza Można wyróżnić trzy etapy: Etap 1: Do początku XVII w. - okres ewidencji i zliczania. W starożytności w dobrze zorganizowanych państwach (jak Egipt, Grecja, Rzym, Chiny) sporządzano spisy ludności i majątków, które dostarczały bogatego materiału charakteryzującego stosunki społeczno-gospodarcze. Przykładem tutaj są tzw. cenzusy, czyli spisy przeprowadzane w starożytnym Rzymie co 5 lat. W średniowieczu prowadzone były obserwacje statystyczne głównie przez instytucje kościelne i feudałów. Miały one charakter prywatny. Spisywano budynki, inwentarz, bogactwa naturalne itp. Powstanie państw scentralizowanych i pozyskiwanie materiału statystycznego dotyczącego ludności, rolnictwa, handlu itp. 10
Geneza Etap 2: XVII - XVIII w. opisywanie zbiorowości według wzorca podanego przez państwoznawców. Dorobkiem tego okresu jest sformułowanie pojęcia zbiorowość statystyczna. W połowie XVIII w. G. Achenwall (1719-1772) po raz pierwszy używa słowa statystyka od łacińskiego status (państwo) do określenia nauki zajmującej się badaniem i opisem zjawisk masowych. Rozumiane ono było jako szeroko ujmowany zbiór wiadomości o państwie. Prezentacja otrzymanego materiału w postaci tablic. Nazwanie zwolenników takiej metody prezentacji danych tabelarystami. W Polsce w 1809 r. S. Staszic wydaje pierwsze opracowanie o charakterze statystycznym: O statystyce Polski 11
Geneza Zaobserwowanie prawidłowości ujawniających się w zjawiskach masowych. Na przykład G. Graunt (1620-1679) badając księgi stanu cywilnego Londynu wykrył prawidłowości w zgonach, W. Petty (1623-1687) opublikował pracę pt. Arytmetyka polityczna, w której wskazuje na nową naukę umożliwiającą identyfikację prawidłowości zjawisk masowych. G. Graunt i W. Petty uznawani są za pierwszych statystyków. 12
Geneza Etap 3: od XVIII w. wprowadzenie do statystyki rachunku prawdopodobieństwa, który umożliwił wypracowanie nowych metod statystycznych opartych na matematyce. Powstaje statystyka matematyczna Badanie zjawisk występujących w grach losowych i pojawienie się rachunku prawdopodobieństwa. Opublikowanie przez P. Laplace a (1749-1827) pracy pt. Analityczna teoria prawdopodobieństwa, w której przedstawia wykład rachunku prawdopodobieństwa i matematyczne wyjaśnienie prawa wielkich liczb. 13
Geneza Rozwój teorii rachunku prawdopodobieństwa przez arytmetyków politycznych i powstanie statystyki matematycznej (wnioskowania statystycznego). Do pierwszych przedstawicieli tego kierunku można zaliczyć F. Galtona (1822-1911), K. Pearsona (1857-1936), K. Gaussa (1777-1895), który stworzył teorię błędów obserwacji Rozwój metod statycznych dzięki pracom matematyków i statystyków matematycznych (np. W. Bortkiewicz, R. Fisher, A.N. Kołmogorow, A. Markow, J. Spława-Neyman, J. Śniadecki, O. Lange) 14
Geneza Współcześnie określenie statystyka ma następujące znaczenie: metoda poznawania zjawisk masowych, nauka badająca zjawiska masowe, zbiór liczb charakteryzujących zbiorowość, np. statystyka ludności, statystyka pracy, statystyka ubezpieczeń, itp. funkcja próby losowej. 15
Definicja statystyki Istniej wiele definicji statystyki. Na przykład: Statystyka to zbiór metod służących pozyskiwaniu, prezentacji i analizie danych. Statystyka to nauka o metodach badania zjawisk masowych. Statystyka to nauka zajmująca się badaniem zjawisk (procesów) masowych, czyli takich, w których mamy do czynienia z dostatecznie dużą liczbą obserwacji oraz ilościowym jej ujęciem. Statystyka to nauka traktująca o metodach ilościowych dostosowanych do badania prawidłowości zjawisk masowych. 16
Definicja statystyki Zjawisko masowe to takie zjawisko, które badane w dużej masie zdarzeń wskazuje właściwą sobie prawidłowość, jakiej nie można zaobserwować w pojedynczym przypadku. Przykłady zjawisk masowych: spożycie pewnych artykułów na 1 mieszkańca, urodzenia itp. 17
Definicja statystyki Prawidłowość stanowi efekt procesu odbywającego się w przyrodzie lub w społeczeństwie, w którym na wszystkie jednostki tworzące daną zbiorowość działa ten sam splot przyczyn głównymi i oprócz tego, na każdą indywidualną jednostkę działają przyczyny uboczne (na każdą jednostkę inne). Przyczyny główne kształtują prawidłowości w procesach masowych, natomiast uboczne powodują odchylenia od nich. 18
Cel statystyki Podstawowym celem statystyki jest pozyskiwanie i przedstawianie danych w postaci ułatwiającej ich ocenę i analizę oraz identyfikacja prawidłowości i ilościowe ich wyrażenie. Określa ona także, jakie warunki powinny być spełnione, aby badanie statystyczne zostało poprawnie przeprowadzone. 19
Zadania statystyki Do głównych zadań statystyki można zaliczyć: dokładniejszy sposób opisu interesującej nas rzeczywistości; formułowanie uogólnień na podstawie uzyskanych wyników analizy; przewidywanie rozwoju zjawisk w przyszłości, czyli pobudzanie do prognoz; dostarczanie narzędzi do porządkowania informacji o zjawiskach a przez to budowę ich ogólnego obrazu; dostarczanie narzędzi do prowadzenia analizy przyczyn kształtujących badane zjawiska i procesy, a więc umożliwianie ich klasyfikacji na czynniki główne (systematyczne) i uboczne (przypadkowe). 20
Podział statystyki Statystyka opisowa. Ukazuje metody gromadzenia, opracowania, prezentacji i analizy danych wraz z sumarycznym ich opisem za pomocą specjalnych narzędzi statystycznych. Statystyka matematyczna. To dział statystyki, który powstała na gruncie rachunku prawdopodobieństwa. Jego zadaniem jest wnioskowanie o badanym zjawisku na podstawie danych częściowych. Zalicza się do niego teorię estymacji i teorię weryfikacji hipotez statystycznych. 21
ORGANIZACJA BADAŃ STATYSTYCZNYCH Etapy badania statystycznego Rodzaje badań statystycznych Skale pomiarowe 22
Etapy badania statystycznego 1. Przygotowanie badania. Na etapie przygotowania powinno się poprawnie sformułować cel i zakres badania oraz sformułować podstawowe hipotezy badawcze, które z kolei będą weryfikowane na drodze empirycznej. 2. Obserwacja statystyczna. Polega na rejestracji wartości przyjętego zespołu cech jednostek wyróżnionej zbiorowości. W ten sposób uzyskuje się materiał statystyczny, który podlega ocenie formalnomerytorycznej. 23
Etapy badania statystycznego 3. Opracowanie statystyczne. Na tym etapie materiał liczbowy, otrzymany w wyniku przeprowadzonej obserwacji statystycznej, odpowiednio się systematyzuje i grupuje w postaci tzw. szeregów statystycznych, a następnie prezentuje w postaci różnego rodzaju tabel i wykresów. Wyróżnia się dwa rodzaje grupowania: typoplogiczne (np. według cech terytorialnych, rzeczowych, czasowych), którego celem jest wyróżnienie grup różnych jakościowo wariancyjne, którego celem jest uporządkowanie badanej zbiorowości i poznanie jej struktury i polega na łączeniu w klasy jednostek statystycznych o odpowiednich wartościach cech statystycznych. 24
Etapy badania statystycznego 4. Analiza statystyczna. Na tym etapie, zweryfikowany i komputerowo przetworzony materiał statystyczny jest poddawany wyczerpującej analizie statystycznej z wykorzystaniem metod statystycznych, umożliwiających wykrycie prawidłowości w badanej zbiorowości. Wybór konkretnej metody jest zdeterminowany celem badania, ilością i kompletnością zebranego materiału statystycznego. Są to następujące metody: analiza struktury, analiza współzależności, analiza szeregów czasowych, analiza przestrzenno-czasowa. 25
Rodzaje badań statystycznych Spisy Pełne Rejestracja bieżąca Rodzaje badań statystycznych Sprawozdawczość Reprezentacyjne Częściowe Monograficzne Ankietowe 26
Rodzaje badań statystycznych Badanie pełne. Z badaniem pełnym (całkowitym) mamy do czynienia, gdy obserwacji podlegają wszystkie elementy zbiorowości generalnej. Badanie częściowe. Z badaniem częściowym mamy do czynienie, gdy obserwacji podlega tylko część zbiorowości generalnej, a więc próba (losowo lub celowo wybrana). 27
Rodzaje badań statystycznych Rodzaje badań częściowych: Badanie reprezentacyjne. Należy do badań częściowych o największej wartości. Pozwala ono z dużym prawdopodobieństwem uogólnić wyniki uzyskane ze zbiorowości próbnej na całą populację (zbiorowość). Badanie monograficzne. Polega na wyczerpującej obserwacji np. grupy społecznej, wsi, miasta. Umożliwia ono poznanie charakterystycznych właściwości zbiorowości w formie ilościowej i jakościowo-opisowej. Badanie ankietowe. Jest obecnie najczęściej stosowaną metodą obserwacji częściowej. Sprowadza się ono do gromadzenia informacji pierwotnych, tj. odpowiedzi na pytania przygotowane przez osobę organizującą badania a zbierane przez ankietera. W badaniu ankietowym korzysta się ze specjalnie opracowanego formularza, tzw. kwestionariusza ankietowego, w którym zapisuje się materiał źródłowy. 28
Rodzaje badań statystycznych Rodzaje badań (ze względu na odstępy czasu między badaniami) Ciągłe (są to badania dynamiczne prowadzone nieprzerwanie, np. rejestracja urodzeń, małżeństw, zgonów, ewidencja bezrobotnych) Okresowe (prowadzone są w ściśle określonych odstępach czasu, np. spisy ludności, spisy rolne, spis przemysłu) Doraźne (jest organizowane w sytuacjach szczególnych, np. klęsk żywiołowych, gdy interesują nas powstałe straty) 29
Skale pomiarowe Skale pomiarowe Nominalna (relacja: równe lub różne) Porządkowa (relacja: większe lub mniejsze) Przedziałowa (relacja: większe o tyle) Ilorazowa (relacja: tyle razy większe) 30
Skale pomiarowe Skala nominalna jest skalą najprostszą. Stosowanie skali nominalnej polega na dzieleniu jakiejś grupy elementów na podgrupy, które się od siebie różnią ze względu na interesującą nas cechę. Pomiar według skali nominalnej nie jest więc niczym innym, jak tylko klasyfikacją elementów. Szczególnym przypadkiem skali nominalnej jest skala dychotomiczna stosowana przy pomiarze zmiennych przyjmujących tylko dwie wartości. 31
Skale pomiarowe Skala porządkowa jest silniejsza od nominalnej. Wynikami pomiaru są liczby wyznaczające kolejność występowania (rangi) elementów, nie określają jednak odległości między nimi. Mając pomiary dokonane według skali porządkowej, możemy z nich wyprowadzić wnioski dotyczące także skali nominalnej, ale nie odwrotnie. Skala przedziałowa (interwałowa). Pomiary na tej skali informują nie tylko o porządku mierzonych elementów, lecz także o tym, o ile jeden element jest większy od drugiego. Skala ilorazowa (stosunkowa). Jest to taka skala przedziałowa, która ma absolutne zero. 32
33 PODSTAWOWE POJĘCIA
Podstawowe pojęcia Zbiorowość generalna (populacja) Jest to dowolnych elementów objętych badaniem statystycznym. zbiór Próba (zbiorowość próbna). Jest to wyodrębniona część zbiorowości generalnej. Od próby wymaga się, aby była reprezentatywna, tzn. z przyjętą z góry dokładnością opisywała strukturę populacji generalnej. Na reprezentatywność próby wpływ wywierają dwa czynniki: sposób doboru próby i liczebność próby. 34
Podstawowe pojęcia Jednostka statystyczna. Jest to element badanej zbiorowości. Jednostka statystyczna musi być precyzyjnie określona pod względem: rzeczowym (co lub kogo badamy) przestrzennym (miejsce prowadzonych badań) czasowym (okres objęty badaniem). Cecha statystyczna. Jest to określona właściwość jednostek statystycznych tworzących badaną zbiorowość. 35
Podstawowe pojęcia Cechy statystyczne Ilościowe Jakościowe Ciągłe Skokowe 36
37 GRUPOWANIE DANYCH- SZEREGI STATYSTYCZNE
Grupowanie danych-szeregi statystyczne Materiał liczbowy, otrzymany w wyniku przeprowadzonej obserwacji statystycznej należy odpowiednio usystematyzować i pogrupować w postaci tzw. szeregów statystycznych. Rozróżnia się dwa rodzaje grupowania: grupowanie typologiczne (według cechy jakościowej) - polega na podzieleniu zbiorowości niejednorodnej z punktu widzenia cechy jakościowej na grupy względnie jednorodne grupowanie wariancyjne (według cechy ilościowej). Szeregiem statystycznym nazywamy ciąg wielkości statystycznych uporządkowanych według określonego kryterium 38
Grupowanie danych-szeregi statystyczne Punktowe Proste Szczegółowe Z cechą mierzalną (ilościową) Skumulowane Proste Rozdzielcze Przedziałowe Skumulowane Szeregi statystyczne Z cechą niemierzalną (jakościową) Momentów Geograficzne Inne Czasowe Okresów 39
Grupowanie danych-szeregi statystyczne Sposób grupowani i wybór szeregu zależy od Rodzaju badania Rodzaju cechy statystycznej Liczby obserwacji Przekrojowe Ilościowa Szczegółowe Czasowe Jakościowa Rozdzielcze 40
Grupowanie danych-szeregi statystyczne Definicje poszczególnych rodzajów szeregów statystycznych: Szeregiem szczegółowym nazywamy uporządkowany ciąg wartości badanej cechy statystycznej. Szereg rozdzielczy stanowi zbiorowość statystyczną podzieloną na części (klasy) według określonej cechy jakościowej lub ilościowej z podaniem liczebności każdej z wyróżnionych klas. Szereg czasowy (dynamiczny, chronologiczny) powstaje w wyniku grupowania typologicznego i wariancyjnego, gdy podstawą grupowania jest zmiana badanego zjawiska w czasie. 41
Grupowanie danych-szeregi statystyczne Szereg czasowy (dynamiczny, chronologiczny) powstaje w wyniku grupowania typologicznego i wariancyjnego, gdy podstawą grupowania jest zmiana badanego zjawiska w czasie. Rozróżnia się dwa rodzaje szeregów czasowych: szeregi czasowe okresów zawierają informacje o wartości badanego zjawiska w krótszych lub dłuższych okresach (np. miesiąc, kwartał, rok); szeregi czasowe momentów ujmuje wielkość zjawiska w danym momencie, najczęściej na początek lub koniec miesiąca, kwartału, roku. 42
43 PREZENTACJA GRAFICZNA DANYCH STATYSTYCZNYCH
Rodzaje wykresów statystycznych Punktowe 4,5 4 3,5 3 2,5 2 1,5 1 0,5 0 Wartości Y 0 1 2 3 4 5 44
Rodzaje wykresów statystycznych Liniowe (szczególną odmianą wykresu liniowego jest diagram zwany wielobokiem liczebności). 6 5 4 3 2 Seria 1 Seria 2 Seria 3 1 0 Kategoria 1 Kategoria 2 Kategoria 3 Kategoria 4 45
Rodzaje wykresów statystycznych Diagram (wielobok liczebności) 4,5 4 3,5 3 2,5 2 1,5 1 0,5 0 1-2 2-3 3-4 4-5 5-6 46
Rodzaje wykresów statystycznych Kołowe Sprzedaż 1. kwartał 2. kwartał 3. kwartał 4. kwartał 47
Rodzaje wykresów statystycznych Kołowe Sprzedaż 1. kwartał 2. kwartał 3. kwartał 4. kwartał 48
Rodzaje wykresów statystycznych Kolumnowe 6 5 4 3 2 Seria 1 Seria 2 Seria 3 1 0 Kategoria 1 Kategoria 2 Kategoria 3 Kategoria 4 49
Rodzaje wykresów statystycznych Kolumnowe 5 4 3 2 1 0 Seria 3 Seria 1 Seria 1 Seria 2 Seria 3 50
Rodzaje wykresów statystycznych Słupkowe Kategoria 4 Kategoria 3 Kategoria 2 Seria 1 Seria 2 Seria 3 Kategoria 1 0% 20% 40% 60% 80% 100% 51
Rodzaje wykresów statystycznych Słupkowe Kategoria 4 Kategoria 3 Kategoria 2 Seria 3 Seria 2 Seria 1 Kategoria 1 0 1 2 3 4 5 52
Rodzaje wykresów statystycznych Giełdowe 160 140 120 100 80 60 40 20 0 70 60 50 40 30 20 10 0 Wielkość obrotów Maks. Min. Zamknięcie 53
Rodzaje wykresów statystycznych Radarowe 09-01-2002 05-01-2002 40 30 20 10 0 06-01-2002 Seria 1 Seria 2 08-01-2002 07-01-2002 54
Rodzaje wykresów statystycznych Radarowe 05-01-2002 40 30 09-01-2002 20 10 0 06-01-2002 Seria 1 Seria 2 08-01-2002 07-01-2002 55
Rodzaje wykresów statystycznych Powierzchniowe 5 4 3 2 1 0 Seria 3 Seria 2 Seria 1 4-5 3-4 2-3 1-2 0-1 56
Rodzaje wykresów statystycznych Kartogramy, stosowane do analiz strukturalnych w ujęciu przestrzennym. Piramidy, używane w analizach demograficznych np. do ilustracji struktury ludności według wieku i płci. Obrazkowe polegające na wyobrażeniu wielkości zjawiska przez odpowiednią wielkość znaku obrazkowego. 57
GRUPOWANIE WARIANCYJNE Szereg szczegółowy prosty Szereg ważony Szereg rozdzielczy 58
Szereg szczegółowy prosty Oznaczenia: X - badana zmienna n - liczba jednostek statystycznych x i (i = 1,...,n) - wartość tej zmiennej odpowiadającą i tej jednostce statystycznej Szereg szczegółowy prosty Uporządkowany nierosnąco lub niemalejąco ciąg wartości badanej zmiennej. 59
Szereg szczegółowy prosty Szereg szczegółowy prosty to ciąg wartości tej zmiennej: x 1, x 2,...,x n uporządkowany niemalejąco: x 1 x 2... x n lub nierosnąco: x 1 x 2... x n 60
Szereg ważony Szereg ważony (rozdzielczy punktowy) x i f i x 1 f 1 x 2 f 2 x k f k n k i 1 f i 61
Szereg rozdzielczy Szereg rozdzielczy (rozdzielczy z przedziałami klasowymi) x i f i x0 x 1 f 1 x1 x 2 f 2 x k 1 x k k f 62
Szereg rozdzielczy Konstrukcja szeregu rozdzielczego (jeden ze sposobów): Liczba klas : k n Długość klasy: i R k 1 x max k x 1 min Początek pierwszej klasy: x 0 x min i 2 63
Prezentacja szeregu rozdzielczego histogramy histogramy liczebności skumulowanych diagramy diagramy liczebności skumulowanych 64