PROJEKTOWANIE BADANIA STATYSTYCZNEGO Termin statystyka ma wiele znaczeń. Po pierwsze określa się nim zbiór informacji liczbowych, dotyczących celowo wybranej grupy zjawisk. W tym sensie mówi się np. o statystyce majątku narodowego, statystyce produkcji, statystyce zdrowia czy też o statystykach branżowych. Statystyka dostarcza więc informacji liczbowych o podstawowych dziedzinach życia i funkcjonowania państwa. Po drugie jest to dyscyplina naukowa, traktująca o metodach liczbowego opisu i wnioskowania o prawidłowościach występujących w procesach masowych. Po trzecie nowoczesna statystyka to nauka dostarczająca metod (narzędzi) do podejmowania decyzji w warunkach niepewności. Umiejętność formułowania precyzyjnych sądów, dotyczących możliwego przebiegu zdarzeń, i dokonywania wyborów między rozmaitymi możliwościami, jest najistotniejszym aspektem życia współczesnego społeczeństwa. Kontrolowanie ryzyka wyznacza kierunek działań w różnych dziedzinach, związanych z podejmowaniem decyzji. To właśnie powoduje, iż współcześnie statystykę określa się jako naukę o podejmowaniu decyzji diagnostycznych (, jak było" i, jak jest") oraz decyzji predyktywnych (,jak może być") w warunkach niepewności. Wiele zjawisk w otaczającej nas rzeczywistości ma charakter 1
masowy. Zjawiska (procesy) masowe to takie, które powtarzają się dostatecznie często. Każde zjawisko: przyrodnicze, techniczne czy ekonomiczno-społeczne, kształtuje się pod wpływem dwojakiego rodzaju przyczyn: głównych, podstawowych (typowych), ' ubocznych, przypadkowych (nietypowych). Przyczyny główne wpływają na każde zjawisko w sposób jednakowy działają w ściśle określonym kierunku, co kształtuje pewną prawidłowość wyników. Przyczyny uboczne mają charakter przypadkowy, zróżnicowany, co powoduje zakłócenie wyników obserwacji. Wyniki obserwacji są więc efektem konieczności i przypadkowości. Statystyka opisowa dostarcza metod i procedur gromadzenia, opracowania i prezentacji danych statystycznych. Celem statystyki opisowej jest podanie zwięzłego opisu określonego materiału statystycznego. Jeżeli zgromadzone dane dotyczą części badanej zbiorowości, sam opis może być niewystarczający. Uogólnienie wyników zaobserwowanych na podstawie badań częściowych jest możliwe tylko w przypadku, gdy badania te są odpowiednio przeprowadzone. Statystyka matematyczna dostarcza metod wyboru prób losowych i reguł wnioskowania, czyli pozwala na uogólnienia wniosków wynikających z obserwacji części zbiorowości tak, aby ryzyko popełnienia błędu było małe. Wnioskowanie statystyczne opiera się na rachunku prawdopodobieństwa. Rozwój techniki komputerowej, w tym Internetu, stworzył nową sytuację w dziedzinie gromadzenia, przechowywania i szybkiego 2
dostarczania informacji praktycznie na każdy temat (jeśli tylko istnieje popyt na taką informację i środki finansowe na jej wytworzenie i dostarczenie). Jest to wyzwanie dla współcześnie pojmowanej statystyki, statystyki informatycznej czyli nowoczesnej dziedziny wiedzy o zarządzaniu informacją publiczną. ZBIOROWOŚĆ GENERALNA, ZBIOROWOŚĆ PRÓBNA Zbiory dowolnych elementów (osób, przedmiotów, faktów), podobnych pod względem określonych cech (ale nie identycznych) i poddanych badaniom statystycznym, nazywa się zbiorowościami statystycznymi lub populacjami statystycznymi. Zbiorowości statystyczne mogą być: skończenie lub nieskończenie liczne, statyczne (gdy elementy obserwowane są w danym momencie) lub dynamiczne (w określonym przedziale czasu), jednowymiarowe (gdy elementy poddaje się badaniu ze względu na jedną cechę) lub wielowymiarowe (w przypadku rozpatrywania wielu cech), jednorodne lub niejednorodne. Bezpośredniej obserwacji lub pomiarowi podlegają elementy składowe zbiorowości (obiekty badania), określane mianem jednostek statystycznych. Zbiorowość (populację) generalną stanowią wszystkie elementy będące przedmiotem badania, co do których chcemy formułować wnioski ogólne. 3
Zbiorowość próbna (próba) jest to podzbiór populacji generalnej, obejmujący część jej elementów wybranych w określony sposób. Próba podlega badaniu statystycznemu, a wyniki badania są uogólniane na zbiorowość generalną. W praktyce, na ogół, nie możemy badać całej zbiorowości generalnej, a chcąc zbadać interesujące cechy, pobieramy skończoną liczbę elementów i poddajemy je obserwacji. Liczbę elementów próby oznaczać będziemy literą n. RODZAJE BADANIA STATYSTYCZNEGO Przez badanie statystyczne rozumie się ogół prac mających na celu poznanie struktury określonej zbiorowości statystycznej. Proces zbierania informacji statystycznych nazywamy obserwacją statystyczną. Obserwacje statystyczne można uzyskać na podstawie badania statystycznego: całkowitego (wyczerpującego) gdy obserwacji podlegają wszystkie elementy zbiorowości generalnej, częściowego, gdy obserwacji podlega tylko część zbiorowości generalnej, a więc próba. Wyróżnia się następujące rodzaje badań częściowych: badanie reprezentacyjne, badanie monograficzne, badanie ankietowe. Wśród badań całkowitych wyróżnia się zwykle: spis statystyczny, 4
inwentaryzację, rejestrację bieżącą oraz sprawozdawczość statystyczną. Spis statystyczny jest to jednorazowe lub powtarzalne (co pewien okres) badanie obejmujące wszystkie jednostki zbiorowości statystycznej. W Polsce przeprowadza się np. co 10 lat narodowy spis powszechny ludności. Spis statystyczny jest badaniem kosztownym, wymagającym odpowiedniego przygotowania technicznego i organizacyjnego. Inwentaryzacja jest to spis ujmujący faktyczny stan ilościowy i wartościowy majątku określonej jednostki administracyjnej lub podmiotu gospodarczego. Rejestracja bieżąca jest to systematyczne notowanie ściśle określonych faktów, będących przedmiotem badań. Typowymi przykładami rejestracji bieżącej są: ewidencja urodzeń, zgonów, małżeństw, ewidencja ruchu ludności, a także ewidencja operacji bankowych, rejestracja przedsiębiorstw (REGON) itp. Sprawozdawczość statystyczna obejmuje informacje przekazywane obligatoryjnie na odpowiednich formularzach przez osoby fizyczne, podmioty gospodarcze i instytucje jednostkom nadrzędnym lub organom statystycznym. Można tu wymienić sprawozdania dotyczące wyników gospodarczych czy zeznania podatkowe. W praktyce badania częściowe są stosowane znacznie częściej niż badania całkowite. Konieczność takiego postępowania wynika z tego, że nie zawsze jest możliwe zbadanie całej zbiorowości generalnej; dotyczy to np. zbiorowości bardzo licznych lub zbiorowości nieskończonych (takie występują w naukach eks- 5
perymentalnych). Przy ocenie preferencji wyborczych jest praktycznie niemożliwe przepytanie wszystkich wyborców. Ankieterzy wyspecjalizowanych ośrodków badania opinii publicznej zbierają więc opinie w odpowiednio wybranej grupie osób. Te opinie stanowią podstawę formułowania oceny tych preferencji. Naukowcy pracują nad nowym lekiem. Potwierdzenie efektywności i bezpieczeństwa leku jest procesem długotrwałym, pracochłonnym i kosztownym. Nigdy jednak nie będzie można powiedzieć, że dysponują pełnymi danymi na temat działania tego leku czy też jego efektów ubocznych. Za badaniami częściowymi przemawiają zatem względy ekonomiczne (obniżają one koszty badań) oraz aktualność wyników badania (skracają czas prowadzonych badań). Badania częściowe muszą być stosowane także wtedy, gdy jednostki statystyczne w trakcie badań ulegają zniszczeniu (np. badanie jakości produktów). Można powiedzieć, że przy podejmowaniu kluczowych decyzji w zasadzie nie możemy się obejść bez badań prób. Pojawia się jednak pytanie: na ile reprezentatywne są próby, na których podstawie wypowiadamy sądy o zbiorowości generalnej? Zarówno badania całkowite, jak i częściowe mogą być obarczone błędami popełnianymi w trakcie organizacji badania, pomiaru cech i przetwarzania wyników. W badaniu częściowym błędy mogą wystąpić dodatkowo na skutek tego, że struktura próby 6
może się różnić od struktury zbiorowości Wynika stąd, że gdy korzystamy z badania częściowego, wydanie prawdziwego sądu jest zdarzeniem losowym, któremu odpowiada jakieś prawdopodobieństwo. To prawdopodobieństwo jest tym większe, im próba lepiej reprezentuje zbiorowość. Aby uzyskane wyniki badania próby można było odnieść do zbiorowości generalnej z określoną dokładnością, próba musi być reprezentatywna, a zatem muszą być spełnione dwa warunki: musi być wybrana losowo tzn. każda jednostka danej zbiorowości ma znane, różne od zera prawdopodobieństwo znalezienia się w próbie, powinna być dostatecznie liczna. Pojęcie próby dostatecznie licznej jest pojęciem umownym. Często oznacza to próbę o bardzo umiarkowanej liczności. Należy także zauważyć, że dobór próby dla jednych cech jest losowy, dla innych zaś może być nielosowy. Zatem o losowości próby można mówić tylko w odniesieniu do konkretnych cech. W praktyce, a w badaniach ekonomiczno--społecznych szczególnie, uzyskanie prób losowych jest w dużym stopniu utrudnione bądź wręcz niemożliwe, zatem w miejsce losowości przyjmuje się pojęcie niezależności jednostek ze względu na wyróżnione zmienne W przypadku prób nielosowych należy jednak zawsze poprzestać jedynie na opisie statystycznym. Badanie monograficzne polega na badaniu indywidualnego przypadku, np. jednego regionu, przedsiębiorstwa czy gospodarstwa domowego, przy czym oprócz charakterystyk 7
liczbowych podaje się też informacje w formie opisowej. Badanie ankietowe jest jednym z najszybszych sposobów badania zjawisk masowych, stosowanym zawsze w celu wyświetlenia jakiegoś specyficznego, ściśle określonego problemu (np. ocena poziomu życia w gospodarstwach domowych, nastroje społeczne czy preferencje konsumentów). Informacje uzyskuje się na podstawie odpowiedzi na przygotowane uprzednio pytania, zadawane wybranym osobom. RODZAJE CECH STATYSTYCZNYCH Jednostki statystyczne (obiekty) charakteryzują się pewnymi właściwościami, które określa się mianem cech statystycznych. W celu uzyskania porównywalności materiału statystycznego należy wszystkie jednostki określić pod względem: o rzeczowym (co lub kogo poddajemy badaniu statystycznemu), o przestrzennym (gdzie badamy), o czasowym (jaki okres obejmuje badanie lub w jakim momencie się ono odbywa). Wymienione atrybuty cech określa się jako tzw. cechy stale (rzeczowe, przestrzenne i czasowe). Cechy stałe są wspólne wszystkim jednostkom danej zbiorowości i nie podlegają badaniu, a jedynie decydują o zaliczeniu jednostki do określonej zbiorowości. Cechy zmienne to właściwości, które różnią poszczególne jednostki statystyczne. 8
Cechy statystyczne mierzalne niemierzalne Ciągłe skokowe geograficzne inne KLASYFIKACJA CECH STATYSTYCZNYCH W dalszym ciągu przez cechy statystyczne będziemy rozumieć cechy zmienne, gdyż one właśnie podlegają obserwacji (pomiarowi). Cechy statystyczne ogólnie dzieli się na : Cechy niemierzalne (jakościowe, kwalitatywne). Są one zwykle określane słownie (np. płeć, przynależność sektorowa itd.). Wśród ogółu cech niemierzalnych na szczególną uwagę zasługują cechy obrazujące przestrzenny rozkład badanych zjawisk (rozmieszczenie terytorialne), tzw. cechy geograficzne Cechy mierzalne (ilościowe, kwantytatywne). Są to właściwości, które można zmierzyć i wyrazić za pomocą odpowiednich jednostek fizycznych (np. w kilogramach, centymetrach, sztukach itp.). Do cech mierzalnych zalicza się także cechy quasi-ilościowe, zwane porządkowymi. Cechy te kwantyfikują zwykle natężenie 9
badanej właściwości przedstawionej w sposób opisowy, porządkując w ten sposób zbiorowość (np. ocena wiadomości studenta: bardzo dobra, dobra albo krócej 5, 4 itp.). Cechy mierzalne, zwane dalej także zmiennymi, dzieli się na: skokowe (dyskretne), a wiec takie, które przyjmują skończony lub przeliczalny zbiór wartości na danej skali liczbowej, przy czym najczęściej jest to zbiór liczb całkowitych dodatnich (np. liczba osób w rodzinie, liczba usterek w wyprodukowanym towarze czy wspomniane wcześniej oceny itp.), ciągłe, które mogą przyjąć każdą wartość z określonego przedziału liczbowego [a, b], przy czym liczba miejsc po przecinku jest zależna od dokładności dokonywanych pomiarów (np. waga detalu). W praktyce występują także cechy, które z natury swej są skokowe, lecz traktuje się je jako ciągłe, gdyż skala wartości, jakie te cechy mogą przybierać, jest bardzo duża. Są to tzw. cechy ąuasiciągle (np. płace w Polsce). Cechy mierzalne (zmienne) oznaczać będziemy dużymi literami X, Y, Z,..., a wartości cech małymi literami: x, y, z,.... W badaniach społeczno-ekonomicznych, zwłaszcza gdy dokonujemy porównywania i porządkowania (rangowania) zbiorowości wielowymiarowych istotnego znaczenia nabiera podział zmiennych na stymulanty, nominanty i destymulanty. Stymulantą nazywamy taką cechę, której wyższe wartości pozwalają zakwalifikować daną jednostkę statystyczną jako lepszą z punktu widzenia realizowanego badania. 10
Destymulantą nazywamy taką cechę, której wysokie wartości świadczą o niskiej pozycji jednostki w zbiorze. W przypadku nominant pożądane są normatywne" poziomy zmiennych. Wszelkie odchylenia nominant od normalnego poziomu są zjawiskiem negatywnym z punktu widzenia przeprowadzającego badania. SKALE POMIAROWE Z cechami statystycznymi wiążą się pojęcia pomiaru i skal pomiarowych. W matematyce liczby zwykle nie są merytorycznie interpretowalne. Gdy dokonujemy pomiaru, liczby stają się wielkościami mianowanymi (np. wzrost w cm itp.). Pomiar jest to więc czynność przyporządkowania liczb przedmiotom (obiektom) lub wydarzeniom zgodnie z pewnym zbiorem reguł. Wynikiem pomiaru są dwa rodzaje wielkości, a więc te, które mówią o liczebności zbioru obiektów, i te, które charakteryzują stopień nasilenia zjawiska. Rozróżnia się cztery podstawowe skale pomiarowe: nominalną (rozróżnia : równe lub różne), porządkową (rozróżnia: większe lub mniejsze), przedziałową (rozróżnia: większe o tyle), stosunkową (rozróżnia: tyle razy większe). Skala nominalna polega na zastosowaniu liczby jako nazwy. Pomiar na tej skali polega wiec na grupowaniu jednostek w klasy (kategorie), którym przypisuje się nazwy czy liczby. W tej skali można także porządkować klasy pod względem liczności. Na przykład klasa studenci skategoryzowana według rodzaju studiów: ekonomiczne (1), politechniczne (2), medyczne (3). Szczególnym 11
przypadkiem tej skali jest skala dychotomiczna dwupunktowa. Skala porządkowa: pomiar polega na grupowaniu jednostek w klasy (kategorie), którym przypisuje się nazwy czy liczby i porządkuje się te klasy ze względu na stopień natężenia, badanej cechy. Każdemu ze stanów, według wzrostu natężenia, można przypisać liczbę. Proces ten nazywa się rangowaniem. Skala przedziałowa występuje wtedy, gdy uporządkowany zbiór wartości cechy składa się z liczb rzeczywistych. Zero w tej skali ustalone jest dowolnie, czego przykładem są np. skale Celsjusza czy Fahrenheita. W obu tych skalach zero jest umowne (0 Celsjusza to + 32 w skali Fahrenheita). Skala pozwala tylko stwierdzić, że np. w jednym pomieszczeniu temperatura jest o tyle" (np. o 5 ) wyższa od temperatury w drugim pomieszczeniu. Skala stosunkowa (ilorazowa) spełnia wszystkie aksjomaty liczb. Pomiary w tej skali charakteryzują się stałymi ilorazami i zerem bezwzględnym. Tylko w tej skali możliwe jest porównywanie jednostek za pomocą względnych charakterystyk: np. jeden obiekt jest dwa razy cięższy od drugiego. Skale nominalna i porządkowa, zwane skalami słabymi, dotyczą głównie cech jakościowych, skale zaś przedziałowa i stosunkowa, tzw. skale mocne, cech ciągłych. CELE BADANIA STATYSTYCZNEGO Badanie statystyczne organizuje się w celu realizacji jednego lub kilku wymienionych zadań: o poznania rozkładu zbiorowości pod względem wybranych cech w badanej zbiorowości, o ustalenia, jakiego rodzaju związki występują między 12
cechami, a więc oceny współzależności cech, o porównania i porządkowania elementów zbiorowości (obiektów wielo-cechowych), o poznania dynamiki zbiorowości. Całość prac związanych z realizacją badania statystycznego można podzielić na następujące etapy: projektowanie badania, gromadzenie materiału statystycznego (pomiar lub obserwacja statystyczną), opracowanie w postaci tablic i wykresów materiału statystycznego, analiza wyników obserwacji. ZBIERANIE MATERIAŁU STATYSTYCZNEGO Badanie statystyczne, na którego podstawie uzyskuje się materiał statystyczny, powinno być odpowiednio zaprojektowane, a zatem należy: sprecyzować cel badania, zdefiniować zbiorowość statystyczną i jednostkę statystyczną, dokonać wyboru cech statystycznych, określić odpowiednią metodę badania statystycznego, podać źródła pozyskania danych: o pierwotne (obserwacja, wywiad, ankieta) o lub wtórne (sprawozdawczość przedsiębiorstw, instytucji, publikacje statystyczne organów państwowych lub instytucji naukowo-badawczych), opracować formularze statystyczne i makiety tablic 13
wynikowych oraz zapewnić odpowiednią kontrolę materiału statystycznego. Badanie statystyczne może być realizowane na wiele różnych sposobów, nie można zatem podać sposobu uniwersalnego. PRZYKŁADY wyników badań całkowitych i częściowych (np. ankietowych): PRZYKŁAD 1. Jest to ilustracja projektu badania marketingowego, którego celem jest ocena rynku nabywców określonego artykułu. Do podstawowych procedur badania marketingowego należy segmentacja rynku. Dla organizacji marketingowej segmentacja rynku oznacza podział nabywców ze względu na ich reakcje na ofertę marketingową 14
Charakterystyka konsumentów Zmienne geograficzne: zasięg terytorialny wielkość regionu wielkość miasta klimat Zmienne socjoekonomiczne: dochód zawód styl życia osobowość Zmienne demograficzne: wiek pleć wielkość rodziny narodowość Reakcje konsumentów Przyczyny zakupu: stałe specjalne Oczekiwania: jakość serwis oszczędności Użytkowanie: status użytkownika szybkość użytkowania Nastawienie: entuzjastyczne pozytywne obojętne negatywne wrogie 15
Przedstawiony na rys. podział kryteriów segmentacji rynku wynika z konieczności identyfikacji na rynku grup nabywców (na których potencjalnie można oddziaływać ofertą marketingową) oraz wyboru cech charakterystycznych dla tych grup (istotnych ze względu na działania marketingowe). Zbiorowością statystyczną są konsumenci. Jest to zbiorowość skończona, lecz bardzo duża. Jednym z etapów procedury segmentacji rynku jest formalne badanie ankietowe, mające na celu zgromadzenie informacji o cechach nabywców. Trudno jest podać przykłady wzorowo opracowanej ankiety, którą można by się posługiwać w praktyce. Zależy to bowiem od celu badania i cech, które należy w badaniu uwzględnić. PRZYKŁAD 2. Generalny dystrybutor sprzętu AGD uzyskuje informacje na podstawie ankiety, którą wypełniają nabywcy przy zakupie sprzętu tej firmy. Pytania w ankiecie mogą być następujące: 1. Województwo, w którym dokonał/a Pan/Pani zakupu... 2. Wiek: 15-25 lat 26-35 lat 36-50 lat ponad 50 lat 3. Był/a Pan/Pani zadowolony/a z prezentacji sprzętu w sklepie? tak nie 4. Dla kogo Pan/Pani kupił/a: do osobistego użytku na prezent 16
5. Jak powstało Pana/Pani zainteresowanie danym sprzętem? pisma sprzedawca gazety wystawa targi znajomi pozostałe 6. Co skłoniło Pana/Panią do zakupu? marka warunki gwarancji serwis jakość wygląd rozwiązania techniczne Materiał zgromadzony w wyniku badania ankietowego po odpowiednim opracowaniu posłuży do przeprowadzenia analizy zróżnicowania rynku nabywców. PRZYKŁAD. Przykład zaczerpnięty z Rocznika Statystycznego, jest ilustracją wyników badań całkowitych i częściowych. Badania dotyczyły wielkości gospodarstw domowych w Polsce; przeprowadzono je w dwóch okresach (1988 oraz 1995). 17
Gospodarstwa domowe według liczby osób Gospodarstwa domowe o liczbie osób Liczba osób w gospodarstwie (w tys.) 1988 1995 1 2188 2468 2 2673 2889 3 2427 2469 4 2632 2497 5 1171 1203 6 514 565 7 i więcej 365 410 PYTANIA TEORETYCZNE 1. Podać określenie i przykłady zbiorowości statystycznej generalnej i próbnej. 2. Wymienić rodzaje badań całkowitych i opisać jeden z nich. 3. Wymienić rodzaje badań częściowych i opisać jeden z nich. 4. Kiedy próba jest reprezentatywna 5. Podać różnicę między stymulantą i destymulantą. 6. Podać po jednym przykładzie stymulanty i destymulanty. 7. Podać określenie i dwa przykłady cechy skokowej. 8. Podać określenie i dwa przykłady cechy ciągłej. 9. Dokonać podziału cech statystycznych. 10. Jakie to są cechy mierzalne podać dwa przykłady. 11. Jakie to są cechy jakościowe podać dwa przykłady. 18