Dyscyplina naukowa zajmująca się sposobami (metodami i narzędziami) gromadzenia i opisywania danych ilościowych oraz wyprowadzania na ich podstawie wniosków odnoszących się do procesów masowych Charakterystyka liczbowa opisującą właściwości zbioru danych (np. średnia, mediana, odchylenie standardowe) Uporządkowany zbiór danych dotyczących określonego zjawiska lub procesu czyli informacje liczbowe (dane statystyczne) opisujące świat wokół nas Wszelkie czynności związane z gromadzeniem i opracowywaniem danych 1
zajmuje się projektowaniem badań, procedurami i sposobami gromadzenia i porządkowania informacji, sposobami opracowania danych ilościowych, ich prezentacją i sumarycznym opisem zajmuje się regułami wnioskowania o właściwościach populacji opierając się na własnościach wylosowanej z niej próby W ciągu życia cały czas podejmujemy decyzje odnosząc się do naszej wiedzy i doświadczenia Wnioskowanie odbywa się na ogół w jednym z dwóch kierunków: OD OGÓŁU DO SZCZEGÓŁU OD SZCZEGÓŁU DO OGÓŁU 2
Rodzaj rozumowania logicznego, mającego na celu dojście do określonego wniosku na podstawie założonego wcześniej zbioru przesłanek Jeśli rozumowanie jest przeprowadzone poprawnie, zaś zbiór przesłanek nie zawiera zdań fałszywych, to wnioski wyciągnięte w wyniku rozumowania dedukcyjnego są nieodparcie prawdziwe i nie można ich zasadnie zakwestionować W procesie dedukcji nie tworzymy nowej wiedzy, dedukcja jest procesem wyprowadzania wniosków z tego, co już jest wiadome Przesłanka 1 Przesłanka 2 W Zielonej Górze mieszka około 119 tys. mieszkańców W każdym mieście powyżej 100 tys. mieszkańców władzą wykonawczą jest prezydent miasta Wniosek W Zielonej Górze władzą wykonawczą jest prezydent miasta 3
Rozumowanie indukcyjne jest procesem logicznym, za pomocą którego dobieramy hipotezę do danych i uogólniamy przypadek szczególny W ten sposób tworzymy nową wiedzę, ale jest ona obarczona niepewnością z powodu braku jednoznacznej zgodności pomiędzy danymi a hipotezą PODEJMOWANIE DECYZJI w warunkach niepewności, w niepowtarzalnej sprawie Czy oskarżony popełnił przestępstwo? PROGNOZOWANIE Czy w najbliższy weekend poprawi się pogoda? Jaki będzie jutro kurs waluty? Jakie będą tematy na kolokwium? TESTOWANIE HIPOTEZ Im dłuższy okres bezrobocia tym trudniej znaleźć pracę Kobiety częściej niż mężczyźni robią zakupy 4
ESTYMATOR własność próby ujęta w formie miary opisowej wyznaczonej z tej próby (średnia, odchylenie standardowe, mediana). Estymatory to wielkości (liczby) odnosząca się do danych uzyskanych w badaniach Estymatory oznaczamy na ogół za pomocą liter łacińskich x średnia arytmetyczna obliczona podstawie danych uzyskanych w badaniach s odchylenie standardowe obliczone na podstawie danych uzyskanych w badaniach PARAMETR własność charakteryzująca populację, ustalona na podstawie estymatora. Parametry to wartości przewidywane, wyznaczone na podstawie danych pochodzących z próby, podawane są zwykle z określonym prawdopodobieństwem błędu (niepewności) Parametry oznaczamy na ogół za pomocą liter greckich (mi) przewidywana z pewnym określonym prawdopodobieństwem błędu średnia w populacji (sigma) przewidywane z pewnym określonym prawdopodobieństwem błędu odchylenie standardowe w populacji Współczynnik dzietności, określający liczbę urodzonych dzieci przypadających na jedną kobietę w wieku rozrodczym (15-49 lat) wynosił w roku 2000 1,367, natomiast w 2011 roku 1,297. Mężczyźni najczęściej żenią się przed trzydziestką. W 2010 r. ich średni wiek zawierania małżeństwa wynosił 28 lat, tj. o ponad 3 lata więcej niż na początku lat 90-tych. Natomiast w 2000 r. pan młody miał średnio niespełna 26 lat. Panny młode też są starsze, w 2010 roku były w wieku - średnio - 26 lat, wobec niepełna 23 lat na początku lat 90-tych i prawie 24 w 2000 roku. Centrum badawcze opublikowało raport pod tytułem "Coming and Going on Facebook", który dotyczył zachowań związanych z odchodzeniem i powracaniem na Facebooku. Pod uwagę wzięto mieszkańców Stanów Zjednoczonych. Okazuje się, że aż 61% użytkowników, czyli prawie dwie trzecie, przynajmniej raz z własnej woli zrobiło sobie przerwę od korzystania z Facebooka. Powody tej decyzji są różne, ale najczęstsze to: brak czasu (21%), niedobór interesujących treści (10%) zmęczenie plotkami, konfliktami i dramatami (9%), znudzenie (7%) czy obawy o utratę prywatności (4%). Jednak to, że użytkownicy od czasu do czasu odpoczywają od Facebooka, nie oznacza wcale, że opuszczają go na zawsze. Aż 92% badanych przyznało, że chce utrzymać swój f acebookowy profil i nie zamierza go usuwać. Średnia temperatura w lecie waha się pomiędzy 16,5-20 C, w zimie między -6-0 C. 5
Sporządzanie statystyki urodzin, opracowanie statystyk bezrobocia, wypadków, spisów ludności, mieszkań, gospodarstw rolnych, itd. Główny Urząd Statystyczny (www.stat.gov.pl) OBOP (www.obop.com.pl) CBOS (www.cbos.pl) Polski Generalny Sondaż Społeczny (http://pgss.iss.uw.edu.pl) 6
Zbiór wszystkich możliwych jednostek, które są przedmiotem zainteresowania badacza. Obejmuje wszystkie jednostki zbiorowości lub wszystkie możliwe przypadki danego zjawiska Część populacji generalnej, w określony sposób wybrany podzbiór zbiorowości W rzetelny sposób odzwierciedla populację. Reprezentatywność próby uzyskujemy przez odpowiedni sposób doboru jednostek do analizy - dobór jednostek do analizy jest przypadkowy, przypadek decyduje o tym, które jednostki znajdą się w próbie - każda jednostka ma takie same szanse na znalezienie się w próbie - dobór jednostek do analizy jest uzależniony od osoby prowadzącej badania - wybór ten nie zapewnia reprezentatywności próby - konieczna jest duża ostrożność w interpretacji wyników 7
- dobór oparty na zgłoszeniach chętnych - dobór oparty na dostępności badanych - dobór na chybił trafił - dobór celowy, arbitralny (badania określonej grupy, jednostek typowych; do próby trafiają jednostki, które w opinii badacza dostarczą optymalnych informacji z punktu widzenia badania, a więc uważane za badacza za przeciętne, typowe) - metoda śnieżnej kuli (badani wskazują kolejne jednostki do badań) - dobór informatorów - dobór kwotowy (znając strukturę zbiorowości pod względem ustalonych cech badacz ustala kwoty (liczebności) badanych, które mają znaleźć się w próbie, aby ich struktura oddawała strukturę zbiorowości). Problemem jest ustalenie aktualnej dla populacji struktury kwot. Wybór osoby spełniającej określone kryteria zależy od badacza Elementy losuje się z całej (niepodzielonej na części ) zbiorowości: Każdy element ma jednakowe szanse znalezienia się w próbie - losowanie bez zwracania - losowanie ze zwracaniem Losujemy k-ty (np. co dziesiąty) lub kolejny zgodnie z liczbami losowymi (żelaznymi) 8
Takie liczby, które nie ukrywają w sobie żadnej prawidłowości Liczby otrzymywane jako rezultat działania określonego mechanizmu losującego (przy rzucaniu kostką do gry, tasowaniu kart, ciągnieniu losów z urny itp.). Można je także uzyskiwać za pomocą specjalnie skonstruowanych maszyn lub - obecnie najczęściej - przy użyciu specjalnych programów komputerowych (generator liczb losowych) Tablica liczb losowych tablica wypełniona liczbami losowymi Stosowane gdy populacja dzieli się na pewne podpopulacje mocno zróżnicowane pod względem badanej cechy Podział przeprowadza się ze względu na pewne kryterium, które zapewnia podział populacji na rozłączne (tzn. żaden element populacji nie może być zaliczony do dwóch różnych warstw) i wyczerpujące (sumie powinny dawać całą populację) warstwy, różniące się pod względem analizowanej cechy (rejon geograficzny, typ szkoły, płeć). Dla wyróżnionych warstw przeprowadza się losowanie proste. W schemacie losowania losuje się nie poszczególne elementy zbiorowości, ale ich grupy (klasy w szkole, bloki mieszkalne itp.) Do próby wchodzą wszystkie elementy tworzące wybrane grupy (np. wszyscy uczniowie Wylosowanej klasy) 9
Wykaz poszczególnych elementów zbiorowości, który służy do przeprowadzania operacji losowania Najczęściej operatu losowania nie można utożsamiać z populacja generalną Operat losowania przeważnie jest uboższy o pewne specyficzne jednostki. Pozyskanie operatu losowania jest trudne! cecha próby, polegająca na tym, że nie jest ona reprezentatywna dla badanej populacji, pomimo, że została dobrana w sposób losowy. Przyczyną obciążenia próby mogą być błędy poczynione w trakcie doboru losowego, błąd operatu losowego itp. 10
- poziom ufności (jak bardzo możemy być pewni uzyskanych rezultatów, najczęściej 95%) - wielkość frakcji (w jakiej części populacji występuje badane zjawisko, gdy wielkość frakcji nie jest znana przyjmuje się 0,5) - liczebność populacji - błąd maksymalny oszacowania (o ile procent wyznaczony w badaniach wynik może się różnić od rzeczywistej wartości parametru w populacji, najczęściej do 5%) Poziom ufności: 95% Frakcja: 0,5 11
Zwykle nie można przebadać całej populacji. Badamy próbę, aby na jej podstawie wyciągać wnioski dotyczące całej populacji Celem analiz jest estymacja (szacowanie) parametrów populacji za pomocą statystyk (estymatorów ) wyznaczonych dla próby Tylko wyniki uzyskana dla prób losowych umożliwiają ich ekstrapolację (uogólnianie) na całą populację Tylko dobór losowy gwarantuje uzyskanie próby reprezentatywnej 12