1
Dyscyplina naukowa zajmująca się sposobami (metodami i narzędziami) gromadzenia i opisywania danych ilościowych oraz wyprowadzania na ich podstawie wniosków odnoszących się do procesów masowych Charakterystyka liczbowa opisującą właściwości zbioru danych (np. średnia, mediana, odchylenie standardowe) Uporządkowany zbiór danych dotyczących określonego zjawiska lub procesu czyli informacje liczbowe (dane statystyczne) opisujące świat wokół nas Wszelkie czynności związane z gromadzeniem i opracowywaniem danych 2
zajmuje się projektowaniem badań, procedurami i sposobami gromadzenia i porządkowania informacji, sposobami opracowania danych ilościowych, ich prezentacją i sumarycznym opisem zajmuje się regułami wnioskowania o właściwościach populacji opierając się na własnościach wylosowanej z niej próby 3
W ciągu życia cały czas podejmujemy decyzje odnosząc się do naszej wiedzy i doświadczenia Wnioskowanie odbywa się na ogół w jednym z dwóch kierunków: OD OGÓŁU DO SZCZEGÓŁU OD SZCZEGÓŁU DO OGÓŁU 4
Rodzaj rozumowania logicznego, mającego na celu dojście do określonego wniosku na podstawie założonego wcześniej zbioru przesłanek Jeśli rozumowanie jest przeprowadzone poprawnie, zaś zbiór przesłanek nie zawiera zdań fałszywych, to wnioski wyciągnięte w wyniku rozumowania dedukcyjnego są nieodparcie prawdziwe i nie można ich zasadnie zakwestionować W procesie dedukcji nie tworzymy nowej wiedzy, dedukcja jest procesem wyprowadzania wniosków z tego, co już jest wiadome 5
Przesłanka 1 Przesłanka 2 W Zielonej Górze mieszka około 119 tys. mieszkańców W każdym mieście powyżej 100 tys. mieszkańców władzą wykonawczą jest prezydent miasta Wniosek W Zielonej Górze władzą wykonawczą jest prezydent miasta 6
Rozumowanie indukcyjne jest procesem logicznym, za pomocą którego dobieramy hipotezę do danych i uogólniamy przypadek szczególny W ten sposób tworzymy nową wiedzę, ale jest ona obarczona niepewnością z powodu braku jednoznacznej zgodności pomiędzy danymi a hipotezą 7
PODEJMOWANIE DECYZJI w warunkach niepewności, w niepowtarzalnej sprawie Czy oskarżony popełnił przestępstwo? PROGNOZOWANIE Czy w najbliższy weekend poprawi się pogoda? Jaki będzie jutro kurs waluty? Jakie będą tematy na kolokwium? TESTOWANIE HIPOTEZ Im dłuższy okres bezrobocia tym trudniej znaleźć pracę Kobiety częściej niż mężczyźni robią zakupy 8
Dyscyplina naukowa zajmująca się sposobami (metodami i narzędziami) gromadzenia i opisywania danych ilościowych oraz wyprowadzania na ich podstawie wniosków odnoszących się do procesów masowych Charakterystyka liczbowa opisującą właściwości zbioru danych (np. średnia, mediana, odchylenie standardowe) Uporządkowany zbiór danych dotyczących określonego zjawiska lub procesu czyli informacje liczbowe (dane statystyczne) opisujące świat wokół nas Wszelkie czynności związane z gromadzeniem i opracowywaniem danych 9
Zbiór wszystkich możliwych jednostek, które są przedmiotem zainteresowania badacza. Obejmuje wszystkie jednostki zbiorowości lub wszystkie możliwe przypadki danego zjawiska Część populacji generalnej, w określony sposób wybrany podzbiór zbiorowości 10
ESTYMATOR własność próby ujęta w formie miary opisowej wyznaczonej z tej próby (średnia, odchylenie standardowe, mediana). Estymatory oznaczamy na ogół za pomocą liter łacińskich x średnia arytmetyczna obliczona podstawie danych uzyskanych w badaniach s odchylenie standardowe obliczone na podstawie danych uzyskanych w badaniach PARAMETR własność charakteryzująca populację, ustalona na podstawie estymatora. Parametry to wartości przewidywane, wyznaczone na podstawie danych pochodzących z próby, podawane są zwykle z określonym prawdopodobieństwem błędu (niepewności) Parametry oznaczamy na ogół za pomocą liter greckich: (mi) przewidywana z pewnym określonym prawdopodobieństwem błędu średnia w populacji (sigma) przewidywane z pewnym określonym prawdopodobieństwem błędu odchylenie standardowe w populacji 11
Średnia temperatura w lecie waha się pomiędzy 16,5-20 C, w zimie między -6-0 C. 12
Współczynnik dzietności, określający liczbę urodzonych dzieci przypadających na jedną kobietę w wieku rozrodczym (15-49 lat) wynosił: 1,367 - w roku 2000 1,297 - w roku 2011 Mężczyźni najczęściej żenią się przed trzydziestką. W 2010 r. ich średni wiek zawierania małżeństwa wynosił 28 lat, tj. o ponad 3 lata więcej niż na początku lat 90-tych. Natomiast w 2000 r. pan młody miał średnio niespełna 26 lat. Panny młode też są starsze, w 2010 roku były w wieku - średnio - 26 lat, wobec niepełna 23 lat na początku lat 90-tych i prawie 24 w 2000 roku. 13
Sporządzanie statystyki urodzin, opracowanie statystyk bezrobocia, wypadków, spisów ludności, mieszkań, gospodarstw rolnych, itd. Główny Urząd Statystyczny (www.stat.gov.pl) OBOP (www.obop.com.pl) CBOS (www.cbos.pl) Polski Generalny Sondaż Społeczny (http://pgss.iss.uw.edu.pl) 14
15
Ciąg wielkości statystycznych (wartości zmiennej) uporządkowanych rosnąco lub malejąco lub pogrupowanych według określonych kryteriów 16
Wiek: 18, 18, 19, 19, 19, 19, 20, 20, 21, 21, 22, 23 wiek N 18 2 19 4 20 2 21 2 22 1 23 1 wiek N 18-19 6 20-21 4 22-23 2 17
Budowa (skład) zbiorowości z punktu widzenia wyróżnionych cech zbiorowości Struktura studentów ze względu na płeć, kierunek studiów, poziom studiów, przynależność do organizacji studenckich 18
p wskaźnik struktury N - liczebność zbiorowości n liczebność części zbiorowości Struktura specjalności 1 roku pedagogiki studiów mgr Specjalność N Frakcja Procent AK 63 0,15 15% EMiI 27 0,06 6% EWiP 53 0,13 13% OiPNS 71 0,17 17% PSiS 65 0,15 15% RzPS 143 0,34 34% Suma 422 1,00 100% 19
Struktura badanych ze względu na ocenę sytuacji materialnej Ocena sytuacji materialnej N Procent Procent skumulowany Bardzo zła 50 28% 28% Zła 30 17% 45% Przeciętna 65 36% 81% Dobra 25 14% 95% Bardzo dobra 10 5% 100% 180 100% 20
50 40 30 20 10 0 Niedostateczny Dopuszczający Dostateczny Dobry Bardzo dobry Celujący X i N % Niedostateczny 10 7% Dopuszczający 23 16% Bardzo dobry 19% Celujący 4% Niedostateczny 7% Dopuszczający 16% Dostateczny 34 23% Dobry 45 31% Bardzo dobry 27 19% Celujący 6 4% Dobry 31% Dostateczny 23% 21
22
Zbiór wszystkich możliwych jednostek, które są przedmiotem zainteresowania badacza. Obejmuje wszystkie jednostki zbiorowości lub wszystkie możliwe przypadki danego zjawiska Część populacji generalnej, w określony sposób wybrany podzbiór zbiorowości W rzetelny sposób odzwierciedla populację. Reprezentatywność próby uzyskujemy przez odpowiedni sposób doboru jednostek do analizy 23
- dobór jednostek do analizy jest przypadkowy, przypadek decyduje o tym, które jednostki znajdą się w próbie - każda jednostka ma takie same szanse na znalezienie się w próbie - dobór jednostek do analizy jest uzależniony od osoby prowadzącej badania - wybór ten nie zapewnia reprezentatywności próby - konieczna jest duża ostrożność w interpretacji wyników 24
- dobór oparty na zgłoszeniach chętnych - dobór oparty na dostępności badanych - dobór na chybił trafił - dobór celowy, arbitralny (badania określonej grupy, jednostek typowych; do próby trafiają jednostki, które w opinii badacza dostarczą optymalnych informacji z punktu widzenia badania, a więc uważane za badacza za przeciętne, typowe) - metoda śnieżnej kuli (badani wskazują kolejne jednostki do badań) - dobór informatorów - dobór kwotowy (znając strukturę zbiorowości pod względem ustalonych cech badacz ustala kwoty (liczebności) badanych, które mają znaleźć się w próbie, aby ich struktura oddawała strukturę zbiorowości). Problemem jest ustalenie aktualnej dla populacji struktury kwot. Wybór osoby spełniającej określone kryteria zależy od badacza 25
Elementy losuje się z całej (niepodzielonej na części ) zbiorowości: Każdy element ma jednakowe szanse znalezienia się w próbie - losowanie bez zwracania - losowanie ze zwracaniem Losujemy k-ty (np. co dziesiąty) lub kolejny zgodnie z liczbami losowymi (żelaznymi) 26
Stosowane gdy populacja dzieli się na pewne podpopulacje mocno zróżnicowane pod względem badanej cechy. Podział przeprowadza się ze względu na pewne kryterium, które zapewnia podział populacji na warstwy: rozłączne (tzn. żaden element populacji nie może być zaliczony do dwóch różnych warstw) wyczerpujące (sumie powinny dawać całą populację) różniące się pod względem analizowanej cechy (rejon geograficzny, typ szkoły, płeć). Dla wyróżnionych warstw przeprowadza się losowanie proste. W schemacie losowania losuje się nie poszczególne elementy zbiorowości, ale ich grupy (klasy w szkole, bloki mieszkalne itp.) Do próby wchodzą wszystkie elementy tworzące wybrane grupy (np. wszyscy uczniowie wylosowanej klasy) 27
Wykaz poszczególnych elementów zbiorowości, który służy do przeprowadzania operacji losowania Najczęściej operatu losowania nie można utożsamiać z populacja generalną Operat losowania przeważnie jest uboższy o pewne specyficzne jednostki. Pozyskanie operatu losowania jest trudne! 28
cecha próby, polegająca na tym, że nie jest ona reprezentatywna dla badanej populacji, pomimo, że została dobrana w sposób losowy. Przyczyną obciążenia próby mogą być błędy poczynione w trakcie doboru losowego, błąd operatu losowego itp. 29
- poziom ufności (jak bardzo możemy być pewni uzyskanych rezultatów, najczęściej 95%) - wielkość frakcji (w jakiej części populacji występuje badane zjawisko, gdy wielkość frakcji nie jest znana przyjmuje się 0,5) - liczebność populacji - błąd maksymalny oszacowania (o ile procent wyznaczony w badaniach wynik może się różnić od rzeczywistej wartości parametru w populacji, najczęściej do 5%) 30
Poziom ufności: 95% Frakcja: 0,5 31
Zwykle nie można przebadać całej populacji. Badamy próbę, aby na jej podstawie wyciągać wnioski dotyczące całej populacji Celem analiz jest estymacja (szacowanie) parametrów populacji za pomocą statystyk (estymatorów ) wyznaczonych dla próby Tylko wyniki uzyskana dla prób losowych umożliwiają ich ekstrapolację (uogólnianie) na całą populację Tylko dobór losowy gwarantuje uzyskanie próby reprezentatywnej 32
33
cecha (właściwość), którą posiadają jednostki badanej zbiorowości, przyjmującą co najmniej dwie wartości. Zmienna to właściwość pod względem której elementy zbioru różnią się między sobą Przyjmuje dowolne wartości z określonego przedziału (skończonego lub nie). Zmienne ciągłe: wzrost, czas rozwiązana testu, kwota dochodu Przyjmuje wartości skokowe czyli liczba wartości zmiennej jest skończona lub przeliczalna. Zmienne dyskretne: płeć, ocena, wykształcenie Pomiar polega na sklasyfikowaniu jednostek i przypisaniu ich do kategorii zmiennej czyli ustaleniu jaką wartość przyjmuje badana cecha (zmienna), jakie jest jej natężenie 34
Ze względu na własności badanych cech wyróżnić możemy cztery poziomy pomiaru: nominalny, porządkowy, interwałowy i ilorazowy Przez analogie mówimy wtedy o skalach i zmiennych jakościowych lub ilościowych Zmienne jakościowe Zmienne ilościowe nominalne porządkowe interwałowe ilorazowe 35
Możemy stwierdzić, czy jedna wartość jest różna/równa od innej W wartościach zmiennej nie można ustalić żadnego porządku, wszystkie wartości są tak samo ważne Zmienne mierzone na skali nominalnej: płeć, wyznanie, zawód 36
Można uporządkować wartości w zależności od natężenia cechy czyli możemy ustalić, czy jedna wartość jest większa/mniejsza od innej Zmienne mierzona na skalach porządkowych: wykształcenie, poziom akceptacji zjawisk i poglądów 37
SKALA LIKERTA W badaniach społecznych bardzo częstą formą pytania, która pozwala ocenić poziom akceptacji danego poglądu jest format pytania zaproponowany przez Rensisa Likerta. Opinia dotycząca jakiegoś zjawiska, poglądu jest diagnozowana na pięciostopniowej skali: respondent ma wybrać jedną z pięciu odpowiedzi od zdecydowanie się zgadzam do zdecydowanie się nie zgadzam jest to skala porządkowa odpowiedź neutralna trudno powiedzieć/ani tak ani nie jest na środku skali jest to skala symetryczna wielostopniowe skale diagnozujące poziom akceptacji nazywane są potocznie skalami Likerta 38
SKALA LIKERTA zdecydowanie nie zgadzam się (5) raczej się nie zgadzam (4) ani się zgadzam, ani się nie zgadzam (3) raczej się zgadzam (2) zdecydowanie się zgadzam (1) SKALA OPARTA NA SKALI LIKERTA - radykalnie lewicowe (1) - lewicowe (2) - centrowe (3) - prawicowe (4) - radykalnie prawicowe (5) - bez duszności (1) - niewielka duszność (2) - umiarkowana duszność (3) - ciężka duszność (4) - bardzo ciężka duszność (5) 39
DYFERENCJAŁ SEMANTYCZNY Skala Osgooda (dyferencjału semantycznego) służy do badania oceny jakiegoś zjawiska. Oparta jest na skali, która zawiera 7 punktów: oceny dokonuje się wskazując natężenie cechy pomiędzy dwoma jej przeciwnymi charakterystykami (wyrażonych często przymiotnikowo) najczęściej zadaje się zestaw pytań diagnozujących różne aspekty analizowanego zjawiska 1. Ocena pozytywna 7. Ocena negatywna 40
DYFERECJAŁ SEMANTYCZNY Które z poniższych określeń dotyczą według Ciebie serwisu Facebook Dla młodych Intuicyjny Bezpieczny Ładny Szybko działa Do biznesu Z przyszłością Dla starszych Skomplikowany w obsłudze Niebezpieczny Brzydki Wolno działa Do zabawy Bez przyszłości 41
Możemy ustalić o ile jedna wartość jest większa od innej. Przypisanym wartościom zmiennej odpowiadają wtedy jednakowe różnice czyli kolejne wartości zmiennej różnią się o tę sama wartość Można ustalić ile razy jedna wartość jest większa od drugiej. Pomiar jest dokonywany na skali, która ma zero Zmienne mierzone na skali interwałowej: temperatura, rok urodzenia Zmienne mierzone na skali ilorazowej: wiek w latach, kwota dochodu, wzrost, wynik testu w procentach (punktach) 42
nominalne porządkowe interwałowe ilorazowe Każda kolejna skala ma cechy skali poprzedniej Skalę można sprowadzić do skali niższego poziomu czyli obniżyć jej poziom. Wiąże się to jednak z utratą pewnych informacji 43
wynik testu Liczba punktów: 0 1 2 3 4 5 6 7 ilorazowa Ocena: ndst dost db bdb porządkowa Zaliczenie: nie zdano zdano nominalna 44
Obliczenia wykonywane na skalach porządkowych STANOWISKO RADYKALNE na skalach porządkowych nie można wykonywać żadnych obliczeń. Dopuszczalne operacje to wyznaczenie częstości, połączenie kategorii STANOWISKO LIBERALNE na liczbach, które oznaczają poziomy skali można wykonywać obliczenia: można je dodawać, odejmować, dzielić 45
Obliczenia wykonywane na skalach porządkowych Na liczbach wolno dokonywać wszelkich działań, jednak nie wolno wyciągać wniosków wybiegających poza dopuszczalne dla danej skali interpretacje Skala nominalna: różne/równe Skala porządkowa: większe/mniejsze Skala interwałowa: o ile większe/mniejsze Skala ilorazowa: ile razy mniejsze/większe Skale, które mają opisane tylko skrajne wartości traktowane są jako skale ilościowe 46
Analizy wykonywane na skalach porządkowych Zmienna: poziom zadowolenia z życia (zmienna porządkowa) Proszę znaczyć na skali od 1 do 10 w jakim stopniu czuje się Pan(i) zadowolony(a) z życia. 1 Zdecydowanie niezadowolony 10 Zdecydowanie zadowolony Średnia: kobiety = 8,5 ; mężczyźni = 7,1 Skale, które mają opisane tylko skrajne wartości są często traktowane jako skale ilościowe 47
Analizy wykonywane na skalach porządkowych Zmienna (indeks): oszczędność (zmienna porządkowa) W jakim stopniu zgadzasz się z poniższymi stwierdzeniami: - Zdecydowanie się zgadzam (1) - Raczej się zgadzam (2) - Raczej się nie zgadzam (4) - Zdecydowanie się nie zgadzam (5) - Trudno powiedzieć (3) a) Zawsze planuję zakupy b) Nie kupuję niepotrzebnych rzeczy c) Nawet jeśli mam dużo pieniędzy oszczędzam d) Przed zrobieniem zakupów przeglądam gazetki reklamowe 48
Analizy wykonywane na skalach porządkowych Res. 1 Res. 2 Res. 3 Res. 4 Zawsze planuję zakupy 1 5 3 4 Nie kupuję niepotrzebnych rzeczy 1 5 3 5 Nawet jeśli mam dużo pieniędzy oszczędzam Przed zrobieniem zakupów przeglądam gazetki reklamowe 1 5 4 4 1 5 2 3 Suma (Oszczędność) 4 20 12 17 Min=4 (bardzo oszczędny) Max=20 (zupełnie nieoszczędny/rozrzutny) 4-9 oszczędny 10-14 racjonalny 15-20 rozrzutny 49