Wykład ze statystyki Maciej Wolny
T1: Zajęcia organizacyjne Agenda 1. Program wykładu 2. Cel zajęć 3. Nabyte umiejętności 4. Literatura 5. Warunki zaliczenia
Program wykładu T1: Zajęcia organizacyjne T2: Przedmiot i zadania statystyki T3: Metody analizy rozkładu cechy T4: Badanie współzależności zjawisk T5: Badanie dynamiki zjawisk T6: Zmienne losowe i ich podstawowe rozkłady T7: Rozkład normalny T8: Estymatory i estymacja przedziałowa T9: Hipotezy statystyczne i ich weryfikacja
Cel Zaznajomienie z podstawowymi metodami procesu badania statystycznego umożliwiającymi wykrywanie prawidłowości struktury, współzależności i dynamiki zjawisk masowych oraz nauczenie wnioskowania statystycznego
Umiejętności czytanie, przetwarzanie i przedstawianie danych statystycznych określanie i obliczanie charakterystyk badanych zbiorowości weryfikacja hipotez parametrycznych i nieparametrycznych wnioskowanie na podstawie przeprowadzonych weryfikacji konstruowanie modeli regresji i ich zastosowanie w naukach społecznych prognozowanie na podstawie analizy dynamiki zjawisk
Literatura Maria Nawojczyk, Przewodnik po statystyce dla socjologów, SPSS Polska, Kraków 2002. Biostatystyka, red. A. Stanisz, Wyd. UJ, Kraków 2005. A.N. Oppenheim, Kwestionariusze, wywiady, pomiary postaw, Wyd. Zysk i S-ka, Poznań 2004. [1] Aczel A. Statystyka w zarządzaniu, PWN, Warszawa 2000 [2] Ostasiewicz S., Rusnak Z., Siedlecka K., Statystyka. Elementy teorii i zadania, Wyd. AE we Wrocławiu, Wrocław 1999 [3] Sobczyk M., Statystyka, PWN, Warszawa 1997
Warunki zaliczenia Egzamin 1. Pozytywna ocena z ćwiczeń i laboratorium 2. Egzamin pisemny (test wyboru) 50% krótkie zadania 50% teoria 3. Ocena: 60-68% dst, 68-76% dst plus, 76-84% db, 84-92% db plus, 92-100% bdb. 4. Ocena końcowa: 40% egz.+ 30% lab.+ 30% ćw.
T2: Przedmiot i zadania statystyki Agenda 1. Definicja 2. Geneza 3. Podstawowe pojęcia i zagadnienia 4. Proces badania statystycznego
Definicja Statystyka jest to nauka o metodach badania zjawisk masowych, nauka traktująca o metodach ilościowych badania prawidłowości zjawisk masowych Zjawiska masowe to zjawiska, które występują często (np. zgony, urodzenia, małżeństwa, etc.)
Geneza Statystyka łac. status państwo Etapy rozwoju badania zjawisk masowych: do XVII w. okres ewidencji i zliczania (dane, informacje) XVII XVIII w. opisywanie zbiorowości według wzorca podanego przez państwoznawców (wykrycie prawidłowości w zjawiskach masowych np. zgonach) od XVIII w. wprowadzenie rachunku prawdopodobieństwa (rozwój metod statystycznych opartych na matematyce)
Podstawowe pojęcia (1) Statystykę dzielimy na: - opisową, która ukazuje metody gromadzenia, opracowania i prezentacji danych wraz z ich sumarycznym opisem, przy wykorzystaniu właściwych narzędzi statystycznych - matematyczną zwaną wnioskowaniem statystycznym, która powstała na gruncie rachunku prawdopodobieństwa Statystyka ma zasadniczo cztery znaczenia: metoda poznawania zjawisk masowych nauka badająca zjawiska masowe zbiór liczb charakteryzujący zbiorowość (np. statystyka ludności) parametr opisowy rozumiany jako pewna wielkość charakterystyczna (np. średnia arytmetyczna, odchylenie standardowe)
Podstawowe pojęcia (2) Przedmiot badania statystycznego Zbiorowość statystyczna, populacja, masa statystyczna Zbiorowością statystyczną nazywamy zespół jednostek objętych badaniem statystycznym, posiadających jedną lub kilka cech wspólnych (stałych) oraz wiele cech je różniących Zbiorowość jednorodna to zbiorowość, którą tworzą jednostki niezróżnicowane pod względem cechy stałej Jednostka statystyczna to podstawowy element zbiorowości statystycznej, który musi być jednoznacznie określony pod względem rzeczowym (kogo lub co badamy), czasowym (kiedy badamy) i przestrzennym (gdzie, na jakim terytorium badamy)
Podstawowe pojęcia (3) Cechami statystycznymi nazywamy własności jednostek statystycznych stałe zmienne rzeczowe przestrzenne czasowe czasowe przestrzenne rzeczowe ilościowe jakościowe ciągłe skokowe
Pomiar, skale pomiarowe Cech statystyczne (zmienne) można mierzyć na różnych skalach pomiarowych, które klasyfikuje się według sposobu, w jaki można zestawić wyniki dwóch pomiarów SKALA NOMINALNA wartości na tej skali nie mają oczywistego uporządkowania (np. płeć), relacją umożliwiającą porównanie jest równoważność (równość) SKALA PORZĄDKOWA wartości mają jasno określony porządek (np. wykształcenie), oprócz równoważności możliwe są relacje porządkujące SKALA INTERWAŁOWA (PRZEDZIAŁOWA) różnice między wartościami mają sensowną interpretację, ale ich iloraz nie ma sensu (np. data urodzenia, temperatura w stopniach Celsjusza) SKALA ILORAZOWA (STOSUNKOWA) nie tylko różnice, ale także ilorazy wielkości mają interpretację (np. masa coś może być dwa razy cięższe), wielkości w skali ilorazowej można dodawać, odejmować i dzielić przez siebie
Podstawowe pojęcia (4) Szereg statystyczny to dane (liczby) odpowiednio uporządkowane otrzymane w wyniku przeprowadzonego badania statystycznego szczegółowy rozdzielczy czasowy z cechą mierzalną (ilościową) z cechą niemierzalną (jakościową) momentów okresów punktowe przedziałowe geograficzne inne proste proste skumulowane skumulowane
Szereg szczegółowy Uporządkowany ciąg wartości badanej cechy statystycznej Np. wzrost [cm] w pewnej grupie studentów 159; 159,5; 160; 161; 161; 162; 162; 162,5; 162,5; 163; 163; 163; 163; 163,5; 163,5; 164; 165; 165; 167; 167;167,5; 168; 168; 168; 168,5; 169; 169; 169; 169; 169,5; 169,5; 170; 170; 170,5; 170,5; 170,5; 170,5; 171; 172; 172,5; 173; 174; 175; 176; 176; 176,5; 177; 177; 177; 178; 178,5; 179; 179; 179; 180; 180; 181; 181; 182
Szereg rozdzielczy punktowy Szereg rozdzielczy stanowi zbiorowość statystyczną podzieloną na części (klasy) według określonej cechy z podaniem liczebności każdej z wyodrębnionych klas Np. wzrost [cm] w pewnej grupie studentów
Szereg rozdzielczy przedziałowy Np. wzrost [cm] w pewnej grupie studentów
Prezentacja graficzna szeregów Histogram jest to zbiór prostokątów, których podstawy, wyznaczone na osi odciętych, stanowią rozpiętości poszczególnych przedziałów klasowych, natomiast wysokości są określone na osi rzędnych przez liczebności odpowiadające przedziałom klasowym Diagram jest łamaną powstałą przez połączenie punktów, których współrzędnymi są środki przedziałów klasowych i odpowiadające im liczebności
Proces badania statystycznego Badanie statystyczne jest procesem złożonym obejmującym całokształt czynności badawczych zmierzających do poznania zjawisk masowych za pomocą metody statystycznej. Proces ten obejmuje: przygotowanie badania obserwację statystyczną opracowanie statystyczne analizę statystyczną
Przygotowanie badania sformułowanie problemu badawczego określenie i poznanie przedmiotu badania celu i zakresu badania oraz postawienie hipotez roboczych, które będą weryfikowane wybór metody obserwacji (pełna lub częściowa) konstrukcja formularza statystycznego (układ pytań, odpowiednie części, koncepcja formularza)
Obserwacja statystyczna Polega na uchwyceniu interesującego badacza zespołu cech (określonych w formularzu statystycznym) Materiał pierwotny materiał źródłowy otrzymany w toku specjalnego badania statystycznego Materiał wtórny materiał zebrany do innych celów wykorzystany przez badacza do swoich celów
Opracowanie statystyczne kontrola formalna i merytoryczna otrzymanego materiału przełożenie treści na liczby opracowanie schematów klasyfikacyjnych dla badanych cech tablice robocze i wynikowe prezentacja graficzna rezultatów badania
Analiza statystyczna Wykrycie prawidłowości w badanej zbiorowości - analiza struktury - analiza współzależności - analiza dynamiki - analiza przestrzenna
Podsumowanie zjawiska masowe prawidłowości statystyka opisowa statystyka matematyczna szeregi statystyczne szczegółowy, rozdzielczy punktowy, rozdzielczy przedziałowy Szereg statystyczny rozkład zmiennej, rozkład cechy (rozkład empiryczny zmiennej) graficzna prezentacja wyników różnorakie sposoby (np. wykresy kołowe) proces badania statystycznego (przygotowanie badania, obserwacja statystyczna, opracowanie statystyczne, analiza statystyczna)
Rozkład empiryczny zmiennej Powró t Rozkładem empirycznym zmiennej nazywamy przyporządkowanie kolejnym wartością zmiennej x i odpowiadających im liczebności n i szereg statystyczny zmiennej = rozkład zmiennej graficzne przedstawienie rozkładu