Podstawowe pojęcia statystyczne Istnieją trzy rodzaje kłamstwa: przepowiadanie pogody, statystyka i komunikat dyplomatyczny Jean Rigaux
Co to jest statystyka? Nauka o metodach ilościowych badania zjawisk masowych. Funkcje statystyki - informacyjna, analityczna (szukanie przyczyn), prognostyczna. Rodzaje statystyki Opisowa: 1)analiza struktury zbiorowości, 2)analiza współzależności, 3)analiza szeregów czasowych. Matematyczna: zajmuje się metodami wnioskowania (estymacji i weryfikacji hipotez) o populacji na podstawie próby. Zbiorowość statystyczna Zbiór elementów (pojedynczych jednostek statystycznych) osób, przedmiotów, faktów, jednostek czasowych i przestrzennych, posiadających jedną lub kilka cech wspólnych (stałych) oraz wiele cech je różnicujących. Przykłady: studenci z określonego województwa różnią się ocenami; rolnicy z danego województwa różnią się pow. gospodarstw; kolejne lata, które charakteryzują się różną średnią temperaturą (np. na stacji Łódź-Lublinek).
Rodzaje zbiorowości Skończone // nieskończone Statyczne (jednostki istniejące w danym momencie) // dynamiczne (jednostki istniejące w przedziale czasu) Jednorodne (jednostki niezróżnicowane pod względem cechy stałej np. pracownicy danego przedsiębiorstwa) // niejednorodne (cecha przedmiotowa się zmienia np. pracownicy plus klienci). Generalna (populacja) // próbna (próba) Przykłady: studenci UJ, komputery w firmie X, katastrofy lotnicze w roku 1965. Badanie statystyczne Ogół prac mających na celu poznanie struktury zbiorowości, współzależności i dynamiki. Jednostka statystyczna = obiekt badany Cechy opisujące jednostkę statystyczną: stałe i zmienne.
Cechy stałe Wspólne dla jednostek statystycznych, które tworzą zbiorowość. 1) rzeczowe (przedmiotowe) czym jest to co badamy? ; jakie kryterium musi spełniać jednostka, żeby wejść do zbiorowości? (np. Polacy, studenci) 2) przestrzenne określają miejsce znajdowania / pochodzenia jednostek statystycznych (np. określone państwo). 3) czasowe okres lub zbiór terminów. Cechy zmienne Różnią jednostki statystyczne, to one podlegają obserwacji. 1) mierzalne (ilościowe) [skokowe (dyskretne) np. odległość elektronu od jądra, ciągłe] 2) niemierzalne (jakościowe) Wariant cechy Wariantem cechy mierzalnej jest jej wartość liczbowa, Wariantem cechy niemierzalnej jest jej wartość jakościowa (nazwa).
Skale pomiarowe [system symboli kodujących wyniki pomiaru] Rodzaje skal [skale pomiarowe klasyfikuje się według sposobu w jaki można zestawić wyniki dwóch pomiarów] Nominalna [relacja: równe // różne] Grupowanie jednostek w rozłączne klasy. Brak możliwości uporządkowania wartości cech w kolejności wartościującej. Szczególny przypadek skali: skala dychotomiczna (np. odpowiedź na pytanie lub brak odpowiedzi na pytanie; płeć). Porządkowa [relacja: większa // mniejsza] Porządkowanie obiektów ze względu na natężenie badanej cechy. Obiektom przyporządkowuje się nazwy lub rangi (np. wykształcenie, stosunek do czegoś, stanowisko w pracy, skala Richtera). Interwałowa [relacja: większa o tyle] Wartości cechy składają się z liczb rzeczywistych, przy czym wartość zero nie oznacza braku zjawiska. Pozwala na określenie odległości między obiektami, w rezultacie pozwala na wykonywanie dodawania i odejmowania np. liczenie amplitudy temperatury. Iloraz wartości nie ma sensownej interpretacji. Przykład: stopnie Celsjusza, Fahrenheita.
Ilorazowa [relacja: tyle razy większa] Pomiary charakteryzują się stałymi ilorazami i zerem bezwzględnym (np. ciężar, Kelviny), można wykonywać wszystkie działania arytmetyczne. Kolejne przykłady: zysk przedsiębiorstwa, cena baryłki ropy, opad. Szereg statystyczny: zbiór zaobserwowanych wartości (wariantów) cech, przyporządkowany jednostkom statystycznym. Rodzaje szeregów: 1) szczegółowe uporządkowane wartości danej cechy. 2) wyliczające prezentuje różne cechy dotyczące tego samego obiektu. 3) rozdzielcze 3.1) cech mierzalnych 3.1.1) punktowe (dotyczy cechy dyskretnej, np. liczba rodzeństwa) 3.1.2) przedziałowe (dotyczy cech ciągłych), liczba klas (k=pierw(n); rozpiętość przedziału c=(xmax-xmin)/k) Histogram 3.2) cech niemierzalnych (zestawienie wariantów danej cechy i odpowiadających im liczebności). 4) przestrzenne 5) czasowe (momentów; okresów)
Rozkład empiryczny (statystyczny) Opis wartości przyjmowanych przez cechę statystyczną w próbie przy pomocy częstości ich występowania. Zestawienie ciągu par (wartość, częstość). Histogram Graficzny sposób przedstawienia rozkładu empirycznego. Co jest ważne przy analizie histogramu? - skośność i modalność. Skośność może świadczyć o sprzężeniach zwrotnych w systemie, wielomodalność o połączeniu kilku zbiorowości. Tablica statystyczna Jest formą uporządkowania danych liczbowych dotyczących jednej lub więcej zbiorowości według przyjętych kryteriów. Tablica statystyczna powinna zawierać: numer, tytuł, treść, objaśnienia, źródło danych. Tablica kombinowana Wtedy gdy jest więcej niż jedno kryterium podziału zbiorowości.
Etapy badań statystycznych 1) przygotowanie badania (cel, przedmiot badania, zakres wybór cech zmiennych) 2) obserwacja statystyczna Gromadzenie danych o określonym zjawisku, jest rejestracją wielkości jakie badane cechy przyjmują u poszczególnych jednostek zbiorowości statystycznej. [zebranie materiałów statystycznych]. 3) kontrola formalna (kompletność danych) i merytoryczna (poprawność rachunkowa). 4) grupowanie statystyczne Systematyzowanie materiału statystycznego, podział na możliwie jednorodne grupy, ustalamy kolejność i nazwy grup otrzymujemy wykaz klasyfikacyjny. W przypadku gdy cecha ma charakter ciągły, warianty cech przedstawiamy w postaci przedziałów liczbowych. 5) prezentacja danych (tablice i wykresy) 6) analiza statystyczna (wykrywanie prawidłowości w kształtowaniu zjawisk statystycznych oraz związków między nimi + interpretacja wyników); (analiza struktury; analiza współzależności; analiza zmian zjawisk w czasie).
Zadania 1) podaj przykład zbiorowości: skończonej, nieskończonej, statycznej, dynamicznej, jednorodnej oraz niejednorodnej. (określ również cechę przestrzenną i czasową) 2) podaj po dwa przykłady cechy zmiennej: mierzalnej dyskretnej, mierzalnej ciągłej oraz niemierzalnej. 3) podaj po dwa przykłady cech mierzonych w skalach: nominalnej, porządkowej, interwałowej, ilorazowej. 4) wygeneruj 50-elementowy szereg losowy (funkcja randbetween calc) i skonstruuj szereg rozdzielczy przedziałowy, narysuj histogram. 5) podaj przykład szeregu czasowego (okresów, momentów).