Wprowadzenie Pojęcia podstawowe Szeregi rozdzielcze STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP.

Podobne dokumenty
W1. Wprowadzenie. Statystyka opisowa

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

Podstawowe pojęcia statystyczne

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

POJĘCIA WSTĘPNE. STATYSTYKA - nauka traktująca o metodach ilościowych badania prawidłowości zjawisk (procesów) masowych.

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Statystyka w pracy badawczej nauczyciela

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Statystyka Matematyczna Anna Janicka

Wykład ze statystyki. Maciej Wolny

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

Wykład Prezentacja materiału statystycznego. 2. Rodzaje szeregów statystycznych.

Statystyka i analiza danych pomiarowych Podstawowe pojęcia statystyki cz. 2. Tadeusz M. Molenda Instytut Fizyki, Uniwersytet Szczeciński

Badania Statystyczne

Statystyka matematyczna i ekonometria

zbieranie porządkowanie i prezentacja (tabele, wykresy) analiza interpretacja (wnioskowanie statystyczne)

Statystyka. Podstawowe pojęcia: populacja (zbiorowość statystyczna), jednostka statystyczna, próba. Cechy: ilościowe (mierzalne),

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

Statystyka. Wykład 1. Magdalena Alama-Bućko. 20 lutego Magdalena Alama-Bućko Statystyka 20 lutego / 19

STATYSTYKA OPISOWA. Przykłady problemów: - badanie opinii publicznej na temat preferencji wyborczych;

Statystyka. Wykład 1. Magdalena Alama-Bućko. 26 lutego Magdalena Alama-Bućko Statystyka 26 lutego / 34

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE)

STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE

Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

1 Podstawy rachunku prawdopodobieństwa

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Statystyka matematyczna dla leśników

Agata Boratyńska. WYKŁAD 1. Wstępna analiza danych, charakterystyki opisowe. Indeksy statystyczne.

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Literatura. Podgórski J., Statystyka dla studiów licencjackich, PWE, Warszawa 2010.

Podstawowe pojęcia cd. Etapy badania statystycznego

Próba własności i parametry

Sposoby prezentacji problemów w statystyce

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Spis treści 3 SPIS TREŚCI

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Analiza struktury i przeciętnego poziomu cechy

STATYSTYKA. dr Agnieszka Figaj

Statystyka. Opisowa analiza zjawisk masowych

STATYSTYKA wykłady. L.Gruszczyński Elementy statystyki dla socjologów Dr. Pactwa pon. i wtorek 09:30 11:00 (pok. 217) I. (08.X)

Statystyka i analiza danych pomiarowych Podstawowe pojęcia statystyki Cz. 1. Tadeusz M. Molenda Instytut Fizyki, Uniwersytet Szczeciński

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

Zagadnienia: wprowadzenie podstawowe pojęcia. Doświadczalnictwo. Anna Rajfura

Statystyka Opisowa WK Andrzej Pawlak. Intended Audience: PWR

Graficzna prezentacja danych statystycznych

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład Przedmiot statystyki

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35

Statystyka. Wykład 6. Magdalena Alama-Bućko. 9 kwietnia Magdalena Alama-Bućko Statystyka 9 kwietnia / 36

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

Wykład 3: Prezentacja danych statystycznych

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

Wykład 10: Elementy statystyki

You created this PDF from an application that is not licensed to print to novapdf printer (

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Przedmiot i rola statystyki

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

Przedmiot statystyki. Graficzne przedstawienie danych.

STATYSTYKA OPISOWA. Dr Alina Gleska. 12 listopada Instytut Matematyki WE PP

Po co nam charakterystyki liczbowe? Katarzyna Lubnauer 34

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

STATYSTYKA MATEMATYCZNA. rachunek prawdopodobieństwa

Statystyka. Wykład 3. Magdalena Alama-Bućko. 6 marca Magdalena Alama-Bućko Statystyka 6 marca / 28

Rok akademicki: 2013/2014 Kod: ZIE n Punkty ECTS: 6. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

Statystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39

Statystyczne metody analizy danych. Agnieszka Nowak - Brzezińska

Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0

Pozyskiwanie wiedzy z danych

Opisowa analiza struktury zjawisk statystycznych

Rozkłady zmiennych losowych

STATYSTYKA OPISOWA. Dr Alina Gleska. 28 września Instytut Matematyki WE PP

Podstawowe funkcje statystyki: informacyjna, analityczna, prognostyczna.

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Z-LOGN1-006 Statystyka Statistics

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Wykład 3. Opis struktury zbiorowości. 1. Parametry opisu rozkładu badanej cechy. 3. Średnia arytmetyczna. 4. Dominanta. 5. Kwantyle.

Budowanie macierzy danych geograficznych Procedura normalizacji Budowanie wskaźnika syntetycznego

Miary statystyczne w badaniach pedagogicznych

Wykład 5: Statystyki opisowe (część 2)

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd

Wnioskowanie statystyczne. Statystyka w 5

Statystyka. Wykład 5. Magdalena Alama-Bućko. 20 marca Magdalena Alama-Bućko Statystyka 20 marca / 26

12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych

Estymacja punktowa i przedziałowa

Z-ZIPN1-004 Statystyka. Zarządzanie i Inżynieria Produkcji I stopień Ogólnoakademicki Niestacjonarne Wszystkie Katedra Matematyki dr Zdzisław Piasta

Miary zmienności STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

Doświadczalnictwo leśne. Wydział Leśny SGGW Studia II stopnia

Wykład z dnia 8 lub 15 października 2014 roku

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

Ćwiczenia 1-2 Analiza rozkładu empirycznego

Transkrypt:

STATYSTYKA OPISOWA Dr Alina Gleska Instytut Matematyki WE PP 18 września 2017

1 Wprowadzenie 2 Pojęcia podstawowe 3 Szeregi rozdzielcze

Zwykle wyróżnia się dwa podstawowe działy statystyki: statystyka opisowa (jedno- i wielowymiarowa), statystyka matematyczna.

STATYSTYKA OPISOWA zajmuje się: zasadami programowania badań statystycznych, metodami obserwacji statystycznej - zbierania danych statystycznych, sposobami opracowania i prezentacji danych statystycznych, syntetycznym opisem zebranego materiału statystycznego za pomoca statystyk (miar opisowych).

Metody statystyki opisowej można podzielić na: metody statystyki jednowymiarowej służace do analizy zjawisk prostych, metody statystyki wielowymiarowej umożliwiaj ace analizę zjawisk złożonych.

STATYSTYKA MATEMATYCZNA zajmuje się metodami wnioskowania o całej zbiorowości na podstawie zbadania pewnej jej części zwanej próba, która wybiera się w sposób losowy. Podstawę statystyki matematycznej stanowi rachunek prawdopodobieństwa, który pozwala ocenić dokładność i wiarygodność wniosków dotyczacych całej badanej zbiorowości.

Dyscyplinę tę tworza m. in. takie działy, jak: teoria estymacji, weryfikacja hipotez statystycznych, metoda reprezentacyjna, statystyczna analiza wielowymiarowa w przypadku podejścia stochastycznego, planowanie eksperymentu, statystyczna kontrola jakości.

ETAPY badania statystycznego: pozyskiwanie danych, opracowanie danych, przetwarzanie danych, interpretacja wyników.

ZBIOROWOŚĆ STATYSTYCZNA (tzw. populacja) - zbiór dowolnych elementów objętych badaniem statystycznym, które nosza nazwę JEDNOSTEK STATYSTYCZNYCH. Wyróżniamy dwa rodzaje zbiorowości statystycznej: skończone, nieskończone. PRÓBA - część zbiorowości statystycznej, która może być wybrana w sposób losowy lub przez dobór celowy. CECHA - właściwość występujaca u wszystkich jednostek zbiorowości, która pozwala odróżniać jednostki zbiorowości. Zbiór cech charakteryzujacych jednostki nazywamy PRZESTRZENIA BADAŃ STATYSTYCZNYCH.

Klasyfikacja cech: ilościowe (mierzalne) i jakościowe, ciagłe, quasi-ciagłe i dyskretne (skokowe), proste i złożone, stymulanty, destymulanty i nominanty.

Forma przedstawienia wartości obejmuje WSKAŹNIKI STRUKTURY, NATEŻENIA i DYNAMIKI. SKALE POMIAROWE: nominalna, porzadkowa, przedziałowa (klasyczny przykład to skala Likerta), ilorazowa.

W wyniku badania 100 sklepów detalicznych w powiecie poznańskim w 2005 r uzyskano następujące dane: Lp Badana cecha Warianty cechy 1 Rodzaj sklepu 0, 5, 2,, 3 2 Liczba pracujących w sklepie 20, 2, 8,, 5 3 Liczba ludności na 1 sklep 200, 100, 70,, 148 4 Wykształcenie kierownika sklepu 3, 1, 0,, 2 5 Powierzchnia sprzedażowa (m 2 ) 300, 20, 150,, 100 6 Metoda sprzedaży 2, 1, 1,, 2 gdzie: - rodzaje sklepów: 0 ogólnospożywczy, 1 owocowo-warzywny, 2 mięsny, 3 rybny, 4 piekarniczy, 5 z napojami alkoholowymi; - poziom wykształcenia: 0 podstawowe, 1 średnie ogólne, 2 średnie handlowe, 3 wyższe; - metody sprzedaży: 1 sklepy z obsługą, 2 sklepy samoobsługowe. Określ populację i jednostkę statystyczną, rodzaje cech oraz skale pomiarowe, w jakich dokonano pomiaru cech. Populacja sklepy detaliczne w powiecie poznańskim Jednostka statystyczna sklep detaliczny Cecha Rodzaj Skala Rodzaj sklepu jakościowa (politomiczna), zmienna, prosta nominalna Liczba pracujących w sklepie ilościowa, zmienna, prosta ilorazowa Liczba ludności na 1 sklep ilościowa, zmienna, prosta, wskaźnik struktury ilorazowa Wykształcenie kierownika sklepu jakościowa (politomiczna), zmienna, prosta porządkowa Powierzchnia sprzedażowa (m 2 ) ilościowa, zmienna, prosta ilorazowa Metoda sprzedaży jakościowa (dychotomiczna), zmienna, prosta nominalna

KLASYFIKACJA SZEREGÓW STATYSTYCZNYCH WG SOBCZYKA 1998 Szeregi statystyczne: szczegółowe (wyliczajace) rozdzielcze (strukturalne) cecha mierzalna punktowe (jednodzielne i wielodzielne) przedziałowe (jednodzielne i wielodzielne) cecha niemierzalna jednodzielne wielodzielne czasowe (dynamiczne) momentów okresów przestrzenne (geograficzne)

Rysunek: Klasyfikacja szeregów

KONSTRUKCJA SZEREGU ROZDZIELCZEGO DLA CECHY CIAGŁEJ: 1) wyszukujemy z n-elementowej zbiorowości wartości cechy x 1,x 2,...,x n jednostki o wartości minimalnej x min oraz maksymalnej x max, 2) określamy obszar zmienności szeregu poprzez rozstęp R = x max x min, 3) ustalamy liczbę przedziałów klasowych k za pomoca jednego ze wzorów: k n, k 3 4 n, k 5log(n), k 1 + 3,322log(n) (H. A. Sturges 1926), 4) wyznaczamy długość przedziału klasowego d ze wzoru: d R/k (zaokraglenie w górę),

5) przyjmujemy za dolna granicę pierwszego przedziału klasowego x min lub arbitralnie ustalamy wartość tej granicy tak, aby jednostka o najmniejszej wartości była zakwalifikowana do pierwszego przedziału klasowego, a o największej wartości - do ostatniego przedziału klasowego, 6) konstruujemy k przedziałów klasowych o długości d, a następnie zliczamy jednostki o wartościach należacych do odpowiednich przedziałów klasowych.

ZASADY BUDOWANIA SZEREGÓW ROZDZIELCZYCH: rzadko stosujemy mniej niż 6 i więcej niż 15 przedziałów klasowych, zawsze ustalamy takie klasy, które obejmuja wszystkie dane, klasy powinny być rozłaczne, przedziały klasowe powinny być niepuste, czyli powinny zawierać co najmniej jedna jednostkę, ustalamy przedziały klasowe w miarę możliwości o jednakowej długości, a w przypadku występowania obserwacji odstajacych stosujemy otwarty górny lub dolny przedział, jednostki zaliczone do tej samej klasy nie powinny być - ze względu na wartości badanej cechy - zbyt mocno zróżnicowane.

Przyjmujemy zasadę, że lewy koniec przedziału klasowego jest domknięty, a prawy otwarty. Umownie można zapisać to tak: 20-49,9; 50-79,9; 80-109,9 itd. Z kolei przedziały prawostronnie domknięte dla cechy ciagłej zapisujemy tak: 20,1-50; 50,1-80; 80,1-110 itd. Symbol xi 0 oznacza środek i-tego przedziału klasowego: xi 0 = (x i + x i+1 )/2 dla i = 1,2,...,k. Liczebność n i oznacza liczbę jednostek zaliczonych do i-tego przedziału, a liczebność skumulowana ni skum określa sumy częściowe liczebności dla i-tego przedziału i jest wyrażona wzorem: dla i = 1,2,...,k. ni skum i = n j j=1

Przez ω i określa się częstość wyrażona ilorazem liczebności i-tego przedziału i liczebności zbiorowości n = k n i, czyli i=1 ω i = n i n i k ω i = 1. Częstość wyrażona w procentach określona i=1 jest wzorem p i = ( n i n )100%. Częstość skumulowana wyznacza się według wzoru = i ω j (dla udziału) lub pi skum = i p j (dla udziału j=1 j=1 procentowego), gdzie i = 1,2,...,k. Wówczas otrzymujemy ω skum i ω skum k = 1 i p skum k = 100%.

Gdy przedziały klasowe maj a różne długości, wprowadza się pojęcie przeciętnej gęstości liczebności oraz przeciętnej gęstości częstości. Przeciętna gęstość liczebności to g i = n i /d i, gdzie n i oznacza liczebność i-tego przedziału, a d i = x i+1 x i jego długość (i = 1,2,...,k). Oznacza ona, ile jednostek zbiorowości danego przedziału klasowego przypada przeciętnie na jednostkę miary analizowanej cechy ilościowej. Z kolei przeciętna gęstość częstości g i jest określona ilorazem częstości ω i i długości d i i-tego przedziału klasowego: g i = ω i /d i i określa, jaka częstość przypada na jednostkę miary cechy ilościowej.

BŁEDY POPEŁNIANE PRZY TWORZENIU SZEREGU ROZDZIELCZEGO 1) Jeżeli zbiorowość jest niejednorodna i występuje duża koncentracja jednostek w jednej klasie, szereg z równymi przedziałami nie daje zadowalajacych rezultatów (przykład). 2) Wnioskowanie porównawcze dotycz ace zbiorowości o różnej liczności (przykład).

Pomiary koncentracji ozonu 1,7 3,1 4,5 3,0 3,5 6,1 6,8 1,1 5,8 4,2 6,0 8,1 2,4 7,5 4,7 5,4 1,4 2,0 6,8 5,8 5,7 6,5 2,8 6,2 5,5 3,4 6,0 7,4 2,5 5,6 6,2 3,1 4,4 5,5 3,7 4,0 5,7 4,4 4,7 5,8 3,3 3,4 9,4 6,6 4,7 1,6 9,4 11,7 6,8 5,4 5,6 1,4 5,3 6,6 6,6 5,6 6,0 5,9 3,5 4,1 1,4 5,3 5,8 3,7 4,1 6,6 2,5 5,1 7,6 4,4 6,7 3,7 3,0 6,2 3,8 4,7 3,9 7,6 Końce przedziałów liczebność klasowych 0 2 7 2 4 19 4 6 31 6 8 17 8 10 3 10 12 1 Histogram liczebności 35 30 liczebność 25 20 15 10 5 0 2 4 6 8 10 12 koncentracja ozonu

PREZENTACJA GRAFICZNA SZEREGÓW ROZDZIELCZYCH HISTOGRAMEM nazywamy wykres słupkowy oparty na układzie współrzędnych, składajacy się z przylegajacych do siebie prostokatów, których długości podstaw sa proporcjonalne do rozpiętości przedziałów klasowych, a wysokości - do ich liczebności (częstości). W przypadku prezentacji graficznej szeregów rozdzielczych punktowych otrzymuje się wykres odcinków pionowych kreślonych od punktu będacego wartościa cechy i o długości proporcjonalnej do liczebności (częstości) poszczególnych wartości cechy skokowej.

PRAWO HISTOGRAMU - suma pól powierzchni prostokatów tworzacych histogram musi być równa: liczbie n, czyli liczbie obserwacji badanej zmiennej, gdy wartości zmiennej w rozkładzie waży się częstościami, 1,0 lub równoważnie 100, gdy wartości zmiennej w rozkładzie waży się częstościami lub procentowymi częstościami względnymi, odpowiednio. WIELOBOK LICZEBNOŚCI (CZESTOŚCI) jest linia łamana łacz ac a środki górnych krawędzi prostokatów. KRZYWA LICZEBNOŚCI (CZESTOŚCI) tworzy połaczenie dużej liczby punktów o współrzędnych: środki przedziałów klasowych i odpowiadajace im liczebności (częstości) otrzymanych poprzez zmniejszanie rozpiętości przedziałów klasowych, a tym samym zwiększanie liczby przedziałów.

Rezultaty obserwacji statystycznej, która polega na ustaleniu wartości cech ilościowych lub wariantów cech jakościowych u wszystkich jednostek analizowanej zbiorowości można też przedstawić w postaci TABLICY STATYSTYCZNEJ. Tablice statystyczne składaja się z jednego lub kilku szeregów statystycznych. Gdy tablica zawiera jeden szereg, określa się ja jako jednodzielna. Tablice zawierajace wiele szeregów statystycznych zalicza się do wielodzielnych. Tablica statystyczna może zawierać kombinację szeregów rozdzielczych dla cechy ilościowej i jakościowej, szeregów czasowych lub przestrzennych.

Macierz danych (dla cech ilościowych) x11 x21 X=... xn 1 x x 12 22... x n2............ x1 m x2m... x nm 1 jednostka statystyczna 2 jednostka statystyczna n ta jednostka statystyczna Cecha 1 Cecha 2 x ij - wartość j-tej cechy ilościowej dla i-tej jednostki statystycznej Macierz indykatywna (dla cech jakościowych): Cechy 1 2 m jakościowe Warianty cechy 1 2 3 4 5 p 1 p Jednostki statystyczne 1 0 1 0 1 0 0 1 2 1 0 1 0 0 1 0 n 1 0 0 0 1 0 1 m liczba cech n liczba jednostek statystycznych

Rozkłady