Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Podobne dokumenty
Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Wskaźnik asymetrii Jeżeli: rozkład jest symetryczny, to = 0, rozkład jest asymetryczny lewostronnie, to < 0. Kwartylowy wskaźnik asymetrii

Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

Miary statystyczne w badaniach pedagogicznych

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Statystyka. Opisowa analiza zjawisk masowych

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Opisowa analiza struktury zjawisk statystycznych

1 Podstawy rachunku prawdopodobieństwa

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

Statystyka. Podstawowe pojęcia: populacja (zbiorowość statystyczna), jednostka statystyczna, próba. Cechy: ilościowe (mierzalne),

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

Próba własności i parametry

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Parametry statystyczne

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

Wykład 5. Opis struktury zbiorowości. 1. Miary asymetrii.

Miary asymetrii STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

Pozyskiwanie wiedzy z danych

Po co nam charakterystyki liczbowe? Katarzyna Lubnauer 34

W1. Wprowadzenie. Statystyka opisowa

Biostatystyka, # 1 /Weterynaria I/

Wykład 2. Statystyka opisowa - Miary rozkładu: Miary położenia

Statystyka. Wykład 3. Magdalena Alama-Bućko. 6 marca Magdalena Alama-Bućko Statystyka 6 marca / 28

Statystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39

Ćwiczenia 1-2 Analiza rozkładu empirycznego

Xi B ni B

Podstawowe funkcje statystyki: informacyjna, analityczna, prognostyczna.

Miary w szeregach. 1 Miary klasyczne. 1.1 Średnia Średnia arytmetyczna

Statystyczne metody analizy danych

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Wykład 5: Statystyki opisowe (część 2)

Miary zmienności STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Statystyka. Wykład 5. Magdalena Alama-Bućko. 20 marca Magdalena Alama-Bućko Statystyka 20 marca / 26

Statystyka opisowa. Robert Pietrzykowski.

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

Wykład 3. Opis struktury zbiorowości. 1. Parametry opisu rozkładu badanej cechy. 3. Średnia arytmetyczna. 4. Dominanta. 5. Kwantyle.

Analiza zróżnicowania, asymetrii i koncentracji

Statystyka Opisowa WK Andrzej Pawlak. Intended Audience: PWR

STATYSTYKA wykłady. L.Gruszczyński Elementy statystyki dla socjologów Dr. Pactwa pon. i wtorek 09:30 11:00 (pok. 217) I. (08.X)

Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl

Zakład Ubezpieczeń Społecznych Departament Statystyki. Struktura wysokości emerytur i rent wypłacanych przez ZUS po waloryzacji w marcu 2010 roku.

Statystyka Matematyczna Anna Janicka

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd

Laboratorium 3 - statystyka opisowa

Analiza struktury i przeciętnego poziomu cechy

STATYSTYKA OPISOWA. Dr Alina Gleska. 28 września Instytut Matematyki WE PP

Matematyka stosowana i metody numeryczne

STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

Wykład 4: Statystyki opisowe (część 1)

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

Porównaj płace pracowników obu zakładów, dokonując kompleksowej analizy struktury. Zastanów się, w którym zakładzie jest korzystniej pracować?

Matematyka z el. statystyki, # 1 /Geodezja i kartografia II/

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Podstawy statystyki - ćwiczenia r.

METODOLOGIA BADAŃ HUMANISTYCZNYCH METODYKA NAUCZANIA JĘZYKA OBCEGO CZ.II

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

Agata Boratyńska. WYKŁAD 1. Wstępna analiza danych, charakterystyki opisowe. Indeksy statystyczne.

Miary koncentracji STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 28 września 2018

Inteligentna analiza danych

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

Statystyka opisowa. Robert Pietrzykowski.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE)

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Rachunek prawdopodobieństwa i statystyka

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

Analiza statystyczna w naukach przyrodniczych

Rozkład normalny. Marcin Zajenkowski. Marcin Zajenkowski () Rozkład normalny 1 / 26

Zadania ze statystyki, cz.6

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Wykład 3: Statystyki opisowe - miary położenia, miary zmienności, miary asymetrii

Statystyka opisowa w wycenie nieruchomości Część I - wyznaczanie miar zbioru danych

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Rozkłady zmiennych losowych

Często spotykany jest również asymetryczny rozkład gamma (Г), opisany za pomocą parametru skali θ i parametru kształtu k:

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Rok akademicki: 2013/2014 Kod: ZIE n Punkty ECTS: 6. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Estymacja parametrów rozkładu cechy

Transkrypt:

Literatura STATYSTYKA OPISOWA A. Aczel, Statystyka w Zarządzaniu, PWN, 2000 A. Obecny, Statystyka opisowa w Excelu dla szkół. Ćwiczenia praktyczne, Helion, 2002. A. Obecny, Statystyka matematyczna w Excelu dla szkół. Ćwiczenia praktyczne, Helion, 2003. J. Koronacki, J. Mielniczuk, Statystyka dla studentów kierunków technicznych i przyrodniczych, WNT, 2006 S. Węglarczyk, Statystyka w inżynierii środowiska, Politechnika Krakowska, 2010 Tomasz Łukaszewski Wprowadzenie Populacja jest zbiorem wyników wszystkich pomiarów, którymi badacz jest zainteresowany. Wprowadzenie Próba jest podzbiorem wyników pomiarów wybranych z populacji. Pobieranie próby dokonuje się z reguły w sposób losowy, tj. w taki sposób, żeby każda możliwa próba złożona z n elementów miała taką samą szansę, że zostanie wybrana. Tak wybrana próbę nazywa się prostą próbą losową lub krócej próbą losową. Wprowadzenie Plan Statystyka opisowa ma na celu podsumowanie próby losowej i wyciągnięcie podstawowych wniosków i uogólnień na temat tego zbioru. Jest to pierwszy i podstawowy krok w analizie danych. Uogólnieniem wyników badania próby losowej na całą populację oraz szacowania błędów wynikających z takiego uogólnienia zajmuje się wnioskowanie statystyczne. Analiza jednorodności Miary położenia Miary rozproszenia Miary koncentracji 1

Szeregi pozwalają poznać podstawowe właściwości badanej zbiorowości, jak np. wartość występująca najczęściej. Budując szeregi należy pamiętać o zaleceniach teoretycznych, np. równe długość przedziałów. wyliczeniowy (prosty) szereg rozdzielczy punktowy przedziałowy Szereg punktowy (Ćwiczenie 1_2 ) E9 = Licz.Jeżeli(A2:A193;D9) Szereg kumulacyjny (Ćwiczenie 1_3) F25 = Częstość(A2:I20;3)/171 Szereg zwykły (Ćwiczenie 1_4) B2-B6: 100,200,,600 + HISTOGRAM (Analiza danych) kumulacyjny zwykły (histogram) Analiza jednorodności Analiza jednorodności Analiza jednorodności Dla zastosowania miar klasycznych w analizie próby, potrzebna jest jej jednorodność ze względu na badaną cechę zmienną. Jednorodność ma miejsce, gdy rozkład zmiennej jest rozkładem jednomodalnym, co najwyżej umiarkowanie asymetrycznym. Jeżeli tak nie jest, należy skorzystać z miar pozycyjnych np. dominanta (modalna), mediana, kwantyle Analiza próby pod kątem jednorodności Ćwiczenie 2_1, 2_2 HISTOGRAM 2

Miary położenia Miary położenia Średnia arytmetyczna Średnia arytmetyczna jest podstawową miarą stosowaną w analizie struktury, bowiem opierając się na niej wylicza się często inne parametry, takie jak odchylenie standardowe, momenty centralne czy skośność Średnią arytmetyczną można wyznaczać z różnego rodzaju szeregów Średnia arytmetyczna Średnia arytmetyczna Średnia arytmetyczna z szeregu punktowego Średnia arytmetyczna z szeregu przedziałowego Stosujemy wzór na średnią arytmetyczną ważoną = x i wariant cechy zmiennej n i liczebność cząstkowa (waga) odpowiadająca cesze x i N liczebność zbiorowości Stosujemy wzór na średnią arytmetyczną ważoną = x i środek przedziału klasowego n i liczebność cząstkowa (waga) odpowiadająca cesze x i N liczebność zbiorowości Ćwiczenie 3_1 Wykorzystaj wzór oraz funkcję ŚREDNIA Ćwiczenie 3_2 (różnice między wartościami średnich) D3 = (A3+B3)/2. Średnia harmoniczna Średnia harmoniczna Średnia harmoniczna - używamy jej gdy dane wyrażone są w postaci względnej = 1 x i wariant cechy zmiennej N liczba obserwacji Ćwiczenie 4_1 W dwóch stutysięcznych miastach gęstość zaludnienia wynosi odpowiednio 200 i 300 osób na kilometr kwadratowy. Oblicz przeciętną gęstość zaludnienia obu tych miast. Odpowiedź 250 jest błędna! Miasto 1 to 500 km2; Miasto 2 to 333,3 km2; Razem 200 000 mieszkańców, 833,3 km2 i 240 osób na km2 Wykorzystaj wzór (N = 2) Wykorzystaj funkcję ŚREDNIA.HARMONICZNA() 3

Średnia harmoniczna ważona Średnia harmoniczna ważona Średnia harmoniczna ważona - używamy jej gdy dane wyrażone są w postaci niemianowanej, czyli względnej a wagi różnią się między sobą = 1 x i wariant cechy zmiennej n i wagi (liczebności cząstkowe) N liczebność zbiorowości (N = n 1 + n 2 + ) Ćwiczenie 4_2 Dane są informacje na temat średniego zaludnienia w trzech państwach o różnej liczbie mieszkańców. Oblicz średnią gęstość zaludnienia na łącznym obszarze tych państw Zastosowanie średniej harmonicznej (nieważonej) daje błędny wynik! Wykorzystaj wzór oraz funkcję ŚREDNIA.HARMONICZNA() Porównaj otrzymane rezultaty Modalna, mediana, kwartyle Modalna Poznane wcześniej miary to klasyczne miary położenia Istnieją również pozycyjne miary położenia. Są to wartości cechy statystycznej występujące u konkretnej jednostki statystycznej. Jednostka ta wyróżnia się miejscem (pozycją) w uporządkowanym szeregu statystycznym. Wyjątkiem jest mediana w szeregu o parzystej liczbie elementów. Modalna (dominanta) dla szeregu prostego i punktowego informuje o wartości cechy zmiennej, której odpowiada maksymalna liczba spostrzeżeń lub w przypadku cechy ciągłej, wokół której koncentrują się spostrzeżenia. W zbiorowościach jednorodnych uzasadnione jest użycie do ich opisu modalnej Ćwiczenie 4_3 Wykorzystaj funkcję WYST.NAJCZĘŚCIEJ() lub wskaż wynik Modalna (dominanta) dla szeregu przedziałowego może być wyznaczona tylko szacunkowo Mediana Kwartyle Mediana dla szeregu prostego i punktowego dzieli zbiorowość na dwie części w ten sposób, że połowa jednostek zbiorowości charakteryzuje się wartościami nie większymi od mediany, a połowa nie mniejszymi od niej. =, =, =!!"#, =, Ćwiczenie 4_5 (mediana z szeregu kumulacyjnego) E2=D2, E3=D3+E2 k=n/2=96 Często stosowaną miarą pozycyjną są kwantyle. Spośród nich najczęściej używane są wartości ćwiartkowe, zwane kwartylami (Q 1, Q 3 ) Ćwiczenie 4_7 Uporządkuj szereg lub skorzystaj z funkcji KWARTYL KWARTYL(zakres;1) KWARTYL(zakres;3) Z szeregu przedziałowego można wyznaczyć kwartyle jedynie w sposób przybliżony 4

Miary rozproszenia Miary rozproszenia Miary rozproszenia Jeżeli znamy średni poziom badanej cechy, możemy przeprowadzić badanie stopnia zróżnicowania całej zbiorowości pod względem jej wartości Najczęściej stosowane miary absolutne to: odchylenie przeciętne, odchylenie standardowe czy odchylenie ćwiartkowe Dysponując tymi parametrami można określić typowy obszar zmienności i względną miarę rozproszenia. Odchylenie przeciętne Odchylenie przeciętne (średnie) używane dla szeregów o rozkładzie symetrycznym lub zbliżonym do symetrycznego. $ % = x i warianty cechy zmiennej - średnia arytmetyczna n i liczebność cząstkowa dla cechy x i N liczebność zbiorowości Ćwiczenie 5_1 Skorzystaj z funkcji ODCH.ŚREDNIE Odchylenie standardowe Miarą najbardziej precyzyjną wśród miar rozproszenia jest odchylenie standardowe. Odchylenie standardowe można też wyznaczać z szeregu przedziałowego ' = ( ) x i środek przedziału klasowego n i liczebność cząstkowa dla cechy x i N liczebność zbiorowości Ćwiczenie 5_2 Skorzystaj z funkcji ODCH.STANDARD.POPUL oraz z funkcji ODCH.STANDARDOWE dla szeregu Odchylenie ćwiartkowe Typowy obszar zmienności Odchylenie ćwiartkowe (kwartylowy obszar zmienności) wyznaczamy, gdy nie można zastosować miar klasycznych a także wtedy, gdy interesuje nas zmienność 50% środkowych jednostek zbiorowości Q 1 kwartyl pierwszy Q 3 kwartyl trzeci Ćwiczenie 5_3 * = * + * 2 Skorzystaj z KWARTYL(zakres;1) KWARTYL(zakres;3) W typowym obszarze zmienności mieści się (zgodnie z teorią) około 2/3 wszystkich obserwacji Ćwiczenie 5_4 Skorzystaj z funkcji: ŚREDNIA ODCH.STAND.POPUL CZĘSTOŚĆ ' <./% < +' 5

Reguła 3 sigma Relacja między odchyleniami Jeżeli rozkład jest zbliżony do rozkładu normalnego to 1 na 370 obserwacji przekracza średnią arytmetyczną o więcej niż plus-minus trzy odchylenia standardowe (pozostałe 99.73% jest odchylone o mniej niż 3 sigma) Między zastosowanymi miarami zróżnicowania zachodzi następująca relacja: * <$ <' Ćwiczenie 5_5 Skorzystaj z funkcji: ŚREDNIA ODCH.STAND.POPUL CZĘSTOŚĆ i ILE.LICZB Ćwiczenie 5_6 Skorzystaj z funkcji: ODCH.ŚREDNIE ODCH.STAND.POPUL CZĘSTOŚĆ i ILE.LICZB Współczynnik zmienności Współczynnik zmienności pozwala na porównanie stopnia zróżnicowania cechy zmiennej w kilku zbiorowościach. Daje również możliwość oceny stopnia jednorodności zbiorowości, co jest istotne do poprawnej analizy statystycznej 1 = ' 0 <= V <= 0,20 małe zróżnicowanie cechy 0,20 < V <= 0,40 przeciętne zróżnicowanie cechy 0,40 < V <= 1,00 duże zróżnicowanie cechy 1,00 < V bardzo duże zróżnicowanie cechy Ćwiczenie 5_7 Skorzystaj z funkcji: ŚREDNIA ODCH.STAND.POPUL Znając wartości miar tendencji centralnej oraz miar rozproszenia, można pogłębić wiedzę na temat struktury badanej zbiorowości przez zastosowanie innego narzędzia analizy, jakim są miary asymetrii. Wyróżniamy trzy rodzaje parametrów asymetrii klasyczny klasyczno-pozycyjny pozycyjny (pomijamy go w tej pracy) 6

Klasyczny współczynnik asymetrii Klasyczny współczynnik asymetrii Moment zwykły pierwszego rzędu (2 ) - średnia Moment centralny drugiego rzędu (3 ) - wariancja Kierunek asymetrii można mierzyć, posługując się momentem centralnym trzeciego rzędu 3 + = ( ) + Wartość dodatnia to asymetria prawostronna, wartość ujemna to asymetria lewostronna, wartość równa 0 wskazuje na rozkład symetryczny Siła asymetrii: Wartość <= 0,7 4 + = 3 + ' + - słaba asymetria 0,7 < wartość < 1,4 - umiarkowana asymetria 1,4 <= wartość - silna asymetria Ćwiczenie 6_1 Klasyczno-pozycyjny w. asymetrii Miary koncentracji Kierunek i siłę asymetrii można zmierzyć posługując się klasyczno-pozycyjnym parametrem asymetrii. Wykorzystuje się go do porównywania szeregów jednomodalnych o umiarkowanej asymetrii: - mediana 5 6 = 3( ) ' Miary koncentracji Ćwiczenie 6_2 Miary koncentracji Współczynnik spłaszczenia Dopełnieniem statystycznego opisu struktury są miary koncentracji: Koncentracja jako skupienie wokół wartości średniej; do analizy natężenia koncentracji wykorzystuje się współczynnik spłaszczenia (moment centralny czwartego rzędu) Koncentracja rozumiana jako nierównomierny rozkład wartości cechy zmiennej między jednostkami zbiorowości; do określenia koncentracji wykorzystuje się współczynnik koncentracji Lorenza i krzywą koncentracji Lorenza Moment centralny czwartego rzędu 3 8 = ( ) 8 Współczynnik spłaszczenia: 4 8 = 3 8 ' 8 Jeżeli wartość współczynnika jest większa od 3, to krzywa jest wysmukła w stosunku do krzywej normalnej; w przeciwnym wypadku krzywa jest spłaszczona Ćwiczenie 7_1 7

Współczynnik spłaszczenia Krzywa koncentracji Lorenza Krzywa nierównomierności podziału globalnego zasobu cechy Tworzymy wielobok koncentracji Lorenza oś odciętych to skumulowane częstości względne liczby zdarzeń (np. liczby transakcji) oś rzędnych to skumulowane częstości względne wartości zdarzeń (np. wartości transakcji) Ćwiczenie 7_2 Krzywa koncentracji Lorenza (2005) Krzywa koncentracji Lorenza (1947-2005) 8