Wykład 5. Opis struktury zbiorowości. 1. Miary asymetrii.

Podobne dokumenty
Wskaźnik asymetrii Jeżeli: rozkład jest symetryczny, to = 0, rozkład jest asymetryczny lewostronnie, to < 0. Kwartylowy wskaźnik asymetrii

Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Statystyka opisowa. Robert Pietrzykowski.

Miary koncentracji STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 28 września 2018

Wykład 3. Opis struktury zbiorowości. 1. Parametry opisu rozkładu badanej cechy. 3. Średnia arytmetyczna. 4. Dominanta. 5. Kwantyle.

Statystyka. Opisowa analiza zjawisk masowych

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Opisowa analiza struktury zjawisk statystycznych

Miary asymetrii STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

Próba własności i parametry

1 Podstawy rachunku prawdopodobieństwa

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Statystyka. Podstawowe pojęcia: populacja (zbiorowość statystyczna), jednostka statystyczna, próba. Cechy: ilościowe (mierzalne),

Miary statystyczne w badaniach pedagogicznych

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Rachunek prawdopodobieństwa i statystyka

Pozyskiwanie wiedzy z danych

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Statystyka. Wykład 5. Magdalena Alama-Bućko. 20 marca Magdalena Alama-Bućko Statystyka 20 marca / 26

Analiza zróżnicowania, asymetrii i koncentracji

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

Parametry statystyczne

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Statystyczne metody analizy danych

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.

W1. Wprowadzenie. Statystyka opisowa

STATYSTYKA wykłady. L.Gruszczyński Elementy statystyki dla socjologów Dr. Pactwa pon. i wtorek 09:30 11:00 (pok. 217) I. (08.X)

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

Porównaj płace pracowników obu zakładów, dokonując kompleksowej analizy struktury. Zastanów się, w którym zakładzie jest korzystniej pracować?

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY

Po co nam charakterystyki liczbowe? Katarzyna Lubnauer 34

Wykład 5: Statystyki opisowe (część 2)

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Inteligentna analiza danych

Statystyka matematyczna dla leśników

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

Wykład 2. Statystyka opisowa - Miary rozkładu: Miary położenia

Podstawowe funkcje statystyki: informacyjna, analityczna, prognostyczna.

Biostatystyka, # 1 /Weterynaria I/

Zakład Ubezpieczeń Społecznych Departament Statystyki. Struktura wysokości emerytur i rent wypłacanych przez ZUS po waloryzacji w marcu 2010 roku.

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

Statystyka. Wykład 3. Magdalena Alama-Bućko. 6 marca Magdalena Alama-Bućko Statystyka 6 marca / 28

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Statystyka opisowa w wycenie nieruchomości Część I - wyznaczanie miar zbioru danych

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

Miary zmienności STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

STATYSTYKA OPISOWA. Dr Alina Gleska. 28 września Instytut Matematyki WE PP

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Xi B ni B

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

OTWARTE FUNDUSZE EMERYTALNE W POLSCE Struktura funduszy emerytalnych pod względem liczby członków oraz wielkości aktywów

Statystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39

Miary w szeregach. 1 Miary klasyczne. 1.1 Średnia Średnia arytmetyczna

Laboratorium 3 - statystyka opisowa

99 wybranych pytań ze statystyki i odpowiedzi na nie

Statystyka. Wykład 6. Magdalena Alama-Bućko. 9 kwietnia Magdalena Alama-Bućko Statystyka 9 kwietnia / 36

ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ

Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl

Statystyka Opisowa WK Andrzej Pawlak. Intended Audience: PWR

Ćwiczenia 1-2 Analiza rozkładu empirycznego

2.Wstępna analiza danych c.d.- wykład z Populacja i próba

Wykład 3: Statystyki opisowe - miary położenia, miary zmienności, miary asymetrii

Rok akademicki: 2013/2014 Kod: ZIE n Punkty ECTS: 6. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

Często spotykany jest również asymetryczny rozkład gamma (Г), opisany za pomocą parametru skali θ i parametru kształtu k:

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

Przedmiot statystyki. Graficzne przedstawienie danych.

Budowa pionowa drzewostanu w świetle przestrzennego rozkładu punktów lotniczego skanowania laserowego

Matematyka stosowana i metody numeryczne

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

Statystyka opisowa. Robert Pietrzykowski.

STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE

Statystyki opisowe i szeregi rozdzielcze

Statystyka opisowa. Wykªad II. Elementy statystyki opisowej. Edward Kozªowski.

Zadanie 2.Na III roku bankowości złożonym z 20 studentów i 10 studentek przeprowadzono test pisemny ze statystyki. Oto wyniki w obu podgrupach.

Podstawy statystyki - ćwiczenia r.

Zawartość. Zawartość

Lean Six Sigma Black Belt

Wykład Prezentacja materiału statystycznego. 2. Rodzaje szeregów statystycznych.

Zakład Ubezpieczeń Społecznych Departament Statystyki i Prognoz Aktuarialnych

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Estymacja parametrów rozkładu cechy

Zakład Ubezpieczeń Społecznych Departament Statystyki i Prognoz Aktuarialnych

Wykład 3. Rozkład normalny

Analiza struktury i przeciętnego poziomu cechy

Zakład Ubezpieczeń Społecznych Departament Statystyki i Prognoz Aktuarialnych

Transkrypt:

Wykład 5. Opis struktury zbiorowości 1. Miary asymetrii. 2. Miary koncentracji.

Przykład Zbadano stawkę godzinową (w zł) pracowników dwóch branŝ, otrzymując następujące charakterysty ki liczbowe: Stawka godzinowa Odsetek pracowników BranŜa A BranŜa B 6-8 5 10 8-10 5 25 10-12 25 25 12-14 25 5 14-16 10 5 Średnia 11 11 arytmetyczna Wariancja 4,8 4,8 Odchylenie standardowe 2,19 2,19 V(x) 20% 20%

Na podstawie histogramów moŝna łatwo stwierdzić, Ŝe pomimo takiej samej średniej arytmetycznej jak i zróŝnicowania stawki godzinowej, istnieją róŝnice w strukturach badanych zbiorowości. 40 5 0 25 20 15 BranŜa A BranŜa B 10 5 0 6-8 8-10 10-12 12-14 14-16

Miary asymetrii (skośności) słuŝą do określenia kierunku zróŝnicowania zmiennej.

Współczynnik skośności Pearsona W s = x D s( x), gdzie x D s( x) - średnia arytmetyczna - dominanta - odchylenie standardowe

Współczynnik asymetrii (klasyczny): µ W = A s x ( ), gdzie µ - trzeci moment centralny, który wyznaczamy z następujących wzorów:

dla szeregu szczegółowego µ ( x x) N dla szeregu punktowego µ N i= = 1 k i= = 1 i ( x x ) n N dla szeregu przedziałowego µ = k i= 1 i ( x& x) i N i n i.

Współczynnik asymetrii (pozycyjny) mierzy wyłącznie skośność w centralnej części rozkładu, bierze pod uwagę jedynie połowę jednostek środkowych: ( ) ( ). 2 1 1 1 1 Q Q M Q Q Q Q Q M M Q W p + = =

Kierunek asymetrii W W W S S S, W, W < A P, W, W > A P, W, W = A P 0 - rozkład o asymetrii lewostronnej (ujemnej), 0 - rozkład o asymetrii prawostronnej (dodatniej); 0 - rozkład symetryczny, W S 1, W > > A 2- rozkład skrajnie asymetryczny.

Siła asymetrii WS WA WP Siła asymetrii 0,0-0,2 0,0-0,4 0,0-0,2 bardzo słaba 0,2-0,4 0,4-0,8 0,2-0,4 słaba 0,4-0,6 0,8-1,2 0,4-0,6 umiarkowana 0,6-0,8 1,2-1,6 0,6-0,8 silna 0,8 i > 1,6 i > 0,8-1,0 bardzo silna

Miary koncentracji dotyczą jedynie rozkładów symetrycznych i odpowiadają na pytanie: czy wartości cechy są rozproszone w zbiorowości, czy teŝ charakteryzuje je skupienie wokół wartości średniej arytmetycznej? Wówczas zjawisko to nazywane jest kurtozą. Koncentracja moŝe być równieŝ rozpatrywana jako nierównomierny podział ogólnej sumy wartości cechy między poszczególne jednostki zbiorowości.

Kurtoza oznacza płaskość lub spiczastość rozkładu w stosunku do drugiego. Między zróŝnicowaniem a kurtozą istnieje ścisła zaleŝność.

Im rozkład jest bardziej rozproszony, tym charakteryzuje się mniejszym skupieniem wokół średniej mówimy wówczas, Ŝe rozkład jest platokuryczny, i odwrotnie, im mniejsze rozproszenie, tym większe skupienie wokół średniej wtedy mamy rozkład leptokuryczny.

Współczynnik kurtozy: gdzie µ 4 µ W K = s 4 4, jest czwarty moment centralny, który obliczamy ze wzorów:

dla szeregu szczegółowego µ 4 ( x x) N dla szeregu punktowego µ 4 N i= = 1 k i= = 1 i 4 ( x x ) 4 n N dla szeregu przedziałowego µ 4 = k i= 1 i ( x& x) i N 4 i n i.

Porównujemy otrzymaną wartość współczynnika z kurtozą charakterystyczną dla pewnego bardzo waŝnego rozkładu w statystyce, zwanego rozkładem normalnym. W tym rozkładzie współczynnik kurtozy jest równy, więc: W K < W K = > W K rozkład platokuryczny, rozkład normalny, rozkład leptokuryczny.

Współczynnik ekscesu (eksces) to: W e = W K W e W e W e < = > 0 0 0 rozkład platokuryczny, rozkład normalny, rozkład leptokuryczny.

Koncentracja wartości cechy (rozpatrywana jako nierównomierny podział sumy wartości cechy miedzy poszczególne jednostki zbiorowości). Krzywa (wielobok) Lorenza (krzywa koncentracji Lorenza) w kwadracie o boku 100 zaznacza się na jego podstawie skumulowane odsetki jednostek, zaś na jego prawym boku skumulowany odsetek wartości cechy. Łącząc powstałe punkty otrzymuje się krzywą Lorenza.

Przekątna kwadratu nosi nazwę linii równomiernego rozdziału, a powierzchnia pomiędzy linią równomiernego rozdziału a krzywą Lorenza jest powierzchnią koncentracji.

Współczynnik koncentracji Giniego: K = a 5000, gdzie a jest to pole miedzy linią równomiernego rozkładu a krzywą Lorenza. K 0,1 Gdy K=0 mamy brak koncentracji, a gdy K=1 mamy do czynienia z koncentracją zupełną.

Przykład PoniŜsze dane przedstawiają informacje na temat liczby miast i ludności w miastach w Polsce w dniu 1.12.2000: Grupy miast wg liczby ludności w tys. Liczba miast Liczba ludnośc i w tys. Odsete k miast Odsetek ludności Skumulowane odsetki miast ludności Do 5 287 882,9 2,6,7 2,6,7 5-10 181 1285,2 20,6 5,4 5,2 9,1 10-20 18 2680,2 20,8 11,2 74,0 20, 20-50 17 4224,9 15,6 17,7 89,6 8,0 50-100 50 59,4 5,7 14,1 95, 52,1 100-200 2 04,5 2,6 12,7 97,9 64,8 200 i więcej 19 840,4 2,1 5,2 100 100 Razem 880 2876,5 100 100 x x