Statystyka. Wykład 5. Magdalena Alama-Bućko. 20 marca Magdalena Alama-Bućko Statystyka 20 marca / 26

Podobne dokumenty
Statystyka. Wykład 6. Magdalena Alama-Bućko. 9 kwietnia Magdalena Alama-Bućko Statystyka 9 kwietnia / 36

Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Miary koncentracji STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 28 września 2018

Wskaźnik asymetrii Jeżeli: rozkład jest symetryczny, to = 0, rozkład jest asymetryczny lewostronnie, to < 0. Kwartylowy wskaźnik asymetrii

Statystyka. Wykład 3. Magdalena Alama-Bućko. 6 marca Magdalena Alama-Bućko Statystyka 6 marca / 28

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

Wykład 5. Opis struktury zbiorowości. 1. Miary asymetrii.

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Próba własności i parametry

Statystyka. Wykład 8. Magdalena Alama-Bućko. 23 kwietnia Magdalena Alama-Bućko Statystyka 23 kwietnia / 38

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

Statystyka. Wykład 11. Magdalena Alama-Bućko. 21 maja Magdalena Alama-Bućko Statystyka 21 maja / 31

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

Statystyka. Wykład 9. Magdalena Alama-Bućko. 7 maja Magdalena Alama-Bućko Statystyka 7 maja / 40

Statystyka. Podstawowe pojęcia: populacja (zbiorowość statystyczna), jednostka statystyczna, próba. Cechy: ilościowe (mierzalne),

Statystyka. Wykład 7. Magdalena Alama-Bućko. 3 kwietnia Magdalena Alama-Bućko Statystyka 3 kwietnia / 36

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Rok akademicki: 2013/2014 Kod: ZIE n Punkty ECTS: 6. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

Statystyka opisowa. Robert Pietrzykowski.

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Statystyczne metody analizy danych

Opisowa analiza struktury zjawisk statystycznych

Statystyka. Opisowa analiza zjawisk masowych

Statystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39

Statystyka. Wykład 1. Magdalena Alama-Bućko. 20 lutego Magdalena Alama-Bućko Statystyka 20 lutego / 19

Analiza zróżnicowania, asymetrii i koncentracji

Po co nam charakterystyki liczbowe? Katarzyna Lubnauer 34

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

Statystyka. Wykład 1. Magdalena Alama-Bućko. 26 lutego Magdalena Alama-Bućko Statystyka 26 lutego / 34

Miary statystyczne w badaniach pedagogicznych

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

1 Podstawy rachunku prawdopodobieństwa

Statystyka. Wykład 10. Magdalena Alama-Bućko. 15 maja Magdalena Alama-Bućko Statystyka 15 maja / 32

W1. Wprowadzenie. Statystyka opisowa

Podstawowe funkcje statystyki: informacyjna, analityczna, prognostyczna.

Porównaj płace pracowników obu zakładów, dokonując kompleksowej analizy struktury. Zastanów się, w którym zakładzie jest korzystniej pracować?

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

Statystyka opisowa- cd.

Wykład 2. Statystyka opisowa - Miary rozkładu: Miary położenia

Ćwiczenia 1-2 Analiza rozkładu empirycznego

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Wykład 5: Statystyki opisowe (część 2)

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

Biostatystyka, # 1 /Weterynaria I/

dr hab. Renata Karkowska 1

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Statystyka. Wykład 10. Magdalena Alama-Bućko. 14 maja Magdalena Alama-Bućko Statystyka 14 maja / 31

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

STATYSTYKA wykłady. L.Gruszczyński Elementy statystyki dla socjologów Dr. Pactwa pon. i wtorek 09:30 11:00 (pok. 217) I. (08.X)

Często spotykany jest również asymetryczny rozkład gamma (Г), opisany za pomocą parametru skali θ i parametru kształtu k:

Statystyka Matematyczna Anna Janicka

Miary zmienności STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd

STATYSTYKA OPISOWA. Dr Alina Gleska. 12 listopada Instytut Matematyki WE PP

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

POJĘCIA WSTĘPNE. STATYSTYKA - nauka traktująca o metodach ilościowych badania prawidłowości zjawisk (procesów) masowych.

WYKRESY SPORZĄDZANE W UKŁADZIE WSPÓŁRZĘDNYCH:

Xi B ni B

Wykład 3. Opis struktury zbiorowości. 1. Parametry opisu rozkładu badanej cechy. 3. Średnia arytmetyczna. 4. Dominanta. 5. Kwantyle.

Statystyka opisowa w wycenie nieruchomości Część I - wyznaczanie miar zbioru danych

Wprowadzenie Pojęcia podstawowe Szeregi rozdzielcze STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP.

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład Przedmiot statystyki

Statystyka matematyczna

Pozyskiwanie wiedzy z danych

Statystyka Opisowa WK Andrzej Pawlak. Intended Audience: PWR

Parametry statystyczne

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

Statystyka matematyczna i ekonometria

Zadanie 2.Na III roku bankowości złożonym z 20 studentów i 10 studentek przeprowadzono test pisemny ze statystyki. Oto wyniki w obu podgrupach.

STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE

Matematyka z el. statystyki, # 1 /Geodezja i kartografia II/

Statystyki opisowe i szeregi rozdzielcze

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

ANALIZA SPRZEDAŻY: - struktura

Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl

Wydział Inżynierii Produkcji. I Logistyki. Statystyka opisowa. Wykład 3. Dr inż. Adam Deptuła

PDF created with FinePrint pdffactory Pro trial version

Dane i ich struktura Skale pomiarowe i ich przekształcanie. Mariusz Dacko

Statystyka i analiza danych pomiarowych Podstawowe pojęcia statystyki cz. 2. Tadeusz M. Molenda Instytut Fizyki, Uniwersytet Szczeciński

Miary asymetrii STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

Zadania ze statystyki, cz.6

Transkrypt:

Statystyka Wykład 5 Magdalena Alama-Bućko 20 marca 2017 Magdalena Alama-Bućko Statystyka 20 marca 2017 1 / 26

Koncentracja Analiza struktury zbiorowości miary położenia ( miary średnie) miary zmienności (rozproszenia, dyspersji) miary asymetrii miary koncentracji (miara spłaszczenia). Miara koncentracji (kurtoza) - miara skupienia obserwacji wokół średniej. Istnieje ścisły zwiazek pomiędzy koncentracja wartości cechy wokół średniej, a ich zróżnicowaniem. Im większe jest zróżnicowanie, tym mniejsza jest koncentracja. Magdalena Alama-Bućko Statystyka 20 marca 2017 2 / 26

K = m 4 s 4, gdzie m 4 = 1 n n (x i x) 4. Im wyższa wartość K, tym bardziej wysmukła krzywa liczebności, więc większa koncentracja wartości cechy wokół średniej. Małe wartości K wskazuja natomiast na spłaszczenie rozkładu zbiorowości względem badanej cechy. i=1 Jeżeli zbiorowość ma rozkład normalny, to K = 3. K < 3- rozkład bardziej spłaszczony od normalnego K > 3 - rozkład bardziej wysmukły od normalnego Zatem uzasadnione jest stosowanie zmodyfikowanej miary K = m 4 s 4 3. Magdalena Alama-Bućko Statystyka 20 marca 2017 3 / 26

kolor czerwony : K = 0 rozkład normalny kolor zielony : K > 0 rozkład bardziej wysmukły od normalnego kolor granatowy : K < 0 rozkład bardziej spłaszczony od normalnego Magdalena Alama-Bućko Statystyka 20 marca 2017 4 / 26

Przykład 4 Rozważmy jeszcze jeden histogram. A = m 3 s 3 = 0 0.733 3 = 0 - rozkład symetryczny K = m 4 s 4 3 = 1 0.733 4 3 = 0.464 > 0 zatem rozkład bardziej wysmukły od normalnego. Magdalena Alama-Bućko Statystyka 20 marca 2017 5 / 26

Obliczenia do przykładu 4. Legenda: xi - wartość cechy (1kolumna); ni - jej liczebność (2 kol.); 3 kolumna - służy do obliczenia średniej; 4 kol.- pomocniczo do obliczenia m 3 i m 4 ; 5 i 6 kol. - do obliczenia wariancji (czyli m 2 ), 7 i 8 - do obliczenia m 3, a 9 i 10 - do obliczenia m 4 Magdalena Alama-Bućko Statystyka 20 marca 2017 6 / 26

Krzywa koncentracji Lorenza w ekonometrii, ekologii, geografii ludności itp. koncentrację rozkładów cech badamy za pomoca krzywej koncentracji Lorenza. w zasadzie badamy czy cecha jest rozłożona równomiernie graficzna metoda badania koncentracji w ekonometrii np. do badania dystrybucji dochodów w społeczeństwie (tzn. czy wszyscy maja takie same dochody?) w geografii ludności : do obrazowania nierównomierności gęstości zaludnienia w podjednostkach terenowych. Magdalena Alama-Bućko Statystyka 20 marca 2017 7 / 26

Kwadrat o boku 1 (= 100%). na osi poziomej odkładamy skumulowane częstości względne (albo skumulowany procent) liczby obserwacji na osi pionowej odkładamy skumulowane częstości względne (albo skumulowany procent) wartości badanej cechy Przekatna kwadratu nosi nazwę linii równomiernego rozdziału. krzywa koncentracji to łamana łacz aca punkty (0, 0) i (1, 1) = (100%, 100%) oraz pewne punkty wyznaczone na podstawie danych (opisane wyżej). Magdalena Alama-Bućko Statystyka 20 marca 2017 8 / 26

Przykład: Dochody społeczeństwa USA w 1978 Rysunek: źródło : Wikipedia, Krzywa Lorenza punkt E : 80% łacznych dochodów otrzymuje 80% społeczeństwa punkt E : 80% społeczeństwa dysponuje zaledwie 50% dochodów. Magdalena Alama-Bućko Statystyka 20 marca 2017 9 / 26

punkt na przekatnej interpretujemy następujaco : jeżeli dana cecha rozłożona jest równomiernie w badanej grupie obiektów, to p% obiektów (o najmniejszych wartościach) przyjmuje dokładnie p% łacznej wartości danej cechy. jeśli rozkład równomierny, to 50% łacznej wartości cechy osiaga 50% obiektów 80% łacznej wartości cechy osiaga 80% obiektów jeżeli na krzywej Lorenza znajduje się punkt (50%,20%) 20% łacznej wartości cechy osiaga 50% obiektów występuje koncentracja danych ma znaczenie przeciwne do dane rozłożone równomiernie wzrost koncentracji oznacza, że dane sa mniej równomierne Magdalena Alama-Bućko Statystyka 20 marca 2017 10 / 26

Interpretacja Magdalena Alama-Buc ko Statystyka 20 marca 2017 11 / 26

na osi poziomej zaznaczamy skumulowane częstości względne liczby obserwacji Niech n = n 1 + n 2 +... + n k. Dla każdego i liczymy = n cum i 1 j i n j = n 1 + n 2 +... + n i oraz w i = ncum in = n 1 + n 2 +... + n i n Oczywiście w i [0, 1], i = 1, 2,..., k oraz w k = 1 = 100%. na osi pionowej zaznaczamy skumulowane częstości względne wartości danej cechy dla każdego i liczymy t i = x i n i. Niech t = n 1 x 1 + n 2 x 2 +... + n k x k. dla każdego i liczymy = t j = t 1 + t 2 +... + t i. oraz zi = t i cum t t cum i 1 j i = t 1 + t 2 +... + t i t = n 1x 1 + n 2 x 2 +... + n i x i n 1 x 1 + n 2 x 2 +... + n k x k Oczywiście z i [0, 1], i = 1, 2,..., k oraz z k = 1 = 100%. Magdalena Alama-Bućko Statystyka 20 marca 2017 12 / 26

dla i = 1, 2,..., k zaznaczamy punkty (w i, z i ) krzywa koncentracji Lorenza otrzymujemy łacz ac po kolei te punkty z soba. Magdalena Alama-Bućko Statystyka 20 marca 2017 13 / 26

Przykład Magdalena Alama-Bućko Statystyka 20 marca 2017 14 / 26

Powierzchnia koncentracji - powierzchnia pomiędzy linia równomiernego rozdziału (tzn. przekatn a) a krzywa Lorenza. Na podstawie wykresu można zorientować się jak silna koncentracja występuje. Im większe pole tym mniejsza równomierność w rozkładzie cechy. Współczynnik koncentracji Lorenza to stosunek pola powierzchni koncentracji do połowy pola kwadratu (tzn. pola pod przekatn a). Magdalena Alama-Bućko Statystyka 20 marca 2017 15 / 26

a - pole powierzchni koncentracji pole połowy kwadratu o boku (1=100%): jeśli jednostki w postaci ułamków (tzn. skala od 0 do 1), to 1 2 12 = 1 2 jeśli skala osi od 0% do 100% (pomijamy procenty) to 1 2 1002 = 1 5000 Wówczas w zależności od sposobu zapisu danych mamy: K L = a 0.5 albo K L = a 5000. K L = 0 - brak koncentracji K L = 1 - koncentracja zupełna Magdalena Alama-Bućko Statystyka 20 marca 2017 16 / 26

K L = a 0.5 albo K L = a 5000. K L = 0 - brak koncentracji (a = 0 czyli wszystkie punkty na przekatnej) K L = 1 - koncentracja zupełna Słaba koncentracja jest zwiazana z dość równomiernym podziałem łacznej wartości badanej cechy pomiędzy jednostki statystyczne opisywane przez dana cechę jak policzyć a? Magdalena Alama-Bućko Statystyka 20 marca 2017 17 / 26

a obliczamy odejmujac od trójkata pod przekatn a kwadratu trójkata (na brzegu) i trapezów. P 1 = 1 2 0.03 0.08 = 0.0012 P 2 = 1 2 (0.03 + 0.24) (0.38 0.08) = 1 2 0.27 0.3 = 0.0405 P 3 = 1 2 (0.24 + 0.65) (0.77 0.38) = 1 2 0.89 0.39 = 0.1735 P 4 = 1 2 (0.65 + 0.86) (0.92 0.77) = 1 2 1.51 0.15 = 0.1132 P 5 = 1 2 (0.86 + 1) (1 0.92) = 1 2 1.86 0.08 = 0.0744 K = a 0.5 = 0.5 (P 1 + P 2 + P 3 + P 4 + P 5 ) 0.5 0.4028 = = 0.1944. 0.5 0.5 Magdalena Alama-Bućko Statystyka 20 marca 2017 18 / 26

Możemy porównywać wyznaczony w ten sposób współczynnik koncentracji Lorenza dla różnych cech Magdalena Alama-Bućko Statystyka 20 marca 2017 19 / 26

Zadanie Wyznaczyć i porównać koncentrację utargów w dwóch sieciach sklepów. Pokażemy, że wartości współczynników koncentracji Lorenza dla odpowiednio pierwszej i drugiej sieci sklepów wynosza: K (1) L = 0.1955, K (2) L = 0.287. Stad utargi w sieci pierwszej sa mniej skoncentrowane niż w drugiej. Magdalena Alama-Bućko Statystyka 20 marca 2017 20 / 26

K L = 0.1955 Magdalena Alama-Bućko Statystyka 20 marca 2017 21 / 26

P 1 = 1 2 0.11 0.2 = 0.011 P 2 = 1 2 (0.11 + 0.55) (0.7 0.2) = 0.165 P 3 = 1 2 (0.55 + 0.74) (0.84 0.7) = 0.09675 P 4 = 1 2 (0.74 + 0.9) (0.95 0.85) = 0.082 P 5 = 1 2 (0.9 + 1) (1 0.95) = 0.0475 K L = 0.5 (P 1+P 2 +P 3 +P 4 +P 5 ) 0.5 = 0.5 0.40225 0.5 = 0.1955 Magdalena Alama-Bućko Statystyka 20 marca 2017 22 / 26

K L = 0.287 Magdalena Alama-Bućko Statystyka 20 marca 2017 23 / 26

P 1 = 1 2 0.19 0.45 = 0.04275 P 2 = 1 2 (0.19 + 0.23) (0.5 0.45) = 0.0105 P 3 = 1 2 (0.23 + 0.29) (0.55 0.5) = 0.013 P 4 = 1 2 (0.29 + 1) (1 0.55) = 0.29025 K L = 0.5 (P 1+P 2 +P 3 +P 4 ) 0.5 = 0.5 0.3565 0.5 = 0.287 Magdalena Alama-Bućko Statystyka 20 marca 2017 24 / 26

Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia miary zmienności miary asymetrii miary koncentracji. Analiza współzależności zjawisk. Analiza dynamiki zjawisk. Magdalena Alama-Bućko Statystyka 20 marca 2017 25 / 26

Dziękuję za uwagę! Magdalena Alama-Bućko Statystyka 20 marca 2017 26 / 26