1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

Podobne dokumenty
Po co nam charakterystyki liczbowe? Katarzyna Lubnauer 34

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

1 Podstawy rachunku prawdopodobieństwa

Statystyka. Wykład 3. Magdalena Alama-Bućko. 6 marca Magdalena Alama-Bućko Statystyka 6 marca / 28

Statystyka. Opisowa analiza zjawisk masowych

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

Wskaźnik asymetrii Jeżeli: rozkład jest symetryczny, to = 0, rozkład jest asymetryczny lewostronnie, to < 0. Kwartylowy wskaźnik asymetrii

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.

Analiza zróżnicowania, asymetrii i koncentracji

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Parametry statystyczne

Pozyskiwanie wiedzy z danych

Wykład 5. Opis struktury zbiorowości. 1. Miary asymetrii.

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

Miary zmienności STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

Statystyczne metody analizy danych

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

Statystyka opisowa. Robert Pietrzykowski.

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Statystyka. Podstawowe pojęcia: populacja (zbiorowość statystyczna), jednostka statystyczna, próba. Cechy: ilościowe (mierzalne),

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

Miary asymetrii STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

Próba własności i parametry

Miary statystyczne w badaniach pedagogicznych

Wykład 5: Statystyki opisowe (część 2)

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY

Laboratorium 3 - statystyka opisowa

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd

STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE

Xi B ni B

Inteligentna analiza danych

Porównaj płace pracowników obu zakładów, dokonując kompleksowej analizy struktury. Zastanów się, w którym zakładzie jest korzystniej pracować?

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Opisowa analiza struktury zjawisk statystycznych

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Biostatystyka, # 1 /Weterynaria I/

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

STATYSTYKA wykłady. L.Gruszczyński Elementy statystyki dla socjologów Dr. Pactwa pon. i wtorek 09:30 11:00 (pok. 217) I. (08.X)

W1. Wprowadzenie. Statystyka opisowa

Ćwiczenia 1-2 Analiza rozkładu empirycznego

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35

Statystyka opisowa w wycenie nieruchomości Część I - wyznaczanie miar zbioru danych

4.2. Statystyczne opracowanie zebranego materiału

Statystyka. Wykład 5. Magdalena Alama-Bućko. 20 marca Magdalena Alama-Bućko Statystyka 20 marca / 26

Przedmiot statystyki. Graficzne przedstawienie danych.

Zakład Ubezpieczeń Społecznych Departament Statystyki. Struktura wysokości emerytur i rent wypłacanych przez ZUS po waloryzacji w marcu 2010 roku.

Analiza struktury i przeciętnego poziomu cechy

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

Podstawowe funkcje statystyki: informacyjna, analityczna, prognostyczna.

Zadanie 2.Na III roku bankowości złożonym z 20 studentów i 10 studentek przeprowadzono test pisemny ze statystyki. Oto wyniki w obu podgrupach.

Wykład 3. Opis struktury zbiorowości. 1. Parametry opisu rozkładu badanej cechy. 3. Średnia arytmetyczna. 4. Dominanta. 5. Kwantyle.

Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe

Matematyka z el. statystyki, # 1 /Geodezja i kartografia II/

2.Wstępna analiza danych c.d.- wykład z Populacja i próba

Statystyka opisowa. Robert Pietrzykowski.

Wykład 2. Statystyka opisowa - Miary rozkładu: Miary położenia

Statystyka matematyczna dla leśników

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

Statystyczne metody analizy danych. Agnieszka Nowak - Brzezińska

Statystyka Opisowa WK Andrzej Pawlak. Intended Audience: PWR

Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

Rachunek prawdopodobieństwa i statystyka

Wykład 3: Statystyki opisowe - miary położenia, miary zmienności, miary asymetrii

Agata Boratyńska. WYKŁAD 1. Wstępna analiza danych, charakterystyki opisowe. Indeksy statystyczne.

Wydział Inżynierii Produkcji. I Logistyki. Statystyka opisowa. Wykład 3. Dr inż. Adam Deptuła

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 1 i 2

Statystyka to nauka o metodach badań (liczbowo wyrażalnych) własności zbiorowości. Próba. Próba Populacja. Próba

Wydział Nauki o Zdrowiu. Zakład Profilaktyki Zagrożeń Środowiskowych i Alergologii Marta Zalewska

Miary w szeregach. 1 Miary klasyczne. 1.1 Średnia Średnia arytmetyczna

Graficzna prezentacja danych statystycznych

1. szereg wyliczający (szczegółowy) - wyniki są uporządkowane wyłącznie według wartości badanej cechy, np. od najmniejszej do największej

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Estymacja punktowa i przedziałowa

Statystyka Matematyczna Anna Janicka

Analiza statystyczna w naukach przyrodniczych

Statystyczne metody analizy danych

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Statystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39

METODOLOGIA BADAŃ HUMANISTYCZNYCH METODYKA NAUCZANIA JĘZYKA OBCEGO CZ.II

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Często spotykany jest również asymetryczny rozkład gamma (Г), opisany za pomocą parametru skali θ i parametru kształtu k:

Zawartość. Zawartość

Zakład Ubezpieczeń Społecznych Departament Statystyki i Prognoz Aktuarialnych

Transkrypt:

Wariancja z populacji: Podstawowe miary rozproszenia: 1 1 s x x x x k 2 2 k 2 2 i i n i1 n i1 Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel: 1 k 2 s xi x n 1 i1 2 Przykład 38, 41, 44, 45, 45, 52, 54, 56, 60, 64, 69, 71, 76, 77, 78, 79, 80, 81, 87, 88, 90, 98 x 1 n n i 1 x i 66,95 1 s x x 306, 77 n 2 2 2 i n i 1 n 1 321,38 n 1 2 s x 2 i x Katarzyna Lubnauer 58 i1

Odchylenie standardowe to pierwiastek z wariancji: 1 k i n i 1 2 s x x lub k 1 s xi x n 1 i1 2 Przykład 38, 41, 44, 45, 45, 52, 54, 56, 60, 64, 69, 71, 76, 77, 78, 79, 80, 81, 87, 88, 90, 98 s 306,77 17,5 s 321,38 17,9 Katarzyna Lubnauer 59

W szeregach rozdzielczych punktowych stosuje się tzw. wariancję, wyrażającą się wzorem: 1 1 s n x x n x x k 2 2 k 2 2 i i i i n i1 n i1 1 k 2 s ni n 1 i1 xi x 2 x i n i n k wartość wariantu i - tej klasy (przedziału) liczebność i-tej klasy Liczebność populacji liczba klas Katarzyna Lubnauer 60

Dla szeregu rozdzielczego przedziałowego: 1 1 s n x x n x x k 2 2 k 2 2 i i i i n i1 n i1 1 k 2 s ni n 1 i1 xi x 2 x i x i n i x 2 i1 środek i - tej klasy (przedziału) liczebność i-tej klasy n Liczebność populacji k liczba klas Katarzyna Lubnauer 61

Współczynnik zmienności (niekiedy wynik jest podawany w procentach) Współczynnik zmienności mierzy zróżnicowanie względne i określa jaką część (ile procent) przeciętnego poziomu badanej cechy stanowi odchylenie standardowe. v s x v s x Przykład Mamy dwie maszyny rozsypujące cukier do torebek: 1. Maszyna A rozsypuje cukier do torebek 1 kg, wyniki otrzymane przy kontroli wagi pokazują następujące wyniki w kg: 0,85; 0,87; 0,9; 0,91; 1,03; 1,03; 1,08; 1,1; 1,12 2. Maszyna B rozsypuje cukier do worków 1 00kg, wyniki otrzymane przy kontroli wagi pokazują następujące wyniki w kg: 86; 87,5; 91; 91; 100; 102; 105; 110; 115 sa sb 0,10533 10,31315 Badanie go ma sens tylko dla cech o dodatnich wartościach v A v B s A 0,10533 0,106633 xa 0, 987778 s B 10,31315 0,104584 x 98,61111 B Katarzyna Lubnauer 62

Odchylenie przeciętne Def. Odchylenie przeciętne SD - jest to średnia arytmetyczna bezwzględnych odchyleń wartości cechy od średniej arytmetycznej. Określa o ile jednostki danej zbiorowości różnią się średnio, ze względu na wartość cechy, od średniej arytmetycznej. W szeregach szczegółowych stosuje się odchylenie przeciętne, wyrażającą się wzorem: D 1 n n i 1 S x x i Katarzyna Lubnauer 63

W szeregach rozdzielczych punktowych stosuje się odchylenie przeciętne, wyrażającą się wzorem: 1 k D i i n i 1 S n x x x i n i n k wartość wariantu i - tej klasy (przedziału) liczebność i-tej klasy Liczebność populacji liczba klas Katarzyna Lubnauer 64

W szeregach rozdzielczych przedziałowych stosuje się odchylenie przeciętne, wyrażającą się wzorem: 1 k D i i n i 1 S n x x x i n i n k Środek i - tej klasy (przedziału) liczebność i-tej klasy Liczebność populacji liczba klas Katarzyna Lubnauer 65

Zachodzi następująca zależność między odchyleniem przeciętnym i standardowym SD s Dla powyższej miary rozrzutu też można zdefiniować współczynnik zmienności: v D s D x Katarzyna Lubnauer 66

Rozstęp jest najprostszą miarą rozproszenia (zmienności). Jest niczym innym jak różnicą między wartością maksymalną a minimalną z naszego zbioru obserwacji. Pokazuje zatem jedynie jaki jest zakres naszych obserwacji nie informuje w żaden sposób co dzieje się "w środku" tego zakresu np. jaka wartość występowała najczęściej, czy jaka jest średnia dla tego zbioru obserwacji. R x x Max Min max min Przykład 38, 41, 44, 45, 45, 52, 54, 56, 60, 64, 69, 71, 76, 77, 78, 79, 80, 81, 87, 88, 90, 98 R xmax xmin 98 38 60 Uwaga Wartość miary R zależy jedynie od dwóch skrajnych (największej i najmniejszej) wartości zmiennej, nie dostarczając tym samym wyczerpującej informacji o zróżnicowaniu pozostałych wartości cechy. Jest to niewątpliwie słabością tej miary dyspersji. Katarzyna Lubnauer 67

Dlatego też często stosuje się inny rodzaj rozstępu, jakim jest odstęp międzykwartylowy. Odstęp międzykwartylowy definiuje się wzorem: IQR Q1 Q3 Przykład 38, 41, 44, 45, 45, 52, 54, 56, 60, 64, 69, 71, 76, 77, 78, 79, 80, 81, 87, 88, 90, 98 IQR Q1 Q3 79,75 52,5 17,25 Min = 38 Q1=52,5 Q3=79,75 Max = 98 x 66,95 Me=70 Katarzyna Lubnauer 68

Znając średnie, mediany, kwartyle oraz wartości skrajne możemy zbudować wykresy pudełkowe w celu porównywania dwóch podobnych populacji ze względu na tę samą cechę. Min = 38 Q1=52,5 Q3=79,75 Max = 98 x 66,95 Me=70 Min = 45 Q1=60,5 Q3=72,5 Max = 88 x 62,25 Me=64 Na rysunki mamy wykresy pudełkowe dla 2 grup studentów i ich wyniki procentowe z tego samego egzaminu. Jakie wnioski możemy wyciągnąć porównując wykresy? Katarzyna Lubnauer 69

Przedział typowych wartości [x - s, x + s] Jest to przedział, do którego należy większość danych statystycznych, interpretacja ta jest uzasadniona wtedy, gdy cecha ma rozkład zbliżony do rozkładu normalnego. Katarzyna Lubnauer 70

Zalety i wady różnych miar rozproszenia Miara rozproszenia Zalety Wady Wariancja, odchylenie standardowe Współczynnik zmienności Łatwo policzyć, jest zdefiniowana algebraicznie Uwzględnia wszystkie wartości wariantów cechy Łatwo policzyć, jest zdefiniowana algebraicznie Uwzględnia wszystkie wartości wariantów cechy Można porównywać dwie różniące się wartościami populacje Duży wpływ mają na nią wartości odskakujące Zniekształcenie w przypadku rozkładów skośnych Trudno porównywać przy różnych wielkościach Duży wpływ mają na nią wartości odskakujące Zniekształcenie w przypadku rozkładów skośnych Rozstęp Łatwo znaleźć Zniekształcony przez wartości odskakujące Pomija większość informacji Nie jest zdefiniowana algebraicznie IQR Nie jest zniekształcona w przypadku rozkładów skośnych Brak wpływu wartości odskakujących Dobry w przypadku rozkładów skośnych Pomija większość informacji Nie jest zdefiniowana algebraicznie Nie powinno się stosować do małych prób Katarzyna Lubnauer 71

Miary asymetrii Jak interpretujemy wartości miar asymetrii? x1 0 s1 5,062279 x2 0 s2 5,062279 18 16 14 12 10 8 6 4 2 0 18 16 14 12 10 8 6 4 2 0-3 -2-1 0 1 2 3 4 5 6 7-7 -6-5 -4-3 -2-1 0 1 2 3 Katarzyna Lubnauer 72

Znak współczynnika asymetrii wskazuje na kierunek asymetrii natomiast jego wartość bezwzględna określa siłę asymetrii. Mówimy, że rozkład może być symetryczny: Katarzyna Lubnauer 73

prawoskośny, lewoskośny Katarzyna Lubnauer 74

Def Rozkład symetryczny występuje, jeśli skupienie wyników znajduje się wokół środka rozkładu. Rozkład prawoskośny - (asymetria dodatnia) wyniki skupiają się przy niskich wartościach cechy. Rozkład lewoskośny - (asymetria ujemna) wyniki skupiają się przy wysokich wartościach cechy. Skośność mierzymy przy pomocy miar asymetrii, najpopularniejsze to: Współczynnik asymetrii (klasyczny) A 1 n i n i1 x x 3 s 3 Katarzyna Lubnauer 75

Współczynnik asymetrii (klasyczny) dla szeregu punktowego: A 1 k i i n i1 3 n x x s 3 Współczynnik asymetrii (klasyczny) dla szeregu przedziałowego: A 1 k i i n i1 3 n x x s 3 Symbole we wzorach oznaczają to co zawsze. Katarzyna Lubnauer 76

Miary asymetrii Jak interpretujemy wartości miar asymetrii? x1 0 s1 5,062279 x2 0 s2 5,062279 18 16 14 12 10 8 6 4 2 0 18 16 14 12 10 8 6 4 2 0-3 -2-1 0 1 2 3 4 5 6 7-7 -6-5 -4-3 -2-1 0 1 2 3 A1 0,077084 A2 0,077084 Katarzyna Lubnauer 77

Współczynnik asymetrii (klasyczny) - własności na ogół 2 A 2 określa kierunek i siłę asymetrii, ujemny oznacz rozkład o asymetrii lewostronnej, a dodatni prawostronnej o sile asymetrii mówi wartość bezwzględna z A: 0-0,4 bardzo słaba asymetria, rozkład prawie symetryczny 0,4-0,8 słaba asymetria 0,8-1,2 umiarkowana asymetria 1,2-1,6 siła asymetria Powyżej 1,6 bardzo silna asymetria. Skośność (inna odmiana klasycznego współczynnika skośności) A 1 2 i1 x x 3 n n i n n s 3 Z tego wzoru policzymy skośność korzystając z Excela. Katarzyna Lubnauer 78

Wskaźnik asymetrii Pearsona: AP x s d Możemy go wyznaczać tylko, jeśli próba ma modę (dominantę) d na ogół 1 AP 1 określa kierunek i siłę asymetrii, ujemny oznacz rozkład o asymetrii lewostronnej, a dodatni prawostronnej o sile asymetrii mówi wartość bezwzględna z AP : 0,0-0,2 bardzo słaba asymetria, rozkład prawie symetryczny 0,2-0,4 słaba asymetria 0,4-0,6 umiarkowana asymetria 0,6-0,8 silna asymetria Powyżej 0,8 bardzo silna asymetria. Katarzyna Lubnauer 79

Zauważmy, że najprostszym, prymitywnym sposobem badania skośności może być porównywanie położenia średniej i mediany, Jeśli średnia jest na prawo od mediany d Me x to mamy asymetrię prawoskośną Jeśli średnia jest na lewo od mediany x Me d to mamy asymetrię lewośną Katarzyna Lubnauer 80

Miary skupienia (koncentracji) Def. Koncentracja oznacza skupienie wartości cechy wokół średniej arytmetycznej z próby. Def. Współczynnikiem kurtozy (koncentracji, spłaszczenia) nazywamy wartość K otrzymaną ze wzoru: K m s 4 4 gdzie m x x 4 4 1 n i n i 1 Jest 4 momentem centralnym z populacji. W celu oceny koncentracji badanego rozkładu porównuje się ją do rozkładu normalnego, dla którego K 3 Katarzyna Lubnauer 81

Def. Współczynnikiem ekscesu nazywamy wartość liczoną ze wzoru: K K 3 Jak widać celem wprowadzenia nowego pojęcia było przesunięcie wartości do 0. Rozkłady prawdopodobieństwa można podzielić ze względu na wartość współczynnika ekscesu na rozkłady: mezokurtyczne - wartość kurtozy wynosi 0, spłaszczenie rozkładu jest podobne do spłaszczenia rozkładu normalnego (dla którego kurtoza wynosi dokładnie 0) leptokurtyczne - kurtoza jest dodatnia, wartości cechy bardziej skoncentrowane niż przy rozkładzie normalnym platokurtyczne - kurtoza jest ujemna, wartości cechy mniej skoncentrowane niż przy rozkładzie normalnym Katarzyna Lubnauer 82

Katarzyna Lubnauer 83

Katarzyna Lubnauer 84