STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Podobne dokumenty
STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

Pozyskiwanie wiedzy z danych

Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Wskaźnik asymetrii Jeżeli: rozkład jest symetryczny, to = 0, rozkład jest asymetryczny lewostronnie, to < 0. Kwartylowy wskaźnik asymetrii

1 Podstawy rachunku prawdopodobieństwa

Parametry statystyczne

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Laboratorium 3 - statystyka opisowa

Statystyka. Opisowa analiza zjawisk masowych

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Opisowa analiza struktury zjawisk statystycznych

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

Statystyczne metody analizy danych

Statystyka opisowa. Robert Pietrzykowski.

Próba własności i parametry

Wykład 2. Statystyka opisowa - Miary rozkładu: Miary położenia

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

Statystyka. Podstawowe pojęcia: populacja (zbiorowość statystyczna), jednostka statystyczna, próba. Cechy: ilościowe (mierzalne),

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.

STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE

Wykład 5: Statystyki opisowe (część 2)

W1. Wprowadzenie. Statystyka opisowa

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

Miary statystyczne w badaniach pedagogicznych

Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

Statystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39

Podstawowe funkcje statystyki: informacyjna, analityczna, prognostyczna.

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

Wydział Inżynierii Produkcji. I Logistyki. Statystyka opisowa. Wykład 3. Dr inż. Adam Deptuła

Wykład 3: Statystyki opisowe - miary położenia, miary zmienności, miary asymetrii

Ćwiczenia 1-2 Analiza rozkładu empirycznego

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

Statystyka Opisowa WK Andrzej Pawlak. Intended Audience: PWR

Wykład 5. Opis struktury zbiorowości. 1. Miary asymetrii.

Wykład 4: Statystyki opisowe (część 1)

Statystyka opisowa w wycenie nieruchomości Część I - wyznaczanie miar zbioru danych

Analiza statystyczna w naukach przyrodniczych

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

Wykład 3. Opis struktury zbiorowości. 1. Parametry opisu rozkładu badanej cechy. 3. Średnia arytmetyczna. 4. Dominanta. 5. Kwantyle.

STATYSTYKA wykłady. L.Gruszczyński Elementy statystyki dla socjologów Dr. Pactwa pon. i wtorek 09:30 11:00 (pok. 217) I. (08.X)

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Statystyka matematyczna dla leśników

Po co nam charakterystyki liczbowe? Katarzyna Lubnauer 34

Biostatystyka, # 1 /Weterynaria I/

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Inteligentna analiza danych

Statystyka. Wykład 3. Magdalena Alama-Bućko. 6 marca Magdalena Alama-Bućko Statystyka 6 marca / 28

Xi B ni B

Wykład dla studiów doktoranckich IMDiK PAN. Biostatystyka I. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

Agata Boratyńska. WYKŁAD 1. Wstępna analiza danych, charakterystyki opisowe. Indeksy statystyczne.

Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe

Podstawy statystyki - ćwiczenia r.

Matematyka z el. statystyki, # 1 /Geodezja i kartografia II/

You created this PDF from an application that is not licensed to print to novapdf printer (

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY

Matematyka stosowana i metody numeryczne

Zmienne losowe. Statystyka w 3

Miary w szeregach. 1 Miary klasyczne. 1.1 Średnia Średnia arytmetyczna

Statystyka. Wykład 5. Magdalena Alama-Bućko. 20 marca Magdalena Alama-Bućko Statystyka 20 marca / 26

Analiza struktury i przeciętnego poziomu cechy

STATYSTYKA OPISOWA. Dr Alina Gleska. 28 września Instytut Matematyki WE PP

Wprowadzenie do zagadnień statystycznych

Miary zmienności STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

Porównaj płace pracowników obu zakładów, dokonując kompleksowej analizy struktury. Zastanów się, w którym zakładzie jest korzystniej pracować?

Graficzna prezentacja danych statystycznych

Statystyka to nauka o metodach badań (liczbowo wyrażalnych) własności zbiorowości. Próba. Próba Populacja. Próba

4.2. Statystyczne opracowanie zebranego materiału

Rok akademicki: 2013/2014 Kod: ZIE n Punkty ECTS: 6. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

2.Wstępna analiza danych c.d.- wykład z Populacja i próba

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

Dane i ich struktura Skale pomiarowe i ich przekształcanie. Mariusz Dacko

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE)

Statystyka opisowa. Robert Pietrzykowski.

Przedmiot statystyki. Graficzne przedstawienie danych.

Często spotykany jest również asymetryczny rozkład gamma (Г), opisany za pomocą parametru skali θ i parametru kształtu k:

Statystyka Matematyczna Anna Janicka

Statystyka. Katarzyna Chudy Laskowska

Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś.

Zawartość. Zawartość

Miary asymetrii STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Statystyka. Šukasz Dawidowski. Instytut Matematyki, Uniwersytet l ski

Transkrypt:

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY) Praca z danymi zaczyna się od badania rozkładu liczebności (częstości) zmiennych. Rozkład liczebności (częstości) zmiennej to jakie wartości zmienna przyjęła i jak często. Wszystkie zmienne możemy podzielić na zmienne poziomu nominalnego, porządkowego oraz ilościowego. Metody przedstawienia rozkładu częstości zmiennej: w postaci tabeli i w postaci wykresów (słupkowe, kołowe, histogram, wielobok). Histogram: rekomendacje co do wyboru liczby klas k w zależności od liczby obserwacji n : n = 30 60 = k = 6 8; n = 60 100 = k = 7 10; n = 100 00 = k = 9 1; n = 00 500 = k = 11 17; n = 500 1500 = k = 16 5. W histogramie w pierwszą kolej zwracamy uwagę na liczbę maksimów (lokalnych). Interpretacja: jeden maksimum - dane są jednorodne; dwa maksima - dane są mieszanką jednorodnych grup danych itd. Gdy n rośnie, histogram zwykle ma tendencję do stabilizacji. 1

Aby opisać rozkład badanej zmiennej, korzystamy z pewnych charakterystyk liczbowych. Dzielimy je na 4 grupy. 1. Określenie przeciętnej wartości zmiennej lub wartości, wokół której grupują się pomiary; próbujemy odpowiedzieć na pytanie: Jaka wartość zmiennej jest najbardziej typowa? Dokonujemy tego przez obliczenie miar położenia (tendencji centralnej).. Określenie zmienności czy też rozproszenia wartości zmiennej (najczęściej wokół pewnej wartości typowej); próbujemy odpowiedzieć na pytanie: Jak bardzo typowa jest ta wartość typowa? Dokonujemy tego przez obliczenie miar rozproszenia. 3. Określenie stopnia asymetrii rozkładu zmiennej. Dokonujemy tego przez obliczenie miar asymetrii. 4. Określenie stopnia skupienia i spłaszczenia (w stosunku do kształtu krzywej rozkładu normalnego standardowego) rozkładu zmiennej. Dokonujemy tego przez obliczenie miar koncentracji.

Miary położenia. Dla zmiennych poziomu nominalnego używamy dominanty (mody). Jest to najczęściej spotykana wartość (kategoria) zmiennej. Dla zmiennych poziomu porządkowego, oprócz dominanty, używamy też mediany. Mediana to taka liczba, że połowa wartości zmiennej jest większa od niej, a połowa jest mniejsza od niej. Wyznacza się wzorem: x ( n+1 ), n jest nieparzyste Me = x ( n ) +x ( n +1), n jest parzyste. Indeksy w nawiasach oznaczają, że wartości x 1,..., x n zostały uporządkowane w sposób niemalejący, czyli x (1) x ()... x (n). Dla zmiennych poziomu ilościowego, oprócz dominanty i mediany, używamy też srednią arytmetyczną (średnią). Wyznacza się wzorem: x = 1 n x i. n Średnia jest lepsza od mediany dla rozkładów bliskich do symetrycznych, gorsza od mediany dla rozkładów dalekich od symetrycznych lub w obecności wartości odstających (oddalonych). 3 i=1

Dla zmiennych poziomu ilościowego czasami uzywamy jeszcze nastepujących miar położenia: średnia ważona x w = n x i w i, gdzie w i 0, i=1 średnia geometryczna x g = n x 1 x... x n ; średnia harmoniczna x h = n n i=1 1 x i. n w i = 1; Szczególnym przypadkiem średniej ważonej (oprócz średniej arytmetycznej) jest średnia ucięta: x u = 1 n k n k i=k+1 x (i), gdzie k jest wyznaczoną liczbą naturalną nie przewyższającą zwykle 5% wartości n. Kwantyle. To są liczby, które dzielą zbiór wartości badanej cechy na równe części pod względem liczby obserwowanych wartości. Najczęściej używane kwantyle to: kwartyle (3 kwartyle, podział na 4 części; drugi kwartyl to mediana), decyle (9 decyli, podział na 10 części), percentyle (99 percentyli, podział na 100 części). Pożytecznym wykresem, tworzonym na podstawie kwartyli, jest wykres skrzynkowy. i=1 4

Miary rozproszenia. Używane są dla zmiennych poziomu ilościowego. Rozstęp. Jest to różnica pomiędzy największą a najmniejszą wartością zmiennej. Odchylenie przeciętne: 1 n n i=1 x i x. Wariancja: s = 1 n n 1 i=1 (x i x). 1 Odchylenie standardowe: s = n n 1 i=1 (x i x). Współczynnik zmienności: v = s x pod warunkiem, że x 0. Ten ostatni współczynnik jest pożyteczny wtedy, gdy zmienność cechy rośnie wraz ze wzrostem jej wartości lub przy przeskalowaniu wartości zmiennej. Miara asymetrii. Używana jest dla zmiennych poziomu ilościowego. Współczynnik skośności: Sk = n n i=1 (x i x) 3 (n 1)(n )s 3. Sk = 0 odpowiada rozkładowi idealnie symetrycznemu, Sk < 0 oznacza asymetrię lewostronną, Sk > 0 asymetrię prawostronną. 5

Miara koncentracji. Używana jest dla zmiennych poziomu ilościowego. Kurtoza: K = n(n + 1) n i=1 (x i x) 4 3(n 1)( n i=1 (x i x) ) (n 1)(n )(n 3)s 4. K = 0 odpowiada rozkładowi normalnemu standardowemu, K < 0 oznacza rozkład bardziej spłaszczony od normalnego standardowego, K > 0 rozkład bardziej wysmukły, niż normalny standardowy. 6