Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Podobne dokumenty
Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

1 Podstawy rachunku prawdopodobieństwa

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Po co nam charakterystyki liczbowe? Katarzyna Lubnauer 34

STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

Próba własności i parametry

W1. Wprowadzenie. Statystyka opisowa

Statystyka. Podstawowe pojęcia: populacja (zbiorowość statystyczna), jednostka statystyczna, próba. Cechy: ilościowe (mierzalne),

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

Statystyka. Wykład 2. Magdalena Alama-Bućko. 5 marca Magdalena Alama-Bućko Statystyka 5 marca / 34

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

Statystyka. Opisowa analiza zjawisk masowych

Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl

Wykład 2. Statystyka opisowa - Miary rozkładu: Miary położenia

Statystyka Matematyczna Anna Janicka

Statystyka. Wykład 2. Magdalena Alama-Bućko. 27 lutego Magdalena Alama-Bućko Statystyka 27 lutego / 39

Statystyka matematyczna. dr Katarzyna Góral-Radziszewska Katedra Genetyki i Ogólnej Hodowli Zwierząt

Ćwiczenia 1-2 Analiza rozkładu empirycznego

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Miary statystyczne w badaniach pedagogicznych

STATYSTYKA wykłady. L.Gruszczyński Elementy statystyki dla socjologów Dr. Pactwa pon. i wtorek 09:30 11:00 (pok. 217) I. (08.X)

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Opisowa analiza struktury zjawisk statystycznych

Statystyka Opisowa WK Andrzej Pawlak. Intended Audience: PWR

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Statystyczne metody analizy danych

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY

Statystyka. Wydział Zarządzania Uniwersytetu Łódzkiego

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

Podstawowe funkcje statystyki: informacyjna, analityczna, prognostyczna.

POJĘCIA WSTĘPNE. STATYSTYKA - nauka traktująca o metodach ilościowych badania prawidłowości zjawisk (procesów) masowych.

Parametry statystyczne

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd

Statystyka. Wykład 3. Magdalena Alama-Bućko. 6 marca Magdalena Alama-Bućko Statystyka 6 marca / 28

Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Pozyskiwanie wiedzy z danych

Matematyka stosowana i metody numeryczne

Analiza struktury i przeciętnego poziomu cechy

Statystyka matematyczna i ekonometria

Miary zmienności STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

Statystyczne metody analizy danych. Agnieszka Nowak - Brzezińska

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE)

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Wykład 3. Opis struktury zbiorowości. 1. Parametry opisu rozkładu badanej cechy. 3. Średnia arytmetyczna. 4. Dominanta. 5. Kwantyle.

Biostatystyka, # 1 /Weterynaria I/

Zmienne losowe. Statystyka w 3

Laboratorium 3 - statystyka opisowa

KARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4

Statystyka opisowa. Robert Pietrzykowski.

Wskaźnik asymetrii Jeżeli: rozkład jest symetryczny, to = 0, rozkład jest asymetryczny lewostronnie, to < 0. Kwartylowy wskaźnik asymetrii

Agata Boratyńska. WYKŁAD 1. Wstępna analiza danych, charakterystyki opisowe. Indeksy statystyczne.

Wykład 5: Statystyki opisowe (część 2)

Statystyka opisowa. Robert Pietrzykowski.

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Statystyka matematyczna dla leśników

Miary asymetrii STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Statystyka. Šukasz Dawidowski. Instytut Matematyki, Uniwersytet l ski

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

4.2. Statystyczne opracowanie zebranego materiału

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Transport II stopień (I stopień / II stopień) Ogólnoakademicki (ogólno akademicki / praktyczny) Studia stacjonarne (stacjonarne / niestacjonarne)

Statystyczne metody analizy danych

Wykład 5. Opis struktury zbiorowości. 1. Miary asymetrii.

Analiza zróżnicowania, asymetrii i koncentracji

Matematyka z el. statystyki, # 1 /Geodezja i kartografia II/

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

Zakład Ubezpieczeń Społecznych Departament Statystyki. Struktura wysokości emerytur i rent wypłacanych przez ZUS po waloryzacji w marcu 2010 roku.

Miary w szeregach. 1 Miary klasyczne. 1.1 Średnia Średnia arytmetyczna

Wprowadzenie Pojęcia podstawowe Szeregi rozdzielcze STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP.

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

Rok akademicki: 2013/2014 Kod: ZIE n Punkty ECTS: 6. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

Xi B ni B

Statystyka matematyczna dla leśników

Porównaj płace pracowników obu zakładów, dokonując kompleksowej analizy struktury. Zastanów się, w którym zakładzie jest korzystniej pracować?

STATYSTYKA OPISOWA. Dr Alina Gleska. 28 września Instytut Matematyki WE PP

zbieranie porządkowanie i prezentacja (tabele, wykresy) analiza interpretacja (wnioskowanie statystyczne)

Podstawowe pojęcia statystyczne

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

WYKŁAD 2. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady

Wydział Nauki o Zdrowiu. Zakład Profilaktyki Zagrożeń Środowiskowych i Alergologii Marta Zalewska

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Statystyka matematyczna dla leśników

Statystyka to nauka o metodach badań (liczbowo wyrażalnych) własności zbiorowości. Próba. Próba Populacja. Próba

Transkrypt:

Wykład Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

Zbiorowość statystyczna - zbiór elementów lub wyników jakiegoś procesu powiązanych ze sobą logicznie (tzn. posiadających wspólne cechy stałe) i jednocześnie nieidentycznych (tzn. różniących się ze względu na cechy zmienne).

Cechy statystyczne - właściwości jednostek zbiorowości statystycznej TYPY CECH STATYSTYCZNYCH cechy mierzalne czyli: ilościowe, które można określić za pomocą liczb ciągłe czyli: wartości rzeczywiste z pewnego przedziału skokowe (dyskretne) czyli przyjmujące skończoną lub co najwyżej przeliczalną liczbę wartości cechy niemierzalne czyli: jakościowe, które można opisać jedynie słownie lub za pomocą odpowiednich skal numerycznych

Rodzaje badań statystycznych Badanie pełne obejmujące wszystkie elementy zbiorowości generalnej. Zbiorowość generalna (populacja generalna) - kompletny zbiór elementów lub wyników procesu. Badanie częściowe obejmujące pewną część elementów zbiorowości generalnej PRÓBA

Metody statystyczne metody opisu metody wnioskowania statystycznego syntetyczny liczbowy opis właściwości zbioru danych ocena charakterystyk populacji generalnej na podstawie danych częściowych = metody rachunku prawdopodobieństwa statystyka opisowa statystyka matematyczna

Badanie statystyczne Zbiorowość statystyczna: studenci w auli Z na wykładzie Pani Q = populacja generalna skończona Cechy statystyczne: liczba rodzeństwa cecha mierzalna skokowa (dyskretna) wiek ulubionego przeboju muzycznego cecha mierzalna ciągła Badanie pełne (jeśli wszyscy przyszli na wykład) Metoda badania statystycznego: opis statystyczny

Cecha = liczba rodzeństwa xj : ; 2; 2; ; 0; 0; ; ; 0; ; ; 0; 0; ; 2; 2; 4; 0; 0; ; ; ; ; 3; 4; 0; 0; ; 2; 2; ; 2; 2; ; 0; 0; 0; 0; 0; ; ; 0; 0; ; 2; 2; 3; 0; 0; ; ; ; ; 3; 4; 0; 0; ; 2; 2; ; 2; 2; ; 0; ; ; 0; 0; ; ; 0; 0; ; 2; 2; 4; 0; 0; ; ; ; ; 3; 4; 0; 0; ; 2; 2; ; 2; 2; ; 0; 0; 0; 0; 0; ; ; ; 0; ; 2; 2; 4; 0; 0; ; ; ; ; 3; 3; ; 0; ; 2; 2; n=20 dane indywidualne xj- indywidualne wartości cechy, gdzie j=,2,...,n ; n - liczebność badanej zbiorowości,

Cecha = liczba rodzeństwa Rozkład empiryczny cechy = dane pogrupowane i uporządkowane Szereg rozdzielczy xi ni wi 0 38 0,32 46 0,38 2 24 0,20 3 8 0,07 4 4 0,03 razem 20,00 xi - cecha przyjmuje k wartości, dla i=,2,...,k,. gdzie..,k (k<n), ni - liczba jednostek zbiorowości, dla których cecha przyjmuje wartość xi, przy czym zachodzi: ni n r i wi - udział jednostek o wartości xi cechy w ogólnej liczebności zbiorowości, czyli częstość względna (częstość jej występowania w ogólnej zbiorowości) określana jako: w i n i ; n i, 2,..., k w,oraz i i r,

Graficzna prezentacja Wykres punktowy Wykres słupkowy

Szereg rozdzielczy Wartości cechy xi Liczebności ni Częstości wi Dystrybuanta empiryczna Fn(xi) = w s x 0 n 38 0,32 w 0,32 w x2 n2 46 0,38 w2 w+w2 0,70 x3 n3 w3 w+w2+ w3 2 24 0,20 0,90.... 3. 8. 0,07. 0,97 x4 k n4 k 0,03 w k w+...,00 +wk = Ogółem razem 20 n,00 ------- X

Szereg rozdzielczy Wartości cechy xi x x2 x3.. Liczebności ni n n2 n3.. Częstości wi w w2 w3.. Dystrybuanta empiryczna Fn(xi) = w s w w+w2 w+w2+ w3. x k n k w k w+... +wk = Ogółem n -------

Dystrybuanta empiryczna cechy X jest to funkcja F n (x) określona na zbiorze liczb rzeczywistych od - do + xi dystrybuanta 0 0,32 0,70 2 0,90 3 0,97 4,00 razem X 32 97

Dystrybuanta empiryczna cechy X F(x),00 0,97,00 0,90 0,96 0,86 0,70 0,58 0,32 Dystrybuanta cechy skokowej x Liczba (liczba rodzeństwa dzieci w rodzinach) liczba rodzeństwa cecha skokowa x 0,29 0 0 2 3 4 x

Rozkład empiryczny cechy ciągłej Cecha = wiek ulubionego przeboju muzycznego (w latach) <x0i xi ) ni 5-0 2 0-5 20 5-20 38 20-25 35 25-30 5 30-35 0 razem 20 podział obszaru zmienności cechy na przedziały klasowe określenie liczby przedziałów klasowych k (k5), (k 5) ustalenie rozpiętości przedziału klasowego hi: h x x 0 i, 2,..., k i i i x0i, xi - odpowiednia dolna i górna granica przedziału klasowego.

Graficzna prezentacja Wiek ulubionego przeboju muzycznego Wielobok liczebności 5 0 5 20 25 30 35 Histogram Wiek ulubionego przeboju muzycznego 5 0 5 20 25 30 35

Dystrybuanta cechy ciągłej x F(x) Wiek ulubionego przeboju muzycznego lata

Analiza struktury zbiorowości statystycznej MIARY KLASYCZNE POZYCYJNE Położenia = tendencji centralnej Zróżnicowania Asymetrii Średnia arytmetyczna Wariancja Odchylenie standardowe Współczynnik zmienności Współczynnik asymetrii Mediana Kwantyle Dominanta Rozstęp Rozstęp międzykwartylowy Odchylenie ćwiartkowe Współczynnik zmienności

Miary położenia Miary klasyczne: Średnia arytmetyczna Miary pozycyjne: Kwantyle: mediana kwartyle decyle centyle Dominanta- najczęściej występująca wartość

Średnia arytmetyczna:

xi wi 0 0,32 0,38 2 0,20 3 0,07 4 0,03 razem,00 Średnia arytmetyczna:

dane indywidualne, Średnia arytmetyczna: formuła nieważona x n x o o x x - środek i-tego przedziału klasowego xi 2 i i0 n j w rozkładzie cechy skokowej, dane pogrupowane, formuła ważona x n k x j x n i i i w rozkładzie z przedziałami klasowymi, formuła ważona k x n x n i i i

Miary pozycyjne - kwantyle Mediana dzieli na połowę Kwartyle dzielą na cztery równe części Decyle dzielą na dziesięć równych części Centyle dzielą na sto równych części

kwantyl rzędu p (0 < p <) w rozkładzie empirycznym to taka wartość k p cechy, dla której - jako pierwszej - dystrybuanta empiryczna spełnia warunek: F n (k p ) p me =Mediana F n (k 0,5 ) 0,5 Q=Kwartyle F n (k 0,25 ) 0,25 F n (k 0,75 ) 0,75 Decyle Centyle F n (k 0, ) 0, F n (k 0,2 ) 0,2 F n (k 0,9 ) 0,9 F n (k 0,0 ) 0,0 F n (k 0,02 ) 0,02 F n (k 0,99 ) 0,99

Przykład wyznaczania kwartyla drugiego =mediany: dane indywidualne dane uporządkowane: 2; 2; 2; 4; 4; 5; 5; 5; 5; 6 n = 0 me = (4 + 5) / 2 = 4,5 (liczebność parzysta) dane uporządkowane: 2; 2; 2; 4; 4; 5; 5; 5; 5; 6 6 n = me = 5 (liczebność nieparzysta) PORZĄDEK!!! mediana to środkowa wartość w uporządkowanym rosnąco zbiorze wartości cechy. me me

Przykład: kwartyl drugi =mediana w szeregu rozdzielczym cechy skokowej F n (me) 0,5 Mediana =

Dystrybuanta cechy ciągłej x skumulowane częstości Graficzne wyznaczanie mediany F(x) Wiek ulubionego przeboju muzycznego 0,50 me lata

Przykład: kwartyle w szeregu rozdzielczym cechy skokowej F n (Q ) 0,25 F n (me) 0,5 F n (Q 3 ) 0,75 Q = 0 Mediana = = Q 3 = 2 Q 2

kwartyle Q, Q 2, Q 3 w rozkładzie cechy skokowej F n (Q ) 0,25; F n (Q2) 0,5; F n (Q 3 ) 0,75 w rozkładzie z przedziałami klasowymi Q x Q 3 oq x oq (0,25-3 Q 2 =me F n (0,75 - (x F oq n ) (x ) oq h w 3 ) Q Q ) h w Q Q 3 3

Miary zróżnicowania klasyczne wariancja z próby, to suma kwadratów odchyleń wartości cechy od jej średniej podzielona przez n- dane indywidualne, formuła nieważona w rozkładzie cechy skokowej, formuła ważona w rozkładzie z przedziałami klasowymi, formuła ważona odchylenie standardowe 2 ) 2 ( x x S j j n n n i x x S i k i n 2 ) ( 2 n i x x S i k i n 2 ) ( 2 2 S S

Obliczanie odchylenia standardowego w rozkładzie z przedziałami klasowymi Wiek ulubionego przeboju muzycznego (w latach) 5-0 2 7,5 69 338 0-5 20 2,5 64 280 5-20 38 7,5 9 342 20-25 35 22,5 4 40 25-30 5 27,5 49 735 30-35 0 32,5 44 440 razem 20 x x 4275 roku S 2 k n i ( x i x) 2 n i S= S Q Q Q 3 2 S lata² 2 lat

Miary zróżnicowania pozycyjne rozstęp = x max x min rozstęp międzykwartylowy I = Q 3 - Q odchylenie ćwiartkowe Q Q Q 3 2

Miary względne współczynnik zmienności (miara klasyczna ) V S *00% x współczynnik zmienności (miara pozycyjna ) V Q *00% me Średnia arytmetyczna Odchylenie standardowe Współczynnik zmienności (klasyczny) studenci 20,5 6 29% rodzice 25 7 28%

średnia; mediana; dominanta (do) n i Symetria A=0 Asymetria dodatnia (prawostronna) n i A>0 x M x D x x me do x i do Dx Mme x x x x i n i Asymetria ujemna (lewostronna) A<0 x me x M x do D x x i

A 2 Miary asymetrii współczynnik asymetrii (miara klasyczna) ( Q M A S 3 me) ( m Q Q 3 3 3 pozycyjny współczynnik asymetrii współczynnik skośności -2<A<2 eq ) A x S do

dla danych indywidualnych, formuła nieważona Moment centralny trzeciego rzędu M n ( x n 3 x j w rozkładzie cechy skokowej, formuła ważona n M n ( x * 3 - j - x i j ) ) 3 3 n i w rozkładzie z przedziałami klasowymi, formuła ważona n M n ( x * 3 j x i ) 3 n i