WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd

Podobne dokumenty
Agata Boratyńska. WYKŁAD 1. Wstępna analiza danych, charakterystyki opisowe. Indeksy statystyczne.

1 Podstawy rachunku prawdopodobieństwa

Wykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

Statystyka w pracy badawczej nauczyciela Wykład 3: Analiza struktury zbiorowości statystycznej. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

Statystyka. Podstawowe pojęcia: populacja (zbiorowość statystyczna), jednostka statystyczna, próba. Cechy: ilościowe (mierzalne),

-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak

Laboratorium 3 - statystyka opisowa

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Przedmiot statystyki. Graficzne przedstawienie danych.

Analiza szeregów czasowych

Podstawowe pojęcia. Własności próby. Cechy statystyczne dzielimy na

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ (II rok WNE)

STATYSTYKA IV SEMESTR ALK (PwZ) STATYSTYKA OPISOWA RODZAJE CECH W POPULACJACH I SKALE POMIAROWE

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Teoretyczne podstawy analizy indeksowej klasyfikacja indeksów, konstrukcja, zastosowanie

2.Wstępna analiza danych c.d.- wykład z Populacja i próba

Zajęcia 1. Statystyki opisowe

Statystyka Matematyczna Anna Janicka

Wykład 5: Statystyki opisowe (część 2)

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Parametry statystyczne

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

Pozyskiwanie wiedzy z danych

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Statystyka i opracowanie danych W5: Wprowadzenie do statystycznej analizy danych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Statystyka opisowa PROWADZĄCY: DR LUDMIŁA ZA JĄC -LAMPARSKA

Statystyka. Wykład 3. Magdalena Alama-Bućko. 6 marca Magdalena Alama-Bućko Statystyka 6 marca / 28

Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40

Po co nam charakterystyki liczbowe? Katarzyna Lubnauer 34

Plan wykładu. Statystyka opisowa. Statystyka matematyczna. Dane statystyczne miary położenia miary rozproszenia miary asymetrii

Rok akademicki: 2013/2014 Kod: ZIE n Punkty ECTS: 6. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

Próba własności i parametry

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

Statystyczne metody analizy danych

STATYSTYKA wykłady. L.Gruszczyński Elementy statystyki dla socjologów Dr. Pactwa pon. i wtorek 09:30 11:00 (pok. 217) I. (08.X)

Wydział Inżynierii Produkcji. I Logistyki. Statystyka opisowa. Wykład 3. Dr inż. Adam Deptuła

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Kolokwium ze statystyki matematycznej

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Miary asymetrii STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

Estymacja parametrów rozkładu cechy

Statystyka opisowa. Robert Pietrzykowski.

Miary zmienności STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018

Wykład 4: Statystyki opisowe (część 1)

Statystyka opisowa. Literatura STATYSTYKA OPISOWA. Wprowadzenie. Wprowadzenie. Wprowadzenie. Plan. Tomasz Łukaszewski

Opisowa analiza struktury zjawisk statystycznych

W1. Wprowadzenie. Statystyka opisowa

ĆWICZENIE 1 Statystyka opisowa. Testowanie zgodności STATYSTYKA OPISOWA wstępna analiza danych I. Miary położenia: Mediana Moda

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Statystyka opisowa. Robert Pietrzykowski.

STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Statystyka. Opisowa analiza zjawisk masowych

Wykład 3: Statystyki opisowe - miary położenia, miary zmienności, miary asymetrii

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Xi B ni B

Statystyka. Wykład 12. Magdalena Alama-Bućko. 29 maja Magdalena Alama-Bućko Statystyka 29 maja / 47

Na poprzednim wykładzie omówiliśmy podstawowe zagadnienia. związane z badaniem dynami zjawisk. Dzisiaj dokładniej zagłębimy

Zmienne losowe. Statystyka w 3

STATYSTYKA MATEMATYCZNA WYKŁAD października 2009

Analiza Zmian w czasie

Zawartość. Zawartość

Statystyki opisowe i szeregi rozdzielcze

Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

Imię, nazwisko i tytuł/stopień KOORDYNATORA (-ÓW) kursu/przedmiotu zatwierdzającego protokoły w systemie USOS Jacek Marcinkiewicz, mgr

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI ROZKŁAD EMPIRYCZNY

Statystyka matematyczna dla leśników

Ekonometria. Zajęcia

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Ćwiczenia 1-2 Analiza rozkładu empirycznego

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Analiza zróżnicowania, asymetrii i koncentracji

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Statystyka i analiza danych Wstępne opracowanie danych Statystyka opisowa. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl

Statystyka opisowa Opracował: dr hab. Eugeniusz Gatnar, prof. WSBiF

STATYSTYKA MATEMATYCZNA WYKŁAD grudnia 2009

Biostatystyka, # 1 /Weterynaria I/

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

O ŚREDNIEJ ARYTMETYCZNEJ I MEDIANIE

1 Estymacja przedziałowa

Imię, nazwisko i tytuł/stopień KOORDYNATORA (-ÓW) kursu/przedmiotu zatwierdzającego protokoły w systemie USOS Dr Roman Sosnowski

Estymacja punktowa i przedziałowa

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

KARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4

Statystyka hydrologiczna i prawdopodobieństwo zjawisk hydrologicznych.

Matematyka z el. statystyki, # 1 /Geodezja i kartografia II/

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

WYKŁADY Z RACHUNKU PRAWDOPODOBIEŃSTWA I wykład 4 Przekształcenia zmiennej losowej, momenty

Transkrypt:

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 2 1 / 20

MIARY ROZPROSZENIA, Wariancja Wariancją z próby losowej X 1, X 2,..., X n (dane surowe) nazywamy liczbę Ŝ 2 = 1 n (X i X ) 2 = 1 ( n ) Xi 2 n X 2 n n i=1 i=1 Dla danych pogrupowanych w szeregu rozdzielczym Ŝ 2 1 n k n i ( c i X ) 2 i=1 Przy danych pogrupowanych w szeregu rozdzielczym stosuje się jeszcze poprawkę związaną z założeniem rozkładu równomiernego danych na poszczególnych przedziałach S 2 = 1 n k i=1 n i ( c i X ) 2 1 12n k n i (c i c i 1 ) 2 i=1 Odchylenie standardowe Ŝ = Ŝ 2 lub S = S 2 Agata Boratyńska Statystyka matematyczna, wykład 2 2 / 20

MIARY ROZPROSZENIA, cd Rozstęp - odległość między największą i najmniejszą obserwacją r = X n:n X 1:n Rozstęp międzykwartylowy podaje długość odcinka, na którym leży 50% środkowych wartości w uporządkowanej niemalejąco próbie. IQR = Q 3/4 Q 1/4 Uwaga: rozstęp jest funkcją tylko krańcowych obserwacji, jest nieodporny na obserwacje odstające, tej wady pozbawiony jest rozstęp międzykwartylowy Odchylenie przeciętne d = 1 n ni=1 X i X W sytuacji gdy chcemy porównać rozrzut dwóch lub więcej prób korzystamy ze współczynnika zmienności V = Ŝ X 100% Agata Boratyńska Statystyka matematyczna, wykład 2 3 / 20

MIARY ROZPROSZENIA, przykłady PRZYKŁAD 1 cd. r = 5 2 = 3 IQR = 4 3 = 1 Ŝ 2 = 1 { 2(2 3, 5) 2 + 6(3 3, 5) 2 + 5(3, 5 3, 5) 2 + 4(4 3, 5) 2 20 +(4, 5 3, 5) 2 + 2(5 3, 5) 2} = 0, 63 Ŝ = 0, 658 = 0, 79 d = 1 {2 2 3, 5 + 6 3 3, 5 + 5 3, 5 3, 5 20 +4 4 3, 5 + 1 4, 5 3, 5 + 2 5 3, 5 } = 0, 6 PRZYKŁAD 2 cd. Dla danych z szeregu rozdzielczego r 120 30 = 90 IQR 66, 67 46, 09 = 20, 58 Ŝ 2 331, 31 Ŝ 18, 20 S 2 = 322, 98 S = 17, 97 d 13, 96 Wariancja z danych surowych Ŝ 2 = 333, 85 Agata Boratyńska Statystyka matematyczna, wykład 2 4 / 20

WYKRES RAMKOWY, PUDEŁKO Z WĄSAMI X max Kwartyl górny wąsy mediana Kwartyl dolny X min Obs. odstające Agata Boratyńska Statystyka matematyczna, wykład 2 5 / 20

WYKRES RAMKOWY, uwagi Maksymalna długośc wąsa to 1, 5IQR Obserwacje odstające są to obserwacje o wartościach x < x lub x > x gdzie { [ x = min X i : X i Q 1/4 3 ]} 2 IQR, Q 1/4 { x = max X i : X i [Q 3/4, Q 3/4 + 3 ]} 2 IQR Pozwala na jednym rysunku przedstawić wiadomości dotyczące położenia, rozproszenia i kształtu rozkładu empirycznego badanej cechy. Na wykresie zaznacza się kwartyle, średnią, medianę, największą i najmniejszą obserwację, obserwacje odstające. pozwala porównywać próby losowe ze wzgledu na wymienione parametry Agata Boratyńska Statystyka matematyczna, wykład 2 6 / 20

WYKRES RAMKOWY, przykłady Dane Przykład 1 Dane Przykład 2 Agata Boratyńska Statystyka matematyczna, wykład 2 7 / 20

WSKAŹNIKI ASYMETRII Współczynnik asymetrii (klasyczny) A = M 3 S 3 M 3 - trzeci moment centralny, równym dla danych surowych M 3 = 1 n ni=1 (X i X ) 3, dla danych pogrupowanych w szeregu rozdzielczym M 3 1 n ki=1 n i ( c i X ) 3 Pozycyjny miernik asymetrii A 2 = Q 3/4 2Med+Q 1/4 Q 3/4 Q 1/4 Współczynnik skośności A 1 = X Mo S Asymetria dodatnia (prawostronna) - wskaźniki asymetrii dodatnie Asymetria ujemna (lewostronna) - wskaźniki asymetrii ujemne PRZYKŁAD 1 cd. A = 0, 08, A 1 = 3,5 3,5 0,79 = 0 PRZYKŁAD 2cd. A = 1, 10 A 1 = 58,7 53,2 18,2 = 0, 30 PRZYKŁAD 3cd. A 1 = 4398,29 354,56 8877,97 = 0, 46 Agata Boratyńska Statystyka matematyczna, wykład 2 8 / 20

INDEKSY STATYSTYCZNE Zbiór wartości danej cechy lub wartości określonego zjawiska zaobserwowany w różnych (ale chronologicznych) momentach czasu nazywamy szeregiem czasowym. PRZYKŁAD. cena akcji w kolejnych dniach stycznia, zarobki w pewnej gałęzi przemysłu w kolejnych latach, wielkość produkcji w kolejnych miesiącach Indeksy statystyczne służą do badania dynamiki zjawiska na podstawie danych z kolejnych okresów czasowych (na podstawie szeregu czasowego). Agata Boratyńska Statystyka matematyczna, wykład 2 9 / 20

INDEKSY PROSTE Są miernikami tempa zmian zjawiska. Indeks łańcuchowy dynamiki i t t 1 = yt y t 1 gdzie y t - poziom zjawiska (wartość cechy) w chwili (okresie) t, t {0, 1, 2,..., n} Tempo zmian wartości zjawiska w okresie t w stosunku do okresu t 1 jest równe (i t t 1 1)100% Indeks jednopodstawowy dynamiki i t t = yt y t, gdzie t jest ustaloną chwilą (ustalonym okresem) czasu. Tempo zmian wartości zjawiska w okresie t w stosunku do okresu t jest równe (i t t 1)100% Agata Boratyńska Statystyka matematyczna, wykład 2 10 / 20

Indeksy proste, cd Związki między indeksami: i t t 1 = i t t i t 1 t, jeśli t > t to i t t = t jeśli t < t to i t t = t t=t +1 t=t +1 i t t 1, 1 i. t t 1 Średnie tempo zmian wartości zjawiska ( n ) 1 n ( ) 1 yn n ) 1 r = ī g 1 = i t t 1 1 = 1 = (i n y n 0 1 t=1 0 Średnie tempo zmian wartości zjawiska określa tempo zmian zjawiska jakie powinno występować przez cały okres (0, n), aby przyrost z okresu (0, n) rozłożyć równomiernie w czasie. Zatem y n = y 0 (r + 1) n. Agata Boratyńska Statystyka matematyczna, wykład 2 11 / 20

AGREGATOWE INDEKSY WARTOŚCI, ILOŚCI I CEN. Indeksy agragatowe oceniają dynamikę zjawiska w niejednorodnej zbiorowości (np. dynamika cen różnych artykułów, dynamika spożycia różnych produktów, dynamika sprzedaży, produkcji kilku dóbr). Dane z dwóch okresów (momentów) czasowych: t = 0 - okres podstawowy i t = 1 okres badany produkt cena jednostki ilość wartość t = 0 t = 1 t = 0 t = 1 t = 0 t = 1 1 p 10 p 11 q 10 q 11 w 10 = p 10 q 10 w 11 = p 11 q 11 2 p 20 p 21 q 20 q 21 w 20 = p 20 q 20 w 21 = p 21 q 21..................... j p j0 p j1 q j0 q j1 w j0 = p j0 q j0 w j1 = p j1 q j1..................... k p k0 p k1 q k0 q k1 w k0 = p k0 q k0 w k1 = p k1 q k1 Agata Boratyńska Statystyka matematyczna, wykład 2 12 / 20

Agregatowy indeks wartości I w = w j1 w j0 informuje o łącznej zmianie wartości wszystkich produktów w momencie badanym do momentu podstawowego Agata Boratyńska Statystyka matematyczna, wykład 2 13 / 20

Agregatowy indeks cen określa wpływ zmian cen na dynamikę wartości (gdyby ilości w obu momentach czasu były niezmienione), mówi o przeciętnych zmianach cen wszystkich rozważanych produktów Agregatowy indeks cen Laspeyresa LI p = p j1 q j0 p j0 q j0 = Agregatowy indeks cen Paaschego p j1 p j0 p j0 q j0 p j0 q j0 PI p = p j1 q j1 p j0 q j1 Agregatowy indeks cen Fishera F I p = LI pp I p Agata Boratyńska Statystyka matematyczna, wykład 2 14 / 20

Agregatowy indeks ilości określa wpływ zmian ilości na dynamikę wartości (gdyby w obu momentach ceny były niezmienione), informuje o przeciętnych zmianach ilości poszczególnych produktów w obu porównywanych momentach czasu. Agregatowy indeks ilości Laspeyresa LI q = p j0 q j1 p j0 q j0 = Agregatowy indeks ilości Paaschego q j1 q j0 p j0 q j0 p j0 q j0 PI q = p j1 q j1 p j1 q j0 Agregatowy indeks ilości Fishera F I q = LI qp I q Agata Boratyńska Statystyka matematyczna, wykład 2 15 / 20

Związki między indeksami I w = L I pp I q = L I qp I p = F I pf I q Agata Boratyńska Statystyka matematyczna, wykład 2 16 / 20

Rozkład χ 2 Z i N(0, 1), i = 1... k, Z i niezależne Rozkładem χ 2 z k stopniami swobody nazywamy rozkład prawdopodobieństwa zmiennej losowej Y = k i=1 Zi 2 i oznaczamy Y χ 2 k Gęstość 1 p k (x) = k 2 k 2 Γ( k 2 1 2 )x exp ( 1 ) 2 x 1 (0, ) (x) EY = k i VarY = 2k kwantyl rzędu p - F 1 (p) - liczba taka, że P{Y F 1 (p)} = p χ 2 χ k 2 k wartość krytyczna rzędu α χ 2 (α, k) = F 1 (1 α) χ 2 k liczba taka, że prawdopodobieństwo zdarzenia Y > χ 2 (α, k) jest równe α. Agata Boratyńska Statystyka matematyczna, wykład 2 17 / 20

Rozkład t-studenta Z N(0, 1) i Y χ 2 k oraz Z i Y niezależne Rozkładem t-studenta z k stopniami swobody nazywamy rozkład zmiennej losowej T = Z i oznaczamy T t k gęstość Y k f k (x) = 1 kπ Γ k ( ) k+1 ( 2 ) Γ ( k 2 1 + x 2 2 ) k+1 2 ET = 0 gdy k > 1 i VarT = k 2 gdy k > 2 kwantyl rzędu p - Ft 1 k (p) - liczba taka, że P{T Ft 1 k (p)} = p wartość krytyczna dwustronna rzędu α ( t(α, k) = Ft 1 k 1 α ) 2 - liczba, taka że prawdopodobieństwo zdarzenia T > t(α, k) jest równe α. Agata Boratyńska Statystyka matematyczna, wykład 2 18 / 20

Rozkład F (Fishera-Snedecora) Y χ 2 k i V χ2 r oraz Y i V niezależne. Rozkładem F z k i r stopniami swobody nazywamy rozkład zmiennej losowej F = Y /k V /r i oznaczamy F F k,r Gęstość ( ) p k,r (x) = Γ k+r ( ) r 2 r 2 x k 2 1 ( ) Γ k 2 Γ ( ) r k ( ) k+r 1 (0, ) (x) 2 x + r 2 k gdy x > 0 kwantyl rzędu p - F 1 F k,r (p) wartość krytyczna rzędu α F (α, k, r) = F 1 F k,r (1 α) - liczba, taka że prawdopodobieństwo zdarzenia F > F (α, k, r) jest równe α. Agata Boratyńska Statystyka matematyczna, wykład 2 19 / 20

Formuły w Excelu Wartości krytyczne: rozkład chi kwadrat: χ 2 (α, k) = ROZK.CHI.ODWR.PS(α; k) np: χ 2 (0, 05, 2) = ROZK.CHI.ODWR.PS(0, 05; 2) = 5, 99 rozkład t-studenta: t(α, k) = ROZK.T.ODWR.DS(α; k) rozkład F: F (α, k, r) = ROZK.F.ODWR.PS(α; k; r) Warto pamiętać: F (α, k, r) F (1 α, r, k) = 1 Agata Boratyńska Statystyka matematyczna, wykład 2 20 / 20