WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 2 1 / 20
MIARY ROZPROSZENIA, Wariancja Wariancją z próby losowej X 1, X 2,..., X n (dane surowe) nazywamy liczbę Ŝ 2 = 1 n (X i X ) 2 = 1 ( n ) Xi 2 n X 2 n n i=1 i=1 Dla danych pogrupowanych w szeregu rozdzielczym Ŝ 2 1 n k n i ( c i X ) 2 i=1 Przy danych pogrupowanych w szeregu rozdzielczym stosuje się jeszcze poprawkę związaną z założeniem rozkładu równomiernego danych na poszczególnych przedziałach S 2 = 1 n k i=1 n i ( c i X ) 2 1 12n k n i (c i c i 1 ) 2 i=1 Odchylenie standardowe Ŝ = Ŝ 2 lub S = S 2 Agata Boratyńska Statystyka matematyczna, wykład 2 2 / 20
MIARY ROZPROSZENIA, cd Rozstęp - odległość między największą i najmniejszą obserwacją r = X n:n X 1:n Rozstęp międzykwartylowy podaje długość odcinka, na którym leży 50% środkowych wartości w uporządkowanej niemalejąco próbie. IQR = Q 3/4 Q 1/4 Uwaga: rozstęp jest funkcją tylko krańcowych obserwacji, jest nieodporny na obserwacje odstające, tej wady pozbawiony jest rozstęp międzykwartylowy Odchylenie przeciętne d = 1 n ni=1 X i X W sytuacji gdy chcemy porównać rozrzut dwóch lub więcej prób korzystamy ze współczynnika zmienności V = Ŝ X 100% Agata Boratyńska Statystyka matematyczna, wykład 2 3 / 20
MIARY ROZPROSZENIA, przykłady PRZYKŁAD 1 cd. r = 5 2 = 3 IQR = 4 3 = 1 Ŝ 2 = 1 { 2(2 3, 5) 2 + 6(3 3, 5) 2 + 5(3, 5 3, 5) 2 + 4(4 3, 5) 2 20 +(4, 5 3, 5) 2 + 2(5 3, 5) 2} = 0, 63 Ŝ = 0, 658 = 0, 79 d = 1 {2 2 3, 5 + 6 3 3, 5 + 5 3, 5 3, 5 20 +4 4 3, 5 + 1 4, 5 3, 5 + 2 5 3, 5 } = 0, 6 PRZYKŁAD 2 cd. Dla danych z szeregu rozdzielczego r 120 30 = 90 IQR 66, 67 46, 09 = 20, 58 Ŝ 2 331, 31 Ŝ 18, 20 S 2 = 322, 98 S = 17, 97 d 13, 96 Wariancja z danych surowych Ŝ 2 = 333, 85 Agata Boratyńska Statystyka matematyczna, wykład 2 4 / 20
WYKRES RAMKOWY, PUDEŁKO Z WĄSAMI X max Kwartyl górny wąsy mediana Kwartyl dolny X min Obs. odstające Agata Boratyńska Statystyka matematyczna, wykład 2 5 / 20
WYKRES RAMKOWY, uwagi Maksymalna długośc wąsa to 1, 5IQR Obserwacje odstające są to obserwacje o wartościach x < x lub x > x gdzie { [ x = min X i : X i Q 1/4 3 ]} 2 IQR, Q 1/4 { x = max X i : X i [Q 3/4, Q 3/4 + 3 ]} 2 IQR Pozwala na jednym rysunku przedstawić wiadomości dotyczące położenia, rozproszenia i kształtu rozkładu empirycznego badanej cechy. Na wykresie zaznacza się kwartyle, średnią, medianę, największą i najmniejszą obserwację, obserwacje odstające. pozwala porównywać próby losowe ze wzgledu na wymienione parametry Agata Boratyńska Statystyka matematyczna, wykład 2 6 / 20
WYKRES RAMKOWY, przykłady Dane Przykład 1 Dane Przykład 2 Agata Boratyńska Statystyka matematyczna, wykład 2 7 / 20
WSKAŹNIKI ASYMETRII Współczynnik asymetrii (klasyczny) A = M 3 S 3 M 3 - trzeci moment centralny, równym dla danych surowych M 3 = 1 n ni=1 (X i X ) 3, dla danych pogrupowanych w szeregu rozdzielczym M 3 1 n ki=1 n i ( c i X ) 3 Pozycyjny miernik asymetrii A 2 = Q 3/4 2Med+Q 1/4 Q 3/4 Q 1/4 Współczynnik skośności A 1 = X Mo S Asymetria dodatnia (prawostronna) - wskaźniki asymetrii dodatnie Asymetria ujemna (lewostronna) - wskaźniki asymetrii ujemne PRZYKŁAD 1 cd. A = 0, 08, A 1 = 3,5 3,5 0,79 = 0 PRZYKŁAD 2cd. A = 1, 10 A 1 = 58,7 53,2 18,2 = 0, 30 PRZYKŁAD 3cd. A 1 = 4398,29 354,56 8877,97 = 0, 46 Agata Boratyńska Statystyka matematyczna, wykład 2 8 / 20
INDEKSY STATYSTYCZNE Zbiór wartości danej cechy lub wartości określonego zjawiska zaobserwowany w różnych (ale chronologicznych) momentach czasu nazywamy szeregiem czasowym. PRZYKŁAD. cena akcji w kolejnych dniach stycznia, zarobki w pewnej gałęzi przemysłu w kolejnych latach, wielkość produkcji w kolejnych miesiącach Indeksy statystyczne służą do badania dynamiki zjawiska na podstawie danych z kolejnych okresów czasowych (na podstawie szeregu czasowego). Agata Boratyńska Statystyka matematyczna, wykład 2 9 / 20
INDEKSY PROSTE Są miernikami tempa zmian zjawiska. Indeks łańcuchowy dynamiki i t t 1 = yt y t 1 gdzie y t - poziom zjawiska (wartość cechy) w chwili (okresie) t, t {0, 1, 2,..., n} Tempo zmian wartości zjawiska w okresie t w stosunku do okresu t 1 jest równe (i t t 1 1)100% Indeks jednopodstawowy dynamiki i t t = yt y t, gdzie t jest ustaloną chwilą (ustalonym okresem) czasu. Tempo zmian wartości zjawiska w okresie t w stosunku do okresu t jest równe (i t t 1)100% Agata Boratyńska Statystyka matematyczna, wykład 2 10 / 20
Indeksy proste, cd Związki między indeksami: i t t 1 = i t t i t 1 t, jeśli t > t to i t t = t jeśli t < t to i t t = t t=t +1 t=t +1 i t t 1, 1 i. t t 1 Średnie tempo zmian wartości zjawiska ( n ) 1 n ( ) 1 yn n ) 1 r = ī g 1 = i t t 1 1 = 1 = (i n y n 0 1 t=1 0 Średnie tempo zmian wartości zjawiska określa tempo zmian zjawiska jakie powinno występować przez cały okres (0, n), aby przyrost z okresu (0, n) rozłożyć równomiernie w czasie. Zatem y n = y 0 (r + 1) n. Agata Boratyńska Statystyka matematyczna, wykład 2 11 / 20
AGREGATOWE INDEKSY WARTOŚCI, ILOŚCI I CEN. Indeksy agragatowe oceniają dynamikę zjawiska w niejednorodnej zbiorowości (np. dynamika cen różnych artykułów, dynamika spożycia różnych produktów, dynamika sprzedaży, produkcji kilku dóbr). Dane z dwóch okresów (momentów) czasowych: t = 0 - okres podstawowy i t = 1 okres badany produkt cena jednostki ilość wartość t = 0 t = 1 t = 0 t = 1 t = 0 t = 1 1 p 10 p 11 q 10 q 11 w 10 = p 10 q 10 w 11 = p 11 q 11 2 p 20 p 21 q 20 q 21 w 20 = p 20 q 20 w 21 = p 21 q 21..................... j p j0 p j1 q j0 q j1 w j0 = p j0 q j0 w j1 = p j1 q j1..................... k p k0 p k1 q k0 q k1 w k0 = p k0 q k0 w k1 = p k1 q k1 Agata Boratyńska Statystyka matematyczna, wykład 2 12 / 20
Agregatowy indeks wartości I w = w j1 w j0 informuje o łącznej zmianie wartości wszystkich produktów w momencie badanym do momentu podstawowego Agata Boratyńska Statystyka matematyczna, wykład 2 13 / 20
Agregatowy indeks cen określa wpływ zmian cen na dynamikę wartości (gdyby ilości w obu momentach czasu były niezmienione), mówi o przeciętnych zmianach cen wszystkich rozważanych produktów Agregatowy indeks cen Laspeyresa LI p = p j1 q j0 p j0 q j0 = Agregatowy indeks cen Paaschego p j1 p j0 p j0 q j0 p j0 q j0 PI p = p j1 q j1 p j0 q j1 Agregatowy indeks cen Fishera F I p = LI pp I p Agata Boratyńska Statystyka matematyczna, wykład 2 14 / 20
Agregatowy indeks ilości określa wpływ zmian ilości na dynamikę wartości (gdyby w obu momentach ceny były niezmienione), informuje o przeciętnych zmianach ilości poszczególnych produktów w obu porównywanych momentach czasu. Agregatowy indeks ilości Laspeyresa LI q = p j0 q j1 p j0 q j0 = Agregatowy indeks ilości Paaschego q j1 q j0 p j0 q j0 p j0 q j0 PI q = p j1 q j1 p j1 q j0 Agregatowy indeks ilości Fishera F I q = LI qp I q Agata Boratyńska Statystyka matematyczna, wykład 2 15 / 20
Związki między indeksami I w = L I pp I q = L I qp I p = F I pf I q Agata Boratyńska Statystyka matematyczna, wykład 2 16 / 20
Rozkład χ 2 Z i N(0, 1), i = 1... k, Z i niezależne Rozkładem χ 2 z k stopniami swobody nazywamy rozkład prawdopodobieństwa zmiennej losowej Y = k i=1 Zi 2 i oznaczamy Y χ 2 k Gęstość 1 p k (x) = k 2 k 2 Γ( k 2 1 2 )x exp ( 1 ) 2 x 1 (0, ) (x) EY = k i VarY = 2k kwantyl rzędu p - F 1 (p) - liczba taka, że P{Y F 1 (p)} = p χ 2 χ k 2 k wartość krytyczna rzędu α χ 2 (α, k) = F 1 (1 α) χ 2 k liczba taka, że prawdopodobieństwo zdarzenia Y > χ 2 (α, k) jest równe α. Agata Boratyńska Statystyka matematyczna, wykład 2 17 / 20
Rozkład t-studenta Z N(0, 1) i Y χ 2 k oraz Z i Y niezależne Rozkładem t-studenta z k stopniami swobody nazywamy rozkład zmiennej losowej T = Z i oznaczamy T t k gęstość Y k f k (x) = 1 kπ Γ k ( ) k+1 ( 2 ) Γ ( k 2 1 + x 2 2 ) k+1 2 ET = 0 gdy k > 1 i VarT = k 2 gdy k > 2 kwantyl rzędu p - Ft 1 k (p) - liczba taka, że P{T Ft 1 k (p)} = p wartość krytyczna dwustronna rzędu α ( t(α, k) = Ft 1 k 1 α ) 2 - liczba, taka że prawdopodobieństwo zdarzenia T > t(α, k) jest równe α. Agata Boratyńska Statystyka matematyczna, wykład 2 18 / 20
Rozkład F (Fishera-Snedecora) Y χ 2 k i V χ2 r oraz Y i V niezależne. Rozkładem F z k i r stopniami swobody nazywamy rozkład zmiennej losowej F = Y /k V /r i oznaczamy F F k,r Gęstość ( ) p k,r (x) = Γ k+r ( ) r 2 r 2 x k 2 1 ( ) Γ k 2 Γ ( ) r k ( ) k+r 1 (0, ) (x) 2 x + r 2 k gdy x > 0 kwantyl rzędu p - F 1 F k,r (p) wartość krytyczna rzędu α F (α, k, r) = F 1 F k,r (1 α) - liczba, taka że prawdopodobieństwo zdarzenia F > F (α, k, r) jest równe α. Agata Boratyńska Statystyka matematyczna, wykład 2 19 / 20
Formuły w Excelu Wartości krytyczne: rozkład chi kwadrat: χ 2 (α, k) = ROZK.CHI.ODWR.PS(α; k) np: χ 2 (0, 05, 2) = ROZK.CHI.ODWR.PS(0, 05; 2) = 5, 99 rozkład t-studenta: t(α, k) = ROZK.T.ODWR.DS(α; k) rozkład F: F (α, k, r) = ROZK.F.ODWR.PS(α; k; r) Warto pamiętać: F (α, k, r) F (1 α, r, k) = 1 Agata Boratyńska Statystyka matematyczna, wykład 2 20 / 20