Statystyka Wykład 13 Magdalena Alama-Bućko 18 czerwca 2018 Magdalena Alama-Bućko Statystyka 18 czerwca 2018 1 / 36
Agregatowy (zespołowy) indeks wartości określonego zespołu produktów np. jak zmianiała się wartość produkcji między poszczególnymi latami przy obserwowanych zmianach cen i ilości produkcji? I w - agregatowy indeks wartości badanego zespołu artykułów p 0 i p 1 - cena produktu jednostkowego w momencie podstawowym i badanym q 0 i q 1 - ilość jednostek produktu w momencie podstawowym i badanym Agregatowy indeks wartości to iloraz sum wartości badanych dóbr w okresie badanym i w okresie podstawowym, czyli q1 p 1 I w = q0 p 0 sumowanie odbywa się po wszystkich możliwych produktach Magdalena Alama-Bućko Statystyka 18 czerwca 2018 2 / 36
Agregatowe indeksy cen i ilości w celu obliczenia siły i kierunku zmian wyłacznie ilości lub wyłacznie ceny wyrobów wchodzacych w skład zespołu buduje się agregatowe indeksy ilości agregatowe indeksy cen polega na ustaleniu jednego z tych czynników (cena/ilość) na stałym poziomie w agregatowych indeksach ilości: cena ma ustalony stały poziom w agregatowych indeksach cen: ilość ma ustalony stały poziom Magdalena Alama-Bućko Statystyka 18 czerwca 2018 3 / 36
Najczęściej stosuje się następujace formuły standaryzacyjne: Laspeyrese ustalenie poziomu ceny (odp. ilości) na poziomie okresu podstawowego (bazowego) Paaschego ustalenie stałego poziomu ceny (odp. ilości) na poziomie okresu badanego (sprawozdawczego). Magdalena Alama-Bućko Statystyka 18 czerwca 2018 4 / 36
Agregatowy (zespołowy) indeks ilości cena ustalana na stałym poziomie według formuły Laspeyresa (cena na poziomie okresu bazowego, czyli p 0 ) Iq L q1 p 0 = q0 p 0 według formuły Paaschego (cena na poziomie okresu badanego, czyli p 1 ) Iq P q1 p 1 = q0 p 1 informuja o tym, o ile (przeciętnie) wzrosła/zmalała ilość danego zbioru artykułów w okresie badanym w porównaniu z okresem bazowym przy założeniu stałych cen z okresu bazowego/badanego. Magdalena Alama-Bućko Statystyka 18 czerwca 2018 5 / 36
Agregatowy (zespołowy) indeks cen ilość ustalana na stałym poziomie według formuły Laspeyresa (ilość na poziomie okresu bazowego, czyli q 0 ) Ip L q0 p 1 = q0 p 0 według formuły Paaschego (ilość na poziomie okresu badanego, czyli q 1 ) Ip P q1 p 1 = q1 p 0 informuja o tym, o ile (przeciętnie) wzrosła/zmalała cena określonego zbioru artykułów w okresie badanym w porównaniu z okresem bazowym przy założeniu stałych ilości z okresu bazowego/badanego. Magdalena Alama-Bućko Statystyka 18 czerwca 2018 6 / 36
Zadanie Roczne spożycie na 1 mieszkańca oraz przeciętne ceny wybranych artykułów żywnościowych w Polsce w latach 1993 i 1996 przedstawiono w tablicy. artykuł j.m. 1993 1996 spożycie cena (zł) spożycie cena (zł) Mleko litry 209 0.41 196 0.83 Jaja szt. 157 0.18 175 0.31 Cukier kg 41.3 0.99 39.7 2.20 Obliczyć: a) roczne łaczne wydatki na te artykuły w 1993 i w 1996 roku b) roczne łaczne wydatki na te artykuły w 1996 roku przy zachowaniu poziomu spożycia z 1993 roku. c) roczne łaczne wydatki na te artykuły w 1996 roku przy niezmienionych cenach z 1993 roku. d) agregatowy indeks rocznych wydatków e)-f) agregatowe indeksy cen i spożycia według formuły Laspeyresa i Paaschego. Magdalena Alama-Bućko Statystyka 18 czerwca 2018 7 / 36
Tabelka (p 0, q 0 - dane z 1993 roku, p 1, q 1 - dane z 1996 roku) artykuł q 0 p 0 q 1 p 1 q 0 p 0 q 0 p 1 q 1 p 0 q 1 p 1 Mleko 209 0.41 196 0.83 85.69 173.47 80.36 162.68 Jaja 157 0.18 175 0.31 28.26 48.67 31.5 54.25 Cukier 41.3 0.99 39.7 2.20 40.89 90.86 39.30 87.34 154.84 313 151.16 304.27 a) roczne łaczne wydatki na te artykuły w 1993 i w 1996 roku w 1993 roku: q 0 p 0 = 154.84 zł w 1996 roku: q 1 p 1 = 304.27 zł b) roczne łaczne wydatki na te artykuły w 1996 roku przy zachowaniu poziomu spożycia z 1993 roku. (ceny z 1996 roku, ilości z 1993 roku) q0 p 1 = 313 zł Magdalena Alama-Bućko Statystyka 18 czerwca 2018 8 / 36
Tabelka (p 0, q 0 - dane z 1993 roku, p 1, q 1 - dane z 1996 roku) artykuł q 0 p 0 q 1 p 1 q 0 p 0 q 0 p 1 q 1 p 0 q 1 p 1 Mleko 209 0.41 196 0.83 85.69 173.47 80.36 162.68 Jaja 157 0.18 175 0.31 28.26 48.67 31.5 54.25 Cukier 41.3 0.99 39.7 2.20 40.89 90.86 39.30 87.34 154.84 313 151.16 304.27 c) roczne łaczne wydatki na te artykuły w 1996 roku przy niezmienionych cenach z 1993 roku. (ceny z 1993 roku, ilości z 1996 roku) q1 p 0 = 151.16 zł d) agregatowy indeks rocznych wydatków q1 p 1 I w = = 304.27 q0 p 0 154.84 = 1.9650 Wartość zakupionych artykułów wzrosła w okresie 1993-1996 o 96, 5%. Magdalena Alama-Bućko Statystyka 18 czerwca 2018 9 / 36
e) indeksy cen i ilości Laspeyresa (stały poziom danych z 1993 roku) indeks ceny ( ilość - stały poziom z 1993 roku ) I L p = q0 p 1 q0 p 0 = 313 154.84 = 2.0214 W latach 1993-1996 nastapił wzrost cen o 102.14% przy założeniu stałego spożycia na poziomie z 1993 roku. indeks spożycia ( cena - stały poziom z 1993 roku ) I L q = q1 p 0 = 151.16 = 0.9762 = 1 0.0238 q0 p 0 154.84 W latach 1993-1996 nastapił spadek spożycia o 2.38% przy założeniu stałej ceny z 1993 roku. Magdalena Alama-Bućko Statystyka 18 czerwca 2018 10 / 36
f) indeksy cen i ilości Paaschego (stały poziom danych z 1996 roku) indeks ceny ( ilość - stały poziom z 1996 roku) I P p = q1 p 1 q1 p 0 = 304.27 151.16 = 2.0129 W latach 1993-1996 nastapił wzrost cen o 101.29% przy założeniu spożycia z 1996 roku. indeks spożycia ( cena - stały poziom z 1996 roku) I L q = q1 p 1 = 304.27 = 0.9721 = 1 0.0279 q0 p 1 313 W latach 1993-1996 nastapił spadek spożycia o 2.79% przy założeniu stałej ceny na poziomie z 1996 roku. Magdalena Alama-Bućko Statystyka 18 czerwca 2018 11 / 36
zatem uzyskaliśmy zespołowe indeksy cen i spożycia: I L p = 2.0214, I P p = 2.0129 Interpretacja : Dynamika zmian cen w 1993-1996 mieści się w przedziale (2.0129; 2.0214) (czyli średni wzrost cen od 101, 29% do 102.14%.) I L q = 0.9762 = 1 0.0238, I L q = 0.9721 = 1 0.0279 Interpretacja : Dynamika zmian spożycia w 1993-1996 mieści się w przedziale (0.9721; 0.9762). (czyli średni spadek spożycia od 2, 38% do 2.79%.) Magdalena Alama-Bućko Statystyka 18 czerwca 2018 12 / 36
Dekompozycja szeregu czasowego Magdalena Alama-Bućko Statystyka 18 czerwca 2018 13 / 36
Co wpływa na zmiany wartości danej cechy w czasie? W najbardziej ogólnym przypadku, na badane zjawisko oddziałuja trzy grupy przyczyn: działajace w sposób trwały i powodujace wystapienie określonej tendencji rozwojowej (czyli trendu), powodujace zmiany powolne, systematyczne i ujawniajace się w długich okresach czasu; działajace okresowo ale regularnie, tzw. wahania sezonowe, często zwiazane ze zjawiskami przyrodniczymi; działajace przypadkowo i nieregularnie tzw. wahania przypadkowe. Magdalena Alama-Bućko Statystyka 18 czerwca 2018 14 / 36
Dekompozycja szeregu czasowego, to: wyodrębnienie tendencji rozwojowej (trendu) wyodrębnienie wahań sezonowych wyodrębnienie wahań przypadkowych Magdalena Alama-Bućko Statystyka 18 czerwca 2018 15 / 36
Wyodrębnienie tendencji rozwojowej Tendencja rozwojowa (trendem) nazywamy powolne, regularne i systematyczne zmiany określonego zjawiska, obserwowane w dostetecznie długim przedziale czasu i będace rezultatem działania przyczyn głównych. Jeżeli trend występuje, to wartości szeregu czasowego można zapisać w postaci: y t = f (t) + z t, gdzie y t obserwowana wartość zjawiska w momencie t, f (t) funkcja trendu z t składnik resztowy Magdalena Alama-Bućko Statystyka 18 czerwca 2018 16 / 36
y t = f (t) + z t, gdzie f (t) ma nieznana postać może być liniowa, wielomianowa, logarytmiczna,... uważa się że do wyodrębniania trendu powinien być wykorzystywany co najmniej 10-letni okres im dłuższy okres badamy, tym zaobserwowana tendencja rozwojowa będzie pewniejsza, a wnioski bardziej precyzyjne Do wyodrębniania tendencji rozwojowej z szeregów czasowych najczęściej wykorzystuje się : metody mechaniczne (tzw. średnie ruchome) metody analityczne (metoda najmniejszych kwadratów) Magdalena Alama-Bućko Statystyka 18 czerwca 2018 17 / 36
Metody mechaniczne Mechaniczna metoda wyodrębniania tendencji rozwojowej opiera się na średnich ruchomych. Średnie ruchome moga być obliczane z parzystej liczby kolejnych wyrazów szeregu czasowego (tzw. średnie ruchome scentrowane) k = 2, 4, 6,... Średnie ruchome moga być obliczane z nieparzystej liczby kolejnych wyrazów (tzw. średnie ruchome zwykłe). k = 3, 5, 7,... wybór średniej zależy od celu badania Magdalena Alama-Bućko Statystyka 18 czerwca 2018 18 / 36
średnie ruchome zwykłe k nieparzyste średnia arytmetyczna z k kolejnych wyrazów szeregu czasowego otrzymane wartości indeksujemy numerem "wewnętrznej" obserwacji dla k = 3 (tzw. średnie ruchome zwykłe trzyokresowe) mamy: y 2 = y 1 + y 2 + y 3 3, y 3 = y 2 + y 3 + y 4, y 3 4 = y 3 + y 4 + y 5 3..., y n 1 = y n 2 + y n 1 + y n 3 dla k = 5 (tzw. średnie ruchome zwykłe pięciookresowe) mamy: y 3 = y 1 + y 2 + y 3 + y 4 + y 5 5 otrzymujemy n k + 1 wartości uśrednionych, y 4 = y 2 + y 3 + y 4 + y 5 + y 6,... 5 Magdalena Alama-Bućko Statystyka 18 czerwca 2018 19 / 36
średnie ruchome scentrowane k parzyste tak naprawdę liczymy średnia z nieparzystej liczby wyrazów, ale wartości skrajne bierzemy z wag a 1 2 otrzymane wartości indeksujemy numerem "wewnętrznej" obserwacji np. dla k = 4 y 3 = 1 2 y 1 + y 2 + y 3 + y 4 + 1 2 y 5 4, y 4 = 1 2 y 2 + y 3 + y 4 + y 5 + 1 2 y 6 4, 1 2..., y n 2 = y n 4 + y n 3 + y n 2 + y n 1 + 1 2 y n 4 otrzymujemy n k wartości uśrednionych Magdalena Alama-Bućko Statystyka 18 czerwca 2018 20 / 36
Uwagi wartości średnie indeksujemy numerem "środkowego" pomiaru wraz ze wzrostem k szereg staje się jest bardziej wygładzony (coraz mniej załamań) jeśli w szeregu czasowym występuje tylko trend (brak wahań sezonowych), to stosujemy średnia ruchoma z nieparzystej liczby wyrazów (bo łatwiejsze do wyliczenia) jeśli w szeregu czasowym występuje obok trendu również wahania sezonowe (okresowe), to k powinno wynosić tyle, ile podokresów sezonowych występuje w danym cyklu wahań. np. sezonowe wahania kwartalne : k = 4 sezonowe wahania miesięczne: k = 12 Magdalena Alama-Bućko Statystyka 18 czerwca 2018 21 / 36
Przykład 1 Zbiory ziemniaków (w mln ton) w Polsce w latach 1990-1998 kształtowały się następujaco: Lata 1990 1991 1992 1993 1994 1995 1996 1997 1998 Zbiory 36.3 29 23.4 36.3 23.1 24.9 27.2 20.8 25.9 Wyznaczyć tendencję rozwojowa zbioru ziemniaków w Polsce w badanych latach stosujac metodę dynamiczna. Magdalena Alama-Bućko Statystyka 18 czerwca 2018 22 / 36
zbiory ziemniaków charakteryzowały się spadkowym trendem rozwojowym Magdalena Alama-Bućko Statystyka 18 czerwca 2018 23 / 36
Metody analityczne: MNK polega na dopasowaniu do szeregu czasowego funkcji pewnego typu np. funkcja liniowa, kwardatowa, wykładnicza,... jeżeli funkcja trendu jest funkcja liniowa, czyli f (t) = a t + b to dla szeregu czasowego mamy: y t = a t + b + z t = ŷ t + z t gdzie ŷ t teoretyczne wartości trendu w momencie t a, b - współczynniki trendu liniowego z t składnik resztowy Magdalena Alama-Bućko Statystyka 18 czerwca 2018 24 / 36
metoda najmniejszych kwadratów : n (y t ŷ t ) 2 min t=1 stosujemy wzory dla regresji liniowej, gdzie zmienna niezależna to czas t, ale rozważamy t = 1, 2, 3,... (a nie lata t = 1995, 1996,...) współczynniki a i b (ŷ t = a t + b) maja postać: a: b: a = n n y t t t=1 n t=1 n y t t=1 n t t=1 n n t 2 ( t) 2 t=1 yt a t b = = y at n Magdalena Alama-Bućko Statystyka 18 czerwca 2018 25 / 36
Interpretacja ŷ = a t + b a - o tyle następuje (średnio) wzrost/spadek wartości zjawiska (z roku na rok) w badanych latach b - wartość zjawiska w zerowym momencie pomiarowym (t = 0) Magdalena Alama-Bućko Statystyka 18 czerwca 2018 26 / 36
Przykład 1 Zbiory ziemniaków (w mln ton) w Polsce w latach 1990-1998 kształtowała się następujaco: Lata 1990 1991 1992 1993 1994 1995 1996 1997 1998 Zbiory 36.3 29 23.4 36.3 23.1 24.9 27.2 20.8 25.9 Wyznaczyć tendencję rozwojowa zbioru ziemniaków w Polsce metoda MNK. Magdalena Alama-Bućko Statystyka 18 czerwca 2018 27 / 36
n = 9, t = 45, yt = 246.9, t yt = 1164.5, t 2 = 285 a: a = n n y t t t=1 n t=1 n y t t=1 n t t=1 = n n t 2 ( t) 2 t=1 b: yt a t b = = n ŷ t = 1.17 t + 33.27 9 1164.5 246.9 45 9 285 45 2 = 1.17, 246.9 ( 1.17) 45 9 = 33.27 w latach 1990-1998 zbiory ziemniaków spadały średnio rocznie o 1.17 mln ton teoretyczne zbiory ziemniaków w 1989 (dla t = 0) roku wynosiły 33.27 mln ton Magdalena Alama-Bućko Statystyka 18 czerwca 2018 28 / 36
otrzymaliśmy ŷ t = 1.17 t + 33.27 poniżej wykresy funkcji trendu dla danych wyznaczone w programie Excel (pierwszy wykres daje nieprawidłowy współczynnik przesunięcia, drugi - współczynniki sa właściwe) według pierwszego wzoru wartość zbiorów ziemniaków w roku t = 0 wynosi 2353.8 mln ton (nieprawidłowe) według drugiego wzoru wartość zbiorów ziemniaków w roku t = 0 wynosi 33.26 mln ton Magdalena Alama-Bućko Statystyka 18 czerwca 2018 29 / 36
wyodrębnienie wahań sezonowych wiele zjawisk podlega również wahaniom okresowym szczególnym przypadkiem wahań okresowych sa wahania sezonowe wahania sezonowe powtarzaja się z roku na rok w tych samych jednostkach kalendarzowych i powoduja podobne zmiany ilościowe d - liczba cykli w roku kalendarzowym wahania roczne (d = 1), półroczne (d = 2), kwartalne (d = 4) oraz miesięczne (d = 12) aby otrzymać wiarygodne oszacowania, powinniśmy obserwować kilka cykli rocznych (co najmniej 3-4) Magdalena Alama-Bućko Statystyka 18 czerwca 2018 30 / 36
Wahania sezonowe maja zwiazek z występowaniem pór roku, np.: produkcja roślinna i zwierzęca w rolnictwie popyt na węgiel ruch turystyczny spożycie lodów, napojów chłodzacych Wahania sezonowe maja również zwiazek z innymi czynnikami (o charakterze instytucjonalnym, zwyczajowym czy prawnym) popyt na towary w grudniu Magdalena Alama-Bućko Statystyka 18 czerwca 2018 31 / 36
Do wyznaczenia wskaźnika wahań okresowych wykorzystuje się wartości szeregu czasowego y t oraz wartości szeregu wygładzonego ŷ t. Załóżmy, że szereg czasowy wykazuje wahania okresowe i że w każdym cyklu jest k faz wahań. Magdalena Alama-Bućko Statystyka 18 czerwca 2018 32 / 36
Ogólna metoda konstrukcji wskaźnika wahań okresowych - rozważmy najprostszy przypadek, gdy szereg czasowy nie ma wyraźnie zaznaczonego trendu. wyodrębniamy wahania okresowe, obliczajać tzw. wskaźniki wahań okresowych (wskaźniki sezonowości) gdzie c i = y i y y i : to średnia arytmetyczna dla jednoimiennych okresów (tj. okresów pochodzacych z tej samej fazy wahań) np. z tych samych kwartałów y: to średnia arytmetyczna z całego badanego okresu informuja, o ile procent poziom zjawiska w danej fazie cyklu jest wyższy/niższy od poziomu równego średniej arytmetycznej wszystkich obserwacji Magdalena Alama-Bućko Statystyka 18 czerwca 2018 33 / 36
Wskaźniki wahań sezonowych (okresowych) spełniaja warunek ci = k. Gdy nie ma wahań okresowych, wszystkie wskażniki wahań okresowych c i = 1 Magdalena Alama-Bućko Statystyka 18 czerwca 2018 34 / 36
Interpretacja wskaźników wahań okresowych: gdy badamy półrocza to k = 2 gdy badamy kwartały to k = 4 gdy badamy miesiace to k = 12 wartość c i oznacza, że w danym miesiacu/kwartale/półroczu na skutek działania składnika okresowego (sezonowego) wartość zjawiska jest niższa (gdy c i < 1) albo wyższa (gdy c i > 1) o (c i 1) 100% od przeciętnej miesięcznej/kwartalnej/półrocznej... Magdalena Alama-Bućko Statystyka 18 czerwca 2018 35 / 36
Przykład jeśli c 1 = 0.7, c 2 = 1.2, c 3 = 1.5, c 4 = 0.6, to c 1 = 0.7 = 1 0.3 - w pierwszym kwartale każdego roku na skutek działania składnika okresowego wartość zjawiska jest niższa o 30% od przeciętnej kwartalnej c 2 = 1.2 = 1 + 0.2 - w drugim kwartale na skutek działania składnika okresowego wartość zjawiska jest wyższa o 20% od przeciętnej kwartalnej c 3 = 1.5 = 1 + 0.5 - w trzecim kwartale na skutek działania składnika okresowego wartość zjawiska jest wyższa o 50% od przeciętnej kwartalnej c 4 = 0.6 = 1 0.4 - w czwartym kwartale na skutek działania składnika okresowego wartość zjawiska jest niższa o 40% od przeciętnej kwartalnej Magdalena Alama-Bućko Statystyka 18 czerwca 2018 36 / 36