Statystyka Wykład 13 Magdalena Alama-Bućko 12 czerwca 2017 Magdalena Alama-Bućko Statystyka 12 czerwca 2017 1 / 30
Co wpływa na zmiany wartości danej cechy w czasie? W najbardziej ogólnym przypadku, na badane zjawisko oddziałuja trzy grupy przyczyn: działajace w sposób trwały i powodujace wystapienie określonej tendencji rozwojowej (czyli trendu), powodujace zmiany powolne, systematyczne i ujawniajace się w długich okresach czasu; działajace okresowo ale regularnie, tzw. wahania sezonowe, często zwiazane ze zjawiskami przyrodniczymi; działajace przypadkowo i nieregularnie tzw. wahania przypadkowe. Magdalena Alama-Bućko Statystyka 12 czerwca 2017 2 / 30
Dekompozycja szeregu czasowego, to: wyodrębnienie tendencji rozwojowej wyodrębnienie wahań sezonowych wyodrębnienie wahań przypadkowych Magdalena Alama-Bućko Statystyka 12 czerwca 2017 3 / 30
Wyodrębnienie tendencji rozwojowej Tendencja rozwojowa (trendem) nazywamy powolne, regularne i systematyczne zmiany określonego zjawiska, obserwowane w dostetecznie długim przedziale czasu i będace rezultatem działania przyczyn głównych. Jeżeli trend występuje, to wartości szeregu czasowego można zapisać w postaci: y t = f (t) + z t, gdzie y t obserwowana wartość zjawiska w momencie t, f (t) funkcja trendu z t składnik resztowy Magdalena Alama-Bućko Statystyka 12 czerwca 2017 4 / 30
y t = f (t) + z t, gdzie f (t) ma nieznana postać może być liniowa, wielomianowa, logarytmiczna,... uważa się że do wyodrębniania trendu powinien być wykorzystywany co najmniej 10-letni okres im dłuższy okres badamy, tym zaobserwowana tendencja rozwojowa będzie pewniejsza, a wnioski bardziej precyzyjne Do wyodrębniania tendencji rozwojowej z szeregów czasowych najczęściej wykorzystuje się : metody mechaniczne (tzw. średnie ruchome) metody analityczne (metoda najmniejszych kwadratów) Magdalena Alama-Bućko Statystyka 12 czerwca 2017 5 / 30
Metody mechaniczne Mechaniczna metoda wyodrębniania tendencji rozwojowej opiera się na średnich ruchomych. Średnie ruchome moga być obliczane z parzystej liczby kolejnych wyrazów szeregu czasowego (tzw. średnie ruchome scentrowane) k = 2, 4, 6,... Średnie ruchome moga być obliczane z nieparzystej liczby kolejnych wyrazów (tzw. średnie ruchome zwykłe). k = 3, 5, 7,... wybór średniej zależy od celu badania Magdalena Alama-Bućko Statystyka 12 czerwca 2017 6 / 30
średnie ruchome zwykłe k nieparzyste średnia arytmetyczna z k kolejnych wyrazów szeregu czasowego otrzymane wartości indeksujemy numerem "wewnętrznej" obserwacji dla k = 3 (tzw. średnie ruchome zwykłe trzyokresowe) mamy: y 2 = y 1 + y 2 + y 3 3, y 3 = y 2 + y 3 + y 4, y 3 4 = y 3 + y 4 + y 5 3..., y n 1 = y n 2 + y n 1 + y n 3 dla k = 5 (tzw. średnie ruchome zwykłe pięciookresowe) mamy: y 3 = y 1 + y 2 + y 3 + y 4 + y 5 5 otrzymujemy n k + 1 wartości uśrednionych, y 4 = y 2 + y 3 + y 4 + y 5 + y 6,... 5 Magdalena Alama-Bućko Statystyka 12 czerwca 2017 7 / 30
średnie ruchome scentrowane k parzyste tak naprawdę liczymy średnia z nieparzystej liczby wyrazów, ale wartości skrajne bierzemy z wag a 1 2 otrzymane wartości indeksujemy numerem "wewnętrznej" obserwacji np. dla k = 4 y 3 = 1 2 y 1 + y 2 + y 3 + y 4 + 1 2 y 5 4, y 4 = 1 2 y 2 + y 3 + y 4 + y 5 + 1 2 y 6 4, 1 2..., y n 2 = y n 4 + y n 3 + y n 2 + y n 1 + 1 2 y n 4 otrzymujemy n k wartości uśrednionych Magdalena Alama-Bućko Statystyka 12 czerwca 2017 8 / 30
Uwagi wartości średnie indeksujemy numerem "środkowego" pomiaru wraz ze wzrostem k szereg staje się jest bardziej wygładzony (coraz mniej załamań) jeśli w szeregu czasowym występuje tylko trend (brak wahań sezonowych), to stosujemy średnia ruchoma z nieparzystej liczby wyrazów jeśli w szeregu czasowym występuje obok trendu również wahania sezonowe (okresowe), to k powinno wynosić tyle, ile podokresów sezonowych występuje w danym cyklu wahań. np. sezonowe wahania kwartalne : k = 4 sezonowe wahania miesięczne: k = 12 Magdalena Alama-Bućko Statystyka 12 czerwca 2017 9 / 30
Przykład 1 Zbiory ziemniaków (w mln ton) w Polsce w latach 1990-1998 kształtowały się następujaco: Lata 1990 1991 1992 1993 1994 1995 1996 1997 1998 Zbiory 36.3 29 23.4 36.3 23.1 24.9 27.2 20.8 25.9 Wyznaczyć tendencję rozwojowa ziemniaków w Polsce w badanych latach stosujac metodę dynamiczna. Magdalena Alama-Bućko Statystyka 12 czerwca 2017 10 / 30
zbiory ziemniaków charakteryzowały się spadkowym trendem rozwojowym Magdalena Alama-Bućko Statystyka 12 czerwca 2017 11 / 30
Metody analityczne: MNK polega na dopasowaniu do szeregu czasowego funkcji pewnego typu np. funkcja liniowa, kwardatowa, wykładnicza,... jeżeli funkcja trendu jest funkcja liniowa, czyli f (t) = a t + b to dla szeregu czasowego mamy: y t = a t + b + z t = ŷ t + z t gdzie ŷ t teoretyczne wartości trendu w momencie t a, b - współczynniki trendu liniowego z t składnik resztowy Magdalena Alama-Bućko Statystyka 12 czerwca 2017 12 / 30
metoda najmniejszych kwadratów : n (y t ŷ t ) 2 min t=1 stosujemy wzory dla regresji liniowej, gdzie zmienna niezależna to czas t, ale rozważamy t = 1, 2, 3,... (a nie lata t = 1995, 1996,...) współczynniki a i b (ŷ t = a t + b) maja postać: a: b: a = n n y t t t=1 n t=1 n y t t=1 n t t=1 n n t 2 ( t) 2 t=1 yt a t b = = y at n Magdalena Alama-Bućko Statystyka 12 czerwca 2017 13 / 30
Interpretacja y = a t + b a - o tyle następuje (średnio) wzrost/spadek wartości zjawiska (z roku na rok) w badanych latach b - wartość zjawiska w zerowym momencie pomiarowym (t = 0) Jakość dopasowania : współczynnik determinacji R 2 R 2 = 1 (yt ŷ t ) 2 (yt y t ) 2 = (ŷt y t ) 2 (yt y t ) 2 odchylenie standardowe składnika resztowego (k- liczba szacowanych parametrów, tutaj k = 2) S e = (yt ŷ t ) 2 n k Magdalena Alama-Bućko Statystyka 12 czerwca 2017 14 / 30
Przykład 1 Zbiory ziemniaków (w mln ton) w Polsce w latach 1990-1998 kształtowała się następujaco: Lata 1990 1991 1992 1993 1994 1995 1996 1997 1998 Zbiory 36.3 29 23.4 36.3 23.1 24.9 27.2 20.8 25.9 Wyznaczyć tendencję rozwojowa ziemniaków w Polsce metoda MNK. Magdalena Alama-Bućko Statystyka 12 czerwca 2017 15 / 30
n = 9, t = 45, yt = 246.9, t yt = 1164.5, t 2 = 285 a: a = n n y t t t=1 n t=1 n y t t=1 n t t=1 = n n t 2 ( t) 2 t=1 b: yt a t b = = n ŷ t = 1.17 t + 33.27 9 1164.5 246.9 45 9 285 45 2 = 1.17, 246.9 ( 1.17) 45 9 = 33.27 w latach 1990-1998 zbiory ziemniaków spadały średnio rocznie o 1.17 mln ton teoretyczne zbiory ziemniaków w 1989 (dla t = 0) roku wynosiły 33.27 mln ton Magdalena Alama-Bućko Statystyka 12 czerwca 2017 16 / 30
otrzymaliśmy ŷ t = 1.17 t + 33.27 poniżej wykresy funkcji trendu dla danych wyznaczone w programie Excel (pierwszy wykres daje nieprawidłowy współczynnik przesunięcia, drugi - współczynniki sa właściwe) według pierwszego wzoru wartość zbiorów ziemniaków w roku t = 0 wynosi 2353.8 mln ton (nieprawidłowe) według drugiego wzoru wartość zbiorów ziemniaków w roku t = 0 wynosi 33.26 mln ton Magdalena Alama-Bućko Statystyka 12 czerwca 2017 17 / 30
wyodrębnienie wahań sezonowych wiele zjawisk podlega również wahaniom okresowym szczególnym przypadkiem wahań okresowych sa wahania sezonowe wahania sezonowe powtarzaja się z roku na rok w tych samych jednostkach kalendarzowych i powoduja podobne zmiany ilościowe d - liczba cykli w roku kalendarzowym wahania roczne (d = 1), półroczne (d = 2), kwartalne (d = 4) oraz miesięczne (d = 12) aby otrzymać wiarygodne oszacowania, powinniśmy obserwować kilka cykli rocznych (co najmniej 3-4) Magdalena Alama-Bućko Statystyka 12 czerwca 2017 18 / 30
Wahania sezonowe maja zwiazek z występowaniem pór roku, np.: produkcja roślinna i zwierzęca w rolnictwie popyt na węgiel ruch turystyczny spożycie lodów, napojów chłodzacych Wahania sezonowe maja również zwiazek z innymi czynnikami (o charakterze instytucjonalnym, zwyczajowym czy prawnym) popyt na towary w grudniu Magdalena Alama-Bućko Statystyka 12 czerwca 2017 19 / 30
Do wyznaczenia wskaźnika wahań okresowych wykorzystuje się wartości szeregu czasowego y t oraz wartości szeregu wygładzonego ŷ t. Załóżmy, że szereg czasowy wykazuje wahania okresowe i że w każdym cyklu jest k faz wahań. Magdalena Alama-Bućko Statystyka 12 czerwca 2017 20 / 30
Ogólna metoda konstrukcji wskaźnika wahań okresowych polega na: a) wygładzeniu szeregu czasowego, czyli wyznaczeniu ŷ t, t = 1, 2,..., n b) uwolnieniu szeregu czasowego od trendu w t = y t ŷ t, t = 1, 2,..., n c) eliminacji wahań przypadkowych z w t obliczamy surowe wskaźniki sezonowości c t : dla jednoimiennych okresów (tj. okresów pochodzacych z tej samej fazy wahań) obliczamy średnie arytmetyczne z wyrazów w t np. z tych samych kwartałów informuja, o ile procent poziom zjawiska w danej fazie cyklu jest wyższy/niższy od poziomu, jaki byłby osiagn ał, gdyby nie było wahań, a rozwój następował zgodnie z trandem Magdalena Alama-Bućko Statystyka 12 czerwca 2017 21 / 30
d) obliczeniu czystych wskaźników wahań okresowych (sezonowości) c t c i = c i, i = 1, 2,..., k c i gdzie c i jest średnia ze wszystkich surowych wskaźników wahań sezonowości. Oczyszczone wskaźniki wahań sezonowych spełniaja warunek ci = k. Może się zdarzyć, że warunek ten spełniaja surowe wskaźniki sezonowości. Wtedy też nie trzeba ich już oczyszczać, czyli wyznaczać c i, i = 1, 2,..., k. Magdalena Alama-Bućko Statystyka 12 czerwca 2017 22 / 30
Interpretacja czystych (oczyszczonych) wskaźników wahań okresowych: gdy badamy półrocza to k = 2 gdy badamy kwartały to k = 4 gdy badamy miesiace to k = 12 wartość c i oznacza, że w danym miesiacu/kwartale/półroczu na skutek działania składnika okresowego (sezonowego) wartość zjawiska jest niższa (gdy c i < 1) albo wyższa (gdy c i > 1) o (c i 1) 100% od przeciętnej miesięcznej/kwartalnej/półrocznej... Magdalena Alama-Bućko Statystyka 12 czerwca 2017 23 / 30
Przykład jeśli c 1 = 0.7, c 2 = 1.2, c 3 = 1.5, c 4 = 0.6, to c 1 = 0.7 - w pierwszym kwartale każdego roku na skutek działania składnika okresowego wartość zjawiska jest niższa o 30% od przeciętnej kwartalnej c 2 = 1.2 - w drugim kwartale na skutek działania składnika okresowego wartość zjawiska jest wyższa o 20% od przeciętnej kwartalnej c 3 = 1.5 - w trzecim kwartale na skutek działania składnika okresowego wartość zjawiska jest wyższa o 50% od przeciętnej kwartalnej c 4 = 0.6 - w czwartym kwartale na skutek działania składnika okresowego wartość zjawiska jest niższa o 40% od przeciętnej kwartalnej Magdalena Alama-Bućko Statystyka 12 czerwca 2017 24 / 30
Przykład Liczba powstajacych małych firm gastronomicznych w pewnym województwie w półroczach 2000-2003 kształtowała się następujaco: Rok I półrocze II półrocze 2000 209 132 2001 282 196 2002 303 208 2003 338 227 Powyższe dane można zapisać następujaco: numer obserwacji t = 1 t = 2 t = 3 t = 4 t = 5 t = 6 t = 7 t = 8 liczba firm 209 132 282 196 303 208 338 227 Magdalena Alama-Bućko Statystyka 12 czerwca 2017 25 / 30
wartość trendu liniowego ŷ t w t = y t /ŷ t surowe wskaźniki sezonowości c t czyste wskaźniki sezonowości c t Magdalena Alama-Bućko Statystyka 12 czerwca 2017 26 / 30
wartość trendu liniowego ŷ t a = n n y t t t=1 n n y t t=1 n t t=1 = n n t 2 ( t) 2 t=1 t=1 yt a t b = = n ŷ t = 12.4 t + 181.1 1895 12.4 36 8 8 9048 1895 36 8 204 36 2 = 12.4 = 181.1 Magdalena Alama-Bućko Statystyka 12 czerwca 2017 27 / 30
w t = y t /ŷ t, gdzie ŷ t = 12.4 t + 181.1 surowe wskaźniki sezonowości c t : dla jednoimiennych okresów obliczamy średnie arytmetyczne z wyrazów w t rozważamy dwa półrocza, zatem k = 2 czyli c 1 i c 2 : c 1 c 2 = 1.08 + 1.29 + 1.25 + 1.26 4 = 0.64 + 0.85 + 0.81 + 0.81 4 = 1.22 = 0.78 Magdalena Alama-Bućko Statystyka 12 czerwca 2017 28 / 30
c 1 = 1.22, c 2 = 0.78 czyste wskaźniki sezonowości: ponieważ c t = 2, to uzyskaliśmy już czyste wskaźniki sezonowości i nie trzeba ich modyfikować (bo otrzymamy c t = c t ). Wnioski: c 1 = 1.22 w pierwszym półroczu każdego roku na skutek działania czynników sezonowych liczba punktów gastronomicznych jest wyższa od wartości ukształtowanej przez trend (albo od przeciętnej półrocznej ) o 22% c 2 = 0.78 w drugim półroczu każdego roku na skutek działania czynników sezonowych liczba punktów gastronomicznych jest niższa od wartości ukształtowanej przez trend (albo od przeciętnej półrocznej ) o 22%. Magdalena Alama-Bućko Statystyka 12 czerwca 2017 29 / 30
Dziękuję za uwagę! Magdalena Alama-Bućko Statystyka 12 czerwca 2017 30 / 30