Dynamiczne modele liniowe w badaniach okresowych Katedra Statystyki UE w Poznaniu
O czym będzie mowa? badamy zmienność pewnego parametru w czasie w pewnej populacji co pewien okres losujemy próbę na podstawie próby szacujemy badany parametr precyzja oszacowania zależy od wielkości próby co, gdy mamy za małą próbę?
Dynamiczne modele liniowe (DLM) Specyfikacja modelu gdzie Y t = F tθ t + ε t ε t N(0, σ 2 ε,t) - równanie pomiaru θ t = G tθ t 1 + η t η t N(0, W t) - równanie przejścia Y t - obserwowana wartość szeregu czasowego θ t - nieobserwowany wektor parametrów stanu F t i G t - wektor i macierz znanych współczynników liniowych ε t - zm. los. opisująca zmienność nieopisana przez parametry stanu / błąd obs. η t - wektor losowy opisujący stratę w czasie informacji o wartości wektora θ t W t - macierz kowariancji macierzy wektora losowego η t
Dynamiczne modele liniowe (DLM) Filtr Kalmana - filtrowanie D t informacje dostępne w okresie t, θ t D t N(m t, C t) prognoza 1 krok naprzód wektora θ t+1 na podstawie informacji D t ma rozkład normalny z parametrami: a t+1 = E(θ t+1 D t) = G t+1m t Z t+1 = Var(θ t+1 D t) = G t+1c tg t+1 + W t+1 prognoza 1 krok naprzód Y t+1 na podstawie informacji D t ma rozkład normalny z parametrami: f t+1 = E(Y t+1 D t) = F t+1a t Q t = Var(Y t+1 D t) = F t+1z t+1f t+1 + σ 2 ε,t+1
Dynamiczne modele liniowe (DLM) Filtr Kalmana - filtrowanie cd. D t+1 = {D t, Y t+1} informacje dostępne w okresie t oszacowanie wektora θ t+1 na podstawie informacji D t+1 ma rozkład normalny z parametrami: m t+1 = E(θ t+1 D t+1) = a t + Z t+1f t+1q 1 t+1(y t+1 f t+1) C t+1 = Var(θ t+1 D t+1) = Z t+1 Z t+1f t+1q 1 t+1f t+1z t+1 Potrzebna jest macierz W t Można ją oszacować za pomocą Metody Największej Wiarygodności
Dynamiczne modele liniowe Filtr Kalmana - filtrowanie cd. Źródło: Solhjell Ida Kjersem [2009] Bayesian Forecasting and Dynamic Models Applied to Strain Data from Gota River Bridge
Dynamiczne modele liniowe Filtr Kalmana - wygładzanie Jeżeli θ t+1 D t N(s t+1, S t+1, wtedy θ t D t N(s t, S t), gdzie: s t = m t + C tg t+1r 1 t+1(s t+1 a t+1) S t = C t + C tg t+1r 1 t+1(s t+1 R t+1)r 1 t+1g t+1c t
Idea wykorzystania DLM w badaniach okresowych Niech Y t - badany parametr populacji Ŷ t - oszacowanie bezpośrednie parametru populacji e t - błąd oszacowania, e t N(0, V t), V t = Var(Ŷ t) Wtedy Ŷ t = Y t + e t (1) Załóżmy, że: Y t = F tθ t + ε t ε t N(0, σε,t) 2 (2) θ t = G tθ t 1 + η t η t N(0, W t) (3) (2)-(3) (1), stąd Ŷ t = F tθ t + ε t + e t = F tθ t + v t v t N(0, σv 2 V t), σv 2 1 (4) θ t = G tθ t 1 + η t η t N(0, W t) (5)
Przykład Dane dane jednostkowe z Badania Aktywności Ekonomicznej Ludności 2000-2005 Populacja osoby biorące udział w BAEL-u Badany parametr miesięczna stopa bezrobocia Y t = NB t N A t N B t N A t - liczba osób bezrobotnych w miesiącu t - liczba osób aktywnych zawodowo w miesiącu t Losowanie próby proste bez zwracania, wielkość próby - 500
Przykład Oszacowanie bezpośrednie Ŷ t = nb t n A t n B t n A t - liczba osób bezrobotnych w próbie wylosowanej w miesiącu t - liczba osób aktywnych zawodowo w próbie wylosowanej w miesiącu t Precyzja oszacowania bezpośredniego V t = (Nt nt )nt nt Var(Ŷt) B (na t nb t ) N t (n t 1) (nt A)3 N t - wielkość populacji w miesiącu t n t - wielkość próby wylosowanej w miesiącu t Var(Ŷt) 0.023 Var(Ŷt ) Y t 0.125
Przykład Ŷ t = Y t + e t = e t N(0, σe,t) 2 = L t + S t + ε t + e t = ε t N(0, σε,t) 2 = L t + S t + v t v t = e t + ε t N(0, σv 2 V t) e t - błąd oszacowania, ε t - reszta modelu L t = L t 1 + R t 1 R t = R t 1 + ω R,t E(ω R,t ) = 0 Var(ω R,t ) = σ 2 R trend lokalnie liniowy S t = 6 j=1 St,j S t,j = cos ( ) jπ St 1,j + sin ( ) jπ 6 6 S t 1,j + ω S,t,j St,j = sin ( ) jπ St 1,j + cos ( ) jπ 6 6 S t 1,j + ωs,t,j E(ω S,t,j ) = E(ωS,t,j) = { 0 σ Cov(ω S,t,j, ωs,t,j ) 2 = S,j, t = t, j = j 0, wpp sezonowość trygonometryczna
Dynamiczne modele liniowe F t = (1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1) θ t = (L t, R t, S t,1, St,1,..., S t,6) T G t = blockdiag(g ( ) R t, G S1 t,..., G S6 t ) 1 1 G R t = ( 0 1 ) cos(jπ/6) sin(jπ/6) G Sj t = sin(jπ/6) cos(jπ/6) η t = (0, ω R,t, ω S,t,1, ωs,t,1,..., ω S,t,6) = Ŷt = Z t θ t + v t θ t = G t θ t 1 + η t
Dynamiczne Modele Liniowe w R Pakiet dlm Giovanni Petris, Sonia Petrone, Partizia Campagnoli [2007/2011] Dynamic Linear Models with R Giovanni Petris [2010] dlm - an R package for Bayesian analysis of Dynamic Linear Models
Dziękuję za uwagę