Ekonometria Przestrzenna Wykªad 5: Proste modele regresji przestrzennej. Dane GIS: analiza w regionach (5) Ekonometria Przestrzenna 1 / 47
Plan wykªadu 1 Model liniowy i SAR (Spatial Lag) Model liniowy SAR (Spatial Lag, SLM) 2 Model SEM (Spatial Error) Model SEM z globaln zale»no±ci skªadników losowych Model SEM z lokaln zale»no±ci skªadników losowych 3 Model SLX 4 Š czenie danych punktowych GIS ze statystykami regionalnymi Przykªad: lokalizacje sklepów Biedronka Zadanie domowe (5) Ekonometria Przestrzenna 2 / 47
Plan prezentacji 1 Model liniowy i SAR (Spatial Lag) 2 Model SEM (Spatial Error) 3 Model SLX 4 Š czenie danych punktowych GIS ze statystykami regionalnymi (5) Ekonometria Przestrzenna 3 / 47
Model liniowy Model regresji liniowej specykacja Dobrze znany klasyczny model regresji liniowej: y = Xβ + ε Jego parametry mo»na szacowa w sposób nieobci»ony, zgodny i efektywny za pomoc KMNK. Wªa±ciwy, gdy powi zania przestrzenne y daj si caªkowicie wyja±ni przy pomocy powi za«przestrzennych wewn trz zbioru regresorów X (przestrzenne skupienia przyczyn ang. spatial clustering). (5) Ekonometria Przestrzenna 4 / 47
Model liniowy Model regresji liniowej specykacja Dobrze znany klasyczny model regresji liniowej: y = Xβ + ε Jego parametry mo»na szacowa w sposób nieobci»ony, zgodny i efektywny za pomoc KMNK. Wªa±ciwy, gdy powi zania przestrzenne y daj si caªkowicie wyja±ni przy pomocy powi za«przestrzennych wewn trz zbioru regresorów X (przestrzenne skupienia przyczyn ang. spatial clustering). (5) Ekonometria Przestrzenna 4 / 47
Model liniowy Model regresji liniowej specykacja Dobrze znany klasyczny model regresji liniowej: y = Xβ + ε Jego parametry mo»na szacowa w sposób nieobci»ony, zgodny i efektywny za pomoc KMNK. Wªa±ciwy, gdy powi zania przestrzenne y daj si caªkowicie wyja±ni przy pomocy powi za«przestrzennych wewn trz zbioru regresorów X (przestrzenne skupienia przyczyn ang. spatial clustering). (5) Ekonometria Przestrzenna 4 / 47
Model liniowy Schemat oddziaªywa«w modelu liniowym (5) Ekonometria Przestrzenna 5 / 47
SAR (Spatial Lag, SLM) Schemat oddziaªywa«w modelu SAR (5) Ekonometria Przestrzenna 6 / 47
SAR (Spatial Lag, SLM) Model SAR relacje z innymi modelami (5) Ekonometria Przestrzenna 7 / 47
SAR (Spatial Lag, SLM) Model SAR relacje z innymi modelami (5) Ekonometria Przestrzenna 8 / 47
SAR (Spatial Lag, SLM) Model SAR specykacja Autoregresja przestrzenna z dodatkowymi regresorami. y = ρwy + Xβ + ε Gdyby w tym modelu nie byªo zmiennych obja±niaj cych X, byªby on to»samy z modelem czystej autoregresji. W tym modelu nie zakªadamy ju» przestrzennych skupie«przyczyn, ale raczej przestrzenne interakcje skutków (ang. spatial interactions, spatial global spillovers, spatial spillovers in outcomes). Problem w estymacji KMNK: endogeniczno± (podobnie jak w czystej autoregresji). (5) Ekonometria Przestrzenna 9 / 47
SAR (Spatial Lag, SLM) Model SAR specykacja Autoregresja przestrzenna z dodatkowymi regresorami. y = ρwy + Xβ + ε Gdyby w tym modelu nie byªo zmiennych obja±niaj cych X, byªby on to»samy z modelem czystej autoregresji. W tym modelu nie zakªadamy ju» przestrzennych skupie«przyczyn, ale raczej przestrzenne interakcje skutków (ang. spatial interactions, spatial global spillovers, spatial spillovers in outcomes). Problem w estymacji KMNK: endogeniczno± (podobnie jak w czystej autoregresji). (5) Ekonometria Przestrzenna 9 / 47
SAR (Spatial Lag, SLM) Model SAR specykacja Autoregresja przestrzenna z dodatkowymi regresorami. y = ρwy + Xβ + ε Gdyby w tym modelu nie byªo zmiennych obja±niaj cych X, byªby on to»samy z modelem czystej autoregresji. W tym modelu nie zakªadamy ju» przestrzennych skupie«przyczyn, ale raczej przestrzenne interakcje skutków (ang. spatial interactions, spatial global spillovers, spatial spillovers in outcomes). Problem w estymacji KMNK: endogeniczno± (podobnie jak w czystej autoregresji). (5) Ekonometria Przestrzenna 9 / 47
SAR (Spatial Lag, SLM) Model SAR specykacja Autoregresja przestrzenna z dodatkowymi regresorami. y = ρwy + Xβ + ε Gdyby w tym modelu nie byªo zmiennych obja±niaj cych X, byªby on to»samy z modelem czystej autoregresji. W tym modelu nie zakªadamy ju» przestrzennych skupie«przyczyn, ale raczej przestrzenne interakcje skutków (ang. spatial interactions, spatial global spillovers, spatial spillovers in outcomes). Problem w estymacji KMNK: endogeniczno± (podobnie jak w czystej autoregresji). (5) Ekonometria Przestrzenna 9 / 47
SAR (Spatial Lag, SLM) Konsekwencje pomini cia struktury przestrzennej SAR (1) Prawdziwy proces generuj cy dane: y = ρwy + Xβ + ε Szacowany model liniowy z pomini ciem Wy (metoda KMNK): y = Xβ KMNK + ε Zgodnie z reguªami ekonometrii, pomini cie zmiennej skutkuje obci»eniem oszacowania β, które zbiega do iloczynu: (prawdziwego) parametru przy pomini tej zmiennej wspóªczynnika kierunkowego regresji pomini tej zmiennej wzgl dem uwzgl dnionych zmiennych W naszym przypadku: plimˆβ KMNK = β + ρ Cov(Wy,X) Var(X) (5) Ekonometria Przestrzenna 10 / 47
SAR (Spatial Lag, SLM) Konsekwencje pomini cia struktury przestrzennej SAR (1) Prawdziwy proces generuj cy dane: y = ρwy + Xβ + ε Szacowany model liniowy z pomini ciem Wy (metoda KMNK): y = Xβ KMNK + ε Zgodnie z reguªami ekonometrii, pomini cie zmiennej skutkuje obci»eniem oszacowania β, które zbiega do iloczynu: (prawdziwego) parametru przy pomini tej zmiennej wspóªczynnika kierunkowego regresji pomini tej zmiennej wzgl dem uwzgl dnionych zmiennych W naszym przypadku: plimˆβ KMNK = β + ρ Cov(Wy,X) Var(X) (5) Ekonometria Przestrzenna 10 / 47
SAR (Spatial Lag, SLM) Konsekwencje pomini cia struktury przestrzennej SAR (1) Prawdziwy proces generuj cy dane: y = ρwy + Xβ + ε Szacowany model liniowy z pomini ciem Wy (metoda KMNK): y = Xβ KMNK + ε Zgodnie z reguªami ekonometrii, pomini cie zmiennej skutkuje obci»eniem oszacowania β, które zbiega do iloczynu: (prawdziwego) parametru przy pomini tej zmiennej wspóªczynnika kierunkowego regresji pomini tej zmiennej wzgl dem uwzgl dnionych zmiennych W naszym przypadku: plimˆβ KMNK = β + ρ Cov(Wy,X) Var(X) (5) Ekonometria Przestrzenna 10 / 47
SAR (Spatial Lag, SLM) Konsekwencje pomini cia struktury przestrzennej SAR (2) Czy Cov (Wy, X) ma szans wynosi 0? Skoro procesem generuj cym dane jest SAR, to... y = (I ρw) 1 Xβ + (I ρw) 1 ε y = Xβ + ρwxβ + ρ 2 W 2 Xβ +... + ε + ρwε + ρ 2 W 2 ε +... Wy = WXβ + ρw 2 Xβ + ρ 2 W 3 Xβ +... + Wε + ρw 2 ε + ρ 2 W 3 ε +... Zatem (pomijaj c skªadniki zwi zane z ε, o których wiadomo,»e nie koreluj z X): plimˆβ KMNK β = ρ Cov(WXβ,X) + ρ Cov(ρW2 Xβ,X) + ρ Cov(ρ2 W 3 Xβ,X) +... = Var(X) Var(X) Var(X) ρ [ ( = Var(X) Cov (WX, X) + ρ Cov W 2 X, X ) + ρ 2 Cov ( W 3 X, X ) +... ] β Je»eli nawet X nie wykazuje przestrzennej autokorelacji i Cov (WX, X) = 0, to dalsze skªadniki nie mog si zerowa. W 2 i dalsze pot gi W nie s ju» bowiem macierzami o zerowej diagonali. Interpretacja: W 2 to macierz poª cze«z s siadami s siadów. S siadem Twojego s siada jeste± m.in. TY! (A sam ze sob zawsze korelujesz.) (5) Ekonometria Przestrzenna 11 / 47
SAR (Spatial Lag, SLM) Konsekwencje pomini cia struktury przestrzennej SAR (2) Czy Cov (Wy, X) ma szans wynosi 0? Skoro procesem generuj cym dane jest SAR, to... y = (I ρw) 1 Xβ + (I ρw) 1 ε y = Xβ + ρwxβ + ρ 2 W 2 Xβ +... + ε + ρwε + ρ 2 W 2 ε +... Wy = WXβ + ρw 2 Xβ + ρ 2 W 3 Xβ +... + Wε + ρw 2 ε + ρ 2 W 3 ε +... Zatem (pomijaj c skªadniki zwi zane z ε, o których wiadomo,»e nie koreluj z X): plimˆβ KMNK β = ρ Cov(WXβ,X) + ρ Cov(ρW2 Xβ,X) + ρ Cov(ρ2 W 3 Xβ,X) +... = Var(X) Var(X) Var(X) ρ [ ( = Var(X) Cov (WX, X) + ρ Cov W 2 X, X ) + ρ 2 Cov ( W 3 X, X ) +... ] β Je»eli nawet X nie wykazuje przestrzennej autokorelacji i Cov (WX, X) = 0, to dalsze skªadniki nie mog si zerowa. W 2 i dalsze pot gi W nie s ju» bowiem macierzami o zerowej diagonali. Interpretacja: W 2 to macierz poª cze«z s siadami s siadów. S siadem Twojego s siada jeste± m.in. TY! (A sam ze sob zawsze korelujesz.) (5) Ekonometria Przestrzenna 11 / 47
SAR (Spatial Lag, SLM) Konsekwencje pomini cia struktury przestrzennej SAR (2) Czy Cov (Wy, X) ma szans wynosi 0? Skoro procesem generuj cym dane jest SAR, to... y = (I ρw) 1 Xβ + (I ρw) 1 ε y = Xβ + ρwxβ + ρ 2 W 2 Xβ +... + ε + ρwε + ρ 2 W 2 ε +... Wy = WXβ + ρw 2 Xβ + ρ 2 W 3 Xβ +... + Wε + ρw 2 ε + ρ 2 W 3 ε +... Zatem (pomijaj c skªadniki zwi zane z ε, o których wiadomo,»e nie koreluj z X): plimˆβ KMNK β = ρ Cov(WXβ,X) + ρ Cov(ρW2 Xβ,X) + ρ Cov(ρ2 W 3 Xβ,X) +... = Var(X) Var(X) Var(X) ρ [ ( = Var(X) Cov (WX, X) + ρ Cov W 2 X, X ) + ρ 2 Cov ( W 3 X, X ) +... ] β Je»eli nawet X nie wykazuje przestrzennej autokorelacji i Cov (WX, X) = 0, to dalsze skªadniki nie mog si zerowa. W 2 i dalsze pot gi W nie s ju» bowiem macierzami o zerowej diagonali. Interpretacja: W 2 to macierz poª cze«z s siadami s siadów. S siadem Twojego s siada jeste± m.in. TY! (A sam ze sob zawsze korelujesz.) (5) Ekonometria Przestrzenna 11 / 47
SAR (Spatial Lag, SLM) Przestrzenna MNK (1) Skoro pomini cie przestrzennego opó¹nienia obci»a estymator KMNK, to nale»y je uwzgl dni. Mo»na to zrobi do± ªatwo: skoro W jest zadane, to mo»na skonstruowa zmienn opó¹nienia przestrzennego Wy i przeprowadzi estymacj modelu SAR y = ρwy + Xβ + ε za pomoc KMNK (ten sposób nazywamy przestrzenn KMNK): y = [ Wy X ] [ ρ β ] + ε Wiemy z wªasno±ci KMNK,»e ([ ]) E = ˆρˆβ [ ] ρ ( [ ] T [ ] ) 1 ( [ ] ) T + Wy X Wy X E Wy X ε β (5) Ekonometria Przestrzenna 12 / 47
SAR (Spatial Lag, SLM) Przestrzenna MNK (1) Skoro pomini cie przestrzennego opó¹nienia obci»a estymator KMNK, to nale»y je uwzgl dni. Mo»na to zrobi do± ªatwo: skoro W jest zadane, to mo»na skonstruowa zmienn opó¹nienia przestrzennego Wy i przeprowadzi estymacj modelu SAR y = ρwy + Xβ + ε za pomoc KMNK (ten sposób nazywamy przestrzenn KMNK): y = [ Wy X ] [ ρ β ] + ε Wiemy z wªasno±ci KMNK,»e ([ ]) E = ˆρˆβ [ ] ρ ( [ ] T [ ] ) 1 ( [ ] ) T + Wy X Wy X E Wy X ε β (5) Ekonometria Przestrzenna 12 / 47
SAR (Spatial Lag, SLM) Przestrzenna MNK (1) Skoro pomini cie przestrzennego opó¹nienia obci»a estymator KMNK, to nale»y je uwzgl dni. Mo»na to zrobi do± ªatwo: skoro W jest zadane, to mo»na skonstruowa zmienn opó¹nienia przestrzennego Wy i przeprowadzi estymacj modelu SAR y = ρwy + Xβ + ε za pomoc KMNK (ten sposób nazywamy przestrzenn KMNK): y = [ Wy X ] [ ρ β ] + ε Wiemy z wªasno±ci KMNK,»e ([ ]) E = ˆρˆβ [ ] ρ ( [ ] T [ ] ) 1 ( [ ] ) T + Wy X Wy X E Wy X ε β (5) Ekonometria Przestrzenna 12 / 47
SAR (Spatial Lag, SLM) Przestrzenna MNK (2) Zaªo»enie modelu regresji ( liniowej mówi o niezale»no±ci reszt od [ ] ) T regresorów, czyli E Wy X ε = 0, czym dowodzimy nieobci»ono±ci estymatora KMNK w takim modelu. Mamy wprawdzie E ( X T ε ) = 0, ale: [ ] { [W E (Wy) T ε = E (I ρw) 1 Xβ + W (I ρw) 1 ε ] } T ε = { [W = E (I ρw) 1 Xβ ] T [ ε + W (I ρw) 1 ε ] } T ε = = E {ε [ T W (I ρw) 1] } T ε 0 Nasz model nie jest jednak modelem regresji liniowej, gdy» obserwacje zale» od siebie nawzajem (y i zale»y od s siada y j i na odwrót). Sytuacja podobna do ukªadów równa«ª cznie wspóªzale»nych. (5) Ekonometria Przestrzenna 13 / 47
SAR (Spatial Lag, SLM) Przestrzenna MNK (2) Zaªo»enie modelu regresji ( liniowej mówi o niezale»no±ci reszt od [ ] ) T regresorów, czyli E Wy X ε = 0, czym dowodzimy nieobci»ono±ci estymatora KMNK w takim modelu. Mamy wprawdzie E ( X T ε ) = 0, ale: [ ] { [W E (Wy) T ε = E (I ρw) 1 Xβ + W (I ρw) 1 ε ] } T ε = { [W = E (I ρw) 1 Xβ ] T [ ε + W (I ρw) 1 ε ] } T ε = = E {ε [ T W (I ρw) 1] } T ε 0 Nasz model nie jest jednak modelem regresji liniowej, gdy» obserwacje zale» od siebie nawzajem (y i zale»y od s siada y j i na odwrót). Sytuacja podobna do ukªadów równa«ª cznie wspóªzale»nych. (5) Ekonometria Przestrzenna 13 / 47
SAR (Spatial Lag, SLM) Przestrzenna MNK (3) Dla uproszczenia rozwa»my model SAR z 1 zmienn obja±niaj c x: = = ([ ]) E = ˆρˆβ [ ] [ ρ 1 + ( β [ ] det Wy x T [ ] ) Wy x }{{} γ>0 zwykle>0 [ ] {}}{ ρ γx T x (Wy) T ε + β γx T (Wy) (Wy) T ε }{{} zwykle<0 x T x x T (Wy) (Wy) T x (Wy) T (Wy) ] (Wy) T ε x T ε }{{} =0 = Przestrzenna MNK dostarcza zatem obci»onych oszacowa«! (ρ zwykle zawy»one, a β zani»one). W przypadkach wielowymiarowych obci»enie koncentruje si na parametrach tych zmiennych X, których ukªad w przestrzeni najbardziej przypomina ukªad y. (5) Ekonometria Przestrzenna 14 / 47
SAR (Spatial Lag, SLM) Przestrzenna MNK (3) Dla uproszczenia rozwa»my model SAR z 1 zmienn obja±niaj c x: = = ([ ]) E = ˆρˆβ [ ] [ ρ 1 + ( β [ ] det Wy x T [ ] ) Wy x }{{} γ>0 zwykle>0 [ ] {}}{ ρ γx T x (Wy) T ε + β γx T (Wy) (Wy) T ε }{{} zwykle<0 x T x x T (Wy) (Wy) T x (Wy) T (Wy) ] (Wy) T ε x T ε }{{} =0 = Przestrzenna MNK dostarcza zatem obci»onych oszacowa«! (ρ zwykle zawy»one, a β zani»one). W przypadkach wielowymiarowych obci»enie koncentruje si na parametrach tych zmiennych X, których ukªad w przestrzeni najbardziej przypomina ukªad y. (5) Ekonometria Przestrzenna 14 / 47
SAR (Spatial Lag, SLM) Przestrzenna 2MNK (1) Obci»enie zwi zane z ª czn wspóªzale»no±ci y = ρwy + Xβ + ε mo»na potraktowa tak samo, jak w przypadku endogenicznych regresorów: zastosowa metod zmiennych instrumentalnych. Ta implementacja jest zgodna, nieobci»ona i nosi nazw przestrzennej 2MNK (S2SLS). Zmienna instrumentalna to taka, która jest zwi zana z problematycznym regresorem (Wy), ale niezwi zana ze skªadnikiem losowym (ε). Przypomnijmy,»e dla modelu SAR: Wy = WXβ + ρw 2 Xβ + ρ 2 W 3 Xβ +... + Wε + ρw 2 ε + ρ 2 W 3 ε +... }{{} idealne instrumenty! Krok 1: Regresja liniowa Wy wzgl dem macierzy zmiennych egzogenicznych oraz pewnej liczby instrumentów: Π = [ X WX W 2 X... ] (KMNK). ) 1 Π T Z niej warto±ci teoretyczne Ŵy = Π (Π T Π } {{ } P Wy (5) Ekonometria Przestrzenna 15 / 47
SAR (Spatial Lag, SLM) Przestrzenna 2MNK (1) Obci»enie zwi zane z ª czn wspóªzale»no±ci y = ρwy + Xβ + ε mo»na potraktowa tak samo, jak w przypadku endogenicznych regresorów: zastosowa metod zmiennych instrumentalnych. Ta implementacja jest zgodna, nieobci»ona i nosi nazw przestrzennej 2MNK (S2SLS). Zmienna instrumentalna to taka, która jest zwi zana z problematycznym regresorem (Wy), ale niezwi zana ze skªadnikiem losowym (ε). Przypomnijmy,»e dla modelu SAR: Wy = WXβ + ρw 2 Xβ + ρ 2 W 3 Xβ +... + Wε + ρw 2 ε + ρ 2 W 3 ε +... }{{} idealne instrumenty! Krok 1: Regresja liniowa Wy wzgl dem macierzy zmiennych egzogenicznych oraz pewnej liczby instrumentów: Π = [ X WX W 2 X... ] (KMNK). ) 1 Π T Z niej warto±ci teoretyczne Ŵy = Π (Π T Π } {{ } P Wy (5) Ekonometria Przestrzenna 15 / 47
SAR (Spatial Lag, SLM) Przestrzenna 2MNK (1) Obci»enie zwi zane z ª czn wspóªzale»no±ci y = ρwy + Xβ + ε mo»na potraktowa tak samo, jak w przypadku endogenicznych regresorów: zastosowa metod zmiennych instrumentalnych. Ta implementacja jest zgodna, nieobci»ona i nosi nazw przestrzennej 2MNK (S2SLS). Zmienna instrumentalna to taka, która jest zwi zana z problematycznym regresorem (Wy), ale niezwi zana ze skªadnikiem losowym (ε). Przypomnijmy,»e dla modelu SAR: Wy = WXβ + ρw 2 Xβ + ρ 2 W 3 Xβ +... + Wε + ρw 2 ε + ρ 2 W 3 ε +... }{{} idealne instrumenty! Krok 1: Regresja liniowa Wy wzgl dem macierzy zmiennych egzogenicznych oraz pewnej liczby instrumentów: Π = [ X WX W 2 X... ] (KMNK). ) 1 Π T Z niej warto±ci teoretyczne Ŵy = Π (Π T Π } {{ } P Wy (5) Ekonometria Przestrzenna 15 / 47
SAR (Spatial Lag, SLM) Przestrzenna 2MNK (2) Krok 2: Oszacowanie KMNK modelu SAR po zast pieniu Wy przez Ŵy: [ ] ( [ ] T [ ] ) 1 [ ] T = Ŵy X Ŵy X Ŵy X y ˆρˆβ Przestrzenna 2MNK (S2SLS) model <- stsls(y ~ x, listw = W) (5) Ekonometria Przestrzenna 16 / 47
SAR (Spatial Lag, SLM) Przestrzenna MNW (1) Wariant 2: metoda najwi kszej wiarygodno±ci M M {}}{{}}{ y = (I ρw) 1 Xβ + (I ρw) 1 u, u N(0, σ 2 ) L (u) = ( ) N ( ) 1 2 σ 2 exp ut u 2π 2σ 2 Z twierdzenia o zamianie zmiennych (przypadek wielowymiarowy): L (y) = det L (y) = M 1 ({}} ){ u L [u (y)] y det ( M 1) ( ( ) ) N 1 2 σ 2 exp (y MXβ)T (M 1 ) T (M 1 )(y MXβ) 2π 2σ 2 ˆβ = arg maxl (y) β (5) Ekonometria Przestrzenna 17 / 47
SAR (Spatial Lag, SLM) Przestrzenna MNW (2) Bª dy standardowe oceniane na podstawie Hesjanu w maksimum funkcji wiarygodno±ci (typowo przy ML). Je»eli M = I funkcja wiarygodno±ci identyczna jak w modelu liniowym. ML dla modelu SAR w R model <- lagsarlm(y ~ x, listw = W) Ten sam model oszacuje si równie», je»eli do formuªy w funkcji spautolm (pure SAR) dopiszemy regresory. (5) Ekonometria Przestrzenna 18 / 47
SAR (Spatial Lag, SLM) Testy: model liniowy vs SAR (1) Ilustracja dotyczy przypadku testowania 1 parametru (θ skalarem). (5) Ekonometria Przestrzenna 19 / 47
SAR (Spatial Lag, SLM) Testy: model liniowy vs SAR (2) LM ρ = N tr[(w T +W)W]+ 1 (WXˆβ) T ˆε T [I X(X T X)X T ](WXˆβ) ˆε χ 2 (1) ( ) ˆε T 2 Wy ˆε T ˆε H 0 : model liniowy (ρ = 0) H 1 : SAR (5) Ekonometria Przestrzenna 20 / 47
Plan prezentacji 1 Model liniowy i SAR (Spatial Lag) 2 Model SEM (Spatial Error) 3 Model SLX 4 Š czenie danych punktowych GIS ze statystykami regionalnymi (5) Ekonometria Przestrzenna 21 / 47
Model SEM z globaln zale»no±ci skªadników losowych Schemat oddziaªywa«w modelu SEM (5) Ekonometria Przestrzenna 22 / 47
Model SEM z globaln zale»no±ci skªadników losowych Model SEM relacje z innymi modelami (5) Ekonometria Przestrzenna 23 / 47
Model SEM z globaln zale»no±ci skªadników losowych Model SEM relacje z innymi modelami (5) Ekonometria Przestrzenna 24 / 47
Model SEM z globaln zale»no±ci skªadników losowych Model SEM specykacja Autoregresja przestrzenna nie dotyczy zmiennej obja±niaj cej, a skªadnika losowego ró»nica mniej wi cej ta sama co mi dzy modelami AR i MA. y = Xβ + ε ε = λwε + u Gdyby w tym modelu nie byªo zmiennych obja±niaj cych X, byªby on to»samy z modelem czystej autoregresji i SLM. Zakªadamy tu przestrzenne skupienia czynników nieobserwowalnych / wstrz sów (spatial clustering in unobservables). (5) Ekonometria Przestrzenna 25 / 47
Model SEM z globaln zale»no±ci skªadników losowych Model SEM specykacja Autoregresja przestrzenna nie dotyczy zmiennej obja±niaj cej, a skªadnika losowego ró»nica mniej wi cej ta sama co mi dzy modelami AR i MA. y = Xβ + ε ε = λwε + u Gdyby w tym modelu nie byªo zmiennych obja±niaj cych X, byªby on to»samy z modelem czystej autoregresji i SLM. Zakªadamy tu przestrzenne skupienia czynników nieobserwowalnych / wstrz sów (spatial clustering in unobservables). (5) Ekonometria Przestrzenna 25 / 47
Model SEM z globaln zale»no±ci skªadników losowych Model SEM specykacja Autoregresja przestrzenna nie dotyczy zmiennej obja±niaj cej, a skªadnika losowego ró»nica mniej wi cej ta sama co mi dzy modelami AR i MA. y = Xβ + ε ε = λwε + u Gdyby w tym modelu nie byªo zmiennych obja±niaj cych X, byªby on to»samy z modelem czystej autoregresji i SLM. Zakªadamy tu przestrzenne skupienia czynników nieobserwowalnych / wstrz sów (spatial clustering in unobservables). (5) Ekonometria Przestrzenna 25 / 47
Model SEM z globaln zale»no±ci skªadników losowych Model SEM estymacja (1) Estymator KMNK jest nieefektywny (a bª dy standardowe obci»one), gdy»: y = Xβ + ε ε = λwε + u, czyli ε = (I λw) 1 u Var (ε) = E ( εε T ) = (I λw) 1 E ( uu T ) [ (I λw) 1] T = σ 2 (I λw) 1 [ (I λw) 1] T σ 2 I Wariant 1: jak zwykle przy niesferycznym skªadniku losowym, rozwi zaniem jest estymator UMNK: ˆβ = ( X T Ω 1 X ) 1 X T Ω 1 y przy zadanym Ω = (I λw) 1 [ (I λw) 1] T W znane, λ szacowane na podstawie reszt ze zgodnej estymacji KMNK (szczegóªy procedury: Kelejian i Prucha, 1998; Arbia, ) 2014). Var (ˆβ = ˆσ ( 2 X T Ω 1 X ) 1 (5) Ekonometria Przestrzenna 26 / 47
Model SEM z globaln zale»no±ci skªadników losowych Model SEM estymacja (2) Przestrzenna UMNK w R model4 <- GMerrorsar(y ~ x, listw = W) (5) Ekonometria Przestrzenna 27 / 47
Model SEM z globaln zale»no±ci skªadników losowych Model SEM estymacja (3) Wariant 2: metoda najwi kszej wiarygodno±ci M {}}{ y = Xβ + (I λw) 1 u, u N(0, σ 2 ) L (u) = ( ) N ( ) 1 2 σ 2 exp ut u 2π 2σ 2 Z twierdzenia o zamianie zmiennych (przypadek wielowymiarowy): L (y) = det L (y) = M 1 ({}} ){ u L [u (y)] y det ( M 1) ( ( ) ) N 1 2 σ 2 exp (y Xβ)T (M 1 ) T (M 1 )(y Xβ) 2π 2σ 2 ˆβ = arg maxl (y) β (5) Ekonometria Przestrzenna 28 / 47
Model SEM z globaln zale»no±ci skªadników losowych Model SEM estymacja (4) Bª dy standardowe oceniane na podstawie Hesjanu w maksimum funkcji wiarygodno±ci (typowo przy ML). Je»eli M = I funkcja wiarygodno±ci identyczna jak w modelu liniowym. ML dla modelu SEM w R model <- errorsarlm(y ~ x, listw = W) Ten sam model oszacuje si równie», je»eli do formuªy w funkcji spautolm (pure SAR) dopiszemy regresory. (5) Ekonometria Przestrzenna 29 / 47
Model SEM z globaln zale»no±ci skªadników losowych Zbie»no± SAR i SEM (do pure SAR) przy braku regresorów X SAR y = ρwy + Xβ + ε y = ρwy + ε y ρwy = ε (I ρw) y = ε y = (I ρw) 1 ε SEM y = Xβ + (I λw) 1 u β = 0 y = (I λw) 1 u (5) Ekonometria Przestrzenna 30 / 47
Model SEM z globaln zale»no±ci skªadników losowych Testy LM: model liniowy vs SEM LM λ = N 2 tr[(w T +W)W] H 0 : model liniowy (λ = 0) H 1 : SMA ( ) 2 ût Wû û T û χ 2 (1) (5) Ekonometria Przestrzenna 31 / 47
Model SEM z globaln zale»no±ci skªadników losowych Odporne testy LM (1) W testach LM dla specykacji SAR i SEM mamy odpowiednio: 1 H 0 : model liniowy (ρ = 0), H 1 : SAR 2 H 0 : model liniowy (λ = 0), H 1 : SMA Problem: ka»da z par hipotez abstrajuje od mo»liwo±ci,»e prawdziwa mo»e by hipoteza alternatywna z drugiego testu. Konsekwencja: test 1 odrzuca H 0 nawet przy nieprawdziwej H 1 (ale prawdziwej H 1 z testu 2). I vice versa. RLMlag i RLMerr Anselin i in. (1996) proponuj odporne statystyki testowe LMρ i LMλ, których konstrukcja wyklucza mo»liwo± obj cia hipotez alternatywn niewªa±ciwego procesu (zob. te» Arbia, 2014). LMρ = LM ρλ LM λ LMλ = LM ρλ LM ρ (5) Ekonometria Przestrzenna 32 / 47
Model SEM z lokaln zale»no±ci skªadników losowych Globalny vs lokalny model SEM (1) Omówiony model SEM postulowaª globaln zale»no± mi dzy czynnikami nieobserwowalnymi: Wersja lokalna modelu SEM: y = Xβ + ε ε = λwε + u y = Xβ + ε ε = λwu + u Na czym polega ró»nica? Rozwa»my macierze mno»ników przestrzennych y wzgl dem u w obu przypadkach: lokalny SEM: y = Xβ + ε, ε = (I + λw)u M = y u = (I + λw) globalny SEM: y = Xβ + ε, ε = (I λw) 1 u M = y u = (I λw) 1 Zauwa»my,»e algebraicznie: mnożnik SEM glob {}}{ (I λw) 1 = mnożnik SEM lok {}}{ I + λw + λ 2 W 2 + λ 3 W 3 +... (5) Ekonometria Przestrzenna 33 / 47
Model SEM z lokaln zale»no±ci skªadników losowych Globalny vs lokalny model SEM (2) US CA 0 0.5 MX 0.5 Przykªad: Kanada, USA, Meksyk; W = 1 0 0 ; 1 0 0 λ = 0.4; wstrz s u = 1 wyst puje w Meksyku. Mno»niki przestrzenne dla lokalnego SEM: I + 0.4 1 0.2 0.2 0.4 1 0 0.4 0 1 0 0.5 0.5 1 0 0 1 0 0 0 0 1 = 0 0 1 0.2 0 1 = y MX = 1, y US = 0.2, brak efektu dla Kanady. Zaburzenie u wpªyn ªo na y w jednostkach bezpo±rednio poª czonych. (5) Ekonometria Przestrzenna 34 / 47
Model SEM z lokaln zale»no±ci skªadników losowych Globalny vs lokalny model SEM (3) Mno»niki przestrzenne dla globalnego SEM: 1 0 0.5 0.5 0 I 0.4 1 0 0 0 = 1 0 0 1 1 0.2 0.2 0.4 1 0 0.4 0 1 1.19 0.24 0.24 0.48 1.10 0.10 0.48 0.10 1.10 1 0 0 1 0.24 0.10 1.10 y MX > 1, y US > 0.2, jest (sªaby, ale dodatni) efekt dla Kanady Zaburzenie przelewa si na jednostki poª czone, a z nich na kolejne jednostki poª czone z nimi (w tym na region b d cy ¹ródªem zaburzenia). (5) Ekonometria Przestrzenna 35 / 47
Plan prezentacji 1 Model liniowy i SAR (Spatial Lag) 2 Model SEM (Spatial Error) 3 Model SLX 4 Š czenie danych punktowych GIS ze statystykami regionalnymi (5) Ekonometria Przestrzenna 36 / 47
Model SLX Schemat oddziaªywa«w modelu SLX (5) Ekonometria Przestrzenna 37 / 47
Model SLX Model SLX relacje z innymi modelami (5) Ekonometria Przestrzenna 38 / 47
Model SLX Model SLX relacje z innymi modelami (5) Ekonometria Przestrzenna 39 / 47
Model SLX Model SLX specykacja Bezpo±redni wpªyw przyczyn w s siedztwie na skutek w obserwowanym regionie przestrzenne efekty zara»ania (ang. spatial spillovers): y = Xβ + WXθ + ε Mo»liwa zgodna, nieobci»ona i efektywna estymacja KMNK. (5) Ekonometria Przestrzenna 40 / 47
Model SLX Model SLX specykacja Bezpo±redni wpªyw przyczyn w s siedztwie na skutek w obserwowanym regionie przestrzenne efekty zara»ania (ang. spatial spillovers): y = Xβ + WXθ + ε Mo»liwa zgodna, nieobci»ona i efektywna estymacja KMNK. (5) Ekonometria Przestrzenna 40 / 47
Plan prezentacji 1 Model liniowy i SAR (Spatial Lag) 2 Model SEM (Spatial Error) 3 Model SLX 4 Š czenie danych punktowych GIS ze statystykami regionalnymi (5) Ekonometria Przestrzenna 41 / 47
Przykªad: lokalizacje sklepów Biedronka Dane GIS nt. sieci sklepów Biedronka ródªo: poiplaza.com POI: points of interest (bazy danych z ciekawymi punktami, zwykle udost pniane z my±l o u»ytkownikach samochodowych urz dze«nawigacyjnych z GPS) Dane punktowe nt. lokalizacji poszczególnych sklepów w Polsce. Dªugo± i szeroko± geograczna. Pytanie: czy wªa±ciciel Biedronki kieruje si innymi kryteriami ni» wielko± rynku, lokalizuj c swoje sklepy? Innymi sªowy, czy znajdziemy zale»no± mi dzy liczb sklepów Biedronka na mieszka«ca a statystykami socjoekonomicznymi z BDL np. na poziomie powiatu? (5) Ekonometria Przestrzenna 42 / 47
Przykªad: lokalizacje sklepów Biedronka Dane GIS nt. sieci sklepów Biedronka ródªo: poiplaza.com POI: points of interest (bazy danych z ciekawymi punktami, zwykle udost pniane z my±l o u»ytkownikach samochodowych urz dze«nawigacyjnych z GPS) Dane punktowe nt. lokalizacji poszczególnych sklepów w Polsce. Dªugo± i szeroko± geograczna. Pytanie: czy wªa±ciciel Biedronki kieruje si innymi kryteriami ni» wielko± rynku, lokalizuj c swoje sklepy? Innymi sªowy, czy znajdziemy zale»no± mi dzy liczb sklepów Biedronka na mieszka«ca a statystykami socjoekonomicznymi z BDL np. na poziomie powiatu? (5) Ekonometria Przestrzenna 42 / 47
Przykªad: lokalizacje sklepów Biedronka Dane GIS nt. sieci sklepów Biedronka ródªo: poiplaza.com POI: points of interest (bazy danych z ciekawymi punktami, zwykle udost pniane z my±l o u»ytkownikach samochodowych urz dze«nawigacyjnych z GPS) Dane punktowe nt. lokalizacji poszczególnych sklepów w Polsce. Dªugo± i szeroko± geograczna. Pytanie: czy wªa±ciciel Biedronki kieruje si innymi kryteriami ni» wielko± rynku, lokalizuj c swoje sklepy? Innymi sªowy, czy znajdziemy zale»no± mi dzy liczb sklepów Biedronka na mieszka«ca a statystykami socjoekonomicznymi z BDL np. na poziomie powiatu? (5) Ekonometria Przestrzenna 42 / 47
Przykªad: lokalizacje sklepów Biedronka Agregacja punktów po zadanej mapie (5) Ekonometria Przestrzenna 43 / 47
Przykªad: lokalizacje sklepów Biedronka Agregacja punktów po zadanej mapie Funkcja ClassIntervals uwaga na parametr style. Dotychczas u»ywali±my quantile podziaª na 9 równych klas do prezentacji na mapie. W przypadku zmiennej licznikowej to nie ma sensu (du»o remisów wokóª granic klas, kolory b d alokowane przypadkowo). (5) Ekonometria Przestrzenna 44 / 47
Przykªad: lokalizacje sklepów Biedronka Oszacowania 3 modeli Szacujemy modele regresji liczby Biedronek na 10 tys. mieszka«ców wzgl dem danych z rynku pracy (bezrobocia, wynagrodzenia): liniowy SLM SEM SLX Porównujemy je pod k tem istotno±ci zmiennych, kryterium AIC, logarytmu warto±ci f. wiarygodno±ci w maksimum oraz kryterium usuni cia autokorelacji przestrzennej. Który model jest najlepszy? (5) Ekonometria Przestrzenna 45 / 47
Zadanie domowe wiczenie Wyprowad¹ funkcj wiarygodno±ci dla modelu SEM z zaburzeniami lokalnymi. Stwórz w R kod sªu» cy do oszacowania takiego modelu. (5) Ekonometria Przestrzenna 46 / 47
Zadanie domowe Zadanie domowe 5 Skonstruuj zbiór potencjalnych zmiennych obja±niaj cych (X) i doª cz go do danych przestrzennych u»ytych w ramach zadania domowego 1 (y). Przy pomocy macierzy wag przestrzennych W zbudowanej w ramach zadania domowego 2 oszacuj model czystej autoregresji dla zmiennej z zadania 1. Oce«, czy wynik jest spójny z przeprowadzonymi w ramach zadania 3 testami. Oszacuj modele SAR, SLX, SEM dla rozwa»anych X, y i W. Zilustruj na mapie reszty z tych modeli oraz zbadaj je pod k tem obecno±ci przestrzennej autokorelacji. (5) Ekonometria Przestrzenna 47 / 47