Ekonometria. Modelowanie zmiennej jakościowej. Jakub Mućk. Katedra Ekonomii Ilościowej

Podobne dokumenty
Model 1: Estymacja KMNK z wykorzystaniem 4877 obserwacji Zmienna zależna: y

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

gdzie. Dla funkcja ma własności:

Stanisław Cichocki. Natalia Nehrebecka

Statystyka I. Regresja dla zmiennej jakościowej - wykład dodatkowy (nieobowiązkowy)

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

(LMP-Liniowy model prawdopodobieństwa)

Stanisław Cichocki. Natalia Neherebecka. Zajęcia 15-17

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

Stanisław Cichocki. Natalia Nehrebecka

Ekonometria. wiczenia 8 Modele zmiennej jako±ciowej. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej

Ekonometria. Model nieliniowe i funkcja produkcji. Jakub Mućk. Katedra Ekonomii Ilościowej

Ekonometria. Model nieliniowe i funkcja produkcji. Jakub Mućk. Katedra Ekonomii Ilościowej. Modele nieliniowe Funkcja produkcji

Mikroekonometria 12. Mikołaj Czajkowski Wiktor Budziński

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota

Stanisław Cichocki. Natalia Nehrebecka

Ćwiczenia IV

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Stanisław Cichocki. Natalia Nehrebecka

Ekonometria. Zajęcia

Uogolnione modele liniowe

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Spis treści 3 SPIS TREŚCI

3. Modele tendencji czasowej w prognozowaniu

Ekonometria. Ćwiczenia nr 3. Jakub Mućk. Katedra Ekonomii Ilościowej

Stanisław Cichocki. Natalia Nehrebecka

Metoda najmniejszych kwadratów

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

5. Model sezonowości i autoregresji zmiennej prognozowanej

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

Statystyka i Analiza Danych

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2017/2018

Własności statystyczne regresji liniowej. Wykład 4

Metoda największej wiarogodności

4. Średnia i autoregresja zmiennej prognozowanej

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

STUDIA I STOPNIA EGZAMIN Z EKONOMETRII

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska

JEDNORÓWNANIOWY LINIOWY MODEL EKONOMETRYCZNY

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2014/2015

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Zawansowane modele wyborów dyskretnych

Zależność. przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna),

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Ekonometria. Weryfikacja liniowego modelu jednorównaniowego. Jakub Mućk. Katedra Ekonomii Ilościowej

Metody Ekonometryczne

Wykªad 6: Model logitowy

e) Oszacuj parametry modelu za pomocą MNK. Zapisz postać modelu po oszacowaniu wraz z błędami szacunku.

t y x y'y x'x y'x x-x śr (x-x śr)^2

Mikroekonometria 9. Mikołaj Czajkowski Wiktor Budziński

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Analiza współzależności zjawisk

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

Metoda najmniejszych kwadratów

Statystyka matematyczna i ekonometria

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Mikroekonometria 9. Mikołaj Czajkowski Wiktor Budziński

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych

Ekonometria. Własności składnika losowego. Jakub Mućk. Katedra Ekonomii Ilościowej

EKONOMETRIA. Prof. dr hab. Eugeniusz Gatnar.

Niestacjonarne zmienne czasowe własności i testowanie

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Proces modelowania zjawiska handlu zagranicznego towarami

Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.

FORECASTING THE DISTRIBUTION OF AMOUNT OF UNEMPLOYED BY THE REGIONS

Metody Ilościowe w Socjologii

Stosowana Analiza Regresji

Value at Risk (VaR) Jerzy Mycielski WNE. Jerzy Mycielski (Institute) Value at Risk (VaR) / 16

Mikroekonometria 3. Mikołaj Czajkowski Wiktor Budziński

przedmiotu Nazwa Pierwsza studia drugiego stopnia

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Zastosowanie modelu regresji logistycznej w ocenie ryzyka ubezpieczeniowego. Łukasz Kończyk WMS AGH

1.9 Czasowy wymiar danych

Przykład 2. Stopa bezrobocia

WYKORZYSTYWANE W ANALIZIE WYNIKÓW METOD WYCENY OBSZARÓW CHRONIONYCH. Dr Dariusz Kayzer

STATYSTYKA

Modele zapisane w przestrzeni stanów

Mikroekonometria 13. Mikołaj Czajkowski Wiktor Budziński

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

MODELE LINIOWE. Dr Wioleta Drobik

Statystyka matematyczna. Wykład VI. Zesty zgodności

EKONOMETRIA STOSOWANA PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Testowanie hipotez statystycznych.

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Uogólniony model liniowy

Testowanie hipotez statystycznych. Wprowadzenie

Metody Ekonometryczne

Na A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)

Transkrypt:

Ekonometria Modelowanie zmiennej jakościowej Jakub Mućk Katedra Ekonomii Ilościowej Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 1 / 25

Zmienna jakościowa Zmienna ilościowa może zostać zmierzona w skali. Zmienna jakościowa to zmienna, która jest niemierzalna ilościowo i której pomiar polega na przypisaniu do grupy z daną cechą. Zmienne jakościowe: uporządkowane (np. poziom wykształcenia), nominalne (np. ukończenie studiów wyższych). Zmienna binarna (zero-jedynkowa, indykatorowa): przyjmuje wartość 1 jeżeli jednostka spełnia warunek/posiada daną cechę oraz 0 w przeciwnym przypadku (w.p.p.). Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 2 / 25

Zmienna jakościowa Zmienna ilościowa może zostać zmierzona w skali. Zmienna jakościowa to zmienna, która jest niemierzalna ilościowo i której pomiar polega na przypisaniu do grupy z daną cechą. Zmienne jakościowe: uporządkowane (np. poziom wykształcenia), nominalne (np. ukończenie studiów wyższych). Zmienna binarna (zero-jedynkowa, indykatorowa): przyjmuje wartość 1 jeżeli jednostka spełnia warunek/posiada daną cechę oraz 0 w przeciwnym przypadku (w.p.p.). Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 2 / 25

Zmienna jakościowa Zmienna ilościowa może zostać zmierzona w skali. Zmienna jakościowa to zmienna, która jest niemierzalna ilościowo i której pomiar polega na przypisaniu do grupy z daną cechą. Zmienne jakościowe: uporządkowane (np. poziom wykształcenia), nominalne (np. ukończenie studiów wyższych). Zmienna binarna (zero-jedynkowa, indykatorowa): przyjmuje wartość 1 jeżeli jednostka spełnia warunek/posiada daną cechę oraz 0 w przeciwnym przypadku (w.p.p.). Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 2 / 25

Zmienna jakościowa Zmienna ilościowa może zostać zmierzona w skali. Zmienna jakościowa to zmienna, która jest niemierzalna ilościowo i której pomiar polega na przypisaniu do grupy z daną cechą. Zmienne jakościowe: uporządkowane (np. poziom wykształcenia), nominalne (np. ukończenie studiów wyższych). Zmienna binarna (zero-jedynkowa, indykatorowa): przyjmuje wartość 1 jeżeli jednostka spełnia warunek/posiada daną cechę oraz 0 w przeciwnym przypadku (w.p.p.). Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 2 / 25

Zmienna jakościowa jako zmienna objaśniająca (przykład z PoE). PRICE = f (SQFT, D, ε) (1) gdzie PRICE to cena domu, SQFT to powierzchnia domu a zmienna D: { 1 jeżeli dom leży w pożądanej okolicy, D = 0 jeżeli dom leży w niepożądanej okolicy. Grupą referencyjna odnosi się do przypadku D = 0. (2) Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 3 / 25

Zmienna jakościowa jako zmienna objaśniająca (przykład z PoE). PRICE = f (SQFT, D, ε) (1) gdzie PRICE to cena domu, SQFT to powierzchnia domu a zmienna D: { 1 jeżeli dom leży w pożądanej okolicy, D = 0 jeżeli dom leży w niepożądanej okolicy. Grupą referencyjna odnosi się do przypadku D = 0. Przypadek # 1: PRICE (2) wtedy: PRICE = β 0 + β 1SQFT + β 2D + ε E (PRICE) = { β0 + β 1SQFT + β 2 dla D = 1, β 0 + β 1SQFT dla D = 0. β 0 + β 2 β 2 β 0 SQFT Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 3 / 25

Zmienna jakościowa jako zmienna objaśniająca (przykład z PoE). PRICE = f (SQFT, D, ε) (1) gdzie PRICE to cena domu, SQFT to powierzchnia domu a zmienna D: { 1 jeżeli dom leży w pożądanej okolicy, D = 0 jeżeli dom leży w niepożądanej okolicy. Grupą referencyjna odnosi się do przypadku D = 0. (2) Przypadek # 2: PRICE = β 0 + β 1SQFT + β 2DSQFT + ε wtedy: E (PRICE) = { β0 + (β 1 + β 2)SQFT dla D = 1, β 0 + β 1SQFT dla D = 0. PRICE β 2 β 0 SQFT Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 3 / 25

Zmienna jakościowa jako zmienna objaśniająca (przykład z PoE). PRICE = f (SQFT, D, ε) (1) gdzie PRICE to cena domu, SQFT to powierzchnia domu a zmienna D: { 1 jeżeli dom leży w pożądanej okolicy, D = 0 jeżeli dom leży w niepożądanej okolicy. Grupą referencyjna odnosi się do przypadku D = 0. Przypadek # 3: PRICE (2) PRICE = β 0 + β 1SQFT + β 2 + β 3DSQFT + ε wtedy: E (PRICE) = { β0 + β = 2 + (β 1 + β 3)SQFT dla D = 1, β 0 + β 1SQFT dla D = 0. β 0 + β 2 β 2 β 3 β 0 SQFT Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 3 / 25

Zmienna indykatorowe a szeregi czasowe Częstotliwość roczna: wykorzystanie zmiennych indykatorowych w celu identyfikacji/ kontrolowania okresów o szczególnym charakterze. Przykład: gdzie: y t = β 0 + β 1D Crisis t + k β ix i,t i=2 }{{} pozostałe zmienne egzogeniczne { D Crisis 1 dla okresów kryzysu, t = 0 w.p.p. +ε t (3) Częstotliwość miesięczna/kwartalna: podobnie jak w przypadku częstotliwości rocznej oraz kontrola sezonowości: Przykład: gdzie: y t = β 0 + β 1D Q1 t + β 2D Q2 t + β 3D Q3 t + k i=4 { D Q1 1 dla obserwacji w I kw., t = 0 w.p.p. β ix i,t + ε t (4) Interpretacja zmienncyh indykatorowych powinna się odwoływać do okresu referencyjnego. Uwaga o współliniowości. Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 4 / 25

Zmienna indykatorowe a szeregi czasowe Częstotliwość roczna: wykorzystanie zmiennych indykatorowych w celu identyfikacji/ kontrolowania okresów o szczególnym charakterze. Przykład: gdzie: y t = β 0 + β 1D Crisis t + k β ix i,t i=2 }{{} pozostałe zmienne egzogeniczne { D Crisis 1 dla okresów kryzysu, t = 0 w.p.p. +ε t (3) Częstotliwość miesięczna/kwartalna: podobnie jak w przypadku częstotliwości rocznej oraz kontrola sezonowości: Przykład: gdzie: y t = β 0 + β 1D Q1 t + β 2D Q2 t + β 3D Q3 t + k i=4 { D Q1 1 dla obserwacji w I kw., t = 0 w.p.p. β ix i,t + ε t (4) Interpretacja zmienncyh indykatorowych powinna się odwoływać do okresu referencyjnego. Uwaga o współliniowości. Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 4 / 25

Zmienna indykatorowe a szeregi czasowe Częstotliwość roczna: wykorzystanie zmiennych indykatorowych w celu identyfikacji/ kontrolowania okresów o szczególnym charakterze. Przykład: gdzie: y t = β 0 + β 1D Crisis t + k β ix i,t i=2 }{{} pozostałe zmienne egzogeniczne { D Crisis 1 dla okresów kryzysu, t = 0 w.p.p. +ε t (3) Częstotliwość miesięczna/kwartalna: podobnie jak w przypadku częstotliwości rocznej oraz kontrola sezonowości: Przykład: gdzie: y t = β 0 + β 1D Q1 t + β 2D Q2 t + β 3D Q3 t + k i=4 { D Q1 1 dla obserwacji w I kw., t = 0 w.p.p. β ix i,t + ε t (4) Interpretacja zmienncyh indykatorowych powinna się odwoływać do okresu referencyjnego. Uwaga o współliniowości. Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 4 / 25

Zmienna indykatorowe a szeregi czasowe Częstotliwość roczna: wykorzystanie zmiennych indykatorowych w celu identyfikacji/ kontrolowania okresów o szczególnym charakterze. Przykład: gdzie: y t = β 0 + β 1D Crisis t + k β ix i,t i=2 }{{} pozostałe zmienne egzogeniczne { D Crisis 1 dla okresów kryzysu, t = 0 w.p.p. +ε t (3) Częstotliwość miesięczna/kwartalna: podobnie jak w przypadku częstotliwości rocznej oraz kontrola sezonowości: Przykład: gdzie: y t = β 0 + β 1D Q1 t + β 2D Q2 t + β 3D Q3 t + k i=4 { D Q1 1 dla obserwacji w I kw., t = 0 w.p.p. β ix i,t + ε t (4) Interpretacja zmienncyh indykatorowych powinna się odwoływać do okresu referencyjnego. Uwaga o współliniowości. Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 4 / 25

Zmienna binarna jako zmienna objaśniana W regresji liniowej zainteresowanie badawcze skupia się na rozkładzie warunkowym średniej wartości zmiennej objaśnianej względem zmiennych objaśniających. Specyfika zmiennej binarnej uniemożliwia powyższe podejście. W modelach zmiennej binarnej, zainteresowanie koncentruje się na prawdopodobieństwie wystąpienia zdarzenia. Standardowe modele pozwalające wytłumaczyć prawdopodobieństwo:... Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 5 / 25

Zmienna binarna jako zmienna objaśniana W regresji liniowej zainteresowanie badawcze skupia się na rozkładzie warunkowym średniej wartości zmiennej objaśnianej względem zmiennych objaśniających. Specyfika zmiennej binarnej uniemożliwia powyższe podejście. W modelach zmiennej binarnej, zainteresowanie koncentruje się na prawdopodobieństwie wystąpienia zdarzenia. Standardowe modele pozwalające wytłumaczyć prawdopodobieństwo:... Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 5 / 25

Zmienna binarna jako zmienna objaśniana W regresji liniowej zainteresowanie badawcze skupia się na rozkładzie warunkowym średniej wartości zmiennej objaśnianej względem zmiennych objaśniających. Specyfika zmiennej binarnej uniemożliwia powyższe podejście. W modelach zmiennej binarnej, zainteresowanie koncentruje się na prawdopodobieństwie wystąpienia zdarzenia. Standardowe modele pozwalające wytłumaczyć prawdopodobieństwo:... Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 5 / 25

Zmienna objaśnina y jako suma wartości oczekiwanej oraz składnika losowego: y = E (y) + ε = p + ε (5) Prawdopodobieństwo zdarzenia y = 1: E (y) = p = β 0 + β 1x 1 + β 2x 2 +... + β k x k (6) : y = β 0 + β 1x 1 + β 2x 2 +... + β k x k + ε (7) Parametry β 0, β 1,..., β k mogą zostać oszacowane MNK (lub UMNK). Interpretacja oszacowań parametrów strukturalnych odwołuje się do prawdopodobieństwa. Przykład: wzrost x 1 o jednostkę zwiększa prawdopodobieństwa wystąpienia zdarzenia skfantyfikowanego jako y o ceteris paribus β 1. Punkty procentowe a procenty. Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 6 / 25

Wartości teoretyczne, tj. prognozy in-sample, mogą być poza przedziałem (0, 1). Ilustracja Brak interpretacji miar dopasowań modelu do danych, np. współczynnika R 2. Problem heterogeniczności składnika losowego. Brak normalności składnika losowego. Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 7 / 25

Przykład empiryczny: Cola czy Pepsi? Specyfikacja modelu: coke = β 0 + β 1pratio + β 2disp_coke + β 3disp_pepsi + ε. (8) Zmienna objaśniana: coke = { 1 jeżeli klient wybrał Colę, 0 jeżeli klient wybrał Pepsi. (9) Zmienne objaśniające: pratio - cena relatywna Coli względem Pepsi, disp_coke: { 1 jeżeli Cola jest reklamowana w czasie zakupu, disp_coke = 0 w przeciwnym przypadku. disp_pepsi: disp_pepsi = { 1 jeżeli Pepsi jest reklamowana w czasie zakupu, 0 w przeciwnym przypadku. (10) (11) Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 8 / 25

Przykład empiryczny: Cola czy Pepsi? Specyfikacja modelu: coke = β 0 + β 1pratio + β 2disp_coke + β 3disp_pepsi + ε. (8) Zmienna objaśniana: coke = { 1 jeżeli klient wybrał Colę, 0 jeżeli klient wybrał Pepsi. (9) Zmienne objaśniające: pratio - cena relatywna Coli względem Pepsi, disp_coke: { 1 jeżeli Cola jest reklamowana w czasie zakupu, disp_coke = 0 w przeciwnym przypadku. disp_pepsi: disp_pepsi = { 1 jeżeli Pepsi jest reklamowana w czasie zakupu, 0 w przeciwnym przypadku. (10) (11) Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 8 / 25

Przykład empiryczny: Cola czy Pepsi? Specyfikacja modelu: coke = β 0 + β 1pratio + β 2disp_coke + β 3disp_pepsi + ε. (8) Zmienna objaśniana: coke = { 1 jeżeli klient wybrał Colę, 0 jeżeli klient wybrał Pepsi. (9) Zmienne objaśniające: pratio - cena relatywna Coli względem Pepsi, disp_coke: { 1 jeżeli Cola jest reklamowana w czasie zakupu, disp_coke = 0 w przeciwnym przypadku. disp_pepsi: disp_pepsi = { 1 jeżeli Pepsi jest reklamowana w czasie zakupu, 0 w przeciwnym przypadku. (10) (11) Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 8 / 25

Przykład empiryczny Zmienna jakościowa Wyniki oszacowań parametrów liniowego modelu prawdopodobieństwa. Zmienna objaśniana: coke ˆβ i se ( ˆβi ) statystyka t Pr( β i 0) pratio 0.401 0.061 6.53 0.000 disp_pepsi 0.166 0.036 4.65 0.000 disp_coke 0.077 0.034 2.24 0.025 const 0.890 0.065 13.59 0.000 Dodatkowe informacje: Średnia artmetyczna zmiennej objaśnianej: 0.447 Statystyka F (3, 1136): 51.67 [0.000] Współczynnik determinacji R 2 : 0.12 Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 9 / 25

Przykład empiryczny Zmienna jakościowa Wyniki oszacowań parametrów liniowego modelu prawdopodobieństwa. Zmienna objaśniana: coke ˆβ i se ( ˆβi ) statystyka t Pr( β i 0) pratio 0.401 0.061 6.53 0.000 disp_pepsi 0.166 0.036 4.65 0.000 disp_coke 0.077 0.034 2.24 0.025 const 0.890 0.065 13.59 0.000 Dodatkowe informacje: Średnia artmetyczna zmiennej objaśnianej: 0.447 Statystyka F (3, 1136): 51.67 [0.000] Współczynnik determinacji R 2 : 0.12 Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 9 / 25

Rozkład logistyczny Zmienna jakościowa Funkcja gęstości prawdopodobieństwa: f (x, µ, s) = gdzie x (, ) oraz: µ R - parametr położenia, s R - parametr skali. Dystrybuanta: Wartość oczekiwana: F (x, µ, s) = exp ( (x µ) s ) s [ 1 + exp ( (x µ) s 1 1 + exp ( (x µ) s )] 2, (12) ), (13) E (x) = µ. (14) Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 10 / 25

Rozkład logistyczny Zmienna jakościowa Gęstość pradopodobieństwa Dystrybuanta rozkładu logistycznego f(x) 0.00 0.05 0.10 0.15 0.20 0.25 F(x) 0.0 0.2 0.4 0.6 0.8 1.0 4 2 0 2 4 4 2 0 2 4 x x f (x) = exp( x) (1 + exp( x)) 2 (15) 1 F (x) = (1 + exp( x)) (16) Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 11 / 25

Rozkład logistyczny Zmienna jakościowa Gęstość pradopodobieństwa Dystrybuanta rozkładu logistycznego f(x) 0.0 0.1 0.2 0.3 0.4 0.5 F(x) 0.0 0.2 0.4 0.6 0.8 1.0 6 4 2 0 2 4 6 x 4 2 0 2 4 x (i) µ = 0 oraz s = 1, (ii) µ = 0 oraz s = 2, (iii) µ = 0 oraz s = 0.5. Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 11 / 25

Rozkład logistyczny Zmienna jakościowa Gęstość pradopodobieństwa Dystrybuanta rozkładu logistycznego f(x) 0.00 0.05 0.10 0.15 0.20 0.25 F(x) 0.0 0.2 0.4 0.6 0.8 1.0 4 2 0 2 4 (i) µ = 0 oraz s = 1, (ii) µ = 1 oraz s = 1, (iii) µ = 1 oraz s = 1. x 4 2 0 2 4 x Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 11 / 25

Zmienna jakościowa Prawdopodobieństwo p: p = exp (β0 + β1x1 +... + β kx k ) 1 + exp (β 0 + β 1x 1 +... + β k x k ). (15) Prawdopodobieństwo zdarzenia przeciwnego, tj. 1 p: 1 p = 1 1 + exp (β 0 + β 1x 1 +... + β k x k ). (16) Logit, czyli logarytm naturalny ilorazu p i 1 p: ( ) p ln = β o + β 1x 1 +... + β k x k. (17) 1 p p (0, 1) Ilustracja Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 12 / 25

Zmienna jakościowa Prawdopodobieństwo p: p = exp (β0 + β1x1 +... + β kx k ) 1 + exp (β 0 + β 1x 1 +... + β k x k ). (15) Prawdopodobieństwo zdarzenia przeciwnego, tj. 1 p: 1 p = 1 1 + exp (β 0 + β 1x 1 +... + β k x k ). (16) Logit, czyli logarytm naturalny ilorazu p i 1 p: ( ) p ln = β o + β 1x 1 +... + β k x k. (17) 1 p p (0, 1) Ilustracja Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 12 / 25

Metoda Największej Wiarygodności Funkcja wiarygodności: L (x 1,..., x n, θ 1,..., θ k ) = gdzie x 1,..., x n - obserwacje zmiennych, θ 1,..., θ k - szacowane parametry, f (x i, θ 1,..., θ k ) - funkcja gęstości. Rozwiązanie układu równań: Dla modelu liniowego: β MLE = β OLS n f (x i, θ 1,..., θ k ) (18) i=1 i {1,...,k} ln L x i = 0. (19) Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 13 / 25

- iloraz szans Iloraz szans (odds ratio): odds ratio: = Pr[y = 1 x i = 1] Pr[y = 0 x i = 1] }{{} iloraz szans po zwiększeniu x i o 1 Pr[y = 1 xi = 0] Pr[y = 0 x i = 0] } {{ } iloraz szans 1 = exp(β i) Interpretacja: wzrost x i o jednostkę zwiększa (zmniejsza) ceteris paribus iloraz szans do exp(β i) [(exp(β i) 1) 100%]. (20) Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 14 / 25

- efekty krańcowe Efekt krańcowy: p j exp (β 0 + β 1x 1,j +... + β k x k,j ) = β ip j (1 p j) = β i x j,i [1 + exp (β 0 + β 1x 1,j +... + β k x k,j )] 2. (21) Indeks j odpowiada jednostce. Efekt krańcowy zależy od wartości : (i) prawdopodobieństwa (p j ), (ii) zmiennej objaśnianej (x j,i ), (iii) parametru strukturalnego (β i ). Efekty krańcowe są najczęśniej liczone dla średnich wartości zmiennych objaśnianych. Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 15 / 25

Test ilorazu wiarygodności i pseudo R 2 Test ilorazu wiarygodności: Statystyka testu: H 0 : β 1 = β 2 =... = β k = 0. (22) 2 (ln L MP ln L MZ ), (23) ma rozkład χ 2 z k stopniami swobowy. Ponadto: ln L MP - logarytm wiarygodności modelu logitowego, ln L MZ - logarytm wiarygodności modelu logitowego, ale wolnym. Pseudo-R 2 McFaddena: gdzie ln L MP oraz ln L MZ j.w. tylko z wyrazem pseudo-r 2 = 1 ln L MP ln L MZ, (24) Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 16 / 25

Prognoza ex post Zmienna jakościowa Wartość teoretyczna w modelu objaśniającym zmienną jakościową (binarną) jest prognozą prawdopodobieństwa. Standardowa zasada: Próba zbilansowana: { 1 jeżeli ˆp > 0.5, ŷ = (25) 0 jeżeli ˆp < 0.5. Zasada optymalnej wartości granicznej: Próba niezbilansowana: Udział obserwacji y = 1 w próbie wynosi δ, { 1 jeżeli ˆp > δ, ŷ = 0 jeżeli ˆp < δ. (26) Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 17 / 25

Prognoza ex post Zmienna jakościowa Wartość teoretyczna w modelu objaśniającym zmienną jakościową (binarną) jest prognozą prawdopodobieństwa. Standardowa zasada: Próba zbilansowana: { 1 jeżeli ˆp > 0.5, ŷ = (25) 0 jeżeli ˆp < 0.5. Zasada optymalnej wartości granicznej: Próba niezbilansowana: Udział obserwacji y = 1 w próbie wynosi δ, { 1 jeżeli ˆp > δ, ŷ = 0 jeżeli ˆp < δ. (26) Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 17 / 25

Prognoza ex post Zmienna jakościowa Wartość teoretyczna w modelu objaśniającym zmienną jakościową (binarną) jest prognozą prawdopodobieństwa. Standardowa zasada: Próba zbilansowana: { 1 jeżeli ˆp > 0.5, ŷ = (25) 0 jeżeli ˆp < 0.5. Zasada optymalnej wartości granicznej: Próba niezbilansowana: Udział obserwacji y = 1 w próbie wynosi δ, { 1 jeżeli ˆp > δ, ŷ = 0 jeżeli ˆp < δ. (26) Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 17 / 25

Tablica trafności i zliczeniowy R 2 Tablica trafności: Prognozowane y = 1 y = 0 Razem Empiryczne y = 1 n 11 n 10 n 1. y = 0 n 01 n 00 n 0. Razem n.1 n.0 n Liczba przypadków: Trafnej predykcji (prognozy): n 11 + n 00, Błędnej predykcji (prognozy): n 10 + n 01. Zliczeniowy R 2 : zliczeniowy R 2 = n11 + n00 n (27) Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 18 / 25

Tablica trafności i zliczeniowy R 2 Tablica trafności: Prognozowane y = 1 y = 0 Razem Empiryczne y = 1 n 11 n 10 n 1. y = 0 n 01 n 00 n 0. Razem n.1 n.0 n Liczba przypadków: Trafnej predykcji (prognozy): n 11 + n 00, Błędnej predykcji (prognozy): n 10 + n 01. Zliczeniowy R 2 : zliczeniowy R 2 = n11 + n00 n (27) Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 18 / 25

Tablica trafności i zliczeniowy R 2 Tablica trafności: Prognozowane y = 1 y = 0 Razem Empiryczne y = 1 n 11 n 10 n 1. y = 0 n 01 n 00 n 0. Razem n.1 n.0 n Liczba przypadków: Trafnej predykcji (prognozy): n 11 + n 00, Błędnej predykcji (prognozy): n 10 + n 01. Zliczeniowy R 2 : zliczeniowy R 2 = n11 + n00 n (27) Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 18 / 25

Przykład empiryczny - model logitowy Wyniki oszacowań parametrów logitowego Zmienna objaśniana: coke ˆβ i se ( ˆβi ) statystyka z Pr( β i 0) pratio 1.996 0.315 6.34 0.000 disp_coke 0.352 0.159 2.22 0.027 disp_pepsi 0.731 0.168 4.36 0.000 cons 1.923 0.325 5.90 0.000 Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 19 / 25

Przykład empiryczny - model logitowy Wyniki oszacowań parametrów logitowego Zmienna objaśniana: coke ˆβ i se ( ˆβi ) statystyka z Pr( β i 0) AME( x) pratio 1.996 0.315 6.34 0.000 0.433 disp_coke 0.352 0.159 2.22 0.027 0.076 disp_pepsi 0.731 0.168 4.36 0.000 0.158 cons 1.923 0.325 5.90 0.000 gdzie AME( x) to efekt krańcowy dla średnich wartości zmiennych objaśniających Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 19 / 25

Przykład empiryczny - model logitowy Wyniki oszacowań parametrów logitowego Zmienna objaśniana: coke ˆβ i se ( ˆβi ) statystyka z Pr( β i 0) AME( x) pratio 1.996 0.315 6.34 0.000 0.433 disp_coke 0.352 0.159 2.22 0.027 0.076 disp_pepsi 0.731 0.168 4.36 0.000 0.158 cons 1.923 0.325 5.90 0.000 gdzie AME( x) to efekt krańcowy dla średnich wartości zmiennych objaśniających Dodatkowe informacje: Statystyka testu ilorazu warygodności χ 2 (3): 148.83 [0.000] Pseudo-R 2 : 0.095 Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 19 / 25

Przykład empiryczny - model logitowy - efekty krańcowe Efekty krańcowe w modelu logitowym p pratio disp_coke disp_pepsi x i 0.435 1.027 0.379 0.364 p/ x i 0.433 0.076 0.159 (0.064) (0.034) (0.035) x i 0.482 1 0 0 p/ x i 0.498 0.088 0.183 (0.079) (0.039) (0.042) x i 0.389 1 1 1 p/ x i 0.426 0.075 0.156 (0.084) (0.031) (0.028) Legenda: p/ x i oznacza efekt krańcowy dla zmiennej x i, błędy standardowe umieszczone w nawiasach,,, oznaczają odrzucenia hipotezy zerowej o nieistotności efektów krańcowych przy poziomie istosności równym odpowiednio 0.01, 0.05 oraz 0.1. Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 20 / 25

Efekty krańcowe (cd.) - wrażliwość na zmianę pratio ˆp ˆp/ pratio i 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 0.5 1 1.5 2 2.5 3 0 0 0.5 1 1.5 2 2.5 3-0.1-0.2-0.3-0.4-0.5-0.6-0.7 ˆp/ disp_coke ˆp/ disp_pepsi 0.18 0.16 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0 0 0.5 1 1.5 2 2.5 3 0 0 0.5 1 1.5 2 2.5 3-0.05-0.1-0.15-0.2-0.25-0.3 Uwagi: disp_coke = disp_pepsi = 0 Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 21 / 25

Przykład empiryczny (cd.) Tablica trafności: Empiryczne Prognozowane y = 1 y = 0 Razem y = 1 247 263 510 y = 0 123 507 630 Razem 370 770 1140 Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 22 / 25

Przykład empiryczny (cd.) Tablica trafności: Empiryczne Prognozowane y = 1 y = 0 Razem y = 1 247 263 510 y = 0 123 507 630 Razem 370 770 1140 Liczba przypadków: Trafnej predykcji (prognozy): 754(247 + 507), Błędnej predykcji (prognozy): 386(123 + 263). Zliczeniowy R 2 : zliczeniowy R 2 = 754 66.14% (28) 1140 Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 22 / 25

Zmienna jakościowa Prawdopodobieństwo p jest wartością dystrybuanty rozkładu normalnego N (0, 1): z ( ) 1 u p = Φ(z) = exp du, (29) (2π) 2 1 2 gdzie z jest kombinacją liniową zmiennych objaśniających, tj.: z = β 0 + β 1 x 1 +... + β k x k. (30) Efekty krańcowe: gdzie φ (z) jest funkcją gęstości rozkładu normalnego. Wybrane charakterystyki: p j x j,i = β i φ (z), (31) p (0, 1): Ilustracja Metoda estymacji: Metoda Największej Wiarygodności. Intepretacja oszacowań: efekty krańcowe. Miary dopasowania: pseudo R 2, test ilorazu wiarygodności, tabela trafności oraz zliczeniowe R 2. Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 23 / 25

Zmienna jakościowa Prawdopodobieństwo p jest wartością dystrybuanty rozkładu normalnego N (0, 1): z ( ) 1 u p = Φ(z) = exp du, (29) (2π) 2 1 2 gdzie z jest kombinacją liniową zmiennych objaśniających, tj.: z = β 0 + β 1 x 1 +... + β k x k. (30) Efekty krańcowe: gdzie φ (z) jest funkcją gęstości rozkładu normalnego. Wybrane charakterystyki: p j x j,i = β i φ (z), (31) p (0, 1): Ilustracja Metoda estymacji: Metoda Największej Wiarygodności. Intepretacja oszacowań: efekty krańcowe. Miary dopasowania: pseudo R 2, test ilorazu wiarygodności, tabela trafności oraz zliczeniowe R 2. Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 23 / 25

Zmienna jakościowa Prawdopodobieństwo p jest wartością dystrybuanty rozkładu normalnego N (0, 1): z ( ) 1 u p = Φ(z) = exp du, (29) (2π) 2 1 2 gdzie z jest kombinacją liniową zmiennych objaśniających, tj.: z = β 0 + β 1 x 1 +... + β k x k. (30) Efekty krańcowe: gdzie φ (z) jest funkcją gęstości rozkładu normalnego. Wybrane charakterystyki: p j x j,i = β i φ (z), (31) p (0, 1): Ilustracja Metoda estymacji: Metoda Największej Wiarygodności. Intepretacja oszacowań: efekty krańcowe. Miary dopasowania: pseudo R 2, test ilorazu wiarygodności, tabela trafności oraz zliczeniowe R 2. Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 23 / 25

Przykład empiryczny - model probitowy Wyniki oszacowań parametrów modelu probitowego Zmienna objaśniana: coke ˆβ i se ( ˆβi ) statystyka z Pr( β i 0) pratio 1.146 0.181 6.34 0.000 disp_coke 0.217 0.097 2.25 0.025 disp_pepsi 0.447 0.101 4.41 0.000 cons 1.108 0.190 5.83 0.000 Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 24 / 25

Przykład empiryczny - model probitowy Wyniki oszacowań parametrów modelu probitowego Zmienna objaśniana: coke ˆβ i se ( ˆβi ) statystyka z Pr( β i 0) AME( x) pratio 1.146 0.181 6.34 0.000 0.410 disp_coke 0.217 0.097 2.25 0.025 0.077 disp_pepsi 0.447 0.101 4.41 0.000 0.160 cons 1.108 0.190 5.83 0.000 gdzie AME( x) to efekt krańcowy dla średnich wartości zmiennych objaśniających Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 24 / 25

Przykład empiryczny - model probitowy Wyniki oszacowań parametrów modelu probitowego Zmienna objaśniana: coke ˆβ i se ( ˆβi ) statystyka z Pr( β i 0) AME( x) pratio 1.146 0.181 6.34 0.000 0.410 disp_coke 0.217 0.097 2.25 0.025 0.077 disp_pepsi 0.447 0.101 4.41 0.000 0.160 cons 1.108 0.190 5.83 0.000 gdzie AME( x) to efekt krańcowy dla średnich wartości zmiennych objaśniających Dodatkowe informacje: Statystyka testu ilorazu warygodności χ 2 (3): 145.82 [0.000] Pseudo-R 2 : 0.093 Zliczeniowy R 2 : 66.14% Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 24 / 25

Porównanie oszacowań parametrów Zestawienie oszacowań parametrów modeli zmiennej jakościowej Zmienna objaśniana: coke LMP Logit Probit pratio 0.401 1.996 1.146 (0.061) (0.315) (0.181) disp_coke 0.077 0.352 0.217 (0.034) (0.159) (0.097) disp_pepsi 0.166 0.731 0.447 (0.036) (0.168) (0.101) const 0.890 1.923 1.108 (0.065) (0.326) (0.190) Legenda: błędy standardowe w nawiasach, dla p < 0.01, dla p < 0.05, dla p < 0.1. Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 25 / 25

Porównanie oszacowań parametrów Zestawienie oszacowań parametrów modeli zmiennej jakościowej Zmienna objaśniana: coke LMP Logit Probit pratio 0.401 1.996 1.146 (0.061) (0.315) (0.181) disp_coke 0.077 0.352 0.217 (0.034) (0.159) (0.097) disp_pepsi 0.166 0.731 0.447 (0.036) (0.168) (0.101) const 0.890 1.923 1.108 (0.065) (0.326) (0.190) Legenda: błędy standardowe w nawiasach, dla p < 0.01, dla p < 0.05, dla p < 0.1. βi LMP 0.25β Logit i (32) βi LMP 0.4βi Probit (33) β Logit i 1.6βi Probit (34) Jakub Mućk Ekonometria Ćwiczenia 8 Zmienna jakościowa 25 / 25

y 0.0 0.2 0.4 0.6 0.8 1.0 1.2 0 1 2 3 4 5 Legenda: obserwacje y. x

y 0.0 0.2 0.4 0.6 0.8 1.0 1.2 0 1 2 3 4 5 Legenda: obserwacje y, wartości teoretyczne LMP, LMP. x

y 0.0 0.2 0.4 0.6 0.8 1.0 1.2 0 1 2 3 4 5 Legenda: obserwacje y, wartości teoretyczne LMP, LMP. x

y 0.0 0.2 0.4 0.6 0.8 1.0 1.2 0 1 2 3 4 5 x Legenda: obserwacje y, wartości teoretyczne LMP, wartości teoretyczne logitu, LMP, logit.

y 0.0 0.2 0.4 0.6 0.8 1.0 1.2 0 1 2 3 4 5 x Legenda: obserwacje y, wartości teoretyczne LMP, wartości teoretyczne logitu, wartości teoretyczne probitu, LMP, logit, probit.