Stanisław Cichocki. Natalia Nehrebecka. Wykład 4

Podobne dokumenty
Metoda najmniejszych kwadratów

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Natalia Nehrebecka Stanisław Cichocki. Wykład 6

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Stanisław Cichocki Natalia Nehrebecka. Wykład 1

Egzamin z ekonometrii wersja IiE, MSEMAT

Testowanie hipotez statystycznych

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

Rozdział 8. Regresja. Definiowanie modelu

Stanisław Cichocki. Natalia Nehrebecka

Ekonometria egzamin wersja ogólna 17/06/08

, a reszta dla pominiętej obserwacji wynosi 0, RSS jest stałe, T SS rośnie, więc zarówno R 2 jak i R2 rosną. R 2 = 1 n 1 n. rosnie. n 2 (1 R2 ) = 1 59

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Egzamin z ekonometrii wersja IiE, MSEMat Pytania teoretyczne

Ekonometria egzamin 07/03/2018

Ekonometria egzamin wersja Informatyka i Ekonometria 26/06/08

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

1.1 Klasyczny Model Regresji Liniowej

Egzamin z ekonometrii wersja ogolna

Natalia Nehrebecka. Zajęcia 3

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Wprowadzenie Testy własności składnika losowego. Diagnostyka modelu. Część 1. Diagnostyka modelu

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne

Budowa modelu i testowanie hipotez

Ekonometria Ćwiczenia 19/01/05

Egzamin z ekonometrii wersja IiE, MSEMAT

Egzamin z ekonometrii wersja IiE, MSEMAT

1.9 Czasowy wymiar danych

Stanisław Cichocki. Natalia Nehrebecka

Zależność. przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna),

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Egzamin z ekonometrii - wersja ogólna

1 Modele ADL - interpretacja współczynników

Stosowana Analiza Regresji

Wprowadzenie do analizy korelacji i regresji

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

Analiza współzależności zjawisk

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Ekonometria. Metodologia budowy modelu. Jerzy Mycielski. Luty, 2011 WNE, UW. Jerzy Mycielski (WNE, UW) Ekonometria Luty, / 18

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Zmienne sztuczne i jakościowe

Stanisław Cichocki Natalia Nehrebecka. Wykład 3

Ekonometria dla IiE i MSEMat Z7

Heteroscedastyczność. Zjawisko heteroscedastyczności Uogólniona Metoda Najmniejszych Kwadratów Stosowalna Metoda Najmniejszych Kwadratów

Wprowadzenie Modele o opóźnieniach rozłożonych Modele autoregresyjne o opóźnieniach rozłożonych. Modele dynamiczne.

Ekonometria dla IiE i MSEMat Z12

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Ekonometria egzamin 06/03/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

1.7 Ograniczenia nakładane na równanie regresji

Diagnostyka w Pakiecie Stata

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34

Ekonometria egzamin wersja Informatyka i Ekonometria 29/01/08

Stanisław Cichocki Natalia Nehrebecka. Wykład 3

Stanisław Cichocki. Natalia Nehrebecka

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych

Analiza zależności cech ilościowych regresja liniowa (Wykład 13)

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

Czasowy wymiar danych

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

Metody Ilościowe w Socjologii

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

Diagnostyka w Pakiecie Stata

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Ekonometria egzamin 31/01/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Przyczynowość Kointegracja. Kointegracja. Kointegracja

Zmienne Binarne w Pakiecie Stata

Stanisław Cichocki. Natalia Nehrebecka. Wykład 13

ANALIZA REGRESJI SPSS

Stanisław Cichocki. Natalia Nehrebecka

Stanisław Cichocki. Natalia Nehrebecka Katarzyna Rosiak-Lada. Zajęcia 3

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8

Stanisław Cichocki. Natalia Neherebecka. Zajęcia 15-17

Ekonometria egzamin wersja ogólna 29/01/08

Natalia Nehrebecka. Wykład 1

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

e) Oszacuj parametry modelu za pomocą MNK. Zapisz postać modelu po oszacowaniu wraz z błędami szacunku.

Statystyczna analiza danych (molekularnych) analiza wariancji ANOVA

PAKIETY STATYSTYCZNE

Testy własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu

Statystyka. Wykład 9. Magdalena Alama-Bućko. 7 maja Magdalena Alama-Bućko Statystyka 7 maja / 40

Stanisław Cichocki Natalia Neherbecka

KORELACJE I REGRESJA LINIOWA

Analiza Współzależności

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Stanisław Cichocki. Natalia Nehrebecka

Transkrypt:

Stanisław Cichocki Natalia Nehrebecka Wykład 4 1

1. Własności hiperpłaszczyzny regresji 2. Dobroć dopasowania równania regresji. Współczynnik determinacji R 2 Dekompozycja wariancji zmiennej zależnej Współczynnik determinacji R 2

1. Własności hiperpłaszczyzny regresji 2. Dobroć dopasowania równania regresji. Współczynnik determinacji R 2 Dekompozycja wariancji zmiennej zależnej Współczynnik determinacji R 2

realtimerpi.com/gamer_prediction_system.html

1. 2. X ' e 0 yˆ' e 0 Dodatkowo dla modelu ze stałą: 3. N i 1 e 4. y yˆ i 0

1. Własności hiperpłaszczyzny regresji 2. Dobroć dopasowania równania regresji. Współczynnik determinacji R 2 Dekompozycja wariancji zmiennej zależnej Współczynnik determinacji R 2

Dobroć dopasowania równania regresji (do danych empirycznych) wyrażona jest przez tak zwany współczynnik determinacji liniowej oznaczany przez R 2. Współczynnik ten określa jaka część zmienności zmiennej objaśnianej y jest wyjaśniona łącznie przez zmienność wszystkich zmiennych objaśniających. X 2, X K Jedną z miar zmienności zmiennej jest WARIANCJA.

Wariancje zmiennej zależnej y można przedstawić jako dekompozycje (podział) na część wyjaśnioną przez model i na część niewyjaśnioną przez model. TSS ESS RSS Dekompozycja wariancji jest możliwa JEDYNIE dla modelu ze stałą

Całkowita suma kwadratów: Zmienność całkowitą zmiennej objaśnianej y, oznaczaną w literaturze angielskim skrótem TSS (Total Sum of Squares), mierzymy za pomocą sumy kwadratów odchyleń obserwacji zmiennej objaśnianej od średniej: n TSS ( yi y) i 1 2

Wyjaśniona suma kwadratów: Jeśli model zawiera stałą, to całkowitą sumę kwadratów możemy zdekomponować na dwa składniki, na wyjaśnioną (równaniem regresji) sumę kwadratów, oznaczaną przez ESS (Explained Sum of Squares) n ESS ( yˆ yˆ) i 1 i 2

Resztowa suma kwadratów: i resztową (niewyjaśnioną) sumę kwadratów, oznaczaną przez RSS (Residual Sum of Squares). RSS n e 2 i i 1

wydatki Model: 1 2 ESS dochod i i i K-1 ESS/df Source SS df MS Number of obs = 31847 F( 1, 31845) = 8241.09 Model 14500.6608 1 14500.6608 Prob > F = 0.0000 Residual 56033.0789 31845 1.75955657 R-squared = 0.2056 Adj R-squared = 0.2056 Total 70533.7398 31846 2.21483828 Root MSE = 1.3265 TSS RSS N-1 N-K RSS/df

R wyjasniona suma kwadratów ESS calkowita suma kwadratów TSS 2 i 1 n n i 1 ( y y) i ( y y) i 2 2 1 RSS TSS Dla modelu ze stałą 0 R 2 1

wydatki Model: 1 2 dochod i i i ESS Source SS df MS Number of obs = 31847 F( 1, 31845) = 8241.09 Model 14500.6608 1 14500.6608 Prob > F = 0.0000 Residual 56033.0789 31845 1.75955657 R-squared = 0.2056 Adj R-squared = 0.2056 Total 70533.7398 31846 2.21483828 Root MSE = 1.3265 TSS RSS 2 14500,66 56033,08 R 1 0, 205 70533,74 70533,74

y y y R 2 =0 TSS RSS X R 2 =0,50 X TSS ESS RSS R 2 =0,90 TSS ESS X R S S np. jeśli na przykład R 2 = 0,7 to możemy powiedzieć, że 70% zmienności zmiennej objaśnianej y jest wyjaśnione przez łączną zmienność wszystkich zmiennych objaśniających, a 30% zmienności jest niewyjaśnione (jest zmiennością resztową).

16

W modelu ze stałą i jedną zmienną: R 2 2 xy

R 2 jest WYŁĄCZNIE statystyką opisową i nie należy jej stosować do porównywania modeli. Przy szacowaniu kilku modeli dla danej zmiennej zależnej z różną liczbą zmiennych objaśniających na podstawie identycznego zbioru danych, korzystanie ze współczynnika determinacji R 2 dla wyboru modelu lepiej dopasowanego do danych empirycznych staje się problematyczne. Gdy bowiem dodajemy do równania kolejne zmienne objaśniające to zawsze wzrasta R 2. placa i 2 1 2wiek i i R 5% placa i 2 1 2wiek i 3 plec i i R 7%

Wynika to z ogólnych własności optymalizacji: narzucenie ograniczeń zmniejszające zbiór na którym minimalizujemy funkcję celu prowadzi do uzyskania w minimum wartości funkcji celu większej lub równej wartości funkcji celu w minimum dla minimalizacji bez ograniczeń

Z tego powodu za miarę dobroci dopasowania zaproponowano nie R 2, a tak zwany skorygowany współczynnik determinacji. R 2

R 2 R 2 jest skorygowany ze względu na tak zwaną liczbę stopni swobody, to znaczy ze względu na różnicę między liczbą obserwacji N a liczbą zmiennych objaśniających K. R 2 1 N 1 N K (1 R 2 )

1. Pokazać, że w modelu ze stałą suma reszt jest równa zero. 2. Pokazać, że w modelu ze stałą średnia wartość zmiennej zależnej równa jest średniej z wartości dopasowanych. 3. Udowodnić, że w modelu ze stałą TSS=ESS+RSS. 4. Podać interpretację R 2 5. Wyjaśnić, dlaczego R 2 nie można używać do porównywania modeli.

Dziękuję za uwagę 24