Rozdział 8. Regresja. Definiowanie modelu

Podobne dokumenty
Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Stosowana Analiza Regresji

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

KORELACJE I REGRESJA LINIOWA

Analiza zależności cech ilościowych regresja liniowa (Wykład 13)

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Analiza współzależności zjawisk

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

MODELE LINIOWE. Dr Wioleta Drobik

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

t y x y'y x'x y'x x-x śr (x-x śr)^2

WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Stanisław Cichocki. Natalia Nehrebecka. Wykład 4

Wprowadzenie do analizy korelacji i regresji

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

e) Oszacuj parametry modelu za pomocą MNK. Zapisz postać modelu po oszacowaniu wraz z błędami szacunku.

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

Regresja i Korelacja

Własności statystyczne regresji liniowej. Wykład 4

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

ANALIZA REGRESJI SPSS

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska

Metody Ilościowe w Socjologii

PDF created with FinePrint pdffactory Pro trial version

Kolokwium ze statystyki matematycznej

Przykład 2. Stopa bezrobocia

Ekonometria. Zajęcia

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

5. Model sezonowości i autoregresji zmiennej prognozowanej

7.4 Automatyczne stawianie prognoz

1 Podstawy rachunku prawdopodobieństwa

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

4. Średnia i autoregresja zmiennej prognozowanej

WYKŁAD 8 ANALIZA REGRESJI

JEDNORÓWNANIOWY LINIOWY MODEL EKONOMETRYCZNY

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

STATYSTYKA MATEMATYCZNA

Analiza regresji część II. Agnieszka Nowak - Brzezińska

Przykład 1 ceny mieszkań

3. Modele tendencji czasowej w prognozowaniu

X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9

Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna

ĆWICZENIE 11 ANALIZA KORELACJI I REGRESJI

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

POLITECHNIKA OPOLSKA

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

Analiza regresji - weryfikacja założeń

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

METODY STATYSTYCZNE W BIOLOGII

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Analizy wariancji ANOVA (analysis of variance)

Wykład 4 Związki i zależności

Egzamin z ekonometrii wersja IiE, MSEMAT

Wielkość dziennego obrotu w tys. zł. (y) Liczba ekspedientek (x) ,5 6,6

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji

Analiza wariancji w analizie regresji - weryfikacja prawdziwości przyjętego układu ograniczeń Problem Przykłady

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Testy post-hoc. Wrocław, 6 czerwca 2016

Analiza Współzależności

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version

Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2017/2018

Projekt zaliczeniowy z Ekonometrii i prognozowania Wyższa Szkoła Bankowa w Toruniu 2014/2015

Weryfikacja hipotez statystycznych

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Statystyka. Wykład 9. Magdalena Alama-Bućko. 7 maja Magdalena Alama-Bućko Statystyka 7 maja / 40

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Ćwiczenia IV

Elektrotechnika II [ Laboratorium Grupa 1 ] 2016/2017 Zimowy. [ Laboratorium Grupa 2 ] 2016/2017 Zimowy

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Ćwiczenia 10. Analiza regresji. Część I.

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

STATYSTYKA MATEMATYCZNA, LISTA 3

LISTA 4. 7.Przy sporządzaniu skali magnetometru dokonano 10 niezależnych pomiarów

Testowanie hipotez statystycznych

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Estymacja parametrów rozkładu cechy

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota

Transkrypt:

Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność między analizowanymi zmiennymi można pokusić się o skwantyfikowanie tej relacji. Jeżeli zależność między zmiennymi ma charakter liniowy (dodatkowo zmienne mają rozkład normalny oraz nie posiadają obserwacji odstających) można pokusić sie o dopasowanie funkcji f która powiąże zmienną wyjaśnianą y (zwana również predyktantą, lub zmienną zależną) ze zmienną niezależną x (predyktor, zmienna wyjaśniająca). ŷ = f(x) Postać funkcji f w przypadku liniowości można zapisać w sposób następujący; ŷ = a + bx W przypadku zależności nieliniowych może to wskazywać na konieczność użycia funkcji wyższego rzędu np. ŷ = a+bx+bx 2 lub ŷ = ae bx Zawsze staramy się poszukiwać funkcji w najprostszej postaci, ponieważ dla skomplikowanego równania trudno znaleźć odpowiednią interpretację fizyczną. Dopasowanie parametrów linii regresji dokonujemy metodą najmniejszych kwadratów (istnieją również inne metody - ta jest jedną z bardziej oczywistych), zakładając takie dobranie współczynników, aby wartość błędu S była najmniejsza S = [y i f(x i )] 2, S = S(a, b) = [y i a bx i ] 2 Wartości współczynników a i b otrzymujemy, wykorzystując poniższe wzory. 3

b = n y i x i y x ( n n x 2 i xi ) 2 a = y i b x i n Analiza jakości modelu = + całko- SST zmienność wita SSR zmienność wyjaśniana równaniem regresji SSE zmienność pozostała poza regresją gdzie: SS-sum of squares, T-total, R-regression, E-error Można to również zapisać jako (y i ȳ) 2 = (ŷ i ȳ) 2 + (y i ŷ i ) 2 Suma kwadratów Stopnie swobody Wartość średnia kwadratów Regresja SSR k = MSR = SSR Resztkowy SSE = n 2 MSE = SSE n 2 Razem SST n Wartość średnia kwadratów reszt (wariancja składnika losowego) MSE mówi o zgodności z danymi obserwowanymi w modelu. (informuje o zmienności składnika losowego) (y i ŷ i ) 2 MSE = = e 2 i = SSE Odchylenie standardowe reszt (RMSE - standardowy błąd estymacji) informuje o ile średnio wartości obserwowane Y odchylają się od wartości prognozowanych w modelu. RMSE = e 2 i MSE = 32

Do oceny istotności statystycznej współczynnika kierunkowego linii regresji (b) stosujemy test t przy H 0 : b = 0 i hipotezie alternatywnej b 0. t = b n (x i x) S 2 e (y i ŷ i ) 2 S e = Do oceny jaka część wariancji zmiennej określona jest poprzez równanie trendu wykorzystujemy test F-Snedecora. F = [ŷ i ȳ] 2 k [ŷ i y i ] 2 n k = MSR MSE Używany jest również współczynnik determinacji R 2, który określa stosunek zmienności wynikającej z trendu do zmienności całkowitej. R 2 = (ŷ i ȳ) 2 = SSR (y i ȳ) 2 SST Wyznaczanie przedziałów ufności dla linii trendu, gdzie s 2 (MSE) oszacowanie wariancji resztowej przy n 2 stopniach swobody s = RMSE, t (α,n 2) wartość krytyczna rozkładu t przy poziomie ufności α i n 2 stopniach swobody. Górne oszacowanie η (x) = ŷ + t α,n 2 s n + (x x)2 (x i x) 2 oraz dolne η 2 (x) = ŷ t α,n 2 s n + (x x)2 (x i x) 2 33

Zadanie Korzystając z tablicy zamieszczonej poniżej narysuj wykres rozrzutu a następnie oblicz współczynniki równania regresji liniowej. Zweryfikuj hipotezę o istotności współczynnika kierunkowego jak również całości modelu. Oblicz R 2, RMSE oraz przedziały ufności dla linii regresji. Lp x y x y x 2 ŷ y ŷ (y ŷ) 2 (ŷ ȳ) 2 (y ȳ) 2 (x x) 2 η η 2 5, 3,7 2,2 -,4 3 6,9 3,7 4,7 0,5 5 0,7 -,4 6, -,0 7 8,2 3,7 8 2,6 3,4 9 7, 4, 0 3,5, 8,6 4,9 2 0,5 2,3 3 5,2 2,2 4 6,7 5, 5 6,0 5,4 6 0,9 0,6 7 6, 2,5 8 3,7 0,4 9 6,9 5, 20 8,3 6, 34

Rozkład F-Snedecora Tablice podają wartości kwantyla rzędu 0.95 centralnego rozkładu F Snedecora z n i n 2 stopniami swobody. Wiersze odpowiadają wartościom n, kolumny wartościom n 2. 2 3 4 5 6 7 8 9 0 2 3 4 5 6,45 8,5 0,3 7,7 6,6 5,99 5,59 5,32 5,2 4,96 4,84 4,75 4,67 4,6 4,54 2 99,5 9 9,55 6,94 5,79 5,4 4,74 4,46 4,26 4, 3,98 3,89 3,8 3,74 3,68 2 3 25,7 9,6 9,28 6,59 5,4 4,76 4,35 4,07 3,86 3,7 3,59 3,49 3,4 3,34 3,29 3 4 224,58 9,25 9,2 6,39 5,9 4,53 4,2 3,84 3,63 3,48 3,36 3,26 3,8 3, 3,06 4 5 230,6 9,3 9,0 6,26 5,05 4,39 3,97 3,69 3,48 3,33 3,2 3, 3,03 2,96 2,9 5 6 233,99 9,33 8,94 6,6 4,95 4,28 3,87 3,58 3,37 3,22 3,09 3 2,92 2,85 2,79 6 7 236,77 9,35 8,89 6,09 4,88 4,2 3,79 3,5 3,29 3,4 3,0 2,9 2,83 2,76 2,7 7 8 238,88 9,37 8,85 6,04 4,82 4,5 3,73 3,44 3,23 3,07 2,95 2,85 2,77 2,7 2,64 8 9 240,54 9,38 8,8 6 4,77 4, 3,68 3,39 3,8 3,02 2,9 2,8 2,7 2,65 2,59 9 0 24,88 9,4 8,79 5,96 4,74 4,06 3,64 3,35 3,4 2,98 2,85 2,75 2,67 2,6 2,54 0 242,98 9,4 8,76 5,94 4,7 4,03 3,6 3,3 3, 2,94 2,82 2,72 2,63 2,57 2,5 2 243,9 9,4 8,74 5,9 4,68 4 3,57 3,28 3,07 2,9 2,79 2,69 2,6 2,53 2,48 2 3 244,69 9,42 8,73 5,89 4,66 3,98 3,55 3,26 3,05 2,89 2,76 2,66 2,58 2,5 2,45 3 4 245,36 9,42 8,7 5,87 4,64 3,96 3,53 3,24 3,03 2,86 2,74 2,64 2,55 2,48 2,42 4 5 245,95 9,43 8,7 5,86 4,62 3,94 3,5 3,22 3,0 2,85 2,72 2,62 2,53 2,46 2,4 5 6 246,46 9,43 8,69 5,84 4,6 3,92 3,49 3,2 2,99 2,83 2,7 2,6 2,5 2,44 2,38 6 7 246,92 9,44 8,68 5,83 4,59 3,9 3,48 3,9 2,97 2,8 2,69 2,58 2,5 2,43 2,37 7 8 247,32 9,44 8,67 5,82 4,58 3,9 3,47 3,7 2,96 2,8 2,67 2,57 2,48 2,4 2,35 8 9 247,69 9,44 8,67 5,8 4,57 3,88 3,46 3,6 2,95 2,79 2,66 2,56 2,47 2,4 2,34 9 20 248,0 9,45 8,66 5,8 4,56 3,87 3,44 3,5 2,94 2,77 2,65 2,54 2,46 2,39 2,33 20 2 248,3 9,45 8,65 5,79 4,55 3,86 3,43 3,4 2,93 2,76 2,64 2,53 2,45 2,38 2,32 2 22 248,58 9,45 8,65 5,79 4,54 3,86 3,43 3,3 2,92 2,75 2,63 2,52 2,44 2,37 2,3 22 23 248,83 9,45 8,64 5,78 4,53 3,85 3,42 3,2 2,9 2,75 2,62 2,5 2,43 2,36 2,3 23 24 249,05 9,45 8,64 5,77 4,53 3,84 3,4 3,2 2,9 2,74 2,6 2,5 2,42 2,35 2,29 24 25 249,26 9,46 8,63 5,77 4,52 3,83 3,4 3, 2,89 2,73 2,6 2,5 2,4 2,34 2,28 25 26 249,45 9,46 8,63 5,76 4,52 3,83 3,4 3, 2,89 2,72 2,59 2,49 2,4 2,33 2,27 26 27 249,63 9,46 8,63 5,76 4,5 3,82 3,39 3, 2,88 2,72 2,59 2,48 2,4 2,33 2,27 27 28 249,8 9,46 8,62 5,75 4,5 3,82 3,39 3,09 2,87 2,7 2,58 2,48 2,39 2,32 2,26 28 29 249,95 9,46 8,62 5,75 4,5 3,8 3,38 3,08 2,87 2,7 2,58 2,47 2,39 2,3 2,25 29 30 250, 9,46 8,62 5,75 4,5 3,8 3,38 3,08 2,86 2,7 2,57 2,47 2,38 2,3 2,25 30 2 3 4 5 6 7 8 9 0 2 3 4 5 6 7 8 9 20 2 22 23 24 25 26 27 28 29 30 4,49 4,45 4,4 4,38 4,35 4,32 4,3 4,28 4,26 4,24 4,23 4,2 4,2 4,8 4,7 2 3,63 3,59 3,55 3,52 3,49 3,47 3,44 3,42 3,4 3,39 3,37 3,35 3,34 3,33 3,32 2 3 3,24 3,2 3,6 3,3 3, 3,07 3,05 3,03 3,0 2,99 2,98 2,96 2,95 2,93 2,92 3 4 3,0 2,96 2,93 2,9 2,87 2,84 2,82 2,8 2,78 2,76 2,74 2,73 2,7 2,7 2,69 4 5 2,85 2,8 2,77 2,74 2,7 2,68 2,66 2,64 2,62 2,6 2,59 2,57 2,56 2,55 2,53 5 6 2,74 2,7 2,66 2,63 2,6 2,57 2,55 2,53 2,5 2,49 2,47 2,46 2,45 2,43 2,42 6 7 2,66 2,6 2,58 2,54 2,5 2,49 2,46 2,44 2,42 2,4 2,39 2,37 2,36 2,35 2,33 7 8 2,59 2,55 2,5 2,48 2,45 2,42 2,4 2,37 2,36 2,34 2,32 2,3 2,29 2,28 2,27 8 9 2,54 2,49 2,46 2,42 2,39 2,37 2,34 2,32 2,3 2,28 2,27 2,25 2,24 2,22 2,2 9 0 2,49 2,45 2,4 2,38 2,35 2,32 2,3 2,27 2,25 2,24 2,22 2,2 2,9 2,8 2,6 0 2,46 2,4 2,37 2,34 2,3 2,28 2,26 2,24 2,22 2,2 2,8 2,7 2,5 2,4 2,3 2 2,42 2,38 2,34 2,3 2,28 2,25 2,23 2,2 2,8 2,6 2,5 2,3 2,2 2, 2,09 2 3 2,4 2,35 2,3 2,28 2,25 2,22 2,2 2,8 2,5 2,4 2,2 2, 2,09 2,08 2,06 3 4 2,37 2,33 2,29 2,26 2,22 2,2 2,7 2,5 2,3 2, 2,09 2,08 2,06 2,05 2,04 4 5 2,35 2,3 2,27 2,23 2,2 2,8 2,5 2,3 2, 2,09 2,07 2,06 2,04 2,03 2,0 5 6 2,33 2,29 2,25 2,2 2,8 2,6 2,3 2, 2,09 2,07 2,05 2,04 2,02 2,0,99 6 7 2,32 2,27 2,23 2,2 2,7 2,4 2, 2,09 2,07 2,05 2,03 2,02 2,99,98 7 8 2,3 2,26 2,22 2,8 2,5 2,2 2, 2,08 2,05 2,04 2,02 2,99,97,96 8 9 2,29 2,24 2,2 2,7 2,4 2, 2,08 2,06 2,04 2,02 2,99,97,96,95 9 20 2,28 2,23 2,9 2,6 2,2 2, 2,07 2,05 2,03 2,0,99,97,96,94,93 20 2 2,26 2,22 2,8 2,4 2, 2,08 2,06 2,04 2,0 2,98,96,95,93,92 2 22 2,25 2,2 2,7 2,3 2, 2,07 2,05 2,02 2,98,97,95,93,92,9 22 23 2,24 2,2 2,6 2,2 2,09 2,06 2,04 2,0,99,97,96,94,92,9,9 23 24 2,24 2,9 2,5 2, 2,08 2,05 2,03 2,0,98,96,95,93,9,9,89 24 25 2,23 2,8 2,4 2, 2,07 2,05 2,02 2,97,96,94,92,9,89,88 25 26 2,22 2,7 2,3 2, 2,07 2,04 2,0,99,97,95,93,9,9,88,87 26 27 2,2 2,7 2,3 2,09 2,06 2,03 2,98,96,94,92,9,89,88,86 27 28 2,2 2,6 2,2 2,08 2,05 2,02 2,97,95,93,9,9,88,87,85 28 29 2,2 2,5 2, 2,08 2,05 2,02,99,97,95,93,9,89,88,86,85 29 30 2,9 2,5 2, 2,07 2,04 2,0,98,96,94,92,9,88,87,85,84 30 35