Stanisław Cichocki. Natalia Nehrebecka Katarzyna Rosiak-Lada. Zajęcia 3

Podobne dokumenty
Natalia Nehrebecka. Zajęcia 3

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 4

Natalia Nehrebecka. Wykład 2

Natalia Nehrebecka. Zajęcia 4

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Stanisław Cichocki. Natalia Nehrebecka. Wykład 4

Natalia Nehrebecka. Dariusz Szymański

Dobór zmiennych objaśniających

Współczynnik korelacji liniowej oraz funkcja regresji liniowej dwóch zmiennych

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Statystyka. Zmienne losowe

Analiza zależności zmiennych ilościowych korelacja i regresja

Rachunek prawdopodobieństwa i statystyka W 11: Analizy zależnościpomiędzy zmiennymi losowymi Model regresji wielokrotnej

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Ntli Natalia Nehrebecka. Dariusz Szymański. Zajęcia 4

IID = 2. i i i i. x nx nx nx


Regresja liniowa i nieliniowa

STATYSTYKA MATEMATYCZNA

Metody predykcji analiza regresji

dy dx stąd w przybliżeniu: y

0. Oszacowanie kilku prostych regresji, interpretacja oszacować parametrów

Egzamin ze statystyki/ Studia Licencjackie Stacjonarne/ Termin I /czerwiec 2010

Weryfikacja hipotez dla wielu populacji

Statystyka Inżynierska

Stanisław Cichocki. Natalia Nehrebecka. Wykład 11

EKONOMETRIA Wykład 4: Model ekonometryczny - dodatkowe zagadnienia

WPROWADZENIE DO ANALIZY KORELACJI I REGRESJI

Hipotezy o istotności oszacowao parametrów zmiennych objaśniających ˆ ) ˆ

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

( ) ( ) 2. Zadanie 1. są niezależnymi zmiennymi losowymi o. oraz. rozkładach normalnych, przy czym EX. i σ są nieznane. 1 Niech X

Ekonometria ćwiczenia Kolokwium 1 semestr 20/12/08. / 5 pkt. / 5 pkt. / 5 pkt. / 5 pkt. /20 pkt. Regulamin i informacje dodatkowe

Badanie współzaleŝności dwóch cech ilościowych X i Y. Analiza korelacji prostej. Badanie zaleŝności dwóch cech ilościowych. Analiza regresji prostej

Rozkład dwupunktowy. Rozkład dwupunktowy. Rozkład dwupunktowy x i p i 0 1-p 1 p suma 1

Zjawiska masowe takie, które mogą wystąpid nieograniczoną ilośd razy. Wyrazów Obcych)

STATYSTYKA MATEMATYCZNA WYKŁAD 5 WERYFIKACJA HIPOTEZ NIEPARAMETRYCZNYCH

65120/ / / /200

0 0,2 0, p 0,1 0,2 0,5 0, p 0,3 0,1 0,2 0,4

Funkcje i charakterystyki zmiennych losowych

) będą niezależnymi zmiennymi losowymi o tym samym rozkładzie normalnym z następującymi parametrami: nieznaną wartością 1 4

KURS STATYSTYKA. Lekcja 6 Regresja i linie regresji ZADANIE DOMOWE. Strona 1

KURS STATYSTYKA. Lekcja 1 Statystyka opisowa ZADANIE DOMOWE. Strona 1

Parametry zmiennej losowej

Analiza danych OGÓLNY SCHEMAT. Dane treningowe (znana decyzja) Klasyfikator. Dane testowe (znana decyzja)

Analiza danych. Analiza danych wielowymiarowych. Regresja liniowa. Dyskryminacja liniowa. PARA ZMIENNYCH LOSOWYCH

1.1. Uprość opis zdarzeń: 1.2. Uprościć opis zdarzeń: a) A B A Uprościć opis zdarzeń: 1.4. Uprościć opis zdarzeń:

D. Ciołek EKONOMETRIA wykład 0 EKONOMETRIA. Wykład 0: Informacje o przedmiocie. dr Dorota Ciołek. Katedra Ekonometrii Wydział Zarządzania UG

Zestaw zadań 4: Przestrzenie wektorowe i podprzestrzenie. Liniowa niezależność. Sumy i sumy proste podprzestrzeni.

EKONOMETRIA Wykład 5: Zmienne zerojedynkowe w modelowaniu ekonometrycznym

Analiza struktury zbiorowości statystycznej

EKONOMETRIA I Spotkanie 1, dn


Rozwiązania (lub wskazówki do rozwiązań) większości zadań ze skryptu STATYSTYKA: MATERIAŁY POMOCNICZE DO ZAJĘĆ oraz EGZAMINÓW Z LAT

PROSTO O DOPASOWANIU PROSTYCH, CZYLI ANALIZA REGRESJI LINIOWEJ W PRAKTYCE

Podstawy teorii falek (Wavelets)

Mikroekonometria 13. Mikołaj Czajkowski Wiktor Budziński

W praktyce często zdarza się, że wyniki obu prób możemy traktować jako. wyniki pomiarów na tym samym elemencie populacji np.

Analiza korelacji i regresji

Statystyka Opisowa 2014 część 1. Katarzyna Lubnauer

Modele wieloczynnikowe. Modele wieloczynnikowe. Modele wieloczynnikowe ogólne. α β β β ε. Analiza i Zarządzanie Portfelem cz. 4.

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Mikroekonometria 10. Mikołaj Czajkowski Wiktor Budziński

Statystyka Opisowa 2014 część 2. Katarzyna Lubnauer

PORÓWNANIE METOD OKREŚLANIA FUNKCJI CELU PRZY DOBORZE ROZSIEWACZY NAWOZÓW MINERALNYCH

Ekonometryczne modele nieliniowe

Portfele zawierające walor pozbawiony ryzyka. Elementy teorii rynku kapitałowego

Badanie współzależności dwóch cech ilościowych X i Y. Analiza korelacji prostej

Natalia Nehrebecka. Dariusz Szymański

Analiza rodzajów skutków i krytyczności uszkodzeń FMECA/FMEA według MIL STD A

SYSTEMY UCZĄCE SIĘ WYKŁAD 7. KLASYFIKATORY BAYESA. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Matematyka ubezpieczeń majątkowych r.

Stanisław Cichocki Natalia Nehrebecka. Wykład 2

Rozwiązywanie zadań optymalizacji w środowisku programu MATLAB

Zapis informacji, systemy pozycyjne 1. Literatura Jerzy Grębosz, Symfonia C++ standard. Harvey M. Deitl, Paul J. Deitl, Arkana C++. Programowanie.

Metoda najmniejszych kwadratów

BADANIE STABILNOŚCI WSPÓŁCZYNNIKA BETA AKCJI INDEKSU WIG20

Prawdopodobieństwo i statystyka r.

Propozycja modyfikacji klasycznego podejścia do analizy gospodarności

Markowa. ZałoŜenia schematu Gaussa-

Projekt 6 6. ROZWIĄZYWANIE RÓWNAŃ NIELINIOWYCH CAŁKOWANIE NUMERYCZNE

System finansowy gospodarki

Stanisław Cichocki Natalia Nehrebecka. Wykład 2

Mikroekonometria 15. Mikołaj Czajkowski Wiktor Budziński

EKONOMETRYCZNA WYCENA NIERUCHOMOŚCI

Teoria niepewności pomiaru (Rachunek niepewności pomiaru) Rodzaje błędów pomiaru

Badania sondażowe. Braki danych Konstrukcja wag. Agnieszka Zięba. Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa

Ćwiczenia 7 Drugie zajęcia w pracowni komputerowej.

Opis danych znajdujących się w zbiorze

SIGMA KWADRAT CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Plan wykładu: Typowe dane. Jednoczynnikowa Analiza wariancji. Zasada: porównać zmienność pomiędzy i wewnątrz grup

V. WPROWADZENIE DO PRZESTRZENI FUNKCYJNYCH

Ryzyko inwestycji. Ryzyko jest to niebezpieczeństwo niezrealizowania celu, założonego przy podejmowaniu określonej decyzji. 3.

SZACOWANIE NIEPEWNOŚCI POMIARU METODĄ PROPAGACJI ROZKŁADÓW

ELEKTROCHEMIA. ( i = i ) Wykład II b. Nadnapięcie Równanie Buttlera-Volmera Równania Tafela. Wykład II. Równowaga dynamiczna i prąd wymiany

5. Pochodna funkcji. lim. x c x c. (x c) = lim. g(c + h) g(c) = lim

Definicje ogólne

Transkrypt:

Stansław Cchock Natala Nehrebecka Katarzyna Rosak-Lada Zajęca 3

1. Dobrod dopasowana równana regresj. Współczynnk determnacj R 2 Dekompozycja warancj zmennej zależnej Współczynnk determnacj R 2 2. Zmenne cągłe a zmenne dyskretne 3. Lnowośd w modelu 4. Interpretacja parametrów przy zmennych objaśnających cągłych Interpretacja współczynnków regresj w modelu lnowym względem zmennych objaśnających Elastycznośd Semelastycznośd

Dobrod dopasowana równana regresj (do danych emprycznych) wyrażona jest przez tak zwany współczynnk determnacj lnowej oznaczany przez R 2. Współczynnk ten określa jaka częśd zmennośc zmennej objaśnanej y jest wyjaśnona łączne przez zmennośd wszystkch zmennych objaśnających. 2, K Jedną z mar zmennośc zmennej jest WARIANCJA.

Warancje zmennej zależnej y można przedstawd jako dekompozycje (podzał) na częśd wyjaśnoną przez model na częśd newyjaśnoną przez model. TSS ESS RSS Dekompozycja warancj jest możlwa JEDYNIE dla modelu ze stałą

Całkowta suma kwadratów: Zmennośd całkowtą zmennej objaśnanej y, oznaczaną w lteraturze angelskm skrótem TSS (Total Sum of Squares), merzymy za pomocą sumy kwadratów odchyleo obserwacj zmennej objaśnanej od średnej: n TSS ( y y) 1 2

Wyjaśnona suma kwadratów: Jeśl model zawera stałą, to całkowtą sumę kwadratów możemy zdekomponowad na dwa składnk, na wyjaśnoną (równanem regresj) sumę kwadratów, oznaczaną przez ESS (Explaned Sum of Squares) n ESS ( y y) 1 2

Resztowa suma kwadratów: resztową (newyjaśnoną) sumę kwadratów, oznaczaną przez RSS (Resdual Sum of Squares). RSS n e 2 1

R wyjasnona suma kwadratów ESS calkowta suma kwadratów TSS 2 1 n n 1 ( y y) ( y y) 2 2 1 RSS TSS Dla modelu ze stałą 0 R 2 1

y y y R 2 =0 TSS RSS R 2 =0,50 TSS ESS RSS R 2 =0,90 TSS ESS R S S Współczynnk determnacj jest jedną z podstawowych mar jakośc dopasowana modelu. Informuje o tym, jaka częśd zmennośc zmennej objaśnanej została wyjaśnona przez model. Współczynnk determnacj przyjmuje wartośc z przedzału [0;1] w modelu ze stałą. Jego wartośc najczęścej są wyrażane w procentach. Dopasowane modelu jest tym lepsze, m jego wartośd jest blższa jednośc.

R 2 przyjmuje wartośc z przedzału domknętego mędzy 0 1. Jeśl R 2 =1, to model regresj w 100% wyjaśna zmennośd y, y yˆ, e 0 oraz RSS a jeśl R 2 = 0, to model regresj w ogóle ne wyjaśna zmennośc y. yˆ y, ESS 0 0 Jeśl na przykład wynos R 2 = 0,7 to możemy powedzed, że 70% zmennośc zmennej objaśnanej y jest wyjaśnone przez łączną zmennośd wszystkch zmennych objaśnających, a 30% zmennośc jest newyjaśnone (jest zmennoścą resztową).

R 2 jest WYŁĄCZNIE statystyką opsową ne należy jej stosowad do porównywana model. Przy szacowanu klku model dla danej zmennej zależnej z różną lczbą zmennych objaśnających na podstawe dentycznego zboru danych, korzystane ze współczynnka determnacj R 2 dla wyboru modelu lepej dopasowanego do danych emprycznych staje sę problematyczne. Gdy bowem dodajemy do równana dalsze zmenne objaśnające to zawsze wzrasta R 2 nezależne od prawdzwej ważnośc tych nowododanych zmennych. placa 2 1 2wek R 5% placa 2 1 2wek 3 plec R 7%

Gdy bowem dodajemy do równana dalsze zmenne objaśnające to zawsze wzrasta R 2 nezależne od prawdzwej ważnośc tych nowododanych zmennych. Wąże sę to z ogólnym własnoścam optymalzacj. Jeśl, poprzez narzucena ogranczeo, zmnejszymy zbór, na którym mnmalzujemy funkcję celu, to uzyskana w mnmum wartośd funkcj celu będze wększa lub równa wartośc funkcj w mnmum dla mnmalzacj bez ogranczeo.

Nawet dodając do modelu całkowce bezsensowną zmenną uzyskujemy polepszene dopasowana. Co węcej, jeśl K=N (lczba parametrów =lczbe obserwacj), to R 2= 1 Z tego powodu za marę dobroc dopasowana zaproponowano ne R 2, a tak zwany skorygowany współczynnk determnacj. R 2

R 2 R 2 jest skorygowany ze względu na tak zwaną lczbę stopn swobody, to znaczy ze względu na różncę mędzy lczbą obserwacj N a lczbą zmennych objaśnających K. R 2 1 N 1 N K (1 R 2 )

Oszacowano dwa modele za pomocą MNK na próbe lczącej 12 obserwacj otrzymano następujące wynk: Który z powyższych model należy wybrad dlaczego? 0,81, 3 2,64 2 ˆ ) 0,8, 2 1,5 ˆ ) 2 3 2 2 2 R x x y b R x y a

Zmenne Zmenne cągłe Zmenne dyskretne

Zmenną cągłą nazywamy zmenną, która przyjmuje wartośc ze zboru lczb rzeczywstych. zmennym posadającym charakter loścowy Np. dochody, wydatk, cena neruchomośc td.

Zmenną dyskretną nazywamy zmenną, która przyjmuje wartośc ze skooczonego podzboru lczb naturalnych. Zazwyczaj podzbór ten jest stosunkowo mało lczny obejmuje klka czy klkanaśce elementów. zmennym posadającym charakter jakoścowy np. płed, wykształcene, mejsce zameszkana, stan cywlny td.

Lnowośd w modelu względem: K Po perwsze - zmennych objaśnających, które są w perwszej potędze, y 1 1 2 2... a po druge - względem parametrów k, które są równe w perwszej potędze. K 1 K y 1 1 1 2 2... 1 K K

Interpretacja współczynnków regresj w modelu lnowym względem zmennych objaśnających

Model regresj lnowej dla -tej obserwacj: y... 1 2 Wartośd oczekwana zmennej objaśnanej przy danych wartoścach zmennych objaśnających wynos: E( y ) 1 2 2 Pochodną cząstkową warunkowej wartośc oczekwanej po 2 k E( y k ) k K k K K K x K k merzy oczekwaną zmanę y jako efekt zmany K o jedną jednostkę, gdy wartośc nnych zmennych objaśnających modelu pozostają nezmenone (ceters parbus).

y... 1 2 2 K K ˆ b1 b2 2 y... b K K 2 współczynnk INTERPRETACJA: jeżel wartość zmennej nezależnej 2 wzrośne o jednostkę, to wartość zmennej zależnej y : - wzrośne (jeżel b 2 >0) o b 2 jednostek lub - spadne (jeżel b 2 <0) o b 2 jednostek ceters parbus. 1 wyraz wolny Uwaga! Wyraz wolny ne nterpretujemy.

placa 1 2nauka 3 wek placa 993,26 73,59nauka 35, 09 wek Zmenna nauka - lata nauk -tej osoby Interpretacja: Mesęczne wynagrodzene wzrasta przecętne o 73,59 zł przy wzrośce lczby lat nauk o jeden rok, przy założenu pozostałych charakterystyk na ne zmenonym pozome.

Elastycznośd

Elastycznośc mogą byd wyznaczane z modelu - LOGLINIOWYM, w którym zarówno zmenna objaśnana jak zmenne objaśnające są logarytmam zmennych perwotnych. ln y 1 2 ln 2... K ln K ln ( y ) 1 2 ln 2... K ln E( y ln k ) k ln K k merzy o le procent zmen sę zmenna objaśnana, gdy zmenna objaśnająca zmen sę o jeden procent, gdy wartośc nnych zmennych objaśnających modelu pozostają nezmenone (ceters parbus).

ln y 1 2 ln 2... K ln K ˆ ln y b1 b2 ln 2... b K ln K 2 współczynnk INTERPRETACJA: jeżel wartość zmennej nezależnej 2 wzrośne o 1%, to wartość zmennej zależnej y : - wzrośne (jeżel b 2 >0) o b 2 % lub - spadne (jeżel b 2 <0) o b 2 %. ceters parbus. 1 wyraz wolny Uwaga! Wyraz wolny ne nterpretujemy.

ln( wydatk ) 1 2 ln( dochód ) ln( wydatk ) 2 0,25ln( dochód ) Interpretacja: Mesęczne wydatk wzrastają przecętne o 0,25% przy wzrośce mesęcznego wynagrodzena o 1%, przy założenu pozostałych charakterystyk na ne zmenonym pozome.

Semelastycznośd

Semelastycznośc mogą byd wyznaczane z modelu, w którym zmenna objaśnana jest zlogarytmowana a zmenne objaśnające ne są logarytmam zmennych perwotnych. ln y 1 2 2... K K ln ( y ) 1 2 2... ln E( y k ) K k K k *100% merzy o le procent zmen sę zmenna objaśnana, gdy zmenna objaśnająca zmen sę o jedną jednostkę, gdy wartośc nnych zmennych objaśnających modelu pozostają nezmenone (ceters parbus).

ln y 1 2 2... K K ˆ ln y b1 b2 2... b K K 2 współczynnk INTERPRETACJA: jeżel wartość zmennej nezależnej 2 wzrośne o 1 jednostkę, to wartość zmennej zależnej y : - wzrośne (jeżel b 2 >0) o b 2 *100% lub - spadne (jeżel b 2 <0) o b 2 *100%. ceters parbus. 1 wyraz wolny Uwaga! Wyraz wolny ne nterpretujemy.

ln( placa ) 1 2wek ln( placa ) 2,34 0, 04 wek Interpretacja: Płaca wzrasta przecętne o 4% przy wzrośce weku o 1 rok, przy założenu pozostałych charakterystyk na ne zmenonym pozome.

ln( wydatk ) 3,6 0,35ln( dochód ) 0, 11dzec Interpretacja: Elastycznośd, wzrost dochodu o 1% powoduje wzrost wydatków o 0,35% przy założenu pozostałych charakterystyk na ne zmenonym pozome. Semelastycznośd, wzrost lczby dzec o 1 powoduje wzrost wydatków o 11%=0,11*100% przy założenu pozostałych charakterystyk na ne zmenonym pozome.

1. Proszę opsad wzór dekompozycj zmennośc całkowtej zmennej objaśnanej y na zmennośd wyjaśnoną newyjaśnoną. 2. Podad nterpretacje R 2. 3. Wyjaśnd, dlaczego R 2 ne można używad do porównana model. 4. Jaką nterpretację mają współczynnk regresj przy zmennych objaśnających cągłych w modelu lnowym względem zmennych objaśnających? 5. Jaką nterpretację mają współczynnk regresj przy zmennych objaśnających cągłych w modelu loglnowym względem zmennych objaśnających?

Dzękuję za uwagę