Dobór zmiennych objaśniających

Podobne dokumenty
Stanisław Cichocki Natalia Nehrebecka. Zajęcia 4

Natalia Nehrebecka. Zajęcia 3

Natalia Nehrebecka. Zajęcia 4

Stanisław Cichocki. Natalia Nehrebecka Katarzyna Rosiak-Lada. Zajęcia 3

Analiza regresji modele ekonometryczne

) będą niezależnymi zmiennymi losowymi o tym samym rozkładzie normalnym z następującymi parametrami: nieznaną wartością 1 4

Natalia Nehrebecka. Wykład 2

Weryfikacja hipotez dla wielu populacji

Badanie współzaleŝności dwóch cech ilościowych X i Y. Analiza korelacji prostej. Badanie zaleŝności dwóch cech ilościowych. Analiza regresji prostej

W praktyce często zdarza się, że wyniki obu prób możemy traktować jako. wyniki pomiarów na tym samym elemencie populacji np.

Rachunek prawdopodobieństwa i statystyka W 11: Analizy zależnościpomiędzy zmiennymi losowymi Model regresji wielokrotnej

Regresja liniowa i nieliniowa

Stanisław Cichocki. Natalia Nehrebecka. Wykład 11

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Analiza zależności zmiennych ilościowych korelacja i regresja

Metody predykcji analiza regresji

KURS STATYSTYKA. Lekcja 6 Regresja i linie regresji ZADANIE DOMOWE. Strona 1

Badanie współzależności dwóch cech ilościowych X i Y. Analiza korelacji prostej

Krzywa wieża w Pizie. SAS Data Step. Przykład (2) Wykład 13 Regresja liniowa

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Statystyka. Zmienne losowe

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

EKONOMETRIA Wykład 4: Model ekonometryczny - dodatkowe zagadnienia

65120/ / / /200

Plan wykładu: Typowe dane. Jednoczynnikowa Analiza wariancji. Zasada: porównać zmienność pomiędzy i wewnątrz grup

Rozdział 8. Regresja. Definiowanie modelu

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

WPROWADZENIE DO ANALIZY KORELACJI I REGRESJI

Procedura normalizacji

STATYSTYKA MATEMATYCZNA WYKŁAD 5 WERYFIKACJA HIPOTEZ NIEPARAMETRYCZNYCH

Prawdopodobieństwo i statystyka r.

( ) ( ) 2. Zadanie 1. są niezależnymi zmiennymi losowymi o. oraz. rozkładach normalnych, przy czym EX. i σ są nieznane. 1 Niech X

Markowa. ZałoŜenia schematu Gaussa-

STATYSTYKA MATEMATYCZNA

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Współczynnik korelacji liniowej oraz funkcja regresji liniowej dwóch zmiennych

IID = 2. i i i i. x nx nx nx

Egzamin ze statystyki/ Studia Licencjackie Stacjonarne/ Termin I /czerwiec 2010


Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Ntli Natalia Nehrebecka. Dariusz Szymański. Zajęcia 4

Zestaw zadań 4: Przestrzenie wektorowe i podprzestrzenie. Liniowa niezależność. Sumy i sumy proste podprzestrzeni.


Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

dy dx stąd w przybliżeniu: y

Parametry zmiennej losowej

ANALIZA KORELACJI WYDATKÓW NA KULTURĘ Z BUDŻETU GMIN ORAZ WYKSZTAŁCENIA RADNYCH

Mikroekonometria 13. Mikołaj Czajkowski Wiktor Budziński

Hipotezy o istotności oszacowao parametrów zmiennych objaśniających ˆ ) ˆ

Ekonometria ćwiczenia Kolokwium 1 semestr 20/12/08. / 5 pkt. / 5 pkt. / 5 pkt. / 5 pkt. /20 pkt. Regulamin i informacje dodatkowe

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Sprawozdanie powinno zawierać:

Modele wieloczynnikowe. Modele wieloczynnikowe. Modele wieloczynnikowe ogólne. α β β β ε. Analiza i Zarządzanie Portfelem cz. 4.

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

0. Oszacowanie kilku prostych regresji, interpretacja oszacować parametrów

Analiza zależności cech ilościowych regresja liniowa (Wykład 13)

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Statystyka Opisowa 2014 część 2. Katarzyna Lubnauer

Mikroekonometria 10. Mikołaj Czajkowski Wiktor Budziński

Trzecie laboratoria komputerowe ze Staty Testy

Natalia Nehrebecka. Dariusz Szymański

Mikroekonometria 10. Mikołaj Czajkowski Wiktor Budziński

Analiza danych. Analiza danych wielowymiarowych. Regresja liniowa. Dyskryminacja liniowa. PARA ZMIENNYCH LOSOWYCH

INFORMATYKA W SELEKCJI

Mikroekonometria 7. Mikołaj Czajkowski Wiktor Budziński

Przedziały ufności i testy parametrów. Przedziały ufności dla średniej odpowiedzi. Interwały prognoz (dla przyszłych obserwacji)

Dr inż. Robert Smusz Politechnika Rzeszowska im. I. Łukasiewicza Wydział Budowy Maszyn i Lotnictwa Katedra Termodynamiki

5. Pochodna funkcji. lim. x c x c. (x c) = lim. g(c + h) g(c) = lim

MATEMATYKA POZIOM ROZSZERZONY Kryteria oceniania odpowiedzi. Arkusz A II. Strona 1 z 5

Rozkład dwupunktowy. Rozkład dwupunktowy. Rozkład dwupunktowy x i p i 0 1-p 1 p suma 1

Stosowana Analiza Regresji

PORÓWNANIE METOD OKREŚLANIA FUNKCJI CELU PRZY DOBORZE ROZSIEWACZY NAWOZÓW MINERALNYCH

Projekt 6 6. ROZWIĄZYWANIE RÓWNAŃ NIELINIOWYCH CAŁKOWANIE NUMERYCZNE

ELEKTROCHEMIA. ( i = i ) Wykład II b. Nadnapięcie Równanie Buttlera-Volmera Równania Tafela. Wykład II. Równowaga dynamiczna i prąd wymiany

Zjawiska masowe takie, które mogą wystąpid nieograniczoną ilośd razy. Wyrazów Obcych)

PORÓWNANIE PRODUKCJI ENERGII ELEKTRYCZNEJ W LATACH W WYBRANYCH WOJEWÓDZTWACH

Analiza danych OGÓLNY SCHEMAT. Dane treningowe (znana decyzja) Klasyfikator. Dane testowe (znana decyzja)

Zaawansowane metody numeryczne Komputerowa analiza zagadnień różniczkowych 1. Układy równań liniowych

Pokazać, że wyżej zdefiniowana struktura algebraiczna jest przestrzenią wektorową nad ciałem

METODA UNITARYZACJI ZEROWANEJ Porównanie obiektów przy ocenie wielokryterialnej. Ranking obiektów.

Ekonometryczne modele nieliniowe

Portfele zawierające walor pozbawiony ryzyka. Elementy teorii rynku kapitałowego

Budowa modelu i testowanie hipotez

Rozwiązania (lub wskazówki do rozwiązań) większości zadań ze skryptu STATYSTYKA: MATERIAŁY POMOCNICZE DO ZAJĘĆ oraz EGZAMINÓW Z LAT

Analiza struktury zbiorowości statystycznej

Statystyka Inżynierska

MECHANIKA 2 MOMENT BEZWŁADNOŚCI. Wykład Nr 10. Prowadzący: dr Krzysztof Polko

XXX OLIMPIADA FIZYCZNA ETAP III Zadanie doświadczalne

Problemy jednoczesnego testowania wielu hipotez statystycznych i ich zastosowania w analizie mikromacierzy DNA

Przypomnienie: wykłady i zadania kursu były zaczerpnięte z podręczników: Model statystyczny Format danych

MODELE LINIOWE. Dr Wioleta Drobik

Współczynnik przenikania ciepła U v. 4.00

Analiza korelacji i regresji

EKONOMETRIA Wykład 5: Zmienne zerojedynkowe w modelowaniu ekonometrycznym

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Testowanie hipotez statystycznych

I. Elementy analizy matematycznej

PROSTO O DOPASOWANIU PROSTYCH, CZYLI ANALIZA REGRESJI LINIOWEJ W PRAKTYCE

Elementy statystyki STA - Wykład 5

Transkrypt:

Dobór zmennych objaśnających Metoda grafowa: Należy tak rozpąć graf na werzchołkach opsujących poszczególne zmenne, aby występowały w nm wyłączne łuk symbolzujące stotne korelacje pomędzy zmennym opsującym.

użyce testu na stotność współczynnków korelacj r t j m r j

odrzucamy te współczynnk korelacj, dla których t t α t r j r /( m ) α m r ( ) ( ) j m tα rj rj + tα /( m ) j t r * α Za nestotne ze statystycznego punktu wdzena przyjmujemy zatem te * współczynnk, które spełnają nerówność r r j α

Redukcja zboru zmennych kandydatek metodą optymalnego wyboru predykat Nośnkem nformacj nazywamy kandydatkę na zmenną objaśnającą. Kombnacją nośnków nformacj jest podzbór zboru zmennych kandydatek. Pojemnoścą ndywdualną j-tego nośnka nformacj w ramach l-tej kombnacj nazywamy lczbę: r h j + j l \ {} j r j

Pojemnoścą ntegralną kombnacj nośnków nformacj nazywamy sumę pojemnośc ndywdualnych nośnków należących do danej kombnacj, tj. j l H h l lj

Pojemnośc nformacyjne są unormowane: h lj,h l [0, ]. Wyberamy taką kombnację zmennych objaśnających, dla której pojemność nformacyjna ntegralna H l jest maksymalna.

Metoda doboru krokowego wprost lub do tyłu Bada sę zmenność (a dokładne stotność tej zmennośc) przy dokładanu (lub odejmowanu) zmennej objaśnającej do modelu).

Przykład z dwema zmennym: Zamerzamy ustalć prognozę zużyca oleju opałowego zużywanego w ogrzewanu meszkań w stycznu. Wybrano w tym celu mnej węcej jednakowe 5 domków zbudowanych w różnych częścach kraju. Rozważać można wele zmennych jako przypuszczalne mających wpływ na zużyce oleju opałowego, jednak dla uproszczena przyjmujemy dwe następujące zmenne opsujące - średną,dzenną temperaturę powetrza, merzoną w stopnach Fahrenheta, na zewnątrz domu (), - grubość materału zolacyjnego, merzonego w calach pod dachem domu ().

Otrzymano następujące wynk badań: Obserwacja Mesęczne zużyce oleju opałowego (w galonach) Średna temperatura w deg F Grubość zolacj w calach 75,3 40 3 363,8 7 3 3 64,3 40 0 4 40,8 73 6 5 94,3 64 6 6 30,9 34 6 7 366,7 9 6 8 300,6 8 0 9 37,8 3 0 0,4 63 3 3,4 65 0 03,5 4 6 3 44, 3 4 33,0 38 3 5 5,5 58 0

Odpowedne równana normalne wyglądają następująco: + + + + + + m m m m m m o m m m b b b Y b b b Y b b mb Y I 0 m m 0 III. II..

po rozwązanu: b o 56,5 b -5,43658 b-0.03 ˆ Y 56,5 5,43658 0. 03

Predykcja zmennej zależnej. Możlwa jest predykcja zmennej objaśnanej (w ogranczonym zakrese) dla poszczególnych wartośc zmennych objaśnających. Np. dla wartośc średnej temperatury 30 F 0 domu o zolacj o grubośc 6 cal otrzymujemy Yˆ Yˆ 56,5 78,9798 5,43658 0,03

Testowane stotnośc zwązku pomędzy zmennym objaśnającym a zmenną objaśnaną. H 0 : β β 0 H : β β 0 F p, n p MSR MSE

Źródło df Suma kwadratów Warancja F Regresja SSR 8 04,663 4 007,33568,47 Błąd 5-- SSE 8 0,6030 676,769 Total 5-4 SST 36 35,93

Mara zwązku w regresj welokrotnej: r Y SSR 8 04,663, SST 3635,93.9656

lub dla współczynnka determnacj adjustowanego r adj m [( ry,... p ) ] Y m p 5 4 ( r ) ( 0,9656) 0, 96, 5 czyl w 96% wybrane zmenne wyjaśnają welkość konsumcj oleju grzewczeg

Wyznaczane wkładu do modelu zmennych objaśnających: SSR( k wszystke zmenne z wyjątkem k) SSR( wszystke zmenne włączne z k) - SSR(wszystke oprócz k) czyl SSR( ) SSR ( ) - SSR ( ) 7 938,63 SSR( ) SSR ( ) - SSR ( ) 49 390,0 a węc aby sprawdzć czy znacząco poprawa model jeżel jest już do m włączona rozdzelamy sumę kwadratów regresj na dwa składnk:

Źródło df Su ma kwadratów Warancja F Regresja SSR 8 04,663 4 007,335 5 076,4650 76 938,63 5 076,4650 76 938,63 6,47 Błąd 5-- SSE 8 0,6030 676,769 Total 5-4 SST 36 35,93

testujemy hpotezę: H 0 : Zmenna ne polepsza znacząco modelu jeśl jest już w nm zmenna H : Zmenna polepsza znacząco model jeśl jest już w nm zmenna F,m-p- SSR ( wszystke oprocz ) MSE F, 6,47 podczas gdy wartość krytyczna wynos dla α0,05 4,75 tym sa odrzucamy H 0.

Podobne robmy dla zmennej otrzymując: Źródło df Su ma kwadratów Warancja F Regresja SSR 8 04,663 4 007,335 7864, 44 49 390,0 78 64,44 49 390,0 7,99 Błąd 5-- SSE 8 0,6030 676,769 Total 5-4 SST 36 35,93 czyl hpotezę o braku wpływu jeżel jest już w modelu także odrzucamy (wartość krytyczna taka sama 4,75).

Współczynnk częścowej determnacj Służy wyjaśnanu zmennośc wywoływanej przez daną zmenną objaśnającą przy założenu, że nne są ustalone. r Yk.( wszystke oprocz k) SST SSR SSR ( (wszystke k wszystke oprocz k) z k) + SSR( wszystke k oprocz k)

dla przykładu: r Y. 0. 956 r Y. 0. 8588 r Y. oznacza, że dla stałej zolacj dachu 96,6% zmennośc zużyca ol stycznu może być wyjaśnone przez zmenność średnej temperatury w tym mesącu.

Porównane paketów komputerowych. Nazwa Regre sja kroko wa Wszystk e możlwe regresje Wykres y resduó w Badane wpływu Przedza ły ufnośc dla µ Y SPSS x REGRESSION Tak Ne Tak Tak Ne SAS PROC GLM Ne Ne Tak Ne Tak PROC Tak Ne Ne Ne Ne STEPWISE PROC Ne Tak Ne Ne Ne RSQUARE PROC REG Ne Ne Tak Tak Tak Mntab REGRESS Ne Ne Tak Tak Tak STEPWISE Tak ne Ne Ne Ne STATGRAPHICS Tak ne Tak Tak Ne MYSTAT Ne ne Tak Tak Ne