Rachunek prawdopodobieństwa i statystyka W 11: Analizy zależnościpomiędzy zmiennymi losowymi Model regresji wielokrotnej

Podobne dokumenty
Statystyka i opracowanie danych W 5: Odkrywanie i analiza zależności pomiędzy zmiennymi losowymi (danymi empirycznymi)

STATYSTYKA MATEMATYCZNA

Współczynnik korelacji liniowej oraz funkcja regresji liniowej dwóch zmiennych

Natalia Nehrebecka. Zajęcia 3

INFORMATYKA W SELEKCJI

Natalia Nehrebecka. Wykład 2

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 4

) będą niezależnymi zmiennymi losowymi o tym samym rozkładzie normalnym z następującymi parametrami: nieznaną wartością 1 4

Analiza zależności zmiennych ilościowych korelacja i regresja

RACHUNEK NIEPEWNOŚCI POMIARU

Dobór zmiennych objaśniających

Natalia Nehrebecka. Zajęcia 4

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

EKONOMETRIA Wykład 2: Metoda Najmniejszych Kwadratów

Hipotezy o istotności oszacowao parametrów zmiennych objaśniających ˆ ) ˆ

Weryfikacja hipotez dla wielu populacji

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Badanie współzaleŝności dwóch cech ilościowych X i Y. Analiza korelacji prostej. Badanie zaleŝności dwóch cech ilościowych. Analiza regresji prostej

Stanisław Cichocki. Natalia Nehrebecka. Wykład 11

Metody predykcji analiza regresji

Regresja liniowa i nieliniowa

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Statystyka. Zmienne losowe

Mikroekonometria 13. Mikołaj Czajkowski Wiktor Budziński

Markowa. ZałoŜenia schematu Gaussa-

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

W praktyce często zdarza się, że wyniki obu prób możemy traktować jako. wyniki pomiarów na tym samym elemencie populacji np.

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Natalia Nehrebecka. Dariusz Szymański


( ) ( ) 2. Zadanie 1. są niezależnymi zmiennymi losowymi o. oraz. rozkładach normalnych, przy czym EX. i σ są nieznane. 1 Niech X

Modele wieloczynnikowe. Modele wieloczynnikowe. Modele wieloczynnikowe ogólne. α β β β ε. Analiza i Zarządzanie Portfelem cz. 4.

Przypomnienie: wykłady i zadania kursu były zaczerpnięte z podręczników: Model statystyczny Format danych

Wnioskowanie statystyczne dla korelacji i regresji.

Prawdopodobieństwo i statystyka r.

Badania sondażowe. Braki danych Konstrukcja wag. Agnieszka Zięba. Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa

Badanie współzależności dwóch cech ilościowych X i Y. Analiza korelacji prostej

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 1-2

KURS STATYSTYKA. Lekcja 6 Regresja i linie regresji ZADANIE DOMOWE. Strona 1

STATYSTYKA MATEMATYCZNA WYKŁAD 5 WERYFIKACJA HIPOTEZ NIEPARAMETRYCZNYCH

Egzamin ze statystyki/ Studia Licencjackie Stacjonarne/ Termin I /czerwiec 2010

Zestaw zadań 4: Przestrzenie wektorowe i podprzestrzenie. Liniowa niezależność. Sumy i sumy proste podprzestrzeni.

SYSTEMY UCZĄCE SIĘ WYKŁAD 7. KLASYFIKATORY BAYESA. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

IID = 2. i i i i. x nx nx nx

CZĘŚĆ 6. MODEL REGRESJI, TREND LINIOWY ESTYMACJA, WNIOSKOWANIE

WPROWADZENIE DO ANALIZY KORELACJI I REGRESJI

termodynamika fenomenologiczna p, VT V, teoria kinetyczno-molekularna <v 2 > termodynamika statystyczna n(v) to jest długi czas, zachodzi

Analiza danych. Analiza danych wielowymiarowych. Regresja liniowa. Dyskryminacja liniowa. PARA ZMIENNYCH LOSOWYCH

Analiza regresji modele ekonometryczne

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Mikroekonometria 10. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

EKONOMETRIA Wykład 4: Model ekonometryczny - dodatkowe zagadnienia

Funkcje i charakterystyki zmiennych losowych

Rozkład dwupunktowy. Rozkład dwupunktowy. Rozkład dwupunktowy x i p i 0 1-p 1 p suma 1

Pokazać, że wyżej zdefiniowana struktura algebraiczna jest przestrzenią wektorową nad ciałem

Mikroekonometria 10. Mikołaj Czajkowski Wiktor Budziński

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

65120/ / / /200

System Przeciwdziałania Powstawaniu Bezrobocia na Terenach Słabo Zurbanizowanych SPRAWOZDANIE Z BADAŃ Autor: Joanna Wójcik

Zad 2 Dynamika zatrudnienia mierzona indeksami łańcuchowymi w ostatnich pięciu latach kształtowały się następująco: Lata Indeksy ( w %)

; -1 x 1 spełnia powyższe warunki. Ale

α i = n i /n β i = V i /V α i = β i γ i = m i /m

Zmienne losowe typu ciągłego. Parametry zmiennych losowych. Izolda Gorgol wyciąg z prezentacji (wykład III)

Ekonometria I materiały do ćwiczeń data lp wykładu temat Wykład dr Dorota Ciołek Ćwiczenia mgr inż. Marta Chylińska

Procedura normalizacji

; -1 x 1 spełnia powyższe warunki. Ale

Krzywa wieża w Pizie. SAS Data Step. Przykład (2) Wykład 13 Regresja liniowa

Analiza rodzajów skutków i krytyczności uszkodzeń FMECA/FMEA według MIL STD A

0 0,2 0, p 0,1 0,2 0,5 0, p 0,3 0,1 0,2 0,4

LINIOWA FUNKCJA PRAWDOPODOBIEŃSTWA

E K O N O M E T R I A

Mikroekonometria 7. Mikołaj Czajkowski Wiktor Budziński

Wykład 4 Testy zgodności. dystrybuanta rozkładu populacji dystrybuanty rozkładów dwóch populacji rodzaj rozkładu wartości parametrów.

Statystyka. Katarzyna Chudy Laskowska

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Pattern Classification

Trzecie laboratoria komputerowe ze Staty Testy

Statystyka Inżynierska

Linie regresji II-go rodzaju

opisać wielowymiarową funkcją rozkładu gęstości prawdopodobieństwa f(x 1 , x xn

Przedziały ufności i testy parametrów. Przedziały ufności dla średniej odpowiedzi. Interwały prognoz (dla przyszłych obserwacji)

ANALIZA SZEREGÓW CZASOWYCH

Parametry zmiennej losowej

Statystyka Opisowa 2014 część 2. Katarzyna Lubnauer

STATYSTYKA MATEMATYCZNA

ANALIZA SZEREGÓW CZASOWYCH

MODELOWANIE UKŁADÓW MECHANICZNYCH Z NIEPEWNYMI PARAMETRAMI

Mikroekonometria 15. Mikołaj Czajkowski Wiktor Budziński

TEORIA PORTFELA MARKOWITZA

Rozwiązania (lub wskazówki do rozwiązań) większości zadań ze skryptu STATYSTYKA: MATERIAŁY POMOCNICZE DO ZAJĘĆ oraz EGZAMINÓW Z LAT

Analiza korelacji i regresji

= σ σ. 5. CML Capital Market Line, Rynkowa Linia Kapitału

SZACOWANIE NIEPEWNOŚCI POMIARU METODĄ PROPAGACJI ROZKŁADÓW


BADANIE WSPÓŁZALEśNOŚCI DWÓCH CECH - ANALIZA KORELACJI PROSTEJ

EKONOMETRIA I Spotkanie 1, dn

Projekt 6 6. ROZWIĄZYWANIE RÓWNAŃ NIELINIOWYCH CAŁKOWANIE NUMERYCZNE

Ntli Natalia Nehrebecka. Dariusz Szymański. Zajęcia 4

Mikroekonometria 12. Mikołaj Czajkowski Wiktor Budziński

Transkrypt:

Rachunek prawdopodobeństwa statstka W 11: Analz zależnoścpomędz zmennm losowm Model regresj welokrotnej Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl

Model regresj lnowej Model regresj lnowej prostej przjmuje postać: Y = E(Y/X=x)= β 0 + β 1 x + ε gdze E(Y/X=x) oznacza wartość zmennej Y oczekwana prz warunku, że zmenna X przjme wartość x β 0, β 1 są współcznnkam regresj lnowej, ε oznacza składnk losow (błąd).

Metoda Najmnejszch Kwadratów ( ) = + = x b b b 0 ) ( 1 0 0 ( ) ( ) mn ) ( ˆ 1 0 + = x b b Wrażene Osągne mn wted tlko wted gd ( ) = + = x b b x b 0 ) ( 1 0 1

Regresja welomanowa dla n= ( ) ( ) mn ˆ 1 0 = x b b x b 1 0 ) ( ˆ x b b x b x f + + = = Współcznnk b 0, b 1 b wznaczm z układu trzech równań utworzonch z trzech pochodnch oblczonch względem zmennch b 0, b 1 b przrównanch do zera

Założena modelu lnowego Estmator b 0 b 1 współcznnków regresj β 0 β 1 wznaczone metodą najmnejszch kwadratów mają pożądane własnośc (efektwność, neobcążoność) jeśl spełnone są warunk: Model jest lnow względem parametrów, tzn. : = β 0 + β 1 x Lczba obserwacj n mus wększa lub równa lczbe szacowanch parametrów (współcznnków regresj) Składnk losow e ma wartość oczekwaną równą zero dla wszstkch =1,..,n, tzn. E(e ) =0 Warancja składnka losowego e (warancja reszt) jest taka sama dla wszstkch obserwacj War (e ) =σ dla wszstkch =1,,n Składnk losowe są neskorelowane, czl e oraz e j są od sebe nezależne j każd ze składnków losowch ma rozkład normaln

Interpretacja wnków oblczeń dla regresj lnowej

Werfkacja modelu Najważnejsze etap werfkacj modelu to: werfkacja mertorczna werfkacja statstczna W trakce werfkacj mertorcznej sprawdzam zgodność wnków uzskanch z modelu z wedzą teoretczną Jeśl werfkacja statstczna wskazuje na nedopasowane modelu, zwkle potwerdza sę to podczas werfkacj mertorcznej

Werfkacja statstczna modelu S e = n = 1 e n = 0,64385 Średne zużce palwa oblczane z równana regresj różną sę od wartośc emprcznch średno borąc o 0,64385 l Oblczone estmator współcznnków regresj odchlają sę od parametru b 0 = 3,830 41 o wartość S b0 = 0,450851, tj.o około 1 % b 1 =0,00386 o wartość S b1 = 0,000311, tj. o około 13% 0,450851 3,83041 0,117703 0,000311 0,00386 0,130344 Można zwerfkować dopasowane modelu na podstawe funkcj testowej t t= b /S b, t b0 = 8,495987 t b1 = 7,668 4 Najbardzej popularną marodajną oceną dopasowana modelu do danch emprcznch jest współcznnk determnacj R

Interpretacja współcznnka determnacj R Można pokazać, że n = 1 ( Całkowta suma kwadratów - CSK ) = n = 1 Wjaśnona przez model suma kwadratów - WSK CSK ( RSK WSK ˆ ) + n = 1 e Resztowa suma kwadratów RSK Zmenność newjaśnona przez model =b 1 x +b 0 x

R Interpretacja współcznnka determnacj R = R =0,777 oznacza, że 7,77% ogólnej zmennośc zmennej zależne zużca palwa, jest objaśnona przez równane regresj, w którm zmenną objaśnającą jest pojemność slnka. Uwag: wspólcznnk determnacj w pewnch okolcznoścach może dawać błędne wjaśnen zmennośc Y, np: gd n= wted zawsze R =1 gd n jest newele wększe od lepej stosować tzw poprawon R poprawone R, mów jak dobrze błob dopasowane nasze równane do nnej prób z tej samej populacj, zawsze jest mnejsze od R z prób gd w modelu ne uwzględnlśm wrazu wolnego tzn =b 1 x gd model jest nelnow n = 1 n = 1 ( ( WSK CSK gd zastosowano nną metodę nż MNK ˆ ) ) =

Inne wskaźnk dopasowana modelu Współcznnk zmennej zależnej względem zmennej nezależnej beta Wlczonch wartośc współcznnków regresj ne można porównwać ze względu na nne jednostk mar. Normalzujem równane regresj otrzmujem s = β Jeśl β = 0,853 oznacza to, że zmana zmennej nezależnej o jedno odchlene standardowe powoduje zmanę wartośc zależnej zmennej o 0,853 jej odchlena standardowego. Zaletą tej nterpretacj jest nezależność od jednostek mar Zauważm, że β = 0,853070 = r (współcznnkow korelacj lnowej. x s x x + e

Inne wskaźnk dopasowana modelu Oblczane elastcznośc Y względem X według wzoru b 1 X Y Pokazuje o le procent zmena sę wartość Y gd wartość X zmen sę o 1% 0,00386 * 1385,917/7,138 = 0,463 oznacza to, że w otoczenu średnch zmana pojemnośc slnka o 1% powoduje zmanę zużca palwa o około 0,5%

Werfkacja hpotez Należ zbadać stotność współcznnka kerunkowego ;Neodrzucene hpotez o braku wpłwu x na śwadcz o wadlwośc modelu stotność współcznnka determnacj stotność lnowego zwązku pomędz analzowanm zmennm

Regresja weloraka

Regresja weloraka W celu wkonana wkresu należ prawm przcskem msz klknąć w obrębe zmennej x - średna temperatura dobowa

Wkres rozrzutu z dopasowaną lną regresj

Regresja welomanowa

Analza zboru danch

Odkrwane analza zależnośc

Odkrwane analza zależnośc

Interpretacja wkresów powerzchnowch

Macerz korelacj

Korelacje cząstkowe Gd nteresuje nas zwązek pomędz dwema wbranm zmennm prz włączenu wpłwu pozostałch zmennch lczm współcznnk korelacj cząstkowej r 1.3 = r 1 (1 r 13 r 13 r 3 )(1 r 3 ) Zwązek korelacjn pomędz zmennm X 1 X, z włączenem dzałana zmennej X 3

Oblczane współcznnków korelacj w Statstca, gd zmenna objaśnana jest jednowmarowa, a zmennch nezależnch, rozpatrwanch ndwdualne, jest wele

Macerz korelacj

Macerz korelacj

Korelacje cząstkowe

Wkluczono wpłw lczb ludnośc Wkluczono wpłw lczb ludnośc, lczb mast udzału ludnośc mejskej