Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Podobne dokumenty
Rozdział 8. Regresja. Definiowanie modelu

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Wprowadzenie do analizy korelacji i regresji

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

KORELACJE I REGRESJA LINIOWA

Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

MODELE LINIOWE. Dr Wioleta Drobik

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno

e) Oszacuj parametry modelu za pomocą MNK. Zapisz postać modelu po oszacowaniu wraz z błędami szacunku.

Regresja i Korelacja

Wykład 4 Związki i zależności

Analiza regresji - weryfikacja założeń

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

ANALIZA REGRESJI SPSS

Statystyka i Analiza Danych

Metody Ilościowe w Socjologii

3. Modele tendencji czasowej w prognozowaniu

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

Zmienne zależne i niezależne

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

Analiza współzależności zjawisk

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

PDF created with FinePrint pdffactory Pro trial version

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Zaawansowana eksploracja danych - sprawozdanie nr 1 Rafał Kwiatkowski 89777, Poznań

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Wprowadzenie do technik analitycznych Metoda najmniejszych kwadratów

Zależność. przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna),

POLITECHNIKA OPOLSKA

Stanisław Cichocki. Natalia Nehrebecka. Wykład 4

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 9 marca 2007

WYKŁAD 8 ANALIZA REGRESJI

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Dopasowanie prostej do wyników pomiarów.

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Analiza regresji część II. Agnieszka Nowak - Brzezińska

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Analiza Współzależności

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Analiza składowych głównych

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 23 marca 2006

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

Szymon Bargłowski, sb39345 MODEL. 1. Równania rozpatrywanego modelu: 1 PKB t = a 1 a 2 E t a 3 Invest t 1

Przykład 2. Stopa bezrobocia

Prognozowanie na podstawie modelu ekonometrycznego

Stanisław Cichocki. Natalia Neherebecka. Zajęcia 15-17

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji

Funkcja liniowa - podsumowanie

Stosowana Analiza Regresji

ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ

Analiza składowych głównych. Wprowadzenie

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version

Regresja liniowa, klasyfikacja metodą k-nn. Agnieszka Nowak Brzezińska

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

W statystyce stopień zależności między cechami można wyrazić wg następującej skali: n 1

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Analiza zależności cech ilościowych regresja liniowa (Wykład 13)

Stanisław Cichocki. Natalia Nehrebecka

Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych. Laboratorium VIII: Analiza kanoniczna

Spis treści. LaboratoriumV: Podstawy korelacji i regresji. Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych

zestaw zadań nr 7 Cel: analiza regresji regresja prosta i wieloraka MODELE

Stanisław Cichocki. Natalia Nehrebecka

Ćwiczenia 10. Analiza regresji. Część I.

Ekonometria. Zajęcia

Metoda najmniejszych kwadratów

istocie dziedzina zajmująca się poszukiwaniem zależności na podstawie prowadzenia doświadczeń jest o wiele starsza: tak na przykład matematycy

JEDNORÓWNANIOWY LINIOWY MODEL EKONOMETRYCZNY

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

Modelowanie Ekonometryczne i Prognozowanie

1) 2) 3) 5) 6) 7) 8) 9) 10) 11) 12) 13) 14) 15) 16) 17) 18) 19) 20) 21) 22) 23) 24) 25)

Współliniowość zmiennych objaśniających: test Walda i test Studenta w badaniu istotności zmiennych objaśniających - przykłady.

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Egzamin ustny z matematyki semestr II Zakres wymaganych wiadomości i umiejętności

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

KALIBRACJA LINIOWA W ZAGADNIENIU WALIDACJI METOD POMIAROWYCH

ANALIZA RYNKU NIERUCHOMOŚCI PRZY ZASTOSOWANIU PROGRAMU GRETL

Projekt Era inżyniera pewna lokata na przyszłość jest współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

EKONOMETRIA STOSOWANA PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Analizy wariancji ANOVA (analysis of variance)

Transkrypt:

Regresja wieloraka

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna zmienna niezależna (można zobrazować na wykresie rozrzutu)

Regresja wieloraka Estymacja najmniejszych kwadratów: Program tak dobierze równanie tej linii, że suma kwadratów odległości punktów na wykresie rozrzutu od linii regresji będzie minimalna.

Równanie regresji Linia prosta w przestrzeni dwuwymiarowej (na płaszczyźnie): Y=a+b*X Stała- wyraz wolny, nachylenie- współczynnik regresji. W przypadku wielowymiarowym (mamy do czynienia z więcej niż jedną zmienną niezależną) linia regresji nie może już być tak prosto przedstawiona wizualnie w przestrzeni dwuwymiarowej. Postać równania: Y=a+b 1 *X 1 +b 2 *X 2 +...+b p *X p

Równanie regresji Y=a+b 1 *X 1 +b 2 *X 2 +...+b p *X p Współczynniki regresji (b) reprezentują niezależne wkłady każdej ze zmiennych niezależnych do predykcji zmiennej zależnej.

Równanie regresji Y=a+b 1 *X 1 +b 2 *X 2 +...+b p *X p Kierunek zależności od poszczególnej zmiennej ustala się na podstawie znaku wartości współczynnika regresji (b). Jeśli b ma wartość dodatnią- związek jest dodatni (wraz ze wzrostem zmiennej X rośnie wartość Y) Jeśli b jest ujemne- związek jest negatywny b=0 - między zmiennymi nie ma zależności

Równanie regresji Wartości przewidywane a wartości resztowe Linia regresji wyraża najlepszą predykcję zmiennej zależnej (Y) przy danych zmiennych niezależnych (X). Zazwyczaj mamy do czynienia z odchyleniami punktów pomiarowych od linii regresji Wartość resztowa: odchylenie danego punktu na wykresie od linii regresji (czyli od jego wartości przewidywanej)

Równanie regresji Wariancja resztowa a R2 Im mniejsza wariancja wartości resztowych wokół linii regresji w stosunku do zmienności ogólnej, tym lepsza jakość predykcji.

Wariancja resztowa a R2 Równanie regresji Brak zależności pomiędzy zmiennymi X i Y - stosunek zmienności resztowej Y do zmienności całkowitej równa się 1,0. X i Y ściśle (w sensie zależności funkcyjnej) zależne od siebie- zmienność resztowa równa się 0 i taki stosunek również 0,0. Najczęściej: stosunek zmienności resztowej Y do zmienności całkowitej zawiera się gdzieś pomiędzy tymi wartościami ekstremalnymi.

Wariancja resztowa a R2 Równanie regresji 1 minus ten stosunek= R2 (współczynnik determinacji)- wskaźnik jakości dopasowania modelu do danych Bliski 1,0 wskazuje, że prawie cała zmienność zmiennej zależnej może być objaśniona przez zmienne niezależne włączone do modelu).

Wariancja resztowa a R2 Równanie regresji 1 minus ten stosunek= R2 (współczynnik determinacji)- wskaźnik jakości dopasowania modelu do danych Interpretacja: Gdyby wartość R2 wynosiła 0,4 wówczas wiadomo byłoby, że wariancja wartości Y wokół linii regresji wynosi 1-0,4 razy pierwotna wariancja Y (40% pierwotnej zmienności Y zostało wytłumaczone przez regresję, a 60% pozostało w zmienności resztowej).

Równanie regresji Interpretacja współczynnika korelacji R Stopień, w jakim dwie lub więcej zmiennych objaśniających (niezależnych lub X) jest powiązanych ze zmienną objaśnianą (zmienna zależna Y), wyrażany jest przez wartość współczynnika korelacji R (pierwiastek kwadratowy z R2). W regresji wielorakiej R może przyjmować wartości pomiędzy 0 i 1.

Równanie regresji Założenia i ograniczenia założenie braku obserwacji odstających (normalności rozkładów zmiennych) założenie liniowości założenie normalności reszt wybór liczby zmiennych

Założenia i ograniczenia Równanie regresji Założenie braku obserwacji odstających: należy przeanalizować pod tym kątem wykresy P-P. histogramy, przeprowadzić testy normalności. 1,4 1,2 1,0 0,8 0,6 0,4 Dystrybuanta empiryczna 0,2 0,0-0,2-0,4-0,2 0,0 0,2 0,4 0,6 0,8 1,0 1,2 Dystrybuanta teoretyczna

Założenia i ograniczenia Równanie regresji Założenie liniowości: założenie, że zależność między zmiennymi jest liniowa. Rada: przeanalizowanie pod tym kątem dwuwymiarowych wykresów rozrzutu badanych zmiennych.

Założenia i ograniczenia Równanie regresji Założenie normalności reszt: reszty (różnice między wartością obserwowaną a obliczoną z równania regresji) podlegają rozkładowi normalnemu.

Założenia i ograniczenia Równanie regresji Wybór liczby zmiennych: Zaleca się, aby brać do analizy przynajmniej około 10 do 20 razy więcej przypadków niż występuje w niej zmiennych. W przeciwnym wypadku oceny linii regresji będą bardzo niestabilne i będą się silnie zmieniać wraz ze wzrostem liczby przypadków.