Regresja i Korelacja

Podobne dokumenty
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

PDF created with FinePrint pdffactory Pro trial version

Analiza współzależności zjawisk

Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka

Wprowadzenie do analizy korelacji i regresji

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Analiza współzależności dwóch cech I

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

Rozdział 8. Regresja. Definiowanie modelu

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Zależność. przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna),

X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

MODELE LINIOWE. Dr Wioleta Drobik

POLITECHNIKA OPOLSKA

REGRESJA (postać liniowa funkcji) - ROZWIĄZANIA Komentarze kursywą, rozwiązania oraz treści zadań pismem prostym.

KORELACJE I REGRESJA LINIOWA

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Statystyka. Wykład 9. Magdalena Alama-Bućko. 7 maja Magdalena Alama-Bućko Statystyka 7 maja / 40

Regresja linearyzowalna

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

3. Modele tendencji czasowej w prognozowaniu

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Stosowana Analiza Regresji

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Statystyka i Analiza Danych

Metody Ilościowe w Socjologii

Analiza Współzależności

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Analiza korelacji

STATYSTYKA MATEMATYCZNA

Statystyka. Wykład 8. Magdalena Alama-Bućko. 23 kwietnia Magdalena Alama-Bućko Statystyka 23 kwietnia / 38

Spis treści 3 SPIS TREŚCI

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Statystyczna analiza danych

WYKŁAD 8 ANALIZA REGRESJI

Korelacja krzywoliniowa i współzależność cech niemierzalnych

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski

Agnieszka Nowak Brzezińska

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 9 marca 2007

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

ĆWICZENIE 11 ANALIZA KORELACJI I REGRESJI

Modelowanie zależności. Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

STATYSTYKA MATEMATYCZNA

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

Statystyka matematyczna dla kierunku Rolnictwo w SGGW. BADANIE WSPÓŁZALEśNOŚCI DWÓCH CECH. ANALIZA KORELACJI PROSTEJ.

e) Oszacuj parametry modelu za pomocą MNK. Zapisz postać modelu po oszacowaniu wraz z błędami szacunku.

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8

Analiza zależności cech ilościowych regresja liniowa (Wykład 13)

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

ANALIZA REGRESJI SPSS

METODY STATYSTYCZNE W BIOLOGII

W statystyce stopień zależności między cechami można wyrazić wg następującej skali: n 1

Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna

EKONOMETRIA. Prof. dr hab. Eugeniusz Gatnar.

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Analiza składowych głównych. Wprowadzenie

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych

Analiza zależności zmiennych ilościowych regresja

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Ćwiczenie 5 PROGNOZOWANIE

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska

Statystyka. Wykład 10. Magdalena Alama-Bućko. 14 maja Magdalena Alama-Bućko Statystyka 14 maja / 31

Pojęcie korelacji. Korelacja (współzależność cech) określa wzajemne powiązania pomiędzy wybranymi zmiennymi.

STATYSTYKA MATEMATYCZNA

X WYKŁAD STATYSTYKA. 14/05/2014 B8 sala 0.10B Godz. 15:15

Statystyka opisowa Opracował: dr hab. Eugeniusz Gatnar, prof. WSBiF

Ekonometria. Dobór postaci analitycznej, transformacja liniowa i estymacja modelu KMNK. Paweł Cibis 23 marca 2006

czerwiec 2013 Uwaga: Przy rozwiązywaniu zadań, jeśli to konieczne, należy przyjąć poziom istotności 0,1 i współczynnik ufności 0,90

Z poprzedniego wykładu

STATYSTYKA MATEMATYCZNA

STATYSTYKA OPISOWA. Dr Alina Gleska. 12 listopada Instytut Matematyki WE PP

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

JEDNORÓWNANIOWY LINIOWY MODEL EKONOMETRYCZNY

Metoda najmniejszych kwadratów

Transkrypt:

Regresja i Korelacja

Regresja i Korelacja W przyrodzie często obserwujemy związek między kilkoma cechami, np.: drzewa grubsze są z reguły wyższe, drewno iglaste o węższych słojach ma większą gęstość, impregnowane drewno dłużej się pali. Takie obserwacje bywają bardzo pomocne, dlatego ważne jest poznanie metod analizy zależności (współzależności, współwystępowania) cech, ponieważ pozwalają one poznać charakter obserwowanych zależności, sprawdzić czy rzeczywiście istnieją (nie są pozorne) a także opisać przy pomocy formuł matematycznych ilościowe relacje między zmiennymi.

Regresja i Korelacja Charakter zależności oraz liczba analizowanych zmiennych decyduje o wyborze metody analizy danych. Na początek poznajmy sposoby analizy liniowej zależności dwóch zmiennych Przeanalizujmy zależność między dwiema zmiennymi: X oraz Y. Zmienną Y będziemy określać jako zmienną zależną (objaśnianą), natomiast zmienną X jako zmienną niezależną (objaśniającą). Jeżeli zmienne X i Y są ze sobą powiązane to charakter takiej zależności może być dwojakiego rodzaju:

- jeżeli konkretnej wartości zmiennej X odpowiada tylko jedna wartość zmiennej Y to występuje wtedy zależność o charakterze funkcyjnym, Y 30 25 Y 30 25 20 20 15 15 10 10 5 5 0 0 10 20 30 40 X 0 0 10 20 30 40 X

- jeżeli danej wartości zmiennej X odpowiada kilka możliwych wartości zmiennej Y wtedy mówimy o zależności o charakterze korelacyjnym. (zmienność wyników obserwacji) Zależności takie mogą mieć charakter przyczynowy lub pozorny

Cele badania współzależności: stwierdzenie czy obserwowana relacja jest statystycznie istotna, uzyskanie liczbowych miar charakteryzujących relację, dostarczenie możliwości prognozowania (predykcji) wartości jednej zmiennej gdy znana jest wartość drugiej zmiennej.

Wymienione cele analizy zależności można zrealizować przez podanie wzoru funkcji aproksymującej przebieg badanej zależności oraz obliczenie współczynników pokazujących jej siłę i charakter. Czego dotyczą pojęcia regresja i korelacja? Termin regresja dotyczy kształtu zależności pomiędzy cechami (a więc liczby parametrów i rodzaju funkcji aproksymującej). Pojęcie korelacji dotyczy siły badanej współzależności.

Celem analizy regresji jest wyznaczenie funkcji przebiegającej przez zbiór punktów. Linia, o której mowa, nazywa się linią regresji albo linią trendu. Współczynniki takiej funkcji są szacowane w taki sposób, by suma kwadratów odchyleń punktów pomiarowych od tej linii była jak najmniejsza. Metoda ta nosi nazwę metody najmniejszych kwadratów

Linią (krzywą) regresji nazywamy wykres zależności E(y x) od x. Przedstawia więc ona zmianę przeciętnych wartości zmiennej Y dla ustalonych wartości zmiennej X i jest funkcją o wzorze ogółnym: f(x)=a+b*x Poszukiwane wartości zmiennej Y będą się odchylać od linii regresji o pewną losową wartość δ. Tak więc funkcję regresji możemy przedstawić wzorem: Y=f(X)+δ Funkcja ta nosi nazwę modelu regresji.

Najważniejszym miernikiem siły związku prostoliniowego między dwiema cechami mierzalnymi jest współczynnik korelacji liniowej Pearsona lub krócej współczynnik korelacji. ) ( ) ( ), cov( y s x s y x r gdzie: cov(x,y) kowariancja dwuwymiarowej zmiennej losowej XY, s(x), s(y) odchylenia standardowe zmiennych X i Y. 1 ) ( ) ( ), cov( 1 n y x n i i i y y x x

Inną miarą siły związku między zmiennymi są wsóczynnik determinacj (R 2 ). Współczynnik determinacji wskazuje jaką część zmienności cechy Y możemy opisać za pomocą zmienności cechy X.

Po określeniu wartości współczynnika korelacji należy sprawdzić, czy jego wartość (określona na podstawie próby) oddaje rzeczywiste relacje zachodzące w populacji generalnej, a więc czy korelacja określona dla próby nie jest zdarzeniem losowym. Test istotności współczynników korelacji opiera się na założeniu o normalności rozkładu wartości resztowych (odchyleń od linii regresji) zmiennej y, oraz o równości wariancji wartości resztowych dla wszystkich wartości zmiennej niezależnej x. W przypadku znacznych odchyłek od tych założeń zachodzi konieczność zastosowania testów nieparametrycznych.

Regresja nieliniowa

Regresja nieliniowa Regresja nieliniowa stanowi ogólną procedurę dopasowania, która służy do oszacowania dowolnego rodzaju zależności między zmienną zależną (objaśnianą) a zmiennymi niezależnymi. W regresji nieliniowej modele możemy ogólnie wyrazić zależnością: y = F(x1, x2,..., xn) + ε gdzie F(x1,...) oznacza dowolną funkcję, za pomocą której sami możemy określić typ zależności. Na przykład możemy przyjąć, że zmienna zależna jest funkcją logarytmiczną lub wykładniczą zmiennych niezależnych.

Regresja nieliniowa Z dowolnością doboru modelu funkcji, na podstawie której budowany jest model regresji wiąże się kilka problemów: Jak wywnioskować o postaci modelu, czyli jaka faktycznie występuje zależność pomiędzy zmiennymi? Jaki rodzaj estymacji zastosować? Jak otrzymane zależności sensownie zinterpretować?

Regresja nieliniowa modele linearyzowane W przypadku niektórych funkcji o nieliniowym przebiegu poprzez odpowiednią transformację zmiennych lub parametrów możemy sprowadzić je do prostszej postaci liniowej. W analizach tego typu należy postępować bardzo rozważnie, gdyż stosując nieodpowiednią transformację, możemy doprowadzić do nietrafnego modelu.

Regresja nieliniowa estymacja modelu Zadanie Podczas realizacji projektu badawczego dotyczącego Oszacowania akumulacji węgla przez sosnowe kompleksy leśne w zachodniej Polsce pomierzono pierśnice i wysokości 90 drzew próbnych po czym określono suchą masę drewna tych drzew. Opracuj możliwie najlepiej dopasowany model regresji pozwalający na obliczanie masy drewna na podstawie pierśnicy

Regresja nieliniowa segmentacja Zadanie Podczas realizacji projektu: Ekologiczne konsekwencje sukcesji wtórnej brzozy brodawkowatej (Betula pendula Roth.) na gruntach porolnych obliczono masę igieł na 100 drzewach. Opracuj możliwie najlepiej dopasowany model regresji wykorzystujący zależność masy igieł od wysokości a później od wieku drzew, poszukaj najlepszych punktów przełamania