BADANIE ZALEśNOŚCI CECHY Y OD CECHY X - ANALIZA REGRESJI PROSTEJ

Podobne dokumenty
Statystyka matematyczna dla kierunku Rolnictwo w SGGW. BADANIE WSPÓŁZALEśNOŚCI DWÓCH CECH. ANALIZA KORELACJI PROSTEJ.

Matematyka i statystyka matematyczna dla rolników w SGGW

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe

PDF created with FinePrint pdffactory Pro trial version

KORELACJA 1. Wykres rozrzutu ocena związku między zmiennymi X i Y. 2. Współczynnik korelacji Pearsona

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT. Anna Rajfura 1

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

Rozdział 8. Regresja. Definiowanie modelu

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9

Analiza zależności cech ilościowych regresja liniowa (Wykład 13)

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 11 DOŚWIADCZENIE JEDNOCZYNNIKOWE W UKŁADZIE CAŁKOWICIE LOSOWYM PORÓWNANIA SZCZEGÓŁOWE

(LMP-Liniowy model prawdopodobieństwa)

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Stosowana Analiza Regresji

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Stanisław Cichocki. Natalia Nehrebecka. Wykład 4

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8

PAKIETY STATYSTYCZNE

Korelacja krzywoliniowa i współzależność cech niemierzalnych

Badanie współzaleŝności dwóch cech ilościowych X i Y. Analiza korelacji prostej. Badanie zaleŝności dwóch cech ilościowych. Analiza regresji prostej

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Badanie współzależności dwóch cech ilościowych X i Y. Analiza korelacji prostej

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Testowanie hipotez statystycznych cd.

Testowanie hipotez statystycznych

Model regresji wielokrotnej Wykład 14 ( ) Przykład ceny domów w Chicago

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Testowanie hipotez statystycznych

Permutacyjna metoda oceny istotności regresji

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Testowanie hipotez statystycznych

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Analiza współzależności zjawisk

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Regresja liniowa wprowadzenie

WYKŁAD 8 ANALIZA REGRESJI

Zależność. przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna),

X WYKŁAD STATYSTYKA. 14/05/2014 B8 sala 0.10B Godz. 15:15

ĆWICZENIE 11 ANALIZA KORELACJI I REGRESJI

Testowanie hipotez statystycznych

Wprowadzenie do analizy korelacji i regresji

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

STATYSTYKA MATEMATYCZNA

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski

Diagnostyka w Pakiecie Stata

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Analiza wariancji w analizie regresji - weryfikacja prawdziwości przyjętego układu ograniczeń Problem Przykłady

Analiza wariancji. Źródło: Aczel A. D. Statystyka w zarządzaniu. Barbara Gładysz

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

Analiza współzależności dwóch cech I

Egzamin z ekonometrii wersja IiE, MSEMAT

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

PODSTAWY STATYSTYCZNEJ ANALIZY DANYCH

WPŁYW WARUNKÓW TERMICZNO-ŚWIETLNYCH NA CZAS TRWANIA FAZ ROZWOJOWYCH PSZENICY JAREJ. Dr hab. Alicja Sułek Dr Anna Nieróbca

Ekonometria dla IiE i MSEMat Z7

Modele nieliniowe sprowadzalne do liniowych

Analiza wariancji. Źródło: Aczel A. D. Statystyka w zarządzaniu. Barbara Gładysz

Statystyczna analiza danych 1

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Ekonometria. Weryfikacja liniowego modelu jednorównaniowego. Jakub Mućk. Katedra Ekonomii Ilościowej

MODELE LINIOWE. Dr Wioleta Drobik

Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych

Ekonometria. Prognozowanie ekonometryczne, ocena stabilności oszacowań parametrów strukturalnych. Jakub Mućk. Katedra Ekonomii Ilościowej

Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

W statystyce stopień zależności między cechami można wyrazić wg następującej skali: n 1

Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Diagnostyka w Pakiecie Stata

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Ekonometria. Zajęcia

Metody Ilościowe w Socjologii

POLITECHNIKA OPOLSKA

JEDNOCZYNNIKOWA ANALIZA WARIANCJI, ANOVA

Estymacja punktowa i przedziałowa

Analiza wariancji i kowariancji

Ekonometria dla IiE i MSEMat Z12

KORELACJE I REGRESJA LINIOWA

Testy post-hoc. Wrocław, 6 czerwca 2016

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

Wykład 4 Związki i zależności

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Transkrypt:

WYKŁAD 3 BADANIE ZALEśNOŚCI CECHY Y OD CECHY X - ANALIZA REGRESJI PROSTEJ

Było: Przykład. Z dziesięciu poletek doświadczalnych zerano plony ulw ziemniaczanych (cecha X) i oznaczono w nich procentową zawartość skroi (cecha Y). Wyniki zestawiono w taeli: plon x i 20 2 22 23 22 25 30 27 24 26 zawartość skroi y i 7, 6,9 7,0 6,8 6,9 6,5 6,3 6,6 6,5 6,4 Diagram korelacyjny zawartość skroi (%) 7,2 7, 7 6,9 6,8 6,7 6,6 6,5 6,4 6,3 6,2 8 20 22 24 26 28 30 32 Analiza korelacji przeprowadzona przy poziomie istotności 0,05 wykazała istotną korelację między plonem ulw a zawartością skroi. Wyznaczono współczynnik korelacji Pearsona r -0,90. Plon ulw i zawartość skroi są ujemnie skorelowane. plon O tej zaleŝności moŝna powiedzieć więcej (wzór zaleŝności, idea opisu)...

Opis zaleŝności cechy Y od cechy X (regresji cechy Y względem cechy X) terminologia cecha X : ojaśniająca, opisująca, niezaleŝna cecha Y : ojaśniana, opisywana, zaleŝna Postać funkcji regresji II rodzaju: g (x) β x + β 0 lu g (x) β x + α β współczynnik regresji, β 0 stała regresji Statgraphics: Linear model: Y a + X współczynnik regresji (ang. slope), a stała regresji (ang. intercept)

X, Y cechy oserwowane w doświadczeniu, Y~N n licza jednostek doświadczalnych, Próa: wartości cechy X: x x 2 x 3... x n wartości cechy Y: y y 2 y 3... y n Diagram korelacyjny: cecha Y ˆ ˆ β β, 0 0 prosta regresji równanie prostej regresji: y x + 0, cecha X - współczynnik regresji, 0 - stała regresji.

Estymacja parametrów β i β 0 metodą najmniejszych kwadratów (MNK): Komentarz... cecha Y równanie prostej regresji: y x + 0,? 0? y(x i ) y i e i y( x i ) x i + 0, e i y( x i ) y i x i cecha X n i e 2 i min

Estymatory uzyskane metodą najmniejszych kwadratów: n i i n ( x x) ( y y) ( x ) i x i i 2, 0 y x

Oznaczenia upraszczające zapis wzoru: SS x n ( x ) i x i 2, SS y n ( y ) i y i 2, S xy n ( x ) ( ) i x yi y i Określenia: SS x suma kwadratów odchyleń dla cechy X, SS y suma kwadratów odchyleń dla cechy Y, S xy suma iloczynów odchyleń dla cech X, Y.

Estymatory uzyskane metodą najmniejszych kwadratów: S xy SS x y x, 0 Interpretacja współczynnika regresji...

Czy adana zaleŝność jest znacząca (istotna)? Stawiamy hipotezę: H 0 : β 0, H : β 0 (hipoteza o raku regresji) poziom istotności α, test t Studenta: gdzie: t emp s, s SS y S xy ( n 2) SSx t kryt t α, v n 2

WNIOSKOWANIE Jeśli t emp > t kryt to H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŝna odrzucić. test F - Fishera: F emp Sxy ( n 2) SS y S xy F F kryt α, v,v2 n 2 WNIOSKOWANIE Jeśli F emp > F kryt to H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŝna odrzucić.

W przykładzie: n0, x 24 kg, y 6,7%, SS x 84, SS y 0,68, S xy -6,8. Wyznaczamy równanie prostej regresji: S 6, 8 84 xy, SSx 0 08 y x 6, 7 ( 0, 08) 24 8, 64 0 prosta regresji: y 8,64 0,08x., Badamy istotność regresji (zaleŝności): poziom istotności α 0,05 H 0 : β 0 (hipoteza o raku regresji), H : β 0,

test t Studenta: s SS S 0, 68 ( 0, 08) ( 6, 8) 0292, y xy ( n 2) SSx ( 0 2) 84 672 0, 04, t emp s 0, 08 0, 04, 5 79, t t 0,05, 8 kryt 2,3 WNIOSKOWANIE t emp 5,79 > 2,3 t kryt, zatem H 0 odrzucamy. Stwierdzamy statystycznie istotną zaleŝność zawartości skroi od plonu ulw ziemniaka.

test F - Fishera: F S ( n 2) ( 0, 08) ( 6, 8) (0-2) 4, 4064 xy emp SS y S xy 0, 68 ( 0, 08) ( 6, 8) 0292, 34, F emp 34, F 5, 32 Fkryt 0,05,, 8 WNIOSKOWANIE Jeśli F emp 34, > 5,32 F kryt, zatem H 0 odrzucamy.

Independent variale: plon Standard T Parameter Estimate Error Statistic P-Value Intercept 8,6429 0,33568 55,5478 0,0000 Slope -0,0809524 0,038832-5,83095 0,0004 Analysis of Variance Source Sum of Squares Df Mean Square F-Ratio P-Value Model 0,550476 0,550476 34,00 0,0004 Residual 0,29524 8 0,06905 Total (Corr.) 0,68 9 Correlation Coefficient -0,899735 R-squared 80,9524 percent Standard Error of Est. 0,27242 The StatAdvisor --------------- The output shows the results of fitting a linear model to descrie the relationship etween skroia and plon. The equation of the fitted model is skroia 8,6429-0,0809524*plon

Plot of Fitted Model 7, 6,9 skroia 6,7 6,5 6,3 20 22 24 26 28 30 plon

Interpretacja współczynnika regresji prosta regresji y 0 + x, Jeśli wartość cechy X wzrośnie o jednostkę (w jednostkach cechy X), to wartość cechy Y zmieni się o jednostek (w jednostkach cechy Y), a dokładniej.: wzrośnie, gdy > 0; zmaleje, gdy < 0. Interpretacja współczynnika regresji w przykładzie: prosta regresji y 8,64 0,08x, -0, 08. Jeśli plon z ulw ziemniaka wzrośnie o kg, to zawartość skroi zmniejszy się o 0,08%.

Współczynnik determinacji d: d r 2 00%, r współczynnik korelacji, Interpretacja współczynnika determinacji: współczynnik d oznacza, jaka część zmienności cechy Y jest ojaśniona (wytłumaczona) zmiennością cechy X. Oliczanie i interpretacja współczynnika determinacji d w przykładzie: r - 0,9, to d 0,8 00% 8% W 8% zmienność zawartości skroi jest wytłumaczona zmiennością plonu, natomiast 9% zmienności zawartości skroi nie jest wytłumaczona zmiennością plonu.

Independent variale: plon Standard T Parameter Estimate Error Statistic P-Value Intercept 8,6429 0,33568 55,5478 0,0000 Slope -0,0809524 0,038832-5,83095 0,0004 Analysis of Variance Source Sum of Squares Df Mean Square F-Ratio P-Value Model 0,550476 0,550476 34,00 0,0004 Residual 0,29524 8 0,06905 Total (Corr.) 0,68 9 Correlation Coefficient -0,899735 R-squared 80,9524 percent Standard Error of Est. 0,27242 The StatAdvisor --------------- The output shows the results of fitting a linear model to descrie the relationship etween skroia and plon. The equation of the fitted model is skroia 8,6429-0,0809524*plon Praktyczne warunki ustalania cechy zaleŝnej i niezaleŝnej... Wykorzystanie prostej regresji...