WYKŁAD 3 BADANIE ZALEśNOŚCI CECHY Y OD CECHY X - ANALIZA REGRESJI PROSTEJ
Było: Przykład. Z dziesięciu poletek doświadczalnych zerano plony ulw ziemniaczanych (cecha X) i oznaczono w nich procentową zawartość skroi (cecha Y). Wyniki zestawiono w taeli: plon x i 20 2 22 23 22 25 30 27 24 26 zawartość skroi y i 7, 6,9 7,0 6,8 6,9 6,5 6,3 6,6 6,5 6,4 Diagram korelacyjny zawartość skroi (%) 7,2 7, 7 6,9 6,8 6,7 6,6 6,5 6,4 6,3 6,2 8 20 22 24 26 28 30 32 Analiza korelacji przeprowadzona przy poziomie istotności 0,05 wykazała istotną korelację między plonem ulw a zawartością skroi. Wyznaczono współczynnik korelacji Pearsona r -0,90. Plon ulw i zawartość skroi są ujemnie skorelowane. plon O tej zaleŝności moŝna powiedzieć więcej (wzór zaleŝności, idea opisu)...
Opis zaleŝności cechy Y od cechy X (regresji cechy Y względem cechy X) terminologia cecha X : ojaśniająca, opisująca, niezaleŝna cecha Y : ojaśniana, opisywana, zaleŝna Postać funkcji regresji II rodzaju: g (x) β x + β 0 lu g (x) β x + α β współczynnik regresji, β 0 stała regresji Statgraphics: Linear model: Y a + X współczynnik regresji (ang. slope), a stała regresji (ang. intercept)
X, Y cechy oserwowane w doświadczeniu, Y~N n licza jednostek doświadczalnych, Próa: wartości cechy X: x x 2 x 3... x n wartości cechy Y: y y 2 y 3... y n Diagram korelacyjny: cecha Y ˆ ˆ β β, 0 0 prosta regresji równanie prostej regresji: y x + 0, cecha X - współczynnik regresji, 0 - stała regresji.
Estymacja parametrów β i β 0 metodą najmniejszych kwadratów (MNK): Komentarz... cecha Y równanie prostej regresji: y x + 0,? 0? y(x i ) y i e i y( x i ) x i + 0, e i y( x i ) y i x i cecha X n i e 2 i min
Estymatory uzyskane metodą najmniejszych kwadratów: n i i n ( x x) ( y y) ( x ) i x i i 2, 0 y x
Oznaczenia upraszczające zapis wzoru: SS x n ( x ) i x i 2, SS y n ( y ) i y i 2, S xy n ( x ) ( ) i x yi y i Określenia: SS x suma kwadratów odchyleń dla cechy X, SS y suma kwadratów odchyleń dla cechy Y, S xy suma iloczynów odchyleń dla cech X, Y.
Estymatory uzyskane metodą najmniejszych kwadratów: S xy SS x y x, 0 Interpretacja współczynnika regresji...
Czy adana zaleŝność jest znacząca (istotna)? Stawiamy hipotezę: H 0 : β 0, H : β 0 (hipoteza o raku regresji) poziom istotności α, test t Studenta: gdzie: t emp s, s SS y S xy ( n 2) SSx t kryt t α, v n 2
WNIOSKOWANIE Jeśli t emp > t kryt to H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŝna odrzucić. test F - Fishera: F emp Sxy ( n 2) SS y S xy F F kryt α, v,v2 n 2 WNIOSKOWANIE Jeśli F emp > F kryt to H 0 odrzucamy, w przeciwnym przypadku H 0 nie moŝna odrzucić.
W przykładzie: n0, x 24 kg, y 6,7%, SS x 84, SS y 0,68, S xy -6,8. Wyznaczamy równanie prostej regresji: S 6, 8 84 xy, SSx 0 08 y x 6, 7 ( 0, 08) 24 8, 64 0 prosta regresji: y 8,64 0,08x., Badamy istotność regresji (zaleŝności): poziom istotności α 0,05 H 0 : β 0 (hipoteza o raku regresji), H : β 0,
test t Studenta: s SS S 0, 68 ( 0, 08) ( 6, 8) 0292, y xy ( n 2) SSx ( 0 2) 84 672 0, 04, t emp s 0, 08 0, 04, 5 79, t t 0,05, 8 kryt 2,3 WNIOSKOWANIE t emp 5,79 > 2,3 t kryt, zatem H 0 odrzucamy. Stwierdzamy statystycznie istotną zaleŝność zawartości skroi od plonu ulw ziemniaka.
test F - Fishera: F S ( n 2) ( 0, 08) ( 6, 8) (0-2) 4, 4064 xy emp SS y S xy 0, 68 ( 0, 08) ( 6, 8) 0292, 34, F emp 34, F 5, 32 Fkryt 0,05,, 8 WNIOSKOWANIE Jeśli F emp 34, > 5,32 F kryt, zatem H 0 odrzucamy.
Independent variale: plon Standard T Parameter Estimate Error Statistic P-Value Intercept 8,6429 0,33568 55,5478 0,0000 Slope -0,0809524 0,038832-5,83095 0,0004 Analysis of Variance Source Sum of Squares Df Mean Square F-Ratio P-Value Model 0,550476 0,550476 34,00 0,0004 Residual 0,29524 8 0,06905 Total (Corr.) 0,68 9 Correlation Coefficient -0,899735 R-squared 80,9524 percent Standard Error of Est. 0,27242 The StatAdvisor --------------- The output shows the results of fitting a linear model to descrie the relationship etween skroia and plon. The equation of the fitted model is skroia 8,6429-0,0809524*plon
Plot of Fitted Model 7, 6,9 skroia 6,7 6,5 6,3 20 22 24 26 28 30 plon
Interpretacja współczynnika regresji prosta regresji y 0 + x, Jeśli wartość cechy X wzrośnie o jednostkę (w jednostkach cechy X), to wartość cechy Y zmieni się o jednostek (w jednostkach cechy Y), a dokładniej.: wzrośnie, gdy > 0; zmaleje, gdy < 0. Interpretacja współczynnika regresji w przykładzie: prosta regresji y 8,64 0,08x, -0, 08. Jeśli plon z ulw ziemniaka wzrośnie o kg, to zawartość skroi zmniejszy się o 0,08%.
Współczynnik determinacji d: d r 2 00%, r współczynnik korelacji, Interpretacja współczynnika determinacji: współczynnik d oznacza, jaka część zmienności cechy Y jest ojaśniona (wytłumaczona) zmiennością cechy X. Oliczanie i interpretacja współczynnika determinacji d w przykładzie: r - 0,9, to d 0,8 00% 8% W 8% zmienność zawartości skroi jest wytłumaczona zmiennością plonu, natomiast 9% zmienności zawartości skroi nie jest wytłumaczona zmiennością plonu.
Independent variale: plon Standard T Parameter Estimate Error Statistic P-Value Intercept 8,6429 0,33568 55,5478 0,0000 Slope -0,0809524 0,038832-5,83095 0,0004 Analysis of Variance Source Sum of Squares Df Mean Square F-Ratio P-Value Model 0,550476 0,550476 34,00 0,0004 Residual 0,29524 8 0,06905 Total (Corr.) 0,68 9 Correlation Coefficient -0,899735 R-squared 80,9524 percent Standard Error of Est. 0,27242 The StatAdvisor --------------- The output shows the results of fitting a linear model to descrie the relationship etween skroia and plon. The equation of the fitted model is skroia 8,6429-0,0809524*plon Praktyczne warunki ustalania cechy zaleŝnej i niezaleŝnej... Wykorzystanie prostej regresji...