Wkład 1: Prosta regresja liniowa Statstczn model regresji liniowej Dane dla prostej regresji liniowej Przedział ufności i test parametrów Przedział ufności dla średniej odpowiedzi Interwał prognoz (dla przszłch obserwacji)
Przkład: Obserwujem 9 mężczzn w wieku od 0 do 9 lat. Mierzm grubość fałdu skórnego i gęstość ciała: ID Iskin Den 1 1.7 1.093 1.56 1.063 3 1.45 1.078 4 1.5 1.056 5 1.51 1.073
Wkres punktow z linią najmniejszch kwadratów:
Dane wjściowe SAS (będziem często użwać oprogramowania do obliczeń): The SAS Sstem 17:47 Thursda, Jul, 004 5 The REG Procedure Model: MODEL1 Dependent Variable: Den Root MSE 0.00854 R-Square 0.704 Dependent Mean 1.06403 Adj R-Sq 0.7173 Coeff Var 0.805 Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr > t 99% Confidence Limits Intercept 1 1.16300 0.00656 177.30 <.0001 1.14574 1.1806 Iskin 1-0.0631 0.00414-15.3 <.0001-0.07403-0.051
Excel, dla tch samch danch:
SPSS, dla tch samch danch:
Przpomnienie Mieliśm zmienną objaśniającą (X) i zmienną odpowiedzi (Y). Zrobiliśm wkres punktowe, regresję najmniejszch kwadratów i korelację. Linia najmniejszch kwadratów to a + bx, gdzie a jest punktem przecięcia, a b jest nachleniem. Nie rozróżnialiśm jeszcze prób od populacji.
Stuacja dla prostej regresji liniowej Pomślim o linii regresji obliczonej z prób jako oszacowaniu linii regresji dla populacji. Tpe of line Least Squares Regression equation of line slope -intercept Ch. General ŷ a bx b a Ch. 10 Sample ˆ b0 b1x b 1 b 0 Ch. 10 Population 0 1x 1 0
Model statstczn dla prostej regresji liniowej: x i i i 0 1 Dane: n obserwacji w formie (x 1, 1 ), (x, ), (x n, n ). Przjmuje się, że odchlenia i są niezależne i normalne ze średnią 0 i odchleniem standardowm. Parametrami modelu są: 0, 1 oraz.
Dwie grup o tm samm SD i różnmi średnimi:
Regresja liniowa: wiele grup ze średnimi zależnmi liniowo od x
Rzeczwiste dane nie będą dokładnie pasować do linii regresji: DANE = DOPASOWANIE + RESZTA DOPASOWANIE to linia regresji (najmniejszch kwadratów) RESZTA ( szum ),, jest różnica międz danmi a tm, co przewiduje linia.
Wzor (nie zapamiętuj) Dane: Statstki pochodne: 1 1 1 1 0 0 1 1, 1 ) (, 1 ) (1 ) ˆ (, ˆ,, r n r SE b t n r s s x x s SE n n r s n s b b bx b a s s r b b b x i b i i i i x ) ( ) ( ) )( (, 1 ) (, 1 ) (,,, x x x x r n s n x x s x n i i i i i i x
Przedział ufności i test istotności dla nachlenia regresji i przechwtwania Przedział ufności na poziomie C dla przecięcia 0: * 0 b b t SE Przedział ufności na poziomie C dla nachlenia 1: * 1 b b t SE t * z tabeli t z n- stopniami swobod 0 1
Ćwiczenie: Oblicz przedział ufności dla średniego spadku gęstości ciała na jednostkę grubości fałd skór. Porównaj z wnikami obok.
Statstka: Testowanie hipotez dla H0: 1=0 t b 1 SE b1 To t-test z df = n. Gd 1 =0, to = 0, tj. średnia nie zmienia się z x. W przeciwnm razie mam "zależność liniową", tj. niezerowe nachlenie (populacjne). Oprogramowanie zapewni statstkę testu i dwustronną P-wartość. W większości przpadków tlko interpretujem wniki.
Test jednostronnej hipotez dla H0: 1=0 Statstka: t b 1 SE b1 df = n.
Ćwiczenie: Cz istnieje "liniowa zależność" międz gęstością ciała a grubością fałdu skórnego?
Przedział ufności dla średniej odpowiedzi, : * ˆ t SE ˆ To zależ od x. Specjalistczne oprogramowanie oblicza ten przedział. Na niektórch wkresach rozrzutu będą to pasma krzwoliniowe (wewnętrzne) wokół danch. Uwaga: Dane szacunkowe dla średniej mają mniejszą zmienność niż te dla indwidualnch obserwacji.
To zależ od x. Specjalistczne oprogramowanie poda ten przedział. Na niektórch wkresach rozrzutu będą to krzwoliniowe (zewnętrzne) pasma wokół danch. Uwaga: indwidualne obserwacje mają większą zmienność, więc ten przedział jest szersz niż poprzedni. Przedział predkcjne dla pojednczej obserwacji: * ˆ t SEˆ
PU dla średnich i dla indwidualnch obserwacji DEN (w funkcji Lskin)
Któr jest któr?
Wniki SAS: przedział ufności dla indwidualnch obserwacji i średnich (w zależności od x = lskin)
Średnia odpowiedź ma liniow związek z x. Ab sprawdzić, cz relacja jest w przbliżeniu liniowa, wkonuje się wkres rozproszenia lub wkres resztkow. Założenia dla regresji: Kolejne odpowiedzi są niezależne od siebie. Możem wkrć problem, odnosząc wartości rezdualne do numeru obserwacji (czasu). Dla każdej ustalonej wartości x odpowiedź zmienia się zgodnie z rozkładem normalnm. Ab sprawdzić założenie normalności, można wkonać normaln wkres kwantlow reszt.
Założenia dla regresji: cd. Odchlenie standardowe dla (σ) jest takie samo dla wszstkich wartości x. Wartość ta jest nieznana. Ab potwierdzić stałą zmienność, patrzm na wkres resztkow. Należ również sprawdzić odstające lub wpłwowe obserwacje przed użciem regresji (mogą one dramatcznie wpłnąć na wniki).
Reszta w funkcji nr obserwacji
Reszta w funkcji Lskin
(ładn) Normaln wkres kwantlow reszt