Wkład 13: (prota) regreja lnowa Model tattczn Format danch Przedzał ufnośc tet totnośc dla parametrów modelu Przpomnene: wkład zadana kuru bł zaczerpnęte z podręcznków: Stattka dla tudentów kerunków techncznch przrodnczch, J. Koronack, J. Melnczuk, WNT 004, wd. II Introducton to the Practce of Stattc, D. Moore, G. McCabe, Freeman 003, wd. IV Stattc for the Lfe Scence, M. Samuel, J. Wtmer, 003, wd. III H. Jaulewcz W. Kordeck \Rachunek prawdopodobeńtwa tattka matematczna. Przkład zadana", wd. II Słownctwo: Zmenna odpowedz jet głównm przedmotem zantereowana. Zmenne objaśnające ą pomocncze wjaśnają, a czaem wręcz wpłwają na zmenną odpowedz. Intereuje na zwązek tch zmennch. Ćwczene. W natępującch przkładach wkaż: oberwowane jednotk/oobnk, zmenne. Eample 1: Średn wzrot pewnej grup dzec w mejcowośc Kalama (Egpt) oberwowanch w weku 18--9 meęc: Scatterplot (wkre punktow): punkt (, ). Tu: wokość wek dzec w Kalama. Przedkutuj źródło zmennośc zmennej Age... Przkład : Średn wnk SAT z matematk w tane (USA) procent abolwentów zkoł średnej (HS) prztępującch do SAT 1
Dodatna cz ujemna korelacja? Mam tu... korelację. Mam tu... korelację. Wpółcznnk korelacj Oznaczam r. Oblczam dla n (par) oberwacj: 1 r n 1 Uwag: -1 r 1. Ne zależ od jednotek pomaru. Wkazuje na lnow zwązek, gd blk ±1. Neodporn na oberwacje odtające. Ne zależ od tego, która zmenna jet uważana za zmenną odpowedz, a która za objaśnającą. Prota regrej (najmnejzch kwadratów): Przkład 1 cd.: Prota regrej dla danch z Kamala predkcja dla weku 3 meęc. Lna prota, która najlepej opuje przblża catterplot. Opuje lnową odpowedź zmennej na zman zmennej objaśnająca. Równane protej (b-nachlene/lope, a- tała/ntercept): =a+b Najlepze a b ą oblczane z danch. Predkcja dla danej wartośc zmennej objaśnającej: ŷ =a+b
Wzór dla protej regrej (najmnejzch kwadratów) (X-zmenna objaśnająca, Y-zmenna odpowedz) Dane:,,,, r. Calculate: lope b r and ntercept a b ab Przkład1 cd. (dane z Kamala) 3.5 m o n th, 7 9.8 5 cm, 3.6 0 6 m o n th,.3 0 cm, r= 0.9 9 4 4 Wartośc reztowe (redual) Oblcz przewdwan wzrot dla weku 5 meęc. Ile wno różnca względem zaoberwowanego wzrotu? A dla weku 50 meęc?? Wartość reztowa (w/dla ) to (oberwowane )-(przewdwane ): r = -ŷ Np. dla danch z Kamala =5, wartość reztowa wno: Redual plot (wkre reztow): Scatterplot (wkre punktow) rezt zmennej objaśnającej. Pomaga ocenć dokładność przblżena przez protą regrej. Model tattczn (protej) regrej lnowej 0 1 Dane: n oberwacj potac ( 1, 1 ), (, ), ( n, n ). Odchlena ą z założena nezależne o tm amm rozkładze ze średną 0 odchlenem tandardowm. Parametr modelu to: 0, 1,. 3
Motwacja: dwe grup/populacje z tm amm odchlenem tandardowm różnm średnm: Regreja lnowa: wele grup z tm amm odchlenem tandardowm średną zmenającą ę lnowo wraz z. Mślm o protej regrej oblczonej dla danch jako etmatorze protej regrej dla populacj. lna równane nachlene (lope) Ogólne ŷa b b a Dla prób b b b ˆ 0 1 1 b 0 Dla populacj 0 1 1 0 tała (ntercept) Wzor ( Dane: n,, ),, n 1 r ( )( ) ( ) ( ) Stattk wnkowe: b b ˆ 1 r, a b0 b, b ( ˆ ) n ( ) (1 r n 1 ), n 1 r n, t 0 ( ), n 1 b, 1 r n 1 r Przedzał ufnośc tet totnośc dla nachlena tałej (lope oraz ntercept) Na pozome ufnośc C przedzał ufnośc dla 0: b t * 0 b Na pozome C przedzał ufnośc dla 1 to: b t * 1 t * znajdujem z (tabel) rozkładu Studenta z n- topnam wobod. 0 Przkład: 9 mężczzn w weku 0-9 lat. Merzm kn-fold thckne oraz bod dent: ID Ikn Den 1 1.7 1.093 1.56 1.063 3 1.45 1.078 4 1.5 1.056 5 1.51 1.073 4
Scatterplot prota najmnejzch kwadratów: Wnk SASa: The SAS Stem 17:47 Thurda, Jul, 004 5 The REG Procedure Model: MODEL1 Dependent Varable: Den Root M 0.00854 R-Square 0.704 Dependent Mean 1.06403 Adj R-Sq 0.7173 Coeff Var 0.805 Parameter Etmate Parameter Standard Varable DF Etmate Error t Value Pr > t 99% Confdence Lmt Intercept 1 1.16300 0.00656 177.30 <.0001 1.14574 1.1806 Ikn 1-0.0631 0.00414-15.3 <.0001-0.07403-0.051 SPSS, dla tch amch danch: Ecel, dla tch amch danch: Ćwczene: Znajdź przedzał ufnośc dla średnej zman bod dent na jednotkę knfold thckne. Stattka: Tetowane hpotez H0: 1=0 t To jet tet Studenta z df = n. Jeżel 1 =0, to = 0, tj. średna ne zmena ę z w modelu lnowm. W przecwnm raze mówm o lnowm wpłwe/zależnośc (nezerowm nachlenu w populacj). Zwkle oprogramowane podaje wartość tattk (dwutronną) P-wartość. Wtarcz znterpretować. 5
P-wartośc dla H0: 1=0 Ćwczene: Cz jet lnowa zależność pomędz bod dent oraz knfold thckne? Stattka tetowa: t df = n. Założena dla regrej lnowej: Wartośc zmennej odpowedz ą nezależne. (Można wkrć ew. problem oberwując wartośc reztowe jako funkcję numeru oberwacj/czau.) Dla każdej utalonej wartośc zmennej, zmenna zachowuje ę jak zmenna normalna. (Ab wkrć problem można narować htogram wartośc reztowch.) Założena dla regrej lnowej cd.: Odchlene tandardowe zmennej jet take amo dla wztkch. (Ab wkrć problem można pojrzeć na wkre reztow.) Należ wzukać/uunąć wartośc odtające tzw. oberwacje wpłwowe. Zależność pomędz jet lnowa (a ne krzwolnowa; ew. problem można wkrć oberwując catterplot). Rezt cza/numer oberwacj. Wkre reztow 6