Dobór zmennych objaśnających Metoda grafowa: Należy tak rozpąć graf na werzchołkach opsujących poszczególne zmenne, aby występowały w nm wyłączne łuk symbolzujące stotne korelacje pomędzy zmennym opsującym.
użyce testu na stotność współczynnków korelacj r t j m r j
odrzucamy te współczynnk korelacj, dla których t t α t r j r /( m ) α m r ( ) ( ) j m tα rj rj + tα /( m ) j t r * α Za nestotne ze statystycznego punktu wdzena przyjmujemy zatem te * współczynnk, które spełnają nerówność r r j α
Redukcja zboru zmennych kandydatek metodą optymalnego wyboru predykat Nośnkem nformacj nazywamy kandydatkę na zmenną objaśnającą. Kombnacją nośnków nformacj jest podzbór zboru zmennych kandydatek. Pojemnoścą ndywdualną j-tego nośnka nformacj w ramach l-tej kombnacj nazywamy lczbę: r h j + j l \ {} j r j
Pojemnoścą ntegralną kombnacj nośnków nformacj nazywamy sumę pojemnośc ndywdualnych nośnków należących do danej kombnacj, tj. j l H h l lj
Pojemnośc nformacyjne są unormowane: h lj,h l [0, ]. Wyberamy taką kombnację zmennych objaśnających, dla której pojemność nformacyjna ntegralna H l jest maksymalna.
Metoda doboru krokowego wprost lub do tyłu Bada sę zmenność (a dokładne stotność tej zmennośc) przy dokładanu (lub odejmowanu) zmennej objaśnającej do modelu).
Przykład z dwema zmennym: Zamerzamy ustalć prognozę zużyca oleju opałowego zużywanego w ogrzewanu meszkań w stycznu. Wybrano w tym celu mnej węcej jednakowe 5 domków zbudowanych w różnych częścach kraju. Rozważać można wele zmennych jako przypuszczalne mających wpływ na zużyce oleju opałowego, jednak dla uproszczena przyjmujemy dwe następujące zmenne opsujące - średną,dzenną temperaturę powetrza, merzoną w stopnach Fahrenheta, na zewnątrz domu (), - grubość materału zolacyjnego, merzonego w calach pod dachem domu ().
Otrzymano następujące wynk badań: Obserwacja Mesęczne zużyce oleju opałowego (w galonach) Średna temperatura w deg F Grubość zolacj w calach 75,3 40 3 363,8 7 3 3 64,3 40 0 4 40,8 73 6 5 94,3 64 6 6 30,9 34 6 7 366,7 9 6 8 300,6 8 0 9 37,8 3 0 0,4 63 3 3,4 65 0 03,5 4 6 3 44, 3 4 33,0 38 3 5 5,5 58 0
Odpowedne równana normalne wyglądają następująco: + + + + + + m m m m m m o m m m b b b Y b b b Y b b mb Y I 0 m m 0 III. II..
po rozwązanu: b o 56,5 b -5,43658 b-0.03 ˆ Y 56,5 5,43658 0. 03
Predykcja zmennej zależnej. Możlwa jest predykcja zmennej objaśnanej (w ogranczonym zakrese) dla poszczególnych wartośc zmennych objaśnających. Np. dla wartośc średnej temperatury 30 F 0 domu o zolacj o grubośc 6 cal otrzymujemy Yˆ Yˆ 56,5 78,9798 5,43658 0,03
Testowane stotnośc zwązku pomędzy zmennym objaśnającym a zmenną objaśnaną. H 0 : β β 0 H : β β 0 F p, n p MSR MSE
Źródło df Suma kwadratów Warancja F Regresja SSR 8 04,663 4 007,33568,47 Błąd 5-- SSE 8 0,6030 676,769 Total 5-4 SST 36 35,93
Mara zwązku w regresj welokrotnej: r Y SSR 8 04,663, SST 3635,93.9656
lub dla współczynnka determnacj adjustowanego r adj m [( ry,... p ) ] Y m p 5 4 ( r ) ( 0,9656) 0, 96, 5 czyl w 96% wybrane zmenne wyjaśnają welkość konsumcj oleju grzewczeg
Wyznaczane wkładu do modelu zmennych objaśnających: SSR( k wszystke zmenne z wyjątkem k) SSR( wszystke zmenne włączne z k) - SSR(wszystke oprócz k) czyl SSR( ) SSR ( ) - SSR ( ) 7 938,63 SSR( ) SSR ( ) - SSR ( ) 49 390,0 a węc aby sprawdzć czy znacząco poprawa model jeżel jest już do m włączona rozdzelamy sumę kwadratów regresj na dwa składnk:
Źródło df Su ma kwadratów Warancja F Regresja SSR 8 04,663 4 007,335 5 076,4650 76 938,63 5 076,4650 76 938,63 6,47 Błąd 5-- SSE 8 0,6030 676,769 Total 5-4 SST 36 35,93
testujemy hpotezę: H 0 : Zmenna ne polepsza znacząco modelu jeśl jest już w nm zmenna H : Zmenna polepsza znacząco model jeśl jest już w nm zmenna F,m-p- SSR ( wszystke oprocz ) MSE F, 6,47 podczas gdy wartość krytyczna wynos dla α0,05 4,75 tym sa odrzucamy H 0.
Podobne robmy dla zmennej otrzymując: Źródło df Su ma kwadratów Warancja F Regresja SSR 8 04,663 4 007,335 7864, 44 49 390,0 78 64,44 49 390,0 7,99 Błąd 5-- SSE 8 0,6030 676,769 Total 5-4 SST 36 35,93 czyl hpotezę o braku wpływu jeżel jest już w modelu także odrzucamy (wartość krytyczna taka sama 4,75).
Współczynnk częścowej determnacj Służy wyjaśnanu zmennośc wywoływanej przez daną zmenną objaśnającą przy założenu, że nne są ustalone. r Yk.( wszystke oprocz k) SST SSR SSR ( (wszystke k wszystke oprocz k) z k) + SSR( wszystke k oprocz k)
dla przykładu: r Y. 0. 956 r Y. 0. 8588 r Y. oznacza, że dla stałej zolacj dachu 96,6% zmennośc zużyca ol stycznu może być wyjaśnone przez zmenność średnej temperatury w tym mesącu.
Porównane paketów komputerowych. Nazwa Regre sja kroko wa Wszystk e możlwe regresje Wykres y resduó w Badane wpływu Przedza ły ufnośc dla µ Y SPSS x REGRESSION Tak Ne Tak Tak Ne SAS PROC GLM Ne Ne Tak Ne Tak PROC Tak Ne Ne Ne Ne STEPWISE PROC Ne Tak Ne Ne Ne RSQUARE PROC REG Ne Ne Tak Tak Tak Mntab REGRESS Ne Ne Tak Tak Tak STEPWISE Tak ne Ne Ne Ne STATGRAPHICS Tak ne Tak Tak Ne MYSTAT Ne ne Tak Tak Ne