Materały omoccze do e-leargu Progozowae symulacje Jausz Górczyńsk Moduł. Podstawy rogozowaa. Model regresj lowej Wyższa Szkoła Zarządzaa Marketgu Sochaczew
Od Autora Treśc zawarte w tym materale były erwote oublkowae w ser wydawczej Wykłady ze statystyk ekoometr, a obece ch wydae zostało dostosowae do otrzeb kursu e-leargowego Progozowae symulacje rzygotowaego dla studetów keruku zarządzae. Prace ad wykorzystaem komuterów Iteretu w dydaktyce zostały uruchomoe w aszej Uczel raktycze od mometu jej utworzea. Początkowo było to realzowae główe orzez rzygotowywae rzez wykładowców różego rodzaju materałów dydaktyczych w wersj cyfrowej (okazy PowerPot, dokumety Worda czy Excela), które były są udostęae w zakładce dowload. Kolejy krok to rzygotowae autorskej latformy testów teretowych (zakładka Testy). Od roku została uruchomoa w eł rofesjoala latforma e- leargowa, w której do weryfkacj wedzy rzekazywaej w kolejych modułach zaadatowae zostały wsomae wcześej testy teretowe. Treśc zawarte w tym materale zostały tak rzygotowae, aby ułatwć tym z Was, którzy z różych owodów mają roblemy z matematyką, statystyką ekoometrą, rzyomee zrozumee materału z zakresu wykorzystaa wybraych fragmetów tej wedzy do zastosowań raktyczych zwązaych z budowaem model rogostyczych. Jak korzystać z tych materałów? Sądzę, że dobrym rozwązaem będze sokoje rzeczytae oszczególych tematów, rześledzee rzykładowych zadań, a astęe trzeba je samemu rozwązać. Weryfkatorem rzyswojoej wedzy jest w ewym stou teraktywy test komuterowy. W ramach każdego modułu użytkowk dostaje ewą lczbę ytań okrywających materał modułu. W erwszym odejścu róg zalczea ustaway jest z reguły a 5% ozytywych odowedz, a w rzyadku ezalczea testu róg jest odoszoy o 5% w każdej kolejej róbe. Jausz Górczyńsk
3 Ss treśc WSTĘP... 4 PROGNOZOWANIE POJĘCIA OGÓLNE... 5. METODY PROGNOSTYCZNE... 5. BŁĄD PROGNOZY... 5 REGRESJA LINIOWA... 8. ESTYMACJA MODELU... 8. BADANIE ISTOTNOŚCI... 9.3 DOKŁADNOŚĆ OCEN PARAMETRÓW MODELU....4 BADANIE ZAŁOŻEŃ MODELU LINIOWEGO....4. Założee o zerowej wartośc oczekwaej reszt losowych....4. Założee o ormalośc składków losowych...3.4.3 Założee o eskorelowau składków losowych...3.5 PROGNOZOWANIE... 5 3 ARKUSZE OBLICZENIOWE... 6 3. SKOPIOWANIE ARKUSZA NA SWÓJ KOMPUTER... 6 3. UDOSTĘPNIENIE MAKROPOLECEŃ... 7 3.. Udostęee makr w MS Excel 3...7 3.. Udostęee makr w MS Excel 7 owszych...7 4 LITERATURA... 9
4 Wstę Przedmot Progozowae symulacje realzoway jest a welu kerukach studów srawając studetom tych keruków ewe roblemy. Wykają oe mędzy ym z tego owodu, że rzekazywae w ramach rzedmotu treśc oczekwae umejętośc wymagają z jedej stroy dość dużej wedzy teoretyczej z zakresu statystyk ekoometr, a z drugej stroy raktyczej umejętośc wykoywaa oblczeń statystyczych. Mom zamarem jest rzedstawee tych teresujących roblemów a welu rzykładach, w tym a rzykładach raktyczych. Perwsza część rezetowaego materału zawera teoretycze wrowadzee do metod regresyjych: regresj lowej, regresj welokrotej lowej, regresj krokowej, regresj krzywolowej, badau stotośc wyestymowaych model oraz ch wykorzystaa do rogozowaa. W zastosowaach raktyczych ezbęde są jakeś arzędza oblczeowe, z uwag a otecjalych odborców tego skrytu będę korzystać wyłącze z arkusza kalkulacyjego Excel. Nc oczywśce e sto a rzeszkodze wykorzystywau do celów oblczeowych wysecjalzowaych aketów statystyczych (. Statstca, SPSS, Statgrahcs), ale dostę do ch może być trudejszy. Dla ułatwea oblczeń będę korzystać z trzech secjale rzygotowaych skoroszytów MS Excel: StatystykaJG.xls Lowa.xls TestSer.xls Wszystke trzy skoroszyty są dostęe w zakładce Dowload/StatystykaJG a stroe aszej Uczel. Każdy z tych skoroszytów zawera mej lub bardzej zaawasowae makroolecea VBA. Skoroszyt StatystykaJG.xls (lub StatystykaJG.xlsm) jest ajbardzej rozbudoway, a rocedury w m zawarte ozwalają a wykoae wększośc oblczeń statystyczych realzowaych w tyowych rogramach rzedmotów statystyka, ekoometra czy rogozowae. Procedury dostęe są orzez meu alkacj, a obsługa oszczególych rocedur realzowaa jest orzez klasycze formularze wdowsowe. Skoroszyty Lowa.xls oraz TestSer.xls są zacze skromejsze, a ch rola ograczoa jest do dwóch zagadeń: estymacj modelu lowego oraz wykorzystau testu ser. Koleja różca zwązaa jest ze sosobem wykoywaa oblczeń, w tych dwóch skoroszytach oblczea wykoywae są (główe) orzez jawe formuły zasae w komórkach arkusza. W racy rzyjęto astęującą kowecję zasu: Nazwy skoroszytów arkuszy są wysywae czcoką Courer New, Formuły Excela wysywae są czcoką Courer New, Nazwy oleceń meu, azwy zakładek osy kotrolek formularzy są wysywae ochyloą czcoką Tmes New Roma. htt://www.wszm-sochaczew.edu.l Vsual Basc for Alcatos, język rogramowaa aketu Offce
5 Progozowae ojęca ogóle Progozowae (lub aczej redykcja) jest oartym a aukowych odstawach rzewdywaem kształtowaa sę zjawsk rocesów w rzyszłośc. Przedmotem rogozowaa jest rzebeg zjawsk rocesów rzyrodczych, sołeczych, demografczych, gosodarczych, techczych t. Jeżel rogozowae dotyczy rocesów zjawsk zachodzących w gosodarce, to mówmy wtedy o rogozowau gosodarczym. Z termem rogozowae zwązay jest term rogozy ( redykcj ). Progozowae jest rocesem woskowaa o rzewdywaym kształtowau sę zjawska czy rocesu w rzyszłośc, a rogoza (redykcja) jest kokretym wykem rocesu rogozowaa. Progozowae gosodarcze (ale e tylko) jest utrudoe rzez secyfcze waruk, w jakch zachodzą rocesy gosodarcze, w tym ch uzależee od welu różorodych czyków. Czyk te, z uwag a sosób oddzaływaa obektu rogozy, moża odzelć a: czyk egzogecze (zewętrze), czyl take, a które obekt rogozy e ma wływu, a które owy być uwzględoe w rogozowau z uwag a ch ograczający lub stymulujący wływ a rzebeg daego zjawska (. kurs walutowy a kształtowae sę obrotów daej frmy, rzebeg waruków ogodowych a loowae daej rośly td.); czyk edogecze (wewętrze), czyl take, a które obekt rogozy ma wływ (. wydajość racy, welkość stosowaego awożea td.).. Metody rogostycze W każdym rocese rogozowaa moża wyróżć astęujące etay: Zdefowae roblemu rogostyczego, Zebrae daych statystyczych ch wstęa aalza, Wybór metody rogozowaa, Zbudowae rogozy ocea jej trafośc. Istotym elemetem rocesu rogozowaa jest wybór odowedej metody rogozowaa, która determuje sosób zbudowaa rogoz. W zastosowaach raktyczych ajczęścej stosuje sę metodę redykcj eobcążoej, która srowadza sę do wyzaczea rogozy a ozome wartośc oczekwaej zmeej rogozowaej w daym ukce. Progozowae metodą redykcj eobcążoej jest uzasadoe szczególe wtedy, gdy moża oczekwać, że w ukce rogozy owtórzą sę te waruk, które obserwowao dla daych statystyczych wykorzystaych do zbudowaa modelu rogostyczego. Jeżel oczekwae take e jest urawoe, to w mejsce redykcj eobcążoej moża wybrać take metody rogozowaa jak ajwększego rawdoodobeństwa czy też metoda mmalzacj oczekwaej straty. W racy tej ograczoo sę do wykorzystaa metody redykcj eobcążoej, jako ajczęścej stosowaej w raktyczych rozwązaach.. Błąd rogozy Z uwag a fakt, że zmea objaśaa jest losowa aturale jest wystęowae różc mędzy rzeczywstą wartoścą zmeej objaśaej a jej rogozą wyzaczoą dla zadaej wartośc zmeej objaśającej (lub zadaych
6 wartośc zmeych objaśaych) 3. Reale jest węc wystąee błędu rogozy, częścej będzemy używać ojęca błąd redykcj. Dwoma odstawowym rodzajam merków dokładośc trafośc zbudowaych rogoz są: merk dokładośc ex ate, merk dokładośc ex ost. Merk dokładośc ex ate służą do ocey oczekwaych welkośc odchyleń rzeczywstych wartośc zmeej objaśaej od ustaloej rogozy. Wartośc tych merków odawae są w momece ustalea rogozy, a wec wtedy, gdy e są jeszcze zae rzeczywste wartośc zmeej objaśaej. W rzykładach raktyczych będzemy wykorzystywać arkusze kalkulacyje StatystykaJG.xls lub StatystykaJG.xlsm oraz Lowa.xls, w obu arkuszach wyzaczae są średe błędy redykcj uktowej ex ate, moża je symbolcze ozaczyć jako. Błąd te ozacza, że rzy rogozowau wartośc ŷ oełamy średo błąd S P y ˆ S ˆ P y ±. Śred błąd redykcj jest lczbą maowaą, o jego odzeleu rzez rogozę uktową otrzymamy względy śred błąd redykcj ex ate: S V yˆ yˆ %. Względy błąd rogozy ex ate formuje as o tym, jak duży (rocetowo) błąd oełamy rzyjmując, że ezaa, rogozowaa wartość będze rówa wyzaczoej rogoze uktowej ŷ. Śred błąd redykcj α; v yˆ S P y ˆ y < yˆ t S P ; yˆ + t S P > z P α. wykorzystujemy także do zbudowaa rogozy rzedzałowej wg wzoru: α; v yˆ Wyzaczoy rzedzał lczbowy okrywa, z rawdoodobeństwem α, ezaą wartość zmeej zależej y w ustaloym ukce rogozy. Ocea rawdzwośc merków ex ate może być zweryfkowaa doero o rzeczywstym zrealzowau sę zmeej objaśaej w ukce, dla którego była ostawoa rogoza. Jeżel zamy rzeczywstą wartość zmeej rogozowaej Y w wybraym ukce, to błąd redykcj ex ost jest rówy D Y yˆ. Welkość błędu absolutego rogozy ex ost formuje as o różcy mędzy rzeczywstą wartoścą zmeej rogozowaej w daym ukce a ostawoą rogozą. Podobe jak w rzyadku błędu ex ate możemy wyzaczyć względy błąd rogozy ex ost z wzoru: D Y yˆ V % %. Y Y ŷ 3 Progozę tę azywamy rogozą uktową, symbolcze ozaczaą jako ŷ.
7 Jeżel rogoza była budowaa e dla ojedyczego uktu, lecz dla ch cągu, to moża wyzaczyć śred błąd rogozy ex ost (absoluty względy) z wzorów: D k k ( Y yˆ ) k Y yˆ V k Y % Statystyczą oceą błędu rogozy ex ost w takej sytuacj jest śred kwadratowy błąd rogozy wyzaczoy z wzoru: S k Y k yˆ ) (. Arkusze kalkulacyje, które będzemy wykorzystywać w rezetowaych dalej rzykładach część z tych merków dokładośc rogoz wyzaczają, ale e wszystke. W marę otrzeby moża je samodzele dolczyć sząc stosukowo rostą formułę Excela.
8 Regresja lowa. Estymacja modelu Rozważmy oulację geeralą π, w której obserwujemy dwe zmee: zmeą losową Y zmeą ustaloą 4 lub losową X. O zmeej losowej Y zakładamy, że ma rozkład ormaly z wartoścą średą m będącą fukcją lową zmeej X oraz stałym (ezależym od zmeej X) odchyleem stadardowym. Założee to moża zasać astęująco: Y N( m( x) b + b x; σ ). (.) ~ y x Parametry fukcj lowej m ( x) b + b x e są zae muszą być oszacowae a odstawe odowedej róby losowej. Ozaczmy elemet -elemetowej róby losowej jako arę lczb y, x ). Zgode z modelem fukcj ( lowej mędzy y a x zachodz zwązek: y m( x ) b + b x + e (.) gdze e jest edoasowaem (różcą, odchyleem, resztą) mędzy wartoścą obserwowaą w róbe y a wartoścą teoretyczą b + b x. Parametry fukcj lowej (arametry modelu) m( x) b + b x musmy tak dobrać, aby doasowae fukcj regresj było jak ajlesze. Kryterum to będze sełoe wtedy, gdy suma kwadratów reszt e będze mmala (suma kwadratów, oeważ reszty są zarówo dodate jak ujeme). Wychodząc z wzoru (.) mamy: s e [ y ( b + b x )] mmum (.3) Tak sformułowae kryterum estymacj ezaych arametrów modelu zae jest w teor statystyk jako metoda ajmejszych kwadratów MNK. Suma kwadratów odchyleń s zdefowaa wzorem.3 jest fukcją dwóch ewadomych (zmeych) - b b, a roblem zalezea jej mmum rozwążemy orzez wyzaczee rzyrówae do zera ochodych fukcj s względem b b : s b s b [ y ( b + b x ] [ y ( b + b x ] x Przyrówae obu ochodych cząstkowych do zera tworzy tzw. układ rówań ormalych, a jego rozwązae daje ocey (oszacowaa) ezaych arametrów modelu. Oszacowaa te tradycyje będzemy ozaczać symbolem daszka umeszczoym ad szacowaym arametrem. Przykładowo, b jest ezaym arametrem, a ˆb jego estymatorem (oszacowaem, oceą). Uwaga to wyka z tego, że w dalszych rzekształceach układu rówań ormalych używać już będzemy symbol oce arametrów modelu w mejsce samych arametrów. Przekształcając.4 otrzymujemy astęujące wzory a ocey arametrów modelu: ( y y x x y x y x )( ) cov xy bˆ y bˆ x ( x x x x x var x ) bˆ (.4) (.5) 4 Zmea ustaloa, aczej elosowa; taka, która w kolejych róbach rzyjmuje te same wartośc.
9. Badae stotośc Korzystając z wzoru.5 mamy ocey arametrów modelu lowego, tym samym mamy także oceę fukcj regresj z róby: ˆ ( x) bˆ + bˆ x. (.6) m Otwartym ozostaje ytae, czy rawdzwe jest asze założee o tym, że mędzy wartoścą oczekwaą zmeej losowej Y a wartoścam zmeej X steje zwązek lowy ostac: m ( x) b + b x. Zwązku takego e będze wtedy, gdy arametr b będze rówy zero, tym samym owśmy rzerowadzć weryfkację hotezy zerowej H : b wobec alteratywy H : b. Tak sformułowaą hotezę azywać będzemy hotezą o estotośc regresj. Jej odrzucee ozaczać będze, że steje stoty lowy zwązek mędzy zmeą Y a zmeą X oszacoway rówaem.6. Z kole brak odstaw do odrzucea hotezy zerowej ozaczać będze, że takego zwązku e ma (wartość oczekwaa zmeej losowej Y będze stała, czyl jej ocea będze rówa średej tej zmeej). Hotezę H : b wobec alteratywy H : b zweryfkować możemy metodą aalzy waracj lub testem t-studeta. Przed wrowadzeem aalzy waracj rozważmy dowolą obserwację y, x ) oraz odowadającą m teoretyczą wartość zmeej losowej Y wyzaczoą dla argumetu ˆ ˆ ( ˆ + ˆ y m x ) bo b x. Różcę (odchylee) wartośc obserwowaej dwóch różc: y y ( yˆ y ) + ( y yˆ ) ( x z wyestymowaej fukcj regresj y od średej y moża rzedstawć jako sumę (.7) Podosząc obustroe rówość.7 do kwadratu sumując o wskaźku otrzymamy, o odowedch rzekształceach, aalogczą rówość sum kwadratów odchyleń: ( y y) ( y y) + ( y yˆ ) ˆ (.8) Po lewej stroe rówośc.8 mamy całkowtą sumę kwadratów odchyleń dla zmeej y, a o rawej stroe sumę kwadratów odchyleń teoretyczych wartośc ŷ od wartośc średej y oraz sumę kwadratów odchyleń dla reszt losowych. Składk ( yˆ y) rerezetujący sumę kwadratów odchyleń wyjaśoą modelem fukcj regresj moża rzedstawć w zacze wygodejszej ostac uwzględając wyestymowae rówae regresj oraz wzór a oceę arametru ˆb : ( y y) bˆ cov xy ˆ Rówość.8, rzedstawająca odzał całkowtej zmeośc zmeej losowej Y a dwa ezależe składk: zmeość wyjaśoą modelem oraz zmeość resztową, jest odstawą wykoaa aalzy waracj. (.9)
Tabela aalzy waracj dla weryfkacj H : b wobec H : b Zmeość Stoe swobody Suma kwadratów odchyleń Śred kwadrat odchyleń Modelu v R var R bˆ cov xy var R sr Resztowa v E var E vart var R Całkowta v T var y ( y y) s v R E E var v e F emrycze F R sr se Hotezę H b będzemy odrzucać a korzyść H b wtedy, gdy wartość emrycza statystyk F : : Fshera-Sedecora będze wększa od wartośc krytyczej odczytaej dla ustaloego ozomu stotośc α, lub gdy wylczoy krytyczy ozom stotośc (tzw. -value) będze mejszy od rzyjętego ozomu stotośc (ajczęścej α,5 lub α,). W takej sytuacj będzemy woskować, że steje stoty, lowy zwązek mędzy zmeą losową Y a zmeą X osay wyestymowaym z róby rówaem regresj ostac ˆ ( x) bˆ + bˆ x. m W sytuacj, gdy F emrycze będze e wększe od odowedej wartośc krytyczej lub -value wększe od rzyjętego ozomu stotośc α, to e mamy odstaw do odrzucea hotezy H : b. Tym samym e steje lowa zależość fukcyja mędzy zmeym Y X, a wyestymowae z róby rówae regresj ma ostać m ˆ ( x) y. Parametry b b azywamy odowedo stałą regresj wsółczykem regresj. Perwszy z ch e ma raktycze żadej terretacj merytoryczej, z kole wsółczyk regresj b ma bardzo ładą rzydatą terretację: mów am o tym, o le średo zme sę zmea y rzy wzrośce zmeej x o jedostkę. Śred kwadrat odchyleń dla zmeośc resztowej s E jest oceą waracj odchyleń od regresj y / x σ określoej w założeu.: var ˆ cov ˆ y b xy σ y / x S y / x se. (.) Hoteza H : b rzy alteratywe H : b może być także weryfkowaa rzy omocy statystyk t-studeta. Przy rawdzwośc H : b statystyka: bˆ bˆ tem. (.) S ˆ S b y / x var x ma rozkład t-studeta z lczbą sto swobody v. Jeżel tem. > t α,, to H b odrzucamy a korzyść hotezy alteratywej. Podobe jak w rzyadku : aalzy waracj decyzję weryfkacyją moża orzeć o wyzaczoy, dla daego t em., krytyczy ozom stotośc -value. W rzyadku odrzucea hotezy H b możemy być zateresowa weryfkacją hotezy zerowej : zakładającej określoą (ozaczaą symbolcze rzez b ), ezerową wartość wsółczyka regresj, czyl
H : b b. Hotezę tę, rzy dowolej alteratywe, możemy zweryfkować testem t-studeta, gdze wartość emrycza tej statystyk daa jest wzorem: bˆ b bˆ b tem. (.) S ˆ S b y / x var x.3 Dokładość oce arametrów modelu Parametry modelu szacujemy a odstawe róby losowej, tym samym mają oe charakter losowy, są zmeym losowym. Tym samym ch kokreta wartość wyzaczoa z -elemetowej róby obarczoa jest ewym błędem. Zajdując ocey tych błędów korzystając z rozkładu t-studeta możemy zbudować -α rocetowe rzedzały ufośc dla rawdzwych wartośc tych arametrów w oulacj geeralej. Oceę błędu wsółczyka regresj b możemy zaleźć ze zaego już wzoru: S y / x S bˆ var x (.3) b a astęe korzystając z faktu, że zmea b t ma rozkład t-studeta S budujemy rzedzał ufośc dla wsółczyka regresj w oulacj: b < bˆ t ˆ S ˆ ; b + tα S, b, bˆ > b ˆ α z rawdoodobeństwem P α. (.4) Oceę błędu stałej regresj b możemy wyzaczyć z wzoru: S bˆ / S y x x var x a astęe korzystając z faktu, że zmea t b ˆ b (.5) ma rozkład t-studeta budujemy rzedzał ufośc dla stałej S b ˆ regresj w oulacj: b < bˆ t ˆ α S ˆ ; b + tα S ˆ > z rawdoodobeństwem P α. (.6), b, b Iterretacja obu rzedzałów ufośc jest stadardowa, w rzyadku rzedzału ufośc dla wsółczyka regresj może meć ostać: z rawdoodobeństwem α mamy rawo oczekwać, że wsółczyk regresj w oulacj będze e mejszy ż b ˆ t, ale e wększy ż b ˆ + t α. α, S b ˆ, S b ˆ
.4 Badae założeń modelu lowego Model regresj lowej określoy wzorem. wymaga sełea trzech ważych założeń dotyczących rozkładu reszt losowych. Ee (.7) D e Ce e j y / x σ (.8) dla j (.9) Założea te mogą być jeszcze uzuełoe założeem o ormalośc reszt losowych, czyl: e N(; σ ) (.) ~ y / x.4. Założee o zerowej wartośc oczekwaej reszt losowych. Srawdzee założea o losowośc reszt jest rówoważe zweryfkowau hotezy o orawośc doboru modelu fukcj regresj. Waruek Ee (dla,,..., ) jest sełoy wtedy, gdy wartość oczekwaa zmeej losowej Y jest osaa zależoścą: ( Y ) mˆ ( x) bˆ + bˆ x E Nesełee waruku Ee jest sygałem, że model m ˆ ( x) jest źle określoy mus być zmeoy w zakrese ostac modelu czy doboru zmeych ezależych. Badae losowośc reszt jest wykoywae zawsze a osteror, czyl o wyestymowau modelu fukcj regresj. Dla każdej obserwacj emryczej y wyzaczamy wartość teoretyczą ŷ wykającą z wyestymowaego modelu fukcj regresj. W kolejym kroku wyzaczamy reszty jako różce mędzy orygalą wartoścą zmeej losowej Y a wartoścą teoretyczą tej zmeej: e y yˆ (.) W uorządkowaym rosąco według wartośc zmeej ezależej X cągu reszt określamy lczbę ser S reszt tych samych zaków. W orawe dobraym modelu lczba tych ser owa ależeć do ewego rzedzału lczbowego. Krańce tego rzedzału możemy odczytać z tablc rozkładu ser dla ustaloego ozomu stotośc α. Rozkład ser e jest symetryczy, stąd z tablc tego rozkładu będzemy odczytywać dwe wartośc krytycze uzależoe od ozomu stotośc α oraz lczby reszt jedomeych (dodatch ujemych) : S S S dla α oraz S dla α. Przedzał lczbowy < S ; S > wyzacza obszar douszczaly dla hotezy zerowej zakładającej losowość reszt. Tym samym w sytuacj, gdy wyzaczoa lczba ser S ależy do rzedzału < S ; S >, to możemy uważać, że model fukcj regresj został orawe dobray. Jeżel wyzaczoa lczba ser S < S lub S > S, to reszty e są losowe, a to ocąga koeczość zmay modelu fukcj regresj (zmay ostac fukcj lub/ zmeych objaśających).
3 Tablce lczby ser są oracowae jedye dla lczby reszt dodatch (ujemych) e rzekraczających, co może być roblemem rzy wększych róbach losowych. W takch sytuacjach moża rzyblżyć rozkład lczby ser S rozkładem ormalym rzyjmując, że: ( ) ˆ ˆ ms + σ S (.) + ( + ) ( + ) Pozwala to a stadaryzację rozkładu lczby ser S: S mˆ S zs (.3) σˆ S weryfkację rówoważej do H : Ee hotezy zerowej H : z orzez srawdzee, czy statystyka.3 trafa do obszaru krytyczego dla H czy też e. Oczywśce do weryfkacj H moża także wykorzystać krytyczy ozom stotośc -value. W arkuszu StatystykaJG.xls (StatystykaJG.xlsm) test ser został zamlemetoway (wbudoway) do rocedur Regresja lowa jak Regresja welokrota, jego użyce wymaga jedye zazaczea odowedego ola wyboru a formularzach tych dwóch rocedur. W rzyadku, gdy dysoujemy jedye wykam róby wyestymowaym modelem fukcj regresj (. z jakejś ublkacj, czy o estymacj modelu z omocą stadardowych oleceń Excela tyu Dodaj lę tredu) badae orawośc doboru modelu testem ser może być wykoae o wyzaczeu reszt losowych rzy omocy wsomaego wcześej arkusza TestSer.xls. Wystarczy skoować do ego (orzez wartośc) uorządkoway rosąco wg wartośc zmeej objaśaej wektor reszt losowych..4. Założee o ormalośc składków losowych Założee o waracj reszt losowych w raktyce e jest srawdzae z tej rzyczyy, że z reguły e dysoujemy wystarczającą lczbą daych emryczych. Formale dla każdej wartośc zmeej ezależej X owśmy dysoować taką lczbą omarów zmeej zależej Y, aby moża było oszacować warację reszt e (wyzaczaych rzy tych samych wartoścach zmeej x). Pewym rozwązaem jest srawdzee założea. o ormalośc rozkładu reszt losowych. Jego eodrzucee ozacza, że zmea losowa Y ma, dla każdej wartośc zmeej X, rozkład ormaly o tej samej waracj, co wyczeruje założee...4.3 Założee o eskorelowau składków losowych Kolejym założeem klasyczej regresj lowej, które możemy srawdzć aalzując reszty, jest założee o eskorelowau kolejych składków losowych (tzw. brak autokorelacj): Ce e cov( e ; e ) dla j (.4) j j Założee to jest srawdzae orzez weryfkację hotezy zerowej o tym, że wsółczyk autokorelacj rzędu τ (ajczęścej erwszego) jest rówy zero. Oceą wsółczyka autokorelacj w róbe jest wsółczyk korelacj lowej wyzaczoy wg wzoru: e je j τ j τ + ˆ ρ τ rτ. (.5) e e j j j j τ +
4 Hotezę o braku autokorelacj rzędu τ : H : (.6) ρ τ możemy zweryfkować testem d Durba-Watsoa: d ( e j τ + j e j j e j τ ) lub klasyczym testem t-studeta wyzaczając wartość emryczą statystyk z wzoru: t em. rτ (.7) rτ τ. (.8) Mędzy statystyką d Durba-Watsoa a statystyką t-studeta zachodz w rzyblżeu zwązek: d ( r ) (.9) τ z którego wyka, że statystyka d rzyjmuje swoje wartośc z rzedzału domkętego <; 4>. W rzyadku braku autokorelacj rzędu τ ( r ) wartość statystyk d jest rówa zero. τ Rozkład statystyk d rzy założeu, że H : ρ τ jest rawdzwa, zależy od lczby obserwacj, lczby zmeych ezależych k w modelu fukcj regresj oraz rzyjętego ozomu stotośc α. Rozkład statystyk d Durba-Watsoa został stablcoway rzy jedostroej hoteze alteratywej H :. W tablcach rozkładu statystyk d, dla ustaloych arametrów k oraz rzyjętego ozomu stotośc α, ρ τ > odae są dwe wartośc d d wyzaczające obszar krytyczy dla hotezy H : ρ τ. Przy weryfkowau H : ρ τ wobec H : ρ τ > stosujemy astęujące krytera weryfkacj hotezy zerowej: d d H : ρ τ odrzucamy a korzyść H : ρ τ >, d d < e odejmujemy żadej decyzj, < d d d e mamy odstaw do odrzucea H :. ρ τ Hotezę H : ρ τ możemy także zweryfkować wobec H : ρ τ <, ale rzy odejmowau decyzj stosujemy e krytera: d 4 d H : odrzucamy a korzyść H :, ρ τ ρ τ < 4 d < d < 4 d e odejmujemy żadej decyzj, d 4 d e mamy odstaw do odrzucea H :. ρ τ Procedura wykorzystywaa w skoroszyce StatystykaJG.xls (StatystykaJG.xlsm) do estymacj regresj lowej dwóch zmeych weryfkuje hotezę o eskorelowau składków losowych za omocą klasyczej statystyk t-studeta wyzaczoej zgode z wzorem.8. Problem wystęowaa autokorelacj składków losowych w szczególośc dotyczy takch sytuacj, w których wartośc zmeej losowej Y są owtarzae a tych samych jedostkach ekserymetalych (. szereg czasowe). W rzyadku stwerdzea autokorelacj ozacza to, że klasycza metoda ajmejszych kwadratów e może być stosowaa do estymacj arametrów modelu, daje bowem obcążoe ocey tych arametrów, a e eobcążoe. Rozwązaem jest zastosowae ej metody estymacj arametrów modelu,. uogóloej metody ajmejszych
5 kwadratów. W dalszej częśc zajęć rzedstawoa zostae jeda z wersj UMNK olegającej a trasformacj daych wyjścowych..5 Progozowae Wyestymoway, stoty model fukcj regresj moża wykorzystać do wyzaczea średej wartośc zmeej losowej y w teresującym as ukce x : m ˆ ( x ) bˆ + bˆ x (.3) Wyzaczoa zgode z owyższym wzorem średa wartość zmeej y (tzw. wartość regresyja, także rogoza uktowa) jest oczywśce losowa (oeważ losowe są arametry modelu). Ocea waracj wartośc regresyjej jest określoa wzorem: ( x x) Sm ˆ ( x ) S / +. y x (.3) var x Warto zauważyć, że ocea waracj wartośc regresyjej jest ajmejsza wtedy, gdy x x, aczej mówąc wtedy, gdy wyzaczamy oczekwaą wartość zmeej y w ukce średm dla zmeej ezależej. Ocea waracj wartośc regresyjej stosukowo szybko rośe w marę tego, jak ukt x odsuwa sę dalej (w obu kerukach) od wartośc średej zmeej X. W klasyczym modelu ormalej regresj lowej estymator m ( x ) określoy wzorem.3 ma rozkład ormaly z wartoścą średą m ( x ) odchyleem stadardowym rówym erwastkow kwadratowemu z wyrażea.3. Korzystając dalej z tego, że statystyka: mˆ ( x ) m( x ) t (.3) S m ˆ ( x ) ma rozkład t-studeta z lczbą sto swobody v budujemy rzedzał ufośc dla m ( x ) : m( x) < mˆ ( x) tα, Smˆ ( x ); mˆ ( x) + t, ˆ ( ) > α Sm x z P α. (.33) W klasyczym ujęcu roblemu redykcj (rogozowaa) chodz o estymację ojedyczej realzacj zmeej y rzy ustaloej wartośc zmeej X x. Zgode z modelem lowym wartość tę wyzaczymy jako: y x b + b x + e a jej ajleszym estymatorem eobcążoym jest wartość regresyja m ˆ ( x ˆ ˆ ) b + b x. Błąd rogozy ojedyczej realzacj zmeej y (błąd redykcj) jest sumą eskorelowaych błędów odchyleń ojedyczych realzacj błędu wartośc regresyjej: P ( x x) S( yx ) S / S ˆ ( ) S /. y x + m x y x + + (.35) var x Podobe jak w rzyadku wartośc regresyjej możemy zbudować rzedzał ufośc dla rawdzwej wartośc zmeej losowej y rzy ustaloej wartośc zmeej X x : < ˆ P ( ) ( ); ˆ ( ) P y x m x tα, S y x m x tα, S( y x ) > z P α. (.36) o o ˆ (.34)
6 3 Arkusze oblczeowe Jak wsomałem wcześej arkusze oblczeowe zawerają bardzej lub mej rozbudowae makroolecea, dlatego owśmy obrać je ze stroy Uczel zasać a lokalym dysku swojego komutera doero z tej lokalzacj je uruchamać. 3. Skoowae arkusza a swój komuter. Wchodzmy a stroę WWW Uczel rzechodzmy do zakładk Dowload, w której odszukujemy folder StatystykaJG otweramy go. Zajdujemy otrzeby lk klkamy go rawym rzycskem myszy, a astęe wywołujemy (lewym rzycskem) olecee Zasz lk jako (Save targer as ). Otwarte zostae oko dalogowe olecea Zasz lk jako, w którym wskazujemy mejsce zasaa oberaego lku. Po wskazau folderu klk rzycsku Zasz kończy oberae.
7 W folderze Dowload/StatystykaJG arkusze oblczeowe z makram są także w wersj zarchwzowaej, oeważ może sę zdarzyć, że rzeglądarka lub jej ustawea e ozwolą a obrae lków Excela z makram. Plk te oberamy tak, jak to okazao wyżej, ale o ch obrau musmy je rozakować (wystarczy odwójy klk a lk archwum, użyty jest stadardowy w środowsku Wdows rogram archwzujący ZIP). 3. Udostęee makrooleceń Przy ch otwerau owśmy ozwolć a uruchomee makrooleceń, aczej arkusze będą efukcjoale (erzydate). Robmy to trochę aczej w MS Excel w wersj 3 oraz w wersjach owszych. 3.. Udostęee makr w MS Excel 3 Przy wczytywau skoroszytu z makram w MS Excel 3 zobaczymy okazay żej komukat. Klk rzycsku Włącz makra ozwala a ełe wykorzystae fukcjoalośc arkuszy oblczeowych. W rzyadku arkusza StatystykaJG.xls zobaczymy rozbudowae meu główe o olecea statystycze. 3.. Udostęee makr w MS Excel 7 owszych Po wczytau skoroszytu z makram możemy zobaczyć okazay żej komukat, który formuje as, że wczytay skoroszyt zawera makra że zostały oe wyłączoe.
8 W takej sytuacj klkamy a rzycsk Włącz zawartość, co skutkuje włączeem makr z jedoczesym usuęcem komukatu o ostrzeżeach. W rzyadku skoroszytu StatystykaJG.xlsm wdoczym efektem włączea makr jest zawartość zakładk Dodatk, w której wdocze będą olecea meu tego skoroszytu (. Hotezy, Regresja, td.). Po takm uruchomeu skoroszytu z makram będą oe dla as dostęe będzemy mogl je wykorzystać do automatyzacj oblczeń.
9 4 Lteratura. Aczel A. D., Statystyka w zarządzau, Wydawctwo Naukowe PWN, Warszawa. Borkowsk B., Dudek H., Szczęsy W., Ekoometra. Wybrae zagadea. Wydawctwo Naukowe PWN, Warszawa 3 3. Nowak E., (red.), Progozowae gosodarcze. Metody, modele, zastosowaa, rzykłady. Agecja Wydawcza PLACET, Warszawa, 998 4. Górczyńsk J,. Wybrae wzory tablce statystycze, Wyd. III orawoe uzuełoe. Wyższa Szkoła Zarządzaa Marketgu, Sochaczew, 6 5. Górczyńsk J., Podstawy statystyk, Wyd. II orawoe uzuełoe. Wyższa Szkoła Zarządzaa Marketgu, Sochaczew, 6. Górczyńsk J., Podstawy ekoometr. Wyższa Szkoła Zarządzaa Marketgu, Sochaczew, 4 7. Górczyńsk J., Procedury VBA Mcrosoft Excel w badaach statystyczych. Wyższa Szkoła Zarządzaa Marketgu, Sochaczew, 6 8. Pawełek B., Waat ST., Zelaś A., Progozowae ekoomcze. Teora, rzykłady, zadaa. Wydawctwo Naukowe PWN, Warszawa 8 9. Welfe A., Ekoometra, Polske Wydawctwo Ekoomcze, Warszawa 3