EKONOMETRIA 26 Zastosowane matematyk w ekonom Redaktor naukowy Janusz Łyko Wydawnctwo Unwersytetu Ekonomcznego we Wrocławu Wrocław 2009
Sps treśc Wstęp... 7 Beata Bal-Domańska, Ekonometryczna analza sgma beta konwergencj regonów Un Europejskej... 9 Andrzej Bąk, Aneta Rybcka, Marcn Pełka, Modele efektów głównych modele z nterakcjam w conjont analyss z zastosowanem programu R. 25 Katarzyna Budny, Kurtoza wektora losowego... 44 Wktor Ejsmont, Optymalna lczebność grupy studentów... 55 Kaml Fjorek, Model regresj dla cechy przyjmującej wartośc z przedzału (0,) ujęce bayesowske... 66 Paweł Hanczar, Wyznaczane zapasu bezpeczeństwa w sec logstycznej... 77 Roman Huptas, Metody szacowana wewnątrzdzennej sezonowośc w analze danych fnansowych pochodzących z pojedynczych transakcj... 83 Aleksandra Iwancka, Wpływ zewnętrznych czynnków ryzyka na prawdopodobeństwo runy w skończonym horyzonce czasowym w weloklasowym modelu ryzyka... 97 Agneszka Lpeta, Stany równowag na rynkach warunkowych... 0 Krystyna Melch-Iwanek, Polsk rynek pracy w śwetle teor hsterezy... 22 Rafał Pszczek, Zastosowane modelu logt w modelowanu upadłośc... 33 Marcn Salamaga, Próba weryfkacj teor parytetu sły nabywczej na przykładze kursów wybranych walut... 49 Anton Smoluk, O zasadze dualnośc w programowanu lnowym... 60 Małgorzata Szulc-Janek, Influence of recommendatons announcements on stock prces of fuel market... 70 Jacek Welc, Regresja lnowa w szacowanu fundamentalnych współczynnków Beta na przykładze spółek gełdowych z sektorów: budownctwa, nformatyk oraz spożywczego... 80 Andrzej Wlkowsk, O współczynnku korelacj... 9 Mrosław Wójcak, Klasyfkacja nowych technolog energetycznych ze względu na determnanty ch rozwoju... 99 Andrzej Wójck, Wykorzystane model wektorowo-autoregresyjnych do modelowana gospodark Polsk... 209 Katarzyna Zeug-Żebro, Rekonstrukcja przestrzen stanów na podstawe welowymarowych szeregów czasowych... 29
6 Sps treśc Summares Beata Bal-Domańska, Econometrc analyss of sgma and beta convergence n the European Unon regons... 24 Andrzej Bąk, Aneta Rybcka, Marcn Pełka, Man effects models and man and nteractons models n conjont analyss wth applcaton of R software... 43 Katarzyna Budny, Kurtoss of a random vector... 53 Wktor Ejsmont, Optmal class sze of students... 65 Kaml Fjorek, Regresson model for data restrcted to the nterval (0,) Bayesan approach... 76 Paweł Hanczar, Safety stock level calculaton n a supply chan network... 82 Roman Huptas, Estmaton methods of ntraday seasonalty n transacton fnancal data analyss... 96 Aleksandra Iwancka, An mpact of some outsde rsk factors on the fnte- -tme run probablty for a mult-classes rsk model... 09 Agneszka Lpeta, States of contngent market equlbrum... 2 Krystyna Melch-Iwanek, The Polsh labour market n lght of the hysteress theory... 32 Rafał Pszczek, Logt model applcatons for bankruptcy modellng... 48 Marcn Salamaga, Attempt to verfy the purchasng power party theory n the case of some foregn currences... 59 Anton Smoluk, On dual prncple of lnear programmng... 68 Małgorzata Szulc-Janek, Analza wpływu rekomendacj analtyków na ceny akcj branży palwowej (Analza wpływu rekomendacj analtyków na ceny akcj branży palwowej)... 78 Jacek Welc, A lnear regresson n estmatng fundamental betas n the case of the stock market companes from constructon, t and food ndustres... 90 Andrzej Wlkowsk, About the coeffcent of correlaton... 98 Mrosław Wójcak, Classfcaton of new energy related technologes based on the determnants of ther development... 208 Andrzej Wójck, Usng vector-autoregressve models to modellng economy of Poland... 28 Katarzyna Zeug-Żebro, State space reconstructon from multvarate tme seres... 227
PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROCŁAWIU nr 76 Ekonometra 26 2009 Kaml Fjorek Unwersytet Ekonomczny w Krakowe MODEL REGRESJI DLA CECHY PRZYJMUJĄCEJ WARTOŚCI Z PRZEDZIAŁU (0, ) UJĘCIE BAYESOWSKIE Streszczene: W artykule przedstawono model regresj dla cechy, która przyjmuje wartośc z obustronne otwartego przedzału (0,). Krótko omówono wady powszechne stosowanych metod modelowana tego typu danych. W tym kontekśce zaprezentowano zreparametryzowany rozkład beta, a następne na jego podstawe skonstruowano model regresj. W ramach ujęca bayesowskego przedstawono estymację parametrów modelu, metody określana dobroc dopasowana oraz nterpretacj parametrów modelu. W dalszej częśc dokonano bayesowskego porównana model, zakładając, że rozkład zmennej zależnej jest rozkładem beta, smplex lub normalnym. Opsaną metodologę zlustrowano przykładem. Słowa kluczowe: beta regresja, ogranczona zmenna losowa, wnoskowane bayerowske.. Wstęp Ogólnym celem przeprowadzana analzy regresj jest próba loścowego ujęca zwązku pomędzy (najczęścej jedną) zmenną zależną (oznaczaną dalej symbolem y) a zmennym nezależnym. W praktyce powszechne stosowane są modele regresj dla cągłej (neogranczonej), lcznkowej lub bnarnej zmennej zależnej. Jednakże modele regresj dla zmennej, która przyjmuje wartośc z przedzału (0,), ne są powszechne znane, co oznacza, że ne są powszechne stosowane. Arbtralne założene mówące o tym, że zmenna zależna y (0,), ne jest szczególne ogranczające, gdyż dla y (a, b) (końce przedzału są znanym stałym) y a / b a 0,. możlwe jest przekształcene ( ) ( ) ( ) Keschnck [2003] przeprowadzł przegląd lteratury, aby określć najpopularnejsze metody analzy rozważanego w artykule typu danych. Na perwszym mejscu znalazła sę (co ne jest szczególnym zaskoczenem) klasyczna normalna regresja lnowa. Jednakże, ze względu na fakt, że zmenna zależna przyjmuje wartośc z przedzału (0,), założene o normalnośc rozkładu ne może być spełnone. Ponadto warancja ogranczonej zmennej losowej jest funkcją wartośc oczekwanej, powodując, że założene o stałej warancj składnka losowego ne jest spełnone. Co węcej, zastosowane tego podejśca może powodować generowane przez mo-
Model regresj dla cechy przyjmującej wartośc z przedzału (0, )... 67 del predykcj spoza przedzału określonośc zmennej zależnej. Drugm często spotykanym postępowanem jest transformacja logtowa zmennej zależnej (surowych danych). Następne dla tak przekształconych danych wykonywana jest klasyczna regresja. Paolno [200] w swoch badanach symulacyjnych wykazał, że transformacja logtowa ne zawsze jest lepszym wyborem w porównanu z klasyczną regresją lnową, gdyż m.n. nedoszacowuje błędów średnch szacunku. Problemem równeż jest to, że transformacja logtowa ne stablzuje warancj zmennej zależnej. Inną metodą, już ne tak często stosowaną jak dwe poprzedne, jest wykorzystane modelu tobtowego. To podejśce równeż cerp z powodu pewnych neścsłośc, gdyż przyczyną braku danych spoza przedzału (0,) ne jest cenzorowane (lub ucęce), ale fakt, że take wartośc ne mogą wystąpć. Naturalnym rozwązanem wspomnanych powyżej problemów zwązanych z modelowanem wartośc z przedzału (0,) wydaje sę bezpośredne przyjęce rozkładu prawdopodobeństwa, który będze respektował ogranczene zmennej zależnej. 2. Rozkłady prawdopodobeństwa dla cechy o wartoścach z przedzału (0, ) W nnejszym artykule założono, że zmenna zależna przyjmuje wartośc z obustronne otwartego przedzału (0,). W przypadku, gdy przedzał ten jest obustronne (lub jednostronne) domknęty, opsane metody ne znajdują bezpośrednego zastosowana. Pewne podstawy teoretyczne w celu uogólnena metod na dyskretno-cągły rozkład zmennej zależnej poczynl autorzy prac [Lesaffre, Rzopoulos, Tsonaka 2004; Ospna, Ferrar 2008]. Rys.. Funkcja gęstośc rozkładu beta w zależnośc od wartośc parametrów kształtu Źródło: opracowane własne.
68 Kaml Fjorek Najbardzej znanym rozkładem prawdopodobeństwa zdefnowanym na przedzale (0,) jest dwuparametrowy rozkład beta. Rozkład beta jest bardzo elastyczny. W zależnośc od wartośc parametrów funkcja gęstośc może być symetryczna, asymetryczna, J-kształtna, L-kształtna lub U-kształtna. Na rysunku przedstawono klka przykładów funkcj gęstośc rozkładu beta. Innym proponowanym w lteraturze rozkładem prawdopodobeństwa zdefnowanym na przedzale (0,) jest dwuparametrowy rozkład smplex [Barndorff- -Nelsen 99; Keschnck 2003; Qu, Song, Tan 2008]. Pommo rozbudowanej bazy teoretycznej stnejącej dla tego rozkładu, jak wynka z badań symulacyjnych przeprowadzonych przez autora nnejszego opracowana, rozkład smplex jest mało elastyczny, tzn. funkcja gęstośc może zmenać kształt w ogranczonym zakrese. Z tego powodu w dalszej częśc pracy uwaga zostane skupona na modelu regresj, w którym warunkowy rozkład zmennej zależnej to rozkład beta. Funkcja gęstośc rozkładu beta w standardowej parametryzacj ma postać: ( p q) ( p) Γ( q) Γ + p q f( y p, q) = y ( y) ; 0< y< ; p > 0, q > 0, () Γ Γ() ( ) ( ) gdze oznacza funkcję gamma, natomast p oraz q są parametram kształtu. p Wartość oczekwana wynos E( y) =, natomast warancja p + q pq Var( y ) =. W przypadku, gdy oba parametry kształtu są węk- 2 p+ q p+ q+ sze od jednośc, rozkład beta ma wartość modalną. W przypadku, gdy oba parametry są równe, rozkład beta redukuje sę do rozkładu jednostajnego. Rozkład beta w standardowej parametryzacj ne jest dogodny do skonstruowana na jego podstawe modelu regresj. W tym kontekśce Ferrar Crbar-Neto [2004] zaproponowal zreparametryzowany rozkład beta. Wyszl on z założena, że typowe dla analzy regresj jest modelowane parametru rozkładu prawdopodobeństwa odpowedzalnego za wartość oczekwaną. Przyjmując następującą parametryzację p μ = ; φ = p + q; p = μφ; q = ( μ ) φ; 0< μ < ; φ > 0, uzyskano zmodyfkowaną wersję rozkładu beta, której funkcja gęstośc ma następującą p + q postać: = natomast warancja Γ( φ ) ( μφ ) ( ) ( μ φ ) ( ) ( ) μφ f( y, ) y y μφ μφ =. (2) Γ Γ W tym przypadku wartość oczekwana ma postać E( y) μ, V ( μ ) Var( y) =, gdze V ( μ ) μ( μ). + φ = Parametr φ może być nterpretowany
Model regresj dla cechy przyjmującej wartośc z przedzału (0, )... 69 jako parametr precyzj, gdyż dla ustalonego μ zwększene wartośc φ powoduje zmnejszene warancj y. 3. Model regresj dla cechy o wartoścach z przedzału (0,) Nech będze danych n nezależnych obserwacj ( y ), =,..., n takch, że rozkład y jest postac y Beta( μφ φ( μ) ) μ, φ,. Model regresj jest uzyskany przez założene, że wartość oczekwana y może być zapsana jako pewna monotonczna transformacja lnowej kombnacj k zmennych nezależnych x (,..., ) : = x xk ( ) k ( k ) g μ = x β = η; j j j=,...,, k β = β. β β (3) Borąc pod uwagę, że zmenna zależna przyjmuje wartość z przedzału (0,), należy rozważyć tylko take transformacje lnowej kombnacj zmennych nezależnych g które przyjmują wartośc z przedzału (0,). Najprostszym wyborem (), μ jest przekształcene logtowe, tj. g ( μ ) = ln. μ W nektórych przypadkach preferowane jest jednak przyjęce nnej transformacj. Na przykład gdy prawdopodobne jest wystąpene obserwacj netypowych jako funkcję transformującą można wykorzystać dystrybuantę rozkładu t-studenta o małej lczbe stopn swobody. Istnejące badana symulacyjne wskazują, że w typowych sytuacjach ne ma dużej korzyśc ze stosowana nnej nż logtowa transformacj [Keschnck 2003]. Nc ne sto na przeszkodze, aby oprócz modelowana wartośc oczekwanej zmennej zależnej równeż modelować parametr precyzj φ jako funkcję zmennych nezależnych. Jednakże w tej pracy φ jest traktowane jako parametr zakłócający, nebędący przedmotem bezpośrednego zanteresowana. Po uwzględnenu wszystkch przyjętych założeń możlwe jest wyznaczene β, φ = μ, φ, gdze funkcj warygodnośc, a konkretne jej logarytmu: ( ) ( ) ( μ φ) ( φ) ( μφ) (( μ ) φ) ( μφ ) ln y + ( ) ln, = lnγ lnγ lnγ + μ φ x ( y ) oraz μ ( ) ' e β. = + W badanach symulacyjnych wykazano, że numeryczna maksymalzacja logarytmu funkcj warygodnośc ne nastręcza szczególnych trudnośc [Smthson, Verkulen 2005]. n =
70 Kaml Fjorek 4. Bayesowska estymacja modelu regresj dla cechy o wartoścach z przedzału (0, ) Buckley [2002] oraz Branscum, Johnson, Thurmond [2007] jako perws podjęl sę bayesowskej estymacj modelu regresj dla cechy o wartoścach z przedzału (0,). Obaj autorzy założyl dla zmennej zależnej rozkład beta oraz wykonal oblczena w programe WnBUGS (Bayesan Inference Usng Gbbs Samplng). Zastosowane gotowego środowska oblczenowego, jakm jest WnBUGS, przyspesza proces budowana modelu, aczkolwek ne pozwala wyjść poza możlwośc przewdzane przez autora oprogramowana. Oznacza to nezmerne utrudnone wykorzystane rozkładu zmennej zależnej nnego nż rozkład beta, a tym samym praktyczne wykluczona zostaje możlwość porównywana konkurencyjnych model. Ponadto, borąc pod uwagę znaczne ogranczony zakres aspektów wnoskowana bayesowskego poruszonych przez wspomnanych autorów, celowe wydają sę dalsze badana. Zastosowane podejśca bayesowskego w estymacj omawanego modelu regresj pozwala uwzględnć wstępną wedzę badacza w postac nałożonego na parametry modelu rozkładu a pror oraz umożlwa bardzej ntucyjną (w porównanu z wnoskowanem klasycznym) nterpretację przedzałów ufnośc. Zdanem autora są to ważnejsze (choć ne jedyne) zalety wnoskowana bayesowskego. Znaczną wadą jest natomast koneczność przeprowadzena względne skomplkowanych często czasochłonnych oblczeń. Wnoskowane bayesowske sprowadza sę (w zasadze) do wyznaczena rozkładu warunkowego parametrów przy ustalonych obserwacjach, nazywanego rozkładem a posteror [Osewalsk 200, s. 6-7]. Funkcję gęstośc rozkładu a posteror parametrów uzyskuje sę na podstawe wzoru Bayesa: L( μ( β), φ) p( β, φ n ) ( β φ ) = L( μ( β), φ) p( β, φ) dβdφ = ( μ( ) ) ( ) p, y L β, φ p β, φ, (4) n (, ) ( ( ), ) ( ( ) gdze ( ) f y μ β φ = L μ β φ y = L μ β, φ y to funkcja warygodnośc = dla n nezależnych obserwacj, a p( β, φ ) to rozkład a pror parametrów. W emprycznej częśc opracowana dla wszystkch parametrów przyjęto newłaścwe rozkłady a pror. Łączny rozkład parametrów (jak równeż ch rozkłady warunkowe) ne przyjmuje znanej postac. Wyklucza to bezpośredne metody symulacj z rozkładu a posteror oraz próbkowane Gbbsa. W tej sytuacj wykorzystano unwersalny algorytm Metropolsa-Hastngsa z błądzenem przypadkowym [Lynch 2007, s. 08-5] w celu wygenerowana próby z rozkładu a posteror (wykonywano 00 000 losowań, perwsze 0 000 uznawano za losowana spalone). Ponadto, w celu zbadana zbeżnośc do rozkładu a posteror, algorytm Metropolsa- )
Model regresj dla cechy przyjmującej wartośc z przedzału (0, )... 7 -Hastngsa rozpoczynano z różnych punktów startowych oraz obserwowano, czy zbega on do tego samego obszaru przestrzen parametrów. Standardową metodą analzy dopasowana modelu do danych jest wyznaczene funkcj gęstośc rozkładu predyktywnego (rozkładu przyszłych obserwacj) dla każdej z n orygnalnych obserwacj. W przypadku dobrego dopasowana danych do modelu, tzn. gdy model adekwatne opsuje proces generujący dane, przyszłe obserwacje pownny być podobne do rzeczywśce zaobserwowanych. Rozkład predyktywny uzyskuje sę z następującego wyrażena: p p ( ) (, ) ( ( ), ) (, ) p y y = p y β φ L μ β φ p β φ dβd φ. (5) Grafczna nspekcja dopasowana modelu do danych polega na nanesenu na wykres funkcj gęstośc rozkładu predyktywnego rzeczywstej realzacj zmennej zależnej. Jeżel obserwacja znajduje sę w centrum rozkładu predyktywnego, można stwerdzć dobre dopasowane, w przecwnym raze, gdy obserwacja znajduje sę w ogonach rozkładu, można mówć o złym dopasowanu [Lynch 2007, s. 55- -56]. Omówona technka jest szczególne przydatna, gdy lczba zmennych nezależnych jest wększa od. Po określenu dobroc dopasowana należy przejść do nterpretacj kluczowych parametrów modelu (β). Ze względu na fakt, że wartość oczekwana rozkładu zmennej zależnej jest nelnową funkcją zmennych nezależnych, ch bezpośredna nterpretacja jest utrudnona. Aby ułatwć nterpretację, wyznacza sę efekty krańcowe dla poszczególnych zmennych nezależnych, przyjmując, że pozostałe zmenne znajdują sę na przecętnym pozome. Efekt krańcowy dla j-tej zmennej zależnej (w przypadku transformacj logtowej) wyraża sę następującym wzorem: ' ( x β) ' ( x β ) g( x) β exp = x j + exp Na grunce wnoskowana bayesowskego możlwe jest bezpośredne porównywane konkurujących ze sobą model w celu określena najlepszego modelu. Bayesowska dea porównywana model sprowadza sę do wyznaczena brzegowej gęstośc wektora obserwacj przy założenu danego modelu p( y M g ) = = L( μ ( β), φ M ) p( β, φ M ) g g dβdφ, gdze M g oznacza g-ty model. Iloraz gęstośc brzegowych dla dwóch konkurujących model nazywany jest czynnkem Bayesa (BF Bayes Factor). Wartość czynnka Bayesa wększa od przemawa na korzyść perwszego modelu. W praktyce wartośc wększe od 3 uznaje sę za znaczące. Na podstawe opsanej powyżej metodolog w dalszej częśc pracy zostaną porównane modele regresj zakładające, że rozkład zmennej zależnej jest rozkładem beta, smplex lub normalnym. 2. (6)
72 Kaml Fjorek Oblczene gęstośc brzegowej wektora obserwacj ne jest zadanem prostym. W rozważanym w częśc emprycznej przypadku rozmar przestrzen parametrów ne jest duży, dlatego też możlwe było wyznaczene prawdopodobeństw brzegowych za pomocą próbkowana z funkcją ważnośc q( ). Zadane to sprowadza sę do zastosowana ponższych formuł: BF ( g ) ( μ( β), φ) p( β, φ) q( βφ, ) L p ym = q dβdφ (7) w ( M ) ( ) r r = w r r M2, gdze wr( Mg) = r ( β, φ) ( β, φ) r( β, φ) q ( βφ, ) p y p Podstawowe zalecena odnośne do konstruowana funkcj ważnośc q( ) wskazują na wykorzystane welowymarowego rozkładu t-studenta o nskej lczbe stopn swobody, którego wektor wartośc oczekwanych oraz macerz kowarancj wyznacza sę na podstawe wynków próbkowana z rozkładu a posteror [Ross, Allenby, McCulloch 2005, s. 62-66; Congdon 2006, s. 30-32]. 5. Przykład empryczny Przedstawona metodologa zostane zlustrowana na podstawe zboru danych zawerającego nformację o dochodze całkowtym gospodarstwa domowego (zmenna nezależna) oraz o odsetku wydatków na żywność (zmenna zależna). Obserwacje pochodzą z losowej próby 38 gospodarstw domowych z dużego masta w Stanach Zjednoczonych (zob.: [Grffths, Hll, Judge 993, tab. 5.4]). Wybór tego stosunkowo prostego zboru danych jest podyktowany faktem, że klka spośród dotychczas opublkowanych opracowań traktujących o analze regresj zmennej zależnej o wartoścach z przedzału (0,) wykorzystuje go w celach lustracyjnych [Ferrar, Crbar-Neto 2004; Branscum, Johnson, Thurmond 2007]. r. Tabela. Wynk estymacj modelu regresj Parametr Ocena punktowa 95-procentowy przedzał ufnośc Efekty krańcowe 95-procentowy przedzał ufnośc β 0 0,2 ( 0,626; 0,208) β 0,9 ( 0,089; 0,0049) 0,00244 ( 0,00386; 0,0004) φ 27,5 (6,63; 4,8) Źródło: opracowane własne.
Model regresj dla cechy przyjmującej wartośc z przedzału (0, )... 73 W tabel zaprezentowano podstawowe charakterystyk rozkładu a posteror parametrów modelu, tj. wartośc przecętne, które uzupełnono o 95-procentowe przedzały ufnośc. Dodatkowo umeszczono tam punktową oraz przedzałową ocenę efektu krańcowego zmany dochodu całkowtego gospodarstwa domowego (przy założenu, że dochód znajduje sę na przecętnym dla próby pozome). Na rysunku 2 przedstawono wykres rozrzutu danych wraz z nanesoną na nego funkcją regresj oraz dolną górną grancą predykcj (95-procentowy przedzał predykcj uzyskany na podstawe rozkładu predyktywnego). Na podkreślene zasługuje obserwacja, że uzyskane przedzały predykcj ścśle odzwercedlają naturę ogranczonej zmennej zależnej, tzn. są one asymetryczne (uwzględnene skośnośc rozkładu zmennej zależnej) oraz ch długość zmnejsza sę w marę zblżana sę do krańców przedzału określonośc zmennej zależnej (uwzględnene zależnośc warancj zmennej zależnej od jej wartośc oczekwanej). Rys. 2. Wykres rozrzutu danych wraz z dopasowaną funkcją regresj oraz 95-procentowym przedzałam predykcj Źródło: opracowane własne. Na rysunku 3 przedstawono wykres funkcj gęstośc predyktywnej dla dwóch przykładowych obserwacj. Wykres prezentuje rzeczywstą realzację zmennej zależnej (ponowa kreska) oraz rozkład prawdopodobeństwa dla przyszłych realzacj wartośc zmennej zależnej. Lewa część wykresu obrazuje sytuację, w której przyszłe obserwacje generowane przez model znajdują sę w zgodze z zaobserwowaną wartoścą. Natomast prawa część wykresu wskazuje sytuację, w której przyszłe obserwacje częścej będą wększe nż zaobserwowana wartość. W rozważanym przypadku (tylko zmenna nezależna) nformacja zawarta na rys. 3 znajduje sę w bezpośrednej korespondencj z nformacją przedstawoną na
74 Kaml Fjorek rys. 2. Jednakże w sytuacj dużej lczby zmennych nezależnych, gdy nemożlwe jest ch jednoczesne przedstawene na wykrese rozrzutu, wykresy gęstośc predyktywnej nadal dostarczają nformacj o jakośc dopasowana modelu do danych. Rys. 3. Funkcja gęstośc predyktywnej dla 2 przykładowych obserwacj Źródło: opracowane własne. Tabela 2. Porównane konkurencyjnych model regresj czynnk Bayesa Rozkład Beta Smplex Normalny Beta 0,82 20,6 Smplex,22 256,7 Normalny 0,0047 0,0039 Źródło: opracowane własne. W tabel 2 zaprezentowano wynk porównana konkurencyjnych specyfkacj model, w których kolejno założono, że rozkład zmennej zależnej jest rozkładem beta, smplex lub normalnym. W wynku stwerdzono, że dane przemawają za rozkładem smplex, jednakże różnca pomędzy nm a rozkładem beta jest zanedbywalna. Istotna jest obserwacja, że dane bardzo slne odrzucają model o warunkowym rozkładze normalnym na korzyść dwóch pozostałych model. 6. Dyskusja Interesującym, aczkolwek mało znanym rozkładem prawdopodobeństwa zdefnowanym na przedzale (0,) jest dwuparametrowy rozkład Kumaraswamy. Jest
Model regresj dla cechy przyjmującej wartośc z przedzału (0, )... 75 on równe elastyczny jak rozkład beta [Mtnk 2008]. Wadą tego rozkładu w porównanu z rozkładem beta jest brak prostej formuły na wartość oczekwaną oraz warancję. Zaletą jest posadane dystrybuanty w postac analtycznej. Fakt ten otwera możlwość zbudowana modelu regresj na podstawe medany. Przedmotem dalszych prac będze próba wykorzystana bayesowskego uśrednana model w celu uwzględnena nepewnośc o prawdzwej postac rozkładu zmennej zależnej, tzn. tego, czy jest to rozkład beta, smplex czy rozkład Kumaraswamy. W przypadku omawanej klasy model jest to obszar dotychczas nezbadany. Lteratura Barndorff-Nelsen O., Some Parametrc Models on the Smplex, Journal of Multvarate Analyss 99 vol. 39, s. 06-6. Branscum A., Johnson W., Thurmond M., Bayesan Beta Regresson: Applcaton to Household Expendture Data and Genetc Dstance between Foot-and-mouth Dsease Vruses, Australan & New Zealand Journal of Statstcs 2007 vol. 49, no 3, s. 287-30. Buckley J., Estmaton of Models wth Beta-Dstrbuted Dependent Varables: A Replcaton and Extenson of Paolno (200), Poltcal Analyss 2002 vol., s. -2. Congdon P., Bayesan Statstcal Modellng, Wley, 2006. Ferrar S., Crbar-Neto F., Beta Regresson for Modellng Rates and Proportons, Journal of Appled Statstcs 2004 vol. 3(7), s. 799-85. Grffths W., Hll R., Judge G., Learnng and Practcng Econometrcs, Wley, 993. Keschnck R., Regresson Analyss of Varates Observed on (0,): Percentages, Proportons and Fractons, Statstcal Modellng 2003 vol. 3, no 3, s. 93-23. Lesaffre E., Rzopoulos D., Tsonaka S., The Logstc-transform for Bounded Outcome Scores, Techncal Report 0448, http://www.stat.ucl.ac.be/iap, 2004. Lynch S., Introducton to Appled Bayesan Statstcs and Estmaton for Socal Scentsts, Sprnger, 2007. Mtnk P., The Kumaraswamy Dstrbuton: a Medan Dsperson Reparametrzaton for Regresson Modelng and Smulaton-based Estmaton, Workng Paper, http://ssrn.com/abstract=23587, 2008. Osewalsk J., Ekonometra bayesowska w zastosowanach, AE, Kraków, 200. Ospna R., Ferrar S., Inflated Beta Dstrbutons, Statstcal Papers, Sprnger, 0.007/s00362-008- 025-4, 2008. Paolno P., Maxmum Lkelhood Estmaton of Models wth Beta-Dstrbuted Dependent Varables, Poltcal Analyss 200 vol. 9, no 4, s. 325-346. Qu Z., Song P., Tan M., Smplex Mxed-Effects Models for Longtudnal Proportonal Data, Scandnavan Journal of Statstcs 2008 vol. 35, s. 577-596. Ross P., Allenby G., McCulloch R., Bayesan Statstcs and Marketng, Wley, 2005. Smthson M., Verkulen J., A Better Lemon Squeezer? Maxmum-Lkelhood Regresson Wth Beta- Dstrbuted Dependent Varables, Psychologcal Methods 2006 vol., no, 54-7. Smthson M., Verkulen J., Beta Regresson: Practcal Issues n Estmaton, http://psychology.anu.edu.au/people/smthson/detals/betareg/readme.pdf, 2005.
76 Kaml Fjorek REGRESSION MODEL FOR DATA RESTRICTED TO THE INTERVAL (0,) BAYESIAN APPROACH Summary: Ths artcle presents a regresson framework for a dependent varable whch s restrcted to the open nterval (0,). The man drawbacks of wdely used methods of modellng ths type of data (e.g. lnear regresson model) have been brefly dscussed. In ths context, the beta dstrbuted dependent varable s presented on the bass of whch a regresson model s constructed. The estmaton of the model parameters as well as graphcal methods for assessng the goodness of ft and the nterpretaton of model parameters are shown wthn the Bayesan framework. Next the Bayesan comparson of three competng models assumng the beta, smplex or normal dstrbuton of a dependent varable s conducted. The model comparson results are presented n terms of the Bayes Factors. Theoretcal results are appled to a small dataset on food expendture and ncome. Future research work wll nvestgate, among others, the applcaton of the Kumaraswamy dstrbuton for a dependent varable and the applcaton of the Bayesan model averagng.