Jerzy Marzec Adres e mail: marzecj@uek.krakow.pl Uniwersye Ekonomiczny w Krakowie Kaedra: Kaedra Ekonomerii i Badań Operacyjnych Wybrane dwuwymiarowe modele dla zmiennych licznikowych w ekonomii. Wsęp Rozkład Poissona, ujemny rozkład dwumianowy i rozkład logarymiczny są powszechnie używane do opisu zjawisk, gdy zmienna objaśniana jes mierzona na skali ilorazowej i jednocześnie przyjmuje wyłącznie warości nieujemne. Pierwsze lieraurowo udokumenowane zasosowanie rozkładu Poissona pochodzi z końca XIX wieku, a doyczy badań przeprowadzonych przez rosyjskiego uczonego polskiego pochodzenia Władysława Borkiewicza. W 898 r. opublikował on wyniki analiz doyczących śmierelności żołnierzy, służących w dziesięciu korpusach kawalerii armii pruskiej w laach 875-894, spowodowanej kopnięciami przez konie. Począkowo rozkład Poissona był proponowany do probabilisycznego opisu rozkładu zdarzeń rzadkich, kóre pojawiają się z małym prawdopodobieńswem w ciągu nieskończonej liczby niezależnych powórzeń ego samego doświadczenia o dwóch możliwych wynikach. Obecnie w lieraurze naukowej isnieją liczne aplikacje z wykorzysaniem ego rozkładu w analizie danych przekrojowych, szeregów czasowych i danych longiudinalnych. W ekonomii modele Poissona znajdują zasosowanie akże wówczas, gdy przedmioem zaineresowania są wyniki zachowań jednosek podejmujących decyzje. Obok modeli dyskrenego wyboru są one podsawowymi narzędziami opisu zjawisk rozważanych na gruncie mikroekonomerii. Lisa zasosowań regresji Poissona jes długa. W ekonomice zdrowia sosuje się je m.in. w analizie inensywności korzysania z różnych form usług opieki zdrowonej, liczby wypadków w pracy lub chorób zawodowych. W zakresie ekonomiki pracy modele e służą badaniu absencji Arykuł powsał w ramach badań sauowych finansowanych przez Uniwersye Ekonomiczny w Krakowie. Auor pragnie podziękować za meryoryczną dyskusję i cenne uwagi, kóre orzymał od uczesników IV Konferencji Naukowej Meody Ilościowe w Ekonomii zorganizowanej przez WSB we Wrocławiu oraz podczas owarych zebrań Kaedry Ekonomerii i Badań Operacyjnych UEK w Krakowie.
w miejscu pracy i mobilności zawodowej ludności w wieku produkcyjnym. W ubezpieczeniach znajdują zasosowanie w analizie szkodowości w porfelu ubezpieczeń komunikacyjnych lub mająkowych. W ransporcie modele zmiennych licznikowych umożliwiają ocenę inensywności wypadków komunikacyjnych. W bankowości zaś są jednym z narzędzi analizy spłacalności ra kapialowo-odsekowych przez kredyobiorców i pomiaru ryzyka kredyowego. W zakresie nauk o przedsiębiorswach modele regresji Poissona mogą być dogodnym sposobem opisu zależności zmian koniunkuralnych (faz wzrosu bądź spadku gospodarczego) na skalę bankrucwa przedsiębiorsw. W markeingu przedmioem badania mogą być decyzje pojedynczych konsumenów doyczące jednoczesnych zakupów określonej ilości różnych produków lub usług. W demografii są podsawowym narzędziem opisu zjawisk doyczących np. umieralności czy prokreacji. C. Cameron i P. Trivedi [998, 005] przedsawiają wyniki przykładowych badań empirycznych pochodzących z różnych dziedzin ekonomii, kóre zosały uzyskane za pomocą szczegółowych modeli danych licznikowych. Celem niniejszego arykułu jes przedsawienie wybranej klasy modeli saysycznych opisujących zależność między dwiema zmiennymi licznikowymi. W lieraurze są one określane erminem dwuwymiarowych modeli Poissona (ang. bivariae Poisson models). Przedmioem zaineresowania w szczególności są e konsrukcje, w ramach kórych możliwa jes analiza zjawisk charakeryzujących się zarówno dodanią jak i ujemną korelacją między zmiennymi endogenicznymi. Opracowanie ma zaem charaker przeglądowy. W arykule rozważamy dwie propozycje. Pierwsza z nich o mieszanka rozkładu Poissona z rozkładem log-normalnym, kóra zosała zaproponowana przez J. Aichisona i C. Ho w 989 r. Druga specyfikacja nazwana przez P. Berkhoua i E. Pluga [004] warunkowym modelem Poissona, jes prosszą konsrukcją. Posiada pewne resrykcje doyczące własności, ale ma akże zaley, m.in. ławość esymacji w przeciwieńswie do modelu pierwszego.. Prosy model regresji Poissona Rozważamy model saysyczny dla licznikowej zmiennej losowej Y, kóra przyjmuje warości ze zbioru liczb całkowiych nieujemnych. Niech Y ma rozkład Poissona z paramerem λ, Y~Poisson(λ), więc funkcja prawdopodobieńswa ma posać y Pr ( Y = y) = py ( y λ) = exp( λ) λ, λ > 0, () y!
gdzie y oznacza pojedynczą realizację ej zmiennej, kóra przyjmuje warości 0,,,3,. Paramer λ jes jednocześnie jej warością oczekiwaną ( E ( Y )) i wariancją Y ( ( Y ) Var ). Zauważmy, że powyższy rozkład ma dużo ograniczeń, gdyż jeden paramer definiuje wszyskie momeny ej zmiennej. W zasosowaniach ekonomerycznych, gdy dosępne są dodakowe informacje o badanych jednoskach w posaci k-wymiarowego wekora zmiennych objaśniających x, można osłabić założenie o homoscedasyczności. W przypadku próby prosej y (dla =,,T) przyjmuje się, że λ = ( x β ) exp, () gdzie β jes k-elemenowym wekorem nieznanych paramerów informującym o kierunku i sile oddziaływania zmiennych objaśniających na charakerysyki rozkładu obserwowanej zmiennej. Szerzej o konsrukcji i własnościach ego modelu oraz podsawowej meodzie esymacji jego paramerów meodzie największej wiarygodności (MNW) piszą m.in. C. Cameron i P. Trivedi [998, 005]. Kolejnym krokiem w kierunku uogólnienia powyższej konsrukcji osłabienia założenia o równości warości oczekiwanej i wariancji jes zasosowanie mieszanki rozkładów Poissona-gamma, kóra jes równoważna przyjęciu dla zmiennej Y dwuparamerycznego ujemnego rozkładu dwumianowego; zob. np. C. Cameron i P. Trivedi [998, 005]. 3. Dwuwymiarowy model Poissona z korelacją dodanią W ej części przedsawimy podsawową klasę rozkładów dwuwymiarowych zmiennych licznikowych. Rozważamy dwuwymiarową zmienną losową Y = [Y Y ], czyli parę zależnych zmiennych. W monografii S. Kocherlakoa i K. Kocherlakoa [99] znajdziemy różne propozycje rozkładów ej zmiennej, od najprosszych do bardzo złożonych. Jednakże w ramach sandardowych koncepcji można modelować wyłącznie e zjawiska, kóre charakeryzują się nieujemną korelacją. Najczęściej rozważa się zmienną dwuwymiarową, kórej rozkład jes określony przez łączną funkcję prawdopodobieńswa posaci Pr ( Y = y, Y = y ) = exp( λ λ ) ( y, y ) r= 0 gdzie paramery λ, λ 3 i λ 3 są dodanie. min y r y r r λ λ λ3 λ 3, (3)! r! ( y r)! ( y r) Hisoria ego rozkładu sięga la 30 ubiegłego sulecia. Powyższy model jes konsrukcją czyso eoreyczną, nie mającą bezpośredniej inerpreacji w zjawiskach empirycznych. Jednakże rozkład en jes granicznym przypadkiem dwuwymiarowego rozkładu 3
dwumianowego. Ponado funkcja prawdopodobieńswa określona formułą (3) reprezenuje łączny rozkład zmiennych będących sumą dwóch spośród rzech jednowymiarowych zmiennych o rozkładach Poissona. Jeżeli V, V i V 3 są niezależnymi jednowymiarowymi zmiennymi o rozkładach opisanych paramerami λ, λ i λ 3, o rozkład pary zmiennych Y = V +V 3 i Y = V +V 3 jes zdefiniowany wzorem (3). Zaem ławo zauważyć, że wekor warości oczekiwanych zmiennej Y składa się z elemenów odpowiednio ( Y ) = λ + λ3 E ( Y ) = λ + λ3 E i. Brzegowe wariancje ej zmiennej dwuwymiarowej są równe warościom oczekiwanym. Ponado, kowariancja zmiennych Y i Y jes równa cov( Y ) = Var( V3 ) = λ3 więc współczynnik korelacji dany jes wzorem ( Y Y ) λ Y,, 3 corr, = ( 3)( λ. (4) λ + λ λ + 3 ) Przyjmuje on warości wyłącznie dodanie i jes ograniczony od góry przez warość ( λ min( λ λ )) λ +. Własności e są mocno resrykcyjne, co za ym idzie zasosowanie ego 3 3, rozkładu w badaniach empirycznych jes ograniczone. Dodakowe informacje o ej klasie modeli, a doyczące m.in. formuł momenów wyższych rzędów rozkładu łącznego i warunkowego można znaleźć u Kocherlakoa i Kocherlakoa [99]. Analogicznie w oparciu o powyższą koncepcję definiuje się rozkłady wielowymiarowych wekorów zmiennych losowych. Niesey wspomniane wady pozosają. Powyższy model znalazł zasosowanie w markeingu. T. Brijs i in. [004] zaprezenowali badania doyczące zależności między zakupami wybranych produków wykorzysywanych w kuchni. W badanym koszyku znalazły się sól zmiękczająca i deergen oraz dwa podsawowe składniki do wypieków domowych. Inna aplikacja pochodzi ze saysyki sporu. D. Karlis i I. Nzoufras [003] analizowali zależność między liczbą zdobyych i sraconych goli w meczach piłki nożnej i wodnej. Naomias K. Kockelman i J. Ma [006] zasosowali powyższy model w przypadku badań doyczących liczby osób, kóre uczesniczyły w wypadkach drogowych i mogły ponieść uszczerbek na zdrowiu. Rozważali rzy syuacje: brak jakichkolwiek obrażeń, doznanie ciężkich obrażeń ciała i obrażenia śmierelne. 4. Dwuwymiarowe modele z korelacją dodanią lub ujemną Jak wcześniej wspomniano powyższy model saysyczny zakłada wyłącznie dodanią korelację. Propozycji rozkładów, kóre dopuszczają zarówno korelację dodanią jak i ujemną 4
jes niewiele. Można je uzyskać wykorzysując funkcję kopula (zob. np. Ophem [999]) lub mieszanki rozkładów. D. Karlis i E. Xekalaki [005] zaprezenowali przegląd jedno i dwuwymiarowych mieszanek rozkładów Poissona. Ponado zwracają uwagę, że ylko w przypadku pewnych mieszanek (zw. drugiego rodzaju) można rozważać korelację ujemną. Przykładem akiego modelu o srukurze hierarchicznej jes mieszanka z wielowymiarowym rozkładem log-normalnym dla skorelowanych efeków losowych w równaniach definiujących paramery lambda [Aichison i Ho 989, Chib i Winkelmann 00]. Niesandardowym modelem z dodanią lub ujemną korelacją jes zw. warunkowy model Poissona zaproponowany przez Berkhoua i Pluga [004]. Jes o prossza specyfikacja, ale dogodniejsza w esymacji. W niniejszym arykule omówimy obie propozycje. Model Poissona log-normalny Propozycja Aichison i Ho [989] polega na zbudowaniu rozkładu łącznego dla wekora losowego poprzez zasosowanie nieskończonej mieszanki w formie wielowymiarowego rozkładu log-normalnego ze złożoną srukurą korelacyjną. Rozkład mieszający jes określony dla efeków losowych wysępujących w równaniach definiujących warości oczekiwane zmiennych obserwowanych o niezależnych rozkładach Poissona. W przypadku dwuwymiarowej zmiennej losowej łączna funkcja prawdopodobieńswa dla wekora Y = [Y Y ] ma posać ( Y = y, Y = y ) = py ( y ) p ( ) (, ), Y y λ p MLN λ µ Σ dλ dλ Pr λ λ (5) gdzie ( λ µ λ, Σ ) + + R R p jes funkcją gęsości zmiennej losowej λ=[λ λ ] o dwuwymiarowym LnN rozkładzie log-normalnym z paramerem położenia µ λ =[µ λ µ λ ] i rozproszenia Σ = [σ ij ] dla i,j =,. Wybór rozkładu log-normalnego jako rozkładu mieszającego był uzasadniony z dwóch powodów: a) charakeryzuje się silną prawosronną asymerią, więc oddaje charaker rozkładu dla zmiennej obserwowanej, b) jego własności w przypadku wielowymiarowym i związki z innymi rozkładami są dobrze określone. Mimo niejawnej posaci funkcji (5) w przypadku niediagonalnej macierzy Σ Aichison i Ho [989] analiycznie wyznaczyli podsawowe charakerysyki zmiennej Y. Dysponujemy próbą {y, y } dla =,,T. Kluczowy paramer współczynnik korelacji, w ym przypadku wynosi Dla prosoy zapisu pominięo indeks. 5
corr (, ) Y Y = exp( σ ) ( exp( σ ) + µ ) exp( σ ) gdzie E( ) µ = exp( µ + λ σ ) V Y i i i ii ( + µ ), (6) = dla i=, oraz =,,T. Ponado wariancja jes równa ( ) + ( µ ) ( exp( σ ) ) Y i = i i ii µ, a więc wysępuje zw. zwiększenie rozproszenia (ang. overdispersion), co jes nauralne w przypadku zjawisk opisywanych przez model zmiennej skokowej, kóra przyjmuje warości ze zbioru liczb nauralnych. Przypadek σ = 0 odpowiada nieskorelowanym zmiennym losowym, a σ < 0 (σ > 0) korelacji ujemnej (dodaniej). Oczywiście macierz Σ jes symeryczna i dodanio określona. Liczba nieznanych paramerów wynosi pięć. Ponado ze wzoru (6) i faku, że współczynnik korelacji zmiennych o dwuwymiarowym rozkładzie log-normalnym jes równy corr σ σ σ ( λ, λ ) = ( e ) ( e )( e ) wynika, iż corr( Y, Y ) corr( λ, λ ) <. Wniosek en jes zgodny z inuicją, gdyż zmienne Y Y są pośrednio ze sobą zależne poprzez skorelowanie λ i λ. Zaleą powyższego modelu jes fak, że a) można go zdefiniować w przypadku dowolnej liczby zmiennych zależnych, b) można mu nadać inerpreację w nawiązaniu do rzeczywisych zjawisk przyrodniczych czy społecznych. Powyższy model ma srukurę hierarchiczną. Zmienne Y i Y posiadają niezależne rozkłady Poissona z paramerami λ i λ warunkowe względem zmiennej u = [u u ]. Na drugim szczeblu zdefiniowany jes układ równań regresji dla warunkowych warości oczekiwanych λ i λ z muliplikaywnym składnikiem u o dwuwymiarowym rozkładzie normalnym z zerową warością oczekiwaną i macierzą kowariancji Σ u. W efekcie równoważna posać modelu jes nasępująca Yi u ~ Poisson( λi ) λi = exp u ~ N u ( x βi + ui ) ( ) ( 0, Σ ). dla i =, (7) Z zależności między wielowymiarowym rozkładem log-normalnym a wielowymiarowym rozkładem normalnym wynikają relacje pomiędzy elemenami µ λ i Σ a macierzą kowariancji Σ u. Dodakowo, po wprowadzeniu wekora zmiennych objaśniających x, orzymuje się i ( Y ) = exp( x β σ ) µ = E +. Paramerami ego modelu są β, β i rzy swobodne i i ii elemeny dodanio określonej macierzy kowariancji Σ u. Obie specyfikacje (5) i (7) ego modelu posiadają równoważną parameryzację. 6
Aichison i Ho [989] przedsawili ciekawą inerpreację mieszanki danej wzorem (5). Rozważają wekor d-wymiarowy zmiennych skokowych, kóre reprezenują liczebności różnych gaunków moyli, odżywiających się nekarem kwiaowym z d-gaunków roślin rosnących na łące. Każdy gaunek moyli żeruje na swoim ulubionym gaunku roślin kwiaowych, więc nie konkurują między sobą o pożywienie. Czy można zaem oczekiwać, że zmienne losowe reprezenujące liczebności poszczególnych gaunków moyli są niezależne? Tak, ale gdy przyjmiemy, że rozważamy rozkład warunkowy względem usalonej (danej) obfiości (ilość) roślin kwiaowych. Liczebność ych osanich może być dodanio skorelowana, gdy rośliny konkurują ze sobą o dosęp do słońca, wody i minerałów zawarych w glebie. W innym przypadku, na wskuek działania czynników amosferycznych (pogodowych) liczebności kwiaów i owoców różnych gaunków roślin są skorelowane dodanio. Zaem zmienna u reprezenuje m. in. warunki pogodowe i konkurencyjność między poszczególnymi gaunkami roślin. Te czynniki środowiskowe są związane wyłącznie z miejscem życia moyli i łącznie oddziałują na przecięne liczebności wszyskich badanych gaunków. Taka hierarchiczna zależność może więc być opisana modelem przywołanym powyżej. Na gruncie ekonomii isnieją analogiczne przykłady, np. doyczące liczby przyjęych sudenów na I rok sudiów różnych uczelni. W wybranym mieście, np. Krakowie, znajdują się szkoły wyższe o odmiennym profilu, j. echnicznym, ekonomicznym, rolniczym, humanisycznym, eologicznym i arysycznym. Załóżmy, że sudiowanie na każdej z ych uczelni jes ak samo rudne. Uczelnie e nie konkurują ze sobą, gdyż kszałcą i przygoowują sudenów do pracy w różnych zawodach. Jednakże sumaryczna liczba kandydaów na sudia wyższe silnie zależy od liczby maurzysów w danym roku szkolnym. Niż albo wyż demograficzny doyka wszyskie szkoły i uczelnie bez względu na profil. Ponado, isnieją czynniki społeczne, kóre wpływają na zaineresowania młodych ludzi określonymi kierunkami sudiów. Częso są o moda, wpływ rodziców lub sarszych kolegów, perspekywa dobrze płanej i ineresującej pracy. W osanim dziesięcioleciu brak maemayki na maurze mógł być barierą wejścia na uczelnie echniczne. Te ukrye czynniki reprezenowane przez skorelowane składniki u mają wpływ na liczbę nowoprzyjęych sudenów na poszczególne uczelnie o rożnym profilu. Zaem badane zjawisko należy rozważać łącznie, a nie osobno dla każdej ze szkół akademickich. Zasosowanie powyższego modelu w ekonomice zdrowia zaprezenowali R. Riphahn i in. [003]. Analizowali oni liczbę wizy u lekarza i okres pobyu w szpialu (przynajmniej jedną dobę) w przypadku niemieckich gospodarsw domowych w laach 984-995. Z kolei 7
S. Chib i in. [998] wykorzysali ą konsrukcję do budowy modelu dla danych panelowych ze skorelowanymi efekami losowymi. Przedmioem badań była liczba paenów zgłoszonych przez firmy amerykańskie w laach 975-979. Chib i Winkelmann [00] analizowali naomias popy na usługi medyczne w przypadku osób sarszych. Badali rozkład liczby wizy pacjenów m.in. u lekarza w przychodni, szpialu i w izbie pogoowia raunkowego. Rozważali model dla sześciu zmiennych licznikowych. Kolejna aplikacja powyższego modelu doyczyła bezpieczeńswa komunikacji. J. Ma i in. [008] zasosowali go do analizy liczby pięciu rodzajów wypadków drogowych na różnych odcinkach dróg z dwoma pasami ruchu poza erenem zabudowanym w sanie Waszyngon w USA. Przykładem badania z zakresu markeingu w urysyce jes arykuł J. Hellsröma [006]. Na podsawie ankie przeprowadzonych w szwedzkich gospodarswach domowych badał on zależność między liczbą wycieczek a liczbą wykupionych noclegów podczas ych podróży. Niewąpliwą wadą log-normalnego modelu Poissona jes niejawna posać rozkładu próbkowego dla wekora obserwacji Y. Obecność całki wielokronej we wzorze (5) powoduje rudności esymacyjne. R. Riphahn i in. [003] zasosowali w ym celu klasyczne meody całkowania numerycznego (kwadraury Gaussa Hermie'a i Gaussa Legendre'a), aby nasępnie procedurą quasi Newona poszukać maksimów funkcji wiarygodności. J. Hellsröm [006] wykorzysał symulacyjną meodę największej wiarygodności (ang. simulaed maximum likelihood). Nauralnym podejściem do esymacji modelu hierarchicznego jes wnioskowanie bayesowskie. Chib i in. [998] oraz Chib i Winkelmann [00] zaproponowali bayesowską esymację ej klasy modeli z wykorzysaniem narzędzi MCMC (ang. Markov Chain Mone Carlo). Pojawiły się już kolejne arykuły, w kórych auorzy sięgają po e narzędzia esymacji i wnioskowania saysycznego, zob. np. [Ma i in. 008]. Warunkowy model Poissona Inne, prossze podejście do konsrukcji modelu zmiennych licznikowych proponują Berkhou i Plug [004]. Rozważali warunkowy model Poissona dla dwóch skorelowanych zmiennych skokowych. Konsrukcja a dopuszcza ujemną jak i i dodanią korelację przy zachowaniu prosoy i elegancji. Niech Y i Y będą zależnymi zmiennymi skokowymi. Ich rozkład łączny można przedsawić jako iloczyn rozkładu warunkowego i brzegowego. W przypadku dwóch zmiennych rozważamy dwa modele saysyczne Pr ( Y y, Y = y ) = g ( y y ) g ( y ) =, (8) Y Y Y 8
Pr ( Y y, Y = y ) = g ( y y ) g ( y ) =. (9) Y Y Y Oba modele nie są równoważne, a zamiana numerów zmiennych nie prowadzi do orzymania równoważnych konsrukcji saysycznych. Zauważmy, że wraz ze wzrosem liczby zmiennych skokowych rośnie liczba możliwych dekompozycji rozkładu łącznego, kóra z kolei jes równa liczbie permuacji zbioru złożonego ze numerów ych zmiennych. W przypadku wekora m zmiennych orzymamy m! modeli saysycznych. Na gruncie klasycznym (niebayesowskim) może o rodzić problemy z wyborem modelu, kóry najlepiej opisuje badane zjawisko. Przejdźmy do przedsawienia, za arykułem Berkhoua i Pluga [004], założeń doyczących specyfikacji rozkładów brzegowego i warunkowego oraz wynikających z ego charakerysyk opisujących badane zjawisko, j. warości oczekiwanych, wariancji i korelacji zmiennych w rozkładzie łącznym. Rozkład brzegowy dla jednej ze zmiennych np. obserwacji Y, jes jednowymiarowym rozkładem Poissona z paramerem λ g! y ( y ) = ( λ ) ( λ ), gdzie λ ( ) exp y = exp x β. (0) Kluczową kwesią jes określenie rozkładu dla drugiej zmiennej Y pod warunkiem zaobserwowania y (Y = y ), o kórym przyjmuje się, że akże jes rozkładem Poissona z paramerem λ. Paramer en jes ciągłą zmienną losową (jak w przypadku nieskończonych mieszanek), bo jes funkcją zmiennej Y. Berkhou i Plug [004] przyjęli, że wspomniany rozkład warunkowy dla Y ma posać g y ( y y ) ( λ ) ( λ ) exp y! =, gdzie = ( x β + α y ) λ. () exp Z powyższego równania wynika, że paramer α odgrywa kluczową rolę, gdyż jes odpowiedzialny za korelację. Znak ego parameru określa znak współczynnika korelacji między obiema zmiennymi. Zauważmy, że aka konsrukcja rozkładu łącznego zakłada, że rozkład brzegowy zmiennej Y jes sandardowym rozkładem Poissona, a więc warość oczekiwana i wariancja są sobie równe. Powyższy model jes konsrukcją, kóra nie rakuje obu zmiennych symerycznie. Może o być posrzegane jako wada. W przypadku modelu saysycznego określonego przez funkcje prawdopodobieńswa (0) i () Berkhou i Plug [004] podali formułę momenu silniowego dla łącznego rozkładu zmiennej dwuwymiarowej Y=[Y Y ]. Pozwoliło o na wyznaczenie z rozkładu łącznego charakerysyk brzegowego rozkładu zmiennej Y i współczynnika korelacji między Y i Y. 9
Wekor warości oczekiwanych zmiennej dwuwymiarowej Y składa się z nasępujących elemenów E E ( Y ) = λ ( Y ) = ( λ ( exp( α ) ) ) exp( x β ). exp () Wariancje zmiennych Y i Y wynoszą odpowiednio Var Var ( Y ) = λ ( Y ) = E( Y ) + E( Y ) exp λ ( exp( α ) ) ( ( ) ). (3) Zauważmy, że skoro λ > 0, o wariancja zmiennej Y jes zawsze większa od jej warości oczekiwanej, ( Y ) E( Y ) Var >. Naomias kluczową charakerysykę zależności między obiema zmiennymi korelację opisuje poniższa formuła corr ( Y, Y ) λ E = Var α ( Y ) ( e ) ( Y ) Var( Y ). (4) Znak współczynnika korelacji zależy od parameru α. Gdy α jes dodanie (ujemne), o korelacja jes akże dodania (ujemna). Oczywiście przypadek α=0 oznacza, że kowariancja (licznik wzoru (4)) wynosi zero, więc obie zmienne losowe są nieskorelowane i niezależne. W odróżnieniu do modelu mieszanki esymacja warunkowego modelu Poissona nie wymaga wyrafinowanych meod. Berkhou i Plug [004] zaproponowali meodę największej wiarygodności. Podali analiyczne formuły równań definiujące en esymaor. Jego własności asympoyczne nie zosały jeszcze zbadane. Analiyczna macierz drugich pochodnych uławi opymalizację numeryczną, ale wyznaczenie asympoycznej macierzy kowariancji esymaora MNW jes urudnione. Z uwagi na brak symeryczności w rakowaniu obu zmiennych Y i Y pojawia się problem wyboru modelu w konekście danych. Koncepcja maximum maximorum jes nieformalnym rozwiązaniem problemu wyboru między Pr ( Y = y, Y = y ) = g ( y y ) g ( y ) a Pr( Y y, Y = y ) = g ( y y ) g ( y ) Y Y Y =. Y Y Y Berkhou i Plug [004] zasosowali powyższy model w celu zdiagnozowania sposobu spędzania wolnego czasu przez mieszkańców Holandii. Analizą objęo uczesnicwo w wydarzeniach kuluralnych (wizyy w earze lub kinie, na koncerach) oraz wizyy w miejscach arakcyjnych urysycznie (np. w zoo, parku rozrywki, w ekspozycjach). Wspomniany model nie znalazł jeszcze szerszego zasosowania w rzeczywisych badaniach. Jedną z ych nielicznych aplikacji zaprezenowano w opracowaniu Polasik i in. [0], kóre przedsawia badanie subsyucji między liczbą ransakcji goówką i karą bankową w 0
płanościach dealicznych na podsawie danych z polskiego rynku. Dalsze uogólnienia meodologiczne są prezenowane w arykułach: J. Osiewalski (0) oraz J. Marzec i J. Osiewalski (0). 5. Podsumowanie Oba modele, model Poissona log-normalny i warunkowy model Poissona pozwalają analizować zależności o dodanim i ujemnym skorelowaniu. Pierwszemu można nadać inerpreację w kaegoriach obserwowanego zjawiska, drugi sanowi wyłącznie arefak. Model mieszanki w nauralny sposób opisuje zależności między wieloma zmiennymi endogenicznymi, ale jes rudny w esymacji. Propozycja Berkhoua i Pluga jes z kolei prossza, ale za cenę resrykcji doyczących własności rozkładu jednej ze zmiennych. Jednakże uogólnienie modelu warunkowego, j. rozszerzenie na przypadek wielu zmiennych, jes możliwe, ale rodzi komplikacje. Obie konsrukcje są modelami względem siebie niezagnieżdżonymi, co na gruncie niebayesowskim urudnia ich esowanie. Esymacja paramerów i wzajemne esowanie obu modeli jes możliwe w ujęciu bayesowskim, co będzie przedmioem dalszych, pogłębionych badań. 6. Lieraura Aichison J., C. H. Ho [989], The mulivariae Poisson-log normal disribuion, Biomerika, vol. 76 (4), s 643-653. Berkhou P., E. Plug [004], A bivariae Poisson coun daa model using condiional probabiliies, Saisica Neerlandica, vol. 58, nr 3, s. 349-364. Brijs, T., D. Karlis, G. Swinnen, K. Vanhoof, G. Wes, P. Marchanda [004], A mulivariae Poisson mixure model for markeing applicaions, Saisica Neerlandica, vol. 58, nr3, s. 3 348. Cameron A.C., P.K. Trivedi [998], Regression analysis of coun daa, Cambridge Universiy Press, New York. Cameron A.C., P.L. Trivedi [005], Microeconomerics: Mehods and Applicaion, Cambridge Universiy Press, New York. Chib S., R. Winkelmann [00], Markov chain mone carlo analysis of correlaed coun daa, Journal of Business and Economic Saisics, vol. 9 nr 4, s. 48-435. Chib, S., E. Greenberg, R. Winkelmann [998]. Poserior simulaion and Bayes facor in panel coun daa models, Journal of Economerics, nr 86, s. 33-54.
Greene W. H. 007, Correlaion in he bivariae Poisson regression model, Working Paper Series, Leonard N. Sern School of Business Paper No. ISSN 547-365, dosępny w Inernecie: hp://ssrn.com/absrac=9900, dosęp 30 października 00 r. Hellsröm J. [006], A bivariae coun daa model for household ourism demand, Journal of Applied Economerics, vol. s. 3 6. Ma J., K. Kockelman, P. Damien [008], A mulivariae Poisson-lognormal regression model for predicion of crash couns by severiy, using bayesian mehods, Acciden Analysis and Prevenion, nr 40, s. 964-975 Kockelman K., J. Ma 006], Bayesian mulivariae Poisson regression for models of injury coun, by severiy, Transporaion Research Record, nr 950, s. 4-34. Karlis D., E. Xekalaki [005], Mixed Poisson disribuions, Inernaional Saisical Review, vol. 78, s. 35-58. Karlis, D., I. Nzoufras [003], Analysis of spors daa using bivariae Poisson models, Journal of he Royal Saisical Sociey: Series D, vol. 5 (3), s. 38-393. Kocherlakoa S., K. Kocherlakoa [99], Bivariae discree disribuions, Marcel Dekker, New York. Marzec J, Osiewalski J. (0), Dwuwymiarowy model ypu ZIP-CP w łącznej analizie zmiennych licznikowych, Folia Oeconomica Cracoviensia, vol. LIII, w druku. Ophem van H. [999], A general mehod o esimae correlaed discree random variables, Economeric Theory, 5, s. 8-37. Osiewalski J. (0), Dwuwymiarowy rozkład ZIP-CP i jego momeny w analizie zależności między zmiennymi licznikowymi, [w:] Spokania z królową nauk (Księga jubileuszowa dedykowana Profesorowi Edwardowi Smadze), red. A. Malawski i J. Taar, Wydawnicwo Uniwersyeu Ekonomicznego w Krakowie, Kraków 0, s.47-54. Polasik M., J. Marzec, P. Fiszeder, J. Górka [0], Modelowanie wykorzysania meod płaności dealicznych na rynku polskim, Maeriały i Sudia NBP nr 65, Warszawa. Riphahn R.T., A. Wambach [003], A. Million, Incenive effecs in he demand for healh care: A bivariae panel coun daa esimaion, Journal of Applied Economerics, vol. 8, nr 4, s. 387-405. Winkelmann R. [008], Economeric analysis of coun daa, Springer-Verlag.
Wybrane dwuwymiarowe modele dla zmiennych licznikowych w ekonomii Sreszczenie Głównym celem niniejszego arykułu jes prezenacja wybranych modeli dla dwuwymiarowych zmiennych licznikowych. Omawiane są podsawowe problemy związane z własnościami sandardowego dwuwymiarowego rozkładu Poissona, kóry zakłada wyłącznie dodanią korelację. Nasępnie przedsawia się konsrukcję, porównuje się zaley i wady dwóch innych modeli, kóre uwzględniają zarówno dodanią jak i ujemną korelację, j. modelu Poissona log-normalnego i warunkowego modelu Poissona. Prezenuje się akże wybrane prakyczne zasosowania ychże modeli w ekonomii. Słowa kluczowe: dwuwymiarowe modele regresji Poissona, skorelowane zmienne licznikowe, rozkład Poissona log-normalny, warunkowy model Poissona. Tile A bivariae coun daa models in he economics Summary This paper presens an overview of he seleced bivariae coun daa regressions. We describe he properies of he sandard bivariae Poisson disribuion and we draw aenion ha he main limiaion of his model is ha i assumes only posiive correlaion beween wo coun variables. Nex wo alernaive approach Poisson lognormal model and condiional Poisson model are presened. We discuss some of heir meris and compare he properies of each of he wo models which allow for a flexible correlaion srucure, i. e. boh negaive and posiive value of he correlaion coefficien. Many examples demonsrae ha one can use hese models in various economics areas. Key words: bivariae Poisson regression models, correlaed coun variables, Poisson lognormal disribuion, condiional Poisson model. 3