Polske Towarzystwo Statystyczne Oddzał we Wrocławu Slesan Statstcal Revew Wydawnctwo Unwersytetu Ekonomcznego we Wrocławu Wrocław 2014
RADA NAUKOWA Walenty Ostasewcz, Tadeusz Bednarsk, Lusa Canal, Stansław Helpern, Stanslava Hronová, Angola Pollastr, Jerzy Śleszyńsk, Renhard Vertl, Emla Zmková KOMITET REDAKCYJNY Zofa Rusnak (redaktor naczelny) Edyta Mazurek (sekretarz naukowy) Tadeusz Borys, Katarzyna Ostasewcz, Grażyna Trzpot RECENZENCI WSPÓŁPRACUJĄCY Z CZASOPISMEM: Mlan Bašta, Marusz Czekała, Stansława Hronová, Helena Jasulewcz, Dorota Kuchta, Tomáš Löster, Ivana Malá, Wtold Mszczak, Stansława Ostasewcz, Wtold Węsław Publkacja jest dostępna w Internece na stronach: www.buk.pl; www.ebscohost.com, The Central European Journal of Socal Scences and Humantes http://cejsh.cm.edu.pl The Central and Eastern European Onlne Lbrary www.ceeol.com, a także w adnotowanej bblograf zagadneń ekonomcznych BazEkon http://kangur.uek.krakow.pl/bazy_ae/bazekon/nowy/ndex.php Informacje o naborze artykułów zasadach recenzowana znajdują sę na strone nternetowej Wydawnctwa www.wydawnctwo.ue.wroc.pl
Sps treśc Od Redakcj 7 Edtor s note on the paper C.F. Gauss and the method of least aquares 8 Oscar Sheynn, C.F. Gauss and the method of least squares 9 Addenda to the paper C.F. Gauss and the method of least squares 39 Oscar Sheynn, Addendum No. 1: Elementary exposton of Gauss fnal justfcaton of least squares 39 Oscar Sheynn, Addendum No. 2: Antstgler 48 Oscar Sheynn, Addendum No. 3: Theory of errors and statstcs. Some thoughts about Gauss 53 Wtold Węsław, Gauss theorem on contnued fractons 55 Oscar Sheynn, Randomness and determnsm: Why are the planetary orbts ellptcal? 57 Walenty Ostasewcz, The emergence of statstcal scence 75 Adam Korczyńsk, Revew of methods for data sets wth mssng values and practcal applcatons 83 Katarzyna Ostasewcz, Impact of outlers on nequalty measures a comparson between Polsh vovodeshps 105 Magdalena Barska, Seasonalty testng for macroeconomc tme seres comparson of X-12-ARIMA and TRAMO/SEATS procedures 121 Małgorzata Gotowska, Anna Jakubczak, Satsfacton wth educaton and work as a bass for assessng the qualty of lfe n selected regons wth dfferent levels of standard of lvng 141 22. Scentfc Statstcal Semnar Wrocław-Marburg, Śweradów Zdrój, 30 IX 4 X 2014. Extended abstracts 157 Stansław Helpern, Zależny, złożony proces Possona wyznaczane składek ubezpeczenowych 195 Stansława Bartosewcz, Anna Błaczkowska, Analza nedowartoścowana kobet w Polsce w zakrese wysokch wynagrodzeń 209 Beata Bal-Domańska, Alna Beńkowska, Zrównoważony rozwój w pracach Eurostatu GUS 225
4 Sps treśc Kaml Jodź, Stochastyczne modelowane umeralnośc 237 Agneszka Marcnuk, Renta hpoteczna a odwrócony kredyt hpoteczny na rynku polskm 253 Agneszka Mruklk, Struktura termnowa stóp procentowych opsana modelam stopy krótkotermnowej 273 Katarzyna Ostasewcz, Racjonalność, konflkty teora ger w życu pracy Roberta J. Aumanna (Nagroda mena Nobla w dzedzne ekonom, 2005) 285 Elżbeta Stańczyk, Analza porównawcza województw ze względu na dzałalność nnowacyjną przedsęborstw w latach 2004 2012 313 Potr Sulewsk, Wykorzystane uogólnonego rozkładu gamma do generowana tablcy dwudzelczej 339 Walenty Ostasewcz, Refleksje o psarstwe statystycznym 349 Agata Grul, Ważnejsze dane społeczno-gospodarcze o województwach 353 Summares Oscar Sheynn, C.F. Gauss metoda najmnejszych kwadratów 37 Oscar Sheynn, Addendum 1. Elementarne przedstawene ostatecznego Gaussowskego uzasadnena najmnejszych kwadratów 48 Oscar Sheynn, Addendum 2. Antstgler 53 Oscar Sheynn, Addendum 3. Teora błędów statystyka. Pewne przemyślena gaussowske 55 Oscar Sheynn, Losowość determnzm. Dlaczego orbty planet są elptyczne? 74 Walenty Ostasewcz, Pojawene sę nauk statystycznej 81 Adam Korczyńsk, Przegląd metod analzy nekompletnych zborów danych wraz z przykładam zastosowań 103 Katarzyna Ostasewcz, Wpływ obserwacj odstających na mary nerównośc porównane pomędzy polskm województwam 120 Magdalena Barska, Weryfkacja sezonowośc dla makroekonomcznych szeregów czasowych porównane metod X-12-ARIMA TRAMO/SEATS 139 Małgorzata Gotowska, Anna Jakubczak, Zadowolene z edukacj pracy jako podstawa do oceny jakośc życa w wybranych województwach o różnym pozome życa 156
Sps treśc 5 Stansław Helpern, Dependent compound Posson process nsurance premum determnaton 207 Stansława Bartosewcz, Anna Błaczkowska, Analyss of women undervaluaton n Poland n terms of hgh salares 223 Beata Bal-Domańska, Alna Beńkowska, Sustanable development as seen by Eurostat and GUS 235 Kaml Jodź, Stochastc modelng mortalty 251 Agneszka Marcnuk, Reverse annuty contract and reverse mortgage on the Polsh market 272 Agneszka Mruklk, Term structure of nterest rates descrbed wth short-rate models 284 Katarzyna Ostasewcz, Ratonalty, conflcts and game theory n the lfe and career of Robert J. Aumann (Nobel Prze n Economc Scences, 2005) 312 Elżbeta Stańczyk, Comparatve analyss of vovodeshps due to the nnovaton actvty of ndustral enterprses n the years 2004 2012 338 Potr Sulewsk, Usng the generalzed gamma dstrbuton to generate contngency tables 347
WYKORZYSTANIE UOGÓLNIONEGO ROZKŁADU GAMMA DO GENEROWANIA TABLICY DWUDZIELCZEJ Nr 12(18) Potr Sulewsk Akadema Pomorska w Słupsku ISSN 1644-6739 Streszczene: Artykuł pośwęcony jest generowanu zawartośc tablcy dwudzelczej (TD) 2 k z wykorzystanem uogólnonego rozkładu gamma (URG). Opsano w nm generator lczb losowych URG oraz sposób tworzena TD 2 k na podstawe wartośc dystrybuanty dośwadczalnej dystrybuanty teoretycznej rozkładu wykładnczego, który jest szczególnym przypadkem URG. Słowa kluczowe: generacja tablc dwudzelczych, uogólnony rozkład gamma, lczby losowe o uogólnonym rozkładze gamma, rozkład wykładnczy. DOI: 10.15611/sps.2014.12.18 1. Wstęp W podręcznkach statystycznych znaleźć można główne metody wnoskowana dotyczące jednej zmennej. Jednak obekty opsywane są często za pomocą wększej lczby zmennych. Tablcę, która powstaje przez podzał danych według dwóch zmennych, nazywa sę tablcą dwudzelczą (dwuwymarową) zalcza do podstawowych narzędz statystycznych. Tablca dwudzelcza jest podstawowym często stosowanym narzędzem statystycznym do badana sły zwązku mędzy cecham typu jakoścowego. W drodze analtycznej trudno jest uzyskać nformacje na temat wykrywana zwązku mędzy cecham w tablcy dwudzelczej, na le czułym jest ona narzędzem. Jedyny sposób osągnęca tego celu stanow generowane tablc dwudzelczych badana symulacyjne. Generowane tablc dwudzelczych, gdy ne ma zwązku mędzy badanym cecham, jest rzeczą prostą, gdyż w takej sytuacj można skorzystać z generatorów lczb równomernych generować nezależne przynależność do wersza kolumny. Zadanem newątplwe trudnejszym wydaje sę generowane TD w sytuacj, gdy zachodz zwązek mędzy cecham. W pracy [Sulewsk 2007a] przedstawono procedurę generowana zawartośc TD 2 2 z wykorzystanem rozkładu normalnego dwuwy-
340 Potr Sulewsk marowego. Metoda ta jednak ne sprawdzła sę jako generator TD o wększych rozmarach, gdyż narożne komórk tablcy często były puste. Z tego powodu w artykule [Sulewsk 2007b] zaproponowano nną metodę generowana zawartośc TD wykorzystującą lczby losowe o rozkładze równomernym, którą określono manem metody słupkowej. W pracy [Sulewsk 2009] do generowana zawartośc TD 2 2 wykorzystano URG. Tablca dwudzelcza (TD) jako narzędze do badana sły zwązku mędzy cecham jest testem nezależnośc wykorzystującym statystykę χ 2 z (k 1)(w 1) stopnam swobody. W lteraturze spotyka sę różne warunk co do mnmalnej lczby realzacj w komórkach tablcy dwudzelczej. W pracy [Sobczyk 1996] stwerdzono, że wszystke lczebnośc empryczne pownny być ne mnejsze nż 5, czyl n j 5 dla każdego = 1, 2,, w, j = 1, 2,, k. W pracy [Oktaba 1974] proponuje sę, by wszystke lczebnośc oczekwane były ne mnejsze nż 10, czyl ñ j 10 dla każdego = 1, 2,, w, j = 1, 2,, k. Autor nnejszej pracy mnmalną lczebność realzacj w komórkach opsuje nerównoścą ñ j 5 dla każdego = 1, 2,, w, j = 1, 2,, k zaproponowaną w pracy [Jóźwak, Podgórsk 1998]. Celem nnejszej pracy jest przedstawene metody generowana zawartośc TD 2 k z wykorzystanem URG, gdy zwązek mędzy cecham stneje. W punkce drugm opsano generator lczb losowych o URG. Punkt drug dotyczy sposobu tworzena TD 2 k z uwzględnenem wartośc dystrybuanty dośwadczalnej dystrybuanty teoretycznej rozkładu wykładnczego, który jest szczególnym przypadkem URG. 2. Generator lczb losowych o uogólnonym rozkładze gamma URG jest rozkładem o złożonej postac analtycznej, która daje mu pożądaną elastyczność. Jego funkcja gęstośc wyrażona jest wzorem [Stacy 1962] ( ) bc 1 b b z z f zabc ;,, = exp ( z> 0), (1) aγ( c) a a gdze: b > 0, c > 0 parametry kształtu, a > 0 parametr skal.
Wykorzystane uogólnonego rozkładu gamma... 341 Dystrybuantę URG można zapsać za pomocą nepełnej funkcj gamma w postac [Stacy 1962] x (, ) c 1 exp( ) Γ n c x = u u du (2) ( ) G z 0 ( ) ( c) Γ n c, z/ a = Γ b. (3) Jeżel f(z; a, b, c) jest funkcją gęstośc URG, to f(x; a, 1, c) jest funkcją gęstośc rozkładu gamma, która dla c = 1 staje sę funkcją gęstośc rozkładu wykładnczego. Mędzy zmenną losową X o rozkładze f(x) zmenną losową Z o rozkładze f(z) zachodz zwązek [Weczorkowsk, Zelńsk 1997] b Z X = Z = a X a 1/ b, (4) węc wystarczy skonstruować generator realzacj zmennej losowej X o rozkładze gamma. Najprostszy algorytm otrzymuje sę wówczas, gdy c jest lczbą całkowtą. Nech X 1, X 2 będą zmennym losowym nezależnym. Jeżel X 1 ma rozkład gamma z parametrem c 1 oraz X 2 ma rozkład gamma z parametrem c 2, to zmenna losowa X 1 + X 2 ma rozkład gamma z parametrem c 1 + c 2. Dla otrzymana zmennej losowej o rozkładze gamma z całkowtym parametrem c generuje sę c realzacj zmennych losowych o rozkładze wykładnczym oblcza ch sumę. Zatem c X = ln( U1) ln ( U2)... ln( Uc) = ln U, (5) = 1 gdze: U 1, U 2,, U c nezależne zmenne losowe o rozkładze równomernym U(0; 1). Jeżel c ne jest lczbą całkowtą, realzację zmennej losowej X o rozkładze gamma generuje sę na podstawe wzoru X = X1+ X2X3, (6) gdze: X 1 zmenna losowa o rozkładze gamma z parametrem n = [c] (część całkowta z c),
342 Potr Sulewsk n X = ln U ln U... ln U = ln U, (7) = 1 ( ) ( ) ( ) 1 1 2 n U 1, U 2,, U n nezależne zmenne losowe o rozkładze równomernym U(0; 1), X 2 zmenna losowa o rozkładze gamma z parametrem c = 1 (rozkład wykładnczy), X2 = ln( U), (8) U zmenna losowa o rozkładze równomernym U(0; 1), X 3 zmenna losowa o rozkładze beta z parametram (d, 1 d), d = c [c] (0; 1). Realzację zmennej losowej X 3 otrzymano, stosując następujący algorytm: a) generuje sę realzację zmennej losowej W o rozkładze potęgowym z parametrem d W 1/d = U, (9) U jest nezależną zmenną losową o rozkładze równomernym U(0; 1); b) generuje sę realzację zmennej losową V o rozkładze potęgowym z parametrem 1 d ( ) V U 1/ 1 d =, (10) U jest nezależną zmenną losową o rozkładze równomernym U(0; 1); c) jeżel W + V > 1, to powtarza sę operacje a) b); w wypadku przecwnym W X 3 = W + V. (11) Generacje realzacj zmennych losowych W (9) V (10) wykonano metodą odwracana dystrybuanty rozkładu potęgowego. W celu sprawdzena poprawnośc dzałana generatora lczby losowe z * posortowano, a następne oblczono na podstawe (3) wartośc * dystrybuanty teoretycznej T ( z( ) ) oraz wartośc dystrybuanty emprycznej danej wzorem F = = 1,..., n. (12) n + 1
Wykorzystane uogólnonego rozkładu gamma... 343 Rysunek 1 przedstawa przebeg dystrybuanty emprycznej teoretycznej URG dla a = 1; b = 2; c = 1,5 oraz lczebnośc próby n = 1000. Rys. 1. Dystrybuanta empryczna teoretyczna URG dla n = 1000 a = 1; b = 2; c = 1,5 Źródło: opracowane własne. Jak wynka z rys. 1, przebeg dystrybuanty teoretycznej URG dystrybuanty emprycznej pokrywają sę, co śwadczy o tym, że lczby losowe z mają URG. * 3. Generacja zawartośc tablcy dwudzelczej 2 k * Nech z ( ) będą lczbam losowym o URG posortowanym rosnąco. Do utworzena TD wykorzystano wartośc dystrybuanty teoretycznej rozkładu wykładnczego * * * * ( ( ); ) 1 exp ( ) ( ) T z a = a z (13) oraz wartośc dystrybuanty emprycznej (12). Do oszacowana neznanej wartośc parametru rozkładu wykładnczego skorzystano z metody najmnejszych kwadratów (MNK), dzęk której dystrybuanta empryczna lepej otacza dystrybuantę teoretyczną (rys. 2) nż ma to mejsce w metodze najwększej warygodnośc (MNW) czy w metodze momentów (MM) (rys. 3).
344 Potr Sulewsk Rys. 2. Przebeg dystrybuant, gdy parametr rozkładu wykładnczego szacowano MNK Źródło: opracowane własne. Rys. 3. Przebeg dystrybuant, gdy parametr rozkładu wykładnczego szacowano MM lub MNW Źródło: opracowane własne. Jako oszacowane a * parametru a przyjęto wartość, która mnmalzuje funkcję
Wykorzystane uogólnonego rozkładu gamma... 345 n 2. (14) = 1 * ( ) ( () ; ) M a = T z a F Na podstawe (12) (13) wyznaczono różnce dystrybuant * * ( ( ) ) D = F T z ; a = 1,2,..., n (15) oraz wartośc bezwzględne tych różnc uporządkowane w kolejnośc wzrastana j DP( ) = D j = 1,2,..., n. (16) j Znak D ( = 1, 2,, n) decyduje o tym, do którego wersza należy dana realzacja według zasady pokazanej w tab. 1. O przynależnośc do kolumny decydują wartośc percentyl stopna u/k (u = 1, 2., k 1) oblczone ze wzoru DP n neparzyste ( n+ 1) u k Peru = DP nu + DP, (17) nu k [ ] [ ] + 1 k k n parzyste 2 gdze [.] oznacza część całkowtą lczby. Ze wzoru (17) wynka, że lczba percentyl jest o jeden mnejsza nż lczba kolumn tablcy dwudzelczej, którą zamerzamy wygenerować. W szczególnośc, gdy tablca ma cztery kolumny, wyznaczamy kwartyl dolny Q 1 = Per 1/4, medanę M = Per 1/2, kwartyl górny Q 1 = Per 3/4. Zasadę tworzena tablcy 2 4 przedstawono w tab. 1. Tabela 1. Sposób postępowana przy tworzenu tablcy 2 4 Y 1 Y 2 Y 3 Y 4 D > 0 X 1 D Q1 D > 0 Q1 < D M D > 0 M < D Q3 D > 0 D > Q3 D 0 X 2 D Q1 D 0 Q1 < D M D 0 M < D Q 3 D 0 D > Q3 Źródło: opracowane własne.
346 Potr Sulewsk Tabela 2 przedstawa TD 2 4 wygenerowaną za pomocą URG, gdy a = 1; b = 1; c = 1 (brak zwązku mędzy X Y). Tabela 3 przedstawa wygenerowaną za pomocą URG TD 2 4, gdy a = 1; b = 1,01; c = 1. Tabela 4 przedstawa wygenerowaną za pomocą URG TD 2 4, gdy a = 1; b = 0,95; c = 1. Tabela 2. Tablca dwudzelcza wygenerowana za pomocą URG, gdy a = 1; b = 1; c = 1 Y 1 Y 2 Y 3 Y 4 Razem X 1 57 36 30 20 143 X 2 18 39 45 55 157 Razem 75 75 75 75 300 Źródło: opracowane własne. Tabela 3. Tablca dwudzelcza wygenerowana za pomocą URG, gdy a = 1; b = 1,01; c = 1 Y 1 Y 2 Y 3 Y 4 Razem X 1 24 30 26 34 114 X 2 51 45 49 41 186 Razem 75 75 75 75 300 Źródło: opracowane własne. Tabela 4. Tablca dwudzelcza wygenerowana za pomocą URG, gdy a = 1; b = 0,95; c = 1 Y 1 Y 2 Y 3 Y 4 Razem X 1 46 40 46 39 171 X 2 29 35 29 36 129 Razem 75 75 75 75 300 Źródło: opracowane własne. Dla b = 1, gdy mędzy cecham ne ma zwązku, lczebnośc werszy są podobne (tab. 2). Dla b 1 uzyskuje sę zwązek mędzy cecham. Zwększaj neznaczne wartość parametru b (b = 1,01) wększość elementów próby znajduje sę w werszu 2 (tab. 3). Gdy wartość parametru b sę zmnejsza, (b = 0,95), wększość elementów próby znajduje sę w werszu 1 (tab. 4). 4. Podsumowane Wykrywane zwązku mędzy cecham w tablcy dwudzelczej jest trudne na drodze analtycznej. Jedyny sposób osągnęca tego celu stanow generowane tablc dwudzelczych badana symulacyjne.
Wykorzystane uogólnonego rozkładu gamma... 347 Generowane tablc dwudzelczych, gdy ne ma zwązku mędzy badanym cecham, ne przysparza trudnośc. Zadanem newątplwe trudnejszym jest generowane TD w sytuacj, gdy zachodz zwązek mędzy cecham. W nnejszej pracy opsano sposób generowana zawartośc TD 2 k, do którego wykorzystano uogólnony rozkład gamma z parametram a, b, c, którego szczególnym przypadkem jest doskonale znany rozkład wykładnczy (a = 1, b = 1, c = 1). Jeżel generuje sę zawartość TD 2 k, gdy zwązku mędzy cecham ne ma, należy w symulacjach przyjąć a = 1, b = 1, c = 1. Jeżel generuje sę zawartość TD 2 k, gdy zwązek mędzy cecham jest, należy w symulacjach przyjąć b 1. Lteratura Jóźwak J., Podgórsk J., Statystyka od podstaw, PWE, Warszawa 1998. Oktaba W., Elementy statystyk matematycznej metodyka dośwadczalnctwa, PWN, Warszawa 1974. Sobczyk M., Statystyka, PWN, Warszawa 1996. Stacy E.W., A generalzaton of the gamma dstrbuton, Annals of Mathematcal Statstcs 1962, Vol. 33. Sulewsk P., Test nezależnośc dwóch cech realzowany za pomocą tablcy dwudzelczej, Słupske Prace Matematyczno-Fzyczne nr 4, Słupsk 2007a, s. 83 97. Sulewsk P., Moc tablcy dwudzelczej jako test nezależnośc, Wadomośc Statystyczne 2007b, nr 6, s. 14 23. Sulewsk P., Two-by-two contngency table as a goodness-of-ft test, Computatonal Methods n Scence and Technology 2009, Vol. 15, No. 2, Poznań, s. 203 211. Weczorkowsk R., Zelńsk R., Komputerowe generatory lczb losowych, WNT, Warszawa 1997. USING THE GENERALIZED GAMMA DISTRIBUTION TO GENERATE CONTINGENCY TABLES Summary: The artcle s devoted to the generaton of two-way table contents usng the generalzed gamma dstrbuton (GG). It descrbes the generalzed gamma random number generator and how to create a two-way table by means of the emprcal dstrbuton functon and theoretcal exponental dstrbuton, whch s a specal case of GG. Keywords: generaton of two-way tables, generalzed gamma dstrbuton, generalzed gamma random value, exponental dstrbuton.