A C T A U N I V E R S I T A T I S L O Z I E N S I S FOLIA OECONOMICA 71, 01 Tomasz o * O PREYKCJI WARTOCI GLOBALNEJ W OMENIE Z WYKORZYSTANIEM INFORMACJI O ZMIENNYCH OATKOWYCH PRZY ZAOENIU MOELU FAYA-HERRIOTA Streszczenie. W pracy zostan zaprezentowane najlepsze liniowe nieobcione preyktory (ang. Best Linear Unbiase Preictors BLUP) i empiryczne najlepsze liniowe nieobcione preyktory (ang. Empirical Best Linear Unbiase Preictors EBLUP), ich by reniokwaratowe (ang. Mean Square Errors MSE) oraz estymatory MSE la moelu Faya-Herriota (Fay, Herriot (1979)). Moel ten naley o klasy ogólnych mieszanych moeli liniowych typu A, co oznacza, e jest on zakaany la wartoci estymatorów bezporenich charakterystyk w omenach. Ponato przyjmuje si, e wartoci wariancji estymatorów bezporenich s znane. W artykule bzie analizowany symulacyjnie z wykorzystaniem rzeczywistych anych wpyw zastpienia nieznanych wariancji estymatorów bezporenich ich nieobcionymi estymatorami i estymatorami otrzymanymi przy wykorzystaniu ogólnych funkcji wariancji na obcienia preyktorów, warto MSE oraz obcienia estymatorów MSE. Ponato bzie uwzglniony problem niespenienia zaoe o normalnoci rozkau skaników losowych specyficznych la omen. Analiza symulacyjna zostanie przeprowazona w oparciu o ane otyczce 864 gospoarstw rolnych z powiatu browa Tarnowska, które zostay uzyskane w spisie rolnym w 1996 roku. Sowa kluczowe: BLUP, EBLUP, moel Faya-Herriota, estymatory MSE. I. POSTAWOWE OZNACZENIA Populacja N-elementowa oznaczana przez zieli si na rozcznych popopulacji (=1,...,) nazywanych ziezinami baania lub omenami o liczebnociach N (=1,...) kaa. Z populacji wybierana jest (losowo lub celowo) próba s o liczebnoci n. Cz wspólna -tej omeny i próby bzie oznaczana przez s s a liczebno tego zbioru przez n. Zbiór elementów -tej omeny, które nie znalazy si w próbie, bzie oznaczany przez r s a liczebno tego zbioru przez N r N n. renia warto baanej zmiennej w -tej omenie oznacza bzie przez a warto globalna baanej zmiennej w -tej omenie przez N. * r, Katera Statystyki, Uniwersytet Ekonomiczny w Katowicach. [43]
44 Tomasz o II. MOEL NAPOPULACJI W pracy bzie analizowany moel Faya-Herriota, który skrótowo bziemy oznacza przez F-H (Fay, Herriot (1979)). Naley on o klasy moeli typu A (zob. Rao (003)), co oznacza, e jest zakaany la wartoci estymatorów bezporenich charakterystyk w omenach. oajmy, e moele typu B (Rao (003)) zakaane s la zmiennych losowych, których realizacjami s wartoci baanej zmiennej. Ononie wartoci bezporeniego estymatora reniej w omenie, oznaczanego przez ˆ, zakaamy, e e (1) ˆ T gzie x v jest reni w omenie, x wektorem wartoci p-zmiennych oatkowych w -tej omenie, wektorem p nieznanych parametrów, e jest bem wynikajcym z planu losowania oraz e i v (=1,...,) s ii ii niezalene, przy czym e ~ N(0, W ) i v ~ N(0, A ) i przyjmuje si, e wariancje W s znane. Pokrelmy, e zaprezentowany moel jest szczególnym przypakiem nastpujcych moeli: ogólnego moelu liniowego, ogólnego mieszanego moelu liniowego oraz ogólnego mieszanego moelu napopulacji z blokowo-iagonaln macierz wariancji i kowariancji, przy czym zamiast zmiennych losowych Y i (i=1,...,n) mamy ˆ (=1,...,) oraz i, Zi 1. III. NAJLEPSZY LINIOWY NIEOBCIONY PREYKTOR la znanego A i bez koniecznoci zaoe normalnoci rozkaów skaników losowych, preyktor typu BLU reniej w -tej omenie oraz jego MSE ane s wzorami (atta, Rao, Smith (005), atta, Lahiri (000), Lahiri, Rao (1995), Prasa, Rao (1990)): BLUP T ˆ ˆ B ( A) ˆ x ˆ () gzie B A W A W 1 ( ) ( ) (3)
O preykcji wartoci globalnej w omenie z wykorzystaniem informacji 45 1 B ( A) T B ( A) ˆ 1 W 1 W ˆ x x x (4) gzie BLUP MSE ( ˆ ) g1 ( A) g ( A) (5) g ( ) ( ) 1 A AW A W 1 (6) 1 T 1 T ( ) ( ) ( ) u u u1 g A W A W x A W x x x (7) St, przy znanych liczebnociach omen N, preyktor typu BLU wartoci globalnej i jego MSE la moelu F-H ane s wzorami: ˆBLUP BLUP ˆ N i ˆBLUP BLUP MSE ( ) N MSE ( ˆ ), gzie ˆ BLUP ane jest wzorem (), a BLUP MSE ( ˆ ) ane jest wzorem (5). oajmy, e prezentowane wyniki s przypakami szczególnymi twierzenia Henersona (1950). IV. ESTYMACJA PARAMETRÓW MOELU NAPOPULACJI Przy wyprowazeniu postaci preyktora typu BLU zakaa si, e parametr A moelu napopulacji jest znany. W praktyce jest on szacowany na postawie anych z próby. Poniej przestawione zostan wykorzystywane w praktyce metoy estymacji tego parametru. Pierwszymi woma metoami szacowania parametru A s metoy najwikszej wiarygonoci (ang. Maximum Likelihoo) i metoy najwikszej wiarygonoci z ograniczeniami (ang. Restricte Maximum Likelihoo). Estymatory parametru A otrzymane tymi metoami przy zaoeniu normalnoci rozkau zmiennych losowych oznacza bziemy opowienio przez A ˆML oraz A ˆRE. Poniewa rozwaany moel napopulacji jest szczególnym przypakiem ogólnego moelu liniowego, mona zastosowa znane w literaturze proceury np. Rao (003) s. 100 10. oajmy, e o iteracyjnego rozwizania równa nieliniowych, które pojawiaj si w obu metoach, zostanie wykorzystany algorytm wyrównujcy (ang. scoring algorithm), który jest równie prezentowany w pracy Rao (003) s. 100. atta, Rao i Smith (005) zwracaj uwag, e w ich rozwaaniach symulacyjnych algorytm ten charakteryzuje si lepszymi wasno- ciami ni algorytmy EM i Newtona-Raphsona. Algorytm ten róni si o meto-
46 Tomasz o y Newtona-Raphsona wycznie uwzglnieniem zamiast hesjanu logarytmu funkcji wiarygonoci wartoci oczekiwanej tej macierzy. Taka moyfikacja zmniejsza czas wykonywania jenej iteracji, ze wzglu na prostsz form wartoci oczekiwanej hesjanu w porównaniu z hesjanem, cho liczba iteracji moe wzrosn. Oprócz estymacji parametru A wspomnianymi woma metoami bzie równie rozwaana metoa Faya-Herriota (1979). Estymator A ˆFH parametru A otrzymuje si jako otrzymane w sposób iteracyjny rozwizanie równania: gzie 1 1 T Q( Aˆ FH ) 1 0 p Y Y (8) T Y Q( A) Y ( W A) ( ˆ x ˆ), ˆ jest ane wzorem (4), p jest 1 T liczb parametrów wektora. Ponato rozwaany bzie estymator parametru A uzyskany meto zaproponowan przez Prasaa-Rao (1990), który obliczany jest ze wzoru max(0, A ˆ ) gzie: PR ˆ 1 T T 1 T T T 1 A ( ) ( ˆ ( ) ˆ PR p x X X X ) W (1 x ( X X) x ) 1 1 (9) a 1 T ˆ col ( ˆ ) i X col1 ( x ). Pokrelmy, e w przypaku stosowania estymatorów A ˆFH i A ˆPR nie jest wymagana normalno rozkau skaników losowych. Naley przypomnie, e w moelu F-H przyjmuje si, e wariancje ˆ oznaczane przez W s znane nawet w przypakach empirycznych (tj. gy inne nieznane parametry zastpowane s wartociami estymatorów). W praktyce, zastpuje si je wartociami estymatorów lub wartociami estymatorów po wygazeniu (cho przy wyprowazeniach przyjmuje si, e s one znane), co mo- e jenak mie wpyw na obcienia preyktorów i estymatorów MSE oraz na warto MSE. Problem ten bzie stuiowany w baaniu symulacyjnym. Ze wzglu na zaoenie niezalenoci skaników losowych e w baaniu symulacyjnym omeny b warstwami i wówczas estymatory W ane b wzorami:
O preykcji wartoci globalnej w omenie z wykorzystaniem informacji 47 ˆ N n 1 W ( Y Y ) (10) n i s N n n 1 i1 Ponato, jak poaj np. Lahiri i Rao (1995), czsto wygaza si wartoci estymatorów wariancji z wykorzystaniem uogólnionych funkcji wariancji. Opis tej metoy mona znale w pracy Woltera (1985). Poniej przestawiamy jen z moliwych technik, która zostanie wykorzystana w tym artykule. Naley zauway, co pokrela równie Wolter (1985), e brak jest teoretycznych uzasanie postaci rónych funkcji wykorzystywanych o moelowania wariancji a ich obór ma charakter empiryczny. W opracowaniu oceny wariancji W bziemy wygaza wykorzystujc funkcj (Wolter (1985) s. 03): log log( ) W (11) gzie i s szacowane meto najmniejszych kwaratów w oparciu o równanie (11), gzie W i zastpujemy opowienio W ˆ i ˆ. Nastpnie w równaniu (11), i zastpujemy ich ocenami i z (11) obliczamy wygazone wartoci wariancji W, które bziemy oznacza przez W ˆGVF. V. EMPIRYCZNE NAJLEPSZE LINIOWE NIEOBCIONE PREYKTORY I ICH BY RENIOKWARATOWE Preyktory typu EBLU reniej oraz wartoci globalnej w omenie la moelu F-H, które oznacza bziemy przez ˆ EBLUP oraz ˆEBLUP, ane s opowienio wzorami () i N ˆ BLUP, gzie parametr A zastpowany jest jenym z omówionych w poprzenim rozziale estymatorów. Warto namieni, e preyktory typu EBLU pozostaj nieobcione, m.in. latego e omawiane estymatory parametru A s parzystymi, niezmienniczymi ze wzglu na przesunicie funkcjami ˆ. Wówczas zachozi ponisze twierzenie. Twierzenie 1. (Kackar i Harville (1981)). Rozwamy preyktor typu EBLU i zaómy, e spenione s zaoenia ogólnego mieszanego moelu liniowego. Jeli spenione s trzy nastpujce warunki: (i) warto oczekwiana preyktora typu EBLU jest skoczona,
48 Tomasz o (ii) Â jest owolnym estymatorem majcym wasno parzystoci i niezmienniczoci wzglem przesunicia tj. A ˆ ( ˆ ) A ˆ ( ˆ ) i A ˆ ( ˆ Xb ) A ˆ ( ˆ ) la p owolnego b R, (iii) rozkay e i v s symetryczne wzglem 0 (niekoniecznie normalne), wówczas preyktor typu EBLU jest -nieobciony. Zakaajc, e (atta, Rao, Smith (005) s.186) wartoci X s jenostajnie T k ograniczone, wartoci X Vss ( A) X (k=1,,3) s rzu O( ) oraz e W s ograniczone o góry i o zera, MSE preyktora typu EBLU wartoci reniej w omenie la moelu F-H mona wyrazi wzorem (Prasa, Rao (1990), atta, Lahiri (000)): MSE ˆ Aˆ g A g A g A o (1) EBLUP 1 ( ( )) 1 ( ) ( ) 3 ( ) ( ) gzie g ( ) 1 A ane jest wzorem (6), g ( ) A ane jest wzorem (7). Posta g ( ) 3 A we wzorze (1) zaley o uytego estymatora parametru A. la estymatora zaproponowanego przez Prasaa i Rao (1990) przyjmuje posta: 3 3 ( ) 3 ( ) ( ) PR ( u ) u1 g A g A W A W A W, (13) la estymatorów parametru A uzyskanych meto najwikszej wiarygonoci i meto najwikszej wiarygonoci z ograniczeniami (atta, Lahiri (000)): 3 g3 ( A) g3ml ( A) g3re ( A) W ( AW ) ( AWu ), (14) u1 a la estymatorów F-H parametru A (atta, Rao, Smith (005)): 1 3 1 g3 ( A) g3fh ( A) W ( AW ) ( AW ). (15) u1
O preykcji wartoci globalnej w omenie z wykorzystaniem informacji 49 B reniokwaratowy preyktora typu EBLU wartoci globalnej w omenie la moelu F-H ma posta: ˆEBLUP ˆ EBLUP MSE ( ( A)) N MSE ( ˆ ( Aˆ )), gzie EBLUP MSE ( ˆ ( ˆ A)) ma posta (1). VI. ESTYMATORY BÓW RENIOKWARATOWYCH ˆ ( ˆ ( ˆ)) ( ˆ ( ˆ E MSE A MSE A)) o( ). atta W niniejszym rozziale przestawione zostan estymatory MSE oznaczane przez ˆ EBLUP MSE ( ˆ ( Aˆ )), które s w przyblieniu nieobcione w nastpuj- EBLUP EBLUP 1 cym sensie: i Lahiri (000) poaj nastpujc posta estymatora MSE preyktora typu EBLU wartoci reniej w omenie: ˆ EBLUP ˆ ˆ ˆ ˆ ˆ ˆ ˆ 1 3 Aˆ MSE ( ( A)) g ( A) g ( A) g ( A) ( B ( A)) b ( A) (16) gzie b ˆ ( A ) to asymptotyczne obcienie estymatora  (z okanoci o A 1 skanika o( ) ), B ( A ) ane jest wzorem (3). la estymatorów A ˆPR oraz A ˆRE, które s asymptotycznie nieobcione 1 (tj. z okanoci o skanika o( ) ) wzór (16) upraszcza si o postaci ˆ EBLUP MSE ˆ ˆ ˆ ˆ ˆ ( ( APR )) g1 ( APR ) g ( APR ) g3pr ( APR ) (17) ˆ EBLUP MSE ˆ ˆ ˆ ˆ ˆ ( ( ARE )) g1 ( ARE ) g ( ARE ) g3re ( ARE ) (18) Poniewa asymptotyczne obcienie estymatora A ˆML wynosi (atta, Lahiri (000)): 1 1 1 T T bˆ ( A) ( A Wu ) tr ( A Wu ) u u ( A Wu ) A x x xux u ML u1 u1 u1 (19) w przypaku, gy wykorzystujemy estymator A ˆML, estymator MSE any wzorem (16) przyjmuje posta:
50 Tomasz o MSE ˆ ˆ Aˆ g Aˆ g Aˆ EBLUP ( ( ML)) 1 ( ML) ( ML) ˆ ˆ g3ml( AML ) ( B ( AML )) ( AML Wu ) (0) u1 1 1 T T tr( AML Wu ) xuxu ( AML Wu ) xux u. u1 u1 1 Asymptotyczne obcienie estymatora A ˆFH ane jest wzorem (atta, Rao, Smith (005)): 3 1 1 b ˆ ( A) ( A Wu ) ( A Wu ) ( A Wu ) A FH u1 u1 u1 (1) St, gy wykorzystujemy estymator A ˆFH, estymator MSE any wzorem (16) ma posta: MSE ˆ ( ˆ ( Aˆ )) g ( Aˆ ) g ( Aˆ ) g ( Aˆ ) ( B ( Aˆ )) EBLUP FH 1 FH FH 3ML FH FH A W A W A W 3 1 1 ( ) FH u ( FH u) ( FH u) u1 u1 u1 () Estymatory MSE preyktorów typu EBLU wartoci globalnej w omenie ane s nastpujcym wzorem: ˆ ˆEBLUP ˆ ˆ EBLUP MSE ( ( A)) N MSE ( ˆ ( Aˆ )). Warto pokreli, e (Lahiri, Rao (1995), atta, Rao, Smith (005)) estymatory MSE uzyskane w przypaku, gy estymacji parametru A meto Prasaa- Rao oraz F-H charakteryzuj si pewn opornoci na brak normalnoci rozkau skaników losowych. VII. ANALIZA MONTE CARLO Zostan przestawione wyniki analizy Monte Carlo przygotowanej z wykorzystaniem pakietu R (R evelopment Core Team, 007). Analizujemy
O preykcji wartoci globalnej w omenie z wykorzystaniem informacji 51 ane otyczce 864 gospoarstw rolnych z powiatu browa Tarnowska, które zostay uzyskane w spisie rolnym w 1996 roku. W rozwaanym powiecie znajuje si =79 miejscowoci, które b traktowane jako omeny. Liczebnoci omen wahaj si o 0 o 610 gospoarstw rolnych. Ze wzglu na zaoenie niezalenoci skaników losowych e zecyowano si na rozwaanie losowania warstwowego (w warstwach losowanie proste bez zwracania), gzie warstwami s omeny. Alokacja próby w warstwach jest w przyblieniu proporcjonalna z kaej warstwy losowanych jest ok. 10% elementów. Celem jest preykcja wartoci globalnej powierzchni zasiewów (w arach) w omenach. W moelu F-H za ˆ przyjmujemy oceny reniej powierzchnia zasiewów (w arach) w omenach (renie arytmetyczne la anych z próby w omenach). Zmienn oatkow bzie rzeczywista renia powierzchnia gospoarstwa rolnego (w arach) w omenie. Moel ze zmienn oatkow uwzglnia sta. Warto wspóczynnika korelacji liniowej Pearsona pomizy tymi charakterystykami w rozwaanym zbiorze anych wynosi 0,5498. Liczba iteracji w symulacji to M=5000. W kaym kroku symulacji generowane s wartoci ˆ zgonie z moelem F-H. Za wartoci W przyjmujemy: N N N n 1 1 W yi N yi N n N 1 i1 i1, (3) gzie wartoci y i s wartociami baanej zmiennej w rozwaanym zbiorze anych. Wartoci skaników losowych e generowane s niezalenie zgonie z rozkaem N(0, W ). Za warto parametru A w symulacji przyjmujemy warto obliczan z wykorzystaniem metoy najwikszej wiarygonoci z ograniczeniami (przy zaoeniu rozkau normalnego zmiennych losowych), przy czym zamiast ˆ wykorzystujemy rzeczywiste wartoci renie w omenach ostpne w rozwaanym zbiorze anych przyjmujc jenoczenie zera za wariancje W estymatorów ˆ. Wówczas skaniki losowe v generowane s niezalenie zgonie z rokaami normalnym, jenostajnym i przesunitym wykaniczym (tak aby warto oczekiwana wynosia 0) z wariancj A. Za przyjmujemy wartoci obliczone na postawie anych z populacji zgonie ze wzorem (4), gzie zamiast ˆ wykorzystujemy rzeczywiste wartoci renie w omenach ostpne w rozwaanym zbiorze anych przyjmujc jenoczenie zera za wariancje W estymatorów ˆ.
5 Tomasz o W poniszych tablicach zostan przestawione wartoci rónych statystyk uzyskane la wszystkich 79 omen. Aby ograniczy wielko tablic wynikowych zostan zaprezentowane wycznie wartoci minimalne (min), pierwszego kwartyla (Q 1 ), meiany (Me), reniej arytmetycznej (renia), trzeciego kwartyla (Q 3 ) oraz maksymalne la wyników uzyskanych la wszystkich omen. Skróty uywane w kolumnach otycz rozaju uytego estymatora parametru A: PR estymator Prasaa-Rao, FH Faya-Herriota, ML estymator uzyskany meto najwijszej wiarygonoci, RE - estymator uzyskany meto najwijszej wiarygonoci z ograniczeniami. W kolumnach wprowazono równie informcje o rozkazie skaników losowych v : N- rozka normalny, J rozka jenostajny i W przesunity rozka wykaniczy. Omawiajc wartoci prezentowane w tablicy 1 warto zwróci uwag, e rónice mizy wartociami funkcji g (.) 3 s znaczce i co wane g3pr( A) g3fh ( A) g3ml( A) g3re ( A). Porównujc jenak wartoci funkcji g (.) 3 z przyblionymi wartociami MSE okazuje si, e rónice mizy warto- ciami funkcji g (.) (a 3 g (.) 3 s niszego rzu o sumy pozostaych wóch komponentów przyblionego MSE) maj mniejsze znaczenie. Tablica 1. Wartoci funkcji g 3 (A) i przyblionego MSE PR FH ML, RE g 3 MSE g 3 MSE g 3 MSE min 8,955 484,368 3,00 478,433,560 477,973 Q 1 89,445 1795,93 30,163 1737,376 5,567 173,836 Me 158,651 818,701 53,50 708,1 45,349 699,655 renia 145,30 303,170 49,006 935,856 41,538 98,388 Q 3 11,743 45,03 71,405 4070,569 60,54 4058,593 max 33,638 6365,049 78,789 685,71 66,783 679,570 Analizujc wartoci prezentowane w tablicy naley pokreli, e wybór estymatora parametru A, estymacja parametrów W a nawet rozka skaników losowych v ma niewielki wpyw na wzglne obcienia preyktorów, które we wszystkich omawianych przypakach nie przekraczaj co o mouu 1,3%. Przestawione w tablicy 3 wzglne wartoci pierwiastków MSE o wartociach o pona 5% o pona 39% (m.in. w zalenoci o omeny) sugeruj konieczno poszukiwania moeli charakteryzujcych si lepsz jakoci opasowania. Jenoczenie, w rozwaanym baaniu najwikszy wpyw na zmiany wartoci wzglnej pierwiastka MSE miaa ocena parametrów W, a sposób estymacji parametru A jak i rozka skaników losowych v miay wpyw znacznie mniejszy.
O preykcji wartoci globalnej w omenie z wykorzystaniem informacji 53 Tablica. Wartoci wzglnych obcie (w %) preyktorów typu EBLU Est. A PR ML RE FH znane W N J W N J W N J W N J W min 0,54 0,66 0,47 0,54 0,63 0,68 0,53 0,63 0,68 0,5 0,64 0,60 Q 1 0,09 0,14 0,08 0,10 0,14 0,11 0,10 0,14 0,11 0,10 0,14 0,08 Me 0,0 0,0 0,05 0,01 0,00 0,01 0,01 0,00 0,0 0,0 0,00 0,04 re. 0,05 0,00 0,06 0,04 0,00 0,01 0,04 0,01 0,01 0,04 0,00 0,03 Q 3 0,1 0,16 0,19 0,17 0,15 0,13 0,16 0,15 0,13 0,17 0,15 0,15 max 0,63 1,03 0,8 0,66 1,01 0,75 0,66 1,01 0,78 0,63 1,00 0,84 szacowane W min 0,66 0,60 0,67 0,83 0,60 0,74 0,84 0,61 0,74 0,84 0,61 0,73 Q 1 0,06 0,11 0,09 0,08 0,1 0,13 0,09 0,1 0,1 0,08 0,1 0,1 Me 0,01 0,0 0,06 0,01 0,01 0,03 0,01 0,0 0,03 0,00 0,0 0,04 re. 0,08 0,03 0,06 0,06 0,03 0,04 0,06 0,03 0,04 0,06 0,03 0,05 Q 3 0,6 0,16 0,18 0,18 0,15 0,18 0,18 0,15 0,18 0,18 0,15 0,18 max 0,91 1,04 0,75 0,97 1,00 0,91 0,98 1,00 0,91 0,98 1,00 0,90 wygazone, szacowane W min 1,3 0,73 0,70 1,1 0,69 0,7 1, 0,70 0,7 1,3 0,7 0,70 Q 1 0,11 0,10 0,10 0,10 0,11 0,10 0,10 0,10 0,10 0,11 0,10 0,10 Me 0,0 0,0 0,07 0,0 0,0 0,04 0,0 0,0 0,04 0,0 0,0 0,06 re. 0,05 0,03 0,07 0,05 0,03 0,06 0,05 0,03 0,06 0,05 0,03 0,07 Q 3 0,1 0,17 0,0 0,0 0,16 0,19 0,19 0,16 0,19 0,0 0,17 0,19 max 1,13 1,00 0,83 1,08 1,00 0,76 1,10 1,00 0,77 1,11 1,00 0,81 Tablica 3. Wartoci wzglnych RMSE (w %) preyktorów typu EBLU Est. A PR ML RE FH znane W N J W N J W N J W N J W min 6,34 6,8 6,44 6,06 5,98 5,9 6,06 5,98 5,9 6,06 5,98 5,94 Q 1 1,51 1,53 1,51 1,11 1,09 1,09 1,09 1,08 1,08 1,11 1,10 1,08 Me 15,1 15,36 15,1 14,85 14,97 14,84 14,85 14,97 14,83 14,85 14,98 14,83 re. 15,57 15,60 15,54 15,16 15,17 15,10 15,15 15,16 15,09 15,17 15,19 15,08 Q 3 18,37 18,17 17,84 17,88 17,7 17,51 17,87 17,71 17,50 17,90 17,74 17,48 max 8,83 9,78 9,45 8,44 9,15 9,13 8,40 9,13 9,10 8,40 9,17 8,98 szacowane W min 6,46 6,40 6,65 6,08 6,0 6,00 6,09 6,03 6,00 6,08 6,0 6,00 Q 1 13,0 13,5 1,99 1,66 1,63 1,67 1,64 1,6 1,59 1,65 1,63 1,60 Me 15,6 15,95 15,75 15,79 15,74 15,88 15,89 15,78 15,98 15,8 15,77 15,91 re. 16,88 16,86 16,84 16,95 16,93 16,87 17,01 16,98 16,93 16,97 16,95 16,88 Q 3 19,41 19,4 19,6 0,35 0,0 0,18 0,48 0,30 0,3 0,38 0,3 0,16 max 35,68 34,65 34,74 37,43 36,05 36,67 37,5 36,14 36,76 37,39 36,0 36,64 wygazone, szacowane W min 7,69 7,56 7,47 7,94 7,77 7,71 7,81 7,65 7,58 7,73 7,58 7,48 Q 1 1,73 1,77 1,64 1,8 1,79 1,75 1,74 1,75 1,65 1,70 1,74 1,6 Me 15,68 15,81 15,5 15,59 15,80 15,61 15,59 15,77 15,60 15,61 15,76 15,56 re. 16,9 16,93 16,84 16,74 16,74 16,66 16,78 16,78 16,70 16,83 16,84 16,74 Q 3 0,58 0,48 0,43 0,39 0,9 0,5 0,46 0,31 0,36 0,49 0,37 0,35 max 38,88 39,14 37,84 38,09 38,9 36,98 38,54 38,73 37,43 38,73 38,96 37,67
54 Tomasz o Posumowujc wyniki prezentowne w tablicy 4 warto zwróci uwag, e w przypaku gy parametry W s szacowane obcienia estymatorów MSE mog by barzo wysokie. alej omawia bziemy wyniki wycznie w sytuacji, gy W s znane. Warto zauway, e w przypaku moelu Faya-Herriota (ze zmiennymi oatkowymi) wykorzystanie estymatora Prasaa-Rao moe w niektórych omenach prowazi o wysokich obcie (wysoka warto maksimum). Pomijajc wyniki uzyskiwane w przypaku estymacji parametru A meto Prasaa-Rao, w przypaku znanych W w anym z rozpatrywanych przypaków obcienie estymatora MSE nie przekroczyo co o mouu 10%. Ponato, w przypaku gy parametr A jest szacowany meto Faya-Herriota estymatory MSE zazwyczaj charakteryzuj si niszymi obcieniami ni w przypaku estymacji parametru A innymi metoami. Warto równie pokreli, e obcienia MSE uzyskane w przypaku jenostajnego rozkau skaników losowych v s zblione o przypaku, gy v maj rozka normalny. Natomiast, gy v maj przesunity rozka wykaniczy, obcienia MSE s wiksze. Tablica 4. Wartoci wzglnych obcie estymatorów MSE (w %) preyktorów typu EBLU Est. A PR ML RE FH N J W N J W N J W N J W min 3,9,6 4,7 3,3 3, 9,5 3, 3, 9,0,9 3,3 7,3 Q 1 1,4 0,5 1,4 1,5 0,8 3,6 1, 0,6 3, 1, 1,1, Me 3,8 3, 5, 0,3 0, 1,1 0,1 0,3 0,8 0,0 0,3 0, re. 5,1 4,3 9,1 0,0 0,3 1,6 0, 0,4 1,3 0, 0, 0,5 Q 3 6,1 5,7 9,6 1, 1, 0,7 1,5 1,3 0,8 1,6 1, 1,4 max 47,9 31,9 109,3 5,6 4,9 5,1 5,8 5,0 5,0 5,5 4,7 5,1 min 89,9 90, 8,7 96, 96,0 96,1 96, 96,0 96,1 96, 96,0 96,1 Q 1 6,9 7,9 14,1 51,8 5,7 50,7 5, 53,1 51,5 5,1 53,1 51,4 Me 1,3 1,1 7,3 0,8,9 0,5 1,5 3, 0,9 1,5 3, 0,7 re. 5,7 1,6 3,4 14,6 14,4 14,9 14,8 14,5 15,0 15,8 15,6 15,7 Q 3 3,8 5,4 46,1 3,7 5,1,7 3,4 4,7 3,0 1,9 3,1,1 max 311,3 4,0 785,8 106,8 108,0 105,3 109,5 110,7 108,4 104,7 105,3 105,6 min 89,5 89,3 89,7 89,5 89,3 89,7 89,7 89,5 89,9 89,6 89,4 89,9 Q 1 3, 4,0 3,,1,8 3,0 3,3 4,0 4, 3, 4, 3,8 Me 3,0 1,7 1, 1,5 19,5 0,6 1,1 19, 0,3 1,8 0,0 0,9 re. 3,3 3,5 3,8 19,5 0,0 19,0 0,0 0,5 19,6 1,5 1,9 1,8 Q 3 58,6 59,1 61,1 50,4 53,6 51,9 5,0 54,9 53,4 55,0 57,4 58,0 max 183,4 181,4 187,0 170,9 170,9 177,9 176,3 176,0 18,8 180,3 179,5 186, Przejmy o wyników otyczcych stosunku MSE preyktorów typu EBLU o MSE preyktorów typu BLU la przypaku moelu Faya-Herriota, które nie s prezentowane w tablicach wynikowych. W rozwaanym baaniu symulacyjnym spaek okanoci preyktora ze wzglu na estymacj parame-
O preykcji wartoci globalnej w omenie z wykorzystaniem informacji 55 tru A jest niewielki, ale w przypaku gy oatkowo szacowane s parametry W spaek ten jest znacznie wikszy. W przypaku, gy v maj rozka normalny i pomijajc sytuacje, gy parametr A jest szacowany meto Prasaa-Rao (co zazwyczaj prowazi o gorszej efektywnoci preyktorów), renie wartoci rozwaanych wspóczynników efektywnoci w przypaku moelu Faya-Herriota nie przekraczaj: gy W s znane 1,0 a gy W s szacowane (lub szacowane i wygazane) 1,7. Poobne wyniki otyczce efektywnoci uzyskano la moelu Faya-Herriota w przypaku, gy skaniki losowe v maj rozka jenostajny. W tym przypaku renia efektywno, gy parametry W s znane, jest poniej 1,0 (za wyjtkiem gy parametr A jest szacowany meto Prasaa-Rao wówczas wynosi prawie 1,08). Gy parametry W s szacowane, renia efektywno jest poniej 1,7, a gy szacowane W s oatkowo wygazane poniej 1,9. la moelu Faya-Herriota w przypaku, gy skaniki losowe v maj przesunity rozka wykaniczy a parametry W s znane, renia efektywno jest poniej 1,01 (za wyjtkiem, gy parametr A jest szacowany meto Prasaa-Rao wówczas nie przekracza 1,08). Gy parametry W s szacowane renia efektywno jest poniej 1,7, a gy szacowane W s oatkowo wygazane poniej 1,8. Posumowujc wyniki symulacji, naley pokreli, e szacowanie parametrów W ma znaczcy wpyw zwaszcza na efektywno estymatora i na obci- enia prezentowanych estymatorów MSE (wyprowazonych przy zaoeniu, e te parametry s znane). Niezbne wic jest zaproponowanie alternatywnych estymatorów MSE (np. jackknife, bootstrap) lub wyprowazenie postaci (przyblionych) MSE w sytuacji, gy parametry W s szacowane i zaproponowanie estymatorów MSE. BIBLIOGRAFIA atta, G. S., Lahiri, P. (000), A unifie measure of uncertainty of estimate best linear unbiase preictors in small area estimation problems, Statistica Sinica, 10, 613 67. atta G.S., Rao J.N.K, Smith.. (005), On measuring the variability of small area estimators uner basic area level moel, Biometrika, 9, 1, 183 196. Fay R.E., Herriot R.A. (1979), Estimates of income for small places: An application of James-Stein proceures to census ata, Journal of the American Statistical Association, 74, 69 77. Henerson, C.R. (1950), Estimation of genetic parameters (Abstract), Annals of MathematicalStatistics, 1, 309 310. Kackar, R.N., Harville,.A. (1981), Unbiaseness of two-stage estimation an preiction proceures for mixe linear moels, Communications in Statistics, Series A, 10, 149 161. Lahiri, Rao (1995), Robust estimation of mean square error of small area estimators, Journal of the American Statistical Association, 90, 430, 758 766 Prasa, N.G.N, Rao, J.N.K. (1990), The estimation of mean the mean square error of small area estimators, Journal of the American Statistical Association, 85, 163 171. Rao, J.N.K. (003), Small area estimation. John Wiley & Sons, New York. Wolter K.M. (1985), Introuction to variance estimation, Springer-Verlag, New York
56 Tomasz o Tomasz o ON SOME PROBLEM OF PREICTION OF OMAIN TOTAL UNER FAY-HERRIOT MOEL Abstract In the paper BLUPs an EBLUPs, their MSEs an estimators of MSEs uner Fay-Herrior moel (Fay, Herrior (1979)) are presente. This moel belongs to the class of general linear mixe moel type A, what means that is assume for irect estimates of omain characteristics. What is more, it is assume that variances of irect estimates are known. In the paper the influence of replacing the variances by their unbiase estimates an by genereal variance function s estimates on biases of preictors, MSEs an biases of estimators of MSEs is stuie in the simulation base on the real ata. The problem of nonormality of area specific ranom components is also inclue.