Estymatory nieobciążone Zadanie 1. Pobieramy próbkę X 1,..., X n niezależnych obserwacji z rozkładu Poissona o nieznanym parametrze λ. Szacujemy p 0 = e λ za pomocą estymatora ˆp 0 = e X, gdzie X jest średnią z próbki. Wyznaczyć znak obciążenia E ˆp 0 p 0 tego estymatora. dodatni Zadanie 2. Sygnały pojawiają się zgodnie z procesem Poissona, a oczekiwana ilość sygnałów na jednostkę czasu wynosi λ. Obserwujemy proces od momentu T 0 do momentu T n pojawienia się n-tego sygnału, przy czym n jest z góry ustaloną liczbą całkowitą równą co najmniej 2. Wyznaczyć nieobciążony estymator parametru λ. n 1 T n T 0 Zadanie 3. Pobrano sto niezależnych obserwacji z rozkładu normalnego o nieznanej wartości oczekiwanej µ i wariancji σ 2. Obliczono dziesięć sum po dziesięć obserwacji, a następnie zgubiono dane źródłowe. Zamiast pierwotnych obserwacji X 1,..., X 100 mamy więc obserwacje Y 1,..., Y 10, gdzie Y i = 9 j=0 X 10i j. Szacujemy wariancję σ 2 używając estymatora postaci const 10 (Y i Ȳ )2. Wyznaczyć stałą const tak, by estymator był nieobciążony. 1/90 Zadanie 4. Niech (X 1, Y 1 ),..., (X n, Y n ) będzie próbą z [ dwuwymiarowego ] rozkładu normalnego o wektorze 1 ϱ wartości oczekiwanych (µ X, µ Y ) i macierzy kowariancji. Dla jakich ϱ nieobciążonym estymatorem ϱ 1 parametru minµ X, µ Y } jest statystyka min 1 n n X i, 1 n n Y i}? ϱ = 1 Zadanie 5. Każda ze zmiennych losowych X 1,..., X n ma taką samą wartość oczekiwaną µ. Wiadomo, że σ 2, dla i = j, Cov(X i, X j ) = σ 2 2, dla i j. Niech S 2 (c) = c n (X i X) 2, gdzie X = 1 n n X i. Dla jakiej wartości c, S 2 (c) jest nieobciążonym estymatorem parametru σ 2? 2 n 1 Zadanie 6. Niech X 1,..., X n, gdzie n > 1, będzie próbą losową z rozkładu wykładniczego o gęstości 1 x f µ (x) = µ e µ, dla x > 0, Niech ˆµ 1 = 1 n n X i, ˆµ 2 = n minx 1,..., X n } będą dwoma estymatorami parametru µ. Udowodnić, że oba estymatory są nieobciążone oraz, że estymator ˆµ 1 ma zawsze mniejszą wariancję niż ˆµ 2. Zadanie 7. Wykonano dziesięć pomiarów pewnej nieznanej wielkości µ jednym przyrządem pomiarowym, a następnie pięć pomiarów innym przyrządem. Zakładamy, że wyniki pomiarów X 1,..., X 10, X 11,..., X 15 są niezależnymi zmiennymi losowymi, przy czym każda ze zmiennych X 1,..., X 10 ma rozkład normalny o parametrach (µ, (0.1) 2 ), podczas gdy każda ze zmiennych X 11,..., X 15 ma rozkład normalny o parametrach (µ, (0.2) 2 ). Dobrać współczynniki c 1,..., c 15 tak, żeby estymator ˆµ = 15 c ix i był nieobciążonym estymatorem o minimalnej wariancji parametru µ. c 1 = = c 10 = 8 90, c 11 = = c 15 = 1 45 zadania aktuarialne (estymacja), modyfikacja WZ, strona 1
Zadanie 8. Niech x 1,..., x 25 będzie realizacją próby losowej z rozkładu N(µ, σ 2 ), zaś x 26,..., x 50 - realizacją próby losowej z rozkładu N(ν, τ 2 ), gdzie µ, ν, σ 2, τ 2 są nieznanymi parametrami. Wiadomo, że s 2 25 = 1 24 x 25 = 1 25 25 25 x i = 10.4, x 50 = 1 50 (x i x 25 ) 2 = 3.333, s 2 50 = 1 49 50 50 x i = 10.0, Obliczyć na tej podstawie wartość nieobciążonego estymatora wariancji τ 2. 0.417 (x i x 50 ) 2 = 2.000. Zadanie 9. Niech X 1,..., X n będzie próbą z rozkładu normalnego o nieznanych parametrach (µ, σ 2 ) i niech n > 1 oraz σ 2 > 0. Niech X = 1 n n X i, S 2 = 1 n 1 n (X i X) 2, t(µ 0 ) = X µ 0, S 2 gdzie µ 0 jest ustaloną liczbą. Niech t α będzie dwustronną wartością krytyczną rozkładu Studenta z n 1 stopniami swobody. Rozważmy następujący estymator ˆµ parametru µ: µ0, jeżeli t(µ ˆµ = 0 ) < t α, X, w przeciwnym przypadku. Dla jakich µ obciążenie E µ ˆµ µ estymatora jest dodatnie? µ < µ 0 Zadanie 10. Niech X 1,..., X n będzie próbą z rozkładu o gęstości f c,µ (x) = x c 1 µ e µ, dla x > c, gdzie c R i µ > 0 są nieznanymi parametrami. Wyznaczyć nieobciążony estymator parametru µ. 1 n n 1 X i n n 1 minx 1,..., X n } Zadanie 11. Niech N 1,..., N n będzie próbą z rozkładu Poissona o wartości oczekiwanej λ i niech N = 1 n n N i będzie średnią z tej próby. Dla jakiej wartości C estymator C N parametru e λ będzie nieobciążony? ( n n 1 ) n Zadanie 12. Proces pojawiania się szkód jest procesem Poissonowskim z parametrem intensywności λ, tzn. (λt )n prawdopodobieństwo pojawienia się n szkód na odcinku czasu (0, T ] jest równe n! e λt. Obserwujemy proces od momentu 0. Niech T 1, T 2, T 3,... oznaczają momenty pojawiania się kolejnych szkód. Ustalamy z góry liczbę n taką, że obserwację procesu przerwiemy w momencie T n pojawienia się n-tej szkody. Dla jakiej wartości C estymator C T n, parametru λ jest estymatorem nieobciążonym? n 1 dla n > 1 Zadanie 13. Niech X będzie pojedynczą obserwacją z rozkładu jednostajnego na przedziale (θ 0.5, θ + 0.5) z nieznanym parametrem θ. Wiemy, że θ jest liczbą rzeczywistą. Za pomocą estymatora X estymujemy wartość bezwzględną parametru θ. Wyznaczyć maksymalne obciążenie E θ X θ tego estymatora. 0.25 zadania aktuarialne (estymacja), modyfikacja WZ, strona 2
Zadanie 14. X 1,..., X n jest prostą próbą losową z rozkładu geometrycznego: P (X i = k) = p(1 p) k, k = 0, 1,..., gdzie p (0, 1) i liczebność próby przekracza 1. W klasie estymatorów parametru p danych wzorem: a a + n X i dobrać parametr a tak, aby otrzymać estymator nieobciążony. n 1 Zadanie 15. Niech X 1,..., X n będzie próbą niezależnych obserwacji z rozkładu jednostajnego na przedziale (ϕ 0, ϕ 1 ) z nieznanymi oboma parametrami i niech n > 1. Interesuje nas szerokość przedziału ϕ 1 ϕ 0. Dobrać parametr a tak, aby estymator a(maxx 1,..., X n } minx 1,..., X n }) szerokości przedziału był nieobciążony. n+1 n 1 Zadanie 16. Dla t = 1,..., T obserwujemy niezależne realizacje zmiennej losowej X t, o których zakładamy iż pochodzą z rozkładu o parametrach EX t = n t µ i V arx t = n t σ 2, gdzie wartości n 1,..., n T są nam znane (i dodatnie), natomiast parametry µ oraz σ 2 są nieznane. Wybieramy estymator parametru σ 2 z klasy estymatorów postaci c T t=1 (X t n t X) 2, gdzie X = 1 T n t=1 X t oraz n = T t=1 n t, zaś c jest pewną liczbą rzeczywistą (parametrem konkretnego estymatora). Dla jakiej wartości c otrzymamy estymator nieobciążony. n nt n Zadanie 17. Mamy dwie niezależne obserwacje X 1 oraz X 2 z rozkładu normalnego, przy czym jedna z nich pochodzi z rozkładu o parametrach (µ, σ 2 ), a druga z rozkładu o parametrach (2µ, 2σ 2 ). Niestety zgubiliśmy informację, która z obserwacji z którego z rozkładów pochodzi. Parametry (µ, σ 2 ) są nieznane. W tej sytuacji wybieramy estymator parametru σ 2 z klasy estymatorów postaci ˆσ 2 = a(x 1 X 2 ) 2 + b(x 1 + X 2 ) 2, gdzie (a, b) to para liczb rzeczywistych (parametry konkretnego estymatora). Dla jakich (a, b) otrzymamy estymator nieobciążony. a = 3/8, b = 1/24 Zadanie 18. Niech X 1,..., X n,..., X n+m będzie próbą prostą z rozkładu normalnego N(µ, σ 2 ), gdzie m, n > 1. Bezpośrednio dostępne są tylko obserwacje X 1,..., X n, ale znamy średnią X n+m = 1 n+m n+m X i. Dla jakiej liczby c estymator c n (X i X n+m ) 2 wariancji σ 2 jest nieobciążony? 1 n+m n n+m 1 Zadanie 19. Przeprowadzamy wśród wylosowanych osób ankietę na delikatny temat. Ankietowana osoba rzuca kostką do gry i w zależności od wyniku rzutu kostką (wyniku tego nie zna ankieter) podaje odpowiednio zakodowaną odpowiedź na pytanie: Czy zdarzyło się Panu/Pani w roku 1999 dać łapówkę w klasycznej formie pieniężnej, przekraczającą kwotę 100 zł? Przyjmijmy, iż interesująca nas cecha X przyjmuje wartość 1, jeśli odpowiedź brzmi TAK i 0, jeśli odpowiedź brzmi NIE. Pierwszych 100 osób udziela odpowiedzi Z 1,..., Z 100 zgodnie z regułą: jeśli wynik rzutu kostką, to liczba oczek równa 1, 2, 3 lub 4, to Z i = X i, natomiast jeśli wynik rzutu kostką, to liczba oczek równa 5 lub 6, to Z i = 1 X i. Następnych 100 osób udziela odpowiedzi Z 101,..., Z 200 zgodnie z regułą: jeśli wynik rzutu kostką, to liczba oczek równa 1 lub 2, to Z i = X i, natomiast jeśli wynik rzutu kostką to liczba oczek równa 3, 4, 5 lub 6, to Z i = 1 X i. Dla uproszczenia zakładamy, że dwieście ankietowanych osób to próba prosta z (hipotetycznej) populacji o nieskończonej liczebności, a podział na podpróby jest także całkowicie losowy. Interesujący nas parametr tej populacji to oczywiście q X z podpróbek: Z 1 = 1 100 = P (X = 1). W wyniku przeprowadzonej ankiety dysponujemy średnimi 200 01 Z i. Estymator parametru q X uzyskany metodą największej 100 Z i i Z 2 = 1 100 wiarogodności ma postać ˆq X = a 0 + a 1 Ẑ 1 + a 2 Ẑ 2. Dla jakich a 0, a 1, a 2 estymator ten jest nieobciążony? a 0 = 0.5, a 1 = 1.5, a 2 = 1.5 zadania aktuarialne (estymacja), modyfikacja WZ, strona 3
Zadanie 20. Rozważmy dwie niezależne próbki X 1,1,..., X 1,n1 N(µ, σ 2 ), X 2,1,..., X 2,n2 N(µ, 2σ 2 ). Niech X 1 = 1 n1 n 1 X 1,i, X2 = 1 n2 n 2 X 2,i oraz X = n 1 X 1 +n 2 X2 n 1 +n 2. Dla jakiego c estymator parametru σ 2 postaci c n 1 (X 1,i X) 2 + n 2 1 n 1 +n 2 1 (X 2,i X) 2} jest nieobciążony? Zadanie 21. Niech X 1,..., X n będzie próbką prostą z rozkładu wykładniczego o gęstości f λ (x) = λe λx dla x > 0, gdzie λ > 0 jest nieznanym parametrem oraz n > 1. Niech a > 0 będzie daną liczbą. Interesuje nas estymacja parametru p = e λa = P λ (X 1 > a). Niech N a oznacza liczbę obserwacji większych od a, zaś S = n X i. Rozważmy trzy estymatory parametru p: ( ˆp 1 = exp a n ), ˆp 2 = n a S N, ˆp 3 = Które z poniższych zdań jest zdaniem prawdziwym? (A) estymatory ˆp 1, ˆp 2 i ˆp 3 są nieobciążone; (B) estymator ˆp 2 jest nieobciążony, zaś ˆp 1 i ˆp 3 są obciążone; (C) estymatory ˆp 1 i ˆp 2 są nieobciążone, zaś ˆp 3 jest obciążony; (D) estymatory ˆp 2 i ˆp 3 są nieobciążone i V ar(ˆp 2 ) < V ar(ˆp 3 ); (E) estymatory ˆp 2 i ˆp 3 są nieobciążone i V ar(ˆp 2 ) > V ar(ˆp 3 ). E 0, gdy S a, ) n 1., gdy S > a Zadanie 22. Niech X 1,..., X 10, X 11,..., X 20 będą niezależnymi zmiennymi losowymi. Zmienne losowe X 1,..., X 10 mają rozkład normalny N(µ 1, σ 2 ), zaś X 11,..., X 20 mają rozkład normalny N(µ 2, σ 2 ). Niech X 1 = 1 10 10 Dobrać liczby α i β tak, żeby statystyka ˆσ 2 = α X i, X2 = 1 10 20 była nieobciążonym estymatorem parametru σ 2. α = 1/18, β = 5/18 20 1 ( S a S X i, X = 1 20 (X i X) 2 + β( X 1 X 2 ) 2 Zadanie 23. Niech Y 1, Y 2, Y 3, Y 4 będą niezależnymi zmiennymi losowymi, przy czym Y k ma rozkład normalny N(kµ, σ 2 ), dla k = 1, 2, 3, 4. Rozważamy estymatory nieznanego parametru µ postaci ˆµ = a 1 Y 1 + a 2 Y 2 + a 3 Y 3 + a 4 Y 4. Znaleźć najmniejszą wariancję estymatora powyższej postaci, przy założeniu, że jest to estymator nieobciążony. σ 2 /30 Zadanie 24. Załóżmy, że X 1, X 2, X 3 są niezależnymi zmiennymi losowymi o jednakowym rozkładzie normalnym N(µ, σ 2 ). Niech S 2 = 1 2 3 (X i X) 2 będzie nieobciążonym estymatorem wariancji. Obliczyć P (S 2 σ 2 ). 0.63212 20 X i. zadania aktuarialne (estymacja), modyfikacja WZ, strona 4
Zadanie 25. Niech X 1,..., X n, X n+1,..., X m będzie próbką z rozkładu normalnego N(µ, σ 2 ) z nieznanymi parametrami µ i σ 2. Obserwujemy zmienne X 1,..., X n i ponadto znamy średnią ze wszystkich zmiennych X m = 1 m m X i. Znaleźć stałą c n,m taką, żeby statystyka 1 c n,m n (X i X m ) 2 była nieobciążonym estymatorem wariancji σ 2. n ( ) 1 1 m Zadanie 26. Niech X 1,..., X n będzie próbką z rozkładu prawdopodobieństwa o gęstości f λ (x) = λe λx, dla x > 0, Parametr λ > 0 jest nieznany. Niech X = 1 n n X i. Znaleźć taką liczbę c, żeby c( X) 2 był nieobciążonym estymatorem wariancji pojedynczej zmiennej X i. n n+1 Zadanie 27. Niech N 1,..., N 10 będzie próbką z rozkładu Poissona z nieznanym parametrem λ. Interesuje nas drugi moment obserwacji, czyli wielkość m 2 (λ) = E λ (N1 2 ). Chcemy skonstruować taki estymator wielkości m 2 (λ), który jest nieobciążony i który jest funkcją zmiennej S = N 1 + + N 10 (zależy tylko od sumy obserwacji). 1 100 S(S + 9) Zadanie 28. Rozpatrzmy następujący model regresji liniowej bez wyrazu wolnego: Y i = βx i + ε i, i = 1,..., n, gdzie x i są znanymi liczbami, β jest nieznanym parametrem, zaś ε i są błędami losowymi. Zakładamy, że Eε i = 0, V arε i = x 2 i σ 2, i = 1,..., n. Skonstruować estymator ˆβ parametru β o następujących własnościach: ˆβ jest liniową funkcją obserwacji, tzn. ˆβ = n c iy i, ˆβ jest nieobciążony, tzn. E ˆβ = β, ˆβ ma najmniejszą wariancję spośród estymatorów liniowych i nieobciążonych. 1 n n Y i Zadanie 29. Niech X 1,..., X n będą niezależnymi zmiennymi losowymi z rozkładu Weibulla o gęstości ( ) 2 θ exp x2 θ, gdy x > 0, gdzie θ > 0 jest nieznanym parametrem. Rozważamy nieobciążony estymator parametru θ postaci T n = ay, gdzie Y = minx 2 1,..., X 2 n} i a jest odpowiednio dobraną stałą (być może zależną od liczebności próby n). Pokazać, że ( ( ε ) ( ( θ > 0)( 0 < ε < 1) P θ T n θ > ε} = 1 exp( 1) exp exp ε )). θ θ zadania aktuarialne (estymacja), modyfikacja WZ, strona 5
Zadanie 30. Niech X 1,..., X 9 będą niezależnymi zmiennymi losowymi o rozkładzie normalnym N(µ, σ 2 ), gdzie µ R, σ 2 > 0 są nieznanymi parametrami. Niech X = 1 9 9 X i, S 2 = 1 9 8 (X i X) 2. Wyznaczyć estymator nieobciążony o minimalnej wariancji parametru µ/σ. 3 Γ(3.5) X S Zadanie 31. Zakładamy, że X 1,..., X 10, X 11,..., X 20 są niezależnymi zmiennymi losowymi o rozkładach normalnych, przy czym EX i = µ 1 i V arx i = σ 2 dla i = 1,..., 10 oraz EX i = µ 2 i V arx i = 2σ 2 dla i = 11,..., 20. Parametry µ 1, µ 2, σ są nieznane. Niech X 1 = 1 10 10, X2 = 1 20 10 1, X = 1 20 20. Dobrać stałe a i b tak, aby statystyka ˆσ 2 = a 20 była nieobciążonym estymatorem parametru σ 2. a = 1/27, b = 5/27 (X i X) 2 + b( X 1 X 2 ) 2 Zadanie 32. Niech X 1, X 2,..., X n,... będą niezależnymi zmiennymi losowymi o tym samym rozkładzie jednostajnym na przedziale (0, θ), gdzie θ > 0 jest nieznanym parametrem. Rozważamy estymator nieobciążony parametru θ postaci T n (X 1, X 2,..., X n ) = T n = ax 1:n, gdzie X 1:n = minx 1, X 2,..., X n } i a jest pewną stałą. Udowodnić, że ( ε > 0)( θ > 0) ( lim P θ( T n θ > ε) = 1 + exp 1 ε ) ( exp 1 + ε ). n θ θ zadania aktuarialne (estymacja), modyfikacja WZ, strona 6
Ryzyko estymatorów Zadanie 33. Niech X 1,..., X n będą niezależnymi zmiennymi losowymi o rozkładach normalnych o nieznanej średniej i wariancji. Rozpatrzmy klasę estymatorów wariancji określonych wzorem S(c) = c n (X i X) 2, X jest średnią z próbki, a c jest pewną liczbą rzeczywistą. Wyznaczyć wartość c, przy której błąd średniokwadratowy estymatora S(c) osiąga minimum. 1 + 1 n+ 1 2 Zadanie 34. Niech X 1,..., X n będzie próbką z niezależnych obserwacji z rozkładu jednostajnego na przedziale (0, ϕ) z nieznanym prawym końcem przedziału ϕ. Estymator n+1 n maxx 1,..., X n } jest nieobciążony. Wyznaczyć wariancję tego estymatora. ϕ 2 n(n+2) Zadanie 35. Zakładamy, że X 1,..., X n jest próbą z rozkładu normalnego N(µ, γ 2 σ 2 ), gdzie µ R jest nieznanym parametrem, zaś γ 2 znanym współczynnikiem. Wyznaczyć estymator postaci ˆµ = c 1 X 1 + + c n X n parametru µ, który ma jednostajnie najmniejszy błąd średniokwadratowy E µ (ˆµ µ) 2. c 1 = = c n = 1 1+γ 2 Zadanie 36. Niech (X, Y ) będzie dwuwymiarową zmienną losową, o wartości oczekiwanej (µ X, µ Y ), wariancji każdej ze współrzędnych równej σ 2 oraz kowariancji równej ϱσ 2. Staramy się obserwować niezależne realizacje tej zmiennej, ale nie w pełni to wychodzi - czasem udaje się zaobserwować jedynie pierwszą lub jedynie drugą ze współrzędnych. Przyjmijmy ważne założenie, iż do zgubienia obserwacji (całkowitego, jej pierwszej współrzędnej lub jej drugiej współrzędnej) dochodzi całkowicie niezależnie od wartości tych obserwacji. Załóżmy, iż otrzymaliśmy próbkę, zawierającą 20 obserwacji wyłącznie pierwszej współrzędnej, 60 obserwacji całej pary oraz 20 obserwacji wyłącznie drugiej współrzędnej. Niech teraz X oznacza średnią z próbki (osiemdziesięciu) obserwacji na zmiennej X, Ȳ oznacza średnią z próbki (osiemdziesięciu) obserwacji na zmiennej Y oraz niech X Y oznacza średnią z próbki (sześćdziesięciu) obserwacji na różnicy zmiennych X Y. Niech X Ȳ oraz X Y oznaczają dwa alternatywne estymatory różnicy µ X µ Y. Dla jakiej wartości współczynnika ϱ estymatory te mają jednakową wariancję? 4/7 Zadanie 37. Niech X 1,..., X n będzie próbką z rozkładu normalnego N(µ, σ 2 ). Niech S 2 = 1 n n 1 (X i X) 2, gdzie X = 1 n n X i. Interesuje nas względny błąd estymacji: R = S2 σ 2 σ. Wyznaczyć rozmiar n 2 próbki, dla którego E(R 2 ) = 0.01. 201 Zadanie 38. Załóżmy, że X 1,..., X n jest próbką z rozkładu prawdopodobieństwa o dystrybuancie 1 e F θ (x) = P θ (X i x) = x, dla x > 0, gdzie θ > 0 jest nieznanym parametrem. Rozważmy następujący estymator: ˆθ = minx 1,..., X n }. Wyznaczyć funkcję ryzyka tego estymatora: R(θ) = E θ (ˆθ θ) 2. 2 n 2 e nθ Zadanie 39. Załóżmy, że X 1,..., X n jest próbką z rozkładu normalnego N(µ, σ 2 ) z nieznanymi parametrami. Rozważmy nieobciążony estymator wielkości µ 2 dany wzorem µ 2 = ( X) 2 S2 n, gdzie X = 1 n n X i i S 2 = 1 n 1 n (X i X) 2. Obliczyć V ar(µ 2 ). 4 n µ2 σ 2 + 2 n(n 1) σ2 zadania aktuarialne (estymacja), modyfikacja WZ, strona 7
Zadanie 40. Załóżmy, że K oznacza liczbę sukcesów w n próbach Bernoulliego z nieznanym prawdopodobieństwem sukcesu θ. Rozważmy estymator parametru θ postaci ˆθ = a + K b + n. Niech n = 16. Przypuśćmy, że dodatnie liczby a i b dobrane zostały tak, że funkcja ryzyka estymatora, R(θ) = E θ (ˆθ θ) 2 jest funkcją stałą, czyli R(θ) = R dla każdej wartości parametru θ. Podać liczbę R. 0.01 Zadanie 41. Niech X 1,..., X n będzie próbką z rozkładu o gęstości danej wzorem: 1 θ x1/θ 1, dla 0 < x < 1, Znaleźć estymator największej wiarogodności ˆθ parametru θ i obliczyć błąd średniokwadratowy tego estymatora R(θ) = E θ (ˆθ θ) 2. θ 2 /n Zadanie 42. Niech W 1,..., W n (n > 1) będzie próbką z rozkładu wykładniczego o wartości oczekiwanej µ. Rozważmy estymatory parametru µ postaci ˆµ = as, gdzie S = n W i. Znaleźć liczbę a, dla której błąd średniokwadratowy estymatora, czyli wielkość E µ (ˆµ µ) 2 jest najmniejszy. 1 n+1 Zadanie 43. Niech X 1, X 2, X 3, X 4 będą niezależnymi zmiennymi losowymi, przy czym zmienna losowa X i ma rozkład normalny o wartości oczekiwanej µ i wariancji iµ 2, i = 1, 2, 3, 4, gdzie µ 0 jest nieznanym parametrem. Rozważamy estymatory parametru µ postaci ˆµ = a 1 X 1 + a 2 X 2 + a 3 X 3 + a 4 X 4. Znaleźć współczynniki a i, i = 1, 2, 3, 4, dla których estymator ma najmniejszy błąd średniokwadratowy, czyli współczynniki minimalizujące funkcję E µ (ˆµ µ) 2. a 1 = 12/37, a 2 = 6/37, a 3 = 4/37, a 4 = 3/37 Zadanie 44. Zmienna losowa N ma rozkład Poissona z nieznanym parametrem λ > 0. O parametrze λ zakładamy, że podlega rozkładowi a priori gamma G(2, 8). Zmienna losowa θ ma rozkład beta b(1, 2). Zmienne N i θ są niezależne i zmienne λ i θ są niezależne. Obserwujemy zmienną losową X, która przy znanych wartościach N i θ ma rozkład dwumianowy B(N, θ). Wyznaczyć wartości a i b najlepszego liniowego predyktora zmiennej losowej N, to znaczy liczby a i b minimalizujące wielkość E(N ax b) 2. a = 54 53, b = 35 212 Zadanie 45. Niech X 1, X 2, X 3, X 4 będą niezależnymi zmiennymi losowymi, przy czym EX i = iµ oraz V arx i = i 2 µ 2, i = 1, 2, 3, 4. Niech µ będzie estymatorem parametru µ minimalizującym błąd średniokwadratowy w klasie estymatorów postaci µ = a 1 X 1 + a 2 X 2 + a 3 X 3 + a 4 X 4, gdzie a 1, a 2, a 3, a 4 są liczbami rzeczywistymi. Wyznaczyć błąd średniokwadratowy E µ ( µ µ) 2. µ 2 /5 zadania aktuarialne (estymacja), modyfikacja WZ, strona 8
Zadanie 46. Pobieramy próbkę niezależnych realizacji zmiennych losowych o rozkładzie Poissona z wartością oczekiwaną λ > 0. Niestety sposób obserwacji uniemożliwia odnotowanie realizacji o wartości 0. Pobieranie próbki kończymy w momencie, gdy liczebność odnotowanych realizacji wynosi n. Tak więc, każda z naszych kolejnych odnotowanych realizacji K 1,..., K n wynosi co najmniej 1 i nic nie wiemy o tym, ile w międzyczasie pojawiło się obserwacji o wartości 0. Estymujemy parametr λ za pomocą estymatora postaci ˆλ = in i, gdzie N i jest liczbą obserwacji o wartości i. Obliczyć wariancję estymatora ˆλ. λ2 λ+λe λ n(e λ 1) i=2 Zadanie 47. Niech X 1,..., X n będzie próbką prostą z rozkładu normalnego N(µ, σ 2 ) oraz niech S 2 = 1 n n (X i X) 2, gdzie X = 1 n n X i. Interesuje nas względny błąd estymacji R = S2 σ 2 σ. Przy n = 10 2 wyznaczyć wartość oczekiwaną E(R 2 ). 0.19 Zadanie 48. Niech X 1,..., X n, gdzie n > 1, będą niezależnymi zmiennymi losowymi o tym samym rozkładzie o gęstości 4c 4 f c (x) = x, gdy x > c, 5 gdzie c > 0 jest nieznanym parametrem. Rozważamy dwa estymatory parametru c: T 1 = a minx 1,..., X n } i T 2 = b X, gdzie X = 1 n n X i oraz a, b są dobrane tak, aby estymatory były nieobciążone. Wyznaczyć różnicę ryzyk estymatorów, czyli R = E c (T 2 c) 2 E c (T 1 c) 2. (n 1)c 2 4n(2n 1) Zadanie 49. Niech X = (X 1,..., X k ) będzie zmienną losową o rozkładzie wielomianowym z parametrami (n, p 1,..., p k ), gdzie wektor p = (p 1,..., p k ) (p i 0 dla i = 1,..., k oraz k p i = 1) jest wektorem nieznanych parametrów. Rozważamy problem estymacji wektora p przy kwadratowej funkcji straty L( ˆp, p) = 1 k k (ˆp i p i ) 2. Wśród estymatorów wektora p postaci ˆp = (ax 1 + b,..., ax k + b) (gdzie a i b są liczbami rzeczywistymi) o ryzyku (tzn. EL( ˆp, p)) stałym, niezależnym od p, wyznaczyć estymator o najmniejszym ryzyku. a = 1 n+ n, b = 1 k(n+ n) zadania aktuarialne (estymacja), modyfikacja WZ, strona 9
Estymatory największej wiarogodności Zadanie 50. Zmienna losowa N ma rozkład Poissona z parametrem λ, który chcemy oszacować. Niestety możemy obserwować jedynie zmienną losową M, która przyjmuje wartość zero, jeśli N równa się zero, a wartość jeden, jeśli N jest większa od zera. Średnią arytmetyczną z próbki niezależnych obserwacji zmiennej M oznaczmy przez m. Wyznaczyć estymator największej wiarogodności parametru λ. ( ln 1 1 m ) Zadanie 51. Niech X 1,..., X 100 będzie próbą losową z rozkładu wykładniczego o nieznanej wartości oczekiwanej µ. Estymujemy µ na podstawie częściowej informacji o próbce, a mianowicie na podstawie tego, że 80 obserwacji miało wartości poniżej 3 oraz średnia arytmetyczna z tych 80-ciu wartości wynosi 2. Obliczyć wartość estymatora największej wiarogodności parametru µ skonstruowanego na podstawie podanej informacji. 11/4 Zadanie 52. Przyjmujemy, że liczby wypadków N 1,..., N k zgłoszonych w kolejnych k latach są niezależnymi zmiennymi losowymi. Zakładamy, że zmienna N i ma rozkład Poissona z wartością oczekiwaną λm i, gdzie m i jest znaną liczbą samochodów ubezpieczonych w i-tym roku, zaś λ nieznanym parametrem. Wyznaczyć estymator największej wiarogodności parametru λ. k Ni k mi Zadanie 53. X 1,..., X n jest próbą losową z rozkładu o dystrybuancie F α (x) = 1 (1 + e 1, x R, α > 0. ) α Wyznaczyć estymator największej wiarogodności parametru α. n [ n ln(1 + exp( X i))] 1 Zadanie 54. X 1,..., X n jest próbą losową z rozkładu o gęstości e (x θ), dla x > θ, Znaleźć estymator największej wiarogodności parametru θ. minx 1,..., X n } Zadanie 55. Niech X 1,..., X 8, X 9 będą niezależnymi zmiennymi losowymi, przy tym gęstość zmiennej X i (i = 1,..., 8) jest dana wzorem λe f λ (x) = λx, dla x > 0, Zmienna X 9 ma rozkład o gęstości g λ (x) = λ 2 xe λx, dla x > 0, Wyznaczyć estymator największej wiarogodności parametru λ. 10 9 X i zadania aktuarialne (estymacja), modyfikacja WZ, strona 10
Zadanie 56. W pewnej populacji prawdopodobieństwo tego, że osobnik przeżyje rok jest równe (1 θ). Jeżeli osobnik przeżył rok, to (warunkowe) prawdopodobieństwo tego, że przeżyje następny rok też jest równe (1 θ). W próbce liczącej n osobników z tej populacji zanotowano n 0 przypadków, kiedy osobnik nie przeżył roku, n 1 przypadków, kiedy osobnik przeżył rok, ale nie przeżył drugiego oraz n 2 przypadków, kiedy osobnik przeżył dwa lata. Wyznaczyć estymator największej wiarogodności parametru θ. n 0+n 1 n+n 1 +n 2 Zadanie 57. Wykonano n doświadczeń Bernoulliego z prawdopodobieństwem sukcesu p = 1/3. Liczba n jest nieznanym parametrem. Okazało się, że liczba porażek jest o cztery większa od liczby sukcesów. Wyznaczyć wartość estymatora największej wiarogodności parametru n. 8 Zadanie 58. Wiemy, że zmienna losowa X ma rozkład normalny o wartości oczekiwanej µ i wariancji 4. Na podstawie czteroelementowej próbki estymujemy µ 2. Zaobserwowano x 1 = 2, x 2 = 3.5, x 3 = 3, x 4 = 7. Wyznaczyć różnicę między wartością estymatora największej wiarogodności a wartością nieobciążonego estymatora o minimalnej wariancji. 1 Zadanie 59. Pobieramy próbkę niezależnych realizacji zmiennej losowej o rozkładzie Poissona z wartością oczekiwaną równą λ (dodatnią). Niestety nasz sposób obserwacji uniemożliwia odnotowanie realizacji o wartości zero. Pobieranie próbki kończymy w momencie, gdy liczebność odnotowanych realizacji wynosi T. Tak więc każda z naszych kolejnych odnotowanych realizacji k 1,..., k T wynosi co najmniej 1, i nic nie wiemy o tym, ile w międzyczasie pojawiło się (i umknęło z naszego pola widzenia) obserwacji zerowych. Wyznaczyć estymator największej wiarogodności parametru λ. estymator jest rozwiązaniem równania λ 1 e λ = 1 T T t=1 k t Zadanie 60. Niech X 1,..., X n będzie próbką z rozkładu o gęstości 1 θ x 1 θ 1, dla x (0, 1), Niech ˆθ będzie estymatorem największej wiarogodności nieznanego parametru θ > 0. Obliczyć wariancję tego estymatora. θ 2 /n Zadanie 61. W urnie jest r czarnych kul. O liczbie r wiemy tylko tyle, że jest większa od zera. Powtarzamy trzy razy następujące czynności: losujemy jedną kulę z urny i odkładamy ją na bok (nie zwracamy), a następnie wrzucamy do urny jedną kulę białą. Wynikiem doświadczenia jest sekwencja trzech liter - C lub B na przykład CBB oznacza, iż wylosowaliśmy po kolei kulę czarną, potem białą, i znowu białą. Wyznaczyć wartość estymatora ˆr największej wiarogodności nieznanej liczby r, gdy zaobserwowano ciąg CBC. 2 Zadanie 62. Zakładając, że X 1,..., X 10 jest próbką prostą z rozkładu wykładniczego o gęstości: 1 x f µ (x) = µ e µ, dla x > 0, przeprowadzono estymację parametru µ metodą największej wiarogodności i otrzymano wartość estymatora ENW (µ) równą 50. Największa zaobserwowana w próbce wartość maxx 1,..., X 10 } wyniosła 100, a dziewięć pozostałych było ściśle mniejszych od 100. Okazało się jednak, że w istocie zaobserwowane przez nas wartości X 1,..., X 10 stanowią próbkę z uciętego rozkładu wykładniczego X i = miny i, 100}, gdzie zmienne losowe Y i pochodzą z rozkładu wykładniczego o gęstości f µ. Obliczyć wartość estymatora największej wiarogodności EN W (µ) po uwzględnieniu modyfikacji założeń. 55.555... zadania aktuarialne (estymacja), modyfikacja WZ, strona 11
Zadanie 63. Niech X 1,..., X n będzie próbką z rozkładu o gęstości prawdopodobieństwa: 1 θ x 1 θ 1, dla 0 < x < 1, Niech ˆθ będzie estymatorem największej wiarogodności nieznanego parametru θ. Obliczyć funkcję ryzyka tego estymatora, tzn. R(θ) = E θ (ˆθ θ) 2. θ 2 /n Zadanie 64. Rozważmy losową liczbę zmiennych losowych X 1,..., X N. Zakładamy, że zmienne X i są wzajemnie niezależne i niezależne od zmiennej losowej N. Wiemy, że każda ze zmiennych X i ma jednakowy rozkład wykładniczy o gęstości f α (x) = αe αx, dla x > 0. Zmienna N ma rozkład Poissona z parametrem λ. Zarówno λ > 0 jak i α > 0 są nieznane. Obserwujemy tylko te spośród zmiennych X 1,..., X N, które przekraczają wartość 10. Nie wiemy, ile jest pozostałych zmiennych ani jakie są ich wartości. Przypuśćmy, że zaobserwowaliśmy pięć wartości większych od 10: 15, 23, 11, 32, 19. Na podstawie tych danych obliczyć wartości estymatorów największej wiarogodności parametrów λ i α. ˆλ = 5e, ˆα = 0.1 Zadanie 65. Niech X 1,..., X n będzie próbką z rozkładu prawdopodobieństwa o gęstości f θ,α (x) = 1 α e (x θ)/α, dla x > θ, Wyznaczono estymatory największej wiarogodności (ˆθ, ˆα) parametrów (θ, α) w sytuacji, gdy oba parametry są nieznane (α > 0). Znaleźć taką liczbę c, żeby cˆα był nieobciążonym estymatorem parametru α. n n 1 Zadanie 66. Niech W 1,..., W n będzie próbką z rozkładu wykładniczego o gęstości dla w > 0 danej wzorem f λ (w) = λ exp( λw). Nie obserwujemy dokładnych wartości zmiennych W i, tylko wartości zaokrąglone w górę do najbliższej liczby całkowitej. Innymi słowami, dane są wartości zmiennych losowych Z 1,..., Z n, gdzie Z i = W i (symbol a oznacza najmniejszą liczbę całkowitą k taką, że a k). Wyznaczyć estymator największej wiarogodności ˆλ parametru λ oparty na obserwacjach Z 1,..., Z n. ln ( 1 n S ), gdzie S = n Z i Zadanie 67. Wektor losowy (X, Y ) ma łączny rozkład prawdopodobieństwa dany następującą tabelką: Y = 1 Y = 2 1 X = 1 4 (1 θ) 1 4 θ 3 X = 2 (1 θ) 4 θ 3 4 gdzie θ (0, 1) jest nieznanym parametrem. Na podstawie 25-elementowej próbki z tego rozkładu wyznaczono estymator największej wiarogodności ˆθ. Obliczyć wariancję V arˆθ estymatora. θ(1 θ) 25 Zadanie 68. Zakładamy, że każda pojedyncza szkoda, niezależnie od pozostałych, z prawdopodobieństwem θ jest likwidowana w roku, w którym została zgłoszona, w drugim roku po zgłoszeniu - z prawdopodobieństwem θ(1 θ), w trzecim roku lub później - z prawdopodobieństwem (1 θ) 2. Dane, którymi dysponujemy dotyczą szkód. Wiemy, że spośród nich n 1 zostało zlikwidowanych w roku, w którym zostały zgłoszone, n 2 zostało zlikwidowanych w drugim roku po zgłoszeniu oraz n 3 zostało zlikwidowanych w trzecim roku lub później, gdzie n 1 + n 2 + n 3 = n. Podać estymator największej wiarogodności parametru θ na podstawie tych danych. n 1+n 2 2n n 1 zadania aktuarialne (estymacja), modyfikacja WZ, strona 12
Zadanie 69. Niech X 1,..., X n będą niezależnymi zmiennymi losowymi z rozkładu normalnego N(µ, σ 2 ), gdzie oba parametry są nieznane. Estymując parametr µ 2 wyznaczono dwa estymatory T 1 - estymator największej wiarogodności i T 2 - estymator nieobciążony o minimalnej wariancji. Wyznaczyć różnicę ryzyk estymatorów T 1 i T 2 przy kwadratowej funkcji straty. σ2 (n 3) n 2 (n 1) Zadanie 70. Niech X 1,..., X m+n będą niezależnymi zmiennymi losowymi, przy czym zmienne losowe X i, i = 1,..., m, mają rozkład Weibulla o gęstości θ 2 x e θ x, dla x > 0, a X i, i = m + 1,..., m + n, mają rozkład Weibulla o gęstości x θ g θ (x) = e 2θ x, dla x > 0, gdzie θ > 0 jest nieznanym parametrem. Niech m = n = 5. Obliczyć błąd średniokwadratowy estymatora największej wiarogodności wyznaczonego na podstawie próby X 1,..., X m+n. θ 2 /6 Zadanie 71. Niech X 1,..., X 10 będą niezależnymi zmiennymi losowymi o rozkładzie prawdopodobieństwa o gęstości θx p θ (x) = θ 1, dla x (0, 1), a Y 1,..., Y 10 będą niezależnymi zmiennymi losowymi o rozkładzie prawdopodobieństwa o gęstości 2θx 2θ 1, dla x (0, 1), gdzie θ > 0 jest nieznanym parametrem. Wszystkie zmienne losowe są niezależne. Dobrać stałą a tak, aby P θ ( T θ > a ) = 0.9, wiedząc, że T jest estymatorem największej wiarogodności parametru θ otrzymanym na podstawie zmiennych losowych X 1,..., X 10 i Y 1,..., Y 10. 0.772 Zadanie 72. Niech T oznacza liczbę pełnych okresów przeżytych przez pacjenta po pewnej operacji. Załóżmy, że T jest zmienną losową o rozkładzie geometrycznym P θ (T = t) = θ(1 θ) t dla t = 0, 1, 2,..., przy czym θ (0, 1) jest nieznanym parametrem. Obserwujemy losową grupę stu niezależnych pacjentów, przy czym dla tych pacjentów, dla których T 5, znamy T dokładnie, a jeżeli pacjent żyje co najmniej sześć okresów, to jego czas życia jest nieznany, zatem dla każdego z pozostałych pacjentów wiemy tylko, że T 6. Estymujemy θ na podstawie tych obserwacji. Wyznaczyć wartość estymatora największej wiarogodności parametru θ wiedząc, że suma okresów życia pacjentów, którzy przeżyli co najwyżej pięć pełnych okresów jest równa 120 oraz liczba tych pacjentów jest równa 40. 1/13 Zadanie 73. Na podstawie prostej próby losowej X 1,..., X n z rozkładu gamma o gęstości θ 2 xe θx, gdy x > 0, estymujemy parametr θ wykorzystując estymator największej wiarogodności ˆθ. Wyznaczyć w przybliżeniu rozmiar próby n taki, że ( ) ˆθ θ P θ 0.05 0.95. θ Posłużyć się aproksymacją rozkładem normalnym. 800 zadania aktuarialne (estymacja), modyfikacja WZ, strona 13
Zadanie 74. Niech X 1,..., X 6 będą niezależnymi zmiennymi losowymi o tym samym rozkładzie jednostajnym na przedziale ( θ, θ), gdzie θ > 0 jest nieznanym parametrem. Niech ˆθ oznacza estymator największej wiarogodności parametru θ. Obliczyć P θ (ˆθ < θ < 2ˆθ). 0.9844 Zadanie 75. Zmienne losowe X 1,..., X 5, Y 1,..., Y 4 są niezależne o tym samym rozkładzie z gęstością θ, dla x > 0, (1+x) θ+1 gdzie θ > 0 jest nieznanym parametrem. Wyznaczono estymatory największej wiarogodności ˆθ 1 i ˆθ 2 parametru θ: estymator ˆθ 1 na podstawie próby X 1,..., X 5 i estymator ˆθ 2 na podstawie próby Y 1,..., Y 4. Wyznaczyć stałe a i b, tak aby ( ) ( ) ˆθ1 ˆθ1 P θ < a = P θ > b = 0.05. ˆθ 2 ˆθ 2 a = 0.299, b = 3.072 Zadanie 76. Zakładamy, że X 1,..., X n, Y 1,..., Y n są niezależnymi zmiennymi losowymi o rozkładach normalnych, przy czym EX i = EY i = µ, V arx i = σ 2, V ary i = 4σ 2 dla i = 1,..., n. Parametry µ i σ są nieznane. Niech ˆσ 2 będzie estymatorem największej wiarogodności parametru σ 2 w tym modelu. Wyznaczyć stałą a, tak aby σ 2 = aˆσ 2 był estymatorem nieobciążonym parametru σ 2. 2n 2n 1 Zadanie 77. W urnie znajduje się razem 76 kul: białych i czarnych. Wylosowano dziesięć kul, wśród których było sześć kul białych. Wyznaczyć wartość estymatora największej wiarogodności liczby kul białych w urnie. 46 Zadanie 78. Zakładając, że obserwacje X 1,..., X 10 stanowią próbkę losową z rozkładu Pareto o gęstości 3 θ θ, dlax 0, (3+x) θ+1 gdzie θ > 0 jest nieznanym parametrem, wyznaczono wartość estymatora największej wiarogodności parametru θ i otrzymano ˆθ = 2. W próbce były dwie obserwacje o wartości sześć, a pozostałe osiem obserwacji miało wartości mniejsze od 6. Okazało się, że w rzeczywistości zaobserwowane wartości stanowiły próbkę z uciętego rozkładu Pareto, czyli były realizacjami zmiennych losowych X i = miny i, 6}, gdzie Y i, i = 1,..., 10, są niezależnymi zmiennymi losowymi z rozkładu o gęstości f θ. Wyznaczyć wartość estymatora największej wiarogodności parametru θ po uwzględnieniu modyfikacji założeń. 1.50 Zadanie 79. Zmienna losowa N ma rozkład Poissona z parametrem λ > 0. Rozważamy losową liczbę zmiennych losowych X 1,..., X N, przy czym zmienne losowe X 1,..., X N są niezależne wzajemnie i niezależne od zmiennej losowej N. Każda ze zmiennych losowych ma rozkład Weibulla o gęstości 2θx exp( θx 2 ), dla x > 0, gdzie θ > 0 jest nieznanym parametrem. Obserwujemy tylko te spośród zmiennych X 1,..., X N, które są większe od 10. Nie wiemy ile jest pozostałych zmiennych ani jakie są ich wartości. Przypuśćmy, że zaobserwowaliśmy cztery wartości większe od 10 i suma ich kwadratów jest równa 1200. Na podstawie tych danych wyznaczyć wartości estymatorów największej wiarogodności parametrów θ i λ. ˆθ = 1/200 i ˆλ = 4 e zadania aktuarialne (estymacja), modyfikacja WZ, strona 14
Zadanie 80. Niech X 1,..., X n będzie próbą z rozkładu wykładniczego o wartości oczekiwanej 1/λ. Nie obserwujemy dokładnych wartości zmiennych X i, tylko wartości zaokrąglone w górę do najbliższej liczby całkowitej. Innymi słowami, dane są wartości zmiennych losowych Z 1,..., Z n, gdzie Z i = X i (symbol a oznacza najmniejszą liczbę całkowitą k, taką, że a k). Niech S = n Z i. Wyznaczyć estymator największej wiarogodności ˆλ nieznanego parametru λ oparty na obserwacjach Z 1,..., Z n. ˆλ = ln ( ) 1 n S Zadanie 81. Niech X 1,..., X 16 będzie próbą z rozkładu jednostajnego na przedziale (0, θ). Zmienne losowe X 1,..., X 16 nie są w pełni obserwowalne. Obserwujemy zmienne losowe Y i = minx i, 10}. Wyznaczyć wartość estymatora największej wiarogodności ˆθ parametru θ na podstawie następującej próbki 16 (Y 1,..., Y 16 ) = (4, 8, 10, 5, 10, 9, 7, 5, 8, 10, 6, 10, 3, 10, 6, 10). Zadanie 82. Zmienne losowe X 1,..., X n,... są niezależne i mają identyczny rozkład dany gęstością 4θx 3 exp( θx 4 ), dla x > 0, 0. poza tym, gdzie θ > 0 jest nieznanym parametrem. Niech T n oznacza estymator największej wiarogodności funkcji g(θ) = P θ (X 1 > 1) = e θ wyznaczony w oparciu o próbę losową X 1,..., X n. Niech θ = 2. Udowodnić, że lim n P T n e 2 n > 2e 2 } = 0.32. zadania aktuarialne (estymacja), modyfikacja WZ, strona 15
Zadanie 83. Rozważmy model regresji liniowej Estymatory najmniejszych kwadratów Y i = ax i + ε i, i = 1, 2, 3, 4, gdzie ε i są niezależnymi zmiennymi losowymi o rozkładzie normalnym z wartością oczekiwaną 0 i nieznaną wariancją σ 2, x 1, x 2, x 3, x 4 są nielosowymi punktami z przedziału [0, 3], natomiast a jest nieznanym współczynnikiem. Dla jakich x 1, x 2, x 3, x 4 wariancja estymatora â otrzymanego metodą najmniejszych kwadratów jest najmniejsza? (3, 3, 3, 3) Zadanie 84. Obserwujemy zmienną y t oraz zmienne [x t,1..., x t,k ], co w postaci macierzowej zapisujemy: y = y 1. y T, X = x 1,1 x 1,K...... x T,1 x T,K Zakładamy, że rząd macierzy X wynosi K, a rząd macierzy rozszerzonej [y X] wynosi K + 1 oraz ilość obserwacji T > K + 1. Niech β = [β 1,..., β k ] oznacza hipotetyczny wektor współczynników regresji liniowej oraz niech b = (X X) 1 X y oznacza jego estymator uzyskany zwykłą metodą najmniejszych kwadratów. Niech e = y Xb będzie wektorem reszt. Pokazać, że suma reszt jest zero wtedy i tylko wtedy, gdy istnieje taka kombinacja liniowa kolumn macierzy X, która równa jest wektorowi jedynek. Zadanie 85. Zakładamy, iż oczekiwany roczny koszt obsługi grupy ubezpieczonych jest liniową funkcją liczebności grupy (wielkości nielosowej), co możemy sformalizować następująco: EY = ax + b, gdzie Y jest rocznym kosztem obsługi grupy (w złotówkach), x jest ilością ubezpieczonych w grupie, natomiast a, b są nieznanymi parametrami. Zakłada się ponadto, że V ary nie zależy od x. Zanotowano roczny koszt obsługi dla czterech grup o różnych liczebnościach:. x 50 100 200 500 Y 2000 3000 7000 9000 Do estymacji parametrów a, b stosujemy estymator najlepszy wśród wszystkich estymatorów liniowych i równocześnie nieobciążonych. Jaka jest wyestymowana wartość kosztu stałego (parametru b)? 2050 Zadanie 86. Zakładamy, że zależność czynnika Y od czynnika x (nielosowego) opisuje model regresji liniowej Y = β 0 + β 1 x i + ε i. Obserwujemy dwudziestoelementową próbkę, w której x 1 = = x 10 = 1 i x 11 = = x 20 = 3. Zmienne losowe Y 1,..., Y 20 są niezależne i błędy mają rozkłady normalne o wartości oczekiwanej 0, przy czym V arε i = σ 2, gdy i = 1,..., 10 i V arε i = 4σ 2, gdy i = 11,..., 20. Wyznaczono estymatory ˆβ 0 i ˆβ1 parametrów β 0 i β 1 wykorzystując metodę najmniejszych kwadratów, czyli minimalizując wielość 20 (Y i β 0 β 1 x i ) 2. Wyznaczyć stałe z 0 i z 1 tak, aby P ( ˆβ 0 β 0 < z 0 σ) = 0.95 i P ( ˆβ 1 β 1 < z 1 σ) = 0.95. z 0 = 1.18 i z 1 = 0.69 Zadanie 87. Zakładamy, że zależność czynnika Y od nielosowego czynnika x opisuje model regresji liniowej Y i = βx i + ε i. Obserwujemy pięcioelementową próbkę, w której x i = i dla i = 1, 2,..., 5. Zmienne losowe Y 1, Y 2,..., Y 5 są niezależne i błędy mają rozkłady normalne o wartości oczekiwanej 0, przy czym V arε i = iσ 2, gdy i = 1, 2,..., 5. Wyznaczono estymator ˆβ parametru β wykorzystując ważoną metodę najmniejszych kwadratów, to znaczy minimalizując sumę 5 (Y i βx i ) 2 V arε i. Wyznaczyć stałą z tak, by P( ˆβ β < zσ) = 0.95. 0.51 zadania aktuarialne (estymacja), modyfikacja WZ, strona 16
Zadanie 88. Zakładamy, że zależność czynnika Y od czynnika x (nielosowego) opisuje model regresji liniowej Y i = β 0 +β 1 x i +ε i. Obserwujemy dziesięcioelementową próbkę, w której x 1 = = x 5 = 1 i x 6 = = x 10 = 4. Zmienne losowe są Y 1,..., Y 10 niezależne i błędy mają rozkłady normalne o wartości oczekiwanej zero, przy czym V arε i = σ 2 dla i = 1,..., 5 oraz V arε i = 9σ 2 dla i = 6,..., 10. Wyznaczono estymatory ˆβ 0 i ˆβ 1 parametrów β 0 i β 1 wykorzystując ważoną metodę najmniejszych kwadratów, to znaczy minimalizując sumę 10 (Y i β 0 β 1 x i ) 2 V arε i. Wyznaczyć stałe z 0 i z 1 tak, aby P ( ˆβ 0 β 0 < z 0 σ) = 0.95 i P ( ˆβ 1 β 1 < z 1 σ) = 0.95. z 0 = 1.46 i z 1 = 0.92 zadania aktuarialne (estymacja), modyfikacja WZ, strona 17
Estymatory bayesowskie Zadanie 89. Niech X będzie zmienną losową o rozkładzie geometrycznym P θ (X = x) = θ x (1 θ), x = 0, 1, 2,... Załóżmy, że nieznany parametr θ jest realizacją zmiennej losowej Θ, która ma gęstość (a priori) 3θ π(θ) = 2, dla 0 < θ < 1, Wyznaczyć wartość bayesowskiego estymatora parametru θ obliczona na podstawie zaobserwowanej wartości X = 0, czyli E(Θ X = 0). 0.6 Zadanie 90. Niech X 1,..., X n będzie próbką prostą z rozkładu jednostajnego na przedziale (0, θ). Zakładamy, że nieznany parametr θ jest zmienną losową o rozkładzie jednostajnym na przedziale (0, 1]. Wyznaczyć gęstość a posteriori π(θ X 1,..., X n ). proporcjonalna do θ n na przedziale [M, 1], gdzie M = maxx 1,..., X n } Zadanie 91. Niech X 1,..., X n będzie próbką z rozkładu prawdopodobieństwa Pareto o dystrybuancie 1 1, dla x > 0, F θ (x) = x θ Przyjmując bayesowski punkt widzenia, zakładamy, że nieznany parametr θ jest zmienną losową o rozkładzie a priori wykładniczym z gęstością λe π(θ) = λθ, dla θ 0, Wyznaczyć bayesowski estymator parametru θ, czyli wartość oczekiwaną a posteriori ˆθ = E(θ X 1,..., X n ). n+1 ln Xi +λ Zadanie 92. Niech X 1,..., X n będą niezależnymi zmiennymi losowymi z rozkładu o gęstości 2θ x, dla x > θ, 3 gdzie θ > 0 jest nieznanym parametrem. Dla parametru θ zakładamy rozkład a priori o gęstości θ π(θ) = 2, dla θ (0, 2), Wyznaczyć wartość estymatora bayesowskiego parametru θ przy kwadratowej funkcji straty, jeżeli zaobserwowano próbkę spełniającą warunek minx 1,..., X n } = 1. 2n+2 2n+3 Zadanie 93. Niech X 1,..., X n będą niezależnymi zmiennymi losowymi z rozkładu wykładniczego o gęstości θe θx, dla x > 0, gdzie θ > 0 jest nieznanym parametrem. Dla parametru θ zakładamy rozkład a priori o gęstości 9θe π(θ) = 3θ, dla θ > 0, Estymujemy parametr θ przy funkcji straty postaci Wyznaczyć estymator bayesowski a parametru θ. (n + 2) ln 3+T 2+T, gdzie T = n X i L(θ, a) = e (θ a) (θ a) 1. zadania aktuarialne (estymacja), modyfikacja WZ, strona 18
Zadanie 94. Niech X 1,..., X n, gdzie n > 1, będą niezależnymi zmiennymi losowymi o tym samym rozkładzie Weibulla o gęstości 2θx exp( θx 2 ), dla x > 0, 0. poza tym, gdzie θ > 0 jest nieznanym parametrem. Zakładamy, że parametr θ ma rozkład a priori o gęstości π(θ) = β α Γ(α) θα 1 exp( βθ), dla θ > 0, Wyznaczyć estymator bayesowski ˆθ parametru θ przy funkcji straty Esschera L(θ, ˆθ) = e cθ (θ ˆθ) 2, gdzie c 0 jest ustaloną liczbą. α+n β+ n X2 i c zadania aktuarialne (estymacja), modyfikacja WZ, strona 19