Egzamin ze Statystyki Matematycznej, WNE UW, wrzesień 016, zestaw B Odpowiedzi i szkice rozwiązań 1. Zbadano koszt 7 noclegów dla 4-osobowej rodziny (kwatery) nad morzem w sezonie letnim 014 i 015. Wylosowano niezależnie próbki losowe 1 elementowe i otrzymano dane: rok 014: średnia z próbki 1100zł, wariancja (estymator nieobciążony) 500 rok 015: średnia z próbki 100zł, wariancja (estymator nieobciążony) 8900 Zakładamy, że obserwowane zmienne losowe mają rozkłady normalne. Weryfikowano hipotezę H 0, że wariancje kosztu 7 noclegów w obu latach są takie same przy alternatywie, że są one różne. Statystyka testowa do weryfikacji tej hipotezy jest postaci i przyjmuje wartość, zatem na poziomie istotności α = 0, 1 ODRZU- CAMY /NIE MA PODSTAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić). Weryfikowano hipotezę H 0, że przeciętne koszty są takie same w obu latach przy alternatywie, że przeciętny koszt wzrósł w roku 015. Obszar krytyczny do weryfikacji tej hipotezy przy poziomie istotności α = 0, 1 jest postaci i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić). Statystyka testowa: F = S, przyjmuje wartość F = 8900 S1 500 = 1, 8. Ponieważ obszar krytyczny jest postaci (tu mogą Państwo korzystać ze swoich wzorów) K = {F < F (0, 95; 0, 0) = 0, 47 F > F (0, 05; 0, 0) =, 14} zatem NIE MA PODSTAW DO ODRZUCENIA HIPOTEZY H 0 Obszar krytyczny (tu mogą Państwo korzystać ze swoich wzorów) K = T = X X 1 > t(0, ; 1 + 1 ) = 1, 3031 1 S e n 1 + 1 n i statystyka testowa przyjmuje wartość T =, 0 zatem ODRZUCAMY H 0.. Na podstawie danych z poprzedniego zadania zbudowano przedział ufności dla przeciętnego kosztu kwatery w roku 014. Realizacja przedziału ufności przy poziomie ufności 0,95 wynosi
Jak liczną próbkę należy dolosować, aby otrzymać realizację przedziału ufności o długości nie większej niż 100 (przy tym samym poziomie ufności). Podaj najmniejszą liczbę obserwacji... Korzystamy ze wzorów na przedział ufności dla wartości oczekiwanej [ X t(α, n 1) S n, X + t(α, n 1) S n ] mamy X = 1100, S = 500, n = 1, α = 0, 05, t(α, n 1) =, 086 i otrzymujemy [1031, 7; 1168, 8] ( ) Korzystamy ze wzoru n t(α,n0 1)S, d gdzie n0 = 1 i d = 100, i podstawiając otrzymujemy n 39, 16, zatem należy dolosować 40 1 = 19 obserwacji. 3. Niech X 1,..., X n będzie próbą losową prostą z rozkładu o dystrybuancie { 1 e (x θ) gdy x (θ, + ) F θ (x) = 0 w przeciwnym przypadku gdzie θ jest nieznanym parametrem. Estymator parametru θ wyznaczony metodą kwantyli ma postać EMK(θ) =... Parametr θ oszacowany metodą kwantyli na podstawie próby: 1,31,75 4,40,56 3,88 1,44 ma wartość... Wyznaczamy kwantyl rzędu 1/ czyli rozwiązujemy równanie 1 e (x θ) = 1/ otrzymujemy q 1/ = x = θ+ln, Podstawiamy Med = θ+ln, wyznaczamy θ, stąd EMK(θ) = Med ln Dla próby z zadania Med =,56+,75 =, 655 zatem EMK(θ) =, 655 ln = 1, 96 4. Niech X 1,..., X 5 będzie próbą losową prostą z rozkładu o gęstości f(x) = e (x θ), x > θ, gdzie θ jest nieznanym parametrem. Hipotezę H 0 : θ 1 przeciw H 1 : θ > 1 na poziomie istotności 0,1 weryfikuje się za pomocą testu o obszarze krytycznym gdzie X 1:5 = min{x 1, X,..., X 5 }. X 1:5 c
Wyznacz wartość krytyczną c Wyznacz funkcję mocy testu dla θ > 1... β(θ) =... Wskazówka: Jeżeli X 1, X,..., X n jest próbą losową z rozkładu o gęstości f(x) = e (x θ), x > θ, to zmienna losowa X 1:n = min{x 1, X,..., X n } ma rozkład o gęstości g(x) = ne n(x θ), x > θ. Korzystając ze wskazówki liczymy 0, 1 = P (X 1:5 c) = stąd wyznaczamy c = 0, ln 10 + 1 = 1, 46. β(θ) = + c ln 0, 1 = 5(c 1) 5e 5(x 1) dx = e 5(x 1) { + c 5e 5(x θ) dx = e 5(x θ) = e ln 0,1+5(θ 1) = 0, 1e 5(θ 1) gdy θ < c 1 gdy θ c 5. Badano związek pomiędzy płcią uczniów szkół średnich i typem preferowanego wykształcenia. Wyniki dla 470 losowo wybranych osób prezentuje tabela: techniczne humanistyczne artystyczne mężczyzna 110 70 40 kobieta 60 140 50 Wartość statystyki testowej χ dla weryfikacji hipotezy zerowej H o niezależności preferencji i płci jest równa χ = Ponieważ wartość krytyczna testu na poziomie istotności 0,1 jest równa..., więc ODRZUCAMY / NIE ODRZUCAMY H (podkreśl właściwą odpowiedź). Korzystamy ze wzoru na statystykę testu niezależności χ i podstawiamy dane, zatem χ = i=1 j=1 ( 3 N i,j Ni N j n N i N j n ) = 37, 39 wartość krytyczna testu na poziomie istotności 0,1 jest równa (odczytujemy z tablic) χ (0, 1; ) = 4, 605, więc ODRZUCAMY H (37, 39 > 4, 605)
6. Na podstawie danych z zadania poprzedniego weryfikowano hipotezę H 0, że odsetek dziewcząt preferujących wykształcenie humanistyczne jest równy 0,5 przy alternatywie, że jest on większy. Statystyka testowa do weryfikacji tej hipotezy przyjmuje wartość, zatem na poziomie istotności α = 0, 05 ODRZUCAMY /NIE MA PODSTAW DO ODRZUCE- NIA HIPOTEZY H 0 (właściwe podkreślić). p-value statystyki testowej z poprzedniego punktu wynosi... i jest WYŻSZE /TAKIE SAMO /NIŻSZE (właściwe podkreślić), niż w sytuacji, gdyby hipoteza alternatywna brzmiała, że odsetek jest różny od 0,5. Statystyka testowa ma postać (odczytujemy ją z kartki z wzorami) U = K/n p 0 140/50 0, 5 n = 50 = 1, 897 p0 (1 p 0 ) 0, 5 wartość krytyczną odczytujemy z tablic u 0,95 = 1, 645, zatem ODRZUCAMY H 0 (1, 897 > 1, 645) p-value= P (U > 1, 897) = 0, 09 0, 03 (korzystamy tu z dystrybuanty standardowego rozkładu normalnego), jest NIŻSZE niż w sytuacji, gdyby hipoteza alternatywna brzmiała, że odsetek jest różny od 0,5. 7. Niech X 1, X,..., X n będzie próbką z rozkładu normalnego N(µ, σ ) ze znaną wariancją σ = 1. Interesuje nas estymacja kwadratu średniej, g(µ) = µ. Rozważmy następujący estymator: g = X. Podać jego obciążenie E µ X µ = Wskazówka: V arx = EX (EX). Nierówność Cramera-Rao mówi, że dla dowolnego estymatora nieobciążonego ĝ kwadratu średniej µ w tym modelu mamy: Var µ (ĝ)... Ponieważ X N(µ, σ n ) = N(µ, 1 n ), zatem E µ X µ = 1 n + µ µ = 1 n Var µ (ĝ) ( d(µ ) dµ ) ni(µ) = 4µ n, bo I(µ) = E ( (ln 1 σ π µ (X µ) e σ )) = E ( (X µ) σ ) µ = 1 σ = 1 8. Zbadano sprzedaż trzech artykułów firmy A w latach 010 i 015:
wartość sprzedaży zmiana ilości sprzedaży w 015 w stosunku do 010 artykuł 010 015 X 70 100 bez zmian Y 160 10 spadek o 50% Z 80 60 wzrost o 0% Agregatowy indeks Laspeyresa ilości jest równy i oznacza, że...... Agregatowy indeks cen Paaschego jest równy... i oznacza, że...... LI q = k j=1 p j0q j1 70 + 0, 5 160 + 1, 80 k j=1 p = = 0, 794 j0q j0 70 + 160 + 80 i oznacza, że wartość łącznej sprzedaży trzech badanych artykułów w roku 015 w stosunku do roku 010 zmalała o 1% na skutek zmian ilości, przy założeniu cen z roku 010 (przykład poprawnej interpretacji). Ponieważ I w = 100+10+60 70+160+80 = L I q P I p zatem P I p = 1, 14 i oznacza, że wartość łącznej sprzedaży trzech badanych artykułów w roku 015 w stosunku do roku 010 wzrosła o 14% na skutek zmian cen, przy założeniu ilości z roku 015.