Kolokwium ze statystyki matematycznej 28.05.2011 Zadanie 1 Niech X będzie zmienną losową z rozkładu o gęstości dla, gdzie 0 jest nieznanym parametrem. Na podstawie pojedynczej obserwacji weryfikujemy hipotezę : 1 przy alternatywie : 1. a) Wyznaczyć obszar krytyczny testu jednostajnie najmocniejszego na poziomie istotności 0,05. (5 pkt) b) Obliczyć moc testu wyznaczonego w podpunkcie a) dla hipotezy alternatywnej : 2. (5 pkt) Zadanie 2 Niech,,, będą niezależnymi zmiennymi losowymi o identycznym rozkładzie normalnym z wartością oczekiwaną 0 i wariancją. a) Wyznaczyć wartość oczekiwaną i wariancję zmiennej losowej. (5 pkt) b) Załóżmy, iż mamy do dyspozycji próbkę liczącą 10 obserwacji. Testujemy hipotezę : 1 wobec alternatywy : 1 za pomocą testu o obszarze krytycznym,, :, gdzie S jest zdefiniowane jak w podpunkcie a). Dobierz stałą c, aby otrzymać test na poziomie istotności 0,05. (5 pkt) Zadanie 3 Zmierzono czas 9 losowo wybranych rozmów telefonicznych w pewnej grupie klientów i otrzymano następujące wyniki w minutach: 3 5 4,5 5,5 2 1 7 2 6 Zakładamy, że czas rozmowy ma rozkład normalny, 2. a) Wyznaczyć przedział ufności dla przeciętnego czasu rozmowy na poziomie ufności 0,9. (4 pkt) b) Jak liczną próbkę należy dolosować, aby otrzymać przedział ufności o długości nie większej niż 1? Przyjąć ponownie poziom ufności 0,9. (2 pkt) c) Przetestuj hipotezę : 3 wobec alternatywy : 3 przyjmując poziom istotności 0,05. Proszę wyznaczyć p-value. (4 pkt) Zadanie 4 Niech,,, będą niezależnymi zmiennymi losowymi o identycznym rozkładzie o gęstości 2 dla x > 0. a) Wyznacz estymator największej wiarygodności parametru. (5 pkt) b) Oblicz wartość oczekiwaną i wariancję estymatora wyznaczonego w podpunkcie a). (5 pkt)
Zadanie 5 Niech,,, będą niezależnymi zmiennymi losowymi o identycznym rozkładzie o gęstości dla x > 1. Zadanie 6 a) Wyznacz estymator parametru w oparciu o metodę kwantyli wykorzystując medianę z próby. (5 pkt) b) Niech oznacza estymator parametru wyznaczony w oparciu o metodę największej wiarygodności. Wyznaczyć w przybliżeniu rozmiar próbki n taki, żeby 0,01 0,95. Proszę posłużyć się aproksymacją rozkładem normalnym dla estymatora metody największej wiarygodności. (5 pkt) a) Tabela przedstawia indeksy jednopodstawowe cen pewnego artykułu w latach 2003 2009. Za rok bazowy przyjęto rok 2005. Lata 2003 2004 2005 2006 2007 2008 2009 Indeks 0,90 1,20 1,00 1,20 1,25 1,10 0,90 Wyznaczyć tempo zmian ceny w okresie 2003 2009. (2 pkt) Wyznaczyć indeks jednopodstawowy za rok 2006, gdy za rok bazowy przyjmiemy rok 2003. (1 pkt) W którym roku (z lat 2004 2007) w stosunku do roku poprzedniego był największy wzrost ceny? (2 pkt) b) Losowa próbka 200 niezależnych obserwacji miesięcznych wydatków na żywność rodzin 3- osobowych dała następujące wyniki wydatki w tyś. zł Liczebności (1.0; 1.2] 30 (1.2; 1.4] 50 (1.4; 1.6] 70 (1.6; 1.8] 40 (1.8; 2.0] 10 Oblicz średnią, odchylenie standardowe oraz dominantę. (3 pkt) Uzupełnij zdanie: 50% rodzin przeznacza na wydatki na żywność co najmniej... (2 pkt)
Zadanie 1 a) Czyli obszar krytyczny jest postaci: : Pozostaje tylko dobrać stałą c: 0,05 1 1 2 Ostatecznie można zapisać: : ln 20/19 / b) 1 / 2 / 1 ln0,95 ln 20/19 / 1 Zadanie 2 a) ~0, 0,5 0,5 ~0,1 ~ Γ, 1 0,5 0,5 1 b) ~ 2 0,05 1 : 1 : 1 /10 /10 : 1 1 F /10 - czyli /10 jest kwantylem rzędu 0,95 dla rozkładu z jednym stopniem swobody. 3,841 38,41 10 Zadanie 3 a) 4 Przedział ufności ma postać: ;, gdzie z jest kwantylem rzędu 0,95 dla rozkładu 0,1. b) długość przedziału = 2 ; 2 1,64 4 ; 4 2 1,64 2,91; 5,09 9 9 2. 1 6,56 43,0336 Czyli potrzeba przynajmniej 44 obserwacji, mamy już 9, więc musimy jeszcze dolosować 35. c) 4
1) Statystyka testowa: 9 1,5 2)Obszar krytyczny:, ; 1,64; 3) brak podstaw do odrzucenia hipotezy zerowej 1 Φ1,5 0,0668 Zadanie 4 a) 2 2 ln 0 / b) Zaczynamy od wyznaczenia rozkładu zmiennej losowej. Dla 0 mamy: 0, gdzie F oznacza dystrybuantę zmiennej losowej X Obliczamy gęstość zmiennej losowej :, 2,, czyli ~ Z tego wynika, że ~Γ, Zadanie 5 a) Wyznaczamy medianę rozkładu teoretycznego (m): 0,5 1 2 / Niech me oznacza medianę wyznaczoną na podstawie próbki liczącej n obserwacji. Wówczas estymator metody momentów wyznaczony jest z równania: 2 / 2/ b) Wiemy, że ma asymptotyczny rozkład, 1/ 1
Czyli ma asymptotyczny rozkład, i z tego wynika, że ma w przybliżeniu rozkład 0,1. 0,01 0,01 0,01 0,01 0,01 Φ0,01 Φ0,01 Φ0,01 1 Φ0,01 2Φ0,01 1 0,95 Φ0,01 0,975 0,01 1,96 38416 Zadanie 6 a) Tempo zmian ceny w okresie 2003 2009: / / / 1 0,9 1 0 Indeks jednopodstawowy za rok 2006, gdy za rok bazowy przyjmiemy rok 2003: / / /, 4/3, Wyznaczamy indeksy łańcuchowe dla okresu 2004 2007: / / /, 4/3, / 1/ 1/1,2 5/6 / 1,2 / / / 1,25/1,2 1,04 Największy wzrost ceny w stosunku do roku poprzedniego był w 2004 b) X0 X1 środek liczebność skumulowane środek*liczebność, 1 / 1 (środekśrednia)^2*liczebność 1,0 1,2 1,1 30 30 33 3,675 1,2 1,4 1,3 50 80 65 1,125 1,4 1,6 1,5 70 150 105 0,175 1,6 1,8 1,7 40 190 68 2,5 1,8 2,0 1,9 10 200 19 2,025 SUMA 200 290 9,5 Średnia 1,45 Odchylenie standardowe, 0,22
Moda 1,4 Mediana: / 200 100 / / 1,4 100 80, 1,46 0,2 1,48 50% rodzin przeznacza na wydatki na żywność co najmniej 1,46 tyś. złoty