Statystyka matematyczna - Seria. Niech Z oznacza zmienną losową o rozkładzie standardowym normalnym. Korzystając z tablic znaleźć (a) P (0 Z 2.7) (d) P (Z.37) (b) P ( Z 2.5) (e) P ( 2.5 Z 0) (c) P (Z.75) (f) P (.5 Z 2).2 Niech X oznacza zmienną losową o rozkładzie normalnym o średniej 80 i odchyleniu standardowym 00. Korzystając z tablic znaleźć (a) P (X 00) (b) P (85 X 95) (c) P ( X 80 0).3 Poziom oddychania tkanek w przeponie szczurów przy zwykłej temperaturze ma rozkład normalny o średniej µ = 2.03 i odchyleniu standardowym σ = 0.44. Obliczyć prawdopodobieństwo, że u losowo wybranego szczura poziom ten: (a) wynosi co najmniej 2.5, (b) mieści się poza przedziałem (.59; 2.47)..4 Załóżmy, że czas wywołania zdjęcia ma rozkład normalny o średniej 25 s. i odchyleniu standardowym.3 s. Jakie jest prawdopodobieństwo tego, że (a) wywołanie pojedynczego zdjęcia zajmie więcej niż 26.5 s.? (b) czas wywołania zdjęcia będzie się różnił od czasu oczekiwanego o więcej niż 2.5 s.? (c) czas wywołania zdjęcia będzie się różnił od 20 s. o co najwyżej dwa odchylenia standardowe?.5 W pewnej populacji iloraz inteligencji ma rozkład normalny N (00 IQ, (5 IQ) 2 ). Obliczyć prawdopodobieństwo zdarzenia, że losowo wybrana osoba ma iloraz inteligencji: (a) z przedziału (00 IQ; 20 IQ), (b) powyżej 30 IQ..6 Pokazać, że dla populacji rozłożonej wg rozkładu normalnego N (µ, σ 2 ) (a) 68% wartości jest oddalona od średniej o co najwyżej σ, (b) 95% wartości jest oddalona od średniej o co najwyżej 2σ, (c) 99.7% wartości jest oddalona od średniej o co najwyżej 3σ..7 Niech Z oznacza zmienną losową o rozkładzie standardowym normalnym. Korzystając z tablic znaleźć takie c, aby (a) P (Z c) = 0.2 (b) P ( Z c) = 0.668 (c) P ( Z c) = 0.06.8 Korzystając z tablic wyznaczyć wartości kwantyli z 0.25 i z 0.75 dla standardowego rozkładu normalnego i sprawdzić, że poza przedziałem leży średnio 7 obserwacji na 000. [z 0.25.5(z 0.75 z 0.25 ); z 0.75 +.5(z 0.75 z 0.25 )].9 Długość ogórków pewnej odmiany ma rozkład normalny N (2 cm, (3 cm) 2 ). Producent ogórków postanowił posortować wszystkie zebrane ogórki na trzy równe ilościowo grupy. Jakie wartości długości powinien przyjąć jako krańce przedziałów dla poszczególnych grup?.0 Stwierdzono, że natężenie prądu w badanym obwodzie ma rozkład normalny N (0 ma, (2 ma) 2 ). Wyznaczyć wartość natężenia, która nie jest przekraczana z prawdopodobieństwem 0.98.. Zmienna losowa X ma rozkład normalny N (50, σ 2 ). Wyznaczyć największe σ takie, że P (45 < X < 55) 0.6827..2 Zakłada się, że w masowej produkcji waga pączków ma rozkład normalny N (80 g, σ 2 ). Jakie największe σ można dopuścić, aby prawdopodobieństwo zdarzenia, że losowo kupiony pączek waży co najmniej 75 g, było równe co najmniej 0.977?
.3 Korzystając z tablic wyznaczyć wartości kwantyli z 0.05 i z 0.005 dla standardowego rozkładu normalnego. Ile wynoszą wartości odpowiednich kwantyli dla rozkładu N (5, 3 2 )?.4 Załóżmy, że średnica pewnych owoców ma rozkład normalny o średniej 0.25 cala i odchyleniu standardowym 0.002 cala. (a) Jakiej wartości nie przekroczy średnica 95% owoców? (b) Jaką wartość przekroczy średnica 0% owoców? (c) Wyznaczyć rozstęp międzykwartylowy rozkładu średnicy ogórków..5 Załóżmy, że opór pewnego typu rezystorów ma rozkład normalny oraz że 0% wszystkich rezystorów ma oporność większą od 0.256 ohmów i 5% rezystorów ma oporność mniejszą od 9.67 ohmów. Ile wynosi wartość oczekiwana i odchylenie standardowe tego rozkładu?.6 Miesięczne wynagrodzenie pracowników pewnej firmy ma rozkład normalny N (4000 zł, σ 2 ). (a) Wyznaczyć wartość parametru σ wiedząc, że 5.86% pracowników tej firmy zarabia nie więcej niż 2400 zł. (b) Jaka część pracowników firmy osiąga miesięczne wynagrodzenie z przedziału (4000 zł; 5600 zł)?.7 Zmienna losowa X ma rozkład jednostajny na przedziale (0; ). Wykazać, że zmienna losowa Y = λ ln X, gdzie λ > 0, ma rozkład wykładniczy z parametrem λ..8 Zmienna losowa X ma rozkład normalny N (2, 2 2 ). Wyznaczyć rozkład zmiennej losowej Y = g(x), gdzie, gdy x < g(x) = 2, gdy x 3, gdy x >.9 Zmienna losowa Z ma rozkład normalny N (0, ). Wyznaczyć dystrybuantę, a następnie gęstość zmiennej losowej Y, gdzie (a) Y = Z, (b) Y = Z 2, (c) Y = Z..20 Udowodnić następującą równość: n (x i x) 2 = n ( n x 2 i n ( n x i ) 2 )..2 Załóżmy, że wzrost dorosłych Polaków ma rozkład N (76 cm, (6.5 cm) 2 ). Obliczyć prawdopodobieństwo, że średnia X dla prostej próby losowej o liczności 00 różni się od 76 cm o więcej niż.5 cm. Wynik porównać z prawdopodobieństwem analogicznej odchyłki dla pojedynczej zmiennej losowej X..22 Załóżmy, że rozkład czasu dojazdu do pracy ma rozkład U([0.5 h, h]). Ile w przybliżeniu wynosi pradwopodobieństwo zdarzenia, że średni dojazd w ciągu 30 dni przekroczy 0.8 h?.23 Zbiór 000 znaków jest przesyłany między dwoma komputerami. Prawdopodobieństwo błędnej transmisji pojedynczego znaku wynosi 0.02 i błędy dla różnych znaków są od siebie niezależne. Oszacować prawdopodobieństwo, że liczba błędów podczas całej transmisji zmieści się w przedziale [0, 25].
Statystyka matematyczna - Seria 2 2. Niech X,..., X n będzie prostą próbą losową z rozkładu o wartości oczekiwanej µ i wariancji σ 2. Pokazać, że: (a) X = n X i jest estymatorem nieobciążonym dla µ, (b) n (c) n (X i µ) 2 jest estymatorem nieobciążonym dla σ 2, (X i X) 2 jest estymatorem obciążonym dla σ 2, (d) S 2 = n (X i X) 2 jest estymatorem nieobciążonym dla σ 2, 2.2 Niech X,..., X n będzie prostą próbą losową z rozkładu o wartości oczekiwanej µ i wariancji σ 2. (a) Pokazać, że ( X) 2 nie jest estymatorem nieobciążonym dla µ 2. (b) Dla jakiej wartości k estymator postaci ( X) 2 ks 2 jest nieobciążony dla µ 2? 2.3 Załóżmy, że wzrost w ciągu roku rośliny pewnego gatunku jest zmienną losową o wartości oczekiwanej µ i wariancji σ 2, zaś wzrost w ciągu roku rośliny drugiego gatunku jest zmienną losową o wartości oczekiwanej µ i wariancji 4σ 2. Niech X,..., X m oznacza m niezależnych obserwacji wzrostu roślin pierwszego gatunku, zaś Y,..., Y n - n niezależnych obserwacji wzrostu roślin drugiego gatunku. (a) Pokazać, że dla każdego δ [0, ] estymator ˆµ = δ X + ( δ)ȳ jest nieobciążony dla µ. (b) Dla ustalonych m i n znaleźć wartość δ, która minimalizuje błąd średniokwadratowy ˆµ. 2.4 Rozważmy estymator wariancji postaci ˆσ 2 = cs 2. Jaka wartość c minimalizuje błąd średniokwadratowy tego estymatora w przypadku, gdy próba losowa pochodzi z rozkładu normalnego N (µ, σ 2 )? Wskazówka: E[(S 2 ) 2 ] = (n + )σ 4 /(n ) 2.5 Niech X,..., X n będzie prostą próbą losową z rozkładu o gęstości prawdopodobieństwa f(x), która jest symetryczna względem wartości µ. Wtedy X = med(x,..., X n ) jest nieobciążonym estymatorem µ i można pokazać, że dla dużych n zachodzi: V ar( X) /(4n(f(µ)) 2 ). (a) Porównać V ar( X) i V ar( X), gdy f N (µ, σ 2 ). (b) Kiedy f Cauchy(µ, ), to V ar( X) =, więc X jest złym estymatorem. Jaką postać przyjmuje V ar( X) dla dużych n w tym przypadku? 2.6 Niech X,..., X n będzie prostą próbą losową z rozkładu Poissona P (λ). Wyznaczyć estymator największej wiarogodności dla parametru λ. 2.7 Wyznaczyć estymatory największej wiarogodności parametrów µ i σ 2 dla rozkładu normalnego N (µ, σ 2 ). 2.8 Metodą największej wiarogodności znaleźć estymator prawdopodobieństwa sukcesu p dla ciągu n niezależnych prób Bernoulliego. 2.9 Niech X,..., X n będzie prostą próbą losową z rozkładu Poissona P (λ ), zaś Y,..., Y n - z rozkładu P (λ 2 ) niezależną od poprzedniej próby. Metodą największej wiarogodności wyznaczyć estymator wielkości λ λ 2. 2.0 Wyznaczyć estymatory największej wiarogodności parametrów λ i θ dla przesuniętego rozkładu wykładniczego mającego gęstość postaci: f(x; λ, θ) = λe λ(x θ) I(x θ), λ > 0. 2. Metodą momentów znaleźć estymatory parametrów α i β dla rozkładu gamma G(α, β). Wskazówka: dla X G(α, β) mamy EX = αβ, V ar(x) = αβ 2, α >, β > 0. 2.2 Metodą momentów znaleźć estymatory parametrów r i p dla rozkładu dwumianowego ujemnego nb(r, p). Wskazówka: dla X nb(r, p) mamy EX = r( p)/p, V ar(x) = r( p)/p 2, r > 0, 0 < p.
2.3 Znaleźć estymator parametru θ dla rozkładu o gęstości f(x; θ) = (θ + )x θ I(0 x ), gdzie θ >, (a) metodą największej wiarogodności, (b) metodą momentów. 2.4 Znaleźć estymator parametru θ dla rozkładu jednostajnego U([0, θ]) (a) metodą największej wiarogodności, (b) metodą momentów. 2.5 Znaleźć estymator parametru a dla rozkładu Pareto mającego gęstość f(x) = a x a+ I(x ), gdzie a >, (a) metodą największej wiarogodności, (b) metodą momentów. 2.6 Znaleźć estymator parametru λ dla rozkładu wykładniczego Exp(λ) (a) metodą największej wiarogodności, (b) metodą momentów. Czy są to estymatory nieobciążone? Rozkład Cauchy ego C(a, b) Rozkład Gamma G(α, β) f(x) = π f(x) = b b 2 + (x a) 2, x R, b > 0 β α Γ(α) xα e x/β, x > 0
Statystyka matematyczna - Seria 3 3. Niech X będzie zmienną losową o rozkładzie normalnym N (µ, σ 2 ). Obliczyć informację Fishera o parametrze σ zawartą w obserwacji X. Wskazówka: jeśli Y N (0, ), to EY 2k+ = 0, EY 2k = 3 5... (2k ), k N. 3.2 Niech X,..., X n będzie próbą losową z rozkładu zero-jedynkowego takiego, że P (X = ) = θ, gdzie 0 < θ <. Wykazać, że X = n n X i jest estymatorem efektywnym parametru θ. 3.3 Niech X,..., X n będzie próbą losową z rozkładu Poissona z parametrem λ > 0. Wykazać, że X = n n X i jest estymatorem nieobciążonym, efektywnym i zgodnym parametru λ. 3.4 Średnia cena 50 losowo wybranych podręczników akademickich wyniosła 28.40 PLN. Wiadomo, że odchylenie standardowe cen podręczników wynosi 4.75 PLN. Wyznaczyć 95% przedział ufności dla średniej ceny podręcznika akademickiego zakładając, że rozkład cen jest rozkładem normalnym. 3.5 Badania przeprowadzone w 990 roku przez Instytut Gallupa na próbie losowej 2727 dorosłych obywateli USA wykazały, że średnie wydatki gospodarstwa domowego na cele charytatywne w 989 r. wyniosły $734, podczas gdy wyestymowane odchylenie standardowe tych wydatków dało $85. Wyznaczyć 99% przedział ufności przeciętnych wydatków na cele charytatywne w USA w 989 r. 3.6 W sondażu przeprowadzonym przez magazym Time 57% spośród 04 dorosłych respondentów stwierdziło, że dla dobra dzieci lepiej jest, gdy matka nie pracuje poza domem. Wyznaczyć 95% przedział ufności dla procentu dorosłych podzielających ten pogląd. 3.7 Próba losowa ośmiu elementów testowych włókien pewnego materiału dała średnią wartość naprężenia powierzchni równą 30.2 i próbkowe odchylenie standardowe naprężenia równe 3.. Zakładając, że wartość naprężenia powierzchni jest zmienną losową o rozkładzie normalnym, wyznaczyć 95% przedział ufności dla wartości oczekiwanej. 3.8 Na podstawie 9-elementowej próby zbadano rozszerzalność spoin używanych w tankowcach pewnego typu. Otrzymano próbkową wartość odchylenia standardowego równą 2.8. Zakładając normalność, wyznaczyć 95% przedział ufności dla wariancji. 3.9 Niech X,..., X n będzie próbą losową z rozkładu ciągłego o medianie µ. Pokazać, że (min(x,..., X n ), max(x,..., X n )) jest 00( α)% przedziałem ufności dla µ, gdzie α = ( 2) n. 3.0 Niech X,..., X n będzie próbą losową z rozkładu wykładniczego z parametrem θ. Wyznaczyć asymptotyczny przedział ufności dla parametru θ na poziomie ufności α. 3. Znając postać estymatora największej wiarogodności parametru θ, wyprowadzić wzór na asymptotyczny przedział ufności dla tego parametru na poziomie ufności α. 3.2 Korzystając ze wzoru wyprowadzonego w zadaniu 3. podać postać asymptotycznego przedziału ufności dla prawdopodobieństwa sukcesu w schemacie Bernoulliego. 3.3 Dział kontroli jakości w zakładach chemicznych chce oszacować średnią wagę proszku do prania sprzedawanego w pudełkach o nominalnej wadze 3 kg. Jak liczną próbkę pudełek proszku należy pobrać, aby z maksymalnym błędem 00g wyznaczyć 99% przedział ufności dla średniej wagi pudełka proszku do prania? Wiadomo, że rozkład wagi pudełka proszku do prania jest normalny z odchyleniem standardowym 50g. 3.4 Jak dużą próbę losową należy pobrać, aby z maksymalnym błędem 2.5% oszacować na poziomie ufności 0.95 procent dorosłych Polaków czytających codziennie przynajmniej jedną gazetę? 3.5 Jak dużą próbę losową należy pobrać, aby z maksymalnym błędem 2% oszacować na poziomie ufności 0.99 procent kierowców nie zapinających pasów bezpieczeństwa? Uwzględnić rezultaty wstępnych badań, z których wynika, że interesująca nas wielkość jest rzędu 6%. Porównać otrzymaną liczność próby z licznością, jaka byłaby wymagana, gdyby pominąć rezultaty badań wstępnych.
Statystyka matematyczna - Seria 4 4. Podrzucano monetę trzy razy. Należy przetestować hipotezę H 0 : p = /2 przy hipotezie alternatywnej H : p = 2/3, gdzie p oznacza prawdopodobieństwo wypadnięcia orła. Procedura testowa polega na odrzuceniu hipotezy zerowej, gdy wypadły dwa lub więcej orłów. Wykazać, że moc tego testu wynosi 20/27. 4.2 Na podstawie próby losowej z rozkładu normalnego o nieznanej wartości średniej θ i znanym odchyleniu standardowym 0.05 należy przetestować hipotezę H 0 : θ = θ 0 przy alternatywie H : θ > θ 0. Wykazać, że liczność próby losowej musi wynosić przynajmniej 245, jeśli chcemy, by na poziomie istotności 0.0 moc testu przekraczała 0.8, gdy prawdziwa wartość parametru θ różni się od przyjętej w hipotezie zerowej wartości θ 0 o 0.0. 4.3 Na podstawie próby losowej o liczności n z rozkładu normalnego o nieznanej wartości średniej θ i znanym odchyleniu standardowym 0.05, należy przetestować hipotezę H 0 : θ = θ 0 przy alternatywie H : θ < θ 0. Wykazać, że przy liczności próby n = 0 moc testu na poziomie istotności 0.05 jest równa 0.599, gdy prawdziwa wartość parametru θ różni się od przyjętej w hipotezie zerowej wartości θ 0 o 0.03. 4.4 Niech X,..., X n będzie próbą niezależnych obserwacji z rozkładu N (µ, σ 2 ) ze znaną wariancją. Wyznaczyć funkcję mocy testu do weryfikacji hipotezy H 0 : µ µ 0 przeciwko H : µ > µ 0 na poziomie istotności α = 0.05. 4.5 Dla 6 próbek pewnej odmiany oleju utwardzonego zmierzono punkt topnienia otrzymując wartość średnią równą 94.32. Załóżmy, że punkt topnienia jest zmienna losową o rozkładzie normalnym z odchyleniem standardowym równym.2. (a) Przetestować hipotezę H 0 : µ = 95 przeciwko H : µ 95 na poziomie istotności α = 0.0. (b) Przy α = 0.0 jaka jest wartość β(94) - prawdopodobieństwo popełnienia błędu drugiego rodzaju, kiedy µ = 94? (c) Jaka liczność próby losowej wystarcza, aby zapewnić β(94) = 0. przy α = 0.0? 4.6 Spośród 400 próbek zmutowanej odmiany zboża poddanej badaniom, u 79 stwierdzono obecność cech recesywnych. Według prawa Mendla cechy recesywne powinna wykazywać czwarta część pierwotnej odmiany zboża. Badacz wysunął hipotezę, że nowa odmiana różni się istotnie od pierwotnej odmiany. Przetestuj tę hipotezę na poziomie istotności α = 0.05. 4.7 Firma lotnicza opracowała projekt stworzenia klubu stałego klienta, spodziewając się, że 5% spośród podróżnych przystąpi do tego klubu. Spośród losowej próby 500 osób 40 wyraziło zamiar przystąpienia do klubu. (a) Na poziomie istotności 0.0 przetestować hipotezę, że przewidywania firmy są słuszne przeciwko hipotezie alternatywnej, że nie są słuszne. (b) Jakie jest prawdopodobieństwo β tego, że przy użyciu testu z punktu (a) stwierdzimy poprawność przewidywań firmy, kiedy faktycznie do klubu stałego klienta kwalifikuje się tylko 0% osób? (c) Jaka liczność próby losowej wystarcza, aby zapewnić α = 0.0 i β = 0.0? 4.8 Żąda się, aby grubość soczewek okularów pewnego typu była równa 3.2 mm. Dla 50 losowo wybranych par okularów zmierzono grubość użytych soczewek, otrzymując wartość średnią równą 3.05 mm oraz próbkowe odchylenie standardowe równe 0.34 mm. (a) Czy otrzymane liczby wyraźnie sugerują, że faktyczna średnia grubość soczewek okularów tego typu jest inna od spodziewanej? Przyjąć poziom istotności α = 0.05. (b) Przypuśćmy, że przed zebraniem danych badacz posiada wiedzę na temat prawdziwego odchylenia standardowego grubości soczewek, które jest równe około 0.3. Czy można powiedzieć, że liczność próby równa 50 jest niepotrzebnie zawyżona, jeśli chcemy, aby prawdopodobieństwo błędu drugiego rodzaju wynosiło 0.05, gdy µ = 3? 4.9 Niech X,..., X n będzie próbą losową z rozkładu Poissona P(λ). (a) Znaleźć postać statystyki testowej i obszaru krytycznego dla testowania hipotezy H 0 : λ = λ 0 przeciwko H : λ λ 0.
(b) Załóżmy, że liczba zgłoszeń w ciągu tygodnia do pewnego statystyka z prośbą o konsultację ma rozkład Poissona. Jeśli w ciągu 36 tygodni zanotowano 60 zgłoszeń, czy na tej podstawie możemy stwierdzić, że faktyczna średnia liczba zgłoszeń przekracza wartość 4? Przyjąć poziom istotności 0.02. 4.0 Niech X,..., X n będzie próbą losową z rozkładu wykładniczego Exp(λ). Można pokazać, że 2λ X i ma rozkład χ 2 2n. Znaleźć postać statystyki testowej i obszaru krytycznego dla testowania hipotezy H 0 : µ = µ 0 przeciwko H : µ µ 0. 4. Pobrano dwie losowe próby ziaren dwóch gatunków fasoli i zmierzono ich długość. Dla 450 ziaren pierwszego gatunku otrzymano średnią długość równą 2.3 mm oraz odchylenie standardowe.8 mm, zaś dla 500 ziaren drugiego gatunku otrzymano średnią długość równą.9 mm oraz odchylenie standardowe 2. mm.na poziomie istotności 0.05 zweryfikować hipotezę o równej średniej długości ziaren obu badanych gatunków. 4.2 455 spośród 700 absolwentów techników i 57 spośród 320 absolwentów liceów nie zdało egzaminu wstępnego z matematyki na pewną uczelnię wyższą. Czy na podstawie tych wyników można stwierdzić, że absolwenci techników są słabiej przygotowani do egzaminu z matematyki niż absolwenci liceów? Przyjąć poziom istotności 0.0. 4.3 Ocenia się, że w pewnym województwie korzystało bezprawnie z ulgi podatkowej 0% podatników. Istnieje obawa, że zmiana przepisów podatkowych mogła zwiększyć podany odsetek osób. Wylosowano 50 podatników i wykazano, że 2 z nich niesłusznie skorzystało z ulgi. Skonstruować odpowiedni test i ocenić zasadność istniejących obaw. 4.4 Próbkowe odchylenie standardowe koncentracji sodu we krwi obliczone dla 20 węgorzy morskich wyniosło 40.5, zaś dla 20 węgorzy słodkowodnych wyniosło ono 32.. Zakładając normalność rozkładów koncentracji sodu we krwi dla obu populacji węgorzy, przetestować na poziomie istotności 0. hipotezę o równości wariancji dla tych dwóch grup węgorzy. 4.5 Jak liczną próbkę należy pobrać z produkowanej partii towaru, aby moc testu weryfikującego hipotezę, że wadliwość produkcji wynosi 0.07, wobec alternatywy, że wynosi ona 0., była równa 0.95? Zakładamy, że poziom istotności rozważanego testu wynosi 0.05. Prześledzić, jak zmienia się liczność próbki wraz ze zmianą alternatywy, założonej mocy testu i przyjętego poziomu istotności. Znaleźć wykres mocy testu. Kwantyle rozkładu standardowego normalnego: z 0.2 = 0.84, z 0.95 =.65, z 0.975 =.96, z 0.98 = 2.05, z 0.99 = 2.33, z 0.995 = 2.58
Statystyka matematyczna - Seria 5 5. Niech X,..., X n będzie prostą próbą losową pochodzącą z rozkładu o dystrybuancie F i niech F n (x) = (X i x) dla x R będzie dystrybuantą empiryczną opartą o tę próbę. n (a) Jaki rozkład ma zmienna losowa F n (x) dla ustalonego x R? Wyznaczyć EF n (x) i V ar(f n (x)). (b) Czy dla ustalonego x R F n (x) jest zgodnym estymatorem F (x)? (c) Napisać wzór na asymptotyczny przedział ufności dla F (x) skonstruowany na podstawie dystrybuanty empirycznej. 5.2 Załóżmy, że Y i = β 0 +β x i +ε i dla i =,..., n, gdzie ε i są niezależnymi zmiennymi losowymi o rozkładzie N (0, σ 2 ) oraz β 0, β, x i R. Niech b 0 = ˆβ 0 i b = ˆβ będą estymatorami parametrów β 0 i β wyznaczonymi metodą najmniejszych kwadratów. Pokazać, że: (a) n e i = 0, gdzie e i = Y i Ŷi, Ŷi = b 0 + b x i. (b) Ȳ = Ŷ (c) n x i e i = 0 oraz n (Ŷi Ȳ )(e i ē) = 0 (d) Cov(Ȳ, b ) = 0 (e) Eb 0 = β 0, Eb = β ( ) (f) V ar(b 0 ) = σ 2 n + P ( x)2 (xi x), V ar(b 2 ) = σ 2 P (xi x) 2 (g) jeśli Ŷ (x) = b 0+b x, to Ŷ (x) ma rozkład normalny o wartości oczekiwanej β 0+β x i wariancji σ 2 ( n + (h) (b 0, b ) są estymatorami największej wiarogodności parametrów (β 0, β ). 5.3 Załóżmy, że Y i = βx i + ε i dla i =,..., n, gdzie ε i są niezależnymi zmiennymi losowymi o rozkładzie N (0, σ 2 ) oraz β, x i R. (a) Metodą najmniejszych kwadratów wyznaczyć estymator parametru β. (b) Wykazać, że w tym modelu S 2 = n e 2 i jest nieobciążonym estymatorem parametru σ2. P (x x)2 (xi x) ). 2 5.4 Załóżmy, że Y i = β 0 + β x i, +... + β p x i,p + ε i dla i =,..., n, gdzie ε i są niezależnymi zmiennymi losowymi o rozkładzie N (0, σ 2 ) oraz β j, x i,j R dla i =,..., n i j = 0,..., p (przyjmujemy, że x i,0 = ). Niech wektor b = (b 0,..., b p ) T będzie estymatorem wektora parametrów β = (β 0,..., β p ) T wyznaczonym metodą najmniejszych kwadratów, tzn. b = (X T X) X T Y, gdzie X = [x i,j ] i n,0 j p, Y = (Y,..., Y n ) T. Pokazać, że: (a) Eb = β, Σ b = σ 2 (X T X) (b) Ŷ = HY, gdzie H jest macierzą rzutu, tzn. jest symetryczna i idempotentna. (c) tr(h) = p (Wskazówka: tr(ab) = tr(ba) dla macierzy A : m m 2 i B : m 2 m ) (d) jeśli e = Y Ŷ, to macierz kowariancji wektora e jest równa σ2 (I n H), gdzie I n to macierz jednostkowa n n. (e) S 2 = n p et e jest nieobciążonym estymatorem parametru σ 2. Wskazówka: skorzystać z faktu, że jeśli A jest macierzą n n, zaś Y jest wektorem losowym n-wymiarowym o wartości oczekiwanej m R n i macierzy kowariancji σ 2 I n R n n, to E(Y T AY ) = σ 2 tr(a) + m T Am.