Wykład VIII: Przestrzenie statystyczne. Estymatory 1 grudnia 2014
Wprowadzenie Przykład: pomiar z błędem Współczynnik korelacji r(x, Z) = 0, 986
Wprowadzenie Przykład: pomiar z błędem Współczynnik korelacji r(x, Y ) = 0, 013
Wprowadzenie Przykład: pomiar z błędem Jak wyliczaliśmy współczynnik korelacji w obu przykładach? W obu przykładach dane maja postać chmury punktów (wektorów dwuwymiarowych). Na podstawie danych, za pomocą odpowiedniego wzoru, wyliczamy liczbę, która stanowi pewną charakterystykę zbioru danych. Nasuwają się następujące naturalne pytania: Skąd wiemy, że to, co policzyliśmy, odpowiada naszym oczekiwaniom? Jaka jest jakość uzyskanego wyniku? A raczej: Jak mierzyć jakość naszego wyniku? Jak znajdować odpowiednie wzory?
Przykład Wprowadzenie Wprowadzenie Przykład: pomiar z błędem n-krotny pomiar jednym przyrządem X k = m + ε k, gdzie m - rzeczywista wartość pomiaru, a ε k - błąd k-tego pomiaru. Co przyjąć za wynik pomiaru? X n = X 1 + X 2 +... + X n. n Dlaczego?
Pomiar z błędem Wprowadzenie Wprowadzenie Przykład: pomiar z błędem X n = m + (ε 1 + ε 2 +... + ε n )/n, przy czym prawo wielkich liczb stwierdza, że ε 1 + ε 2 +... + ε n n Eε 1, gdzie Eε 1 = 0 dla przyrządu poprawnie skalibrowanego ( brak błędu systematycznego ). Powyżej korzystamy z modelu błędu pomiaru w postaci ciągu niezależnych zmiennych losowych o jednakowym rozkładzie, z wartością oczekiwaną zero. Inne spojrzenie: E X n = m, jeśli brak jest błędu systematycznego (obciążenia).
Przestrzeń statystyczna i statystyka Przestrzeń statystyczna i statystyka Próba prosta z populacji Definicja estymatora Definicja przestrzeni statystycznej Przestrzenią statystyczną (lub modelem statystycznym ) nazywamy trójkę (X, B, {P θ } θ Θ ), gdzie dla każdego θ Θ trójka (X, B, P θ ) jest przestrzenią probabilistyczną. Zbiór X nazywamy przestrzenią próbek lub zbiorem prób losowych. Definicja statystyki Statystyką nazywamy funkcję Y : (X, B) R 1 (lub R d ), która dla każdego θ Θ jest zmienną losową na (X, B, P θ ).
Próba prosta z populacji Przestrzeń statystyczna i statystyka Próba prosta z populacji Definicja estymatora Przykład: losowanie ze zwracaniem Jesteśmy zainteresowani rozkładem danej cechy U w populacji Ω. Losujemy (ze zwracaniem) N osobników i badamy wartości cechy. Jak określić odpowiednią przestrzeń statystyczną (X, B, {P θ } θ Θ )? Niech X 0 = {U(ω) : ω Ω} R d. Kładziemy: X = (X 0 ) N ; B =? (jak wynika z kontekstu); Θ = P(X 0 ) (zbiór wszystkich rozkładów prawdopodobieństwa na X 0 ); P θ = θ θ... θ. }{{} N razy
Próba prosta z populacji Przestrzeń statystyczna i statystyka Próba prosta z populacji Definicja estymatora Definicja modelu dla próby prostej Jeżeli: X = (X 0 ) N dla pewnego X 0 R d, B =? (jak wynika z kontekstu), Θ P(X 0 ) (podzbiór(!) zbioru wszystkich rozkładów prawdopodobieństwa na X 0 ), P θ = θ θ... θ, }{{} N razy to przestrzeń statystyczną (X, B, {P θ } θ Θ ) nazywamy modelem dla próby prostej (długości N), a wektor losowy współrzędnych (X 1, X 2,..., X N ) T : (X, B, P θ ) X nazywamy próbą prostą z rozkładu (lub populacji) θ. Uwaga: X 1, X 2,..., X N są niezależne i mają jednakowy rozkład θ!
Estymatory Wprowadzenie Przestrzeń statystyczna i statystyka Próba prosta z populacji Definicja estymatora Definicja estymatora parametru Niech (X, B, {P θ } θ Θ ) będzie przestrzenią statystyczną. Parametrem nazywamy odwzorowanie g : {P θ } θ Θ R 1. Estymatorem parametru g nazwiemy odwzorowanie ĝ : X R 1. (Można mówić także o parametrach i estymatorach wektorowych). Oczywiście to tylko ogólny schemat. Pojęcie estymator staje sie interesujące dopiero po uzupełnieniu o dodatkowe własności.
Przykłady estymatorów nieobciążonych Definicja estymatora nieobciążonego Niech (X, B, {P θ } θ Θ ) będzie modelem dla próby prostej długości N. Niech g : {P θ } θ Θ R 1 będzie parametrem. Funkcja ĝ : X R 1 jest nieobciążonym estymatorem parametru g jeśli dla każdego θ Θ istnieje E θ ĝ(x 1, X 2,..., X N ) i E θ ĝ(x 1, X 2,..., X N ) = g(p θ ).
Przykłady estymatorów nieobciążonych Przykłady estymatorów nieobciążonych Estymator wartości oczekiwanej Θ = {θ P(R 1 ) : E Y < +, jeśli Y θ}, g(θ) = EY, jeśli Y θ. ĝ(x 1, X 2,..., X N ) = X N = X 1 + X 2 +... + X N. N
Przykłady estymatorów nieobciążonych Przykłady estymatorów nieobciążonych - cd. Nieobciążony estymator wariancji Θ = {θ P(R 1 ) : EY 2 < +, jeśli Y θ}, g(θ) = Var (Y ) = EY 2 (EY ) 2, jeśli Y θ. ĝ(x 1, X 2,..., X N ) = S 2 N = = (X 1 X N ) 2 + (X 2 X N ) 2 +... + (X N X N ) 2. N 1
Przykłady estymatorów nieobciążonych Przykłady estymatorów nieobciążonych - cd. Nieobciążony estymator wariancji przy znanej wartości oczekiwanej Θ = {θ P(R 1 ) : EY 2 < +, EY = µ, jeśli Y θ}, g(θ) = Var (Y ) = EY 2 µ 2, jeśli Y θ. ĝ(x 1, X 2,..., X N ) = (X 1 µ) 2 + (X 2 µ) 2 +... + (X N µ) 2. N
Przykłady estymatorów nieobciążonych Przykłady estymatorów nieobciążonych - cd. Estymator prawdopodobieństwa sukcesu w schemacie Bernoullego Θ = {rozkład dwupunktowy, P(Y = 1) = θ = 1 P(Y = 0)}, g(θ) = θ. ĝ(x 1, X 2,..., X N ) = X 1 + X 2 +... + X N. N
Przykłady estymatorów nieobciążonych Przykłady estymatorów nieobciążonych - cd. Estymatory dla P(X = 0) z rozkładu Poissona Θ = {rozkład Poissona z parametrem θ R + }, g(θ) = e θ (= P θ (Y = 0)). ĝ 1 (X 1, X 2,..., X N ) = 1I {X 1 =0} + 1I {X2 =0} +... + 1I {XN =0}. N ĝ 2 (X 1, X 2,..., X N ) = ( 1 1 N ) X1 +X 2 +...+X N.