STATYSTYKA MATEMATYCZNA WYKŁAD 10 14 grudnia 2009
PARAMETRY POŁOŻENIA Przypomnienie: Model statystyczny pomiaru: wynik pomiaru X = µ + ε 1. ε jest zmienną losową 2. E(ε) = 0 pomiar nieobciążony, pomiar bez błędu systematycznego 3. błąd symetryczny względem zera (jednakowo prawdopodobne błędy dodatnie i ujemne) 4. duże (bezwzględnie) błędy mniej prawdopodobne niż małe 5. krzywa Gaussa 6. ε N(0, σ), X N(µ, σ), σ dokładność pomiaru, znana lub nieznana = MODEL BŁĘDU NORMALNEGO
PARAMETRY POŁOŻENIA Model statystyczny pomiaru: wynik pomiaru X = µ + ε 1. ε jest zmienną losową 2. E(ε) = 0 pomiar nieobciążony, pomiar bez błędu systematycznego 3. błąd symetryczny względem zera (jednakowo prawdopodobne błędy dodatnie i ujemne) 4. duże (bezwzględnie) błędy mniej prawdopodobne niż małe 5. krzywa Gaussa 6. ε N(0, σ), X N(µ, σ), σ dokładność pomiaru, znana lub nieznana. ε F, F F, F znane lub nie = MODEL Z PARAMETREM POŁOŻENIA F - rozkłady o ciągłych i ściśle rosnących dystrybuantach
PARAMETRY POŁOŻENIA MODEL BŁĘDU NORMALNEGO: estymatorem parametru µ jest średnia X obserwacji X 1, X 2,..., X n
PARAMETRY POŁOŻENIA MODEL BŁĘDU NORMALNEGO: estymatorem parametru µ jest średnia X obserwacji X 1, X 2,..., X n MODEL Z PARAMETREM POŁOŻENIA: średnia X?
PARAMETRY POŁOŻENIA. MODEL BŁĘDU NORMALNEGO MODEL BŁĘDU NORMALNEGO: estymatorem parametru µ jest średnia X obserwacji X 1, X 2,..., X n 1.6 1.4 1.2 1.0 n=16 0.8 0.6 0.4 n=4 0.2 n=1. -1 0 1 2 3 4 5 µ = 2.
PARAMETRY POŁOŻENIA. MODEL BŁĘDU NORMALNEGO JAK TO SIĘ DZIEJE? Funkcja charakterystyczna rozkładu normalnego N(µ, σ): φ X (t) = exp {iµt 1 } 2 σ2 t 2 Funkcja charakterystyczna średniej X = n j=1 X j /n: { φ X (t) = exp iµt 1 ( } σ 2 )t 2 2 n
PARAMETRY POŁOŻENIA. BŁĄD SYMETRYCZNY Przykład: rozkład Cauchy ego rozkład o trochę tłuściejszych ogonach: 0.4 0.3 0.2 0.1.. -5-4 -3-2 -1 0 1 2 3 4 5
TŁUSTE OGONY - rozmiar finansowej odpowiedzialności ubezpieczyciela w związku z wypadkami losowymi jego klientów przy ubezpieczeniu OC, AC oraz od wypadków przy pracy
TŁUSTE OGONY - rozmiar finansowej odpowiedzialności ubezpieczyciela w związku z wypadkami losowymi jego klientów przy ubezpieczeniu OC, AC oraz od wypadków przy pracy - wielkość plików przesyłanych w internecie
TŁUSTE OGONY - rozmiar finansowej odpowiedzialności ubezpieczyciela w związku z wypadkami losowymi jego klientów przy ubezpieczeniu OC, AC oraz od wypadków przy pracy - wielkość plików przesyłanych w internecie - pojemność złóż ropy naftowej
TŁUSTE OGONY - rozmiar finansowej odpowiedzialności ubezpieczyciela w związku z wypadkami losowymi jego klientów przy ubezpieczeniu OC, AC oraz od wypadków przy pracy - wielkość plików przesyłanych w internecie - pojemność złóż ropy naftowej - rozmiary osiedli ludzkich
TŁUSTE OGONY - rozmiar finansowej odpowiedzialności ubezpieczyciela w związku z wypadkami losowymi jego klientów przy ubezpieczeniu OC, AC oraz od wypadków przy pracy - wielkość plików przesyłanych w internecie - pojemność złóż ropy naftowej - rozmiary osiedli ludzkich - tzw. zwroty w operacjach giełdowych
PARAMETRY POŁOŻENIA. BŁĄD SYMETRYCZNY Funkcja charakterystyczna rozkładu Cauchy go φ Y (t) = exp{iµt λt }
PARAMETRY POŁOŻENIA. BŁĄD SYMETRYCZNY Funkcja charakterystyczna rozkładu Cauchy go φ Y (t) = exp{iµt λt } Funkcja charakterystyczna średniej Y = n j=1 Y j /n:
PARAMETRY POŁOŻENIA. BŁĄD SYMETRYCZNY Funkcja charakterystyczna rozkładu Cauchy go φ Y (t) = exp{iµt λt } Funkcja charakterystyczna średniej Y = n j=1 Y j /n: φ Y (t) = exp{iµt λt }
PARAMETRY POŁOŻENIA. BŁĄD SYMETRYCZNY ROZKŁAD CAUCHY EGO ROZKŁAD ŚREDNIEJ ARYTMETYCZNEJ Z PRÓBY JEST TAKI SAM JAK ROZKŁAD POJEDYNCZEJ OBSERWACJI
PARAMETRY POŁOŻENIA. BŁĄD SYMETRYCZNY Ogólniej: SYMETRYCZNE ROZKŁADY α-stabilne exp{iµt λt α }
PARAMETRY POŁOŻENIA. BŁĄD SYMETRYCZNY Ogólniej: SYMETRYCZNE ROZKŁADY α-stabilne exp{iµt λt α } ( exp{iµ t n λ t n α }) n = exp{iµt n 1/α 1 λt α } α=2 rozkład normalny; α=1 rozkład Cauchy ego
PARAMETRY POŁOŻENIA. BŁĄD SYMETRYCZNY 1.0 0.8 0.6 0.4 0.2 rozk lad pojedynczej obserwacji rozk lad średniej -1 0 1 2 3 4 5..
PARAMETRY POŁOŻENIA Teraz średnia z próby się nie ma sensu, bo 1. rozkład może nie mieć wartości oczekiwanej, czyli średnia może nie mieć wartości oczekiwanej 2. rozkład średniej z próby może być gorszy do wnioskowania o parametrze położenia niż rozkład pojedynczej obserwacji
PARAMETRY POŁOŻENIA Zamiast średniej - MEDIANA Model: Obserwacja X = µ + ε ε F, F F, F - rozkład znany lub nieznany Med F (ε) = F 1 ( 1 2 ) = 0. Wtedy Med µx = µ
PARAMETRY POŁOŻENIA MEDIANA Z PRÓBY Próba: X 1, X 2,..., X n Statystyki pozycyjne: X 1:n, X 2:n,..., X n:n X 1:n X 2:n... X n:n
PARAMETRY POŁOŻENIA MEDIANA Z PRÓBY Próba: X 1, X 2,..., X n Statystyki pozycyjne: X 1:n, X 2:n,..., X n:n X 1:n X 2:n... X n:n Mediana M n z próby X 1, X 2,..., X n M n = 1 2 ( X n 2 :n + X n 2 +1:n ), jeżeli n jest parzyste, X n+1 2 :n, jeżeli n jest nieparzyste
PARAMETRY POŁOŻENIA Mediana M n z próby jako estymator mediany populacji
PARAMETRY POŁOŻENIA Mediana M n z próby jako estymator mediany populacji Obciążenie?
PARAMETRY POŁOŻENIA Mediana M n z próby jako estymator mediany populacji Obciążenie? Rozrzut?
DEFINICJA (przypadek ciągłego rozkładu F T estymatora T ) T jest estymatorem MEDIANOWO NIEOBCIĄŻONYM (nieobciążonym w sensie mediany) parametru θ, jeżeli P θ {T θ} = P θ {T θ} = 0.5, dla każdego θ
DEFINICJA (przypadek ciągłego rozkładu F T estymatora T ) T jest estymatorem MEDIANOWO NIEOBCIĄŻONYM (nieobciążonym w sensie mediany) parametru θ, jeżeli P θ {T θ} = P θ {T θ} = 0.5, dla każdego θ ROZSTĘP MIĘDZYKWARTYLOWY ( 3 FT 4) 1 jest miarą rozrzutu estymatora T ( 1 FT 4) 1
Narzędzie pomocnicze: rozkład beta OZNACZENIA: Gęstość: Γ(p + q) Γ(p)Γ(q) x p 1 (1 x) q 1, x (0, 1), p, q > 0 Dystrybuanta w punkcie x: B(x; p, q) Kwantyl rzędu q: B 1 (q; p, q) Brak jawnych wzorów. Łatwo dostępne jako funkcje standardowe w pakietach statystycznych R: beta.r
PARAMETRY POŁOŻENIA Mediana M n = X n+1 2 :n z próby X 1, X 2,..., X n, n nieparzyste Rozkład F błędu znany Rozkład mediany M n. Gęstość: Dystrybuanta: Γ(n + 1) ( [ (n 1)/2 Γ 2 ( n+1 2 ) F µ (x) 1 F µ (x)]) fµ (x) P µ {M n x} = B ( F (x µ); n + 1 2, n + 1 ) 2
PARAMETRY POŁOŻENIA Mediana M n = X n+1 2 :n z próby X 1, X 2,..., X n, n nieparzyste Rozkład F błędu znany OBCIĄŻENIE Mediana M n z próby jest medianowo-nieobciążonym estymatorem mediany populacji: P µ {M n µ} = B ( F (0); n + 1 2, n + 1 ) ( 1 = B 2 2 ; n + 1 2, n + 1 ) = 1 2 2
PARAMETRY POŁOŻENIA Mediana M n = X n+1 2 :n z próby X 1, X 2,..., X n, n nieparzyste Rozkład F błędu znany ROZSTĘP MIĘDZYKWARTYLOWY n : Kwantyl x q(m n) rzędu q rozkładu mediany M n to taka liczba, że czyli czyli czyli Więc ( B P µ{m n x q(m n)} = q F (x n + 1 q(m n) µ); 2 ( F (x q(m n) µ) = B 1 q; n + 1 2 ( x q(m n) = µ + F 1 B 1 (q; n + 1 2, n + 1 ) = q 2, n + 1 ) 2, n + 1 ) 2 n = F 1 ( B 1 ( 3 4 ; n + 1 2, n + 1 2 ) ) F 1 ( B 1 ( 1 4 ; n + 1 2, n + 1 2 ) ) )