7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej



Podobne dokumenty
Estymacja parametrów w modelu normalnym

Środowisko R Założenie normalności metody nieparametryczne Wykład R4; Weryfikacja założenia o normalności rozkładu populacji

Wykład 15. Metody nieparametryczne. Elementy analizy wielowymiarowej Weryfikacja założenia o normalności rozkładu populacji

Wykład 10 ( ). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego

Testy dla dwóch prób w rodzinie rozkładów normalnych

Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych

Statystyka opisowa- cd.

Testowanie hipotez statystycznych.

6. Zmienne losowe typu ciagłego ( ) Pole trapezu krzywoliniowego

Testowanie hipotez statystycznych.

Przedmiot statystyki. Graficzne przedstawienie danych.

2.Wstępna analiza danych c.d.- wykład z Populacja i próba

Testowanie hipotez statystycznych.

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Rozkłady statystyk z próby

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Metoda momentów i kwantyli próbkowych. Wrocław, 7 listopada 2014

Wykład 3. Rozkład normalny

Kolokwium ze statystyki matematycznej

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych

Wykład 7 Testowanie zgodności z rozkładem normalnym

Środowisko R wprowadzenie c.d. Wykład R2; Struktury danych w R c.d.

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

1 Estymacja przedziałowa

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Wykłady 14 i 15. Zmienne losowe typu ciągłego

Analizy wariancji ANOVA (analysis of variance)

Wykład 9 Wnioskowanie o średnich

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Weryfikacja hipotez statystycznych

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Estymacja punktowa i przedziałowa

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Analiza zależności cech ilościowych regresja liniowa (Wykład 13)

Testowanie hipotez statystycznych.

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Ważne rozkłady i twierdzenia c.d.

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Testy nieparametryczne

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

WYKŁAD 8 ANALIZA REGRESJI

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

Wykład 3 Hipotezy statystyczne

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

Wykład 10: Elementy statystyki

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Wykład 9 Testy rangowe w problemie dwóch prób

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Centralne twierdzenie graniczne

Wykład 5 Estymatory nieobciążone z jednostajnie minimalną war

Wykład 13. Zmienne losowe typu ciągłego

1 Podstawy rachunku prawdopodobieństwa

PODSTAWY BIOSTATYSTYKI ĆWICZENIA

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Statystyka matematyczna dla leśników

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

STATYSTYKA MATEMATYCZNA

Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego

Zmienne losowe ciągłe i ich rozkłady

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

Wykład 5 Problem dwóch prób - testowanie hipotez dla równości średnich

Wykład 10 Testy jednorodności rozkładów

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Rozkłady zmiennych losowych

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Estymacja parametrów rozkładu cechy

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Przedmiot statystyki. Graficzne przedstawienie danych. Wykład Przedmiot statystyki

4,5. Dyskretne zmienne losowe (17.03; 31.03)

Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Rozdział 8. Regresja. Definiowanie modelu

Dyskretne zmienne losowe

Analiza regresji - weryfikacja założeń

STATYSTYKA MATEMATYCZNA WYKŁAD października 2009

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Zmienne losowe ciągłe i ich rozkłady

Przedziały ufności. Poziom istotności = α (zwykle 0.05) Poziom ufności = 1 α Przedział ufności dla parametru μ = taki przedział [a,b], dla którego

Wykład 3 Momenty zmiennych losowych.

Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.

Statystyka matematyczna i ekonometria

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Spis treści 3 SPIS TREŚCI

Wykład 3 Momenty zmiennych losowych.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd

WYKŁAD 5 TEORIA ESTYMACJI II

POLITECHNIKA OPOLSKA

Transkrypt:

7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej Definicja 1 n-elementowa losowa próba prosta nazywamy ciag n niezależnych zmiennych losowych o jednakowych rozkładach prawdopodobieństwa. Uwaga. Niektórzy autorzy utożsamiają losową próbę prostą X 1, X 2,..., X n z jej realizacją x 1, x 2,..., x n ; x 1 jest realizacją X 1 itd. 1

Rozkład cen mieszkań Można oczekiwać, że rozkład cen domów w dzielnicach które nie pretendują do miana prestiżowych czy luksusowych będzie zbliżony do normalnego N(µ, σ); (cena mieszkania jest wtedy sumą niezależnych składników). Rozważmy dane dotyczące cen mieszkań w dzielnicy A (dzielnica A jest zdecydowanie mniej prestiżowa niż B) można założyć, że rozkład cen mieszkań w A będzie zbliżony do normalnego. 2

Estymacja średniej µ Zakładamy, że nasze dane x 1,..., x n są realizacją losowej próby prostej X 1,..., X n ; sensownym oszacowaniem µ jest X; Dla konkretnej realizacji x 1,..., x n losowej próby losowej X 1,..., X n realizacja X jest równa x 3

Własności zmiennej losowej X Zakładamy, że X 1,..., X n są próbą prostą X i N(µ, σ), i = 1, 2,..., n. X = 1 n (X 1,..., X n ) jest zmienną losową. Funkcje próby prostej nazywane są statystykami. Z własności wartości oczekiwanej, omawianych na jednym z poprzednich wykładów: E( X) = µ, a więc X jest nieobciążonym estymatorem µ. 4

Estymacja σ i σ 2 Wariancja z próby S 2 określona przez 1 n 1 jest sensownym oszacowaniem σ 2. Uwaga: można pokazać, że: n (X i X) 2 i=1 E X = µ, E(S 2 ) = σ 2 średnia z próby X jest nieobciążonym (niestronniczym) estymatorem µ wariancja z próby S 2 jest nieobciążonym estymatorem σ 2 (por. Koronacki, Mielniczuk, Rozdz. 2.4) 1 odchylenie standardowe z próby S = n 1 (Xi X) 2 jest sensownym estymatorem σ, ale nie ma (z reguły) własności nieobciążoności. 5

Dane dotyczace cen mieszkań w A- histogram+krzywa normalna 0.000 0.002 0.004 0.006 50 100 150 200 250 300 350 Rysunek 1: Histogram probabilistyczny+ wykres gęstości N( x, s). 6

Weryfikacja założenia o normalności rozkładu populacji Dane są obserwacje x 1, x 2,..., x n. Czy można założyć, że x 1, x 2,..., x n jest realizacją próby prostej z rozkładu normalnego N(µ, σ) dla pewnych µ i σ? Metody weryfikacji założenia o normalności: Sporządzenie histogramu i porówanie jego kształtu z krzywą dzwonową (wykresem funkcji φ.) Sporządzenie wykresu ramkowego i odpowiednia jego interpretacja Sporządzenie wykresu kwantylowego i odpowiednia jego interpretacja. Testy zgodości: Shapiro Wilka i inne. Trzy z powyższych metod wykorzystują pojecie kwantyla. 7

Kwantyle rozkładu normalnego przykład Załóżmy, że Y, wzrost dorosłych mężczyzn w kraju A ma rozkład normalny N(176, 8). Chcemy znaleźć liczbę d taką, że P (Y < d) = 0,99. Znajomość liczby d może być przydatna dla inżynierów sporządzających projekty budowlane itd. Zadanie ogólniejsze: dla liczby p (0, 1) kwantylem rzędu p rozkładu normalnego N(µ, σ) nazywamy liczbę q p spełniającą równość: P (X < q p ) = qp φ µ,σ (x)dx = p, gdzie X N(µ, σ). Dla innych rozkładów ciągłych kwantyle definiujemy analogicznie. 8

Obliczanie kwantyli rozkładu normalnego Korzystając z tablic rozkładu N(0, 1) : ponieważ P (X < q p ) = P (Z < q p µ σ ) = Φ( q p µ ), σ gdzie X N(µ, σ), Z N(0, 1), więc zadanie sprowadza się do znalezienia przybliżonej wartości c 0 rozwiązania równania Φ(c) = p oraz do wyznaczenia przybliżonej wartości q p jako rozwiązania równania: x µ σ = c 0. Korzystając z R-a: należy użyć poleca qnorm z odpowiednimi parametrami; w Excelu: należy skorzystać z polecenia ROZKŁAD.NORMALNY.ODW. 9

Kwantyle rozkładu normalnego przykład (c.d.) Y, wzrost dorosłych mężczyzn w kraju A ma rozkład normalny N(176, 8); Równanie Φ(c) = 0,99 ma przybliżone rozwiązanie c 0 = 2,33 (bo Φ(2,32) 0,9898 i Φ(2,32) 0,9901); przybliżona wartość szukanego kwantyla jest rozwiązaniem równania: x 176 8 = 2,33 stąd przybliżona wartość kwantyla rzędu 0,99 rozkładu N(176, 8) wynosi 176 + 2,33 8 = 194,64. Korzystając z R-a: > qnorm(0.99,176,8) [1] 194.6108 10

Wykres ramkowy i założenie normalności rozkładu Można pokazać że poza przedziałem: [q 0,25 1,5 (q 0,75 q 0,25 ), q 0,75 + 1,5 (q 0,75 q 0,25 )] leży średnio 7 obserwacji na 1000, (jeśli zakładamy, że obserwacje te stanowią realizację próby prostej z rozkładu N(µ, σ) (por. książkę J. Koronackiego i J. Mielniczuka, par. 1.4.2). Zbyt duża liczba obserwacji odstających wskazuje na to, że założenie normalności rozkładu nie jest spełnione. Jeśli obserwacje pochodzą z rozkładu normalnego, to odpowiadający im wykres ramkowy będzie w przybliżeniu symetryczny względem odcinka "wewnątrz ramki" (który odpowiada medianie). 11

150 160 170 180 190 200 p1 p2 Rysunek 2: Wykresy pudełkowe dla dwóch prób o liczności n = 1000, wygenerowanych przy pomocy generatora liczb pseudolosowych o rozkładzie N(176, 8) 12

Wykres kwantylowy Uporządkowany ciąg obserwacji x 1,..., x n oznaczamy przez x 1:n,..., x n:n. Niech x 1:n = x 1:n m s,..., x n:n = x n:n m, s gdzie m onacza średnią z próby, a s odchylenie standardowe z próby. Jeśli założymy, że x 1,..., x n pochodzą z rozkładu normalnego, to x 1:n, x 2:n,..., powinny być sensownymi przybliżeniami kwantyli q 1/n, q 2/n,... (rzędu 1 n, rzędu 2 n itd.) rozkładu N(0, 1); stąd punkty (x 1:n, q 1/n ), (x 2:n, q 2/n ) powinny się układać wokół (pewnej) prostej ; analogicznie punkty: (x 1:n, q 1/n ), (x 2:n, q 2/n ),... (1) również powinny się układać wokół prostej.wykres przedstawiający punkty (1) jest nazywany wykresem kwantylowym. 13

W praktyce zamiast kwantyli rzędu i/n wyznacza się np. kwantyle rzędu i/(n + 1); w ten sposób unikamy problemu z n-tym punktem! Wykres kwantylowy odbiegający od prostej : założenie o normalności rozkładu, z którego pochodzą x 1,..., x n, należy odrzucić. Szczegóły dotyczące sprządzania rozkładu kwantylowego można znaleźć w [KM01,par.3.4.2]. 14

Ceny mieszkań w A 2 1 0 1 2 100 150 200 250 300 350 Rysunek 3: Wykres kwantylowy dla danych dotyczących cen mieszkań w A 15

Test Shapiro Wilka i inne testy zgodności Zgodność z rozkładem normalnym można weryfikować za pomocą testu Shapiro-Wilka; w wyniku obliczeń, wykonanych dla otrzymanych obserwacji, otrzymujemy tzw. p-wartość (ang. p-value); jeśli p-wartość jest mała, powiedzmy mniejsza niż 0,05, wtedy są podstawy do odrzucenia hipotezy o normalności rozkładu, z którego pochodzą obserwacje. 16

Test Shapiro Wilka: przykład obliczeń W zmiennej y zapisane są wartości cen mieszkań w dzielnicy A. > y [1] 65 80 139 180 355 158 240 205 265 305 200 155 209 310 [20] 200 184 130 260 250 195 > shapiro.test(y) Shapiro-Wilk normality test data: y W = 0.9849, p-value = 0.962 p-wartość jest równa 0,962 nie ma podstaw do odrzucenia hipotezy o zgodności z rozkładem normalnym. Więcej informacji o teście Shapiro-Wilka; [KM01,par. 3.4.2] 17