Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Podobne dokumenty
R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych

Próbkowanie. Wykład 4 Próbkowanie i rozkłady próbkowe. Populacja a próba. Błędy w póbkowaniu, cd, Przykład 1 (Ochotnicy)

W ykład 4: Z m ienna losow a. Ciągła zmienna losowa. Zmienna losowa dyskretna. Dystrybuanta zmiennej X:

Testowanie hipotez statystycznych.

Estymacja parametrów rozkładu cechy

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Wykład 9 Wnioskowanie o średnich

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Centralne twierdzenie graniczne

Metody Statystyczne. Metody Statystyczne.

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Pobieranie prób i rozkład z próby

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

STATYSTYKA MATEMATYCZNA

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

1.1 Wstęp Literatura... 1

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Wykład 3 Hipotezy statystyczne

Rozkłady statystyk z próby

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Wykład 2. Standaryzacja: Przykład: wpływ stałej addytywnej: odejmujemy 20. Liniowa transformacja zmiennych. Liniowa transformacja zmiennych, cd.

Wykład 2. Transformacje (przekształcenia) danych

Testowanie hipotez statystycznych.

Metody probabilistyczne

Estymacja punktowa i przedziałowa

METODY STATYSTYCZNE W BIOLOGII

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Wykład 10. Wpływ stałej (odejmujemy 20) Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Testowanie hipotez statystycznych.

Monte Carlo, bootstrap, jacknife

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Statystyka matematyczna i ekonometria

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Statystyka matematyczna i ekonometria

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

Testowanie hipotez dla frakcji. Wrocław, 29 marca 2017

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Kolokwium ze statystyki matematycznej

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Statystyka matematyczna i ekonometria

Testowanie hipotez dla proporcji. Wrocław, 13 kwietnia 2015

Metody probabilistyczne

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Estymacja parametrów w modelu normalnym

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Zadanie Punkty Ocena

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Wnioskowanie statystyczne. Statystyka w 5

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Rozkłady prawdopodobieństwa zmiennych losowych

Prawdopodobieństwo i statystyka

Prawdopodobieństwo i rozkład normalny cd.

Rozkłady statystyk z próby. Statystyka

Analiza niepewności pomiarów

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Weryfikacja hipotez statystycznych

Jeśli powyższy opis nie jest zrozumiały należy powtórzyć zagadnienie standaryzacji zanim przejdzie się dalej!

Wykład 2. Wpływ stałej (odejmujemy 20) Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd.

Prawdopodobieństwo i statystyka r.

Oszacowanie i rozkład t

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Wykład 5 Estymatory nieobciążone z jednostajnie minimalną war

Statystyka w analizie i planowaniu eksperymentu

Ważne rozkłady i twierdzenia

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Wykład 2. Wpływ stałej (odejmujemy 20) Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd. Liniowa transformacja zmiennych, cd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyka matematyczna dla leśników

STATYSTYKA wykład 5-6

Statystyka w analizie i planowaniu eksperymentu

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Na A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)

Statystyka matematyczna

Statystyka w analizie i planowaniu eksperymentu

Rozkłady zmiennych losowych

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 1) Dariusz Gozdowski

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Zadania ze statystyki, cz.6

WYKŁAD 5 TEORIA ESTYMACJI II

Wykład 11: Dane jakościowe. Rozkład χ 2. Test zgodności chi-kwadrat

Dokładne i graniczne rozkłady statystyk z próby

Wykład 8: Testy istotności

Prawdopodobieństwo i statystyka

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Transkrypt:

Wykład 4 Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym 2. Rozkłady próbkowe 3. Centralne twierdzenie graniczne

Przybliżenie rozkładu dwumianowego rozkładem normalnym Niech Y ma rozkład B(n,p). Liczenie prawdopodobieństw jest problematyczne dla dużych n: Gdy n jest duże, to mamy dużo wartości Y. Gdy n jest duże, to symbole Newtona są trudne do wyliczenia.

Aproksymacja: Rozkład dwumianowy z parametrami n i p przybliżamy rozkładem normalnym z parametrami =np i = np(1 p). Tzn. liczymy jak dla rozkładu normalnego. Przybliżenie jest dobre, gdy np 5 i n(1-p) 5. Przybliżenie jest dość dokładne w centrum rozkładu i względnie gorsze w ogonach.

Przykład Załóżmy, że Y ma rozkład dwumianowy z n=40 i p=0.25. Wtedy = np = i = Sprawdzamy wielkość np oraz n(1-p): Obliczmy przybliżone p-stwo tego, że Y jest pomiędzy 10 i 15 (włącznie). z 1 = z 2 = P(10 Y 15) [Wynik dokładny = 0.534; dość blisko.]

Przybliżanie rozkładów dyskretnych Dość często używamy rozkładu normalnego dla opisu danych, które nie są ciągłe, bo: Wygoda Mogła zajść dyskretyzacja pomiarów Korekta na ciągłość: Liczbie całkowitej y przypisujemy p-stwo odcinka od y-0.5 do y+0.5, które liczymy z rozkładu normalnego.

Przykład (powtórzony z korektą na ciągłość) Załóżmy, że Y ma rozkład dwumianowy z n=40 i p=0.25. Obliczyć z korektą na ciągłość p-stwo, że Y jest pomiędzy 10 i 15 (włącznie). z 1 = z 2 = P(10 Y 15) [Wynik dokładny = 0.534; blisko.]

Przykład: wyniki testu. Załóżmy, że = 100 i = 16, rozkład (ocen studenckich) ma kształt dzwonu. Jakie jest p-stwo, że losowo wybrany student uzyska wynik między 120 a 140 punktów?

Rozkłady próbkowe: notacja Rozważmy populację o pewnym rozkładzie, np.: normalnym N(, ), lub dwupunktowym, np. P(Y=sukces)=p, P(Y=porażka)=1-p Parametry populacji: i, lub p. Bierzemy próbę o rozmiarze n z populacji. Wynik: y 1, y n, lub y = sumaryczna liczba sukcesów. Obliczamy estymatory y ˆp i s, lub Gdy n jest duże, estymatory te są na ogół bliskie parametrom.

Rozkłady próbkowe, cd. Jak bardzo estymatory mogą sią różnić od prawdziwych parametrów? Co się stanie, jeżeli wylosujemy inną próbę? Otrzymamy inne wartości y, s, ˆp. Interesuje nas rozkład (próbkowy) estymatorów y,s, ˆp.

Meta-eksperyment Wyobraźmy sobie, że powtarzamy eksperyment wiele razy. Interesuje nas rozkład wszystkich możliwych do uzyskania wartości, s lub ˆp. Taki rozkład będziemy nazywali rozkładem próbkowym estymatora. Zwykle próbkujemy tylko raz, ale rozkłady próbkowe można obliczyć teoretycznie. y

Rozkład próbkowy estymatora dla parametru p w rozkładzie dwupunktowym ˆp Y = liczba sukcesów w n próbach y = zaobserwowana liczba sukcesów ˆp = Y/n jest estymatorem p ˆp Zasada: rozkład sprowadza się do rozkładu Y (zob. przykłady).

Przykład: Producent ocenia, że 2% jego wyrobów jest wadliwych. Wyroby te paczkuje się po 40. Y = liczba wadliwych wyrobów w losowo wybranej paczce. Y ma rozkład... Niech ˆp = Y/40 = frakcja elementów wadliwych. ˆp P( = k/40 ) =

Rozkład ˆp wyznaczamy przy pomocy (dwumianowego) rozkładu Y! 0 40 Pr( pˆ 0) Pr( Y 0) (1)(.02) (.98) 0.45 1 39 Pr( pˆ 0.025) Pr( Y 1) (40)(.02) (.98) 0.36 2 38 Pr( pˆ 0.05) Pr( Y 2) (780)(.02) (.98) 0.14 3 37 Pr( pˆ 0.075) Pr( Y 3) (9880)(.02) (.98) 0.04 Pr( pˆ 0.1) Pr( Y 4) 0.01

Gdybyśmy otworzyli tysiące paczek, to rozkład frakcji liczby wadliwych elementów w paczce byłby dalece zgodny z rozkładem wyliczonym teoretycznie. Prawdziwa wartość p wynosi 0.02, i nie jest nawet możliwa do zaobserwowania w pojedynczym eksperymencie, ale na ogół otrzymamy wartości bliskie 0.02: ˆp P-stwo tego, że = 0.025 wynosi 36%. P-stwo tego, że estymator będzie różnić się nie więcej niż o 0.03 od prawdziwej wartości wynosi:... Zatem, jeżeli znajdziemy 3 lub więcej wyrobów wadliwych w jednej paczce mamy podstawy, żeby kwestionować twierdzenie producenta o p!

Przykład (cd., n=40 i p = 0.02.): Jakie jest p-stwo, że estymator częstości przekracza dwukrotnie (lub więcej) prawdziwą wartość?

Zależność od rozmiaru próby: Y ma rozkład B(n,p) μ Y =np Var (Y)=np(1-p) ˆp = ˆp = ˆp Var ( )=

Wnioski: Gdy n rośnie, to wariancja... i estymator... Na kolejnym rysunku p=0.3, n=10, 20, 40, 80.

Rozkład ˆp (gdy p=0.3) n P(0.25 ˆp 0.35) 10 0.5 20 0.535 40 0.612 80 0.728 500 0.987

Rozkład próbkowy dla średniej z rozkładu normalnego Dana jest próba o rozmiarze n z populacji normalnej. Obserwujemy średnią próbkową. Jak daleko od może być? Odpowiemy na to pytanie znajdując rozkład próbkowy. y y

Wyobraźmy sobie wielokrotne powtarzanie próbkowania. Za każdym razem liczymy y. Możemy o tym myśleć jak o nowym eksperymencie, w którym obserwacjami są średnie (meta-eksperyment).

Jaki będzie rozkład (histogram) tych średnich? FAKT 1 : Suma dwóch zmiennych niezależnych o rozkładzie normalnym ma rozkład normalny. FAKT 2 : Jeżeli X ma rozkład normalny to Y=aX+b, gdzie a 0, ma również rozkład normalny. ZADANIE: Oblicz rozkład. Y

Rozwiązanie:

Histogramy średnich z rozkładu standardowego normalnego Rozmiary pojedynczych prób n=1 and n=50. Liczba powtórzeń eksperymentu N=1000.

Przykład: Y ~ N(30, 6). Bierzemy 10 próbek o rozmiarze n = 9: y 29.89 32.27 31.19 30.86 28.68 s 5.74 5.01 6.06 6.25 6.31 y 29.60 30.02 31.19 29.84 30.27 s 6.83 3.81 5.13 4.82 4.90

Rozkład Y Sprawdzenie: ma wartość oczekiwaną=.. i odchylenie standardowe SD=.. Oczekujemy, że średnia próbkowa: Z p-stwem 0.95 będzie w odległości nie większej niż 1.96 SD od, tzn. pomiędzy... a... Z p-stwem 0.8 będzie w odległości nie większej niż 1.28 SD od, tzn. pomiędzy 27.4 a 32.6. 0.68 1 SD tzn. pomiędzy 28 a 32.

Jeżeli Y ma rozkład normalny to rozkład (próbkowy) jest normalny. Y Niezależnie od rozkładu Y wartość oczekiwana średniej próbkowej=, a odchylenie standardowe średniej=. Centralne Twierdzenie Graniczne: Nawet jeżeli Y nie ma rozkładu normalnego, to dla dużych n rozkład Y jest bliski normalnemu (gdy rozkład Y ma skończoną wariancję).

Szybkość zbieżności w CTG: Co to znaczy ``duże n? Jeżeli Y ma rozkład normalny to wystarczy n=. Jeżeli rozkład Y jest w przybliżeniu symetryczny i nie ma ciężkich ogonów, to n=30 jest duże.

Uwagi: Wiele metod statystycznych używa przybliżeń rozkładem normalnym. Techniki prezentowane dalej na tym kursie (np. przedziały ufności i testowanie hipotez dla ) mogą być stosowane także wtedy, gdy rozkład obserwacji nie jest normalny ale rozmiar prób jest duży i rozkład nie ma ciężkich ogonów. Założenie o niezależności poszczególnych obserwacji jest niezbędne.

Problem: Czas pracy lampy jest wykładniczy z wartością oczekiwaną 10000h. Oszacuj prawdopodobieństwo, że łączny czas pracy 20-tu lamp będzie krótszy niż 180kh.

Zadanie dwustopniowe : Niech X będzie liczbą tych dużych prób spośród 10-ciu, dla których średnie różnią się od o więcej niż /. Oblicz P(X=2).