Ryszard Zieliński PRZEDZIAŁ UFNOŚCI DLA FRAKCJI. To takie proste, więc dlaczego tak źle tego uczymy?



Podobne dokumenty
PRZEDZIAŁ UFNOŚCI DLA FRAKCJI. Ryszard Zieliński. XXXVIII Konferencja Zastosowań Matematyki Zakopane Kościelisko 8-15 września 2009

STATYSTYKA MATEMATYCZNA WYKŁAD października 2009

1.1 Wstęp Literatura... 1

STATYSTYKA MATEMATYCZNA

Inżynierskie zastosowania statystyki Czyli co i jak andrzej.rusiecki.staff.iiar.pwr.wroc.pl s.

Wykład 10 ( ). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

Spis treści 3 SPIS TREŚCI

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO

wolne wolne wolne wolne

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Wykład Ćwiczenia Laboratorium Projekt Seminarium Liczba godzin zajęć

166 Wstęp do statystyki matematycznej

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak

Wykład Ćwiczenia Laboratorium Projekt Seminarium Liczba godzin zajęć zorganizowanych w Uczelni

PRZEWODNIK PO PRZEDMIOCIE

Wykład Ćwiczenia Laboratorium Projekt Seminarium 30

12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Wykład z analizy danych: powtórzenie zagadnień z rachunku prawdopodobieństwa

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

KARTA KURSU. Kod Punktacja ECTS* 1

Opis przedmiotu: Probabilistyka I

dr Jerzy Pusz, st. wykładowca, Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej B. Ogólna charakterystyka przedmiotu

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Wykład 10 Testy jednorodności rozkładów

Wykład 7 Testowanie zgodności z rozkładem normalnym

Testowanie hipotez dla frakcji. Wrocław, 29 marca 2017

STATYSTYKA

Testowanie hipotez dla proporcji. Wrocław, 13 kwietnia 2015

Z Wikipedii, wolnej encyklopedii.

Wykład 9 Testy rangowe w problemie dwóch prób

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak

Statystyka matematyczna i ekonometria

studia stacjonarne w/ćw zajęcia zorganizowane: 30/15 3,0 praca własna studenta: 55 Godziny kontaktowe z nauczycielem akademickim: udział w wykładach

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Wykład 5 Problem dwóch prób - testowanie hipotez dla równości średnich

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

Opis przedmiotu. Karta przedmiotu - Probabilistyka I Katalog ECTS Politechniki Warszawskiej

Prawdopodobieństwo i statystyka

Testowanie hipotez statystycznych.

KARTA KURSU. (do zastosowania w roku akademickim 2015/16) Kod Punktacja ECTS* 3. Dr hab. Tadeusz Sozański

Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne)

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

ZALICZENIA. W celu uzyskania zaliczenia należy wybrać jeden z trzech poniższych wariantów I, II lub III

Rozkłady statystyk z próby

Testowanie hipotez statystycznych.

Weryfikacja hipotez statystycznych

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2012/2013

STATYSTYKA Statistics. Inżynieria Środowiska. II stopień ogólnoakademicki

Sylabus do programu kształcenia obowiązującego od roku akademickiego 2014/15

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

KARTA PRZEDMIOTU. 12. Przynależność do grupy przedmiotów: Prawdopodobieństwo i statystyka

Testy dla dwóch prób w rodzinie rozkładów normalnych

Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Statystyka matematyczna dla leśników

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

PRZYKŁAD ZASTOSOWANIA DOKŁADNEGO NIEPARAMETRYCZNEGO PRZEDZIAŁU UFNOŚCI DLA VaR. Wojciech Zieliński

Testowanie hipotez statystycznych

Własności statystyczne regresji liniowej. Wykład 4

przedmiot podstawowy obowiązkowy polski drugi

Na podstawie dokonanych obserwacji:

Kierunek i poziom studiów: Biologia, poziom drugi Sylabus modułu: Metody statystyczne w naukach przyrodniczych

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

WSTĘP. Tematy: Regresja liniowa: model regresji liniowej, estymacja nieznanych parametrów. Wykład:30godz., ćwiczenia:15godz., laboratorium:30godz.

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

KARTA PRZEDMIOTU. Forma prowadzenia zajęć. Odniesienie do efektów dla kierunku studiów K1A_W02

Testowanie hipotez statystycznych.

KARTA MODUŁU KSZTAŁCENIA

WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

W1. Wprowadzenie. Statystyka opisowa

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Opis programu studiów

STATYSTYKA MATEMATYCZNA

Matematyka stosowana w geomatyce Nazwa modułu w języku angielskim Applied Mathematics in Geomatics Obowiązuje od roku akademickiego 2012/2013

Transkrypt:

Ryszard Zieliński PRZEDZIAŁ UFNOŚCI DLA FRAKCJI To takie proste, więc dlaczego tak źle tego uczymy? Seminarium IMPAN 23.X.2008 1

Problem. Zmienna losowa X ma rozkład Bernoulliego z prawdopodobieństwem sukcesu θ, jeżeli P θ {X=1}=θ=1 P θ {X=0}, 0<θ<1 X 1,X 2,...,X n próbazrozkładu(1) S n = n j=1 X jjestminimalnąizupełnąstatystyką dostateczną Interesuje nas przedziałowa estymacja parametru θ, októrymwiemytylkoto,że leżygdzieśwprzedziale(0, 1) : model statystyczny z przestrzenią parametrówθ (0,1). 2

Definicja. Losowy przedział ( ) θ(s n ),θ(s n ) nazywamy przedziałem ufności dla parametru θ na poziomie ufności γ, jeżeli P θ {θ(s n ) θ θ(s n )} γ dlakażdegoθ (0,1) Fisz(1967)wrozdz.13.8(s.509) Lehmann(1968)wrozdz.III.5(s.104-rodzinazbiorów ufności) Bartoszewicz(1996) w rozdz. V.9(s. 296- rodzina zbiorów ufności) Niemiro(1999)wrozdz.6(s.151) Trybuła(2001) w rozdz. III.13(s. 179) Magiera(2007)wrozdz.3(s.83) 3

Inna definicja(formalnie poprawna): P θ {θ(s n ) θ θ(s n )}=γ dlakażdegoθ (0,1) Gajek(1996) rozdz. 4.5(s. 82). Ale(kilka wierszy niżej): Uniwersalny przedział ufności z nierówności Czebyszewa P ( Xn ε<θ< X n +ε ) 1 σ2 nε 2 Krzyśko(2004) rozdz. 2.6(s. 131, Def. 2.11) Plucińska(2000) rozdz. 5.9(s. 268, Def. 5.62)[ale gdy X jest zmienną losową typu skokowego, nowa Def. 5.65 z nierównością ] Fisz(1967), Magiera(2007) i Trybuła(2001) w komentarzu do definicji z dodają dla zmiennych losowych ciągłych piszemy = Silvey(1978) dwa pojęcia: p.ufn. na poziomie γ, wtedy = oraz p.ufn. na poziomie ufności co najmniej γ, wtedy 4

W niektórych podręcznikach przedziały ufności są wprowadzane w sposób opisowy, bez jawnego formułowania definicji, ale za to z obszerniejszą interpretacją i przykładowymi konstrukcjami(cramér(1958) w rozdz. XI.34, Zubrzycki(1966) w rozdz. VIII.50, Klonecki(1999) w rozdz. 10, Koronacki(2004) w rozdz. 3.3). Alezdarzasięitak: 5

Cytuję: Zadaniem estymacji przedziałowej jest skonstruowanie na podstawie próby losowej przedziału, o którym można z dużą dozą przekonania powiedzieć, iż zawiera prawdziwą wartość szacowanego parametru... Jeżeli próba nie została jeszcze zaobserwowana, jest to przedział o losowych końcach... estymator przedziałowy jest wyznaczony przez dwie zmienne losowe, w przeciwieństwie do estymatora punktowego, który jest pojedynczą zmienną losową... Otrzymane na postawie zaobserwowanej próby wartości estymatorów przedziałowych będziemy nazywali przedziałami ufności. Zaobserwowawszypróbęlosową X 1,X 2,...,X n,czylimając realizacjętejpróby x 1,x 2,...,x n,możemyobliczyćrealizację średniej w próbie, x i podać przedział ufności dla µ na poziomie ufności 1 α (3.22) [ x z 1 α/2 σ n, x+z 1 α/2 σ n ] 6

Nadal cytuję: Ścisłe znaczenie sformułowania zadana doza przekonania, które w statystyce zastępuje się pojęciem zadanego poziomu ufności, zostanie wyjaśnione w dalszym ciągu tego podrozdziału.... Wprowadzenie pojęcia poziomu ufności 1 α, niejako w miejsce prawdopodobieństwa 1 α,jestpotrzebneiniejestmnożeniem bytów ponad potrzebę. O prawdopodobieństwie można mówić tylko wtedy, gdy mamy do czynienia ze zmiennymi losowymi. Gdy mówimy o realizacjach zmiennych losowych, mówienie o prawdopodobieństwie traci sens. Przedział(3.22) nie jest już przedziałem losowym, jest zaś zwykłym przedziałem na osi liczbowej i albo zawiera nieznaną liczbową wartość średnią µ, albo nie. Jak zatem rozumieć pojęcie poziomu ufności? ( Aby odpowiedzieć na to pytanie, wróćmy do równości σ P X z 1 α/2 n µ X+z σ 1 α/2 n )=1 α, która opisuje prawdopodobieństwo zajścia dobrze określonego zdarzenia losowego. Odwołajmy się do częstościowej interpretacji prawdopodobieństwa, która powiada, że gdybyśmy dysponowali nie jedną a 1 milionem średnich próbkowych X, to oczekiwalibyśmy zajścia zdarzenia µ [ x z 1 α/2 σ n, x+z 1 α/2 σ n ] zczęstością(1 α)10 6 /10 6 =(1 α).itakwłaśnienależyrozumieć pojęcie poziomu ufności: dla około 100(1 α)% prób losowych obliczony przedział ufności zawiera szacowany parametr. 7

Definicje formalnie niepoprawne. Przestrzeń statystyczna z rodziną rozkładów P lub {P θ,θ Θ} Koronacki(2004, s.212): Jak zobaczyliśmy we wszystkich wcześniejszych przypadkach, naszym celem jest znalezienie przy dowolnym ustalonym poziomie ufności 1 α takich dwóch funkcjih 1 ( )ih 2 ( )próbylosowej,abybyłaspełniona równość P(h 1 (X 1,X 2,...,X n ) θ h 2 (X 1,X 2,...,X n )) =1 α, gdzie θ jest parametrem, dla którego konstruujemy przedział ufności. Dla formalnej poprawności wystarczy zamiast P napisaćp θ idopisaćkwantyfikator dlakażdegoθ. 8

Posługiwanie się symbolem P w statystyce, bez wyraźnegowskazaniaoktórep Pchodzi,brakkwantyfikatora(czy chodzi o jakieś jedno, szczególne P, czyokażdep P)uważamzaformalnąniepoprawność. Taka sama niedokładność jest u Fisza(1967, s. 509),Kali(2002,s.52)iPlucińskiej(2000,s.268). 9

Przedział ufności. Przedziały ufności wymyślił Jerzy Spława-Neyman. Neyman(1934) pisze, że rozwiązanie problemu estymacji, o którym mówił, consists in determining certain intervals, which I propose to call the confidence intervals. Konstrukcja: Cramér(1958), Zubrzycki(1966) Cytuję ogólną, przejrzystą i świetnie nadającą się do dydaktyki nawet na elementarnym poziomie konstrukcję przedziału ufności podaną przez Zubrzyckiego(1966, s. 306); w poniższym cytowaniu używam oryginalnych oznaczeń Zubrzyckiego, więc poszczegolne symbole mogą oznaczać coś innego niż w podstawowym tekście tej prezentacji: 10

Konstrukcja przedziałów ufności... jest bardzo ogólna i przy pewnych założeniach co do ciągłości rozkładów da się powtórzyć dla dowolnego parametru. Można ją też stosować w przypadku kilku parametrów jednocześnie i budować dla nich obszary ufności. Niech bowiemx będzie wielowymiarową przestrzenią euklidesową punktów x=(x 1,...,x n )reprezentującychwynikiobserwacji. Niech dalej Ω będzie przestrzenią wartości parametru θ(liczbowego lub wektorowego) wyznaczającego w X rozkład o gęstości f θ (x).ustalmy αzprzedziału 0<α<1idlakażdego θ Ω wybierzmyzbiórs θ X,takiże S θ f θ (x)dx=α. Rozważmyterazwprzestrzeni X Ωzbiór Dtychwszystkich punktów(x,θ),dlaktórychjednocześnieθ Ωix S θ.wówczas (porównajrysunekz)dlaustalonegoθ Ωzbiór{(x,θ):x S θ } jestprzekrojemzbioru Drównoległymdoosi x.zbiór Dma tę własność, że niezależnie od tego, czy parametr θ ma ustaloną wartość, czy też uważamy go za zmienną losową o jakimś rozkładzie prawdopodobieństwa, losowy punkt(x, θ) będzie należał do D z prawdopodobieństwem α. A teraz zapiszmy przynależność punktu(x,θ)dodinaczej,biorącpoduwagęprzekrojezbiorud równoległe do osi θ. 0znaczmy T x ={θ:(x,θ) D}. Wówczas trzy zapisy θ Ω, x S θ, (x,θ) D, x X, θ T x określają na trzy sposoby przynależność punktu (x, θ) do zbioru D.Wobectego T x sąposzukiwanymiprzeznasprzedziałamiufności o poziomie ufności α, mającymi tę własność, że niezależnie od tego, czy θ jest ustalone, czy losowe, z ustalonym prawdopodobieństwemαlosowyprzedziałt x,odpowiadającyobserwacjix, zawiera wartość parametru θ, określającą rozkład, według którego losowano x. 11

. x.. D S θ. T x. Rys. Z. Ogólna konstrukcja przedziału ufności. θ 12

Rachunki dla frakcji(p.ufn. jednostronny): Rozkład dwumianowy P θ {S n k} = k j=0 ( n ) θ j (1 θ) n j, k = 0,1,..., n, j nie jest ciągły, więc go uciąglamy P θ {S n x} = B(n x, x + 1;1 θ), x [ 1, n] 1.. 0.5 0 1 2 3 4 5 13

Dla ustalonej liczby γ (0, 1) definiujemy funkcję (0,1) θ q γ (θ) [0,n): P θ {S n <q γ (θ)}=γ (!!!) Jejodwrotność:[0,n) x q 1 γ (x) (0,1): Więc q γ (θ)=x P θ {S n <x}=γ B(n x+1,x;1 θ)=γ B(x,n x+1;θ)=1 γ θ=b 1 (x,n x+1;1 γ) q 1 γ (x)=b 1 (x,n x+1;1 γ) Funkcjaθ q γ (θ)jestrosnąca,więc P θ {S n <q γ (θ)}=p θ {q 1 γ (S n )<θ} Zatem,jeżeli0<S n n,to ( ) B 1 (S n,n S n +1;1 γ),1 jest przedziałem ufności dla θ na poziomie ufności γ;jeżelis n =0,toprzedziałemufnościnapoziomie ufności γdlakażdegoγ (0,1)jestprzedział (0,1),bo α B 1 (x,n x+1;α) 0,gdyx 0. 14

Powtarzająctorozumowanie,razdlafunkcjiq γ(θ) takiej, że P θ {S n <q γ(θ)}= 1+γ 2 idrugirazdlafunkcjiq γ(θ)takiej,że P θ {S n >q γ(θ)}= 1+γ 2 otrzymamy dwustronny przedział ufności dla θ na poziomie ufności γ w postaci ( B 1 ( S n, n S n +1; 1 γ 2 ( ), B 1 S n +1, n S n ; 1 + γ ) ) 2 Por. Bartoszewicz(1996), Przykład V.9.3(s. 301) 15

Przedział Neymana spełnia wymagania definicji: P θ {θ(s n ) θ θ(s n )} γ dla kadego θ (0,1) 1. 0.95. n = 20, γ = 0.9 0.90............. 0.1 0.2 0.3 0.4 0.5. 1. 0.95 n = 100, γ = 0.9 0.90............. 0.1 0.2 0.3 0.4 0.5 16

Komentarze: 1. Przez randomizację można uzyskać dokładnie zadany poziom ufności(szczegóły np. Bartoszewicz) 2. Optymalność p.ufn.(lehmann, Bartoszewicz) 17

Przedział Neymana ( B 1 ( S n, n S n +1; 1 γ 2 ( ), B 1 S n +1, n S n ; 1 + γ ) ) 2 Kłopoty numeryczne dwudziestego wieku: Clopper i Pearson(1934)- nomogram Tablice np w Zieliński i Zieliński(1990)- interpolacja Trudna teoria? przedziały asymptotyczne Walda 18

ASYMPTOTYCZNE PRZEDZIAŁY UFNOŚCI UnormowanastatystykaS n maasymptotycznierozkładnormalny:dlakażdegoθ (0,1)orazdlakażdegox (, ) P θ { } ˆθ n θ x θ(1 θ)/n Φ(x), n ˆθ n =S n /n Φ(x) wartość dystrybuanty rozkładu normalnego N(0,1)wpunkciex Interpretacja: dla dużych n zmienna losowa (ˆθ n θ)/ θ(1 θ)/nma wprzybliżeniu rozkład normalnyn(0,1) dużych -??? wprzybliżeniu -??? 19

DWIE SZKOŁY PIERWSZA(Cramér1957s.492,Fisz1967s.512, Niemiro 1999 s. 155, Trybuła 2001 s. 184, Krzyśko 2004 s. 162): (ˆθ n θ)/ θ(1 θ)/nmaasymptotycznyrozkładnormalnyn(0,1)więcdla dużychn idlakażdego θ (0,1),mamy wprzybliżeniu, { θ(1 θ) P θ ˆθ n z γ n } θ(1 θ) θ ˆθ n +z γ =γ n z γ =Φ 1 (1+γ)/2 Przedział ufności: ( n n+z 2 γ n [ n+z 2 γ ˆθ n + z2 γ 2n z γ [ ˆθ n + z2 γ 2n +z γ ˆθ n (1 ˆθ n ) n + ˆθ n (1 ˆθ n ) n ( zγ + 2n ) 2 ] ( zγ 2n, ) 2 ]) 20

DWIE SZKOŁY(c.d.) DRUGA(Gajek 1996 s. 85, Grzegorzewski 2003 s. 113,Kala2002s.58,Koronacki2004s.211,Krzyśko 2004 s. 163): (ˆθ n θ)/ ˆθn (1 ˆθ n )/nmaasymptotycznyrozkład normalnyn(0,1)iwtedy,dlakażdegoθ (0,1), mamy w przybliżeniu P θ ˆθ n z γ ˆθ n (1 ˆθ n ) n θ ˆθ n +z γ ˆθ n (1 ˆθ n ) n =γ Przedział ufności: ˆθ n (1 ˆθ n ) ˆθn z γ, ˆθn +z γ n ˆθ n (1 ˆθ n ) n 21

Przybliżone przedziały ufności WERSJA(ˆθ n θ)/ θ(1 θ)/n N(0,1) Fisz(1967, s. 512) ograniczymy się do dużych prób Niemiro: W praktyce, jeśli n jest odpowiednio duże, oczekujemy,żenierównośćp θ {θ(s n ) θ θ(s n )} γ dlakażdegoθ (0,1)jestwprzybliżeniuspełniona Trybuła(2001, s. 184) n musi być dostatecznie wielkie(n 50) Krzyśko(2004, s. 162) przybliżony przedział ufności WERSJA(ˆθ n θ)/ ˆθn (1 ˆθ n )/n N(0,1) Gajek(1996, s.85), Grzegorzewski(2003, s. 113): n 100 Kala(2002, s. 58), Krzyśko(2004, s. 163): przedział przybliżony Koronacki(2004, s. 211) P ˆθ n (1 ˆθ n ) (ˆθn zγ n ˆθ n (1 ˆθ n ) θ ˆθ n +z γ n ) γ bez sprecyzowania, co oznacza podwójny wężyk. 22

Prawdopodobieństwopokryciadlaγ=0.9,n=100 (ˆθ n θ)/ 1 θ(1 θ)/n N(0,1). 0.95 0.90.............. 0.85 0.80 0.1 0.2 0.3 0.4 0.5 (ˆθ n θ)/ ˆθn (1 ˆθ n )/n N(0,1) 1. 0.90............. 0.80 0.70 0.60 0.50 0.1 0.2 0.3 0.4 0.5 23

Dla przedziałów ˆθ n (1 ˆθ n ) ˆθn z γ, ˆθn +z γ n ˆθ n (1 ˆθ n ) n prawdopodobieństwo pokrycia maleje do zera, gdy θ 0orazgdyθ 1. Zalecenie:stosować,gdynθ 5orazn(1 θ) 5 (Inny problem statystyczny!) Oryginalna propozycja: Koronacki(2004, s. 149): stosować ten przedział wtedy, gdynˆθ n 5orazn(1 ˆθ n ) 5;wpozostałychprzypadkach stosować przedział Neymana 24

. 0.95 1. 0.90................ 0.85 0.80 0.1 0.2 0.3 0.4 0.5 Koronacki-Mielniczuk(n = 100, γ = 0.9) TO TEŻ NIE JEST PRZEDZIAŁ UFNOŚCI! 25

n=100,γ=0.95 Dokładne Asympt 1 Asympt2 5 (0.0164,0.1128) (0.0073,0.0927) (0.0245,0.0992) 10 (0.0491,0.1762) (0.0412,0.1588) (0.0607,0.1604) 15 (0.0865,0.2353) (0.0800,0.2200) (0.1005,0.2179) 20 (0.1267,0.2918) (0.1216,0.2784) (0.1425,0.2733) 30 (0.2124,0.3998) (0.2102,0.3898) (0.2307,0.3798) 40 (0.3033,0.5028) (0.3040,0.4960) (0.3231,0.4822) 50 (0.3983,0.6017) (0.4020,0.5980) (0.4188,0.5812) 26

Baran(2007): ( θ zγ θ(1 θ) n+b(s n ), θ+zγ θ(1 θ) n+b(s n ) ), gdzie oraz (a,b)(s n )= θ= S n+a(s n ) n+b(s n ) (1/2,5/4), gdys n =0, (1,7/4), gdys n =1, (3/4,7/4), gdys n =n 1, (3/4,5/4), gdys n =n, (3/4, 3/2), poza tym. 1.. 0.95 n=100 γ=0.9 0.90................ 0.85 0.80 0.1 0.2 0.3 0.4 0.5 27

Podwójny wężyk pojawia się w kontekście ˆθ n (1 ˆθ n ) ˆθ n (1 ˆθ n ) P (ˆθn zγ θ ˆθ n +z γ n n ) γ Koronacki(2004. s. 211), Niemiro(1999, s.155) Może raczej tak: P θ ( ˆθ n z γ ˆθ n (1 ˆθ n ) n ˆθ n (1 ˆθ n ) θ ˆθ n +z γ n ) =γ±coś lub, jeżeli zbyt duży poziom ufności nam nie przeszkadza, P θ ( ˆθ n z γ ˆθ n (1 ˆθ n ) n ˆθ n (1 ˆθ n ) θ ˆθ n +z γ n ) =γ coś gdzie coś =... ALEPOCOWTEDYTENWĘŻYK? 28

DUALIZM testy- przedziały ufności Przedział ufności na poziomie ufności w przybliżeniu równym... Test na poziomie istotności w przybliżeniu równym...??? 29

PRZEDZIAŁ UFNOŚCI NEYMANA Teza: Techniczne przeszkody numeryczne w stosowaniu tego przedziału, które jeszcze przed pół wiekiem stymulowały poszukiwanie prostszych rozwiązań, są już dawno pokonane i dzisiaj każdy inżynier, biolog, ekonomista i in., który potrafi stosować test Studenta i test chi-kwadrat, z pewnością sobie poradzi z poprawną estymacją przedziałową frakcji 30

Kilka prostych sposobów. Podaneniżejwzorysąaktualnedla1 S n n 1. JeżeliS n =0,todolnagranicaprzedziałuufności jestrówna0,ajeżelis n =ntogórnagranicajest równa 1; pozostałą granicę obliczamy według podanych niżej reguł. 31

EXCEL Wpisać ndokomórkia1 S n dokomórkia2 γdokomórkia3 i obliczyć dolną i górną granicę: ROZK LAD.BETA.ODW((1 A3)/2; A2; A1 A2+1) ROZK LAD.BETA.ODW((1+A3)/2; A2+1; A1 A2) 32

Pakiet STATISTICA Funkcje VBeta((1 γ)/2,s n,n S n +1) VBeta((1+γ)/2,S n +1,n S n ) 33

Pakiet MATHEMATICA Funkcje Quantile[BetaDistribution[S n,n S n +1,(1 γ)/2] Quantile[BetaDistribution[S n +1,n S n,(1+γ)/2] 34

KWANTYLE ROZKŁADU F B 1 (α,β;t)= αf(2α,2β,t) β+αf(2α,2β,t) F(2α,2β,t) kwantylrzędutrozkładufz(2α,2β) stopniami swobody. - Zieliński/Zieliński(1990): dolna granica dwustronnego p.ufn. na poziomie ufn 1 α: S n +(n S n +1)F S n ( 2(n S n +1),2S n, α 2 ) oraz górna ( (S n +1)F 2(S n +1),2(n S n ), α ) ( 2 n S n +(S n +1)F 2(S n +1),2(n S n ), α ) 2 35

Jak widać, żadne kombinowanie z przybliżonymi i asymtotycznymi wzorami, które w dodatku nie dają poprawnych przedziałów ufności, nie jest potrzebne. Bye-bye, so long, farewell to the Wald interval(casella 2001). 36

Prace cytowane. J.Baran(2007): Nowy przedział ufności dla prawdopodobieństwa sukcesu rozkładu dwumianowego. XXXIII Konferencja Statystyka Matematyczna Wisła 2007, 3-7 grudnia 2007 J.Bartoszewicz(1996): Wykłady ze statystyki matematycznej. PWN. C.R.Blyth i H.A.Still(1983): Binomial Confidence Intervals. JASA 78, 381, pp, 108-116 L.D.Brown, T.T.Cai and A.DasGupta(2001): Interval Estimation for a Binomial Proportion. Statistical Science 16, 2, 101-133 G.Casella(1986): Refining binomial confidence intervals. The Canadian Journal of Statistics 14, 2, pp. 113-129 G.Casella(2001): Statistical Science 16, 2, p. 120 C.J.Clopper i E.S.Pearson(1934): The Use of Confidence or Fiducial Limits Illustrated in the Case of the Binomial. Biometrika, Vol.26,No.4,pp.404-413 H.Cramér(1958): Metody matematyczne w statystyce. PWN. M.Fisz(1967): Rachunek prawdopodobieństwa i statystyka matematyczna. PWN. L.Gajek i M.Kałuszka(1996): Wnioskowanie statystyczne. Modele i metody. WNT. P.Grzegorzewski, K.Bobecka, A.Dembińska, J.Pusz(2003): Rachunek prawdopodobieństwa i statystyka. Wydanie czwarte, poprawione. Wyższa Szkoła Informatyki Stosowanej i Zarządzania, Warszawa R.Kala(2002): Statystyka dla przyrodników. Wydawnictwo Akademii Rolniczej im. Augusta Cieszkowskiego w Poznaniu. 37

W.Klonecki(1999): Statystyka dla inżynierów, PWN J.Koronacki i J.Mielniczuk(2004): Statystyka dla studentów kierunków technicznych i przyrodniczych. Wydanie drugie. WNT M.Krzyśko(2004): Statystyka matematyczna. Uniwersytet im. Adama Mickiewicza w Poznaniu E.L.Lehmann(1968): Testowanie hipotez statystycznych. PWN. R.Magiera(2007): Modele i metody statystyki matematycznej. Wydanie drugie rozszerzone. Część II, Wnioskowanie statystyczne. Oficyna Wydawnicza GiS, s.c., Wrocław J.Neyman(1934): On the Two Different Aspects of the Representative Method: The Method of Stratified Sampling and the Method of Purposive Selecion. Journal of the Royal Statistical Society, Vol. 97, No. 4, pp. 558-625. W.Niemiro(1999): Rachunek prawdopodobieństwa i statystyka matematyczna. Szkoła Nauk Ścisłych. A.Plucińska i E.Pluciński(2000): Rachunek prawdopodobieństwa. Statystyka matematyczna. Procesy stochastyczne. WNT S.D.Silvey(1978): Wnioskowanie statystyczne. PWN. S.Trybuła(2001): Statystyka matematyczna z elementami teorii decyzji. Oficyna Wydawnicza Politechniki Wrocławskiej. R.Zieliński i W.Zieliński(1990): Tablice statystyczne. PWN. S.Zubrzycki(1966): Wykłady z rachunku prawdopodobieństwa i statystyki matematycznej. PWN. 38