Wykład 8. Przedziały ufości i testowaie hipotez A gdy ie zamy wariacji σ 2? Załóżmy, że X ma rozkład ormaly, ale ie zamy wartości ai m ai σ 2. Jak wtedy szacować wartość średią m? Przypomijmy, że Wtedy statystyka Ŝ 2 = 1 1 X m Ŝ ma rozkład t-tudeta o 1 stopiach swobody. Używać czy Ŝ? Określiliśmy dwie, bardzo podobe statystyki: X i X 2 i=1 = 1 X i X 2, Ŝ = i=1 1 X i X 2. 1 i=1 tatystyka X m 1 też ma rozkład t-tudeta o 1 stopiach swobody. Uwaga: Oczywiście = 1 Ŝ, więc X m Ŝ X m = 1. Kim był tudet? Praca a temat tego rozkładu została opublikowaa w czasopiśmie Biometrika w 1908 roku. Dlaczego praca podpisaa była pseudoimem? Lody ajważiejszy ośrodek statystyki a świecie. Karl Pearso 1857-1936 wprowadził p. termi odchyleie stadardowe, test χ 2 -Pearsoa itp. Ego Pearso 1895-1980 współpracował z Jerzym pławą-neymaem, był syem Karla Pearsoa. William Gosset tudet. Rozkład t-tudeta Rozkład tudeta jest a pierwszy rzut oka podoby do rozkładu ormalego, ma jedak ciężkie ogoy. Tablice: p. w iterecie tudet t-distributio. Kształt jego gęstości zależy od liczby stopi swobody. Dla = 1 ma ieskończoą wartość oczekiwaą. Gdy, to rozkład tudeta zbliża się do rozkładu ormalego tak, że dla > 30 różica pomiedzy tymi rozkładami jest iewielka. Tablice rozkładu tudeta podają zwykle tylko wartości dla 30 stopi swobody. 1
Zadaie Zajdź dwie symetrycze wartości t α i t α takie, że między imi zawiera się 0,95 masy rozkładu tudeta z 11 stopiami swobody. Rozwiązaie. Niech T k ozacza zmieą o rozkładzie studeta z k stopiami swobody. zukamy takiego t, dla którego P T 11 < t = 0, 975. Z tablic t = 2, 2010. Odpowiedź: t α = 2, 2010, t α = 2, 2010. Zadaie Wytrzymałość pewego materiału budowlaego ma rozkład ormaly Nm, σ 2. Pięcioelemetowa próba wylosowaych sztuk tego materiału dała wyiki: x = 20, 8 N/cm 2, ŝ = 2, 8N/cm 2. Na poziomie ufości 0,99 zbuduj przedział ufości dla średiej m. Rozwiązaie Nie zamy wartości parametru σ, a próba ma liczebość < 30, więc musimy użyć rozkładu t-tudeta. Wiemy, że ma rozkład tudeta o 4 stopiach swobody. X m 1 Ŝ Dla poziomu ufości 0,99 i 4 stopi swobody odczytujemy z tablic t = 4, 6041 Zatem P 4, 6041 < X m Ŝ 1 < 4, 6041 = 0, 99, co daje przedział 14, 36; 27, 24. A jeśli przedział jest zbyt szeroki? Zwiększając liczbę pomiarów w próbie, możemy zmiejszyć długość przedziału ufości. Gdy stosujemy rozkład t-tudeta powiiśmy zwracać baczą uwagę a: liczbę stopi swobody, rodzaj statystyki, jaką stosujemy: czy też Ŝ. Jeśli jest więcej iż 30 obserwacji w próbie, to korzystamy z tablic rozkładu ormalego. Przedziały ufości dla frakcji w populacji Przypuśćmy, że chcemy oszacować prawdopodobieństwo wystąpieia pewego zdarzeia. Dla przykładu rozważmy iesymetryczą moetę lub kostkę. Jakie jest prawdopodobieństwo p uzyskaia orła w jedym rzucie? zukamy tutaj prawdopodobieństwa p sukcesu w próbach Beroulliego. Moglibyśmy skorzystać z rozkładu Beroulliego, ale wymagałoby to uciążliwych rachuków. Korzystamy z przybliżeia rozkładu Beroulliego rozkładem ormalym: 2
gdy Y ma rozkład Beroulliego B, p i jest duże, wtedy Y ma w przybliżeiu rozkład ormaly Np, p1 p 2. Zmiea Y = częstość wystąpieia zdarzeia w próbach ma w przybliżeiu rozkład ormaly N p, 2 p1 p. Musimy ja uormować, odejmując średią p i dzieląc przez odchyleie stadardowe Y p p1 p ma w przybliżeiu rozkład N0, 1 dla dostateczie dużej liczby obserwacji. p1 p. tatystyka Przykład pośród stałych mieszkańców pewego miasta wylosowao próbę prostą złożoą z 400 osób i okazało się, że wśród ich jest 320 osób, które się w tym mieście urodziły. Zbuduj przedział ufości a poziomie 0,95 dla iezaego wskaźika struktury ˆp osób, mieszkajacych w tym mieście i tam urodzoych. Rozwiązaie Niech Y będzie liczbą tych osób w próbie, które urodziły się w tym mieście. Poieważ = 400 jest dostateczie duże rzędu kilkuset, więc zmiea Y p p1 p ma z całkiem dobrym przybliżeiem rozkład N0, 1. zukamy takiego z α, aby P z α < Z < z α = 0, 95. Z tablic rozkładu ormalego odczytujemy z α = 1, 96. Rozwiązaie - c.d. Zatem P 1, 96 < 320 400 p p1 p 400 < 1, 96 = 0, 95, skąd, po przekształceiach długich, ale iezbyt trudych, bo to rówaie kwadratowe, otrzymujemy szukay przedział ufości 0, 754; 0, 836. Wzory przybliżoe a graice przedziału ufości Gdy jest duże, to przedział ufości dla p ma graice przybliżoe! Y ± z α Y 1 Y Rozkład χ 2 Niech X 1, X 2,..., X będą iezależymi zmieymi losowymi o jedakowym rozkładzie ormalym N0, 1. Wtedy zmiea U = X 2 1 + X 2 2 +... + X 2 ma rozkład χ 2 czyt.: chi-kwadrat o stopiach swobody. 3.
Rozkład te jest stabelaryzoway. Gdy, to zmiea U ma rozkład asymptotyczie ormaly Nk, 2k 2. Tabele zawierają zwykle dae dla liczby stopi swobody od 1 do 30. Rozkład wariacji z próby Niech X 1, X 2,..., X będzie ciągiem iezależych zmieych losowych o jedakowym rozkładzie Nm, σ 2. Zwykle ie zamy ai m, ai σ, dlatego zamiast σ 2 użyjemy statystyki 2 = 1 i=1 X i X 2. Wówczas zmiea losowa ma rozkład χ 2 1 o 1 stopiach swobody. 2 σ 2 Zadaie abstrakcyje Zbudować przedział ufości dla iezaej wariacji rozkładu ormalego a poziomie ufości 1 α. Budowa przedziału ufości dla wariacji Załóżmy, że pobierzemy próbę liczebości, iech X 1, X 2,..., X będą wyikami tej próby. Wiemy, że zmiea losowa 2 σ 2 ma rozkład χ 2 1 o 1 stopiach swobody. Dla zadaego poziomu ufości szukamy w tablicach takich dwóch liczb u 1 oraz u 2, aby P u 1 2 σ 2 u 2 = 1 α. Takich par liczb jest ieskończeie wiele, zwykle wybieramy je tak, aby P 0 < U < u 1 = α 2 oraz P u 2 < U < = α 2. Mamy więc skąd P P u 1 2 σ 2 u 2 2 u 2 = 1 α, σ 2 2 = 1 α. u 1 zukaym przedziałem ufości jest więc przedział 2 u 2 ; 2. u 1 Kokrety przykład Z populacji o rozkładzie ormalym pobrao próbę prostą i otrzymao wyiki: 3,2 3,7 4,1 3,5 3,0. Na poziomie ufości 0,9 zbuduj przedział ufości dla iezaej wariacji tego rozkładu. Rozwiązaie Obliczamy: 4
X = 3,2+3,7+4,1+3,5+3,0 5 = 17, 5/5 = 3, 5 2 = 1 5 3, 2 3, 52 + 3, 7 3, 5 2 + 4, 1 3, 5 2 + + 3, 5 3, 5 2 + 3 3, 5 2 = 0, 74/5 = 0, 148. Z tablic rozkładu χ 2 4 z czterema stopiami swobody odczytujemy, że P 0, 711 < χ2 4 < 9, 488 = 0, 9. tąd przedziałem ufości dla σ 2 jest 5 0, 148 9, 488 5 0, 148 σ2 0, 711 czyli 0, 28 σ 1, 02. Testowaie hipotez Idea: Chcemy odpowiedzieć a pytaie dotyczące pewej lub pewych populacji. Decyzję podejmujemy w oparciu o próbę - dyspoujemy iformacją fragmetaryczą. W rezultacie możemy popełić błąd przy podejmowaiu decyzji. Chcemy zmiimalizować prawdopodobieństwo błędu. Typowe pytaia Pytaia o wartości parametrów w rozkładzie. Dla populacji o rozkładzie Beroulliego: Czy prawdopodobieństwo sukcesu wyosi 1/2? Czy moeta jest symetrycza? Dla rozkładu ormalego: Czy średia w populacji wyosi 0? Czy średia w populacji wyosi m? Typowe pytaia Pytaia o postać rozkładu. Czy te rozkład jest rozkładem ormalym? A może jest rozkładem wykładiczym? A może to jest rozkład Beroulliego? Pytaie o iezależość Czy dae dwie cechy są iezależe? Na przykład waga i wzrost. Albo wzrost i ocey w szkole. Albo... posób formułowaia odpowiedzi Na większość z powyższych pytań są dwie możliwe odpowiedzi tak albo ie prawda albo fałsz. Pytaia dotyczą całej populacji, do której a ogół ie mamy dostępu. Nasza decyzja, którą podejmujemy w oparciu o próbę, jest zagrożoa błędem. Zamiast: Prawda mówimy: W oparciu o tę próbę ie możemy wykluczyć postawioej hipotezy. Przykład: Przeprowadzoe badaia ie potwierdzają, że badae populacje mają róży średi poziom badaej cechy. Ale ie moża wykluczyć, że ie ma różicy. 5
posób formułowaia odpowiedzi Zamiast: Nieprawda ależałoby mówić: Jest to mało prawdopodobe albo: Gdyby postawioa hipoteza była prawdziwa, to uzyskay wyik z próby byłby bardzo mało prawdopodoby. Dlatego odrzucamy tę hipotezę. Ale możemy się mylić. Przykład: Przeprowadzoe badaie potwierdza tezę, że badae populacje różią się średią wartością badaej cechy. Odrzucamy hipotezę o rówości średich. Aalogia czujik dymu Istalujemy czujiki dymu, aby ostrzegły as przed pożarem. Nie są to ideale wykrywacze pożarów. Reagują a cząstki dymu w powietrzu. Czujiki mogą być w dwu możliwych staach CICHO albo GŁOŚNO ostrzegają przed pożarem sygałem dźwiękowym. Nasz dom może być w dwu możliwych staach ie ma pożaru albo jest pożar. Decyzja Możemy podjąć dwie decyzje: zostać albo uciekać. ystem ostrzegaia może popełić dwa błędy: Jest GŁOŚNO choć ie ma pożaru a przykład przypaliliśmy grzakę. Jest CICHO choć wybuchł pożar zła lokalizacja czujika, zużyta bateria,... Decyzję uzależiamy od stau wykrywaczy dymu CICHO zostajemy, GŁOŚNO uciekamy. Błędy w podejmowaiu decyzji Na ogół ie ma pożaru i wykrywacz jest CICHO, więc ie reagujemy dobra decyzja. Czasami ie ma pożaru a wykrywacz jest GŁOŚNO, więc uciekamy zła decyzja = strata czasu błąd I-go rodzaju. Czasami jest pożar a wykrywacz jest CICHO więc zostajemy zła decyzja = iebezpieczeństwo błąd II-go rodzaju. Czasami jest pożar i wykrywacz jest GŁOŚNO więc uciekamy dobra decyzja. Notacja - hipotezy statystycze ta wyjściowy, ie ma pożaru, azywamy hipotezą zerową. Drugi możliwy sta, pożar, azywamy hipotezą alteratywą. H 0 to skrót dla hipotezy zerowej. H A to skrót dla hipotezy alteratywej. Decyzje Decyzja uciekamy odpowiada odrzuceiu H 0, tz. odrzucamy staowisko, że ie ma pożaru. Decyzja zostajemy odpowiada ieodrzuceiu H 0. Decyzję podejmujemy w oparciu o zachowaie czujika dymu, którego rolę w dalszym ciągu przejmie statystyka testowa, czyli pewa wielkość obliczoa z próby. Gdy wykrywacz jest GŁOŚNO to mówimy, że wyik testu jest istoty. Defiicja: Istoty wyik powoduje odrzuceie H 0. 6
Gdy wykrywacz jest CICHO to wyik testu jest ieistoty i ie odrzucamy H 0. Podsumowaie aalogii Hipotezy: H 0 = ie ma pożaru, H A = pożar. tatystyka testowa: ieistota=cicho, istota=głośno. Decyzja: ie odrzucamy H 0 = zostajemy, odrzucamy H 0 = uciekamy. Błąd I rodzaju: odrzucamy H 0, choć jest prawdziwa = uciekamy, choć ie ma pożaru. Błąd II rodzaju: ie odrzucamy H 0, choć prawdziwa jest H A = zostajemy, choć jest pożar. Zauważmy, że H 0 jest bardziej precyzyja iż H A : p. gdy H A jest prawdziwa, to pożar może być dowolej wielkości. Wykrywacze dymu mają pewą ustaloą czułość reagują a określoą ilość dymu w powietrzu. Jeżeli wykrywacz jest zbyt czuły, to będzie często powodował fałszywe alarmy błędy I rodzaju. Jeżeli ie jest dość czuły, to ie będzie się włączał, kiedy potrzeba błędy II rodzaju. Zwiększając czułość zmiejszamy prawdopodobieństwo błędu II rodzaju, ale zwiększamy prawdopodobieństwo błędu I rodzaju. Dobór czułości testu powiie zależeć od kosekwecji błędów! Jak opisać czułość testu? Poziom istotości to prawdopodobieństwo popełieia błędu I rodzaju. Poziom istotości powio się ustalić jeszcze przed przeprowadzeiem eksperymetu. Moc testu to dopełieie do jedości prawdopodobieństwa popełieia błędu II rodzaju. Moc testu zwykle dużo trudiej obliczyć iż poziom istotości. m Hipoteza zerowa H 0 Zwykle prosta, to zaczy taka, która jedozaczie określa dystrybuatę rozkład zmieej losowej. Często parametrycza tz. dotycząca wielkości jakiegoś parametru zmieej, a przykład średiej albo wariacji. Będziemy ją odrzucali albo ie. Aby kotrolować błąd I rodzaju ależy zać rozkład statystyki testowej przy założeiu hipotezy H 0. Hipoteza alteratywa H A W jakimś sesie przeciwa do H 0. Na ogół bardziej ogóla iż H 0 p. iezay rozmiar pożaru Odrzuceie H 0 ozacza, że wierzymy w H A. Nie odrzuceie H 0 ozacza, że ie mamy dość silych dowodów przemawiających za H A. Nie jest to to samo co udowodieie prawdziwości H 0 tego a ogół ie potrafimy zrobić za pomocą statystyki. 7
Przykład Załóżmy, że mamy próbę z populacji o rozkładzie ormalym. Niech m iezae ozacza jego średią. Chcemy przetestować hipotezę przeciw alteratywie H 0 : m = 5 H A : m 5. Jak testować taka hipotezę? Możemy skostruować przedział ufości dla m w oparciu o dae. Taki przedział ufości powiie zawierać m. Zatem jeżeli przedział ufości ie zawiera 5, to odrzucimy H 0 a korzyść H A. Jeżeli przedział ufości zawiera 5, to ozacza, że ie możemy odrzucić H 0. Poieważ jedak przedział ufości zawiera także wiele iych wartości iż 5, zatem ie mamy wystarczających podstaw, aby twierdzić, że H 0 jest prawdziwa. Testowaie hipotezy Przedział ufości a poziomie 1 α jest day wzorem gdy ie zamy σ, to korzystamy z rozkładu t-tudeta: prawdzamy, czy zawiera o liczbę 5. X t α/2 ; X + tα/2 1 1 Rówoważie, wystarczy wyzaczyć statystykę testową X m 1 i sprawdzić, czy zawiera się oa w przedziale t α/2 ; t α/2. Jeżeli tak, to statystyka jest ieistota i ie odrzucamy H 0. Jeżeli ie, to statystyka jest istota i odrzucamy H 0. Zbiór, t α/2 t α/2, azywamy obszarem krytyczym obszarem odrzuceń. Jeżeli wartość statystyki testowej zajdzie się w obszarze krytyczym, to odrzucamy H 0. Róże postacie hipotezy alteratywej W aszym przykładzie zbiorem krytyczym jest suma, t α/2 t α/2,. Postępujemy tak, poieważ H A : m 5, jest symetrycza iekierukowa. Jesteśmy zaiteresowai zarówo alteratywami dla których m < 5 jak i m > 5. Czasami rozważamy alteratywy kierukowe, takie jak H A : m > 5. W tym przypadku obszar krytyczy ma postać t α,. W przypadku alteratywy kierukowej H A : m < 5 obszar krytyczy ma postać, t α. Przykład Czy średia prędkość aut a ulicy Legickiej jest rówa 50 km/h? Decyzja o rodzaju hipotezy alteratywej kierukowa lub ie powia być podjęta zaim spojrzymy a dae liczbowe zebrae dla jej weryfikacji. Może być atomiast podjęta a podstawie iych, p. historyczych daych lub a podstawie profilu zaiteresowań, ogólych oczekiwań itp. 8
H 0 : m = 50 km/h. H A : m > 50 km/h. Dae liczbowe Dae fikcyje: przypuśćmy, że zmierzoo średią prędkość 10 samochodów i otrzymao X = 61 km/h oraz = 5, 5. Czy a poziomie istotości 0,95 te dae przeczą hipotezie H 0? A gdyby te wyiki pochodziły tylko z 5 prób, a poziom istotości wyosił 0,995? Rozwiązaie Poieważ używamy 2, bo ie zamy σ 2, więc korzystamy z rozkładu tudeta: statystyka t = X m 1 ma rozkład t-tudeta o 1 stopiach swobody. W aszym zadaiu: Przy założeiu prawdziwości hipotezy H 0 mamy m = 50, więc statystyka przyjmuje wartość t = 61 50 9 = 6. 5, 5 Obszar krytyczy jest jedostroy, więc dla 9 stopi swobody odczytujemy z tablic t α =1,8331. Wartość statystyki wpada w obszar krytyczy 1, 8331;, więc H 0 odrzucamy. Rozwiązaie Gdyby było tylko 5 prób, to t = 61 50 4 = 4. 5, 5 Dla 4 stopi swobody i poziomu 0,995 odczytujemy z tablic t α =4,6041, więc ie ma podstaw do odrzuceia hipotezy H 0. kąd ta różica: poprzedio odrzucamy, a teraz ie ma podstaw do odrzuceia? 9