VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Podobne dokumenty
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Statystyka matematyczna dla leśników

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Hipotezy statystyczne

Testowanie hipotez statystycznych

Statystyka matematyczna i ekonometria

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Hipotezy statystyczne

Wykład 3 Hipotezy statystyczne

Statystyka matematyczna i ekonometria

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Testowanie hipotez statystycznych.

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Testowanie hipotez statystycznych

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

166 Wstęp do statystyki matematycznej

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Statystyka matematyczna

WYKŁAD 5 TEORIA ESTYMACJI II

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych cd.

LABORATORIUM 6 ESTYMACJA cz. 2

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych.

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Prawdopodobieństwo i rozkład normalny cd.

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

Testowanie hipotez statystycznych. Wprowadzenie

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Weryfikacja hipotez statystycznych

IV WYKŁAD STATYSTYKA. 26/03/2014 B8 sala 0.10B Godz. 15:15

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Zadanie 1 Odp. Zadanie 2 Odp. Zadanie 3 Odp. Zadanie 4 Odp. Zadanie 5 Odp.

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Testowanie hipotez statystycznych

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd.

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Weryfikacja hipotez statystycznych

1 Estymacja przedziałowa

Wykład 12 Testowanie hipotez dla współczynnika korelacji

1. szereg wyliczający (szczegółowy) - wyniki są uporządkowane wyłącznie według wartości badanej cechy, np. od najmniejszej do największej

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Test lewostronny dla hipotezy zerowej:

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Statystyka matematyczna Testowanie hipotez dla średnich w rozkładzie normalnym. Wrocław, r

Statystyka Matematyczna Anna Janicka

Prawdopodobieństwo i statystyka

Testowanie hipotez cz. I

WNIOSKOWANIE STATYSTYCZNE

Zawartość. Zawartość

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

Transkrypt:

VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15

WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady konstrukcji testu statystycznego, testy porównawcze, test Fishera, test t-studenta, testy sprawdzające, porównywanie próbek).

WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych parametrów lub rozkładu Hipoteza statystyczna PARAMETRYCZNA (parametryczne testy istotności) precyzuje wartość parametru w rozkładzie populacji gen. NIEPARAMETRYCZNA (nieparametryczne testy istotności) orzeka o typie rozkładu TESTY ZGODNOŚCI Sprawdzają hipotezę, że populacja ma określony typ rozkładu. TESTY SPRAWDZAJĄCE CZY 2 PRÓBY POCHODZĄ Z JEDNEJ POPULACJI

PRZYKŁADY Wiemy, że wzrost człowieka jest zmienną losową ciągłą. Stwierdzenie wzrost badanej populacji jest określony rozkładem normalnym o parametrach m=1,75m i σ=0,1 jest hipotezą parametryczną, ponieważ określa wartość parametrów rozkładu oraz prostą, bo jednoznacznie definiuje rozkład. Stwierdzenie "wzrost badanej populacji jest określony rozkładem normalnym" jest hipotezą nieparametryczną - nie dotyczy wartości parametrów rozkładu i złożoną - określa więcej niż jeden możliwy rozkład.

Standardowy przebieg procedury weryfikacyjnej Reguły postępowania przy weryfikacji hipotez są określane mianem testów statystycznych 1. Sformułowanie hipotezy zerowej i alternatywnej Hipoteza zerowa (H 0 ) - Jest to hipoteza poddana procedurze weryfikacyjnej, w której zakładamy, że różnica między analizowanymi parametrami lub rozkładami wynosi zero. Przykładowo wnioskując o parametrach hipotezę zerową zapiszemy jako: Hipoteza alternatywna (H 1 ) - hipoteza przeciwstawna do weryfikowanej. Możemy ją zapisać na trzy sposoby w zależności od sformułowania badanego problemu: 2. Wybór statystyki testowej Wyznaczamy pewną funkcję wyników z próby losowej, i wyznaczamy jej rozkład przy założeniu, że hipoteza zerowa jest prawdziwa. Funkcję x ϴ nazywa się statystyką testową lub funkcją testową.

Standardowy przebieg procedury weryfikacyjnej 3. Określenie poziomu istotności α Na tym etapie procedury weryfikacyjnej przyjmujemy maksymalne dopuszczalne prawdopodobieństwo popełnienia błędu I rodzaju, który polega na odrzuceniu hipotezy zerowej wtedy, gdy jest ona prawdziwa. Prawdopodobieństwo to jest oznaczane symbolem α i nazywane poziomem istotności. Na ogół przyjmujemy prawdopodobieństwo bliskie zeru, ponieważ chcemy aby ryzyko popełnienia błędu było jak najmniejsze. Najczęściej zakładamy poziom istotności α=0.05, czasem przyjmuje się np. α=0.01 ; α=0.1 4. Podjęcie decyzji Wyznaczoną na podstawie próby wartość statystyki porównujemy z wartością krytyczną testu. Jeżeli wartość ta znajdzie się w obszarze krytycznym, to hipotezę zerową należy odrzucić jako nieprawdziwą. Stąd wniosek, że prawdziwa jest hipoteza alternatywna. Jeżeli natomiast wartość ta znajdzie się poza obszarem krytycznym, oznacza to, że brak jest podstaw do odrzucenia hipotezy zerowej. Stąd wniosek, że hipoteza zerowa może, ale nie musi, być prawdziwa, a postępowanie nie dało żadnych dodatkowych informacji uprawniających do podjęcia decyzji o przyjęciu lub odrzuceniu hipotezy zerowej.

BŁĘDY I i II RODZAJU DECYZJA Odrzucić H o H o jest prawdziwa Błąd I rodzaju p(błędu I rodz.) =α H o jest fałszywa Poprawna decyzja Nie odrzucić H o Poprawna decyzja Błąd II rodzaju p(błędu II rodz.) =β

OBSZAR KRYTYCZNY Obszar krytyczny- obszar znajdujący się zawsze na krańcach rozkładu. Jeżeli obliczona przez nas wartość statystyki testowej znajdzie się w tym obszarze, to weryfikowaną przez nas hipotezę H 0 odrzucamy. Wielkość obszaru krytycznego wyznacza dowolnie mały poziom istotności α, natomiast jego położenie określane jest przez hipotezę alternatywną. DWUSTRONNY OBSZAR KRYTYCZNY test dwuśladowy (two-tail test)

OBSZAR KRYTYCZNY LEWOSTRONNY OBSZAR KRYTYCZNY Test jednośladowy (one- tail test) PRAWOSTRONNY OBSZAR KRYTYCZNY Test jednośladowy (one- tail test)

DECYZJE Obszar krytyczny od pozostałej części rozkładu statystyki oddzielony jest przez tzw. wartości krytyczne testu czyli wartości odczytane z rozkładu statystyki przy danym α, tak aby spełniona była relacja zależna od sposobu sformułowania H 1.

TESTY DLA WARTOŚCI ŚREDNIEJ POPULACJI ( znane σ ) Przypadek 1. Populacja generalna ma rozkład normalny N(µ, σ); odchylenie standardowe σ jest znane. Na podstawie n-elementowej próby sprawdzić, hipotezę: H o : µ= µ o (µ o -hipotetyczna wartość) wobec hipotezy alternatywnej: H 1 : µ µ o. Rozwiązanie: Statystyka testowa: ma rozkład N(0,1), dwustronny obszar krytyczny Dwustronny test Dla H 1 : µ > µ o lub H 1 : µ < µ o zastosować prawostronny lub lewostronny test, odpowiednio.

TESTY DLA WARTOŚCI ŚREDNIEJ POPULACJI (znane σ) Przykład 1: Automat formuje płytki ceramiczne o nominalnej wadze 250 g. Wiadomo, że rozkład wagi poszczególnych płytek ma rozkład N(m, 5). Kontrola techniczna pobrała losowo 16 płytek, ich średnia masa wyniosła 244 g. Czy można twierdzić, że automat rozregulował się i produkuje płytki o mniejszej wadze niż przewiduje norma. Na poziomie istotności α=0,05 zweryfikować odpowiednią hipotezę statystyczną. Rozwiązanie: Hipoteza zerowa H o : m= 250 g; H 1 : m < 250 g z =(244-250) *16 0,5 /5 = - 4,8 z EXCEL ROZKŁAD.NORMALNY.S.ODWR -z α = -1,64. Ponieważ : z < -z α H o należy odrzucić na korzyść H 1

TESTY DLA WARTOŚCI ŚREDNIEJ POPULACJI (próba duża) Przypadek 2. Populacja generalna ma rozkład normalny N(µ, σ) lub dowolny inny; odchylenie standardowe σ jest nieznane. Na podstawie dużej próby n 30 sprawdzić, hipotezę: H o : µ= µ o (µ o -hipotetyczna wartość) wobec hipotezy alternatywnej: H 1 : µ µ o. Rozwiązanie: Statystyka testowa: ma rozkład N(0,1), dwustronny obszar krytyczny (dalej postępować jak w Przypadku 1.

TESTY DLA WARTOŚCI ŚREDNIEJ POPULACJI Przykład 2. : Badano czas zakończenia reakcji chemicznej. Wykonano n=60 powtórzeń, uzyskano xsr =46 s, s=13 s. Sprawdzić hipotezę, że średni czas zakończenia reakcji wynosi 50s. Przyjąć poziom istotności =0,01. Rozwiązanie: H o : µ =50 s ; H 1 : µ 50s (µ o =50 s). n=60, Statystyka testowa: =0,01 stąd /2=0,005, z ROZKŁAD.NORMALNY.S.ODWR mamy z =-2,57583. Wartość -2,36 leży poza obrębem obszaru krytycznego, więc nie ma podstaw do odrzucenia H o. Sprawdzając hipotezę, że średni czas reakcji jest większy niż 50 s mamy: H o : µ =50 s ; H 1 : µ > 50s (µ o =50 s). =0,01 (test jednostronny) ROZKŁAD.NORMALNY.S.ODWR mamy z =-2,32635. Wartość -2,36 leży w obrębie obszaru krytycznego, a więc H o odrzucamy.

TESTY DLA WARTOŚCI ŚREDNIEJ POPULACJI (próba duża) Przykład 3: W 82 wylosowanych zakładach, produkujących pewien artykuł, średnia cena jego produkcji wyniosła x sr =540 zł oraz s=150 zł. Na poziomie istotności α=0,05 zweryfikować hipotezę, że średnie koszty produkcji tego artykułu wynoszą 600 zł. Rozwiązanie: H o : x= 600 zł; H 1 : x 600 zł z= (540-600) * 81 1/2 / 150 = 3,6; z α/2 =1,96 Ponieważ: z >z α/2 więc H o należy odrzucić

TESTY DLA WARTOŚCI ŚREDNIEJ POPULACJI (próba mała) Przypadek 3. Populacja generalna ma rozkład normalny N(µ, σ),odchylenie standardowe σ jest nieznane. Na podstawie małej próby (n <30) sprawdzić, hipotezę: H o : µ= µ o (µ o -hipotetyczna wartość) wobec hipotezy alternatywnej: H 1 : µ µ o. Rozwiązanie: Statystyka testowa: ma rozkład t-studenta z k=n-1 stopniami swobody, dwustronny obszar krytyczny.

TESTY DLA WARTOŚCI ŚREDNIEJ POPULACJI (próba mała) Przykład 4: Wykonano 8 pomiarów przyspieszenia ziemskiego w pewnym miejscu i otrzymano wartości w cm 2 s -1 : 976,9 ; 978,2; 978,5; 977,6; 979,2; 980,4; 980,2; 978,8. Na poziomie istotności α=0,05 zweryfikować hipotezę, że wartość przyspieszenia wynosi tam 980 cm 2 s -1 Rozwiązanie: H o : g= 980 cm 2 s -1 ; H 1 : g 980 cm 2 s -1 g_i 976,9 978,2 978,5 977,6 979,2 980,4 980,2 978,8 g_sr= 978,725 s_g= 1,203269 t_alfa/2;7= 2,364624 t = (978,7-980,0) *7 1/2 /1,20 = 2,83 H o należy odrzucić

WARYFIKACJA HIPOTEZ dla μ: H o : µ= µ o (µ o -hipotetyczna wartość) H 1 : µ µ o lub: µ > µ o lub: µ <µ o Dane: próba losowa: P (n), poziom istotności: α PRÓBA LOSOWA P (n) Próba duża Mała (n <30) Gdy: σ znane (jest to słuszne też dla małej próby) Gdy: σ nieznane TYLKO dla dużej próby σ nieznane dla małej próby Z α N(0,1) : ROZKLAD.N.S.ODWR prawdopodobieństwo : a) Test dwustronny (H 1 : µ µ o ) : α/2 b) Test jednostronny (H 1 : µ >µ o lub : µ <µ o ) : α t α : ROZKLAD.T.ODWR Stopnie swobody: k=n-1, prawdopodobieństwo: a) Test dwustronny (H 1 : µ µ o ) : α/2 b) Test jednostronny (H 1 : µ >µ o lub : µ <µ o ) : α

Alternatywne podejście: p-wartości (p Value of a test) Powyższa standardowa procedura wymaga przyjęcia arbitralnego poziomu istotności α a wynikiem weryfikacji jest odpowiedź binarna albo statystyka testowa mieści się w przedziale ufności, albo nie. Alternatywnym i nowocześniejszym, choć mniej popularnym podejściem jest obliczenie zamiast tego surowej p-wartości (prawdopodobieństwa popełnienia błędu I rodzaju) i podawanie jej jako wyników weryfikacji. Dzięki temu nie ma potrzeby przyjmowania a priori żadnych wartości α, pozwala to również na porównywanie istotności różnych konkurencyjnych hipotez statystycznych. Definicja: p-wartość (p-value) testowania hipotezy jest to najmniejsza wartość (poziomu istotności), która prowadzi do odrzucenia hipotezy zerowej, H o. Ćwiczenie 3 W oparciu o wartości w Ćwiczeniu 2 wyznaczmy p- wartość. Mamy obliczoną wartość z=-2,36, z ROZKŁAD.NORMALNY.S dla tej wartości z uzyskujemy: 0,009137 jest to p/2 i p wartość odpowiednio dla testów dwu- i jednostronnych.

Alternatywne podejście: p-wartości PRZYKŁAD z 1-α/2 p=α 100 0 0,5 1 101 0,2 0,57926 0,841481 102 0,4 0,655422 0,689157 103 0,6 0,725747 0,548506 104 0,8 0,788145 0,423711 105 1 0,841345 0,317311 110 2 0,97725 0,0455 115 3 0,99865 0,0027 120 4 0,999968 6,33E-05 130 6 1 1,97E-09 160 12 1 0 180 16 1 0 Mała p-wartość wskazuje na poparcie hipotezy alternatywnej H 1 Duża p-wartość dostarcza mało argumentów na poparcie hipotezy alternatywnej