Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Podobne dokumenty
Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Statystyka matematyczna dla leśników

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Wykład 3 Hipotezy statystyczne

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Testowanie hipotez statystycznych

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

WNIOSKOWANIE STATYSTYCZNE

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Statystyka matematyczna

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Wydział Matematyki. Testy zgodności. Wykład 03

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Testowanie hipotez statystycznych.

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Hipotezy statystyczne

Hipotezy statystyczne

WNIOSKOWANIE STATYSTYCZNE

Testowanie hipotez statystycznych

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

166 Wstęp do statystyki matematycznej

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Testowanie hipotez statystycznych

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Weryfikacja hipotez statystycznych

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Metody Statystyczne. Metody Statystyczne

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Testowanie hipotez statystycznych cd.

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Testowanie hipotez statystycznych.

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

Statystyka matematyczna i ekonometria

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

Zadania ze statystyki cz.8. Zadanie 1.

Rozkłady statystyk z próby

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Weryfikacja hipotez statystycznych

Statystyka Matematyczna Anna Janicka

Weryfikacja hipotez statystycznych testy t Studenta

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Statystyka matematyczna i ekonometria

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

1 Estymacja przedziałowa

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Testowanie hipotez cz. I

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Prawdopodobieństwo i rozkład normalny cd.

Weryfikacja hipotez statystycznych

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Testy nieparametryczne

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Weryfikacja hipotez statystycznych testy dla dwóch zbiorowości

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Wprowadzenie do analizy korelacji i regresji

Test lewostronny dla hipotezy zerowej:

Testowanie hipotez statystycznych

Transkrypt:

Testowanie hipotez statystycznych Wnioskowanie statystyczne

Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów).

Hipotezy statystyczne Hipotezy mogą dotyczyć: Wartości parametrów Różnicy między cechami opisującymi badaną populację Zależności między badanymi zmiennymi Kształtu zależności badanych zmiennych Porównania rozkładu zmiennych

Hipotezy proste i złożone Proste - hipoteza jednoznacznie określa rozkład danej populacji (np. wzrost badanej populacji jest określony rozkładem normalnym o parametrach m=70 cm i σ=6 ) Złożone - hipoteza określa całą grupę rozkładów (np. wzrost badanej populacji jest określony rozkładem normalnym o parametrach m=70 cm i σ)

Hipotezy parametryczne i nieparametryczne Parametryczne - hipoteza dotyczy wartości parametru rozkładu (wzrost badanej populacji jest określony rozkładem normalnym o parametrach m=70 cm i σ=6) Nieparametryczne - hipoteza dotyczy postaci funkcyjnej rozkładu (twierdzenie "wzrost badanej populacji jest określony rozkładem normalnym" )

Test statystyczny to reguła postępowania do sprawdzenia prawdziwości hipotezy statystycznej na podstawie wyników próby losowej.

Rodzaje testów Parametryczne służą do weryfikacji hipotez parametrycznych, odnoszących się do parametrów rozkładu badanej cechy w populacji generalnej. Nieparametryczne - służą do weryfikacji różnorodnych hipotez, dotyczących m.in. zgodności rozkładu cechy w populacji z określonym rozkładem teoretycznym, zgodności rozkładów w dwóch populacjach, a także losowości doboru próby.

Błędy popełniane przy weryfikacji hipotez Błąd pierwszego rodzaju - odrzucenie testowanej hipotezy prawdziwej. Błąd drugiego rodzaju przyjęcie testowanej hipotezy fałszywej.

Poziom istotności to prawdopodobieństwo popełnienia błędu pierwszego rodzaju w postępowaniu testującym hipotezę. obrane z góry, najczęściej małe prawdopodobieństwo popełnienia błędu polegającego na odrzuceniu testowanej hipotezy prawdziwej.

Weryfikacją hipotez nazywamy sprawdzanie sądów o populacji, sformułowanych bez zbadania jej całości.

Schemat weryfikacji hipotez. Zdefiniowanie hipotezy zerowej H o i alternatywnej H. Wybór testu do weryfikacji 3. Wykonanie obliczeń wartości statystyki na podstawie danych z próby 4. Określenie poziomu istotności. 5. Wyznaczenie obszarów krytycznych dla ustalonego 6. Podjęcie decyzji o przyjęciu hipotezy zerowej lub jej odrzuceniu.

Zasady konstruowania testów Sformułowanie hipotezy zerowej np. H 0 : m=m 0. hipoteza alternatywna np. H : mm 0» H : m > m 0» H : m < m 0

Wybór statystyki testowej Zakładając, że hipoteza H 0 jest prawdziwa tworzy się pewną statystykę testową Z, będącą funkcją wyników z próby losowej.

Określenie poziomu istotności α α - maksymalne dopuszczalne prawdopodobieństwo popełnienia błędu I rodzaju, który polega na odrzuceniu hipotezy zerowej wtedy, gdy jest ona prawdziwa.

Obszar krytyczny Obszar krytyczny zawiera takie wartości zmiennej Z, jakie musiałaby ona przyjąć, aby było to "mało prawdopodobne", tzn. aby prawdopodobieństwo zaistnienia tych wartości było małe, równe poziomowi istotności.

Podjęcie decyzji Jeśli wartość statystyki Z znalazła się w obszarze krytycznym, to wystąpiło zdarzenie bardzo mało prawdopodobne, a to oznacza, że nie jest spełnione założenie o prawdziwości hipotezy zerowej.

Testy istotności to taki rodzaj testów statystycznych, w których na podstawie wyników próby losowej podejmuje się jedynie decyzję odrzucenia hipotezy sprawdzanej lub stwierdza się, że brak jest podstaw do jej odrzucenia.

Czynniki wpływające na moc Liczebność próby testów Błędy pomiarowe. Każda poprawa dokładności pomiarów poprawia moc testu.

Testy Studenta Testy t Studenta to: test dla jednej próby, dla dwóch niezależnych prób dla dwóch prób zależnych.

Testy t. Testy dla prób niezależnych (czyli dla zmiennych niepowiązanych) Testy te porównują średnie badanej zmiennej dla dwóch grup o równych lub różnych liczebnościach.. Testy dla prób zależnych (czyli dla zmiennych powiązanych) Testy te stosuje się dla porównania średnich danej zmiennej w tej samej grupie, ale badanej dwukrotnie w czasie.

Przykład. Zmienne niezależne Należy porównać natężenie hałasu na dwóch skrzyżowaniach położonych w różnych częściach miasta.

Zmienne zależne. Należy porównać natężenie hałasu na skrzyżowaniach, położonych blisko siebie. Badamy poziom cholesterolu we krwi pewnej grupy osób przed i po podaniu odpowiedniego lekarstwa. Pytanie: Czy ten lek jest skuteczny?

Test t-studenta dla prób zależnych. Test stosujemy, jeśli: Otrzymujemy dwie serie wyników pomiarów dotyczących tej samej próby (tych samych jednostek w dwóch różnych momentach czasu) i chcemy zweryfikować hipotezę o średniej wielkości różnic między tymi wynikami.

Testy istotności dla jednej próby (Model I) Model I. Populacja generalna ma rozkład normalny N(m, ) o nieznanej wartości średniej m oraz znanym odchyleniu standardowym. H 0 : m=m 0 (gdzie m 0 jest konkretną wartością hipotetyczną średniej) H : mm 0.

Weryfikacja hipotezy na podstawie wyników z próby Do weryfikacji hipotezy służy statystyka u x m 0 n

Obszar krytyczny dla H : mm 0 Z tablicy dystrybuanty standardowego rozkładu normalnego N(0,) wyznacza się taką wartość krytyczną u, by dla założonego z góry małego prawdopodobieństwa zachodziła równość P( U u ) = (u ) = - / Zbiór wartości zmiennej U określony nierównością u u tworzy obszar krytyczny tego testu

H : mm 0 obszar dwustronny W =(-, -u ) ( u, )

Prawostronny obszar krytyczny H : m > m 0, Dla tej hipotezy zachodzi: u u u wyznaczamy tak, by spełniona była równość P(U u ) =.

H : m > m 0, W = (u, + )

Obszar krytyczny lewostronny H : m < m 0, W = (-, - u )

Obszar krytyczny Gdy z próby otrzymamy taką wartość u że znajdzie się w obszarze krytycznym, to hipotezę H 0 odrzucamy, uznajemy zatem, że różnica między wartością m 0 a jest statystycznie istotna. W przeciwnym wypadku nie ma podstaw do odrzucenia hipotezy H 0.

Test t dla jednej próby. Model II. Populacja generalna ma rozkład normalny N(m,), przy czym odchylenie standardowe populacji jest nieznane. W oparciu o wyniki małej, n-elementowej próby losowej należy zweryfikować hipotezę H 0 : m = m 0, wobec hipotezy alternatywnej H : m m 0.

Test t dla jednej próby. Do weryfikacji służy statystyka t x m s 0 n

Obszar krytyczny dwustronny H : m m 0 W =(-, -t ) ( t, ),

Obszar krytyczny lewostronny H : m < m 0 Lewostronny obszar krytyczny W = (-, - t )

Obszar krytyczny prawostronny H : m > m 0 Prawostronny obszar krytyczny W = (t, + )

Testy t dla jednej próby. Wartość t, n- (t,n- ) odczytuje się z tablicy rozkładu t - Studenta, dla ustalonego poziomu istotności i dla n- stopni swobody. Jeśli wartość statystyki t znajdzie się w obszarze krytycznym hipotezę zerową odrzucamy.

Test istotności t dla dwóch prób niezależnych (model I). Badane są dwie populacje generalne o rozkładach normalnych N(m, ) i N(m, ). Wartości średnie tych populacji nie są znane, znane są natomiast wartości odchyleń standardowych i. H 0 : m = m H : m m

Test istotności t dla dwóch prób niezależnych (model I). Weryfikacja hipotezy: Zakładamy, że spełniona jest hipoteza zerowa czyli m = m. Statystyka U ma postać: ) ( ) ( n n X X n n m m X X U

Test istotności t dla dwóch prób niezależnych (model I). Wyznaczamy obszar krytyczny (jak w Modelu I) Jeśli wartość U, znajdzie się w obszarze krytycznym to hipotezę H 0 odrzucamy. W przeciwnym wypadku nie ma podstaw do odrzucenia hipotezy H 0

Test t-studenta dla prób (Model ). Załóżmy, że badane są dwie populacje generalne o rozkładach normalnych N(m, ) i N(m, ), ( i nieznane, jednorodne) H 0 : m = m H : m m.

Weryfikacja testu: Budujemy statystykę: Statystyka ta ma rozkład t-studenta z = n + n stopniami swobody. p n n s ) m (m ) X (X t n n )s (n )s (n s p Test t-studenta dla prób (Model ).

Test t-studenta dla prób (Model ). Budujemy obszar krytyczny (jak w modelu ) Jeśli wartość statystyki znajdzie się w obszarze krytycznym to hipotezę H 0 należy odrzucić na korzyść hipotezy H, W przeciwnym wypadku nie ma podstaw do odrzucenia hipotezy H 0.

Etapy wnioskowania statystycznego z programem Statistica.. Wprowadzanie danych. Sformułowanie hipotezy zerowej 3. Sprawdzenie założeń wybranego testu 4. Uruchomienie testu 5. Interpretacja wyników

Statistica. Wybieramy z menu: Statystyka - Statystyki podstawowe i tabele.

Wartość p prawdopodobieństwo komputerowe P- wartość poziom prawdopodobieństwa p najmniejszy poziom istotności, przy którym wyliczona wartość statystyki, doprowadza do odrzucenie hipotezy zerowej.

Obszar krytyczny prawostronny H : m > m 0 Prawostronny obszar krytyczny W = (t, + ) p

Wartość p- poziom prawdopodobieństwa Wartość p porównujemy z przyjętym poziomem istotności. Jeżeli p < odrzucamy H 0 i stwierdzamy istotną różnicę między średnimi. Jeżeli p > to na danym poziomie istotności alfa nie ma podstaw do odrzucenia hipotezy zerowej.

Podstawowe założenia testów. Mierzalność zmiennej t-studenta. Losowy dobór próby gwarantuje reprezentatywność próby dla populacji 3. Respektowanie rodzaju porównań Testy przeznaczone do testowania różnic między grupami niezależnymi Testy dla grup zależnych 4. Założenie o normalności rozkładu zmiennej 5. Założenie jednorodności wariancji

Test T Studenta dla zmiennych niezależnych Testy T- Studenta dla zmiennych niezależnych Czy zmienne losowe mają w dwóch zbiorowościach rozkłady normalne Tak Czy znane wariancje? Nie Czy duże próby? Tak Nie Tak Nie Test U Czy równe wariancje? Test U dla dużych prób Testy nieparametryczne Tak Test T Nie Test Cochrana-Coxa

Test t Test U Test Cochrana Coxa p n n s ) X (X t n n ) X (X U n s n s ) X (X C

Testy jednorodności wariancji Test F Test Leven a. Test Browna i Forsytha.

Test istotności dla dwóch wariancji. Zakładamy że populacje mają rozkład normalny N(m, ) oraz N(m, ) oraz liczebności prób wynoszą odpowiednia n i n. Żaden z parametrów tych rozkładów nie jest znany.

Hipotezy: H H 0 : :

Rozkład ilorazu wariancji z prób dla dwóch populacji normalnych ma rozkład F Snedecora F s s / /

Numerujemy s s tak, by s s F s s / / s s

Statystyka F ma rozkład F Snedecora o n i n - stopniach swobody.

P(F F / ) = / Dla hipotezy : Prawostronna część obszaru krytycznego Jeśli F < F / nie ma podstaw do odrzucania hipotezy zerowej. Jeśli F F / to hipotezę zerową należy odrzucić. H F odczytana z tablic F Snedecora dla n i n - i ustalonego.

Dla hipotezy H : w liczniku umieszczamy s niezależnie od tego, czy jest to wartość mniejsza czy większa niż s Prawostronny obszar krytyczny wyznacza relacja P(F F ) =.

Dla hipotezy H : należy ponumerować populacje tak, by otrzymać prawostronną hipotezę alternatywną P(F F ) =.