Wykład 8: Testy istotności

Podobne dokumenty
Wykład 9 Wnioskowanie o średnich

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych.

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Hipotezy statystyczne

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Hipotezy statystyczne

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna dla leśników

Prawdopodobieństwo i rozkład normalny cd.

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyka matematyczna i ekonometria

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Statystyka matematyczna i ekonometria

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez

Testowanie hipotez statystycznych

Weryfikacja hipotez statystycznych testy dla dwóch zbiorowości

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

Testowanie hipotez statystycznych.

Zadanie 1 Odp. Zadanie 2 Odp. Zadanie 3 Odp. Zadanie 4 Odp. Zadanie 5 Odp.

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Testowanie hipotez statystycznych cd.

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Testowanie hipotez statystycznych. Wprowadzenie

Statystyka matematyczna

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Kolokwium ze statystyki matematycznej

166 Wstęp do statystyki matematycznej

Statystyka Matematyczna Anna Janicka

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

Testowanie hipotez statystycznych

Przedziały ufności. Poziom istotności = α (zwykle 0.05) Poziom ufności = 1 α Przedział ufności dla parametru μ = taki przedział [a,b], dla którego

a. opisać badaną cechę; cechą X jest pomiar średnicy kulki

Może faktycznie ceny na Opolszczyźnie są wyższe niż w Polsce. Ceny na Opolszczyźnie są podobne, a akurat trafiliśmy na próbę droższych piekarni.

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Wykład 12 Testowanie hipotez dla współczynnika korelacji

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Prawdopodobieństwo i statystyka

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Weryfikacja hipotez statystycznych testy t Studenta

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Uwaga! Test studenta dla pojedynczej próby, niekierunkowy. Wykład 9: Testy Studenta. Test Studenta dla jednej próby, kierunkowy

1 Estymacja przedziałowa

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Statystyka Matematyczna Anna Janicka

Wykład 3. Rozkład normalny

Weryfikacja hipotez statystycznych

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Statystyka Opisowa z Demografią oraz Biostatystyka. Aleksander Denisiuk. denisjuk@euh-e.edu.pl

Wydział Matematyki. Testy zgodności. Wykład 03

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Wykład 3 Hipotezy statystyczne

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

Zadanie Punkty Ocena

STATYSTYKA MATEMATYCZNA WYKŁAD października 2009

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Testowanie hipotez statystycznych

Estymacja parametrów rozkładu cechy

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Zadanie 1. Analiza Analiza rozkładu

Testy dla dwóch prób w rodzinie rozkładów normalnych

Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

2.1 Przykład wstępny Określenie i konstrukcja Model dwupunktowy Model gaussowski... 7

Badanie zgodności z określonym rozkładem. F jest dowolnym rozkładem prawdopodobieństwa. Test chi kwadrat zgodności. F jest rozkładem ciągłym

LISTA 4. 7.Przy sporządzaniu skali magnetometru dokonano 10 niezależnych pomiarów

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Transkrypt:

Wykład 8: Testy istotności Hipotezy Statystyki testowe P-wartości Istotność statystyczna Test dla średniej w populacji Dwustronny test a przedział ufności Używanie i nadużywanie testów

Testy istotności (testowanie hipotez) Będziemy uzgadniać z danymi hipotezy dotyczące populacji. Przykłady: Czy średnia zawartość leku wynosi 200 mg na tabletkę przy odchyleniu standardowym 5 mg? Powiedzmy, że obserwujemy średnią 198 mg dla n = 100 obserwacji. Czy mniej niż 15% czujników CCD jest uszkodzonych? Powiedzmy, że obserwujemy 20% uszkodzonych dla n = 100 obserwacji.

Przykład 1: Stwierdzenie producenta: Średnia zawartość substancji czynnej wynosi 200 mg na pigułkę przy SD 5 mg. Oceniamy 100 tabletek; uzyskano średnią 198 mg. Czy dane są zgodne ze stwierdzeniem? Wskazówka: Oblicz prawdopodobieństwo uzyskania 198 mg lub mniej, przy założeniu, że twierdzenie producenta jest prawidłowe.

A co ze średnią próbkową 199 mg lub 200,5 mg? (Czy takie wyniki są prawdopodobne, czy nie?)

Hipotezy Hipoteza = stwierdzenie o parametrach w populacji lub w modelu (nie o danych). Formułujemy dwie konkurencyjne hipotezy: hipoteza zerowa H0 alternatywna hipoteza Ha

Hipotezy Hipoteza zerowa H0 jest stwierdzeniem, które początkowo jest uprzywilejowane lub uważane za prawdziwe. Często domyślna lub nieciekawa sytuacja "bez efektu" lub "bez różnicy". Alternatywna hipoteza Ha to stwierdzenie, że mamy nadzieję lub podejrzewamy, że jest prawdziwe zamiast H0. Często najpierw stawiamy alternatywną hipotezę Ha, a następnie stwierdzamy, że H0 nie zawiera oczekiwanego efektu. Często też odpowiadamy przy pomocy Ha. Test istotności orzeka o ewentualnej "sprzeczności" pomiędzy hipotezą zerową a danymi.

Przykład 1 cd. H0: μ = 200 Słowami: Średnia zawartość to 200 mg na pigułkę. Ha: μ 200 Słowem: średnia zawartość nie wynosi 200 mg. (Tzw. dwustronna alternatywa Ha.)

Uwaga: Wybierz schemat przed analizowaniem danych - na podstawie wiedzy ogólnej lub wcześniejszych doświadczeń. Inne możliwe schematy: H 0 : μ = 200 kontra H a : μ <200 (Podejrzewasz, że średnia zawartość jest zbyt niska. Jednostronne Ha.) H 0 : μ = 200 kontra H a : μ >200 (Podejrzewamy, że zawartość jest zbyt wysoka. Jednostronne Ha.) H 0 : μ 200 vs. H a : μ >200 (Praktycznie to samo, co poprzednio. Jednostronne Ha.)

Przykład 1 cd. Statystyka testowa: Gdy średnia zawartość wynosi 200 mg, SD = 5 mg, to Z 200 X 5 / 100 ma (w przybliżeniu) rozkład N (0,1). Z jest tutaj statystyką testową testu tutaj. Wartość i rozkład Z są podstawą osądu, czy dane i H0 zgadzają się. Terminologia: przy H0 = zakładając, że H0 jest prawdziwe, przy Ha = zakładając, że Ha jest prawdziwe.

Przykład 1 ctnd. (dwustronna alternatywa) Przy H0: μ = 200: Jakie jest p-stwo, że średnia z 100 zawartości będzie tak bliska 200 mg jak 198 mg? P=...199mg? 200.5mg?

Definicja P-wartości: P-wartość to prawdopodobieństwo przy H0, że statystyka testowa przyjmuje wartości tak ekstremalne jak (lub bardziej ekstremalne niż) wartość faktycznie zaobserwowana dla danych. Uwagi: P-wartość, jest obliczana dla danych. Jeśli jest mała, to jest dowodem przeciw H0 ("przeczy" H0). Aby móc obliczyć P należy znać wartość statystyki dla danych i rozkład statystyki testowej przy H0. P-wartość jest prawdopodobieństwem, które pokazuje, czy dane i hipoteza zerowa się zgadzają.

Statistical Significance: Wybieramy odcięcie dla P-wartości, aby podjąć decyzję. Punkt odcięcia nazywany jest poziomem istotności α. Typowe poziomy istotności α: 0,05, 0,01. Odrzucamy H0, jeśli P-wartość<α. Jeśli nie podano inaczej, weź α = 0,05.

Kiedy P-wartość α, to mówimy, że dane są statystycznie istotne (na poziomie α), lub że mamy znaczący (= wystarczająco silny) dowód przeciwko H0. Uwagi: dane o P-wartości wynoszącej 0,02 są statystycznie istotne na poziomie 0,05, ale nie na poziomie 0,01 podawaj P-wartość ze swoimi wnioskamijest ona ostatecznym podsumowaniem procedury testowej

Przykład 1 cd. Sformułowanie konkluzji: (Używaj prostego języka. Dołącz P-wartość.)

z-test dla średniej populacji. Procedura: X 1,., X n : PP z rozkładu N(μ,σ) μ-nieznane (parametr będący przedmiotem zainteresowania), σ-dane hipoteza zerowa H 0 : μ = μ 0 alternatywna hipoteza może być: H a : μ μ 0 H a : μ > μ 0 H a : μ < μ 0 (dwustronna) (jednostronna) (jednostronna)

Statystyka testu dla średniej populacji μ: Uwagi: Z X Tą procedurę nazywamy z-testem. Przy H 0, Z ma standardowy rozkład normalny oczekujemy niewielkich wartości Z. P-wartości liczymy z N(0,1). z-test będzie się dobrze zachowywać także wtedy, gdy rozkład populacji jest w przybliżeniu normalny lub n jest duże / 0 n

Jednostronne czy dwustronne H a Jeśli spodziewamy się "więcej", "mniej", "gorzej", "zwiększenia", "zmniejszenia", "lepszego itp., to możemy zastosować test jednostronny. W przeciwnym razie używamy dwustronnego. Słowa kluczowe: "inny", "zmieniony"... Jednostronność ma wpływa (tylko) na obliczenie P-wartości.

against... 0 P-wartość dla z-testu H : is 2 P( Z z ) P( Z z ) a H : is P( Z z) a 0 H : is P( Z z) a 0

Przykład 2: 72 mężczyzn menedżerów w wieku 35-44 lat miało średnie skurczowe ciśnienie krwi 126,07. Czy średnie ciśnienie krwi w tej grupy zawodowej jest inne niż w przypadku ogólnej populacji mężczyzn w wieku 35-44 lat, które wynosi N(128,15)? (α nie podane?? Weź 0.05.)

Przykład 3: Nowy system rozliczeniowy w banku będzie opłacalny tylko wtedy, gdy średnia miesięczna salda kont przekracza 170 USD. Konta mają SD = 65 USD. Próba 400 kontach dała średnią 178 USD. Czy nowy system będzie opłacalny?

Statystyka, wartość P (tutaj jednostronny test z-z), decyzja... Dla Przykładu 1, jaka decyzja dla 198, 199, 200.5 [mg], dla dwustronnego testu?

Dwustronny test a przedziały ufności Przykład 1 cd.: Znajdź 95% przedziały ufności, gdy średnia próbki wynosi 198 mg (199 mg, 200,5 mg), SD = 5, n = 100.

Zauważ, że hipotetyczne μ = 200mg jest poza pierwszymi dwoma i wewnątrz trzeciego PU.

Ogólna zależność: Dwustronny test istotności dla poziomu α odrzuca H0: μ = μ0 wtedy i tylko wtedy, gdy μ0 znajduje się poza przedziałem ufności dla μ na poziomie 1-α.

Wartość krytyczna dla z-testu: Wartość krytyczna z* to taka liczba, że obszar pod krzywą normalną wartości przekraczających z* jest równy α. Np. dla testu jednostronnego przy H 0 Pr(Z> z * )= α. Używamy tablicy rozkładu normalnego lub Studenta.

Ćwiczenie: Znajdź wartości krytyczne dla Ha: μ> μ0, gdy α = 0,05, 0,02, 0,01. Jakie są P-wartości dla z = 1,5, z = 2, z = 2,5?

Exercise: Find critical values for H a : μ μ 0 when α=0.05, 0.02, 0.01. What are the P-values of z=1.5, z=2, z=2.5?

Używanie i nadużywanie testów Wybór poziomu istotności Istotność statystyczna a znaczenie praktyczne Brak istotności może mieć wartość informacyjną Niebezpieczeństwa poszukiwania wyników istotnych statystycznie Założenia dotyczące danych

Wybór poziomu istotności α = 0,05 to akceptowany standard, ale... jeżeli H a ma kosztowne implikacje, to mniejsze α mogą być odpowiednie - zgodnie z normami przyjętymi w Twojej dyscyplinie nie zawsze musimy podjąć decyzję: wystarczające może być podanie P-wartości

Istotność a znaczenie praktyczne Istotny statystycznie efekt może być niewielki: Przykład (ciśnienie krwi cd.): μ0 = 128, σ = 15, n = 1000 obserwacji; średnia z próby = 127: Istotne?? Ważne??

Wynik statystycznie istotny nie zawsze jest ważny praktycznie, więc... Zilustruj wyniki i przedziały ufności, aby sprawdzić, czy efekt jest wart uwagi. Ważne efekty mogą mieć małą P-wartość, jeśli wielkość próbki jest zbyt mała. Wartości odstające mogą kreować lub niszczyć istotność statystyczną.

Brak istotności może być pouczający dla innych badaczy...... jako ostrzeżenie, aby nie inwestować w takie badania, lub... jako punkt wyjścia dla szerszego badania, które ma szansę wykrycia rozmiaru efektu, którego szukamy (być może wielkość próbki jest za mała?)

Niebezpieczeństwa poszukiwania istotności Przykład: weź 100 pracowników na stanowiskach kierowniczych. Zmierz: ciśnienie krwi, wzrost, wagę, gęstość kości, tempo metabolizmu, kolor oczu, kolor krawata itp? Jeśli, powiedzmy, zostanie przeprowadzonych 40 niezależnych testów istotności przy α = 5%, to spodziewana liczba testów, które są znaczące (sugerują nietypową charakterystykę tych osób) przez przypadek, wynosi 40x0,05 = 2.

Remedies: Poszukaj wzorców przy użyciu jednego zbioru danych. Przetestuj przy pomocy innego. Użyj korekty Bonferroniego: dla kilku testów k, użyj α/k jako poziomu istotności w każdym teście. W poprzednim przykładzie użyj 0.05/40 =

Założenia / przestrogi: Kiepskie dane = niewiarygodne wnioski Dobre dane: próba prosta z populacji (są też procedury dla innych schematów/sytuacji) Populacja niekoniecznie musi być normalna, ale wartości odstające mogą unieważnić wnioski Dowiemy się, jak oszacować σ na następnym wykładzie