Testowanie hipotez statystycznych

Podobne dokumenty
Statystyka matematyczna dla leśników

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Testowanie hipotez statystycznych

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Weryfikacja hipotez statystycznych

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

Hipotezy statystyczne

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

1 Estymacja przedziałowa

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Hipotezy statystyczne

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Weryfikacja hipotez statystycznych testy t Studenta

Wykład 12 Testowanie hipotez dla współczynnika korelacji

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Testowanie hipotez statystycznych. Wprowadzenie

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Testowanie hipotez statystycznych.

Testowanie hipotez cz. I

Testowanie hipotez statystycznych cd.

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Wydział Matematyki. Testy zgodności. Wykład 03

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Wykład 3 Hipotezy statystyczne

166 Wstęp do statystyki matematycznej

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Statystyka matematyczna i ekonometria

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Statystyka matematyczna

Prawdopodobieństwo i statystyka

STATYSTYKA

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

Zawartość. Zawartość

Testowanie hipotez statystycznych

Statystyczna analiza danych

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Statystyka matematyczna i ekonometria

Testowanie hipotez statystycznych.

Estymacja parametrów rozkładu cechy

Rozkłady statystyk z próby

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Statystyka matematyczna. Wykład VI. Zesty zgodności

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

Testowanie hipotez statystycznych

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Wnioskowanie statystyczne. Statystyka w 5

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Testowanie hipotez statystycznych.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna

Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11

Weryfikacja hipotez statystycznych

Transkrypt:

Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012

Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom istotności 3

Wprowadzenie Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom istotności Definicja 2.1 stanowi istotę nauki jaką jest statystyka. Typowy problem statystki polega na tym, że mamy do dyspozycji wiele różnych typów losowości, i określamy szansę że nasz problem (z którego posiadamy jakieś dane losowe) odpowiada wybranej losowości. Wprowadzimy najważniejsze pojęcia oraz ogólną metodę na badanie elementów statystyki.

Hipoteza oraz błędy I i II rodzaju Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom istotności Definicja 2.2 Postawieni przed problemem przyjmujemy najczęściej obstawiamy że pewne zdanie jest prawdziwe. To zdanie nazywamy hipotezą. Po wykonaniu testu decydujemy czy nasza hipoteza jest do przyjęcia czy też do odrzucenia. Biorąc pod uwagę, że nasza hipoteza może być prawdziwa lub fałszywa mamy 4 możliwe wersje * przyjęta odrzucona prawdziwa OK błąd I rodzaju fałszywa błąd II rodzaju OK

Skuteczność testów Wprowadzenie Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom istotności Uwaga 2.3 Aby nazwać test statystyczny skutecznym należy uzasadnić, że powoduje optymalizuje on szanse na oba błędy. Poza trywialnymi przypadkimi, nie istnieją testy które daj się osiągnąć poprzez minimalizację błędu I i II. Trzeba je optymalizować jednoczęśnie. Uwaga 2.4 Błędy I i II rodzaju istotnie się od siebie różnią. Zauważmy, że chcą określić szanse błędu I rodzaju dysponujemy wiedzą pewną na temat losowości (np. rozkład jest normalny N(0,1)). Wiedza ta z reguły pozwala dobrze określać prawdopodobieństwa błędu. Znacznie trudniejszym jest z reguły błąd II rodzaju (np. rozkład nie jest normalnym N(0,1)), w znanej postaci często wyklucza możliwość policzenia odpowiednich prawdopodobieństw.

Hipoteza alternatywna Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom istotności Definicja 2.5 Hipoteza alternatywna i podstawowa Często sposobem na ominięcie problemu błędu II rodzaju, jest dopuszcznie tylko dwóch możliwych wariantów losowości A i A (np. rozkład jest normalny N(0,1) [A] albo jest rozkładem t-studenta o 5 stopniach swobody[a ]). Testując przyjęcie hipotezy A, do liczenia błędu II rodzaju wykorzystamy wiedzę A. Hipotezę że A jest prawdziwe nazywa się wtedy hipotezą alternatywną, konkurencyjną. Zaś naszą wyjściową hipotezę A nazywa się podstawową.

Statystyka testowa Wprowadzenie Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom istotności Definicja 2.6 Statystyka testowa Zmienną losową używaną w teście, a określoną dla wszystkich dopuszalnych losowości nazywamy statystyką testową. Statystyki testowe służą do do transformowania wyników (grupowania, usuwania nieistotnych szczegółów, itp). W obu przypadkach zarówno hipotezy podstawowej jak i konkurencyjnej, statystyki mają znane (mniej lub bardziej) rozkłady.

Zbiór krytyczny Wprowadzenie Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom istotności Definicja 2.7 Zbiór krytyczny Zbiorem krytycznym nazywamy zbiór wartości statystyki, dla których zdecydowani jesteśmy hipotezę odrzucić. Wybór zbioru krytycznego stanowi o jakości testu, gdyż pozwala ona oceniać (bądź nawet określać) szansę obu błędów. W praktyce (w przypadku jednowymiarowym) jednak dowodzi się, że najczęściej najlepszym zbiorem jest jeden z 4-rech 1 (, a) lewostronny 2 (a, ) prawostronny 3 (, a) (b, + ), a < b obustronny, lub 4 (a, b), a < b centralny (środkowy)

Poziom zaufania i istotności Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom istotności Zbiory krytyczne są konstruowane w sposób szczególny, tak mianowicie aby szansa że statystyka znajdzie się w nim była odpowiednio mała. Jak dokładnie mała podaje nam pojęcia poziomu istotności Definicja 2.8 Poziom istotności Poziomem istotności nazwiemy miarę prawdopodobieństwa zbioru krytycznego. Poziomem ufności nazwiemy miarę dopełnienia zbioru krytycznego. Zatem zachodzi równość:p i + p u = 1, p i poziom istotności, p u poziom ufności. Testowanie odbywa się z reguły przy pewnym określonym poziomie istotności bądź zaufania. W zależności od tego poziomu różnie zmieniają się prawdopodobieństwa błędów I i II rodzaju.

Schemat testu Wprowadzenie Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom istotności Większość testów wygląda nastepująco 1 Stawiamy hipotezę podstawową 2 Wybieramy statystykę 3 Kierując się hipotezą podst. oraz statystyką, wybieramy zbiór krytyczny 1 4 Porównujemy wartość statystyki z zbiorem krytycznym. Przyjmujemy lub odrzucamy hipotezę. 1 Kluczowy punkt

Testy parametryczne Wprowadzenie Najprostszymi testami są tzw testy parametryczne. Przykład. Rozkład pewnej cechy ma ma rozkład normalny z nieznanymi parametrami. Sprawdzić na pewnym poziomie istotności, że rozkład ten ma µ = 4. Obszarem zmienności losowości są jedynie jej parametry. Przykładowe testy 1 Testy dla średnich 2 Testy dla wariancji

Test dla średniej przy znanej wariancji Założenia: Cecha ma rozkład normalny o znanej wariancji (σ 2 ) i poszukiwanej wartości średniej. Posiadamy n-próbnych wyników w X Hipoteza: µ = a Statystyka testowa: T = X a n N(0, 1) (1) σ Zbiór krytyczny postaci (, z) (z, + ). 2 2 X oznacza średnią wartość w próbie

Test dla średniej przy nieznanej wariancji i dużej próbie Założenia: Cecha ma nieznany rozkład o nieznanej wariancji i poszukiwanej wartości średniej. Posiadamy n-próbnych wyników w X, gdzie próba jest liczna (> 30, > 100) Hipoteza: µ = a Statystyka testowa: T = X a n N(0, 1) (2) sd(x ) Zbiór krytyczny postaci (, z) (z, + ). 3 3 sd(x ) to przybliżenie odchylenia standardowego, w r jest to funkcja o nazwie sd( )

Test dla średniej przy nieznanej wariancji i małej próbie Założenia: Cecha ma rozkład normalny o nieznanej wariancji i poszukiwanej wartości średniej. Posiadamy n-próbnych wyników w X, gdzie próba jest mało-liczna (< 30) Hipoteza: µ = a Statystyka testowa: T = X a n 1 t(n 1) t-studenta (3) sd(x ) Zbiór krytyczny postaci (, z) (z, + ).

Test dla wariancji przy znanej wartości oczekiwanej Założenia: Cecha ma rozkład normalny o znanej wartości oczekiwanej µ i poszukiwanej wariancji. Posiadamy n-próbnych wyników w X. Hipoteza: σ = a > 0 Statystyka testowa: T = n i=1 ((X i µ) ) 2 χ 2 a n (4) Zbiór krytyczny postaci (0, a) (b, + ), gdzie a = n natomiast b = (X i µ) 2 i=1 qchisq( α 2,n) n (X i µ) 2 i=1 qchisq(1 α 2,n)

Test dla wariancji przy nieznanej wartości oczekiwanej Założenia: Cecha ma rozkład normalny o nieznanej wartości oczekiwanej i poszukiwanej wariancji. Posiadamy n-próbnych wyników w X. Hipoteza: σ = a > 0 Statystyka testowa: T = n i=1 ((X i mean(x ))) 2 χ 2 a n 1 (5) Zbiór krytyczny postaci (0, a) (b, + ), gdzie n n a = (X i mean(x )) 2 i=1 qchisq(1 α 2,n 1) natomiast b = (X i mean(x )) 2 i=1 qchisq( α 2,n 1)

Test χ 2 Pearsona Wprowadzenie Test bada hipotezy, że pewna losowość ma określony rozkład, gdy mamy n-elementową jej próbę. Metoda postępowania 1 Dzielimy wszystkie możliwe wyniki na m klas (np m=3 i wtedy są 3 przedziały (, a), (a, b) oraz (b, + )). 2 Obliczamy ile wyników losowych jest w każdej z klas (oznaczamy tę liczność za n i ) 3 Obliczamy spodziewaną ilość w każdej z klas dla postulowanego rozkładu (n p i, gdzie p i jest prawdopodobieństwem danego przedziału) 4 Porównujemy ze statystyką zwyczajowo oznaczaną przez χ 2 m χ 2 (n i n p i ) 2 = n p i i=1 n χ 2 m 1 (6)

Wprowadzenie Definicja 3.1 stanowią najistotniejszą podgrupę testów zgodności. Odpowiadają one na pytanie czy dana próba losowa pochodzi z rozkładu normalnego. Wiadomo, że w sposób graniczny wszystkie rozkłady zbiegają do rozkładu normalnego. Odwrócenie tego procesu jest więc istotnym zadaniem. posiadają również bardzo liczne zastosowania praktyczne.

Test normalności Shapiro-Wilka Twierdzenie 3.2 Posiadamy próbę losową z nieznanego rozkładu. Stawiamy hipotezę, że rozkład posiada dowolny rozkład normalny. Wtedy statystyka testowa postaci W = ( [n/2] a i:n (X ( n i + 1) X ( i))) 2 i=1 sd(x ) 2 (7) gdzie a i:n są stablicowanymi współczynnikami testu. To statystyka ma rozkład Shapiro-Wilka dla n-elementowego testu. Rozważany jest wyłącznie zbiór krytyczny prawostronny, którego lewy kraniec podany jest przez wartość krytyczną testu SW W n (α), gdzie α jest poziomem istotności testu. sd - nieobciąż. est. odch. std.

Definicja 3.3 Do najważniejszych testów należą również testy zgodności rozkładów. W zadaniach tego typu posiadamy dwie lub więcej prób losowych, a ogólne pytanie polega na uzasadnieniu czy te próby opierają się o taką samą losowość (Czy pochodzą z tego samego rozkładu?). 1 Test dwóch średnich 2 Test dwóch wariancji (F-Snedecora)

Test dwóch średnich o znanych wariancjach Twierdzenie 3.4 Rozważamy dwie populacje generalne o rozkładnie normalnym o znanych odchyleniach standardowych (niekoniecznie równych). Mamy próby losowe o licznościach odpowiednio n 1 i n 2. Weryfikujemy hipotezę, że te rozkłady mają taka samą wartość średnią. Wtedy statystyka testowa T = X 1 X 2 (8) σ1 2 n 1 + σ2 2 n 2 Posiada rozkład normalny standaryzowany N(0, 1).

Test dwóch średnich o nieznanych wariancjach Twierdzenie 3.5 Rozważamy dwie populacje generalne o rozkładnie normalnym o nieznanych odchyleniach standardowych. Mamy próby losowe o małych licznościach odpowiednio n 1 i n 2. Weryfikujemy hipotezę, że te rozkłady mają taka samą wartość średnią. Wtedy statystyka testowa T = X 1 X 2 S 2 p ( 1 n 1 + 1 n 2 ) S 2 p = (n 1)S 1+(n 2 1)S 2 n 1 +n 2 2 Posiada rozkład t-studenta o n 1 + n 2 2 stopniach swobody. (9)

Test dwóch średnich o nieznanych rozkładach Twierdzenie 3.6 Rozważamy dwie populacje generalne o nieznanych rozkładach. Mamy próby losowe o dużych licznościach odpowiednio n 1 i n 2. Weryfikujemy hipotezę, że te rozkłady mają taka samą wartość średnią. Wtedy statystyka testowa T = X 1 X 2 S 1 n 1 + S 2 Posiada rozkład normalny standaryzowany N(0, 1). n 2 (10)

Test dwóch wariancji Twierdzenie 3.7 Mamy dwie próby losowe z rozkładów normalnych o nieznanych parametrach. Próby losowe mają liczność n 1 oraz n 2. S j = 1 n j n j (x i x) 2 jest obciążonym estymatorem wariancji. i=1 Hipoteza podstawowa to równość wariancji obu rozkładów. Wtedy statystyka testowa postaci F = n 1 n 1 1 S 1 n 2 n 2 1 S 2 (11) Ma rozkład F-Snedecora o n 1 1 i n 2 2 stopniach swobody.

Wprowadzenie Twierdzenie 3.8 Specyficznym testem jest test podziału frakcji. Pewna populacja ma rozkład zero-jedynkowy z nieznanym parametrem p. Posiadamy próbę losową o dużym rozmiarze n. Testujemy hipotezę, że o parametrze p, H : p = p 0. Wtedy statystyka testowa postaci T = X p 0 p0 (1 p 0 ) n (12) Ma rozkład (asymptotycznie) normalny standaryzowany N(0, 1).