Testy dla dwóch prób w rodzinie rozkładów normalnych

Podobne dokumenty
Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych

Wykład 5 Problem dwóch prób - testowanie hipotez dla równości średnich

Problem dwóch prób: porównywanie średnich i wariancji z populacji o rozkładach normalnych. Wrocław, 23 marca 2015

Wykład 10 ( ). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

Statystyka matematyczna Testowanie hipotez dla średnich w rozkładzie normalnym. Wrocław, r

Testowanie hipotez statystycznych.

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 3

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Testowanie hipotez dla frakcji. Wrocław, 29 marca 2017

Testowanie hipotez dla proporcji. Wrocław, 13 kwietnia 2015

Testowanie hipotez statystycznych.

Testowanie hipotez statystycznych.

Estymacja parametrów w modelu normalnym

Wykład 7 Testowanie zgodności z rozkładem normalnym

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Statystyka w analizie i planowaniu eksperymentu

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Wykład 8 Dane kategoryczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Statystyka matematyczna. Wykład VI. Zesty zgodności

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Wykład 9 Testy rangowe w problemie dwóch prób

Środowisko R Założenie normalności metody nieparametryczne Wykład R4; Weryfikacja założenia o normalności rozkładu populacji

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

1 Estymacja przedziałowa

Wykład 10 Testy jednorodności rozkładów

Analiza zależności cech ilościowych regresja liniowa (Wykład 13)

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Testy post-hoc. Wrocław, 6 czerwca 2016

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

Statystyka matematyczna dla leśników

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Porównanie wielu rozkładów normalnych

Wykład 11 Testowanie jednorodności

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

Statystyczna analiza danych

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Wykład 15. Metody nieparametryczne. Elementy analizy wielowymiarowej Weryfikacja założenia o normalności rozkładu populacji

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

S t a t y s t y k a, część 3. Michał Żmihorski

Weryfikacja hipotez statystycznych testy dla dwóch zbiorowości

Statystyka w analizie i planowaniu eksperymentu

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Testowanie hipotez statystycznych.

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Wykład 3 Hipotezy statystyczne

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Weryfikacja hipotez statystycznych

Model regresji wielokrotnej Wykład 14 ( ) Przykład ceny domów w Chicago

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Analiza wariancji w analizie regresji - weryfikacja prawdziwości przyjętego układu ograniczeń Problem Przykłady

Kolokwium ze statystyki matematycznej

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Przykład 1. (A. Łomnicki)

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Matematyka i statystyka matematyczna dla rolników w SGGW

Statystyka matematyczna

1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 11 DOŚWIADCZENIE JEDNOCZYNNIKOWE W UKŁADZIE CAŁKOWICIE LOSOWYM PORÓWNANIA SZCZEGÓŁOWE

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

Wydział Matematyki. Testy zgodności. Wykład 03

Testowanie hipotez statystycznych cd.

Testowanie hipotez statystycznych

Analiza autokorelacji

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd.

Zadania ze statystyki cz.8. Zadanie 1.

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Testowanie hipotez statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

Testowanie hipotez statystycznych

Prawdopodobieństwo i statystyka

Transkrypt:

Testy dla dwóch prób w rodzinie rozkładów normalnych dr Mariusz Grządziel Wykład 12; 18 maja 2009 Przykład Rozważamy dane wygenerowane losowo; ( podobne do danych z przykładu 7.2 z książki A. Łomnickiego) n 1 = 9 poletek w dąbrowie, n 2 = 10 poletek w borze Liczby pająków (na poletkach) w dąbrowie : 45, 57, 30, 61, 52, 64, 50, 60, 48; Liczby pająków (na poletkach) w borze: 46, 32, 39, 34, 46, 31, 37, 26, 52, 21. Chcielibyśmy zweryfikować hipotezę o równości liczby pająków w borze i dąbrowie. Formalizacja problemu Zakładamy,że x 1, x 2,..., x n1, liczby pająków na poletkach w dąbrowie, są realizacjami próby prostej X 1, X 2,..., X n1, X 1, X 2,..., X n1, X i N(µ 1, σ 1 ), i = 1, 2,..., n 1 oraz że y 1, y 2,..., y n2 są realizacjami próby prostej W naszym przykładzie : Y 1, Y 2,..., Y n2, Y i N(µ 2, σ 2 ), i = 1, 2,..., n 2. Chcemy zweryfikować hipotezę x 1 = 45,..., y 1 = 46,.... H 0 : µ 1 = µ 2 przeciwko hipotezie H 1 : µ 1 µ 2 Weryfikacja hipotezy o równości wariancji Przy założeniu, że: σ 1 = σ 2 (warunek "jednorodności wariancji" jest spełniony) moglibyśmy zastosować test Studenta dla jednorodnych wariancji dla prównania dwóch średnich. Ma on wiele zalet (z punktu widzenia teorii testowania hipotez). Dlatego pierwszym krokiem powinno być sprawdzenie hipotezy o równości wariancji: H j 0 : σ2 1 = σ 2 2 przeciwko H j 1 : σ2 1 σ 2 2. Odpowiedną statystyką testową dle weryfikacji H j 0 przeciwko Hj 1 jest F = S2 1 S 2 2 gdzie S 2 1 jest wariancją próbkową dla pierwszej próby, S 2 2 jest wariancją próbkową dla drugiej próby. Można pokazać, że F ma rozkład F n1 1,n 2 1 (rozkład F-Snedecora z n 1 1 i n 2 1 stopniami swobody). 1

Rozkład F-Snedecora 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 y 0 1 2 3 4 5 6 x Rysunek 1: Wykres gęstości rozkładu rozkładu F 4,30 ; obszar zakreskowany odpowiada wartościom większym niż F 0,975;4;30 = 3,25. Funkcja gęstości rozkładu F n1,n 2 patrz Koronacki i Mielniczuk (2001, str. 208). Hipoteza o równości wariancji obszar krytyczny Obszar krytyczny, dla poziomu istotności α, ma postać Weryfikacja może być również oparta na statystyce [0, F α/2;n1,n 2 ] [F 1 α/2,n1,n 2, ). H j 0 : σ2 1 = σ 2 2 przeciwko H j 1 : σ2 1 σ 2 2. F = max(s2 1, S 2 2) min(s 2 1, S2 2 ) ; obszar krytyczny (odpowiadający F ) ma postać: [F 1 α/2,n1,n 2, ) Przykład obliczenia s 2 1 = 108,3611; s 2 2 = 92,7111; widzimy, że s 2 1 s 2 2; f, realizacja statystyki testowej F, jest równa f = s2 1 s 2 = 1,168804. 2 Wartość kwantyla rzędu 0,975 rozkładu f 8,9 (oznaczmy ją przez f 0,975,8,9 ) jest równa f 0,975,8,9 = 4,101956, wartość statystyki testowej nie należy do obszaru krytycznego [4,101956, ), więc nie ma podstaw do odrzucenia hipotezy H j 0. 2

Testowanie hipotezy o równości średnich przypadek jednorodnych wariancji Jeśli X 1, X 2,..., X n1 jest próbą prostą, X i N(µ 1, σ), a Y 1, Y 2,..., Y n2 jest również próbą prostą, Y i N(µ 2, σ), (zauważ, że wariancje obu rozkładów, z których pochodzą próby, są równe!), wtedy można do weryfikacji hipotezy H 0 : µ 1 = µ 2 przeciwko H 1 : µ 1 µ 2 można zastosować "klasyczny" test t-studenta dla dwóch prób. Statystyka testowa ma postać: T = X Ȳ S X,Y, gdzie S X,Y = (n 1 1)S1 2 + (n 2 1)S2 2 n1 + n 2, n 1 + n 2 2 n 1 n 2 S 2 1 oznacza wariancję zmiennych X i, i = 1,..., n 1, S 2 2 oznacza wariancję zmiennych Y i, i = 1,..., n 2, a obszar krytyczny, dla poziomu istotności α (0, 1) : [t 1 α/2,n1+n 2 2, ). Przykład obliczenia Przyjmujemy α = 0,05 (poziom istotności testowania hipotezy); n 1 =9, n 2 = 10 x =51,88889 ȳ = 36,4 s 2 1 =108,3611, s 2 2 = 92,71111 s 2 x,y = (n 1 1)s 2 1 + (n 2 1)s 2 2 n 1 + n 2 = n 1 + n 2 2 n 1 n 2 8 108,3611 + 9 92,71111 = 9 + 10 9 + 10 2 9 10 = =21,12712 s x,y = 21,12712 = 4,596424 x ȳ 51,88889 36,4 t = = 3,369769. s x,y 4,596424 Odczytujemy z tablic rozkładu t-studenta (lub obliczamy korzystając z R-owskiego polecenia qt) t 0,975;17 = 2,109816. Wartość statystyki testowej należy do obszaru krytycznego, a zatem należy odrzucić hipotezę o równości liczebności pająków na jednostkę powierzchni w borze i dąbrowie. 3

Obliczenia w środowisku R Powyższe obliczenia można wykonać przy użyciu programu R w następujący sposób: > x [1] 45 57 30 61 52 64 50 60 48 > y [1] 46 32 39 34 46 31 37 26 52 21 > t.test(x,y,var.equal=true) Two Sample t-test data: x and y t = 3.3698, df = 17, p-value = 0.003638 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 5.791281 25.186497 sample estimates: mean of x mean of y 51.88889 36.40000 Wersje testu t dla przypadku niejednorodnych wariancji Jeśli nie można przyjąć założenia o jednorodności wariancji, wtedy należy użyć wersji testu t dla przypadku niejednorodnych wariancji takich jak: - test oparty na statystyce Cochrana-Coxa (por. Łomnicki, Rozdz. 7) - test oparty na aproksymacji Welcha (dostępny w pakiecie R) Należy pamiętać, że korzystanie z powyższych testów wymaga założenia normalności porównywanych populacji. Obliczenia przy braku założenia dotyczacego równości wariancji > t.test(x,y,var.equal=false) Welch Two Sample t-test data: x and y t = 3.3552, df = 16.413, p-value = 0.003907 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 5.722523 25.255255 sample estimates: mean of x mean of y 51.88889 36.40000 Obliczenia przy braku założenia dotyczacego równości wariancji komentarz Wartość statystyki testowej t- obliczana jest trochę inaczej niż w przypadku równych wariancji ; liczba stopni swobody nie jest liczbą całkowitą! 4

Polecana literatura J. Koronacki i J. Mielniczuk, Statystyka dla studentów kierunków technicznych i przyrodniczych, WNT 2001, str. 229-237. A. Łomnicki, Wprowadzenie do statystyki dla przyrodników, Wyd. 3, Rozdział 7. 5