Wykład 5 Problem dwóch prób - testowanie hipotez dla równości średnich

Podobne dokumenty
Problem dwóch prób: porównywanie średnich i wariancji z populacji o rozkładach normalnych. Wrocław, 23 marca 2015

Testy dla dwóch prób w rodzinie rozkładów normalnych

Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Statystyka matematyczna Testowanie hipotez dla średnich w rozkładzie normalnym. Wrocław, r

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

Wykład 7 Testowanie zgodności z rozkładem normalnym

Testowanie hipotez dla frakcji. Wrocław, 29 marca 2017

Testowanie hipotez dla proporcji. Wrocław, 13 kwietnia 2015

Wykład 11 Testowanie jednorodności

Wykład 10 Testy jednorodności rozkładów

Wykład 10 ( ). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego

Testowanie hipotez statystycznych.

Testy post-hoc. Wrocław, 6 czerwca 2016

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

Wykład 8 Dane kategoryczne

Wykład 9 Testy rangowe w problemie dwóch prób

Testowanie hipotez statystycznych.

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 3

1 Estymacja przedziałowa

Statystyka w analizie i planowaniu eksperymentu

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Statystyka w analizie i planowaniu eksperymentu

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych.

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Statystyka matematyczna. Wykład VI. Zesty zgodności

Wykład 5 Estymatory nieobciążone z jednostajnie minimalną war

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Statystyka matematyczna dla leśników

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Kolokwium ze statystyki matematycznej

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Statystyka Matematyczna Anna Janicka

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

Statystyczna analiza danych

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

Matematyka i statystyka matematyczna dla rolników w SGGW

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Statystyka matematyczna

Środowisko R Założenie normalności metody nieparametryczne Wykład R4; Weryfikacja założenia o normalności rozkładu populacji

STATYSTYKA MATEMATYCZNA WYKŁAD października 2009

S t a t y s t y k a, część 3. Michał Żmihorski

Wydział Matematyki. Testy zgodności. Wykład 03

Wykład 6 Estymatory efektywne. Własności asymptotyczne estym. estymatorów

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Testowanie hipotez statystycznych cd.

Testowanie hipotez statystycznych.

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Wykład 5 Teoria eksperymentu

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

Weryfikacja hipotez statystycznych testy dla dwóch zbiorowości

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Na podstawie dokonanych obserwacji:

Eksploracja Danych. Testowanie Hipotez. (c) Marcin Sydow

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Testowanie hipotez statystycznych

Przykład 1. (A. Łomnicki)

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

Estymacja parametrów w modelu normalnym

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Prawdopodobieństwo i statystyka

Wykład 3 Hipotezy statystyczne

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 11 DOŚWIADCZENIE JEDNOCZYNNIKOWE W UKŁADZIE CAŁKOWICIE LOSOWYM PORÓWNANIA SZCZEGÓŁOWE

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Własności statystyczne regresji liniowej. Wykład 4

Statystyka Matematyczna Anna Janicka

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

Wykład 3 Momenty zmiennych losowych.

1 Testowanie hipotez statystycznych

Statystyka matematyczna i ekonometria

Hipotezy statystyczne

Wykład 3 Momenty zmiennych losowych.

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Transkrypt:

Wykład 5 Problem dwóch prób - testowanie hipotez dla równości średnich Magdalena Frąszczak Wrocław, 22.03.2017r

Problem Behrensa Fishera Niech X = (X 1, X 2,..., X n ) oznacza próbę z rozkładu normalnego N (µ X, σ 2 X ), a Y = (Y 1, Y 2,..., Y m ) będzie próbą z rozkładu normalnego N (µ Y, σ 2 Y ) oraz σ2 X σ2 Y.

Problem Behrensa Fishera Niech X = (X 1, X 2,..., X n ) oznacza próbę z rozkładu normalnego N (µ X, σ 2 X ), a Y = (Y 1, Y 2,..., Y m ) będzie próbą z rozkładu normalnego N (µ Y, σ 2 Y ) oraz σ2 X σ2 Y. Testujemy hipotezę H 0 : µ X = µ Y przy alternatywie H 1 : µ X µ Y

Problem Behrensa Fishera Niech X = (X 1, X 2,..., X n ) oznacza próbę z rozkładu normalnego N (µ X, σ 2 X ), a Y = (Y 1, Y 2,..., Y m ) będzie próbą z rozkładu normalnego N (µ Y, σ 2 Y ) oraz σ2 X σ2 Y. Testujemy hipotezę H 0 : µ X = µ Y przy alternatywie H 1 : µ X µ Y Nie znaleziono dotychczas dokładnego rozwiązania tego problemu, istnieją jedynie rozwiązania przybliżone

Test Cochrana Coxa Statystyka testowa przyjmuje postać: C = S 2 X n X Ȳ + S2 Y m

Test Cochrana Coxa Statystyka testowa przyjmuje postać: C = S 2 X n X Ȳ + S2 Y m Przy założeniu H 0 rozkład statystyki C zależy od nieznanego stosunku σ X /σ Y.

Test Cochrana Coxa Statystyka testowa przyjmuje postać: C = S 2 X n X Ȳ + S2 Y m Przy założeniu H 0 rozkład statystyki C zależy od nieznanego stosunku σ X /σ Y. Dla danych n i m można znaleźć przybliżoną wartość c p (n, m) kwantyla rzędu p rozkładu zmiennej C

Test Cochrana Coxa Statystyka testowa przyjmuje postać: C = S 2 X n X Ȳ + S2 Y m Przy założeniu H 0 rozkład statystyki C zależy od nieznanego stosunku σ X /σ Y. Dla danych n i m można znaleźć przybliżoną wartość c p (n, m) kwantyla rzędu p rozkładu zmiennej C c p (n, m) = s 2 X n t p (n 1) + s2 Y m t p (m 1) s 2 X n + s2 Y m, gdzie sx 2, s2 Y oznaczają wartości wariancji z próby.

Test Cochrana Coxa Obszar krytyczny jest postaci: (, c 1 α/2 (n, m)] [c 1 α/2 (n, m), )

Test Welch Aspin Statystyka testowa przyjmuje postać: T = S 2 X n X Ȳ + S2 Y m

Test Welch Aspin Statystyka testowa przyjmuje postać: T = S 2 X n X Ȳ + S2 Y m Przy założeniu H 0 statystyka T ma rozkład studenta z liczbą stopni swobody przybliżoną równaniem: ( s 2 Xn + s2 Ym ) 2 df W = (s 2 X /n)2 n 1 + (s2 Y /m)2 m 1,

Przykład 5.1 W dwóch różnych sklepach tej samej sieci spytano pracowników o ich wiek, w celu sprawdzenia hipotezy, że w obu sklepach średni wiek praconików jest podobny. Pracownicy pierwszego sklepu tej sieci mają: 30, 27, 38, 35, 41, 27, 32, 35, 37, 39, 45 lat, a drugiego 30, 32, 33, 29, 31, 34, 33, 35, 37.

Przykład 5.1 W dwóch różnych sklepach tej samej sieci spytano pracowników o ich wiek, w celu sprawdzenia hipotezy, że w obu sklepach średni wiek praconików jest podobny. Pracownicy pierwszego sklepu tej sieci mają: 30, 27, 38, 35, 41, 27, 32, 35, 37, 39, 45 lat, a drugiego 30, 32, 33, 29, 31, 34, 33, 35, 37. Próby niezależne Test dla równości średnich Sprawdzenie założeń testu studenta: normalność danych, jednorodność wariancji

Przykład 5.1 - cd. Przetestujemy normalność obu prób korzystając z testu Shapiro-Wilka: H 0 : Rozkład wieku pracowników pierwszego/drugiego sklepu jest rozkładem normalnym. H 1 : Rozkład wieku pracowników pierwszego/drugiego sklepu nie jest rozkładem normalnym.

Przykład 5.1 - cd. Przetestujemy normalność obu prób korzystając z testu Shapiro-Wilka: H 0 : Rozkład wieku pracowników pierwszego/drugiego sklepu jest rozkładem normalnym. H 1 : Rozkład wieku pracowników pierwszego/drugiego sklepu nie jest rozkładem normalnym. Statystyki testowe przyjmują odpowiednio wartości: W X = 0.96 dla pierwszego sklepu W Y = 0.98 dla drugiego sklepu.

Przykład 5.1 - cd. Przyjmujemy poziom istotności α = 0.01, kwantyle rozkładu statystyki W są odpowiednio równe: w(0.01, 11) = 0.79 oraz w(0.01, 9) = 0.764.

Przykład 5.1 - cd. Przyjmujemy poziom istotności α = 0.01, kwantyle rozkładu statystyki W są odpowiednio równe: w(0.01, 11) = 0.79 oraz w(0.01, 9) = 0.764. W przypadku testu Shapiro-Wilka obszar odrzucenia hipotezy zerowej jest obszarem lewostronnym, tzn odrzucamy H 0, gdy wartości statystyki W < w(α, n). W naszym przypadku zarówno jak i W X = 0.96 > 0.79 = w(0.01, 11) W Y = 0.98 > 0.76 = w(0.01, 9), a zatem obie próby pochodzą z rozkładu normalnego.

Przykład 5.1 - cd. Test jednorodności wariancji: H 0 : σ 2 X = σ 2 Y przy alternatywie: H 1 : σ 2 X σ 2 Y

Przykład 5.1 - cd. Test jednorodności wariancji: H 0 : σx 2 = σy 2 przy alternatywie: H 1 : σx 2 σy 2 Wartość statystyki testowej: F = S 2 X S 2 Y = 29.72 5.55 = 5.23

Przykład 5.1 - cd. Test jednorodności wariancji: H 0 : σx 2 = σy 2 przy alternatywie: H 1 : σx 2 σy 2 Wartość statystyki testowej: F = S 2 X S 2 Y = 29.72 5.55 = 5.23 Przyjmijmy α = 0.05, Obszar krytyczny jest postaci (0, f 0.025 (10, 8)] [f 0.975 (10, 8), ) = (0, 0.259] [4.295, ).

Przykład 5.1 - cd. Test jednorodności wariancji: H 0 : σx 2 = σy 2 przy alternatywie: H 1 : σx 2 σy 2 Wartość statystyki testowej: F = S 2 X S 2 Y = 29.72 5.55 = 5.23 Przyjmijmy α = 0.05, Obszar krytyczny jest postaci (0, f 0.025 (10, 8)] [f 0.975 (10, 8), ) = (0, 0.259] [4.295, ). Odrzucamy hipotezę o jednorodności wariancji.

Przykład 5.1 - cd. Obie niezależne próby danych pochodzą z rozkładu normalnego Brak jednorodności wariancji Testujemy przy alternatywie: H 0 : µ X = µ Y H 1 : µ X µ Y

Przykład 5.1 - cd. Obie niezależne próby danych pochodzą z rozkładu normalnego Brak jednorodności wariancji Testujemy przy alternatywie: H 0 : µ X = µ Y H 1 : µ X µ Y Problem Behrensa Fishera

Test Cochrana Coxa Statystyka testowa: C = Przykład 5.1 - cd. X Ȳ 35.09 32.66 = S 2 X 11 + S2 Y 32.69 9 11 + 6.25 9 Niech α = 0.01. Obszar krytyczny jest postaci: = 1.26 (, c 0.995 (11, 9)] [c 0.995 (11, 9), )

Test Cochrana Coxa Statystyka testowa: C = Przykład 5.1 - cd. X Ȳ 35.09 32.66 = S 2 X 11 + S2 Y 32.69 9 11 + 6.25 9 Niech α = 0.01. Obszar krytyczny jest postaci: = 1.26 (, c 0.995 (11, 9)] [c 0.995 (11, 9), ) Wyznaczymy wartość c 0.995 (11, 9). c 0.995 (11, 9) = s X 2 11 t 0.995 (10)+ s2 Y 9 t 0.995 (8) = s X 2 11 + s2 Y 9 = 32.69 11 6.25 3.16+ 9 3.35 32.69 11 + 6.25 9 = 3.2

Przykład 5.1 - cd. Test Cochrana Coxa Wartość statystyki testowej C = 1.26 nie mieści się w zbiorze C : (, 3.2] [3.2, ), stąd nie mamy podstaw do odrzucenia hipotezy o równości średniego wieku pracowników w obu sklepach.

Przykład 5.1 - cd. Test Welch Aspin Statystyka testowa: T = X Ȳ 35.09 32.66 = = 1.26 S 2 X 11 + S2 Y 32.69 9 11 + 6.25 9

Przykład 5.1 - cd. Test Welch Aspin Statystyka testowa: T = X Ȳ 35.09 32.66 = S 2 X 11 + S2 Y 32.69 9 11 + 6.25 9 Wyznaczmy liczbę stopni swobody ( ) 2 sx 2 11 + s2 Y 9 df W = = (sx 2 /11)2 10 + (s2 Y /9)2 8 = 1.26 ( ) 2 32.69 11 + 6.25 9 (32.69/11) 2 10 + (6.25/9)2 8 = 14.24

Przykład 5.1 - cd. Test Welch Aspin Statystyka testowa: T = X Ȳ 35.09 32.66 = S 2 X 11 + S2 Y 32.69 9 11 + 6.25 9 Wyznaczmy liczbę stopni swobody ( ) 2 sx 2 11 + s2 Y 9 df W = = (sx 2 /11)2 10 + (s2 Y /9)2 8 = 1.26 ( ) 2 32.69 11 + 6.25 9 (32.69/11) 2 10 + (6.25/9)2 8 = 14.24 Kwantyl rozkładu studenta rzędu 0.995 z 14.24 stopniami swobody jest równy t 0.995 (14.24) = 2.96, a zatem obszar krytyczny jest postaci C : (, 2.96] [2.96, ).

Przykład 5.1 - cd. Test Welch Aspin Statystyka testowa: T = X Ȳ 35.09 32.66 = S 2 X 11 + S2 Y 32.69 9 11 + 6.25 9 Wyznaczmy liczbę stopni swobody ( ) 2 sx 2 11 + s2 Y 9 df W = = (sx 2 /11)2 10 + (s2 Y /9)2 8 = 1.26 ( ) 2 32.69 11 + 6.25 9 (32.69/11) 2 10 + (6.25/9)2 8 = 14.24 Kwantyl rozkładu studenta rzędu 0.995 z 14.24 stopniami swobody jest równy t 0.995 (14.24) = 2.96, a zatem obszar krytyczny jest postaci C : (, 2.96] [2.96, ). Nie mamy podstaw do odrzucenia hipotezy zerowej.

Przykład 5.1 - pakiet R x <-c (30,27,38,35,41,27,32,35,37,39,45) y <-c (30,32,33,29,31,34,33,35,37)

Przykład 5.1 - pakiet R x <-c (30,27,38,35,41,27,32,35,37,39,45) y <-c (30,32,33,29,31,34,33,35,37) shapiro. test (x) Shapiro-Wilk normality test data: x W = 0.9643, p-value = 0.8237 shapiro. test (y) Shapiro-Wilk normality test data: y W = 0.9857, p-value = 0.9871

Przykład 5.1 - pakiet R var. test (x,y) F test to compare two variances data: x and y F = 5.2305, num df = 10, denom df = 8, p-value = 0.02778 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 1.217786 20.163182 sample estimates: ratio of variances 5.230545

Przykład - pakiet R t. test (x,y) Welch Two Sample t-test data: x and y t = 1.2661, df = 14.247, p-value = 0.2258 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -1.675861 6.524346 sample estimates: mean of x mean of y 35.09091 32.66667

Literatura: Bartoszewicz J.,Wykłady ze statystyki matematycznej, PWN, Warszawa 1989. Koronacki J. i Mielniczuk J., Statystyka, dla studentów kierunków technicznych i przyrodniczych, WNT, 2001 Magiera M, Modele i metody statystyki matematycznej, część II, wnioskowanie statystyczne, Wrocław, 2007