Statystyka matematyczna - ZSTA LMO

Podobne dokumenty
Wykład 10 Testy jednorodności rozkładów

Rozwini cia asymptotyczne dla mocy testów przybli»onych

Statystyka matematyczna - ZSTA LMO

Wykład 9 Testy rangowe w problemie dwóch prób

Biostatystyka, # 5 /Weterynaria I/

5. (8 punktów) EGZAMIN MAGISTERSKI, r Matematyka w ekonomii i ubezpieczeniach

In»ynierskie zastosowania statystyki wiczenia

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Elementarna statystyka Dwie próby: porównanie dwóch proporcji (Two-sample problem: comparing two proportions)

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

EGZAMIN MAGISTERSKI, r Matematyka w ekonomii i ubezpieczeniach

Wykład 5 Problem dwóch prób - testowanie hipotez dla równości średnich

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Biostatystyka, # 4 /Weterynaria I/

Matematyka z elementami statystyki

Metody dowodzenia twierdze«

Wykład 11 Testowanie jednorodności

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

Problem dwóch prób: porównywanie średnich i wariancji z populacji o rozkładach normalnych. Wrocław, 23 marca 2015

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Testowanie hipotez statystycznych.

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

3. (8 punktów) EGZAMIN MAGISTERSKI, Biomatematyka

Ekonometria - wykªad 8

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Elementarna statystyka Wnioskowanie o regresji (Inference 2 czerwca for regression) / 13

Matematyka 1. Šukasz Dawidowski. Instytut Matematyki, Uniwersytet l ski

Statystyczna analiza danych

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Elementy geometrii w przestrzeni R 3

Wykªad 7. Ekstrema lokalne funkcji dwóch zmiennych.

Kolokwium ze statystyki matematycznej

Zdzisªaw Dzedzej, Katedra Analizy Nieliniowej pok. 611 Kontakt:

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

Elementy Modelowania Matematycznego Wykªad 1 Prawdopodobie«stwo

Ekonometria. wiczenia 2 Werykacja modelu liniowego. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

Funkcje wielu zmiennych

Ukªady równa«liniowych

Testowanie hipotez statystycznych.

x y x y x y x + y x y

ARYTMETYKA MODULARNA. Grzegorz Szkibiel. Wiosna 2014/15

Statystyka matematyczna Testowanie hipotez dla średnich w rozkładzie normalnym. Wrocław, r

Wydział Matematyki. Testy zgodności. Wykład 03

Ekonometria. wiczenia 4 Prognozowanie. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

Ciaªa i wielomiany. 1 Denicja ciaªa. Ciaªa i wielomiany 1

EGZAMIN MAGISTERSKI, r Matematyka w ekonomii i ubezpieczeniach. a) (6 pkt.) oblicz intensywno± pªaconych skªadek;

Wykład 9 Wnioskowanie o średnich

1 Poj cia pomocnicze. Przykªad 1. A A d

Testy nieparametryczne

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych

Pakiety statystyczne - Wykªad 8

Twierdzenie Wainera. Marek Czarnecki. Warszawa, 3 lipca Wydziaª Filozoi i Socjologii Uniwersytet Warszawski

Statystyka matematyczna. Wykład VI. Zesty zgodności

CAŠKA NIEOZNACZONA. Politechnika Lubelska. Z.Šagodowski. 18 lutego 2016

ARYTMETYKA MODULARNA. Grzegorz Szkibiel. Wiosna 2014/15

gdzie wektory α i tworz baz ortonormaln przestrzeni E n

Modele liniowe i mieszane na przykªadzie analizy danych biologicznych - Wykªad 1

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

STATYSTYKA

Przekroje Dedekinda 1

Liniowe równania ró»niczkowe n tego rz du o staªych wspóªczynnikach

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

det A := a 11, ( 1) 1+j a 1j det A 1j, a 11 a 12 a 21 a 22 Wn. 1 (Wyznacznik macierzy stopnia 2:). = a 11a 22 a 33 +a 12 a 23 a 31 +a 13 a 21 a 32

Modele liniowe i mieszane na przykªadzie analizy danych biologicznych - Wykªad 6

Ekonometria. wiczenia 8 Modele zmiennej jako±ciowej. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Przeksztaªcenia liniowe

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Zbiory i odwzorowania

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

ARYTMETYKA MODULARNA. Grzegorz Szkibiel. Wiosna 2014/15

STATYSTYCZNE MODELOWANIE DANYCH BIOLOGICZNYCH

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych.

Estymacja parametru gªadko±ci przy u»yciu falek splajnowych

Statystyka. Šukasz Dawidowski. Instytut Matematyki, Uniwersytet l ski

Informacje pomocnicze

punkcie. Jej granica lewostronna i prawostronna w punkcie x = 2 wynosz odpowiednio:

Janusz Adamowski METODY OBLICZENIOWE FIZYKI Zastosowanie eliptycznych równa«ró»niczkowych

Metody probablistyczne i statystyka stosowana

Elementy statystyki STA - Wykład 5

VIII WYKŁAD STATYSTYKA. 7/05/2014 B8 sala 0.10B Godz. 15:15

Testy dla dwóch prób w rodzinie rozkładów normalnych

Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

1 Przypomnienie wiadomo±ci ze szkoªy ±redniej. Rozwi zywanie prostych równa«i nierówno±ci

Testowanie hipotez statystycznych cd.

Test t-studenta dla jednej średniej

Cz ± III. Testowanie hipotez statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Czy funkcja zadana wzorem f(x) = ex e x. 1 + e. = lim. e x + e x lim. lim. 2 dla x = 1 f(x) dla x (0, 1) e e 1 dla x = 1

Transkrypt:

Statystyka matematyczna - ZSTA LMO Šukasz Smaga Wydziaª Matematyki i Informatyki Uniwersytet im. Adama Mickiewicza w Poznaniu Wykªad 4 Šukasz Smaga (WMI UAM) ZSTA LMO Wykªad 4 1 / 18

Wykªad 4 - zagadnienia test znaków dla jednej próby zastosowanie testu znaków w problemie jednorodno±ci dwóch prób zale»nych rangi testy oparte na rangach test W Wilcoxona test U Manna-Whitneya Šukasz Smaga (WMI UAM) ZSTA LMO Wykªad 4 2 / 18

Test znaków dla jednej próby Zaªó»my,»e X = (X 1, X 2,..., X n ) jest prób prost z populacji o rozkªadzie opisanym ci gª dystrybuant F. Werykujemy hipotez zerow dotycz c kwantyla z rozkªadu o dystrybuancie F. Dokªadniej: H 0 : F 1 (p) = a przeciwko ró»nym hipotezom alternatywnym, gdzie p (0, 1) i a R s ustalone. Na przykªad dla p = 1 2 otrzymujemy median (F 1 ( 1 2 ) = Me), dla p = 1 4 otrzymujemy pierwszy kwartyl (F 1 ( 1 4 ) = Q 1), dla p = 3 4 otrzymujemy trzeci kwartyl (F 1 ( 3 4 ) = Q 3). Šukasz Smaga (WMI UAM) ZSTA LMO Wykªad 4 3 / 18

Test znaków dla jednej próby Znakujemy prób X, tzn. konstruujemy prób Y = (Y 1, Y 2,..., Y n ), gdzie { 1, dla Xi > a, Y i = 0, dla X i < a. Poniewa» dystrybuanta F jest ci gªa, P(X i = a) = 0. Jednak, gdyby x i = a, to obserwacj x i usuwamy z próbki x. Statystyka testowa testu znaków ma posta n S(X) = Y i. i=1 H 1 : F 1 (p) a F 1 (p) < a F 1 (p) > a Obszar krytyczny B = {x : S(x) < k α lub S(x) > n k α }, k α -najwi ksze B = {x : S(x) < k α }, k α -najwi ksze B = {x : S(x) > k α }, k α -najmniejsze Šukasz Smaga (WMI UAM) ZSTA LMO Wykªad 4 4 / 18

Test znaków dla jednej próby Warto± k α wybieramy na podstawie warunku P 0 (X B) α korzystaj c z faktu,»e przy prawdziwo±ci hipotezy zerowej S b(n, 1 p). Przy du»ej liczebno±ci próby, wyznaczamy k α za pomoc rozkªadu granicznego podanego w nast puj cym twierdzeniu. Twierdzenie 1 Przy prawdziwo±ci hipotezy zerowej S n(1 p) np(1 p) d N (0, 1). Šukasz Smaga (WMI UAM) ZSTA LMO Wykªad 4 5 / 18

Zastosowanie testu znaków w problemie dwóch prób zale»nych Zaªó»my,»e X = (X 1, X 2,..., X n ), Y = (Y 1, Y 2,..., Y n ) s zale»nymi próbami prostymi z populacji o rozkªadach, których dystrybuanty F 1 i F 2 s ci gªe. Werykujemy ukªad hipotez H 0 : F 1 = F 2, H 1 : F 1 F 2. (1) Niech Z = (Z 1, Z 2,..., Z n ), gdzie Z i = Y i X i, i = 1, 2,..., n. Przy prawdziwo±ci hipotezy zerowej P 0 (Y i > X i ) = P 0 (Y i X i > 0) = P 0 (Z i > 0) = 1 2. St d gdy H 0 : F 1 = F 2, to H Z 1 0 : Me(Z) = 0 (FZ ( 1 2 ) = 0), gdzie Z Z i. Zatem w celu werykacji ukªadu hipotez (1) mo»emy wykorzysta test znaków zastosowany do próby Z i ukªadu hipotez H 0 : F 1 Z ( 1 2 ) = 0, H 1 : F 1 Z ( 1 2 ) 0. Šukasz Smaga (WMI UAM) ZSTA LMO Wykªad 4 6 / 18

Rangi Zaªó»my,»e X = (X 1, X 2,..., X n ) jest prób prost z populacji o rozkªadzie opisanym ci gª dystrybuant F. Rangujemy prób X, tzn. konstruujemy prób R = (R 1, R 2,..., R n ), gdzie R i = ranga(x i ). Przykªad 1 Niech x = (4, 7, 1, 5). Zatem x 1 = 4, x 2 = 7, x 3 = 1, x 4 = 5 oraz x (1) = 1, x (2) = 4, x (3) = 5, x (4) = 7. St d r = (2, 4, 1, 3). Z ci gªo±ci dystrybuanty F wynika,»e obserwacje x i, i = 1, 2,..., n powinny by parami ró»ne. Jednak, gdyby x i = x j, i j i wtedy x (k) = x (k+1) dla pewnego k, to obserwacjom x i i x j przypisujemy rangi k+(k+1) 2 = k + 1 2. Przykªad 2 Gdy x = (5, 7, 1, 5), x (1) = 1, x (2) = x (3) = 5, x (4) = 7 i r = (2.5, 4, 1, 2.5). Šukasz Smaga (WMI UAM) ZSTA LMO Wykªad 4 7 / 18

Rangi W takim ukªadzie suma rang nie zmienia si i zale»y tylko od liczby obserwacji. Jednak nie tylko suma rang jest staªa o czym mówi poni»szy lemat. Lemat 1 R = 1 n n i=1 R i = n + 1 2, S2 R = 1 n 1 n (R i R) 2 = i=1 n(n + 1) 12 Zatem R i SR 2 s staªe, wi c nie mo»na przy ich pomocy przeprowadzi»adnego wnioskowania. Šukasz Smaga (WMI UAM) ZSTA LMO Wykªad 4 8 / 18

Test W Wilcoxona Zaªó»my,»e X = (X 1, X 2,..., X n1 ), Y = (Y 1, Y 2,..., Y n2 ) s niezale»nymi próbami prostymi z populacji o rozkªadach, których dystrybuanty F µ1 i F µ2 s ci gªe oraz speªniaj warunek dla pewnej ci gªej dystrybuanty F. F µ (x) = F (x µ) Parametr µ nazywa si parametrem poªo»enia. Przykªadowo jest nim mediana w rozkªadzie normalnym, Laplace'a oraz Cauchy'ego. Werykujemy hipotez zerow H 0 : µ 1 = µ 2 przeciwko ró»nym hipotezom alternatywnym. Šukasz Smaga (WMI UAM) ZSTA LMO Wykªad 4 9 / 18

Test W Wilcoxona Rangujemy poª czon prób (X, Y) = (X 1,..., X n1, Y 1,..., Y n2 ), uzyskuj c próby R = (R 1, R 2,..., R n1 ) - rangi x-ów, S = (S 1, S 2,..., S n2 ) - rangi y-ów. Statystyka testowa testu W Wilcoxona (statystyka W Wilcoxona): n 2 W (X, Y) = S i. Przy prawdziwo±ci hipotezy zerowej, wszystkie ukªady rang s równo prawdopodobne. Oznacza to,»e rozkªad statystyki W Wilcoxona nie zale»y od dystrybuanty F przy prawdziwo±ci hipotezy zerowej. Liczba wszystkich ukªadów rang w poª czonej próbie wynosi ( n 1 +n 2 n 1 ) = ( n1 +n 2 n 2 ) = (n 1 +n 2 )! n 1!n 2!. H 1 : Obszar krytyczny i=1 µ 1 > µ 2 B = {(x, y) : W (x, y) k α }, k α -najwi ksze µ 1 < µ 2 B = {(x, y) : W (x, y) k α }, k α -najmniejsze Šukasz Smaga (WMI UAM) ZSTA LMO Wykªad 4 10 / 18

Test W Wilcoxona - przykªad Przykªad 3 Niech X = (X 1, X 2, X 3 ), Y = (Y 1, Y 2 ) b d dwiema niezale»nymi próbami prostymi z populacji o ci gªych dystrybuantach F µ1 i F µ2 odpowiednio, gdzie µ 1, µ 2 R s nieznanymi parametrami oraz dystrybuanta F µ speªnia warunek F µ (x) = F (x µ) dla pewnej ci gªej dystrybuanty F. Za pomoc testu Wilcoxona, werykujemy hipotez H 0 : µ 1 = µ 2 przy alternatywie H 1 : µ 1 > µ 2. 1 Wyznacz obszar krytyczny testu W Wilcoxona przy α = 0,1. 2 Wykonaj wyprowadzony test na nast puj cych danych x = (1, 3, 8) oraz y = (2, 7). Šukasz Smaga (WMI UAM) ZSTA LMO Wykªad 4 11 / 18

Test W Wilcoxona - przykªad Wyznaczamy rozkªad statystyki W przy prawdziwo±ci hipotezy zerowej. Liczba ukªadów rang w poª czonej próbie wynosi (3+2)! 3!2! = 10. Wszystkie ukªady rang i odpowiadaj ce im warto±ci statystyki W Wilcoxona przedstawia tabela: Ukªad rang w rrrss 9 rrsrs 8 rrssr 7 rsrrs 7 rsrsr 6 rssrr 5 srrrs 6 srrsr 5 srsrr 4 ssrrr 3 Šukasz Smaga (WMI UAM) ZSTA LMO Wykªad 4 12 / 18

Test W Wilcoxona - przykªad Zatem rozkªad statystyki W Wilcoxona przy prawdziwo±ci hipotezy zerowej przedstawia poni»sza tabela: w 3 4 5 6 7 8 9 P 0 (W = w) 1 10 1 10 Wyznaczamy staª k α, pojawiaj c si w obszarze krytycznym, na podstawie warunku 2 10 2 10 2 10 1 10 P 0 ((X, Y) B) = P 0 (W k α ) α. Skoro α = 0,1 i P 0 (W 3) = P 0 (W = 3) = 0,1, to k α = 3 i obszar krytyczny testu W Wilcoxona ma posta : B = {(x, y) : W (x, y) 3}. 1 10 Šukasz Smaga (WMI UAM) ZSTA LMO Wykªad 4 13 / 18

Test W Wilcoxona - przykªad Dla danych x = (1, 3, 8) oraz y = (2, 7) mamy: xy (1) = 1, xy (2) = 2, xy (3) = 3, xy (4) = 7, xy (5) = 8, a st d Zatem r = (1, 3, 5), s = (2, 4). W (x, y) = 2 + 4 = 6. Skoro W (x, y) = 6 > 3 = k α, to nie ma podstaw do odrzucenia H 0. Šukasz Smaga (WMI UAM) ZSTA LMO Wykªad 4 14 / 18

Test W Wilcoxona Twierdzenie 2 Gdy w statystyce testowej testu t-studenta dla dwóch prób niezale»nych zmienne X i i Y j zast pimy przez ich rangi R i i S j, i = 1,..., n 1, j = 1,..., n 2, uzyskane wyra»enie b dzie ±ci±le monotoniczn funkcj statystyki W Wilcoxona. T (X, Y) = X Ȳ n1 n 2 (n1 1)SX 2+(n 2 1)SY 2 n 1 + n 2 T W (R, S) = n 1 +n 2 2 R S n1 n 2 n 1 + n 2 = (n1 1)S 2 R +(n 2 1)S 2 S n 1 +n 2 2 1 n 1 (a W ) 1 n 2 W 2(n1 +n 2 ) 1 3 a 1 n 1 (a W ) 2 1 n 2 W 2 n 1 n 2 (n 1 + n 2 2) n 1 + n 2, gdzie a = (n 1 + n 2 )(n 1 + n 2 + 1)/2. Šukasz Smaga (WMI UAM) ZSTA LMO Wykªad 4 15 / 18

Test U Manna-Whitneya Przyjmujemy takie same zaªo»enia i rozwa»amy te same hipotezy jak w te±cie W Wilcoxona. Statystyka U Manna-Whitneya jest postaci: n 2 n 1 U = I (X i < Y j ), j=1 i=1 gdzie I (x i < y j ) = { 1, gdy xi < y j, 0, gdy x i y j. Lemat 2 Je»eli W oznacza statystyk Wilcoxona, to U = W 1 2 n 2(n 2 + 1). Šukasz Smaga (WMI UAM) ZSTA LMO Wykªad 4 16 / 18

Test U Manna-Whitneya Twierdzenie 3 Przy prawdziwo±ci hipotezy zerowej Z = U E 0(U) Var0 (U) d N(0, 1), gdzie E 0 (U) = n 1n 2 2, Var 0(U) = n 1n 2 (n 1 + n 2 + 1). 12 Zauwa»my,»e (przy H 1 : µ 1 < µ 2 ) B = {(x, y) : W (x, y) k α } = {(x, y) : U(x, y) k U α } = {(x, y) : Z(x, y) k Z α }. Z powy»szego twierdzenia otrzymujemy,»e przy du»ej liczbie obserwacji mo»emy przyj k Z α = z(1 α). Šukasz Smaga (WMI UAM) ZSTA LMO Wykªad 4 17 / 18

Test U Manna-Whitneya Zatem przy du»ych próbach mo»emy korzysta z nast puj cych postaci obszarów krytycznych: H 1 : Obszar krytyczny µ 1 > µ 2 B = {(x, y) : Z(x, y) z(1 α)} µ 1 < µ 2 B = {(x, y) : Z(x, y) z(1 α)} Šukasz Smaga (WMI UAM) ZSTA LMO Wykªad 4 18 / 18