Cz ± III. Testowanie hipotez statystycznych
|
|
- Julia Zakrzewska
- 9 lat temu
- Przeglądów:
Transkrypt
1 Cz ± III Testowanie hipotez statystycznych 85
2
3 Rozdziaª 7 Testy istotno±ci W tym rozdziale spróbujemy wyja±ni, na czym polega zagadnienie testowania hipotez statystycznych. Poka»emy, jak konstruuje si tak zwane testy istotno±ci. Skoncentrujemy si na kilku wa»nych i typowych przykªadach. Nasze rozwa»ania b d miaªy charakter wst pny i heurystyczny. Bardziej systematyczn teori przedstawimy w rozdziale nast pnym. Przykªad wst pny Matematyczny model zjawiska losowego sprowadza si do okre±lenia rozkªadu prawdopodobie«stwa P obserwacji X na przestrzeni X. Przez hipotez statystyczn rozumiemy, najogólniej mówi c, pewn wypowied¹ na temat rozkªadu prawdopodobie«stwa rz dz cego zjawiskiem, które nas interesuje. Zajmiemy si najprostsz sytuacj. Rozwa»amy na razie jeden, ustalony rozkªad P. Pytamy, czy opisuje on poprawnie przebieg do±wiadczenia losowego. Stawiamy hipotez : nasz model probabilistyczny jest zgodny z rzeczywisto±ci. Ogólna zasada, wykraczaj ca daleko poza statystyk, jest taka: powinni±my odrzuci hipotez, je±li rezultaty do±wiadczenia oka» si sprzeczne z przewidywaniami wynikaj cymi z modelu. Specyka modeli probabilistycznych polega jednak na tym,»e potramy przewidzie tylko prawdopodobie«stwo poszczególnych wyników. Zmodykujemy wi c ogóln zasad. Powinni±my odrzuci hipotez, je±li wynik do±wiadczenia jest bardzo maªo prawdopodobny, to znaczy model przewiduje taki wynik z maªym prawdopodobie«stwem. Innymi sªowy, wybieramy pewien zbiór K X taki,»e P(X K) α, gdzie α jest odpowiednio maª liczb, zwan poziomem istotno±ci. Je±li w wyniku do±wiadczenia stwierdzimy,»e zaszªo zdarzenie X K, to powinni±my zw tpi w poprawno± naszego modelu, czyli odrzuci postawion przez nas hipotez statystyczn. Zbiór K nazywamy obszarem krytycznym testu, za± caªa procedura nosi nazw testu istotno±ci. 87
4 88 ROZDZIAŠ 7. TESTY ISTOTNO CI Przykªad (Czy prawdopodobie«stwo jedynki jest równe 1/6?). Wykonujemy 300 rzutów kostk do gry. Je±li kostka jest symetryczna i rzuty wykonujemy rzetelnie, to zmienna losowa X = N 1 równa liczbie wyrzuconych jedynek ma rozkªad dwumianowy Bin(300, 1/6). Mamy jednak pewne w tpliwo±ci, czy kasyno nie u»ywa obci»onej kostki, w której jedynka ma prawdopodobie«stwo mniejsze ni» 1/6. Je±li w wyniku do±wiadczenia ani ani razu nie otrzymamy jedynki, musimy podejrzewa,»e co± jest nie w porz dku. Mo»e kostka w ogóle nie ma ±ciany oznaczonej jedn kropk? Co prawda, zdarzenie X = 0 w modelu symetrycznej kostki jest mo»liwe ale skrajnie maªo prawdopodobne, P(X = 0) = (5/6) Nie jeste±my skªonni wierzy w tak wyj tkowy traf. Odrzucamy, bez wielkiego wahania, hipotez o zgodno±ci modelu. Jak post pi je±li otrzymamy, powiedzmy, 33 jedynki, nie jest a» tak jasne. Czy to wynik zgodny z hipotez o rzetelno±ci kostki, czy te» jest podstaw do odrzucenia tej hipotezy? Rozpatrzymy spraw bardziej systematycznie. Stawiamy hipotez H 0 : X Bin(300, 1/6). Zdecydujemy si na taki przepis post powania: je±li X < c to odrzucamy H 0 ; je±li X c to pozostajemy przy H 0. dla pewnej liczby progowej c, testu. Próg c ustalimy w nast puj cy sposób. Wybierzmy poziom istotno±ci, powiedzmy α = Uznamy,»e zaj±cie zdarzenia o prawdopodobie«- stwie mniejszym ni» α jest dostatecznym powodem do odrzucenia H 0. Powinni±my wi c wybra c tak, aby P(X < c) Mamy przy tym na my±li prawdopodobie«stwo obliczone przy zaªo»eniu,»e H 0 jest prawdziwa. Šatwo przekona si,»e P(X < 36) = , a wi c ostatecznie nasz test na poziomie istotno±ci 0.01 jest nast puj cy: Odrzucamy H 0 je±li X < 36. Obszarem krytycznym naszego testu jest podzbiór K = {0, 1,..., 35} przestrzeni obserwacji X = {0, 1,..., 300}. Je»eli wynikiem do±wiadczenia s 33 jedynki, to opisana powy»ej reguªa decyzyjna odrzuca H 0. Inne spojrzenie na ten sam test jest nast puj ce. Obliczamy prawdopodobie«stwo otrzymania wyniku takiego jak 33 lub gorszego (za gorszy uznajemy zbyt maª liczb jedynek), przy zaªo»eniu H 0. Mówimy,»e p-warto± (lub poziom krytyczny testu) jest w naszym przypadku równa P = P(X 33) = Porównujemy p-warto± z zaªo»onym poziomem istotno±ci. Odrzucamy H 0 je±li P < 0.01.
5 Obie reguªy s równowa»ne, to znaczy prowadz do takiej samej decyzji. Niemniej obliczanie p-warto±ci stwarza mo»liwo± (lub pokus ) mierzenia stopnia przekonania o nieprawdziwo- ±ci H 0. Zwró my uwag,»e nasz test reaguje na odst pstwa od prawdopodobie«stwa 1/6 tylko w dóª. Mówimy,»e jest to test hipotezy zerowej H 0 : prawdopodobie«stwo jedynki = 1/6 przeciwko hipotezie alternatywnej H 1 : prawdopodobie«stwo jedynki < 1/6. Je±li rozwa»ymy inn jednostronn alternatyw, H 1 : prawdopodobie«stwo jedynki > 1/6, to test powinien odrzuca H 0 je±li X > c, dla odpowiednio dobranego c. Wybór c = 65 prowadzi do testu na poziomie istotno±ci α = 0.01, bo P(X > 65) = Mo»na równie» skonstruowa test H 0 przeciwko dwustronnej alternatywie H 1 : prawdopodobie«- stwo jedynki 1/6. Do tej dyskusji jeszcze wrócimy. Podsumujmy rozwa»ania z powy»szego przykªadu. Mieli±my w nim do czynienia z hipotez H 0, która precyzuje dokªadnie jeden rozkªad prawdopodobie«stwa P. Mówimy,»e jest to hipoteza prosta. Test hipotezy H 0 na poziomie α speªnia postulat P( odrzucamy H 0 ) α, gdzie prawdopodobie«stwo jest obliczone przy zaªo»eniu prawdziwo±ci H 0. Konstrukcja testu istotno±ci dopuszcza du» dowolno±. Wybór obszaru krytycznego zale»y od tego, przed jak ewentualno±ci chcemy si zabezpieczy, czyli jaka jest hipoteza alternatywna H 1. Sposób obliczania p-warto±ci 1 te» zale»y od wyboru H 1 (bo musimy sprecyzowa, jakie wyniki uznajemy za gorsze, bardziej ±wiadcz ce przeciw H 0 ). Rozwa»my statystyk T = T (X) tak,»e du»e warto±ci T ±wiadcz przeciw H 0 na korzy± H 1. Je±li dla zaobserwowanej warto±ci X = x otrzymali±my warto± statystyki t = T (x), to p-warto± testu jest liczb P = P(T (X) t), gdzie prawdopodobie«stwo jest obliczone przy zaªo»eniu H 0. Innymi sªowy, p-warto± jest prawdopodobie«stwem, z jakim nale»aªoby oczekiwa wyniku takiego jak faktycznie otrzymany lub gorszego je±li hipoteza zerowa byªby prawdziwa. Oczywi±cie, maªa p-warto± ±wiadczy przeciw H 0. Je±li c jest kwantylem rz du 1 α statystyki testowej T, to zdarzenie T > c zachodzi wtedy i tylko wtedy, gdy p < α. Test na poziomie istotno±ci α mo»emy sformuªowa dwojako. Odrzucamy H 0 na rzecz H 1, je±li T > c lub równowa»nie, je±li p < α. 1 U»ywamy tu bardziej rozpowszechnionego terminu p-warto± (dosªowne tªumaczenie angielskiego p- value) zamiast poprawnej ale wychodz cej z u»ycia nazwy poziom krytyczny. 89
6 90 ROZDZIAŠ 7. TESTY ISTOTNO CI Poniewa» p-warto± jest obliczona na podstawie danych, jest wi c statystyk, zmienn losow, i mo»emy mówi o jej rozkªadzie prawdopodobie«stwa. Niech Q(t) = P(T (X) t) (prawdopodobie«stwo obliczamy przy zaªo»eniu,»e H 0 jest prawdziwa, czyli X P). Z denicji, p-warto± testu jest obliczana zgodnie ze wzorem P = Q(T (X)). Nast puj cy fakt wynika bezpo±rednio z okre±lenia p-warto±ci Stwierdzenie. Zaªó»my,»e H 0 jest prosta i rozkªad statystyki testowej jest ci gªy. Przy zaªo»eniu prawdziwo±ci H 0, p-warto± testu jest zmienn losow o rozkªadzie U(0, 1) (jednostajnym na przedziale [0, 1]). Dowód. Funkcja Q jest ci gªa z zaªo»enia i oczywi±cie nierosn ca. Przeprowadzimy dowód zakªadaj c dodatkowo,»e Q jest na przedziale {x : 0 < Q(x) < 1} ±ci±le malej ca (bez tego zaªo»enia rozumowanie wymaga tylko nieznacznych modykacji, ale pomi«my szczegóªy). Niech Q 1 b dzie funkcj odwrotn do Q. Obliczmy dystrybuant zmiennej losowej Q(T ). Dla 0 < u < 1 mamy P(P u) = P(Q(T ) u) (z denicji P) = P(T Q 1 (u)) (bo Q 1 jest funkcj malej c ) = Q(Q 1 (u)) = u (z denicji funkcji Q), a to jest dystrybuanta rozkªadu U(0, 1). Oczywi±cie, je±li H 0 nie jest prawdziwa, to rozkªad p-warto±ci nie jest jednostajny. Jest po» dane,»eby byª jak najbardziej skupiony na warto±ciach bliskich zeru (bo chcemy,»eby test rozpoznawaª nieprawdziwo± hipotezy zerowej). 7.1 Kilka wybranych testów istotno±ci Test proporcji W sytuacji takiej jak w Przykªadzie 7.0.1, powszechnie u»ywa si testów opartych na przybli»eniu rozkªadu dwumianowego rozkªadem normalnym. Zakªadamy,»e obserwujemy liczb sukcesów w schemacie Bernoulli'ego i stawiamy hipotez H 0 : prawdopodobie«stwo sukcesu = p.
7 7.1. KILKA WYBRANYCH TESTÓW ISTOTNO CI 91 Z Twierdzenia de Moivre'a - Laplace'a (CTG dla schematu Bernoulli'ego) wynika,»e Bin(n, p) N(np, np(1 p)), przynajmniej dla dostatecznie du»ych n (niektóre ¹ródªa zalecaj stosowanie tego przybli-»enia, je±li np 5 i n(1 p) 5). Rozpatrzymy kolejno zagadnienia werykacji hipotezy zerowej przeciw alternatywie lewostronnej, prawostronnej i dwustronnej. Podamy testy na poziomie istotno±ci (w przybli»eniu) α. Niech z 1 α b dzie kwantylem rozkªadu N(0, 1), to znaczy Φ(z 1 α ) = 1 α. Test H 0 przeciwko alternatywie H 1 : prawdopodobie«stwo sukcesu < p. Odrzucamy H 0, je±li X np < z 1 α np(1 p). ( X np Reguªa obliczania p-warto±ci jest nast puj ca: p Φ ). np(1 p) Test H 0 przeciwko alternatywie H 1 : prawdopodobie«stwo sukcesu > p. Odrzucamy H 0, je±li X np > z 1 α np(1 p). ( Reguªa obliczania p-warto±ci: p Φ ). X np np(1 p) Test H 0 przeciwko alternatywie H 1 : prawdopodobie«stwo sukcesu p: Odrzucamy H 0 je±li X np > z 1 α/2 np(1 p) (zauwa»my zamian z1 α na z 1 α/2 ). ( X np Reguªa obliczania p-warto±ci jest nast puj ca: p 2Φ ). np(1 p) Ze wzgl du na pó¹niejsze uogólnienia, napiszmy ten ostatni, dwustronny test w innej, równowa»nej formie: Odrzucamy H 0 je±li (X np)2 np(1 p) > χ2 1 α(1) gdzie χ 2 1 α(1) = z 2 1 α/2 jest kwantylem rozkªadu chi-kwadrat z jednym stopniem swobody.
8 92 ROZDZIAŠ 7. TESTY ISTOTNO CI Uwaga. Opisali±my test przybli»ony, oparty na teorii asymptotycznej. Istnieje do± prosty test dokªadny. Przybli»ony test ma t zalet dydaktyczn,»e w sposób naturalny uogólnia si na przypadek do±wiadcze«o k > 2 mo»liwych wynikach (zamiast dwóch: sukces/pora»ka). Tym uogólnieniem jest sªawny test χ 2. Test chi-kwadrat Jest to jeden z klasycznych i najcz ±ciej stosowanych testów statystycznych. Wyobra¹my sobie,»e powtarzamy n-krotnie do±wiadczenie losowe, które ma k mo»liwych wyników. Wyniki kolejnych do±wiadcze«s zmiennymi losowymi X 1,..., X n o warto±ciach w zbiorze X = {w 1,..., w k }. Przypu± my,»e te zmienne s niezale»ne i ka»da z nich ma ten sam rozkªad prawdopodobie«stwa dany tabelk wynik w 1 w i w k prawdopodobie«stwo p 1 p i p k gdzie p i = P(X j = w i ) (oczywi±cie, p p k = 1). Rezultaty do±wiadcze«podsumujmy w postaci tabelki powtórze«: wynik w 1 w i w k liczba do±wiadcze«n 1 N i N k wynik w 1 w i w k liczba do±wiadcze«n 1 N i N k gdzie N i = n j=1 1(X j = w i ) jest liczb do±wiadcze«, których wynikiem jest w i (oczywi±cie, N N k = n). Je±li nasze przypuszczenia s sªuszne, to zmienne losowe N 1,..., N k maj rozkªad wielomianowy Mult(n, p 1,..., p k ), to znaczy n! P(N 1 = n 1,..., N k = n k ) = n 1! n k! pn 1 1 p n k k. Najlepiej patrze na nasze do±wiadczenie jak na losowe wrzucanie n kul do k komórek (wielko± i-tej komórki jest proporcjonalna do p i ). Test hipotezy H 0 : (N 1,..., N k ) Mult(n, p 1,..., p k ) przeprowadzamy w nast puj cy sposób. Obliczamy statystyk chi-kwadrat: (7.1.1) χ 2 = k i=1 (N i np i ) 2 np i. Dla wyznaczenia warto±ci krytycznej testu lub p-warto±ci, korzystamy z nast puj cego faktu, którego dowód pominiemy.
9 7.1. KILKA WYBRANYCH TESTÓW ISTOTNO CI Stwierdzenie. Je»eli H 0 jest prawdziwa i n, to rozkªad statystyki χ 2 danej wzorem (7.1.1) zmierza do rozkªadu χ 2 (k 1) (chi-kwadrat z k 1 stopniami swobody). Test na poziomie istotno±ci α (w przybli»eniu) jest nast puj c reguª post powania: odrzucamy H 0 je±li χ 2 > c, gdzie c = χ 2 1 α(k 1) jest kwantylem rz du 1 α rozkªadu χ 2 (k 1) Przykªad (Czy ko± jest rzetelna?). Przypu± my,»e wykonali±my 150 rzutów kostk. Wyniki do±wiadczenia podsumujmy w nast puj cej tabelce: liczba oczek liczba rzutów Stawiamy hipotez,»e ko± jest rzetelna, czyli H 0 : (N 1, N 2, N 3, N 4, N 5, N 6 ) Mult(150, 1/6, 1/6, 1/6, 1/6, 1/6, 1/6). Warto± statystyki testowej jest równa χ 2 (15 25)2 (27 25)2 (36 25)2 = (17 25)2 (26 25)2 (29 25) = Przeprowadzimy test tej hipotezy na poziomie istotno±ci Odczytujemy z tablic kwantyl rz du 0.95 rozkªadu chi-kwadrat z 6 1 = 5 stopniami swobody: χ (5) = Poniewa» > 11.7, odrzucamy H 0. Nale»y przypuszcza,»e ko± nie jest symetryczna. Zamiast odczyta z tablic kwantyl, mo»na obliczy p-warto± i zauwa»y,»e P = < α = Rysunek 7.1 pokazuje kwantyl χ (5) = i warto± statystyki testowej χ 2 = oraz g sto± rozkªadu χ 2 (5). Oba równowa»ne sposoby s zilustrowane na Rysunku 7.1. Pokazuje on kwantyl χ (5) = i warto± statystyki testowej χ 2 = oraz g sto± rozkªadu χ 2 (5).
10 94 ROZDZIAŠ 7. TESTY ISTOTNO CI p wartość gęstość α kwantyl=11.07 statystyka= χ 2 Rysunek 7.1: p-warto± i poziom istotno±ci testu.
11 7.1. KILKA WYBRANYCH TESTÓW ISTOTNO CI Przykªad (Rozkªad statystyki testowej i p-warto±ci). Korzystaj c z uªatwienia, jakie daje komputer wyposa»ony w R, wykonajmy test opisany w poprzednim przykªadzie wiele razy. Powtórzmy m = 1000 razy seri n = 150 rzutów rzeteln kostk (H 0 prawdziwa). Rysunek 7.2 w górnej cz ±ci pokazuje empiryczny rozkªad statystyk testowych w m = 1000 powtórzeniach testu zgodno±ci χ 2. Dane pochodziªy z rozkªadu speªniaj cego hipotez zerow H 0. Poni»ej pokazany jest empiryczny rozkªad odpowiednich p-warto±ci. Widzimy,»e zgodnie ze Stwierdzeniem 7.1.2, warto±ci statystyki χ 2 maj rozkªad zbli»ony do χ 2 (5) (g sto± tego rozkªadu jest naªo»ona na histogram). Z kolei p-warto±ci maj rozkªad zbli»ony do rozkªadu jednostajnego U(0, 1). To jest oczywi±cie zwi zane ze Stwierdzeniem Zauwa»my przy tym,»e zaªo»enia Stwierdzenia s speªnione tylko w przybli»eniu. Statystyka χ 2 jest zmienn dyskretn i tylko w granicy ma rozkªad ci gªy χ 2 (5). Pomimo tego, zgodno± p-warto±ci z rozkªadem jednostajnym jest uderzaj ca. Test chi-kwadrat ma wiele odmian, stosowanych w ró»nych okoliczno±ciach. Z pewnymi wersjami tego testu spotkamy si jeszcze w tych wykªadach. Posta statystyki, któr tu rozpatrzyli±my najªatwiej zrozumie i zapami ta w takiej postaci: χ 2 = (wielko± obserwowana wielko± oczekiwana) 2. wielko± oczekiwana Sumowanie rozci gni te jest na wszystkie komórki, czyli warto±ci obserwacji. Oczywi±cie, w wersji tutaj omawianej wielko± obserwowana oznacza N i, za± wielko± oczekiwana (przy zaªo»eniu prawdziwo±ci hipotezy) jest równa np i. Dyskretyzacja zmiennych ci gªych. Wspomnijmy jeszcze,»e prosty chwyt pozwala stosowa test zgodno±ci χ 2 równie» do obserwacji typu ci gªego. Rozpatrzmy zmienne losowe X 1,..., X n i hipotez H 0 : X 1,..., X n jest próbk z rozkªadu o dystrybuancie F, gdzie F jest ci gªa. Wystarczy rozbi zbiór warto±ci zmiennych losowych na rozª czne komórki, na przykªad wybra punkty = a 0 < a < < a k = i zdeniowa N i = n 1(a i 1 < X j a i ), (i = 1,..., k). j=1 Dalej post pujemy tak jak poprzednio, przyjmuj c p i = F (a i ) F (a i 1 ). Taki test dopuszcza du»o dowolno±ci w wyborze komórek. Istniej testy lepiej dostosowane do ci gªego typu danych. Nale»y do nich test Koªmogorowa- Smirnowa, który pó¹niej omówimy.
12 96 ROZDZIAŠ 7. TESTY ISTOTNO CI Histogram statystyk testowych gęstość χ 2 Histogram p wartości gęstość p Rysunek 7.2: Rozkªad warto±ci statystyki testowej χ 2 i p-warto±ci testu.
13 7.1. KILKA WYBRANYCH TESTÓW ISTOTNO CI 97 Test chi-kwadrat hipotezy zªo»onej. Opiszemy modykacj testu chi-kwadrat w sytuacji, gdy hipoteza zerowa precyzuje rozkªad prawdopodobie«stwa jedynie z dokªadno±ci do nieznanego parametru. Podobnie jak dla zwykªego testu χ 2, rozwa»amy n niezale»nych powtórze«do±wiadczenia losowego o k mo»liwych wynikach. Hipoteza H 0 stwierdza,»e rozkªad prawdopodobie«stwa pojedynczego do±wiadczenia jest dany tabelk : wynik w 1 w i w k prawdopodobie«stwo p 1 (θ) p i (θ) p k (θ) gdzie p i (θ) s, dla i = 1,, k, znanymi funkcjami nieznanego parametru θ. Ten parametr mo»e by wektorem d-wymiarowym: θ = (θ 1,..., θ d ). Statystyk χ 2 budujemy w dwóch etapach. Najpierw estymujemy θ metod najwi kszej wiarogodno±ci. Mamy f θ (n 1,..., n k ) = P θ (N 1 = n 1,..., N k = n k ) = const p 1 (θ) n1 p k (θ) n k (tak jak w zwykªym te±cie χ 2, zmienna N i oznacza liczb powtórze«i-tego wyniku). Logarytm wiarogodno±ci ma wi c posta l(θ) = const + k N i log p i (θ) i estymator najwi kszej wiarogodno±ci obliczamy rozwi zuj c ukªad równa«l(θ) θ j = k i=1 i=1 1 p i (θ) N i = 0, (j = 1,..., d). p i (θ) θ j Statystyk χ 2 okre±lamy tak jak w (7.1.1), wstawiaj c ˆθ = ENW(θ) w miejsce nieznanego θ: ( ) 2 k N i np i (ˆθ) χ 2 =. np i (ˆθ) i=1 Rozkªad tej statystyki jest inny, ni» statystyki obliczonej w przypadku ustalonych z góry prawdopodobie«stw p i. Intuicyjnie jest do± jasne,»e statystyka z estymowanymi prawdopodobie«stwami klatek jest ±rednio mniejsza, bo warto±ci oczekiwane s wyliczane na podstawie danych i mog si dopasowa do warto±ci obserwowanych. Okazuje si,»e to dopasowanie zmniejsza liczb stopni swobody granicznego rozkªadu χ 2. Podamy ten fakt bez dowodu: Stwierdzenie. W opisanej wy»ej sytuacji, rozkªad statystyki χ 2 zmierza do rozkªadu χ 2 (k d 1), gdy n. Przypomnijmy,»e d jest liczb wspóªrz dnych wektora (θ 1,..., θ d ). Symbolicznie,
14 98 ROZDZIAŠ 7. TESTY ISTOTNO CI stopnie swobody = liczba klatek liczba estymowanych parametrów 1. Oczywi±cie, wynika st d nast puj cy przepis na budow testu na poziomie istotno±ci α (w przybli»eniu, dla du»ej liczby powtórze«n): odrzucamy H 0 gdy χ 2 > c, gdzie c = χ 2 1 α(k d 1) Przykªad (Zgodno± danych z modelem Hardy'ego-Weinberga). Mówili±my ju» o tym, jak estymowa nieznany parametr w tym modelu, patrz Przykªady i Teraz zajmiemy si sprawdzeniem hipotezy,»e model poprawnie opisuje wyniki do±wiadczenia (genetycznego, w tym przypadku). Nasza hipoteza jest wi c taka: H 0 : p 1 = θ 2, p 2 = 2θ(1 θ), p 3 = (1 θ) 2 dla pewnego θ (0, 1). Wykorzystamy estymator najwi kszej wiarogodno±ci Statystyk testow jest ) 2 (N 1 nˆθ 2 χ 2 = nˆθ 2 + ˆθ = ENW(θ) = 2N 1 + N 2. 2n ( N 2 2nˆθ(1 ˆθ) ) 2 2nˆθ(1 ˆθ) + (N 3 n(1 ˆθ) 2 ) 2 n(1 ˆθ) 2. Proste, cho nieco»mudne przeksztaªcenia pozwalaj upro±ci to wyra»enie: ( ) 2 χ 2 N 2 = n 1 2nˆθ(1 ˆθ). Dla du»ych n, ta statystyka ma w przybli»eniu rozkªad χ 2 (3 1 1) = χ 2 (1). Testowanie zgodno±ci z typem rozkªadu. Obserwujemy próbk X 1,..., X n z pewnego nieznanego rozkªadu o dystrybuancie F. Przypuszczamy,»e jest to rozkªad normalny. Stawiamy hipotez H 0 : X 1,..., X n N(µ, σ 2 ) dla pewnych µ, σ. Inaczej, H 0 mówi,»e dystrybuanta ma posta F (x) = Φ ((x µ)/σ) dla pewnych µ, σ, gdzie Φ jest standardow dystrybuant normaln (dla rozkªadu N(0, 1)). Opiszemy sposób zastosowania testu chi-kwadrat w wersji dla hipotez zªo»onych. Najpierw dane ci gªe musimy zdyskretyzowa, w sposób ju» wcze±niej wyja±niony. Wybieramy punkty = a 0 < a 1 < < a k = i dzielimy prost na rozª czne przedziaªy. Oznaczamy przez
15 7.1. KILKA WYBRANYCH TESTÓW ISTOTNO CI 99 N i liczb obserwacji wpadaj cych do i-tego przedziaªu. Warto±ci obserwowane porównujemy z warto±ciami oczekiwanymi nˆp i, gdzie ( ) ( ) ai ˆµ ai 1 ˆµ ˆp i = Φ Φ. ˆσ ˆσ W zasadzie, nale»y za estymatory µ i σ przyj ENW obliczone dla zdyskretyzowanych zmiennych. Zgodnie z tym co powiedzieli±my, te ENW s rozwi zaniem ukªadu równa«i N i 1 p i p i µ = 0, i N i 1 p i p i σ = 0. Statystyka χ 2 ma asymptotyczny rozkªad χ 2 (k 3) (bo estymujemy 2 parametry). W praktyce, rozwi zywanie napisanych wy»ej równa«jest zbyt kªopotliwe i przyjmuje si,»e wstawienie zwyczajnych estymatorów ˆµ = X i ˆσ = S we wzory na p i niewiele zmienia rozkªad statystyki χ 2. Dokªadnie w ten sam sposób mo»na testowa inne hipotezy zgodno±ci z typem rozkªadu, czyli H 0 : F = F θ dla pewnego θ, gdzie {F θ } jest dan parametryczn rodzin dystrybuant (rozkªadów wykªadniczych, gamma itp.). Test niezale»no±ci chi-kwadrat. Przypu± my,»e w pojedynczym do±wiadczeniu obserwujemy par zmiennych losowych (X, Y ) o warto±ciach w zbiorze {1,..., r} {1,..., s} (te warto±ci nale»y traktowa jako umowne etykietki). Rozkªad prawdopodobie«stwa jest opisany dwuwymiarow tabelk (p ij ; i = 1,..., r; j = 1,..., s), gdzie p ij = P(X = i, Y = j). Prawdopodobie«stwa brzegowe P(X = i) i P(Y = j) zapiszemy w postaci p i = s p ij, p j = j=1 r p ij. Je±li powtarzamy do±wiadczenie niezale»nie n-krotnie, mamy niezale»ne wektory losowe (X 1, Y 1 ),..., (X n, Y n ), ka»dy o rozkªadzie takim jak (X, Y ). Mo»emy zbudowa dwuwymiarow tabelk (N ij ), gdzie N ij = i=1 n 1(X k = i, Y k = j), k=1 N ij = liczba do±wiadcze«, które zako«czyªy si par wyników (i, j). Jest to tak zwana tablica kontyngencji. Wielko±ci brzegowe w tej tabelce oznaczymy N i = s N ij, N j = j=1 r N ij. i=1
16 100 ROZDZIAŠ 7. TESTY ISTOTNO CI Rozpatrzymy hipotez, która stwierdza niezale»no± zmiennych X i Y : H 0 : p ij = p i p j, (i = 1,..., r; j = 1,..., s). Mo»e na pierwszy rzut oka tego nie wida, ale jest to specjalny przypadek schematu rozpatrzonego w poprzednim punkcie: prawdopodobie«stwa klatek p ij s znanymi funkcjami nieznanego parametru θ = (p 1,..., p r 1, p 1,..., p s 1 ). Zauwa»my,»e p r = 1 p 1 p r 1 i p s = 1 p 1 p s 1, wi c tych ostatnich prawdopodobie«stw brzegowych nie wª czyli±my do wektora θ. W rezultacie θ ma wymiar r + s 2. Zbudujemy statystyk chi-kwadrat, u»ywaj c estymowanych prawdopodobie«stw klatek ˆp ij = N i N j n 2. Przekonajmy si,»e s to estymatory najwi kszej wiarogodno±ci w modelu okre±lonym hipotez H 0. Wygodnie nam b dzie potraktowa wiarogodno± jako funkcj rozszerzonego wektora parametrów (p 1,..., p r, p 1,..., p s ) i znale¹ maksimum warunkowe, przy ograniczeniach r i=1 p i = 1 i s j=1 p j = 1. Logarytm wiarogodno±ci ma posta l(p 1,..., p r, p 1,..., p s ) = const + i,j N ij [log p i + log p j ]. Zgodnie z metod Lagrange'a poszukujemy minimum funkcji l a b, gdzie ( ) ( ) a = λ p i 1, b = µ p j 1, λ i µ s mno»nikami Lagrange'a. Poniewa» p i (l a b) = N i p i λ, i j p j (l a b) = N j p j µ, wi c przyrównuj c pochodne do zera dostajemy p i = N i /λ i p j = N j /µ. Wykorzystuj c posta ogranicze«, obliczamy λ = µ = n i ostatecznie otrzymujemy oczywiste estymatory ˆp i = ENW(p i ) = N i /n i ˆp j = ENW(p j ) = N j /n. Warto± oczekiwana (przy zaªo»eniu H 0 ) w klatce (i, j) jest równa nˆp i ˆp j = N i N j /n. Z tego co zostaªo powiedziane wynika,»e statystyka chi-kwadrat przeznaczona do testowania hipotezy o niezale»no±ci jest nast puj ca: r s χ 2 (N ij N i N j /n) 2 =. N i N j /n i=1 j=1 Dla n, rozkªad tej statystyki zmierza do rozkªadu χ 2 ((r 1)(s 1)) na mocy Stwierdzenia 7.1.5, bo rs (r 1) (s 1) 1 = (r 1)(s 1).
17 7.1. KILKA WYBRANYCH TESTÓW ISTOTNO CI Przykªad. [Zale»no± gustów muzycznych i pogl dów politycznych] Rzecznik partii A twierdzi,»e w±ród zwolenników tej partii, miªo±nicy muzyki disco-polo, rockowej i symfonicznej wyst puj w tych samych proporcjach, co w caªej populacji wyborców. Przeprowadzono sonda». W±ród wylosowanych 100 wyborców (spo±ród osób o jednoznacznie sprecyzowanych preferencjach muzycznych), wyniki badania byªy nast puj ce: Popieram A Nie popieram A Razem Sªucham Disco Polo Sªucham muzyki rockowej Sªucham Disco Polo Razem Sformuªowana przez rzecznika hipoteza stwierdza niezale»no± dwóch cech wyborcy: stosunku do partii A i preferencji muzycznych. Przeprowadzimy test niezale»no±ci chi-kwadrat na poziomie istotno±ci Statystyka testowa ma warto± χ 2 ( /100)2 ( /100)2 ( /100)2 = / / /100 ( /100)2 ( /100)2 ( /100) / / /100 = Warto± krytyczn odczytujemy z tablicy rozkªadu chi-kwadrat z (2 1)(3 1) = 2 stopniami swobody. Poniewa» χ (2) = 5.99 > 2.53, wi c zebrane dane nie daj podstaw,»eby zarzuci rzecznikowi kªamstwo. Test Koªmogorowa-Smirnowa Niech F b dzie ustalon, ci gª dystrybuant. Rozpatrzmy hipotez stwierdzaj c,»e obserwacje X 1,..., X n s próbk z rozkªadu o dystrybuancie F. Symbolicznie, H 0 : X 1,..., X n F. Niech ˆF n b dzie dystrybuant empiryczn. Statystyka testowa jest równa Šatwo zauwa»y,»e D n = sup ˆF n (x) F (x). <x< D n = max(d + n, D n ),
18 102 ROZDZIAŠ 7. TESTY ISTOTNO CI gdzie ( ) ( i D n + = max i=1,...,n n F (X i:n), Dn = max F (X i:n ) i 1 ). i=1,...,n n Idea testu jest prosta. Odrzucamy H 0, je±li odchylenia dystrybuanty empirycznej od dystrybuanty teoretycznej (sprecyzowanej w hipotezie) s du»e, czyli gdy D n > c. Sposób doboru poziomu krytycznego c opiera si na dwóch faktach. Pierwszy z nich jest prosty Stwierdzenie. Dla dowolnego rozkªadu ci gªego F, rozkªad statystyki D n jest taki sam. Naturalnie, mamy tu na my±li rozkªad statystyki D n przy prawdziwej hipotezie H 0. Dowód. Dla uproszczenia przeprowadzimy dowód przy zaªo»eniu,»e istnieje dobrze zdeniowana funkcja odwotna F 1 do dystrybuanty. Rozpatrzmy próbk U 1,..., U n z rozkªadu jednostajnego U(0, 1). Zauwa»my,»e 1 n sup 1(U 0<u<1 i u) u n = sup 1 n 1(U <x< i F (x)) F (x) n i=1 i=1 1 n = sup 1(F 1 (U i ) x) F (x) n. <x< i=1 Wiemy,»e zmienne losowe X i = F 1 (U i ) maj rozkªad o dystrybuancie F (x). Ze wzoru napisanego powy»ej wynika,»e rozkªad statystyki D n jest taki sam dla rozkªadu U(0, 1) i dla rozkªadu o dystrybuancie F Uwaga. Stwierdzenie pozwala budowa tablice rozkªadu statystyki D n i oblicza p- warto±ci. Potrzebna jest, w zasadzie, oddzielna tablica dla ka»dego n. Teoria asymptotyczna pozwala na jeszcze dalsze uproszczenie. Przy n mamy zbie»no± statystyk nd n d K do pewnego rozkªadu prawdopodobie«stwa (rozkªadu Koªmogorowa), który nie zale»y od dystrybuanty F. Mo»na zatem wybiera staª c > 0 w taki sposób, aby P( nd n > c) α (przy prawdziwej H 0 ) Przykªad (Testowanie generatora liczb losowych). Chcemy sprawdzi, czy ci g produkowany przez R-owsk funkcj runif() zachowuje si jak ci g niezale»nych zmiennych losowych o rozkªadzie jednostajnym U(0, 1). Test Koªmogorowa jest jednym z podstawowych sprawdzianów. Dla ilustracji rozwa»my 10-cio elementow próbk : (*) , , , , , , , , , (w rzeczywisto±ci bada si znacznie dªu»sze ci gi). Przeprowadzimy test hipotezy H 0 : ( ) jest próbk losow z U(0, 1)
19 7.1. KILKA WYBRANYCH TESTÓW ISTOTNO CI 103 na poziomie istotno±ci 0.1. Dystrybuanta rozkªadu jednostajnego jest równa F (x) = x dla 0 < x < 1. Sposób obliczania statystyki D 10 pokazuje Rysunek 7.3 i nast puj ca tabelka: X i:10 (i 1)/10 i/10 i/10 X i:10 X i:10 (i 1)/ Wida,»e D 10 + = i D10 = (najwi ksze liczby w dwóch ostatnich kolumnach). St d D 10 = Warto± krytyczna statystyki D 10, odczytana z tablic, jest równa Test Koªmogorowa nie odrzuca hipotezy,»e nasz ci g jest próbk z rozkªadu U(0, 1). Do- ±wiadczenie nie daªo powodów, by kwestionowa generator. Dwupróbkowy test Koªmogorowa-Smirnowa. Rozpatrzmy dwa niezale»ne ci gi obserwacji, X 1,..., X n i Y 1,..., Y m. Zakªadamy,»e s to próbki z rozkªadów o dystrybuantach, odpowiednio, F i G: X 1,..., X n F, Y 1,..., Y m G. Stawiamy hipotez,»e obie próbki pochodz z tego samego rozkªadu prawdopodobie«stwa: H 0 : F = G. Sens tej hipotezy jest taki,»e dwa do±wiadczenia losowe nie ró»ni si w istotny sposób. Najcz ±ciej oba do±wiadczenia przeprowadzamy w nieco odmiennych warunkach. Chcemy skontrolowa przypuszczenie,»e ta odmienno± nie wpªywa na przebieg zjawiska. Idea dwupróbkowego testu Koªmogorowa-Smirnowa jest podobna do testu jednopróbkowego, omówionego poprzednio. Porównujemy teraz dwie dystrybuanty empiryczne t dla X-ów i t dla Y -ów: D n,m = sup ˆF n (z) Ĝm(z), <z< gdzie ˆF n (z) = 1 n 1(X i z), Ĝ m (z) = 1 m 1(Y i z). n m i=1 Je±li hipoteza H 0 jest prawdziwa, to rozkªad statystyki D n,m nie zale»y od F pod warunkiem,»e dystrybuanta F jest ci gªa. Sposób post powania jest podobny, jak dla testu jednopróbkowego. Odrzucamy H 0, je±li D n,m > c. W praktyce korzystamy z gotowej funkcji, która oblicza D n,m i (dokªadn lub przybli»on ) p-warto±. i=1
20 104 ROZDZIAŠ 7. TESTY ISTOTNO CI ecdf(x) Fn(x) D= x Rysunek 7.3: Dystrybuanta empiryczna i hipotetyczna dla 10-cio elementowej próbki.
21 7.1. KILKA WYBRANYCH TESTÓW ISTOTNO CI Przykªad. Zbadano iloraz inteligencji n uczniów szkoªy X i m uczniów szkoªy Y. Przykªadowe dane, dla n = 7 i m = 6, wygl daj nast puj co: X Y Stawiamy hipotez,»e poziom inteligencji uczniów obu szkóª jest taki sam. Matematycznie, hipoteza sprowadza si do przypuszczenia,»e X-y i Y -i s próbkami losowymi z tego samego rozkªadu prawdopodobie«stwa. Prze±led¹my zastosowanie testu Koªmogorowa-Smirnowa na tych danych 2. Sposób obliczania statystyki D n,m pokazuje nast puj ca tabelka: z ˆFn (z) Ĝ m (z) ˆF n (z) Ĝm(z) 88 Y 0/7 1/6 7/42 95 Y 0/7 2/6 14/42 98 X 1/7 2/6 8/ X 2/7 2/6 2/ X 3/7 2/6 4/ X 4/7 2/6 10/ X 5/7 2/6 16/ Y 5/7 3/6 9/ X 6/7 3/6 15/ Y 6/7 4/6 8/ Y 6/7 5/6 1/ Y 6/7 6/6 6/ X 7/7 6/6 0/42 Wida,»e D 7,6 = 16/42. Test na poziomie istotno±ci 0.05 odrzuca H 0 je±li statystyka przekracza 30/42 (to mo»na odczyta z tablic). Konkluzja jest taka,»e nie ma podstaw do odrzucenia hipotezy zerowej. Dane nie s sprzeczne z zaªo»eniem,»e poziom inteligencji uczniów w obu szkoªach ma ten sam rozkªad prawdopodobie«stwa. Test Koªmogorowa-Lilieforsa. Rozpatrzmy ponownie zagadnienie testowania zgodno±ci z typem rozkªadu. Hipotez o normalno±ci rozkªadu, ( ) x µ H 0 : F (x) = Φ dla pewnych µ, σ, σ 2 W zasadzie, test Koªmogorowa-Smirnowa jest przeznaczony do stosowania dla danych pochodz cych z rozkªadów ci gªych. Nasze dane szkolne mo»emy w przybli»eniu uzna za ci gªe, bo nie zawieraj powtarzaj cych si warto±ci.
22 106 ROZDZIAŠ 7. TESTY ISTOTNO CI mo»na testowa przy pomocy zmodykowanej statystyki Koªmogorowa ( ) D n = sup ˆF x X n (x) Φ. S <x< W tej formie, statystyka zwi zana jest z nazwiskiem Lilieforsa. Rozpatrywana hipoteza zerowa jest zªo»ona, to znaczy nie precyzuje jednego rozkªadu prawdopodobie«stwa, tylko caª rodzin rozkªadów. Dlatego rozkªad statystyki jest inny, ni» dla testu hipotezy prostej. Warto±ci krytyczne s stablicowane. Jak ªatwo zgadn, s mniejsze od warto±ci krytycznych zwykªego testu Koªmogorowa-Smirnowa (tego dla prostej hipotezy zerowej). Sytuacja jest faktycznie znacznie gorsza, ni» dla testu χ 2 : rozkªad statystyki Koªmogorowa-Lilieforsa zale»y w istotny sposób od faktu,»e obserwacje maj rozkªad normalny. Porównaj, dla kontrastu, Stwierdzenie Je±li chcieliby±my w podobny sposób testowa (powiedzmy) hipotez,»e rozkªad jest wykªadniczy, to ªatwo napisa odpowiednio zmodykowan statystyk Koªmogorowa-Smirnowa ale trudno ustali warto±ci krytyczne. 7.2 Parametryczne testy istotno±ci Rozpatrzmy model normalny. Zakªadamy,»e X 1,..., X n jest próbk z rozkªadu N(µ, σ 2 ) z nieznanymi paramerami µ i σ. Przedstawimy kilka typowych testów w tym modelu. B dziemy rozpatrywali zªo»one hipotezy zerowe i przedstawimy testy, które nie s jednostajnie najmocniejsze, bo TJNM po prostu nie istniej. Estymatory X i S 2 oznaczaj to, co zwykle Test Studenta Test H 0 : µ = µ 0 przeciwko H 1 : µ > µ 0, gdzie µ 0 jest ustalon liczb. Na poziomie istotno±ci α, odrzucamy H 0, gdy X µ0 n > t, t = t 1 α (n 1). S Test H 0 : µ = µ 0 przeciwko H 1 : µ µ 0, gdzie µ 0 jest ustalon liczb. Na poziomie istotno±ci α, odrzucamy H 0, gdy n X µ 0 S > t, t = t 1 α/2 (n 1). Zajmiemy si teraz problemem porównania populacji, z których pochodz dwie (niezale»ne) próbki. Niech X 1,..., X n N(µ X, σ 2 X ) i Y 1,..., Y m N(µ Y, σ 2 Y ). Znaczenie symboli X, Ȳ, S 2 X i S 2 Y jest oczywiste (i takie samo, jak w Przykªadzie 2.2.6).
23 7.2. PARAMETRYCZNE TESTY ISTOTNO CI Dwupróbkowy test Studenta. Test H 0 : µ X = µ Y przeciwko H 1 : µ X > µ Y. Zakªadamy,»e σx 2 = σ2 Y. Testujemy wi c hipotez o równo±ci warto±ci oczekiwanych, nie kwestionuj c zaªo»enia o równo±ci wariancji. Odrzucamy H 0, gdy X Ȳ nm (n 1)S 2 X + (m 1)SY 2 n + m (n + m 2) > t, t = t 1 α(n + m 2). Pozostawiamy Czytelnikowi oczywist modykacj procedury testowania, gdy alternatywa jest dwustronna: H 0 : µ X = µ Y przeciwko H 1 : µ X µ Y Testy dotycz ce wariancji Test H 0 : σ = σ 0 przeciwko H 1 : σ > σ 0, gdzie σ 0 jest ustalon liczb. Odrzucamy H 0, gdy n 1 S 2 > c, c = χ 2 σ 1 α(n 1). 0 2 Test H 0 : σ = σ 0 przeciwko H 1 : σ σ 0, gdzie σ 0 jest ustalon liczb. Odrzucamy H 0, gdy n 1 σ 2 0 S 2 > c 2 lub n 1 S 2 < c σ0 2 1, c 1 = χ 2 α/2(n 1), c 2 = χ 2 1 α/2(n 1). Zajmiemy si teraz problemem porównania populacji, z których pochodz dwie (niezale»ne) próbki. Niech X 1,..., X n N(µ X, σ 2 X ) i Y 1,..., Y m N(µ Y, σ 2 Y ). Znaczenie symboli X, Ȳ, S 2 X i S 2 Y jest oczywiste (i takie samo, jak w Przykªadzie 2.2.6).
24 108 ROZDZIAŠ 7. TESTY ISTOTNO CI 7.3 Zadania 1. W Przykªadzie obliczy p-warto± testu. Wskazówka: Rozkªad χ 2 (2) jest rozkªadem wykªadniczym Ex(1/2). 2. Przeprowadzono sonda» wsród n = 1000 losowo wybranych pasa»erów warszawskiego transportu publicznego (metra, tramwajów, autobusów). Pasa»erowie oceniali, czy s zadowoleni z komfortu jazdy wybranym ±rodkiem transportu. Otrzymano nast puj ce dane: N M = 400 osób wybraªo metro i spo±ród nich Z M = 300 byªo zadowolonych; N T = 300 osób wybraªo tramwaj i spo±ród nich Z T = 200 byªo zadowolonych; N A = 300 osób wybraªo autobus i spo±ród nich Z A = 150 byªo zadowolonych. (a) Zwerykowa hipotez H 0 mówi c,»e frakcje osób niezadowolonych z komfortu jazdy s takie same dla wszystkich trzech ±rodków transportu. U»yj testu niezale»no±ci χ 2. (b) Wykaza,»e statystyka testowa mo»e by wyra»ona nast puj cym wzorem: χ 2 = (Z i ˆp) 2 N i i ˆp(1 ˆp), gdzie ˆp = i Z i/n i, oczywi±cie, i {M, T, A}. 3. Interesuje nas procent absolwentów warszawskich wy»szych uczelni, którzy znajduj prac nie pó¹niej ni» póª roku po uko«czeniu studiów. Zbadano reprezentatywn próbk n = 400 absolwentów i okazaªo si,»e w±ród nich S = 256 znalazªo prac. S to te same dane, co w Zadaniu 2 w Rozdziale 6. (a) Werykujemy hipotez H 0 mówi c,»e przynajmniej 70% absolwentów znajduje prac przeciwko alternatywie,»e mniej ni» 70% absolwentów znajduje prac. Przeprowadzi test na poziomie istotno±ci α = (b) Przeprowadzi test tej samej hipotezy zerowej przeciwko dwustronnej alternatywie, stwierdzaj cej,»e procent absolwentów znajduj cych prac jest ró»ny od 70%. Przyj poziom istotno±ci α = 0.01, jak poprzednio. 4. Zakªadamy,»e liczby wypadków w kolejnych tygodniach s niezale»nymi zmiennymi losowymi o jednakowym rozkªadzie (o mo»liwych warto±ciach 0, 1, 2,...). Chcemy zwerykowa hipotez, mówi c,»e te zmienne losowe maj rozkªad Poissona. Dane dotycz ce 100 tygodni opisuje nast puj ca tabelka: liczba wypadków w tygodniu Liczba tygodni Przeprowadzi test χ 2 zgodno±ci na poziomie istotno±ci α = Uwaga: Jest to zagadnienie zgodno±ci z typem rozkªadu. Potrzebna jest dyskretyzacja zbioru warto±ci obserwacji, który jest dla rozkªadu Poissona niesko«czony (mianowicie {0, 1, 2,...}). Mo»na podzieli ten zbiór na trzy podzbiory: {0}, {1} i {2, 3,...}. Odpowiadaj ce temu prawdopodobie«stwa s równe p 0 (θ) = e θ, p 1 (θ) = θe θ i p 2 (θ) = 1 p 0 (θ) p 1 (θ) (nale»y pami ta,»e w te±cie χ 2 prawdopodobie«stwa teoretyczne musz si sumowa do 1).
25 7.3. ZADANIA Zwa»ono 10 paczek masªa i otrzymano nast puj ce wyniki: 245; 248; 241; 251; 252; 244; 246; 248; 247; 248. S to te same dane co w Zadaniu 1 z Rozdziaªu 6. Zakªadamy,»e jest to próbka losowa z rozkªadu normalnego N(µ, σ 2 ) z nieznanymi parametrami µ i σ. (a) Przeprowadzi test hipotezy H 0 stwierdzaj cej,»e ±rednia waga µ masy paczki jest równa 250 przeciwko alternatywie,»e jest mniejsza. Przyjmujemy poziom istotno±ci α = (b) Przeprowadzi test hipotezy H 0 stwierdzaj cej,»e ±rednia waga µ masy paczki jest równa 250 przeciwko alternatywie,»e jest inna. Przyjmujemy poziom istotno±ci α = (c) Przeprowadzi test hipotezy H 0 stwierdzaj cej,»e odchylenie standardowe σ masy paczki nie przekracza 2 przeciwko alternatywie,»e jest wi ksze. Przyjmujemy poziom istotno±ci α = Porównywano ±rednie ceny 1 kg truskawek w dwu ró»nych miastach. W ka»dym z miast zebrano informacje z 6 losowo wybranych punktów sprzeda»y. Po dokonaniu oblicze«otrzymano nast puj ce warto±ci ±rednich cen i wariancji w obu miastach: ±rednia x estymator wariancji s 2 Miasto I Miasto II Estymatory wariancji s 2 s wyznaczone (dla ka»dej z dwóch próbek z osobna) wedªug wzoru s 2 = n i=1 (x i x) 2 /(n 1), gdzie n jest rozmiarem próbki. Zakªadamy,»e obserwowane zmienne losowe s niezale»ne i maj rozkªady normalne o tej samej wariancji. (a) Przeprowadzi test dla werykacji hipotezy H 0 mówi cej,»e przeci tne ceny s jednakowe w obu miastach, przy alternatywie H 1 mówi cej,»e w mie±cie II przeci tna cena 1 kg truskawek jest wy»sza. Przyj poziom istotno±ci α = (b) Przeprowadzi test dla werykacji hipotezy H 0 mówi cej,»e przeci tne ceny s jednakowe w obu miastach, przy alternatywie H 1 mówi cej,»e przeci tne s ró»ne. Przyj poziom istotno±ci α = 0.05.
26 110 ROZDZIAŠ 7. TESTY ISTOTNO CI
27 Rozdziaª 8 Teoria testowania hipotez Przeanalizujemy zagadnienie testowania hipotez statystycznych w sposób bardziej formalny. Nasze rozwa»ania b d miaªy do± ogólny i abstrakcyjny charakter. Punktem wyj±cia jest przestrze«statystyczna (X, F, {P θ, θ Θ}). 8.1 Denicje Hipotezy statystyczne, czyli wypowiedzi na temat rozkªadu prawdopodobie«stwa, uto»samiamy z podzbiorami przestrzeni parametrów Θ (tak, jak zdarzenia losowe uto»samiamy z podzbiorami przestrzeni próbkowej Ω). Mówi c o zagadnieniu testowania, zawsze b dziemy rozwa»ali hipotez zerow H 0 : θ Θ 0 i hipotez alternatywn H 1 : θ Θ 1. Zakªadamy,»e Θ 0 i Θ 1 s podzbiorami przestrzeni Θ takimi,»e Θ 0 Θ 1 =. Znaczy to,»e H 0 i H 1 wzajemnie si wykluczaj. Obie konkurencyjne hipotezy traktujemy nierównoprawnie. Zasadniczo, interpretacja jest taka: H 0 jest zaªo»eniem obowi zuj cym do czasu, gdy pojawi si dane do±wiadczalne sprzeczne (lub raczej bardzo trudne do pogodzenia) z t hipotez. Z kolei, H 1 jest ewentualno±ci, z któr powinni±my si liczy, je±li przyjdzie nam zrezygnowa z hipotezy H 0. Testem hipotezy H 0 przeciw alternatywie H 1 nazywamy statystyk δ : X {0, 1}. Warto± 1 interpretujemy jako decyzj o odrzuceniu H 0, za± 0 oznacza,»e nie odrzucamy H 0. Zbiór K = {x X : δ(x) = 1} nazywamy obszarem krytycznym testu. Przewa»nie 111
28 112 ROZDZIAŠ 8. TEORIA TESTOWANIA HIPOTEZ test ma posta δ(x) = 1(T (X) > c), gdzie T (X) jest pewn wygodn statystyk, zwan statystyk testow, za± c jest liczb zwan warto±ci krytycznym. Tak wi c, je±li T (X) > c czyli δ(x) = 1 czyli X K, to odrzucamy H 0 ; je±li T (X) c czyli δ(x) = 0 czyli X K, to nie odrzucamy H 0. Oczywi±cie, jest tylko spraw wygody, czy okre±lamy funkcj δ, T i c, czy zbiór K: s to trzy równowa»ne sposoby opisu testu. Istotne jest to,»e test jest reguª podejmowania decyzji w zale»no±ci od wyniku obserwacji. Poniewa» obserwacje s losowe, musimy czasem popeªnia bª dy. Skutki dziaªania testu przedstawimy tak: stan rzeczy \ decyzja δ = 0 δ = 1 H 0 prawdziwa O.K. bª d I rodzaju H 1 prawdziwa bª d II rodzaju O.K. B dziemy równie» mówi,»e decyzja 0 oznacza akceptacj H 0 a decyzja 1 akceptacj H 1. Niektórzy statystycy starannie unikaj takich sformuªowa«. To jednak kwestia interpretacji decyzji. Statystyka nie zajmuje si skutkami bª dnych decyzji, tylko bada cz sto± podejmowania takich decyzji. Niech 1 β(θ) = P θ (δ(x) = 1) oznacza prawdopodobie«stwo odrzucenia H 0. Nazwiemy 1 β(θ) funkcj mocy testu δ. Interpretacja tej funkcji jest odmienna dla θ Θ 0 i θ Θ 1 : Je±li θ Θ 0 to 1 β(θ) = P θ (δ(x) = 1) jest prawdopodobie«stwem bª du I rodzaju. Je±li θ Θ 1 to β(θ) = P θ (δ(x) = 0) jest prawdopodobie«stwem bª du II rodzaju. Za klasyczn teori testowania stoi wa»na idea metodologiczna. Jest to zasada konserwatyzmu: nie nale»y rezygnowa z ustalonej teorii (hipotezy zerowej), je±li nie ma po temu koniecznych lub przynajmniej bardzo wyra¹nych powodów. Wobec tego staramy si przede wszystkim kontrolowa prawdopodobie«stwo bª du I rodzaju. Interesowa nas b d testy, dla których prawdopodobie«stwo bª du I rodzaju nie przekracza zadanej z góry, maªej liczby. Spo±ród takich i tylko takich testów postaramy si wybra te, które maj mo»liwie maªe prawdopodobie«stwo bª du II rodzaju. Jest jeszcze inny powód kontroli bª du I rodzaju. Cz sto w zastosowaniach za H 0 przyjmuje si hipotez, której bª dne odrzucenie ma powa»niejsze skutki ni» bª dne jej przyj cie. O przykªady takich sytuacji praktycznych nie jest trudno. Wyobra¹my sobie,»e zadaniem
29 8.2. LEMAT NEYMANA-PEARSONA 113 statystyka jest porównanie skuteczno±ci dwóch leków: A i B. Przypu± my,»e lek A jest od dawna stosowany, jego dziaªanie i skutki uboczne s dobrze znane. Lek B jest nowy i jego stosowanie wi»e si z pewnym ryzykiem. W takiej sytuacji statystyk powinien za hipotez zerow przyj H 0 : lek A jest nie mniej skuteczny, ni» B. W istocie, bª d I rodzaju polegaj cy na pochopnym odrzuceniu H 0 mo»e narazi pacjentów na niebezpiecze«stwo tego staramy si przede wszystkim unikn. Bª d II rodzaju mo»e tylko troch opó¹ni post p w metodach leczenia i jest mniej gro¹ny w skutkach DEFINICJA. Mówimy,»e δ jest testem na poziomie istotno±ci α, je±li sup P θ (δ(x) = 1) α. θ Θ 0 Za poziom istotno±ci α przyjmuje si zwykle okr gª, maª liczb, na przykªad α = 0.01 lub α = Zgodnie z tym co powiedzieli±my wcze±niej, wybór poziomu istotno±ci odzwierciedla nasz stopie«konserwatyzmu: im bardziej przywi zani jeste±my do wyj±ciowej hipotezy H 0, tym mniejsze wybieramy α. Zaªó»my,»e test ma posta δ(x) = 1(T (X) > c). Poziom krytyczny testu lub inaczej p-warto± jest to najmniejszy poziom istotno±ci przy którym odrzucamy H 0. Formalnie, je±li zaobserwujemy x X, to P = sup θ Θ 0 P θ (T (X) > T (x)) DEFINICJA. Test δ jest jednostajnie najmocniejszy na poziomie istotno±ci α, je±li (i) δ jest testem na poziomie istotno±ci α; (ii) dla ka»dego testu δ na poziomie istotno±ci α, mamy dla ka»dego θ Θ 1. P θ (δ (X) = 1) P θ (δ(x) = 1) W skrócie, δ jest TJNM (hipotezy H 0 : θ Θ 0 przeciw alternatywie H 1 : θ Θ 1 na poziomie istotno±ci α). 8.2 Lemat Neymana-Pearsona Niech θ 0 i θ 1 b d ustalonymi punktami przestrzeni parametrów Θ. Rozwa»ymy dwie hipotezy proste: H 0 : θ = θ 0, H 1 : θ = θ 1.
30 114 ROZDZIAŠ 8. TEORIA TESTOWANIA HIPOTEZ Znaczy to,»e Θ 0 = {θ 0 } i Θ 1 = {θ 1 } s zbiorami jednopunktowymi. Niech P 0 i P 1 oznaczaj rozkªady prawdopodobie«stwa na przestrzeni próbkowej, odpowiadaj ce warto±ciom parametru θ 0 i θ 1. Zaªó»my,»e te rozkªady maj g sto±ci f 0 i f 1. Niech X oznacza wektor obserwacji. Innymi sªowy, obie hipotezy mo»emy sformuªowa tak: H 0 : X f 0, H 1 : X f TWIERDZENIE (Lemat Neymana - Pearsona). Niech { (8.2.2) K = x X : f } 1(x) f 0 (x) > c. Zaªó»my,»e P 0 (K ) = α i P 1 (K ) = β. Je±li K X jest takim zbiorem,»e P 0 (K) α, to P 1 (K) β. Dowód. Poniewa» K f 0 K f 0, wi c K \K f 0 K\K f 0. Pomnó»my t ostatni nierówno± obustronnie przez c i skorzystajmy z faktu,»e f 1 > cf 0 na zbiorze K \K i cf 0 f 1 na K\K. Otrzymujemy K \K f 1 K\K f 1 i st d f 1 K Dodajmy,»e nierówno± jest ostra, je±li tylko K \K f 0 > 0 i c > 0. Popatrzmy na zbiory K i K jak na obszary krytyczne testów δ i δ. Z oczywistych wzgl dów, δ nazywamy testem ilorazu wiarogodno±ci. Lemat Neymana - Pearsona stwierdza,»e test ilorazu wiarogodno±ci jest najmocniejszy na poziomie istotno±ci α (przymiotnik jednostajnie mo»emy opu±ci, bo hipoteza alternatywna jest prosta). Uwaga. Przypu± my,»e f 1 i f 2 oznaczaj g sto±ci prawdopodobie«stwa w zwykªym sensie, to znaczy obserwacja X jest zmienn losow typu ci gªego. Je±li α jest zadan z góry liczb (0 < α < 1), to zazwyczaj mo»na dobra poziom krytyczny c testu ilorazu wiarogodno±ci tak,»eby P 0 (f 1 (X)/f 0 (X) > c) = α. Nie b dziemy tego stwierdzenia ani u±ci±la ani dowodzi, ale zobaczymy wkrótce na kilku przykªadach jak to si robi. Z drugiej strony, g sto±ci w Twierdzeniu mog oznacza dyskretne funkcje prawdopodobie«- stwa: f i (x) = P i (X = x). Dowód jest taki sam, tylko caªki trzeba zamieni na sumy. Lemat Neymana - Pearsona pozostaje prawdziwy dla obserwacji typu dyskretnego, ale przy jego stosowaniu pojawiaj si drobne trudno±ci. Dla danego α, mo»e nie istnie c takie,»e P 0 (f 1 (X)/f 0 (X) > c) = α. Wtedy najmocniejszy test na poziomie istotno±ci α mo»e nie by testem ilorazu wiarogodno±ci. Pewnym wyj±ciem jest u»ycie tak zwanych testów zrandomizowanych, w których uzale»nia si decyzj od przypadku. W naszych rozwa»aniach, w szczególno±ci w Denicji 8.1.2, ograniczyli±my si dla uproszczenia do testów niezrandomizowanych. Dokªadniejsza dyskusja wymagaªaby wi c bardziej ogólnej denicji testu. Nie b dziemy si tym zajmowa. K f 1.
31 8.2. LEMAT NEYMANA-PEARSONA 115 Wspomnijmy,»e obszar krytyczny testu ilorazu wiarogodno±ci mo»na (i zazwyczaj wygodnie jest) napisa w równowa»nej, zlogarytmowanej postaci K = {x : log f 1 (x) log f 0 (x) > log c = const}. Wprowad¹my umow,»e const jest ogólnym oznaczeniem poziomu krytycznego i mo»e w trakcie rachunków reprezentowa ró»ne liczby Przykªad (Model normalny, test jednostronny). Zaªó»my,»e mamy próbk X 1,..., X n z rozkªadu N(µ, σ 2 ), gdzie σ 2 jest znane. Rozwa»my najpierw dwie hipotezy proste: H 0 : µ = µ 0 przeciw H 1 : µ = µ 1, gdzie µ 0 < µ 1. Zbudujemy test ilorazu wiarogodno±ci. Niech n [ 1 f h (x 1,..., x n ) = exp 1 ] 2πσ 2σ (x 2 i µ h ) 2, dla h = 0, 1. Mamy wi c i=1 log f 1 (X 1,..., X n ) log f 0 (X 1,..., X n ) = 1 n (X 2σ 2 i µ 1 ) n (X 2σ 2 i µ 0 ) 2 i=1 i=1 [ ] = 1 n 2 X 2σ 2 i (µ 1 µ 0 ) + n(µ 2 0 µ 2 1). i=1 Test ilorazu wiarogodno±ci odrzuca H 0 na rzecz H 1, je±li powy»sze wyra»enie przekracza pewn staª. Ale tak si dzieje wtedy i tylko wtedy, gdy X > c dla pewnej (innej) staªej. Dopiero teraz doko«czymy nasz konstrukcj, stosownie wybieraj c c. Niech c = zσ/ n, gdzie z jest kwantylem rz du 1 α standardowego rozkªadu normalnego, czyli Φ(z) = 1 α: odrzucamy H 0, je±li X > µ0 + zσ n. Niech 1 β(µ) b dzie funkcj mocy tego testu. Nasz wybór staªej c zapewnia,»e 1 β(µ 0 ) = α. Z lematu N-P wnioskujemy,»e jest to najmocniejszy test H 0 : µ = µ 0 przeciw H 1 : µ = µ 1 na poziomie istotno±ci α. Mówili±my na razie o dwóch hipotezach prostych, ale ten sam test jest równie» TJNM H 0 : µ µ 0 przeciw H 1 : µ > µ 0, na poziomie istotno±ci α. eby to uzasadni, posªu»ymy si bardzo prost argumentacj. Je±li test ma poziom istotno±ci α, to w szczególno±ci 1 β(µ 0 ) α. Dla dowolnego µ 1 > µ 0, spo±ród testów speªniaj cych warunek 1 β(µ 0 ) α, nasz test ma najwi ksz moc w punkcie µ 1. Ale to znaczy,»e jest on jednostajnie najmocniejszym testem przeciw alternatywie µ > µ 0. Na koniec przyjrzyjmy si funkcji mocy naszego TJNM: ( (8.2.4) 1 β(µ) = 1 Φ z n µ µ ) 0. σ
32 116 ROZDZIAŠ 8. TEORIA TESTOWANIA HIPOTEZ Rodziny z monotonicznym ilorazem wiarogodno±ci. W Przykªadzie 8.2.3, konstrukcja TJNM opieraªa si na spostrze»eniu,»e najmocniejszy test test hipotezy prostej µ 0 przeciw µ 1 na poziomie istotno±ci α jest taki sam dla wszystkich alternatyw µ 1 > µ 0. To rozumowanie mo»na uogólni. Je±li mamy rodzin g sto±ci {f θ } tak,»e dla wszystkich θ 0 < θ 1 iloraz f θ1 (x)/f θ0 (x) jest rosn c funkcj pewnej statystyki T (x) to mówimy o rodzinie z monotonicznym ilorazem wiarogodno±ci. W zagadnieniu jednostronnym H 0 : θ θ 0 przeciw H 1 : θ > θ 0, TJNM na poziomie istotno±ci α ma posta T (X) > c, gdzie c jest staª, dobran tak»eby P θ0 (T (X) > c) = α. Testy nieobci»one. Dla rodziny z monotonicznym ilorazem wiarogodno±ci, w zagadnieniu dwustronnym H 0 : θ = θ 0 przeciw H 1 : θ θ 0, TJNM po prostu nie istnieje. Rzeczywi±cie, test na poziomie istotno±ci α musi by postaci T (X) > c 1,»eby by najmocniejszy w punkcie θ 1 > θ 0 i musi by postaci T (X) < c 2,»eby by najmocniejszy w punkcie θ 2 < θ 0. Powstaje podobny kªopot jak w teorii estymacji. Mamy do dyspozycji ró»ne testy, z których»aden nie jest (uniwersalnie) najlepszy. Pewnym wyj±ciem jest ograniczenie rozwa»a«do tak zwanych testów nieobci»onych DEFINICJA. Rozwa»my zagadnienie testowania H 0 : θ Θ 0 przeciw H 1 : θ Θ 1. Test δ nazywamy nieobci»onym, je±li dla dowolnych θ 0 Θ 0 i θ 1 Θ 1 mamy P θ1 (δ(x) = 1) P θ0 (δ(x) = 1). Innymi sªowy, dla testu nieobci»onego moc nigdzie nie spada poni»ej poziomu istotno±ci. Jest to bardzo naturalne wymaganie Przykªad (Model normalny, test dwustronny). W modelu z Przykªadu 8.2.3, rozwa»my zagadnienie testowania H 0 : µ = µ 0 przeciw H 1 : µ µ 0. TJNM, jak wiemy, nie istnieje. Rozwa»my test odrzucamy H 0, je±li X µ 0 > zσ n, gdzie z jest kwantylem rz du 1 α/2, czyli Φ(z) = 1 α/2. Funkcja mocy rozwa»anego teraz testu jest nast puj ca: ( 1 β(µ) = 1 Φ z n µ µ ) ( 0 + Φ z n µ µ ) 0. σ σ Zauwa»my,»e 1 β(µ 0 ) = α i 1 β(µ) > α dla µ µ 0. Zatem nasz test jest testem nieobci»onym H 0 : µ µ 0 przeciw H 1 : µ > µ 0 na poziomie istotno±ci α. W istocie,
33 8.2. LEMAT NEYMANA-PEARSONA 117 mo»na pokaza wi cej: jest to test najmocniejszy spo±ród testów nieobci»onych na ustalonym poziomie istotno±ci. Funkcje mocy dwóch testów jednostronnych H 0 : µ = 0 (przeciw H 1 : µ > 0 i przeciw H 1 : µ < 0, Przykªad 8.2.3) oraz testu dwustronnego (przeciw H 1 : µ 0, Przykªad 8.2.6) s pokazane na Rysunku 8.1. Przyj ty poziom istotno±ci jest równy α = moc greater less two.sided µ Rysunek 8.1: Funkcje mocy testów jednostronnych i testu dwustronnego.
34 118 ROZDZIAŠ 8. TEORIA TESTOWANIA HIPOTEZ 8.3 Testy ilorazu wiarogodno±ci Rozwa»my dwa modele statystyczne (na tej samej przestrzeni obserwacji). W modelu pierwszym mamy do czynienia z rodzin rozkªadów prawdopodobie«stwa o g sto±ciach f 0 (θ 0, x), gdzie θ 0 Θ 0, za± w modelu drugim mamy g sto±ci f 1 (θ 1, x), gdzie θ 1 Θ 1. Chcemy zdecydowa, który z dwóch konkuruj cych modeli wybra do opisu do±wiadczenia losowego, w którym pojawiªa si obserwacja X. Zgodnie z klasycznym schematem testowania hipotez, oba modele nie b d traktowane równoprawnie: pierwszy z nich odgrywa rol hipotezy zerowej, z której nie mamy ochoty rezygnowa bez wyra¹nej konieczno±ci. Rozwa»amy zatem zagadnienie testowania przeciw H 0 : X f 0 (θ 0, ) dla pewnego θ 0 Θ 0 H 1 : X f 1 (θ 1, ) dla pewnego θ 1 Θ 1. W istocie, jeste±my w podobnej sytuacji jak w Lemacie Neymana - Pearsona z t ró»nic,»e dwa konkurencyjne modele s statystyczne, a nie probabilistyczne. Modele zawieraj nieznane parametry (θ 0 i θ 1 ). Rzecz jasna, to bardzo komplikuje spraw i nie mo»emy bezpo±rednio odwoªa si do Lematu N-P. Spróbujemy na±ladowa ide testu ilorazu wiarogodno±ci, z koniecznymi modykacjami. Za statystyk testow przyjmiemy Innymi sªowy, λ = sup θ 1 Θ 1 f 1 (θ 1, X) sup θ0 Θ 0 f 0 (θ 0, X). λ = f 1(ˆθ 1, X) f 0 (ˆθ 0, X), gdzie ˆθ 0 = ˆθ 0 (X) i ˆθ 1 = ˆθ 1 (X) s estymatorami najwi kszej wiarogodno±ci odpowiednio w pierwszym i drugim modelu. Odrzucamy H 0, je±li λ > c, gdzie c jest pewn staª. Konstrukcj tego testu mo»na nieformalnie uzasadni tak: porównujemy najwi ksz szans otrzymania obserwacji X, gdy prawdziwa jest hipoteza H 1 i najwi ksz szans, gdy prawdziwa jest hipoteza H 0. Dostatecznie du»a warto± ilorazu tych najwi kszych szans sugeruje odrzucenie H 0 na rzecz H Modele zagnie»d»one. Rozwa»my model statystyczny opisany przez rodzin g sto±ci prawdopodobie«stwa {f θ : θ Θ} i zanurzony w nim mniejszy model {f θ : θ Θ 0 }, gdzie Θ 0 Θ. Interesuje nas pytanie: czy mo»emy zaªo»y,»e mniejszy model Θ 0 opisuje poprawnie do±wiadczenie losowe, czy potrzebny jest wi kszy model Θ? Formalnie, zagadnienie polega na zbudowaniu testu hipotezy H 0 : θ Θ 0 przeciw alternatywie H 1 :
In»ynierskie zastosowania statystyki wiczenia
Uwagi: 27012014 poprawiono kilka literówek, zwi zanych z przedziaªami ufno±ci dla wariancji i odchylenia standardowego In»ynierskie zastosowania statystyki wiczenia Przedziaªy wiarygodno±ci, testowanie
Statystyka matematyczna - ZSTA LMO
Statystyka matematyczna - ZSTA LMO Šukasz Smaga Wydziaª Matematyki i Informatyki Uniwersytet im. Adama Mickiewicza w Poznaniu Wykªad 4 Šukasz Smaga (WMI UAM) ZSTA LMO Wykªad 4 1 / 18 Wykªad 4 - zagadnienia
Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).
PRZYKŁADY TESTÓW NIEPARAMETRYCZNYCH. Test zgodności χ 2. Ten test służy testowaniu hipotezy, czy rozważana zmienna ma pewien ustalony rozkład, czy też jej rozkład różni się od tego ustalonego. Tym testem
5. (8 punktów) EGZAMIN MAGISTERSKI, r Matematyka w ekonomii i ubezpieczeniach
Matematyka w ekonomii i ubezpieczeniach ( Niezale»ne szkody maja rozkªady P (X i = k) = exp( 1)/k!, P (Y i = k) = 4+k ) k (1/3) 5 (/3) k, k = 0, 1,.... Niech S = X 1 +... + X 500 + Y 1 +... + Y 500. Skªadka
Część III. Testowanie hipotez statystycznych
Część III Testowanie hipotez statystycznych 89 Rozdział 7 Testy istotności W tym rozdziale spróbujemy wyjaśnić, na czym polega zagadnienie testowania hipotez statystycznych. Pokażemy, jak konstruuje się
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 9 i 10 1 / 30 TESTOWANIE HIPOTEZ STATYSTYCZNYCH
Biostatystyka, # 5 /Weterynaria I/
Biostatystyka, # 5 /Weterynaria I/ dr n. mat. Zdzisªaw Otachel Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowa«Matematyki i Informatyki ul. Gª boka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl
ARYTMETYKA MODULARNA. Grzegorz Szkibiel. Wiosna 2014/15
ARYTMETYKA MODULARNA Grzegorz Szkibiel Wiosna 2014/15 Spis tre±ci 1 Denicja kongruencji i jej podstawowe wªasno±ci 3 2 Systemy pozycyjne 8 3 Elementy odwrotne 12 4 Pewne zastosowania elementów odwrotnych
1 Bª dy i arytmetyka zmiennopozycyjna
1 Bª dy i arytmetyka zmiennopozycyjna Liczby w pami ci komputera przedstawiamy w ukªadzie dwójkowym w postaci zmiennopozycyjnej Oznacza to,»e s one postaci ±m c, 01 m < 1, c min c c max, (1) gdzie m nazywamy
ARYTMETYKA MODULARNA. Grzegorz Szkibiel. Wiosna 2014/15
ARYTMETYKA MODULARNA Grzegorz Szkibiel Wiosna 2014/15 Spis tre±ci 1 Denicja kongruencji i jej podstawowe wªasno±ci 3 2 Systemy pozycyjne 8 3 Elementy odwrotne 12 4 Pewne zastosowania elementów odwrotnych
Ekonometria. wiczenia 2 Werykacja modelu liniowego. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej
Ekonometria wiczenia 2 Werykacja modelu liniowego (2) Ekonometria 1 / 33 Plan wicze«1 Wprowadzenie 2 Ocena dopasowania R-kwadrat Skorygowany R-kwadrat i kryteria informacyjne 3 Ocena istotno±ci zmiennych
Elementarna statystyka Dwie próby: porównanie dwóch proporcji (Two-sample problem: comparing two proportions)
Elementarna statystyka Dwie próby: porównanie dwóch proporcji (Two-sample problem: comparing two proportions) Alexander Bendikov Uniwersytet Wrocªawski 25 maja 2016 Elementarna statystyka Dwie próby: porównanie
ANALIZA NUMERYCZNA. Grzegorz Szkibiel. Wiosna 2014/15
ANALIZA NUMERYCZNA Grzegorz Szkibiel Wiosna 2014/15 Spis tre±ci 1 Metoda Eulera 3 1.1 zagadnienia brzegowe....................... 3 1.2 Zastosowanie ró»niczki...................... 4 1.3 Output do pliku
Testowanie hipotez statystycznych.
Bioinformatyka Wykład 9 Wrocław, 5 grudnia 2011 Temat. Test zgodności χ 2 Pearsona. Statystyka χ 2 Pearsona Rozpatrzmy ciąg niezależnych zmiennych losowych X 1,..., X n o jednakowym dyskretnym rozkładzie
Metody probablistyczne i statystyka stosowana
Politechnika Wrocªawska - Wydziaª Podstawowych Problemów Techniki - 011 Metody probablistyczne i statystyka stosowana prowadz cy: dr hab. in». Krzysztof Szajowski opracowanie: Tomasz Kusienicki* κ 17801
x y x y x y x + y x y
Algebra logiki 1 W zbiorze {0, 1} okre±lamy dziaªania dwuargumentowe,, +, oraz dziaªanie jednoargumentowe ( ). Dziaªanie x + y nazywamy dodawaniem modulo 2, a dziaªanie x y nazywamy kresk Sheera. x x 0
Metody dowodzenia twierdze«
Metody dowodzenia twierdze«1 Metoda indukcji matematycznej Je±li T (n) jest form zdaniow okre±lon w zbiorze liczb naturalnych, to prawdziwe jest zdanie (T (0) n N (T (n) T (n + 1))) n N T (n). 2 W przypadku
Elementy Modelowania Matematycznego Wykªad 1 Prawdopodobie«stwo
Spis tre±ci Elementy Modelowania Matematycznego Wykªad 1 Prawdopodobie«stwo Romuald Kotowski Katedra Informatyki Stosowanej PJWSTK 2009 Spis tre±ci Spis tre±ci 1 2 3 4 5 Spis tre±ci Spis tre±ci 1 2 3 4
ARYTMETYKA MODULARNA. Grzegorz Szkibiel. Wiosna 2014/15
ARYTMETYKA MODULARNA Grzegorz Szkibiel Wiosna 2014/15 Spis tre±ci 1 Denicja kongruencji i jej podstawowe wªasno±ci 3 2 Systemy pozycyjne 8 3 Elementy odwrotne 12 4 Pewne zastosowania elementów odwrotnych
ARYTMETYKA MODULARNA. Grzegorz Szkibiel. Wiosna 2014/15
ARYTMETYKA MODULARNA Grzegorz Szkibiel Wiosna 2014/15 Spis tre±ci 1 Denicja kongruencji i jej podstawowe wªasno±ci 3 2 Systemy pozycyjne 8 3 Elementy odwrotne 12 4 Pewne zastosowania elementów odwrotnych
ARYTMETYKA MODULARNA. Grzegorz Szkibiel. Wiosna 2014/15
ARYTMETYKA MODULARNA Grzegorz Szkibiel Wiosna 2014/15 Spis tre±ci 1 Denicja kongruencji i jej podstawowe wªasno±ci 3 2 Systemy pozycyjne 8 3 Elementy odwrotne 12 4 Pewne zastosowania elementów odwrotnych
Elementarna statystyka
Elementarna statystyka Alexander Bendikov 26 marca 2017 Klasyczny model: eksperyment o jednakowo prawdopodobnych wynikach Zaªo»enia: 1 Przestrze«próbek S ma sko«czenie wiele wyników ω 1, ω 2,..., ω n,
Elementarna statystyka Test Istotno±ci
Elementarna statystyka Test Istotno±ci Alexander Bendikov Uniwersytet Wrocªawski 27 kwietnia 2017 Alexander Bendikov (UWr) Elementarna statystyka Test Istotno±ci 27 kwietnia 2017 1 / 24 Wnioskowanie statystyczne:
Metodydowodzenia twierdzeń
1 Metodydowodzenia twierdzeń Przez zdanie rozumiemy dowolne stwierdzenie, które jest albo prawdziwe, albo faªszywe (nie mo»e by ono jednocze±nie prawdziwe i faªszywe). Tradycyjnie b dziemy u»ywali maªych
STATYSTYKA
Wykład 1 20.02.2008r. 1. ROZKŁADY PRAWDOPODOBIEŃSTWA 1.1 Rozkład dwumianowy Rozkład dwumianowy, 0 1 Uwaga: 1, rozkład zero jedynkowy. 1 ; 1,2,, Fakt: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym
Testowanie hipotez statystycznych.
Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 11 i 12 1 / 41 TESTOWANIE HIPOTEZ - PORÓWNANIE
Statystyka Matematyczna Anna Janicka
Statystyka Matematyczna Anna Janicka wykład X, 9.05.206 TESTOWANIE HIPOTEZ STATYSTYCZNYCH II: PORÓWNYWANIE TESTÓW Plan na dzisiaj 0. Przypomnienie potrzebnych definicji. Porównywanie testów 2. Test jednostajnie
CAŠKOWANIE METODAMI MONTE CARLO Janusz Adamowski
III. CAŠKOWAIE METODAMI MOTE CARLO Janusz Adamowski 1 1 azwa metody Podstawowym zastosowaniem w zyce metody Monte Carlo (MC) jest opis zªo-»onych ukªadów zycznych o du»ej liczbie stopni swobody. Opis zªo»onych
Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.
Testowanie hipotez Niech X = (X 1... X n ) będzie próbą losową na przestrzeni X zaś P = {P θ θ Θ} rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X. Definicja 1. Hipotezą zerową Θ
Ciaªa i wielomiany. 1 Denicja ciaªa. Ciaªa i wielomiany 1
Ciaªa i wielomiany 1 Ciaªa i wielomiany 1 Denicja ciaªa Niech F b dzie zbiorem, i niech + (dodawanie) oraz (mno»enie) b d dziaªaniami na zbiorze F. Denicja. Zbiór F wraz z dziaªaniami + i nazywamy ciaªem,
Wykªad 7. Ekstrema lokalne funkcji dwóch zmiennych.
Wykªad jest prowadzony w oparciu o podr cznik Analiza matematyczna 2. Denicje, twierdzenia, wzory M. Gewerta i Z. Skoczylasa. Wykªad 7. Ekstrema lokalne funkcji dwóch zmiennych. Denicja Mówimy,»e funkcja
3. (8 punktów) EGZAMIN MAGISTERSKI, Biomatematyka
EGZAMIN MAGISTERSKI, 26.06.2017 Biomatematyka 1. (8 punktów) Rozwój wielko±ci pewnej populacji jest opisany równaniem: dn dt = rn(t) (1 + an(t), b gdzie N(t) jest wielko±ci populacji w chwili t, natomiast
Elementarna statystyka Test Istotno±ci (Tests of Signicance)
Elementarna statystyka Test Istotno±ci (Tests of Signicance) Alexander Bendikov Uniwersytet Wrocªawski 16 kwietnia 2016 Elementarna statystyka Test Istotno±ci (Tests of Signicance) 16 kwietnia 2016 1 /
Biostatystyka, # 4 /Weterynaria I/
Biostatystyka, # 4 /Weterynaria I/ dr n. mat. Zdzisªaw Otachel Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowa«Matematyki i Informatyki ul. Gª boka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl
EGZAMIN MAGISTERSKI, r Matematyka w ekonomii i ubezpieczeniach
EGZAMIN MAGISTERSKI, 12.09.2018r Matematyka w ekonomii i ubezpieczeniach Zadanie 1. (8 punktów) O rozkªadzie pewnego ryzyka S wiemy,»e: E[(S 20) + ] = 8 E[S 10 < S 20] = 13 P (S 20) = 3 4 P (S 10) = 1
Ekonometria - wykªad 8
Ekonometria - wykªad 8 3.1 Specykacja i werykacja modelu liniowego dobór zmiennych obja±niaj cych - cz ± 1 Barbara Jasiulis-Goªdyn 11.04.2014, 25.04.2014 2013/2014 Wprowadzenie Ideologia Y zmienna obja±niana
Matematyka z elementami statystyki
Matematyka z elementami statystyki Šukasz Dawidowski Instytut Matematyki, Uniwersytet l ski Korelacja Zale»no± funkcyjna wraz ze wzrostem jednej zmiennej nast puje ±ci±le okre±lona zmiana druiej zmiennej.
Rozwini cia asymptotyczne dla mocy testów przybli»onych
Rozwini cia asymptotyczne dla mocy testów przybli»onych Piotr Majerski, Zbigniew Szkutnik AGH Kraków Wisªa 2010 P. Majerski, Z. Szkutnik, AGH () Rozwini cia mocy testów przybli»onych Wisªa 2010 1 / 22
ARYTMETYKA MODULARNA. Grzegorz Szkibiel. Wiosna 2014/15
ARYTMETYKA MODULARNA Grzegorz Szkibiel Wiosna 2014/15 Spis tre±ci 1 Denicja kongruencji i jej podstawowe wªasno±ci 3 2 Systemy pozycyjne 8 3 Elementy odwrotne 12 4 Pewne zastosowania elementów odwrotnych
ARYTMETYKA MODULARNA. Grzegorz Szkibiel. Wiosna 2014/15
ARYTMETYKA MODULARNA Grzegorz Szkibiel Wiosna 2014/15 Spis tre±ci 1 Denicja kongruencji i jej podstawowe wªasno±ci 3 2 Systemy pozycyjne 8 3 Elementy odwrotne 12 4 Pewne zastosowania elementów odwrotnych
Rozkªady i warto± oczekiwana
Rozkªady i warto± oczekiwana Piotr Wilkin Zmienne losowe i rozkªady. Wst p Zmienn losow nazywamy zmienn X przyjmuj c dowolne warto±ci z pewnego zbioru D, która speªnia wªasno± y D P (X = y) = (innymi sªowy
Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa
Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie
Informatyka. z przedmiotu RACHUNEK PRAWDOPODOBIE STWA
Informatyka Zbiór przykªadowych prac kontrolnych oraz przykªadowych zada«egzaminacyjnych z przedmiotu RACHUNEK PRAWDOPODOBIE STWA Sprawdzian 1, M09-02 Zadanie 1 (1p) W rzucie dwiema kostkami obliczy prawdopodobie«stwo
Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407
Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Weryfikacja hipotez dotyczących postaci nieznanego rozkładu -Testy zgodności.
Rozkłady statystyk z próby
Rozkłady statystyk z próby Rozkłady statystyk z próby Przypuśćmy, że wykonujemy serię doświadczeń polegających na 4 krotnym rzucie symetryczną kostką do gry, obserwując liczbę wyrzuconych oczek Nr kolejny
O pewnym zadaniu olimpijskim
O pewnym zadaniu olimpijskim Michaª Seweryn, V LO w Krakowie opiekun pracy: dr Jacek Dymel Problem pocz tkowy Na drugim etapie LXII Olimpiady Matematycznej pojawiª si nast puj cy problem: Dla ka»dej liczby
Zadania z rachunku prawdopodobie«stwa
STATYSTYKA 2 rok, informatyka,. Zadania z rachunku prawdopodobie«stwa 1. Niech A B C = Ω, P (B) = 2P (A), P (C) = 3P (A), P (A B) = P (A C) = P (B C). Pokaza,»e 1 P (A) 1. Pokaza,»e oba ograniczenia mog
WST P DO TEORII INFORMACJI I KODOWANIA. Grzegorz Szkibiel. Wiosna 2013/14
WST P DO TEORII INFORMACJI I KODOWANIA Grzegorz Szkibiel Wiosna 2013/14 Spis tre±ci 1 Kodowanie i dekodowanie 4 1.1 Kodowanie a szyfrowanie..................... 4 1.2 Podstawowe poj cia........................
Elementarna statystyka Wnioskowanie o regresji (Inference 2 czerwca for regression) / 13
Elementarna statystyka Wnioskowanie o regresji (Inference for regression) Alexander Bendikov Uniwersytet Wrocªawski 2 czerwca 2016 Elementarna statystyka Wnioskowanie o regresji (Inference 2 czerwca for
1 Metody iteracyjne rozwi zywania równania f(x)=0
1 Metody iteracyjne rozwi zywania równania f()=0 1.1 Metoda bisekcji Zaªó»my,»e funkcja f jest ci gªa w [a 0, b 0 ]. Pierwiastek jest w przedziale [a 0, b 0 ] gdy f(a 0 )f(b 0 ) < 0. (1) Ustalmy f(a 0
ARYTMETYKA MODULARNA. Grzegorz Szkibiel. Wiosna 2014/15
ARYTMETYKA MODULARNA Grzegorz Szkibiel Wiosna 2014/15 Spis tre±ci 1 Denicja kongruencji i jej podstawowe wªasno±ci 3 2 Systemy pozycyjne 8 3 Elementy odwrotne 12 4 Pewne zastosowania elementów odwrotnych
A = n. 2. Ka»dy podzbiór zbioru sko«czonego jest zbiorem sko«czonym. Dowody tych twierdze«(elementarne, lecz nieco nu» ce) pominiemy.
Logika i teoria mnogo±ci, konspekt wykªad 12 Teoria mocy, cz ± II Def. 12.1 Ka»demu zbiorowi X przyporz dkowujemy oznaczany symbolem X obiekt zwany liczb kardynaln (lub moc zbioru X) w taki sposób,»e ta
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
Prawdopodobieństwo i statystyka
Wykład XI: Testowanie hipotez statystycznych 12 stycznia 2015 Przykład Motywacja X 1, X 2,..., X N N (µ, σ 2 ), Y 1, Y 2,..., Y M N (ν, δ 2 ). Chcemy sprawdzić, czy µ = ν i σ 2 = δ 2, czyli że w obu populacjach
Uczenie Wielowarstwowych Sieci Neuronów o
Plan uczenie neuronu o ci gªej funkcji aktywacji uczenie jednowarstwowej sieci neuronów o ci gªej funkcji aktywacji uczenie sieci wielowarstwowej - metoda propagacji wstecznej neuronu o ci gªej funkcji
Modele liniowe i mieszane na przykªadzie analizy danych biologicznych - Wykªad 6
Modele liniowe i mieszane na przykªadzie analizy danych biologicznych - Wykªad 6 Tomasz Suchocki Uniwersytet Przyrodniczy we Wrocªawiu Katedra Genetyki i Ogólnej Hodowli Zwierz t Plan wykªadu Model mieszany
Statystyka matematyczna - ZSTA LMO
Statystyka matematyczna - ZSTA LMO Šukasz Smaga Wydziaª Matematyki i Informatyki Uniwersytet im. Adama Mickiewicza w Poznaniu Wykªad 1 Šukasz Smaga (WMI UAM) ZSTA LMO Wykªad 1 1 / 28 Kontakt Dr Šukasz
ZADANIA. Maciej Zakarczemny
ZADANIA Maciej Zakarczemny 2 Spis tre±ci 1 Algebra 5 2 Analiza 7 2.1 Granice iterowane, granica podwójna funkcji dwóch zmiennych....... 7 2.2 Caªki powierzchniowe zorientowane...................... 8 2.2.1
Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość
Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę
ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.
Opracowała: Joanna Kisielińska ZMIENNE LOSOWE Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R tzn. X: R. Realizacją zmiennej losowej
Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28
Statystyka #5 Testowanie hipotez statystycznych Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2016/2017 1 / 28 Testowanie hipotez statystycznych 2 / 28 Testowanie hipotez statystycznych
EGZAMIN MAGISTERSKI, r Matematyka w ekonomii i ubezpieczeniach
EGZAMIN MAGISTERSKI, 12.09.2018r Matematyka w ekonomii i ubezpieczeniach Zadanie 1. (8 punktów) W modelu rezerwy R n = u + n (W 1 + + W n ) wiemy,»e W i s iid o rozkªadzie geometrycznym na 0, 1, 2,...
Testowanie hipotez statystycznych. Wnioskowanie statystyczne
Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy
O pewnej regule alokacji jako sposobie inwestowania na gieªdzie papierów warto±ciowych
O pewnej regule alokacji jako sposobie inwestowania na gieªdzie papierów warto±ciowych Paweª Gªadki 1 Podstawowe poj cia teorii gier dwuosobowych Strategia gracza to reguªa okre±laj ca wybór przez gracza
1 Poj cia pomocnicze. Przykªad 1. A A d
Poj cia pomocnicze Otoczeniem punktu x nazywamy dowolny zbiór otwarty zawieraj cy punkt x. Najcz ±ciej rozwa»amy otoczenia kuliste, tj. kule o danym promieniu ε i ±rodku x. S siedztwem punktu x nazywamy
Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu
Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)
Liniowe zadania najmniejszych kwadratów
Rozdziaª 9 Liniowe zadania najmniejszych kwadratów Liniowe zadania najmniejszych kwadratów polega na znalezieniu x R n, który minimalizuje Ax b 2 dla danej macierzy A R m,n i wektora b R m. Zauwa»my,»e
TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.
TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne. Zajmiemy
Lekcja 9 - LICZBY LOSOWE, ZMIENNE
Lekcja 9 - LICZBY LOSOWE, ZMIENNE I STAŠE 1 Liczby losowe Czasami spotkamy si z tak sytuacj,»e b dziemy potrzebowa by program za nas wylosowaª jak ± liczb. U»yjemy do tego polecenia: - liczba losowa Sprawd¹my
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
wiczenie nr 3 z przedmiotu Metody prognozowania kwiecie«2015 r. Metodyka bada«do±wiadczalnych dr hab. in». Sebastian Skoczypiec Cel wiczenia Zaªo»enia
wiczenie nr 3 z przedmiotu Metody prognozowania kwiecie«2015 r. wiczenia 1 2 do wiczenia 3 4 Badanie do±wiadczalne 5 pomiarów 6 7 Cel Celem wiczenia jest zapoznanie studentów z etapami przygotowania i
Ekonometria Bayesowska
Ekonometria Bayesowska Wykªad 9: Metody numeryczne: MCMC Andrzej Torój 1 / 17 Plan wykªadu Wprowadzenie 1 Wprowadzenie 3 / 17 Plan prezentacji Wprowadzenie 1 Wprowadzenie 3 3 / 17 Zastosowanie metod numerycznych
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 7 i 8 1 / 9 EFEKTYWNOŚĆ ESTYMATORÓW, próba
WST P DO TEORII INFORMACJI I KODOWANIA. Grzegorz Szkibiel. Wiosna 2013/14
WST P DO TEORII INFORMACJI I KODOWANIA Grzegorz Szkibiel Wiosna 203/4 Spis tre±ci Kodowanie i dekodowanie 4. Kodowanie a szyfrowanie..................... 4.2 Podstawowe poj cia........................
Podstawy statystycznego modelowania danych Analiza prze»ycia
Podstawy statystycznego modelowania danych Analiza prze»ycia Tomasz Suchocki Uniwersytet Przyrodniczy we Wrocªawiu Katedra Genetyki i Ogólnej Hodowli Zwierz t Plan wykªadu 1. Wprowadzenie 2. Hazard rate
Równania ró»niczkowe I rz du (RRIR) Twierdzenie Picarda. Anna D browska. WFTiMS. 23 marca 2010
WFTiMS 23 marca 2010 Spis tre±ci 1 Denicja 1 (równanie ró»niczkowe pierwszego rz du) Równanie y = f (t, y) (1) nazywamy równaniem ró»niczkowym zwyczajnym pierwszego rz du w postaci normalnej. Uwaga 1 Ogólna
Proste modele o zªo»onej dynamice
Proste modele o zªo»onej dynamice czyli krótki wst p do teorii chaosu Tomasz Rodak Festiwal Nauki, Techniki i Sztuki 2018 April 17, 2018 Dyskretny model pojedynczej populacji Rozwa»my pojedyncz populacj
Ekstremalnie maªe zbiory
Maªe jest pi kne Instytut Matematyki Uniwersytetu Warszawskiego Nadarzyn, 27.08.2011 Zbiory silnie miary zero Przypomnienie Zbiór X [0, 1] jest miary Lebesgue'a zero, gdy dla ka»dego ε > 0 istnieje ci
Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości
TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu, z którego pochodzi próbka. Hipotezy dzielimy na parametryczne i nieparametryczne. Parametrycznymi
Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )
Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału
Interpolacja funkcjami sklejanymi
Interpolacja funkcjami sklejanymi Funkcje sklejane: Zaªó»my,»e mamy n + 1 w zªów t 0, t 1,, t n takich,»e t 0 < t 1 < < t n Dla danej liczby caªkowitej, nieujemnej k funkcj sklejan stopnia k nazywamy tak
2.1 Przykład wstępny Określenie i konstrukcja Model dwupunktowy Model gaussowski... 7
Spis treści Spis treści 1 Przedziały ufności 1 1.1 Przykład wstępny.......................... 1 1.2 Określenie i konstrukcja...................... 3 1.3 Model dwupunktowy........................ 5 1.4
Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r
Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów
Ekstremalnie fajne równania
Ekstremalnie fajne równania ELEMENTY RACHUNKU WARIACYJNEGO Zaczniemy od ogólnych uwag nt. rachunku wariacyjnego, który jest bardzo przydatnym narz dziem mog cym posªu»y do rozwi zywania wielu problemów
TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.
TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy. Hipotezy dzielimy na parametryczne i nieparametryczne. Zajmiemy
1 Granice funkcji wielu zmiennych.
AM WNE 008/009. Odpowiedzi do zada«przygotowawczych do czwartego kolokwium. Granice funkcji wielu zmiennych. Zadanie. Zadanie. Pochodne. (a) 0, Granica nie istnieje, (c) Granica nie istnieje, (d) Granica
Hipotezy proste. (1 + a)x a, dla 0 < x < 1, 0, poza tym.
Hipotezy proste Zadanie 1. Niech X ma funkcję gęstości f a (x) = (1 + a)x a, dla 0 < x < 1, Testujemy H 0 : a = 1 przeciwko H 1 : a = 2. Dysponujemy pojedynczą obserwacją X. Wyznaczyć obszar krytyczny
Arkusz maturalny. Šukasz Dawidowski. 25 kwietnia 2016r. Powtórki maturalne
Arkusz maturalny Šukasz Dawidowski Powtórki maturalne 25 kwietnia 2016r. Odwrotno±ci liczby rzeczywistej 1. 9 8 2. 0, (1) 3. 8 9 4. 0, (8) 3 4 4 4 1 jest liczba Odwrotno±ci liczby rzeczywistej 3 4 4 4
), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0
Testowanie hipotez Każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy nazywamy hipotezą statystyczną. Hipoteza określająca jedynie wartości nieznanych parametrów liczbowych badanej cechy
Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych
Statystyka matematyczna. Wykład IV. e-mail:e.kozlovski@pollub.pl Spis treści 1 2 3 Definicja 1 Hipoteza statystyczna jest to przypuszczenie dotyczące rozkładu (wielkości parametru lub rodzaju) zmiennej
Wykªad 6: Model logitowy
Wykªad 6: Model logitowy Ekonometria Stosowana SGH Model logitowy 1 / 18 Plan wicze«1 Modele zmiennej jako±ciowej idea 2 Model logitowy Specykacja i interpretacja parametrów Dopasowanie i restrykcje 3
166 Wstęp do statystyki matematycznej
166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej
Zagadnienia na wej±ciówki z matematyki Technologia Chemiczna
Zagadnienia na wej±ciówki z matematyki Technologia Chemiczna 1. Podaj denicj liczby zespolonej. 2. Jak obliczy sum /iloczyn dwóch liczb zespolonych w postaci algebraicznej? 3. Co to jest liczba urojona?
VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15
VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady
2 Liczby rzeczywiste - cz. 2
2 Liczby rzeczywiste - cz. 2 W tej lekcji omówimy pozostaªe tematy zwi zane z liczbami rzeczywistymi. 2. Przedziaªy liczbowe Wyró»niamy nast puj ce rodzaje przedziaªów liczbowych: (a) przedziaªy ograniczone:
Statystyka opisowa. Wykªad II. Elementy statystyki opisowej. Edward Kozªowski.
Statystyka opisowa. Wykªad II. e-mail:e.kozlovski@pollub.pl Spis tre±ci Mediana i moda 1 Mediana i moda 2 3 4 Mediana i moda Median m e (warto±ci ±rodkow ) próbki x 1,..., x n nazywamy ±rodkow liczb w
Testowanie hipotez statystycznych.
Bioinformatyka Wykład 4 Wrocław, 17 października 2011 Temat. Weryfikacja hipotez statystycznych dotyczących wartości oczekiwanej w dwóch populacjach o rozkładach normalnych. Model 3. Porównanie średnich
Testowanie hipotez cz. I
Wykład 11 Testowanie hipotez cz. I TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipoteza statystyczna jest to przypuszczenie dotyczące nieznanej własności rozkładu prawdopodobieństwa badanej cechy populacji. W zadaniach