test dla średniej rozkładu normalnego moc testu test dla wariancji rozkładu normalnego test dla rozkładu dwumianowego, Poissona

Podobne dokumenty
1. Wnioskowanie statystyczne. Ponadto mianem statystyki określa się także funkcje zmiennych losowych o

Testowanie hipotez. H 1 : µ 15 lub H 1 : µ < 15 lub H 1 : µ > 15

X i. X = 1 n. i=1. wartość tej statystyki nazywana jest wartością średnią empiryczną i oznaczamy ją symbolem x, przy czym x = 1. (X i X) 2.

Zadanie 2 Niech,,, będą niezależnymi zmiennymi losowymi o identycznym rozkładzie,.

Statystyka. Katarzyna Chudy Laskowska

Statystyka matematyczna dla leśników

Statystyka i Opracowanie Danych. W7. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

Metoda łączona. Wykład 7 Dwie niezależne próby. Standardowy błąd dla różnicy dwóch średnich. Metoda zwykła (niełączona) n2 2

Estymacja parametrów populacji

16 Przedziały ufności

KURS STATYSTYKA. Lekcja 3 Parametryczne testy istotności ZADANIE DOMOWE. Strona 1

12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez

L.Kowalski zadania ze statystyki matematycznej-zestaw 3 ZADANIA - ZESTAW 3

Estymacja przedziałowa

Parametryczne Testy Istotności

3. Tworzenie próby, błąd przypadkowy (próbkowania) 5. Błąd standardowy średniej arytmetycznej

STATYSTYKA I ANALIZA DANYCH

ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA

Estymacja: Punktowa (ocena, błędy szacunku) Przedziałowa (przedział ufności)

PODSTAWY BIOSTATYSTYKI ĆWICZENIA

(X i X) 2. n 1. X m S

Ćwiczenie nr 14. Porównanie doświadczalnego rozkładu liczby zliczeń w zadanym przedziale czasu z rozkładem Poissona

Moda (Mo, D) wartość cechy występującej najczęściej (najliczniej).

1 Testy statystyczne. 2 Rodzaje testów

TESTY LOSOWOŚCI. Badanie losowości próby - test serii.

Estymacja przedziałowa - przedziały ufności

SIGMA KWADRAT LUBELSKI KONKURS STATYSTYCZNO- DEMOGRAFICZNY

Słowniczek Hipoteza statystyczna Hipoteza parametryczna Hipoteza nieparametryczna Hipoteza zerowa Hipoteza alternatywna Błąd pierwszego rodzaju

Podstawowe oznaczenia i wzory stosowane na wykładzie i laboratorium Część I: estymacja

ANALIZA DANYCH DYSKRETNYCH

Korelacja i regresja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 12

Wykład 5 Przedziały ufności. Przedział ufności, gdy znane jest σ. Opis słowny / 2

2.1. Studium przypadku 1

Ćwiczenie 2 ESTYMACJA STATYSTYCZNA

Wykład 11 ( ). Przedziały ufności dla średniej

STATYSTYKA MATEMATYCZNA

Lista 6. Estymacja punktowa

Statystyka opisowa. (n m n m 1 ) h (n m n m 1 ) + (n m n m+1 ) 2 +1), gdy n jest parzyste

Metrologia: miary dokładności. dr inż. Paweł Zalewski Akademia Morska w Szczecinie

Trzeba pokazać, że dla każdego c 0 c Mc 0. ) = oraz det( ) det( ) det( ) jest macierzą idempotentną? Proszę odpowiedzieć w

STATYSTYKA MATEMATYCZNA

n n X n = σ σ = n n n Ponieważ zmienna losowa standaryzowana ma rozkład normalny N(0, 1), więc

Wokół testu Studenta 1. Wprowadzenie Rozkłady prawdopodobieństwa występujące w testowaniu hipotez dotyczących rozkładów normalnych

STATYSTYKA OPISOWA I PROJEKTOWANIE EKSPERYMENTU dr inż Krzysztof Bryś

Statystyka Matematyczna Anna Janicka

PRZEDZIAŁY UFNOŚCI. Niech θ - nieznany parametr rozkładu cechy X. Niech α będzie liczbą z przedziału (0, 1).

Elementy statystyki opisowej Izolda Gorgol wyciąg z prezentacji (wykład I)

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Edycja pierwsza 2014/1015. dla kierunku fizyka medyczna, I rok, studia magisterskie

będą niezależnymi zmiennymi losowymi z rozkładu jednostajnego na przedziale ( 0,

Miary położenia (tendencji centralnej) to tzw. miary przeciętne charakteryzujące średni lub typowy poziom wartości cechy.

Rachunek prawdopodobieństwa i statystyka W12: Statystyczna analiza danych jakościowych. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.

Estymacja przedziałowa:

Rozkład normalny (Gaussa)

Prawdopodobieństwo i statystyka r.

Porównanie dwu populacji

Statystyka matematyczna. Wykład II. Estymacja punktowa

µ = Test jest następujący: jeŝeli X > 0.01 to odrzucamy H. 0

Estymacja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 7

WYKŁAD 1. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady

θx θ 1, dla 0 < x < 1, 0, poza tym,

Wykład 10 Wnioskowanie o proporcjach

Estymacja to wnioskowanie statystyczne koncentrujące się wokół oszacowania wartości specyficznych parametrów populacji.

STATYSTKA I ANALIZA DANYCH LAB II

Elementy modelowania matematycznego

Charakterystyki liczbowe zmiennych losowych: wartość oczekiwana i wariancja

Estymacja przedziałowa - przedziały ufności

1 Dwuwymiarowa zmienna losowa

PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH

Statystyka w rozumieniu tego wykładu to zbiór metod służących pozyskiwaniu, prezentacji, analizie danych.

ZADANIA NA ĆWICZENIA 3 I 4

Opracowanie danych pomiarowych. dla studentów realizujących program Pracowni Fizycznej

Rozkłady statystyk z próby Twierdzenia graniczne

Estymacja punktowa i przedziałowa

Ćwiczenia rachunkowe TEST ZGODNOŚCI χ 2 PEARSONA ROZKŁAD GAUSSA

8. WERYFIKACJA HIPOTEZ STATYSTYCZNYCH DWA RODZAJE TESTÓW STATYSTYCZNYCH: PARAMETRYCZNE I ZGODNOŚCI

1 Zmienne losowe. Własności dystrybuanty F (x) = P (X < x): F1. 0 F (x) 1 dla każdego x R, F2. lim F (x) = 0 oraz lim F (x) = 1,

Prawdopodobieństwo i statystyka r.

ZSTA LMO Zadania na ćwiczenia

Lista 5. Odp. 1. xf(x)dx = xdx = 1 2 E [X] = 1. Pr(X > 3/4) E [X] 3/4 = 2 3. Zadanie 3. Zmienne losowe X i (i = 1, 2, 3, 4) są niezależne o tym samym

Statystyka Matematyczna Anna Janicka

Modele probabilistyczne zjawisk losowych

są niezależnymi zmiennymi losowymi o jednakowym rozkładzie Poissona z wartością oczekiwaną λ równą 10. Obliczyć v = var( X

Statystyka powtórzenie (I semestr) Rafał M. Frąk

Komputerowa analiza danych doświadczalnych

ma rozkład złożony Poissona z oczekiwaną liczbą szkód równą λ i rozkładem wartości pojedynczej szkody takim, że Pr( Y

Statystyka opisowa - dodatek

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Metoda łączona. Wykład 7 Dwie niezależne próby. Standardowy błąd dla różnicy dwóch średnich. Metoda zwykła (niełączona)

Rachunek prawdopodobieństwa i statystyka Wnioskowanie statystyczne. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

TESTY NORMALNOŚCI. ( Cecha X populacji ma rozkład normalny). Hipoteza alternatywna H1( Cecha X populacji nie ma rozkładu normalnego).

STATYSTYKA OPISOWA WYKŁAD 1 i 2

Statystyczny opis danych - parametry

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka Inżynierska

Zasada indukcji matematycznej. Dowody indukcyjne.

Plan wykładu. Analiza danych Wykład 1: Statystyka opisowa. Literatura. Podstawowe pojęcia

ZMIENNA LOSOWA I JEJ PARAMETRY -powtórzenie

8 Weryfikacja hipotez statystycznych

Transkrypt:

/9/7 Biostatystyka, 6/7 dla Fizyki Medyczej, studia magisterskie test dla średiej rozkładu ormalego moc testu test dla wariacji rozkładu ormalego test dla rozkładu dwumiaowego, Poissoa Estymacja przedziałowa Testowaie hipotez estymator ieobciążoy estymator mi wariacji estymator MLE

/9/7 waga oworodka a status społeczy matki Przypuśćmy, że szpital, którego dae o wadze oworodków badaliśmy, zajduje się w obszarze biedym mieszkańcy okoliczi mają iski status ekoomiczy. Załóżmy, że średia waga oworodka w populacji ogólej to ucji. Czy waga oworodków od matek o iskim statusie ekoomiczym jest iższa iż waga oworodków z populacji ogólej? Czy waga oworodków ie zależy od statusu ekoomiczego matki? śmiertele choroby serca a wysoki cholesterol u potomstwa Zidetyfikowao grupę osób, które zmarły w ostatim okresie z powodu ataku serca. Dodatkowo, osoby te miały wysoki cholesterol, to jest > 5 mg/dl Załóżmy, że średi poziom cholesterolu w populacji ogólej dzieci w wieku -4 to 75 mg/dl Czy średi poziom cholesterolu potomstwa osób, które zmarły z powodów sercowych jest wyższy od średiego w populacji? Czy jest taki sam jak w populacji ogólej? Zważoo kolejych oworodków. Średia waga tej próby to x = 5 ucji przy odchyleiu stadardowym próby s= 4 ucje. c x t,. 95 s Estymacja górej graicy dopuszczalych wartości. Podejście: jedostroy 95%CI Zmierzoo cholesterol u dzieci z takiej grupy. Średia poziom cholesterolu w tej próbie to = mg/dl przy odchyleiu stadardowym próby s= 5 mg/dl. c x t,. 95 s Estymacja dolej graicy dopuszczalych wartości. waga oworodka a status społeczy matki śmiertele choroby serca a wysoki cholesterol u potomstwa H: waga oworodków od matek o iższym statusie ekoomiczym jest idetycza z waga oworodków populacji ogólej H: waga oworodków od matek o iskim statusie ekoomiczym jest iższa iż waga oworodków z populacji ogólej. stawiamy dwie hipotezy: zerową: H, prawdziwość której kwestioujemy alteratywą:h, pewe zaprzeczeie hipotezy zerowej H: 75 średi poziom cholesterolu potomstwa osób, które zmarły z powodów sercowych jest taki sam jak w populacji ogólej. H: 75 średi poziom cholesterolu potomstwa osób, które zmarły z powodów sercowych jest wyższy od średiego w populacji?

decyzja /9/7 prawdziwe H H Akceptujemy H H jest prawdziwe i H jest zaakceptowae H jest prawdziwe i H jest zaakceptowae Błąd II typu Odrzucamy H H jest prawdziwe H jest odrzucoe i H jest prawdziwe H jest odrzucoe i Błąd I typu Uwaga- akceptacja H w teście statystyczym to ie dowód prawdziwości H, ale raczej asza przegraa w teście odrzuceia H. waga oworodka a status społeczy matki śmiertele choroby serca a wysoki cholesterol u potomstwa H: H: H: 75 H: 75 Błąd typu I to przyjęcie staowiska, że średia waga urodzeiowa jest miejsza iż, gdy w rzeczywistości jest oa rówa. Błąd typu II to przyjęcie staowiska, że średia waga urodzeiowa jest rówa, gdy w rzeczywistości jest oa miejsza iż. Błąd typu I to przyjęcie staowiska, że średi poziom cholesterolu jest większy iż 75, gdy w rzeczywistości jest o rówy 75. Błąd typu II to przyjęcie staowiska, że średi poziom cholesterolu jest rówy 75, gdy w rzeczywistości jest o większy iż 75. Prawdopodobieństwo popełieia błędu I rodzaju ozaczamy i azywamy istotością testu. Prawdopodobieństwo popełieia błędu II rodzaju ozaczamy i defiiujemy im moc testu jako -. 3

/9/7 Małe ozacza, że H jest odrzucae miej często, gdy H jest prawdziwe Małe ozacza, że H jest akceptowae miej często, gdy H jest ieprawdziwe Strategia ustalić a poziomie akceptowalym, p.:...5,., przy czym stosować testy miimalizujące wartość Najsiliejszy test test bazujący a średiej z próby ma ajwyższą moc przy ustaloym poziomie Obszar akceptacji- obszar wartości X, dla których H akceptujemy Obszar odrzuceia- obszar wartości X, dla których H odrzucamy Testem jedostroym azywamy test, w którym wartości badaego parametru w hipotezie alteratywej są albo większe, albo miejsze od wartości w hipotezie zerowej, ale ie obie a raz. Statystyka testu to reprezetacja wyiku próby w zmieych stadardowych. 4

/9/7 waga oworodka a status społeczy matki Zał.: populacja wag urodzeiowych ma rozkład ormaly z i H: H: śmiertele choroby serca a wysoki cholesterol u potomstwa Zał.: populacja daje poziom cholesterolu o rozkładzie ormalym z i H: 75 H: 75 x 5 5 t s / 4 /.4.5 t t,.5 99,.5.8 t t,. 5.66 99.66 H odrzucamy przy poziomie istotości.5.8 x 75 5 t s / 5 / 5.8.5 t t.58 t t,. 95,.95 9,.95 9.833.833 H akceptujemy przy poziomie istotości.5.58 Aby testować hipotezę H: H: a poziomie istotości ależy obliczyć x t s / Podejście polegające a obliczeiu statystyki i określeiu wyiku testu w oparciu o porówaie statystyki z wartością krytyczą wyzaczoą przez błąd typu I azywamy testem istotości H: H: Statystyka testu Jeżeli Jeżeli t t t, t, to H odrzucamy to Ho akceptujemy Jeżeli Jeżeli t t t, t, to H odrzucamy to Ho akceptujemy Wartość krytycza testu wyzaczoa przez prawd. popełieia błędu I rodzaju 5

/9/7 waga oworodka a status społeczy matki. t t,. 99,..36.8 t t,. 99.36 H akceptujemy przy poziomie istotości. Defiicja: Wartość, przy której statystyka testu jest brzegiem pomiędzy obszarem odrzuceia i akceptacji azywamy wartością p : p-value waga oworodka a status społeczy matki śmiertele choroby serca a wysoki cholesterol u potomstwa p t 99.8) cdf (' t',.8,99). p..5 Kokluzja: ) wyiki są statystyczie istote. ) średia waga urodzeiowa dzieci matek o iskim statusie ekoomiczym jest iższa iż w populacji ogólej. p t 9.58) cdf (' t',.58,9).743 p.74.5 Kokluzja: ) wyiki ie są statystyczie istote. ) średi poziom cholesterolu u dzieci rodziców o ciężkiej chorobie serca jest idetyczy jak w populacji ogólej. 6

/9/7 Jeśli Jeśli Jeśli. p.5. p. p. to mówimy, że rezultat jest istoty to mówimy, że rezultat jest wysoko istoty to mówimy, że rezultat jest bardzo wysoko istoty Jeśli p.5 iezaczący Jeśli. p.5 statystyczości to mówimy, że rezultat jest statystyczie to mówimy, że jest tred w kieruku istotej waga oworodka a status społeczy matki Próba I: x 9 Wyik o super istotości, ale ie do wykorzystaia Próba II: x x 9 t 4.7 s / 4 / t 9999 4.7) cdf(' t', - 4.7, 9999) =.5359e - 5 x t.3 s / 4 / t 9.3) cdf(' t', -.3, 9) =.97 Wyik ieistoty, ale wartościowy bo wskazuje a tredy 7

/9/7. Mamy dwie metody ocey statystyczej istotości hipotezy : metodę wyzaczaia wartości krytyczej metodę wyzaczaia p-value. Obie metody wymagają zajomości statystyki testu, czyli dystrybucji rozkładu wyików uzyskiwaych w losowych próbach z badaej populacji. 3. Jeśli szukamy odpowiedzi dotyczącej wartości średiej populacji o rozkładzie ormalym, to taka statystyką dla próby -elemetowej jest rozkład t -. x Zatem to wartość t s / zadecyduje o wyiku testu. 4. Przy założeiu poziomu istotości testu =.5 wartość t -,.5 określa maksymalą wartość t jaka spełia waruek istotości przy <.5. 5. Natomiast p-value to cdf( t, t, -) i jeśli jest <.5 to H odrzucamy a rezultaty uzajemy za statystyczie istote. W przeciwym wypadku H akceptujemy a rezultaty są statystyczie ieistote. Przykład: poziom cholesterolu wśród kobiet imigratek z Azji, właśie przybyłych do USA. Kobiety -4 lat w USA mają te poziom średio 9mg/dL. Kobiety -4 lat imigratki z Azji mają te poziom iezay. Stawiaa hipoteza: Czy imigratki z Azji mają iy poziom cholesterolu iż Amerykaki? H: 9 H: 9 Test dwustroy Testy przeprowadzoe a Azjatkach dały wyik X =8.5 mg/dl przy s=4mg/dl. Defiicja: Testem dwustroym azywamy taki test, w którym dopuszcza się, aby wartości badaego parametru w hipotezie alteratywej były albo większe, albo miejsze iż wartość parametru hipotezy zerowej. 8

/9/7 Najlepszym testem dla przetestowaia hipotezy H: versus H: a poziomie istotości jest test opierający się a statystyce t, czyli Przy x t s / Jeżeli Jeżeli t t, / t t, / to H odrzucamy to H akceptujemy Przykład: poziom cholesterolu wśród kobiet imigratów z Azji właśie przybyłych do USA. H: 9 H: 9 Wyiki jedej próby = Azjatek X = 8.5 mg/dl s = 4mg/dL. Wartość statystyki t dla rozważaego przypadku x 8.5 9 t s / 4. Wartość krytycza dla testu dwustroego średiej przy poziomie istotości.5 t, / t99,.975 Wyzaczeie relacji : t t, / : bo. Decyzja: Ho odrzucamy, H przyjmujemy przy poziomie istotości.5 Kokluzja : poziom cholesterolu u Azjatek, imigratek do USA, jest róży od poziomu cholesterolu Amerykaek przy poziomie istotości.5. 9

/9/7 Twierdzeie: Jeśli x t s / to t t) dla t p [ t t)] dla t Przykład: poziom cholesterolu wśród kobiet imigratów z Azji właśie przybyłych do USA. t. p t.) * cdf (' t',.,99) *.83.37 Kokluzja : poziom cholesterolu u Azjatek, imigratek do USA, jest zacząco statystyczie róży (z p-value p=.37) od poziomu cholesterolu Amerykaek. Test dwustroy ie daje wątpliwości co do kokluzji: średia jest ia. Test dwustroy jest bardziej zachowawczy- ostrzejszy, ma większą moc. W każdym wypadku decyzji o rodzaju testu musi być podjęta przed aaliza daych, awet przed zbieraiem daych. Geeralie zaleca się używaie testów dwustroych.

/9/7 Twierdzeie: ()o teście dwustroym () dla średiej (3) dla populacji ormalej (4) o zaej wariacji (5) opartym a jedej próbie Najlepszym testem dla przetestowaia hipotezy H versus H: a poziomie istotości jest test opierający się a statystyce z, czyli Dla x z / Jeżeli z z / lub z z / to H odrzucamy Jeżeli z z z / / to H akceptujemy ( z) Wartość dwustroego p-value wyzacza: p [ ( z)] dla z dla z Przykład: poziom cholesterolu wśród kobiet imigratów z Azji właśie przybyłych do USA. Zakładamy =, a =s. x 8.5 9 z / 4 Dla =.5 : z * =-.96 i z* =.96 Zatem H odrzucamy przy poziomie istotości.5 p= ( -3.)=.3 Zatem H odrzucamy z p-value.3 3. Diagram (pierwszy) wyzaczaia właściwych metod statystyczego wioskowaia

/9/7 Biostatystyka, 6/7 dla Fizyki Medyczej, studia magisterskie test dla średiej rozkładu ormalego moc testu test dla wariacji rozkładu ormalego test dla rozkładu dwumiaowego, Poissoa Podstawowe kocepcje testowaia hipotez: Specyfikacja testowaej hipotezy H i H Błąd typu I (ozaczeie ) i błąd typu II (ozaczeie ) test wartości krytyczej statystyki testu (test istotości) Wyzaczeie p-value dla testowaej hipotezy H to sformułowaie, które chcemy odrzucić. Błąd I typu : odrzuceie H mimo, że jest oa prawdziwa Błąd II typu: akceptacja H mimo, że jest oa fałszywa Prawdopodobieństwo popełieia błędu typu a założoym poziomie Poziom błędu I typu określoy poprzez wyiki z próby Rozróżieie testu jedostroego od dwustroego

/9/7 TESTOWANE HIPOTEZY Zakładamy, że badaa cecha ma w populacji rozkład ormaly N(, ) H: = H: = H: = H: H: > H: < Przypadek A: zamy Statystyka testu x z / Statystyka z ma rozkład N(,). Obszar krytyczy a poziomie istotości jest wyzaczoy warukiem Dwustroy: P z z / Lewostroy: Prawostroy: P P z z z z Przypadek B: ie zamy To B: mała próba 3 Statystyka testu x t s / Statystyka t ma rozkład t-studeta o - stopiach swobody. Obszar krytyczy a poziomie istotości jest wyzaczoy warukiem Dwustroy: Lewostroy: Prawostroy: Albo B: duża próba >3 Statystyka testu P t t, / Pt t, Pt t, x z s / H odrzucamy H fałszywe) Twierdzeie Moc testu w teście jedostroym jedej próby dla średiej z populacji ormalej o zaej wariacji to [ z ] / 3

/9/7 Przykład: waga oworodka a status społeczy matki Obliczmy moc tego testu jeśli hipoteza alteratywa to =5, oraz jeśli =.5 i =4. Zatem przy =, =5, =.5, =4 i = moc testu wyosi MOC= [ z. 5 5 ] 4 /.669 Powyższy wyik ozacza, że mamy 67% szasy iż wykryjemy istotą statystyczie różicę średich w populacjach a poziomie istotości 5% w próbie o rozmiarze. Twierdzeie Moc testu w teście dwustroym H: versus H:, przy określoej wartości alteratywy, z jedej próby dla średiej z populacji ormalej i o zaej wariacji to [ z / ] [ z / [ z / ] / ] / Im większy jest rozmiar próby tym MOC większa Im miejsza jest wariacja tym MOC większa Jeśli istotość testu maleje to MOC test maleje 4

/9/7 H: H: Przy czym obie badae populacje mają rozkłady ormale o tej samej wariacji Moc testu - szacuje prawdopodobieństwo, że statystyczie istota różica zostaie wykryta w teście z próbą o rozmiarze, jeśli alteratywa jest prawdziwa. Dla zadaego testu jedostroego, przeprowadzaego przy zadaym stopiu istotości, i przy oczekiwaiu, że alteratywa to, jaki rozmiar próby będzie w staie wykryć istotą różicę z prawdopodobieństwem -? Przy z dostajemy ( ) z / ( z z ) Przykład: waga oworodka a status społeczy matki Przy =, =5, =.5, =4 i = moc testu wyosi 68%, co obliczyliśmy wcześiej. Teraz wyzaczmy rozmiar próby gwaratujący moc 8 %. ( z.8 z.95) 4 4.3 43 ( 5) Rozmiar próby (zawsze zaokrąglamy do góry) dający am szase 8% odrzuceia H a poziomie istotości.5 w teście jedostroym to 43 osoby. W przypadku testu dwustroego rozmiar próby ustala astępująca wielkość ( z z ) / ( ) Przypomieie: oszacowaie rozmiaru próby bazujące a pożądaej szerokości L przedziału ufości 95%CI (z / ) L 5

/9/7 Wytłumacz swoimi słowami co to jest moc testu, jakie czyiki wpływają a moc i w jaki sposób? Testujemy: H: versus H: Wioskowaie statystycze zakłada, że H jest prawdą i w oparciu o dae z próby wyzacza obszar odrzuceia tego założeia przy zadaym poziomie istotości. Moc testu określa prawdopodobieństwo odrzuceia H przy założeiu, że H dla pewej kokretej wartości jest prawdą. Korzystając z oszacowaia dla wartości mocy testu jedostroego mamy: [ z ] / (a) Jeśli rośie, to moc rośie (b) Jeśli rośie, to moc rośie, (c) Jeśli rośie, to moc maleje (d) Jeśli maleje, to moc maleje Jakie czyiki wpływają a oszacowaie właściwego rozmiaru próby? Na czym polega zasadicza różica pomiędzy oszacowaiem mocy a oszacowaiem rozmiaru próby? Dla testu, jak powyżej chcemy aby wioskowaie o poziomie istotości miało określoą moc -. Te potrzeby będą spełioe jeśli: ( z z ) ( Zatem: ) (a) Jeśli moc rośie, to rośie (b) Jeśli maleje to rośie, (c) Jeśli rośie, to rośie (d) Jeśli różica pomiędzy alteratywami rośie to maleje Porówujemy wyiki estymacji przedziału ufości %(- ) CI dla z wyikami testu hipotezy H: vs. H: Twierdzeie : H jest odrzucae w teście dwustroym przy poziomie istotości wtedy i tylko wtedy gdy dwustroy przedział ufości %(- ) CI dla ie zawiera H jest akceptowae w teście dwustroym przy poziomie istotości wtedy i tylko wtedy gdy dwustroy przedział ufości %(- ) CI dla zawiera Twierdzeie : Przedział ufości %(- ) CI dla zawiera wszystkie wartości takie, dla których będziemy mogli akceptować H w teście dwustroym przy poziomie istotości. Przedział ufości %(- ) CI dla ie zawiera żadej wartości takiej, przy której H może być odrzucoe w teście dwustroym przy poziomie istotości. 6

/9/7 Przykład: poziom cholesterolu wśród kobiet imigratów z Azji właśie przybyłych do USA. Kobiety -4 lat w USA mają te poziom średio 9mg/dL. Stawiaa hipoteza : H: 9 Kobiety -4 lat imigratki z Azji mają te poziom iezay. H: 9 Testy przeprowadzoe a Azjatkach dały x =8.5 mg/dl przy s=4mg/dl. Przedział ufości 95%CI w powyższym badaiu: ( x t ( x t, / 99,.975 s / s /, x t, x t, / 99,.975 s / s / ) ) (8.5 7.94,8.5 7.94) (73.58,89.46) Powyższy przedział ufości 95%CI zawiera wszystkie wartości, dla których hipoteza H będzie zaakceptowae przy poziomie istotości =5%. Powyższy przedział ufości 95%CI ie zawiera żadej wartości, dla której hipoteza H będzie odrzucoa przy poziomie istotości =5%. W szczególości przedział ufości 95%CI ie zawiera wartości =9, co odpowiada decyzji opisaej wcześiej przy badaiu testu. Dobra praktyka: obliczaie zarówo przedziału ufości %(- ) CI, aby podać obszar wartości do którego może wpaść wartość, jak i p-value, aby dostarczyć iformacji o statystyczej istotości przeprowadzoego badaia. Poziom istotości p-value jaki i graice przedziału ufości 95%CI dostarczają komplemetarej iformacji. Przykład: poziom cholesterolu wśród kobiet imigratów z Azji właśie przybyłych do USA. Z poprzedich testów mamy p-value =.37 a więc rezultaty z próby są statystyczie zaczące. Natomiast 95%CI= (73.58, 89.46) dostarcza iformacji jakie wartości są możliwe do rozważeia w projekcie testu statystyczego. Zatem własości 95%CI i p-value wzajemie się uzupełiają. 7

/9/7 Niech : A to hipoteza B to dae x x ) ) x) x) x ) ) x) x) -wiarygodość uzyskaia daych x przy hipotezie, tzw. likelihood daych - prior prawdopodobieństwo hipotezy - evidece prawdopodobieństwo uzyskaia daych x - posterior prawdopodobieństwo hipotezy, jeśli otrzymao dae x B A) A) A B) B) x ma rozkład ormaly o średiej i wariacji / N, - prawdopodobieństwo prior jest takie samo iezależie od wartości - x) ie zależy bezpośredio od ZATEM: prawdopodobieństwo posterior to rozkład ormaly o średiej i wariacji / N x, czyli: x) x ) Mając prawdopodobieństwo posterior x) możemy twierdzić, że to wyzacza oo przedział wartości o prawdopodobiestwie -. ) x z x z / / / / Przykład: poziom cholesterolu wśród kobiet imigratów z Azji właśie przybyłych do USA. Testy przeprowadzoe a = Azjatkach dały x =8.5 mg/dl przy =4mg/dL. x z x z / / / / 8.5 z 8.5 z.975.975 4 / 4 / 76 87. Zatem przedział posterior o 95% predykcji dla 76 87.) 95% 8

/9/7 Biostatystyka, 6/7 dla Fizyki Medyczej, studia magisterskie test dla średiej rozkładu ormalego moc testu test dla wariacji rozkładu ormalego test dla rozkładu dwumiaowego, Poissoa Kocepcja testowaia hipotezy wiąże się: określeiem testowaej hipotezy H i hipotezy alteratywej H Testowaie zgodości daych z postawioą hipotezą, co pozwala a oszacowaie błędu dla hipotezy Błąd typu I (ozaczeie ) Błąd typu II (ozaczeie ) test wartości krytyczej statystyki testu (test istotości) Wyzaczeie p-value dla testowaej hipotezy Błąd I typu : odrzuceie H mimo, że jest oa prawdziwa Błąd II typu: akceptacja H mimo, że jest oa fałszywa Prawdopodobieństwo popełieia błędu typu a założoym poziomie Poziom błędu I typu określoy poprzez wyiki z próby 9

/9/7 Przykład: pomiar ciśieia skurczowego arteriosodą przyrząd wykorzystujący efekt Dopplera do ustaleia ciśieia krwi. Nagraie iterpretowało dwóch operatorów. Pytaie o rozbieżość oce pomiędzy operatorami. Przyjmijmy, że zamy wariacje dla tradycyjego pomiaru makietem i jest oa =35. Czy owa maszya jest pewiejsza- czyli daje miej rozbieżości? Jak przeprowadzić test statystyczy, gdy hipoteza odosi się do wariacji rozkładu ormalego? H : 35 H : Twierdzeie: ()w teście dwustroym () dla wariacji (3) w populacji ormalej (4) opartym a jedej próbie Metoda wartości krytyczych Najlepszym testem dla przetestowaia hipotezy H : vs H: istotości jest test opierający się a statystyce X, czyli a poziomie przyjmując: X ( ) s Jeżeli Jeżeli X, / lub X X, /, /, / to H odrzucamy to H akceptujemy X X, /, / ) / ) /

/9/7 Przykład: pomiar ciśieia skurczowego arteriosodą przyrząd wykorzystujący efekt Dopplera do ustaleia ciśieia krwi. Nagraie iterpretowało dwóch operatorów. Dae: d ( 6 3... ) /. s 9 i ( d d) 8.78 Statystyka X przy tych daych przyjmuje wartość: Wyzaczamy wartości krytycze dla testu: i X, /, / ( ) s 9,.5 9,.975 9*8.78.3 35.7 9. Poieważ.3 <.7, to H odrzucamy w oparciu o test dwustroy dla wariacji rozkładu ormalego opartego a jedej próbie a poziomie istotości.5. Twierdzeie: ()w teście dwustroym () dla wariacji (3) w populacji ormalej (4) opartym a jedej próbie Niech statystyką będzie ( ) s X Jeżeli s to p-value = ( pole powierzchi a lewo od X ) Statystyka X może być użyta jedyie dla daych o rozkładzie ormalych!!! O p-value Jeżeli s to p-value = (pole powierzchi a prawo od X ) Przykład: pomiar ciśieia skurczowego arteriosodą Poieważ 8.78 < 35 ( s ) to wartość p-value 9.3).

/9/7 Przy założeiu p q 5 pq pˆ N( p, H : p p p p vs H: ) Przykład: Rak piersi wśród kobiet 5-54 letich, których matki miały raka piersi. Mamy próbę losową kobiet o w/w wieku, 4 z ich miało lub ma raka piersi. W populacji ogólej rak te występuje z prawd. %. Jak się ma ta proporcja do aszej populacji? Twierdzeie: Niech statystyką testu będzie ( pˆ p z ) pq Jeśli z z / i z z / to Ho jest odrzucoe. Jeśli z z z / / to H jest akceptowae. pq Przy założeiu p q 5 pˆ N( p, ) Przykład: Rak piersi wśród kobiet 5-54 letich, których matki miały raka piersi. Mamy próbę losową kobiet o w/w wieku, 4 z ich miało lub ma raka piersi. Twierdzeie: Niech statystyką testu będzie Jeśli pˆ p ( pˆ p z ) pq to p-value =Φ(z) Jeśli pˆ p to p-value =[-Φ(z)] Przykład: ( pˆ p).4. z 4.3 pq.*.98/ Zatem 4.3 z więc H może być odrzucoe w.975 teście dwustroym a poziomie istotości.5 A dalej: p-value=[-φ(4.3)] <.

/9/7 Przykład: Chcemy przetestować hipotezę, czy dla kobiety, której siostra miała raka piersi ryzyko pojawieia się raka piersi jest wyższe? Twierdzeie: Moc testu jedej próby rozkładu dwumiaowego dla hipotezy H : p p H : p p przy specyficzej alteratywie p=p jest wyzaczoy formułą: p q p p z / pq pq / Powyższa formuła chodzi przy założeiu p q 5. Załóżmy, że zachorowalość a raka piersi wśród kobiet 5-54 letich jest %, podczas, gdy jest to 5% jeśli siostra miała raka. Chcemy przetestować 5 kobiet z populacji, gdzie siostry miały raka. Jaka będzie moc takich badań jeśli zakładamy przeprowadzeie testu dwustroego przy poziomie istotości.5?.*.98 z.5*.95. 5.3.*.98 / 5.966 Zatem powiiśmy mieć 96.6% szasy, że asze wyiki oparte a próbie 5 osób będą statystyczie istote. Twierdzeie: Niech to wartość oczekiwaa zmieej losowej o rozkładzie Poissoa. Aby przetestować hipotezę H : vs.h : jeśli x to liczba zaobserwowaych zdarzeń w badaej populacji to statystyka ( ) X x To W teście dwustroym a poziomie istotości hipotezę H odrzucamy jeśli X hipotezę H akceptujemy jeśli Wartość p-value jest daa wzorem Powyższy test zachodzi dla X,, X ) 3

/9/7 Przykład: Pracowicy przemysłu gumowego i ich zagrożeie życia. Obserwowao śmiertelość w grupie 848 pracowików tego przemysłu (w wieku 4-84) przez dziesięć lat. Ich śmiertelość była porówywaa ze śmiertelością populacji ogólej w tym samym wieku. Otrzymao zgoy spowodowae rakiem krwi, podczas gdy w populacji geeralej jest oa obserwowaa z częstością 8.. Czy zalezioa różica jest statystyczie istota? Testujemy hipotezę H : 8.vs.H : 8. Przy x= Poieważ X (8.) 8. 3.84,.95.46 więc H akceptujemy Zatem pracowicy przemysłu gumowego ie są dodatkowo arażei a ryzyko zachorowaia a raka krwi. Diagram (drugi) wyzaczaia właściwych metod statystyczego wioskowaia 4

/9/7 Przy założeiu p q 5 pq pˆ N( p, H : p p p p vs H: ) Przykład: Rak piersi wśród kobiet 5-54 letich, których matki miały raka piersi. Mamy próbę losową kobiet o w/w wieku, 4 z ich miało lub ma raka piersi. W populacji ogólej rak te występuje z prawd. %. Jak się ma to do aszej populacji? Twierdzeie: Niech statystyką testu będzie ( pˆ p z ) pq Jeśli z z / i z z / to Ho jest odrzucoe. Jeśli z z z / / to H jest akceptowae. pq Przy założeiu p q 5 pˆ N( p, ) Mamy próbę losową kobiet o w/w wieku, 4 z ich miało lub ma raka piersi. Twierdzeie: ( pˆ p Niech statystyką testu będzie z ) pq Jeśli pˆ p to p-value =Φ(z) Jeśli pˆ p Przykład: Rak piersi wśród kobiet 5-54 letich, których matki miały raka piersi. to p-value =[-Φ(z)] Przykład: ( pˆ p).4. z 4.3 pq.*.98/ Zatem 4.3 z więc H może być odrzucoe w.975 teście dwustroym a poziomie istotości.5 A dalej: p-value=[-φ(4.3)] <. MATLAB: z_crit= icdf('orm',.975,,) P=*(-cdf('orm',4.3,,)) 5

/9/7 Przykład: Chcemy przetestować hipotezę, czy dla kobiety, której siostra miała raka piersi ryzyko pojawieia się raka piersi jest wyższe? Twierdzeie: Moc testu jedej próby rozkładu dwumiaowego dla hipotezy H : p p H : p p przy specyficzej alteratywie p=p jest wyzaczoy formułą: p q p p z / pq pq / Powyższa formuła chodzi przy założeiu p q 5. Załóżmy, że zachorowalość a raka piersi wśród kobiet 5-54 letich jest %, podczas, gdy jest to 5% jeśli siostra miała raka. Chcemy przetestować 5 kobiet z populacji, gdzie siostry miały raka. Jaka będzie moc takich badań jeśli zakładamy przeprowadzeie testu dwustroego przy poziomie istotości.5?.*.98 z.5*.95. 5.3.*.98 / 5.966 Zatem powiiśmy mieć 96.6% szasy, że asze wyiki oparte a próbie 5 osób będą statystyczie istote jeśli tylko prawdą jest, że kobiety, których siostry miały raka mają.5 raza większe ryzyko zachorowaia a raka iż ich rówieśiczki. Twierdzeie: Niech to wartość oczekiwaa zmieej losowej o rozkładzie Poissoa. Aby przetestować hipotezę H : vs.h : Należy dla x liczby zaobserwowaych zdarzeń w badaej populacji obliczyć statystykę ( ) X x W teście dwustroym a poziomie istotości hipotezę H odrzucamy jeśli X, Hipotezę H akceptujemy jeśli X, Wartość p-value jest daa wzorem Powyższy test zachodzi dla X ) 6

/9/7 Przykład: Pracowicy przemysłu gumowego i ich zagrożeie życia. Obserwowao śmiertelość w grupie 848 pracowików tego przemysłu (w wieku 4-84) przez dziesięć lat. Ich śmiertelość była porówywaa ze śmiertelością populacji ogólej w tym samym wieku. Otrzymao zgoy spowodowae rakiem krwi, podczas gdy w populacji geeralej jest oa obserwowaa z częstością 8.. Czy zalezioa różica jest statystyczie istota? Testujemy hipotezę H : 8.vs.H : 8. Przy x= Poieważ X (8.) 8. 3.84,.95.46 więc H akceptujemy Zatem pracowicy przemysłu gumowego ie są dodatkowo arażei a ryzyko zachorowaia a raka krwi. 7