Statystyka Wykład 6 Adam Ćmiel A3-A4 311a

Podobne dokumenty
( X, Y ) będzie dwuwymiarową zmienną losową o funkcji gęstości

TESTY NORMALNOŚCI. ( Cecha X populacji ma rozkład normalny). Hipoteza alternatywna H1( Cecha X populacji nie ma rozkładu normalnego).

Prawdopodobieństwo i statystyka r.

W loterii bierze udział 10 osób. Regulamin loterii faworyzuje te osoby, które w eliminacjach osiągnęły lepsze wyniki:

. Wtedy E V U jest równa

ma rozkład normalny z nieznaną wartością oczekiwaną m

ma rozkład normalny z wartością oczekiwaną EX = EY = 1, EZ = 0 i macierzą kowariancji

OBLICZANIE NIEPEWNOŚCI METODĄ TYPU B

Prawdopodobieństwo i statystyka r.

Zadanie 1. ), gdzie 1. Zmienna losowa X ma rozkład logarytmiczno-normalny LN (, . EX (A) 0,91 (B) 0,86 (C) 1,82 (D) 1,95 (E) 0,84

Tablica Galtona. Mechaniczny model rozkładu normalnego (M10)

N ( µ, σ ). Wyznacz estymatory parametrów µ i. Y które są niezależnymi zmiennymi losowymi.

STATYSTYKA MATEMATYCZNA WYKŁAD 2 ESTYMACJA PUNKTOWA

Podstawy analizy niepewności pomiarowych (I Pracownia Fizyki)

POPULACJA I PRÓBA. Próba reprezentatywna. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH 5 1

W zadaniu nie ma polecenia wyznaczania estymatora nieobciążonego o minimalnej wariancji. σ σ σ σ σ = =

Planowanie eksperymentu pomiarowego I

5. OPTYMALIZACJA NIELINIOWA

będą niezależnymi zmiennymi losowymi z rozkładu o gęstości

będą niezależnymi zmiennymi losowymi o tym samym 2 x

L.Kowalski PODSTAWOWE TESTY STATYSTYCZNE WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH

W zadaniu nie ma polecenia wyznaczania estymatora nieobciążonego o minimalnej wariancji. σ σ σ σ σ = =

wyniki serii n pomiarów ( i = 1,..., n) Stosując metodę największej wiarygodności możemy wykazać, że estymator wariancji 2 i=

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 7-8

ZJAZD 1. STATYSTYKA OPISOWA wstępna analiza danych

PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH. dr Michał Silarski

3. OPTYMALIZACJA NIELINIOWA

Jego zależy od wysokości i częstotliwości wypłat kuponów odsetkowych, ceny wykupu, oczekiwanej stopy zwrotu oraz zapłaconej ceny za obligację.

EKSTREMA FUNKCJI EKSTREMA FUNKCJI JEDNEJ ZMIENNEJ. Tw. Weierstrassa Każda funkcja ciągła na przedziale domkniętym ma wartość najmniejszą i największą.

KONCEPCJA WIELOKRYTERIALNEGO WSPOMAGANIA DOBORU WARTOŚCI PROGOWEJ W BIOMETRYCZNYM SYSTEMIE UWIERZYTELNIANIA. Adrian Kapczyński Maciej Wolny

Wyrażanie niepewności pomiaru

µ = Test jest następujący: jeŝeli X > 0.01 to odrzucamy H. 0

Pojęcie statystyki. Definicja. Wektorową funkcję mierzalną T: X T(X)=(T 1 (X),...,T k (X)) R k wymiarową statystyką. próby X nazywamy k

Statystyka Inżynierska

Statystyczne charakterystyki liczbowe szeregu

IV. ZMIENNE LOSOWE DWUWYMIAROWE

Podstawy opracowania wyników pomiarowych, analiza błędów

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 5

[, ] [, ] [, ] ~ [23, 2;163,3] 19,023 2,7

Statystyczna analiza miesięcznych zmian współczynnika szkodowości kredytów hipotecznych

) będą niezależnymi zmiennymi losowymi o tym samym rozkładzie normalnym z następującymi parametrami: nieznaną wartością 1 4

Regresja REGRESJA

Różniczkowanie funkcji rzeczywistych wielu zmiennych. Matematyka Studium doktoranckie KAE SGH Semestr letni 2008/2009 R. Łochowski

będzie próbką prostą z rozkładu normalnego ( 2

Statystyka Opisowa 2014 część 3. Katarzyna Lubnauer

Średnia harmoniczna (cechy o charakterze ilorazu np. Prędkość, gęstość zaludnienia)

X i. X = 1 n. i=1. wartość tej statystyki nazywana jest wartością średnią empiryczną i oznaczamy ją symbolem x, przy czym x = 1. (X i X) 2.

AKADEMIA MORSKA W SZCZECINIE

Podstawowe zadanie statystyki. Statystyczna interpretacja wyników eksperymentu. Zalety statystyki II. Zalety statystyki

Statystyka. Analiza zależności. Rodzaje zależności między zmiennymi występujące w praktyce: Funkcyjna

opisać wielowymiarową funkcją rozkładu gęstości prawdopodobieństwa f(x 1 , x xn

L.Kowalski zadania ze statystyki opisowej-zestaw 5. ZADANIA Zestaw 5

Monika Jeziorska - Pąpka Uniwersytet Mikołaja Kopernika w Toruniu

W praktyce często zdarza się, że wyniki obu prób możemy traktować jako. wyniki pomiarów na tym samym elemencie populacji np.

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 4

Statystyka matematyczna dla leśników

METODY ANALIZY DANYCH DOŚWIADCZALNYCH

STATYSTYKA MATEMATYCZNA WYKŁAD 5 WERYFIKACJA HIPOTEZ NIEPARAMETRYCZNYCH

JEDNOWYMIAROWA ZMIENNA LOSOWA

Rachunek prawdopodobieństwa i statystyka W12: Statystyczna analiza danych jakościowych. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.

Testowanie hipotez. H 1 : µ 15 lub H 1 : µ < 15 lub H 1 : µ > 15

1. Wnioskowanie statystyczne. Ponadto mianem statystyki określa się także funkcje zmiennych losowych o

ZAGADNIENIE TRANSPORTOWE

Estymacja przedziałowa - przedziały ufności

Matematyka dyskretna. 10. Funkcja Möbiusa

Podstawowe pojcia. Metody probabilistyczne i statystyka Wykład 7: Statystyka opisowa. Rozkłady prawdopodobiestwa wystpujce w statystyce.

Pomiary parametrów napięć i prądów przemiennych

Średnia arytmetyczna Klasyczne Średnia harmoniczna Średnia geometryczna Miary położenia inne

TARCIE CIĘGIEN O POWIERZCHNIĘ WALCOWĄ WZÓR EULERA

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

65120/ / / /200

Weryfikacja hipotez dla wielu populacji

ELEMENTY TEORII MOŻLIWOŚCI

O testowaniu jednorodności współczynników zmienności

Wnioskowanie statystyczne dla korelacji i regresji.

Matematyka ubezpieczeń majątkowych r. t warunkowo niezależne i mają (brzegowe) rozkłady Poissona:

WYZNACZANIE WARTOŚCI ENERGII ROZPRASZANEJ PODCZAS ZDERZENIA CIAŁ

1. Relacja preferencji

OKREŚLANIE NIEPEWNOŚCI POMIARÓW (poradnik do Laboratorium Fizyki)

( ) L 1. θ θ = M. Przybycień Rachunek prawdopodobieństwa i statystyka. = θ. min

Materiały do wykładu 7 ze Statystyki

KURS STATYSTYKA. Lekcja 3 Parametryczne testy istotności ZADANIE DOMOWE. Strona 1

METODY KOMPUTEROWE 1

PODSTAWY PROBABILISTYKI Z PRZYKŁADAMI ZASTOSOWAŃ W INFORMATYCE

ROZKŁADY ZMIENNYCH LOSOWYCH

Estymacja przedziałowa

Natalia Nehrebecka. Zajęcia 4

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Prawdopodobieństwo i statystyka r.

VI. TWIERDZENIA GRANICZNE

Funkcja wiarogodności

Nieparametryczne Testy Istotności

Przegląd wybranych testów

Elementy arytmetyki komputerowej

FINANSE II. Model jednowskaźnikowy Sharpe a.

Zadanie 2 Niech,,, będą niezależnymi zmiennymi losowymi o identycznym rozkładzie,.

ZMIENNA LOSOWA JEDNOWYMIAROWA POJĘCIE ZMIENNEJ LOSOWEJ

Zadanie 1. Rzucamy symetryczną monetą tak długo, aż w dwóch kolejnych rzutach pojawią się,,reszki. Oblicz wartość oczekiwaną liczby wykonanych rzutów.

Współczynnik korelacji rangowej badanie zależności między preferencjami

ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA

Transkrypt:

Testowae hpotez Nech (X, B, P={P : }) będze przestrzeą statystyczą, przy czym = =. Problem testowaa hpotez moża sformułować astępująco: a podstawe obserwacj X X zweryfkować hpotezę H : wobec alteratywy H :. Problem testowaa hpotezy e jest problemem badawczym lecz decyzyjym. Możemy podjąć jedą z dwóch możlwych decyzj d o - akceptacja hpotezy H d - odrzucea H akceptacj H Możemy węc podjąć poprawa decyzję lub popełć jede z dwóch rodzajów błędów błąd perwszego rodzaju d H polegający a odrzuceu H, gdy w rzeczywstośc jest oa prawdzwa, błąd drugego rodzaju d H polegający a akceptacj H, gdy w rzeczywstośc jest oa fałszywa. H H d d Decyzja Błąd I rodzaju poprawa d H Błąd II rodzaju Decyzja d H poprawa Potrzebujemy pewej procedury, która podpowe jaką podjąć decyzję gdy dyspoujemy wykem eksperymetu X. Rozwązaem problemu (H, H ) testowaa hpotezy H przecwko alteratywe H będze pewa fukcja : X[,] zwaa zradomzowaym testem statystyczym. Dyspoując testem statystyczym X : z prawdopodobeństwem -(X) podejmujemy decyzję d o - akceptacj hpotezy H z prawdopodobeństwem (X) podejmujemy decyzję d - odrzucea H akceptacj H. Aby węc podjąć kokretą decyzję ależy węc użyć pewego mechazmu losowego, który produkuje dwa wyk z prawdopodobeństwam (X) -(X) a tej podstawe podjąć (wylosować) decyzję. Podejśce take jest krytykowae przez praktyków, jako stwarzające możlwość adużyć w terpretacj daych. Zdecydowae wększe uzae praktyków zalazły testy ezradomzowae, dla których zbór wartośc fukcj jest zborem dwuelemetowym {,}. Test tak dzel przestrzeń prób a dwa rozłącze zbory: C= - ({})={XX : (X = } zway zborem odrzucea hpotezy H (lub zborem krytyczym - ({})={XX : (X) = } zway zborem akceptacj H.

Kostrukcja testu ezradomzowego jest węc rówoważa rozbcu przestrze prób a dwa rozłącze podzbory : odrzucea akceptacj H. Jeżel zaobserwowaa wartość zmeej losowej X wpada do zboru krytyczego C= - ({}), to odrzucamy H, w przecwym przypadku akceptujemy H. Oczywśce e każdy test statystyczy jest dobrym testem. Aby móc porówywać testy w kosekwecj wybrać ajlepszy moża podobe jak w probleme estymacj puktowej próbować określć stratę jaką poos statystyk podejmując błędą decyzję. Następym krokem jest wtedy wyzaczee średej straty dla daego testu, czyl wyzaczee jego fukcj ryzyka. Testy, podobe jak estymatory, moża porówywać, porówując ch fukcje ryzyka. Moża tu róweż wyróżć : podejśce globale (porówywae fukcj ryzyka) z zawężaem klasy testów, podejśce mmaksowe, podejśce bayesowske. Najwększe uzae zyskało jedak w teor testów podejśce Neymaa-Pearsoa. W ujęcu tym przypsuje sę różą wagę błędom I II rodzaju. Ważejszy jest błąd perwszego rodzaju. Dlatego akłada sę pewe ograczee a prawdopodobeństwo błędu I rodzaju wśród dostępych testów spełających to ograczee poszukuje sę testu, który mmalzuje prawdopodobeństwo błędu II rodzaju. Def. Fukcją mocy testu azywamy fukcję ()=E ((X)) (= P (C) dla testu ezradomzowaego) Łatwo zauważyć, że dla testu ezradomzowaego mamy: rodzaju) (czyl prawdzwa jest H ) ()=P (d H )+P (d H )=P (d H ) (pr. błędu I (czyl prawdzwa jest H ) ()=P (d H )+P (d H )=P (d H )=-P (d H ) (pr. Def. Rozmarem testu azywamy lczbę sup braku błędu II rodzaju- aczej moc testu ). () (lub sup ( C) dla testu ezradomzowaego). Def. Mówmy, że test hpotezy H przecwko H jest testem a pozome stotośc, jeżel sup (), czyl rozmar testu e przekracza. P Wśród testów a pozome stotośc poszukujemy ajlepszego w sese Neymaa-Pearsoa czyl ajmocejszego. Klasyczy lemat Neymaa-Pearsoa podaje sposób kostrukcj testu ajmocejszego dla testowaa hpotezy prostej H : = (czyl = { }) przecwko prostej alteratywe H : = (czyl = { }). Hpoteza prosta specyfkuje węc dokłade jede rozkład prawdopodobeństwa określoy a przestrze prób. Hpoteza H głos, że prawdzwym rozkładem a przestrze prób jest rozkład P = P a kokurecyja hpoteza H głos, że prawdzwym rozkładem a

przestrze prób jest rozkład P = P. Hpotezę, która e jest prosta (tz. specyfkuje przyajmej dwuelemetową rodzę rozkładów prawdopodobeństwa) azywamy hpotezą złożoą. Lemat Neymaa-Pearsoa. Jeżel rozkłady P P mają gęstośc p p (w przypadku cągłym względem mary Lebesguea a w przypadku dyskretym względem mary lczącej), to test ajmocejszy a pozome hpotezy H przecwko H steje ma postać gdy p( kp ( ( gdy p( kp (, gdy p( kp ( gdze k,) są tak dobraym stałym, aby rozmar testu był rówy Z postac fukcj testowej wyka, że optymaly test H przecwko H jest testem zradomzowaym. W przypadku testowaa hpotez dotyczących cągłych rozkładów prawdopodobeństwa moża stałą przyjąć rówą otrzymać w te sposób test ezradomzoway. W przypadku dyskretym zwykle e moża zaleźć testu ezradomzowaego o zadaym rozmarze. Moża jedak zaleźć optymaly test ezradomzoway o rozmarze zblżoym do zadaego. Lemat Neymaa-Pearsoa podaje porządek w jakm ależy włączać poszczególe pukty przestrze prób do zboru krytyczego. Porządek te wyzacza wartość lorazu. Im p ( wyższa wartość tego lorazu tym szybcej pukt x trafa do zboru krytyczego. Proces te ależy przerwać wówczas, gdy dołączee astępych puktów do zboru krytyczego powoduje przekroczee założoego pozomu stotośc. p ( Zwykle w kostrukcj testu występuje etap pośred polegający a wyzaczeu tzw. statystyk testowej T: X XT(X), która przeos dalsze rozważaa z przestrze (X, B, P={P : }) do prostszej przestrze (R,B, P T T = { P : } ). Przykład. Nech (X,...,X ) (=9) będze cągem d o rozkładze P z dystrybuatą F. Zaleźć test ajmocejszy a pozome dla problemu testowaa hpotezy H : P=N(,) przecwko alteratywe H : P=N(,). Zgode z lematem Neymaa-Pearsoa obszar krytyczy testu ajmocejszego ma postać ( X ) {( X,..., X ) : e k e ( ) ( ) X } = {(X,...,X ): T ( X ) X X k } przy czym P ( X k )=. Statystyką testową jest węc w tym przypadku T X ) X (. Wadomo, że w przypadku prawdzwośc H statystyka X ma rozkład ormaly z wartoścą oczekwaą odchyleem stadardowym, wec statystyka X ma rozkład N(,). Stąd 3

P ( X k )=P ( X k )=. Z tablc rozkładu ormalego odczytujemy wartość kwatyla u - - w rozważaym przykładze u.95 =.64. Stąd 9 k =,64 w kosekwecj k =,55. W języku programu STATISTICA k vnormal( ;;/ 3) W przypadku prawdzwośc hpotezy H statystyka X ma rozkład N(, dla zadaego pozomu stotośc wyzaczyć moc testu : moc(.5)= P ( X ). Wobec tego możemy k )=P ( ( X ) ( k ) =-.35)=-F N(.) (-,35)=,9. W języku programu STATISTICA moc( ) Normal(vNormal( ;;/ 3);;/ 3)),,,9 Krzywa mocy testu ajmocejszego hpotezy (=9) H : m= vs H : m=,,9 Fukcja mocy testu hpotezy H : m= (=9) vs H (m> test ajmocejszy) (m<> test ajmocejszy eobcążoy) a=.5,8,8,7,7,6,6 moc,5,4 moc testu,5,4,3,3,,,,,,,5,,5,,5,3,35,4,45,5, -,5 -, -,5,,5,,5 m Krzywa mocy (a) fukcja mocy (b) Powtarzając oblczea dla dowolego (,) możemy wyzaczyć krzywą mocy zalezoego testu moc(). Ustalając pozom stotośc =,5 możemy wyzaczyć fukcję mocy testu moc(m) a pozome dla różych alteratyw m Def. Test złożoej hpotezy H : przecwko złożoej alteratywe H : azywamy testem jedostaje ajmocejszym a pozome, gdy dla każdego testu H przecwko H a pozome prawdzwy jest waruek: () (). W pewych (elczych) przypadkach moża z lematu Neymaa Pearsoa skostruować test jedostaje ajmocejszy złożoej hpotezy przecwko złożoej alteratywe. Testy eobcążoe W sytuacj, gdy e steje test jedostaje ajmocejszy a pozome możemy próbować ograczyć klasę testów, podobe jak ograczylśmy klasę estymatorów do estymatorów eobcążoych być może w tej ograczoej klase zajdzemy test jedostaje ajmocejszy. Def. Test azywamy testem eobcążoym a pozome stotośc, gdy (), czyl jest o testem a pozome sup () czyl prawdopodobeństwo odrzucea H gdy jest oa fałszywa jest co ajmej take jak prawdopodobeństwo jej odrzucea, gdy jest oa prawdzwa. Iaczej moc testu ma być co ajmej tak duża jak rozmar testu. 4

W kotekśce testowaa stotośc statystyczej spotykamy sę z dwema sytuacjam, odrzucającopotwerdzającą (OP ag. RS Reject Support) przyjmująco-potwerdzającą (PP ag. AS Accept Support). Przy testowau typu OP, hpoteza zerowa jest przecweństwem tego, co badacz chcałby wykazać. Np. lekarz testujący ową terapę oczekuje, że da oa wyk pozytywy wyk. Przy testowau OP, błąd I-rodzaju ozacza błęde potwerdzee tezy badacza. Z puktu wdzea reszty społeczeństwa, błąd te jest szczególe ekorzysty. Spowodować o może podjęce westycj wysłków, a co ajmej dalszych badań, które e mają szas powodzea.natomast błąd II-rodzaju (przy teśce OP) jest bardzo ekorzysty dla badacza, gdyż jego słusze przewdywaa e zostały potwerdzoe jedye a skutek losowego błędu. Lekarz, który wymyślł ową terapę wpada w frustrację, gdyż był głęboko przekoay o swojej racj, a wyk testu statystyczego jedak jej e potwerdzł. Badaa ad tą terapą e będą kotyuowae kt sę już e dowe, jaka była prawda, a medycya stracła cey pomysł. Testowae typu OP (odrzucająco-potwerdzające) występuje ajczęścej dlatego zwązae z m kowecje zdomowały populare wdzee zagadea testów statystyczych. Przy testowau PP (przyjmująco-potwerdzającym) aczej patrzy sę a możlwość błędów obu rodzajów. Hpoteza H wyraża tu pogląd (adzeję) badacza. W takej sytuacj błąd I-rodzaju jest fałszywym zaprzeczeem przewdywań badacza, a błąd II-rodzaju fałszywym ch potwerdzeem. Tak węc korzyste dla teor przedstawaej przez badacza byłoby tu coś zupełe erealego przy testowau OP, maowce przyjęce bardzo skego, a przykład,. W obu sytuacjach, OP PP, łatwo podać przykłady trudych badań erealstyczego testowaa ch wyków. Rozpatrzmy ajperw przypadek OP. Czasam e da sę powększyć próbk. Psycholog klczy może spędzć klka d a badau tylko jedego pacjeta; po roku będze mał o N=5 obserwacj. A testy korelacj (częste w tego typu badaach) mają małą moc przy małych lczoścach próbek. W takej sytuacj koecze ( sesowe) może być wyjśce poad wartość =,5, jeżel otrzyma sę przy tym rozsądą moc testu. Z drugej stroy, możlwe są sytuacje za dużej mocy testu. Na przykład w testowau zgodośc dwóch średch (m =m ) przy mloe pomarów w każdej grupe (w przemyśle, przy automatyczych pomarach N= e jest od rzeczy). W takej sytuacj, hpoteza zerowa prawe zawsze będze odrzucoa, przy ajmejszych, w jakmś sese przypadkowych różcach. Sytuacja taka jest tym bardzej sztucza przy testach PP. Jeżel N jest bardzo duże, to badacz prawe zawsze zmuszoy będze odrzucć swoją teorę, awet jeżel "tak aprawdę" jest to dobra wartoścowa hpoteza "całkem" dobrze pasuje do daych. Zbyt duża dokładość dośwadczea dzałałaby tu a ekorzyść eksperymetatora. Podsumowując testy OP (odrzucająco-potwerdzające):. Badacz ceszyłby sę, gdyby mał podstawy do odrzucea hpotezy H.. Społeczość, dla której badacz pracuje chce meć kotrolę ad błędam I rodzaju. 3. W terese badacza leży ska wartość błędu II rodzaju. 4. Duża lczość próby jest korzysta dla badacza. 5. Przy "za dużej" mocy testu eważe efekty stają sę "bardzo stote". Testy PP (przyjmująco-potwerdzające):. Badacz ceszyłby sę, gdyby e było podstaw do odrzucea hpotezy H mógłby ją zaakceptować.. Społeczość, dla której badacz pracuje powa meć kotrolę ad błędam II rodzaju, choć e zawsze sytuacja ta jest właścwe rozpozawaa pozostaje sę przy kowecjach stosowalych przy testowau OP. 3. Badacz ple zwraca uwagę a błędy I rodzaju. 4. Duża lczość próby jest ekorzysta dla badacza. 5. Przy "za dużej" mocy testu teora badacza zostae raczej odrzucoa w teśce awet jeśl 6. "całkem dobrze" pasuje do daych. 5