8. WERYFIKACJA HIPOTEZ STATYSTYCZNYCH DWA RODZAJE TESTÓW STATYSTYCZNYCH: PARAMETRYCZNE I ZGODNOŚCI

Podobne dokumenty
1. Wnioskowanie statystyczne. Ponadto mianem statystyki określa się także funkcje zmiennych losowych o

X i. X = 1 n. i=1. wartość tej statystyki nazywana jest wartością średnią empiryczną i oznaczamy ją symbolem x, przy czym x = 1. (X i X) 2.

ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA

16 Przedziały ufności

Estymacja przedziałowa

Zadanie 2 Niech,,, będą niezależnymi zmiennymi losowymi o identycznym rozkładzie,.

Lista 6. Estymacja punktowa

Statystyka i Opracowanie Danych. W7. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

KURS STATYSTYKA. Lekcja 3 Parametryczne testy istotności ZADANIE DOMOWE. Strona 1

Statystyka matematyczna dla leśników

Parametryczne Testy Istotności

Testowanie hipotez. H 1 : µ 15 lub H 1 : µ < 15 lub H 1 : µ > 15

θx θ 1, dla 0 < x < 1, 0, poza tym,

Metrologia: miary dokładności. dr inż. Paweł Zalewski Akademia Morska w Szczecinie

Estymacja parametrów populacji

STATYSTYKA OPISOWA I PROJEKTOWANIE EKSPERYMENTU dr inż Krzysztof Bryś

Statystyka opisowa. (n m n m 1 ) h (n m n m 1 ) + (n m n m+1 ) 2 +1), gdy n jest parzyste

STATYSTYKA I ANALIZA DANYCH

TESTY LOSOWOŚCI. Badanie losowości próby - test serii.

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

będą niezależnymi zmiennymi losowymi z rozkładu jednostajnego na przedziale ( 0,

Statystyka. Katarzyna Chudy Laskowska

Wykład 11 ( ). Przedziały ufności dla średniej

Wokół testu Studenta 1. Wprowadzenie Rozkłady prawdopodobieństwa występujące w testowaniu hipotez dotyczących rozkładów normalnych

2. INNE ROZKŁADY DYSKRETNE

Metoda łączona. Wykład 7 Dwie niezależne próby. Standardowy błąd dla różnicy dwóch średnich. Metoda zwykła (niełączona) n2 2

n n X n = σ σ = n n n Ponieważ zmienna losowa standaryzowana ma rozkład normalny N(0, 1), więc

Elementy statystyki opisowej Izolda Gorgol wyciąg z prezentacji (wykład I)

1 Testy statystyczne. 2 Rodzaje testów

L.Kowalski zadania ze statystyki matematycznej-zestaw 3 ZADANIA - ZESTAW 3

Podstawowe oznaczenia i wzory stosowane na wykładzie i laboratorium Część I: estymacja

PRZEDZIAŁY UFNOŚCI. Niech θ - nieznany parametr rozkładu cechy X. Niech α będzie liczbą z przedziału (0, 1).

Charakterystyki liczbowe zmiennych losowych: wartość oczekiwana i wariancja

STATYSTKA I ANALIZA DANYCH LAB II

(X i X) 2. n 1. X m S

Korelacja i regresja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 12

Estymacja przedziałowa:

Prawdopodobieństwo i statystyka r.

Twierdzenia graniczne:

Elementy modelowania matematycznego

SIGMA KWADRAT LUBELSKI KONKURS STATYSTYCZNO- DEMOGRAFICZNY

Rachunek prawdopodobieństwa i statystyka W12: Statystyczna analiza danych jakościowych. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.

3. Tworzenie próby, błąd przypadkowy (próbkowania) 5. Błąd standardowy średniej arytmetycznej

Estymacja przedziałowa - przedziały ufności

Trzeba pokazać, że dla każdego c 0 c Mc 0. ) = oraz det( ) det( ) det( ) jest macierzą idempotentną? Proszę odpowiedzieć w

WYKŁAD 1. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady

Wykład 5 Przedziały ufności. Przedział ufności, gdy znane jest σ. Opis słowny / 2

ANALIZA DANYCH DYSKRETNYCH

STATYSTYKA MATEMATYCZNA

Ćwiczenie nr 14. Porównanie doświadczalnego rozkładu liczby zliczeń w zadanym przedziale czasu z rozkładem Poissona

Estymacja: Punktowa (ocena, błędy szacunku) Przedziałowa (przedział ufności)

Prawdopodobieństwo i statystyka r.

Moda (Mo, D) wartość cechy występującej najczęściej (najliczniej).

O liczbach naturalnych, których suma równa się iloczynowi

są niezależnymi zmiennymi losowymi o jednakowym rozkładzie Poissona z wartością oczekiwaną λ równą 10. Obliczyć v = var( X

Słowniczek Hipoteza statystyczna Hipoteza parametryczna Hipoteza nieparametryczna Hipoteza zerowa Hipoteza alternatywna Błąd pierwszego rodzaju

Estymacja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 7

0.1 ROZKŁADY WYBRANYCH STATYSTYK

2.1. Studium przypadku 1

Modele probabilistyczne zjawisk losowych

Prawdopodobieństwo i statystyka

PODSTAWY BIOSTATYSTYKI ĆWICZENIA

Porównanie dwu populacji

Statystyka matematyczna. Wykład II. Estymacja punktowa

Ćwiczenie 2 ESTYMACJA STATYSTYCZNA

PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH

oznaczają łączne wartości szkód odpowiednio dla k-tego kontraktu w t-tym roku. O składnikach naszych zmiennych zakładamy, że:

Lista 5. Odp. 1. xf(x)dx = xdx = 1 2 E [X] = 1. Pr(X > 3/4) E [X] 3/4 = 2 3. Zadanie 3. Zmienne losowe X i (i = 1, 2, 3, 4) są niezależne o tym samym

POLITECHNIKA OPOLSKA

8 Weryfikacja hipotez statystycznych

Statystyka w rozumieniu tego wykładu to zbiór metod służących pozyskiwaniu, prezentacji, analizie danych.

1 Twierdzenia o granicznym przejściu pod znakiem całki

Rozkłady statystyk z próby Twierdzenia graniczne

Statystyka opisowa - dodatek

3. Regresja liniowa Założenia dotyczące modelu regresji liniowej

z przedziału 0,1. Rozważmy trzy zmienne losowe:..., gdzie X

Rachunek prawdopodobieństwa i statystyka Wnioskowanie statystyczne. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

Estymacja punktowa i przedziałowa

ZADANIA NA ĆWICZENIA 3 I 4

Liczebnośd (w tys.) n

I. Ciągi liczbowe. , gdzie a n oznacza n-ty wyraz ciągu (a n ) n N. spełniający warunek. a n+1 a n = r, spełniający warunek a n+1 a n

Zeszyty naukowe nr 9

Statystyka i rachunek prawdopodobieństwa

STATYSTYKA MATEMATYCZNA

MODELE MATEMATYCZNE W UBEZPIECZENIACH. 1. Renty

O pewnych zastosowaniach rachunku różniczkowego funkcji dwóch zmiennych w ekonomii

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Ćwiczenia nr 5. TEMATYKA: Regresja liniowa dla prostej i płaszczyzny

Komputerowa analiza danych doświadczalnych

1 Przedziały ufności. ). Obliczamy. gdzie S pochodzi z rozkładu B(n, 1 2. P(2 S n 2) = 1 P(S 2) P(S n 2) = 1 2( 2 n +n2 n +2 n ) = 1 (n 2 +n+2)2 n.

Plan wykładu. Analiza danych Wykład 1: Statystyka opisowa. Literatura. Podstawowe pojęcia

µ = Test jest następujący: jeŝeli X > 0.01 to odrzucamy H. 0

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Jarosław Wróblewski Analiza Matematyczna 1A, zima 2012/13. Ciągi.

I kolokwium z Analizy Matematycznej

Estymacja przedziałowa - przedziały ufności

Statystyka opisowa. () Statystyka opisowa 24 maja / 8

Damian Doroba. Ciągi. 1. Pierwsza z granic powinna wydawać się oczywista. Jako przykład może służyć: lim n = lim n 1 2 = lim.

Matematyka ubezpieczeń majątkowych r. Zadanie 1. Rozważamy proces nadwyżki ubezpieczyciela z czasem dyskretnym postaci: n

Transkrypt:

Weryfikacja hipotez statystyczych 8 95 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH DWA RODZAJE TESTÓW STATYSTYCZNYCH: PARAMETRYCZNE I ZGODNOŚCI 81 Rodzaje testów oraz etapy badań statystyczych Badaie iteresującej as cechy statystyczej populacji geeralej może się odbywać w dwóch różych sytuacjach: zaego oraz iezaego rozkładu prawdopodobieństwa W pierwszym przypadku szukamy tylko wartości pewych parametrów rozkładu i koiecze są odpowiedie testy parametrycze W drugim przypadku, gdy poszukiway jest rozkład prawdopodobieństwa, koiecze są testy zgodości rozkładów prawdopodobieństwa Jak już iejedokrotie podkreślao badaie każdej cechy statystyczej odbywa się w dwóch etapach: stawiaie hipotezy statystyczej a podstawie zebraego materiału statystyczego, a astępie zebraie owego, iezależego materiału statystyczego dla przeprowadzeia sprawdzeia, a więc testu-weryfikacji postawioej hipotezy statystyczej Wykorzystywaie tego samego materiału statystyczego do formułowaia i weryfikowaia hipotezy jest iedopuszczale, bowiem ie powio am zależeć a jak ajszybszym przyjęciu każdej hipotezy, jak to czasem bywa podczas testowaia, gdy testującemu, w grucie rzeczy, ie zależy a obiektywej prawdzie statystyczej, a zależy a przemyceiu pewych hipotez statystyczych, które uważa za pożytecze Są to iestety sytuacje maipulowaia materiałem statystyczym dla uzyskaia z góry założoego rezultatu badań statystyczych W zdrowej sytuacji praktyczej, ie powio się z góry igdy iczego zakładać i odrzucaie hipotezy powio występować jeszcze częściej, iż przyjmowaie A więc ormala sytuacja praktycza to taka, w której badający poszukuje obiektywej prawdy statystyczej i ie jest zaiteresoway jakimś z góry określoym wyikiem badań Tak więc postawioa hipoteza statystycza, aby moża ją traktować jako sprawdzoą hipotezę, musi rówież być potwierdzoa przez iezależy materiał statystyczy Jest to podstawowy kao sztuki statystyczej Co zatem robić, gdy ie możemy, ze względów kosztowych lub techiczych, zebrać iezależego materiału weryfikacyjego? Należy losowo (ie tedecyjie) podzielić zebray materiał a

96 Weryfikacja hipotez statystyczych 8 dwie części: jedą do stawiaia, a drugą do weryfikacji badaej hipotezy, a przykład za pomocą geeratora liczb pseudolosowych lub tablic statystyczych Drugim kaoem sztuki statystyczej jest specyficzy język określający badae hipotezy statystycze, który powiie am uświadamiać, że asze wioski z przeprowadzoych badań mają bardzo specyficzy, warukowy charakter, co pozwala am a ostroże formułowaie ogólych wiosków płyących z badań statystyczych W języku potoczym ie stosuje się a ogół tak ostrożego wyrażaia sądów ogólych, jakim są zweryfikowae hipotezy statystycze Język wiosków z weryfikacji hipotez statystyczych wyraża tę iepewą sytuację, jaką jest asza zajomość badaej rzeczywistości Trzecim kaoem sztuki statystyczej jest bardzo duża ostrożość podczas zbieraia i przetwarzaia daych statystyczych Dzisiejsza techika obliczeiowa stwarza duże możliwości w zakresie obliczeń statystyczych Z drugiej stroy, stwarza rówież możliwości popełieia błędów przeoszeia daych statystyczych, gdy uczesticzy w tym omyly, a czasem ieświadomie tedecyjy obserwator procesów trasportowych Łatwość stosowaia arzędzi weryfikacji hipotez statystyczych w postaci programów komputerowych stwarza rówież możliwości wykorzystaia przez użytkowików iewtajemiczoych w arzędzia statystycze i ułatwia maipulację przez użytkowików zaiteresowaych sfałszowaiem badań Iymi słowy, dzisiejsza techika komputerowa w zakresie statystyki matematyczej obok wspaiałych możliwości obliczeiowych, stwarza rówież duże możliwości maipulacji statystyczej opatrzoej etykietą: badaia aukowe Poprzedio zajmowaliśmy się metodami ajlepszego, w określoym sesie, oszacowaia wartości iezaych parametrów iteresującej as cechy elemetów populacji geeralej Obecie zajmiemy się zupełie iym zagadieiem Miaowicie, będziemy się starali dyspoując iformacjami z próbki, jak rówież czasami iformacjami spoza próbki zaklasyfikować iezay lub częściowo iezay rozkład iteresującej as cechy elemetów populacji do jedej z dwóch rozłączych podklas Mówiąc dokładiej, będziemy się starali odpowiedzieć a pytaie, do której z dwóch podklas pewej klasy rozkładów ależy wybray z tej klasy rozkład Dobrym wprowadzeiem do tej tematyki jest rozdział 511 książki Plucińskich (199), który w dalszym ciągu przytacza się po małej zmiaie termiologiczej Wspomiae iformacje spoza próbki mogą pozwolić a ograiczeie rozważań do pewej rodziy rozkładów, p ormalych, Poissoa, gamma itp Będziemy wtedy mówili, że zaa jest postać rozkładu Ie iformacje mogą dotyczyć zajomości iektórych parametrów lub iezależości pewych zdarzeń Iformacje tego typu pochodzą bądź z

Weryfikacja hipotez statystyczych 8 97 poprzedio przeprowadzoych badań statystyczych, bądź wyikają w sposób oczywisty z charakteru czy własości elemetów populacji I tak a przykład, przyjmuje się a ogół, że błędy pomiarów, cechy elemetów pochodzących z masowej produkcji mają rozkłady ormale W tym przypadku iformacja spoza próbki polega a zajomości rozkładu Niezae są atomiast parametry tego rozkładu i dlatego w tym przypadku możemy ograiczyć rozważaia do klasy rozkładów ormalych o iezaych parametrach Przystępując do badań statystyczych w miejszym lub większym stopiu ie zamy iteresującej as cechy X elemetów populacji Możemy jedak a ogół ustalić klasę P rozkładów, które mogą być brae pod uwagę jako ewetuale rozkłady cechy X Może to być p zbiór rozkładów ormalych o iezaej wartości przeciętej, zbiór rozkładów o ciągłej dystrybuacie, zbiór rozkładów, w których cecha X jest typu skokowego i przyjmuje wartości z pewego skończoego przedziału itp Jeśli elemety klasy P są wyzaczoe przez podaie wartości parametru θ, gdzie θ może być wektor, to klasę P wygodie jest zapisywać w postaci P = { Pθ : θ Θ } Zadaiem statystyka jest odpowiedź a pytaie: czy wskazay rozkład ależący do klasy P może być uzay za rozkład cechy X? W ajbliższych paragrafach będziemy się starali odpowiedzieć a powyższe pytaia w różych aspektach Hipotezą statystyczą azywamy każdy iepusty podzbiór klasy P Hipotezą statystyczą jest a przykład wybraie z klasy P kokretego rozkładu Jeżeli hipoteza statystycza polega a wyborze rozkładu PΘ P wskazaego przez podaie umeryczej wartości Θ parametru Θ, to taką hipotezę azywamy parametryczą Używać będziemy przy tym zapisu H ( Θ Θ ) = Klasę P azywamy zbiorem możliwych (dopuszczalych) hipotez Ze zbioru wszystkich możliwych w daym zagadieiu hipotez wyróżiamy, ze względu a aspekt praktyczy, tę hipotezę, która podlega weryfikacji Tę wyróżioą hipotezę azywać będziemy hipotezą zerową i ozaczać symbolem H Wszystkie pozostałe hipotezy azywać będziemy alteratywymi i ozaczać symbolem H 1 Jeżeli hipoteza dotyczy iezaej wartości parametru, to zbiór możliwych hipotez jest wyzaczay przez zbiór wszystkich możliwych wartości parametru W dalszych rozważaiach

98 Weryfikacja hipotez statystyczych 8 te dwa zbiory będziemy utożsamiać Te zbiór możliwych wartości parametru azywamy przestrzeią parametrów i ozaczamy symbolem Θ Przestrzeń parametrów Θ przedstawiamy w postaci sumy dwóch iepustych zbiorów rozłączych H i H = Θ H 1 Zbiór H azywamy hipotezą zerową, zbiór H 1 hipotezą alteratywą Jeżeli H jest zbiorem jedoelemetowym będziemy mówić że jest hipotezą prostą Jeżeli H jest zbiorem wieloelemetowym będziemy mówić, że jest hipotezą złożoą Podobie o hipotezie alteratywej mówić będziemy, że jest prosta lub złożoa w zależości od tego czy H 1 jest zbiorem jedoelemetowym czy wieloelemetowym Zaim sprecyzujemy co zaczy z w e r y f i k o w a ć hipotezę H rozważmy astępujący przykład: PRZYKŁAD 81 (Plucińscy, 199) Wyprodukowao owy materiał izolacyjy używay w określoym rodzaju kodesatorów Chcemy zbadać, czy owy materiał jest bardziej wytrzymały a przebicie od dotychczas używaego W tym celu przeprowadźmy astępujące doświadczeie Z bieżącej produkcji kodesatorów wybieramy losowo parę kodesatorów: jede z dotychczas stosowaym izolatorem, drugi z owym izolatorem Włączamy je rówocześie w obwód i obserwujemy apięcia, przy których astępują przebicia Ozaczmy zaobserwowae apięcia przez x 1 i y 1 Powtórzmy doświadczeie razy W wyiku obserwacji otrzymamy par liczb ( x y ) ( x y ) ( x y ),,,,,, 1 1 Opisaa metoda postępowaia gwaratuje jedakowe waruki przeprowadzaia doświadczeia Poieważ kodesatory pobierae są z bieżącej produkcji, więc a ich jakość ma wpływ wiele czyików losowych, takich jak: grubość izolatora, odległość okładzi, wilgotość itp Te czyiki losowe powodują, że zaobserwowae przez as wartości x 1, x,, x będą róże w różych doświadczeiach To samo dotyczy wartości y 1, y,, y Wspomiae czyiki losowe spowodują także, że w przypadku pobraia do badaia iych par kodesatorów otrzymamy iy układ zaobserwowaych wartości W wyiku przeprowadzoego doświadczeia chcemy odpowiedzieć a pytaie, czy owy izolator jest lepszy od starego

Weryfikacja hipotez statystyczych 8 99 Przyjmijmy, że a podstawie poprzedich badań wiemy, że x 1, x,, x są wartościami zmieej losowej X o rozkładzie ormalym o zaej wariacji Ze względu a idetyczy proces produkcji aalogicze założeie możemy przyjąć o wartościach y 1, y,, y Rozważmy różice y x = z, y x = z,, y x = z 1 1 1 Wartości z 1, z,, z możemy zaobserwować jako zaobserwowae wartości zmieej losowej o rozkładzie ormalym o zaej wariacji σ Gdyby obydwa izolatory miały jedakową wytrzymałość a przebicie, wówczas z 1, z,, z byłyby zaobserwowaymi wartościami zmieej losowej o rozkładzie ormalym N(,σ ) Wartość z 1 = i= 1 z i byłaby wtedy zaobserwowaą wartością zmieej losowej Z o rozkładzie ormalym ( ) N,σ Gdybyśmy opisae doświadczeie powtarzali wielokrotie, to w poszczególych doświadczeiach otrzymać możemy róże wartości z Niektóre z ich mogą się dość zaczie różić od zera Oczywiście, im większą wartość z zaobserwujemy, tym bardziej skłoi jesteśmy sądzić, że owy izolator jest lepszy od starego Ale iewielkie odchyleia wartości z są ieuikioe ze względu a losowy charakter doświadczeia Powstaje zasadicze pytaie: jak duże odchyleia wartości z od zera ależy uważać za dopuszczale odchyleia losowe, a jak duże za istotą wskazówkę, że owy izolator jest lepszy od starego? Musimy przyjąć umowie jakąś graicę Wybór tej umowej graicy uzasadiamy w sposób astępujący Wartość z jest zaobserwowaą wartością zmieej losowej Z mającą rozkład ormaly o iezaej wartości oczekiwaej m i zaej wariacji σ Stawiamy hipotezę dotyczącą iezaej wartości parametru m Mamy tu więc do czyieia z hipotezą

1 Weryfikacja hipotez statystyczych 8 parametryczą Przestrzeią parametrów jest tu zbiór { m m } : < Wykluczamy możliwość, że owy izolator jest gorszy od starego Zbiór te przedstawiamy w postaci sumy dwóch zbiorów rozłączych { m: m = } { m: m > } Pierwszy z ich będzie hipotezą zerową H, drugi hipotezą alteratywą H 1 Hipoteza zerowa orzeka, że m =, tz że obydwa izolatory mają tę samą wytrzymałość a przebicie Jest to hipoteza wyróżioa ze zbioru możliwych hipotez wyłączie ze względu a aspekt praktyczy Jeżeli hipoteza H jest prawdziwa, to zaobserwowaie dużych odchyleń wartości z od zera jest zdarzeiem mało prawdopodobym Określeie takie jest mało precyzyje Dlatego też musimy ustalić, jakie prawdopodobieństwo w rozważaym przypadku uzamy za małe lub iaczej, zdarzeia o jakim prawdopodobieństwie uzajemy za przeczące hipotezie zerowej Ozaczmy to prawdopodobieństwo przez Jako wspomiaą wyżej umową graicę odchyleia wartości zaobserwowaej z od hipotetyczej m = przyjmijmy taką liczbę ε, dla której P Z > ε =, σ gdzie jest zaą liczbą Liczbę ε odczytujemy z tablic rozkładu ormalego Spełieie waruku z > ε σ iterpretujemy jako wystąpieie zdarzeia o małym prawdopodobieństwie (miejszym od ) i uzajemy za zaprzeczeie hipotezie zerowej, tz za zaprzeczeie zdaia: obydwa izolatory mają tę samą wytrzymałość a przebicie, lub iaczej ieprawdą jest, że zmiea losowa Z

Weryfikacja hipotez statystyczych 8 11 ma rozkład ormaly o wartości oczekiwaej m = Mówić wtedy będziemy: o d r z u c a m y hipotezę zerową H Jeżeli spełioa jest ierówość z ε σ, to będziemy uważać, że zaobserwowaa wartość z ie przeczy hipotezie zerowej, a więc możemy przyjąć, że obydwa izolatory mają tę samą wytrzymałość a przebicie lub iaczej, że zmiea losowa Z ma rozkład ormaly o wartości oczekiwaej m = Mówić wtedy będziemy: p r z y j m u j e m y hipotezę zerową H Zwroty odrzucamy hipotezę zerową i przyjmujemy hipotezę zerową są bardzo wygode i przyjęte w literaturze statystyczej Należy jedak przy tym pamiętać, że ie ozaczają oe aszego całkowitego przekoaia o ieprawdziwości czy prawdziwości hipotezy zerowej Naszym zadaiem była jedyie odpowiedź a pytaie: czy a podstawie zaobserwowaych wartości zmieej losowej Z uzać, że rozkład zmieej losowej Z jest rozkładem ormalym o wartości oczekiwaej m = czy też raczej o wartości m >? Przytoczoy przykład upoważia as do stwierdzeia, że z formalego puktu widzeia weryfikacja hipotez polega a określeiu a przestrzei próbkowej fukcji, której wartościami jest jedo z dwóch orzeczeń: przyjąć hipotezę zerową lub odrzucić hipotezę zerową Mówiąc bardziej poglądowo weryfikacja hipotezy zerowej polega a: 1 wyborze odpowiediej statystyki U, której rozkład (dokłady lub asymptotyczy) jest zay, ustaleiu zbioru W tych wartości statystyki U, których wystąpieie uważamy za zaprzeczeie hipotezy zerowej Statystykę U azywamy testem hipotezy H przeciw hipotezie alteratywej H 1, a zbiór W zbiorem krytyczym testu W przykładzie 81 statystyką U była statystyka Z, a zbiorem W zbiór ( x1, y1, x, y,, x, y ): z > ε σ

1 Weryfikacja hipotez statystyczych 8 Prawdopodobieństwo ( W H ) P U =, (81) tz prawdopodobieństwo odrzuceia hipotezy zerowej, gdy jest oa prawdziwa, azywamy poziomem istotości testu Wybór liczby jest w zasadzie dość dowoly W praktyce przyjmuje się a ogół jedą z liczb: 5,, 1, 1 Ustalając liczbę ależy przede wszystkim mieć a uwadze kosekwecje praktycze, jakie się z tym wiążą Testy służące do weryfikowaia hipotez parametryczych azywamy testami parametryczymi, testy służące do weryfikowaia hipotez ieparametryczvh - testami ieparametryczymi lub testami zgodości 8 Testy parametrycze W iiejszym rozdziale ograiczymy się do przedstawieia testów do weryfikacji hipotez dotyczących wartości oczekiwaej, wariacji, współczyika korelacji i współczyika regresji 1 W e r y f i k a c j a h i p o t e z y o w a r t o ś c i o c z e k i w a e j p r z y zae z a y m σ Niech cecha X elemetów populacji ma rozkład ormaly N( m,σ ), w którym σ jest Pobrao -elemetową próbkę i zaobserwowao wartości x 1, x,, x Przyjmując poziom istotości chcemy zweryfikować hipotezę H ( m m ) alteratywej H ( m m ) 1 = przeciw hipotezie Wykorzystując fakt, że średia arytmetycza X z iezależych zmieych losowych o rozkładach ormalych ( ) N m,σ ma rozkład ormaly N( m ) jako test przyjmujemy statystykę X Zbiorem krytyczym jest w tym przypadku zbiór,σ,

Weryfikacja hipotez statystyczych 8 13 W = ( x1, x,, x ): x m σ > ε, (8) gdzie ε wyzaczoe jest z rówości P X m σ W H P X m = σ > ε = Zatem hipotezę H odrzucamy, gdy x m > ε σ (83) i przyjmujemy, gdy x m ε σ (84) PRZYKŁAD 8 (Plucińscy, 199) Wiadomo, że dla oporików pochodzących z masowej produkcji odchyleie wartości rezystacji od wartości zamioowej ma rozkład ormaly o zaym odchyleiu stadardowym σ = kω Celem zweryfikowaia hipotezy H ( m = ), tz że wartość oczekiwaa rezystacji jest rówa wartości zamioowej (ie występują systematycze odchyleia) pobrao próbkę o liczości = 9 i otrzymao wyiki w kω k 1 3 4 5 6 7 8 9 x k -18 9-1 45-35 19 7-8 - x k = 9 Przyjmujemy poziom istotości = 5 Z tablic statystyczych rozkładu ormalego odczytujemy, że ε = 196 Zatem

14 Weryfikacja hipotez statystyczych 8 ε σ = 196 3 = 13 Uwzględiając, że x = 1 otrzymujemy x m = 1 = 1 13 Poieważ spełioa jest ierówość (84), więc hipotezę H przyjmujemy a poziomie istotości = 5 W e r y f i k a c j a h i p o t e z y o w a r t o ś c i o c z e k i w a e j w r o z k ł a d z i e o r m a l y m p r z y i e z a y m σ Wiadomo, że cecha X elemetów populacji ma rozkład ormaly N( m,σ ), w którym m i σ są iezae Na podstawie -elemetowej próbki chcemy zweryfikować hipotezę H ( m = m ) przeciw hipotezie alteratywej H ( m m ) 1 Niech poziom istotości będzie Korzystając z twierdzeia o rozkładzie Studeta jako test przyjmiemy t u statystykę t = X m S 1, o której wiemy, że ma rozkład iezależy od σ, a miaowicie, rozkład Studeta o 1 stopiach swobody Zbiorem krytyczym jest zbiór {( 1 ) } W = x, x,, x : t > t, gdzie t jest wartością odczytaą z tablicy rozkładu Studeta spełiającą waruek P( t W H ) P X m = S > t =

Weryfikacja hipotez statystyczych 8 15 Hipotezę H ( m m ) = odrzucamy, gdy i przyjmujemy, gdy s x m > t 1 (85) s x m t (86) 1 PRZYKŁAD 83 (Plucińscy, 199) Niech w warukach przykładu 8 odchyleie 9 1 = = 9 stadardowe σ będzie iezae Po obliczeiu s ( xk x ) i odczytaiu t = 36 z tablicy rozkładu Studeta otrzymujemy k = 1 6 9 s x m = t = 6 = 1 36 138 1 3 8 Poieważ jest spełioa ierówość (86), więc hipotezę H ( m m ) = przyjmujemy Porówując wyiki w przykładach 8 i 83 warto zwrócić uwagę a fakt, że iezajomość σ, a więc posiadaie miejszej ilości iformacji, powoduje ostrożiejsze podejmowaie decyzji o przyjęciu hipotezy zerowej 3 W e r y f i k a c j a h i p o t e z y o w a r i a c j i w r o z k ł a d z i e o r m a l y m Wiemy, że cecha X elemetów populacji ma rozkład ormaly N( m,σ ) o iezaych parametrach m i σ Na podstawie -elemetowej próbki chcemy zweryfikować hipotezę ( σ σ ) H hipoteza H 1 ( σ σ ), tz że wariacja ie przekracza pewej liczby Hipotezą alteratywą jest tu > Przyjmijmy poziom istotości Pamiętajmy, że statystyka S σ ma rozkład chikwadrat o 1 stopiach swobody Wykorzystamy tę statystykę jako test do weryfikacji hipotezy H ( σ σ ) Zbiorem krytyczym będzie tu zbiór

16 Weryfikacja hipotez statystyczych 8 s W = ( x1, x,, x ): > χ σ, gdzie χ jest liczbą odczytaą z tablicy rozkładu chi-kwadrat, spełiającą waruek P S W H P S χ σ = σ > = Hipotezę H o ( σ σ ) odrzucamy, gdy i przyjmujemy, gdy s σ > (87) χ s σ (88) χ PRZYKŁAD 84 (Plucińscy, 199) Błąd pomiaru odległości za pomocą radaru ma rozkład ormaly Przeprowadzoo 1 pomiarów tej samej odległości i otrzymao astępujące wartości błędów (w km): k 1 3 4 5 6 7 8 9 1 x k 115-5 18-6 -1 1-5 75-15 -5 Σx k = 5 Przyjmując poziom istotości = Z daych liczbowych wyika, że x = 5, s dla daych i, odczytujemy χ = 19 679 zweryfikować hipotezę H ( 15) σ = 9435 Z tablicy rozkładu chi-kwadrat

Weryfikacja hipotez statystyczych 8 17 Zatem s 9435 3 448 19 679 σ = 15 = > odrzucić Ozacza to, że spełioa jest ierówość (87) i hipotezę H ( 15) σ ależy 4 W e r y f i k a c j a h i p o t e z y o r ó w o ś c i w a r t o ś c i o c z e k i w a y c h o r o z k ł a d a c h o r m a l y c h z j e d a k o w ą i e z a ą w a r i a c j ą Dae są dwie populacje, w których cecha X ma odpowiedio rozkład ormaly N( m 1,σ ) i ( ) N m,σ, przy czym parametry m, m i σ są iezae Pobrao z obu populacji 1 próbki o liczościach odpowiedio 1 i i otrzymao astępujące wyiki: x 1, x,, x dla próbki z pierwszej populacji i y 1, y,, y dla próbki z drugiej populacji Przyjmując poziom istotości chcemy zweryfikować hipotezę H ( m m ) ( ) H m m 1 1 1 = przeciw hipotezie alteratywej Żada z pozaych dotąd statystyk ie adaje się do weryfikowaia hipotezy H Dlatego wprowadzamy tu ową statystykę określoą wzorem T = + 1 1 X Y 1 ( 1S + S ) 1 1 + (89) Jeśli hipoteza H jest prawdziwa, to statystyka T ma rozkład Studeta o 1 + stopiach swobody Nie trudo to uzasadić, jeżeli tylko (89) zapiszemy w ieco iej postaci, a miaowicie: T = ( X Y ) 1 1 + 1 σ σ + 1 [( 1S σ ) + ( S ) 1 σ ] (81)

18 Weryfikacja hipotez statystyczych 8 Jeżeli hipoteza H jest prawdziwa, to wobec iezależości zmieych losowych X, X,, X, Y, Y,, Y i twierdzeia o rozkładzie chi-kwadrat, tak poday liczik i 1 1 awias kwadratowy w miaowiku wzoru (81) są iezależymi zmieymi losowymi o rozkładach odpowiedio N( 1), i chi-kwadrat o + stopiach swobody, a zatem w 1 myśl defiicji rozkładu Studeta zmiea losowa T ma rozkład Studeta o stopiach swobody + 1 Statystykę T określoą wzorem (89) możemy wykorzystać jako test do weryfikacji hipotezy H ( m m ) = 1 Przyjmijmy poziom istotości Zbiorem krytyczym jest tu zbiór x y 1 W = ( x1, x,, x, y1, y,, y ): > t 1, + S + S 1 1 1 + 1 1 gdzie t jest liczbą odczytaą z tablicy rozkładu Studeta spełiającą waruek ( T W H ) = P( T > t ) P = Hipotezę H o rówości wartości oczekiwaych odrzucamy, gdy + x 1 1 y 1 1S + S + 1 1 > t (811) i przyjmujemy, gdy + x 1 1 y 1 1S + S + 1 1 t (81)

Weryfikacja hipotez statystyczych 8 19 PRZYKŁAD 85 (Plucińscy, 199) Wałek główy samochodowej skrzyki biegów obrabiay jest a obrabiarce automatyczej Rozkład średic wałków jest rozkładem ormalym W celu sprawdzeia, czy poziom astawieia obrabiarki ie zmieia się w czasie pracy, pobrao dwie próbki wałków o liczościach 8 i 1 sztuk, jedą próbkę z produkcji przedpołudiowej, drugą z popołudiowej i otrzymao astępujące dae dla długości średic wałków (w mm): k 1 3 4 5 6 7 8 x k 198 1 199 198 1 198 197 j 1 3 4 5 6 7 8 9 1 y k 199 3 1 198 1 199 198 199 Zakładamy, że zmiaa waruków w ciągu odstępu czasu między pobieraiem próbek może wpłyąć tylko a średi rozmiar, a ie zmieia wariacji Przyjmując poziom istotości = 5, zweryfikować hipotezę o iewystępowaiu zmia poziomu astawieia obrabiarki w czasie Z daych liczbowych zajdujemy x 8 = 19 9, s 8 =, y 1 =, s 1 = 6 Z tablic rozkładu Studeta dla = 5 i 8+1-=16 stopi swobody odczytujemy t = 1 Obliczając wartość statystyki (89) zajdujemy 19 9 8 + 1 ( 16 + 6) 8 1 8 + 1 = 137 < 1 Poieważ spełioa jest ierówość (81) więc przyjmujemy hipotezę o iewystępowaiu zmia poziomu astawieia obrabiarki 5 W e r y f k a c j a h i p o t e z y o w a r t o ś c i o c z e k i w a e j a p o d s t a w i e p r ó b e k o d u ż e j l i c z e b o ś c i

11 Weryfikacja hipotez statystyczych 8 W puktach 1 4 iiejszego rozdziału zakładaliśmy, że zaa jest postać badaej cechy populacji, ie przyjmowaliśmy żadych założeń odośie do liczości próbki Przy tak mocym założeiu, jakim jest zajomość postaci rozkładu, założeie o liczości próbki ie było potrzebe Rozważmy teraz przypadek, gdy postać rozkładu iteresującej as cechy elemetów populacji jest iezaa Aby móc zweryfikować hipotezę o iezaej wartości oczekiwaej cechy X, musimy zać rozkład jakiejś statystyki, która może służyć za test Tylko wtedy bowiem potrafimy zbudować zbiór krytyczy W Nie zając rozkładu cechy X ie potrafimy zaleźć dokładego rozkładu żadej statystyki Nie jest to jedak sytuacja bez wyjścia Skorzystać przecież moża ze zaych twierdzeń graiczych, p z tw Lideberga-Ley ego, które orzeka, że jeżeli jest dostateczie duże, a zmiee losowe X 1, X,, X są iezależe o jedakowym rozkładzie, i istieją E( X 1 ) = m oraz V ( X 1 ) = σ, to zmiea losowa = ( 1 ) X X k = 1 k ma rozkład w przybliżeiu ormaly o parametrach m i σ Korzystając z iego twierdzeia możemy przyjąć, że σ s Uwzględiając powyższe, dochodzimy do wiosku, że chcąc zweryfikować hipotezę ( = ) przeciw hipotezie alteratywej H ( m m ) H m m 1, gdy ie mamy żadych iformacji o postaci rozkładu cechy X w populacji, ależy pobrać dostateczie liczą próbkę (rzędu co ajmiej kilku dziesiątek), a astępie jako test przyjąć statystykę X Zbiorem krytyczym będzie w tym przypadku zbiór x m W = ( x1, x,, x ): > ε s, gdzie ε jest liczbą odczytaą z tablic rozkładu ormalego, spełiającą waruek P X m S > ε =

Weryfikacja hipotez statystyczych 8 111 Hipotezę H ( m m ) = odrzucamy, gdy x m s > ε (813) i przyjmujemy, gdy x m s ε (814) PRZYKŁAD 86 (Plucińscy, 199) Zużycie wody przez zakład przemysłowy podlega losowym wahaiom w kolejych diach Na podstawie obserwacji = 56 di stwierdzoo, że średie dziee zużycie wody wyosi x s = hl, a średie odchyleie kwadratowe 56 1 = 64 hl Przyjmując poziom istotości = 5 zweryfikować hipotezę 56 ( ) H m = 1 hl, tz że średie dziee zużycie wody wyosi 1 hl, przeciw hipotezie alteratywej H ( m hl) 1 1 Z tablicy rozkładu ormalego dla = 5 odczytamy ε = 196 Z daych przykładu wyika, że x s m 56 56 = 1 1 8 56 = 4 > ε = 196 Poieważ spełioa jest ierówość (813), więc hipotezę H odrzucamy

11 Weryfikacja hipotez statystyczych 8 Problemy rozdziału 8 1 Rodzaje testów statystyczych Podstawowe kaoy sztuki statystyczej 3 Przestrzeń parametrów 4 Hipotezy statystycze 5 Zbiór krytyczy testu 6 Poziom istotości testu 7 Waruek odrzuceia hipotezy 8 Waruek przyjęcia hipotezy 9 Weryfikacja hipotezy o wartości oczekiwaej przy zaej wariacji 1 Weryfikacja hipotezy o wartości oczekiwaej przy iezaej wariacji 11 Weryfikacja hipotezy o wariacji w rozkładzie ormalym 1 Weryfikacja hipotezy o rówości wartości oczekiwaych o rozkładach ormalych z jedakową iezaą wariacją 13 Weryfikacja hipotezy o wartości oczekiwaej a podstawie próbek o dużej liczebości