Weryfikacja hipotez statystyczych 8 95 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH DWA RODZAJE TESTÓW STATYSTYCZNYCH: PARAMETRYCZNE I ZGODNOŚCI 81 Rodzaje testów oraz etapy badań statystyczych Badaie iteresującej as cechy statystyczej populacji geeralej może się odbywać w dwóch różych sytuacjach: zaego oraz iezaego rozkładu prawdopodobieństwa W pierwszym przypadku szukamy tylko wartości pewych parametrów rozkładu i koiecze są odpowiedie testy parametrycze W drugim przypadku, gdy poszukiway jest rozkład prawdopodobieństwa, koiecze są testy zgodości rozkładów prawdopodobieństwa Jak już iejedokrotie podkreślao badaie każdej cechy statystyczej odbywa się w dwóch etapach: stawiaie hipotezy statystyczej a podstawie zebraego materiału statystyczego, a astępie zebraie owego, iezależego materiału statystyczego dla przeprowadzeia sprawdzeia, a więc testu-weryfikacji postawioej hipotezy statystyczej Wykorzystywaie tego samego materiału statystyczego do formułowaia i weryfikowaia hipotezy jest iedopuszczale, bowiem ie powio am zależeć a jak ajszybszym przyjęciu każdej hipotezy, jak to czasem bywa podczas testowaia, gdy testującemu, w grucie rzeczy, ie zależy a obiektywej prawdzie statystyczej, a zależy a przemyceiu pewych hipotez statystyczych, które uważa za pożytecze Są to iestety sytuacje maipulowaia materiałem statystyczym dla uzyskaia z góry założoego rezultatu badań statystyczych W zdrowej sytuacji praktyczej, ie powio się z góry igdy iczego zakładać i odrzucaie hipotezy powio występować jeszcze częściej, iż przyjmowaie A więc ormala sytuacja praktycza to taka, w której badający poszukuje obiektywej prawdy statystyczej i ie jest zaiteresoway jakimś z góry określoym wyikiem badań Tak więc postawioa hipoteza statystycza, aby moża ją traktować jako sprawdzoą hipotezę, musi rówież być potwierdzoa przez iezależy materiał statystyczy Jest to podstawowy kao sztuki statystyczej Co zatem robić, gdy ie możemy, ze względów kosztowych lub techiczych, zebrać iezależego materiału weryfikacyjego? Należy losowo (ie tedecyjie) podzielić zebray materiał a
96 Weryfikacja hipotez statystyczych 8 dwie części: jedą do stawiaia, a drugą do weryfikacji badaej hipotezy, a przykład za pomocą geeratora liczb pseudolosowych lub tablic statystyczych Drugim kaoem sztuki statystyczej jest specyficzy język określający badae hipotezy statystycze, który powiie am uświadamiać, że asze wioski z przeprowadzoych badań mają bardzo specyficzy, warukowy charakter, co pozwala am a ostroże formułowaie ogólych wiosków płyących z badań statystyczych W języku potoczym ie stosuje się a ogół tak ostrożego wyrażaia sądów ogólych, jakim są zweryfikowae hipotezy statystycze Język wiosków z weryfikacji hipotez statystyczych wyraża tę iepewą sytuację, jaką jest asza zajomość badaej rzeczywistości Trzecim kaoem sztuki statystyczej jest bardzo duża ostrożość podczas zbieraia i przetwarzaia daych statystyczych Dzisiejsza techika obliczeiowa stwarza duże możliwości w zakresie obliczeń statystyczych Z drugiej stroy, stwarza rówież możliwości popełieia błędów przeoszeia daych statystyczych, gdy uczesticzy w tym omyly, a czasem ieświadomie tedecyjy obserwator procesów trasportowych Łatwość stosowaia arzędzi weryfikacji hipotez statystyczych w postaci programów komputerowych stwarza rówież możliwości wykorzystaia przez użytkowików iewtajemiczoych w arzędzia statystycze i ułatwia maipulację przez użytkowików zaiteresowaych sfałszowaiem badań Iymi słowy, dzisiejsza techika komputerowa w zakresie statystyki matematyczej obok wspaiałych możliwości obliczeiowych, stwarza rówież duże możliwości maipulacji statystyczej opatrzoej etykietą: badaia aukowe Poprzedio zajmowaliśmy się metodami ajlepszego, w określoym sesie, oszacowaia wartości iezaych parametrów iteresującej as cechy elemetów populacji geeralej Obecie zajmiemy się zupełie iym zagadieiem Miaowicie, będziemy się starali dyspoując iformacjami z próbki, jak rówież czasami iformacjami spoza próbki zaklasyfikować iezay lub częściowo iezay rozkład iteresującej as cechy elemetów populacji do jedej z dwóch rozłączych podklas Mówiąc dokładiej, będziemy się starali odpowiedzieć a pytaie, do której z dwóch podklas pewej klasy rozkładów ależy wybray z tej klasy rozkład Dobrym wprowadzeiem do tej tematyki jest rozdział 511 książki Plucińskich (199), który w dalszym ciągu przytacza się po małej zmiaie termiologiczej Wspomiae iformacje spoza próbki mogą pozwolić a ograiczeie rozważań do pewej rodziy rozkładów, p ormalych, Poissoa, gamma itp Będziemy wtedy mówili, że zaa jest postać rozkładu Ie iformacje mogą dotyczyć zajomości iektórych parametrów lub iezależości pewych zdarzeń Iformacje tego typu pochodzą bądź z
Weryfikacja hipotez statystyczych 8 97 poprzedio przeprowadzoych badań statystyczych, bądź wyikają w sposób oczywisty z charakteru czy własości elemetów populacji I tak a przykład, przyjmuje się a ogół, że błędy pomiarów, cechy elemetów pochodzących z masowej produkcji mają rozkłady ormale W tym przypadku iformacja spoza próbki polega a zajomości rozkładu Niezae są atomiast parametry tego rozkładu i dlatego w tym przypadku możemy ograiczyć rozważaia do klasy rozkładów ormalych o iezaych parametrach Przystępując do badań statystyczych w miejszym lub większym stopiu ie zamy iteresującej as cechy X elemetów populacji Możemy jedak a ogół ustalić klasę P rozkładów, które mogą być brae pod uwagę jako ewetuale rozkłady cechy X Może to być p zbiór rozkładów ormalych o iezaej wartości przeciętej, zbiór rozkładów o ciągłej dystrybuacie, zbiór rozkładów, w których cecha X jest typu skokowego i przyjmuje wartości z pewego skończoego przedziału itp Jeśli elemety klasy P są wyzaczoe przez podaie wartości parametru θ, gdzie θ może być wektor, to klasę P wygodie jest zapisywać w postaci P = { Pθ : θ Θ } Zadaiem statystyka jest odpowiedź a pytaie: czy wskazay rozkład ależący do klasy P może być uzay za rozkład cechy X? W ajbliższych paragrafach będziemy się starali odpowiedzieć a powyższe pytaia w różych aspektach Hipotezą statystyczą azywamy każdy iepusty podzbiór klasy P Hipotezą statystyczą jest a przykład wybraie z klasy P kokretego rozkładu Jeżeli hipoteza statystycza polega a wyborze rozkładu PΘ P wskazaego przez podaie umeryczej wartości Θ parametru Θ, to taką hipotezę azywamy parametryczą Używać będziemy przy tym zapisu H ( Θ Θ ) = Klasę P azywamy zbiorem możliwych (dopuszczalych) hipotez Ze zbioru wszystkich możliwych w daym zagadieiu hipotez wyróżiamy, ze względu a aspekt praktyczy, tę hipotezę, która podlega weryfikacji Tę wyróżioą hipotezę azywać będziemy hipotezą zerową i ozaczać symbolem H Wszystkie pozostałe hipotezy azywać będziemy alteratywymi i ozaczać symbolem H 1 Jeżeli hipoteza dotyczy iezaej wartości parametru, to zbiór możliwych hipotez jest wyzaczay przez zbiór wszystkich możliwych wartości parametru W dalszych rozważaiach
98 Weryfikacja hipotez statystyczych 8 te dwa zbiory będziemy utożsamiać Te zbiór możliwych wartości parametru azywamy przestrzeią parametrów i ozaczamy symbolem Θ Przestrzeń parametrów Θ przedstawiamy w postaci sumy dwóch iepustych zbiorów rozłączych H i H = Θ H 1 Zbiór H azywamy hipotezą zerową, zbiór H 1 hipotezą alteratywą Jeżeli H jest zbiorem jedoelemetowym będziemy mówić że jest hipotezą prostą Jeżeli H jest zbiorem wieloelemetowym będziemy mówić, że jest hipotezą złożoą Podobie o hipotezie alteratywej mówić będziemy, że jest prosta lub złożoa w zależości od tego czy H 1 jest zbiorem jedoelemetowym czy wieloelemetowym Zaim sprecyzujemy co zaczy z w e r y f i k o w a ć hipotezę H rozważmy astępujący przykład: PRZYKŁAD 81 (Plucińscy, 199) Wyprodukowao owy materiał izolacyjy używay w określoym rodzaju kodesatorów Chcemy zbadać, czy owy materiał jest bardziej wytrzymały a przebicie od dotychczas używaego W tym celu przeprowadźmy astępujące doświadczeie Z bieżącej produkcji kodesatorów wybieramy losowo parę kodesatorów: jede z dotychczas stosowaym izolatorem, drugi z owym izolatorem Włączamy je rówocześie w obwód i obserwujemy apięcia, przy których astępują przebicia Ozaczmy zaobserwowae apięcia przez x 1 i y 1 Powtórzmy doświadczeie razy W wyiku obserwacji otrzymamy par liczb ( x y ) ( x y ) ( x y ),,,,,, 1 1 Opisaa metoda postępowaia gwaratuje jedakowe waruki przeprowadzaia doświadczeia Poieważ kodesatory pobierae są z bieżącej produkcji, więc a ich jakość ma wpływ wiele czyików losowych, takich jak: grubość izolatora, odległość okładzi, wilgotość itp Te czyiki losowe powodują, że zaobserwowae przez as wartości x 1, x,, x będą róże w różych doświadczeiach To samo dotyczy wartości y 1, y,, y Wspomiae czyiki losowe spowodują także, że w przypadku pobraia do badaia iych par kodesatorów otrzymamy iy układ zaobserwowaych wartości W wyiku przeprowadzoego doświadczeia chcemy odpowiedzieć a pytaie, czy owy izolator jest lepszy od starego
Weryfikacja hipotez statystyczych 8 99 Przyjmijmy, że a podstawie poprzedich badań wiemy, że x 1, x,, x są wartościami zmieej losowej X o rozkładzie ormalym o zaej wariacji Ze względu a idetyczy proces produkcji aalogicze założeie możemy przyjąć o wartościach y 1, y,, y Rozważmy różice y x = z, y x = z,, y x = z 1 1 1 Wartości z 1, z,, z możemy zaobserwować jako zaobserwowae wartości zmieej losowej o rozkładzie ormalym o zaej wariacji σ Gdyby obydwa izolatory miały jedakową wytrzymałość a przebicie, wówczas z 1, z,, z byłyby zaobserwowaymi wartościami zmieej losowej o rozkładzie ormalym N(,σ ) Wartość z 1 = i= 1 z i byłaby wtedy zaobserwowaą wartością zmieej losowej Z o rozkładzie ormalym ( ) N,σ Gdybyśmy opisae doświadczeie powtarzali wielokrotie, to w poszczególych doświadczeiach otrzymać możemy róże wartości z Niektóre z ich mogą się dość zaczie różić od zera Oczywiście, im większą wartość z zaobserwujemy, tym bardziej skłoi jesteśmy sądzić, że owy izolator jest lepszy od starego Ale iewielkie odchyleia wartości z są ieuikioe ze względu a losowy charakter doświadczeia Powstaje zasadicze pytaie: jak duże odchyleia wartości z od zera ależy uważać za dopuszczale odchyleia losowe, a jak duże za istotą wskazówkę, że owy izolator jest lepszy od starego? Musimy przyjąć umowie jakąś graicę Wybór tej umowej graicy uzasadiamy w sposób astępujący Wartość z jest zaobserwowaą wartością zmieej losowej Z mającą rozkład ormaly o iezaej wartości oczekiwaej m i zaej wariacji σ Stawiamy hipotezę dotyczącą iezaej wartości parametru m Mamy tu więc do czyieia z hipotezą
1 Weryfikacja hipotez statystyczych 8 parametryczą Przestrzeią parametrów jest tu zbiór { m m } : < Wykluczamy możliwość, że owy izolator jest gorszy od starego Zbiór te przedstawiamy w postaci sumy dwóch zbiorów rozłączych { m: m = } { m: m > } Pierwszy z ich będzie hipotezą zerową H, drugi hipotezą alteratywą H 1 Hipoteza zerowa orzeka, że m =, tz że obydwa izolatory mają tę samą wytrzymałość a przebicie Jest to hipoteza wyróżioa ze zbioru możliwych hipotez wyłączie ze względu a aspekt praktyczy Jeżeli hipoteza H jest prawdziwa, to zaobserwowaie dużych odchyleń wartości z od zera jest zdarzeiem mało prawdopodobym Określeie takie jest mało precyzyje Dlatego też musimy ustalić, jakie prawdopodobieństwo w rozważaym przypadku uzamy za małe lub iaczej, zdarzeia o jakim prawdopodobieństwie uzajemy za przeczące hipotezie zerowej Ozaczmy to prawdopodobieństwo przez Jako wspomiaą wyżej umową graicę odchyleia wartości zaobserwowaej z od hipotetyczej m = przyjmijmy taką liczbę ε, dla której P Z > ε =, σ gdzie jest zaą liczbą Liczbę ε odczytujemy z tablic rozkładu ormalego Spełieie waruku z > ε σ iterpretujemy jako wystąpieie zdarzeia o małym prawdopodobieństwie (miejszym od ) i uzajemy za zaprzeczeie hipotezie zerowej, tz za zaprzeczeie zdaia: obydwa izolatory mają tę samą wytrzymałość a przebicie, lub iaczej ieprawdą jest, że zmiea losowa Z
Weryfikacja hipotez statystyczych 8 11 ma rozkład ormaly o wartości oczekiwaej m = Mówić wtedy będziemy: o d r z u c a m y hipotezę zerową H Jeżeli spełioa jest ierówość z ε σ, to będziemy uważać, że zaobserwowaa wartość z ie przeczy hipotezie zerowej, a więc możemy przyjąć, że obydwa izolatory mają tę samą wytrzymałość a przebicie lub iaczej, że zmiea losowa Z ma rozkład ormaly o wartości oczekiwaej m = Mówić wtedy będziemy: p r z y j m u j e m y hipotezę zerową H Zwroty odrzucamy hipotezę zerową i przyjmujemy hipotezę zerową są bardzo wygode i przyjęte w literaturze statystyczej Należy jedak przy tym pamiętać, że ie ozaczają oe aszego całkowitego przekoaia o ieprawdziwości czy prawdziwości hipotezy zerowej Naszym zadaiem była jedyie odpowiedź a pytaie: czy a podstawie zaobserwowaych wartości zmieej losowej Z uzać, że rozkład zmieej losowej Z jest rozkładem ormalym o wartości oczekiwaej m = czy też raczej o wartości m >? Przytoczoy przykład upoważia as do stwierdzeia, że z formalego puktu widzeia weryfikacja hipotez polega a określeiu a przestrzei próbkowej fukcji, której wartościami jest jedo z dwóch orzeczeń: przyjąć hipotezę zerową lub odrzucić hipotezę zerową Mówiąc bardziej poglądowo weryfikacja hipotezy zerowej polega a: 1 wyborze odpowiediej statystyki U, której rozkład (dokłady lub asymptotyczy) jest zay, ustaleiu zbioru W tych wartości statystyki U, których wystąpieie uważamy za zaprzeczeie hipotezy zerowej Statystykę U azywamy testem hipotezy H przeciw hipotezie alteratywej H 1, a zbiór W zbiorem krytyczym testu W przykładzie 81 statystyką U była statystyka Z, a zbiorem W zbiór ( x1, y1, x, y,, x, y ): z > ε σ
1 Weryfikacja hipotez statystyczych 8 Prawdopodobieństwo ( W H ) P U =, (81) tz prawdopodobieństwo odrzuceia hipotezy zerowej, gdy jest oa prawdziwa, azywamy poziomem istotości testu Wybór liczby jest w zasadzie dość dowoly W praktyce przyjmuje się a ogół jedą z liczb: 5,, 1, 1 Ustalając liczbę ależy przede wszystkim mieć a uwadze kosekwecje praktycze, jakie się z tym wiążą Testy służące do weryfikowaia hipotez parametryczych azywamy testami parametryczymi, testy służące do weryfikowaia hipotez ieparametryczvh - testami ieparametryczymi lub testami zgodości 8 Testy parametrycze W iiejszym rozdziale ograiczymy się do przedstawieia testów do weryfikacji hipotez dotyczących wartości oczekiwaej, wariacji, współczyika korelacji i współczyika regresji 1 W e r y f i k a c j a h i p o t e z y o w a r t o ś c i o c z e k i w a e j p r z y zae z a y m σ Niech cecha X elemetów populacji ma rozkład ormaly N( m,σ ), w którym σ jest Pobrao -elemetową próbkę i zaobserwowao wartości x 1, x,, x Przyjmując poziom istotości chcemy zweryfikować hipotezę H ( m m ) alteratywej H ( m m ) 1 = przeciw hipotezie Wykorzystując fakt, że średia arytmetycza X z iezależych zmieych losowych o rozkładach ormalych ( ) N m,σ ma rozkład ormaly N( m ) jako test przyjmujemy statystykę X Zbiorem krytyczym jest w tym przypadku zbiór,σ,
Weryfikacja hipotez statystyczych 8 13 W = ( x1, x,, x ): x m σ > ε, (8) gdzie ε wyzaczoe jest z rówości P X m σ W H P X m = σ > ε = Zatem hipotezę H odrzucamy, gdy x m > ε σ (83) i przyjmujemy, gdy x m ε σ (84) PRZYKŁAD 8 (Plucińscy, 199) Wiadomo, że dla oporików pochodzących z masowej produkcji odchyleie wartości rezystacji od wartości zamioowej ma rozkład ormaly o zaym odchyleiu stadardowym σ = kω Celem zweryfikowaia hipotezy H ( m = ), tz że wartość oczekiwaa rezystacji jest rówa wartości zamioowej (ie występują systematycze odchyleia) pobrao próbkę o liczości = 9 i otrzymao wyiki w kω k 1 3 4 5 6 7 8 9 x k -18 9-1 45-35 19 7-8 - x k = 9 Przyjmujemy poziom istotości = 5 Z tablic statystyczych rozkładu ormalego odczytujemy, że ε = 196 Zatem
14 Weryfikacja hipotez statystyczych 8 ε σ = 196 3 = 13 Uwzględiając, że x = 1 otrzymujemy x m = 1 = 1 13 Poieważ spełioa jest ierówość (84), więc hipotezę H przyjmujemy a poziomie istotości = 5 W e r y f i k a c j a h i p o t e z y o w a r t o ś c i o c z e k i w a e j w r o z k ł a d z i e o r m a l y m p r z y i e z a y m σ Wiadomo, że cecha X elemetów populacji ma rozkład ormaly N( m,σ ), w którym m i σ są iezae Na podstawie -elemetowej próbki chcemy zweryfikować hipotezę H ( m = m ) przeciw hipotezie alteratywej H ( m m ) 1 Niech poziom istotości będzie Korzystając z twierdzeia o rozkładzie Studeta jako test przyjmiemy t u statystykę t = X m S 1, o której wiemy, że ma rozkład iezależy od σ, a miaowicie, rozkład Studeta o 1 stopiach swobody Zbiorem krytyczym jest zbiór {( 1 ) } W = x, x,, x : t > t, gdzie t jest wartością odczytaą z tablicy rozkładu Studeta spełiającą waruek P( t W H ) P X m = S > t =
Weryfikacja hipotez statystyczych 8 15 Hipotezę H ( m m ) = odrzucamy, gdy i przyjmujemy, gdy s x m > t 1 (85) s x m t (86) 1 PRZYKŁAD 83 (Plucińscy, 199) Niech w warukach przykładu 8 odchyleie 9 1 = = 9 stadardowe σ będzie iezae Po obliczeiu s ( xk x ) i odczytaiu t = 36 z tablicy rozkładu Studeta otrzymujemy k = 1 6 9 s x m = t = 6 = 1 36 138 1 3 8 Poieważ jest spełioa ierówość (86), więc hipotezę H ( m m ) = przyjmujemy Porówując wyiki w przykładach 8 i 83 warto zwrócić uwagę a fakt, że iezajomość σ, a więc posiadaie miejszej ilości iformacji, powoduje ostrożiejsze podejmowaie decyzji o przyjęciu hipotezy zerowej 3 W e r y f i k a c j a h i p o t e z y o w a r i a c j i w r o z k ł a d z i e o r m a l y m Wiemy, że cecha X elemetów populacji ma rozkład ormaly N( m,σ ) o iezaych parametrach m i σ Na podstawie -elemetowej próbki chcemy zweryfikować hipotezę ( σ σ ) H hipoteza H 1 ( σ σ ), tz że wariacja ie przekracza pewej liczby Hipotezą alteratywą jest tu > Przyjmijmy poziom istotości Pamiętajmy, że statystyka S σ ma rozkład chikwadrat o 1 stopiach swobody Wykorzystamy tę statystykę jako test do weryfikacji hipotezy H ( σ σ ) Zbiorem krytyczym będzie tu zbiór
16 Weryfikacja hipotez statystyczych 8 s W = ( x1, x,, x ): > χ σ, gdzie χ jest liczbą odczytaą z tablicy rozkładu chi-kwadrat, spełiającą waruek P S W H P S χ σ = σ > = Hipotezę H o ( σ σ ) odrzucamy, gdy i przyjmujemy, gdy s σ > (87) χ s σ (88) χ PRZYKŁAD 84 (Plucińscy, 199) Błąd pomiaru odległości za pomocą radaru ma rozkład ormaly Przeprowadzoo 1 pomiarów tej samej odległości i otrzymao astępujące wartości błędów (w km): k 1 3 4 5 6 7 8 9 1 x k 115-5 18-6 -1 1-5 75-15 -5 Σx k = 5 Przyjmując poziom istotości = Z daych liczbowych wyika, że x = 5, s dla daych i, odczytujemy χ = 19 679 zweryfikować hipotezę H ( 15) σ = 9435 Z tablicy rozkładu chi-kwadrat
Weryfikacja hipotez statystyczych 8 17 Zatem s 9435 3 448 19 679 σ = 15 = > odrzucić Ozacza to, że spełioa jest ierówość (87) i hipotezę H ( 15) σ ależy 4 W e r y f i k a c j a h i p o t e z y o r ó w o ś c i w a r t o ś c i o c z e k i w a y c h o r o z k ł a d a c h o r m a l y c h z j e d a k o w ą i e z a ą w a r i a c j ą Dae są dwie populacje, w których cecha X ma odpowiedio rozkład ormaly N( m 1,σ ) i ( ) N m,σ, przy czym parametry m, m i σ są iezae Pobrao z obu populacji 1 próbki o liczościach odpowiedio 1 i i otrzymao astępujące wyiki: x 1, x,, x dla próbki z pierwszej populacji i y 1, y,, y dla próbki z drugiej populacji Przyjmując poziom istotości chcemy zweryfikować hipotezę H ( m m ) ( ) H m m 1 1 1 = przeciw hipotezie alteratywej Żada z pozaych dotąd statystyk ie adaje się do weryfikowaia hipotezy H Dlatego wprowadzamy tu ową statystykę określoą wzorem T = + 1 1 X Y 1 ( 1S + S ) 1 1 + (89) Jeśli hipoteza H jest prawdziwa, to statystyka T ma rozkład Studeta o 1 + stopiach swobody Nie trudo to uzasadić, jeżeli tylko (89) zapiszemy w ieco iej postaci, a miaowicie: T = ( X Y ) 1 1 + 1 σ σ + 1 [( 1S σ ) + ( S ) 1 σ ] (81)
18 Weryfikacja hipotez statystyczych 8 Jeżeli hipoteza H jest prawdziwa, to wobec iezależości zmieych losowych X, X,, X, Y, Y,, Y i twierdzeia o rozkładzie chi-kwadrat, tak poday liczik i 1 1 awias kwadratowy w miaowiku wzoru (81) są iezależymi zmieymi losowymi o rozkładach odpowiedio N( 1), i chi-kwadrat o + stopiach swobody, a zatem w 1 myśl defiicji rozkładu Studeta zmiea losowa T ma rozkład Studeta o stopiach swobody + 1 Statystykę T określoą wzorem (89) możemy wykorzystać jako test do weryfikacji hipotezy H ( m m ) = 1 Przyjmijmy poziom istotości Zbiorem krytyczym jest tu zbiór x y 1 W = ( x1, x,, x, y1, y,, y ): > t 1, + S + S 1 1 1 + 1 1 gdzie t jest liczbą odczytaą z tablicy rozkładu Studeta spełiającą waruek ( T W H ) = P( T > t ) P = Hipotezę H o rówości wartości oczekiwaych odrzucamy, gdy + x 1 1 y 1 1S + S + 1 1 > t (811) i przyjmujemy, gdy + x 1 1 y 1 1S + S + 1 1 t (81)
Weryfikacja hipotez statystyczych 8 19 PRZYKŁAD 85 (Plucińscy, 199) Wałek główy samochodowej skrzyki biegów obrabiay jest a obrabiarce automatyczej Rozkład średic wałków jest rozkładem ormalym W celu sprawdzeia, czy poziom astawieia obrabiarki ie zmieia się w czasie pracy, pobrao dwie próbki wałków o liczościach 8 i 1 sztuk, jedą próbkę z produkcji przedpołudiowej, drugą z popołudiowej i otrzymao astępujące dae dla długości średic wałków (w mm): k 1 3 4 5 6 7 8 x k 198 1 199 198 1 198 197 j 1 3 4 5 6 7 8 9 1 y k 199 3 1 198 1 199 198 199 Zakładamy, że zmiaa waruków w ciągu odstępu czasu między pobieraiem próbek może wpłyąć tylko a średi rozmiar, a ie zmieia wariacji Przyjmując poziom istotości = 5, zweryfikować hipotezę o iewystępowaiu zmia poziomu astawieia obrabiarki w czasie Z daych liczbowych zajdujemy x 8 = 19 9, s 8 =, y 1 =, s 1 = 6 Z tablic rozkładu Studeta dla = 5 i 8+1-=16 stopi swobody odczytujemy t = 1 Obliczając wartość statystyki (89) zajdujemy 19 9 8 + 1 ( 16 + 6) 8 1 8 + 1 = 137 < 1 Poieważ spełioa jest ierówość (81) więc przyjmujemy hipotezę o iewystępowaiu zmia poziomu astawieia obrabiarki 5 W e r y f k a c j a h i p o t e z y o w a r t o ś c i o c z e k i w a e j a p o d s t a w i e p r ó b e k o d u ż e j l i c z e b o ś c i
11 Weryfikacja hipotez statystyczych 8 W puktach 1 4 iiejszego rozdziału zakładaliśmy, że zaa jest postać badaej cechy populacji, ie przyjmowaliśmy żadych założeń odośie do liczości próbki Przy tak mocym założeiu, jakim jest zajomość postaci rozkładu, założeie o liczości próbki ie było potrzebe Rozważmy teraz przypadek, gdy postać rozkładu iteresującej as cechy elemetów populacji jest iezaa Aby móc zweryfikować hipotezę o iezaej wartości oczekiwaej cechy X, musimy zać rozkład jakiejś statystyki, która może służyć za test Tylko wtedy bowiem potrafimy zbudować zbiór krytyczy W Nie zając rozkładu cechy X ie potrafimy zaleźć dokładego rozkładu żadej statystyki Nie jest to jedak sytuacja bez wyjścia Skorzystać przecież moża ze zaych twierdzeń graiczych, p z tw Lideberga-Ley ego, które orzeka, że jeżeli jest dostateczie duże, a zmiee losowe X 1, X,, X są iezależe o jedakowym rozkładzie, i istieją E( X 1 ) = m oraz V ( X 1 ) = σ, to zmiea losowa = ( 1 ) X X k = 1 k ma rozkład w przybliżeiu ormaly o parametrach m i σ Korzystając z iego twierdzeia możemy przyjąć, że σ s Uwzględiając powyższe, dochodzimy do wiosku, że chcąc zweryfikować hipotezę ( = ) przeciw hipotezie alteratywej H ( m m ) H m m 1, gdy ie mamy żadych iformacji o postaci rozkładu cechy X w populacji, ależy pobrać dostateczie liczą próbkę (rzędu co ajmiej kilku dziesiątek), a astępie jako test przyjąć statystykę X Zbiorem krytyczym będzie w tym przypadku zbiór x m W = ( x1, x,, x ): > ε s, gdzie ε jest liczbą odczytaą z tablic rozkładu ormalego, spełiającą waruek P X m S > ε =
Weryfikacja hipotez statystyczych 8 111 Hipotezę H ( m m ) = odrzucamy, gdy x m s > ε (813) i przyjmujemy, gdy x m s ε (814) PRZYKŁAD 86 (Plucińscy, 199) Zużycie wody przez zakład przemysłowy podlega losowym wahaiom w kolejych diach Na podstawie obserwacji = 56 di stwierdzoo, że średie dziee zużycie wody wyosi x s = hl, a średie odchyleie kwadratowe 56 1 = 64 hl Przyjmując poziom istotości = 5 zweryfikować hipotezę 56 ( ) H m = 1 hl, tz że średie dziee zużycie wody wyosi 1 hl, przeciw hipotezie alteratywej H ( m hl) 1 1 Z tablicy rozkładu ormalego dla = 5 odczytamy ε = 196 Z daych przykładu wyika, że x s m 56 56 = 1 1 8 56 = 4 > ε = 196 Poieważ spełioa jest ierówość (813), więc hipotezę H odrzucamy
11 Weryfikacja hipotez statystyczych 8 Problemy rozdziału 8 1 Rodzaje testów statystyczych Podstawowe kaoy sztuki statystyczej 3 Przestrzeń parametrów 4 Hipotezy statystycze 5 Zbiór krytyczy testu 6 Poziom istotości testu 7 Waruek odrzuceia hipotezy 8 Waruek przyjęcia hipotezy 9 Weryfikacja hipotezy o wartości oczekiwaej przy zaej wariacji 1 Weryfikacja hipotezy o wartości oczekiwaej przy iezaej wariacji 11 Weryfikacja hipotezy o wariacji w rozkładzie ormalym 1 Weryfikacja hipotezy o rówości wartości oczekiwaych o rozkładach ormalych z jedakową iezaą wariacją 13 Weryfikacja hipotezy o wartości oczekiwaej a podstawie próbek o dużej liczebości