n n X n = σ σ = n n n Ponieważ zmienna losowa standaryzowana ma rozkład normalny N(0, 1), więc

Podobne dokumenty
1. Wnioskowanie statystyczne. Ponadto mianem statystyki określa się także funkcje zmiennych losowych o

Lista 6. Estymacja punktowa

ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA

Estymacja przedziałowa

Zadanie 2 Niech,,, będą niezależnymi zmiennymi losowymi o identycznym rozkładzie,.

X i. X = 1 n. i=1. wartość tej statystyki nazywana jest wartością średnią empiryczną i oznaczamy ją symbolem x, przy czym x = 1. (X i X) 2.

Statystyka i Opracowanie Danych. W7. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

16 Przedziały ufności

Estymacja: Punktowa (ocena, błędy szacunku) Przedziałowa (przedział ufności)

będą niezależnymi zmiennymi losowymi z rozkładu jednostajnego na przedziale ( 0,

Trzeba pokazać, że dla każdego c 0 c Mc 0. ) = oraz det( ) det( ) det( ) jest macierzą idempotentną? Proszę odpowiedzieć w

STATYSTYKA MATEMATYCZNA

θx θ 1, dla 0 < x < 1, 0, poza tym,

Statystyka matematyczna. Wykład II. Estymacja punktowa

Charakterystyki liczbowe zmiennych losowych: wartość oczekiwana i wariancja

Testowanie hipotez. H 1 : µ 15 lub H 1 : µ < 15 lub H 1 : µ > 15

Lista 5. Odp. 1. xf(x)dx = xdx = 1 2 E [X] = 1. Pr(X > 3/4) E [X] 3/4 = 2 3. Zadanie 3. Zmienne losowe X i (i = 1, 2, 3, 4) są niezależne o tym samym

Moda (Mo, D) wartość cechy występującej najczęściej (najliczniej).

PRZEDZIAŁY UFNOŚCI. Niech θ - nieznany parametr rozkładu cechy X. Niech α będzie liczbą z przedziału (0, 1).

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Twierdzenia graniczne:

Parametryczne Testy Istotności

3. Tworzenie próby, błąd przypadkowy (próbkowania) 5. Błąd standardowy średniej arytmetycznej

ZBIEŻNOŚĆ CIĄGU ZMIENNYCH LOSOWYCH. TWIERDZENIA GRANICZNE

KURS STATYSTYKA. Lekcja 3 Parametryczne testy istotności ZADANIE DOMOWE. Strona 1

Estymacja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 7

Wokół testu Studenta 1. Wprowadzenie Rozkłady prawdopodobieństwa występujące w testowaniu hipotez dotyczących rozkładów normalnych

Ćwiczenie 2 ESTYMACJA STATYSTYCZNA

Korelacja i regresja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 12

ANALIZA DANYCH DYSKRETNYCH

Ćwiczenie nr 14. Porównanie doświadczalnego rozkładu liczby zliczeń w zadanym przedziale czasu z rozkładem Poissona

Estymacja parametrów populacji

STATYSTYKA I ANALIZA DANYCH

STATYSTYKA OPISOWA I PROJEKTOWANIE EKSPERYMENTU dr inż Krzysztof Bryś

PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH

Prawdopodobieństwo i statystyka r.

1 Przedziały ufności. ). Obliczamy. gdzie S pochodzi z rozkładu B(n, 1 2. P(2 S n 2) = 1 P(S 2) P(S n 2) = 1 2( 2 n +n2 n +2 n ) = 1 (n 2 +n+2)2 n.

STATYSTKA I ANALIZA DANYCH LAB II

Wykład 5 Przedziały ufności. Przedział ufności, gdy znane jest σ. Opis słowny / 2

WYKŁAD 1. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady

Ćwiczenia rachunkowe TEST ZGODNOŚCI χ 2 PEARSONA ROZKŁAD GAUSSA

ZADANIA NA ĆWICZENIA 3 I 4

Statystyka matematyczna dla leśników

0.1 ROZKŁADY WYBRANYCH STATYSTYK

ZSTA LMO Zadania na ćwiczenia

Estymacja przedziałowa:

Prawdopodobieństwo i statystyka r.

1 Twierdzenia o granicznym przejściu pod znakiem całki

Statystyka opisowa. (n m n m 1 ) h (n m n m 1 ) + (n m n m+1 ) 2 +1), gdy n jest parzyste

Statystyka. Katarzyna Chudy Laskowska

Jarosław Wróblewski Analiza Matematyczna 1, zima 2016/17

Estymatory nieobciążone o minimalnej wariancji

ZMIENNA LOSOWA I JEJ PARAMETRY -powtórzenie

Prawdopodobieństwo i statystyka

Metrologia: miary dokładności. dr inż. Paweł Zalewski Akademia Morska w Szczecinie

L.Kowalski zadania ze statystyki matematycznej-zestaw 3 ZADANIA - ZESTAW 3

PODSTAWY BIOSTATYSTYKI ĆWICZENIA

są niezależnymi zmiennymi losowymi o jednakowym rozkładzie Poissona z wartością oczekiwaną λ równą 10. Obliczyć v = var( X

TESTY LOSOWOŚCI. Badanie losowości próby - test serii.

Podstawowe oznaczenia i wzory stosowane na wykładzie i laboratorium Część I: estymacja

Estymacja przedziałowa - przedziały ufności

Znajdowanie pozostałych pierwiastków liczby zespolonej, gdy znany jest jeden pierwiastek

Modele probabilistyczne zjawisk losowych

z przedziału 0,1. Rozważmy trzy zmienne losowe:..., gdzie X

Komputerowa analiza danych doświadczalnych

3. Regresja liniowa Założenia dotyczące modelu regresji liniowej

Statystyka w rozumieniu tego wykładu to zbiór metod służących pozyskiwaniu, prezentacji, analizie danych.

Zmienna losowa N ma rozkład ujemny dwumianowy z parametrami (, q) = 7,

(X i X) 2. n 1. X m S

I. Ciągi liczbowe. , gdzie a n oznacza n-ty wyraz ciągu (a n ) n N. spełniający warunek. a n+1 a n = r, spełniający warunek a n+1 a n

Rachunek prawdopodobieństwa i statystyka Wnioskowanie statystyczne. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

I. Podzielność liczb całkowitych

oznaczają łączne wartości szkód odpowiednio dla k-tego kontraktu w t-tym roku. O składnikach naszych zmiennych zakładamy, że:

KADD Metoda najmniejszych kwadratów

Wykład 11 ( ). Przedziały ufności dla średniej

O pewnych zastosowaniach rachunku różniczkowego funkcji dwóch zmiennych w ekonomii

O liczbach naturalnych, których suma równa się iloczynowi

MODELE MATEMATYCZNE W UBEZPIECZENIACH. 1. Renty

Rekursja 2. Materiały pomocnicze do wykładu. wykładowca: dr Magdalena Kacprzak

Model ciągły wyceny opcji Blacka Scholesa - Mertona. Wzór Blacka - Scholesa na wycenę opcji europejskiej.

40:5. 40:5 = υ5 5p 40, 40:5 = p 40.

ZDARZENIE ELEMENTARNE to możliwy wynik doświadczenia losowego. Wszystkie takie możliwe wyniki tworzą zbiór zdarzeń elementarnych.

Podstawowe rozkłady zmiennych losowych typu dyskretnego

Analiza wyników symulacji i rzeczywistego pomiaru zmian napięcia ładowanego kondensatora

Statystyka i rachunek prawdopodobieństwa

Obserwacje odstające mają duży wpływ na średnią średnia nie jest odporna.

POLITECHNIKA OPOLSKA

Estymacja punktowa i przedziałowa

I kolokwium z Analizy Matematycznej

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Rachunek prawdopodobieństwa i statystyka W12: Statystyczna analiza danych jakościowych. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.

Komputerowa analiza danych doświadczalnych

0.1 Statystyczne Podstawy Modelu Regresji

Statystyka opisowa. () Statystyka opisowa 24 maja / 8

Miary położenia (tendencji centralnej) to tzw. miary przeciętne charakteryzujące średni lub typowy poziom wartości cechy.

2 n < 2n + 2 n. 2 n = 2. 2 n 2 +3n+2 > 2 0 = 1 = 2. n+2 n 1 n+1 = 2. n+1

Informatyka Stosowana-egzamin z Analizy Matematycznej Każde zadanie należy rozwiązać na oddzielnej, podpisanej kartce!

P = 27, 8 27, 9 27 ). Przechodząc do granicy otrzymamy lim P(Y n > Y n+1 ) = P(Z 1 0 > Z 2 X 2 X 1 = 0)π 0 + P(Z 1 1 > Z 2 X 2 X 1 = 1)π 1 +

Podstawy opracowania wyników pomiarów z elementami analizy niepewności pomiarowych (w zakresie materiału przedstawionego na wykładzie organizacyjnym)

Transkrypt:

5.3. Zagadieia estymacji 87 Rozważmy teraz dokładiej zagadieie szacowaia wartości oczekiwaej m zmieej losowej X o rozkładzie ormalym N(m, F), w którym odchyleie stadardowe F jest zae. Niech X, X,..., X ozacza próbkę dla zmieej losowej X oraz iech średia z próbki, tj. będzie estymatorem wartości oczekiwaej m. Zmiea X jest zmieą losową o rozkładzie ormalym Nm,. W twierdzeiu 5. udowodiliśmy bowiem, że E( X ) E( X) m, a poadto mamy czyli DX ( ). X Niech g ozacza ustaloą liczbę dodatią i obliczmy prawdopodobieństwo tego, że różica pomiędzy aszym oszacowaiem i szacowaą wartością m będzie większa od g. Mamy X X+ X + K + X D X D X X X D ( ) ( + + K + ) ( X + X + K + X ) ( D ( X) + D ( X) + K + D ( X )), P( X m ) P X m > ε X m Poieważ zmiea losowa stadaryzowaa ma rozkład ormaly N(0, ), więc P X m ε X m > ε X m P ε ε ε ε Φ Φ ε + ε ε Φ Φ Φ, gdzie Φ( x) ozacza wartość dystrybuaty rozkładu ormalego N(0, ) w pukcie x. Z powyższego wzoru wyika, że prawdopodobieństwo popełieia błędu ustaloej wielkości, którą ozaczyliśmy przez g, jest malejącą fukcją liczebości próbki, tj. wielkości i rosącą fukcją odchyleia stadardowego F. >, ε.

88 V. Elemety statystyki matematyczej W aukach eksperymetalych przyjęto błąd metody pomiarowej charakteryzować za pomocą odchyleia stadardowego F i z dwóch ieobciążoych metod pomiarowych za dokładiejszą uważać tę, dla której odchyleie stadardowe F jest miejsze. Przykład 5.3. Za pomocą pewej metody wykoao pomiary przyspieszeia ziemskiego g. Otrzymao astępujące wyiki (w m/s ): 9,806633, 9,80668, 9,806673, 9,806665 i 9,806646. Oszacowaiem stałej g jest średia z tych pomiarów, która jest rówa 9,806660. Zakładając, że błąd pomiaru jest zmieą losową o rozkładzie ormalym N(0, 0,0000), tz. że metoda jest ieobciążoa, a jej dokładość charakteryzuje się odchyleiem stadardowym F 0,0000, obliczymy prawdopodobieństwo, że błąd oszacowaia otrzymay przez uśredieie pięciu wyików pomiarów przekroczy 0,0000 m/s. Ozaczając przez X 5 średią z pomiarów, a przez g szacowaą wartość przyspieszeia ziemskiego, z podaego wzoru mamy (, ) P X5 g > 0 0000 0 0000, Φ 0, 0000 5 ( Φ(, 095)) 0, 736. Często stawiamy pytaie: ile ależy wykoać pomiarów, aby oszacowaie iteresującej as wielkości za pomocą średiej z wyików tych pomiarów z prawdopodobieństwem co ajwyżej rówym p miało błąd ie większy iż g. Należy zatem wyzaczyć wartość tak, by ( ) P X m ε p. Na podstawie poprzediego wzoru ozacza to, że wartość powia spełiać waruek Φ ε p. Przykład 5.4. Przy założeiach z poprzediego przykładu obliczmy, ile ależy wykoać pomiarów przyspieszeia ziemskiego metodą, w której odchyleie stadardowe F jest rówe 0,0000 m/s, aby błąd wykoaego oszacowaia z prawdopodobieństwem co ajmiej 0,99 ie przekroczył g 0,0000 m/s. Na podstawie podaego wzoru mamy 0 0000 00 Φ,,. 0, 0000 Stąd Φ 0 995,. Korzystając z tablic rozkładu N(0, ) rozwiązujemy względem x rówaie Φ( x ) 0, 995 i otrzymujemy x.,576. Poieważ fukcja M jest rosąca, więc

5.3. Zagadieia estymacji 89 czyli $ 7. 576,, Wiemy, że jeśli zmiea losowa X ma rozkład ormaly N(m, F), to średia X, X,..., X jest zmieą losową o rozkładzie ormalym X z próbki Nm,, a zmiea losowa po- X staci m ma rozkład N(0, ). Jeśli mamy ustaloą liczbę z przedziału (0, ), to moża wyzaczyć taką liczbę t, by P X m t. Poieważ P X m X m t P t t Φ( t ) Φ( t ) Φ( t ) ( Φ( t )) Φ( t ), więc liczbę t otrzymuje się przez rozwiązaie rówaia Φ( t ). Wybierając dostateczie dużą wartość możemy być prawie pewi, że zdarzeie X m t astąpi, czyli, że szacowaa wartość oczekiwaa m zmieej losowej X będzie zajdowała się w przedziale X t X t, +. Przedział te azywa się przedziałem ufości dla parametru m, a liczbę poziomem ufości. W praktyce przyjmuje się zwykle 0,95 lub 0,99. Przykład 5.5. Wyzaczyć przedział ufości dla 0,95 i daych z przykładu 5.3. W przykładzie tym dla próbki o liczebości 5 otrzymaliśmy średią X 5 0, 80666. Odchyleie stadardowe metody pomiarowej było rówe F 0,0000. Po podstawieiu do powyższego wzoru otrzymujemy przedział ufości [9,80664; 9,806678] z poziomem ufości 0,95. Dotychczas zakładaliśmy, że odchyleie stadardowe F w odpowiedich rozkładach prawdopodobieństwa jest zae. W praktyce tak ie jest i powstają astępujące pytaia:

90 V. Elemety statystyki matematyczej! jak ależy szacować wartość oczekiwaą i jak obliczać dla iej przedział ufości, gdy z powodu braku zajomości parametru F ie moża określić przedziału ufości,! jak oszacować parametr F a podstawie próbki? Niech zmiea losowa X ma pewie rozkład z iezaą wariacją F. Niech zmiee X, X,..., X staowią próbkę dla tej zmieej, a iech ozacza średią z tej próbki. Wyrażeie będziemy azywać wariacją z próbki. X Twierdzeie 5.4. Wariacja z próbki jest ieobciążoym i zgodym estymatorem wariacji zmieej losowej X, o ile ta ostatia istieje. Dowód. Rozważmy zmieą losową U ( X X ). Dla zmieej losowej U mamy U i i Poieważ zmiee X, X,..., X są próbką, więc dla każdej wartości j,,..., mamy Z kolei z iezależości zmieych losowych X, X,..., X wyika, że Otrzymujemy zatem S Xi X ( ) i X X j X m X m ( ) j ( j ) j X m ( ) X m ( j ) j X m + X j m X m X j m ( ) ( ) ( )( ) j k k j j + ( X j m)( Xk m). Stąd EU ( ) E ( X m) + ( ) ( ) E( X j m ) j j ( j ) E( X j m Xk m ) E ( X m)( X m) ( )( ). + j j k k j ( j ) E ( X m). ( j k ) E ( X m)( X m) 0dla j k. EU ( ) +. j

5.3. Zagadieia estymacji 9 Taki sam wzór otrzymamy dla zmieych U, U 3,..., U, czyli Stąd czyli estymator jest ieobciążoy. Dowód zgodości estymatora jest trudiejszy, bo zmiee losowe U i ie są iezależe (pomijamy go). # S EU ( i ) dla i,, K,. ES ( ) EU ( i), i i Przykład 5.6. Dla daych z poprzedich przykładów, które dotyczyły przyciągaia ziemskiego ze średią z próbki rówą 9,80666, oszacowaiem wariacji jest S 5 [( 9, 806633 9, 806660) + ( 9, 80668 9, 806660) 4 + ( 9, 806673 9, 806660) + ((, 806665 9, 806660) 0 + ( 9, 806646 9, 806660) ] 4 0. S W celu kostrukcji przedziału ufości dla wariacji F zmieej losowej X o rozkładzie ormalym N(m, F) ależy zać rozkład estymatora tej wariacji. S Twierdzeie 5.5. Niech zmiea losowa X ma rozkład ormaly N(m, F) i iech X, X,..., X ozacza -elemetową próbkę dla tej zmieej, a S wariację z próbki. Wówczas zmiea losowa V ma rozkład o dystrybuacie F ( v) ( ) S 0 dla v < 0, v x c x exp dx dla v 0, 0 gdzie c! ozacza stałą. Dowód pomijamy. # Defiicja 5.4. Rozkład o dystrybuacie G k ( v) 0 dla v < 0, v k x ck x exp dx dla v 0, 0 tz. rozkład o gęstości prawdopodobieństwa

9 V. Elemety statystyki matematyczej 0 dla v < 0, k gk ( v) v cv k exp dla v 0, gdzie c k ozacza stałą azywa się rozkładem chi-kwadrat i jest ozaczay przez P. Rozkład te zależy od parametru k, który azywa się liczbą stopi swobody. Gęstość rozkładu chi-kwadrat dla różych wartości parametru k przedstawioo a poiższym rysuku. Przy rozkładzie chi-kwadrat korzysta się zazwyczaj z tablic. Na ogół tablice te podają wartości v, które są rozwiązaiami rówaia Gk () v α dla różych liczb " oraz k. Na podstawie powyższej defiicji twierdzeie 5.5 moża wypowiedzieć astępująco: przy przyjętych założeiach zmiea losowa V ( ) S ma rozkład chi-kwadrat z! stop- iami swobody. W celu wyzaczeia przedziału ufości dla wariacji ustalmy poziom ufości. Poieważ zamy rozkład zmieej losowej V, więc potrafimy wyzaczyć dwie liczby v i v, by Pv ( ) S v. Ale ierówości są rówoważe ierówościom ( ) S v v, v ( ) S v

5.3. Zagadieia estymacji 93 czyli ( ) S ( ) S v v. Zatem przedział ( ) S, ( ) S v v jest przedziałem ufości dla wariacji F a poziomie ufości. Stąd przedziałem ufości dla odchyleia stadardowego F jest S S,. v v Jeżeli w zmieej losowej tego odchyleia, tj. X m zastąpimy odchyleie stadardowe F oszacowaiem i i S ( X X ), to otrzymamy ową zmieą losową X m T, S dla której mamy Twierdzeie 5.6. Niech zmiea losowa X ma rozkład ormaly N(m, F), X, X,..., X ozacza -elemetową próbkę dla tej zmieej, a X i S średią i wariację z tej próbki. Wówczas zmiea losowa T! ma rozkład o dystrybuacie dx H () t c, t x + gdzie c! ozacza pewą stałą. Dowód pomijamy. # Defiicja 5.5. Rozkład z dystrybuatą H () t c t dx + + x

94 V. Elemety statystyki matematyczej gdzie c ozacza stałą, azywamy rozkładem t-studeta. Liczba jest parametrem tego rozkładu i azywa się liczbą stopi swobody. Gęstość rozkładu t-studeta jest przedstawioa a poiższym rysuku. Korzystając z defiicji 5.5 twierdzeie 5.6 moża sformułować astępująco: przy przyjętych założeiach zmiea losowa T! ma rozkład t-studeta z! stopiami swobody. Teoria przedziałów ufości dotycząca zmieej losowej T! jest idetycza z teorią przedziałów ufości związaych ze zmieą losową m o rozkładzie ormalym N(0, ). Jedya X różica polega a posługiwaiu się iymi tablicami. W przypadku rozkładu t-studeta posługujemy się tablicami będącymi rozwiązaiami rówaia dla wybraych wartości " oraz. Zadaia H () t α. Błąd wskazaia wysokościomierza w samolocie jest zmieą losową o rozkładzie ormalym z wartością oczekiwaą m 0 i z odchyleiem stadardowym F 5 m.. Jakie jest prawdopodobieństwo, że błąd ocey wysokości będzie większy iż 30 m.? Ile ależy mieć takich wysokościomierzy w samolocie, żeby błąd ocey wysokości za pomocą średiej ich wskazań z prawdopodobieństwem 0,99 ie przekraczał 30 m?. Zbadao czas świeceia się czterech żarówek wylosowaych z partii żarówek wyprodukowaych w pewym zakładzie. Otrzymao astępujące wyiki (w godziach): 40, 300, 50 i 0. Zakładając, że czas świeceia się żarówki jest zmieą losową o rozkładzie ormalym z odchyleiem stadardowym rówym 70 godzi, wyzaczyć jedostroy przedział ufości a poziomie ufości 0,90. 3. Z dużej partii słupków betoowych wybrao próbkę losową o liczości 50 sztuk. Średia wytrzymałość a ściskaie osiowe obliczoa w tej próbce wyiosła 48,3 kg/cm. Oszacować średią wytrzymałość słupków. Zakładając, że cecha ma rozkład ormaly oszacować wartość oczekiwaą tej zmieej za pomocą przedziału ufości a poziomie 0,99.

5.4. Weryfikacja hipotez statystyczych 95 4. Jaki będzie przedział ufości dla daych z poprzediego zadaia, gdy poziom ufości zmiejszymy do 0,95? 5. W celu wyzaczeia błędu stadardowego pewego przyrządu pomiarowego (odchyleia stadardowego tego przyrządu) dokoao pięciu pomiarów pewej wielkości i otrzymao astępujące wyiki: 8,5; 8,0; 8,04; 8,4 i 8,. Oszacować wariację wskazań przyrządu i obliczyć przedział ufości dla odchyleia stadardowego tego przyrządu przy poziomie ufości 0,90. 6. Celem sprawdzeia dokładości wskazań pewego przyrządu pomiarowego dokoao 0 pomiarów tej samej wielkości fizyczej i otrzymao astępujące wyiki: 9,0; 9,00; 9,0; 8,99; 8,98; 9,00; 9,00; 9,0; 8,99; i 9,00. Oszacować wariację wskazań przyrządu i podać przedział ufości dla jego błędu (odchyleia stadardowego) a poziomie ufości rówym 0,99 zakładając, że wskazaia tego przyrządu mają rozkład ormaly. 7. Za pomocą pięciu iezależych pomiarów szacowao średicę kątową plaety Neptu i otrzymao astępujące wyiki (w sekudach łuku):,3;,5;,,8;,30 i,7. Zakładając, że wyiki pomiarów są błędem losowym o rozkładzie ormalym oszacować średicę kątową Neptua i podać przedział ufości dla tej średicy a poziomie ufości 0,90. Jak zmiei się oszacowaie i przedział ufości, gdy obserwacje uzupełimy owym wyikiem pomiaru rówym,30? 5.4. Weryfikacja hipotez statystyczych Niech będzie daa pewa zmiea losowa X, której rozkład albo pewe jego parametry ie są zae. Odośie tego rozkładu lub tych parametrów formułujemy pewe przypuszczeie. Każde takie przypuszczeie będziemy azywać hipotezą statystyczą i ozaczać przez H. W celu weryfikacji hipotezy H obserwujemy próbkę X, X,..., X i defiiujemy pewą fukcję * a tej próbce. Niech S ozacza zbiór wszystkich wartości tej fukcji. Ustalamy pewą małą liczbę " i kostruujemy taki podzbiór S k zbioru S, aby prawdopodobieństwo zdarzeia polegającego a tym, że * 0 S k, gdy hipoteza H jest prawdziwa, było ie większe od ". Jeżeli w wyiku próby zaobserwujemy taką wartość *, która ależy do zbioru S k, to weryfikowaą hipotezę H odrzucamy jako ieprawdziwą, a w przeciwym przypadku stwierdzamy, że wyik doświadczeia ie przeczy tej hipotezie. Liczbę " azywamy poziomem istotości testu, zbiór S k zbiorem krytyczym testu, a opisae postępowaie testem hipotezy H. Przykład 5.7. Wykoao owy przyrząd do mierzeia wysokości drzew. Wiadomo, że błąd pomiaru tym przyrządem jest zmieą losową o rozkładzie ormalym z odchyleiem stadardowym 0, m. W celu sprawdzeia, czy pomiary przyrządem ie są obarczoe błędem systematyczym (tz. czy błąd pomiaru ma wartość oczekiwaą rówą 0) wykoao pięć pomiarów wzorcowego drzewa o zaej wysokości m i otrzymao astępujące wyiki:,3;,90;,93;,0 i,9. Średia tych wyików jest rówa X 5, 07, a więc błąd oszacowaia wysokości wyosi 0,07 m.

96 V. Elemety statystyki matematyczej Czy wyik te upoważia as do stwierdzeia, że przyrząd wykazuje pewie błąd systematyczy, czy też zaobserwowae odchyleie od zaej wartości m moża usprawiedliwić losowymi wahaiami przyrządu? Stawiamy hipotezę: przyrząd ie jest obciążoy błędem systematyczym. Naszymi daymi są:! zmiea losowa X o rozkładzie N(m, 0,), gdzie wartość oczekiwaa m jest iezaa, a hipoteza mówi, że m, czyli H: m,! próbka o liczebości 5,! fukcja *, za którą przyjmujemy X. Wyzaczamy graicę, od której począwszy będziemy uważali obserwację X za sprzeczą z hipotezą, że rozpatrywaa zmiea losowa ma rozkład N(, 0,). Jako graicę weźmiemy taką liczbę 8, aby prawdopodobieństwo tego, że zaobserwujemy różicę X m większą iż 8 było małe, p. " 0,05 (jest to przyjęty poziom istotości testu). Zbiorem krytyczym jest zbiór przy czym w aszym przypadku δ X 5. Mamy ( λ) Zmiea losowa U X m ma rozkład ormaly N(0, ). Z tablic wyza czamy liczbę tak, by u α Ω k { δ: δ > λ}, P X m P X > m λ >. P( U > uα ) α 005,. W tym celu wykoujemy kolejo astępujące przekształceia: P( U > uα) P( U uα) P( uα U uα) ( Φ( uα) Φ( uα) ) Φ( uα). Stąd wyika, że Φ( u α ) 005,, a więc Φ( u α ) 0975, i z tablic odczytujemy, że uα u005, 96,. Mamy zatem P X m > 96, 005, λ czyli skąd wyika, że i poieważ F 0, oraz 5, 96,, λ 96, więc mamy 8. 0,088. Zatem jeśli X 5 > 0, 088, to ależy uzać, że przy- rząd wykazuje błąd systematyczy. Poieważ dla 5 mamy X 5, 07, więc X 5 0, 07, co ie pozwala a dyskwalifikację przyrządu jako obarczoe- go błędem systematyczym (zaobserwoway wyik ie jest elemetem zbioru krytyczego). Brak zatem podstaw do zakwestioowaia hipotezy.

5.4. Weryfikacja hipotez statystyczych 97 Powstają dwa problemy:! skoro wartość " jest prawdopodobieństwem popełieia błędu, to dlaczego ie wybrao miejszej liczby ",! jak ależy kostruować zbiór krytyczy w ogólości? Odpowiedź daje tzw. fukcja mocy testu (zwaa też krótko mocą testu). Niech hipoteza dotyczy pewego parametru h (w przykładzie parametrem tym była wartość oczekiwaa m). Ozaczmy przez * 0 S k h zdarzeie polegające a tym, że odrzucimy weryfikowaą hipotezę, gdy iteresujący as parametr ma wartość h (w podaym przykładzie: gdy wartość oczekiwaa wskazań testowaego przyrządu pomiarowego jest rówa m.). Defiicja 5.6. Prawdopodobieństwo zdarzeia * 0 S k h rozpatrywae jako fukcja parametru h ozaczamy i azywamy mocą testu. M( ϑ) P( δ Ωk ϑ) Liczbę " oraz zbiór krytyczy testu wybiera się tak, żeby moc testu spełiała pewe rozsąde wymagaia. Co to zaczy wyjaśimy a przykładzie. Przykład 5.8. W poprzedim przykładzie przyjęliśmy za zbiór krytyczy zbiór Ω k { X5: X5 > 0, 088 m}. Zatem fukcją mocy tego testu jest ( 5 0 088 ) Mm ( ) P X >, m, czyli prawdopodobieństwo zdarzeia X 5 > 0, 088, gdy rozkład zmieej losowej jest ormaly N(m, 0,). Wyzaczając to prawdopodobieństwo otrzymamy, 9 m, 088 m Mm ( ) Φ 5 + Φ 5. 0, 0, Wykres tej fukcji jest przedstawioy a poiższym rysuku.

98 V. Elemety statystyki matematyczej Z wykresu widać, że jeśli m, czyli gdy weryfikowaa hipoteza jest prawdziwa, prawdopodobieństwo jej odrzuceia jest ajmiejsze i rośie wraz ze wzrostem obciążeia przyrządu (gdy m > lub m < ). W praktyce ajczęściej są stosowae testy wymieioe poiżej.. Jedostroy test hipotezy o wartości oczekiwaej w rozkładzie ormalym przy zaej wariacji, czyli H: m m 0 przy hipotezach alteratywych K: m > m 0 (lub K: m < m 0 ). Daymi w tym teście są: " poziom istotości testu, F odchyleie stadardowe (otrzymae ze zaej wariacji), liczebość próbki. Hipotezę dyskwalifikuje się, gdy X > λ, gdzie wartość 8 jest ustaloa z waruku Moc testu określa wzór. Dwustroy test hipotezy o wartości oczekiwaej w rozkładzie ormalym przy zaej wariacji, czyli H: m m 0 przy hipotezach alteratywych K: m m 0. Daymi są te same wielkości, co poprzedio. Hipotezę odrzucamy, gdy X m0 > λ, gdzie wartość 8 wyzacza się z waruku Moc testu jest daa wzorem Φ λ m0 α. m Mm ( ) Φ λ. Φ λ α. m m m m Mm ( ) 0 λ 0 + λ Φ + Φ. 3. Jedostroy test hipotezy o wartości oczekiwaej w rozkładzie ormalym przy iezaej wariacji, czyli H: m m 0 przy hipotezach alteratywych K: m > m 0 (lub K: m < m 0 ). Daymi w tym teście są: " poziom istotości testu, liczebość próbki.

5.4. Weryfikacja hipotez statystyczych 99 X Hipotezę odrzucamy, gdy m 0 > gdzie ozacza wariację z próbki, a war- S λ, S tość 8 wyzacza się z waruku Fukcja H ( x) jest dystrybuatą rozkładu t-studeta z! stopiami swobody. W celu wyzaczeia mocy testu trzeba rozważyć pewie owy rozkład, bo gdy m m 0, to zmiea X losowa m 0 ie ma rozkładu t-studeta (pomijamy to zagadieie). S 4. Dwustroy test hipotezy o wartości oczekiwaej w rozkładzie ormalym przy iezaej wariacji, czyli H: m m 0 przy hipotezach alteratywych K: m m 0. Daymi są te same wielkości, co poprzedio. X m0 Hipotezę odrzucamy, gdy > λ, gdzie S ozacza wariację z próbki, a war- S tość 8 wyzacza się z waruku H ( λ) α. α H ( λ). Odośie mocy testu obowiązuje poprzedia uwaga. 5. Jedostroy test hipotezy o parametrze p zmieej losowej X dwupuktowej (o rozkładzie zero-jedykowym), tj. zmieej dla której P(X ) p, P(X 0)! p. Hipoteza ma postać H: p p 0 przy hipotezach alteratywych K: p > p 0 (lub K: p < p 0 ). Hipotezę weryfikuje się a podstawie próbki X, X,..., X. Suma S tych zmieych ma rozkład Beroulliego, tj. PS k k p k p k ( ) ( ), przy czym dla dużej liczebości próbki (dużych wartości ) i małych wartości p stosuje się przybliżeie za pomocą rozkładu Poissoa, tz. ( p) PS ( k) exp( p). k! W praktyce przybliżeie to stosuje się, gdy p # 0, oraz p(! p) # 9. Gdy p(! p) > 9, to zwykle rozkład dwumiaowy przybliża się za pomocą rozkładu ormalego (możliwość taka wyika z cetralego twierdzeia graiczego zob. astępy rozdział): k Pa < S p p( p) < b Φ() b Φ(). a

00 V. Elemety statystyki matematyczej Weryfikowaą hipotezę H odrzuca się, gdy S > 8, gdzie wartość 8 jest ajmiejszą liczbą ustaloą z zależości PS ( > λ, gdy p p0 ) α. Zauważmy, że rówość w powyższej ierówość może ie być spełioa dla żadej wartości 8, gdyż zmiea losowa S przyjmuje tylko ieujeme wartości całkowite. Moc testu określa astępujący wzór: M( p) P( S > λ p), przy czym za rozkład w ostatich dwóch wzorach przyjmuje się (w zależości od okoliczości) jede z wymieioych rozkładów, tz. Beroulliego, Poissoa lub ormaly.