Wykład 1 20.02.2008r. 1. ROZKŁADY PRAWDOPODOBIEŃSTWA 1.1 Rozkład dwumianowy Rozkład dwumianowy, 0 1 Uwaga: 1, rozkład zero jedynkowy. 1 ; 1,2,, Fakt: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym rozkładzie Wtedy: 1.2 Rozkład Poissona Rozkład Poissona 0 ~, 0,1,2,! Fakt: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym rozkładzie Wtedy: ~ 1.3 Rozkład wykładniczy Rozkład wykładniczy exp 0 exp, Fakt: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym rozkładzie wykładniczym exp Wtedy: ~, 1.4 Rozkład normalny Rozkład normalny, ; 0 1 2 exp 1 2 Własności: 1. Jeżeli zmienna losowa ~, to Strona 1
2. Jeżeli jest dystrybuantą zmiennej losowej o rozkładzie, to: gdzie dystrybuanta rozkładu 0,1 3. Jeżeli ~, oraz to ~, 4. Jeżeli,, są niezależnymi zmiennymi losowymi o rozkładach, 1,, odpowiednio oraz zmienna losowa: Wtedy: 0 ~, Przykład 1: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym rozkładzie, Rozważmy zmienną losową: średnia arytmetyczna Mamy: Zatem na podstawie własności 4.: Ponadto niech: Wtedy: Stąd: 1 ~ 1, 1 ~,, 0,1 Definicja: Ciąg zmiennych losowych nazywamy asymptotycznie normalnym, 0, gdy ciąg zmiennych losowych: jest zbieżny według rozkładu do zmiennej losowej o rozkładzie normalnym 0,1 Strona 2
Twierdzenie 1 Centralne tw. graniczne Linderberga Levy ego: Niech,, będzie ciągiem niezależnych zmiennych losowych o jednakowym rozkładzie z wartością oczekiwaną i skończoną dodatnią wariancją. Wtedy ciąg średnich, gdzie jest asymptotycznie normalny, Twierdzenie 2: Niech ciąg zmiennych losowych będzie asymptotycznie normalny, przy czym 0 gdy oraz niech : będzie funkcją różniczkowalną w punkcie i 0 Wtedy ciąg zmiennych losowych jest asymptotycznie normalny, Przykład 2: Niech będzie ciągiem niezależnych zmiennych losowych o rozkładzie Wtedy: ~, Niech w twierdzeniu 2: Mamy: 0 Ponadto: ; Zatem: Stąd: 1 2 0 ~, 1 2, 1 4 1.5 Rozkład chi kwadrat Rozkład chi kwadrat ; 1,2, Definicja: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym rozkładzie 0,1. Mówimy, że ma rozkład chi kwadrat z stopniami swobody. Fakt: Strona 3
1 2, 2 Twierdzenie 3 Fishera: Niech,,, 1 będą niezależnymi zmiennymi losowymi o jednakowym rozkładzie,. Wtedy zmienne losowe: 1 ; 1 1 są niezależne oraz: ~, 1 ~ 1 Wykład 2 27.02.2008r. Lemat: Niech,,,, gdzie,,, są niezależne i mają jednakowe rozkłady,. Ponadto niech:,, przy czym jest macierzą ortogonalną rozmiaru Wtedy,, są niezależne i mają rozkłady,,, 1,2,, Dowód tw. 3: Konstruujemy macierz w następujący sposób: 1 pierwszy wiersz,, 2 pozostałe wyznaczamy tak, aby otrzymać macierz ortogonalną,,,,, Mamy: 1.,, są niezależne 2. 3. Dla 2,, 1 4. Zatem 0 Strona 4
1 STATYSTYKA 2 2 Stąd zmienna losowa Ponadto: Mamy: są niezależne/ ~ 1, 1, 1 ~ 1 0, 1 0,1 2,,, niezależne Czyli: 1 ~ 1 Fakt: Niech zmienna losowa ~ Wtedy 1 2 1,2, gdzie ~ 2 1 Dowód szkic: 1 2 1 1 2 exp 2 1 1 1 2 2!!! 1.6 Rozkład studenta Rozkład studenta 1,2, Definicja: Niech ~0,1 oraz ~ będą niezależnymi zmiennymi losowymi. Mówimy, że zmienna losowa Strona 5
1 ma rozkład Studenta z stopniami swobody. Fakt: 1 2 1 2 Fakt: Niech będzie ciągiem gęstości zmiennych losowych o rozkładzie Wtedy: : lim 1 exp 2 2 Przykład 3: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym rozkładzie, 1 wtedy: oraz ~ 0,1 przykład 1 1 ~ 1 tw. 3 Ponadto zmienne losowe, są niezależne Wtedy: 1 ~ 1 1 Mamy: 1 1 1 1 1 1.7 Rozkład Snedecora Rozkład Snedecora,, 1,2, Definicja: Niech ~ oraz ~ będą niezależnymi zmiennymi losowymi. Mówimy, że zmienna losowa 1 1 Strona 6
ma rozkład Snedecora z, stopniami swobody. Fakt: 2 2 2, Przykład 4: Niech,,,, będą niezależnymi zmiennymi losowymi o rozkładach odpowiednio równych, ;, Wtedy: 1 ~ 1 tw. 3 1 ~ 1 tw. 3 Ponadto zmienna losowa, są niezależne 1 1 ~ 1, 1 1 1 Mamy: 1 1 1 1 1 1 1 1 1 1 2. DANE STATYSTYCZNE. MODEL STATYSTYCZNY Przykład 5: 1 Centrala telefoniczna W 200 losowo wybranych 5 sekundowych odcinkach czasowych, badano liczbę zgłoszeń. otrzymano wynik: 0,5,3,,2. 2 Auto test Przeprowadzono 50 niezależnych eksperymentów polegających na hamowaniu badanego typu samochodu. Zaobserwowano długości drogi hamowania w metrach 18,13; 17,61; ; 18,62 Wykład 3 05.03.2008r. Definicja: Populacja zbiór obiektów Cecha zmienna funkcja określona na obiektach populacji ozn. Strona 7
Rozkład rzeczywisty populacji rozkład wartości tej cechy na elementach populacji. Próba podzbiór populacji złożony z obiektów podlegających badaniu statystycznemu Rozkład empiryczny z próby rozkład wartości cechy na elementach próby. Przykład 5 Cd.: częstość % zgłoszeń 0 16% 1 33,5% 2 24,5% 3 15,5% 4 7,5% 5 3% dyskretna cecha dane długość drogi liczebność hamowania 17,6 17,8 4 17,8 18 5 18 18,2 6 18,2 18,4 8 18,4 18,6 11 18,6 18,8 12 18,8 19 4 ciągła cecha Konstruując model matematyczny eksperymentu statystycznego. Dane,,, traktujemy jako realizację wektora losowego,,, o rozkładzie należącej do pewnej rodziny rozkładu przestrzeń próby ciało podzbiorów zbioru na którym określone są rozkłady w zbiorze Próby proste,, przestrzeń statystyczna częstość wartości cechy w próbie rozkład empiryczny funkcja prawdopodobieństwa rozkładu Poissona rozkład tradycyjny wielobok częstotliwości wartości cechy w próbie rozkład empiryczny gęstość rozkładu normalnego rozkład teoretyczny Strona 8
Budując model zakładamy, że cecha jest zmienną losową o rozkładzie z rodziny jednowymiarowy. Indukuje ona przestrzeń statystyczną w taki sposób, że,, są niezależnymi zmiennymi losowymi o jednakowym rozkładzie.,,,, rozkład populacji : przestrzeń populacji model parametryczny model nieparametryczny Przykład 5: 1 budujemy model Zakładamy ~ 0 Zatem 0,1,2, zbiór potencjalnych wartości 2 0 Model,, Uwaga: przestrzeń parametru 2 długość drogi hamowania Zakładamy, że ~, ; 0 borelowski, :, 0 zatem Model,, przestrzeń statystyczna Uwaga:, parametr przestrzeń parametru Strona 9
STATYSTYKA Niech,, będzie przestrzenią statystyczną Niech,,, będzie próbą z populacji o rozkładzie, gdzie jest parametrem. Wykład 4 12.03.2008r. 3. STATYSTYKI DOSTATECZNE I ZUPEŁNE Niech,,, będzie próba z populacji o rozkładach gdzie jest parametrem. Statystyką nazywamy każdą funkcję mierzalną próby. np. średnia z próby. wariancja z próby Definicja: Statystyka jest dostateczna dla rodziny rozkładów : gdy rozkład warunkowy: nie zależy od parametru Przykład 6: Niech,,, będzie próbą z populacji o rozkładzie, 0 parametr. rozważmy statystykę postaci: Mamy ~ Zatem, 0, 0, 0,,,!! 0, 0,!!!,,!, Strona 10
Stąd rozkład warunkowy nie zależy od, czyli jest dostateczny od parametru. Twierdzenie 4 Kryterium faktoryzacji: Statystyka jest dostateczna dla parametru funkcje prawdopodobieństwa gęstość próby można przestawić w postaci: gdzie funkcja nie zależy od parametru a funkcja zależna od zależy od tylko poprzez wartości statystyki. Przykład 7: Niech,,, będzie próbą z populacji o rozkładzie,,, 0 Wtedy: 1,, 2 exp 1 2 gdzie 2 exp 1 2 2 exp 1 2 2 2 exp 2 1 2 2 1,, ; ; Zatem statystyka dostateczna dla parametru, ma postać:,, Definicja: Statystykę dostateczną nazywamy minimalną statystyka dostateczną jeżeli dla każdej statystyki dostatecznej istnieje funkcja taka, że Definicja: Statystyka jest zupełna dla rodziny rozkładów : dla parametru Θ gdy z warunku : 0 Strona 11
wynika, że: 0 prawie wszędzie Przykład 6 Cd.: Niech: statystyka dostateczna dla parametru.! 0 0,1,2,! 0 0,1,2, 0 Zatem statystyka jest zupełna dla parametru. 0! ę Twierdzenie 5: Jeżeli statystyka jest dostateczna i zupełna dla rodziny rozkładów, to jest minimalną statystyką dostateczną dla rodziny. Definicja: Rodzinę rozkładów prawdopodobieństwa : nazywamy parametrową rodziną wykładniczą jeżeli funkcje prawdopodobieństwa lub gęstość rozkładu można zapisać w postaci: Przykład 8: Zatem: exp,,, 0, 1 2 exp 1 2 1 1 exp 2 2 2 1 2 exp 1 2 2 exp 1 2 2 1 2 ln2, 2 1 2 ln2, 1 2 1 Strona 12
Zatem rodzina rozkładów jest rodziną wykładniczą. Wykład 5 19.03.2008r. Twierdzenie 6 Lemanna: Niech,,, będzie próbą z populacji o rozkładzie z rodziną wykładniczą dla której zbiór,, : zawiera niezdegerowany prostokąt w. Wtedy statystyka,, jest dostateczna i zupełna dla rodziny rozkładów. Przykład 8 Cd.: Rozważmy następujący zbiór:,,, :, 0 1, 2 :, 0 zawiera niezdegenerowany prostokąt w. zatem statystyka:,, jest dostateczna i zupełna dla rodziny rozkładów normalnych. 4. ESTYMACJA PUNKTOWA SZACOWANIE Niech,,, będzie próbą z populacji z rozkładem prawdopodobieństwa o rozkładzie, gdzie jest parametrem. Ponadto niech będzie funkcją parametryczną. Definicja: Statystykę o wartościach w zbiorze skonstruowana w ten sposób, aby jej wartości szacowały prawdziwą wartość funkcji parametrycznej nazywamy estymatorem funkcji parametrycznej. Oznaczamy. Przykład 9: Załóżmy, że badamy cechę o której to cesze zakładamy, że ~, 0. Poszukamy estymatorów funkcji parametrycznej. a) b) 0 Przykładowe estymatory: Strona 13
a) b) Przykład 10: Badamy cechę. Model: ~,,, parametry. Poszukujemy estymatorów funkcji parametrycznej: a),, b),, Przykłady estymatorów: a) b) Definicja: Statystykę nazywamy estymatorem nieobciążonym funkcji par, gdy Przykład 11: Zakładamy, że cecha ma dowolny rozkład Estymujemy prawdopodobieństwo, gdzie jest zbiorem borelowskim. Rozważmy estymator częściowy postaci: #: Mamy #: ~, Zatem 1 #: 1 Czyli estymator jest estymatorem nieobciążonym dla. Uwaga: Niech będzie dystrybuantą rozkładu zmiennej losowej, tzn.. Wtedy dystrybuanta empiryczna #: jest nieobciążonym estymatorem dystrybuanty w punkcie. Przykład 12: Zakładamy, że badana cecha populacji ma rozkład o wartości oczekiwanej. Ponieważ Strona 14
STATYSTYKA 1 1 1 Zatem jest estymatorem nieobciążonym dla. Uwaga: Niech,, będą liczbami takimi, że 1 Wtedy statystyka jest nieobciążonym estymatorem parametru. Mamy Przykład 12 (cd.): Zakładamy dodatkowo, że cecha ma skończoną wariancję oraz, że 1. Wtedy: 1 1 1 1 2 1 1 Ponadto: Zatem: 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 czyli statystyka jest estymatorem nieobciążonym dla. Wykład 6 26.03.2008r. funkcja parametryczna,, próba estymator dla Strona 15
estymator nieobciążony Definicja: Ciąg estymatorów funkcji parametrycznej nazywamy (słabo) zgodnym, gdy ciąg jest zbieżny według prawdopodobieństwa do tzn.: lim 0 Przykład 12 (cd.): Z prawa wielkich liczb Chińczyna wynika, że jest zgodnym estymatorem dla. Ponadto Zastosujemy prawo wielkich liczb Chińczyna do ciągu, Wtedy 1 Zatem Czyli jest zgodnym estymatorem parametru Twierdzenie 7: Niech będzie nieobciążonym estymatorem funkcji parametrycznej, dla której: 0 Wtedy jest zgodnym estymatorem dla. Lemat Nierówność Czybyszewa: Jeżeli jest zmienną losową o wartości oczekiwanej i skończonej wariancji, to prawdziwe jest: Dowód tw. 7: Obieramy dowolne ; 0 Mamy: : Niech: Zatem: : 1 Strona 16
Ponieważ: Zatem: STATYSTYKA 0 0 Czyli jest zgodnym estymatorem dla. 4.1 Estymatory nieobciążone o minimalnej wariancji Niech będzie rodziną estymatorów nieobciążonych posiadających skończoną wariancję dla każdego dla. Statystykę nazywamy estymatorem nieobciążonym o minimalnej wariancji (ENMW) funkcji parametrycznej, gdy: Twierdzenie 8: ENMW funkcji parametrycznej jest wyznaczony jednoznacznie z dokładnością do zbioru miary zero. Lemat 1: Niech będzie ENMW funkcji parametrycznej, statystyką taką, że: : 0. Wtedy : 0 Dowód lematu 1: Niech ; Mamy Zatem U jest estymatorem nieobciążonym dla. 2, Ponieważ jest ENMW dla, to: 2 Stąd 0 Lemat 2: 2 0 4 0 0 0 0 Strona 17
Niech, będą zmiennymi losowymi takimi, że, 1 Wtedy istnieją, liczby 0 i 0 takie, że 1 Ponadto, ; Dowód tw. 8: Niech, będą ENMW dla. Zatem ; Ponadto:, Mamy 0 Czyli dla 0 Zatem (z lematu 1) mamy 0 0 Stąd:,, 1 Zatem (z lematu 2) mamy: Istnieją stałe 0 i takie, że:.. Ponadto:, 1 0 Stąd.. Twierdzenie 9 Rao Blackwella: Niech będzie estymatorem nieobciążonym funkcji parametrycznej, statystyką dostateczną dla parametru. Wtedy: 1. estymator nieobciążony funkcji parametrycznej 2. : Lemat: Jeżeli odpowiednie wartości oczekiwane istnieją, to: 1. 2. Dowód : Mamy, że nie zależy od parametru θ, bo jest statystyką dostateczną. Zatem nie zależy od parametru θ. Strona 18
Wykład 7 02.04.2008r. Twierdzenie 9: Estymator nieobciążony dla statystyka dostateczna dla 1. Estymator nieobciążony dla 2. Stąd: nie zależy od parametru, czyli jest statystyką. Ponadto: czyli jest Estymatorem nieobciążonym dla dodatkowo: Twierdzenie 10 Lehmanna Scheffego: Niech będzie nieobciążonym estymatorem funkcji parametrycznej, statystyką dostateczną i zupełną dla parametru. Wtedy jest Estymatorem nieobciążonym o minimalnej wariancji funkcji parametrycznej. Dowód tw. 10: Niech Mamy Niech będzie dowolnym estymatorem nieobciążonym dla funkcji parametrycznej. Zatem dla każdego Rozważmy statystykę: mamy: Zatem z zupełności statystyki 0 Strona 19
Stąd STATYSTYKA 0.... czyli jest Estymatorem nieobciążonym o minimalnej wariancji funkcji parametrycznej. Przykład 9 (cd.): Niech,, będzie próbą z populacji o rozkładzie, 0 parametr oraz niech. Niech #: Wiemy, że Estymator nieobciążony dla przykład 11 Poznadto statystyka dostateczna i zupełna dla parametru przykład 6 Zatem: 1 1 0 0, 0 1!! 1 1 1 1 1 Twierdzenie 11: Niech będzie statystyką dostateczną i zupełną dla parametru oraz niech będzie Estymatorem nieobciążonym funkcji parametrycznej. Wtedy jest Estymatorem nieobciążonym o minimalnej wariancji funkcji parametrycznej. Lemat: Jeżeli oraz istnieje, to Dowód tw. 11: Z twierdzenia 10 ENMW funkcji parametrycznej Z lematu czyli jest ENMW funkcji parametrycznej. Strona 20
Przykład 10 (cd.): Niech,, 1 będzie próbą z populacji o rozkładzie, ; ; 0 Estymujemy funkcję parametryczną,,, Wiemy, że statystyka jest dostateczna i zupełna dla, Mamy:, Estymator nieobciążony dla parametru Estymator nieobciążony dla parametru Zatem 1 1 1 1 1 1 Zatem i są ENMW dla i odpowiednio. 1 1 1 1 Mówimy, że rodzina rozkładów : na przestrzeni próby spełnia warunki regularności Cramera Rao, gdy dla funkcji prawdopodobieństwa (lub gęstości) rozkładu mamy: Zbiór : 0 nie zależy od parametru. Dla dowolnych i istnieje skończona pochodna ln Jeżeli jest dowolną statystyką taką, że dla dowolnych, to Do końca rozdziału zakładamy, że rodzina : rozkładów prawdopodobieństwa spełnia warunki regularności Cramera Rao. Funkcję ln nazywamy ilością informacji Fishera o parametrze z próby. Wykład 8 09.04.2008r. Własność 1: Dowód: Strona 21
ln STATYSTYKA ln ln ln 2 ln ln ln 2 ln ln ln ln 1 0 Własność 2: Jeżeli dla dowolnych i istnieje skończona pochodna ln oraz to ln Dowód: ln 1 1 1 1 1 1 0 Przykład13: Niech,, będzie próbą z populacji o rozkładzie, gdzie 0 Mamy: Strona 22
Zatem: ; 1,2,! ln ln ln! ln 1 ln 1 Twierdzenie 12 Nierówność Cramera Rao: Niech będzie estymatorem nieobciążonym o skończonej wariancji funkcji parametrycznej oraz niech 0. Wtedy: : oraz równość zachodzi gdy ln Dowód: Lemat Nierówność Cauchy ego Schwarza: Jeżeli odpowiednie wartości oczekiwane istnieją, to,, przy czym równość zachodzi gdy 1, gdzie, ; Dowód tw. 12: Niech ln Zatem ln ln 1 0 0 ln Strona 23
, ln Stąd: czyli: Ponadto: Zatem: ln ln ln 1 ln, gdzie, ln ln Wniosek: Estymator nieobciążony funkcji parametrycznej dla którego jest Estymatorem nieobciążonym o minimalnej wariancji funkcji parametrycznej. Estymatory nieobciążone, dla których spełniona jest powyższa równość nazywamy efektywnymi w sensie Cramera Rao. Przykład 9 (cd.): Niech,, będzie próbą z populacji o rozkładzie, gdzie 0 Ponadto niech Niech Estymator nieobciążony dla przykład 12 Mamy: przykład 13 Strona 24
Stąd: STATYSTYKA czyli jest ENMW (efektywnym w sensie Cramera Rao) parametru. 4.2. Estymatory największej wiarygodności Niech,, będzie próbą z populacji o rozkładzie z rodziny : Ponadto niech rozkłady opisane będą za pomocą funkcji prawdopodobieństwa (lub gęstości). Funkcję określoną wzorem:, nazywamy funkcją wiarygodności. Estymatorem największej wiarygodności parametru (ENW) nazywamy statystykę, której wartość spełnia warunek: :, sup, Uwaga: Dla dowolnego parametru, ENW może istnieć albo być wyznaczony niejednoznacznie. Przyjmujemy, że funkcja parametryczna jest statystyką, gdzie ENW parametru. Zazwyczaj wygodnie jest operować funkcją ln niż funkcją. Przykład 9 (cd.): Mamy ~ 0 Zatem: ; ; 0,1,2,!,!! ln, ln ln! Strona 25
0 ; Zatem ENW dla parametru jest Stąd ENW dla jest jest 0 5. ESTYMACJA PRZEDZIAŁOWA Wykład 9 16.04.2008r. Niech,, będzie próbą z populacji o rozkładzie, gdzie jest parametrem. Ponadto niech będzie funkcją parametryczną. Definicja: Przedział, określony parą statystyk, takich, że 1 dla każdego, nazywamy przedziałem ufności dla na poziomie ufności 1 0 1, gdy: : 1 Przykład14: Niech,, będzie próbą z populacji o rozkładzie z wartością oczekiwaną i skończoną wariancją. Zakładamy, że jest parametrem, a jest znane. Mamy: 1 z nierówności Czebyszewa 1 1 1 Strona 26
STATYSTYKA 1 1 1 1 1 1 1 1 1 1 Zatem 1 100% przedział ufności dla parametru ma postać: ; Konstrukcja przedziałów ufności za pomocą funkcji centralnej. Definicja: Funkcję, nazywamy funkcją centralną dla, gdy rozkład prawdopodobieństwa, jest absolutnie ciągły i nie zależy od parametru., jest funkcją ciągłą i ściśle monotoniczną względem. Konstrukcja: Obieramy funkcję centralną, Wybieramy stałe i tak, aby :, 1 Stałe, można dobrać na wiele sposobów. Zazwyczaj dobieramy je tak, aby 2 Strona 27
Rozwiązujemy nierówność, względem otrzymując przedział,. Przykład 10 (cd.): ~, ;, parametry, ;, a) Dla :, ;, ~ 1 przykład 3, 2, 1 2 1 2 1, 1 2 zatem 1 100% przedział ufności dla : 1, 1, 2 1, 1 2 b) Dla :, 1, ~ 1 tw. 3 Strona 28
, 2 2, 1 2, 2 1 1 1, 1 2 1 2 1, 1 2 Zatem 1 100% przedział ufności dla ma postać Przykład 9 (cd.): ~ 0 parametr ; Dla : 100 1 1, 1, 1 2, 1 2 ~, z centralnego twierdzenia granicznego,, ~0,1 szukamy stałych i : 2 Strona 29
1 2 1 2 1 2 1 2 / bo 0 2 0 2 0 2 4 4 4 4 4 0 2 4 2 4 2 4 1 2 2 4 1 2 Zatem 1 100% przedział ufności dla par 100: Porównajmy i max 1 2, 1 2 1, 1 2 1 2 Fakt: 1 100% przedział ufności dla parametru : Przykład 5 (cd.): liczba zgłoszeń Model: ~ 0 parametr 1 2 2, 2, 1 2 1, 2 1 2 Funkcja parametryczna Estymator punktowy % przedział ufności 1,74 1,59; 1,89 0,17 0,15; 0,20 Strona 30
długość drogi hamowania Model:,, parametry STATYSTYKA Funkcja parametryczna Estymator punktowy % przedział ufności, 18,38 18,28; 18,48, 0,13 0,09; 0,20 6. WERYFIKACJA HIPOTEZ STATYSTYCZNYCH Niech,, będzie próbą z populacji o rozkładzie : gdzie jest parametrem. Hipoteza statystyczna: hipoteza zerowa: : hipoteza alternatywna: : Definicja: Testem statystycznym nazywamy statystykę: : 0,1 określoną następująco: 1, 0, gdzie: 1 oznacza decyzję odrzucamy hipotezę zerową 0 oznacza decyzję nie ma podstaw do odrzucenia Typowa postać obszaru krytycznego : : ść ść Błąd I rodzaju: Odrzucamy, gdy jest ona prawdziwa Błąd II rodzaju: Przyjmujemy, gdy jest ona fałszywa Definicja: Funkcję : 0,1 taką, że nazywamy funkcją mocy testu. Uwaga: Strona 31
STATYSTYKA RYSUNEK!!!. łę 1. łę ę,, Uwaga: Zmniejszenie prawdopodobieństwa błędu I rodzaju powoduje zwiększenie prawdopodobieństwa błędu II rodzaju (i na odwrót). konstrukcja optymalnego (jednostajnie najmocniejszego) testu na poziomie istotności 0 1: 1. Ustalamy poziom istotności i wyznaczamy wszystkie testy, dla których: : 2. Wśród testów spełniających wybieramy ten, dla którego: : max 6.1. Testy jednostajnie najmocniejsze. Zakładamy, że rozkłady : badanych cech są absolutnie ciągłe z funkcją gęstości. Twierdzenie 14 Lemat Neymana Pearsona: Niech : będzie obszarem krytycznym dla testu hipotezy zerowej :, przeciwko hipotezie alternatywnej :, przy czym 0 wyznaczamy z równości: gdzie jest zadanym poziomem istotności. Jeżeli jest dowolnym obszarem krytycznym testu powyższej hipotezy na poziomie istotności, to czyli test z obszarem krytycznym jest najmocniejszy.??? Dowód tw. 14: Mamy: Strona 32
0 Przykład 15: Niech,, będzie próbą z populacji o rozkładzie,, gdzie jest parametrem a jest znane. Weryfikujemy hipotezę : przeciwko hipotezie : Niech : 0 Zatem: 1 2 exp 1 2 2 exp 1 2 stąd: 2 exp 1 2 Strona 33
exp 1 : exp 1 2 2 STATYSTYKA : exp 1 2 : 2 ln : 2 2 2 ln : 2 2 ln : 2 2 ln : 2 ln 2 : Ponadto: Ponieważ: Zatem: 1 1 ~, 1 Stąd: 1 1 : 1 Ponieważ obszar krytyczny nie zależy od wyboru wartości, zatem skonstruowany test jest jednostajnie najmocniejszy przy hipotezie alternatywnej : Uwaga: 1. Równoważna postać obszaru krytycznego: Strona 34
: 1 2. Dla hipotezy alternatywnej : jednostajnie najmocniejszy test ma postać: : 3. Dla hipotezy alternatywnej : jednostajnie najmocniejszy test nie istnieje!! 6.2. Testy ilorazu wiarygodności Niech,, będzie próbą z populacji o rozkładzie z rodziny : Ponadto niech rozkłady z rodziny opisane będą za pomocą funkcji prawdopodobieństwa (lub gęstości). Testujemy hipotezę : przeciwko hipotezie alternatywnej : Definicja: Testem ilorazu wiarygodności nazywamy test z obszarem krytycznym sup, : sup, gdzie jest najmniejszą stałą taką, że :. Uwaga: Jeżeli i są hipotezami prostymi, to test ilorazu wiarygodności pokrywa się z testem lematu Neymana Pearsona, czyli jest najmocniejszy. Wyznaczając test używamy równoważnego obszaru krytycznego postaci: sup, : sup, Supremum funkcji wiarygodności osiągane jest dla, gdzie jest ENW parametru. Przykład16 (Test t Studenta dla jednej próby): Niech,, będzie próbą z populacji o rozkładzie,, gdzie, parametry. Wyznaczamy test ilorazu wiarygodności hipotezy zerowej : przeciwko hipotezie alternatywnej : Mamy:, :, 0,, 2 exp 1 2 Ponadto ENW parametrów, mają postać: Strona 35
Zatem sup, Zatem: Zatem: sup STATYSTYKA 1 przykład 10 4.2,, 2 exp 1 2, :, 0 sup,, sup,, ln,, 2 ln2 2 ln 1 2,, 2 1 2 2 0 1 2 exp : 2 2 exp : 2 2 exp 2 exp 1 2 2 exp 2 1 1 : 1 2 Strona 36
: : 1 : 1 1 : 1 1 1 1 1 : 1 1 : 1 1 1 : ~ 1 przykład 3. 1 1 1 1 2 2 1 1, 1 Zatem: : 1, 1 2 Uwaga: Dla hipotezy alternatywnej : obszar krytyczny ma postać: : 1, 1 Dla hipotezy alternatywnej : obszar krytyczny ma postać: :, 1 Przykład 5b (cd.): Na poziomie istotności 0,05 zweryfikujmy hipotezę głoszącą, że średnia długość hamowania dla samochodu wyposażonego w nowy typ układu hamulcowego jest istotnie krótsza niż w poprzednio stosowanym typie (wynosiła ona wtedy 18,6 [m]). długość drogi hamowania Strona 37
Model: ~, ; µ,σ parametry Formułujemy hipotezy: : 18,6 : 18,6 50 ; 18,38 Wartość statystyki testowej: STATYSTYKA 18,38 18,6 504,32 0,13 Wartość krytyczna:, 1 0,05,49 0,95,49 1,677 Decyzja: Odrzucamy hipotezę. Przykład 17 Test dla wariancji w jednej próbie: Niech,, 1 będzie próbą z populacji o rozkładzie,, gdzie, parametry. Weryfikujemy hipotezę zerową : Statystyka testowa: Rozkład statystyki testowej ~ 1 Obszary krytyczne: 1. : 2. : 3. : : 1 2, 1 lub, 1 2 : 1, 1 :, 1 Wykład 11 26.03.2008r. Przykład 18 (Test t Studenta dla dwóch prób): Niech,, ;,,, 1 będą niezależnymi próbami z populacji o rozkładach, ;, odpowiednio, gdzie,, parametry Weryfikujemy hipotezę zerową: : przeciwko hipotezie alternatywnej : Strona 38