STATYSTYKA

Podobne dokumenty
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Własności statystyczne regresji liniowej. Wykład 4

Spis treści 3 SPIS TREŚCI

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Prawdopodobieństwo i statystyka

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Rozkłady statystyk z próby

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Weryfikacja hipotez statystycznych

Statystyka Matematyczna Anna Janicka

Testowanie hipotez statystycznych.

Kolokwium ze statystyki matematycznej

Metody probabilistyczne

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Definicja 1 Statystyką nazywamy (mierzalną) funkcję obserwowalnego wektora losowego

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Instytut Matematyczny Uniwersytet Wrocławski. Zakres egzaminu magisterskiego. Wybrane rozdziały anazlizy i topologii 1 i 2

166 Wstęp do statystyki matematycznej

Wnioskowanie statystyczne. Statystyka w 5

Stanisław Cichocki Natalia Nehrebecka. Wykład 7

Na A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

Statystyka Matematyczna Anna Janicka

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych

Statystyka i eksploracja danych

Statystyka matematyczna dla leśników

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Wykład 3 Hipotezy statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Weryfikacja hipotez statystycznych

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

Wydział Matematyki. Testy zgodności. Wykład 03

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).

Testowanie hipotez statystycznych

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Testowanie hipotez statystycznych

Wykład 6 Estymatory efektywne. Własności asymptotyczne estym. estymatorów

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak

Testowanie hipotez statystycznych.

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Wykład 10 Testy jednorodności rozkładów

W4 Eksperyment niezawodnościowy

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

SPIS TEŚCI CZĘŚĆ I RACHUNEK PRAWDOPODOBIEŃSTWA

Estymacja punktowa i przedziałowa

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

PODSTAWOWE ROZKŁADY PRAWDOPODOBIEŃSTWA. Piotr Wiącek

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

2.1 Przykład wstępny Określenie i konstrukcja Model dwupunktowy Model gaussowski... 7

WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Prawa wielkich liczb, centralne twierdzenia graniczne

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

Wykład Ćwiczenia Laboratorium Projekt Seminarium Liczba godzin zajęć

Testowanie hipotez cz. I

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Statystyka matematyczna. Wykład VI. Zesty zgodności

1 Estymacja przedziałowa

Statystyka matematyczna i ekonometria

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 4 - zagadnienie estymacji, metody wyznaczania estymatorów

Wykład 12 Testowanie hipotez dla współczynnika korelacji

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Testowanie hipotez statystycznych cd.

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Ważne rozkłady i twierdzenia c.d.

Hipotezy statystyczne

Prawdopodobieństwo i statystyka

Prawdopodobieństwo i statystyka r.

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

Transkrypt:

Wykład 1 20.02.2008r. 1. ROZKŁADY PRAWDOPODOBIEŃSTWA 1.1 Rozkład dwumianowy Rozkład dwumianowy, 0 1 Uwaga: 1, rozkład zero jedynkowy. 1 ; 1,2,, Fakt: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym rozkładzie Wtedy: 1.2 Rozkład Poissona Rozkład Poissona 0 ~, 0,1,2,! Fakt: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym rozkładzie Wtedy: ~ 1.3 Rozkład wykładniczy Rozkład wykładniczy exp 0 exp, Fakt: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym rozkładzie wykładniczym exp Wtedy: ~, 1.4 Rozkład normalny Rozkład normalny, ; 0 1 2 exp 1 2 Własności: 1. Jeżeli zmienna losowa ~, to Strona 1

2. Jeżeli jest dystrybuantą zmiennej losowej o rozkładzie, to: gdzie dystrybuanta rozkładu 0,1 3. Jeżeli ~, oraz to ~, 4. Jeżeli,, są niezależnymi zmiennymi losowymi o rozkładach, 1,, odpowiednio oraz zmienna losowa: Wtedy: 0 ~, Przykład 1: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym rozkładzie, Rozważmy zmienną losową: średnia arytmetyczna Mamy: Zatem na podstawie własności 4.: Ponadto niech: Wtedy: Stąd: 1 ~ 1, 1 ~,, 0,1 Definicja: Ciąg zmiennych losowych nazywamy asymptotycznie normalnym, 0, gdy ciąg zmiennych losowych: jest zbieżny według rozkładu do zmiennej losowej o rozkładzie normalnym 0,1 Strona 2

Twierdzenie 1 Centralne tw. graniczne Linderberga Levy ego: Niech,, będzie ciągiem niezależnych zmiennych losowych o jednakowym rozkładzie z wartością oczekiwaną i skończoną dodatnią wariancją. Wtedy ciąg średnich, gdzie jest asymptotycznie normalny, Twierdzenie 2: Niech ciąg zmiennych losowych będzie asymptotycznie normalny, przy czym 0 gdy oraz niech : będzie funkcją różniczkowalną w punkcie i 0 Wtedy ciąg zmiennych losowych jest asymptotycznie normalny, Przykład 2: Niech będzie ciągiem niezależnych zmiennych losowych o rozkładzie Wtedy: ~, Niech w twierdzeniu 2: Mamy: 0 Ponadto: ; Zatem: Stąd: 1 2 0 ~, 1 2, 1 4 1.5 Rozkład chi kwadrat Rozkład chi kwadrat ; 1,2, Definicja: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym rozkładzie 0,1. Mówimy, że ma rozkład chi kwadrat z stopniami swobody. Fakt: Strona 3

1 2, 2 Twierdzenie 3 Fishera: Niech,,, 1 będą niezależnymi zmiennymi losowymi o jednakowym rozkładzie,. Wtedy zmienne losowe: 1 ; 1 1 są niezależne oraz: ~, 1 ~ 1 Wykład 2 27.02.2008r. Lemat: Niech,,,, gdzie,,, są niezależne i mają jednakowe rozkłady,. Ponadto niech:,, przy czym jest macierzą ortogonalną rozmiaru Wtedy,, są niezależne i mają rozkłady,,, 1,2,, Dowód tw. 3: Konstruujemy macierz w następujący sposób: 1 pierwszy wiersz,, 2 pozostałe wyznaczamy tak, aby otrzymać macierz ortogonalną,,,,, Mamy: 1.,, są niezależne 2. 3. Dla 2,, 1 4. Zatem 0 Strona 4

1 STATYSTYKA 2 2 Stąd zmienna losowa Ponadto: Mamy: są niezależne/ ~ 1, 1, 1 ~ 1 0, 1 0,1 2,,, niezależne Czyli: 1 ~ 1 Fakt: Niech zmienna losowa ~ Wtedy 1 2 1,2, gdzie ~ 2 1 Dowód szkic: 1 2 1 1 2 exp 2 1 1 1 2 2!!! 1.6 Rozkład studenta Rozkład studenta 1,2, Definicja: Niech ~0,1 oraz ~ będą niezależnymi zmiennymi losowymi. Mówimy, że zmienna losowa Strona 5

1 ma rozkład Studenta z stopniami swobody. Fakt: 1 2 1 2 Fakt: Niech będzie ciągiem gęstości zmiennych losowych o rozkładzie Wtedy: : lim 1 exp 2 2 Przykład 3: Niech,, będą niezależnymi zmiennymi losowymi o jednakowym rozkładzie, 1 wtedy: oraz ~ 0,1 przykład 1 1 ~ 1 tw. 3 Ponadto zmienne losowe, są niezależne Wtedy: 1 ~ 1 1 Mamy: 1 1 1 1 1 1.7 Rozkład Snedecora Rozkład Snedecora,, 1,2, Definicja: Niech ~ oraz ~ będą niezależnymi zmiennymi losowymi. Mówimy, że zmienna losowa 1 1 Strona 6

ma rozkład Snedecora z, stopniami swobody. Fakt: 2 2 2, Przykład 4: Niech,,,, będą niezależnymi zmiennymi losowymi o rozkładach odpowiednio równych, ;, Wtedy: 1 ~ 1 tw. 3 1 ~ 1 tw. 3 Ponadto zmienna losowa, są niezależne 1 1 ~ 1, 1 1 1 Mamy: 1 1 1 1 1 1 1 1 1 1 2. DANE STATYSTYCZNE. MODEL STATYSTYCZNY Przykład 5: 1 Centrala telefoniczna W 200 losowo wybranych 5 sekundowych odcinkach czasowych, badano liczbę zgłoszeń. otrzymano wynik: 0,5,3,,2. 2 Auto test Przeprowadzono 50 niezależnych eksperymentów polegających na hamowaniu badanego typu samochodu. Zaobserwowano długości drogi hamowania w metrach 18,13; 17,61; ; 18,62 Wykład 3 05.03.2008r. Definicja: Populacja zbiór obiektów Cecha zmienna funkcja określona na obiektach populacji ozn. Strona 7

Rozkład rzeczywisty populacji rozkład wartości tej cechy na elementach populacji. Próba podzbiór populacji złożony z obiektów podlegających badaniu statystycznemu Rozkład empiryczny z próby rozkład wartości cechy na elementach próby. Przykład 5 Cd.: częstość % zgłoszeń 0 16% 1 33,5% 2 24,5% 3 15,5% 4 7,5% 5 3% dyskretna cecha dane długość drogi liczebność hamowania 17,6 17,8 4 17,8 18 5 18 18,2 6 18,2 18,4 8 18,4 18,6 11 18,6 18,8 12 18,8 19 4 ciągła cecha Konstruując model matematyczny eksperymentu statystycznego. Dane,,, traktujemy jako realizację wektora losowego,,, o rozkładzie należącej do pewnej rodziny rozkładu przestrzeń próby ciało podzbiorów zbioru na którym określone są rozkłady w zbiorze Próby proste,, przestrzeń statystyczna częstość wartości cechy w próbie rozkład empiryczny funkcja prawdopodobieństwa rozkładu Poissona rozkład tradycyjny wielobok częstotliwości wartości cechy w próbie rozkład empiryczny gęstość rozkładu normalnego rozkład teoretyczny Strona 8

Budując model zakładamy, że cecha jest zmienną losową o rozkładzie z rodziny jednowymiarowy. Indukuje ona przestrzeń statystyczną w taki sposób, że,, są niezależnymi zmiennymi losowymi o jednakowym rozkładzie.,,,, rozkład populacji : przestrzeń populacji model parametryczny model nieparametryczny Przykład 5: 1 budujemy model Zakładamy ~ 0 Zatem 0,1,2, zbiór potencjalnych wartości 2 0 Model,, Uwaga: przestrzeń parametru 2 długość drogi hamowania Zakładamy, że ~, ; 0 borelowski, :, 0 zatem Model,, przestrzeń statystyczna Uwaga:, parametr przestrzeń parametru Strona 9

STATYSTYKA Niech,, będzie przestrzenią statystyczną Niech,,, będzie próbą z populacji o rozkładzie, gdzie jest parametrem. Wykład 4 12.03.2008r. 3. STATYSTYKI DOSTATECZNE I ZUPEŁNE Niech,,, będzie próba z populacji o rozkładach gdzie jest parametrem. Statystyką nazywamy każdą funkcję mierzalną próby. np. średnia z próby. wariancja z próby Definicja: Statystyka jest dostateczna dla rodziny rozkładów : gdy rozkład warunkowy: nie zależy od parametru Przykład 6: Niech,,, będzie próbą z populacji o rozkładzie, 0 parametr. rozważmy statystykę postaci: Mamy ~ Zatem, 0, 0, 0,,,!! 0, 0,!!!,,!, Strona 10

Stąd rozkład warunkowy nie zależy od, czyli jest dostateczny od parametru. Twierdzenie 4 Kryterium faktoryzacji: Statystyka jest dostateczna dla parametru funkcje prawdopodobieństwa gęstość próby można przestawić w postaci: gdzie funkcja nie zależy od parametru a funkcja zależna od zależy od tylko poprzez wartości statystyki. Przykład 7: Niech,,, będzie próbą z populacji o rozkładzie,,, 0 Wtedy: 1,, 2 exp 1 2 gdzie 2 exp 1 2 2 exp 1 2 2 2 exp 2 1 2 2 1,, ; ; Zatem statystyka dostateczna dla parametru, ma postać:,, Definicja: Statystykę dostateczną nazywamy minimalną statystyka dostateczną jeżeli dla każdej statystyki dostatecznej istnieje funkcja taka, że Definicja: Statystyka jest zupełna dla rodziny rozkładów : dla parametru Θ gdy z warunku : 0 Strona 11

wynika, że: 0 prawie wszędzie Przykład 6 Cd.: Niech: statystyka dostateczna dla parametru.! 0 0,1,2,! 0 0,1,2, 0 Zatem statystyka jest zupełna dla parametru. 0! ę Twierdzenie 5: Jeżeli statystyka jest dostateczna i zupełna dla rodziny rozkładów, to jest minimalną statystyką dostateczną dla rodziny. Definicja: Rodzinę rozkładów prawdopodobieństwa : nazywamy parametrową rodziną wykładniczą jeżeli funkcje prawdopodobieństwa lub gęstość rozkładu można zapisać w postaci: Przykład 8: Zatem: exp,,, 0, 1 2 exp 1 2 1 1 exp 2 2 2 1 2 exp 1 2 2 exp 1 2 2 1 2 ln2, 2 1 2 ln2, 1 2 1 Strona 12

Zatem rodzina rozkładów jest rodziną wykładniczą. Wykład 5 19.03.2008r. Twierdzenie 6 Lemanna: Niech,,, będzie próbą z populacji o rozkładzie z rodziną wykładniczą dla której zbiór,, : zawiera niezdegerowany prostokąt w. Wtedy statystyka,, jest dostateczna i zupełna dla rodziny rozkładów. Przykład 8 Cd.: Rozważmy następujący zbiór:,,, :, 0 1, 2 :, 0 zawiera niezdegenerowany prostokąt w. zatem statystyka:,, jest dostateczna i zupełna dla rodziny rozkładów normalnych. 4. ESTYMACJA PUNKTOWA SZACOWANIE Niech,,, będzie próbą z populacji z rozkładem prawdopodobieństwa o rozkładzie, gdzie jest parametrem. Ponadto niech będzie funkcją parametryczną. Definicja: Statystykę o wartościach w zbiorze skonstruowana w ten sposób, aby jej wartości szacowały prawdziwą wartość funkcji parametrycznej nazywamy estymatorem funkcji parametrycznej. Oznaczamy. Przykład 9: Załóżmy, że badamy cechę o której to cesze zakładamy, że ~, 0. Poszukamy estymatorów funkcji parametrycznej. a) b) 0 Przykładowe estymatory: Strona 13

a) b) Przykład 10: Badamy cechę. Model: ~,,, parametry. Poszukujemy estymatorów funkcji parametrycznej: a),, b),, Przykłady estymatorów: a) b) Definicja: Statystykę nazywamy estymatorem nieobciążonym funkcji par, gdy Przykład 11: Zakładamy, że cecha ma dowolny rozkład Estymujemy prawdopodobieństwo, gdzie jest zbiorem borelowskim. Rozważmy estymator częściowy postaci: #: Mamy #: ~, Zatem 1 #: 1 Czyli estymator jest estymatorem nieobciążonym dla. Uwaga: Niech będzie dystrybuantą rozkładu zmiennej losowej, tzn.. Wtedy dystrybuanta empiryczna #: jest nieobciążonym estymatorem dystrybuanty w punkcie. Przykład 12: Zakładamy, że badana cecha populacji ma rozkład o wartości oczekiwanej. Ponieważ Strona 14

STATYSTYKA 1 1 1 Zatem jest estymatorem nieobciążonym dla. Uwaga: Niech,, będą liczbami takimi, że 1 Wtedy statystyka jest nieobciążonym estymatorem parametru. Mamy Przykład 12 (cd.): Zakładamy dodatkowo, że cecha ma skończoną wariancję oraz, że 1. Wtedy: 1 1 1 1 2 1 1 Ponadto: Zatem: 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 czyli statystyka jest estymatorem nieobciążonym dla. Wykład 6 26.03.2008r. funkcja parametryczna,, próba estymator dla Strona 15

estymator nieobciążony Definicja: Ciąg estymatorów funkcji parametrycznej nazywamy (słabo) zgodnym, gdy ciąg jest zbieżny według prawdopodobieństwa do tzn.: lim 0 Przykład 12 (cd.): Z prawa wielkich liczb Chińczyna wynika, że jest zgodnym estymatorem dla. Ponadto Zastosujemy prawo wielkich liczb Chińczyna do ciągu, Wtedy 1 Zatem Czyli jest zgodnym estymatorem parametru Twierdzenie 7: Niech będzie nieobciążonym estymatorem funkcji parametrycznej, dla której: 0 Wtedy jest zgodnym estymatorem dla. Lemat Nierówność Czybyszewa: Jeżeli jest zmienną losową o wartości oczekiwanej i skończonej wariancji, to prawdziwe jest: Dowód tw. 7: Obieramy dowolne ; 0 Mamy: : Niech: Zatem: : 1 Strona 16

Ponieważ: Zatem: STATYSTYKA 0 0 Czyli jest zgodnym estymatorem dla. 4.1 Estymatory nieobciążone o minimalnej wariancji Niech będzie rodziną estymatorów nieobciążonych posiadających skończoną wariancję dla każdego dla. Statystykę nazywamy estymatorem nieobciążonym o minimalnej wariancji (ENMW) funkcji parametrycznej, gdy: Twierdzenie 8: ENMW funkcji parametrycznej jest wyznaczony jednoznacznie z dokładnością do zbioru miary zero. Lemat 1: Niech będzie ENMW funkcji parametrycznej, statystyką taką, że: : 0. Wtedy : 0 Dowód lematu 1: Niech ; Mamy Zatem U jest estymatorem nieobciążonym dla. 2, Ponieważ jest ENMW dla, to: 2 Stąd 0 Lemat 2: 2 0 4 0 0 0 0 Strona 17

Niech, będą zmiennymi losowymi takimi, że, 1 Wtedy istnieją, liczby 0 i 0 takie, że 1 Ponadto, ; Dowód tw. 8: Niech, będą ENMW dla. Zatem ; Ponadto:, Mamy 0 Czyli dla 0 Zatem (z lematu 1) mamy 0 0 Stąd:,, 1 Zatem (z lematu 2) mamy: Istnieją stałe 0 i takie, że:.. Ponadto:, 1 0 Stąd.. Twierdzenie 9 Rao Blackwella: Niech będzie estymatorem nieobciążonym funkcji parametrycznej, statystyką dostateczną dla parametru. Wtedy: 1. estymator nieobciążony funkcji parametrycznej 2. : Lemat: Jeżeli odpowiednie wartości oczekiwane istnieją, to: 1. 2. Dowód : Mamy, że nie zależy od parametru θ, bo jest statystyką dostateczną. Zatem nie zależy od parametru θ. Strona 18

Wykład 7 02.04.2008r. Twierdzenie 9: Estymator nieobciążony dla statystyka dostateczna dla 1. Estymator nieobciążony dla 2. Stąd: nie zależy od parametru, czyli jest statystyką. Ponadto: czyli jest Estymatorem nieobciążonym dla dodatkowo: Twierdzenie 10 Lehmanna Scheffego: Niech będzie nieobciążonym estymatorem funkcji parametrycznej, statystyką dostateczną i zupełną dla parametru. Wtedy jest Estymatorem nieobciążonym o minimalnej wariancji funkcji parametrycznej. Dowód tw. 10: Niech Mamy Niech będzie dowolnym estymatorem nieobciążonym dla funkcji parametrycznej. Zatem dla każdego Rozważmy statystykę: mamy: Zatem z zupełności statystyki 0 Strona 19

Stąd STATYSTYKA 0.... czyli jest Estymatorem nieobciążonym o minimalnej wariancji funkcji parametrycznej. Przykład 9 (cd.): Niech,, będzie próbą z populacji o rozkładzie, 0 parametr oraz niech. Niech #: Wiemy, że Estymator nieobciążony dla przykład 11 Poznadto statystyka dostateczna i zupełna dla parametru przykład 6 Zatem: 1 1 0 0, 0 1!! 1 1 1 1 1 Twierdzenie 11: Niech będzie statystyką dostateczną i zupełną dla parametru oraz niech będzie Estymatorem nieobciążonym funkcji parametrycznej. Wtedy jest Estymatorem nieobciążonym o minimalnej wariancji funkcji parametrycznej. Lemat: Jeżeli oraz istnieje, to Dowód tw. 11: Z twierdzenia 10 ENMW funkcji parametrycznej Z lematu czyli jest ENMW funkcji parametrycznej. Strona 20

Przykład 10 (cd.): Niech,, 1 będzie próbą z populacji o rozkładzie, ; ; 0 Estymujemy funkcję parametryczną,,, Wiemy, że statystyka jest dostateczna i zupełna dla, Mamy:, Estymator nieobciążony dla parametru Estymator nieobciążony dla parametru Zatem 1 1 1 1 1 1 Zatem i są ENMW dla i odpowiednio. 1 1 1 1 Mówimy, że rodzina rozkładów : na przestrzeni próby spełnia warunki regularności Cramera Rao, gdy dla funkcji prawdopodobieństwa (lub gęstości) rozkładu mamy: Zbiór : 0 nie zależy od parametru. Dla dowolnych i istnieje skończona pochodna ln Jeżeli jest dowolną statystyką taką, że dla dowolnych, to Do końca rozdziału zakładamy, że rodzina : rozkładów prawdopodobieństwa spełnia warunki regularności Cramera Rao. Funkcję ln nazywamy ilością informacji Fishera o parametrze z próby. Wykład 8 09.04.2008r. Własność 1: Dowód: Strona 21

ln STATYSTYKA ln ln ln 2 ln ln ln 2 ln ln ln ln 1 0 Własność 2: Jeżeli dla dowolnych i istnieje skończona pochodna ln oraz to ln Dowód: ln 1 1 1 1 1 1 0 Przykład13: Niech,, będzie próbą z populacji o rozkładzie, gdzie 0 Mamy: Strona 22

Zatem: ; 1,2,! ln ln ln! ln 1 ln 1 Twierdzenie 12 Nierówność Cramera Rao: Niech będzie estymatorem nieobciążonym o skończonej wariancji funkcji parametrycznej oraz niech 0. Wtedy: : oraz równość zachodzi gdy ln Dowód: Lemat Nierówność Cauchy ego Schwarza: Jeżeli odpowiednie wartości oczekiwane istnieją, to,, przy czym równość zachodzi gdy 1, gdzie, ; Dowód tw. 12: Niech ln Zatem ln ln 1 0 0 ln Strona 23

, ln Stąd: czyli: Ponadto: Zatem: ln ln ln 1 ln, gdzie, ln ln Wniosek: Estymator nieobciążony funkcji parametrycznej dla którego jest Estymatorem nieobciążonym o minimalnej wariancji funkcji parametrycznej. Estymatory nieobciążone, dla których spełniona jest powyższa równość nazywamy efektywnymi w sensie Cramera Rao. Przykład 9 (cd.): Niech,, będzie próbą z populacji o rozkładzie, gdzie 0 Ponadto niech Niech Estymator nieobciążony dla przykład 12 Mamy: przykład 13 Strona 24

Stąd: STATYSTYKA czyli jest ENMW (efektywnym w sensie Cramera Rao) parametru. 4.2. Estymatory największej wiarygodności Niech,, będzie próbą z populacji o rozkładzie z rodziny : Ponadto niech rozkłady opisane będą za pomocą funkcji prawdopodobieństwa (lub gęstości). Funkcję określoną wzorem:, nazywamy funkcją wiarygodności. Estymatorem największej wiarygodności parametru (ENW) nazywamy statystykę, której wartość spełnia warunek: :, sup, Uwaga: Dla dowolnego parametru, ENW może istnieć albo być wyznaczony niejednoznacznie. Przyjmujemy, że funkcja parametryczna jest statystyką, gdzie ENW parametru. Zazwyczaj wygodnie jest operować funkcją ln niż funkcją. Przykład 9 (cd.): Mamy ~ 0 Zatem: ; ; 0,1,2,!,!! ln, ln ln! Strona 25

0 ; Zatem ENW dla parametru jest Stąd ENW dla jest jest 0 5. ESTYMACJA PRZEDZIAŁOWA Wykład 9 16.04.2008r. Niech,, będzie próbą z populacji o rozkładzie, gdzie jest parametrem. Ponadto niech będzie funkcją parametryczną. Definicja: Przedział, określony parą statystyk, takich, że 1 dla każdego, nazywamy przedziałem ufności dla na poziomie ufności 1 0 1, gdy: : 1 Przykład14: Niech,, będzie próbą z populacji o rozkładzie z wartością oczekiwaną i skończoną wariancją. Zakładamy, że jest parametrem, a jest znane. Mamy: 1 z nierówności Czebyszewa 1 1 1 Strona 26

STATYSTYKA 1 1 1 1 1 1 1 1 1 1 Zatem 1 100% przedział ufności dla parametru ma postać: ; Konstrukcja przedziałów ufności za pomocą funkcji centralnej. Definicja: Funkcję, nazywamy funkcją centralną dla, gdy rozkład prawdopodobieństwa, jest absolutnie ciągły i nie zależy od parametru., jest funkcją ciągłą i ściśle monotoniczną względem. Konstrukcja: Obieramy funkcję centralną, Wybieramy stałe i tak, aby :, 1 Stałe, można dobrać na wiele sposobów. Zazwyczaj dobieramy je tak, aby 2 Strona 27

Rozwiązujemy nierówność, względem otrzymując przedział,. Przykład 10 (cd.): ~, ;, parametry, ;, a) Dla :, ;, ~ 1 przykład 3, 2, 1 2 1 2 1, 1 2 zatem 1 100% przedział ufności dla : 1, 1, 2 1, 1 2 b) Dla :, 1, ~ 1 tw. 3 Strona 28

, 2 2, 1 2, 2 1 1 1, 1 2 1 2 1, 1 2 Zatem 1 100% przedział ufności dla ma postać Przykład 9 (cd.): ~ 0 parametr ; Dla : 100 1 1, 1, 1 2, 1 2 ~, z centralnego twierdzenia granicznego,, ~0,1 szukamy stałych i : 2 Strona 29

1 2 1 2 1 2 1 2 / bo 0 2 0 2 0 2 4 4 4 4 4 0 2 4 2 4 2 4 1 2 2 4 1 2 Zatem 1 100% przedział ufności dla par 100: Porównajmy i max 1 2, 1 2 1, 1 2 1 2 Fakt: 1 100% przedział ufności dla parametru : Przykład 5 (cd.): liczba zgłoszeń Model: ~ 0 parametr 1 2 2, 2, 1 2 1, 2 1 2 Funkcja parametryczna Estymator punktowy % przedział ufności 1,74 1,59; 1,89 0,17 0,15; 0,20 Strona 30

długość drogi hamowania Model:,, parametry STATYSTYKA Funkcja parametryczna Estymator punktowy % przedział ufności, 18,38 18,28; 18,48, 0,13 0,09; 0,20 6. WERYFIKACJA HIPOTEZ STATYSTYCZNYCH Niech,, będzie próbą z populacji o rozkładzie : gdzie jest parametrem. Hipoteza statystyczna: hipoteza zerowa: : hipoteza alternatywna: : Definicja: Testem statystycznym nazywamy statystykę: : 0,1 określoną następująco: 1, 0, gdzie: 1 oznacza decyzję odrzucamy hipotezę zerową 0 oznacza decyzję nie ma podstaw do odrzucenia Typowa postać obszaru krytycznego : : ść ść Błąd I rodzaju: Odrzucamy, gdy jest ona prawdziwa Błąd II rodzaju: Przyjmujemy, gdy jest ona fałszywa Definicja: Funkcję : 0,1 taką, że nazywamy funkcją mocy testu. Uwaga: Strona 31

STATYSTYKA RYSUNEK!!!. łę 1. łę ę,, Uwaga: Zmniejszenie prawdopodobieństwa błędu I rodzaju powoduje zwiększenie prawdopodobieństwa błędu II rodzaju (i na odwrót). konstrukcja optymalnego (jednostajnie najmocniejszego) testu na poziomie istotności 0 1: 1. Ustalamy poziom istotności i wyznaczamy wszystkie testy, dla których: : 2. Wśród testów spełniających wybieramy ten, dla którego: : max 6.1. Testy jednostajnie najmocniejsze. Zakładamy, że rozkłady : badanych cech są absolutnie ciągłe z funkcją gęstości. Twierdzenie 14 Lemat Neymana Pearsona: Niech : będzie obszarem krytycznym dla testu hipotezy zerowej :, przeciwko hipotezie alternatywnej :, przy czym 0 wyznaczamy z równości: gdzie jest zadanym poziomem istotności. Jeżeli jest dowolnym obszarem krytycznym testu powyższej hipotezy na poziomie istotności, to czyli test z obszarem krytycznym jest najmocniejszy.??? Dowód tw. 14: Mamy: Strona 32

0 Przykład 15: Niech,, będzie próbą z populacji o rozkładzie,, gdzie jest parametrem a jest znane. Weryfikujemy hipotezę : przeciwko hipotezie : Niech : 0 Zatem: 1 2 exp 1 2 2 exp 1 2 stąd: 2 exp 1 2 Strona 33

exp 1 : exp 1 2 2 STATYSTYKA : exp 1 2 : 2 ln : 2 2 2 ln : 2 2 ln : 2 2 ln : 2 ln 2 : Ponadto: Ponieważ: Zatem: 1 1 ~, 1 Stąd: 1 1 : 1 Ponieważ obszar krytyczny nie zależy od wyboru wartości, zatem skonstruowany test jest jednostajnie najmocniejszy przy hipotezie alternatywnej : Uwaga: 1. Równoważna postać obszaru krytycznego: Strona 34

: 1 2. Dla hipotezy alternatywnej : jednostajnie najmocniejszy test ma postać: : 3. Dla hipotezy alternatywnej : jednostajnie najmocniejszy test nie istnieje!! 6.2. Testy ilorazu wiarygodności Niech,, będzie próbą z populacji o rozkładzie z rodziny : Ponadto niech rozkłady z rodziny opisane będą za pomocą funkcji prawdopodobieństwa (lub gęstości). Testujemy hipotezę : przeciwko hipotezie alternatywnej : Definicja: Testem ilorazu wiarygodności nazywamy test z obszarem krytycznym sup, : sup, gdzie jest najmniejszą stałą taką, że :. Uwaga: Jeżeli i są hipotezami prostymi, to test ilorazu wiarygodności pokrywa się z testem lematu Neymana Pearsona, czyli jest najmocniejszy. Wyznaczając test używamy równoważnego obszaru krytycznego postaci: sup, : sup, Supremum funkcji wiarygodności osiągane jest dla, gdzie jest ENW parametru. Przykład16 (Test t Studenta dla jednej próby): Niech,, będzie próbą z populacji o rozkładzie,, gdzie, parametry. Wyznaczamy test ilorazu wiarygodności hipotezy zerowej : przeciwko hipotezie alternatywnej : Mamy:, :, 0,, 2 exp 1 2 Ponadto ENW parametrów, mają postać: Strona 35

Zatem sup, Zatem: Zatem: sup STATYSTYKA 1 przykład 10 4.2,, 2 exp 1 2, :, 0 sup,, sup,, ln,, 2 ln2 2 ln 1 2,, 2 1 2 2 0 1 2 exp : 2 2 exp : 2 2 exp 2 exp 1 2 2 exp 2 1 1 : 1 2 Strona 36

: : 1 : 1 1 : 1 1 1 1 1 : 1 1 : 1 1 1 : ~ 1 przykład 3. 1 1 1 1 2 2 1 1, 1 Zatem: : 1, 1 2 Uwaga: Dla hipotezy alternatywnej : obszar krytyczny ma postać: : 1, 1 Dla hipotezy alternatywnej : obszar krytyczny ma postać: :, 1 Przykład 5b (cd.): Na poziomie istotności 0,05 zweryfikujmy hipotezę głoszącą, że średnia długość hamowania dla samochodu wyposażonego w nowy typ układu hamulcowego jest istotnie krótsza niż w poprzednio stosowanym typie (wynosiła ona wtedy 18,6 [m]). długość drogi hamowania Strona 37

Model: ~, ; µ,σ parametry Formułujemy hipotezy: : 18,6 : 18,6 50 ; 18,38 Wartość statystyki testowej: STATYSTYKA 18,38 18,6 504,32 0,13 Wartość krytyczna:, 1 0,05,49 0,95,49 1,677 Decyzja: Odrzucamy hipotezę. Przykład 17 Test dla wariancji w jednej próbie: Niech,, 1 będzie próbą z populacji o rozkładzie,, gdzie, parametry. Weryfikujemy hipotezę zerową : Statystyka testowa: Rozkład statystyki testowej ~ 1 Obszary krytyczne: 1. : 2. : 3. : : 1 2, 1 lub, 1 2 : 1, 1 :, 1 Wykład 11 26.03.2008r. Przykład 18 (Test t Studenta dla dwóch prób): Niech,, ;,,, 1 będą niezależnymi próbami z populacji o rozkładach, ;, odpowiednio, gdzie,, parametry Weryfikujemy hipotezę zerową: : przeciwko hipotezie alternatywnej : Strona 38