Test dwustronny: H 0 : p= 1 2 H A : p 1 2 0,300 0,250 0,200 P(r) 0,150 0,100 0,050 0,000 0 1 2 3 4 5 6 7 8 9 10 r α/2 Przedział ufności α/2 Obszar krytyczny dla α = 0,05
Prawo Murphy'ego: kanapka zazwyczaj spada posmarowaną stroną do dołu. Zrzucono 10 razy kanapkę na dywan. 8 razy kanapka spadła posmarowaną stroną do dołu. Czy można uznać, że prawo Murphy'ego jest prawdziwe? Przetestuj hipotezę dla poziomu istotności α = 0,05 i α = 0,1.
α = 0,05 P (r=0) = 1/1024 P (r=1) = 10/1024 P (r=2) = 45/1024 P (r=3) = 120/1024 P (r=4) = 210/1024 P (r=5) = 252/1024 P (r=6) = 210/1024 P (r=7) = 120/1024 P (r=8) = 45/1024 P (r=9) = 10/1024 P (r=10) = 1/1024 P(r) 0,300 0,250 0,200 0,150 0,100 0,050 0,000 0 1 2 3 4 5 6 7 8 9 10 r Przedział ufności α p = 56/1024 = 5,5% Obszar krytyczny dla α = 0,05
α = 0,1 P (r=0) = 1/1024 P (r=1) = 10/1024 P (r=2) = 45/1024 P (r=3) = 120/1024 P (r=4) = 210/1024 P (r=5) = 252/1024 P (r=6) = 210/1024 P (r=7) = 120/1024 P (r=8) = 45/1024 P (r=9) = 10/1024 P (r=10) = 1/1024 P(r) 0,300 0,250 0,200 0,150 0,100 0,050 0,000 0 1 2 3 4 5 6 7 8 9 10 r Przedział ufności α p = 56/1024 = 5,5% Obszar krytyczny dla α = 0,1
Zadanie: Jakie jest prawdopodobieństwo, że uda się zidentyfikować krzywą monetę (p=0,3) przy dziesięciu rzutach monetą?
Wyznaczamy obszar krytyczny i przedział ufności dla n = 10. Przyjmujemy poziom istotności testu α = 0,05. P (r=0) = 1/1024 P (r=1) = 10/1024 P (r=2) = 45/1024 P (r=3) = 120/1024 P (r=4) = 210/1024 P (r=5) = 252/1024 P (r=6) = 210/1024 P (r=7) = 120/1024 P (r=8) = 45/1024 P (r=9) = 10/1024 P (r=10) = 1/1024 P(r) 0,300 0,250 0,200 0,150 0,100 0,050 0,000 0 1 2 3 4 5 6 7 8 9 10 r α/2 Przedział ufności α/2 p = 22/1024 = 2,1% Obszar krytyczny dla α = 0,05
Zadanie: Jakie jest prawdopodobieństwo, że uda się zidentyfikować krzywą monetę (p=0,3) przy n = 10? P (p = 0,3; r=0) = 0,028 P (p = 0,3; r=1) = 0,121 P (p = 0,3; r=2) = 0,233 P (p = 0,3; r=3) = 0,267 P (p = 0,3; r=4) = 0,200 P (p = 0,3; r=5) = 0,103 P (p = 0,3; r=6) = 0,037 P (p = 0,3; r=7) = 0,009 P (p = 0,3; r=8) = 0,001 P (p = 0,3; r=9) = 0 P (p = 0,3; r=10) = 0 P(r) 0,30 0,25 0,20 0,15 0,10 0,05 0,00 0 1 2 3 4 5 6 7 8 9 10 r α/2 Przedział ufności α/2 p=0.5 p=0.3 p = 0,028 + 0,121 + 0 + 0 = 0,149 = 14.9% = β Obszar krytyczny dla α = 0,05
Rodzaje błędów, które można popełnić przy testowaniu hipotez. Błąd I-go rodzaju (α) odrzucenie prawdziwej hipotezy H 0. Błąd II-go rodzaju (1-β) przyjęcie fałszywej hipotezy H 0. Hipoteza H 0 Prawdziwa Fałszywa Odrzucamy α Przyjmujemy 1-β Błąd III-go rodzaju (γ) przyjęcie złego kierunku H A.
Pytanie: Kiedy do testowania hipotezy stosujemy rozkład dwumianowy? Gdy: badana cecha jest niemierzalna i może przyjąć dwie możliwe wartości (np. orzeł i reszka); dysponujemy pojedynczą próbą (np. jedną serią), w której policzono ilość przypadków wystąpienia każdej z dwóch wartości, jakie może przyjąć cecha (np. ilość wyrzuconych orłów i reszek); dysponujemy rozkładem teoretycznym; próba (seria) zdarzeń (np. rzutów monetą) jest małoliczna (mniej niż 30).
Rozkład normalny n 0,30 0,12 0,25 0,1 0,20 0,08 P(r) 0,15 P(r) 0,06 0,10 0,04 0,05 0,02 0,00 0 1 2 3 4 5 6 7 8 9 10 r 0 r 0,090 0,080 0,070 0,060 P(X) 0,050 0,040 0,030 0,020 0,010 0,000 0 10 20 30 40 50 60 X
Parametry charakteryzujące rozkład normalny 0,25 0,20 0,15 P(X) 0,10 0,05 0,00 0 10 20 30 40 50 60 X
Parametry charakteryzujące rozkład normalny μ 0,09 0,08 0,07 f x i = 1 2 e 1 2 x i P(X) 0,06 0,05 0,04 0,03 0,02 0,01 σ 0,00 0 10 20 30 40 50 60 X
Standaryzacja rozkładu normalnego X N, X N 0, X N 0,1 Wartość standaryzowana: z= x 0,6 0,5 0,4 P(Z) 0,3 0,2 0,1 0-0,1-4 -3-2 -1 0 1 2 3 4 Z
Dystrybuanta rozkładu normalnego F X =P X x i =P X x i z = 1 z 2 e z 2 2 dz 1,2 1 0,8 F(Z) 0,6 0,4 0,2 0-4 -3-2 -1 0 1 2 3 4 Z
Kodowanie danych Dodawanie, odejmowanie, mnożenie i dzielenie wszystkich elementów szeregu przez stałą. W/w działania można łączyć. Obliczając statystyki z danych zakodowanych można je odkodować i uzyskujemy statystykę, jak z danych niekodowanych. Rozkład przy kodowaniu przesuwa się na skali, zwęża lub rozszerza, ale jego zasadniczy kształt nie zmienia się.
Transformowanie danych Pierwiastkowanie, podnoszenie do potęgi, obliczanie odwrotności, logarytmowanie i antylogarytmowanie, stosowanie funkcji trygonometrycznych, Transformowanie danych stosujemy, gdy mamy do czynienia z przypadkami zależności nieliniowych (występujących w przyrodzie). Np. powierzchnia liścia rośne z kwadratem długości.
Zadania: 1) Wystandaryzować wartości x 1 = 23, x 2 = 34, x 3 = 28 względem rozkładu o parametrach μ = 27 i σ = 4. Odp: z 1 = -1; z 2 = 1,75; z 3 = 0,25 2) Odkodować wartości z 1 = 3, z 2 = -1,5 oraz z 3 = -0,5 wiedząc, że pochodzą one z rozkładu o parametrach μ = 30 i σ = 5. Odp: x 1 = 45; x 2 = 22,5; x 3 = 27,5 Student wystandaryzował wartość x 1 = 25 otrzymując wartość z 1 = 2. Pamięta, że standaryzacji dokonał względem σ = 3. Niestety, nie pamięta wartości μ. Czy na podstawie posiadanych danych można odzyskać informację o wartości μ? Odp: Tak. μ = 19.
Jakie jest prawdopodobieństwo, że zmienna Z przyjmie wartość mniejszą niż z 1 = 3. Jak to prawdopodobieństwo zmienia się dla wartości z 2 = 2, z 3 = 1, z 4 = 0, z 5 = -1, z 6 = -2, z 7 = -3? Wynik podaj z dokładnością do trzech cyfr znaczących. Odp: F(z 1 ) = 0,999; F(z 2 ) = 0,977; F(z 3 ) = 0,841; F(z 4 ) = (0,500); F(z 5 ) = 0,159; F(z 6 ) = 0,0228; F(z 7 ) = 0,00135 Rozkład pewnej cechy posiada następujące parametry: μ = 20,0 i σ = 5,0. Odszukaj: a) Kwartyle Q 1 i Q 3. Odp: Q 1 = 16,6 (17), Q 3 = 23,4 (23) b) Centyle C 20 i C 70. Odp: C 20 = 15,8, C 70 = 22,6
Siatka centylowa Masa chłopców w wieku 12-36 miesięcy.
Rozkład pewnej cechy w populacji (np. wzrost 8-letnich chłopców we Wrocławiu) posiada parametry μ = 100 i σ = 12,0. Odszukaj: Jaki procent chłopców zawiera się w granicach: a) μ ± σ, b) μ ± 2σ, c) μ ± 3σ? Odp: a) 68,3% b) 95,4% c) 99,7% W jakim zakresie zawiera się 95% chłopców? Odp: <76,5 (76); 124>
Wyznaczyć przedział ufności i obszar krytyczny (dwustronny) w rozkładzie o parametrach μ = 100 i σ = 12,0 dla α= 0,01, α= 0,05 i α= 0,1. Odp: α= 0,01: Przedział ufności <69,0; 131> α= 0,05: Przedział ufności <76,5; 124> α= 0,1: Przedział ufności <80,3; 120> Na ulicach Wrocławia złapano osobnika podającego się za ośmiolatka o wzroście 128 cm. Czy osobnik ten jest rodowitym mieszkańcem Wrocławia? Odp: Nie, dla α= 0,05. Na jakim najniższym poziomie istotności możemy odrzucić hipotezę H 0 (tzn. że chłopiec pochodzi z Wrocławia)? Odp: α= 0,02.