Statystyka matematyczna Wykład 6 Magdalena Alama-Bućko 8 kwietnia 019 Magdalena Alama-Bućko Statystyka matematyczna 8 kwietnia 019 1 / 1
Rozkłady ciagłe Magdalena Alama-Bućko Statystyka matematyczna 8 kwietnia 019 / 1
Dla zmiennych losowych ciagłych wartościami moga być dowolne liczby z pewnego zbioru (przedziału). Zmienna losowa X ma rozkład ciagły, gdy istnieje taka funkcja f (x) 0 dla x R taka, że, P(X A) to pole pod wykresem gęstości na zbiorze A (tzn. dla x A). Funkcję f nazywamy funkcja gęstości (gęstościa). Mówi ona o "szansach" na wylosowanie liczby z danego zbioru (przedziału) (większe wartości - większe szanse). Pole obszaru znajdujacego się między wykresem gęstości i osia OX wynosi 1, tzn. P(X R) = 1. Magdalena Alama-Bućko Statystyka matematyczna 8 kwietnia 019 3 / 1
Dystrybuanta zmiennej losowej ciagłej X nazywamy funkcję F(u) określona dla u R wzorem: F(u) = P(X < u) tzn. jest to pole obszaru znajdujacego się pod gęstościa f w punktach mniejszych niż u (na lewo od u). Znane rozkłady ciagłe: Rozkład jednostajny U(a, b) x (a, b) Rozkład wykładniczy E(λ) x > 0 Rozkład normalny N(m, σ ) x R Magdalena Alama-Bućko Statystyka matematyczna 8 kwietnia 019 / 1
Znane rozkłady ciagłe Rozkład jednostajny U(a, b), a, b, a < b -parametry określajace końce przedziału. Zmienna losowa X ma rozkład jednostajny U(a, b), jeśli jej gęstość ma postać 1 jeśli x [a, b], f (x) = b a 0 w przeciwnym przypadku, czyli x / [a, b]. gęstość f(x) 1 b a a b x W tym przypadku szanse na uzyskanie dowolnej liczby z przedziału (a, b) jest takie samo. Magdalena Alama-Bućko Statystyka matematyczna 8 kwietnia 019 5 / 1
Rozkład wykładniczy E(λ), λ > 0-parametr Zmienna losowa X ma rozkład wykładniczy E(λ), jeśli jej gęstość ma postać { λ e λx jeśli x 0, f (x) = 0 jeśli x < 0. Wykres gęstości dla λ = 1: Im dalej odchodzimy od zera tym szanse na otrzymanie danej dodatniej liczby maleja. Magdalena Alama-Bućko Statystyka matematyczna 8 kwietnia 019 6 / 1
Rozkład normalny N(m, σ ), m, σ -parametry. Zmienna losowa X ma rozkład normalny z parametrami m i σ, jeśli jej gęstość ma postać f (x) = 1 σ (x m) π e σ, x R wykres gęstości rozkładu standardowego N(0, 1), czyli dla m = 0, σ = 1: wartości dystrybuanty rozkładu standardowego w tablicach Jeśli Y N(m, σ ) to Y m σ N(0, 1) (tzw. standaryzacja) Magdalena Alama-Bućko Statystyka matematyczna 8 kwietnia 019 7 / 1
Parametry rozkładu zmiennej losowej Wartość oczekiwana zmiennej losowej ciagłej Wartościa oczekiwana zmiennej losowej ciagłej X o funkcji gęstości f (x) nazywamy (o ile istnieje) liczbę EX = x f (x)dx = x f (x)dx. R Wariancja zmiennej losowej skokowej Wariancja zmiennej losowej ciagłej X o gęstości f (x) nazywamy (o ile istnieje) liczbę ( m = EX) VaxX = E(X m) = (x m) f (x)dx Równoważny wzór: gdzie EX = R x f (x)dx. R VarX = EX (EX) Magdalena Alama-Bućko Statystyka matematyczna 8 kwietnia 019 8 / 1
Parametry i dystrybuanta znanych rozkładów ciagłych 1) Rozkład jednostajny : f (x) = 1 b a dla x [a, b]. EX = a + b, VarX = (b a) 1 ) Rozkład wykładniczy E(λ), F(x) = x a, a x b b a EX = 1 λ, VarX = 1 λ, F(x) = 1 e λx, x a 3) Rozkład normalny N(m, σ ) EX = m, VarX = σ F(x) = x f (u)du, x R Wartości dystrybuanty F(x) dla N(0, 1) znajduja się w tablicach. Magdalena Alama-Bućko Statystyka matematyczna 8 kwietnia 019 9 / 1
Dystrybuanta rozkładu N(0, 1) dla u 0 : oznaczenie Φ(u) x 0.00 0.01 0.0 0.03 0.0 0.05 0.06 0.07 0.08 0.09 0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.5199 0.539 0.5790 0.53188 0.53586 0.1 0.53983 0.5380 0.5776 0.5517 0.55567 0.5596 0.56356 0.5679 0.571 0.57535 0. 0.5796 0.58317 0.58706 0.59095 0.5983 0.59871 0.6057 0.606 0.6106 0.6109 0.3 0.61791 0.617 0.655 0.6930 0.63307 0.63683 0.6058 0.631 0.6803 0.65173 0. 0.655 0.65910 0.6676 0.6660 0.67003 0.6736 0.677 0.6808 0.6839 0.68793 0.5 0.6916 0.6997 0.6987 0.7019 0.7050 0.7088 0.716 0.71566 0.7190 0.70 0.6 0.7575 0.7907 0.7337 0.73565 0.73891 0.715 0.7537 0.7857 0.75175 0.7590 0.7 0.7580 0.76115 0.76 0.76730 0.77035 0.77337 0.77637 0.77935 0.7830 0.785 0.8 0.7881 0.79103 0.79389 0.79673 0.79955 0.803 0.80511 0.80785 0.81057 0.8137 0.9 0.8159 0.81859 0.811 0.8381 0.8639 0.889 0.8317 0.83398 0.8366 0.83891 1.0 0.813 0.8375 0.861 0.889 0.85083 0.8531 0.8553 0.85769 0.85993 0.861 1.1 0.8633 0.86650 0.8686 0.87076 0.8786 0.8793 0.87698 0.87900 0.88100 0.8898 1. 0.8893 0.88686 0.88877 0.89065 0.8951 0.8935 0.89617 0.89796 0.89973 0.9017 1.3 0.9030 0.9090 0.90658 0.908 0.90988 0.9119 0.91309 0.9166 0.9161 0.9177 1. 0.919 0.9073 0.90 0.936 0.9507 0.967 0.9785 0.99 0.93056 0.93189 1.5 0.93319 0.938 0.9357 0.93699 0.938 0.9393 0.906 0.9179 0.995 0.908 1.6 0.950 0.9630 0.9738 0.985 0.9950 0.95053 0.9515 0.955 0.9535 0.959 1.7 0.9553 0.95637 0.9578 0.95818 0.95907 0.9599 0.96080 0.9616 0.966 0.9637 1.8 0.9607 0.9685 0.9656 0.96638 0.9671 0.9678 0.96856 0.9696 0.96995 0.9706 1.9 0.9718 0.97193 0.9757 0.9730 0.97381 0.971 0.97500 0.97558 0.97615 0.97670.0 0.9775 0.97778 0.97831 0.9788 0.9793 0.9798 0.98030 0.98077 0.981 0.98169.1 0.981 0.9857 0.98300 0.9831 0.9838 0.98 0.9861 0.98500 0.98537 0.9857. 0.98610 0.9865 0.98679 0.98713 0.9875 0.98778 0.98809 0.9880 0.98870 0.98899.3 0.9898 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.9913 0.99158. 0.99180 0.990 0.99 0.995 0.9966 0.9986 0.99305 0.993 0.9933 0.99361.5 0.99379 0.99396 0.9913 0.9930 0.996 0.9961 0.9977 0.999 0.99506 0.9950.6 0.9953 0.9957 0.99560 0.99573 0.99585 0.99598 0.99609 0.9961 0.9963 0.9963.7 0.99653 0.9966 0.9967 0.99683 0.99693 0.9970 0.99711 0.9970 0.9978 0.99736.8 0.997 0.9975 0.99760 0.99767 0.9977 0.99781 0.99788 0.99795 0.99801 0.99807.9 0.99813 0.99819 0.9985 0.99831 0.99836 0.9981 0.9986 0.99851 0.99856 0.99861 3.0 0.99865 0.99869 0.9987 0.99878 0.9988 0.99886 0.99889 0.99893 0.99896 0.99900 Magdalena Alama-Bućko Statystyka matematyczna 8 kwietnia 019 10 / 1
Własności Dla rozkładów ciagłych z dystrybuanta F zachodza wzory: P(X = a) = 0 dla dowolnego a P(X a) = F(a) gdzie F oznacza dystrybuantę rozkładu P(a < X < b) = P(a X b) = F(b) F(a) P(X > a) = P(X a) = 1 F(a). dla rozkładów symetrycznych (tzn. o gęstości symetrycznej względem zera ): F( u) = 1 F(u). W szczególności dla rozkładu normalnego (tutaj F = Φ): Φ( u) = 1 Φ(u) gdzie Φ oznacza dystrybuantę rozkładu N(0, 1). Magdalena Alama-Bućko Statystyka matematyczna 8 kwietnia 019 11 / 1
Zadanie 1 Dla U N(0, 1) wylicz p-stwa: P(U < 0.3), P( 0.5 < U < 1.98), P(U > 0.5), P( U < 0.8). Zadanie Dla X N(1, ) = N(1, ) wylicz p-stwa: P(X < 0.3), P(0.9 < X < 1.98), P(X > 0.5), P( X < 0.8). Magdalena Alama-Bućko Statystyka matematyczna 8 kwietnia 019 1 / 1
Zadanie 1 Dla U N(0, 1) wylicz p-stwa: P(U < 0.3), P( 0.5 < U < 1.98), P(U > 0.5), P( U < 0.8). P(U < 0.3) = Φ(0.3) = 0.591 = 59.1% P( 0.5 < U < 1.98) = Φ(1.98) Φ( 0.5) = Φ(1.98) (1 Φ(0.5)) = 0.976 1 + 0.67 = 0.65 = 65% P(U > 0.5) = 1 P(U < 0.5) = 1 Φ(0.5) = 1 0.691 = 0.31 = 31% P( U < 0.8) = P( 0.8 < U < 0.8) = Φ(0.8) Φ( 0.8) = Φ(0.8) (1 Φ(0.8)) = Φ(0.8) 1 = 0.788 1 = 0.576 = 57.6% Magdalena Alama-Bućko Statystyka matematyczna 8 kwietnia 019 13 / 1
Zadanie Dla X N(1, ) wylicz p-stwa: P(X < 0.3), P(0.9 < X < 1.98), P(X > 0.5), P( X < 0.8). X 1 = U N(0, 1) P(X < 0.3) = P( X 1 < 0.3 1 ) = P(U < 0.385) Φ( 0.385) = 1 Φ(0.385) = 1 0.68 = 0.35 = 35.% P(0.9 < X < 1.98) = P( 0.9 1 < X 1 < 1.98 1 ) = P( 0.05 < U < 0.9) = Φ(0.9) Φ( 0.05) = Φ(0.9) (1 Φ(0.05)) = 0.68793 1+0.5199 = 0.08 = 0.8% Magdalena Alama-Bućko Statystyka matematyczna 8 kwietnia 019 1 / 1
X 1 = U N(0, 1) P(X > 0.5) = P( X 1 > 0.5 1 ) = P(U > 0.5) = 1 P(U < 0.5) = 1 Φ(0.5) = 1 0.59871 = 0.019 = 0.1% P( X < 0.8) = P( 0.8 < X < 0.8) = P( 0.8 1 < X 1 < 0.8 1 ) = P( 0.9 < U < 0.1) = Φ( 0.1) Φ( 0.9) = 1 Φ(0.1) (1 Φ(0.9)) = Φ(0.9) Φ(0.1) = 0, 8159 0, 53983 = 0.7611 = 7.6%. Magdalena Alama-Bućko Statystyka matematyczna 8 kwietnia 019 15 / 1
Zadanie 3 Masa ciała pewnej grupy osób opisana jest rozkładem normalnym o wartości średniej 75 kg i odchyleniu standardowym kg. a) Jakie jest prawdopodobieństwo, ze losowo wybrana osoba waży więcej niż 83 kg? b) Jakie jest prawdopodobieństwo, ze losowo wybrana osoba waży nie więcej niż 79 kg. c) Jaka jest frakcja osób majacych wagę pomiędzy 71 i 80 kg? d) Wyznaczyć wartość wagi, której nie przekracza 80% badanej populacji osób. Jeśli X N(75, ), to X 75 = U N(0, 1) Magdalena Alama-Bućko Statystyka matematyczna 8 kwietnia 019 16 / 1
oczywiście X N(75, ), więc standaryzacja ma postać: X 75 = U N(0, 1) a) Jakie jest prawdopodobieństwo, ze losowo wybrana osoba waży więcej niż 83 kg? P(X > 83) = P( X 75 > 83 75 ) = P(U > ) = 1 P(U < ) = 1 Φ() = 1 0, 9775 = 0.03 =.3% Odp., 3% badanej populacji waży więcej niż 83 kg. Magdalena Alama-Bućko Statystyka matematyczna 8 kwietnia 019 17 / 1
X 75 = U N(0, 1) b) Jakie jest prawdopodobieństwo, ze losowo wybrana osoba waży nie więcej niż 79 kg. P(X 79) = P( X 75 79 75 ) = P(U 1) = Φ(1) = 0.813 = 8.1% Odp. 8, 1% badanej populacji waży nie więcej niż 79 kg. Magdalena Alama-Bućko Statystyka matematyczna 8 kwietnia 019 18 / 1
X 75 = U N(0, 1) c) Jaka jest frakcja osób majacych wagę pomiędzy 71 i 80 kg? 71 75 P(71 < X < 80) = P( < X 75 < 80 75 ) = P( 1 < U < 5 ) = Φ(1.5) Φ( 1) = Φ(1.5) (1 Φ(1)) = 0, 8935 1 + 0, 813 = 0.73569 = 73, 6% Odp. 73, 6% badanej populacji waży pomiędzy 71 a 80 kg. Magdalena Alama-Bućko Statystyka matematyczna 8 kwietnia 019 19 / 1
X 75 = U N(0, 1) d) Wyznaczyć wartość wagi, której nie przekracza 80% badanej populacji osób. Zatem należy wyznaczyć taka wartość a, że P(X a) = 0.8. P(X a) = P( X 75 a 75 ) = P(U a 75 ) = Φ( a 75 ) Zatem musimy rozwiazać równanie: Φ( a 75 ) = 0.8 Z tablic dytrybuanty mamy, że (znamy wartość, odczytujemy punkt) a 75 = 0.8 czyli a = 75 + 0.8 = 75 + 3.36 = 78.36 Zatem 80% badanej populacji ma wagę nie większa niż 78,36 kg. Magdalena Alama-Bućko Statystyka matematyczna 8 kwietnia 019 0 / 1
Dziękuję za uwagę! Magdalena Alama-Bućko Statystyka matematyczna 8 kwietnia 019 1 / 1