Statystyka i opracowanie danych W3 Zmienne losowe ciągłe i ich rozkłady Dr Anna ADRIAN Paw B5, pok47 adan@agh.edu.pl
Plan wykładu Rozkład Poissona. Zmienna losowa ciągła Dystrybuanta i funkcja gęstości rozkładu zmiennej losowej ciągłej Rozkłady ciągłe: jednostajny, wykładniczy i normalny.
Rozkład Poissona i jego związek z rozkładem Bernouliego Jeśli zmienna losowa X n ma rozkład Bernoulliego i prawdopodobieństwo sukcesu pp(n) maleje do zera w ten sposób, że poczynając od pewnego n dla każdego n > n spełniony jest związek n*p λ, ( gdzie λ> jest wielkością stałą) to p ( k ) lim n P ( X n k ) e λ λ k! k gdzie k,1,2,... oraz λ n*p
Przykład zastosowania rozkładu Poissona W skład złożonej aparatury wchodzi między innymi n1 elementów określonego rodzaju. Prawdopodobieństwo uszkodzenia wciągu roku każdego z tych n elementów p,1 i nie zależy od stanu pozostałych elementów. Obliczyć prawdopodobieństwo uszkodzenia w ciągu roku: a. dokładnie dwóch elementów b. co najmniej dwóch elementów c. oczekiwaną liczbę uszkodzonych elementów d. wariancję dla liczby elementów uszkodzonych w ciągu roku
Rozwiązanie λ n*p 1 *,11 a)p(x2),5* e -1,184 b)p(x 2) 1- P(X<2) 1- [P(X) +P(X1)] 1-(e -1 + e -1 ),264 c) E(X) n*p λ 1 d)d 2 (X) λ 1
Zadanie praca indywidualna W zawodach strzeleckich bierze udział 12 zawodników. Każdy oddaje 7 strzałów do wyznaczonego celu Niech zmienna losowa X oznacza liczbę trafionych strzałów, wyznaczyć Rozkład zmiennej X Wykonać wykres tego rozkładu Wskazać najbardziej prawdopodobną liczbę trafionych Obliczyć oczekiwaną liczbę strzałów trafionych Jakie jest prawdopodobieństwo przejścia do następnego etapu jeśli warunkiem jest uzyskanie co najmniej 5 trafionych
Rozkład zmiennej losowej ciągłej Uwagi o zmiennej losowej ciągłej: Liczba wszystkich możliwych i wzajemnie wykluczających się zdarzeń elementarnych jest nieskończona Dystrybuanta dla dowolnej zmiennej losowej F() P (X<), Zmienna losowa o dystrybuancie F jest typu ciągłego, jeśli istnieje funkcja f, spełniająca równość F ( ) f ( ) d (1) Funkcję f nazywa się gęstością prawdopodobieństwa zmiennej losowej ciągłej
Związek dystrybuanty i gęstości zmiennej losowej ciągłej Dla dowolnej funkcji f, będącej gęstością prawdopodobieństwa zachodzi zależność F ( ) f ( ) d 1 Dla zmiennej losowej ciągłej zachodzi równość P(a X b) F(b) F (a) Stąd wynika, że: P (X a) ponieważ P (X a) P (a X a) F (a) - F (a)
Funkcja gęstości prawdopodobieństwa Funkcja gęstości prawdopodobieństwa odgrywa najważniejszą rolę w definiowaniu rozkładów prawdopodobieństwa zmiennych losowych typu ciągłego. Definicja Funkcją gęstości prawdopodobieństwa zmiennej losowej typu ciągłego nazywamy funkcję f (), określoną na zbiorze liczb rzeczywistych, taką że: f() ( przyjmuje wartości nieujemne) oraz dla dowolnych a < b zachodzi b f ( ) d P( a < X < b) a
Interpretacja graficzna związku funkcji gęstości z prawdopodobieństwem f() a b b f ( ) d P( a < X < b) a
Własności funkcji gęstości prawdopodobieństwa Funkcja gęstości jest nieujemna; f. W punktach, w których f jest ciągła zachodzi równość: f() F (); funkcja gęstości jest pochodną dystrybuanty. Każda funkcja f, będąca gęstością prawdopodobieństwa, wyznacza jednoznacznie pewną dystrybuantę, a tym samym rozkład prawdopodobieństwa pewnej zmiennej. Z faktu, że prawdopodobieństwo zdarzenia jest równe zeru, nie wynika, że zdarzenie to jest niemożliwe, bo P( X ) lim P( X < + ) lim + f ( ) d f ( ) d
Przykład czy dana funkcja może być funkcją gęstości Sprawdzić czy dana funkcja f, f ( ) e dla dla < 1. jest gęstością prawdopodobieństwa 2. znaleźć dystrybuantę F() 3. obliczyć P (X<,5) P (1<X<2) 4. przedstawić graficzną interpretację wyników obliczeń
Rozwiązanie Czy f jest gęstością prawdopodobieństwa: 1. Funkcja f jest nieujemna 2. f ( ) d d + e d e 1 Dystrybuanta F ( ) 1 e dla dla > P(X<,5) F(,5) 1- e -,5 P(1<X<2) F(2) F(1) (1- e -2 ) ( 1- e -1 ) e -1 + e -2
Zadanie do domu Wyznaczyć stałą A taką, aby funkcja f była gęstością prawdopodobieństwa zmiennej losowej X. Obliczyć P(X>1) Zinterpretować otrzymane wyniki na wykresie gęstości i dystrybuanty f ( ) 3 Ae dla dla <
Funkcje zmienne losowej Niech zmienna losowa Y będzie funkcją pewnej zmiennej X, tzn Y( ω) g(x(ω)) Znając rozkład zmiennej X możemy wyznaczyć rozkład zmiennej Y Zadanie : Znaleźć rozkład zmiennej losowej Y (dystrybuantę i gęstość), gdy : Y ax+b, gdzie a X jest zmienną losową typu ciągłego z gęstością f X i dystrybuantą F X Rozważmy dwa przypadki : a> i a<
Funkcje zmienne losowej dla a> F Y (y) P(Y<y) P(aX+b <y) P(X<(y-b)/a) F X ((y-b)/a) zauważmy, że funkcja F X jest różniczkowalna w punktach ciągłości f X więc f Y d d y b d ( y ( y) FY ( y) FX ( ) dy dy a dy y b ( ) a dla < F Y (y) P(Y<y) P(aX+b <y) P(X >(y-b)/a) 1- F X ((y-b)/a) zauważmy, że funkcja F X jest różniczkowalna w punktach ciągłości f X więc f Y d d y b d ( y) FY ( y) [1 FX ( )] dy dy a dy y b) / a f f X ( ) d ( ) d 1 a f X 1 a y b ( ) X X ( b)/ a a f gęstość f Y (y) możemy napisać przy użyciu jednego f Y ( y) 1 a f X ( y b ) a
Wartość przeciętna i wariancja zmiennej losowej ciągłej Obliczyć wartość oczekiwaną i wariancję zmiennej losowej ciągłej, o gęstości prawdopodobieństwa wartość oczekiwana/nadzieja matematyczna [ ] [ ] 1 ) ( ) ( 1 _ + e e d e e d e d f X E < ) ( dla e dla f [ ] 2 2 ) ( ) ( ) ( 2 2 _ 2 2 2 + d e e e d d e d f X E wariancja/dyspersja: D 2 (X) E[X-E(X)] 2 E(X 2 )-(E(X)) 2 D 2 (X) 2-1 2 1
Mediana, Medianę zmiennej losowej X oznaczaną 1/2 lubm e definiują następujące wzory P( {ω: X(ω) m e }) 1/2 i P( {ω: X(ω) m e }) 1/2 Dla zmiennej losowej ciągłej medianę wyznacza się ze wzoru 1 2 Przykład czyli 1- ep(- m e )1/2 m e m e _ e d f ( ) d 1 2 stąd m e ln2
Kwantyle Mediana jest szczególnym przypadkiem ogólniejszego parametru, zwanego Kwantylem. Definicja Kwantylem rzędu p (<p<1) zmiennej losowej X, o dystrybuancie F, nazywamy liczbę p, taką że F( p ) p F( p +) Dla zmiennej losowej ciągłej kwantyl p jest wyznaczany z wzoru F( p ) p Mediana jest kwantylem rzędu 1/2
Rozkład jednostajny Rozkład jednostajny (zwany też równomiernym lub prostokątnym albo płaskim) to ciągły rozkład prawdopodobieństwa, dla którego gęstość prawdopodobieństwa w przedziale od a do b jest stała i różna od zera, a poza nim równa zeru. Ponieważ rozkład jest ciągły, nie ma większego znaczenia czy punkty a i b włączy się do przedziału czy nie. Rozkład jest określony parą parametrów a i b, takich że b>a.
Rozkład jednostajny Funkcja gęstości prawdopodobieństwa f ( ) ; < a 1 ; a b a ; > b b Dystrybuanta Wartość oczekiwana E( X ) a + b 2 Wariancja D ( X ) ( b ) 2 a 12 2
Zastosowanie rozkładu jednostajnego Rozkład jednostajny: ma zastosowanie przy analizie niepewności systematycznych. Gęstość prawdopodobieństwa f() jest stała wewnątrz przedziału (a, b) i równa zero poza nim. Dla pomiarów obarczonych niepewnością systematyczną, mamy b a 2, zatem S D ( ) ( b 2 2 X a 12 ) 3
Zadanie Punkt materialny porusza się ruchem jednostajnym po okręgu koła o promieniu r. Niech O będzie ustalonym punktem okręgu, natomiast X długością łuku łączącego punkty OM. Określić rozkład zmiennej losowej X Narysować wykres funkcji gęstości i dystrybuanty zmiennej X Obliczyć P (X<πr) oraz P(X> 3πr/2) Obliczyć wartość oczekiwaną i wariancję X M O
Rozwiązanie zadania postać funkcji gęstości f ( ) 1 2πr ; ; ; < 2πr ; > 2πr Zadanie należy dokończyć samodzielnie
Zadanie praca samodzielna Pociągi przyjeżdżają na stację dokładnie co 1 minut. Pasażer przychodzi na stację w pewnej przypadkowej chwili. Niech X oznacza czas oczekiwania na przybycie pociągu. Należy: Określić funkcję gęstości prawdopodobieństwa f, wykonać wykres Określić dystrybuantę F, wykonać wykres Obliczyć P(X<8) i przedstawić interpretację graficzną Obliczyć oczekiwany/średni czas czekania na przyjazd pociągu
Rozkład wykładniczy Funkcja gęstości f() λ e - λ Dystrybuanta: F() 1- e - λ Wartość oczekiwana E() λ -1 Wariancja D (X) λ -2 Znajduje zastosowanie do obliczania prawdopodobieństwa przejścia obiektu ze stanu X w stan Y w czasie δt, przy stałym, w jednostce czasu, prawdopodobieństwie zmiany stanu obiektu z X na Y.
Rozkład wykładniczy - zastosowania w zagadnieniach ruchu na liniach telefonicznych w problemach czasu eksploatacji elementów maszyn w problemach czasu obsługi i czasu oczekiwania na obsługę przy maszynach, w sklepach itp Niezawodność urządzenia to prawdopodobieństwo tego, że urządzenie wykona zamierzone zadanie w określonym przedziale czasu i w określonych warunkach prawdopodobieństwo niewystąpienia uszkodzeń w ciągu czasu t. Sprawdzono, że dobrą aproksymacją niezawodności jest funkcja N(t) e -λt dla t> (wykładnicze prawo niezawodności) z tego wynika, że N(t)1-F(t) gdzie F(t) jest dystrybuantą w punkcie t, zmiennej losowej T (czas poprawnej pracy) o rozkładzie wykładniczym
Rozkład normalny Rozkład zwany rozkładem Gaussa-Laplace'a jest najczęściej spotykanym rozkładem zmiennej losowej ciągłej. Mówimy, że zmienna losowa ciągła X ma rozkład normalny o wartości oczekiwanej µ i odchyleniu standardowym σ, co symbolicznie zapisuje się: X ~ N ( µ,σ )
Rozkład normalny funkcja gęstości Funkcja gęstości w rozkładzie normalnym o postaci: f ( ) σ 1 2 π e ( µ ) 2σ 2 2 określona została dla wszystkich rzeczywistych wartości zmiennej X.
Rozkład normalny wykres funkcji gęstości i interpretacja f() σ µ Parametry rozkładu N(µ,σ), µ - Wartość oczekiwana σ 2 - Wariancja
Rozkład normalny Funkcja gęstości w rozkładzie normalnym o postaci: f ( ) σ 1 2 π e 2 ( µ ) określona została dla wszystkich rzeczywistych wartości zmiennej X. 2 σ 2
Cechy charakterystyczne funkcji gęstości rozkładu normalnego Funkcja gęstości w rozkładzie normalnym: jest symetryczna względem prostej µ w punkcie µ osiąga wartość maksymalną ramiona funkcji mają punkty przegięcia dla µ -σ oraz µ + σ Kształt funkcji gęstości zależy od wartości parametrów: µ,σ: - parametr µ decyduje o przesunięciu krzywej, - parametr σ decyduje o smukłości krzywej.
Wykresy funkcji gęstości rozkładów N (µ, σ) Przykłady funkcji gęstości rozkładów N (µ,σ) dla różnych wartości µ i σ,5 N(,1) N(3,1) N(,2) N(3,2) -4-3 -2-1 1 2 3 4
Wykresy dystrybuanty rozkładów N (µ, σ) Wykresy dystrybuanty rozkładu normalnego N(µ,σ), dla różnych wartości µ i σ 1,2 1,8,6 N (,1) N (3,1) N (,2) N (3,2),4,2 -,2-4 -3-2 -1 1 2 3 4
Rozkład normalny Reguła 3 sigma Jeżeli zmienna losowa ma rozkład normalny N(µ,σ) to: - 68,3 % populacji mieści się w przedziale (µ -σ; µ + σ) - 95,5 % populacji mieści się w przedziale (µ - 2σ; µ + 2σ) - 99,7 % populacji mieści się w przedziale (µ - 3σ; µ + 3σ)