Rachunek Prawdopodobieństwa istatystyka W4 Rozkład normalny Parametry rozkładu zmienne losowe Zmienne losowe wielowymiarowe Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl
Rozkład normalny - standaryzaca Standaryzaca polega na sprowadzeniu dowolnego rozkładu normalnego N(µ,σ, o danych parametrach µi σ do rozkładu standaryzowanego (modelowego o wartości oczekiwane µ 0 i odchyleniu standardowym σ 1. Zmienną X zastępue zmienna standaryzowana U, która ma rozkład N(0,1. Wtedy otrzymamy następuące zależności: u x σ µ f(x ϕ(u, F(x Φ(u, czyli: P( X x F( x x µ Φ( σ
Własności dystrybuanty standaryzowanego rozkładu normalnego: ( ( ( 1 ( 1 ( ( 1 ( ( ( ( ( ( u u U P u u U P u U P u u u U P u u U P x X P x F Φ > Φ > Φ Φ Φ
gdzie Φ(u oznacza wartości dystrybuanty standaryzowanego rozkładu normalnego N(0,1. Wartości te znadziemy w tablicach statystycznych Φ Φ < Φ Φ < < < σ µ σ µ σ µ σ µ σ µ σ µ σ µ σ µ σ µ a b a F b F b X a P a b b U a P b X a P b X a P ( ( ( ( Obliczanie prawdopodobieństwa w rozkładzie normalnym Obliczanie prawdopodobieństwa, że zmienna losowa X, o rozkładzie N (µ, σ, przymie wartości z przedziału (a,b
Zadanie: Wzrost kobiet w pewne populaci ma rozkład normalny N(165,15. Oznacza to, iż zmienna losowa aką est wzrost kobiet ma rozkład normalny ze średnią równą 165 cm odchyleniem standardowym równym 15 cm. Jaki est udział w populaci kobiet o wzroście: a do 160 cm, b w przedziale 165-170 cm, c powyże 175 cm d dokładnie 150 cm
Rozwiązanie: a poniże 160 cm X 165 160 165 P( X 160 P P( U 0,33 15 15 Φ( 0,33 1 Φ(0,33 1 0,6293 0,3707 innym sposobem 160 165 P( X 160 F(160 Φ 15 Φ( 0,33 1 Φ(0,33 1 0,6293 0,3707
Rozwiązanie: b w przedziale 165-170 cm 165 165 X P(165 < X 170 P < 15 P(0 < U 0,33 Φ(0,33 Φ(0 165 170 165 15 15 0,6293 0,5 0,1293 P( X 1 c powyże 175 cm. X 165 175 165 > 175 P > P( U > 0,67 15 15 P( U 0,67 1 Φ(0,67 1 0,748571 0,251429 d dokładnie 150 cm. P( X 150 P(150 X 150 F(150 F(150 0
Parametry pozycyne rozkładu zmienne losowe Moda Dominanta. Mediana. Modą Mo ( DominantąDo zmienne losowe X nazywamy tę wartość zmienne losowe, które odpowiada: Nawiększe prawdopodobieństwo w przypadku zmienne dyskretne Maksimum lokalne funkci gęstości w przypadku zmienne losowe ciągłe. Medianą Me zmienne losowe X nazywamy wartość x, spełniaącą nierówności P(X x 0,5 i P (X x 0,5 natomiast dla dystrybuanty mamy 0,5 F(x 0,5+P(Xx dla zmienne dyskretne F(x0,5 dla zmienne ciągłe
Symetria rozkładu zmienne losowe Zmienna losowa ma rozkład symetryczny eśli istniee taka wartość a, że: W przypadku zmienne dyskretne każdemu punktowi skokowemu x i a odpowiada punkt x a, taki, że P(X x i P(Xx oraz a- x i x -a W przypadku zmienne losowe ciągłe o funkci gęstości f(x : f(a-xf(a+x dla każdego x w punktach ciągłości f(x. Punkt a nosi nazwę środka symetrii, a prosta xa est osią symetrii rozkładu zmienne losowe. Jeśli rozkład est symetryczny, to środkiem symetrii est wartość oczekiwana W rozkładzie symetrycznym wszystkie momenty centralne nieparzystego rzędu równe są zero
Asymetria rozkładu zmienne losowe Zmienna losowa ma rozkład asymetryczny eśli nie istniee taka wartość a (taki punkt a, który spełnia warunki rozkładu symetrycznego. Ze względu na to, że w rozkładzie asymetrycznym momenty centralne rzędu nieparzystego są różne od zera, do określenia współczynnika asymetrii (skośności rozkładu wykorzystue się trzeci moment centralny µ 3, mianowicie γ D µ 3 ( 3 X Jeśli γ>0, asymetria rozkładu est dodatnia prawostronna (wydłużenie w kierunku dużych wartości Jeśli γ<0, asymetria rozkładu est uemna - lewostronna (wydłużenie w kierunku małych wartości
Wyznaczyćwskaźniki położenia zmienne X: wartośćoczekiwaną, modę, medianę, kwantylrzędu 0,75, Dla zmienne losowe, które funkca gęstości dana est wzorem f ( x x 2 + 2 3 0 0 < x < 1 wprzeciwnymprzypadku E(X 7/12 Mo 1 Me obliczę z równania F(Me 1/2; Me 9/24 Q 3 F(Q 3 3/4 stąd Q 3 41/64
Zmienna losowa wielowymiarowa Dana est przestrzeń probabilistyczna (Ω, S, P i w te przestrzeni n zmiennych losowych X 1,X 2,...,X n Definica Uporządkowany układ n zmiennych losowych, oznaczony X (X 1,X 2,...,X n nazywamy wektorem losowym lub n -wymiarową zmienną losową, co oznacza, że każdemu zdarzeniu ω Ω przyporządkowano punkt przestrzeni euklidesowe R n FunkcęP X (A P({ω: X(ω A} nazywamy rozkładem prawdopodobieństwa wektora losowego X, a ego dystrybuanta est określona wzorem F X (x P(X 1 <x 1,X 2 <x 2,...,X n <x n
Przykłady Badamy trzy cechy człowieka : wiek, ω 1 [18,100] [lat] wzrost, ω 2 [140, 210][cm] waga, ω 3 [40,150][kg] ω (ω 1, ω 2, ω 3 Ω Zmienne losowe definiuę następuąco: X 1 ( ω ω 1 X 2 ( ω ω 2... X n ( ω ω n
Tablicowa reprezentaca dwuwymiarowego rozkładu zmienne losowe skokowe Yy 1 Y y 2 Y y 3 Y y 4 Y y 5 Y y 6 Rozkład brzegowy zmienne X X x 1 p 11 p 12 p 13 p 14 p 15 p 16 p 1. X x 2 p 21 p 22 p 23 p 24 p 25 p 26 p 2. X x 1 p3. p 31............... Rozkład brzegowy zmienne Y p p.2 p.3 p.4 p.5 p.6.1 1
Dwuwymiarowa zmienna losowa (para zmiennych typu skokowego Def. Dwuwymiarowa zmienna losowa est typu skokowego eśli przymue skończoną lub co nawyże przeliczaną liczbę wartości (x 1,y, (i,1,2,. odpowiednio z prawdopodobieństwami p i, Zachodzi przy tym warunek: (* p 1 i gdzie p i i ( X x, Y y ( i, 1,2,... P i Uwaga, w celu właściwe interpretaci wartości p i,, należy pamiętać, że zapis (Xx i,yy oznacza iloczyn zdarzeń Xx i i Yy
Niezależność zmiennych losowych typu skokowego Para (X, Y est dwuwymiarową zmienną losową typu skokowego, Zmienne X i Y nazywamy niezależnymi, eśli dla każde pary wartości (x i, y spełniony est warunek: P(Xx i,yy P(Xx i *P(Yy czyli p i p i. * p. Oznacza to, że zmienne losowe X i Y są niezależne eśli prawdopodobieństwa w łącznym rozkładzie tych zmiennych są równe iloczynowi odpowiednich prawdopodobieństw ich rozkładów brzegowych. Dla zmiennych niezależnych musi być spełniony warunek: pi P ( X xi Y y pi. P( X x p oraz pi P ( Y y X xi p. P( Y y p. i. i
Dystrybuanta dwuwymiarowe zmienne losowe Dystrybuantą dwuwymiarowe zmienne losowe nazywamy funkcę rzeczywistą określoną wzorem: dla zmienne losowe typu skokowego F ( x, y pi x i x y y dla zmienne losowe typu ciągłego (, (, (, F x y P X x Y y f u v dudv x y
Rozkład dwuwymiarowe zmienne losowe typu ciągłego Funkcą gęstości dwuwymiarowe zmienne losowe (X,Y typu ciągłego nazywamy funkcę rzeczywistą określoną wzorem:, ( f x, y lim x 0 y 0 o następuących własnościach: f ( x y, 0 dla x, y R ( < < +, < < + P x X x x y Y y y x y x2 y2 + ( f x, y d x d y 1 (, (, f x y dxdy P x < X x y < Y y x1 y1 + 1 2 1 2
Dwuwymiarowy rozkład normalny Funkca gęstości dwuwymiarowego rozkładu normalnego N(µ1,µ2,σ1,σ2,ρ
Brzegowe funkce gęstości + ( ( f1 x f x, y dy; + ( (, f2 y f x y dx
Warunkowe funkce gęstości: ( / f x y (, ( y f x y f 2 ; ( / f y x f ( x, y ( x f 1
Niezależnośćdwuwymiarowych zmiennych losowych ciągłych Zmienne losowe X i Y typu ciągłego są niezależne, eśli dla dowolne pary liczb rzeczywistych (x,y zachodzi równość: ( x, y f ( x f ( y f 1 2
Momenty zwykłe dwuwymiarowe zmienne losowe Momentem zwykłym rzędu kl, dwuwymiarowe zmienne losowe (X, Y nazywamy wyrażenie m kl E ( k l X Y i x k y l x f i k y ( x, l p i y dxdy Na przykład ( XY E ( X E ( Y m 10 01 m 11 E m
Parametry rozkładu dwuwymiarowe zmienne losowe typu skokowego Wartością oczekiwaną dwuwymiarowe zmienne losowe typu skokowego nazywamy wyrażenie: E ( X, Y E ( X E ( Y x i y p i i Wariancą dwuwymiarowe zmienne losowe typu skokowego nazywamy wyrażenie: D 2 ( [ ( ] 2 [ ( ] 2 X, Y E X E X Y E Y i 2 [ x E( X ] y E( Y i [ ] 2 pi
Momenty centralne dwuwymiarowe zmienne losowe Momentem centralnym rzędu k+l (k,l 0,1,2,... dwuwymiarowego rozkładu zmienne losowe (X,Y nazywamy wyrażenie µ i kl E ( x i ( x m k l ( X m ( Y m m 10 10 k k 10 Wzór dla zmienne skokowe ( y Wzór dla zmienne ciągłe ( y m m 01 01 l l 01 p i f ( x, y dxdy
Parametry dwuwymiarowych zmiennych losowych Kowarianca Def. Kowariancą zmienne losowe dwuwymiarowe (X,Y nazywamy wyrażenie: cov cov ( X, Y E ([ X E ( X ][ Y E ( Y ] ( X, Y cov xy µ 11 σ xy
Wzory na obliczanie kowarianci cov( dla zmienne losowe skokowe X, Y i dla zmienne losowe ciągłe [ x E ( X ] y E ( Y i [ ] p i σ xy + + ( x m ( y m f ( x dx dy dla danych empirycznych 1 n S ( x x ( y y xy i i n i 1 Jeśli zmienne X i Y są niezależne to cov(x,y0, Twierdzenie odwrotne w ogólności nie est prawdziwe x y
Parametry dwuwymiarowych zmiennych losowych Współczynnik korelaci liniowe ρ cov( D( X X, Y D( Y ρ µ 11 µ 02 µ 20
Współczynnik korelaci liniowe Współczynnik korelaci opisue siłę liniowego związku pomiędzy dwiema zmiennymi. Przymue on wartości z przedziału domkniętego <-1; 1>. Wartość -1 oznacza występowanie doskonałe korelaci uemne (to znaczy sytuacę, w które punkty leżą dokładnie na proste, skierowane w dół, a wartość 1 oznacza doskonałą korelacę dodatnią (punkty leżą dokładnie na proste, skierowane w górę. Wartość 0 oznacza brak korelaci liniowe
Przykłady układów punktów przy różnych wartościach współczynnika korelaci liniowe
Analiza rozkładu łącznego zmienne dwuwymiarowe (X,Y Y pęknięcie Y zgorzelina Y mat.pow Y wżery Y skaza Y inne Rozkład zmienne X X duże 0.05 0.01 0.02 0.01 0.11 0.06 0.26 X średnie 0.1 0.03 0.06 0.02 0.09 0.03 0.33 X małe 0.1 0.06 0.01 0.03 0.20 0.01 0.41 Rozkład zmienne Y 0.25 0.1 0.09 0.06 0.40 0.10 1 Rozkłady brzegowe zmiennych losowych Y i X
Analiza rozkładu łącznego (JPD zmienne dwuwymiarowe (X,Y Na podstawie tablicy JPD można obliczać prawdopodobieństwa dowolnych zdarzeń losowych (każde zdarzenie est sumą zdarzeń elementarnych/atomowych W wierszu oraz kolumnie i tabeli JPD, znadue się prawdopodobieństwo zdarzenia atomowego polegaącego na ednoczesnym przyęciu wartości y i przez zmienną Y oraz wartości x przez zmienną X, np. P(X średnia,y skaza 0.09. W ostatnim wierszu tabeli nr 1 zamieszczono rozkład zmienne Y, który uzyskue się w wyniku sumowania wartości pól w kolumnach, W ostatnie kolumnie zamieszczono rozkład zmienne X, uzyskany w wyniku sumowania wartości pól w wierszach, są to rozkłady brzegowe zmienne (X,Y. Suma prawdopodobieństw wszystkich zdarzeń atomowych wynosi 1 (est to warunek konieczny, wynikaący z definici rozkładu prawdopodobieństw
Zastosowania tablicowe reprezentaci JPD Prawdopodobieństwo zdarzenia polegaącego na tym, że wylosowano wyrób ze skazą lub akąkolwiek małą wadą (Y skaza lub X mała można obliczyć z tabeli JPD dodaąc wszystkie wartości w kolumnie Y skaza i wierszu X mała, licząc zawartość pola na przecięciu kolumny skaza i wiersza mała tylko eden raz. 0.1 + 0.06 + 0.01 + 0.03 + 0.2 +0.01+ 0.09 + 0.11 0.61 Wynik ten est taki sam ak dla prawdopodobieństwa sumy zdarzeń (X Y, bo: P (X Y P(X + P(Y P(X,Y 0.41 + 0.4-0.2 0.61
Prawdopodobieństwo warunkowe Prawdopodobieństwo łączne Prawdopodobieństwa warunkowe można obliczyć korzystaąc z tablicy JPD, np. P(pęknięcie/małe P(pęknięcie,małe : P(małe 0,1 : 0,41 0,244 P(małe/pęknięcie P(pęknięcie,małe :P(pęknięcie 0,1: 0,25 0,4 Prawdopodobieństwo łączne: P(A,B P(A B P(A/B * P(B
Zadanie Dany est rozkład zmienne losowe (X,Y X Y 1 2 3 3 0,2 0,2 0 4 0,1 0,2 0,3 1. Znaleźć rozkłady brzegowe i obliczyć E(X i D(X. 2. Wyznaczyć rozkład warunkowy P(X/Y1 i obliczyć wartość oczekiwaną w tym rozkładzie. 3. O czym świadczy porównanie wyników E(X i E(X/Y1?