METODY ANALIZY DANYCH NIEPEWNYCH LITERATURA PODSTAWOWA. Z. Hellwig, Elementy Rachunku Prawdopodobieństwa i Statystyki Matematycznej, PWN, Warszawa, 995 2. W. Krysicki i inni, Rachunek Prawdopodobieństwa i Statystyka Matematyczna w Zadaniach, PWN, Warszawa 995 (Tom I i II) 3. M. Fisz, Rachunek Prawdopodobieństwa i Statystyka Matematyczna, PWN, Warszawa 979 4. W. Feller, Wstęp do Rachunku Prawdopodobieństwa, PWN, Warszawa 978 5. S. Zubrzycki, Wykłady z Rachunku Prawdopodobieństwa i Statystyki Matematycznej, PWN, Warszawa 980 6. F. Sawicki, Elementy Statystyki dla Lekarzy, PZWL, Warszawa 992 7. G.R. Rao, Statystyka i Prawda, PWN, Warszawa 994 8. L. Garding, Spotkanie z Matematyką, PWN, Warszawa 993
RYS HISTORYCZNY: początek XVII w. - B. Pascal, P. Fermat - pierwsze prace inspirowane grami hazardowymi koniec XVII w. - J.Bernoulli - pierwsze formalizmy, aksjomaty rachunku prawdop. (książka: Traktat o sztuce przewidywania) - ich rozwój: A. de Moivre (XVIII w.). XVIII w. W. Petty - początek statystyki (książka: Rozważania dotyczące rozmiarów cen ziemi, ludności, zabudowań, gospodarki rolnej, manufaktury, handlu, przemysłu rybnego, rzemieślników, marynarzy, żołnierzy, oraz dochodów państwowych, procentów, podatków, sposobów powiększania dochodów). XIX w. - szybki rozwój rach. prawdop. i statystyki: K. Gauss (teoria błędów obserwacji, metoda najmniejszych kwadratów), A. Cauchy, S. Poisson (badanie rozkładów prawdopodobieństwa), L. Euler (badania demograficzne i ubezpieczenia). XX w. - A. Kołmogorow (teorio-mnogościowe podejście do rachunku prawdopodob.). Polscy matematycy: Hugo Steinhaus, K. Urbanik 2
RACHUNEK PRAWDOPODOBIEŃSTWA Dział matematyki zajmujący się opisywaniem i badaniem zdarzeń przypadkowych i niepewnych Doświadczenie losowe: doświadczenie (eksperyment), którego wyniku z góry nie można określić, gdyż zależy on od przypadku (np. rzut monetą lub kostką, urodziny dziecka, czas oczekiwania na tramwaj, długość gwoździa calowego) Zdarzenie (zdarzenie losowe) wynik doświadczenia losowego. Zbiór możliwych wyników doświadczenia losowego (zbiór możliwych zdarzeń) jest na ogół znany: np. {orzeł, reszka}, {,2,3,4,5,6}, o {dziewczynka, chłopiec}, [0-5(min)], o [2-3(cm)]. 3
ZDARZENIA LOSOWE Zdarzenie elementarne pojęcie pierwotne w aksjomatyce rach. prawd. - elementarny, niepodzielny wynik doświadczenia losowego. Oznaczenia: e - zdarzenie elementarne, E - przestrzeń zdarzeń elementarnych (skończona, nieskończona) e E Przykłady:. Rzut monetą: E = { e, e2}, e orzeł, e2 reszka (skończona) 2. Rzut kostką: E = { e, e2, e3, e4, e5, e6 } (skończona) 3. Czas oczekiwania na tramwaj: E = ( 05, ) (nieskończona) 4
Zdarzenie (losowe) każdy podzbiór przestrzeni E (wliczając w to zbiór pusty i całą przestrzeń E ) Zdarzenia będziemy oznaczać dużymi literami: A, B, C,... Np. E = { e, e2, e3, e4, e5, e6, e7, e8, e9 }, A = { e, e2, e3 }, B = { e, e } 5 7. Zdarzenie A zachodzi wtedy i tylko wtedy, gdy zachodzi którekolwiek ze zdarzeń elementarnych wchodzących w jego skład. Zdarzenia szczególne: - zdarzenie niemożliwe (zbiór pusty) I = E - zdarzenie pewne 5
Przykłady zdarzeń losowych:. Rzut monetą: E = { OR, }, A =, A = { O}, A = { R}, A = { O, R} 2 3 4 liczba wszystkich zdarzeń: 4 2. Rzut kostką: E = {, 23456,,,, } Przykłady zdarzeń: A= {, 246, }, A2 = {, 23, } liczba wszystkich zdarzeń: 64 3. Dwukrotny rzut monetą: E = { OO, OR, RO, RR} Przykłady zdarzeń: A = { OO, OR}, A2 = { OR, RO}, A3 = { OO, OR, RO} liczba wszystkich zdarzeń: 6. 6
4. Czas oczekiwania na tramwaj: E = ( 05), Przykłady zdarzeń: A = ( 02, ), A2 = ( 35), ilość wszystkich zdarzeń:. 5. Wiek małżonków: Wiek żony 00 E Narysować zdarzenia:. A - mąż ma więcej niż 50 lat 2. A 2 -żona jest młodsza od męża o 20 lat 3. A 3 - mąż jest starszy od żony 4. A 4 - suma lat małżonków jest mniejsza niż 00 8 00 wiek męża 7
Relacje pomiędzy zdarzeniami zdarzenie A zawiera się w B A B - gdy każde zdarzenie elementarne należące do A należy do B lub równoważnie: zdarzenie A pociąga (implikuje) zdarzenie B A B - (jeśli zachodzi A, to na pewno zachodzi także B) Przykład: doświadczenie losowe - wyciągnięcie karty z talii. A - wyciągnięcie pika, B - wyciągnięcie karty czarnej A B. czy B A? zdarzenia równoważne A = B (wtedy jednocześnie A B i B A) 8
zdarzenia wyłączające się (wykluczające się) gdy A i B nie mają wspólnych elementów tzn: jeśli zachodzi A, to nie zachodzi B i odwrotnie. Przykład: Zdarzenie losowe- ilość osób z grupy 0-osobowej, która dożyje do 200 roku E = { e0, e, e2, e3, e4, e5, e6, e7, e8, e9, e0 } Zdarzenia: A = { e2 }, B = { e 5 }, C = { e 5, e 6, e 7, e 8, e 9, e 0 } wyłączające? - które są Operacje na zdarzeniach 9
Zbiór zbiór pusty zbiór pełny Zdarzenie zdarzenie niemożliwe zdarzenie pewne Suma zdarzeń (alternatywa) A= A i zdarzenie A zachodzi wtedy, gdy zachodzi którekolwiek ze zdarzeń A i Różnica zdarzeń A = A A2 zdarzenie A zachodzi wtedy, gdy zachodzi A i nie zachodzi A 2. gdy A i A 2 są wyłączające się (rozłączne), to A A2 = A. Iloczyn zdarzeń (koniunkcja) 0
A= A i zdarzenie A zachodzi wtedy, gdy zachodzą wszystkie A i. gdy A i A 2 wykluczają się, to własności iloczynu zdarzeń:. A A = A 2. A = 3. A I = A A A 2 = Przykład - ilość samochodów i telewizorów w gospodarstwie domowym ( 2) E = { e00, e0, e0, e, e20, e2, e02, e2, e22 } A - w losowo wybranym gospodarstwie jest co najmniej samochód i nie mniej niż telewizor B - w losowo wybranym gospodarstwie jest dokładnie samochód i nie więcej niż telewizor A = { e, e2, e2, e22 }, B = { e0, e }, A B ={ e }. Zdarzenie przeciwne (dopełniające) do zdarzenia A
A = I A Zdarzenie A zachodzi wtedy, gdy nie zachodzi zdarzenie A. Własności zdarzeń przeciwnych. A+ A = I, 2. A A = Przykład: A - wyciągamy kartę w kolorze pik lub trefl - co to jest A? DIAGRAM EULERA 2
A A A + A A A 2 2 A A + A A A 2 2 A A + A 2 2 A A A A 2 2 3
PRAWDOPODOBIEŃSTWO Definicja klasyczna (Laplace) Jeżeli przestrzeń E zawiera n jednakowo możliwych zdarzeń elementarnych, z których m sprzyja zajściu zdarzenia A (A zawiera m zdarzeń elementarnych), to prawdopodobieństwem zdarzenia A nazywamy ułamek Wnioski: m P( A) =. n. 0 P( A), 2. P( I)=, P( ) = 0 3. Jeśli A, A2 są zdarzeniami wykluczającymi się, to P( A + A ) = P( A ) + P( A ) 2 2 Wady definicji klasycznej: Tautologia ( w definicji użyto słowa definiowanego; jednakowo możliwe zdarzenie = jednakowo prawdopodobne) skończona przestrzeń E, wymaga znajomości zbioru zdarzeń sprzyjających Definicja częstościowa (Mises) zliczamy zajścia zdarzeń Jeżeli przy wielokrotnej realizacji doświadczenia losowego, częstość wystąpienia zdarzenia losowego A oscyluje wokół pewnej nieznanej 4
liczby p, i jeżeli wahania częstości maleją wraz ze wzrostem liczby doświadczeń, to liczba p będzie prawdopodobieństwem zdarzenia A. P(A) = lim n m n Wada: Liczba doświadceń jest wartością ograniczoną Definicja aksjomatyczna (Kołmogorow): Każdemu zdarzeniu A związanemu z określonym doświadczeniem losowym przyporządkowujemy liczbę P(A) o następujących własnościach. 0 P( A), 2. P( I)=, 3. Jeżeli A, A2, A3,... są zdarzeniami parami się wykluczającymi, to: P( A + A + A +...) = P( A ) + P( A ) + P( A ) +... 2 3 2 3 Wnioski:. P( ) = 0, bo: 5
I = I +, P( I) = P( I) + P( ), = + P( ) 2. P( A+ A) = 3. Jeżeli A B, to P( A) P( B) 4. Jeżeli A = B, to P( A) = P( B) Definicja geometryczna Jeżeli Q i q to dwa zbiory należące do przestrzeni n- wymiarowej, oraz jeżeli q zawiera się w Q to prawdopodobieństwo, że dowolny punkt z Q będzie należał do q, jest równe stosunkowi miary zbioru q do miary zbioru Q. Przykłady. Rzut kostką: P(parzysta liczba oczek)=?, P(liczba oczek podzielna przez 3)=? 2. Rzut dwoma kostkami: 6
Ile jest zdarzeń elementarnych? P(suma oczek podzielna przez 5) =? P(suma oczek = 2) =? P(suma oczek = 6) =? P(suma oczek = 7) =? (paradoks de Merego) 3. Dwóch graczy gra aż do 6 zwycięstw. Przy stanie 2:5 przerwali grę. Jak należy podzielić pulę? 7
Zdarzenia niezależne Dwa zdarzenia A i B nazywamy zdarzeniami niezależnymi, jeżeli zajście jednego z nich nie ma wpływu na prawdopodobieństwo zajścia drugiego zdarzenia. Przykład Zdarzenia niezależne 2 urny w obu kule białe i czarne; Wylosowanie jakiejkolwiek kuli z urny pierwszej nie ma wpływu na prawdopodobieństwo wylosowania jakiejkolwiek kuli z urny drugiej 8
Zdarzenia zależne Losowanie kuli z urny - schemat bez zwracania i ze zwracaniem W urnie jest 5 kul białych i 0 czarnych A zdarzenie polegające na wylosowaniu kuli białej w pierwszym losowaniu B - zdarzenie polegające na wylosowaniu kuli białej w drugim losowaniu Schemat ze zwracaniem więc 5 P ( A) = P( B) = = 5 3 P ( B) = 3 niezależnie od tego czy zaszło zdarzenie A czy nie. Zdarzenia A i B są niezależne 9
Schemat bez zwracania Gdy zdarzenie A zaszło tzn.: wylosowano kulę białą w pierwszym losowaniu, to: P ( B) = 4 4 gdy zdarzenie A, (wylosowano kulę czarną w pierwszym losowaniu), to: P ( B) = 5 4 Zdarzania A i B są zależne 20
Prawdopodobieństwo warunkowe Jeśli prawdopodobieństwo zdarzenia B zależy od dodatkowych okoliczności (warunków), to takie prawdopodobieństwo będziemy nazywać warunkowym. Warunek (okoliczność) - najczęściej zajście innego zdarzenia (A). Prawdopodobieństwo warunkowe zdarzenia B przy założeniu, że zaszło zdarzenia A oznaczamy symbolem: P( B / A) Dwa zdarzenia A i B są niezależne, jeśli: P( A / B) = P( A) oraz P( B / A) = P( B) Przykłady Rzut kostką A - zdarzenie, że wyrzuciliśmy mniej niż 2 oczka B - zdarzenie, że wyrzuciliśmy mniej niż 3 oczka P ( A) = 6 więc P ( A/ B) = 2 P( A) P( A/ B) 2
więc zdarzenia A i B są zależne Talia kart Losujemy z talii jedną kartę A wylosowanie figury B wylosowanie karty czarnej 6 P ( A) = = 52 4 3 8 P ( A/ B) = = 26 4 3 P ( A) = P( A/ B) Podobnie 26 P ( B) = = 52 2 8 P ( B / A) = = 6 2 P ( B) = P( B / A) więc zdarzenia A i B są zależne 22
Prawdopodobieństwo iloczynu zdarzeń A pole =k Pole =n B pole =r Pole prostokąta - n Pole lewego koła - k Pole prawego koła - r Pole powierzchni wspólnej - s A - zdarzenie, że trafimy w punkt lewego koła B - zdarzenie, że trafimy w punkt prawego koła AB (iloczyn) - trafimy w obszar wspólny Stąd mamy: k r s s PA ( ) =, PB ( ) =, PAB ( ) =, PA ( / B) =, PB ( / A) = n n n r s k dalej: 23
s PA ( / B) = = n = r s r n PAB ( ) PB ( ) Otrzymujemy stąd wzór na prawdopodobieństwo iloczynu dwóch zdarzeń: P( AB) = P( B) P( A / B) i w podobny sposób (jak?): P( AB) = P( A) P( B / A) Zdarzenia A i B są niezależne to Przykład P( AB) = P( A) P( B) Z talii wyciągamy kolejno dwie karty (bez zwracania). Policzyć prawdopodobieństwo, że będą to asy. A - prawdopodobieństwo wylosowania asa w pierwszym losowaniu B - prawdopodobieństwo wylosowania asa w drugim losowaniu 4 3 P ( AB) = P( A) P( B / A) = = 52 5 22 Uogólnienie na prawdopodobieństwo iloczynu 3 zdarzeń: 24
P ( ABC) = P( A) P( B / A) P( C / BA) dla n zdarzeń? Przykład Z talii ciągniemy kolejno 3 karty (bez zwracania). Policz prawdopodobieństwo, że będą to kolejno as, król i dama A prawdopodobieństwo wylosowania asa w pierwszym losowaniu B prawdopodobieństwo wylosowania króla w drugim losowaniu C prawdopodobieństwo wylosowania damy w trzecim losowaniu 4 4 4 P ( ABC) = P( A) P( B / A) P( C / AB) = = 52 5 50 8 6575 Zdarzenia A, B i C są niezależne, jeśli P( ABC) = P( A) P( B) P( C) oraz P( AB) = P( A) P( B), P( AC) = P( A) P( C), P( BC) = P( B) P( C) 25
Kiedy n zdarzeń jest niezależnych? Przykład Z urny, w której są 24 kartki ponumerowane liczbami, 2, 3,..., 24 losujemy jedną kartkę. Określamy następujące zdarzenia: A - wyciągamy liczbę nie większą niż 2 B - wyciągamy jedną z liczb:, 2, 3, 4, 5, 7 C - wyciągamy liczbę podzielną przez 3 Sprawdź, czy zdarzenia A, B i C są niezależne. P ( A) = 2 6 P ( B) = = 24 4 8 P ( C) = = 24 3 więc P ( ABC) = 24 P ( ABC) = P( A) P( B) P( C) = 24 Zdarzenia A, B, C nie są niezależne, gdyż: P( A) P( B) = 8 P( B) P( C) = 2 P( AB) = 4 P( BC) = 24 26
Prawdopodobieństwo sumy zdarzeń A B Pole prostokąta - n Pole lewego koła - k Pole prawego koła - r Pole powierzchni wspólnej - s Pole powierzchni obu kół - t A - zdarzenie, że trafimy w punkt lewego koła B - zdarzenie, że trafimy w punkt prawego koła AB - zdarzenie, że trafimy w punkt wspólnego obszaru A+B - zdarzenie, że trafimy w punkt lewego lub prawego koła Ponieważ: t k r s t = k+ r s lub = +, n n n n stąd mamy wzór na prawdopodobieństwo sumy zdarzeń: P( A+ B) = P( A) + P( B) P( AB) 27
Jak będzie wyglądał wzór dla 3 zdarzeń? Przykład: Z talii wyciągamy jedną kartę. Wyznacz prawdopodobieństwo, że będzie to figura lub karta czerwona. A wylosowanie figury B wylosowanie karty czerwonej 6 4 P ( A) = =, 52 3 P ( B) =, 2 8 P ( AB) = = 52 2 3 4 2 P ( A + B) = + = 3 2 3 7 26 28
Prawdopodobieństwo całkowite Przykład: Mamy dwie urny. W jednej urnie są 3 kule białe i 2 czarne, a w drugiej jest kula biała i 4 czarne. Schemat losowania jest następujący: najpierw losujemy urnę, a potem losujemy z niej kulę. Należy wyznaczyć prawdopodobieństwo wylosowania kuli białej. A - wylosowanie urny A 2 - wylosowanie urny 2 B - wylosowanie białej kuli P( B) = P( A ) P( B / A ) + P( A ) P( B / A ) 2 2 Jest to wzór na prawdopodobieństwo całkowite Dane jest dowolne zdarzenie B i układ zdarzeń A, A 2,..., A n, które są wyłączające się (rozłączne) i dające w sumie zdarzenie pewne. Musi więc zajść jedno i tylko jedno zdarzenie A, a zatem zdarzenie B - jeśli zajdzie - to musi zajść wraz z jednym i tylko jednym zdarzeniem A. Stąd wynika, że: B = BA+ BA2 +... + BA n, gdzie poszczególne składniki są zdarzeniami wyłączającymi się. 29
Mamy zatem: P( B) = P( BA) + P( BA2 ) +... + P( BA n ) a dalej, korzystając ze wzoru na prawdopodobieństwo iloczynu otrzymujemy wzór na prawdopodobieństwo całkowite: P( B) = P( B / A ) P( A ) + P( B / A ) P( A ) +... + P( B / A ) P( A 2 2 n n ) Przykład: Mamy 4 urny. W pierwszej jest kula biała i 999 czarnych, a w pozostałych po jednej białej i czarnej. Wyznaczyć prawdopodobieństwo wylosowania kuli białej. Jakie byłoby to prawdopodobieństwo, gdyby wszystkie kule były w jednej urnie? 30
Wzór Bayesa Wzór Bayesa (Thomas Bayes - 702-76) pozwala wyznaczyć prawdopodobieństwo zajścia jednego ze zdarzeń A i, jeśli zaszło zdarzenie B. Ze wzoru na prawdopodobieństwo iloczynu zdarzeń mamy: P( A B) = P( A ) P( B / A ) P( B) P( A / B), i i i = i a stąd P( A P B A PAi B i) ( / ( / ) i) =. PB ( ) Wykorzystując w mianowniku wzór na prawdopodobieństwo całkowite otrzymujemy wzór Bayesa: PA ( / B) = i PA ( i) PB ( / Ai) PA ( ) PB ( / A) + PA ( ) PB ( / A) + PA ( ) PB ( / A 2 2 n n) Przykład: 3
Dla danych jak w przykładzie poprzednim (z dwoma urnami) wyznaczyć prawdopodobieństwo wylosowania każdej z obu urn, pod warunkiem, że wyciągnięto kulę białą. Bayesowska teoria podejmowania decyzji ZMIENNE LOSOWE Zmienna losowa - wielkość, która w wyniku doświadczenia losowego przyjmuje określoną wartość liczbową (niemożliwą do przewidzenia wcześniej). Oznaczenia zmiennych losowych: X, Y, Z,..., ich wartości: x, y, z,... Realizacja zmiennej losowej - wartość, jaką przyjmuje zmienna losowa Przykłady:. Rzut kostką: X x { 23456,,,,, } 2. Temperatura powietrza w dniu 20.2. o godz. 2.00 x [ 30, 20] 3. Procentowa zmiana kursu akcji Banku Śląskiego x [ 0, + 0] 4. Czas oczekiwania na tramwaj x [ 05], 32
Zmienna losowa - funkcja odwzorowująca przestrzeń zdarzeń elementarnych w zbiór liczb [ x = Xe ( ) ] Rodzaje zmiennych losowych:. Zmienne losowe dyskretne (skokowe) - zbiór wartości jest skończony (przeliczalny) 2. Zmienne losowe ciągłe - zbiór wartości nieskończony (np. zbiór liczb rzeczywistych) Zmienna losowa przyjmuje swe wartości z określonymi prawdopodobieństwami (jej wartość zależy od wyniku doświadczenia losowego - zdarzenia). Rozkład prawdopodobieństwa zmiennej losowej - przyporządkowanie wartościom zmiennej losowej prawdopodobieństw. Dystrybuanta zmiennej losowej X: 33
Własności dystrybuanty:. 0 F( x) 2. F( ) = 0, F( + ) = 3. Jest funkcja niemalejącą: jeśli x < x to ( F( x ) F( x ) 2 2 F( x) = P( X < x) Dyskretne zmienne losowe Zmienna losowa X o wartościach ze zbioru { x, x 2, x 3,..., x n } Rozkład prawdopodobieństwa: Dystrybuanta: PX ( = x) = Px ( ) = p, p= i i i i i= n Fx ( ) = Px ( i ) x < x Narysować rozkład i dystrybuantę dyskretnej zmiennej losowej i 34
Przykłady dyskretnych zmiennych losowych. Zero-jedynkowa (binarna) zmienna losowa X przyjmuje dwie wartości: rozkład prawdopodobieństwa: x { 0,} P( X = ) = p, P( X = 0) = p= q Interpretacja: X = X = 0 gdy zajdzie zdarzenie oznaczające sukces gdy zajdzie zdarzenie oznaczające porażkę Przykład: Rzut kostką: sukces - wyrzucenie szóstki, porażka - nie wyrzucenie szóstki P( X = ) = / 6, P( X = 0) = 5/ 6 35
Narysować dystrybuantę. 2. Dwumianowa zmienna losowa Przykład: Rzucamy 3 razy monetą; sukces, gdy wypadnie orzeł - porażka, gdy wypadnie reszka X - zmienna losowa oznaczająca ilość sukcesów zbiór wartości: { 023,,, } Wyznaczyć rozkład zmiennej losowej X oraz jej dystrybuantę. Mamy n doświadczeń (niezależnych): każde z nich może zakończyć się sukcesem (z prawdopodobieństwem p) lub porażką (z prawdopodobieństwem q=-p). X - zmienna losowa oznaczająca ilość sukcesów zbiór wartości: {,2,3,..,n} Rozkład prawdopodobieństwa X: 36
n k = n! k!( n k)! elementowego PX k n k p k q n k ( = ) = (dlaczego?) - ilość k-elementowych kombinacji ze zbioru n- Przykład: Mamy pakiet akcji 0 firm. Prawdopodobieństwo, że wzrośnie wartość akcji firmy wynosi 0.5. Jakie jest prawdopodobieństwo, że wzrośnie wartość akcji 7 firm? 37
Ciągłe zmienne losowe Dystrybuanta F(x) jest funkcją ciągłą. Rozkład prawdopodobieństwa ciągłej zmiennej losowej wygodnie jest przedstawić przy pomocy funkcji gęstości rozkładu prawdopodobieństwa f(x), która związana jest z dystrybuantą: x f( x) = d Fx ( ), Fx ( ) = f( ) d dx ξ ξ Z własności dystrybuanty wynika: + F( + ) = f( x) dx = oraz f ( x) 0 (dlaczego?) Dla dowolnych a< b: 38
b Pa ( X b) = Fb ( ) Fa ( ) = f( x) dx a W szczególności: x0 PX ( = x0) = f( xdx ) = 0 x nie znaczy to, że zdarzenie takie jest niemożliwe 0 Interpretacja f(x). Przykłady ciągłych zmiennych losowych. Zmienna losowa o rozkładzie prostokątnym (równomiernym, jednostajnym) Zm. los. X ma rozkład równomierny na odcinku [a, b]: dla x [ a, b], f( x) = b a 0 w przeciwnym razie. 39
Narysować funkcję gęstości i dystrybuantę. 2. Zmienna losowa o rozkładzie trójkątnym Narysować funkcję gęstości i dystrybuantę. DWUWYMIAROWE ZMIENNE LOSOWE Dwuwymiarową zmienną losową (X,Y) nazywamy parę funkcji X(e) i Y(e) opisanych na przestrzeni zdarzeń elementarnych E i przyjmujących wartości ze skończonego zbioru liczb (zmienna dyskretna) lub ciągłego (zmienna ciągła). Dystrybuanta dwuwymiarowej zmiennej losowej: F( x, y) = P( X < x, Y < y) F(, y) = F( x, ) = 0, F( +, + ) = Dwuwymiarowa dyskretna zmienna losowa X ma zbiór wartości { x, x 2,..., x n } 40
Y ma zbiór wartości { y, y 2,..., y m } Rozkład zmiennej losowej (X,Y) określają prawdopodobieństwa: P( X = x, Y = y ) = p, i= 2,,..., n, j = 2,,..., m. i j ij Można go ująć w postaci tablicy n m. Oczywiście: Oznaczmy: n m p ij = i= j= p = p q = i m n ij j j= i= p j. i Oczywiście: m q n j j= i= = p =. i Pokazać, że: p P( X = x ), q = P( Y = y ). i = i j j p ij - rozkład łączny zmiennych losowych (X,Y) pi, qj - rozkłady brzegowe zmiennych losowych (X,Y) 4
Mamy: p = P( X = x, Y = y ) = P( X = x / Y = y ) P( Y = y ) = p / p ij i j i j j i j j p = P( X = x, Y = y ) = P( Y = y / X = x ) P( X = x ) = p / p p ij i j j i i j i i p i/ j, j/ i - prawdopodobieństwa warunkowe Gdy: zmienne losowe X i Y są niezależne to: lub równoważnie: p = p i p = q i/ j i j/ i j p = p q ij i j Dwuwymiarowa ciągła zmienna losowa (X, Y) - nieskończony zbiór wartości (np. R) Funkcja gęstości rozkładu prawdopodobieństwa: 2 d F( x, y) f( x, y) =, Fxy (, ) = f ( xydxdy, ) dx dy. Gęstość brzegowa: Gęstości warunkowe: + f( x) = f( x, y) dy, f( y) = f( x, y) dx x + y 42
f ( x, y) f x y f( x/ y) f y x f( y), ( / ) (, ) = =. f( x) f ( x, y) = f ( x) f ( y) zmienne losowe X i Y są niezależne. Przykłady Są dwie spółki: A i B. Z notowaniami akcji spółki A wiążemy zmienną losową X: jeśli akcje spadają, to X=-, gdy się nie zmieniają, to X=0, gdy rosną, to X=+. W podobny sposób ze spółką B wiążemy zmienna losową Y. Łączny rozkład (X,Y) jest następujący: - 0 + - 0,05 0,05 0 0 0,05 0, 0,5 + 0, 0,05 0,45 Sprawdź, czy zmienne losowe X i Y są niezależne. 43
2. Piotr jedzie na uczelnię dwoma autobusami. Czas oczekiwania na każdy autobus jest zmienną losową o rozkładzie równomiernym na odcinku [0, 0]. Wychodząc z domu Piotr przeznaczył na łączne czekanie na autobusy 7 minut. Jakie jest prawdopodobieństwo, że nie spóźni się na zajęcia? PARAMETRY ZMIENNYCH LOSOWYCH Wartość oczekiwana (przeciętna, średnia) zmiennej losowej Oznaczenia: E X ), X (, m Znaczenie: obserwujemy realizacje zm. losowej X: x, x 2,..., x n - gdy n jest duże, to wartość średnia jest przybliżeniem średniej arytmetycznej realizacji: E( X ) ( x+ x2 +... + xn )/ n Przykład: czas czekania na tramwaj Wartość oczekiwana dyskretnej zmiennej losowej 44
Zmienna losowa X o wartościach x, x 2,..., x n przyjmowanych z prawdopodobieństwami p, p 2,..., p n. Wartość oczekiwana X: EX ( )= n i= x p i i Przykłady:. Zmienna losowa binarna: X przyjmuje dwie wartości: x { 0,} P( X = ) = p, P( X = 0) = p= q EX ( )= 0q+ p= p (wartość średnia nie musi należeć do zbioru wartości X). 2. Rzut kostką: zm. losowa X przyjmuje wartości, 2, 3, 4, 5, 6 z prawdopodobieństwem/6. Policzyć E(X). 45
3. Zmienna losowa X ma rozkład dwumianowy o parametrach n i p: PX k n k p k q n k ( = ) = Pokazać, że: E(X) = n p Wartość oczekiwana ciągłej zmiennej losowej Zmienna losowa X o funkcji gęstości rozkładu prawdopodobieństwa f(x): + EX ( ) = xfxdx ( ) Przykłady:. X ma rozkład równomierny na odcinku [a, b]. Wyliczyć E(X). 2. X ma rozkład trójkątny (równoramienny) na odcinku [0, 2]. Wyliczyć E(X). 46
Interpretacja Wartość średnia - środek ciężkości f(x). Inne parametry I rzędu: mediana - x m takie, że moda - x l takie, że F( x m ) = / 2 f ( xl ) = max f ( x) rozkłady jedno-, wielomodalne Własności E(X):. C - stała: E(C) = C (dlaczego?) 47
2. E( X+ X2+... + Xn) = E( X) + E( X2) +... + E( Xn) 2. E(C X)=C E(X) 4. X - zmienna losowa o funkcji gęstości prawdopodobieństwa f(x). Y - zmienna losowa: Y=g(X) n E( X) = g( xi) pi i= Przykłady: + EY ( ) = gx ( ) f( x) dx - dla przypadku dyskretnego).. Z = X E( X). Policzyć E(Z). 2. X ma rozkład równomierny na odcinku [a, b]. Y = X 2. Policzyć E(Y). Wariancja zmiennej losowej Oznaczenia: V(X) (σ 2 ) 48
Znaczenie: parametr informujący o rozrzucie zmiennej losowej (miara rozproszenia) 2 V( X) = E( X E( X)) Dla ciągłych zmiennych losowych + 2 V( X) = ( x E( X)) f( x) dx - Dla dyskretnych zmiennych losowych: n 2 V( X) = ( xi E( X)) pi i= 2 2 2 2 2 V( X) = E( X E( X)) = E( X 2 XE( X) + E ( X)) = E( X ) E ( X) Przykłady:. Wyznaczyć wariancję zm. losowej o rozkładzie binarnym (V(X)=p q) 49
2. Wyznaczyć wariancję zm. losowej o rozkładzie równomiernym na [a, b]. Dyspersja (odchylenie standardowe) - inna miara rozproszenia: σ = σ 2 Własności wariancji. V( C )= 0, 2 2 2 2 bo V( C ) = E( C ) E ( C) = C C = 0 2. V( C X) = C 2 V( X) 2 2 2 2 2 2 bo:v( C X) = E[ CX E( CX)] = C E( X ) C E ( X) = C V( X) 3. Wariancja sumy niezależnych zmiennych losowych równa się sumie wariancji tych zmiennych: n n V( Xi ) = V( Xi ) i= i= 50
4. X, Y - niezależne zmienne losowe: V( X Y) = V( X) + V( Y) Przykłady:. Wyliczyć ( V( X E( X)) 2. Wyznaczyć wariancję zm. losowej o rozkładzie dwumianowym (suma n niezależnych zm. losowych o rozkładzie binarnym) Zmienna losowa o rozkładzie normalnym ( x m) f( x) = 2 N( m, σ ) = exp{ } 2π σ 2 2 2 σ 2 Zmienna losowa standaryzowana (normalizowana) Zmienna losowa X jest standaryzowana, jeśli E(X)=0 i V(X)=. Jeśli dla zm. losowej X: 5
E(X)=m i V( X )= σ 2, to zmienna losowa jest standaryzowana. Y = X m σ 2 Parametry dwuwymiarowej zmiennej losowej (X, Y) Kowariancja cov( X, Y) = E( X E( X))( Y E( Y)) Jeśli zmienne losowe X i Y są niezależne, to cov( XY, ) = 0 (twierdzenie odwrotne nie jest prawdziwe) Współczynnik korelacji 52
ρ = cov( X, Y) V( X) V( Y ), ρ miara siły zależności pomiędzy zmiennymi losowymi dla zmiennych losowych niezależnych: ρ = 0. 53