Rachunek prawdopodobieństwa (Elektronika, studia niestacjonarne) Wykład 3 Przygotowując wykład korzystam głównie z książki Jakubowski, Sztencel Wstęp do teorii prawdopodobieństwa. Zmienna losowa i jej rozkład Definicja. Zmienną losową nazywamy dowolną funkcję f określoną na przestrzeni probabilistycznej (Ω, F, P ), dla której każdy zbiór postaci {ω Ω : f(ω) < a}, a R, należy do F (czyli daje się mierzyć miarą P ). Wtedy także zbiory {ω Ω : f(ω) > a}, {ω Ω : f(ω) a}, {ω Ω : f(ω) a}, {ω Ω : f(ω) [a, b]} itp. należą do F. Co więcej, dla dowolnego zbioru borelowskiego B zbiór {ω Ω : f(ω) B} należy do F. Chodzi więc o funkcje, dla których potrafimy określić, z jakim prawdopodobieństwem funkcja przyjmuje wartości z zadanego przedziału. Takie funkcje mogą nam służyć do opisu różnych zjawisk. Przykładowo, możemy wykorzystać zmienną losową do opisu cen akcji przedsiębiorstwa, kursu walut, ryzyka wypłaty, która zrujnuje towarzystwo ubezpieczeniowe lub kasyno, ruchu cząsteczek itp. My będziemy się na razie zajmować prostymi modelami (aby osiągnąć pewną wprawę) i u nas zmienne losowe będą np. liczbą wyrzuconych oczek na kostce, sumą rzutów kilkoma kostkami, czasem oczekiwania na przyjazd autobusu itp. Zmienne losowe będziemy zazwyczaj nazywać wielkimi literami X czy Y. Można też spotkać się z nazwą funkcja mierzalna to to samo co zmienna losowa. Będziemy stosować zapis P (X A) (i podobne) na określenie prwdopodobieństwa, że X przyjmuje wartości ze zbioru A. Tzn. P (X A) = P ({ω Ω : X(ω) A}) P (a X b) = P ({ω Ω : X(ω) [a, b]}) itp. Niekiedy potrzebujemy obserwować kilka zmiennych losowych naraz, np. dysponujemy portfelem akcji giełdowych, a każda z nich modelowana jest przez inną zmienną losową. Dlatego wygodne będzie również pojęcie wielowymiarowe: Definicja. Wektor losowy wymiaru n to układ (X,..., X n ), w którym każda X i jest zmienną losową na (Ω, F, P ). Uwaga.. Jeśli X i Y są zmiennymi losowymi, to funkcje X, e X, ln X, X ± Y, XY (i wiele innych) także są zmiennymi losowymi. Teorię mówiącą dla jakich φ funkcja φ(x) jest zmienną losową omijamy zawsze będziemy spotykać się z operacjami, które zmienne losowe przerabiają na zmienne losowe.. Umawiamy się traktować zmienne losowe X, Y jako nierozróżnialne (takie same), jeśli dla każdego zbioru borelowskiego A zachodzi P (X A) = P (Y A). Wystarczy myśleć, że A są odcinkami, to znaczy dla wszystkich a, b R mamy P (a X b) = P (a Y b). Definicja 3.. Rozkład prawdopodobieństwa na R to prawdopodobieństwo określone na przestrzeni (R, B).
. Rozkład prawdopodobieństwa zmiennej losowej X(Ω, F, P ) R to rozkład prawdopodobieństwa µ X określony wzorem Przykłady µ X (A) = P (X A).. Dla zabicia czasu gram z kolegą w następującą grę hazardową. Rzucamy monetą: jeśli wypadnie O kolega płaci $, a jeśli R, ja mu płacę $. Jak wygląda zmienna losowa opisująca moją wygraną/stratę po trzech rzutach i jej rozkład? Ω = {RRR, RRO, ROR, ORR, ROO, ORO, OOR, OOO} przyjmujemy prawdopodobieństwo klasyczne każde zdarzenie jednakowo prawdopodobne X(RRR) = 3, X(RRO) = X(ROR) = X(ORR) =, X(ROO) = X(ORO) = X(OOR) =, X(OOO) = 3 A rozkład to: µ X ({ 3}) = P (X = 3) = 8, µ X({ }) = P (X = ) = 3 8, µ X ({}) = P (X = ) = 3 8, µ X({3}) = P (X = 3) = 8. Rzucamy kostką dwukrotnie i notujemy sumę oczek. Ta suma to wartość naszej zmienej losowej X. Jaki jest rozkład? Łatwo sprawdzić, że x 3 4 5 6 7 8 9 µ X (x) /36 /8 / /9 5/36 /6 5/36 /9 / /8 /36 Podstawowe typy zmiennych losowych. Definicja 4. Zmienną losową X o rozkładzie µ nazywamy dyskretną (lub rozkład µ zmiennej losowej nazywamy rozkładem dyskretnym), gdy istnieje zbiór przeliczalny (może być skończony) S, dla którego µ(s) =. Innymi słowy, rozkład taki można opisać przez podanie par (x i, p i ), gdzie p i jest prawdopodobieństwem, z jakim zmienna losowa przyjmuje wartość x i : ( ) P (X = x i ) = p i = µ({x i }). Zmienne w powyższych dwóch przykładach są zmiennymi dyskretnymi, podobnie jak zmienne opisujące zdarzenia oparte na rzutach monetą kośćmi, wyciąganiu kul z urn itp. Definicja 5. Zmienną losową X o rozkładzie µ nazywamy ciągłą (lub rozkład µ zmiennej losowej nazywamy rozkładem ciągłym), gdy istnieje nieujemna funkcja f, taka że dla dowolnych liczb a, b zachodzi P (a X b) = b a f(x) dx Taką funkcję nazywamy gęstością rozkładu zmiennej X. ( ) = µ([a, b]).
Uwaga. Gęstość zmiennej losowej musi całkować się do jedynki, tzn. Przykład (Za H.Jasiulewicz i W.Kordecki Rachunek prawdopodobieństwa i statystyka matematyczna ). Niech zmienna X ma gestość Ile wynosi α? Obliczyć P (X < ) i P ( X ). { αe x dla x [, ln 3], f(x) =. () poza tym Ponieważ całka z gęstości wynosi musi zachodzić αe x dx =. Mamy więc α =. αe x dx = α(e ln 3 e ) = α, P (X < ) = P ( X ) = dx = ex dx = (e ), 86 Dystrybuanta Jak widać powyżej, rozkłady dyskretne i rozkłady ciągłe mają inny opis i posługują się zupełnie innymi technikami w dyskretnych dodajemy prawdopodobieństwa i możemy utworzyć tabelkę opisującą rozkład; w ciągłych musimy posługiwać się całkami. A są jeszcze rozkłady mieszane. Jest jednak sposób, by stworzyć wspólny dla wszystkich przypadków sposób opisu rozkłądu przy użyciu funkcji. Definicja 6. Dystrybuanta rozkładu µ zmiennej losowej X to funkcja rzeczywista F spełniająca ( ) F (t) = P (X t) = µ((, t)) Twierdzenie. Własności dystrybuanty. Dystrybuanta jest funkcją nieujemną.. Dystrybuanta jest funkcją niemalejącą 3. lim t F (t) = a lim t F (t) = 4. Dystrybuanta jest prawostronnie ciągła (ale można się tym zbytnio nie przejmować). 3
Warto sobie narysować dystrybuanty rozkładów dla przykładów z bieżącego wykładu. W powyższych rozkładach dyskretnych dystrybuanta będzie funkcją przedziałami stałą, np. w przykładzie z grą z rzucaniem monetą, będzie równa aż do t = 3, w tym punkcie będzie miała skok o /8 w górę, potem w t = skok o 3/8 itd. W naszym przykładzie ciągłym, dystrybuanta jest równa dla t, dla t > ln 3, a wzór dystrybuanty dla t (, ln 3] to F (t) = P (X t) = ex dx = (et ) Uwaga. Dystrybuanta F i gęstość f są zawsze związane zależnością F (t) = f(x) dx Definicja 7. Kwantylem rzędu p jest najmniejsza liczba t R, dla której F (t) p. Kwantyl rzędu / to mediana, rzędu /4, /4, 3/4 to kwartyle, a rzędu k/ to percentyle lub, potocznie, centyle. Innymi słowy, kwantyl x p rzędu p spełnia P (X < x p ) p. Funkcje zmiennej losowej Niekiedy mamy do czynienia z sytuacją, w której chcemy badać nie zmienną X, ale Y = ϕ(x) dla jakiejś (porządnej) funkcji ϕ. Jeśli F X jest dystrybuantą zmiennej X, a F Y dystrybuantą zmiennej Y, a ϕ jest funkcją rosnącą, to F X (t) = P (X t) = P (ϕ(x) ϕ(t)) = F Y (ϕ(t)). Czyli F Y (t) = F X (ϕ (t)) Natomiast jeśli ϕ jest malejącą, to, przy dodatkowym założeniu, że F Y jest ciągła, mamy F X (t) = P (X t) = P (ϕ(x) ϕ(t)) = P (Y < ϕ(t)) = F Y (ϕ(t)). W przykładzie, gdzie rozkład X jest zadany gęstością () przyjmijmy Y = e X. Mamy więc ϕ(x) = e x, a ϕ (y) = ln y. Wtedy Można też, na przykład, tak: P (Y < ) = P (e X < ) = P (X < ) = P (Y ) = F Y () = F X (ln ) = (eln ) = Można również podać wzór na gęstość w przypadku takiego przekształcenia zmiennej, ale nie będziemy tego robić. Parametry rozkładów Ogólne definicje wymagają znajomości całkowania względem miary (całka Lebesgue a) lub całkowania względem dystrybuanty (całka Riemanna-Stieltjesa). Tego nie znamy, dlatego będziemy posługiwać się osobnymi, prostymi definicjami dla szczególnych przypadków zmiennej dyskretnej lub zmiennej ciągłej. 4
Definicja 8. Wartość oczekiwana lub wartość średnia zmiennej losowej to liczba: dla rozkładu dyskretnego opisanego zbiorem par (x i, p i ): EX = i x i p i dla rozkładu ciągłego o gęstości f(x): EX = xf(x) dx Mimo nazwy, wartość oczekiwana nie jest wartością, którą spodziewamy się zobaczyć z największym prawdopodobieństwem, lecz wartością, którą powinna być średnią wartością wyników z wielu doświadczeń losowych. Na przykład, rzucając kostką k6 i notując liczbę oczek mamy: EX = 6 + 6 + 3 6 + 4 6 + 5 6 + 6 = 3, 5, 6 wartość, której nigdy nie wyrzucimy. Dla przykładu z grą związaną z rzutem monetą (z wypłatami w wysokości lub 3) mamy EX = ( 3) 8 + ( ) 3 8 + 3 8 + 3 8 = Dla przykładu ciągłego EX = x xex dx = [xe x e x] ln 3 = 3 ln 3, 65 5