Przegląd ważniejszych rozkładów Rozkład dwupunktowy P (X = x) = { p dla x = a, 1 p dla x = b, to zmienna losowa X ma rozkład dwupunktowy z parametrem p (0 < p < 1). Rozkład ten pojawia się przy opisie doświadczeń losowych o dwu możliwych wynikach, z którymi możemy skojarzyć wartości liczbowe. EX = pa + (1 p)b, D X = p(1 p)(a b). pe t + (1 p), t R. Rozkład dwumianowy (Bernoulliego) P (X = k) = ( ) n p k (1 p) n k, gdzie k = 0, 1,..., n, k to zmienna losowa X ma rozkład dwumianowy z parametrami n, p (n N, 0 < p < 1), oznaczany B(n, p). Jest to rozkład łącznej liczby sukcesów w n doświadczeniach Bernoulliego, gdy szansa pojedyńczego sukcesu wynosi p. Lub inaczej: jest to rozkład sumy X 1 +... + X n, gdzie zmienne losowe X i są niezależne i mają ten sam rozkład dwupunktowy: P (X i = x) = { p dla x = 1, 1 p dla x = 0, gdzie i = 1,,..., n. EX = np, D X = np(1 p). (pe t + (1 p)) n, t R. Rozkład Poissona P (X = k) = λk k! e λ, gdzie k = 0, 1,,..., to zmienna losowa X ma rozkład Poissona z parametrem λ (λ > 0), oznaczany P ois(λ). 1
Jest to rozkład graniczny dla ciągu rozkładów dwumianowych B(n, p n ), gdy n, p n 0 i np n λ. W związku z tym pojawia się jako rozkład zdarzeń rzadkich (liczba wypadków drogowych, liczba pożarów, liczba wygranych w Lotto, itp.). EX = λ, D X = λ. e λ(et 1), t R. Rozkład geometryczny P (X = k) = (1 p) k 1 p, gdzie k = 1,,..., to zmienna losowa X ma rozkład geometryczny z parametrem p (0 < p < 1), oznaczany G 1 (p). Jest to rozkład czasu oczekiwania na pierwszy sukces w ciągu doświadczeń Bernoulliego, rozumianego jako liczba doświadczeń, które należy wykonać, żeby doczekać się sukcesu. Niekiedy rozumie się czas oczekiwania dosłownie, jako liczbę doświadczeń wykonanych przed otrzymaniem pierwszego sukcesu. Wtedy otrzymujemy zmienną losową Y = X 1 przyjmującą wartości k = 0, 1,...; wtedy P (Y = k) = (1 p) k p. Rozkład zmiennej losowej Y także nazywamy geometrycznym i oznaczamy G 0 (p). Wtedy EY = EX 1, D Y = D X. EX = 1 p, D X = 1 p p. G 1 (p) : G 0 (p) : M Y (t) = pe t, t < ln (1 p), 1 (1 p)et p, t < ln (1 p). 1 (1 p)et Rozkład ujemny dwumianowy ( ) α + k 1 P (X = k) = (1 p) k p α, gdzie k = 0, 1,,..., k to zmienna losowa X ma ujemny rozkład dwumianowy z parametrami α, p (α > 0, 0 < p < 1), oznaczany N B(α, p). parametr α jest całkowity, to mamy do czynienia z czasem oczekiwania na α-ty sukces w ciągu prób Bernoulliego, tzw. rozkładem Pascala. X interpretuje się jako liczbę porażek poprzedzających α-ty sukces. Dla α = 1 otrzymujemy rozkład geometryczny. EX = α(1 p), D X = p α(1 p) p.
( ) p α, t < ln(1 p). 1 (1 p)e t Rozkład jednostajny na A R n Niech A B(R n ) i niech 0 < λ(a) <. Rozkład o gęstości λ(a) I A(x) nazywamy rozkładem jednostajnym na A. Wiąże się z intuicją losowego wyboru punktu ze zbioru A. Najczęściej spotyka się rozkład jednostajny na przedziałe [a, b]: Oznaczenia: U[a, b]. b a I [a,b](x). Wartość oczekiwana i wariancja zmiennej losowej X o rozkładzie U[a, b]: EX = a + b, D X = (b a). 1 Funkcja generująca momenty zmiennej losowej X o rozkładzie U[a, b]: ebt e at (b a)t, t R. Uwaga: wzór ten traci sens dla t = 0; wtedy FGM jest równa 1. Rozkład gamma Funkcja gamma jest zdefiniowana za pomocą całki niewłaściwej: Mamy: Γ(α) = 0 t α 1 e t dt, gdzie α > 0. ( ) 1 Γ(α + 1) = αγ(α), Γ(n + 1) = n!, Γ = π. Zmienna losowa X ma rozkład gamma z parametrami α, β (α > 0, β > 0), oznaczany Γ(α, β), jeśli jej gęstość wyraża się wzorem: f(x) = βα Γ(α) xα 1 e βx I (0, ) (x). Rozkład gamma jest dobry do opisu zmiennych, które mogą mieć rozkład skośny. EX = α β, D X = α β. 3
( ) β α, t < β. β t Rozkład wykładniczy Szczególnym, ale bardzo istotnym przypadkiem rozkładu gamma jest rozkład Γ(1, β), czyli rozkład wykładniczy z parametrem β (β > 0), oznaczany Exp(β), którego funkcja gęstości ma postać: f(x) = βe βx I (0, ) (x). Rozkład wykładniczy jest ciągłym odpowiednikiem rozkładu geometrycznego. EX = 1 β, D X = 1 β. β β t, t < β. Rozkład Pareto Zmienna losowa X ma rozkład Pareto z parametrami k, α (k > 0, α > 0), oznaczany P a(k, α), jeżeli jej gęstość ma postać: f(x) = αkα x α+1 I (k, )(x). Nazwa pochodzi od nazwiska włoskiego ekonomisty Vilfredo Pareto. Jest to ciągły rozkład prawdopodobieństwa, występujący m.in. w naukach społecznych, geofizyce, i aktuariacie. W ubezpieczeniach wyraża rozmiar finansowej odpowiedzialności ubezpieczyciela w związku z wypadkami losowymi jego klientów przy ubezpieczeniu OC, AC oraz od wypadków przy pracy. EX = αk α 1, określona dla α > 1, D X = nie istnieje. αk, określona dla α >. (α )(α 1) Rozkład normalny (Gaussa) Zmienna losowa X ma rozkład normalny z parametrami µ, σ (µ R, σ > 0), oznaczany N (µ, σ), jeżeli jej gęstość wyraża się następująco: σ (x µ) π e σ, gdzie x R. Jest to jeden z najważniejszych rozkładów prawdopodobieństwa. Odgrywa ważną rolę w statystycznym opisie zagadnień przyrodniczych, przemysłowych, medycznych, socjalnych, ekonomicznych itp. EX = µ, D X = σ. 4
e tµ+ 1 t σ, t R. zmienna losowa X ma rozkład N (µ, σ), to zmienna losowa U = X µ σ dystrybuancie: Φ(x) = 1 x e u du, π której wartości są stablicowane. Ponadto: Φ( x) = 1 Φ(x). ma rozkład N (0, 1) o Rozkład logarytmiczno-normalny Zmienna losowa X ma rozkład logarytmiczno-normalny z parametrami µ, σ (µ R, σ > 0), oznaczany LN (µ, σ), jeżeli jej gęstość określa wzór: f(x) = 1 σx (log x µ) π e σ, gdzie x R. Rozkład logarytmiczno-normalny jest często lepszym od rozkładu normalnego przybliżeniem rozkładów zmiennych losowych, w których istotne są stosunki pomiędzy wartościami, a nie różnice pomiędzy nimi. Na przykład przybliżony rozkład logarytmiczno-normalny mają kursy akcji giełdowych, gdzie ważniejsze jest o ile procent zmniejszyła się lub zwiększyła wartość akcji, a nie o ile złotych. nie istnieje. σ µ+ EX = e, D X = e µ( e σ e σ). 5