Modelowanie zależności pomiędzy zmiennymi losowymi Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski
P Zmienne losowe niezależne - przypomnienie Dwie rzeczywiste zmienne losowe X i Y są niezależne jeżeli dla dowolnych a<b i c<d ( X ab, & Y cd, ) = P( ( XY, ) ab, cd, ) ( X ab, ) ip ( Y cd, ) = P Jeżeli X i Y są niezależne, to dla dowolnych funkcji f i g, dla których istniejąef X, Eg Y : E ( f ( X ) g ( Y )) = Ef ( X ) ieg ( Y ) W ogólnej sytuacji, gdy X i Y nie są niezależne powyższa równość nie musi zachodzić
Kowariancja i korelacja - przypomnienie Jedną z wielu miar niezależności zmiennych losowych jest współczynnik korelacji Pearsona, który definiujemy za pomocą formuły Cov ( X, Y ) E ( XY ) EXiEY ρ X, Y = = ( X ) ( Y ) D ( X ) D ( Y ) D D Współczynnik korelacji przyjmuje wartości z przedziału [-1,1], nie zmienia się przy transformacjach liniowych zmiennych X i Y (z dokładnością do znaku), jeżeli jest równy 1 lub -1, to zmienne losowe X i Y są związane zależnością liniową, jeżeli zmienne X i Y są niezależne, to (ale nie na odwrót). ( X Y ) ρ, = 0
Dwuwymiarowa zmienna losowa Dwuwymiarowa zmienna losowa (dwuwymiarowy wektor losowy) (X,Y) to zmienna, która przyjmuje wartości będące parami liczb rzeczywistych. Współrzędne dwuwymiarowej zmiennej losowej X i Y są również zmiennymi losowymi. Możliwe są wszystkie kombinacje: X dyskretna X ciągła Y dyskretna x x Y -ciągła x x
Rozkład łączny i rozkłady brzegowe, przypadek dyskretny Rozkład łączny dwóch zmiennych losowych X i Y to rozkład wektora losowego (X,Y) na płaszczyźnie 2 liczb rzeczywistychr Jeżeli zmienne X i Y są dyskretne, to rozkład łączny dany jest za pomocą prawdopodobieństw PX ( = x ) ( ) i& Y = yj = P XY, = xy i, j = pij,, ij = 1,2,... Rozkłady brzegowe wektora (X,Y) to rozkłady zmiennych X i Y Zadanie: jaka jest zależność p ij od pi = P( X = xi) oraz q = P( Y = y) gdy X i Y są niezależne? j j
Rozkład łączny i rozkłady brzegowe - przypadek ciągły 2 Jeżeli istnieje pewna funkcja f: R 0, + ) taka, że dla a<bi c<d b d P XY, ab, cd, = f x, ydxdy ( ) a c to f nazywa się gęstością wektora (X,Y) zaś zmienne X i Y mają rozkłady ciągłe odpowiednio o gęstościach + + f x f x, y dy, f y f x, y dx X = Y = Zadanie: jaka jest zależność pomiędzy gęstością rozkładu łącznego a gęstościami rozkładów brzegowych gdy zmienne X i Y są niezależne?
Rozkład łączny i rozkłady brzegowe - przypadek dyskretno-ciągły Jeżeli zmienna X ma rozkład ciągły a zmienna Y ma rozkład dyskretny, to wówczas rozkład łączny wektora (X,Y) można określić za pomocą formuły ( X Y ) ab { y } j P( X ab, & Y = yj) = P(,, ) b = fj x dx, j = 1,2,... a Zadanie: wyznaczyć z powyższej formuły gęstość zmiennej X oraz q = PY = y j j
Kopule i dystrybuanty dwuwymiarowe Kopulą nazywamy dowolną funkcję 2 C: 0,1 0,1 spełniającą warunki C t,0 = C 0, s = 0, C 1, t = t, C s,1 = s, C s, t + C s, t C s, t + C s, t gdy 1 1 2 2 1 2 2 1 s s, t t 1 2 1 2 Dystrybuantę rozkładu (X,Y) definiujemy wzorem F XY, st, = P X sy, t
Kopule a dystrybuanty dwuwymiarowe -Twierdzenie Sklara Dystrybuanta każdego rozkładu dwuwymiarowego, którego rozkłady brzegowe są jednostajne na przedziale [0,1] jest kopulą Zachodzi również odwrotne Twierdzenie SklaraKażda dystrybuanta FXY, st, rozkładu dwuwymiarowego da się przedstawić w postaci F ( ) XY, st, = CXY, FX s, FY t gdzie C - kopula, a F - XY, X s, FY t dystrybuanty X i Y
Współczynnik korelacji rang Spearmana Współczynnik korelacji rang Spearmana zmiennych X i Y, ρ ( X, Y ) S, definiujemy za pomocą formuły ρ X, Y = ρ F X, F Y S X Y gdzie ρ - współczynnik korelacji Pearsona Zachodzi również formuła 1 1 ( X, Y ) 12 (, ) ρs = CXY, st s t dsdt 0 0
Współczynnik korelacji rang - własności Współczynnik korelacji rang przyjmuje wartości z przedziału [-1,1], nie zmienia się przy transformacjach monotonicznychzmiennych X i Y, (z dokładnością do znaku), jeżeli jest równy 1 lub -1, to zmienne losowe X i Y są związane zależnością monotoniczną. Jeżeli X i Y są niezależne, to ρ ( XY, ) = (ale S 0 nie na odwrót). Pewien estymator współczynnika korelacji rang n 2 ( 3 r ) S = 1 6 Rx / 1 i Ry i i n n = Pytanie o rozkład asymptotyczny estymatora.
Prawdopodobieństwo warunkowe Prawdopodobieństwo warunkowe, że zmienna X przyjmie wartości z przedziału [a,b], pod warunkiem, że zmienna Y przyjmuje wartości z przedziału [c,d] definiuje się, przy założeniu, że PY cd, > 0 za pomocą formuły PX ab, & Y cd, PX ab, Y cd, = P( Y cd, ) Zadanie: Obliczyć P( X ab, Y = y ) j dla rozkładu dyskretno-ciągłego
Rozkłady warunkowe (X,Y) - rozkład dyskretny, wówczas P X = x Y = y = p / q i j ij j (X,Y) -rozkład ciągły, wówczas możemy określić gęstość warunkową X ( = ) = (, )/ f x Y y f x y f y (X,Y) rozkład dyskretno-ciągły, wówczas ( = ) = P ( = ) = f x Y y f x / Y y f x / q X j j j j j Zadanie: Obliczyć PY = yj X = x dla rozkładu dyskretno-ciągłego Y
Rozkłady warunkowe i brzegowe a rozkłady łączne (X,Y) - rozkład dyskretny, wówczas P X = x & Y = y i ( X x Y y ) ip ( Y y ) = P = = = (X,Y) - rozkład ciągły, wówczas j i j j (, ) = ( = ) i f x y f x Y y f y X (X,Y) rozkład dyskretno-ciągły, wówczas = ( = ) ip ( = ) f x f x Y y Y y j X j j ( Y y X x) if ( x) = P = = j X Y
Rozkład ujemny dwumianowy jako mieszanina rozkładów Zmienna (X,Y) ma rozkład dyskretno ciągły, prawdopodobieństwa warunkowe są równe P ( N k λ ) = Λ = = e λ λ k / k!, k = 0,1,... gęstość brzegowa zmiennej Λjest gęstością rozkładu Γ(β,α), wówczas N ma rozkład ujemny dwumianowy P β k + λ β 1 αλ N = k = e e d Γ 0 k! α λ λ λ ( β ) ( β k ) β + k ( α 1) β 1 α Γ + β + k 1 α 1 = = k! ( β ) Γ k α + 1 α + 1 + β k
Warunkowa wartość oczekiwana Warunkową wartość oczekiwaną X pod warunkiem Y = yokreślamy jako wartość oczekiwaną rozkładu warunkowegozmiennej X pod warunkiem Y = y, np. w przypadku dyskretnym E = X Y = y = ( = = ) i = 1 px / q ij i j i = 1 i j i j P X x Y y x Warunkowa wartość oczekiwana pod warunkiem Y=yjest pewną funkcją zmiennej y E X Y = y = E y
Warunkowa wartość oczekiwana, c. d. Warunkową wartość oczekiwaną zmiennej X pod warunkiem zmiennej Y definiujemy jako E X Y = EY Tak zdefiniowana warunkowa wartość oczekiwana jest zmienną losową i jest zawsze pewną funkcją zmiennej Y Zadanie: Obliczyć rozkład warunkowy i E X Y gdy zmienna (X,Y) ma rozkład łączny ciągły o gęstości exp x 2 2xy y 2 2 y / π
Warunkowa wartość oczekiwana -własności Warunkowa wartość oczekiwana, podobnie jak wartość oczekiwana jest operacją liniową, tzn. E αx + βx Y = αe X Y + βe X Y 1 2 1 2 Jeżeli zmienna Z = FY jest funkcją zmiennej Y, to E ( ZX Y ) = ZE ( X Y ) Zachodzi również równość ( ( X Y )) = E ( X ) EE Jeżeli zmienne X i Y są niezależne, to E X Y = E X
Dekompozycja wariancji Dla warunkowej wartości oczekiwanej ponadto zachodzi następująca równość 2 D ( X ) = E ( X EX ) 2 2 2 ( X ( X Y )) ( X Y ) ( X ) = E E + EE E Zadanie: udowodnić powyższą równość korzystając z równości EE ( ( X Y )) = E ( X ), sprawdzić obie równości dla wektora (X,Y) o 2 2 gęstości exp x 2xy y 2 y /2 π
Wariancja warunkowa Wariancję warunkową definiujemy jako zmienną losową 2 D ( 2 ) X X Y Y ( X Y ) = E E Ze wzoru na dekompozycję wariancji 2 2 2 D X = ED X Y + D E X Y Zadanie: udowodnić, że jeżeli mamy gęstość 2 warunkową f x Y y, to D X Y = D 2 Y, gdzie ( ) + 2 2 = 0 X = ( + ) 2 xf 0 X x Y y dx D y X = ( = ) x f x Y y dx