Statystyka Wydział Zarządzania Uniwersytetu Łódzkiego 2017
Zmienna losowa i jej rozkład
Mając daną przestrzeń probabilistyczną, czyli parę (&, P) stanowiącą model pewnego doświadczenia losowego (gdzie & jest przestrzenią zdarzeń elementarnych, P jest prawdopodobieństwem określonym dla zdarzeń losowych zawartych w przestrzeni &), wygodnie jest nieraz przejść do innej przestrzeni probabilistycznej - na drodze odpowiedniego przekształcenia przestrzeni zdarzeń elementarnych & - otrzymując model doświadczenia losowego związanego z wyjściowym doświadczeniem losowym. Rozważmy, na przykład doświadczenie polegające na rzucie parą kostek sześciennych. Ω = {(i, j) :i, j = 1,2,,6} P(i, j) = 1 36 (i, j = 1,2,,6)
Przypuśćmy, że interesuje nas teraz suma oczek na obu kostkach. Obserwację sumy oczek na kostkach można traktować jako inne doświadczenie losowe, związane jednak z poprzednim. Suma oczek jest to słowny opis funkcji X :Ω! określonej na przestrzeni & w następujący sposób: X(i, j) = i + j (i, j = 1,2,,6). Funkcja ta przekształca przestrzeń & na zbiór & X = {2, 3,, 12} stanowiący odpowiednią przestrzeń zdarzeń elementarnych nowego doświadczenia losowego. W naturalny sposób możemy na & X określić prawdopodobieństwo P X za pomocą prawdopodobieństwa P: P(k) = P(i, j) (k Ω ). X i+ j=k
Zmienna losowa Zmienna losowa to funkcja X :Ω!, która wynikom doświadczenia losowego (zdarzeniom elementarnym) przyporządkowuje wartości liczbowe i dla której zbiór {ω Ω : X(ω ) x} jest zdarzeniem losowym dla każdej liczby rzeczywistej x.
Pewne oznaczenia Niech X :Ω!, będzie zmienną losową, x, a, b będą liczbami rzeczywistymi, a G niech będzie podzbiorem zbioru liczb rzeczywistych. Wprowadźmy pewne oznaczenia, które uproszczą zapis. Pełny zapis Zapis skrócony {ω Ω : X(ω ) x} X x {ω Ω : X(ω ) = x} X = x {ω Ω : X(ω ) G} X G {ω Ω :a X(ω ) b} a X b
Zmienna losowa skokowa i ciągła Zmienne losowe przyjmujące skończoną lub co najwyżej przeliczalną liczbę wartości nazywamy skokowymi lub dyskretnymi. Zmienną losową, której wartością może być każda liczba rzeczywista z pewnego, dopuszczalnego przedziału, określamy jako zmienną losową typu ciągłego.
Zmienna losowa typu skokowego Przyporządkowanie wszystkim wartościom skokowej zmiennej losowej prawdopodobieństw ich realizacji, które sumują się do jedności nazywamy funkcją prawdopodobieństwa zmiennej losowej. Mówimy wtedy, że został określony rozkład prawdopodobieństwa tej zmiennej. Niech x i (i = 1, 2,, k) oznaczają wszystkie wartości zmiennej X. Wtedy funkcja prawdopodobieństwa jest dana wzorem: gdzie P(X = x ) = p(x ) = p (i = 1,2,,k), i i i k p = p + p + + p = 1. i 1 2 k i=1
Zmienna losowa typu skokowego Funkcję prawdopodobieństwa zmiennej losowej skokowej można określić za pomocą tabeli: x i x 1 x 2! x k p i p 1 p 2! p k Funkcję prawdopodobieństwa wielu zmiennych skokowych można podać również wzorem analitycznym, np. zmienne o rozkładzie dwumianowym (Bernoulliego).
Zmienna losowa typu skokowego Rozkład prawdopodobieństwa zmiennej losowej skokowej można przedstawić graficznie za pomocą diagramu słupkowego: Prawdopodobieńsrwo 0,6 0,5 0,3 0,2 0,0 x_1 x_2 x_3 x_4 x_5 x_6 x_7 Wartości zmiennej skokowej
X(i, j) = i + j (i, j = 1,2,,6). P(k) = P(i, j) (k Ω ). X i+ j=k 6 5 4 3 2 1 1 2 3 4 5 6 0,18 0,12 0,06 0 2 3 4 5 6 7 8 9 10 11 12 x i p i 2 3 4 5 6 7 8 9 10 11 12 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
Zmienna losowa typu skokowego Rozkład prawdopodobieństwa zmiennej losowej skokowej X można określić za pomocą funkcji zwanej dystrybuantą zmiennej losowej. Jest to funkcja F określona dla każdej liczby rzeczywistej x następującym wzorem: x i x F(x) = P( X x) = p(x ). i Zgodnie z powyższym wartość dystrybuanty F(a) jest prawdopodobieństwem, że zmienna losowa X przyjmie wartość nie większą niż a.
x i p i 1 2 3 4 5 6 1/6 1/6 1/6 1/6 1/6 1/6 F(x) = 0, dla x < 1, 1 6, dla 1 x < 2, 2 6, dla 2 x < 3, 3 6, dla 3 x < 4, 4 6, dla 4 x < 5, 5 6, dla 5 x < 6, 1, dla x 6.
x i p i 1 2 3 4 5 6 1/6 1/6 1/6 1/6 1/6 1/6 F 1 5/6 4/6 3/6 2/6 1/6 0 1 2 3 4 5 6 x
Zmienna losowa typu skokowego Znajomość funkcji prawdopodobieństwa lub - równoważnie - dystrybuanty pozwala na obliczenie prawdopodobieństw tego, że zmienna losowa przyjmie wartość z dowolnego przedziału. Na podstawie funkcji prawdopodobieństwa: ( ) = p i a<x i b P a < X b Na podstawie dystrybuanty:. P( a < X b) = P(X b) P(X a) = F(b) F(a).
x i p i 1 2 3 4 5 6 1/6 1/6 1/6 1/6 1/6 1/6 ( ) = p i 2<x i 4 P 2 < X 4 = 1 6 + 1 6 = 1 3.
P( 2 < X 4) = F(4) F(2) = 4 6 2 6 = 1 3. F 1 5/6 4/6 3/6 2/6 1/6 0 1 2 3 4 5 6 x
Podstawowe parametry rozkładu zmiennej losowej Rozkład zmiennej losowej scharakteryzowany jest syntetycznymi miarami zwanymi parametrami rozkładu zmiennej losowej. Do podstawowych parametrów rozkładu należą: wartość oczekiwana zmiennej losowej, wariancja i odchylenie standardowe zmiennej losowej. Wartość oczekiwana (Expected value) zmiennej losowej X, oznaczana jako E(X), jest określona w przypadku zmiennej losowej skokowej wzorem: E(X) = n x i p i. i=1
Podstawowe parametry rozkładu zmiennej losowej x i p i 1 2 3 4 5 6 1/6 1/6 1/6 1/6 1/6 1/6 E(X) = 1 1 6 + 2 1 6 + 3 1 6 + 4 1 6 + 5 1 6 + 6 1 6 = 3,5.
Podstawowe parametry rozkładu zmiennej losowej Wariancja (Variance) skokowej zmiennej losowej X, oznaczana jako Var(X), jest określona w przypadku zmiennej losowej skokowej wzorem: lub Var(X) = Var(X) = n i=1 n (x i E(X)) 2 p i i=1 (x i ) 2 p i E(X) ( ) 2. Wariancję zmiennej losowej X oznacza się również symbolami: V(X) albo D 2 (X).
Podstawowe parametry rozkładu zmiennej losowej x i p i 1 2 3 4 5 6 1/6 1/6 1/6 1/6 1/6 1/6 Var(X) = 1 2 1 6 + 22 1 6 + 32 1 6 + 42 1 6 + 52 1 6 + 62 1 6 ( 3,5 ) 2 = = 15,17 12,25 = 2,92.
Podstawowe parametry rozkładu zmiennej losowej Pierwiastek kwadratowy z wariancji jest odchyleniem standardowym (Standard deviation) zmiennej losowej. Oznaczamy go symbolem SD(X) albo D(X). SD(X) = Var(X) x i p i 1 2 3 4 5 6 1/6 1/6 1/6 1/6 1/6 1/6 SD(X) = 2,92 = 1,71.
Zmienna losowa typu ciągłego Zmienną losową, której wartością może być każda liczba rzeczywista z pewnego dopuszczalnego przedziału tych liczb, określamy jako zmienną losową typu ciągłego. Przykładami takiej zmiennej mogą być: czas obsługi klienta przy kasie w sklepie, waga ryby złowionej przez wędkarza, okres użytkowania urządzenia między awariami, wiek wylosowanej osoby.
Zmienna losowa typu ciągłego Ponieważ każda liczba rzeczywista z dopuszczalnego przedziału może być wartością zmiennej losowej typu ciągłego, to rozkład prawdopodobieństwa takiej zmiennej losowej nie może być określony w taki sam sposób, jak rozkład zmiennej skokowej, czyli za pomocą funkcji prawdopodobieństwa przyporządkowującej każdej możliwej wartości zmiennej dodatnie prawdopodobieństwo realizacji. Rozkład zmiennej typu ciągłego opisuje się za pomocą nieujemnej funkcji f, zwanej funkcją gęstości prawdopodobieństwa, która ma następującą własność: dla każdego a i b, przy czym a b. b a f (x)dx = P(a < X b),
Zmienna losowa typu ciągłego f(x) P(a < X b) b a f (x)dx a b x
Zmienna losowa typu ciągłego Zgodnie z powyższą definicją dla funkcji gęstości musi zachodzić: + f (x)dx = 1, ponieważ prawdopodobieństwo tego, że zmienna X przyjmie wartość z przedziału (-, + ), czyli jakąkolwiek wartość, musi być równe 1. f(x) x
Zmienna losowa typu ciągłego Dystrybuanta zmiennej losowej ciągłej jako funkcja F, której wartość dla dowolnego x określa się jako prawdopodobieństwo tego, że X x, jest więc równa F(x) = P(X x) = x f (t)dt f(t) x t
Zmienna losowa typu ciągłego Dystrybuanta jest niemalejącą funkcją różniczkowalną, której pochodna jest funkcją gęstości w punktach ciągłości funkcji f: F '(x) = f (x). Poniżej przedstawiony jest wykres dystrybuanty. F(x) 1 F(b) P( a < X b) F(a) 0 a b x
Zmienna losowa typu ciągłego Podobnie jak w przypadku zmiennej typu skokowego, prawdopodobieństwo tego, że zmienna X typu ciągłego przyjmuje wartości z przedziału (a, b] obliczamy jako P(a < X b) = F(b) F(a). F(x) 1 F(b) P( a < X b) F(a) 0 a b x
Zmienna losowa typu ciągłego Zauważmy przy okazji, że dla zmiennej losowej typu ciągłego, zgodnie z powyższym wzorem, dla dowolnej liczby a otrzymujemy: P(X = a) = P(a < X a) = F(a) F(a) = 0. Prawdopodobieństwo trafienia dokładnie w środek tarczy równe jest zero.
Zmienna losowa typu ciągłego Z powyższego wynikają wzory: P(X < a) = P(X a), P(X > a) = 1 P(X a) = 1 F(a), P(a < X < b) = P(a X b) = P(a X < b) = P(a < X b) = F(b) F(a). f(x) a b x
Zmienna losowa typu ciągłego Wartość oczekiwaną zmiennej typu ciągłego określa wzór: E(X) = + x f (x)dx. Odpowiednio, wariancję i odchylenie standardowe zmiennej ciągłej określają wzory: Var(X) = + ( x E(X) ) 2 f (x)dx, SD(X) = Var(X).
Pociągi metra kursują co 6 minut. Załóżmy, że pasażer przychodzi na stację, nie kierując się rozkładem jazdy. Czas oczekiwania na pociąg jest więc zmienną losową, która może przyjąć każdą wartość rzeczywistą z przedziału [0, 6]. Jest to zmienna typu ciągłego. Znajdźmy funkcję gęstości tej zmiennej. Ponieważ pasażer nie kieruje się rozkładem jazdy, więc prawdopodobieństwo czasu oczekiwania dla każdego podprzedziału o jednakowej długości [a, b] [0, 6] jest jednakowe, tzn. P(a X b) = P(a + λ X b + λ). Warunek ten jest spełniony dla funkcji stałej. Niech zatem f (x) = c dla x [0,6]. oraz f (x) = 0 dla x [0,6].
Ponieważ P(0 X 6) = 1, to c = 1/6. f(x) 1/6 P(0 X 6) = 1 0 6 x Dystrybuantę tej zmiennej losowej można łatwo znaleźć na podstawie rysunku f(x) F(x) = P(X x) = 1 6 x dla x [0,6] 1/6 0 x 6 x
F(x) = 0 dla x < 0, 1 x 6 dla x [0,6], 1 dla x > 6. f(x) F(x) 1 1/6 0 6 x 0 6 x
Możemy teraz obliczyć prawdopodobieństwo oczekiwania od 2 do 4 minut. Za pomocą funkcji gęstości: f(x) 1/6 P(2 X 4) = (4 2) 1 6 = 1 3. 0 2 4 6 x Za pomocą dystrybuanty: F(x) 1 2/3 1/3 P(2 X 4) = F(4) F(2) = 1 3. 0 2 4 6 x
Przypuśćmy, że pasażer zbliżający się do peronu przyspiesza, gdy widzi zbliżający się pociąg, a zwalnia, gdy widzi już odjeżdżający pociąg. Wtedy krzywa gęstości mogłaby wyglądać następująco: f(x) 1/6 0 6 x
Inaczej sytuacja wyglądałaby, gdyby pasażerowie metra prali pod uwagę rozkład jazdy pociągów. Przypuśćmy, że pociągi kursują rzadziej, co 30 minut, co powoduje, że pasażerowie interesują się rozkładem jazdy i biorą go pod uwagę. Wówczas krzywa gęstości prawdopodobieństwa oczekiwania na pociąg przypuszczalnie miałaby następującą postać: f(x) 1/30 0 30 x
Zmienna losowa dwuwymiarowa Przypuśćmy, że każdemu zdarzeniu elementarnemu będącemu rezultatem pewnego doświadczenia losowego przyporządkowuje się parę liczb (x, y). Przyporządkowanie to określa dwuwymiarową zmienną losową, którą oznaczamy jako (X, Y). Niech X i Y będą zmiennymi losowymi skokowymi i wartości jakie przyjmuje zmienna X oznaczmy przez x i (i = 1, 2,, k), wartości jakie przyjmuje zmienna Y oznaczmy przez y j (j = 1, 2,, l). Rozkład prawdopodobieństwa zmiennej (X, Y) opisuje w takim przypadku funkcja prawdopodobieństwa określona wzorem: P(X = x i, Y = y j ) = p ij (i = 1,2,,k, j = 1,2,,l), przy czym k l p ij = 1. i=1 j=1
Zmienna losowa dwuwymiarowa Powyższą funkcję prawdopodobieństwa można zapisać w postaci następującej tabeli: y j x i y 1 y 2 y l p i x 1 p 11 p 12 p 1l p 1 x 2 p 21 p 22 p 2l p 2 x k p k1 p k2 p kl p k p j p 1 p 2 p l 1
Zmienna losowa dwuwymiarowa Na podstawie funkcji prawdopodobieństwa łącznego rozkładu zmiennych X i Y (prawdopodobieństwa p ij ) można dla tych zmiennych wyznaczyć tak zwane rozkłady brzegowe (inaczej bezwarunkowe). Rozkład brzegowy zmiennej X określa się za pomocą prawdopodobieństw otrzymanych przez zsumowanie prawdopodobieństw rozkładu dwuwymiarowego w wierszach tablicy: x i y j y 1 y 2 y l p i x 1 p 11 p 12 p 1l p 1 x 2 p 21 p 22 p 2l p 2 x k p k1 p k2 p kl p k p j p 1 p 2 p l 1
Zmienna losowa dwuwymiarowa P(X = x i ) = l p ij = p i j=1 (i = 1,2,,k), Rozkład brzegowy zmiennej Y określa się za pomocą prawdopodobieństw otrzymanych przez zsumowanie prawdopodobieństw rozkładu dwuwymiarowego w kolumnach tablicy: x i y j y 1 y 2 y l p i x 1 p 11 p 12 p 1l p 1 x 2 p 21 p 22 p 2l p 2 x k p k1 p k2 p kl p k p j p 1 p 2 p l 1
Zmienna losowa dwuwymiarowa przy czym P(Y = y j ) = l k i=1 p j = 1 j=1 p ij = p j oraz ( j = 1,2,,l), k p i = 1. i=1 x i y j y 1 y 2 y l p i x 1 p 11 p 12 p 1l p 1 x 2 p 21 p 22 p 2l p 2 x k p k1 p k2 p kl p k p j p 1 p 2 p l 1
Liczba pracujących Liczba samochodów 0 1 2 1 480 960 60 2 90 1020 90 3 30 120 150 Z 3000 rodzin losujemy jedną i rejestrujemy dla niej liczbę pracujących członków rodziny (x) i liczbę samochodów osobowych, które posiada ta rodzina (y). W ten sposób zostaje określona dwuwymiarowa zmienna losowa (X, Y). Otrzymujemy: P(X = 1, Y = 0) = 480 3000 P(X = 3, Y = 1) = 120 3000 = 0,16, P(X = 1, Y = 1) = 960 3000 = 0,32, = 0,04, P(X = 3, Y = 2) = 150 3000 = 0,05.
Liczba pracujących Liczba samochodów 0 1 2 1 480 960 60 2 90 1020 90 3 30 120 150 2 Wykres bąbelkowy Liczba samochodów 1 0 1 2 3 Liczba pracujących
Pełną funkcję prawdopodobieństwa tych zmiennych (wraz z rozkładami brzegowymi) przedstawiono w poniższej tabeli: y j x i 0 1 2 p i 1 0,16 0,32 0,02 0,50 2 0,03 0,34 0,03 0,40 3 0,01 0,04 0,05 0,10 p j 0,20 0,70 0,10 1
Zmienna losowa dwuwymiarowa Na podstawie dwuwymiarowego rozkładu można także określić tak zwane rozkłady warunkowe każdej ze zmiennych. Rozkład warunkowy zmiennej X to rozkład określony, przy warunku, że druga zmienna Y przyjęła ustaloną wartość. Korzystając ze wzoru na prawdopodobieństwo warunkowe mamy: P(X = x i Y = y s ) = P(X = x i, Y = y s ) P(Y = y s ) = p is p s (i = 1,2,,k). x i y j y 1 y 2 y l p i x 1 p 11 p 12 p 1l p 1 x 2 p 21 p 22 p 2l p 2 x k p k1 p k2 p kl p k p j p 1 p 2 p l 1
Zmienna losowa dwuwymiarowa Podobnie, rozkład warunkowy zmiennej Y to rozkład określony, przy warunku, że druga zmienna X przyjęła ustaloną wartość. Korzystając ze wzoru na prawdopodobieństwo warunkowe mamy: P(Y = y j X = x r ) = P(X = x r, Y = y j ) P(X = x r ) = p rj p r ( j = 1,2,,l). x i y j y 1 y 2 y l p i x 1 p 11 p 12 p 1l p 1 x 2 p 21 p 22 p 2l p 2 x k p k1 p k2 p kl p k p j p 1 p 2 p l 1
Na podstawie poniższej tabeli wyznaczymy na przykład rozkład warunkowy zmiennej X przy warunku Y = 0. x i y j 0 1 2 p i 1 0,16 0,32 0,02 0,50 2 0,03 0,34 0,03 0,40 3 0,01 0,04 0,05 0,10 p j 0,20 0,70 0,10 1 P(X = 1 Y = 0) = 0,16 0,20 P(X = 3 Y = 0) = 0,01 0,20 = 0,05. = 0,80, P(X = 2 Y = 0) = 0,03 0,20 = 0,15, Nasuwa się pytanie: Czy występuje zależność między liczbą zarobkujących w rodzinie a liczbą samochodów w rodzinie?
Niezależność zmiennych losowych Pytanie: Czy występuje zależność między liczbą zarobkujących w rodzinie a liczbą samochodów w rodzinie? Jeśli stwierdzimy fakt takiego powiązania, to będzie nas interesować charakter tego związku, np. jak zmienia się liczba samochodów, gdy rośnie liczba pracujących. Mówimy, że zmienne X i Y są niezależne, jeśli wszystkie zdarzenia typu X = x i i Y = y j są niezależne, tzn. dla każdej pary (i, j) P(X = x i, Y = y j ) = P(X = x i ) P(Y = y j ) lub zapisując powyższe symbolami: p ij = p i p j.
Zmienne X i Y z poprzedniego przykładu nie są niezależne, gdyż dla pary (i, j) = (1, 1) otrzymujemy: p 11 = 0,16 0,5 0,2 = p 1 p 1. y j x i 0 1 2 p i 1 0,16 0,32 0,02 0,50 2 0,03 0,34 0,03 0,40 3 0,01 0,04 0,05 0,10 p j 0,20 0,70 0,10 1
Kowariancja i współczynnik korelacji Jeśli chcemy w sposób syntetyczny scharakteryzować zależność między dwoma zmiennymi losowymi, możemy posłużyć się dwoma parametrami: kowariancją i współczynnikiem korelacji. Kowariancję zmiennych losowych X i Y, którą oznaczać będziemy jako cov(x, Y) definiuje się jako wartość oczekiwaną odchyleń obu zmiennych od wartości oczekiwanych w ich rozkładach brzegowych: cov(x,y ) = E( ( X E(X) ) ( Y E(Y ))), co można też przedstawić w postaci: cov(x,y ) = E(X Y ) E(X) E(Y ).
Kowariancja i współczynnik korelacji Jeśli chcemy w sposób syntetyczny scharakteryzować zależność między dwoma zmiennymi losowymi, możemy posłużyć się dwoma parametrami: kowariancją i współczynnikiem korelacji. Kowariancję zmiennych losowych X i Y, którą oznaczać będziemy jako cov(x, Y) definiuje się jako wartość oczekiwaną odchyleń obu zmiennych od wartości oczekiwanych w ich rozkładach brzegowych: cov(x,y ) = E( ( X E(X) ) ( Y E(Y ))), co można też przedstawić w postaci: cov(x,y ) = E(X Y ) E(X) E(Y ).
Kowariancja i współczynnik korelacji Dla zmiennych typu skokowego wzory na kowariancję przyjmują zatem postać: cov(x,y ) = k l i=1 j=1 ( x i E(X) ) ( y j E(Y )) p ij albo w postaci: cov(x,y ) = k l i=1 j=1 x i y j p ij E(X)E(Y ).
Kowariancja i współczynnik korelacji cov(x,y ) = k l i=1 j=1 ( x i E(X) ) ( y j E(Y )) p ij Jeśli we wspólnym rozkładzie zmiennych X i Y małym wartościom zmiennej X odpowiadają małe wartości zmiennej Y, to odchylenia x i - E(X) i y j - E(Y) mają w większości przypadków jednakowe znaki (oba dodatnie albo oba ujemne), ich iloczyny są przeważnie dodatnie i w konsekwencji cov(x, Y) > 0. Dodatnia wartość kowariancji oznacza zatem, że przy wzroście wartości X wartości Y na ogół również rosną, przy czym relacja ta ma charakter symetryczny. Mówimy w takim przypadku, że zmienne X i Y są dodatnio skorelowane.
Kowariancja i współczynnik korelacji cov(x,y ) = k l i=1 j=1 ( x i E(X) ) ( y j E(Y )) p ij Jeśli natomiast małym wartościom zmiennej X odpowiadają duże wartości zmiennej Y, a dużym wartościom zmiennej X - małe wartości zmiennej Y, to odchylenia x i - E(X) i y j - E(Y) mają w większości przypadków przeciwne znaki, ich iloczyny są więc przeważnie ujemne i w konsekwencji cov(x, Y) < 0. Ujemna wartość kowariancji oznacza zatem, że przy wzroście wartości X wartości Y na ogół maleją, przy czym relacja ta ma charakter symetryczny. Mówimy w takim przypadku, że zmienne X i Y są ujemnie skorelowane.
Kowariancja i współczynnik korelacji Może się też zdarzyć, że przy wzroście X poziom wartości Y, ogólnie rzecz biorąc, nie zmienia się. Wtedy cov(x, Y) = 0 i mówimy, że zmienne X i Y nie są skorelowane. Taka sytuacja ma na przykład miejsce, gdy zmienne X i Y są niezależne. Wadą kowariancji jest to, że jej wartość zależy od jednostek pomiaru obu cech, więc kowariancja nie może określać stopnia intensywności (siły) zależności. Aby pozbyć się tej wady wprowadza się współczynnik korelacji: ρ = cov(x,y ) SD(X) SD(Y ) = cov(x,y ) Var(X) Var(Y ).
Kowariancja i współczynnik korelacji ρ = cov(x,y ) SD(X) SD(Y ) = cov(x,y ) Var(X) Var(Y ). Iloczyn w mianowniku niweluje wpływ jednostek pomiaru X i Y i w rezultacie wartość ρ zależy wyłącznie od intensywności skorelowania zmiennych. Wykazuje się, że: 1 ρ 1 Jeśli ρ = 0, to cov(x, Y)=0, więc zmienne nie są skorelowane; jeśli współczynnik ρ = -1, to zmienne są ujemnie skorelowane; jeśli ρ = 1, to zmienne są skorelowane dodatnio.
y j x i 0 1 2 p i 1 0,16 0,32 0,02 0,50 2 0,03 0,34 0,03 0,40 3 0,01 0,04 0,05 0,10 p j 0,20 0,70 0,10 1 więc E(X) = 1 0,50 + 2 0,40 + 3 0,10 = 1,6, E(Y ) = 0 0,20 +1 0,70 + 2 0,10 = 0,9, E(XY ) = k l x i y j p ij = 1 0 0,16 + + 3 2 0,05 = 1,58, i=1 j=1 cov(x,y ) = k l i=1 j=1 x i y j p ij E(X)E(Y ) = 1,58 1,6 0,9 = 0,14.
y j x i 0 1 2 p i 1 0,16 0,32 0,02 0,50 2 0,03 0,34 0,03 0,40 3 0,01 0,04 0,05 0,10 p j 0,20 0,70 0,10 1 Ponadto SD(X) = 1 2 0,50 + 2 2 0,40 + 3 2 0,10 = 0,44, SD(Y ) = 0 2 0,20 +1 2 0,70 + 2 2 0,10 = 0,29, więc współczynnik korelacji jest równy ρ = cov(x,y ) SD(X) SD(Y ) = 0,14 0,44 0,29 = 0,392. Uzyskany wynik, bliższy 0 niż 1, wskazuje na niezbyt silne skorelowanie dodatnie obu zmiennych.
Własności wartości oczekiwanej i wariancji E(c) = 0, gdzie c jest stałą, E(cX) = ce(x), E(X + Y) = E(X) + E(Y), Var(c) = 0, Var(cX) = c 2 Var(X), Var(X + Y) = Var(X) + Var(Y) + 2cov(X, Y), Var(X + Y) = Var(X) + Var(Y) dla zmiennych niezależnych X i Y.