prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Pravděpodobnost a statistika Katedra teoretické informatiky Fakulta informačních technologií

Náhodné vektory prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v Praze c Rudolf Blažek, Roman Kotecký, 2011 Pravděpodobnost a statistika BI-PST, LS 2010/11, Přednáška 6 Evropský sociální fond. Praha & EU: Investujeme do vaší budoucnosti Roman Kotecký, Rudolf Blažek (FIT ČVUT) Náhodné vektory BI-PST, LS 2010/11, Přednáška 6 1 / 17

Rekapitulace Rekapitulace (spojité náhodné veličiny) Hustota náhodné veličiny X : funkce f X : R [0, ) tak, že P(a X b) = Distribuční funkce náhodné veličiny X : F X (x) = P(X x) = x f X (u)du. Střední hodnota náhodné veličiny X : EX = x f X (x) dx a její variance (rozptyl) : varx = E[(X EX) 2 ] = b (x EX) 2 f X (x) dx. a f X (x)dx. Roman Kotecký, Rudolf Blažek (FIT ČVUT) Náhodné vektory BI-PST, LS 2010/11, Přednáška 6 2 / 17

Rekapitulace Hustota f X (x) Rovnoměrné rozdělení X Unif(a, b) : f X (x) = 1 b a Exponenciální rozdělení X Exp(λ) : a + b pro a x b, EX =, varx = 2 2 1 1 2 λ=2 λ=1 1 2 3 4 5 6 a λ=1/2 b (b a)2. 12 f X (x) = λe λx pro x 0, EX = 1 λ, varx = 1 λ. 2 Normální (Gaussovo) rozdělení X N(µ, σ 2 ) : Μ3Σ Μ2Σ ΜΣ Μ ΜΣ Μ2Σ Μ3Σ f X (x) = 1 e (x µ)2 /2σ 2, EX = µ, varx = σ 2. 2πσ Standardní normální (Gaussovo) rozdělení Z N(0, 1) : ϕ(x) = f Z (x) = 1 2π e x 2 /2, Φ(x) = 1 2π x 3 2 1 0 1 2 3 e u2 /2 du. Roman Kotecký, Rudolf Blažek (FIT ČVUT) Náhodné vektory BI-PST, LS 2010/11, Přednáška 6 3 / 17

Charakteristiky náhodných veličin Mimo střední hodotu E(X) se jako charakteristika polohy používá i medián : číslo m (nejednoznačné), které splňuje rovnost P(X m) 1/2 a P(X m) 1/2. Např. pro X {1, 2, 2, 3, 3, 13}, každá hodnota se stejnou pravděpodobností, je m(x) [2, 3]. Přitom E(X) = 4. Medián ignoruje extrémy. Charakteristikou variability je rozptyl (variance) σ 2 = var(x) = E(X 2 ) E(X) 2, nebo též střední odchylka E( X E(X) ). Charakteristikou šikmosti (skewness) je koeficient šikmosti γ 1 = µ 3 σ 3 = E((X E(X))3 ) (E(X 2 ) E(X) 2 ) 3/2. Míra asymetrie: koeficient γ 1 je kladný nebo záporný podle toho, na kterou stranu se hustota pravděpodobnosti víc odchyluje od střední hodnoty: γ 1 = 1.26 γ 1 = 1.14 Roman Kotecký, Rudolf Blažek (FIT ČVUT) Náhodné vektory BI-PST, LS 2010/11, Přednáška 6 4 / 17

Charakteristiky náhodných veličin Koeficient špičatosti (excess kurtosis) κυρτός =opuchat; je charakteristika, která porovnává hustotu pravděpodobnosti náhodné veličiny s normálním rozdělením: γ 2 = µ 4 σ 4 3 = E((X E(X))4 ) (E(X 2 ) E(X) 2 ) 2 3. γ 2 = 0.5 γ 2 = 0 γ 2 = 0.85 Roman Kotecký, Rudolf Blažek (FIT ČVUT) Náhodné vektory BI-PST, LS 2010/11, Přednáška 6 5 / 17

Soubory náhodných veličin Společná pravděpodobostní funkce Definice Máme-li dvě diskrétní náhodné veličiny X a Y na stejném pravděpodobnostním prostoru Ω, můžeme definovat jejich společnou pravděpodobnostní funkci p X,Y : R [0, 1] danou vztahem p X,Y (x, y) = P(X = x, Y = y). Zde, P(X = x, Y = y) je zkratkou za podrobnější P({X = x} {Y = y}). Příklad (Minimum a maximum ze dvou hodů čtyřstranné kostky) X(ω) = min{ω(1), ω(2)}, Y(ω) = max{ω(1), ω(2)}: Společná pravděpodobostní funkce : 4 3 2 1 1 2 3 4 P(X = 2, Y = 3) = P({ω : min{ω(1), ω(2)} = 2, max{ω(1), ω(2)} = 3}) = = P({ω {(2, 3), (3, 2)}) = 2 16 = 1 8. Roman Kotecký, Rudolf Blažek (FIT ČVUT) Náhodné vektory BI-PST, LS 2010/11, Přednáška 6 6 / 17

Soubory náhodných veličin Marginál Příklad (pokračování) Obecně tedy, 1 pokud k < l, 8 1 p X,Y (k, l) = P(X = k, Y = l) = pokud k = l, 16 0 pokud k > l. Všimněte si, že pro každé k platí l p X,Y (k, l) = 2(4 k)+1 16 = p X (k). Podobně, pro každé l platí k p X,Y (k, l) = 2(l 1)+1 16 = p Y (l). To platí i v obecněm případě, p X,Y (x, y) = y y P(X = x, Y = y) = P(X = x) = p X (x) V tomto kontextu se p X a p Y nazývají marginály pravděpodobnostní funkce p X,Y : E(f(X)) = x,y p X,Y (x, y)f(x) = x f(x) y p X,Y (x, y) = x f(x)p X (x). Roman Kotecký, Rudolf Blažek (FIT ČVUT) Náhodné vektory BI-PST, LS 2010/11, Přednáška 6 7 / 17

Soubory náhodných veličin Funkce několika náhodných veličin Pro g : R 2 R, uvažujme náhodnou veličinu Z = g(x, Y) (tj. funkci Z : Ω R danou pro každé ω Ω vztahem Z(ω) = g(x(ω), Y(ω))). Pak p Z (z) = p X,Y (x, y) {(x,y):g(x,y)=z} a E(Z) = E(g(X, Y)) = z zp Z (z) = z z {(x,y):g(x,y)=z} p X,Y (x, y) = = z {(x,y):g(x,y)=z} g(x, y)p X,Y (x, y) = x,y g(x, y)p X,Y (x, y). Speciálně, E(αX + βy) = x,y (αx + βy)p X,Y (x, y) = = αx p X,Y (x, y)+ βy p X,Y (x, y) = α x y y x x xp X (x)+β y yp Y (y) = = αe(x) + βe(y). Roman Kotecký, Rudolf Blažek (FIT ČVUT) Náhodné vektory BI-PST, LS 2010/11, Přednáška 6 8 / 17

Soubory náhodných veličin Funkce několika náhodných veličin Podobně definujeme i společnou pravděpodobostní funkci více náhodných veličin. Třeba pro tři náhodné veličiny X, Y, Z, máme p X,Y,Z (x, y, z) = P(X = x, Y = y, Z = z), p X,Y,Z (x, y, z) = p X (x) y,z a podobně p X,Y,Z (x, y, z) = p Y (y) a p X,Y,Z (x, y, z) = p Z (z), x,z x,y E(g(X, Y, Z)) = x,y,z g(x, y, z)p X,Y,Z (x, y, z) a E(αX + βy + γz) = αe(x) + βe(y) + γe(z). Roman Kotecký, Rudolf Blažek (FIT ČVUT) Náhodné vektory BI-PST, LS 2010/11, Přednáška 6 9 / 17

Podmíněná pravděpodobnostní funkce Podmínění náhodným jevem Definice (Podmínění náhodné veličiny X jevem A) Podmíněná pravděpodobnostní funkce p X A náhodné veličiny X podmíněná jevem A s P(A) > 0, je definována vztahem p X A (x) = P(X = x A) = P({X = x} A). P(A) Všimněme si, že jevy {X = x} A jsou disjunktní pro různá x a proto P(A) = x P({X = x} A), což implikuje p X A (x) = 1. Funkce p X A je tedy skutečně legitimní pravděpodobnostní funkce. x Roman Kotecký, Rudolf Blažek (FIT ČVUT) Náhodné vektory BI-PST, LS 2010/11, Přednáška 6 10 / 17

Podmíněná pravděpodobnostní funkce Podmínění náhodným jevem Příklad Student opakuje zkoušku nejvýše n-krát, pokaždé se stejnou pravděpodobností p úspěchu (nezávisle na počtu předešlých pokusů!) Jaká je pravděpodobnostní funkce počtu pokusů o zkoušku podmíněná tím, že student u zkoušky uspěl? Nechť A je náhodný jev, že student u zkoušky uspěl (po nejvýše n pokusech) a X je počet pokusů až k prvnímu úspěchu za předpokladu, že je umožněn neohraničený počet pokusů. X je geometrická náhodná veličina s parametrem p a A = {X n}. Platí a P(A) = n (1 p) m 1 1 (1 p)n p = p 1 (1 p) m=1 p X A (k) = { (1 p) k 1 p 1 (1 p) n pokud k = 1,..., n, 0 jindy. = 1 (1 p)n Roman Kotecký, Rudolf Blažek (FIT ČVUT) Náhodné vektory BI-PST, LS 2010/11, Přednáška 6 11 / 17

Podmíněná pravděpodobnostní funkce Podmínění náhodnou veličinou Definice (Podmínění náhodné veličiny X náhodnou veličinou Y ) X a Y jsou dvě náhodné veličiny asociované se stejným experimentem. Víme-li, že Y = y (s p Y (y) > 0), máme částečnou informaci o X. Ta je zachycená v podmíněné pravděpodobnostní funkci p X Y veličinou Y a definované vztahem p X Y (x y) = P(X = x Y = y) = náhodné veličiny X podmíněné P(X = x, Y = y). P(Y = y) Opět, p X Y (x y) = 1. y Roman Kotecký, Rudolf Blažek (FIT ČVUT) Náhodné vektory BI-PST, LS 2010/11, Přednáška 6 12 / 17

Podmíněná pravděpodobnostní funkce Podmínění náhodnou veličinou Ilustrace podmíněné pravděpodobnostní funkce p X Y : p X Y (x 3) px,y (x, y) y y = 3 p X Y (x 2) y = 2 y = 1 x = 1 x = 2 x = 3 x p X Y (x 1) Roman Kotecký, Rudolf Blažek (FIT ČVUT) Náhodné vektory BI-PST, LS 2010/11, Přednáška 6 13 / 17

Podmíněná pravděpodobnostní funkce Podmínění náhodnou veličinou Časté použití k výpočtu společné pravděpodobnostní funkce z té podmíněné: p X,Y (x, y) = p Y (y)p X Y (x y) = p X (x)p Y X (y x). A dále pak k výpočtu marginálních funkcí: p X (x) = y p X,Y (x, y) = y p Y (y)p X Y (x y). Příklad (Popletený profesor) Profesor M. Popleta odpovídá na otázky studentů s pravděpodobností 1/4 špatně (nezávisle na ostatních otázkách). V každé přednášce jsou mu položeny 0, 1 nebo 2 otázky, každá možnost s pravděpodobností 1/3. X je počet otázek, které dostane při dané přednášce, Y je počet špatně zodpovězených. Chceme vypočítat společnou pravděpodobnostní funkci p X,Y (x, y) = P(X = x, Y = y) pro všechny dvojice (x, y). Např. p X,Y (1, 1) = p X (1)p Y X (1 1) = 1 3 1 4 = 1 12, atd Roman Kotecký, Rudolf Blažek (FIT ČVUT) Náhodné vektory BI-PST, LS 2010/11, Přednáška 6 14 / 17

Podmíněná pravděpodobnostní funkce Podmínění náhodnou veličinou Příklad (pokračování) 1/16 2 1 6/16 0 9/16 p X,Y (2, 2) = 1/48 p X,Y (2, 1) = 6/48 1/3 p X,Y (2, 0) = 9/48 2 1 1/3 0 1 1/4 0 3/4 p X,Y (1, 1) = 4/48 1/3 p X,Y (1, 0) = 12/48 p X,Y (0, 0) = 16/48 X: # otázek Y : # špatných odpovědí Roman Kotecký, Rudolf Blažek (FIT ČVUT) Náhodné vektory BI-PST, LS 2010/11, Přednáška 6 15 / 17

Podmíněná pravděpodobnostní funkce Podmínění náhodnou veličinou Příklad (pokračování) y p X,Y (x, y) 2 0 0 1/48 1 0 4/48 6/48 0 16/48 12/48 9/48 0 1 2 x Odsud například: P(aspoň jedna špatná odpověď) = součet prvních dvou řádků = = p X,Y (1, 1) + p X,Y (2, 1) + p X,Y (2, 2) = 4 48 + 6 48 + 1 48 Roman Kotecký, Rudolf Blažek (FIT ČVUT) Náhodné vektory BI-PST, LS 2010/11, Přednáška 6 16 / 17

Podmíněná pravděpodobnostní funkce Podmínění náhodnou veličinou Tento výpočet může probíhat ve více stupňích: p X,Y,Z (x, y, z) = p X (x)p Y X (y x)p Z X,Y (z x, y). O pravdivosti této formule se přesvědčíme, dosadíme-li z definice do pravé strany, dostaneme p X (x)p Y X (y x)p Z X,Y (z x, y) = p X (x) p X,Y (x, y) p X,Y,Z (x, y, z) = p X,Y,Z (x, y, z). p X (x) p X,Y (x, y) Roman Kotecký, Rudolf Blažek (FIT ČVUT) Náhodné vektory BI-PST, LS 2010/11, Přednáška 6 17 / 17