IV. ZMIENNE LOSOWE DWUWYMIAROWE 4.. Rozkład zmeej losowej dwuwymarowej Defcja 4.. Uporządkowaą parę (X, Y) azywamy zmeą losową dwuwymarową, jeśl każda ze zmeych X Y jest zmeą losową. Defcja 4.. Fukcję rzeczywstą F(, y) zmeych rzeczywstych y określoą a całej płaszczyźe Oy jako prawdopodobeństwo, że zmea losowa X przyjme wartość mejszą od oraz zmea losowa Y przyjme wartość mejszą od y azywamy dystrybuatą zmeej losowej dwuwymarowej, czyl Dystrybuata F(, y) jest względem każdego z argumetów y fukcją: a) emalejącą, b) co ajmej lewostroe cągłą, c) spełającą waruk gracze d) o własośc gdze < y < y ozaczają lczby rzeczywste. Powyższe waruk są zarazem koecze wystarczające a to, by fukcja F(, y) była dystrybuatą dwuwymarowej zmeej losowej (X, Y). Defcja 4.3. Mówmy, że zmea losowa dwuwymarowa (X, Y) jest typu skokowego, jeżel dla każdej pary wskaźków oraz k jest określoa fukcja spełająca waruek F(, y) = P( X <, Y < y). lm F(, y) =, lm F(, y) = 0, lm F(, y) = 0, y dla każdej pary wartośc rzeczywstych y. y F(, y ) F(, y ) F(, y ) + F(, y ), 0 P( X =, Y = y ) = p >0 k k F(, y) = p k < y < y k
76 IV. Zmee losowe dwuwymarowe Fukcję tę azywa sę fukcją prawdopodobeństwa, pukty (, y k ) puktam skokowym, a prawdopodobeństwa p k skokam. Bezpośredo z podaej defcj wyka, że p k =., k Defcja 4.4. Mówmy, że zmea losowa (X, Y) jest typu cągłego, gdy steje taka eujema całkowala a całej płaszczyźe Oy fukcja f(, y), że dla każdej pary wartośc rzeczywstych y. Fukcję f(, y) azywa sę gęstoścą prawdopodobeństwa lub krótko gęstoścą zmeej losowej cągłej (X, Y). Z defcj tej wyka, że Mówmy, że jest day rozkład prawdopodobeństwa zmeej losowej (X, Y), gdy jest zaa dystrybuata albo też gdy jest zaa fukcja prawdopodobeństwa dla zmeej losowej skokowej lub gęstość prawdopodobeństwa dla zmeej losowej cągłej. Przykład 4.. Zbadać, czy fukcja F(, y) = f ( s, t) dsdt y f (, y) ddy =. ( y ) e dla y, f (, y) = 8 0 dla ych (, y) jest gęstoścą dwuwymarowej zmeej losowej (X, Y). Podaa fukcja jest eujema, gdyż dla y # mamy! y $ 0. Wystarczy zatem sprawdzć, że Mamy f (, y) ddy =. f (, y) dy = ( y ) e dy = e dy e y dy 8 8 3 y = e y e e e e = = 8 3 8 3 3 3 3 6 Stąd.
4.. Rozkład zmeej losowej dwuwymarowej 77 f (, y) dy 3 d = e d = Γ( 4) =! =. 6 6 6 3 Przykład 4.. Zmea losowa (X, Y) podlega rozkładow o gęstośc dla 0< y, f (, y) = y 0 dla ych (, y). Zaleźć dystrybuatę zmeej losowej (X, Y). Dystrybuatę wyzaczymy kolejo dla obszarów przedstawoych a poższym rysuku. W obszarze A mamy # 0 lub y # 0. Z określea gęstośc f(, y) wyka, że w tym obszarze mamy F(, y) = 0. Obszar B jest określoy erówoścam 0 < # oraz # y #. Dla puktów (, y) położoych w tym obszarze mamy (zob. rys. a)) y y F(, y) = y dy d = y dy d = 0 0 0 y = ( y ) d = d y = d = y = y. 0 0 0 0 0 0 W obszarze C są spełoe erówośc 0 < # oraz < y < 4. W obszarze tym mamy (zob. rys. b)) F(, y) = dy d F(, ), = = y 0 przy czym wykorzystalśmy tu wyk otrzymay dla obszaru B. y y d d
78 IV. Zmee losowe dwuwymarowe W obszarze D mamy 0 < < 4 oraz 0 < y # y <, a węc (zob. rys. C) y y F(, y) = dy d F( y, y) y, = = y 0 przy czym poowe wykorzystalśmy wyk otrzymay dla obszaru B. Wreszce, dla obszaru E spełoe są erówośc < < 4 oraz < y < 4 otrzymujemy (zob. rys. d)) F(, y) = f (, y) dy d = F(, ) =. 0 4.. Rozkłady brzegowe Nech prawdopodobeństwo p k będze określoe wzorem p = P( X =, Y = y ) > 0. k k Ozaczmy p = P( X =, Y = y lub X =, Y = y lub K)
4.. Rozkłady brzegowe 7 podobe = = = + = = + = P ( X, Y y ) P ( = = = X, Y y ) P( X, Y yk) pk k K p k = P( X =, Y = yk) = pk. k Ozacza to, że wartość p jest prawdopodobeństwem, że zmea losowa X przyjme war- tość, gdy zmea losowa Y przyjme którąkolwek z możlwych wartośc, a wartość p k jest prawdopodobeństwem, że zmea losowa Y przyjme wartość y k, gdy zmea losowa X przyjme którąkolwek z możlwych wartośc. Mamy przy tym p = p = p = p =. k k k k k Defcja 4.5. Rozkład prawdopodobeństwa wyzaczoy przez lczby p lub p k azywamy rozkładem brzegowym zmeej losowej skokowej X lub Y w dwuwymarowym rozkładze zmeej losowej (X, Y), a wyrażee p lub p k azywamy fukcją prawdopodobeństwa tego rozkładu. Fukcję prawdopodobeństwa moża podać w postac wzoru lub tzw. tablcy dwuwejścowej (gdy zmea losowa przyjmuje skończoą lczbę wartośc). Dystrybuatę F () określa wzór F( ) = p = pk, < < k co ozacza, że sumowae dotyczy wszystkch wartośc k oraz tych wartośc wskaźka, dla których jest spełoa erówość <. Podobe jest określoa dystrybuata F (y): Podobe, jak dla zmeej losowej skokowej, wprowadza sę pojęce rozkładów brzegowych dla zmeej losowej cągłej. Nech f(, y) ozacza gęstość dwuwymarowej zmeej losowej (X, Y). Wprowadźmy ozaczea Fukcje te są całkowale a całej os, eujeme oraz spełają waruk F ( y) = p k = pk. y k < y y < y k f ( ) = f (, y) dy, f ( y) = f (, y) d. f( ) d = f (, y) dy d =, f ( y) dy = f (, y) d dy. = k Defcja 4.6. Rozkład wyzaczoy przez fukcje f () lub f (y) azywamy rozkładem brzegowym zmeej losowej cągłej X lub Y w dwuwymarowym rozkładze zmeej
80 IV. Zmee losowe dwuwymarowe losowej (X, Y), a fukcje f () lub f (y) azywamy gęstoścam prawdopodobeństwa tych rozkładów. Dystrybuaty są określoe astępującym wzoram: Przykład 4.3. Daa jest fukcja F( ) = f( ) d = f (, y) dy d, y y F( y) = f( y) dy = f (, y) d dy. Cy dla, y 4, f (, y) = 0 dla ych y. A. Wyzaczyć stałą C tak, aby podaa fukcja określała rozkład. B. Podać rozkłady brzegowe. C. Określć dystrybuatę. Ad. A. Stałą wyzaczamy z waruku Z uwag a defcję fukcj f(, y) mamy Zatem C =, skąd C = /. Ad. B. Mamy f (, y) ddy =. 4 4 f (, y) d dy = Cy d dy = C y d dy 4 C y 4 = dy = C y dy 4 = C ydy = C y 4 3 3 3 = C( 8 ) = C. 4 f f y dy ydy y ( ) = (, ) = ( 8 ), = = = dla 3 f y f y d y d y ( ) = (, ) = = y y y 4. = = dla 6 4
4.. Rozkłady brzegowe 8 Możemy zatem apsać f dla, ( ) = 3 0 dla ych, f y dla y 4, ( y) = 6 0 dla ych y. Ad. C. Dystrybuatę wyzaczymy kolejo dla obszarów pokazaych a poższym rysuku. Dla obszaru A mamy # lub y #. Poeważ fukcja gęstośc f(, y) jest w tym obszarze rówa 0, węc F(, y) = 0. W obszarze B spełoe są erówośc # # oraz # y # 4 mamy y y F(, y) = ydyd = ydy d y = d y y = d = d = ( y ) 4 4 8 8 = ( y 4) ( y )( ) 8 = 36 4 = ( y 4 y + 4). 36 Dla obszaru C mamy # # oraz 4 # y < 4, węc 4 F(, y) = ydyd = F(, 4) = ( + ) = ( ) = F ( ), 36 6 4 6 4 3 przy czym skorzystalśmy tu z wyku uzyskaego dla obszaru B.
8 IV. Zmee losowe dwuwymarowe W obszarze D zachodzą erówośc < < 4 oraz # y # 4 poowe korzystając z wyku dla obszaru B otrzymujemy y F(, y) = ydyd = F(, y) = ( y y + ) = ( y ) = F ( y). 36 4 6 4 4 Wreszce, dla obszary E, w którym zachodzą erówośc < < 4 4 < y < 4, mamy 4 F(, y) = ydyd = F( 4, ) = ( 64 6 6 + 4) =. 36 Zadaa. Podać gęstośc rozkładów brzegowych zmeych X Y w dwuwymarowym rozkładze zmeej losowej (X, Y) o gęstośc daej wzorem ( y ) e dla y, f (, y) = 8 0 dla ych (, y).. Podać rozkłady brzegowe zmeych X Y rozkładu podaego w przykładze 4.. 3. Zaleźć gęstośc dystrybuaty brzegowe zmeych X Y rozkładu w dwuwymarowym rozkładze zmeej losowej (X, Y) o gęstośc f (, y) = e dla 0 <, y <, 0 dla ych (, y). 4. Wyzaczyć dystrybuatę F(, y), gęstośc brzegowe f (), f (y), dystrybuaty brzegowe F (), F (y) rozkładu prawdopodobeństwa dwuwymarowej zmeej losowej (X, Y), jeśl gęstość jest daa wzorem dla 0, y, f (, y) = 0 dla ych (, y).
V. ELEMENTY STATYSTYKI MATEMATYCZNEJ 5.. Przedmot zadaa statystyk matematyczej Statystyka jest auką zajmującą sę lczbowym opsywaem masowych zjawsk procesów. Najpowszechej zaa statystyka zajmuje sę rejestrowaem daych potrzebych ludzom zajmującym sę poltyką gospodarką. Dae te dotyczą zwykle ludośc, jej podzału a róże zawody, welkośc produkcj w poszczególych dzałach gospodark arodowej, welkośc obrotów hadlowych, welkośc spożyca różych artykułów tp. Baday zbór azywa sę populacją (ekoecze mus to być zbór ludz, p. populacja przedsęborstw, populacja gospodarstw rolych). Dla daej populacj wyróża sę pewą cechę (lub cechy) każdemu elemetow populacj przyporządkowuje sę pewą wartość cechy. Zbór par (wartość cechy, lczba jedostek w populacj o daej wartośc cechy) azywa sę rozkładem cechy w populacj. Często pojawa sę koeczość uzyskaa daych w y sposób ż za pomocą spsywaa wszystkch jedostek populacj. Te y sposób to tzw. badae reprezetacyje lub badae wyrywkowe. Polega oo a tym, że z populacj wybera sę tylko pewą lczbę jedostek każdej z wybraych jedostek, w wyku odpowedego badaa, przyporządkowuje sę wartość badaej cechy. Zbór badaych jedostek azywa sę próbką. Powstaje problem uogólea wyków badaa wyrywkowego a całą populację. Pojawają sę atychmast astępujące pytaa:! czy take uogólee jest możlwe,! jeżel tak, to jak je przeprowadzć,! jak jest warygodość tak uogóloych daych? Zagadee opsaa populacj przez podae rozkładu teresującej as cechy sprowadza sę do zadaa podaa rozkładu pewej zmeej losowej. Często jest wystarczające oszacowae tylko pewych sytetyczych wskaźków dotyczących tej cechy. Take zadaa sprowadzają sę do szacowae ektórych parametrów zmeych losowych lub prawdopodobeństw pewych zdarzeń losowych. Zadaa szacowaa rozkładu zmeych losowych, parametrów tych rozkładów (p. wartośc oczekwaej) lub prawdopodobeństw różych zdarzeń azywają sę zadaam estymacj. Często w praktyce zdarza sę, że rozważając pewe zagadee mamy gotową hpotezę dotyczącą tego zagadea zadae polega a tym, żeby hpotezę tę sprawdzć. Hpotezą statystyczą azywa sę każde przypuszczee o rozkładze zmeej losowej, jego parametrach lub prawdopodobeństwach pewych zdarzeń. Część statystyk, która zajmuje sę metodam sprawdzaa takch hpotez azywa sę teorą weryfkacj hpotez statystyczych lub teorą testów statystyczych.
84 V. Elemety statystyk matematyczej Przykład 5.. Wyjmjmy z portmoetk dowolą moetę. Sprawdzee, czy jest oa symetrycza sprowadza sę do zweryfkowaa hpotezy, że zmea losowa przyjmująca wartość, gdy wykem rzutu moetą jest orzeł wartość 0 w przecwym przypadku, ma wartość oczekwaą rówą /. Hpoteza ta może być rówoważe sformułowaa astępująco: zdarzee polegające a wyrzuceu orła jest rówe /. 5.. Pojęce próbk Rozważmy przykład 5.. W celu sprawdzea, czy moeta jest symetrycza, wykoujemy serę ezależych rzutów tą moetą. Nech X ozacza zmeą losową przyjmują wartość, gdy wykem rzutu jest orzeł wartość 0 w przecwym przypadku. Nech X ozacza zmeą losową wyk -tego rzutu. Lczba wszystkch rzutów ech wyos. Każda ze zmeych losowych X ma jedakowy rozkład, tak jak zmea losowa X zmee losowe X są ezależe. Zadae polega a sformułowau pewych wosków o rozkładze zmeej losowej X a podstawe wyków X, X,..., X przeprowadzoych rzutów. Zmee losowe X, X,..., X staową próbkę w aszym zagadeu. Defcja 5.. Nech X ozacza zmeą losową. Próbką -elemetową azywamy cąg ezależych zmeych losowych X, X,..., X o jedakowym rozkładze, takm jak rozkład zmeej losowej X. Woskowae statystycze polega a formułowau różych twerdzeń o rozkładze zmeej losowej X a podstawe próbk X, X,..., X. 5.3. Zagadea estymacj Rozpatrzmy problem ogóly. Nech X ozacza zmeą losową o ezaej dystrybuace F(X), a X, X,..., X próbkę dla zmeej losowej X. Przypuśćmy, że zadae polega a oszacowau pewego parametru lczbowego ϑ w tym rozkładze (p. wartośc oczekwaej, waracj, prawdopodobeństwa pewego ustaloego zdarzea, p. P(X > a), gdze a ozacza pewą stałą). Za oszacowae parametru ϑ przyjmemy zaobserwowaą wartość pewej fukcj określoej a zborze wszystkch wartośc z próbk, tz. fukcj, której argumetam są zmee losowe X, X,..., X. Ozaczmy tę fukcję astępująco: $ ϑ = $ ϑ ( X, X, K, X ). Fukcję ϑ$ azywamy estymatorem parametru ϑ. Określając fukcję ϑ$ dla każdej wartośc, otrzymujemy cąg fukcj ϑ$ ( =,,..., ). Aby estymator ϑ$ mógł być praktycze wykorzystay, muszą być spełoe pewe dodatkowe waruk, które powy zagwaratować, że obserwowae w próbce wartośc ϑ$ e będą bardzo odbegały od prawdzwych wartośc parametru ϑ. Ograczymy sę do dwóch waruków.
5.3. Zagadea estymacj 85 Defcja 5.. Jeżel dla każdej dodatej lczby g Defcja 5.3. Jeśl to estymator ϑ$ azywamy estymatorem zgodym. to estymator ϑ$ azywamy estymatorem eobcążoym. Przykład 5.. Nech daa będze zmea losowa X ech zadae polega a oszacowau prawdopodobeństwa p = P(X > a), gdze a ozacza pewą stałą. Nech X, X,..., X ozacza próbkę zdefujmy owe zmee losowe Pokazać, że estymator $p jest zgodym eobcążoym estymatorem parametru p. Z określea zmeych losowych Y wyka, że zdarzee, ż zmea losowa Y jest rówa jest rówoważe zdarzeu, że zmea losowa X przyjme wartość wększą od a. Poeważ zmee losowe X są ezależe, węc zdarzea X > a są też ezależe. Suma Y + Y +... + Y może być węc terpretowaa jako lczba zajść pewego zdarzea w schemace Beroullego. W takm przypadku jest spełoe tzw. prawo welkch lczb Berollego: Twerdzee 5.. Jeżel {X } ozacza cąg zmeych losowych o wspólym rozkładze zero-jedykowym, tj. oraz ( ) lm P ϑ$ ϑ > ε = 0, E ( ϑ ) $ = ϑ,, gdy X > a, Y = 0, gdy X a. Określmy astępe estymator $p parametru p: p$ = ( ). Y + Y + K + Y P( X = ) = p, P( X = 0) = p Y = = X, to cąg U jest stochastycze zbeży do p. Dowód pomjamy. Y = # Iym słowy: poeważ zmea Y jest zmeą losową o rozkładze dwumaowym, która przyjmuje wartośc k (k = 0,,..., ), a ułamek k/ ozacza częs-
86 V. Elemety statystyk matematyczej tość względą pojawea sę określoego zdarzea w dośwadczeach przeprowadzoych według schematu Beroullego, to możemy powedzeć, że Stąd wyka, że estymator Poadto mamy lm P k p ε = 0. $p jest estymatorem zgodym. Ale wartość oczekwaa sumy zmeych losowych jest rówa sume wartośc oczekwaych tych zmeych, węc Korzystając z twerdzea 3.7 mamy ( ) a to ozacza, że estymator $p jest estymatorem eobcążoym parametru p. Wyk uzyskay dla parametru p z powyższego przykładu może być uogóloy. Twerdzee 5.. Średa z próbk jest zgodym eobcążoym estymatorem wartośc oczekwaej, jeśl tylko ta wartość oczekwaa steje. Dowód. Ozaczmy średą z próbk przez Mamy X. EY ( ) = PX ( > a) + 0 PX ( a) = p. EY ( + Y + K + Y) = EY ( ) = p. gdze X ozacza zmeą losową o takm samym rozkładze, jak X, X,..., X, czyl jak próbka. Dowód zgodośc estymatora X wyka z tzw. prawa welkch lczb Chczya, którego dowód pomjamy: Twerdzee 5.3. Nech X, X,..., X ozacza cąg ezależych zmeych losowych o jedakowym rozkładze. Jeżel wartość oczekwaa m = E(X) steje, to dla każdej lczby g > 0 = E p$ = E ( Y + Y + + Y ) = EY ( + Y + + Y ) = p, K K E( X) = E ( X+ X + K+ X) = E ( X + X + K+ X ) ( E ( X ) E ( X ) E ( X = + + K + )) = E ( X ) = E ( X ), lm P X + X + K + X m ε = 0. #