Statystya Wyład Adam Ćmel A4 5 cmel@agh.edu.pl Pojęce statysty Pojęce statysty w statystyce matematyczej jest odpowedem pojęca zmeej losowej w rachuu prawdopodobeństwa. Nech X(X,...,X ) będze próbą z pewej populacj. Defcja. Wetorową fucję merzalą T: X T(X)(T (X),...,T (X)) R wymarową statystyą. próby X azywamy Należy oecze podreślć, że statystya e może zależeć od parametru θ desującego rodzę rozładów. Nech X(X,...,X ) będze próbą prostą z populacj o rozładze N(m,σ ).Nech X X, S ( X X ). Wówczas X(X,...,X ), X, S są statystyam. Natomast X m S X m σ e są statystyam. Przyład. Wyoujemy cąg ezależych dośwadczeń, z tórych ażde ończy sę sucesem z ezaym prawdopodobeństwem θ lub porażą z prawdopodobeństwem -θ. Dośwadczea te wyoujemy dopóty, dopó e uzysamy m sucesów. Sformułować model statystyczy tego esperymetu. Aby esperymet zaończył sę w -tej próbe m musmy uzysać w próbe suces, a w poprzedch - próbach dołade m- sucesów. Ozaczając ja zwyle - suces, 0 - poraża przestrzeń prób moża zapsać astępująco: X { (x,...,x ): m, x lub x 0, x, Poeważ z prawdopodobeństwem ta esperymet zaończy sę w sończoej lczbe prób pomjamy esończoe cąg zawerające mej ż m jedye. Jest ch przelczala lość. Przestrzeń prób słada sę wec z cągów sończoych o długośc co ajmej m, ończących sę jedyą zawerających dołade m jedye. Rodza B jest w tym przypadu rodzą wszystch podzborów zboru X, tórą ozaczać będzemy X. Rodza rozładów jest astępująca: x m }. x x P{p θ (x,...,x ) θ ( θ ) θ m (-θ ) -m θ (0,), m }. Ta sostruowaa przestrzeń e jest przestrzeą produtową, ale rodza rozładów jest zów rodzą parametryczą. Możlwa jest też ostrucja ej przestrze
Statystya Wyład Adam Ćmel A4 5 cmel@agh.edu.pl X {m,m+,...}, B X, P {p θ ( ( ) t θ m (-θ) t-m, θ (0,)}, tm,m+.... Powstaje pytae: Czy przeesee rozważań z przestrze (X,B, P) do przestrze zacze uboższej przestrze (X, B, P ) pocąga za sobą utratę formacj. Odpowedź w tym przypadu jest egatywa. Jej uzasadee prowadz do pojęca statysty dostateczych. Dystrybuata emprycza jej podstawowe własośc Rozważmy przestrzeń statystyczą (R,B,{P, ). Stawamy pytae: Czy mając do dyspozycj cąg ezależych obserwacj x,...,x zmeej losowej o rozładze z ezaą dystrybuatą moża choćby w przyblżeu odtworzyć tą dystrybuatę? Aby odpowedzeć a to pytae defujemy a R fucję ˆ ( zwaą dystrybuatą empryczą ˆ obserwacj e węszych ( lczba wszystch obserwacj m lczba ż t #{ j : x j t} Poeważ obserwacja (x,...,x ) jest realzacją wetora losowego (X (,...,X (), to dla ażdego ustaloego t wartość dystrybuaty empryczej ˆ ( tratujemy jao zaobserwowaą wartość zmeej losowej ˆ zwaej róweż dystrybuatą empryczą oreśloej wzorem ˆ { : # j X j ( ω ) t} ( X ( ω )) (, dla x ( gdze ( ( x). 0, dla x ( Z powyższego wzoru wdać, że dla ustaloego t dystrybuata emprycza jest sumą ezależych zmeych losowych ( ( )) o rozładze dwuputowym. Ogóle, dystrybuata emprycza ( t ] X ω jest procesem stochastyczym a R. Z powyższych uwag wya. Twerdzee. Dla ażdego ustaloego t dystrybuata emprycza ma astępujące własośc:. E ( ˆ ) (. P {ω : lm ˆ ω ) ( } 3. Rozład zmeej losowej ˆ ( ( t )( ( ) dąży do rozładu N(0,), gdy. Dowód: Własość wya z lowośc operatora wartośc oczewaej. Istote E ˆ ( ) E [ ( ( X ( ω )) ] E [ ( ( X ( ) ] P X ( ) ( ( t (
Statystya Wyład Adam Ćmel A4 5 cmel@agh.edu.pl Własość wya bezpośredo z mocego prawa welch lczb Kołmogorowa a własość 3 z cetralego twerdzea graczego CTG dla cągu prób Beroullego. Własośc, 3 mają charater loaly. Warto zazaczyć, że zbór {ω: lm ˆ ω ) ( } o zerowym P prawdopodobeństwe jest zależy od t. Istotym wzmoceem własośc jest astępujące twerdzee Glwe-Catellego zwae taże podstawowym twerdzeem statysty matematyczej. Twerdzee Glwe-Catellego. Jeżel X,..., X jest cągem ezależych zmeych losowych o tym samym rozładze z dystrybuatą, to P {ω : lm D ( 0 }, gdze D ( ω ) sup ˆ (. < t< Twerdzee to orzea, że dystrybuata emprycza zbega z prawdopodobeństwem jedostaje a R do dystrybuaty teoretyczej. Zatem, jeżel rozmar próby jest dostatecze duży, to dystrybuata emprycza dowole dobrze przyblża ezaą dystrybuatę. Bardzo ważym użyteczym jest astępujące: Twerdzee Kołmogorowa. Jeżel X,..., X jest cągem ezależych zmeych losowych o tym samym rozładze z cągłą dystrybuatą c, to x lm P ( D x) K( x) ( ) e dla x >0. Dystrybuata K(x) jest stablcowaa. Rozład zmeej losowej D przy założeu c e zależy od dystrybuaty. Wya to z fatu, że jeśl X jest zmeą losową o dystrybuace, to (X) jest zmeą losową o rozładze jedostajym U (0,). Podstawowe problemy statysty matematyczej Nech (X, B, P{P θ : θ Θ}), będze przestrzeą statystyczą duowaą przez zmeą losową X (zwyle wetorową) o wartoścach w przestrze X. Podstawowe problemy statysty matematyczej to: Problem estymacj putowej. Na podstawe obserwacj zmeej losowej X oszacować g(θ) Y, gdze g: Θ Y jest zaą fucją parametru θ o wartoścach w pewej przestrze metryczej (zwyle euldesowej). Poeważ parametr θ jest ezay wartość g(θ) jest ezaa. Rozwązaem tego problemu będze pewa fucja (statystya, elemet losowy) ĝ:x Y zwaa estymatorem. Estymator może być uzay za dobry estymator, jeżel fucja ĝ przyjmuje wartośc blse wartoścom g(θ) θ Θ. Wprowadzee do sformułowaa problemu fucj g poszerza lasę jedolce rozważaych zagadeń, gdyż oprócz szacowaa samego parametru θ (g jest wtedy 3
Statystya Wyład Adam Ćmel A4 5 cmel@agh.edu.pl detyczoścą) różych jego fucj ( p. θ ) obejmuje szacowae wartośc pewych fucjoałów w przypadach eparametryczych (R,B,{P, ) p. g(θ)g() xd E θx. X (X, B, P ) g ĝ Y g ˆ( X ) g(θ) θ Θ Problem estymacj przedzałowej. Dla przedstawoego powyżej problemu estymacj możemy ostruować e rozwązae w postac zboru ĝ(x) Y p. przedzału (ĝ (X), ĝ (X)) Y w przypadu szacowaa parametru lczbowego g(θ) ta, aby θ Θ P θ (ĝ (X) g(θ) ĝ (X)) -α. Przedzał (ĝ (X), ĝ (X)) jest oczywśce przedzałem losowym. Lczbę -α (zwyle blsą jedośc) azywamy pozomem ufośc. Zagadee estymacj przedzałowej moża uogólć zastępując przedzał ym zborem ufośc (p. ulą jeśl Y jest przestrzeą metryczą). Zazwyczaj przyjmuje sę pewe założea regularośc (p. spójość zboru ufośc) założea dotyczące ształtu zboru ufośc. Problem testowaa hpotez. Nech ΘΘ 0 Θ Θ 0 Θ. Na podstawe obserwacj zmeej losowej X zweryfować hpotezę H 0 : θ Θ 0 wobec alteratywy H : θ Θ. Rozwązaem problemu będze pewa fucja ϕ: X [0,] zwaa zradomzowaym testem statystyczym. Dyspoując testem statystyczym ϕ obserwacją x zmeej losowej X odrzucamy hpotezę H 0 z prawdopodobeństwem ϕ(x). Aby podjąć oretą decyzję ależy węc użyć pewego mechazmu losowego, tóry produuje dwa wy z prawdopodobeństwam ϕ(x) -ϕ(x) a tej podstawe podjąć (wylosować) decyzję. Jeżel zbór wartośc fucj ϕ jest zborem dwuelemetowym {0,}, to test ϕ azywamy ezradomzowaym. Test ta dzel przestrzeń prób a dwa rozłącze zbory : ϕ - ({}){x X: ϕ (x)} zway zborem odrzucea hpotezy H 0 ϕ - ({0}){x X: ϕ (x)0} zway zborem aceptacj H 0. Kostrucja testu ezradomzowego jest węc rówoważa rozbcu przestrze prób a dwa rozłącze podzbory. Problem lasyfacj (zway róweż problemem dysrymacj.) jest uogóleem problemu testowaa hpotez. Uogólee to polega a rozbcu zboru parametrów Θ ( lub rówoważe 4
Statystya Wyład Adam Ćmel A4 5 cmel@agh.edu.pl rodzy P rozładów prawdopodobeństwa a przestrze prób ) a rozłączych podzborów tz. ΘU Θ, j Θ Θ j. Dla dowolej obserwacj x zmeej losowej X ależy zadecydować z tórej z rozłączych populacj oa pochodz. Rozwązaem tego problemu będze pewa fucja wetorowa ϕ : X ϕ(x)( ϕ (x),..., ϕ (x)) zwaa zradomzowaą fucją dysrymacyją, gdze ϕ (x) jest prawdopodobeństwem zawalfowaa obserwacj x do -tej populacj ϕ ( x) ( x). Zagadee testowaa hpotez jest szczególym przypadem zagadea lasyfacj dla. Warue ϕ (x)+ϕ (x) umożlwa używae tylo jedej sładowej fucj wetorowej (ϕ,ϕ ). Każdy z przedstawoych problemów ma swój specyfczy aspet, ale moża też wyróżć pewe wspóle cechy pozwalające tratować jedolce te problemy jao tzw. statystyczy problemem decyzyjy, czyl grę dwóch osób: statystya atury. To podejśce będze precyzyje omówoe w urse statysty II ( studa II stopa) 5