Metody probabilistyczne opracowane notatki 1. Zdefiniuj zmienną losową, rozkład prawdopodobieństwa. Przy jakich założeniach funkcje: Fx sinx, Fx a e x mogą być dystrybuantami?. Podaj twierdzenie Lindeberga Lévy`ego. Jakie jest jego znaczenie w estymacji wartości średniej? 3. Zdefiniować proces Markova. Co go w pełni charakteryzuje? 4. Partia pudełek zapałek zawiera 100 000 pudełek zapałek. Dostawca twierdzi, że w pudełku są średnio 54 zapałki. Stwierdzić, czy hipotezę tę można odrzucić na poziomie istotności α 0.0. 5. Podać definicję zmiennych losowych niezależnych dla N zmiennych 1,,..., N. Rozpatrzmy dwukrotny rzut monetą. Sprawdzić, czy zmienne losowe i charakteryzujące odpowiednio pierwszy i drugi rzut są niezależne 6. Zdefiniuj proces stacjonarny w szerszym i w węższym sensie. Podaj związek między nimi. 7. Opisać sposób wyznaczania minimalnej liczności próby zapewniającej zadaną dokładność estymacji wartości średniej cechy w próbie generalnej. 8. Podać aksjomatykę Kołmogorowa, opisać jak tworzymy σ - algebrę. Zdefiniować prawdopodobieństwo warunkowe i udowodnić, że spełnia te aksjomaty. 9. Zdefiniować warunkowy rozkład prawdopodobieństwa zmiennej losowej pod warunkiem, że zmienna losowa przyjęła określoną wartość oraz warunkową wartość średnią przy tym założeniu. 10. Sformułować słabe prawo wielkich liczb Markowa i podać krótko jego związek z teorią estymacji. 11. Zdefiniować proces losowy o niezależnych przyrostach i proces Markowa. Podać związek między nimi. 1. Zdefiniuj rozkłady brzegowe zmiennej losowej. Podaj dystrybuantę dla typu skokowego, ciągłego i w przypadku ogólnym. 13. W pewnym urządzeniu trzeba przeciętnie 7 razy w roku ~7000h pracy wymieniać pewien podzespół. Zakładając, że liczba wymian tego podzespołu w danym okresie ma rozkład Poissona, wyliczyć prawdopodobieństwo tego, że konieczność wymiany podzespołu wstąpi po 100 godzinach pracy. 14. Oblicz i D rozkładu Poissona. 15. Podaj własności wariancji i udowodnij, że suma wariancji jest równa wariancji sumy zmiennych.
1. Zdefiniuj zmienną losową, rozkład prawdopodobieństwa. Przy jakich założeniach funkcje: Fx sinx, Fx a e x mogą być dystrybuantami? Zmienną losową nazywamy funkcję rzeczywistą określoną na przestrzeni zdarzeń elementarnych Ω i taką, że przeciwobrazy zbiorów borelowskich na prostej w R 1 otrzymane za pomocą tej funkcji są zdarzeniami losowymi; wystarczy wymagać, by przeciwobrazy wszystkich zbiorów przedziałów postaci -, x były zdarzeniami losowymi każdy zbiór borelowski w R 1 można uzyskać za pomocą przeliczalnej liczby działań na takich podzbiorach. Inaczej mówiąc zmienna losowa to funkcja działająca z Ω w R 1 taka, że: a {ω: ω a } Ἇ Widzimy więc, że zmienna losowa jest funkcją mierzalną względem prawdopodobieństwa. transformacją Ω w R 1 Rozkładem prawdopodobieństwa zmiennej losowej nazywamy prawdopodobieństwo indukowane, czyli funkcję zbioru daną wzorem: P x S P [ 1 S ]P [ω: ω S ], S Ἇ x Aby funkcja F x sin x była dystrybuantą spełnione muszą być następujące warunki: a być funkcją nieujemną b być funkcją niemalejącą c być funkcją co najmniej lewostronnie ciągłą Warunki te spełnione są w I ćwiartce tj. gdy x 0, π Dla x<0 funkcja przyjmuje wartość 0, a dla x>π/ wartość 1. Dla funkcji Fx a e x wystarczy, że a będzie równe 1, a wartość funkcji dla x<0 przyjmiemy 0. Oczywiście dla x<0 funkcja przyjmuje wartość 0. Aby to zrozumieć należy przekształcić funkcję e x, ale pewnie większość woli tylko wykuć na pamięć ; Jeśli jednak ktoś by chciał, służę wykresami.
. Podaj twierdzenie Lindeberga Lévy`ego. Jakie jest jego znaczenie w estymacji wartości średniej? W notatkach możecie je znaleźć jako centralne twierdzenie graniczne. Niech 1,,... będzie ciągiem niezależnych zmiennych losowych o jednakowym rozkładzie prawdopodobieństwa., przy czym i m, D i σ 0, i1,,... Utwórzmy zmienną losową: n n i1 Oczywiście n n m; D n n σ ; Unormujmy zmienną losową n definiując zmienną losową Z n wzorem: Przy powyższych założeniach ciąg zmiennych losowych Z 1, Z,...jest zbieżny według dystrybuant do zmiennej losowej Z o rozkładzie N0,1, czyli i Z n nm n σ n z lim n F n z 1 z π e z dz gdzie F n z jest dystrybuantą zmiennej losowej Z n. Jeśli mamy więc jakiś nieznany rozkład, dla odpowiednio dużej próby możemy przyjąć, że jest to rozkład normalny, co znacznie ułatwia np. stymację wartości średniej.
3. Zdefiniować proces Markova. Co go w pełni charakteryzuje? Proces losowy t nazywamy procesem Markova, jeśli dla dowolnego n, dowolnego układu chwil t 1 < t <.. < t n oraz dla dowolnych liczb rzeczywistych x 1, x,..., x n zachodzi: P t n x n t n1 x n1, t n x n,..., t 1 x 1 P t n x n t n1 x n1 Oznacza to, że dystrybuanta warunkowa procesu Markova w dowolnej chwili t n zależy tylko od chwili obecnej oraz ustalonej wartości tego procesu w chwili t n-1. Jest to tzw. własność braku pamięci lub własność Markova. Proces Markova jest w pełni opisany przez swoją dystrybuantę warunkową lub też przez łączną dystrybuantę [t, s] wraz z dystrybuantą początkową Fs,y P[s<y]. Widzimy zatem, że proces Markova jest w pełni scharakteryzowany przez jego rozkłady dwuwymiarowe.
4. Partia pudełek zapałek zawiera 100 000 pudełek zapałek. Dostawca twierdzi, że w pudełku są średnio 54 zapałki. Stwierdzić, czy hipotezę tę można odrzucić na poziomie istotności α 0.0. Nie jest znany rozkład liczby zapałek w pudełku, więc wylosowana próba musi być duża. W tym wypadku otrzymujemy informację, że pobrano próbę o liczności 100 sztuk. Z tej próby otrzymano m n 51,1, a σ n ',45. Dalsze rozważania są moją interpretacją tego, co wyczytałem z notatek oraz z pliku: http://jay.au.poznan.pl/~strabel/dydaktyka/statystyka/partesis.pdf Czytasz i używasz na własną odpowiedzialność!! Hipoteza zerowa ma postać: H 0 : μ 54 Hipoteza alternatywna ma postać: H 1 : μ 54 Znajdujemy liczbę t korzystając ze wzoru: t M m n 0 n σ M n t 11,387755 Tak obliczoną wartość t porównujemy z wartością krytyczną t α Ponieważ na egzaminie nie będziemy posiadali ani kalkulatorów, ani tablic rozkładu normalnego zakładam, że będzie można zostawić ten ułamek samemu sobie i napisać tylko, że jeśli obliczona przez nas wartość będzie większa niż t α odczytane z tablic rozkładu normalnego, to powinniśmy hipotezę odrzucić na tym poziomie istotności, w przeciwnym przypadku nie ma podstaw by tę hipotezę odrzucić. Opracowanie wg Krysickiego: Badana cecha ma rozkład Nμ,σ o obu parametrach nieznanych w naszym przypadku rozkład nie jest znany, ale n jest duże, więc możemy korzystać chyba z tego sposobu korzystać. Weryfikujemy hipotezę H 0 : μ 54 wobec hipotezy alternatywnej H 1 : μ 54. Poziom istotności α 0,0. Do weryfikacji tej hipotezy stosujemy test oparty na statystyce: t 0 n1 S która przy założeniu prawdziwości hipotezy H 0 ma rozkład t Studenta o n-1 stopniach swobody. W tym przypadku zbiorem krytycznym jest suma przedziałów -, -a, a, gdzie a t1-α/, n-1 jest kwantylem rzędu 1-α/ rozkładu t Studenta o n-1 stopniach swobody. Jeżeli t obliczone wg powyższego wzoru należy do zbioru krytycznego, to hipotezę H0 należy odrzucić, w przeciwnym przypadku nie należy ani jej przyjmować, ani odrzucać.
5. Podać definicję zmiennych losowych niezależnych dla N zmiennych 1,,..., N. Rozpatrzmy dwukrotny rzut monetą. Sprawdzić, czy zmienne losowe i charakteryzujące odpowiednio pierwszy i drugi rzut są niezależne. Zmienne losowe nazywamy niezależnymi, jeśli dla dowolnych zbiorów borelowskich S1, S,..., Sn odpowiednio na osiach x 1, x,..., x n zdarzenia Z i {ω: i ω S i } i1,,...,n spełniają warunek P Z 1 Z... Z n P Z 1 P Z... P Z n Zdefiniujmy następujące zmienne losowe: 1, jeśli na pierwszej monecie wypadł orzeł i 0, jeśli wypadła reszka. 1, jeśli na drugiej monecie wypadł orzeł i 0, jeśli wypadła reszka. Prawdopodobieństwo tego, że 1 wynosi ½. Tak samo jest w przypadku zmiennej losowej. Prawdopodobieństwo tego, że na obu monetach wypadnie orzeł wynosi ¼. Otrzymujemy więc równianie: Łatwo zauważyć, że prawdopodobieństwo warunkowe jest równe prawdopodobieństwu bezwarunkowemu. P 1 1 P 0 1 P 1 1 P 0 1 P 1,1 1 4 P 1, 0 1 4 P 0, 1 1 4 P 0,0 1 4 x, y {0,1} Można więc zauważyć, że P P P,
6. Zdefiniuj proces stacjonarny w szerszym i w węższym sensie. Podaj związek między nimi. Proces t nazywamy stacjonarnym w węższym sensie jeśli dla dowolnego n, dowolnego t 1, t,..., t n T oraz dla dowolnego takiego, że t i T zachodzi: i F x 1,t 1 ; x,t ;... ; x n, t n F x 1,t 1 ; x,t ;... ; x n,t n Proces losowy t dla którego istnieją: wartość średnia mt i funkcja korelacji R x t 1,t nazywamy stacjonarnym w szerszym sensie jeśli: m t m R x t 1,t R x τ, τ t t 1 Proces losowy stacjonarny w węższym sensie dla którego [ t ] jest również stacjonarny w szerszym sensie. Dla procesów normalnych gaussowskich prawdziwe jest też twierdzenie odwrotne.
7. Opisać sposób wyznaczania minimalnej liczności próby zapewniającej zadaną dokładność estymacji wartości średniej cechy w próbie generalnej. Przy założeniu, że cecha w populacji generalnej ma rozkład Nμ,σ, gdzie σ jest znane dokładność estymacji wyraża się wzorem: d y α σ n gdzie y α/ znajdujemy z tablic rozkładu N0,1 jako spełniające równanie: F y 1 α, p u 1α Stąd minimalną liczność próby wyraża się wzorem: n min ' y α σ n d gdzie d jest zadaną dokładnością estymacji. Jeśli ma rozkład normalny, ale σ nie jest znane, to y α/ znajdujemy z tablic rozkładu t-studenta o n-1 stopniach swobody. Przy czym, jeśli n>30 możemy korzystać z tablic rozkładu N0,1. ' W celu wyliczenia minimalnej liczności próby musimy znać wartość σ n. Jeśli nie jest ona znana, to musimy albo pobrać wstępną próbę, w celu znalezienia wartości, a dopiero później pobranie próby właściwej, albo przyjąć n min 16 t α. Prowadzi to jednak do stosunkowo dużych n min.
8. Podać aksjomatykę Kołmogorowa, opisać jak tworzymy σ - algebrę. Zdefiniować prawdopodobieństwo warunkowe i udowodnić, że spełnia te aksjomaty Niech Ω będzie dowolnym zbiorem. lementy ω 1,ω,... Ω nazywamy zdarzeniami elementarnymi. Niech Ἇ będzie sigma-algebrą podzbiorów Ω. lementy A 1, A,... Ἇ nazywamy zdarzeniami losowymi. Dla każdego zdarzenia A Ἇ określona jest liczba rzeczywista PA, zwana prawdopodobieństwem zdarzenia A, spełniająca następujące aksjoamty: A1. 0 P A 1 A. P Ω 1 A3. A 1, A,... Ἇ A i A j,i j [ P U i1 A i i 1 P A i ] Jeśli Ω jest skończona lub przeliczalna to w charakterze Ἇ bierzemy sigma-algebrę wszystkich podzbiorów Ω, w przeciwnym przypadku weźmiemy sigma-algebrę podzbiorów borelowskich zbioru Ω. Jeśli PB>0 to prawdopodobieństwo warunkowe zdarzenia A, pod warunkiem, ze zaszło zdażenie B definiujemy jako: P A B P A B P B Tak zdefiniowane prawdopodobieństwo spełnia aksjomaty A1, A, A3. P U i1 P A B P B, P B 0 P A B P B P A B P B P A B 1 P U A i B i 1 A i B P B 0 P A B P B 0 P A B P B P B 0 P A B 1 P Ω B P Ω B 1 P B i1 P A i B P B P B i 1 P A i B
9. Zdefiniować warunkowy rozkład prawdopodobieństwa zmiennej losowej pod warunkiem, że zmienna losowa przyjęła określoną wartość oraz warunkową wartość średnią przy tym założeniu. Jeśli zmienna losowa, jest typu skokowego, to warunkową dystrybuantę zmiennej losowej pod warunkiem, że zmienna losowa przyjmie wartość x i definiujemy wzorem: F y x i y k y p y k x i gdzie p y k x i P y k x i P y, x k i p ik k1,, 3,... P x i p i jest warunkową funkcją prawdopodobieństwa. Jeśli zmienna losowa, jest typu ciągłego to, przy pewnych założeniach dotyczących granicy, warunkową dystrybuantę zmiennej losowej pod warunkiem, że zmienna losowa przyjmie wartość x i definiujemy wzorem: F y x i y f y x i dy gdzie f y x i f x i, y f 1 x i f 1 x i 0 jest warunkową funkcją gęstości. Warunkowa wartość średnia: x i y df y x i To oczywiście można jeszcze rozwinąć, zapisując wzór dla obu przypadków, tj. zmiennej typu ciągłego i skokowego, czyli:
10. Sformułować słabe prawo wielkich liczb Markowa i podać krótko jego związek z teorią estymacji. Niech 1,,... będzie ciągiem niezależnych zmiennych losowych o jednakowym rozkładzie prawdopodobieństwa., przy czym i m, D i σ, i1,,... Utwórzmy zmienną losową: n M n 1 n i1 i Oczywiście: M n D M n n m i i 1 n n i i1 n Jeśli przy powyższych założeniach to lim n D M n 0 0 lim n P M n M n 0 czyli ciąg zmiennych losowych M1, M,... jest zbieżny według prawdopodobieństwa do Mn, czyli do zmiennej losowej o rozkładzie jednopunktowym. Do dopracowania związek z teorią estymacji każdy wie o co chodzi, nikt nie wie jak to dobrze zapisać. Dowód by sn00zer: Dowód: dla każdego tzw. Warunek Markowa i niech tw. Czybyszewa ponieważ jest spełniony warunek to z * otrzymujemy
11. Zdefiniować proces losowy o niezależnych przyrostach i proces Markowa. Podać związek między nimi. Proces losowy t nazwyamy procesem o przyrostach niezależnych jeżeli dla dowolnego, dowolnego układu chwil t 1 t.. t n T zmienne losowe t 1, t t 1,..., t n t n1 są niezależne. Proces losowy t nazywamy procesem Markova, jeśli dla dowolnego n, dowolnego układu chwil t 1 < t <.. < t n oraz dla dowolnych liczb rzeczywistych x 1, x,..., x n zachodzi: P t n x n t n1 x n1, t n x n,..., t 1 x 1 P t n x n t n1 x n1 Proces losowy o przyrostach niezależnych taki, że Markova, ale nie odwrotnie. P [ t 1 c]1 cstała jest procesem
1. Zdefiniuj rozkłady brzegowe zmiennej losowej. Podaj dystrybuantę dla typu skokowego, ciągłego i w przypadku ogólnym. Jeżeli dla zmiennej losowej, interesuje nas rozkład tylko jednej ze zmiennych składowych podczas gdy druga może przyjmować dowolne wartości to mówimy o rozkładzie brzegowym. Jeśli, jest typu skokowego i p i P x i P x i, y 1 P x i, y... k p ik Kropka oznacza zmienną, która przyjmuje dowolne wartości. Jeśli natomiast zmienna losowa, jest typu ciągłego to funkcja gęstości rozkładu brzegowego zmiennej wyraża się wzorem: f 1 x f x, y dy Ogólnie dla zmiennej losowej, o dystrybuancie Fx,y dystrybuanta rozkładu brzegowego zmiennej losowej ma postać: F 1 x F x, P x, Jeśli zmienna losowa jest typu skokowego F 1 x x i x p i x i x Jeśli jest typu ciągłego: k p ik x F 1 x x f 1 x dx f x, y dy dx Analogicznie dla zmiennej losowej :
13. W pewnym urządzeniu trzeba przeciętnie 7 razy w roku ~7000h pracy wymieniać pewien podzespół. Zakładając, że liczba wymian tego podzespołu w danym okresie ma rozkład Poissona, wyliczyć prawdopodobieństwo tego, że konieczność wymiany podzespołu wstąpi po 100 godzinach pracy. Korzystamy ze wzoru: P k eƛ ƛ k k! n100 n pƛ p 7 7000 0,001 ƛ100 0,0010,1 k0 liczba napraw w tymokresie e P 0 1 10 1 10 0 0! 1 10 e Obliczona wartość mówi nam jakie jest prawdopodobieństwo, że w czasie 100h nie zajdzie konieczność naprawy liczba awarii w czasie 100h jest równa 0. Kwestią dyskusyjną jest jak rozumieć treść zadania. Wg mnie musimy podać właśnie taką wartość awaria nastąpi najwcześniej po 100 godzinach, nie wcześniej. Ale oczywiście każdy pisze co chce ;
14. Oblicz i D rozkładu Poissona. k1 k 1 k ƛk k! eƛ ƛ e ƛ D k 1 k ƛ k k! eƛ e ƛ ƛ k 1 D ƛ k ƛ k k! eƛ k k k1 k ƛ k k! ƛ k 1 e ƛ k1 ƛ k 1 k 1 k 1! Szereg MacLaurinae ƛ ƛ k k1 ƛ k k! k1 k ƛ k k! ƛ k 1 k 1! eƛ e ƛ ƛ ƛ ƛ ƛ
15. Podaj własności wariancji i udowodnij, że suma wariancji jest równa wariancji sumy zmiennych. Wariancja D ma następujące własności: D c D D c D m c < Λ Nierówność CZBSZWA Jeśli < D, to dla każdego 0 > ε zachodzi P {ω: m ε} σ ε Dowód: D dla zmiennych niezależnych wartość średnia iloczynu jest równa iloczynowi wartości średnich D D