Statystyka matematyczna w zastosowaniach Elementy rachunku prawdopodobieństwa Robert Pietrzykowski STATYSTYKA: nauka poświęcona metodom badania(analizowania) zjawisk masowych; polega na systematyzowaniu obserwowanych cech ilościowych i jakościowych oraz przedstawianiu wyników w postaci zestawień tabelarycznych, wykresów, itp; posługuje się rachunkiem prawdopodobieństwa STATYSTYKA MATEMATYCZNA: dział matematyki stosowanej oparty na rachunku prawdopodobieństwa; zajmuje się badaniem zbiorów na podstawie znajomości własności ich części Rachunek prawdopodobieństwa zajmuje się analizą praw rządzących zdarzeniami losowymi Pojęciami pierwotnymi są: zdarzenie elementarne ω oraz zbiór zdarzeń elementarnych Ω Doświadczenie losowe realizacja określonego zespołu warunków wraz z góry określonym zbiorem wyników Zdarzenie losowe A jest podzbiorem zbioru zdarzeń elementarnych Ω Encyklopedia Popularna PWN, Warszawa 1982 RP SGGW l ogistyka Statystyka 1 RP SGGW l ogistyka Statystyka 2
Prawdopodobieństwo(definicja aksjomatyczna) jest funkcją określoną na zbiorze zdarzeń losowych: 1P(A) 0,1 2P(Ω)=1 3P(A B)=P(A)+P(B),oileA B= Prawdopodobieństwo(definicja klasyczna) Jeżeli Ω składa się z n jednakowo prawdopodobnych zdarzeń elementarnych, to prawdopodobieństwo zdarzenia A składającego się z k zdarzeń elementarnych wyraża się wzorem Prawdopodobieństwo całkowite Jeżeli zdarzeniab 1,,B n sątakie,żeb i B j = dlawszystkichi j,b 1 B n =ΩorazP(B i )>0dla wszystkich i, to dla dowolnego zdarzenia A zachodzi P(A)=P(A B 1 )P(B 1 )+ +P(A B n )P(B n ) Twierdzenie Bayesa P(B k A)= P(B k )P(A B k ) P(A B 1 )P(B 1 )+ +P(A B n )P(B n ) P(A)= k n Niezależność zdarzeń Zdarzenia A oraz B są niezależne, jeżeli Prawdopodobieństwo warunkowe zajścia zdarzenia A pod warunkiem realizacji zdarzenia B: P(A B)= P(A B) P(B) (P(B)>0) Równoważnie P(A B)=P(A)P(B) P(A B)=P(A) P(B A)=P(B) RP SGGW l ogistyka Statystyka 3 RP SGGW l ogistyka Statystyka 4
Zmienna losowa(cecha) Funkcja o wartościach rzeczywistych określona na zbiorze zdarzeń elementarnych Rozkład zmiennej losowej Zbiór wartości zmiennej losowej oraz prawdopodobieństwa z jakimi są te wartości przyjmowane Przykład Jednokrotny rzut kostką Zmienna losowa: ilość wyrzuconych oczek Zbiórwartości:{1,2,3,4,5,6} Rozkład(kostka uczciwa) x i 1 2 3 4 5 6 p i 1/6 1/6 1/6 1/6 1/6 1/6 Rozkład(kostka nieuczciwa) x i 1 2 3 4 5 6 p i 1/24 1/24 1/24 1/24 1/6 2/3 Zmienna losowa skokowa (dyskretna) jest to zmienna, której zbiór wartości jest skończony lub przeliczalny Jeżelix 1 orazx 2 sąkolejnymiwartościamizmiennej losowej skokowej, to nie przyjmuje ona żadnych wartościmiędzyx 1 ax 2 Przykłady Rzut kostką, liczba bakterii, ilość pracowników Zmienna losowa ciągła jest to zmienna przyjmująca wszystkie wartości z pewnego przedziału(najczęściej zbioru liczb rzeczywistych) Jeżelix 1 orazx 2 sądwiemawartościamizmiennej losowej ciągłej, to może ona przyjąć dowolną wartość międzyx 1 ax 2 Przykłady Wzrost, ciężar paczki towaru, wydajność pracowników RP SGGW l ogistyka Statystyka 5 RP SGGW l ogistyka Statystyka 6
Dystrybuanta F jest funkcją określoną na zbiorze liczb rzeczywistych R wzorem F(x)=P{X x}, x R Najważniejsze własności dystrybuanty 10 F(x) 1 2F( )=0,F( )=1 3 dystrybuanta jest funkcją niemalejącą 4P{a<X b}=f(b) F(a) 030 020 015 005 Skokowa zmienna losowa 10 15 20 37 60 Funkcja rozkładu prawdopodobieństwa Funkcja(gęstości) rozkładu prawdopodobieństwa f jest funkcją określoną na zbiorze liczb rzeczywistych R wzorem f(x)= { F (x), jeżelif (x)istnieje 0, w przeciwnym przypadku 100 085 080 050 Najważniejsze własności funkcji gęstości 1f(x) 0 2P{a<X b}= b a f(x)dx 020 10 15 20 37 60 Dystrybuanta RP SGGW l ogistyka Statystyka 7 RP SGGW l ogistyka Statystyka 8
Ciągła zmienna losowa Charakterystyki liczbowe zmiennych losowych Wartość oczekiwana(średnia) Wartość oczekiwana EX zmiennej losowej X jest liczbą charakteryzującą położenie zbioru jej wartości EX= { xi p i dlazmiennejskokowej xf(x)dx dlazmiennejciągłej Funkcja gęstości F(b) F(a) Prawo wielkich liczb: X 1 +X 2 + +X n n EX WariancjaWariancjaD 2 Xzmiennejlosowejjest liczbą charakteryzującą rozrzut zbioru jej wartości wokół wartości średniej EX a Dystrybuanta b D 2 X= { (xi EX) 2 p i (x EX) 2 f(x)dx RP SGGW l ogistyka Statystyka 9 RP SGGW l ogistyka Statystyka 10
Odchylenie standardowe Odchylenie standardowe DX zmiennej losowej X jest liczbą charakteryzującą rozrzut zbioru jej wartości wokół wartości średniej EX DX= D 2 X Rozkład dwupunktowy Zmienna losowa X ma rozkład D(p), jeżeli P{X=1}=p=1 P{X=0} KwantylrzędupzmiennejlosowejXjesttotaka liczbax p,że F(x p )=p Frakcja Jeżeli A jest danym podzbiorem zbioru wartości zmiennej losowej X, to frakcją nazywamy liczbę p=p{x A} EX=p D 2 X=p(1 p) Doświadczenie Bernoulliego Wykonujemy dwuwynikowe doświadczenie Wyniki nazywane są umownie sukces oraz porażka Prawdopodobieństwo sukcesu wynosi p(porażki: 1 p) Niech zmienną losową X będzie uzyskanie sukcesu Zmienna losowa X ma rozkład D(p) Asymetria (skośność)liczbaγ 1 charakteryzująca niejednakowość rozproszenia wartości zmiennej losowej wokół wartości oczekiwanej Przykłady Płeć osoby Wadliwość produktu RP SGGW l ogistyka Statystyka 11 RP SGGW l ogistyka Statystyka 12
Rozkład dwumianowy Zmienna losowa X ma rozkład B(n, p), jeżeli P n,p {X=k}= ( ) n p k (1 p) n k,k=0,1,,n k Rozkład Poissona ZmiennalosowaXmarozkładPo(λ),jeżeli P λ {X=k}= λk k! e λ,k=0,1, EX=np D 2 X=np(1 p) Schemat Bernoulliego Zmienną losową o rozkładzie D(p) obserwujemy n krotnie w sposób niezależny Niech zmienną losową X będzie ilość sukcesów ZmiennalosowaXmarozkładB(n,p) Przykłady Ilość nasion, z których wzeszły rośliny Ilość wadliwych produktów Popularność danej osobistości publicznej EX=λ D 2 X=λ Przykłady Ilość wad na metrze kwadratowym produkowanego materiału Ilość klientów przybywających do sklepu w jednostce czasu P n,p {X=k}=P n,1 p {X=n k} RP SGGW l ogistyka Statystyka 13 RP SGGW l ogistyka Statystyka 14
Rozkład normalny Rozkład normalny ZmiennalosowaXmarozkładnormalnyN(µ,σ 2 ) owartościśredniejµiwariancjiσ 2,jeżelijejfunkcja gęstości wyraża się wzorem f µ,σ 2(x)= 1 σ 2( x µ 2π e 1 σ ) 2, <x< EX=µ D 2 X=σ 2 Przykłady Błędy pomiarowe Ciężar ciała Zawartość białka w mięsie Standardowy rozkład normalny: N(0, 1) Dystrybuanta F(x) standardowego rozkładu normalnego(n(0, 1)) jest stablicowana F(x)=1 F( x) µ=0 µ= 1 µ=1 σ=05 σ=10 σ=20 RP SGGW l ogistyka Statystyka 15 RP SGGW l ogistyka Statystyka 16
JeżeliX N(µ,σ 2 ),to Standaryzacja Prawo trzech sigm P{ X µ <σ}=068268 068 Z= X µ σ N(0,1) P{ X µ <2σ}=095450 095 { ( )} a µ P{X (a,b)}=p Z σ,b µ σ ( ) ( ) b µ a µ =F F σ σ PrzykładDlazmiennejlosowejX N(10,16)obliczyćP{X (8,14)} P{ X µ <3σ}=099730 0997 0997 095 068 µ P{X (8,14)}=P { ( 8 10 Z, 14 10 )} 4 4 =F(1) F( 05) =084134 (1 069146) =053380 µ 3σ µ 2σ µ σ µ+σ µ+2σ µ+3σ RP SGGW l ogistyka Statystyka 17 RP SGGW l ogistyka Statystyka 18
Pożyteczne przybliżenia X B(n,p),nduże,pmałe X Po(np) X B(n,p),nduże,p około 05 X N(np,np(1 p)) X Po(λ),λduże X N(λ 05,λ)lub X N ( ) λ, 1 4 RP SGGW l ogistyka Statystyka 19