Prof. Dauta Makowe Istytut Fzyk Teoretyzej Astrofzyk, UG Kotakt: pok. 353, tel.: 58 53 466, e-mal dauta.makowe at gmal.om http://www.fzdm.stroy.ug.edu.pl/me/bostatystyka.html Zmea losowa to fukja odwzorowująa przestrzeń zdarzeń elemetaryh Ω w zbór lzb rzezywstyh R, zyl : Ω R. Jeżel zbór wartoś zmeej losowej jest skońzoy lub przelzaly to mówmy o dyskretej zmeej losowej. Dyskretą zmeą losową dyskretą harakteryzuje zbór wartoś: {x,x,.., x, } zbór prawdopodobeństw p =P=x, =,, p =., opsująyh szase uzyskaa daej wartoś. Zestaw prawdopodobeństw jest azyway fukją masy. Skumuloway rozkład prawdopodobeństwa dystrybuata zmeej losowej : prawdopodobeństwo zdarzea P< x Wartość ozekwaa zmeej losowej dyskretej to E= = =,, x p. Waraja zmeej losowej to Var = E - = = =,, x p -. D.Makowe: Bostatystka 5
Populaja: Dze w weku 0- lata. Zestaw wyków pomaru: 0,,, 3, 4, 5, 6. Fukja masy E= 0*0.9 + *0.64+ * 0.7+ 3*0.85+ 4* 0.095+ 5*0.039 +6*0.7=.038 Var= 0*0.9 + *0.64+ 4* 0.7+9*0.85+ 6*.095+ 5*0.039 +36*0.7.038 =.967 σ=.40 średo dzeko będze horowało razy a zapalee uha środkowego w swoh dwóh perwszyh latah żya. Skumuloway rozkład prawdopodobeństwa: 95% dze będze horowało od -* do +*, zyl od -0.77 do 4.84 o tłumazy sę 0,,4 razy. D.Makowe: Bostatystka 53 Test: jeda z ćwartek ma yh kolor- wskaż która? Test z daą osobą przeprowadzamy 4razy. Wyk pomaru: zestaw poprawyh odpowedz zyl 0,,,3 4. Pytae: jake jest prawdopodobeństwo, ze daltosta dobrze rozpoza kolor w 0,,,3 zy 4 próbah? Jak zamodelować taką populaję pomarów? Załóżmy, że daltosta losowo wybera ćwartkę. Zatem prawdopodobeństwo, że losowo wybray kolor jest dobry jest p=0.5 Szukamy rozkładu prawdopodobeństwa P=k uzyskaa k dobryh wyków spośród 4 przeprowadzoyh ezależyh prób, jeśl prawdopodobeństwo sukesu w jedej próbe jest 0.5. D.Makowe: Bostatystka 54
Rozkład dwumaowy prawdopodobeństwa to rozkład opsująy prawdopodobeństwo uzyskaa k sukesów w ezależyh próbah, przy zym prawdopodobeństwo sukesu w jedej próbe jest p. P k k k k p p wartość ozekwaa waraja E p Var p p Kombaja to lzba sposobów wyboru k elemetów spośród, przy zym kolejość wyboru e odgrywa rol:... k C k k k k... Sla to lzba sposobów uporządkowaa elemetów!... 0! D.Makowe: Bostatystka 55 Dla p=/: wartość maksymala jest dla /. rozkład jest symetryzy względem / 3
Dla p << /: wartość maksymala jest dla 0. rozkład jest prawoskośy Dla p >> /: wartość maksymala jest dla. rozkład jest lewoskośy D.Makowe: Bostatystka 57 Tabla rozkładu dwumaowego: Róże,k p from spy.stats mport bom p=0.95 0 9 8 7 6 5 4 3 0 D.Makowe: Bostatystka 58 4
D.Makowe: Bostatystka 59 D.Makowe: Bostatystka 60 5
Grupa 00 kobet w weku 60-64 lata zaszzepła sę a grypę ową szzepoką. W roku astępym pęć z h zmarło. Czy jest to zdarzee ezwykłe zy zgode ze statystykę pł weku, jeśl wadomo, że śmertelość kobet w tym weku to 0.009 table USA z 004? Jeśl p=0.009 dla kobety, to prawdopodobeństwo, że umrze k spośród 00 jest: 00 k k P k 0.009 0.99 0.009 k dla k=5 Zasada : Aby oeć zy dae zdarzee jest zgode ze statystyką ależy wyzazyć skumulowae prawdopodobeństwo wszystkh rówyh wększyh zdarzeń od daego. Zdarzee uzajemy za statystyze uzasadoe jeśl to prawdopodobeństwo jest wększe ż 5% Zatem, trzeba polzyć skumulowaą śmertelość wystąpea pęu węej zgoów P 00 k k 5 0.009 0. 99 k 5 00 k D.Makowe: Bostatystka 6 Przykład: prawdopodobeństwo pojawea sę w szptalu owego horego z dość rzadkm typem raka Jeżel: Możemy wskazać jedostkę zasu Δt, w której dokouje sę obserwaję zlzee Prawdopodobeństwo pojawea sę zdarzea jest proporjoale do Δt, zyl Pzdarzee = λδt, przy zym prawdopodobeństwo ezaobserwowaa zdarzea w zase Δt moża przyblżyć jako Pbrak zdarzea = -λδt. Zaobserwowae węej ż zdarzee w tym zase jest zaedbywale małe. Iterwał obserwayjy powe być odpowedo krótk, aby moża było ejsze założea uzyć Lzba zdarzeń w jedoste zasu Δt e zmea sę w okrese t. założee o stajoaroś. Może być trude do spełea jeśl okres t jest duży Każde zdarzee pojawa sę w jedoste zasu ezależe od pojawea sę tyh zdarzeń w yh okresah zasu. założee o ezależoś pojawaa sę opsywayh zdarzeń. 6
Ozekwaa lość zdarzeń w jedoste zasu Rozkład Possoa prawdopodobeństwa to rozkład opsująy prawdopodobeństwo pojawea sę k zdarzeń w zase t : P k k t t k! Wartość ozekwaa waraja zmeej o rozkładze Possoa z parametrem =λt wyos e Ozekwaa lość zdarzeń w okrese zasu D.Makowe: Bostatystka 63 Przypuśćmy, że rejestrujemy owego horego w przeągu h lat. Nagle pojawły sę w jedym roku 3 owe osoby hore. Czy jest to wyjątkowe zdarzee zy zgode ze statystyką? Prawd. 3 owyh horyh w roku P k k! k 8 e k 3 e 6 0.06 3 węej owyh horyh w roku P 3 P 0 P P e 0.5 0.5 0.04.4% Opsae zdarzee jest statystyze eprawdopodobe, bowem prawdopodobeństwo wystąpea takego ydetu jest mejsze of 5%. Zatem jest to zdarzee wyjątkowe- INCYDENT 7
from spy.stats mport posso posso.pmfk,µ # fukja masy posso.dfk, µ # skumuloway rozklad Przykład: Zgoy z powodu duru brzuszego. Przyjmjmy, że lzba zgoów z tego powodu w jedym roku to średo 4.6. Jak jest rozkład tyh zgoów w okrese półrozym, zy kwartalym? Neh = lość zgoów w ągu 6 mesęy. λ =4.6 zgoów a Δt= rok. Szukamy rozkładu prawdopodobeństwa zgoów dla t=0.5 k 4.6*0.5 P k e k! 4.6*0.5 zy dla t= trzeh mesęy k 4.6*0.5 P k e k! 4.6*0.5 D.Makowe: Bostatystka 65 Słye trzęsee Zem w Los Ageles w 994r. W tygodu poprzedzająym trzęsee, średo obserwowao dzee 5.6 zgoów z powodów kardologzyh. W du trzęsea Zem zdarzyło sę h 5.. Jake jest prawdopodobeństwo pojawea sę 5 zgoów w du przy opsaej powyżej śmerteloś? 5 5.6 5.6 P 5 e 5!. Czy pojawee sę 5 zgoów jest zdarzeem adzwyzajym? 7.75*0 P 5 P 5 0 3. Jaka jest maksymala lzba zgoów, która może sę pojawć jedego da, aby być w zgodze z rozkładem zgoów z przed trzęsea Zem? 3 D.Makowe: Bostatystka 66 8
Przykłady Fakt: Przy dużym małym p rozkład dwumaowy B,p jest dobrze przyblżay przez rozkład Possoa z =p D.Makowe: Bostatystka 67 Defja: Fukją gęstoś rozkładu prawdopodobeństwa zmeej losowej azywamy taką fukję, dla której powerzha pod tą krzywą, pomędzy dowolym dwoma puktam a b, jest rówa prawdopodobeństwu zdarzea Pa<<b, że wartość zmeej losowej wpada do tego zboru. wartoś DBP u ludz w weku 35-44 A ezaze adśee B średe adśee C wysoke adśee A B C wartoś trójglerydów: tkaka tłuszzowa W Polse za wartoś prawdłowe stężea trójglerydów w surowy lub osozu krw przyjmuje sę: 35 35 mg/dl u kobet 40 60 mg/dl u mężzyz <00 mg/dl u dze D.Makowe: Bostatystka 69 9
Modeluje wele zborów dayh w sposób satysfakjoująy! Cetrale Twerdzee Graze wyjaśa dlazego jest tak powszehy, tak jest uwersaly. Defja: Mówmy, że zmea losowa ma rozkład ormaly, jeśl gęstość rozkładu prawdopodobeństwa tej zmeej opsuje sę wzorem: f x x exp przy zym =E a = Var Pytho: from spy.stats mport orm Wysokość: Pukt przegęa = moda, medaa, wartość ozekwaa Pukt przegęa Ozazee: N =50, =00 D.Makowe: Bostatystka 7 0
f x x e parametr położea parametr kształtu, skala Pytho: orm.pdfx, mu=0, sale= D.Makowe: Bostatystka 73 f x e x Pytho: orm.pdfx, mu=0, sale= x P x f x dx x Pytho: orm.dfx, mu=0, sale= D.Makowe: Bostatystka 74
Defja: u-ty peretyl dla N0, to taka wartość z u, że zahodz P zu z u e dx u x Pytho: orm.ppfx, mu=0, sale= peret pot futo D.Makowe: Bostatystka 75 Neh to zmea losowa o stadardowym rozkładze ormalym. Wówzas P x =Φx P>x =-Φx P0 x =Φx-/ P-x x =Φx-Φ-x x x Warto pamętać!!! D.Makowe: Bostatystka 76
D.Makowe: Bostatystka 77 Twerdzee: Jeśl to zmea o rozkładze To zmea μ Z = σ ma rozkład N0, Nμ, σ Z = μ σ Z N, N0, D.Makowe: Bostatystka 78 3
Z = μ σ Przykład: Dae ągłe wartoś FEV atężoej objętoś wydehowa w sekudze u dze 0-4 lat Neh aormale ozaza FEV<.5L. Jake jest prawdopodobeństwo tego zdarzea Neh aormale jeśl FEV jest mejszy od 5 peretylu. Jakej wartoś FEV to odpowada? D.Makowe: Bostatystka 79 Nμ, σ Wszystke używae w Pytho fukje zakładają, że oblzea są dla stadardowego rozkładu ormalego, zyl dla N0,: orm.pdfx = orm.pdfx, lo=0, sale= = orm.pdfx, 0, orm.pdfx, lo, sale = orm.pdfz / sale μ Z = σ Lzby Z są ajbardzej użyteze przy porówywau rozkładów: Populaja A królków ma rozkład N.6,. Populaja B królków ma rozkład N.9, 0.7 Z której populaj mamy wększą szase wylosowaa królka o wadze 3. Z A = 3.-.6/sqrt. =0.57 dla Z>0 rozkład ormaly maleje Z B =3. -.9/sqrt0.7 = 0.78 D.Makowe: Bostatystka 80 4
Nμ, σ Wzrost mężzyz w Europe to N74,53.3 a wzrost kobet to N6.5, 34.8 Jaka jest proporja mężzyz ższyh ż 50m? Jaka jest proporja pa ższyh ż 6.5m Jaka jest proporja pań wyższyh ż 70m Jaka jest ajwyższa Pa wśród ajższyh % Jaka jest ajższa Pa wśród % ajwyższyh? Jake jest prawdopodobeństwo, że losowo wybray pa ma wzrost 75-8 m? Jake jest prawdopodobeństwo, że losowa para to pa o wzrośe 75-8 m pa o wzrośe 50-60m Paowe N75, 53.3 Pae N6.5, 34,8 Oblzee df bezpośrede Oblzee df poprzez Z Oblzee pdf poprzez Z D.Makowe: Bostatystka 8 Nμ, σ Paowe N75, 53.3 Pae N6.5, 34,8 Wysokość mężzyz w Europe to N74,53.3 Wysokość kobet w Europe to N6.5, 34.8 Jaka jest proporja paów/pań ższyh ż 50m? Jaka jest proporja paów/ pań ższyh ż 6.5m Jaka jest proporja paów/ pań wyższyh ż 70m Jaka jest ajwyższa Pa wśród ajższyh % Jaka jest ajższa Pa wśród % ajwyższyh? Jake jest prawdopodobeństwo, że losowo wybray pa/pa ma wzrost 75-8 m? Jake jest prawdopodobeństwo, że losowa para to pa o wzrośe 75-8 m a pa o wzrośe 50-60m 0.0003 0.07 0.0434 0.5 0.7533 0.08 69.4 57.9 80.6 67. 0.33 0.066 0.33 0.388 0.056 D.Makowe: Bostatystka 8 5
Omówlśmy: Omówlśmy pojęe zmeej losowej, jako modelu pomaru. Rozróżlśmy zmeą losową dyskretą od zmeej losowej ągłej Wprowadzlśmy fudametale własoś zmeej losowej take jak: fukja masy zmea dyskreta rozkład gęstoś zmea ągła. rozkład skumuloway: dystrybuata W oparu o powyższe własoś wprowadzlśmy pojęa wartoś ozekwaej E waraj Var zmeej losowej. Warto też pamęta o yh harakterystykah rozkładu: skośość kurtoza. Wspomelśmy, jak te pojęa wążą sę z wześej omawaym harakterystykam opsu własoś uzyskwayh w eksperymee statystyzym, tzw. próbe skońzoej zyl z rozkładem zęstoś próby, średą z próby <x> warają z próby s. Wprowadzlśmy spejale modele prawdopodobeństwa szzególe użyteze w rozważaah statystyzyh rozkład dwumaowy B,p doskoale opsująy wyk ser ezależyh zdarzeń, gdze w pojedyzym zdarzeu są możlwe tylko dwa wyk: sukes lub porażka, prawdopodobeństwo sukesu jest p a porażk q=-p rozkład Possoa Po klasyzego modelu prawdopodobeństwa używaego do opsu zdarzeń rzadkh, =λt. D.Makowe: Bostatystka 83 Omówlśmy własoś rozkładu ormalego jako ajważejszego rozkładu używaego w opse ągłej zmeej losowej: o Rozkład ormaly jest harakteryzoway jedye przez dwa parametry średą waraję : N, o Każdy rozkład ormaly moża przekształć w stadardowy rozkład ormaly N0, Z N, N0, D.Makowe: Bostatystka 84 6
Day jest zestaw obserwaj pewej własoś populaj o dowolym rozkładze w populaj, przy zym jej wartość średa to μ a waraja to σ. Neh: próba_a to obserwaj z tego zestawu próba_b to obserwaj z tego zestawu.. Przy zym lzebość prób jest duża. Dla każdej próby wyzazamy jej średą: <próba_a>, <próba_b>,.. Zmea losowa średa z próby o dużej lzeboś ma rozkład ormaly o średej rówej μ waraj σ / D.Makowe: Bostatystka 85 Wykresy fukj masy prawdopodobeństwa rozkładu dwumaowego B,p dla rożyh wartoś parametrów p rozkładu Źle, bo esymetry -zy Źle, bo esymetry -zy Wykresy te sugerują kedy take przyblżee jest możlwe. B=00,p=0.0 B=00,p=0.99 Wdzmy, że mus być: stosukowo duże p e ekstremale. Wówzas rozkład dwumaowy staje sę w przyblżeu symetryzy. B=5,p=0.3 Źle, bo esymetry -zy B=5,p=0.4 Dobrze, bo symetryzy D.Makowe: Bostatystka 86 7
P zgode z B,p P7 = P=7+ +P== =5 p=0.4 lok=*p skala=p.sqrt*p*-p P Np,pq wyk_bom = bom.df,,p -bom.df6,,p wyk_orm = orm.df,lok,skala - orm.df7,lok,skala =0.77 =0.68 D.Makowe: Bostatystka ZA MAŁO 87 bozk 6.5.5 D.Makowe: Bostatystka 88 8
Reguły: Jeśl jest zmeą o rozkładze B,p a, b to lzby ałkowte to: P a b PN p, pq a b B, p W szzególoś: przypadek P=0 PB, p 0 PN p, pq 0 przypadek P= P PN p, pq B, p D.Makowe: Bostatystka 89 Def: kombaja lowa zmeyh losowyh to zmea losowa posta L... gdze,,, dowole lzby rzezywste. Twerdzee: E L E E... E Twerdzee: Jeżel zmee losowe,.. są wzajeme ezależe, to Var L Var Var... Var D.Makowe: Bostatystka 9
Kowarają dwóh zmeyh losowyh A, B azywamy welkość CovA, B= E[A-EA] [B EB]= EAB-EAEB Korelają dwóh zmeyh losowyh A, B azywamy welkość ρ AB : D.Makowe: Bostatystka ρ AB =CorrA, B= CovA,B / A B -..0. ałkowe brak ałkowe atyskorelowae korelaj skorelowae Korelaja merzy jedye współzależość LINIOWĄ pomędzy zmeym losowym. ma rozkład N0,, Y= E=0, atomast EY= Wymuszoa objętość wydehowa w perwszej mue jest tym wększa, m złowek jest wyższy. Cholesterol we krw ezaze dodato zależy od zawartoś holesterolu w dee. Puls złoweka maleje z jego wekem. Wymuszoa objętość wydehowa w perwszej mue ezaze ujeme, zależy od loś wypalayh paperosów. D.Makowe: Bostatystka 0
j j j Cov Var Cov Cov Cov Cov Cov Cov Cov Cov Cov Var Var Var L Var 4 4 3 3 3 3 ]......... [... Twerdzee: Jeżel zmee losowe,,.. e są wzajeme ezależe, to D.Makowe: Bostatystka Twerdzee: Neh zmee losowe,.. są wzajeme ezależe mają rozkłady ormale o wartośah ozekwayh : warajah. Wówzas dowola kombaja lowa L tyh zmeyh jest zmeą o rozkładze ormalym, N E E Twerdzee: Jeżel zmee losowe,,... e są wzajeme ezależe mają rozkłady ormale o parametrah to L jest zmeą losową o rozkładze ormalym waraj: ]......... [...,,, 4 4 4 3 3 3 3 3 3 L Var E E D.Makowe: Bostatystka
Próba Beroulego Zmea losowa reprezetująa lość sukesów w ezależyh próbah Beroulego z prawd p 0 z prawd - p L,.., E p Var pq E L p Var L pq Zasada : Rozkład ormaly Np,pq moża użyć do aproksymaj rozkładu dwumaowego B,p jeśl pq 5 p=0. rośe ok ok p=0. rośe ok D.Makowe: Bostatystka Reguła: Jeśl jest zmeą o rozkładze Po to: PPo x PN, x x Przypadek P=0 PPo 0 PN, 0 µ= µ=5 µ=0 µ=0 Zasada: Przyblżee wolo stosować dla µ 0 D.Makowe: Bostatystka