WSPÓŁZALEŻNOŚĆ PROCESÓW MASOWYCH Test zgodości H : rozład jest zgody z załadaym 0 : H bra zgodości rozładu z załadaym statystya: p emp i p obszar rytyczy: K ;, i gdzie liczba ategorii p Przyład: Wyoujemy 0 rzutów ostą sześcieą: >osta= sample(:6,0,replace=t) >osta [] 4 6 6 3 3 3 3 4 6 5 4 5 6 4 3 3 5 4 5 4 5 5 3 4 4 5 5 6 4 4 6 [49] 5 6 4 3 4 4 4 4 6 6 5 3 3 6 3 6 6 3 5 5 4 4 5 6 4 6 6 6 4 3 4 3 3 5 4 [97] 5 3 5 5 6 3 5 4 4 4 3 3 6 5 3 5 6 5 Teoretyczie ażda liczba ocze powia wypaść 0 razy, bo p 0*/ 6 0 A co u as? > osta=data.frame(table(osta)) > osta osta Freq 8 8 3 3 0 4 4 4 5 5 6 6 9 Czy otrzymae wyii świadczą o tym, że osta jest symetrycza? Czy różice są statystyczie istote? Stawiamy hipotezy: H H 6 6 6 6 6 6,,,,, 6 6 6 6 6 6 p, p, p, p, p,,,,,, 0 : 3 4 5 p6 p, p, p, p, p, : 3 4 5 p6
Obliczymy statystyę chi-wadrat p emp 8 0 8 0 0 0 4 0 0 9 0 0 0 4 4 0 6 6,3 0 0 0 i 0 p i 0 0 Obliczymy statystyę chi-wadrat w R > chi.osta=sum((osta$freq-0)^/0) > chi.osta [].3 Kwatyl z rozładu chi-wadrat : > qchisq(.95,5) [].0705 Nie ma podstaw do odrzuceia H0, a więc osta jest symetrycza. Test chisq.test() > pr=rep(/6,6) (albo pr=c(/6,/6,/6,/6,/6,/6)) > chisq.test(osta$freq,p=pr) Chi-squared test for give probabilities data: osta$freq X-squared =.3, df = 5, p-value = 0.9349 A więc osta jest symetrycza
Test iezależości Przy badaiu populacji geeralej jedocześie ze względu a dwie cechy często iteresuje as sprawdzeie hipotezy, czy cechy te są ze sobą związae. Gdy obie cechy są mierzale, posługujemy się ajczęściej pojęciem orelacji i regresji. Gdy przyajmiej jeda z dwu badaych cech jest iemierzala, to badając związe tych cech ze sobą posługujemy się pojęciem iezależości stochastyczej odpowiedich dwóch zmieych losowych. Zmiee X i Y są iezależe, jeśli dla ich dystrybuat zachodzi związe: F x, y) F ( x) F ( ). ( y H : cechy są iezależe 0 : H istieje zależość między cechami statystya: r s r s p emp i j p obszar rytyczy: K, ( r ) s; i j gdzie r ilość grup wartości cechy X s ilość grup wartości cechy Y i j Przyład: W drugim biegu CITY TRAIL w Olsztyie dia 3..08 wystartowało 404 zawodiów. Li: https://citytrail.pl/zawody/wyii/miasto/olszty/id/787 Rozład zawodiów w poszczególych ategoriach wieowych Kobiet i Mężczyz wyglądał astępująco: obiety mężczyźi Kategoria 6 5 0 Kategoria 0 3 36 Kategoria 30 65 87 Kategoria 40 40 90 Kategoria 50 9 7 Kategoria 60 0 Czy moża twierdzić, że płeć determiuje wie zawodiów? Uwaga: przy teście iezależości chi-wadrat wszystie wartości w tablicy otygecji powiy wyosić co ajmiej 5. Tutaj mamy problem z ategorią K60 są tylo dwie paie. W taiej sytuacji moża połączyć ategorie 50 i 60
Obliczeia wyglądają astępująco: obiety mężczyźi Kategoria 6 5 0 5 Kategoria 0 3 36 59 Kategoria 30 65 87 5 Kategoria 40 40 90 30 Kategoria 50 i więcej 37 48 44 60 404 Statystyę liczymy w formie tabelaryczej: (emp) () (emp)-() ((emp)-())^/() K6 5 5,346535-0,34653 0,046 K0 3,097,97097 0,84599 K30 65 54,78 0,878,6588 K40 40 46,33663-6,33663 0,866548 K50 7,089-6,089,849 M6 0 9,653465 0,346535 0,044 M0 36 37,9703 -,9703 0,04 M30 87 97,878-0,88,9787 M40 90 83,66337 6,336634 0,479934 M50 37 30,8909 6,089,08076 8,463 i j 5*44 5*60 K6 5,35 M 30 97, 8 404 404 Wartość statystyi 8,463 K ; 9, Obszar rytyczy dla alfa=0,05 to 488 > qchisq(0.95,4) [] 9.48779 0,05,4 Obszar rytyczy dla alfa=0, to K ; 7, 779 > qchisq(0.9,4) [] 7.77944 Jaie stąd płyą wiosi???? Czy płeć determiuje wie zawodiów? 0,,4
A ja to zrobić w R? > K=c(5,3,65,40,) > M=c(0,36,87,90,37) > chisq.test(cbid(k,m)) Pearso's Chi-squared test data: cbid(k, M) X-squared = 8.463, df = 4, p-value = 0.07746 Wiosi??? Moża taże wyorzystać poszczególe elemety: > wyi<-chisq.test(cbid(k,m)) > wyi Pearso's Chi-squared test data: cbid(k, M) X-squared = 8.463, df = 4, p-value = 0.07746 > wyi$statistic X-squared 8.463 > wyi$expected K M [,] 5.346535 9.653465 [,].09703 37.97097 [3,] 54.788 97.878 [4,] 46.336634 83.663366 [5,] 7.089 30.89089 > wyi$observed K M [,] 5 0 [,] 3 36 [3,] 65 87 [4,] 40 90 [5,] 37 > wyi$p.value [] 0.0774646 > wyi$method [] "Pearso's Chi-squared test" > wyi$data.ame [] "cbid(k, M)"
Współczyi orelacji rag Spearmaa r s i 6 d i Przyład alohole Aia Barte liier 8 metaxa 5 4 piwo 4 rum 6 7 szampa 5 whisy 7 3 wio 3 6 wóda 8 Obliczmy teraz współczyi orelacji rag Spearmaa i przetestujemy jego istotość. Obliczeia zrobimy w formie tabelaryczej: alohole Aia Barte di di^ liier 8 8 0 0 metaxa 5 4 piwo 4 3 9 rum 6 7 - szampa 5-3 9 whisy 7 3 4 6 wio 3 6 3 9 wóda - 46 6*46 r s 0,548 0,45 88 Co to zaczy? Przy pomocy języa R: > Aia=c(8, 5, 4, 6,, 7, 3, ) > Aia [] 8 5 4 6 7 3 > Barte=c(8, 4,, 7, 5, 3, 6, ) > Barte [] 8 4 7 5 3 6 > di<-sum((aia-barte)^) > di [] 46
> r.s<--(6*di)/(8*(8^-)) > r.s [] 0.4538 Albo używającu fucji cor() > cor(aia,barte,method = "spearma") [] 0.4538 Test istotości dla współczyia orelacji rag Spearmaa H : r 0 0 s rs statystya t H : rs 0 rs Obszar rytyczy: K ( ; t, ) ( t, ; ) U as: t 0,45 0,45, 4 K ( ;,447) (,447; ) 8 > qt(0.975,6) [].4469 Wiosi? Albo przy użyciu języa R robimy to szybciej: > cor.test(aia,barte,method = "spearma") Spearma's ra correlatio rho data: Aia ad Barte S = 46, p-value = 0.675 alterative hypothesis: true rho is ot equal to 0 sample estimates: rho 0.4538
Współczyi orelacji Kedalla Korelacja Tau Kedalla obliczeia statystycze z wyorzystaiem tego testu stosujemy wtedy gdy asze zmiee (bądź przyajmiej jeda z ich) jest wyrażoa a sali porządowej. Opiera się a aalizie rag ta ja to jest w przypadu orelacji rag Spearmaa. Współczyi orelacji rag Kedalla dla rag iepowiązaych: r V Przyład: Ragi cechy X :, 5, 4,, 3 Ragi cechy Y:, 3, 4,, 5 Próbę porządujemy ze względu a jedą cechę, p. X X:,, 3, 4, 5 Y:,, 5, 4, 3 Teraz dla ażdej ragi cechy I ta dostaiemy: tworzymy pary z ragami astępującymi po iej. (,) (,5) (,4) (,3) (,5) (,4) (,3) (5,4) (5,3) (4,3) Jeżeli w parze poprzedi jest miejszy iż astępi to parze przypisujemy otę +, gdy poprzedi jest więszy iż astępi to przypisujemy otę -. Teraz tworzymy sumę wszystich ot +. U as: - + + + + + + - - - Ta więc V=6, a r 6 0, 55
W języu R: > ragix=c(,5,4,,3) > ragiy=c(,3,4,,5) > cor(ragix,ragiy,method="edall") [] 0. Test istotości dla współczyia orelacji rag Kedalla: > cor.test(ragix, ragiy,method="edall") Kedall's ra correlatio tau data: ragix ad ragiy T = 6, p-value = 0.867 alterative hypothesis: true tau is ot equal to 0 sample estimates: tau 0. A więc ie ma zależości.