H brak zgodności rozkładu z zakładanym

Podobne dokumenty
Wyższe momenty zmiennej losowej

n k n k ( ) k ) P r s r s m n m n r s r s x y x y M. Przybycień Rachunek prawdopodobieństwa i statystyka

Rozkład normalny (Gaussa)

STATYSTYKA MATEMATYCZNA

TESTY LOSOWOŚCI. Badanie losowości próby - test serii.

Wykład 11 ( ). Przedziały ufności dla średniej

STATYSTYKA MATEMATYCZNA

Podstawowe testy statystyczne i analiza zależności zjawisk

Korelacja i regresja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 12

Prawdopodobieństwo i statystyka

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Rachunek prawdopodobieństwa i statystyka W12: Statystyczna analiza danych jakościowych. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

S t a t y s t y k a, część 3. Michał Żmihorski

Ćwiczenia rachunkowe TEST ZGODNOŚCI χ 2 PEARSONA ROZKŁAD GAUSSA

STATYSTYKA I ANALIZA DANYCH

3. Regresja liniowa Założenia dotyczące modelu regresji liniowej

KURS STATYSTYKA. Lekcja 3 Parametryczne testy istotności ZADANIE DOMOWE. Strona 1

Rachunek różniczkowy funkcji wielu zmiennych

Analiza I.1, zima wzorcowe rozwiązania

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 3

Analiza matematyczna i algebra liniowa

Testowanie hipotez dla frakcji. Wrocław, 29 marca 2017

Testowanie hipotez dla proporcji. Wrocław, 13 kwietnia 2015

WYKORZYSTANIE FILTRU CZĄSTECZKOWEGO W PROBLEMIE IDENTYFIKACJI UKŁADÓW AUTOMATYKI

Statystyka. Katarzyna Chudy Laskowska

i statystyka matematyczna Rachunek prawdopodobieństwa i statystyka matematyczna w zadaniach, M. Przybycień Rachunek prawdopodobieństwa i statystyka

Statystyka Inżynierska

Wykład 8 Dane kategoryczne

LICZBY, RÓWNANIA, NIERÓWNOŚCI; DOWÓD INDUKCYJNY

KOMBINATORYKA. Oznaczenia. } oznacza zbiór o elementach a, a2,..., an. Kolejność wypisania elementów zbioru nie odgrywa roli.

UWAGI O GRANICZNYCH ROZKŁADACH EKSTREMALNYCH STATYSTYK POZYCYJNYCH

RACHUNEK PRAWDOPODOBIEŃSTWA WYKŁAD 5.

INDUKCJA MATEMATYCZNA

Testy dla dwóch prób w rodzinie rozkładów normalnych

Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych

Podstawy rachunku prawdopodobieństwa (przypomnienie)

STATYSTYKA OPISOWA PODSTAWOWE WZORY

Dwumian Newtona. Agnieszka Dąbrowska i Maciej Nieszporski 8 stycznia 2011

Problem dwóch prób: porównywanie średnich i wariancji z populacji o rozkładach normalnych. Wrocław, 23 marca 2015

1. Wnioskowanie statystyczne. Ponadto mianem statystyki określa się także funkcje zmiennych losowych o

Wykład 8: Zmienne losowe dyskretne. Rozkłady Bernoulliego (dwumianowy), Pascala, Poissona. Przybliżenie Poissona rozkładu dwumianowego.

Trzeba pokazać, że dla każdego c 0 c Mc 0. ) = oraz det( ) det( ) det( ) jest macierzą idempotentną? Proszę odpowiedzieć w

obie z mocy ustawy. owego.

Rachunek prawdopodobieństwa i statystyka matematyczna w zadaniach,

Kombinacje, permutacje czyli kombinatoryka dla testera

ZBIEŻNOŚĆ CIĄGU ZMIENNYCH LOSOWYCH. TWIERDZENIA GRANICZNE

Plan wykładu. Analiza danych Wykład 1: Statystyka opisowa. Literatura. Podstawowe pojęcia

Parametryczne Testy Istotności

KURS STATYSTYKA. Lekcja 4 Nieparametryczne testy istotności ZADANIE DOMOWE. Strona 1

STATYSTYKA OPISOWA I PROJEKTOWANIE EKSPERYMENTU dr inż Krzysztof Bryś

Ćwiczenia rachunkowe TEST ZGODNOŚCI 2 PEARSONA ROZKŁAD GAUSSA

Wykład 5 Problem dwóch prób - testowanie hipotez dla równości średnich

X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

L.Kowalski zadania z rachunku prawdopodobieństwa-zestaw 1 ZADANIA - ZESTAW 1. . (odp. a)

JEDNOWYMIAROWA ZMIENNA LOSOWA

Moda (Mo, D) wartość cechy występującej najczęściej (najliczniej).

Wstęp. zbiór wszystkich zdarzeń elementarnych (sample space), S zbiór zdarzeń, (events), P prawdopodobieństwo (probability distribution).

Prawdopodobieństwo i statystyka r.

Porównanie dwu populacji

4. Weryfikacja modelu

Analiza I.1, zima globalna lista zadań

Wokół testu Studenta 1. Wprowadzenie Rozkłady prawdopodobieństwa występujące w testowaniu hipotez dotyczących rozkładów normalnych

Metody probabilistyczne Rozwiązania zadań

Miary rozproszenia. Miary położenia. Wariancja. Średnia. Dla danych indywidualnych: Dla danych indywidualnych: s 2 = 1 n. (x i x) 2. x i.

Techniczne Aspekty Zapewnienia Jakości

i statystyka matematyczna Rachunek prawdopodobieństwa i statystyka matematyczna w zadaniach, M. Przybycień Rachunek prawdopodobieństwa i statystyka

Statystyka w analizie i planowaniu eksperymentu

STATYSTYKA OPISOWA PODSTAWOWE WZORY

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Dwa podstawowe zagadnienia klasycznej statystyki matematycznej.

PDF created with FinePrint pdffactory Pro trial version

Miary położenia. Miary rozproszenia. Średnia. Wariancja. Dla danych indywidualnych: Dla danych indywidualnych: s 2 = 1 n. (x i x) 2. x i.

Zeszyty naukowe nr 9

będą niezależnymi zmiennymi losowymi z rozkładu jednostajnego na przedziale ( 0,

APROKSYMACJA I INTERPOLACJA. funkcja f jest zbyt skomplikowana; użycie f w dalszej analizie problemu jest trudne

Wytrzymałość śruby wysokość nakrętki

ANALIZA DANYCH DYSKRETNYCH

σ-ciało zdarzeń Niech Ω będzie niepustym zbiorem zdarzeń elementarnych, a zbiór F rodziną podzbiorów zbioru Ω spełniającą warunki: jeśli A F, to A F;

Statystyka matematyczna. Wykład VI. Zesty zgodności

Badanie stacjonarności szeregów czasowych w programie GRETL

Lista 5. Odp. 1. xf(x)dx = xdx = 1 2 E [X] = 1. Pr(X > 3/4) E [X] 3/4 = 2 3. Zadanie 3. Zmienne losowe X i (i = 1, 2, 3, 4) są niezależne o tym samym

Metody Podejmowania Decyzji

TRANSFORMACJA DO UKŁADU 2000 A PROBLEM ZGODNOŚCI Z PRG

Wiadowmości wstępne z rachunku prawdopodobieństwa

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

STATYSTYKA OPISOWA WYKŁAD 1 i 2

Bezpieczeństwo i niezawodność w geotechnice Kalibracja częściowych współczynników bezpieczeństwa według Eurokodu EC7-1

N ( µ, σ ). Wyznacz estymatory parametrów µ i. Y które są niezależnymi zmiennymi losowymi.

Powtórzenie do kolokwium

X i. X = 1 n. i=1. wartość tej statystyki nazywana jest wartością średnią empiryczną i oznaczamy ją symbolem x, przy czym x = 1. (X i X) 2.

Wykład 7. Przestrzenie metryczne zwarte. x jest ciągiem Cauchy ego i posiada podciąg zbieżny. Na mocy

Kolorowanie Dywanu Sierpińskiego. Andrzej Szablewski, Radosław Peszkowski

O liczbach naturalnych, których suma równa się iloczynowi

Wykład 5 Przedziały ufności. Przedział ufności, gdy znane jest σ. Opis słowny / 2

Transkrypt:

WSPÓŁZALEŻNOŚĆ PROCESÓW MASOWYCH Test zgodości H : rozład jest zgody z załadaym 0 : H bra zgodości rozładu z załadaym statystya: p emp i p obszar rytyczy: K ;, i gdzie liczba ategorii p Przyład: Wyoujemy 0 rzutów ostą sześcieą: >osta= sample(:6,0,replace=t) >osta [] 4 6 6 3 3 3 3 4 6 5 4 5 6 4 3 3 5 4 5 4 5 5 3 4 4 5 5 6 4 4 6 [49] 5 6 4 3 4 4 4 4 6 6 5 3 3 6 3 6 6 3 5 5 4 4 5 6 4 6 6 6 4 3 4 3 3 5 4 [97] 5 3 5 5 6 3 5 4 4 4 3 3 6 5 3 5 6 5 Teoretyczie ażda liczba ocze powia wypaść 0 razy, bo p 0*/ 6 0 A co u as? > osta=data.frame(table(osta)) > osta osta Freq 8 8 3 3 0 4 4 4 5 5 6 6 9 Czy otrzymae wyii świadczą o tym, że osta jest symetrycza? Czy różice są statystyczie istote? Stawiamy hipotezy: H H 6 6 6 6 6 6,,,,, 6 6 6 6 6 6 p, p, p, p, p,,,,,, 0 : 3 4 5 p6 p, p, p, p, p, : 3 4 5 p6

Obliczymy statystyę chi-wadrat p emp 8 0 8 0 0 0 4 0 0 9 0 0 0 4 4 0 6 6,3 0 0 0 i 0 p i 0 0 Obliczymy statystyę chi-wadrat w R > chi.osta=sum((osta$freq-0)^/0) > chi.osta [].3 Kwatyl z rozładu chi-wadrat : > qchisq(.95,5) [].0705 Nie ma podstaw do odrzuceia H0, a więc osta jest symetrycza. Test chisq.test() > pr=rep(/6,6) (albo pr=c(/6,/6,/6,/6,/6,/6)) > chisq.test(osta$freq,p=pr) Chi-squared test for give probabilities data: osta$freq X-squared =.3, df = 5, p-value = 0.9349 A więc osta jest symetrycza

Test iezależości Przy badaiu populacji geeralej jedocześie ze względu a dwie cechy często iteresuje as sprawdzeie hipotezy, czy cechy te są ze sobą związae. Gdy obie cechy są mierzale, posługujemy się ajczęściej pojęciem orelacji i regresji. Gdy przyajmiej jeda z dwu badaych cech jest iemierzala, to badając związe tych cech ze sobą posługujemy się pojęciem iezależości stochastyczej odpowiedich dwóch zmieych losowych. Zmiee X i Y są iezależe, jeśli dla ich dystrybuat zachodzi związe: F x, y) F ( x) F ( ). ( y H : cechy są iezależe 0 : H istieje zależość między cechami statystya: r s r s p emp i j p obszar rytyczy: K, ( r ) s; i j gdzie r ilość grup wartości cechy X s ilość grup wartości cechy Y i j Przyład: W drugim biegu CITY TRAIL w Olsztyie dia 3..08 wystartowało 404 zawodiów. Li: https://citytrail.pl/zawody/wyii/miasto/olszty/id/787 Rozład zawodiów w poszczególych ategoriach wieowych Kobiet i Mężczyz wyglądał astępująco: obiety mężczyźi Kategoria 6 5 0 Kategoria 0 3 36 Kategoria 30 65 87 Kategoria 40 40 90 Kategoria 50 9 7 Kategoria 60 0 Czy moża twierdzić, że płeć determiuje wie zawodiów? Uwaga: przy teście iezależości chi-wadrat wszystie wartości w tablicy otygecji powiy wyosić co ajmiej 5. Tutaj mamy problem z ategorią K60 są tylo dwie paie. W taiej sytuacji moża połączyć ategorie 50 i 60

Obliczeia wyglądają astępująco: obiety mężczyźi Kategoria 6 5 0 5 Kategoria 0 3 36 59 Kategoria 30 65 87 5 Kategoria 40 40 90 30 Kategoria 50 i więcej 37 48 44 60 404 Statystyę liczymy w formie tabelaryczej: (emp) () (emp)-() ((emp)-())^/() K6 5 5,346535-0,34653 0,046 K0 3,097,97097 0,84599 K30 65 54,78 0,878,6588 K40 40 46,33663-6,33663 0,866548 K50 7,089-6,089,849 M6 0 9,653465 0,346535 0,044 M0 36 37,9703 -,9703 0,04 M30 87 97,878-0,88,9787 M40 90 83,66337 6,336634 0,479934 M50 37 30,8909 6,089,08076 8,463 i j 5*44 5*60 K6 5,35 M 30 97, 8 404 404 Wartość statystyi 8,463 K ; 9, Obszar rytyczy dla alfa=0,05 to 488 > qchisq(0.95,4) [] 9.48779 0,05,4 Obszar rytyczy dla alfa=0, to K ; 7, 779 > qchisq(0.9,4) [] 7.77944 Jaie stąd płyą wiosi???? Czy płeć determiuje wie zawodiów? 0,,4

A ja to zrobić w R? > K=c(5,3,65,40,) > M=c(0,36,87,90,37) > chisq.test(cbid(k,m)) Pearso's Chi-squared test data: cbid(k, M) X-squared = 8.463, df = 4, p-value = 0.07746 Wiosi??? Moża taże wyorzystać poszczególe elemety: > wyi<-chisq.test(cbid(k,m)) > wyi Pearso's Chi-squared test data: cbid(k, M) X-squared = 8.463, df = 4, p-value = 0.07746 > wyi$statistic X-squared 8.463 > wyi$expected K M [,] 5.346535 9.653465 [,].09703 37.97097 [3,] 54.788 97.878 [4,] 46.336634 83.663366 [5,] 7.089 30.89089 > wyi$observed K M [,] 5 0 [,] 3 36 [3,] 65 87 [4,] 40 90 [5,] 37 > wyi$p.value [] 0.0774646 > wyi$method [] "Pearso's Chi-squared test" > wyi$data.ame [] "cbid(k, M)"

Współczyi orelacji rag Spearmaa r s i 6 d i Przyład alohole Aia Barte liier 8 metaxa 5 4 piwo 4 rum 6 7 szampa 5 whisy 7 3 wio 3 6 wóda 8 Obliczmy teraz współczyi orelacji rag Spearmaa i przetestujemy jego istotość. Obliczeia zrobimy w formie tabelaryczej: alohole Aia Barte di di^ liier 8 8 0 0 metaxa 5 4 piwo 4 3 9 rum 6 7 - szampa 5-3 9 whisy 7 3 4 6 wio 3 6 3 9 wóda - 46 6*46 r s 0,548 0,45 88 Co to zaczy? Przy pomocy języa R: > Aia=c(8, 5, 4, 6,, 7, 3, ) > Aia [] 8 5 4 6 7 3 > Barte=c(8, 4,, 7, 5, 3, 6, ) > Barte [] 8 4 7 5 3 6 > di<-sum((aia-barte)^) > di [] 46

> r.s<--(6*di)/(8*(8^-)) > r.s [] 0.4538 Albo używającu fucji cor() > cor(aia,barte,method = "spearma") [] 0.4538 Test istotości dla współczyia orelacji rag Spearmaa H : r 0 0 s rs statystya t H : rs 0 rs Obszar rytyczy: K ( ; t, ) ( t, ; ) U as: t 0,45 0,45, 4 K ( ;,447) (,447; ) 8 > qt(0.975,6) [].4469 Wiosi? Albo przy użyciu języa R robimy to szybciej: > cor.test(aia,barte,method = "spearma") Spearma's ra correlatio rho data: Aia ad Barte S = 46, p-value = 0.675 alterative hypothesis: true rho is ot equal to 0 sample estimates: rho 0.4538

Współczyi orelacji Kedalla Korelacja Tau Kedalla obliczeia statystycze z wyorzystaiem tego testu stosujemy wtedy gdy asze zmiee (bądź przyajmiej jeda z ich) jest wyrażoa a sali porządowej. Opiera się a aalizie rag ta ja to jest w przypadu orelacji rag Spearmaa. Współczyi orelacji rag Kedalla dla rag iepowiązaych: r V Przyład: Ragi cechy X :, 5, 4,, 3 Ragi cechy Y:, 3, 4,, 5 Próbę porządujemy ze względu a jedą cechę, p. X X:,, 3, 4, 5 Y:,, 5, 4, 3 Teraz dla ażdej ragi cechy I ta dostaiemy: tworzymy pary z ragami astępującymi po iej. (,) (,5) (,4) (,3) (,5) (,4) (,3) (5,4) (5,3) (4,3) Jeżeli w parze poprzedi jest miejszy iż astępi to parze przypisujemy otę +, gdy poprzedi jest więszy iż astępi to przypisujemy otę -. Teraz tworzymy sumę wszystich ot +. U as: - + + + + + + - - - Ta więc V=6, a r 6 0, 55

W języu R: > ragix=c(,5,4,,3) > ragiy=c(,3,4,,5) > cor(ragix,ragiy,method="edall") [] 0. Test istotości dla współczyia orelacji rag Kedalla: > cor.test(ragix, ragiy,method="edall") Kedall's ra correlatio tau data: ragix ad ragiy T = 6, p-value = 0.867 alterative hypothesis: true tau is ot equal to 0 sample estimates: tau 0. A więc ie ma zależości.