Statystyka Matematyczna Anna Janicka

Podobne dokumenty
( X, Y ) będzie dwuwymiarową zmienną losową o funkcji gęstości

TESTY NORMALNOŚCI. ( Cecha X populacji ma rozkład normalny). Hipoteza alternatywna H1( Cecha X populacji nie ma rozkładu normalnego).

będą niezależnymi zmiennymi losowymi z rozkładu o gęstości

Prawdopodobieństwo i statystyka r.

. Wtedy E V U jest równa

ma rozkład normalny z nieznaną wartością oczekiwaną m

Prawdopodobieństwo i statystyka r.

będą niezależnymi zmiennymi losowymi o tym samym 2 x

[, ] [, ] [, ] ~ [23, 2;163,3] 19,023 2,7

ma rozkład normalny z wartością oczekiwaną EX = EY = 1, EZ = 0 i macierzą kowariancji

STATYSTYKA MATEMATYCZNA WYKŁAD 2 ESTYMACJA PUNKTOWA

JEDNOWYMIAROWA ZMIENNA LOSOWA

Zadanie 1. ), gdzie 1. Zmienna losowa X ma rozkład logarytmiczno-normalny LN (, . EX (A) 0,91 (B) 0,86 (C) 1,82 (D) 1,95 (E) 0,84

N ( µ, σ ). Wyznacz estymatory parametrów µ i. Y które są niezależnymi zmiennymi losowymi.

ROZKŁADY ZMIENNYCH LOSOWYCH

Zadanie 1. Rzucamy symetryczną monetą tak długo, aż w dwóch kolejnych rzutach pojawią się,,reszki. Oblicz wartość oczekiwaną liczby wykonanych rzutów.

W loterii bierze udział 10 osób. Regulamin loterii faworyzuje te osoby, które w eliminacjach osiągnęły lepsze wyniki:

Tablica Galtona. Mechaniczny model rozkładu normalnego (M10)

STATYSTYKA MATEMATYCZNA WYKŁAD 5 WERYFIKACJA HIPOTEZ NIEPARAMETRYCZNYCH

65120/ / / /200

Weryfikacja hipotez dla wielu populacji

W zadaniu nie ma polecenia wyznaczania estymatora nieobciążonego o minimalnej wariancji. σ σ σ σ σ = =

Nieparametryczne Testy Istotności

) będą niezależnymi zmiennymi losowymi o tym samym rozkładzie normalnym z następującymi parametrami: nieznaną wartością 1 4

Statystyka. Analiza zależności. Rodzaje zależności między zmiennymi występujące w praktyce: Funkcyjna

Podstawowe zadanie statystyki. Statystyczna interpretacja wyników eksperymentu. Zalety statystyki II. Zalety statystyki

będzie próbką prostą z rozkładu normalnego ( 2

L.Kowalski PODSTAWOWE TESTY STATYSTYCZNE WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH

OBLICZANIE NIEPEWNOŚCI METODĄ TYPU B

W zadaniu nie ma polecenia wyznaczania estymatora nieobciążonego o minimalnej wariancji. σ σ σ σ σ = =

( ) ( ) ( ) ( ) ( ) ( )

( ) ( ) 2. Zadanie 1. są niezależnymi zmiennymi losowymi o. oraz. rozkładach normalnych, przy czym EX. i σ są nieznane. 1 Niech X

ZJAZD 1. STATYSTYKA OPISOWA wstępna analiza danych

Metoda Monte-Carlo i inne zagadnienia 1

Wnioskowanie statystyczne dla korelacji i regresji.

Miary położenia wskazują miejsce wartości najlepiej reprezentującej wszystkie wielkości danej zmiennej. Mówią o przeciętnym poziomie analizowanej

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 7-8

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

POPULACJA I PRÓBA. Próba reprezentatywna. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH 5 1

O testowaniu jednorodności współczynników zmienności

Podstawowe pojcia. Metody probabilistyczne i statystyka Wykład 7: Statystyka opisowa. Rozkłady prawdopodobiestwa wystpujce w statystyce.

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Statystyka Matematyczna Anna Janicka

Średnia harmoniczna (cechy o charakterze ilorazu np. Prędkość, gęstość zaludnienia)

Przegląd wybranych testów

( ) L 1. θ θ = M. Przybycień Rachunek prawdopodobieństwa i statystyka. = θ. min

VI. TWIERDZENIA GRANICZNE

1.1. Uprość opis zdarzeń: 1.2. Uprościć opis zdarzeń: a) A B A Uprościć opis zdarzeń: 1.4. Uprościć opis zdarzeń:

Matematyka ubezpieczeń majątkowych r. t warunkowo niezależne i mają (brzegowe) rozkłady Poissona:

Prawdopodobieństwo i statystyka r.

Wykład 10 Testy jednorodności rozkładów

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

AKADEMIA MORSKA W SZCZECINIE

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 5

Testowanie hipotez statystycznych.

Planowanie eksperymentu pomiarowego I

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

W praktyce często zdarza się, że wyniki obu prób możemy traktować jako. wyniki pomiarów na tym samym elemencie populacji np.

Pojęcie statystyki. Definicja. Wektorową funkcję mierzalną T: X T(X)=(T 1 (X),...,T k (X)) R k wymiarową statystyką. próby X nazywamy k

Badania niezawodnościowe i statystyczna analiza ich wyników

Statystyka Matematyczna Anna Janicka

k k M. Przybycień Rachunek Prawdopodobieństwa i Statystyka Wykład 13-2

Statystyka Matematyczna Anna Janicka

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 4

Funkcja wiarogodności

ZMIENNA LOSOWA JEDNOWYMIAROWA POJĘCIE ZMIENNEJ LOSOWEJ

Statystyczne charakterystyki liczbowe szeregu

16 Przedziały ufności

STATYSTYKA MATEMATYCZNA WYKŁAD 1. Wiadomości wstępne

wyniki serii n pomiarów ( i = 1,..., n) Stosując metodę największej wiarygodności możemy wykazać, że estymator wariancji 2 i=

PDF created with FinePrint pdffactory Pro trial version WIII/1

Testowanie hipotez statystycznych.

IV. ZMIENNE LOSOWE DWUWYMIAROWE

X i. X = 1 n. i=1. wartość tej statystyki nazywana jest wartością średnią empiryczną i oznaczamy ją symbolem x, przy czym x = 1. (X i X) 2.

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).

Podstawy analizy niepewności pomiarowych (I Pracownia Fizyki)

STATYSTYKA MATEMATYCZNA

Problemy jednoczesnego testowania wielu hipotez statystycznych i ich zastosowania w analizie mikromacierzy DNA

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Statystyka Inżynierska

Wyrażanie niepewności pomiaru

Średnia arytmetyczna Klasyczne Średnia harmoniczna Średnia geometryczna Miary położenia inne

Testowanie hipotez statystycznych.

( ) ( ) ( ) ( ) ( ) ( )

Statystyka Matematyczna Anna Janicka

Plan wykładu: Typowe dane. Jednoczynnikowa Analiza wariancji. Zasada: porównać zmienność pomiędzy i wewnątrz grup

Matematyczny opis ryzyka

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Elementy statystyki STA - Wykład 5

Estymacja przedziałowa

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

opisać wielowymiarową funkcją rozkładu gęstości prawdopodobieństwa f(x 1 , x xn

Natalia Nehrebecka. Zajęcia 4

X i T (X) = i=1. i + 1, X i+1 i + 1. Cov H0. ( X i. k 31 ) 1 Φ(1, 1818) 0, 12.

L.Kowalski zadania ze statystyki opisowej-zestaw 5. ZADANIA Zestaw 5

Porównanie wielu rozkładów normalnych

Statystyka matematyczna dla leśników

Transkrypt:

Statystyka Matematycza Aa Jacka wykład II, 3.05.016 PORÓWNANIE WIĘCEJ NIŻ DWÓCH POPULACJI TESTY NIEPARAMETRYCZNE

Pla a dzsaj 1. Porówywae węcej ż dwóch populacj test jedoczykowej aalzy waracj (ANOVA). Testy zgodośc test Kołmogorowa test Kołmogorowa-Smrowa (dla dwóch próbek) test Kołmogorowa-Llleforsa test zgodośc ch-kwadrat róże wersje 3. Testy ezależośc test ch-kwadrat

Porówywae dwóch węcej populacj Zastaawamy sę, czy populacje są pod pewym względam take same : testy parametrycze: badamy rówość kokretych parametrów rozkładów testy eparametrycze: sprawdzamy, czy rozkłady są take same

Uwaga a otację: x coś zawsze ozacza kwatyl rzędu coś

Testy dla węcej ż dwóch populacj Nawe podejśce: testowae param Uwaga: w tym przypadku p-stwo popełea błędu I rodzaju jest wększe, ż założoy pozom stotośc!

Przypadek welu populacj Przypuśćmy, że mamy k prób losowych... 1,1,,1 k,1,, k, 1,,, oraz wszystke,j są ezależe (1,...,k, j1,.., ),j ~N(m, σ ) e zamy m 1, m,..., m k, a σ 1,,,...,,...,,..., 1 k,, k, oz. 1 + +...+ k

Test aalzy waracj (ANOVA) a pozome stotośc α H 0 : µ 1 µ... µ k H 1 : H 0 (tz. e wszystke µ są rówe) Test lorazu warogodośc ze statystyką: ma obszar krytyczy dla k test ANOVA jest rówoważy testow t dla dwóch populacj ) 1, ( ~ ) /( ) ( 1) /( ) ( 1 1, 1 k k F k k F k j j k k k j j j j 1 1 1, 1, 1 1, 1 )} 1, ( ) ( : { * 1 k k F x F x K > α

Test aalzy waracj terpretacja mamy k ( + j j ) ( ) 1 1 j k, (, j ) 1 1 1 k Sum of Squares (SS) Sum of Squares Betwee (SSB) Sum of Squares Wth (SSW) 1 1 1 k k 1 ( k ( j j 1 1, ) k ) estymator waracj mędzygrupowej estymator waracj wewątrz grup

Test aalzy waracj tabela źródło zmeośc sumy kwadratów lczba stop swobody wartość statystyk F mędzy grupam wewątrz grup SSB k-1 SSW -k w sume SS -1 F

Test aalzy waracj przykład Rocze spożyce czekolady w trzech mastach: A, B, C a podstawe losowych prób A 8, B 10, C 9 kosumetów. Czy średe spożyce zależy od masta? 1 7 A B C średa z próby 11 10 7 waracja z próby 3,5,8 3 (11 8+ 10 10+ 7 9) SSB (11 9,3) SSW F 75,63/ 73,7/ 4 1,31 8+ (10 9,3) 3,5 7+,8 9+ 3 8 a F 0,99 9,3 73,7 10+ (7 9,3) (,4) 5,61 75,63 odrzucamy H 0 o rówośc średch 9

Test aalzy waracj tabela przykład źródło zmeośc sumy kwadratów lczba stop swobody wartość statystyk F mędzy grupam wewątrz grup 75,63 73,7 4 w sume 149,33 6 1,31

Testy eparametrycze Badamy, czy zmea pochodz z kokretego rozkładu (testy zgodośc). Badamy, czy rozkłady zmeych są take same Badamy, czy zmee/cechy są ezależe (test ezależośc)

Test zgodośc Kołmogorowa Model: 1,,..., są próbą IID z rozkładu o dystrybuace F. H 0 : F F 0 (F 0 ustaloa) H 1 : H 0 (tz. dystrybuata jest jakaś a) Jeśl F 0 jest cągła, to testujemy statystyką D gdze D + + supt R F ( t) F0( t) max{ D, D max 1,..., F0( x: ), D max 1,..., F0( x: zaś F (t) -ta dystrybuata emprycza } ) 1

Test zgodośc Kołmogorowa cd. Postać testu: odrzucamy H 0 gdy: D > c(α, ) dla pewej wartośc krytyczej c(α, ). Tw. Przy prawdzwej H 0 rozkład statystyk D e zależy od rozkładu F 0. Problem: Te rozkład wymaga tablcowaa, w zasadze dla każdego z osoba Tw. W gracy P( D d) K( d) + k ( 1) k moża stosować przyblżee dla 100 k e d

Test zgodośc Kołmogorowa cd. Tablca rozkładu asymptotyczego K(d) 1-α 0,8 0,9 0,95 0,99 kwatyl K(d) c(, α) dla 100 1,07 1, 1,36 1,63 1,07/ 1,/ 1,36/ 1,63/

Test zgodośc Kołmogorowa przykład Czy próba 0,4085 0,567 0,3751 0,839 0,0846 0,8306 0,664 0,3086 0,366 0,795 pochodz z rozkładu jedostajego U(0,1)? Źródło: W. Nemro

Test zgodośc Kołmogorowa przykład cd. :10 (-1)/10 /10 /10 - F( :10 ) F( :10 -/10) 0,0846 0 0,1 0,0154 0,0846 0,3086 0,1 0, -0,1086 0,086 0,366 0, 0,3-0,066 0,166 0,3751 0,3 0,4 0,049 0,0751 0,4085 0,4 0,5 0,0915 0,0085 0,567 0,5 0,6 0,0733 0,067 0,664 0,6 0,7 0,0736 0,064 0,795 0,7 0,8 0,0048 0,095 0,8306 0,8 0,9 0,0694 0,0306 0,839 0,9 1 0,1671-0,0671 D 0,086 c(10; 0,9) 0,369 e ma podstaw do odrzucea hpotezy o jedostajośc rozkładu

Test zgodośc Kołmogorowa Smrowa Model: 1,,..., są próbą IID z rozkładu o dystrybuace F, Y 1, Y,..., Y m są próbą IID z rozkładu o dystrybuace G. H 0 : F G H 1 : H 0 (tz. dystrybuaty są róże) Jeśl F ( G) jest cągła, to testujemy statystyką D sup F ( t) G ( ), m t R m t gdze F (t) -ta dystrybuata emprycza perwszej próbk, a G m (t) m-ta dystrybuata emprycza drugej próbk

Test zgodośc Kołmogorowa Smrowa cd. Postać testu: odrzucamy H 0 gdy: D,m > c(α,,m) dla pewej wartośc krytyczej c(α,, m). Tw. Przy prawdzwej H 0 rozkład statystyk D,m e zależy od rozkładu F (a G). Tw. W gracy P( m + k D + m, m d) K( d) ( 1), m k przyblżee OK dla,m 100 e k d

Test zgodośc Kołmogorowa Llleforsa Model: 1,,..., są próbą IID z rozkładu o dystrybuace F. H 0 : F jest dystrybuatą rozkładu ormalego (o ezaych parametrach) H 1 : H 0 (tz. dystrybuata jest jakaś a) Testujemy statystyką gdze a }, max{ + D D D z D z D 1 max, max,..., 1 1,..., + Φ S z : 1 1 1 1 1 ) (, S

Test zgodośc Kołmogorowa Llleforsa cd. Postać testu: odrzucamy H 0 gdy: D > D (α) dla pewej wartośc krytyczej D (α). Tw. Przy prawdzwej H 0 rozkład statystyk D e zależy od kokretego rozkładu orm. Problem: Te rozkład wymaga tablcowaa e jest zaa postać aaltycza... Stosoway zwł. dla próbek o lczebośc do 30, kedy jest lepszy ż test zgodośc chkwadrat

Test zgodośc Kołmogorowa Llleforsa wartośc krytycze Źródło: H. Lllefors

Test zgodośc ch-kwadrat Model: 1,,..., są próbą IID z rozkładu dyskretego o k wartoścach (oz. 1,..., k). H 0 : prawdopodobeństwa w rozkładze to 1 3... k P() p 1 p p 3... p k H 1 : H 0 (tz. rozkład jest jakś y) Ozaczmy rezultat dośwadczea jako 1 3... k N N 1 N N 3... N k gdze N ozacza lczbę uzyskaych wyków wartośc. N 1 j 1 j etykety

Test zgodośc ch-kwadrat postać testu Ogóla postać testu: χ u as: ( wartosc obserwowaa- wartoscoczekwaa) wartoscoczekwaa χ N p k ( - ) 1 p Tw. Przy prawdzwośc H 0 rozkład w/w statystyk χ zmerza do rozkładu χ o k-1 stopach swobody χ (k-1) przy Procedura: odrzucamy H 0 gdy χ > c, gdze c χ 1-α(k-1) jest kwatylem rzędu 1- α rozkładu χ o k-1 stopach swobody

Test zgodośc ch-kwadrat przykład Czy kość jest rzetela? Na pozome α0,05 150 rzutów. Wyk: H 0 : (N 1, N, N 3, N 4, N 5, N 6 ) H 1 : H 0 1 3 4 5 6 N 15 7 36 17 6 9 ~Mult(150, 1/6, 1/6, 1/6, 1/6, 1/6, 1/6) χ (15 5) 5 + (7 5) 5 + (36 5) 5 + (17 5) 5 + (6 5) 5 + (9 5) 5 1,4 10,05(5) 11,7 χ odrzucamy H 0. Źródło: W. Nemro

Test zgodośc ch-kwadrat z ezaym parametrem Model: 1,,..., są próbą IID z rozkładu dyskretego o k wartoścach (oz. 1,..., k). H 0 : prawdopodobeństwa w rozkładze to H 1 : H 0 1 3... k P() p 1 (θ) p (θ) p 3 (θ)... p k (θ) przy czym θ jest ezaym parametrem wymaru d. (tz. rozkład jest jakś y)

Test zgodośc ch-kwadrat z ezaym parametrem postać testu Statystyk testowe kostruujemy aalogcze jak poprzedo, przy czym wartośc oczekwae wylczamy w oparcu o estymatory NW parametrów θ. Zmea sę tylko lczba stop swobody w rozkładze: Tw. Przy prawdzwej H 0 rozkład statystyk χ zmerza do rozkładu χ o k-d-1 stopach swobody χ (k-d-1) przy

Test zgodośc ch-kwadrat ucąglee Lepsze są testy Kołmogorowa, ale moża róweż stosować test ch-kwadrat Model: 1,,..., są próbą IID z rozkładu cągłego. H 0 : Rozkład zaday jest dystrybuatą F H 1 : H 0 (tz. rozkład jest jakś y) Wystarczy rozbć zbór wartośc zmeej a rozłącze przedzały zlczać obserwacje, które wpadły do poszczególych przedzałów. P-stwa oczekwae są zae (wykają z F). Dalej: test ch-kwadrat

Test zgodośc ch-kwadrat uwag praktycze Test powe być stosoway dla dużych prób Lczebośc klas (oczekwae) e mogą być za małe (<5). Jeśl za małe, ależy pogrupować obserwacje Przedzały klas w wersj cągłej ustalae dowole, ale warto zadbać o rówomere rozłożee p-stw teoretyczych.

Test ezależośc ch-kwadrat Model: ( 1,Y 1 ),..., (,Y ) są próbą IID z rozkładu dwuwymarowego o r*s wartoścach (oz. zborem {1,..., r} {1,..., s}). Nech rozkład teoretyczy zaday będze przez Ozaczmy Iteresuje as hpoteza o ezależośc Y: H 0 : p j H 1 : H 0 P(, Y j) 1,..., r j p s j 1 p j, p j pj p p j 1,..., s, j 1,..., r r 1 p j 1,..., s

Test ezależośc ch-kwadrat cd. Rozkład empryczy opsay jest dwuwymarową tabelką (tzw. tablca kotygecj) \j 1... s N 1 N 11 N 1 N 1s N 1 N 1 N N s N... r N r1 N r N rs N r N j N 1 N N s

Test ezależośc ch-kwadrat postępowae Szczególy przypadek testu zgodośc z (r-1) + (s-1) parametram do wyestymowaa: Statystyka testowa: χ N 1 j 1 j j ma rozkład ch-kwadrat z (r-1)(s-1) stopam swobody (przy prawdzwej H 0 ) r s ( N j N N N / / )

Test ezależośc ch-kwadrat przykład Badamy zależość gustów muzyczych poglądów poltyczych, a pozome α 0,05 Poperam Ne poperam Razem Słucham dsco-polo 5 10 35 Słucham rocka 0 0 40 Słucham muzyk klasyczej 15 10 5 Razem 60 40 100 χ (5 60 * 35/100) (0 60 * 40/100) (15 60 * 5/100) + + 60 * 35/100 60 * 40/100 60 * 5/100 (10 40 * 35/100) (0 40 * 40/100) (10 40 * 5/100) + + + 40 * 35/100 40 * 40/100 40 * 5/100 χ1 0,05((1)(31)) χ0,95() odrzucamy H 0. Źródło: W. Nemro 5,99 3,57

Radomzacja testu Czasem może e być testu o pozome stotośc rówym dokłade α (p. dla zmeych o rozkładach dyskretych). Wówczas rozwązaem jest radomzacja. (TJNM, o le jest, mus być zradomzoway). p. lczba orłów w 8 rzutach, H 0 : p ½, H 1 : p <½, α0,05: x 0 1 3 4 5 6 7 8 p 0,004 0,03 0,11 0, 0,7 0, 0,11 0,03 0,004 suma p 0,004 0,04 0,15 0,36 0,64 0,86 0,97 0,996 1,000 1 odrzucamy, > OK, : p1/11 odrzucamy