Weryfikacja hipotez dla wielu populacji

Podobne dokumenty
STATYSTYKA MATEMATYCZNA WYKŁAD 5 WERYFIKACJA HIPOTEZ NIEPARAMETRYCZNYCH

W praktyce często zdarza się, że wyniki obu prób możemy traktować jako. wyniki pomiarów na tym samym elemencie populacji np.

) będą niezależnymi zmiennymi losowymi o tym samym rozkładzie normalnym z następującymi parametrami: nieznaną wartością 1 4

65120/ / / /200

Nieparametryczne Testy Istotności

Funkcje i charakterystyki zmiennych losowych

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 4

TESTY NORMALNOŚCI. ( Cecha X populacji ma rozkład normalny). Hipoteza alternatywna H1( Cecha X populacji nie ma rozkładu normalnego).

Badanie współzależności dwóch cech ilościowych X i Y. Analiza korelacji prostej

( ) ( ) 2. Zadanie 1. są niezależnymi zmiennymi losowymi o. oraz. rozkładach normalnych, przy czym EX. i σ są nieznane. 1 Niech X

Natalia Nehrebecka. Zajęcia 4

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Prawdopodobieństwo i statystyka r.

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Plan wykładu: Typowe dane. Jednoczynnikowa Analiza wariancji. Zasada: porównać zmienność pomiędzy i wewnątrz grup

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

1 Estymacja przedziałowa

brak podstaw do odrzucenia hipotezy zerowej.

Egzamin ze statystyki/ Studia Licencjackie Stacjonarne/ Termin I /czerwiec 2010

Testowanie hipotez statystycznych.

1.1. Uprość opis zdarzeń: 1.2. Uprościć opis zdarzeń: a) A B A Uprościć opis zdarzeń: 1.4. Uprościć opis zdarzeń:

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Testowanie hipotez statystycznych.

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Stanisław Cichocki. Natalia Nehrebecka. Wykład 11

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Procedura normalizacji

Korelacja krzywoliniowa i współzależność cech niemierzalnych

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

STATYSTYKA MATEMATYCZNA

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Natalia Nehrebecka. Wykład 2

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Natalia Nehrebecka. Zajęcia 3

Kolokwium ze statystyki matematycznej

Parametry zmiennej losowej

KURS STATYSTYKA. Lekcja 6 Regresja i linie regresji ZADANIE DOMOWE. Strona 1

Testowanie hipotez statystycznych

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Estymacja parametrów rozkładu cechy

Statystyka matematyczna

KURS STATYSTYKA. Lekcja 1 Statystyka opisowa ZADANIE DOMOWE. Strona 1

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Testowanie hipotez statystycznych

Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11

Dobór zmiennych objaśniających

Problemy jednoczesnego testowania wielu hipotez statystycznych i ich zastosowania w analizie mikromacierzy DNA

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Badanie współzaleŝności dwóch cech ilościowych X i Y. Analiza korelacji prostej. Badanie zaleŝności dwóch cech ilościowych. Analiza regresji prostej

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

STATYSTYKA

Porównanie dwóch rozkładów normalnych

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Statystyka. #6 Analiza wariancji. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2015/ / 14

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Elementy statystyki STA - Wykład 5

Stanisław Cichocki. Natalia Nehrebecka Katarzyna Rosiak-Lada. Zajęcia 3

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Regresja liniowa i nieliniowa

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

Analiza danych OGÓLNY SCHEMAT. Dane treningowe (znana decyzja) Klasyfikator. Dane testowe (znana decyzja)

Statystyka matematyczna dla leśników

Ekonometryczne modele nieliniowe

Zadanie 1. ), gdzie 1. Zmienna losowa X ma rozkład logarytmiczno-normalny LN (, . EX (A) 0,91 (B) 0,86 (C) 1,82 (D) 1,95 (E) 0,84

Testowanie hipotez statystycznych

Rachunek prawdopodobieństwa i statystyka W 11: Analizy zależnościpomiędzy zmiennymi losowymi Model regresji wielokrotnej

Estymacja punktowa i przedziałowa

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Analiza niepewności pomiarów

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Wykład 3 Hipotezy statystyczne

Analiza wariancji w analizie regresji - weryfikacja prawdziwości przyjętego układu ograniczeń Problem Przykłady

Macierz prawdopodobieństw przejścia w pojedynczym kroku dla łańcucha Markowa jest postaci

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Testowanie hipotez statystycznych

Badania sondażowe. Braki danych Konstrukcja wag. Agnieszka Zięba. Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

Weryfikacja hipotez: Hipoteza statystyczna to dowolne przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji. o prawdziwości którego

Zarządzenie Nr 3831/2013 Prezydenta Miasta Płocka z dnia 25 listopada 2013

STATYSTYKA MATEMATYCZNA

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

będą niezależnymi zmiennymi losowymi z rozkładu o gęstości

6. ROŻNICE MIĘDZY OBSERWACJAMI STATYSTYCZNYMI RUCHU KOLEJOWEGO A SAMOCHODOWEGO

Transkrypt:

Weryfkacja hpotez dla welu populacj Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Intelgencj Metod Matematycznych Wydzał Informatyk Poltechnk Szczecńskej

5. Parametryczne testy stotnośc w dwóch populacjach (5.) Wartośc oczekwane (średne) Model (rozkłady normalne, znane warancje) X zmenna losowa o rozkładze normalnym N(m,σ ) w jednej populacj rozkładze normalnym N(m,σ ) w drugej, wartośc oczekwane m = EX, m = EX ne są znane, warancje σ = D X σ = D X są znane Statystyka X X U = σ σ + n n ma rozkład N(0,) przy założenu prawdzwośc hpotezy zerowej H 0 : m = m Obszary krytyczne dla odpowednch hpotez alternatywnych zebrano w tablcy 5.

Weryfkacja hpotezy dotyczącej wartośc średnej model Tablca 5.. Tablca testu dla dwóch średnch model Hpoteza zerowa alternatywna Statystyka testowa U Obszar krytyczny K Uwag H 0 : m = m H : m m H : m < m X σ n X σ + n ( ; u( ) u( ); ) ( ; u( ) 0. u( ) = u( ) 0. u( ) = u( ) 0 0 N(0,) u( ) N(0,) H : m > m u( ); ) 0. N(0,) 0 u( )

Weryfkacja hpotezy o równośc wartośc przecętnej w dwóch populacjach model Model (rozkłady normalne, parametry neznane, warancje równe) X zmenna losowa o rozkładach normalnych N(m,σ ) N(m,σ ) w dwóch populacjach odpowedno, parametry ne są znane, ale warancje są równe σ = σ Statystyka X X t = ns + ns + n + n n n ma rozkład Studenta z n + n stopnam swobody przy założenu, że prawdzwa jest hpoteza zerowa H 0 : m = m Obszary krytyczne dla odpowednch hpotez alternatywnych zebrano w tablcy 5.

Weryfkacja hpotezy o równośc wartośc przecętnej w dwóch populacjach model Tablca 5.. Tablca testu dla dwóch średnch model Hpoteza zerowa alternatywna H : m m H 0 : m = m H : m < m H : m > m Statystyka testowa t X X ns + ns + n + n n n Obszar krytyczny K ( ; t(, n + n ) t(, n + n ); ) ( ; t(, n + n ) t(, n + n ); )

Weryfkacja hpotezy o równośc wartośc przecętnej w dwóch populacjach model Przykład (do modelu ) Cel badana: sprawdzene, która z metod nauczana A, czy B jest lepsza Dwe grupy studentów poddano temu samemu testow Wynk dla grupy nauczanej metodą A: 7 0 9 8 8 7 9 8 6 7 B: 0 0 7 5 9 5 8 5 6 0 7 Zakładamy, że wynk testu jest zmenną losową o rozkładze normalnym warancje są równe (sprawdzmy to późnej) Na pozome stotnośc 0.05 sprawdzć hpotezę, że średn wynk testu jest w obu grupach tak sam, wobec alternatywnej, że w grupe nauczanej metodą A jest lepszy

Weryfkacja hpotezy o równośc wartośc przecętnej w dwóch populacjach model 3 Model 3 (rozkłady normalne, parametry neznane, duże próby n 00 ) X zmenna losowa o rozkładach normalnych N(m,σ ) N(m,σ ) w dwóch populacjach odpowedno, parametry ne są znane Jeśl próby są duże (n 00, n 00), to neznane wartośc parametrów σ, σ możemy oszacować za pomocą estymatorów S, S odpowedno statystyka X X U = S S + n n ma w przyblżenu rozkład normalny N(0,) przy założenu, że prawdzwa jest hpoteza zerowa H 0 : m = m Obszary krytyczne dla hpotez alternatywnych H : m m, H : m < m, H : m > m wyznaczamy tak samo jak w modelu

Weryfkacja hpotezy o równośc wartośc przecętnej w dwóch populacjach model 4 Model 4 (rozkłady normalne, neznane parametry, próby zależne) X zmenna losowa o rozkładze normalnym N(m,σ) w populacj poddanej badanu ze względu na pewną cechę dwukrotne, parametry ne są znane Jeśl z badana otrzymujemy próbkę wartośc pewnej cechy (x, x,, x n ) w populacj przed pewną operacją (np. podanem leku) oraz po tej operacj (x, x,, x n ), to ze względu na zależność próbek hpotezy formułujemy w postac H 0 : m m = 0 wobec hpotez alternatywnych H : m m 0, H : m m < 0 H : m m > 0 oblczamy wartośc nowej próbk (x, x,, x n ) ze wzoru x = x x, =,,n stosujemy test dla jednej średnej Obszary krytyczne dla odpowednch hpotez alternatywnych wyznaczamy tak samo jak w testach dla wartośc średnej w populacj

Weryfkacja hpotezy o równośc warancj w dwóch populacjach (5.) Warancje Model (rozkłady normalne, parametry neznane) X zmenna losowa o rozkładach normalnych N(m,σ ) N(m,σ ) w dwóch populacjach odpowedno, parametry ne są znane Statystyka Sˆ ˆ n F = S S Sˆ = =, gdze,, n ma rozkład Fshera-Snedecora z n n stopnam swobody przy założenu prawdzwośc hpotezy zerowej H 0 : σ = σ Obszary krytyczne dla odpowednch hpotez alternatywnych zebrano w tablcy 5.3

Weryfkacja hpotezy o równośc warancj w dwóch populacjach Tablca 5.3. Tablca testu dla dwóch warancj zerowa Hpoteza alternatywna Statystyka testowa F Obszar krytyczny K Uwag f ( x) H : σ σ max{ Sˆ, Sˆ } mn{ Sˆ, } Sˆ F(, n, n ), ) l m F H 0 : σ = σ H : σ < σ Sˆ Sˆ F(, n, n ), ) 0 F(, n, n ) x f ( x) F l m H : σ > σ Sˆ Sˆ F(, n, n ), ) 0 F(, n, n ) x l m

Weryfkacja hpotezy o równośc warancj w dwóch populacjach Przykład Wynk dla grupy nauczanej metodą A: S A =.9 ; n A = 0 B: S B = 3.88 ; n B = Zakładamy, że wynk testu jest zmenną losową o rozkładze normalnym Na pozome stotnośc 0.05 sprawdzć założene o równośc warancj wynków testu w obu grupach

Weryfkacja hpotezy o równośc wskaźnków struktury w dwóch populacjach (5.3) Wskaźnk struktury Model (rozkłady 0-, parametry neznane, duże próby n 00) X zmenna losowa o rozkładach 0- w dwóch populacjach odpowedno, parametry p p ne są znane Jeśl próby są duże (n 00, n 00), to statystyka M M n n M + M nn U =, gdze p =, n = p( p) n + n n + n n ma w przyblżenu rozkład normalny N(0,) przy założenu prawdzwośc hpotezy zerowej H 0 : p = p Obszary krytyczne dla hpotez alternatywnych H : p p, H : p < p, H : p > p wyznaczamy tak samo jak w modelu

Weryfkacja hpotezy o równośc wskaźnków struktury w dwóch populacjach Przykład Odbył sę egzamn z matematyk na wyższą uczelnę Spośród 705-cu absolwentów technków, 450-cu ne rozwązało pewnego zadana Na 30-tu absolwentów lceum ogólnokształcącego, ne rozwązało tego zadana 57-tu kandydatów Na pozome stotnośc 0.05 zweryfkować hpotezę, że absolwenc technków byl słabej przygotowan z part materału dotyczącej tego zadana

6. Analza warancj z klasyfkacją pojedynczą (6.) Wartośc oczekwane (średne) Założena oznaczena X zmenna losowa o rozkładze normalnym N(m,σ) w k populacjach Z każdej populacj poberamy próbkę o lcznośc n, =,,k x j j-ty wynk w -tej próbce x średna -tej próbk, tj. x średna ogólna, tj. x = x, =,..., k n n j= k n k k n, gdze = j= j n = = x = x = x n n = n j

Analza warancj z klasyfkacją pojedynczą założena oznaczena Suma kwadratów odchyleń obserwacj od średnej ogólnej k n k n ( ) ( ) ( ) j = j= = j= j k n k ( x ) ( ) j x x j x n = = = k n q x x = x x + x x = + q ( ) G x suma kwadratów odchyleń wewnątrz grup j x = j= albo resztkowa suma kwadratów k qp ( x ) suma kwadratów pomędzy populacjam x n = q, q G q P traktujemy jako realzacje zmennych losowych Q, Q G Q P odpowedno Można wykazać, że Q Q ( ) ( ) ( ) G QP E n = E n k = E k = σ statystyka Sˆ P ˆ QP ˆ QG F =, gdze S ˆ P = SG = S k n k G ma rozkład Fshera-Snedecora z k n k stopnam swobody

Weryfkacja hpotezy o równośc wartośc przecętnej w k populacjach Model (rozkłady normalne, neznane parametry, równe warancje) X zmenna losowa o rozkładach normalnych N(m,σ ) w k populacjach odpowedno, parametry ne są znane, warancje są równe σ = σ = = σ k = σ Statystyka Sˆ F = ˆ P S ma rozkład Fshera-Snedecora z k n k stopnam swobody przy założenu, że prawdzwa jest hpoteza zerowa H 0 : m = = m k Obszar krytyczny dla hpotezy alternatywnej H : ne wszystke średne są równe ma dla ustalonego pozomu ufnośc postać K = F(, k, n k), ) G

Weryfkacja hpotezy o równośc wartośc przecętnej w k populacjach Tablca 6.. Schemat analzy warancj z klasyfkacją pojedynczą Źródło zmennośc Suma kwadratów Lczba stopn swobody Warancja Statystyka F Mędzy populacjam k ( ) P = q x x n k sˆ P qp = k Wewnątrz grup k n q ( ) G x x = j= j n k sˆ G qg = n k F = sˆ s ˆ P G Razem k n q ( x x) = j= j n

Weryfkacja hpotezy o równośc wartośc przecętnej w k populacjach Przykład W pewnym dośwadczenu fzycznym prowadzonym 3 metodam bada sę czas śwecena pewnej substancj (w sekundach) Zakładamy równość warancj (sprawdzmy późnej) normalny rozkład czasu śwecena substancj Wynk przedstawono w tabel Metoda Czasy śwecena 0 3 6 5 5 5 4 6 3 8 3 8 Na pozome stotnośc 0.05 zweryfkować hpotezę, że średn czas śwecena substancj ne zależy od wyboru metody

Test Bartletta jednorodnośc warancj w k populacjach (6.) Warancje Model (rozkłady normalne, neznane parametry) X zmenna losowa o rozkładach normalnych N(m,σ ) w k populacjach odpowedno, parametry ne są znane Statystyka gdze.303 χ = k ( n k)log sˆ G ( n ) log ˆ s = c k ( = ) ma rozkład χ z k stopnam swobody przy założenu, że prawdzwa jest hpoteza zerowa H 0 : σ = = σ k Obszar krytyczny dla hpotezy alternatywnej H : ne wszystke warancje są równe ma dla ustalonego pozomu ufnośc postać n k n = ˆ n j j G = j= n k = j= j j sˆ ( x x ), s ( x x ), c = + 3( k ) n n k K = χ (, k ), )

Test Bartletta jednorodnośc warancj w k populacjach Przykład W dośwadczenu fzycznym prowadzonym 3 metodam badany był czas śwecena pewnej substancj (w sekundach) o rozkładze normalnym Na pozome stotnośc 0.05 sprawdzć poprawność założena o jednorodnośc warancj czasu śwecena dla wszystkch 3 metod

Dzękuję za uwagę