Weryfkacja hpotez dla welu populacj Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Intelgencj Metod Matematycznych Wydzał Informatyk Poltechnk Szczecńskej
5. Parametryczne testy stotnośc w dwóch populacjach (5.) Wartośc oczekwane (średne) Model (rozkłady normalne, znane warancje) X zmenna losowa o rozkładze normalnym N(m,σ ) w jednej populacj rozkładze normalnym N(m,σ ) w drugej, wartośc oczekwane m = EX, m = EX ne są znane, warancje σ = D X σ = D X są znane Statystyka X X U = σ σ + n n ma rozkład N(0,) przy założenu prawdzwośc hpotezy zerowej H 0 : m = m Obszary krytyczne dla odpowednch hpotez alternatywnych zebrano w tablcy 5.
Weryfkacja hpotezy dotyczącej wartośc średnej model Tablca 5.. Tablca testu dla dwóch średnch model Hpoteza zerowa alternatywna Statystyka testowa U Obszar krytyczny K Uwag H 0 : m = m H : m m H : m < m X σ n X σ + n ( ; u( ) u( ); ) ( ; u( ) 0. u( ) = u( ) 0. u( ) = u( ) 0 0 N(0,) u( ) N(0,) H : m > m u( ); ) 0. N(0,) 0 u( )
Weryfkacja hpotezy o równośc wartośc przecętnej w dwóch populacjach model Model (rozkłady normalne, parametry neznane, warancje równe) X zmenna losowa o rozkładach normalnych N(m,σ ) N(m,σ ) w dwóch populacjach odpowedno, parametry ne są znane, ale warancje są równe σ = σ Statystyka X X t = ns + ns + n + n n n ma rozkład Studenta z n + n stopnam swobody przy założenu, że prawdzwa jest hpoteza zerowa H 0 : m = m Obszary krytyczne dla odpowednch hpotez alternatywnych zebrano w tablcy 5.
Weryfkacja hpotezy o równośc wartośc przecętnej w dwóch populacjach model Tablca 5.. Tablca testu dla dwóch średnch model Hpoteza zerowa alternatywna H : m m H 0 : m = m H : m < m H : m > m Statystyka testowa t X X ns + ns + n + n n n Obszar krytyczny K ( ; t(, n + n ) t(, n + n ); ) ( ; t(, n + n ) t(, n + n ); )
Weryfkacja hpotezy o równośc wartośc przecętnej w dwóch populacjach model Przykład (do modelu ) Cel badana: sprawdzene, która z metod nauczana A, czy B jest lepsza Dwe grupy studentów poddano temu samemu testow Wynk dla grupy nauczanej metodą A: 7 0 9 8 8 7 9 8 6 7 B: 0 0 7 5 9 5 8 5 6 0 7 Zakładamy, że wynk testu jest zmenną losową o rozkładze normalnym warancje są równe (sprawdzmy to późnej) Na pozome stotnośc 0.05 sprawdzć hpotezę, że średn wynk testu jest w obu grupach tak sam, wobec alternatywnej, że w grupe nauczanej metodą A jest lepszy
Weryfkacja hpotezy o równośc wartośc przecętnej w dwóch populacjach model 3 Model 3 (rozkłady normalne, parametry neznane, duże próby n 00 ) X zmenna losowa o rozkładach normalnych N(m,σ ) N(m,σ ) w dwóch populacjach odpowedno, parametry ne są znane Jeśl próby są duże (n 00, n 00), to neznane wartośc parametrów σ, σ możemy oszacować za pomocą estymatorów S, S odpowedno statystyka X X U = S S + n n ma w przyblżenu rozkład normalny N(0,) przy założenu, że prawdzwa jest hpoteza zerowa H 0 : m = m Obszary krytyczne dla hpotez alternatywnych H : m m, H : m < m, H : m > m wyznaczamy tak samo jak w modelu
Weryfkacja hpotezy o równośc wartośc przecętnej w dwóch populacjach model 4 Model 4 (rozkłady normalne, neznane parametry, próby zależne) X zmenna losowa o rozkładze normalnym N(m,σ) w populacj poddanej badanu ze względu na pewną cechę dwukrotne, parametry ne są znane Jeśl z badana otrzymujemy próbkę wartośc pewnej cechy (x, x,, x n ) w populacj przed pewną operacją (np. podanem leku) oraz po tej operacj (x, x,, x n ), to ze względu na zależność próbek hpotezy formułujemy w postac H 0 : m m = 0 wobec hpotez alternatywnych H : m m 0, H : m m < 0 H : m m > 0 oblczamy wartośc nowej próbk (x, x,, x n ) ze wzoru x = x x, =,,n stosujemy test dla jednej średnej Obszary krytyczne dla odpowednch hpotez alternatywnych wyznaczamy tak samo jak w testach dla wartośc średnej w populacj
Weryfkacja hpotezy o równośc warancj w dwóch populacjach (5.) Warancje Model (rozkłady normalne, parametry neznane) X zmenna losowa o rozkładach normalnych N(m,σ ) N(m,σ ) w dwóch populacjach odpowedno, parametry ne są znane Statystyka Sˆ ˆ n F = S S Sˆ = =, gdze,, n ma rozkład Fshera-Snedecora z n n stopnam swobody przy założenu prawdzwośc hpotezy zerowej H 0 : σ = σ Obszary krytyczne dla odpowednch hpotez alternatywnych zebrano w tablcy 5.3
Weryfkacja hpotezy o równośc warancj w dwóch populacjach Tablca 5.3. Tablca testu dla dwóch warancj zerowa Hpoteza alternatywna Statystyka testowa F Obszar krytyczny K Uwag f ( x) H : σ σ max{ Sˆ, Sˆ } mn{ Sˆ, } Sˆ F(, n, n ), ) l m F H 0 : σ = σ H : σ < σ Sˆ Sˆ F(, n, n ), ) 0 F(, n, n ) x f ( x) F l m H : σ > σ Sˆ Sˆ F(, n, n ), ) 0 F(, n, n ) x l m
Weryfkacja hpotezy o równośc warancj w dwóch populacjach Przykład Wynk dla grupy nauczanej metodą A: S A =.9 ; n A = 0 B: S B = 3.88 ; n B = Zakładamy, że wynk testu jest zmenną losową o rozkładze normalnym Na pozome stotnośc 0.05 sprawdzć założene o równośc warancj wynków testu w obu grupach
Weryfkacja hpotezy o równośc wskaźnków struktury w dwóch populacjach (5.3) Wskaźnk struktury Model (rozkłady 0-, parametry neznane, duże próby n 00) X zmenna losowa o rozkładach 0- w dwóch populacjach odpowedno, parametry p p ne są znane Jeśl próby są duże (n 00, n 00), to statystyka M M n n M + M nn U =, gdze p =, n = p( p) n + n n + n n ma w przyblżenu rozkład normalny N(0,) przy założenu prawdzwośc hpotezy zerowej H 0 : p = p Obszary krytyczne dla hpotez alternatywnych H : p p, H : p < p, H : p > p wyznaczamy tak samo jak w modelu
Weryfkacja hpotezy o równośc wskaźnków struktury w dwóch populacjach Przykład Odbył sę egzamn z matematyk na wyższą uczelnę Spośród 705-cu absolwentów technków, 450-cu ne rozwązało pewnego zadana Na 30-tu absolwentów lceum ogólnokształcącego, ne rozwązało tego zadana 57-tu kandydatów Na pozome stotnośc 0.05 zweryfkować hpotezę, że absolwenc technków byl słabej przygotowan z part materału dotyczącej tego zadana
6. Analza warancj z klasyfkacją pojedynczą (6.) Wartośc oczekwane (średne) Założena oznaczena X zmenna losowa o rozkładze normalnym N(m,σ) w k populacjach Z każdej populacj poberamy próbkę o lcznośc n, =,,k x j j-ty wynk w -tej próbce x średna -tej próbk, tj. x średna ogólna, tj. x = x, =,..., k n n j= k n k k n, gdze = j= j n = = x = x = x n n = n j
Analza warancj z klasyfkacją pojedynczą założena oznaczena Suma kwadratów odchyleń obserwacj od średnej ogólnej k n k n ( ) ( ) ( ) j = j= = j= j k n k ( x ) ( ) j x x j x n = = = k n q x x = x x + x x = + q ( ) G x suma kwadratów odchyleń wewnątrz grup j x = j= albo resztkowa suma kwadratów k qp ( x ) suma kwadratów pomędzy populacjam x n = q, q G q P traktujemy jako realzacje zmennych losowych Q, Q G Q P odpowedno Można wykazać, że Q Q ( ) ( ) ( ) G QP E n = E n k = E k = σ statystyka Sˆ P ˆ QP ˆ QG F =, gdze S ˆ P = SG = S k n k G ma rozkład Fshera-Snedecora z k n k stopnam swobody
Weryfkacja hpotezy o równośc wartośc przecętnej w k populacjach Model (rozkłady normalne, neznane parametry, równe warancje) X zmenna losowa o rozkładach normalnych N(m,σ ) w k populacjach odpowedno, parametry ne są znane, warancje są równe σ = σ = = σ k = σ Statystyka Sˆ F = ˆ P S ma rozkład Fshera-Snedecora z k n k stopnam swobody przy założenu, że prawdzwa jest hpoteza zerowa H 0 : m = = m k Obszar krytyczny dla hpotezy alternatywnej H : ne wszystke średne są równe ma dla ustalonego pozomu ufnośc postać K = F(, k, n k), ) G
Weryfkacja hpotezy o równośc wartośc przecętnej w k populacjach Tablca 6.. Schemat analzy warancj z klasyfkacją pojedynczą Źródło zmennośc Suma kwadratów Lczba stopn swobody Warancja Statystyka F Mędzy populacjam k ( ) P = q x x n k sˆ P qp = k Wewnątrz grup k n q ( ) G x x = j= j n k sˆ G qg = n k F = sˆ s ˆ P G Razem k n q ( x x) = j= j n
Weryfkacja hpotezy o równośc wartośc przecętnej w k populacjach Przykład W pewnym dośwadczenu fzycznym prowadzonym 3 metodam bada sę czas śwecena pewnej substancj (w sekundach) Zakładamy równość warancj (sprawdzmy późnej) normalny rozkład czasu śwecena substancj Wynk przedstawono w tabel Metoda Czasy śwecena 0 3 6 5 5 5 4 6 3 8 3 8 Na pozome stotnośc 0.05 zweryfkować hpotezę, że średn czas śwecena substancj ne zależy od wyboru metody
Test Bartletta jednorodnośc warancj w k populacjach (6.) Warancje Model (rozkłady normalne, neznane parametry) X zmenna losowa o rozkładach normalnych N(m,σ ) w k populacjach odpowedno, parametry ne są znane Statystyka gdze.303 χ = k ( n k)log sˆ G ( n ) log ˆ s = c k ( = ) ma rozkład χ z k stopnam swobody przy założenu, że prawdzwa jest hpoteza zerowa H 0 : σ = = σ k Obszar krytyczny dla hpotezy alternatywnej H : ne wszystke warancje są równe ma dla ustalonego pozomu ufnośc postać n k n = ˆ n j j G = j= n k = j= j j sˆ ( x x ), s ( x x ), c = + 3( k ) n n k K = χ (, k ), )
Test Bartletta jednorodnośc warancj w k populacjach Przykład W dośwadczenu fzycznym prowadzonym 3 metodam badany był czas śwecena pewnej substancj (w sekundach) o rozkładze normalnym Na pozome stotnośc 0.05 sprawdzć poprawność założena o jednorodnośc warancj czasu śwecena dla wszystkch 3 metod
Dzękuję za uwagę