Słowniczek Hipoteza statystyczna Hipoteza parametryczna Hipoteza nieparametryczna Hipoteza zerowa Hipoteza alternatywna Błąd pierwszego rodzaju

Podobne dokumenty
1. Wnioskowanie statystyczne. Ponadto mianem statystyki określa się także funkcje zmiennych losowych o

Testowanie hipotez. H 1 : µ 15 lub H 1 : µ < 15 lub H 1 : µ > 15

Parametryczne Testy Istotności

Estymacja parametrów populacji

KURS STATYSTYKA. Lekcja 3 Parametryczne testy istotności ZADANIE DOMOWE. Strona 1

Statystyka. Katarzyna Chudy Laskowska

X i. X = 1 n. i=1. wartość tej statystyki nazywana jest wartością średnią empiryczną i oznaczamy ją symbolem x, przy czym x = 1. (X i X) 2.

L.Kowalski zadania ze statystyki matematycznej-zestaw 3 ZADANIA - ZESTAW 3

Porównanie dwu populacji

Statystyka matematyczna dla leśników

Statystyka opisowa. (n m n m 1 ) h (n m n m 1 ) + (n m n m+1 ) 2 +1), gdy n jest parzyste

ANALIZA DANYCH DYSKRETNYCH

Moda (Mo, D) wartość cechy występującej najczęściej (najliczniej).

Statystyka i Opracowanie Danych. W7. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

Metoda łączona. Wykład 7 Dwie niezależne próby. Standardowy błąd dla różnicy dwóch średnich. Metoda zwykła (niełączona) n2 2

TESTY LOSOWOŚCI. Badanie losowości próby - test serii.

Estymacja przedziałowa - przedziały ufności

STATYSTYKA I ANALIZA DANYCH

SIGMA KWADRAT LUBELSKI KONKURS STATYSTYCZNO- DEMOGRAFICZNY

Estymacja przedziałowa

Estymacja: Punktowa (ocena, błędy szacunku) Przedziałowa (przedział ufności)

1 Testy statystyczne. 2 Rodzaje testów

test dla średniej rozkładu normalnego moc testu test dla wariancji rozkładu normalnego test dla rozkładu dwumianowego, Poissona

Zadanie 2 Niech,,, będą niezależnymi zmiennymi losowymi o identycznym rozkładzie,.

(X i X) 2. n 1. X m S

Lista 6. Estymacja punktowa

PODSTAWY BIOSTATYSTYKI ĆWICZENIA

16 Przedziały ufności

Elementy statystyki opisowej Izolda Gorgol wyciąg z prezentacji (wykład I)

PRZEDZIAŁY UFNOŚCI. Niech θ - nieznany parametr rozkładu cechy X. Niech α będzie liczbą z przedziału (0, 1).

Wykład 11 ( ). Przedziały ufności dla średniej

Statystyka w rozumieniu tego wykładu to zbiór metod służących pozyskiwaniu, prezentacji, analizie danych.

Wykład 5 Przedziały ufności. Przedział ufności, gdy znane jest σ. Opis słowny / 2

Korelacja i regresja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 12

Ćwiczenie 2 ESTYMACJA STATYSTYCZNA

Estymacja przedziałowa:

STATYSTYKA OPISOWA I PROJEKTOWANIE EKSPERYMENTU dr inż Krzysztof Bryś

ZAGADNIENIE ESTYMACJI. ESTYMACJA PUNKTOWA I PRZEDZIAŁOWA

Podstawowe oznaczenia i wzory stosowane na wykładzie i laboratorium Część I: estymacja

Miary położenia (tendencji centralnej) to tzw. miary przeciętne charakteryzujące średni lub typowy poziom wartości cechy.

STATYSTYKA MATEMATYCZNA

Estymacja przedziałowa - przedziały ufności

będą niezależnymi zmiennymi losowymi z rozkładu jednostajnego na przedziale ( 0,

Rachunek prawdopodobieństwa i statystyka W12: Statystyczna analiza danych jakościowych. Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.

Estymacja. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 7

Metrologia: miary dokładności. dr inż. Paweł Zalewski Akademia Morska w Szczecinie

2.1. Studium przypadku 1

WYKŁAD 1. Zdarzenia losowe i prawdopodobieństwo Zmienna losowa i jej rozkłady

STATYSTYKA OPISOWA WYKŁAD 1 i 2

n n X n = σ σ = n n n Ponieważ zmienna losowa standaryzowana ma rozkład normalny N(0, 1), więc

0.1 ROZKŁADY WYBRANYCH STATYSTYK

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

3. Tworzenie próby, błąd przypadkowy (próbkowania) 5. Błąd standardowy średniej arytmetycznej

STATYSTYKA MATEMATYCZNA

2 n < 2n + 2 n. 2 n = 2. 2 n 2 +3n+2 > 2 0 = 1 = 2. n+2 n 1 n+1 = 2. n+1

Elementy modelowania matematycznego

POLITECHNIKA OPOLSKA

Ćwiczenie nr 14. Porównanie doświadczalnego rozkładu liczby zliczeń w zadanym przedziale czasu z rozkładem Poissona

Wykład nr 2. Statystyka opisowa część 2. Plan wykładu

µ = Test jest następujący: jeŝeli X > 0.01 to odrzucamy H. 0

ZSTA LMO Zadania na ćwiczenia

1 Dwuwymiarowa zmienna losowa

Wokół testu Studenta 1. Wprowadzenie Rozkłady prawdopodobieństwa występujące w testowaniu hipotez dotyczących rozkładów normalnych

8. WERYFIKACJA HIPOTEZ STATYSTYCZNYCH DWA RODZAJE TESTÓW STATYSTYCZNYCH: PARAMETRYCZNE I ZGODNOŚCI

Plan wykładu. Analiza danych Wykład 1: Statystyka opisowa. Literatura. Podstawowe pojęcia

PODSTAWY OPRACOWANIA WYNIKÓW POMIARÓW Z ELEMENTAMI ANALIZY NIEPEWNOŚCI POMIAROWYCH

STATYSTKA I ANALIZA DANYCH LAB II

Statystyczny opis danych - parametry

Prawdopodobieństwo i statystyka r.

Modele tendencji rozwojowej STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 18 listopada 2017

8 Weryfikacja hipotez statystycznych

ZADANIA NA ĆWICZENIA 3 I 4

Rozkłady statystyk z próby Twierdzenia graniczne

Statystyka powtórzenie (I semestr) Rafał M. Frąk

Jak obliczać podstawowe wskaźniki statystyczne?

Trzeba pokazać, że dla każdego c 0 c Mc 0. ) = oraz det( ) det( ) det( ) jest macierzą idempotentną? Proszę odpowiedzieć w

Podstawowe pojęcia. Próba losowa. Badanie próby losowej

Zeszyty naukowe nr 9

ZMIENNA LOSOWA I JEJ PARAMETRY -powtórzenie

ZDARZENIE ELEMENTARNE to możliwy wynik doświadczenia losowego. Wszystkie takie możliwe wyniki tworzą zbiór zdarzeń elementarnych.

Statystyka opisowa. () Statystyka opisowa 24 maja / 8

Ćwiczenia rachunkowe TEST ZGODNOŚCI χ 2 PEARSONA ROZKŁAD GAUSSA

MODELE MATEMATYCZNE W UBEZPIECZENIACH. 1. Renty

Liczebnośd (w tys.) n

Modele probabilistyczne zjawisk losowych

θx θ 1, dla 0 < x < 1, 0, poza tym,

Statystyka matematyczna. Wykład II. Estymacja punktowa

ma rozkład złożony Poissona z oczekiwaną liczbą szkód równą λ i rozkładem wartości pojedynczej szkody takim, że Pr( Y

1 Zmienne losowe. Własności dystrybuanty F (x) = P (X < x): F1. 0 F (x) 1 dla każdego x R, F2. lim F (x) = 0 oraz lim F (x) = 1,

ZBIEŻNOŚĆ CIĄGU ZMIENNYCH LOSOWYCH. TWIERDZENIA GRANICZNE

Statystyka opisowa - dodatek

WERSJA TESTU A. Komisja Egzaminacyjna dla Aktuariuszy. LX Egzamin dla Aktuariuszy z 28 maja 2012 r. Część I. Matematyka finansowa

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Rozkład normalny (Gaussa)

Metoda łączona. Wykład 7 Dwie niezależne próby. Standardowy błąd dla różnicy dwóch średnich. Metoda zwykła (niełączona)

Opracowanie danych pomiarowych. dla studentów realizujących program Pracowni Fizycznej

Statystyka matematyczna i ekonometria

Rachunek prawdopodobieństwa i statystyka Wnioskowanie statystyczne. Estymacja i estymatory. Dr Anna ADRIAN Paw B5, pok407

Podstawowe testy statystyczne i analiza zależności zjawisk

Transkrypt:

Słowiczek Hipoteza statystycza jakiekolwiek przypuszczeie dotyczące rozkładu populacji geeralej Hipoteza parametrycza hipoteza statystycza precyzująca wartość parametru w rozkładzie populacji geeralej zaego typu Hipoteza ieparametrycza hipoteza statystycza precyzująca typ rozkładu populacji geeralej Hipoteza zerowa podstawowa hipoteza statystycza sprawdzaa daym testem. Ozacza się ją zwykle symbolem H 0 Hipoteza alteratywa hipoteza statystycza kokurecyja w stosuku do hipotezy zerowej w tym sesie, że jeżeli odrzuca się hipotezę zerową, to przyjmuje się hipotezę alteratywą. Ozacza się ją H Błąd pierwszego rodzaju możliwy do popełieia przy weryfikacji hipotezy statystyczej błąd polegający a odrzuceiu testowaej hipotezy prawdziwej Błąd drugiego rodzaju możliwy do popełieia przy sprawdzaiu hipotezy statystyczej błąd polegający a przyjęciu testowaej hipotezy fałszywej Poziom istotości prawdopodobieństwo popełieia błędu pierwszego rodzaju w postępowaiu testującym hipotezę. Poziom istotości ozacza się zwykle symbolem i obiera się go z góry, zwykle jako małe prawdopodobieństwo. Najczęściej przyjmuje się rówe 0,, 0,05, 0,0 lub 0,00. Odrzuceie sprawdzaej hipotezy a poziomie istotości p. = 0,05 ozacza, że ryzyko popełieia błędu pierwszego rodzaju przy tej decyzji wyosi 5% (iaczej mówiąc: co ajwyżej 5 razy a 00 takich decyzji popełiać będziemy błąd) Test statystyczy reguła postępowaia, która a podstawie wyików próby ma doprowadzić do decyzji przyjęcia lub odrzuceia postawioej

hipotezy statystyczej. Za pomocą testu weryfikujemy zatem hipotezę statystyczą. Moc testu prawdopodobieństwo podjęcia decyzji prawidłowej przy weryfikacji hipotezy statystyczej daym testem, a polegającej a odrzuceiu testowaej hipotezy fałszywej Test istotości ajczęściej używay w praktyce statystyczej typ testu, pozwalający a odrzuceie hipotezy z małym ryzykiem popełieia błędu (mierzoym poziomem istotości ). Ze względu a to, że w teście istotości uwzględia się jedyie błąd pierwszego rodzaju, a ie rozpatruje się szasy popełieia błędu drugiego rodzaju, to w wyiku tego testu możliwa jest decyzja odrzuceia hipotezy zerowej lub ie ma podstaw do jej odrzuceia (co ie ozacza jej przyjęcia!) Parametryczy test istotości test istotości weryfikujący hipotezę zerową precyzującą wartość parametru w ustaloym typie rozkładu populacji geeralej Nieparametryczy test istotości test istotości dla hipotezy zerowej precyzującej ogóly typ, postać rozkładu populacji geeralej Obszar krytyczy testu wyjaśioe poiżej Obszar krytyczy testu dwustroy obszar krytyczy złożoy z dwu rozłączych podzbiorów, wyzaczoy ajczęściej symetryczie, w rozkładzie odpowiediej statystyki. Testu z dwustroym obszarem krytyczym używa się zwykle wtedy, gdy hipoteza alteratywa (parametrycza) jest w postaci ierówości typu Obszar krytyczy testu jedostroy w zależości od hipotezy alteratywej może być lewostroy lub prawostroy. Jest to obszar krytyczy złożoy z jedego podzbioru, wybraego z jedej stroy w rozkładzie odpowiediej statystyki. Testu z jedostroym obszarem

krytyczym używa się zwykle wtedy, gdy hipoteza alteratywa występuje w postaci ierówości typu < lub > Testowaie hipotez, etapy () w zależości od postaci hipotezy zerowej buduje się pewa statystykę Z z wyików -elemetowej próby () wyzacza się rozkład tej statystyki przy założeiu prawdziwości hipotezy H 0 (3) w rozkładzie tym wybiera się taki obszar Q wartości statystyki Z, by spełioa była rówość P Z Q gdzie jest ustaloym z góry, dowolie małym prawdopodobieństwem (4) obszar Q azywa się obszarem krytyczym testu, gdyż ilekroć wartość statystyki Z z próby zajdzie się w im, to podejmuje się decyzję o odrzuceiu hipotezy H 0 a korzyść jej alteratywy H (5) atomiast, gdy otrzymaa z kokretej próby wartość statystyki Z ie ależy do obszaru krytyczego, to ie ma podstaw do odrzuceia hipotezy H 0 (ależy wyraźie podkreślić, że ie jest to rówozacze z jej przyjęciem). Uzasadieie powyższych decyzji: obszar krytyczy Q jest tak wyzaczoy, że przy założeiu prawdziwości hipotezy H 0 prawdopodobieństwo otrzymaia z próby -elemetowej wartości statystyki Z ależącej do tego obszaru jest zae i jest bardzo małą liczbą. Takie zdarzeie losowe ie powio się więc zrealizować w jedym doświadczeiu. Jeżeli jedak aprawdę zrealizowało się, to musiało mieć większe prawdopodobieństwo iż to wyika z założeia prawdziwości hipotezy H 0, więc skłoi jesteśmy uzać hipotezę za 3

fałszywą i odrzucamy ją. Możemy pomylić się i odrzucić hipotezę, która w grucie rzeczy była prawdziwa (błąd pierwszego rodzaju), jedak prawdopodobieństwo takiej pomyłki jest bardzo małe, rówe obraej dowolie liczbie. Jeżeli atomiast wartość statystyki Z z próby -elemetowej zalazła się poza obszarem krytyczym, to prawdopodobieństwo tego zdarzeia, przy prawdziwości hipotezy H 0, jest rówe, co jest bliskie. Zaszło zatem zdarzeie, które powio przy prawdziwości hipotezy zajść, bo miało duże prawdopodobieństwo, więc ie ma podstaw do odrzuceia hipotezy H 0 Jako poziom istotości wybiera się ajczęściej w testach istotości liczby 0,, 0,05, 0,0, 0,00. Im miejszy przyjmie się poziom istotości w teście (czyli im miejsze dopuszcza się ryzyko popełieia błędu pierwszego rodzaju), tym trudiej jest hipotezę H 0 odrzucić (zwykle przyjmuje się = 0,05 a miejsze wartości stosuje się w wyjątkowo ważych badaiach, p. techiczych czy medyczych). Odrzuceie sprawdzaej hipotezy a poziomie istotości p. = 0,0 ozacza, że odrzucając tę hipotezę albo się ie mylimy (czyli hipoteza jest aprawdę fałszywa) albo też popełiamy błąd pierwszego rodzaju (czyli w grucie rzeczy, o czym ie wiemy, hipoteza jest prawdziwa) ale w tym ostatim przypadku częstość popełieia takiego błędu jest tylko a 00 przypadków stosowaia tego testu istotości. Podstawą budowy obszaru krytyczego dla daego testu istotości jest rozkład odpowiediej statystyki z próby, wyzaczay przy założeiu prawdziwości sprawdzaej hipotezy o parametrze populacji. Test dla wartości średiej populacji statystyką jest tutaj średia z próby x. 4

MODEL Populacja geerala ma rozkład ormaly N( m,), przy czym odchyleie stadardowe jest zae. Należy a podstawie wyików próby losowej - elemetowej sprawdzić hipotezę H 0 : m = m 0 (m 0 jest kokretą wartością hipotetyczą średiej) wobec hipotezy alteratywej H : m m 0. Test istotości dla hipotezy H 0 jest astępujący: Na podstawie wyików próby oblicz wartość statystyki x a astępie wartość zmieej ormalej stadaryzowaej U według wzoru x m0 u Z tablicy rozkładu N(0,) wyzacz taką wartość krytyczą u /, by dla założoego z góry małego prawdopodobieństwa (poziomu istotości) zachodziła rówość P U u / (u) / / Q -u / Q u u / Zbiór wartości U określoy ierówością u u / jest obszarem krytyczym tego testu, tz. gdy z próby otrzymamy taką wartość u, że u / u, to hipotezę H 0 odrzucamy. Gdy u u /, to ie ma wtedy podstaw do odrzuceia hipotezy H 0 5

UWAGA Powyższy test z tzw. dwustroym obszarem krytyczym stosuj jedyie dla takiego przypadku hipotezy alteratywej, w której występuje ierówość m m 0. Gdy hipoteza alteratywa ma postać H : m < m 0 to stosuj test istotości z tzw. lewostroym obszarem krytyczym określoym ierówością U u zachodziła rówość P U u. Wtedy wartość u wyzacz tak, by Dla hipotezy alteratywej postaci: H : m > m 0 Stosuj test istotości z prawostroym obszarem krytyczym określoym ierówością U u zachodziła rówość P U u. Wtedy wartość u wyzacz z rozkładu N(0,) tak, by. Hipotezę H 0 odrzucasz dla takiego przypadku hipotezy H tylko wtedy, gdy wyzaczoa z próby wartość u spełia ierówość u u. 6

MODEL Populacja geerala ma rozkład ormaly N( m,), przy czym odchyleie stadardowe jest iezae. Należy a podstawie wyików próby losowej -elemetowej sprawdzić hipotezę H 0 : m = m 0 (m 0 jest kokretą wartością hipotetyczą średiej) wobec hipotezy alteratywej H : m m 0. Test istotości dla hipotezy H 0 jest astępujący: Na podstawie wyików próby oblicz wartość x oraz s lub s ~ a astępie wartość statystyki t według jedego ze wzorów gdzie x m x m t 0 s ~ s 0 s i ( x i x) ~ s i ( x i x) Statystyka t ma przy założeiu prawdziwości hipotezy H 0 rozkład t Studeta o - stopiach swobody. Z tablicy tego rozkładu, dla ustaloego poziomu istotości i dla - stopi swobody, odczytaj taką wartość t, że t t P. Nierówość t t określa obszar krytyczy (dwustroy) w tym teście. Wystarczy więc porówać obliczoą z próby wartość zmieej t z wartością krytyczą t, odczytaą z tablic rozkładu Studeta. Jeżeli zajdzie ierówość 7 t t, to hipotezę H 0 ależy odrzucić a korzyść hipotezy H, atomiast gdy zajdzie ierówość przeciwa t t, to ie ma podstaw do odrzuceia hipotezy H 0. UWAGA Gdy hipoteza alteratywa ma postać H : m < m 0 to stosuj test istotości z lewostroym obszarem krytyczym, tj. wyzaczoym tak, by P t t t t. Natomiast gdy hipoteza alteratywa ma postać H : m > m 0 to stosuj w tym teście obszar krytyczy

pawostroy określoy ierówością t t sposób, by zachodziła ierówość P t t., przy czym t wyzacz w taki MODEL 3 Populacja geerala ma rozkład ormaly N( m,) lub dowoly iy rozkład o średiej wartości m i o skończoej, ale iezaej wartości wariacji. Na podstawie wyików dużej próby losowej ( co ajmiej rzędu kilku dziesiątków) z tej populacji ależy zweryfikować hipotezę H 0 : m = m 0,wobec hipotezy alteratywej H : m m 0. Test istotości dla tej hipotezy jest aalogiczy jak w MODEL, tz. jest testem U, z tą różicą, że zamiast wartości przyjmuje się wyzaczoą z dużej próby wartość s. ZADANIE Pewie automat w fabryce czekolady wytwarza tabliczki czekolady o omialej wadze 50 g. Wiadomo, że rozkład wagi produkowaych tabliczek jest ormaly N(m,5). Kotrola techicza pobrała próbę losową 6 tabliczek czekolady i otrzymała ich średią wagę 44 g. Czy moża twierdzić, że automat rozregulował się i produkuje tabliczki czekolady o miejszej iż przewiduje orma wadze? Na poziomie istotości = 0,05 zweryfikuj odpowiedią hipotezę statystyczą. ZADANIE. W szpitalu wylosowao iezależie spośród pacjetów chorych a pewą chorobę próbę 6 chorych i otrzymao dla ich średią ciśieia tęticzego krwi 35 x oraz s = 45. Należy a poziomie istotości = 0,05 zweryfikować hipotezę, że pacjeci pochodzą z populacji o średim ciśieiu tęticzym 0. 8

ZADANIE 3 Miesięcze dodatkowe dochody studetów Politechiki Opolskiej w zbadaej grupie 0 wylosowaych studetów były astępujące [w zł] Dochody 50 50 50-350 350 450 450 550 550 650 650 750 750 850 850 950 950-050 Liczba studetów 7 0 30 9 5 0 6 Na poziomie istotości = 0,0 zweryfikuj hipotezę, że średi dochód studetów tej uczeli wyosi 500 zł. Test dla dwóch średich W praktyczych zastosowaiach statystyki zachodzi bardzo często potrzeba sprawdzeia hipotez dotyczących rówości wartości średich w dwóch populacjach ormalych, p. przy porówaiu populacji zdrowych z populacją chorych. W zależości od posiadaych iformacji o porówywaych populacjach wyróżiamy trzy modele. W każdym z ich weryfikujemy hipotezę H 0 : m = m czyli m m = 0, gdzie m i m ozaczają wartości średie odpowiedio pierwszej i drugiej populacji geeralej. Postać hipotezy alteratywej H decyduje o wyborze jedostroego lub dwustroego obszaru krytyczego. MODEL Badamy dwie populacje geerale mające rozkłady ormale N(m, ) i N(m, ). Odchyleia stadardowe i tych populacji są zae. W oparciu o wyiki dwu iezależych prób, odpowiedio o liczebości i, 9

wylosowaych z tych populacji ależy sprawdzić hipotezę H 0 : m = m wobec hipotezy alteratywej H : m m Test istotości dla hipotezy H 0 buduje się w astępujący sposób: Z wyików prób wylosowaych z tych populacji oblicz wartości średie x i x a astępie wartość statystyki U według wzoru Statystyka ta przy założeiu prawdziwości hipotezy H 0 ma rozkład N(0,). Z tablicy rozkładu ormalego N(0,) wyzacz dla przyjętego z góry poziomu istotości taką wartość krytyczą u / by spełioa była rówość P U u /. Nierówość w awiasie powyższego wzoru określa dwustroy obszar krytyczy testu, czyli gdy przy porówaiu wartości u wyzaczoej ze wzoru z wartością u / odczytaą z tablicy zajdzie ierówość u u /, to sprawdzaą hipotezę H 0 odrzucasz a korzyść jej alteratywy H. Gdy zaś otrzymasz ierówość przeciwą, tj. u / u, to ie ma podstaw do odrzuceia hipotezy H 0. UWAGA Dla hipotezy alteratywej H : m < m stosujemy test istotości z jedostroym obszarem krytyczym U u. Wartość krytyczą u odczytuje się wtedy z tablicy rozkładu N(0,) tak, by P U u. Natomiast dla hipotezy alteratywej H : m > m stosujesz test z prawostroym obszarem krytyczym U u. Wartość krytyczą u odczytuje się wtedy z tablicy rozkładu N(0,) tak, by zachodziło P U u. u x x MODEL Badamy dwie populacje geerale mające rozkłady ormale N(m, ) i N(m, ), przy czym odchyleia stadardowe i tych populacji są 0

iezae ale jedakowe, tz. zachodzi =. Na podstawie wyików dwu małych prób odpowiedio o liczebościach i, wylosowaych iezależie z tych populacji, ależy zweryfikować hipotezę H 0 : m = m wobec hipotezy alteratywej H : m m Test istotości dla hipotezy H 0 buduje się w astępujący sposób: Z wyików obu prób oblicz wartości średie x i x oraz wariacje s, a astępie wartość statystyki t według wzoru s i Statystyka ta przy założeiu prawdziwości hipotezy H 0 ma rozkład t Studeta o + - stopiach swobody. Z tablicy rozkładu t Studeta odczytaj dla + - stopi swobody oraz dla przyjętego z góry poziomu istotości taką wartość krytyczą t by spełioa była rówość t t P. Nierówość t t określa dwustroy obszar krytyczy testu, tz. gdy porówując obliczoą wartość t z wartością krytyczą t otrzymujesz ierówość t t, to sprawdzaą hipotezę H 0 odrzucasz a korzyść jej alteratywy H. Gdy zaś otrzymamy ierówość przeciwą, tj. t t, to ie ma podstaw do odrzuceia hipotezy H 0. UWAGA Gdy hipoteza alteratywa ma postać H : m < m, wtedy stosujemy w tym teście lewostroy obszar krytyczy wyzaczoy ierówością t t, gdzie wartość krytycza t jest wtedy odczytaa z tablicy rozkładu t Studeta w taki sposób, by spełioa była rówość t t P. Natomiast dla hipotezy alteratywej postaci H : m > m stosujemy w tym teście prawostroy obszar krytyczy wyzaczoy ierówością t t wartość krytycza t odczytaa jest z tablicy tak, by zachodziła rówość t t P. t x x s s, gdzie

Należy admieić, że MODEL jest ze względu a małe próby ajczęściej stosoway w statystyczej aalizie wyików eksperymetów aukowych z różych dziedzi wiedzy. Nie wymaga się przy tym jedakowo liczych prób. UWAGA Czasem w praktyce zdarza się, że wyiki obu prób możemy traktować jako wyiki pomiarów a tym samym elemecie populacji. Jest tak wtedy gdy staowią oe pary przyporządkowaych sobie liczb. Typową sytuacją jest tu model: wyik x i przed jakąś operacją a wyik y i po iej dla tego samego i. Należy wtedy aalizować wyiki obu prób jako wyiki jedej próby biorąc różice y i x i, a zamiast testu zamieszczoego w MODELU użyć testu dla pojedyczej średiej (też MODEL ), opisaego wcześiej. Stosujemy wtedy astępujący wzór a wartość statystyki t Studeta z t s z Gdzie z i = y i x i, a jest liczbą par. Zamiast hipotezy H 0 : m = m, weryfikujemy wtedy hipotezę H 0 : Z 0, gdzie Z ozacza średią w populacji różic. MODEL 3 Badamy dwie populacje mające rozkłady ormale lub ie, byle o skończoych wariacjach i, które są iezae. Na podstawie wyików dwu dużych prób ( oraz są rzędu co ajmiej kilku dziesiątków) wylosowaych z obu populacji ależy sprawdzić hipotezę H 0 : m = m wobec hipotezy alteratywej H : m m Test istotości dla tej hipotezy jest aalogiczy jak w MODEL, tz. jest oparty a rozkładzie ormalym N(0,), z tą jedyie różicą, że przy obliczaiu wartości u zamiast iezaych wariacji i przyjmuje się wartości s i s wyzaczoe z dużych prób.

ZADANIE 4 Chcemy stwierdzić, czy zatrudioe a tych samych staowiskach kobiety otrzymują przeciętie iższą płacę iż mężczyźi. Z populacji kobiet zatrudioych a określoych staowiskach losujemy iezależie próbę = 00 kobiet i otrzymujemy z iej średią płacę x = 80 zł oraz wariację płac s = 6400. Z populacji mężczyz zatrudioych a tych samych staowiskach losujemy iezależie = 80 mężczyz i otrzymujemy dla ich średią płacę x = 80 oraz wariację s = 0000. Na poziomie istotości = 0,0 sprawdzamy hipotezę, że średie płace kobiet są iższe. ZADANIE 5 Wysuięto hipotezę, że czas potrzeby a wykoaie pewego eksperymetu moża zmiejszyć przez zastosowaie owego typu pipet. Przy iezmieioych iych warukach zmierzoo czasy wykoaia tego eksperymetu dla owego i starego typu pipet i otrzymao dla owej pipety czasy (w miutach): 5,, 0, 8, 4, 5, 3 a dla starej pipety: 7,,, 8, 9, 3, 4, 6. Zweryfikuj wysuiętą hipotezę a poziomie istotości = 0,05. ZADANIE 6 Zbadao 40 liści jedego gatuku A oraz 35 liści iego gatuku B dębu i otrzymao dae o liczbie erwów boczych a liściach, zestawioe w poiższej tabeli. Liczba erwów boczych a liściach gatuku A Liczba liści gatuku B 3 4 5 6 - - 6 3 6 0 9 3

7 8 9 0 4 0 6 Przyjmując poziom istotości = 0,0 sprawdzić hipotezę, że liście dębu gatuku A maja przeciętie więcej erwów boczych iż liście dębu gatuku B. Test dla procetu (wskaźika struktury) W badaiu statystyczym prowadzoym ze względu a cechę iemierzalą (jakościową) zachodzi czasem koieczość sprawdzeia hipotezy o wartości wskaźika struktury populacji, tj. frakcji elemetów wyróżioych w populacji (lub po pomożeiu przez 00 procetu). Wskaźik struktury p populacji geeralej może przyjąć wartość z przedziału (0,). Omówimy test dla wskąźika p dla przypadku dużej próby, tz. gdy możemy budować obszar krytyczy w oparciu o rozkład ormaly. MODEL Frakcja elemetów wyróżioych w populacji jest rówa p. Z populacji tej wylosowao iezależie do próby dużą liczbę elemetów populacji ( > 00). W oparciu o wyiki tej próby, ależy zweryfikować hipotezę H 0 : p = p 0 wobec hipotezy alteratywej H : p p 0, gdzie p 0 jest hipotetyczą wartością parametru p. Test istotości dla hipotezy H 0 buduje się w astępujący sposób: Oblicz wskaźik struktury z próby m/, gdzie m jest liczbą elemetów wyróżioych zalezioą w próbie. Następie oblicz wartość statystyki m p0 u p ( 0 p0) Statystyka ta ma przy założeiu prawdziwości hipotezy H 0 rozkład asymptotyczie ormaly N(0,). Z tablicy rozkładu ormalego N(0,) 4 5 - -

wyzacz astępie taką krytyczą wartość u / by spełioa była rówość P U u /. Nierówość w awiasie powyższego wzoru określa dwustroy obszar krytyczy testu, czyli gdy przy porówaiu wartości u wyzaczoej ze wzoru z wartością u / odczytaą z tablicy zajdzie ierówość u u /, to sprawdzaą hipotezę H 0 odrzucasz a korzyść jej alteratywy H. Gdy zaś otrzymasz ierówość przeciwą, tj. u / u, to ie ma podstaw do odrzuceia hipotezy H 0. UWAGA Dla hipotezy alteratywej postaci H : p < p 0 obszar krytyczy buduje się lewostroie, tz. taka wartość u jest wartością krytyczą, że P U u U u. Obszar krytyczy jest wtedy określoy przez ierówość. Wartość u jest wtedy oczywiście ujema. Natomiast dla hipotezy alteratywej H : p > p 0 obszar krytyczy w tym teście buduje się prawostroie, tz. jest o określoy ierówością U u. Wartość krytyczą u odczytuje się wtedy z tablicy rozkładu N(0,) w taki sposób, by spełioa była rówość P U u. ZADANIE 7 Wysuięto hipotezę, że wadliwość produkcji pewego podzespołu w aparatach radiowych wyosi 0%. W celu sprawdzeia tej hipotezy wylosowao iezależie próbę 00 podzespołów i otrzymao w iej 5 podzespołów wadliwych. Na poziomie istotości = 0,05 zweryfikuj tę hipotezę. Test dla dwóch procetów (wskaźików struktury) Badając dwie populacje geerale ze względu a cechę iemierzalą musimy często sprawdzić hipotezę, że frakcje elemetów wyróżioych (wskaźiki struktur lub procety) są w obu populacjach takie same. Test poday poiżej pozwala a zweryfikowaie tej hipotezy w oparciu o wyiki dwu dużych rób. 5

Korzysta się przy tym z asymptotyczego rozkładu ormalego odpowiediej statystyki MODEL Dae są dwie populacje geerale, w których frakcje elemetów wyróżioych są rówe odpowiedio p i p. Na podstawie dwu dużych prób o liczebościach odpowiedio i ( i większe od 00) ależy sprawdzić hipotezę, że parametry p i p są jedakowe, tz. H 0 : p = p wobec hipotezy alteratywej H : p p Test istotości dla hipotezy H 0 buduje się w astępujący sposób: Z obu prób o liczebościach i wyzacz odpowiedie liczby m i m elemetów wyróżioych w tych próbach. Następie według wzoru m m p oblicz wartość średiego wskaźika struktury z obu prób p oraz według wzoru wartość pseudo-liczebości próby. Oblicz wartość statystyki m m u p( p) m / i m / są wskaźikami struktury uzyskaymi z obu prób. Powyższa statystyka ma przy założeiu prawdziwości hipotezy H 0 rozkład asymptotyczy N(0,). Z tablicy rozkładu ormalego N(0,) odczytaj astępie taką krytyczą wartość u /, dla daego z góry poziomu istotości, aby P U u /. Jeśli z porówaia u z wartością krytyczą u / otrzymasz ierówość u u /, to zalazłeś się w dwustroym obszarze krytyczym, zatem hipotezę H 0 odrzucasz a 6

korzyść jej alteratywy H. Gdy zaś otrzymasz ierówość przeciwą, tj. u / u, to ie ma podstaw do odrzuceia hipotezy H 0. UWAGA Gdy hipoteza alteratywa ma postać H : p < p stosoway jest lewostroy obszar krytyczy, tz. krytyczą wartość u odczytuje się z tablic tak, by P U u. Gdy atomiast hipoteza alteratywa ma postać H : p > p stosoway jest w tym teście prawostroy obszar krytyczy, tz. wartość krytyczą u odczytuje się z tablic tak, by P U u. ZADANIE 8 W celu sprawdzeia czy zachorowalość a gruźlicę jest taka sama w mieście jak i a wsi, pobrao w pewym województwie z ludości wiejskiej i miejskiej dwie losowe próby. Z ludości miejskiej wylosowao = 00 osób i otrzymao m = 40 chorych a gruźlicę a z ludości wiejskiej wylosowao = 500 osób i otrzymao m = 00 osób chorych. Przyjmując poziom ufości = 0,05 zweryfikuj hipotezę o jedakowym procecie chorych a gruźlicę w mieście i a wsi w tym województwie. Test dla dwóch wariacji W przypadku gdy badaie statystycze ze względu a pewą cech mierzalą prowadzimy w dwóch populacjach, może zajść potrzeba sprawdzeia hipotezy o jedakowym stopiu rozproszeia wartości badae cechy w obu populacjach. Gdy populacje mają rozkłady ormale, możemy tę hipotezę łatwo sprawdzić podaym poiżej prostym testem istotości (ajczęściej test te służy do sprawdzeia rówości wariacji w dwu populacjach, których średie chcemy porówać, MODEL w pukcie Test dla dwóch średich). Rozkładem, którym będziemy posługiwać się w omawiaym teście jest rozkład F Sedecora. Ze względu a to, że dostępe tablice tego rozkładu zostały sporządzoe tak, iż podają taką wartość F, dla której zachodzi rówość P F F, w omawiaym teście obszar krytyczy jest 7

prawostroy. Dlatego ozaczeia populacji umerami i ależy tak przyjąć, aby w ilorazie dwu wariacji z prób liczik był zawsze większy od miaowika. Przy odczytywaiu z rozkładu F Sedecora wartości krytyczej F dla tego testu ależy pamiętać, że występują w im dwa rodzaje stopi swobody - liczika () i miaowika (). W omawiaym teście wygodiej jest użyć statystyki ~ s. MODEL Dae są dwie populacje geerale mające odpowiedio rozkłady ormale N(m, ) i N(m, ), gdzie parametry tych rozkładów są iezae. Z populacji tych wylosowao iezależie dwie próby o liczebości odpowiedio i elemetów. Na podstawie wyików tych prób ależy sprawdzić hipotezę H 0 : =, wobec hipotezy alteratywej H : Test istotości dla hipotezy H 0 buduje się w astępujący sposób: Z obu prób wyzacz wartości wyzacz wartość statystyki F ~ s i ~ s, przy czym ~ s F ~ s ~ s ~ s. Następie Statystyka ta przy założeiu prawdziwości hipotezy H 0 ma rozkład F Sedecora z - i - stopiami swobody. Następie dla ustaloego z góry poziomu istotości odczytaj z tablicy rozkładu F Sedecora wartość krytyczą F, tak by spełioa była rówość P F F. 8

Nierówość F F określa obszar krytyczy w tym teście, tz. gdy z porówaia wartości obliczoej F i krytyczej F otrzymamy tę ierówość, hipotezę H 0 o rówości wariacji w populacjach ależy odrzuć a korzyść hipotezy alteratywej H mówiącej, że wariacja w populacji przyjętej umowie jako pierwsza jest większa. Gdy atomiast otrzymasz ierówość hipotezy H 0. F F, to ie ma podstaw do odrzuceia ZADANIE 9 Przed zastosowaiem testu t Studeta dla hipotezy, że średie zarobki pracowików zatrudioych a tych samych staowiskach roboczych w dwu różych fabrykach są jedakowe, ależy sprawdzić założeie tego testu, że wariacje zarobków w obu fabrykach są idetycze. Z jedej fabryki wylosowao w tym celu iezależie 6 pracowików i otrzymao z tej próby wariację ~ s = 500 zł. Natomiast z drugiej fabryki wylosowao pracowików do próby i otrzymao z iej ~ s = 40000 zł, Moża przyjąć, że rozkłady zarobków w obu fabrykach są ormale. Na poziomie istotości = 0,05 ależy sprawdzić hipotezę, że wariacje zarobków badaych pracowików są takie same w obu fabrykach. Test ANOVA (KLASYFIKACJA POJEDYNCZA) DLA WIELU ŚREDNICH Testy aalizy wariacji pozwalają a sprawdzeie, czy pewe czyiki, które moża dowolie regulować w toku eksperymetu, wywierają wpływ, a jeśli tak, to jak wielki, a kształtowaie się średich wartości badaych cech mierzalych. Istotą aalizy wariacji jest rozbicie a addytywe składiki (których liczba wyika z potrzeb eksperymetu) sumy kwadratów wariacji całego zbioru wyików. Porówaie poszczególej wariacji wyikającej z 9

działaia daego czyika oraz tzw. wariacji resztowej, czyli wariacji mierzącej losowy błąd (które to porówaie odbywa się przez zastosowaie testu F Sedecora) daje odpowiedź, czy day czyik odgrywa istotą rolę w kształtowaiu się wyików eksperymetu. Omówimy prosty przypadek aalizy wariacji w tzw. klasyfikacji pojedyczej. Sumę kwadratów wariacji ogólej rozbija się tu jedyie a dwa składiki mierzące zmieość między grupami (populacjami) i wewątrz grup. Porówując testem F wariację między grupami z wariacją wewętrzą grup rozstrzygamy, czy średie grupowe różią się istotie od siebie czy ie. Jeżeli podział a grupy przebiegał p. ze względu a róże poziomy badaego czyika, to moża w te sposób wykryć wpływ poziomu a efekt wartości badaej cechy. Test aalizy wariacji zwykle przeprowadza się według określoego schematu, ujętego w postaci tzw. tablicy aalizy wariacji, mającej różą liczbę wierszy w zależości od kokretego schematu, ale kolumy zawsze astępujące: źródło zmieości suma kwadratów stopie swobody wariacja test F Do tabelki tej wpisuje się odpowiedie dae liczbowe obliczoe z wyików próby. Dzieląc odpowiedią sumę kwadratów przez stopie swobody otrzymujemy pewe ocey wariacji, które porówujemy testem F z wariacją resztową a przyjętym poziomie istotości. Jeżeli daego czyika jest istoty. F F, to efekt MODEL Daych jest k populacji o rozkładzie ormalym N(m i, i ) (i =,,...,k) lub o rozkładzie zbliżoym do ormalego. Zakłada się przy tym, że wariacje wszystkich k populacji są rówe, tz. = =...= k = (lecz ie muszą być zae). Z każdej z tych populacji wylosowao iezależie próby o 0

liczebości i elemetów. Wyiki prób ozaczoe są przez x ij (i =,,...,k, j =,,..., i ) przy czym x ij = m i + ij, gdzie ij jest składikiem losowym, mającym rozkład N(0,). Na podstawie wyików x ij ależy zweryfikować hipotezę H 0 : m = m =... = m k wobec hipotezy alteratywej H : ie wszystkie średie badaych populacji są rówe. Test istotości (aalizy wariacji) dla tej hipotezy jest astępujący. Z wyików poszczególych prób oblicz średie grupowe x i i średią ogólą x : i xi xij dla i,,...,k i j x k i i j x ij gdzie k i i Następie oblicz odpowiedie sumy kwadratów i wypełij wartościami liczbowymi astępującą tablicę aalizy wariacji; występująca w iej statystyka F ma przy założeiu prawdziwości hipotezy H 0 rozkład F Sedecora o k- i -k stopiach swobody: źródło zmieości między populacja mi (grupami) wewątrz grup (składik losowy) suma kwadratów k i k stopie swobody ( x x) k - i i j i i ( x x ) - k ij i wariacja test F ~ s ~ s F ~ s ~ s

Obliczoą w tablicy aalizy wariacji wartość F porówaj z wartością krytyczą F. odczytaą z tablicy rozkładu F Sedecora dla ustaloego z góry poziomu istotości i dla odpowiediej liczby k - oraz - k stopi swobody. Spełioa ma być przy tym rówość P F F wyiku porówaia otrzymasz ierówość F F. Jeżeli w, to hipotezę H 0 o rówości średich w badaych populacjach ależy odrzucić. Natomiast gdy F F, to ie ma podstaw do odrzuceia hipotezy H 0. Gdy F <, to bez porówywaia z F ie ma podstaw do odrzuceia hipotezy H 0. Odrzuceie hipotezy H 0 ozacza udowodieie istotego wpływu podziału a te populacje. W przeciwym przypadku, wszystkie grupy (populacje) moża uzać za rówoważe z puktu widzeia otrzymywaych wartości badaej cechy. ZADANIE 0 Koszty materiałowe pewego wyrobu, który moża produkować trzema różymi metodami, mają rozkład ormaly o jedakowej wariacji dla każdej z tych metod. Wylosowae sztuki tego wyrobu dały astępujące koszty materiałowe dla poszczególych metod produkcji (w zł): Metoda A B C 5 5 0 30 0 - - 40 0 5 50 0 35-5 5 0 0 40 0 30

Na poziomie istotości = 0,05 ależy zweryfikować hipotezę, że średie koszty materiałowe są jedakowe dla wszystkich trzech metod produkcji tego wyrobu. 3