PODSTAWY STATYSTYKI. Teoria prawdopodobieństwa i elementy kombinatoryki. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5. Testy parametryczne (na przykładzie testu t) 6. Testy nieparametryczne 7. Korelacja liniowa i rangowa 8. Regresja prosta 9. Analiza wariancji
Testy parametryczne weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (głównie: cechy ilościowe o rozkładzie normalnym) hipotezy dotyczące średniej: test t (duże próby test średniej standaryzowanej, z) hipotezy dotyczące wariancji: test F w analizie wariancji i analizie regresji
Testy parametryczne - test t ROZKŁAD t Studenta Kształt zależy od liczby stopni swobody, nie zależy od wariancji Stosuje się go w analizach statystycznych, jeśli próby są małe (rozrzut danych nie oddaje prawdziwej zmienności cechy) Ten rozkład prawdopodobieństwa odkrył i opracował angielski statystyk William Sealy Gosset grafika - Wikipedia
Testy parametryczne - test t William Sealy Gosset (876 937) angielski statystyk. Publikował pod pseudonimem Student (stąd nazwa: rozkład t Studenta) Pracował w browarach Guinnessa w Dublinie i w Londynie (m.in. nad kontrolą jakości piwa i surowców do jego produkcji) Stąd: rozważania nad statystyką i szacowaniem nieznanych parametrów (nie był z wykształcenia matematykiem, ale miał genialną intuicję) Wniósł wielki wkład w rozwój metod statystycznych (estymacji, testowania hipotez statystycznych) i doświadczalnictwa źródło - Wikipedia
Testy parametryczne - test t ROZKŁAD t Studenta grafika - Wikipedia k k k k k f Test oparty na statystyce, która ma rozkład t Studenta nazywamy testem t
Testy parametryczne - test t Kiedy i jak stosujemy test t Test parametryczny (wnioskowanie o średniej) Analiza cech ilościowych ciągłych Niewielka liczebność prób Próby z populacji o rozkładzie normalnym Porównywane próby mają podobne wariancje
Testy parametryczne - test t Kiedy i jak stosujemy test t. Hipotezy o średniej z pojedynczej próby. Porównanie średnich z dwóch prób niezależnych 3. Porównanie średnich z dwóch prób sparowanych 4. Porównanie średnich z kilku prób test Duncana
POJEDYNCZA PRÓBA Testy parametryczne - test t
Test t pojedyncza próba Płeć HCT k 0,49 k 0,37 k 0,44 k 0,47 k 0,5 k 0,38 k 0,39 k 0,5 k 0,4 k 0,38 k 0,44 k 0,36 m 0,46 m 0,5 m 0,44 Przykład: Podstawowa morfologia krwi HCT hematokryt (udział erytrocytów we krwi) średnia wartość HCT wynosi 0,47 W próbie: s n 0,45 0,06 36
Test t pojedyncza próba Etapy testu:. Określenie hipotez H 0 i H H 0 : średnia wartość HCT w populacji wynosi 0,47 H A : średnia wartość HCT w populacji różni się od 0,47 H 0 : = 0,47 H A : 0,47 (test dwustronny). Ustalenie poziomu istotności MAX = 0,05 3. Wybór statystyki???
(z poprzedniego wykładu) Testowanie hipotez Jedna próba, nieznana wariancja Statystyka gdzie: t s n s standardowe odchylenie w próbie danych ma rozkład t Studenta o k = n stopniach swobody Stopnie swobody to liczba zmiennych niezależnych użytych przy obliczaniu statystyki; jest to prawidłowe statystycznie wyrażona liczebność próby
Test t pojedyncza próba 3. Wybór i określenie rozkładu statystyki testowej Statystyka t s n ma rozkład t Studenta o k = n - stopniach swobody Mamy n = 36, więc k = 35
Test t pojedyncza próba 4. Obliczenie wartości testu t 0,45 0,47 0,06 36 4,5 t 4,5 5. Obliczenie wartości t (lub odczyt t ) T 0,00007 ( t 0,05;35 =,03008 ) 6. Decyzja t < ma H 0 H ( t > t ) Odp.: Średnia wartość HCT w populacji różni się od 0,47
Przykład z poprzedniego wykładu Test t pojedyncza próba Próba A H 0 : = 35 ma = 0,05 n s 6 3 9 t s t = 0,75 T = 0,3 n Wniosek?
DWIE NIEZALEŻNE PRÓBY
Płeć HCT k 0,49 k 0,37 k 0,44 k 0,47 k 0,5 k 0,38 k 0,39 k 0,5 k 0,4 k 0,38 k 0,44 k 0,36 m 0,46 m 0,5 m 0,44 Podstawowa morfologia krwi Test t dwie próby niezalezne HCT hematokryt (udział erytrocytów we krwi) określono średnie wartości osobno dla kobiet i mężczyzn W próbach: n K M K 0,40( s 0,44( s n M 8 0,04) 0,08)
Test t dwie próby niezalezne. Określenie hipotez H 0 i H H 0 : średnia wartość HCT kobiet jest taka sama jak mężczyzn H A : średnie wartości HCT kobiet i mężczyzn są różne H 0 : K = M H A : K M (test dwustronny). Ustalenie poziomu istotności MAX = 0,05 3. Wybór statystyki testowej???
(z poprzedniego wykładu) Testowanie hipotez Dwie próby, nieznana wariancja Statystyka t s D gdzie s D s n s n oraz s, n stand. odchylenie i liczebność w pierwszej próbie; s, n stand. odchylenie i liczebność w drugiej próbie ma rozkład t Studenta o k = n + n stopniach swobody
3. Wybór i określenie rozkładu statystyki testowej Statystyka ma rozkład t Studenta o k = n + n - st. swobody W przykładzie mamy k = 8 + 8 = 34 n s n s s t D Test t dwie próby niezalezne
Test t dwie próby niezależne 4. Obliczenie wartości statystyki testowej t t t K s n K K 0,006 8,895 M s n M M 0,40 0,44 0,0064 8,895
Test t dwie próby niezależne 5. Obliczenie wartości t t 0,0666 ( t 0,05;34 =,0344 ) 6. Decyzja t > ma H 0 H Nie ma podstaw do odrzucenia hipotezy zerowej A gdyby test był jednostronny? H 0 : K = M H : K < M t 0,0333 Decyzja?
Testowanie hipotez Próba A Przykład z poprzedniego wykładu Próba B n s 6 3 9 t H 0 : = ma = 0,05 s D n s 5 45 49 3 45 t =,67 T = 0,09 3 67 Wniosek?
DWIE SPAROWANE PRÓBY (pary skorelowane)
Test t pary skorelowane Oko lewe Oko prawe 0,0 4,3 3,9 3,8 8,3 5,8, 33,4 0, 0,3 4,4 9,9 0, 4,3,6,4 8,8 5, 8,5 4,. Badano odruch źreniczny (czas trwania pełnego cyklu reakcji na pojedynczy błysk światła, w milisekundach). Badanie w obu oczach u 0 osób
Test t pary skorelowane. Określenie hipotez H 0 i H H 0 : długość trwania reakcji jest taka sama w obu oczach H A : długość trwania reakcji jest różna w obu oczach H 0 : L = P H A : L P (test dwustronny). Ustalenie poziomu istotności MAX = 0,05
3. Wybór i określenie rozkładu statystyki testowej N D D S N S S N D N D S D t N i i D D D N i i N i i i D i i Średnia arytmetyczna różnic (D i ) w parach obserwacji Błąd standardowy średniej Tak określona statystyka ma rozkład t - Studenta o k = N - stopniach swobody (N liczba par) Standardowe odchylenie różnic Test t pary skorelowane
4. Obliczenie wartości statystyki 0,5,7895 0,45,7895 0 5,6589 5,6589 0 88. 0,45 0 4,5 D D D N i i D N i i i S D t N S S N D D S N D i i Test t pary skorelowane
Test t pary skorelowane 5. Obliczenie wartości t t 0,808 ( t 0,05;9 =,657) 6. Decyzja t > ma H 0 H Odp.: odruch źreniczny trwa tyle samo w obu oczach.
KILKA PRÓB - TEST DUNCANA
Test t kilka prób (test Duncana). Badanie frekwencji na zajęciach ze statystyki. Podział na 4 grupy w zależności od atrakcyjności (ocena na podstawie ankiety w skali od do 5) wykładowcy poziom atrakcyjności 3 4 5 5 0 0 30 0 3 4 0 9 9 0 0............ średnia.3 7.88 0.5 4.38 Przykład z wykladu J. Szydy 00
Test t kilka prób (test Duncana). Próby uszeregowane od najniższej do najwyższej średniej. Sekwencja kilku testów t dla niezależnych prób 3. Zmodyfikowany poziom istotności MAX MAX * = - ( - MAX ) n- 4. W ten sam sposób obliczamy t : liczba porównań ma pojed. testu t 3 4 * = - ( 0,00000096) 4- = 0,000009 5 H 0 : = 3 = 4 = 5 H : 3 4 5 Przykład z wykladu J. Szydy 00
Test t kilka prób (test Duncana). Próby uszeregowane od najniższej do najwyższej średniej. Sekwencja kilku testów t dla niezależnych prób 3. Zmodyfikowany poziom istotności MAX 4. Zmodyfikowane obliczanie t : 3 * = - ( 0,000) 3- = 0,0004 4 * = - ( 0,0048)3- = 0,0097 5 H 0 : = 3 = 4 H : 3 4 H 0 : 3 = 4 = 5 H : 3 4 5 Przykład z wykladu J. Szydy 00
Test t kilka prób (test Duncana). Próby uszeregowane od najniższej do najwyższej średniej. Sekwencja kilku testów t dla niezależnych prób 3. Zmodyfikowany poziom błędu istotności MAX 4. Zmodyfikowane obliczanie t : 3 * = - ( - 0.0036) - = 0.0036 4 5 * = - ( - 0.065) - = 0.065 H 0 : = 3 H : 3 H 0 : 4 = 5 H : 4 5 Przykład z wykladu J. Szydy 00
Test t kilka prób (test Duncana). Próby uszeregowane od najniższej do najwyższej średniej. Sekwencja kilku testów t dla niezależnych prób 3. Zmodyfikowany poziom błędu istotności MAX 4. Zmodyfikowane obliczanie t : 3 4 * = - ( 0,7) - = 0,7 5 H 0 : 3 = 4 H : 3 4 Przykład z wykladu J. Szydy 00
Test t kilka prób (test Duncana) 3 A 4 A B 5 B. Atrakcyjność wykładowcy wpływa na frekwencję. Frekwencja na zajęciach nie różni się istotnie (=0,05) w grupach 3 i 4 oraz 4 i 5 Przykład z wykladu J. Szydy 00
Testy parametryczne - test t Kiedy i jak stosujemy test t Test parametryczny (wnioskowanie o średniej) Analiza cech ilościowych ciągłych Niewielka liczebność prób Próby z populacji o rozkładzie normalnym Porównywane próby mają podobne wariancje
Testy parametryczne - test t Kiedy i jak stosujemy test t. Hipotezy o średniej z pojedynczej próby. Porównanie średnich z dwóch prób niezależnych 3. Porównanie średnich z dwóch prób sparowanych 4. Porównanie średnich z kilku prób test Duncana