Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i przedziały ufności dla dwóch niezależnych prób Odporność procedur typu Studenta (t)
The t distribution: Cel: oszacowanie μ, gdy σ jest (również) nieznane. Rozwiązanie: oszacuj σ przez s i inteligentnie używaj we wzorach. Wyzwanie: zmieni się rozkład statystyk testowych.
Założenia: normalna populacja, nieznane odchylenie standardowe Załóżmy PP: X 1,, X n z rozkładu N(μ, σ); X ~ N, n Załóżmy, że zarówno μ, jak i σ są nieznane. można oszacować przez n SE X s n SE nazywa się standardowym błędem średniej z próby
t-test, rozkład t (Studenta) Jeśli znamy σ, to używamy statystyki testowej Jeśli nie znamy σ, to używamy statystyki t z Jest to odpowiednio unormowana" średnia z próby. Ta wielkość nie ma rozkładu normalnego, zamiast tego ma rozkład t z n-1 stopniami swobody. Dla każdego rozmiaru próby n jest inny rozkład t. x x s n n
Rozkład t Krzywa gęstości rozkładu t z k stopniami swobody jest symetryczna o środku 0 i kształcie dzwonu. Im większe są stopnie swobody (df), tym węższy jest rozrzut rozkładu t. n 1 < n d.f. = n 1 d.f. = n Większy rozrzut niż N (0,1), zwłaszcza gdy df jest małe. Wraz ze wzrostem df krzywa gęstości rozkładu t zbliża się coraz bardziej do gęstości dla N(0,1). 0
Tabela rozkładu Studenta P =.10 t=1.35 Degrees of Freedom t.1 t.05 t.05 t.01 t.005 1 3,078 6,314 1,706 31,81 63,657 1,886,9 4,303 6,965 9,95............ 0 1,35 1,75,086,58,845............ 00 1,86 1,653 1,97,345,601 z* 1,8 1,645 1,96,36,576
Przedział dla μ dla jednej próby, gdy σ jest również nieznane to x t SE Oznacza to: przedział dla μ na poziomie ufności C = 1-α wynosi * s * s * s x t, or x t, x t n n n t * jest takie, że obszar pomiędzy -t * i t * wynosi C dla krzywej gęstości rozkładu t oraz df = n-1. Używamy 95% ufności, jeśli nie podano inaczej. Przedział jest dokładny dla normalnej populacji i w przybliżeniu dokładny dla dużego n przy innych rozkładach. *
Czytaj t * z tabeli t α=0.05 α=0.01 α=0.10 df=3 df=10 df=130
Przykład 1 Z bieżącej produkcji mieszanki kukurydziano-sojowej pobieramy próbkę do oznaczania zawartości witaminy C: 6 31 3 11 14 31. Znajdź 95% przedział ufności dla średniej zawartości witaminy C w tej produkcji. Zinterpretuj. Wskaż SE i margines błędu.
Przykład Fundusz inwestycyjny szacuje zwrot z inwestycji w spółki, które w ubiegłym roku zdobyły nagrody jakości. SRS 50 takich firm jest wybierany, a zwrot z inwestycji jest obliczany. Dane są podsumowane w następujący sposób: x 14.75, s 8.18. Skonstruuj i zinterpretuj przedział ufności dla średniego zwrotu z inwestycji.
t-test dla μ dla jednej próby (z nieznanym σ) Testujemy H 0 : μ = μ 0 w oparciu o PP rozmiaru n; obliczamy statystykę x t 0 s n Zwróć uwagę na SE w mianowniku. Użyj istotności 5%, jeśli nie określono inaczej.
Przykład 1 cd. Sprawdź, czy poziom wit. C jest zgodny ze specyfikacjami: H 0 : μ = 40 vs. H a : μ 40
Przykład 1 cd. Sprawdź, czy poziom wit. C jest niższy deklarowany: H 0 : μ = 40 vs. H a : μ <40
Dyskusja: jak/kiedy powinniśmy wybrać kierunkowość testu?
Rozważmy zmienną losową T z rozkładem Studenta z df=n - 1 i wartość statystyki t. P-wartość P testu H 0 : μ = μ 0 przeciw H a : μ > μ 0 wynosi P(T t) H a : μ < μ 0 wynosi P(T t) H a : μ μ 0 to P(T t ) Excel: tdist()
Przypomnienie: P-wartość mówi, jak mało prawdopodobna jest wartość uzyskanych przez nas statystyk testów, jeśli H0 było prawdziwe. Ta P-wartości jest dokładna, jeśli rozkład populacji jest normalny i jest dość dokładna dla dużych n w innych przypadkach. Długie ogony i ciężka skośność rozkładu populacji może unieważnić otrzymane P-wartości. Możemy oszacować P-wartości P za pomocą tabeli rozkładu t.
oszacuj t=.1 t=.1 t=.7 t=-1.8 P-wartość df=3 df=6 n=13 n=10 H a : μ μ 0 <P< <P< <P< <P< H a : μ>μ 0 <P< <P< <P< <P< H a : μ<μ 0 <P< <P< <P< <P<
Porównuj! Porównawcze wnioskowanie jest bardziej powszechne niż wnioskowanie o parametrze pojedynczego rozkładu. Dlatego często mamy dwie próby do porównania. W pewnych okolicznościach badanie porównawcze prowadzi do procedur z jedną próbą
Test dla par Analiza par: dwa pomiary lub obserwacje (para) na każdą osobę, albo badamy przed i po itp. Dla każdej pary oblicz po przed. Analizuj te różnice za pomocą przedziału lub testu t dla jednej próby.
Przykład 3 0 francuskich nauczycieli bierze udział w kursie doskonaląc swoje umiejętności. Nauczyciele biorą udział w teście odsłuchowym Modern Language Association na początku kursu i na końcu. Wyniki "po" - "przed" mają średnią,5 i SD.893. Zbuduj 95% przedział ufności dla średniej poprawy umiejętności. Czy poprawa jest znacząca?
X i =po i przed i, i=1,,0 μ-średnia poprawa
H 0 : μ = 0 H a : μ > 0
Praktyczne wskazówki: Rozmiar próbki <15: Użyj procedur t, tylko jeśli dane są zbliżone do normalnych. Wielkość próby 15: Stosuj procedury t, za wyjątkiem obecności wartości odstających lub silnej skośności. Użyj normalnego wykresu kwantyl-kwantyl, histogramu lub boxplotu do zbadania tych właściwości danych. Duży rozmiar próbki ( 40): użyj procedur t nawet w przypadku wyraźnie wypaczonych rozkładów. Założenie, że dane są PP jest niezbywalne!
Problemy z dwoma próbami Problemy z dwoma próbami zwykle wynikają ze zrandomizowanego doświadczenia porównawczego z dwiema grupami terapeutycznymi. (Badania eksperymentalne.) Porównanie losowych próbek oddzielnie wybranych z dwóch populacji jest również problemem dwóch prób. (Badania obserwacyjne.) W przeciwieństwie testu dla par, nie ma kojarzenia jednostek w dwóch próbach, a próby mogą mieć różne rozmiary.
Zapis dla dwóch prób Populacja 1 Średnia populacji 1 SD dla populacji σ 1 σ Próba (PP) Rozmiar próby Średnia z próby SD dla próby 1 n 1 x 1 x n s 1 s
Przykład 4 (poziom metabolizmu dla mężczyzn i kobiet): Obs Płeć Waga Poziom 1 M 6 179 M 6.9 1666 3 F 36.1 995 4 F 54.6 145 5 F 48.5 1396 6 F 4 1418 7 M 47.4 136 8 F 50.6 150 9 F 4 156 10 M 48.7 1614 11 F 40.3 1189 1 F 33.1 913 13 M 51.9 1460 14 F 4.4 114 15 F 34.5 105 16 F 51.1 1347 17 F 41. 104 18 M 51.9 1867 19 M 46.9 1439 Obs Płeć Waga Poziom 1 F 36.1 995 F 54.6 145 3 F 48.5 1396 4 F 4 1418 5 F 50.6 150 6 F 4 156 7 F 40.3 1189 8 F 33.1 913 9 F 4.4 114 10 F 34.5 105 11 F 51.1 1347 1 F 41. 104 13 M 6 179 14 M 6.9 1666 15 M 47.4 136 16 M 48.7 1614 17 M 51.9 1460 18 M 51.9 1867 19 M 46.9 1439
Zestawione boxploty: 1800 1600 R a t e 1400 100 1000
Dwie populacje: znane σ 1, σ ma średnią μ 1 μ oraz SD Jeśli rozkłady obu populacji są normalne, to rozkład jest również normalny, zatem statystyka ma standardowy rozkład normalny N(0,1). 1 x x 1 1 n n 1 x x 1 1 1 1 ) ( ) ( n n x x z
Przedział ufności Gdy σ 1, σ są znane to przedział ufności na poziomie C dla μ 1 μ wynosi x 1 x z * n 1 1 n gdzie P(-z* Z z*) = C.
Test istotności Testujemy H 0 : μ 1 = μ przeciw jednej z następujących alternatywnych hipotez : H a : μ 1 > μ H a : μ 1 < μ H a : μ 1 μ Statystyka z jest odpowiednia, gdy σ 1, σ są znane: z x n x 1 1 n 1
P-wartości (z rozkładu normalnego) Alternatywna Hipoteza P-wartość H a : μ 1 > μ P(Z>z) H a : μ 1 < μ P(Z<z) H a : μ 1 μ *P(Z> z )
Dwie populacje: nieznane σ 1, σ Załóżmy, że μ 1, μ, σ 1 oraz σ są nieznane. Statystyka t dla różnicy średnich: t ( x x ) ( ) 1 s ma w przybliżeniu rozkład t, gdzie df liczymy oprogramowaniem lub jako min(n 1 1, n 1). Mianownik nazywany jest błędem standardowym: 1 n 1 s n 1 SE x 1 x
Przedziały ufności Gdy σ 1 oraz σ są nieznane, to przedział ufności mna poziomie C dla μ 1 μ wynosi gdzie jest z tabeli t. 1 s ( x x ) t * 1 df n * * P( t t t ) df df:=min(n 1 1, n 1) lub z oprogramowania. df C 1 s n
Przykład 4 (Poziom metabolizmu kobiet i mężczyzn). n 1 1, x 1 135.1, s 1 188.3 n 7, x 1600, 189. Oszacuj różnicę średnich poziomów metabolizmu u mężczyzn i kobiet z 95% pewnością. s
Przedział ufności i konkluzja:
Testy istotności: podsumowanie Testujemy H 0 : μ 1 = μ przeciwko jednej z następujących alternatywnych hipotez, dla nieznanych σ 1, σ : H a : μ 1 > μ H a : μ 1 < μ H a : μ 1 μ Satystyka t wynosi t x s x 1 s 1 n n 1 Stopnie swobody jak poprzednio: min(n 1 1, n 1) lub z oprogramowania.
P-wartości (z tabeli t, gdy σ 1, σ nieznane) Alternatywy P-wartość H a : μ 1 > μ P(T t) H a : μ 1 < μ P(T t) H a : μ 1 μ *P(T t )
Przykład 4 cd.: Czy kobiety mają inny poziom metabolizmu niż mężczyźni?
Stopnie swobody dla procedur z dwiema próbami df:=min(n 1 1, n 1) lub software Wybór min(n 1 1, n 1) jest konserwatywny. Software zwykle da mniejsze P-wartości. W naszym przykładzie z metabolizmem calculator will daje df=1.6 (i bierzemy 1 w tabeli t). Bez różnicy dla końcowego wniosku...
Odporność procedur t Wnioskowanie statystyczne nazywa się odporne, jeśli nie jest wrażliwe na naruszenie przyjętych założeń. Prawdziwe populacje nigdy nie są całkiem normalne; procedury t są odporne na nienormalność populacji, z wyjątkiem wartości odstających lub silnej skośności. Procedury t są raczej konserwatywne, tzn. Twoje obliczone wartości P mogą być większe niż w rzeczywistości. To jest bezpieczne