Wykład 9 Wnioskowanie o średnich

Podobne dokumenty
Testowanie hipotez statystycznych.

Wykład 8: Testy istotności

Testowanie hipotez statystycznych.

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

Pobieranie prób i rozkład z próby

Statystyka matematyczna dla leśników

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Wykład 10 Estymacja przedziałowa - przedziały ufności dla średn

STATYSTYKA MATEMATYCZNA

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Weryfikacja hipotez statystycznych testy t Studenta

Testowanie hipotez statystycznych cd.

Prawdopodobieństwo i rozkład normalny cd.

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

Testowanie hipotez statystycznych.

Wykład 12 Testowanie hipotez dla współczynnika korelacji

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Estymacja przedziałowa - przedziały ufności dla średnich. Wrocław, 5 grudnia 2014

Przedziały ufności. Poziom istotności = α (zwykle 0.05) Poziom ufności = 1 α Przedział ufności dla parametru μ = taki przedział [a,b], dla którego

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Wykład 10 ( ). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego

1 Estymacja przedziałowa

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Oszacowanie i rozkład t

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 3 - model statystyczny, podstawowe zadania statystyki matematycznej

STATYSTYKA MATEMATYCZNA

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Zmienna bazowa. 100(1 α)% przedział ufności dla µ: 100(α)% test hipotezy dla µ = µ 0; odrzucić, jeżeli Ȳ nie jest w przedziale

Rozkłady statystyk z próby

Hipotezy statystyczne

Weryfikacja hipotez statystycznych testy dla dwóch zbiorowości

Statystyka matematyczna i ekonometria

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Weryfikacja hipotez statystycznych

Estymacja parametrów rozkładu cechy

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Hipotezy statystyczne

STATYSTYKA MATEMATYCZNA WYKŁAD grudnia 2009

Kolokwium ze statystyki matematycznej

Zadania ze statystyki, cz.6

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Zadania ze statystyki cz.8. Zadanie 1.

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Statystyka matematyczna i ekonometria

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Estymacja parametrów w modelu normalnym

Wykład 3. Rozkład normalny

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Testowanie hipotez statystycznych

Prawdopodobieństwo i statystyka

Badanie normalności rozkładu

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 7 i 8 - Efektywność estymatorów, przedziały ufności

STATYSTYKA MATEMATYCZNA WYKŁAD października 2009

R ozkład norm alny Bardzo często używany do modelowania symetrycznych rozkładów zmiennych losowych ciągłych

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Statystyka w przykładach

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Statystyka w analizie i planowaniu eksperymentu

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd.

Rozkład Gaussa i test χ2

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

O ŚREDNIEJ ARYTMETYCZNEJ I MEDIANIE

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Statystyka matematyczna

1 Podstawy rachunku prawdopodobieństwa

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Jednoczynnikowa analiza wariancji. Wnioskowanie dla jednoczynnikowej ANOV-y. Porównywanie poszczególnych średnich

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

166 Wstęp do statystyki matematycznej

Porównanie dwóch rozkładów normalnych

Transkrypt:

Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i przedziały ufności dla dwóch niezależnych prób Odporność procedur typu Studenta (t)

The t distribution: Cel: oszacowanie μ, gdy σ jest (również) nieznane. Rozwiązanie: oszacuj σ przez s i inteligentnie używaj we wzorach. Wyzwanie: zmieni się rozkład statystyk testowych.

Założenia: normalna populacja, nieznane odchylenie standardowe Załóżmy PP: X 1,, X n z rozkładu N(μ, σ); X ~ N, n Załóżmy, że zarówno μ, jak i σ są nieznane. można oszacować przez n SE X s n SE nazywa się standardowym błędem średniej z próby

t-test, rozkład t (Studenta) Jeśli znamy σ, to używamy statystyki testowej Jeśli nie znamy σ, to używamy statystyki t z Jest to odpowiednio unormowana" średnia z próby. Ta wielkość nie ma rozkładu normalnego, zamiast tego ma rozkład t z n-1 stopniami swobody. Dla każdego rozmiaru próby n jest inny rozkład t. x x s n n

Rozkład t Krzywa gęstości rozkładu t z k stopniami swobody jest symetryczna o środku 0 i kształcie dzwonu. Im większe są stopnie swobody (df), tym węższy jest rozrzut rozkładu t. n 1 < n d.f. = n 1 d.f. = n Większy rozrzut niż N (0,1), zwłaszcza gdy df jest małe. Wraz ze wzrostem df krzywa gęstości rozkładu t zbliża się coraz bardziej do gęstości dla N(0,1). 0

Tabela rozkładu Studenta P =.10 t=1.35 Degrees of Freedom t.1 t.05 t.05 t.01 t.005 1 3,078 6,314 1,706 31,81 63,657 1,886,9 4,303 6,965 9,95............ 0 1,35 1,75,086,58,845............ 00 1,86 1,653 1,97,345,601 z* 1,8 1,645 1,96,36,576

Przedział dla μ dla jednej próby, gdy σ jest również nieznane to x t SE Oznacza to: przedział dla μ na poziomie ufności C = 1-α wynosi * s * s * s x t, or x t, x t n n n t * jest takie, że obszar pomiędzy -t * i t * wynosi C dla krzywej gęstości rozkładu t oraz df = n-1. Używamy 95% ufności, jeśli nie podano inaczej. Przedział jest dokładny dla normalnej populacji i w przybliżeniu dokładny dla dużego n przy innych rozkładach. *

Czytaj t * z tabeli t α=0.05 α=0.01 α=0.10 df=3 df=10 df=130

Przykład 1 Z bieżącej produkcji mieszanki kukurydziano-sojowej pobieramy próbkę do oznaczania zawartości witaminy C: 6 31 3 11 14 31. Znajdź 95% przedział ufności dla średniej zawartości witaminy C w tej produkcji. Zinterpretuj. Wskaż SE i margines błędu.

Przykład Fundusz inwestycyjny szacuje zwrot z inwestycji w spółki, które w ubiegłym roku zdobyły nagrody jakości. SRS 50 takich firm jest wybierany, a zwrot z inwestycji jest obliczany. Dane są podsumowane w następujący sposób: x 14.75, s 8.18. Skonstruuj i zinterpretuj przedział ufności dla średniego zwrotu z inwestycji.

t-test dla μ dla jednej próby (z nieznanym σ) Testujemy H 0 : μ = μ 0 w oparciu o PP rozmiaru n; obliczamy statystykę x t 0 s n Zwróć uwagę na SE w mianowniku. Użyj istotności 5%, jeśli nie określono inaczej.

Przykład 1 cd. Sprawdź, czy poziom wit. C jest zgodny ze specyfikacjami: H 0 : μ = 40 vs. H a : μ 40

Przykład 1 cd. Sprawdź, czy poziom wit. C jest niższy deklarowany: H 0 : μ = 40 vs. H a : μ <40

Dyskusja: jak/kiedy powinniśmy wybrać kierunkowość testu?

Rozważmy zmienną losową T z rozkładem Studenta z df=n - 1 i wartość statystyki t. P-wartość P testu H 0 : μ = μ 0 przeciw H a : μ > μ 0 wynosi P(T t) H a : μ < μ 0 wynosi P(T t) H a : μ μ 0 to P(T t ) Excel: tdist()

Przypomnienie: P-wartość mówi, jak mało prawdopodobna jest wartość uzyskanych przez nas statystyk testów, jeśli H0 było prawdziwe. Ta P-wartości jest dokładna, jeśli rozkład populacji jest normalny i jest dość dokładna dla dużych n w innych przypadkach. Długie ogony i ciężka skośność rozkładu populacji może unieważnić otrzymane P-wartości. Możemy oszacować P-wartości P za pomocą tabeli rozkładu t.

oszacuj t=.1 t=.1 t=.7 t=-1.8 P-wartość df=3 df=6 n=13 n=10 H a : μ μ 0 <P< <P< <P< <P< H a : μ>μ 0 <P< <P< <P< <P< H a : μ<μ 0 <P< <P< <P< <P<

Porównuj! Porównawcze wnioskowanie jest bardziej powszechne niż wnioskowanie o parametrze pojedynczego rozkładu. Dlatego często mamy dwie próby do porównania. W pewnych okolicznościach badanie porównawcze prowadzi do procedur z jedną próbą

Test dla par Analiza par: dwa pomiary lub obserwacje (para) na każdą osobę, albo badamy przed i po itp. Dla każdej pary oblicz po przed. Analizuj te różnice za pomocą przedziału lub testu t dla jednej próby.

Przykład 3 0 francuskich nauczycieli bierze udział w kursie doskonaląc swoje umiejętności. Nauczyciele biorą udział w teście odsłuchowym Modern Language Association na początku kursu i na końcu. Wyniki "po" - "przed" mają średnią,5 i SD.893. Zbuduj 95% przedział ufności dla średniej poprawy umiejętności. Czy poprawa jest znacząca?

X i =po i przed i, i=1,,0 μ-średnia poprawa

H 0 : μ = 0 H a : μ > 0

Praktyczne wskazówki: Rozmiar próbki <15: Użyj procedur t, tylko jeśli dane są zbliżone do normalnych. Wielkość próby 15: Stosuj procedury t, za wyjątkiem obecności wartości odstających lub silnej skośności. Użyj normalnego wykresu kwantyl-kwantyl, histogramu lub boxplotu do zbadania tych właściwości danych. Duży rozmiar próbki ( 40): użyj procedur t nawet w przypadku wyraźnie wypaczonych rozkładów. Założenie, że dane są PP jest niezbywalne!

Problemy z dwoma próbami Problemy z dwoma próbami zwykle wynikają ze zrandomizowanego doświadczenia porównawczego z dwiema grupami terapeutycznymi. (Badania eksperymentalne.) Porównanie losowych próbek oddzielnie wybranych z dwóch populacji jest również problemem dwóch prób. (Badania obserwacyjne.) W przeciwieństwie testu dla par, nie ma kojarzenia jednostek w dwóch próbach, a próby mogą mieć różne rozmiary.

Zapis dla dwóch prób Populacja 1 Średnia populacji 1 SD dla populacji σ 1 σ Próba (PP) Rozmiar próby Średnia z próby SD dla próby 1 n 1 x 1 x n s 1 s

Przykład 4 (poziom metabolizmu dla mężczyzn i kobiet): Obs Płeć Waga Poziom 1 M 6 179 M 6.9 1666 3 F 36.1 995 4 F 54.6 145 5 F 48.5 1396 6 F 4 1418 7 M 47.4 136 8 F 50.6 150 9 F 4 156 10 M 48.7 1614 11 F 40.3 1189 1 F 33.1 913 13 M 51.9 1460 14 F 4.4 114 15 F 34.5 105 16 F 51.1 1347 17 F 41. 104 18 M 51.9 1867 19 M 46.9 1439 Obs Płeć Waga Poziom 1 F 36.1 995 F 54.6 145 3 F 48.5 1396 4 F 4 1418 5 F 50.6 150 6 F 4 156 7 F 40.3 1189 8 F 33.1 913 9 F 4.4 114 10 F 34.5 105 11 F 51.1 1347 1 F 41. 104 13 M 6 179 14 M 6.9 1666 15 M 47.4 136 16 M 48.7 1614 17 M 51.9 1460 18 M 51.9 1867 19 M 46.9 1439

Zestawione boxploty: 1800 1600 R a t e 1400 100 1000

Dwie populacje: znane σ 1, σ ma średnią μ 1 μ oraz SD Jeśli rozkłady obu populacji są normalne, to rozkład jest również normalny, zatem statystyka ma standardowy rozkład normalny N(0,1). 1 x x 1 1 n n 1 x x 1 1 1 1 ) ( ) ( n n x x z

Przedział ufności Gdy σ 1, σ są znane to przedział ufności na poziomie C dla μ 1 μ wynosi x 1 x z * n 1 1 n gdzie P(-z* Z z*) = C.

Test istotności Testujemy H 0 : μ 1 = μ przeciw jednej z następujących alternatywnych hipotez : H a : μ 1 > μ H a : μ 1 < μ H a : μ 1 μ Statystyka z jest odpowiednia, gdy σ 1, σ są znane: z x n x 1 1 n 1

P-wartości (z rozkładu normalnego) Alternatywna Hipoteza P-wartość H a : μ 1 > μ P(Z>z) H a : μ 1 < μ P(Z<z) H a : μ 1 μ *P(Z> z )

Dwie populacje: nieznane σ 1, σ Załóżmy, że μ 1, μ, σ 1 oraz σ są nieznane. Statystyka t dla różnicy średnich: t ( x x ) ( ) 1 s ma w przybliżeniu rozkład t, gdzie df liczymy oprogramowaniem lub jako min(n 1 1, n 1). Mianownik nazywany jest błędem standardowym: 1 n 1 s n 1 SE x 1 x

Przedziały ufności Gdy σ 1 oraz σ są nieznane, to przedział ufności mna poziomie C dla μ 1 μ wynosi gdzie jest z tabeli t. 1 s ( x x ) t * 1 df n * * P( t t t ) df df:=min(n 1 1, n 1) lub z oprogramowania. df C 1 s n

Przykład 4 (Poziom metabolizmu kobiet i mężczyzn). n 1 1, x 1 135.1, s 1 188.3 n 7, x 1600, 189. Oszacuj różnicę średnich poziomów metabolizmu u mężczyzn i kobiet z 95% pewnością. s

Przedział ufności i konkluzja:

Testy istotności: podsumowanie Testujemy H 0 : μ 1 = μ przeciwko jednej z następujących alternatywnych hipotez, dla nieznanych σ 1, σ : H a : μ 1 > μ H a : μ 1 < μ H a : μ 1 μ Satystyka t wynosi t x s x 1 s 1 n n 1 Stopnie swobody jak poprzednio: min(n 1 1, n 1) lub z oprogramowania.

P-wartości (z tabeli t, gdy σ 1, σ nieznane) Alternatywy P-wartość H a : μ 1 > μ P(T t) H a : μ 1 < μ P(T t) H a : μ 1 μ *P(T t )

Przykład 4 cd.: Czy kobiety mają inny poziom metabolizmu niż mężczyźni?

Stopnie swobody dla procedur z dwiema próbami df:=min(n 1 1, n 1) lub software Wybór min(n 1 1, n 1) jest konserwatywny. Software zwykle da mniejsze P-wartości. W naszym przykładzie z metabolizmem calculator will daje df=1.6 (i bierzemy 1 w tabeli t). Bez różnicy dla końcowego wniosku...

Odporność procedur t Wnioskowanie statystyczne nazywa się odporne, jeśli nie jest wrażliwe na naruszenie przyjętych założeń. Prawdziwe populacje nigdy nie są całkiem normalne; procedury t są odporne na nienormalność populacji, z wyjątkiem wartości odstających lub silnej skośności. Procedury t są raczej konserwatywne, tzn. Twoje obliczone wartości P mogą być większe niż w rzeczywistości. To jest bezpieczne