Zadanie 1. Analiza Analiza rozkładu

Podobne dokumenty
Zadanie 1. Plik Nowy Kod. lub naciskając ikonę Nowy kod (jak na rysunku) Tworzymy bibliotekę o nazwie lab wpisując instrukcję

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Wykład 3 Hipotezy statystyczne

Testowanie hipotez statystycznych.

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Testowanie hipotez statystycznych.

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Testy nieparametryczne

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Kolokwium ze statystyki matematycznej

Statystyka matematyczna

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Statystyka matematyczna dla leśników

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Testowanie hipotez statystycznych.

Prawdopodobieństwo i rozkład normalny cd.

Hipotezy statystyczne

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

1 Estymacja przedziałowa

Statystyka matematyczna i ekonometria

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Hipotezy statystyczne

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

166 Wstęp do statystyki matematycznej

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Wykład 8: Testy istotności

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

Wprowadzenie do statystyki dla. chemików testowanie hipotez

Statystyka matematyczna i ekonometria

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

PDF created with FinePrint pdffactory Pro trial version

Autor: Dariusz Piwczyński 1 Ćwiczenie: Doświadczenia 2-grupowe w układzie niezależnym i zależnym.

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Zadania ze statystyki cz.8. Zadanie 1.

STATYSTYKA MATEMATYCZNA, LISTA 3

Weryfikacja hipotez statystycznych

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez

Zadanie 1 Odp. Zadanie 2 Odp. Zadanie 3 Odp. Zadanie 4 Odp. Zadanie 5 Odp.

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Katedra Biotechnologii i Genetyki Zwierząt, Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

a. opisać badaną cechę; cechą X jest pomiar średnicy kulki

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Jednoczynnikowa analiza wariancji

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 3

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Wydział Matematyki. Testy zgodności. Wykład 03

WNIOSKOWANIE STATYSTYCZNE

Wykład 11 Testowanie jednorodności

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

Ćwiczenie: Weryfikacja hipotez statystycznych dla jednej i dwóch średnich.

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Wykład 5 Problem dwóch prób - testowanie hipotez dla równości średnich

Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów

Transkrypt:

Zadanie 1 data lab.zad 1; input czas; datalines; 85 3060 631 819 805 835 955 595 690 73 815 914 ; run; Analiza Analiza rozkładu Ponieważ jesteśmy zainteresowani wyznaczeniem przedziału ufności oraz weryfikacja hipotezy dotyczącej wartości oczekiwanej, wybieramy odpowiednie opcje. Uwaga! Wybierając Podstawowe przedziały ufności dokonujemy wyboru poziomu ufności (domyślna wartością jest 0.95). Wybierając Testy położenia wpisujemy wartość średniej, występującą w hipotezie zerowej.

a) Ponieważ przyjęliśmy założenie, że rozkład czasu świecenia żarówek jest normalny, zatem 95% przedział ufności dla średniego czasu świecenia żarówek ma postać: (73, 893), natomiast 95% przedział ufności dla odchylenia standardowego czasu świecenia żarówek jest postaci: (94.8104, 7.4115). b) Uwaga! Ponieważ mamy do czynienia z hipotezą alternatywną jednostronną: H : μ = 900 K : μ < 900 natomiast podawane p-value zostało wyznaczone dla alternatywy dwustronnej, zatem aby otrzymać interesując nas p-value należy podzielić wartość odczytaną z ekranu przez dwa, 0.0361 tzn. p value = = 0. 01805. Wyznaczone p-value jest mniejsze od przyjętego poziomu istotności 0.05, a zatem możemy stwierdzić, iż hipotezę zerową należy odrzucić, co oznacza, że średni czas świecenia żarówek jest istotnie krótszy od 900 godzin.,

Zadanie Wczytujemy plik bottles (znany nam już z lab.1). Analiza Analiza rozkładu

a) W ramach laboratorium 1 wykazaliśmy, iż rozkład wytrzymałości butelek jest normalny, a zatem 95% przedział ufności dla średniej wytrzymałości butelek ma postać: (1.75196, 1.8466), natomiast 95% przedział ufności dla wariancji wytrzymałości butelek jest postaci: (0.0407, 0.07049). b) Ponieważ mamy do czynienia z hipotezą alternatywną jednostronną: H : μ = 1.75 K : μ > 1.75, natomiast podawane p-value zostało wyznaczone dla alternatywy dwustronnej, zatem aby otrzymać interesując nas p-value należy podzielić wartość odczytaną z ekranu przez dwa, 0.0411 tzn. p value = = 0. 0055. Wyznaczone p-value jest mniejsze od przyjętego poziomu istotności 0.05, a zatem możemy stwierdzić, iż hipotezę zerową należy odrzucić, co oznacza, że średnia wytrzymałość butelek jest istotnie większa od 1.75 MPa. c) Weryfikację hipotez H : σ = 0.06 K : σ 0.06 dokonamy na podstawie wyznaczonego wcześniej przedziału ufności dla wariancji. Ponieważ hipotetyczna wartość wariancji należy do dwustronnego 95% przedziału ufności dla wariancji, tzn. σ0 = 0. 06 (0.0407, 0.07049) zatem na poziomie istotności 0.05 nie ma podstaw do odrzucenia hipotezy zerowej. Tym samym stwierdzamy, iż wariancja wytrzymałości butelek nie różni się istotnie od 0.06 MPa.

Zadanie 4 data lab.zad 4; input twardosc metoda; datalines; 145 1 150 1 153 1 148 1 141 1 15 1 146 1 154 1 139 1 148 1 15 150 147 155 140 146 158 15 151 143 153 ; run; Najpierw należy sprawdzić, czy próbki pochodzą z rozkładu normalnego.

Ponieważ, obie próbki pochodzą z rozkładu normalnego, zatem aby dobrać jak najbardziej odpowiedni test do porównania średnich, sprawdzimy, czy rozproszenie obu próbki różnią się istotnie. W tym celu zweryfikujemy hipotezę K : σ 1 1 H : σ = σ σ Analiza ANOVA Test T

W ostatniej tabeli znajdujemy p value = 0. 8599 dla testu jednorodności wariancji, które wskazuje, że obie próbki nie różnią się istotnie co do rozproszenia. Przechodzimy więc do zasadniczego problemu porównania średnich H : μ1 = μ K : μ < μ 1 Ponieważ, jak stwierdziliśmy, nie ma istotnych różnic co do rozproszenia próbek, zatem p-value odczytujemy z wiersza tabeli, w którym w kolumnie Wariancje znajduje się słowo Equal. Owe p-value dzielimy przez dwa (bo mamy jednostronną hipotezę alternatywną): p value 0.3557 = = 0.17785, a zatem nie ma podstaw do odrzucenia hipotezy alternatywnej, co oznaczą, iż nie ma powodu sądzić, że średnia twardość stopu utwardzanego drugą metodą przewyższa średnią twardość stopu utwardzanego pierwszą metodą.

Zadanie 5 data lab.zad 5; input przed po; datalines; 7 9 1 3 34 9 4 7 30 31 7 6 33 35 31 30 9 7 8 ; run; Tym razem mamy próbki parami zależne, co sprawia, że w procedurze Analiza ANOVA Test T wybieramy inną opcję niż poprzednio (przetłumaczoną niezręcznie jako Parzysty)

H : μ1 = μ Interesuje nas weryfikacja hipotez K : μ < μ 1 0.1864 Ponieważ (mamy jednostronną hipotezę alternatywną) p value = = 0. 093, a zatem na poziomie istotności 0.05 nie ma podstaw do odrzucenia hipotezy alternatywnej, co oznaczą, iż nie ma powodu sądzić, że zaproponowane ćwiczenia w istotny sposób usprawniają pamięć.

Zadanie 7 Najpierw z bazy danych cardata wybieramy te rekordy, które odpowiadają samochodom produkowanym w USA i Japonii: data lab.zad 7; set lab.cardata; where origin^=; run; (zrobiliśmy to usuwając rekordy odpowiadające samochodom produkowanym w Europie). Znanymi już metodami sprawdzamy, czy rozkład zużycia paliwa przez samochody produkowane w USA i w Japonii jest normalny. Ponieważ okazuje się, iż tym razem nie mamy do czynienia z rozkładami normalnymi, w celu zbadania, czy występuje statystycznie istotna różnica w zużyciu paliwa przez samochody produkowane w USA i w Japonii, nie możemy posłużyć się testem równości dwóch średnich (z którego korzystaliśmy np. w zadaniu 4). Tym razem posłużymy się testem nieparametrycznym Wilcoxona do weryfikacji hipotez H : med X = medy K : med X medy gdzie med X oraz med Y oznaczają, odpowiednio, medianę zużycia paliwa przez samochody produkowane w USA i w Japonii., Tym razem korzystamy z procedury Analiza ANOVA Nieparametryczna ANOVA jednoczynnikowa

Ponieważ p-value przyjmuje wartości mniejsze od 0.0001, zatem odrzucamy hipotezę zerową, co oznacz, iż występuje istotna różnica w zużyciu paliwa przez samochody produkowane w USA i Japonii.

Zadanie 8 Wczytujemy plik wakacje, a następnie otwieramy procedurę: Opis Analiza kontyngencji Następnie wskazujemy, jak ma być zbudowana tabela kontyngencji oraz ustalamy formę jej opisu.

Wreszcie wybieramy test chi-kwadrat do weryfikacji hipotezy zerowej H: nie ma zależności miedzy preferowanym miejscem spędzania wakacji a płcią, wobec hipotezy alternatywnej K: jest zależność miedzy preferowanym miejscem spędzania wakacji a płcią. Ponieważ wartość p-value wynosi 0.0713, zatem na poziomie istotności 0.05 nie mamy podstaw do odrzucenie hipotezy zerowej, co oznacza, że nie ma zależności miedzy preferowanym miejscem spędzania wakacji a płcią.

Zadanie 9 Zadanie analogiczne po zad. 8.

Zadanie 10 W celu przetestowania hipotezy H : p = 0.3 K : p 0.3 przekształcamy wpierw zbiór danych, tworząc kolumnę, w której 0 odpowiada kategorii góry, a 1 pozostałym kategoriom. data lab.wakacje; set lab.wakacje; if miejsce='gory' then kod=0; else kod=1; run; Następnie uruchamiamy procedurę: Opisz Tabele jednoczynnikowe

Następnie wybieramy test dla wskaźnika struktury oraz wpisujemy odpowiednia wartość odsetka, występującą w hipotezie zerowej.

Ponieważ testujemy hipotezę zerową wobec dwustronnej alternatywy, zatem p value = 0. 0896 przewyższa przyjęty poziom istotności 0.05, co oznacza, że nie ma podstaw do odrzucenia hipotezy zerowej. Innymi słowy odsetek osób, które najbardziej lubią spędzać je w górach nie różni się istotnie od 30%.

Zadanie 1 Interesujący nas problem, czy rozkład liczby wypadków w poszczególne dni tygodnia jest równomierny, sprowadza się do weryfikacji hipotezy o równomierności rozkładu. W rozważanym przez nas zadaniu będzie miała ona postać H : p1 = p = p3 = p4 = p5 = p6 = p7 = K : H gdzie p i oznacza prawdopodobieństwo zajścia wypadku w i-tym dniu tygodnia. 1 7 data lab.zad 1; input dzien $ liczba; datalines; pon 78 wt 56 sr 5 czw 58 pt 83 sob 4 niedz 45 ; run; Ponieważ dysponujemy liczną próbką, możemy posłużyć się testem zgodności chi-kwadrat. Opisz Tabele jednoczynnikowe

Wybieramy test zgodności chi-kwadrat.

Aby w wyświetlanej tabeli z danymi kategorie były uporządkowane nie podług liczności, ale w kolejności zadanej we wpisywanym zbiorze danych (a więc zgodnie z kolejnością dni tygodnia), musimy wybrać odpowiednia opcję (patrz poniżej). Ponieważ obliczona wartość p-value jest bardzo mała (zaledwie 0.0003), zatem odrzucamy hipotezę zerową, co oznacza, iż rozkład wypadków w poszczególne dni tygodnia nie jest równomierny.

Zadanie 14 Interesujące nas wartości prawdopodobieństwa oraz kwantyl obliczane są poprzez wpisanie następującego programu. data lab.zad 14; a=1-cdf('normal',181,173,6); b=cdf('normal',179,173,6); c=cdf('normal',180,173,6)-cdf('normal',167,173,6); d=quantile('normal',0.6,173,6); run; A to oznacza, iż P( X > 191) = 0.091 P( X 179) = 0.8413 P(167 < X < 180) = 0.7197 W ostatnim przypadku szukamy kwantyla, będącego rozwiązaniem równania ( X d ) = 0. 6 otrzymujemy = 174. 5 d. P i