Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4

Podobne dokumenty
Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 3

Wykład 12 ( ): Testy dla dwóch prób w rodzinie rozkładów normalnych

Testy dla dwóch prób w rodzinie rozkładów normalnych

Wykład 5 Problem dwóch prób - testowanie hipotez dla równości średnich

Problem dwóch prób: porównywanie średnich i wariancji z populacji o rozkładach normalnych. Wrocław, 23 marca 2015

Statystyka matematyczna Testowanie hipotez dla średnich w rozkładzie normalnym. Wrocław, r

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 1

Wykład 10 ( ). Testowanie hipotez w rodzinie rozkładów normalnych przypadek nieznanego odchylenia standardowego

S t a t y s t y k a, część 3. Michał Żmihorski

Testowanie hipotez dla proporcji. Wrocław, 13 kwietnia 2015

Testowanie hipotez statystycznych.

Testowanie hipotez dla frakcji. Wrocław, 29 marca 2017

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Wykład 9 Testy rangowe w problemie dwóch prób

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Statystyczna analiza danych

12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Statystyka matematyczna dla leśników

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Testowanie hipotez statystycznych.

Eksploracja Danych. Testowanie Hipotez. (c) Marcin Sydow

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Wykład 3 Hipotezy statystyczne

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Statystyka w analizie i planowaniu eksperymentu

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Testowanie hipotez statystycznych.

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Przykład 1. (A. Łomnicki)

Kolokwium ze statystyki matematycznej

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Statystyka matematyczna

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Wydział Matematyki. Testy zgodności. Wykład 03

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

LABORATORIUM Populacja Generalna (PG) 2. Próba (P n ) 3. Kryterium 3σ 4. Błąd Średniej Arytmetycznej 5. Estymatory 6. Teoria Estymacji (cz.

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Testowanie hipotez statystycznych

Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Statystyka matematyczna i ekonometria

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Testowanie hipotez statystycznych

Zadania ze statystyki, cz.6

Testowanie hipotez statystycznych cd.

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja)

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Prawdopodobieństwo i statystyka r.

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

Wykład 10 Testy jednorodności rozkładów

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Weryfikacja hipotez statystycznych testy dla dwóch zbiorowości

Testowanie hipotez statystycznych

Pobieranie prób i rozkład z próby

Estymacja parametrów rozkładu cechy

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

Statystyka w analizie i planowaniu eksperymentu

Zadanie 1. Analiza Analiza rozkładu

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

Testowanie hipotez statystycznych

Transkrypt:

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 4 Konrad Miziński, nr albumu 233703 31 maja 2015 Zadanie 1 Wartości oczekiwane µ 1 i µ 2 oszacowano wg wzorów: { µ1 = 0.43925 µ = X n µ 2 = 1.10520 Różnica między nimi wynosiła: µ 1 µ 2 µ 1 µ 2 = 0.66595 Wariancję σ 2 oszacowano w następujacy sposób: gdzie: s 2 = (n 1)s2 X + (m 1)s2 Y n + m 2 s 2 X = 1 n 1 s 2 Y = 1 m 1 n (X i X) 2 i=1 m (Y i Y ) 2 i=1 a m i n oznaczaja liczność prób X i Y. Wynosiła ona: s 2 = 0.6318142 W celu oszacowania odchylenia standardowego wartości µ 1 µ 2 posłużono się właściwościa: X Y N(µ X µ Y, σ 2 (n 1 + m 1 )) Wynosiło ono: s X Y = s 2 (n 1 + m 1 ) = 0.5332133 Do sprawdzenie hipotezy równości między średnimi najlepiej nadaje się test dwustronny - wykorzystuje on hipotezę zerowa o równości średnich oraz hipotezę alternatywa mówiac o różnych wartościach średnich rozkładów. 1

W celu udowodnienia ww. hipotezy posłużono się testem t-studenta z hipotezami postaci: H 0 : µ x = µ y H 1 : µ x µ y oraz liczba stopni swobody równa n + m 2 = 7. Statystyka T miała postać: T = X Y = 1.248937 s X Y P-wartość wynosiła: 2(1 F tn+m 2 ( T )) = 0.2518336 Dla przyjętego poziomu istotności α = 0.1, wartość krytyczna wynosiła: c = F 1 t n+m 2 (1 α 2 ) = 1.894579 co jest większe od modułu ze statystyki T. Oznacza to, że nie ma podstaw do odrzucenia hipotezy zerowej H 0 : µ x = µ y. Powyższe wyniki potwierdza dostępna wraz z pakietem statystycznym R implementacja > t.test(los1, los2, var.equal=true, alternative = two.sided, conf.level = 0.9); Two Sample t-test data: los1 and los2 t = -1.2489, df = 7, p-value = 0.2518 90 percent confidence interval: -1.6761645 0.3442645 mean of x mean of y 0.43925 1.10520 Zadanie 2 Przy założeniu, że obie próby losowe należa do rozkładów normalnych można posłużyć się testem t-studenta z hipotezami postaci: H 0 : µ X = µ Y H 1 : µ X µ Y Z racji, że nie posiadamy danych o wariancjach obu rozkładów statystyka T przyjęła postać: T = X Y s 2

gdzie odchylenie standardowe s wyliczono na podstawie zależności: Otrzymano: s 2 = s2 X n + s2 Y m T = 2.072309 Liczbę stopni swobody oszacowano w następujacy sposób: (s 2 ) 2 d = 17 1 n 1 ( s2 X n ) 2 + 1 m 1 ( s2 Y m ) 2 Dla tak wyliczonych wartości T i d p-wartość wynosiła 0.05375895. Dla przyjętego poziomu istotności α = 0.05 wartość krytyczna wynosiła c = 2.109816, co jest większe od uzyskanej wartości statystyki T. Oznacza to, że również w tym przypadku nie ma podstaw do odrzucenia hipotezy zerowej. Powyższe wyniki potwierdza dostępna wraz z pakietem statystycznym R implementacja > t.test(lozyska1,lozyska2) Welch Two Sample t-test data: lozyska1 and lozyska2 t = 2.0723, df = 16.665, p-value = 0.05408 95 percent confidence interval: -0.07752643 7.96352643 mean of x mean of y 10.693 6.750 Przy braku założenia o normalności rozkładów posłużono się wbudowanym w pakiet statystyczny R testem Wilcoxona: > wilcox.test(lozyska1, lozyska2) Wilcoxon rank sum test data: lozyska1 and lozyska2 W = 75, p-value = 0.06301 alternative hypothesis: true location shift is not equal to 0 który dla przyjętego poziomu istotności α = 0.05 również nie daje podstaw do odrzucenia hipotezy zerowej. Test wydaje się być odpowiedniejszy dla tego typu danych, gdyż przy braku dodatkowych informacji nie możemy zakładać normalności rozkładów, z których te dane pochodza. Prawdopodobieństwo tego, że łożysko wykonane z pierwszego materiału będzie pracowało dłużej niż wykonane z materiału drugiego wyestymowano za pomoca wzoru: P = {(x, y) X Y : x > y} X Y gdzie X i Y oznaczaja poszczególne próby losowe. = 0.75 3

Zadanie 3 Zależność różnicy liczb awarii w parze w funkcji liczby awarii w regionie kontrolnym przedstawiono na rysunku 1. Rysunek 1: Zależność różnicy liczb awarii w parze w funkcji liczby awarii w regionie kontrolnym. Na rysunki zaobserwować można liniowa zależność między poszczególnymi zmiennymi. Świadczy to o pewnej korelacji danych. 4

Średnia wartość różnicy liczb awarii w ramach pary wynosiła: X Y = 461.2857 Wariancję tego estymatora obliczono za pomoca wzoru: V (X Y ) = V X V Y 2C(X, Y ) = 574274.8 Mediana różnicy liczb awarii w ramach pary wynosiła -368.50. Jej wariancję wyestymowano metoda bootstrapu nieparametrycznego jako wariancję 10000-elementowej próby złożonej z median zbiorów wygenerowanych metoda losowania ze zwracaniem ze zboru różnic awarii w ramach pary. Wynosiła ona 12268.38. Sprawdzenie czy różnice pomiędzy liczbami awarii w ramach pary sa efektem przypadku wykonano najpierw testem t-studenta. Przyjęto hipotezy: H 0 : X Y = µ 0 = 0 Wykorzystano statystykę T postaci: H 0 : X Y µ 0 T = (X Y µ 0) n σ = 2.2776 Dla przyjętego poziomu istotności α = 0.05, wartość krytyczna wynosiła c = 2.16, co jest mniejsze od modułu ze statystyki T. Oznacza to, że należy odrzucić hipotezę zerowa na rzecz hipotezy alternatywnej. P-wartość wynosiła w tym przypadku 0.04. Otrzymane wyniki potwierdza dostępna wraz z pakietem statystycznym R implementacja > t.test(awarie.test, awarie.kontrola, paired=t, alternative = "two.sided") Paired t-test data: awarie.test and awarie.kontrola t = -2.2776, df = 13, p-value = 0.0403 95 percent confidence interval: -898.83174-23.73969 mean of the differences -461.2857 Podobne wyniki daje test Wilcoxona: > wilcox.test(awarie.test, awarie.kontrola, paired=t, alternative = "two.sided") Wilcoxon signed rank test data: awarie.test and awarie.kontrola V = 17, p-value = 0.02454 alternative hypothesis: true location shift is not equal to 0 Ponieważ nie mamy podstaw żeby zakładać normalność rozkładów, z których pochodza analizowane dane, test Wilcoxona wydaje się być w tym przypadku odpowiedniejszy. 5