Wydział Matematyki. Testy zgodności. Wykład 03

Podobne dokumenty
Wykład 3 Hipotezy statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Statystyka matematyczna dla leśników

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Statystyka matematyczna. Wykład VI. Zesty zgodności

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Testowanie hipotez statystycznych

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

166 Wstęp do statystyki matematycznej

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Wykład 10 Testy jednorodności rozkładów

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Hipotezy statystyczne

Badanie zgodności z określonym rozkładem. F jest dowolnym rozkładem prawdopodobieństwa. Test chi kwadrat zgodności. F jest rozkładem ciągłym

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Hipotezy statystyczne

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Zadania ze statystyki, cz.6

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

Spis treści 3 SPIS TREŚCI

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Testowanie hipotez statystycznych

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Testy nieparametryczne

Wykład 14. Testowanie hipotez statystycznych - test zgodności chi-kwadrat. Generowanie liczb losowych.

Statystyka matematyczna i ekonometria

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

Wykład 7 Testowanie zgodności z rozkładem normalnym

STATYSTYKA

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

Badanie normalności rozkładu

Kolokwium ze statystyki matematycznej

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Porównanie dwóch rozkładów normalnych

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

Statystyka Matematyczna Anna Janicka

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Testowanie hipotez statystycznych

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

przedmiot podstawowy obowiązkowy polski drugi

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

Prawdopodobieństwo i statystyka

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

Testowanie hipotez statystycznych cd.

Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Testowanie hipotez statystycznych.

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

1 Estymacja przedziałowa

WNIOSKOWANIE STATYSTYCZNE

Weryfikacja hipotez statystycznych

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

KARTA KURSU. Kod Punktacja ECTS* 1

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

Testowanie hipotez statystycznych.

Transkrypt:

Wydział Matematyki Testy zgodności Wykład 03

Testy zgodności W testach zgodności badamy postać rozkładu teoretycznego zmiennej losowej skokowej lub ciągłej. Weryfikują one stawiane przez badaczy hipotezy dotyczące rozkładu zmiennej losowej. Celem tych testów jest porównanie rozkładów dwóch cech w jednej populacji lub jednej cechy w dwóch populacjach. Testy zgodności nazywamy także testami nieparametrycznymi.

Rodzaje testów zgodności Dowolny rozkład Rozkład normalny Test chi-kwadrat Uniwersalny test dla dowolnych rozkładów, stosowany do dużych prób losowych. Test ten polega na porównaniu liczebności empirycznej z liczebnościami oczekiwanymi wyznaczonymi przez rozkład teoretyczny Test Kołomogorowa -Smirnowa (KS) Test dla rozkładów, ciągłych. Test ten polega na porównaniu dystrybuanty empirycznej z dystrybuantą rozkładu normalnego. Dla małych prób stosuje się test z poprawką Lillierforsa Test W Shapiro-Wilka Test dla małych prób. Posiada dużą moc. W teście wyznacza się wartość statystyki W. Im większa jest ta wartość, tym rozkład empiryczny jest bardziej zgodny z rozkładem normalnym.

Testowanie hipotez statystycznych schemat H 0 hipoteza zerowa H 1 hipoteza alternatywna 1. Losujemy próbkę {x 1,,x n } z populacji generalnej i obliczamy wartość wybranej statystyki S(x) dla x=(x 1,,x n ). 2. Ustalamy poziom istotności α (np. 0,05) 3. Wyznaczamy obszar krytyczny testu 4. Podejmujemy decyzję, jeśli obliczona wartość statystyki S(x) zawiera się w zbiorze krytycznym, wtedy odrzucamy hipotezę zerową, w przeciwnym wypadku nie ma podstaw do odrzucenia hipotezy zerowej, co oznacza, że hipoteza zerowa może (ale nie musi) być prawdziwa. W testowaniu hipotez wylicza się tzw. wartość p. Jest to prawdopodobieństwo zdarzenia wylosowania próbki, dla której uzyskamy konkretną wartość statystyki S(x)

Typy błędów w testowaniu hipotez statystycznych

Interpretacja wartości p

Test zgodności Chi-kwadrat - liczba obserwacji - prawdopodobieństwo, że cecha X przyjmie wartość należącą do i-tego przedziału klasowego - Liczba jednostek, które powinny znaleźć się w i-tym przedziale przy założeniu, że cecha ma rozkład zgodny z hipotezą zerową. Statystyka ma rozkład chi-kwadrat o k = r-s-1 stopniach swobody, gdzie s jest liczbą parametrów rozkładu wyliczoną z próby, a r jest liczbą przedziałów klasowych

Rozkład chi-kwadrat

Rozkład chi-kwadrat

Przykład 1 We wrocławskim ośrodku WORD przeprowadzono test 100 losowo wybranych kierowców, w którym badano refleks i uwagę. Każdy kierowca miał do wykonania zadania na czterech stanowiskach. Otrzymane wyniki podane są w poniższej tabeli Okazuje się, że w warszawskim ośrodku WORD prawdopodobieństwa liczby wykonania takich zadań przez kandydatów wynoszą Na poziomie istotności α = 0,01 zweryfikować hipotezę, że we wrocławskim ośrodku WORD rozkład wyników osiąganych przez kandydatów jest takim sam jak w Warszawie.

Przykład 1 Sformułowanie hipotez: H 0 wrocławscy kandydaci na kierowców uzyskują podobne wyniki, jak warszawscy kandydaci H 1 wyniki uzyskiwane we Wrocławiu różnią się od wyników uzyskiwanych przez warszawskich kandydatów

Przykład 1 Liczba stopni swobody k = 5 1 = 4

Przykład 1 Decyzja: nie ma podstaw do odrzucenia hipotezy, że wrocławscy kandydaci, są tak samo zdolni, jak ich warszawscy odpowiednicy

Przykład 1 stopień swobody =ROZKŁAD.CHI.ODWR(0,01;4) = 13,277 stopień swobody

Przykład 2 Na podstawie danych z karty zdarzeń drogowych, które wystąpiły na placu Dominikańskim we Wrocławiu w ciągu kilku lat (300 tygodni) nastąpiła znaczna liczba wypadków. Dane są przedstawione w poniższej tabeli: Na poziomie istotności α = 0,05 zweryfikować hipotezę, że rozkład zdarzeń jest rozkładem Poissona

Przykład 2 Sformułowanie hipotez: H 0 Rozkład zdarzeń jest rozkładem Poissona H 1 Rozkład zdarzeń nie jest rozkładem Poissona

Przykład 2 Zwiększamy wartość, tak aby prawdopodobieństwa sumowały się do 1

Przykład 2 Obliczamy wartość krytyczną statystyki dla k = 6-1 - 1 = 4 stopni swobody. Odejmujemy od liczby klas dodatkową jedynkę, bo parametr λ w rozkładzie teoretycznym Poissona obliczyliśmy z próby. =ROZKŁAD.CHI.ODWR(0,05;4) = 9,488

Przykład 2 1 2

Przykład 2 1 2 3

Przykład 2 1 2

Przykład 2 1 2

Przykład 2 Wartość statystyki chi-kwadrat Wartość p

Przykład 3 W poniższej tabeli zamieszczone są punkty uzyskane przez 100 studentów z egzaminu ze statystyki. Stosując test chi-kwadrat na poziomie istotności α = 0,05 zweryfikować hipotezę, że rozkład tych punktów jest normalny..

Przykład 3 Sformułowanie hipotez: H 0 Rozkład uzyskanych punktów z egzaminu ze statystyki jest rozkładem normalnym H 1 Rozkład uzyskanych punktów z egzaminu ze statystyki nie jest rozkładem normalnym

Przykład 3 Budujemy szereg rozdzielczy Liczymy parametry rozkładu

Przykład 3 Obliczamy prawdopodobieństwa teoretyczne, że obserwacja wpadnie do danego przedziału

Przykład 3 Liczba stopni swobody k = 5 2-1 = 2 Dwa parametry wyliczyliśmy z próby

Przykład 3 4,98 < 5,99 Decyzja: nie ma podstaw do odrzucenia hipotezy, że rozkład punktów jest normalny

Przykład 3 stopień swobody =ROZKŁAD.CHI.ODWR(0,01;2) = 5,99 stopień swobody

Przykład 3 1 2 3

Przykład 3 2 1

Przykład 3 1 2 Przy wyborze własnych przedziałów testy normalności są zablokowane

Przykład 3 1 2 testy normalności są odblokowane

Przykład 3

Przykład 3 1 2

Przykład 3 1 2

Przykład 3

Przykład 4 W poniższej tabeli zamieszczone są dane na temat miesięcznych wynagrodzeń netto 150 pracowników pewnej korporacji. Na poziomie istotności α = 0,05 zweryfikować hipotezę, że rozkład tych punktów jest normalny.

Przykład 4 1 2 3

Przykład 4 3

Przykład 4 Prawy przycisk myszy Wybieramy rozkład normalny

Przykład 4

Porównanie Dane z Przykładu 4 Dane z Przykładu 3