Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11

Podobne dokumenty
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Wydział Matematyki. Testy zgodności. Wykład 03

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Korelacja krzywoliniowa i współzależność cech niemierzalnych

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Badanie zgodności z określonym rozkładem. F jest dowolnym rozkładem prawdopodobieństwa. Test chi kwadrat zgodności. F jest rozkładem ciągłym

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Statystyka matematyczna. Wykład VI. Zesty zgodności

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Spis treści 3 SPIS TREŚCI

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Statystyka matematyczna dla leśników

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Statystyka matematyczna i ekonometria

Testowanie hipotez statystycznych cd.

1 Estymacja przedziałowa

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Testowanie hipotez statystycznych

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

Wykład 3 Hipotezy statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Estymacja parametrów rozkładu cechy

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Wykład 10 Testy jednorodności rozkładów

Estymacja punktowa i przedziałowa

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Estymatory i testy statystyczne - zadania na kolokwium

166 Wstęp do statystyki matematycznej

STATYSTYKA

12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

LISTA 4. 7.Przy sporządzaniu skali magnetometru dokonano 10 niezależnych pomiarów

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych

Hipotezy statystyczne

Statystyczna analiza danych

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Wykład 7 Testowanie zgodności z rozkładem normalnym

STATYSTYKA MATEMATYCZNA, LISTA 3

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Testy nieparametryczne

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

STATYSTYKA MATEMATYCZNA

POLITECHNIKA WARSZAWSKA

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

Hipotezy statystyczne

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Kolokwium ze statystyki matematycznej

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd.

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

Wykład 11 Testowanie jednorodności

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

ESTYMACJA. Przedział ufności dla średniej

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Statystyka matematyczna

Wykład dla studiów doktoranckich IMDiK PAN. Biostatystyka I. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

4.Zmienne losowe X 1, X 2,..., X 100 są niezależne i mają rozkład wykładniczy z α = 0.25 Jakie jest prawdopodobieństwo, że 1

Testowanie hipotez statystycznych. Wprowadzenie

Test t-studenta dla jednej średniej

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Testowanie hipotez statystycznych.

Przykład 1. (A. Łomnicki)

VIII WYKŁAD STATYSTYKA. 7/05/2014 B8 sala 0.10B Godz. 15:15

Statystyka w przykładach

Testowanie hipotez statystycznych

Prawdopodobieństwo i rozkład normalny cd.

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

HISTOGRAM. Dr Adam Michczyński - METODY ANALIZY DANYCH POMIAROWYCH Liczba pomiarów - n. Liczba pomiarów - n k 0.5 N = N =

Wnioskowanie statystyczne. Statystyka w 5

Teoria Estymacji. Do Powyżej

Transkrypt:

Testy zgodności Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki Szczecińskiej

27. Nieparametryczne testy zgodności Weryfikacja hipotezy nieparametrycznej zbadanie zgodności między hipotetycznym rozkładem w populacji, a empirycznym rozkładem w próbce zbadanie zgodności między empirycznymi rozkładami w dwóch próbkach Wstępne informacje co do postaci rozkładu analiza histogramu uzyskanego z próbki a) b) 0 0 Rys.27.1. Przykłady histogramów empirycznych

Testy zgodności dla jednej populacji (27.1) Testy zgodności dla jednej populacji test χ 2 Pearsona (n 80) test λ Kołmogorowa (liczność dowolna, cecha typu ciągłego) test Shapiro-Wilka (rozkład normalny, n 50) test Kołmogorowa-Lillieforsa (rozkład normalny, n > 30) Hipotezy H 0 : cecha X ma rozkład określony dystrybuantą F H 1 : H 0 Dla cechy typu ciągłego zakładamy, że wartości próbki są przedstawione w postaci szeregu przedziałowego rozdzielczego Lp. 1 2 k Granice klas x 1d x 1g x 2d x 2g x kd x kg Liczebność empiryczna n i n 1 n 2 n k Zauważmy, że x id = x i-1g

Test χ 2 Pearsona Model (test χ 2 Pearsona, n 80) Jeśli hipoteza H 0 jest prawdziwa, to prawdopodobieństwo p i, że cecha X typu ciągłego przyjmuje wartości należące do i-tej klasy można obliczyć ze wzoru pi = F( xig ) F( xi 1g ) Wtedy liczność hipotetyczna w i-tej klasie wyraża się wzorem np i i zachodzą następujące twierdzenia Twierdzenie a) Jeśli próba jest liczna (n 80), to statystyka ( N np ) 2 2 k i i χ = i= 1 npi ma w przybliżeniu rozkład χ 2 z k 1 stopniami swobody, gdzie N i jest zmienną losową, oznaczającą liczbę elementów próbki, należących do i-tej klasy

Test χ 2 Pearsona Twierdzenie cd. b) Jeśli dystrybuanta F cechy X zależy od l parametrów o nieznanych wartościach, to statystyka χ 2 ma w przybliżeniu rozkład χ 2 z k l 1 stopniami swobody Obszar krytyczny dla hipotezy alternatywnej H 1 : H 0 ma dla ustalonego poziomu ufności α postać K = χ 2 (1 α, k l 1), ) Uwaga Do klasy 1-szej i k-tej (ostatniej) powinno należeć co najmniej 5 elementów, do pozostałych klas co najmniej 10 elementów

Test χ 2 Pearsona Przykład (a) Z populacji, w której badana cecha X ma nieznaną dystrybuantę F pobrano próbkę o liczności 200 Wyniki po podziale na 10 równych klas zawarto w tabeli Środki klas 45,25 45,75 46,25 46,75 47,25 47,75 48,25 48,75 49,25 49,75 n i 23 19 25 18 17 24 16 22 20 16 Na poziomie istotności 0.05 zweryfikować hipotezę, że cecha X ma rozkład jednostajny na przedziale 40,50

Test χ 2 Pearsona Przykład (b) Doświadczenie dotyczy selekcji grochu Mendel obserwował liczności występowania różnych rodzajów nasion, otrzymanych przy krzyżowaniu roślin z okrągłymi i żółtymi nasionami oraz roślin z pomarszczonymi i zielonymi nasionami Otrzymane wyniki zebrano w tabeli Nasiona żółte zielone okrągłe 315 108 pomarszczone 101 Na poziomie istotności 0.05 zweryfikować hipotezę, że stosunek liczby czterech rodzajów nasion wynosi 9:3:3:1 32

Test χ 2 Pearsona Przykład (c) Dokonano 100 pomiarów wytrzymałości elementów żelbetonowych Wyniki przedstawiono w tabeli Wytrzymałość 289-291 291-293 293-295 295-297 297-299 Liczba pomiarów 1 4 9 15 24 Wytrzymałość 299-301 301-303 303-305 305-307 307-309 Liczba pomiarów 21 13 9 3 1 Na poziomie istotności 0.05 sprawdzić hipotezę, że zmienna losowa X, będąca modelem wytrzymałości tych elementów, ma rozkład normalny

Testy zgodności dla dwóch populacji (27.2) Testy zgodności dla dwóch populacji (cecha typu ciągłego) test serii test Smirnowa-Kołmogorowa test Wilcoxona Założenia W dwóch populacjach dystrybuanty F 1 i F 2 badanej cechy X są ciągłe Dane są dwie niezależne próbki proste o licznościach n 1 i n 2 odpowiednio Hipotezy H 0 : F 1 (x) = F 2 (x) H 1 : F 1 (x) F 2 (x)

Test serii Model (test serii) Wyniki obu próbek ustawiamy w n 1 +n 2 -elementowy ciąg niemalejący Tworzymy drugi ciąg, w którym a odpowiada elementom pierwszej próbki, b drugiej, np. aaabbabaab Ustalamy liczbę k serii występujących w ciągu (w powyższym jest 6 serii) Wyznaczamy obszar krytyczny K = 2, k( α, n, n ) gdzie k(α, n 1,n 2 ) odczytujemy z tablic rozkładu serii Odrzucamy hipotezę H 0 o zgodności rozkładów, jeśli k K 1 2

Test serii Przykład Chcemy sprawdzić, która kapusta: biała czy czerwona, zawiera więcej witaminy C Pobrano próbki 100 gramowe z każdego gatunku i wyznaczono ilość witaminy C dla każdej próbki w mg: Kapusta biała 45 50 64 38 66 43 49 58 31 49 Kapusta czerwona 70 68 55 61 62 74 52 71 56 Na poziomie istotności 0.05 zweryfikować testem serii hipotezę, że rozkłady zawartości witaminy C dla obu gatunków kapusty są identyczne

Dziękuję za uwagę