Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Podobne dokumenty
Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Wydział Matematyki. Testy zgodności. Wykład 03

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Dr Anna ADRIAN Paw B5, pok 407

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

Testy zgodności. Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych. Wykład 11

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Statystyka matematyczna dla leśników

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Wykład 3 Hipotezy statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Wykład 2 Hipoteza statystyczna, test statystyczny, poziom istotn. istotności, p-wartość i moc testu

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Testowanie hipotez statystycznych.

Hipotezy statystyczne

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Wykład 3 Testowanie hipotez statystycznych o wartości średniej. średniej i wariancji z populacji o rozkładzie normalnym

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Hipotezy statystyczne

... i statystyka testowa przyjmuje wartość..., zatem ODRZUCAMY /NIE MA POD- STAW DO ODRZUCENIA HIPOTEZY H 0 (właściwe podkreślić).

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Statystyka matematyczna. Wykład VI. Zesty zgodności

Statystyka matematyczna. Wykład V. Parametryczne testy istotności

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych

Badanie zgodności z określonym rozkładem. F jest dowolnym rozkładem prawdopodobieństwa. Test chi kwadrat zgodności. F jest rozkładem ciągłym

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 9 i 10 - Weryfikacja hipotez statystycznych

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 11 i 12 - Weryfikacja hipotez statystycznych

VII WYKŁAD STATYSTYKA. 30/04/2014 B8 sala 0.10B Godz. 15:15

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI TESTOWANIE HIPOTEZ PARAMETRYCZNYCH

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

166 Wstęp do statystyki matematycznej

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

Kolokwium ze statystyki matematycznej

Weryfikacja hipotez statystycznych

Zawartość. Zawartość

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Testowanie hipotez statystycznych

STATYSTYKA MATEMATYCZNA WYKŁAD 4. WERYFIKACJA HIPOTEZ PARAMETRYCZNYCH X - cecha populacji, θ parametr rozkładu cechy X.

1 Estymacja przedziałowa

Gdy n jest duże, statystyka ta (zwana statystyką chikwadrat), przy założeniu prawdziwości hipotezy H 0, ma w przybliżeniu rozkład χ 2 (k 1).

Testy zgodności 9 113

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Testowanie hipotez statystycznych.

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Spis treści 3 SPIS TREŚCI

Weryfikacja hipotez statystycznych

Testowanie hipotez statystycznych cd.

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Statystyczna analiza danych

Wykład 10 Testy jednorodności rozkładów

STATYSTYKA

Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT. Anna Rajfura 1

Wykład 11 Testowanie jednorodności

Estymacja punktowa i przedziałowa

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Zadania ze statystyki, cz.6

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

Testowanie hipotez statystycznych.

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Statystyka matematyczna

Statystyka matematyczna i ekonometria

ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna

Wykład 7 Testowanie zgodności z rozkładem normalnym

Matematyka i statystyka matematyczna dla rolników w SGGW

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1

Zadanie 1. Analiza Analiza rozkładu

b) Niech: - wśród trzech wylosowanych opakowań jest co najwyżej jedno o dawce 15 mg. Wówczas:

Prawdopodobieństwo i statystyka

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Wstęp do probabilistyki i statystyki. Wykład 4. Statystyki i estymacja parametrów

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

Porównanie dwóch rozkładów normalnych

Transkrypt:

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl

Weryfikacja hipotez dotyczących postaci nieznanego rozkładu -Testy zgodności. Podstawowe działania: Konstrukcja rozkładu empirycznego (a najlepiej kilku rozkładów o różnej liczbie klas); Ocena podobieństwa rozkładu empirycznego do określonego rozkładu teoretycznego postawienie hipotezy zerowej. Przyjęcie odpowiedniej statystyki, która może służyć za test do weryfikacji hipotezy zerowej; Weryfikacja hipotezy o zgodności rozkładu empirycznego z hipotetycznym rozkładem teoretycznym: wykonanie obliczeń podjęcie decyzji o przyjęciu lub odrzuceniu hipotezy zerowej.

Test χ 2 Pearsona Niech cecha X ma rozkład o dystrybuancie F Oś rzeczywistą dzielimy na r+1 rozłącznych przedziałów (- <a 1 <...a r+1 < ) Oznaczmy przez p j prawdopodobieństwo, że zmienna przyjmie wartość z przedziału I j, tzn. p j =F(a j )- F(a j-1 ), j=1,2,...,r+1 Niech p j >0 dla każdego j. Liczba n*p j jest oczekiwaną liczbą obserwacji n-elementowej próbki; Niech n j oznacza liczbę obserwacji, które rzeczywiście znalazły się w przedziale I j

Test χ 2 Pearsona Suma kwadratów różnic (n j -n*p j, ) tzn. r + 1 j = 1 ( ) 2 n np może być miarą zgodności rozkładu zaobserwowanego w próbce z rozkładem hipotetycznym K. Pearson udowodnił, że statystyka j j χ 2 r + 1 = j = 1 ( n np ) j np j j 2 (*) ma, gdy n, rozkład chi-kwadrat o r stopniach swobody

Test χ 2 Pearsona Statystyka określona wzorem (*), znana jest pod nazwą test χ 2 Pearsona. Statystyka ta nie zależy od postaci dystrybuanty cechy X, a tylko od prawdopodobieństw p j = P(X I j ), przy czym podział na przedziały I j jest zupełnie dowolny. Taki sam układ prawdopodobieństw p1,p2,...,p r+1 może odpowiadać wielu różnym rozkładom zarówno typu ciągłego jak i skokowego, stąd test χ 2 powinien być używany do weryfikowania hipotezy dotyczącej układu prawdopodobieństw a nie postaci rozkładu cechy X w populacji.

Test χ 2 Pearsona W teście χ 2, hipoteza zerowa dotyczy klasy wszystkich rozkładów dla których P(X I j ) = p j, hipoteza alternatywna obejmuje klasę wszystkich tych rozkładów, dla których co najmniej dla jednego j zachodzi P(X I j ) p j. Dla danej próbki statystyka χ 2 obliczona ze wzoru (*), będzie mieć taką samą wartość dla wielu różnych rozkładów

Weryfikacja hipotezy o zgodności rozkładu empirycznego z teoretycznym Przyjęcie hipotezy zerowej oznacza, że każdy rozkład należący do danej klasy może mieć zastosowanie do opisu zjawiska. Kierując się wiedzą o zjawisku, najczęściej wybiera się jeden z rozkładów należących do hipotezy zerowej, stąd często upraszcza się problem stosowania testu χ 2 formułując hipotezę zerową jako przypuszczenie, że cecha X ma w populacji rozkład określonej postaci (czyli opisany konkretną dystrybuantą) Mając sprecyzowaną hipotezę zerową i wybrany test do weryfikacji dalej postępowanie przebiega jak w testach parametrycznych.

Algorytm realizacji testu χ 2 Pearsona Przyjąć poziom istotności α, Odczytać z tablic rozkładu χ 2 wartość krytyczną χ 2 α dla zadanej wartości α i r=k-p-1 stopni swobody, gdzie k jest liczbą parametrów rozkładu teoretycznego k-jest liczba klas rozkładu empirycznego Obliczyć wartość statystyki testowej χ 2, (wg wzoru *) Porównać wartości χ 2 obliczone z wartością krytyczną χ2 α Ponieważ 2 2 P( χ > χα ) = α hipotezę H 0 odrzucamy ilekroć stwierdzimy, że H 0 przyjmujemy gdy 2 2 χ obliczone > χ α 2 2 χobliczone χ α

Komentarz do testu χ 2 Przedstawiona metoda weryfikacji hipotezy o postaci rozkładu jest oparta na granicznym rozkładzie statystyki (*), a zatem test χ 2, ma zastosowanie do próbek o dużej liczności n; Przyjmuje się, że test ten można stosować gdy np j 10 dla j=2,3,...,r oraz np 1 i np r+1 5; W przypadku podziału na osi 0x na przedziały, gdzie p j =1/(r+1) jest dopuszczalne stosowanie testu χ 2 już dla niewielkich liczności (n=15..20), przy r stopniach swobody oraz poziomie istotności α=0,05

Zastosowania testu χ 2 przykład1 Przeprowadzono obserwacje dotyczące wypadków drogowych na określonym terenie, spowodowanych przez kierowców będących w stanie nietrzeźwym. Wyniki podano w tabeli: Pn Wt Śr Cz Pt So N 19 15 16 14 13 18 17 Na poziomie α = 0,05 zweryfikować hipotezę, że dla każdego dnia tygodnia jest takie samo prawdopodobieństwo wypadku spowodowanego przez kierowcę będącego w stanie nietrzeźwym.

Wykonanie testu Dla α = 0,05 oraz r=n-1= 6 stopni swobody znajduję w tablicach χ 2 α = 12,592 obliczam wartość statystyki χ 2 według wzoru (*), przy czym przyjmuję n=112 p 1 =p 2 =...p 7 =1/7 np j =112/7=16 liczności n j biorę z tabelki i obliczam χ 2 obliczone=(9+1+0+4+9+4+1+)/16 = 1,75 Ponieważ χ 2 obliczone = 1,75 < χ2 α = 12,592, zatem nie ma podstaw do odrzucenia hipotezy zerowej, Utwierdziliśmy się w przekonaniu, że prawdopodobieństwo spowodowania wypadku na badanym terenie przez nietrzeźwego kierowcę jest jednakowe dla każdego dnia tygodnia.

Przykład badania zgodności z rozkładem normalnym W grupie 192 chorych wykonano pomiar pewnego parametru biochemicznego (PB) i uzyskano następujące wyniki wartość PB 5 5,5 6,5 7,5 8,5 9,5 10,5 11,5 12,5 13,5 14,5 15 liczba chorych 4 2 11 18 27 32 35 24 20 13 3 3 postawiono hipotezę H 0, że parametr PB ma rozkład normalny N (µ, σ) z danych empirycznych obliczono estymatory parametrów rozkładu i sformułowano następującą hipotezę H 0 : parametr PB ma rozkład normalny obliczono wartości statystyki χ 2

Przykład badania zgodności z rozkładem normalnym - dokończyć Zakres PB ni pi npi χ2 <6 6 0,03407 6,5086 0,04472 6-7 11 0,0509 9,78 0,15943 7-8 18 8-9 27 9-10 32 10-11 35 11-12 24 12-13 20 13-14 13 >14 6 Razem 192 1,74252

Przykład badania zgodności z rozkładem normalnym wskazówki do obliczeń Mamy: n=192 ; Obliczamy x śr = 10,044; s 2 = 4,91557; s=2,217108 P(6 X<7)=F(7)-F(6) = 0,050954 F(7)= Φ ((7-10,044)/2,217108))= Φ(-1,372959)= 1-0,91466 =0,085334 F(6) = Φ ((6-10,044)/2,217108))= Φ(-1,823997)=1-0,96562 = 0,03438 p 2 = 0,050954 n*p 2 =9,78 χ 2 obliczone=1,74 < χ 2 kryt=14,067 χ 2 kryt odczytano z tablic rozkładu χ 2 dla α=0.05 i r=7 (u nas r=10-2-1, bo liczba klas równa się 10 i dwa parametry rozkładu: średnia i wariancja, były obliczone)

Jak to sięliczy w Statistica

Jak to sięliczy w Statistica

Z tabeli liczności

Testy normalności w pakiecie Statistica

Testy normalności w pakiecie Statistica

Zastosowania testu χ 2 przykład 2

Tablice rozkładu χ 2 poziom istotności 0,99 0,95 0,9 0,1 0,05 0,01 l.ss 1 0,000 0,004 0,016 2,706 3,841 6,635 2 0,020 0,103 0,211 4,605 5,991 9,210 3 0,115 0,352 0,584 6,251 7,815 11,345 4 0,297 0,711 1,064 7,779 9,488 13,277 5 0,554 1,145 1,610 9,236 11,070 15,086 6 0,872 1,635 2,204 10,645 12,592 16,812 7 1,239 2,167 2,833 12,017 14,067 18,475 8 1,646 2,733 3,490 13,362 15,507 20,090 9 2,088 3,325 4,168 14,684 16,919 21,666 10 2,558 3,940 4,865 15,987 18,307 23,209 11 3,053 4,575 5,578 17,275 19,675 24,725 12 3,571 5,226 6,304 18,549 21,026 26,217 13 4,107 5,892 7,042 19,812 22,362 27,688 14 4,660 6,571 7,790 21,064 23,685 29,141 15 5,229 7,261 8,547 22,307 24,996 30,578

Zastosowania testu χ 2 przykład 2