Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT Anna Rajfura 1
Przykład wprowadzający Wiadomo, że 40% owoców ulega uszkodzeniu podczas pakowania automatycznego. Jaki jest rozkład liczby owoców uszkodzonych w opakowaniu zawierającym cztery sztuki? Anna Rajfura 2
Przykład wprowadzający cd. Cecha X liczba owoców uszkodzonych w opakowaniu X ~ B (n = 4, p = 0,4) wartości zmiennej losowej: k = 0, 1, 2,..., n prawdopodobieństwo: P n n ( ) k ( ) n k X = k = p 1 p k wartość k 0 1 2 3 4 p-stwo p k = P 4 ( X = k) 0,1296 0,3456 0,3456 0,1536 0,0256 Σ p k = 1,0000 Anna Rajfura 3
Przykład wprowadzający cd. wartość k 0 1 2 3 4 p-stwo p k = P 4 (X = k) 0,1296 0,3456 0,3456 0,1536 0,0256 Σ p k = 1,0000 Wykres funkcji rozkładu p-stwa cechy X p-stwo 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00 0 1 2 3 4 5 liczba owoców uszkodzonych Anna Rajfura 4
Przykład 1. Przypuśćmy, że nie wiadomo, jaka część owoców ulega uszkodzeniu podczas automatycznego pakowania. Będzie to przedmiotem badania. Sprawdzono 200 opakowań. Wyniki przedstawia tabela: liczba owoców uszkodzonych 0 1 2 3 4 liczba opakowań 20 75 67 30 8 Σ = 200 Czy na podstawie otrzymanej próby można przyjąć, że liczba owoców uszkodzonych w jednym opakowaniu ma rozkład dwumianowy z parametrem p = 0,4? Anna Rajfura 5
Przykład 1. cd. Wyniki doświadczenia (dają rozkład empiryczny) liczba owoców uszkodzonych 0 1 2 3 4 liczba opakowań 20 75 67 30 8 Σ = 200 % opakowań 0,1 0,375 0,335 0,15 0,04 Rozkład teoretyczny wartość k 0 1 2 3 4 p-stwo p k = P 4 ( X = k ) 0,130 0,346 0,346 0,154 0,026 Σ p k = 1,000 Anna Rajfura 6
Przykład 1. cd. Wykres frp rozkładu dwumianowego Wykres częstości rozkładu empirycznego 0,40 0,35 pstwo częstość 0,30 0,25 0,20 0,15 0,10 0,05 0,00 0 1 2 3 4 5 liczba owoców uszkodzonych Anna Rajfura 7
Przykład 1. cd. (inny sposób porównania rozkładów) Wyniki doświadczenia (rozkład empiryczny) liczba owoców uszkodzonych liczba opakowań 0 1 2 3 4 20 75 67 30 8 Σ = 200 Rozkład teoretyczny wartość k 0 1 2 3 4 p-stwo p k = P 4 ( X = k ) liczebności teoretyczne n (t) = p k N 0,130 0,346 0,346 0,154 0,026 Σ p k = 1,000 26 69,2 69,2 30,8 5,2 200,4 Anna Rajfura 8
Badanie zgodności rozkładu empirycznego z rozkładem teoretycznym Cecha X liczba owoców uszkodzonych w opakowaniu; H 0 : X~ B (n = 4, p = 0,4), poziom istotności α = 0,05; test χ 2 (czyt.: chi - kwadrat), wzór funkcji testowej: r ( ) t χ 2 = ni ni emp n ( t ) i i= 1 gdzie: n i liczebność empiryczna ( t n ) i liczebność teoretyczna r liczba klas ( ) 2 Anna Rajfura 9
Badanie zgodności rozkładu empirycznego Wnioskowanie jeżeli χ z rozkładem teoretycznym cd. 2 emp 2 α, v > χ, to H 0 odrzucamy, = r 1 u w przeciwnym przypadku H 0 nie można odrzucić gdzie: u liczba parametrów, które należy oszacować na podstawie próby Obliczenia i wnioski na tablicy. Anna Rajfura 10
Wartości krytyczne rozkładu chi-kwadrat X ~ χ 2 ν - X zmienna losowa o rozkładzie chi-kwadrat z liczbą stopni swobody ν, α - poziom istotności, χ 2 α, ν - wartość krytyczna - liczba taka, że P(X > χ 2 α, ν ) = α ν \ a 0,995 0,990 0,975 0,950 0,900 0,100 0,050 0,025 0,010 0,005 1 0,0 4 393 0,0002 0,0010 0,0039 0,0158 2,7055 3,8415 5,0239 6,6349 7,8794 2 0,0100 0,0201 0,0506 0,1026 0,2107 4,6052 5,9915 7,3778 9,2104 10,5965 3 0,0717 0,1148 0,2158 0,3518 0,5844 6,2514 7,8147 9,3484 11,3449 12,8381 4 0,2070 0,2971 0,4844 0,7107 1,0636 7,7794 9,4877 11,1433 13,2767 14,8602 5 0,4118 0,5543 0,8312 1,1455 1,6103 9,2363 11,0705 12,8325 15,0863 16,7496 6 0,6757 0,8721 1,2373 1,6354 2,2041 10,6446 12,5916 14,4494 16,8119 18,5475 7 0,9893 1,2390 1,6899 2,1673 2,8331 12,0170 14,0671 16,0128 18,4753 20,2777 8 1,3444 1,6465 2,1797 2,7326 3,4895 13,3616 15,5073 17,5345 20,0902 21,9549 9 1,7349 2,0879 2,7004 3,3251 4,1682 14,6837 16,9190 19,0228 21,6660 23,5893 : 80 51,1719 53,5400 57,1532 60,3915 64,2778 96,5782 101,8795 106,6285 112,3288 116,3209 85 55,1695 57,6339 61,3888 64,7494 68,7771 102,0789 107,5217 112,3933 118,2356 122,3244 90 59,1963 61,7540 65,6466 69,1260 73,2911 107,5650 113,1452 118,1359 124,1162 128,2987 95 63,2495 65,8983 69,9249 73,5198 77,8184 113,0377 118,7516 123,8580 129,9725 134,2466 100 67,3275 70,0650 74,2219 77,9294 82,3581 118,4980 124,3421 129,5613 135,8069 140,1697 Anna Rajfura 11
Przykład 2. Badano wagę tuczników pewnej rasy po 8- miesięcznym tuczu. Czy na podstawie uzyskanych wyników (rozkład empiryczny) można stwierdzić, że ma ona rozkład normalny? Numer klasy Granice przedziału Środek przedz. x i 1. < 85 82,5 6 2. <85;90) 87,5 10 3. <90;95) 92,5 17 4. <95;100) 97,5 21 5. <100;105) 102,5 19 6. <105;110) 107,5 14 7. <110;115) 112,5 8 8. > 115 117,5 5 Razem 100 Liczebność n i Anna Rajfura 12
Był przykład: Wykres fgp rozkładu normalnego Wykres częstości rozkładu empirycznego 185,3 187,8 190,3 192,8 195,3 197,8 200,3 202,8 205,3 masa owocu Czy rozkład empiryczny wartości cechy X jest dobrze opisany za pomocą teoretycznego rozkładu normalnego? Anna Rajfura 13
Badanie zgodności rozkładu empirycznego z rozkładem teoretycznym Cecha X masa owocu pewnej odmiany; Uwagi... H 0 : X~ N, poziom istotności α = 0,05, Anna Rajfura 14
Uwagi 1. Można korzystać z faktu, że funkcja testowa ma asymptotycznie rozkład chi-kwadrat, o ile liczebność w każdej klasie wynosi co najmniej 5. Jeśli nie trzeba łączyć klasy, aby ten warunek był spełniony. 2. W hipotezie zerowej jest nazwa rozkładu, ale nie ma parametrów. Średnią i wariancję oszacujemy na podstawie próby, stąd weźmiemy liczbę parametrów szacowanych na podstawie próby. 3. Zastosujemy taką samą procedurę testowania hipotezy, jak w poprzednim przykładzie. Wymaga ona wyznaczenia liczebności teoretycznej w przedziałach, np. <85;90). Anna Rajfura 15
Wyznaczanie liczebności teoretycznej dla przedziału obliczanie p-stwa wartości z przedziału < a;b ) z wykorzystaniem dystrybuanty rozkładu normalnego przedstawienie p-stwa przy użyciu dystrybuanty zmiennej losowej X~N(µ,σ 2 ) standaryzacja - przedstawienie dystrybuanty zmiennej losowej X, przy użyciu dystrybuanty zmiennej losowej standardowej Z~N(0,1) odczyt z tablic dystrybuanty rozkładu normalnego; obliczenia. Anna Rajfura 16
x Numer klasy Wyznaczanie wartości średniej i wariancji dla próby w postaci szeregu rozdzielczego Granice przedziału Środek przedz. x i Liczebność n i x i n i (x i -x) 2 n i 1. < 85 82,5 6 495,0 1693,4 2. <85;90) 87,5 10 875,0 1392,4 3. <90;95) 92,5 17 1572,5 786,1 4. <95;100) 97,5 21 2047,5 68,0 5. <100;105) 102,5 19 1947,5 194,6 6. <105;110) 107,5 14 1505,0 941,4 7. <110;115) 112,5 8 900,0 1393,9 8. > 115 117,5 5 587,5 1656,2 Razem 100 9930,0 8126,0 9930 2 8126,0 = = 99,3, s = = 82,08, s 100 99 9,06 Anna Rajfura 17
Numer klasy Wyznaczanie wartości funkcji testowej Granice przedziału Liczebność n i p i n i (t) ( ( t n ) ) i ni ( t n ) 1. < 85 6 0,057 5,7 0,016 2. <85;90) 10 0,094 9,4 0,038 3. <90;95) 17 0,168 16,8 0,002 4. <95;100) 21 0,213 21,3 0,004 5. <100;105) 19 0,204 20,4 0,096 6. <105;110) 14 0,145 14,5 0,017 7. <110;115) 8 0,077 7,7 0,012 8. > 115 5 0,042 4,2 0,152 Razem 100 1,000 100,00 0,338 Obliczenia na tablicy. i 2 Anna Rajfura 18
Dystrybuanta standardowego rozkładu normalnego X zmienna losowa, f(x) funkcja gęstości, F(x) dystrybuanta X~N (0, 1), x F(x)= f (t) dt x 2 1 2 f (x) = e, 2π x 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586 0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535... 0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891 1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214 1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298 1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147 1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91308 0,91466 0,91621 0,91774 1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189 1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408 1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449 1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327 1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062 1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670... Anna Rajfura 19
Wartości krytyczne rozkładu chi-kwadrat X ~ χ 2 ν - X zmienna losowa o rozkładzie chi-kwadrat z liczbą stopni swobody ν, α - poziom istotności, χ 2 α, ν - wartość krytyczna - liczba taka, że P(X > χ 2 α, ν ) = α ν \ a 0,995 0,990 0,975 0,950 0,900 0,100 0,050 0,025 0,010 0,005 1 0,0 4 393 0,0002 0,0010 0,0039 0,0158 2,7055 3,8415 5,0239 6,6349 7,8794 2 0,0100 0,0201 0,0506 0,1026 0,2107 4,6052 5,9915 7,3778 9,2104 10,5965 3 0,0717 0,1148 0,2158 0,3518 0,5844 6,2514 7,8147 9,3484 11,3449 12,8381 4 0,2070 0,2971 0,4844 0,7107 1,0636 7,7794 9,4877 11,1433 13,2767 14,8602 5 0,4118 0,5543 0,8312 1,1455 1,6103 9,2363 11,0705 12,8325 15,0863 16,7496 6 0,6757 0,8721 1,2373 1,6354 2,2041 10,6446 12,5916 14,4494 16,8119 18,5475 7 0,9893 1,2390 1,6899 2,1673 2,8331 12,0170 14,0671 16,0128 18,4753 20,2777 8 1,3444 1,6465 2,1797 2,7326 3,4895 13,3616 15,5073 17,5345 20,0902 21,9549 9 1,7349 2,0879 2,7004 3,3251 4,1682 14,6837 16,9190 19,0228 21,6660 23,5893 : 80 51,1719 53,5400 57,1532 60,3915 64,2778 96,5782 101,8795 106,6285 112,3288 116,3209 85 55,1695 57,6339 61,3888 64,7494 68,7771 102,0789 107,5217 112,3933 118,2356 122,3244 90 59,1963 61,7540 65,6466 69,1260 73,2911 107,5650 113,1452 118,1359 124,1162 128,2987 95 63,2495 65,8983 69,9249 73,5198 77,8184 113,0377 118,7516 123,8580 129,9725 134,2466 100 67,3275 70,0650 74,2219 77,9294 82,3581 118,4980 124,3421 129,5613 135,8069 140,1697 Anna Rajfura 20
W pakiecie Statistica Do kolumn można wprowadzić dane dotyczące liczebności empirycznych i teoretycznych Anna Rajfura 21
W pakiecie Statistica Z menu wybrać Statystyka, Statystyki nieparametryczne, Z listy wybrać Chi-kwadrat dla liczności obserwowanych wz. oczekiwanych Anna Rajfura 22
Wybrać nazwy zmiennych W pakiecie Statistica Anna Rajfura 23
W pakiecie Statistica Zaakceptować przyciskiem OK Anna Rajfura 24