Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT Anna Rajfura 1
Przykład W celu porównania skuteczności wybranych herbicydów: A, B, C sprawdzano, czy masa chwastów na poletku zaleŝy od stosowanego herbicydu. Przygotowano 400 poletek i zastosowano na nich herbicydy: A na 100 poletkach, B na 200, C na 100. Komentarz. Anna Rajfura 2
Przykład cd. W celu porównania skuteczności wybranych herbicydów: A, B, C sprawdzano, czy masa chwastów na poletku zaleŝy od stosowanego herbicydu. Przygotowano 400 poletek i zastosowano na nich herbicydy: A na 100 poletkach, B na 200, C na 100. Zanotowano masę chwastów na kaŝdym poletku przy uŝyciu kategorii: mała, średnia, duŝa. Wyniki doświadczenia zamieszczono w tabeli. Anna Rajfura 3
Przykład cd. Tabela zawiera liczby poletek z zaobserwowanymi kategoriami masy chwastów dla kaŝdego herbicydu. Rodzaj Masa chwastów Suma herbicydu mała średnia duŝa A n 11 = 25 n 12 = 35 n 13 = 40 100 B n 21 = 45 n 22 = 65 n 23 = 90 200 C n 31 = 50 n 32 = 30 n 33 = 20 100 Anna Rajfura 4
Przykład cd. Tabela zawiera liczby poletek z zaobserwowanymi kategoriami masy chwastów dla kaŝdego herbicydu. Rodzaj Masa chwastów Suma herbicydu mała średnia duŝa A n 11 = 25 n 12 = 35 n 13 = 40 100 B n 21 = 45 n 22 = 65 n 23 = 90 200 C n 31 = 50 n 32 = 30 n 33 = 20 100 Anna Rajfura 5
Rozkład empiryczny masy chwastów dla herbicydu A Rodzaj Masa chwastów herbicydu mała średnia duŝa Suma A n 11 = 25 n 12 = 35 n 13 = 40 100 Liczba poletek 50 40 30 20 10 0 Mała Średnia DuŜa Masa chwastów Anna Rajfura 6
Porównanie rozkładów empirycznych liczby poletek dla róŝnych herbicydów 100 80 60 40 20 0 A 100 80 60 40 20 0 B Mała Średnia DuŜa Mała Średnia DuŜa 100 80 60 40 20 0 C Mała Średnia DuŜa Anna Rajfura 7
Porównanie rozkładów empirycznych częstości poletek dla róŝnych herbicydów 0,5 0,5 0,4 0,4 0,3 0,2 A 0,3 0,2 B 0,1 0,1 0,0 0,0 Mała Średnia DuŜa Mała Średnia DuŜa 0,5 0,4 0,3 0,2 C 0,1 0,0 Mała Średnia DuŜa Anna Rajfura 8
Porównanie rozkładów empirycznych częstości poletek dla róŝnych herbicydów 0,6 0,5 0,4 0,3 0,2 0,1 0,0 A B C Mała Średnia DuŜa Anna Rajfura 9
Przykład cd. Rodzaj Masa chwastów Suma herbicydu mała średnia duŝa A n 11 = 25 n 12 = 35 n 13 = 40 100 B n 21 = 45 n 22 = 65 n 23 = 90 200 C n 31 = 50 n 32 = 30 n 33 = 20 100 Czy te trzy rozkłady są jednakowe? Czy rozkład masy chwastów zaleŝy od rodzaju herbicydu? Anna Rajfura 10
Czy masa chwastów zaleŝy od rodzaju herbicydu? cecha Y masa chwastów cecha X rodzaj herbicydu klasy cechy Y: mała, średnia, duŝa klasy cechy X: A, B, C Czy cecha Y zaleŝy od cechy X? Anna Rajfura 11
Badanie niezaleŝności rozkładów cech skategoryzowanych H 0 : cechy X i Y są niezaleŝne poziom istotności α test χ 2 (czyt.: chi-kwadrat) wzór funkcji testowej: χ 2 emp = ij i, j [ ( ) ] t n n gdzie: n ij liczebność empiryczna, n ij (t) liczebność teoretyczna Anna Rajfura 12 n ij ij ( t ) 2
Badanie niezaleŝności rozkładów cech skategoryzowanych cd. wzór funkcji testowej: χ 2 emp = ij i, j [ ( ) ] t n n gdzie: n ij liczebność empiryczna, n ij (t) liczebność teoretyczna n r i = j= 1 n ij, n = j k i= 1 r, k liczby klas cech X, Y n ij n ij, ij ( t ) n 2 ( t ) ij = n i n n j ; Anna Rajfura 13
wnioskowanie: jeŝeli χ 2 > χ 2, to H emp v = ( r 1) ( k 1) 0 odrzucamy, w przeciwnym przypadku H 0 nie moŝna odrzucić. Anna Rajfura 14
Przykład cd. Wyznaczanie liczebności teoretycznych Masa chwastów Suma herb. mała średnia duŝa n i A n 11 = 25 n 12 = 35 n 13 = 40 n 1 =100 Rodzaj B n 21 = 45 n 22 = 65 n 23 = 90 n 2 =200 C n 31 = 50 n 32 = 30 n 33 = 20 n 3 =100 Suma n j n 1 = 120 n 2 = 130 n 3 = 150 n = 400 Anna Rajfura 15
Przykład cd. Wyznaczanie liczebności teoretycznych cd. Rodzaj herb. Masa chwastów mała średnia duŝa n 11 = 25 n 12 = 35 n 13 = 40 Suma n i A n (t) 11 = n (t) 12 = n (t) 13 = n 1 =100 = (100 120)/400 = (100 130)/400 = (100 150)/400 = 30 = 32,5 = 37,5 B n 21 = 45 n 22 = 65 n 23 = 90 n 2 =200 C n 31 = 50 n 32 = 30 n 33 = 20 n 3 =100 Suma n j n 1 = 120 n 2 = 130 n 3 = 150 n = 400 Anna Rajfura 16
Przykład cd. Wyznaczanie liczebności teoretycznych cd. Rodzaj Masa chwastów herb. mała średnia duŝa n 11 = 25 n 12 = 35 n (t) A 11 = n (t) 12 = = (100 120)/400 = (100 130)/400 = 30 = 32,5 37,5 B C Suma n j n 21 = 45 n (t) 21 = = (200 120)/400 = 60 n 31 = 50 n 31 (t) = = (100 120)/400 = 30 n 22 = 65 n (t) 22 = = (200 130)/400 = 65 n 32 = 30 n 32 (t) = = (100 130)/400 = 32,5 n 13 = 40 n 13 (t) = = (100 150)/400 = n 23 = 90 n (t) 23 = = (200 150)/400 = 75 n 33 = 20 n 33 (t) = = (100 150)/400 = 37,5 Suma n i n 1 = 100 n 2 = 200 n 3 = 100 n 1 = 120 n 2 = 130 n 3 = 150 n = 400 Anna Rajfura 17
Przykład cd. χ χ Wyznaczanie wartości funkcji testowej 2 2 2 ( 25 30) ( 35 32, 5) ( 20 37, 5) = + +... + = 29, 63, emp 30 32, 5 37, 5 2 2 0 05 2 0 05 = χ = χ = 9, 49. kryt,,,, PoniewaŜ odrzucamy. (3 1)(3 1) 2 χ 2 emp kryt χ >, to hipotezę H 0 Zatem moŝna stwierdzić, Ŝe masa chwastów na poletku jest zaleŝna od rodzaju herbicydu. Anna Rajfura 18 4 2
Wartości krytyczne rozkładu chi-kwadrat X ~ χ 2 ν - X zmienna losowa o rozkładzie chi-kwadrat z liczbą stopni swobody ν, α - poziom istotności, χ 2 α, ν - wartość krytyczna - liczba taka, Ŝe P(X > χ 2 α, ν ) = α ν \ a 0,995 0,990 0,975 0,950 0,900 0,100 0,050 0,025 0,010 0,005 1 0,0 4 393 0,0002 0,0010 0,0039 0,0158 2,7055 3,8415 5,0239 6,6349 7,8794 2 0,0100 0,0201 0,0506 0,1026 0,2107 4,6052 5,9915 7,3778 9,2104 10,5965 3 0,0717 0,1148 0,2158 0,3518 0,5844 6,2514 7,8147 9,3484 11,3449 12,8381 4 0,2070 0,2971 0,4844 0,7107 1,0636 7,7794 9,4877 11,1433 13,2767 14,8602 5 0,4118 0,5543 0,8312 1,1455 1,6103 9,2363 11,0705 12,8325 15,0863 16,7496 6 0,6757 0,8721 1,2373 1,6354 2,2041 10,6446 12,5916 14,4494 16,8119 18,5475 7 0,9893 1,2390 1,6899 2,1673 2,8331 12,0170 14,0671 16,0128 18,4753 20,2777 8 1,3444 1,6465 2,1797 2,7326 3,4895 13,3616 15,5073 17,5345 20,0902 21,9549 9 1,7349 2,0879 2,7004 3,3251 4,1682 14,6837 16,9190 19,0228 21,6660 23,5893 : 80 51,1719 53,5400 57,1532 60,3915 64,2778 96,5782 101,8795 106,6285 112,3288 116,3209 85 55,1695 57,6339 61,3888 64,7494 68,7771 102,0789 107,5217 112,3933 118,2356 122,3244 90 59,1963 61,7540 65,6466 69,1260 73,2911 107,5650 113,1452 118,1359 124,1162 128,2987 95 63,2495 65,8983 69,9249 73,5198 77,8184 113,0377 118,7516 123,8580 129,9725 134,2466 100 67,3275 70,0650 74,2219 77,9294 82,3581 118,4980 124,3421 129,5613 135,8069 140,1697 Anna Rajfura 19
Temat*: BADANIE NIEZALEśNOŚCI DWÓCH CECH SKATEGORYZOWANYCH KORELACJA RANG SPEARMANA Anna Rajfura 20
Przykład Sprawdzano, czy liczba roślin chwastu gatunku I zaleŝy od liczby roślin chwastu gatunku II. Zebrano wyniki z sześciu poletek. Anna Rajfura 21
Przykład cd. Nr poletka Chwasty gat. I Chwasty gat. II 1. 2 3 2. 4 2 3. 5 8 4. 8 6 5. 9 9 6. 10 7 Anna Rajfura 22
Korelacja rang Spearmana r s współczynnik korelacji rang Spearmana r s słuŝy do oceny współzaleŝności między dwiema zmiennymi (cechami) w odróŝnieniu od współczynnika korelacji Pearsona przy pomocy współczynnika r s moŝna oceniać zaleŝności nieliniowe Anna Rajfura 23
Korelacja rang Spearmana cd. przy testowaniu r s nie jest wymagana normalność rozkładu zmiennych (wymagana przy stosowaniu współczynnika korelacji Persona) wartości r s są z zakresu [-1, 1] a ich interpretacja jest podobna jak w przypadku współczynnika korelacji Pearsona Anna Rajfura 24
Współczynnik korelacji rang Spearmana r s N 6 = = D 2 i 1 i 1 2 N ( N 1) D i róŝnica rang dla i-tej jednostki statystycznej N liczba jednostek statystycznych Anna Rajfura 25
Przykład cd. Nr poletka Chwasty gat. I Rangi I 1. 2 1 2. 4 2 3. 5 3 4. 8 4 5. 9 5 6. 10 6 Anna Rajfura 26
Przykład cd. Nr poletka Chwasty gat. II Rangi II 1. 3 2 2. 2 1 3. 8 5 4. 6 3 5. 9 6 6. 7 4 Anna Rajfura 27
Przykład cd. Nr poletka Chwasty gat. I Rangi I Chwasty gat. II Rangi II 1. 2 1 3 2 2. 4 2 2 1 3. 5 3 8 5 4. 8 4 6 3 5. 9 5 9 6 6. 10 6 7 4 Anna Rajfura 28
Przykład cd. Nr poletka Rangi I Rangi II RóŜnica rang 1. 1 2-1 2. 2 1 1 3. 3 5-2 4. 4 3 1 5. 5 6-1 6. 6 4 2 Anna Rajfura 29
Przykład cd. Nr poletka Rangi I Rangi II RóŜnica rang Kwadrat róŝnicy rang 1. 1 2-1 1 2. 2 1 1 1 3. 3 5-2 4 4. 4 3 1 1 5. 5 6-1 1 6. 6 4 2 4 Suma 12 Anna Rajfura 30
Współczynnik korelacji rang Spearmana dla przykładu r s = 1 6 N i= 1 2 N ( N D 2 i 1) = 1 6 12 6 (6 2 1) = = 23 35 0,66 Anna Rajfura 31
Hipoteza o niezaleŝności cech X, Y H 0 : cechy X, Y są niezaleŝne H 1 : cechy X, Y są zaleŝne poziom istotności α test korelacji rang Spearmana r emp 6 = r = 1 i= 1 2 s N N ( N D 2 i 1) Anna Rajfura 32
Wartości krytyczne współczynnika korelacji rang Spearmana poziom 0,05 0,01 istotności N=4 1 5 0.9 1 6 0.8285 0.9428 7 0.7142 0.8928 8 0.6428 0.8333 9 0.6 0.7833 10 0.5636 0.7454 11 0.5363 0.709 12 0.5034 0.6783 13 0.4835 0.6483 14 0.4637 0.6263 15 0.4464 0.6035 16 0.4294 0.5823 poziom istotności 0,05 0,01 N=17 0.4142 0.5661 18 0.4014 0.55 19 0.3912 0.535 20 0.3804 0.5203 21 0.3701 0.509 22 0.3608 0.4974 23 0.3527 0.4861 24 0.3443 0.4765 25 0.3369 0.4661 26 0.3305 0.457 27 0.3241 0.4487 28 0.3174 0.4406 29 0.3118 0.4325 30 0.3063 0.4255 Anna Rajfura 33
Hipoteza o niezaleŝności cech X, Y cd. r kryt = r N Wnioskowanie: Jeśli r emp > r kryt, to H 0 odrzucamy, wpp H 0 nie moŝna odrzucić. Anna Rajfura 34
Przykład cd. H 0 : liczby roślin chwastu gat. I i II na poletku są niezaleŝne H 1 : liczby roślin chwastu gat. I i II na poletku są zaleŝne poziom istotności α = 0,05 test korelacji rang Spearmana r emp = 0,66 r = r = 6 kryt 0,8285 Wniosek statystyczny: poniewaŝ r emp <r kryt, to H 0 nie moŝna odrzucić. Anna Rajfura 35
Przykład cd. Wniosek merytoryczny: liczby roślin chwastów gat. I i II na poletku są niezaleŝne. Anna Rajfura 36
Przykład* Czy ocena na egzaminie ze statystyki zaleŝy od oceny na zaliczenie ćwiczeń z tego przedmiotu? Anna Rajfura 37
Przykład* cd. Zal Egz 3,0 5,0 4,5 4,5 4,0 3,0 5,0 4,0 4,0 4,0 3,0 3,5 3,0 3,0 3,5 4,0 4,0 4,0 3,0 3,0 4,0 3,5 3,5 4,0 3,0 2,0 3,0 3,5 Anna Rajfura 38
Przykład* cd. wyznaczanie rang Zal Rangi Zal Egz 3,0 5,0 4,5 4,5 4,0 3,0 5,0 4,0 4,0 4,0 3,0 3,5 3,0 3,0 3,5 4,0 4,0 4,0 3,0 3,0 4,0 3,5 3,5 4,0 3,0 2,0 3,0 3,5 Anna Rajfura 39
Przykład* cd. uporządkowanie wg Zal Zal Rangi Zal Egz 3,0 5,0 3,0 3,5 3,0 3,0 3,0 3,0 3,0 2,0 3,0 3,5 3,5 4,0 3,5 4,0 4,0 3,0 4,0 4,0 4,0 4,0 4,0 3,5 4,5 4,5 5,0 4,0 Anna Rajfura 40
Przykład* cd. uporządkowanie wg Zal Lp. Zal Zal Rangi Zal Egz 1. 3,0 5,0 2. 3,0 3,5 3. 3,0 3,0 4. 3,0 3,0 5. 3,0 2,0 6. 3,0 3,5 3,5 4,0 3,5 4,0 4,0 3,0 4,0 4,0 4,0 4,0 4,0 3,5 4,5 4,5 5,0 4,0 Anna Rajfura 41
Przykład* cd. uporządkowanie wg Zal Lp. Zal Zal Rangi Zal Egz 1. 3,0 3,5 5,0 2. 3,0 3,5 3,5 3. 3,0 3,5 3,0 4. 3,0 3,5 3,0 5. 3,0 3,5 2,0 6. 3,0 3,5 3,5 3,5 4,0 3,5 4,0 4,0 3,0 4,0 4,0 4,0 4,0 4,0 3,5 4,5 4,5 5,0 4,0 Anna Rajfura 42
Przykład* cd. uporządkowanie wg Zal Lp. Zal Zal Rangi Zal Egz 1. 3,0 3,5 5,0 2. 3,0 3,5 3,5 3. 3,0 3,5 3,0 4. 3,0 3,5 3,0 5. 3,0 3,5 2,0 6. 3,0 3,5 3,5 7. 3,5 4,0 8. 3,5 4,0 4,0 3,0 4,0 4,0 4,0 4,0 4,0 3,5 4,5 4,5 5,0 4,0 Anna Rajfura 43
Przykład* cd. uporządkowanie wg Zal Lp. Zal Zal Rangi Zal Egz 1. 3,0 3,5 5,0 2. 3,0 3,5 3,5 3. 3,0 3,5 3,0 4. 3,0 3,5 3,0 5. 3,0 3,5 2,0 6. 3,0 3,5 3,5 7. 3,5 7,5 4,0 8. 3,5 7,5 4,0 4,0 3,0 4,0 4,0 4,0 4,0 4,0 3,5 4,5 4,5 5,0 4,0 Anna Rajfura 44
Przykład* cd. uporządkowanie wg Zal Lp. Zal Zal Rangi Zal Egz 1. 3,0 3,5 5,0 2. 3,0 3,5 3,5 3. 3,0 3,5 3,0 4. 3,0 3,5 3,0 5. 3,0 3,5 2,0 6. 3,0 3,5 3,5 7. 3,5 7,5 4,0 8. 3,5 7,5 4,0 9. 4,0 3,0 10. 4,0 4,0 11. 4,0 4,0 12. 4,0 3,5 4,5 4,5 5,0 4,0 Anna Rajfura 45
Przykład* cd. uporządkowanie wg Zal Lp. Zal Zal Rangi Zal Egz 1. 3,0 3,5 5,0 2. 3,0 3,5 3,5 3. 3,0 3,5 3,0 4. 3,0 3,5 3,0 5. 3,0 3,5 2,0 6. 3,0 3,5 3,5 7. 3,5 7,5 4,0 8. 3,5 7,5 4,0 9. 4,0 10,5 3,0 10. 4,0 10,5 4,0 11. 4,0 10,5 4,0 12. 4,0 10,5 3,5 4,5 4,5 5,0 4,0 Anna Rajfura 46
Przykład* cd. uporządkowanie wg Zal Lp. Zal Zal Rangi Zal Egz 1. 3,0 3,5 5,0 2. 3,0 3,5 3,5 3. 3,0 3,5 3,0 4. 3,0 3,5 3,0 5. 3,0 3,5 2,0 6. 3,0 3,5 3,5 7. 3,5 7,5 4,0 8. 3,5 7,5 4,0 9. 4,0 10,5 3,0 10. 4,0 10,5 4,0 11. 4,0 10,5 4,0 12. 4,0 10,5 3,5 13. 4,5 13 4,5 14. 5,0 14 4,0 Anna Rajfura 47
Przykład* cd. uporządkowanie wg Egz Lp. Zal Zal Rangi Zal Egz 5. 3 3,5 2 3. 3 3,5 3 4. 3 3,5 3 9. 4 10,5 3 2. 3 3,5 3,5 6. 3 3,5 3,5 12. 4 10,5 3,5 7. 3,5 7,5 4 8. 3,5 7,5 4 10. 4 10,5 4 11. 4 10,5 4 14. 5 14 4 13. 4,5 13 4,5 1. 3 3,5 5 Anna Rajfura 48
Przykład* cd. uporządkowanie wg Egz Lp. Zal Zal Rangi Zal Egz Rangi Egz 5. 3 3,5 2 3. 3 3,5 3 4. 3 3,5 3 9. 4 10,5 3 2. 3 3,5 3,5 6. 3 3,5 3,5 12. 4 10,5 3,5 7. 3,5 7,5 4 8. 3,5 7,5 4 10. 4 10,5 4 11. 4 10,5 4 14. 5 14 4 13. 4,5 13 4,5 1. 3 3,5 5 Anna Rajfura 49
Przykład* cd. uporządkowanie wg Egz Lp. Zal Zal Rangi Zal Lp. Egz Egz Rangi Egz 5. 3 3,5 1. 2 3. 3 3,5 2. 3 4. 3 3,5 3. 3 9. 4 10,5 4. 3 2. 3 3,5 5. 3,5 6. 3 3,5 6. 3,5 12. 4 10,5 7. 3,5 7. 3,5 7,5 8. 4 8. 3,5 7,5 9. 4 10. 4 10,5 10. 4 11. 4 10,5 11. 4 14. 5 14 12. 4 13. 4,5 13 13. 4,5 1. 3 3,5 14. 5 Anna Rajfura 50
Przykład* cd. uporządkowanie wg Egz Lp. Zal Zal Rangi Zal Lp. Egz Egz Rangi Egz 5. 3 3,5 1. 2 3. 3 3,5 2. 3 4. 3 3,5 3. 3 9. 4 10,5 4. 3 2. 3 3,5 5. 3,5 6. 3 3,5 6. 3,5 12. 4 10,5 7. 3,5 7. 3,5 7,5 8. 4 8. 3,5 7,5 9. 4 10. 4 10,5 10. 4 11. 4 10,5 11. 4 14. 5 14 12. 4 13. 4,5 13 13. 4,5 1. 3 3,5 14. 5 Anna Rajfura 51
Przykład* cd. uporządkowanie wg Egz Lp. Zal Zal Rangi Zal Lp. Egz Egz Rangi Egz 5. 3 3,5 1. 2 1 3. 3 3,5 2. 3 3 4. 3 3,5 3. 3 3 9. 4 10,5 4. 3 3 2. 3 3,5 5. 3,5 6 6. 3 3,5 6. 3,5 6 12. 4 10,5 7. 3,5 6 7. 3,5 7,5 8. 4 10 8. 3,5 7,5 9. 4 10 10. 4 10,5 10. 4 10 11. 4 10,5 11. 4 10 14. 5 14 12. 4 10 13. 4,5 13 13. 4,5 13 1. 3 3,5 14. 5 14 Anna Rajfura 52
Przykład* cd. obliczanie r s Rangi Zal Rangi Egz RóŜnice rang 3,5 1 3,5-1=2,5 3,5 3 0,5 3,5 3 0,5 10,5 3 7,5 3,5 6-2,5 3,5 6-2,5 10,5 6 4,5 7,5 10-2,5 7,5 10-2,5 10,5 10 0,5 10,5 10 0,5 14 10 4 13 13 0 3,5 14-10,5 Anna Rajfura 53
Przykład* cd. obliczanie r s Suma kwadratów róŝnic: r s = 14 14 i = 1 D i = 235 6 Di 6 235 i= 1 = 1 14 (14 2 1) 14 (14 1) 1 2 0,48 r kryt = r N=14 = 0,46 Anna Rajfura 54
Przykład* cd. testowanie r s H 0 : ocena na egzaminie ze statystyki nie zaleŝy od oceny z ćwiczeń H 1 : ocena na egzaminie ze statystyki zaleŝy od oceny z ćwiczeń poziom istotności α = 0,05 r s emp = 0,48 r s kryt = 0,46 PoniewaŜ r s emp > r s kryt, to H 0 odrzucamy. Ocena na egzaminie ze statystyki zaleŝy od oceny z ćwiczeń. Anna Rajfura 55