Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

Podobne dokumenty
Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT. Anna Rajfura 1

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Testowanie hipotez statystycznych

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

WYKŁAD 8 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Testowanie hipotez statystycznych.

Wydział Matematyki. Testy zgodności. Wykład 03

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Wykład dla studiów doktoranckich IMDiK PAN. Biostatystyka I. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

1. Jednoczynnikowa analiza wariancji 2. Porównania szczegółowe

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Test zgodności i analiza wariancji Analiza wariancji

TABELE WIELODZIELCZE

Badanie zależności pomiędzy zmiennymi

Testowanie hipotez statystycznych cd.

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

STATYSTYKA OPISOWA. Dr Alina Gleska. 12 listopada Instytut Matematyki WE PP

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Statystyka matematyczna Test χ 2. Wrocław, r

Porównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

ρ siła związku korelacyjnego brak słaba średnia silna bardzo silna

Matematyka i statystyka matematyczna dla rolników w SGGW

GRUPY NIEZALEŻNE Chi kwadrat Pearsona GRUPY ZALEŻNE (zmienne dwuwartościowe) McNemara Q Cochrana

Statystyka. Wykład 8. Magdalena Alama-Bućko. 23 kwietnia Magdalena Alama-Bućko Statystyka 23 kwietnia / 38

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

PDF created with FinePrint pdffactory Pro trial version

Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA

STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech

Statystyczna analiza danych w programie STATISTICA (wykład 2) Dariusz Gozdowski

Statystyka matematyczna dla leśników

Zawartość. Zawartość

Wykład 3 Hipotezy statystyczne

Testowanie hipotez. Hipoteza prosta zawiera jeden element, np. H 0 : θ = 2, hipoteza złożona zawiera więcej niż jeden element, np. H 0 : θ > 4.

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 11 DOŚWIADCZENIE JEDNOCZYNNIKOWE W UKŁADZIE CAŁKOWICIE LOSOWYM PORÓWNANIA SZCZEGÓŁOWE

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Analiza Współzależności

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

ĆWICZENIE 11 NIEPARAMETRYCZNE TESTY ISTOTNOŚCI

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

Elementarne metody statystyczne 9

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Zmienna losowa dwuwymiarowa i korelacja

Korelacja krzywoliniowa i współzależność cech niemierzalnych

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Statystyka. Wykład 7. Magdalena Alama-Bućko. 3 kwietnia Magdalena Alama-Bućko Statystyka 3 kwietnia / 36

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 9. TESTOWANIE HIPOTEZ STATYSTYCZNYCH cd.

Badanie zgodności z określonym rozkładem. F jest dowolnym rozkładem prawdopodobieństwa. Test chi kwadrat zgodności. F jest rozkładem ciągłym

TECHNIKA DRZWI ZATRZAŚNIĘTE PRZED NOSEM

Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

STATYSTYKA I DOŚWIADCZALNICTWO

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

NIEZALEŻNOŚĆ i ZALEŻNOŚĆ między cechami Test chi-kwadrat, OR, RR

Statystyka. Wykład 9. Magdalena Alama-Bućko. 7 maja Magdalena Alama-Bućko Statystyka 7 maja / 40

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski

WNIOSKOWANIE STATYSTYCZNE

Wykład 11 Testowanie jednorodności

Błędy przy testowaniu hipotez statystycznych. Decyzja H 0 jest prawdziwa H 0 jest faszywa

Statystyka matematyczna dla kierunku Rolnictwo w SGGW. BADANIE WSPÓŁZALEśNOŚCI DWÓCH CECH. ANALIZA KORELACJI PROSTEJ.

LABORATORIUM 9 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Testy nieparametryczne

ĆWICZENIE 11 ANALIZA KORELACJI I REGRESJI

KORELACJE I REGRESJA LINIOWA

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35

STATYSTYKA MATEMATYCZNA WYKŁAD 5. 2 listopada 2009

Spis treści. Księgarnia PWN: Bruce M. King, Edward W. Minium - Statystyka dla psychologów i pedagogów. Wstęp Wprowadzenie...

Metodologia badań psychologicznych. Wykład 12. Korelacje

Wykład 8 Dane kategoryczne

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Wykład dla studiów doktoranckich IMDiK PAN. Biostatystyka I. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Statystyka. #6 Analiza wariancji. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2015/ / 14

Badania eksperymentalne

Estymacja punktowa i przedziałowa

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

Badanie normalności rozkładu

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

ANALIZA DWUZMIENNOWA. czyli ABC KOREALCJI

Transkrypt:

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat Anna Rajfura 1

Przykład W celu porównania skuteczności wybranych herbicydów: A, B, C sprawdzano, czy masa chwastów na poletku zależy od stosowanego herbicydu. Przygotowano 400 poletek i zastosowano na nich herbicydy: A na 100 poletkach, B na 00, C na 100. Komentarz. Anna Rajfura

Przykład cd. W celu porównania skuteczności wybranych herbicydów: A, B, C sprawdzano, czy masa chwastów na poletku zależy od stosowanego herbicydu. Przygotowano 400 poletek i zastosowano na nich herbicydy: A na 100 poletkach, B na 00, C na 100. Zanotowano masę chwastów na każdym poletku przy użyciu kategorii: mała, średnia, duża. Wyniki doświadczenia zamieszczono w tabeli. Anna Rajfura 3

Przykład cd. Tabela zawiera liczby poletek z zaobserwowanymi kategoriami masy chwastów dla każdego herbicydu. Rodzaj herbicydu Masa chwastów mała średnia duża Suma A n11 = 5 n1 = 35 n13 = 40 100 B n1 = 45 n = 65 n3 = 90 00 C n31 = 50 n3 = 30 n33 = 0 100 Anna Rajfura 4

Przykład cd. Tabela zawiera liczby poletek z zaobserwowanymi kategoriami masy chwastów dla każdego herbicydu. Rodzaj herbicydu Masa chwastów mała średnia duża Suma A n11 = 5 n1 = 35 n13 = 40 100 B n1 = 45 n = 65 n3 = 90 00 C n31 = 50 n3 = 30 n33 = 0 100 Anna Rajfura 5

Rozkład empiryczny masy chwastów dla Rodzaj herbicydu herbicydu A Masa chwastów mała średnia duża Suma A n11 = 5 n1 = 35 n13 = 40 100 Anna Rajfura 6

Rozkład empiryczny masy chwastów dla Rodzaj herbicydu herbicydu A Masa chwastów mała średnia duża Suma A n11 = 5 n1 = 35 n13 = 40 100 Liczba poletek 50 40 30 0 10 0 Mała Średnia Duża Masa chwastów Anna Rajfura 7

Porównanie rozkładów empirycznych liczby poletek dla różnych herbicydów 100 80 60 40 A 100 80 60 40 B 0 0 0 0 Mała Średnia Duża Mała Średnia Duża 100 80 60 40 0 0 C Mała Średnia Duża Anna Rajfura 8

Porównanie rozkładów empirycznych częstości poletek dla różnych herbicydów 0,5 0,5 0,4 0,4 0,3 0, A 0,3 0, B 0,1 0,1 0,0 0,0 Mała Średnia Duża Mała Średnia Duża 0,5 0,4 0,3 0, C 0,1 0,0 Mała Średnia Duża Anna Rajfura 9

Porównanie rozkładów empirycznych częstości poletek dla różnych herbicydów 0,6 0,5 0,4 0,3 0, 0,1 0,0 A B C Mała Średnia Duża Anna Rajfura 10

Przykład cd. Rodzaj herbicydu Masa chwastów mała średnia duża Czy te trzy rozkłady są jednakowe? Czy rozkład masy chwastów zależy od rodzaju herbicydu? Suma A n11 = 5 n1 = 35 n13 = 40 100 B n1 = 45 n = 65 n3 = 90 00 C n31 = 50 n3 = 30 n33 = 0 100 Anna Rajfura 11

Czy masa chwastów zależy od rodzaju herbicydu? cecha Y masa chwastów cecha X rodzaj herbicydu klasy cechy Y: mała, średnia, duża klasy cechy X: A, B, C Czy cecha Y zależy od cechy X? Anna Rajfura 1

Badanie niezależności rozkładów cech skategoryzowanych H 0 : cechy X i Y są niezależne poziom istotności α test χ (czyt.: chi-kwadrat) wzór funkcji testowej: emp Anna Rajfura 13 n = ij i, j gdzie: n ij liczebność empiryczna, n ij (t) liczebność teoretyczna n n ij ij ( t ) ( t )

Badanie niezależności rozkładów cech skategoryzowanych cd. wzór funkcji testowej: emp n = ij i, j gdzie: n ij liczebność empiryczna, n ij (t) liczebność teoretyczna n r i = j= 1 n ij, n = j k i= 1 r, k liczby klas cech X, Y n ij n n ij, ij ( t ) ( t ) n ( t) ij = n i n n j ; Anna Rajfura 14

wnioskowanie: jeżeli emp v = ( r 1) ( k 1), to H 0 odrzucamy, w przeciwnym przypadku H 0 nie można odrzucić. Anna Rajfura 15

Przykład cd. Rodzaj herb. Wyznaczanie liczebności teoretycznych Masa chwastów mała średnia duża Suma n i A n 11 = 5 n 1 = 35 n 13 = 40 n 1 =100 B n 1 = 45 n = 65 n 3 = 90 n =00 C n 31 = 50 n 3 = 30 n 33 = 0 n 3 =100 Suma n j n 1 = 10 n = 130 n 3 = 150 n = 400 Anna Rajfura 16

Przykład cd. Wyznaczanie liczebności teoretycznych cd. Rodzaj herb. Masa chwastów Suma n i mała średnia duża A n 11 = 5 n 1 = 35 n 13 = 40 n (t) 11 = n (t) 1 = n (t) 13 = = (100 10)/400 n 1 =100 = 30 B n 1 = 45 n = 65 n 3 = 90 n =00 C n 31 = 50 n 3 = 30 n 33 = 0 n 3 =100 Suma n j n 1 = 10 n = 130 n 3 = 150 n = 400 Anna Rajfura 17

Przykład cd. Wyznaczanie liczebności teoretycznych cd. Rodzaj herb. A B C Suma n j Masa chwastów mała średnia duża n 1 = 35 (t) n 1 = = (100 130)/400 = 3,5 = 37,5 n 11 = 5 (t) n 11 = = (100 10)/400 = 30 n 1 = 45 (t) n 1 = = (00 10)/400 = 60 n 31 = 50 n 31 (t) = = (100 10)/400 = 30 n = 65 (t) n = = (00 130)/400 = 65 n 3 = 30 n 3 (t) = = (100 130)/400 = 3,5 n 13 = 40 n 13 (t) = = (100 150)/400 n 3 = 90 (t) n 3 = = (00 150)/400 = 75 n 33 = 0 n 33 (t) = = (100 150)/400 = 37,5 Suma n i n 1 = 100 n = 00 n 3 = 100 n 1 = 10 n = 130 n 3 = 150 n = 400 Anna Rajfura 18

Przykład cd. Wyznaczanie wartości funkcji testowej ( 5 30) ( 35 3, 5) ( 0 37, 5) = + +... + = 9, 63, emp 30 3, 5 37, 5 χ kryt = Anna Rajfura 19

Przykład cd. Wyznaczanie wartości funkcji testowej ( 5 30) ( 35 3, 5) ( 0 37, 5) = + +... + = 9, 63, emp 30 3, 5 37, 5 χ kryt = χ 0, 05,( 3 1 )( 3 1 ) = χ 0, 05, 4 = Anna Rajfura 0

Wartości krytyczne rozkładu chi-kwadrat X ~ χ ν - X zmienna losowa o rozkładzie chi-kwadrat z liczbą stopni swobody ν, α - poziom istotności, χ α, ν - wartość krytyczna - liczba taka, że P(X > χ α, ν ) = α ν \ a 0,995 0,990 0,975 0,950 0,900 0,100 0,050 0,05 0,010 0,005 1 0,0 4 393 0,000 0,0010 0,0039 0,0158,7055 3,8415 5,039 6,6349 7,8794 0,0100 0,001 0,0506 0,106 0,107 4,605 5,9915 7,3778 9,104 10,5965 3 0,0717 0,1148 0,158 0,3518 0,5844 6,514 7,8147 9,3484 11,3449 1,8381 4 0,070 0,971 0,4844 0,7107 1,0636 7,7794 9,4877 11,1433 13,767 14,860 5 0,4118 0,5543 0,831 1,1455 1,6103 9,363 11,0705 1,835 15,0863 16,7496 6 0,6757 0,871 1,373 1,6354,041 10,6446 1,5916 14,4494 16,8119 18,5475 7 0,9893 1,390 1,6899,1673,8331 1,0170 14,0671 16,018 18,4753 0,777 8 1,3444 1,6465,1797,736 3,4895 13,3616 15,5073 17,5345 0,090 1,9549 9 1,7349,0879,7004 3,351 4,168 14,6837 16,9190 19,08 1,6660 3,5893 : 80 51,1719 53,5400 57,153 60,3915 64,778 96,578 101,8795 106,685 11,388 116,309 85 55,1695 57,6339 61,3888 64,7494 68,7771 10,0789 107,517 11,3933 118,356 1,344 90 59,1963 61,7540 65,6466 69,160 73,911 107,5650 113,145 118,1359 14,116 18,987 95 63,495 65,8983 69,949 73,5198 77,8184 113,0377 118,7516 13,8580 19,975 134,466 100 67,375 70,0650 74,19 77,994 8,3581 118,4980 14,341 19,5613 135,8069 140,1697 Anna Rajfura 1

Przykład cd. Wyznaczanie wartości funkcji testowej ( 5 30) ( 35 3, 5) ( 0 37, 5) = + +... + = 9, 63, emp 30 3, 5 37, 5 = = = 9, 49. kryt 0, 05, (3 1)(3 1) 0, 05, 4 Ponieważ odrzucamy. emp kryt, to hipotezę H 0 Zatem można stwierdzić, że masa chwastów na poletku jest zależna od rodzaju herbicydu. Anna Rajfura

Analiza przy użyciu pakietu Statistica Anna Rajfura 3

Przykład. W grupie 40 osób ze zdiagnozowaną pewną chorobą, w badaniu ankietowym oraz na podstawie historii choroby zebrano następujące dane. Lp Nasilenie choroby Papierosy Alkohol Inne używki 1 3 3 3 3 1 3 1 3 3 3 3 3 3 4 3 3 3 3 5 3 3 1 3 6 1 1 3 7 3 3 3 8 3 3 1 9 3 1 1 0 10 3 3 0 11 3 3 3 1 1 1 1 13 3 3 3 14 3 3 1 3 15 3 3 1 3 16 3 3 3 17 1 1 0 18 1 1 0 19 3 3 3 3 0 1 3 Lp Nasilenie choroby Papierosy Alkohol Inne używki 1 1 3 0 3 1 0 3 1 3 0 4 3 3 5 1 3 6 0 7 1 3 1 8 1 1 9 3 3 1 30 3 3 1 0 31 3 3 3 1 3 1 1 33 1 1 34 0 1 35 1 1 1 36 3 1 37 0 1 38 1 1 1 39 1 0 40 1 1 1 0 Anna Rajfura 4

Przykład. Opis: Nasilenie choroby: 1 - lekka postać choroby - ostra postać choroby 3 - przewlekła, ostra postać choroby Wszystkie używki: 0 - nic 1 - mało - średnio 3 - dużo Badano, czy istnieje zależność między nasileniem choroby a stosowaniem używek: papierosów, alkoholu i innych. Anna Rajfura 5

Przykład. Dane w arkuszu Anna Rajfura 6

Przykład. Menu Statystyka Statystyki podstawowe i tabele Tabele wielodzielcze Anna Rajfura 7

Przykład. Wybieramy kartę Zbiorcza Anna Rajfura 8

Przykład. Na karcie Zbiorcza wybieramy przycisk Określ tabele (wybierz zmienne) Anna Rajfura 9

Przykład. Na każdej liście zaznaczany zmienne (nazwy kolumn) zawierające dane o nasileniu choroby oraz konsumpcji wszystkich używek Przyciskamy OK Anna Rajfura 30

Przykład. Przyciskamy OK Anna Rajfura 31

Przykład. Na karcie Opcje zaznaczamy pola: Procenty w wierszach, Procenty w kolumnach Przyciskamy Podsumowanie Anna Rajfura 3

Przykład. W okienku Wybierz tabele... zaznaczamy tabelę pokazującą nasilenie choroby w zależności od ilości wypalanych papierosów Przyciskamy OK Anna Rajfura 33

Przykład. Komentarz o liczebnościach i częstościach w tabeli. Anna Rajfura 34

Czy cecha Y zależy od cechy X? Czy nasilenie choroby zależy od ilości wypalanych papierosów? cecha Y nasilenie choroby cecha X ilość papierosów klasy cechy Y: 1,, 3 klasy cechy X: 1,, 3 Anna Rajfura 35

H0: cechy X i Y są niezależne, H1: cechy X i Y są zależne, poziom istotności α=0,05, test χ emp Anna Rajfura 36 n = ij i, j gdzie: nij liczebność empiryczna, nij (t) liczebność teoretyczna n r i = j= 1 n ij, n = j k i= 1 r, k liczby klas cech X, Y Wnioskowanie: jeżeli n ij n n ij, emp v ij ( t ) ( t ) n ( t) ij = n = ( r 1) ( k 1) i n n j, to H0 odrzucamy, w przeciwnym przypadku H 0 nie można odrzucić. ;

Przykład. Obliczenia na tablicy Anna Rajfura 37

Przykład. W okienku analizy zaznaczamy pole Liczebności oczekiwane Przyciskamy Podsumowanie Wybieramy taelę z zależnością nasilenia choroby od ilości wypalanych papierosów Anna Rajfura 38

Przykład. Otrzymujemy liczebności teoretyczne Wyznaczanie wartości empirycznej funkcji testowej na tablicy Anna Rajfura 39

Przykład. W okienku analizy zaznaczamy w obszarze Statystyki dla tabel dwudzielczych pole Chikwadrat Pearsona Na karcie Więcej wybieramy przycisk Dokładne tabele dwudzielcze Przyciskamy Podsumowanie Anna Rajfura 40

Przykład. Otrzymujemy wartość funkcji testowej i wartość p. χ kryt α, v = χ = χ 0,05, (3 1) (3 = ( r 1) ( k 1) 1) = χ 0,05, 4 = = 9,4877 9,49 Wniosek. Hipotezę zerową odrzucamy na poziomie istotności 0,05. Stwierdzamy statystycznie istotną zależność między natężeniem choroby a ilością wypalanych papierosów. Anna Rajfura 41

Temat: Badanie niezależności dwóch cech skategoryzowanych korelacja rang Spearmana Anna Rajfura 4

Przykład Sprawdzano, czy liczba roślin chwastu gatunku G1 na poletku zależy od liczby roślin chwastu gatunku G na tym samym poletku. Zebrano wyniki z sześciu poletek. Anna Rajfura 43

Przykład cd. Nr poletka Chwasty G1 (liczba sztuk) Chwasty G (liczba sztuk) P1 3 P 4 P3 5 8 P4 8 6 P5 9 9 P6 10 7 Anna Rajfura 44

Korelacja rang Spearmana r s współczynnik korelacji rang Spearmana r s służy do oceny współzależności między dwiema zmiennymi (cechami) w odróżnieniu od współczynnika korelacji Pearsona przy pomocy współczynnika r s można oceniać zależności nieliniowe Anna Rajfura 45

Korelacja rang Spearmana cd. przy testowaniu r s nie jest wymagana normalność rozkładu zmiennych (wymagana przy stosowaniu współczynnika korelacji Persona) wartości r s są z zakresu [-1, 1] a ich interpretacja jest podobna jak w przypadku współczynnika korelacji Pearsona Anna Rajfura 46

Współczynnik korelacji rang Spearmana r s N 6 Di 1 i 1 N( N 1) = = D i różnica rang dla i-tej jednostki statystycznej N liczba jednostek statystycznych Anna Rajfura 47

Przykład cd. Nr poletka Chwasty G1 (liczba sztuk) Rangi G1 P1 1 P 4 P3 5 3 P4 8 4 P5 9 5 P6 10 6 Anna Rajfura 48

Przykład cd. Nr poletka Chwasty G (liczba sztuk) Rangi G P1 3 P 1 P3 8 5 P4 6 3 P5 9 6 P6 7 4 Anna Rajfura 49

Przykład cd. Nr poletka Chwasty G1 Rangi G1 Chwasty G Rangi G P1 1 3 P 4 1 P3 5 3 8 5 P4 8 4 6 3 P5 9 5 9 6 P6 10 6 7 4 Anna Rajfura 50

Przykład cd. Nr poletka Rangi G1 Rangi G Różnica rang Di P1 1-1 P 1 1 P3 3 5 - P4 4 3 1 P5 5 6-1 P6 6 4 Anna Rajfura 51

Przykład cd. Nr poletka Rangi G1 Rangi G Różnica rang Di Kwadrat różnicy rang Di P1 1-1 1 P 1 1 1 P3 3 5-4 P4 4 3 1 1 P5 5 6-1 1 P6 6 4 4 Suma 1 Anna Rajfura 5

Współczynnik korelacji rang Spearmana dla przykładu r s = 1 6 N i= 1 N( N D i 1) = 1 6 1 6 (6 1) = = 3 35 0,66 Anna Rajfura 53

Hipoteza o niezależności cech X, Y H 0 : cechy X, Y są niezależne H 1 : cechy X, Y są zależne poziom istotności α test korelacji rang Spearmana r emp 6 = r = 1 i= 1 s N N( N D i 1) Anna Rajfura 54

Wartości krytyczne współczynnika korelacji rang Spearmana poziom 0,05 0,01 istotności N=4 1 5 0.9 1 6 0.885 0.948 7 0.714 0.898 8 0.648 0.8333 9 0.6 0.7833 10 0.5636 0.7454 11 0.5363 0.709 1 0.5034 0.6783 13 0.4835 0.6483 14 0.4637 0.663 15 0.4464 0.6035 16 0.494 0.583 poziom istotności 0,05 0,01 N=17 0.414 0.5661 18 0.4014 0.55 19 0.391 0.535 0 0.3804 0.503 1 0.3701 0.509 0.3608 0.4974 3 0.357 0.4861 4 0.3443 0.4765 5 0.3369 0.4661 6 0.3305 0.457 7 0.341 0.4487 8 0.3174 0.4406 9 0.3118 0.435 30 0.3063 0.455 Anna Rajfura 55

Hipoteza o niezależności cech X, Y cd. r kryt = r N Wnioskowanie: Jeśli r emp > r kryt, to H 0 odrzucamy, wpp H 0 nie można odrzucić. Anna Rajfura 56

Przykład cd. H 0 : liczby roślin chwastów gatunku G1 i G na poletku są niezależne H 1 : liczby roślin chwastów gatunku G1 i G na poletku są zależne poziom istotności α = 0,05 test korelacji rang Spearmana r emp = 0,66 r = r = 6 kryt 0,885 Wniosek statystyczny: ponieważ r emp <r kryt, to H 0 nie można odrzucić. Anna Rajfura 57

Przykład cd. Wniosek merytoryczny: nie stwierdzono zależności między liczbą roślin chwastów gatunków G1 i G na poletku. Anna Rajfura 58

Przykład* Czy ocena na egzaminie ze statystyki zależy od oceny na zaliczeniu ćwiczeń z tego przedmiotu? Anna Rajfura 59

Przykład* cd. Id_stu Zal Egz S1 3,0 5,0 S 4,5 4,5 S3 4,0 3,0 S4 5,0 4,0 S5 4,0 4,0 S6 3,0 3,5 S7 3,0 3,0 S8 3,5 4,0 S9 4,0 4,0 S10 3,0 3,0 S11 4,0 3,5 S1 3,5 4,0 S13 3,0,0 S14 3,0 3,5 Anna Rajfura 60

Przykład* cd. wyznaczanie rang Id_stu Zal Rangi Zal Egz S1 3,0 5,0 S 4,5 4,5 S3 4,0 3,0 S4 5,0 4,0 S5 4,0 4,0 S6 3,0 3,5 S7 3,0 3,0 S8 3,5 4,0 S9 4,0 4,0 S10 3,0 3,0 S11 4,0 3,5 S1 3,5 4,0 S13 3,0,0 S14 3,0 3,5 Anna Rajfura 61

Przykład* cd. uporządkowanie wg Zal Id_stu Zal Rangi Zal Egz S1 3,0 5,0 S6 3,0 3,5 S7 3,0 3,0 S10 3,0 3,0 S13 3,0,0 S14 3,0 3,5 S8 3,5 4,0 S1 3,5 4,0 S3 4,0 3,0 S5 4,0 4,0 S9 4,0 4,0 S11 4,0 3,5 S 4,5 4,5 S4 5,0 4,0 Anna Rajfura 6

Przykład* cd. uporządkowanie wg Zal Id_stu Zal Obliczenia pomocnicze - lp Rangi Zal Egz S1 3,0 1. 5,0 S6 3,0. 3,5 S7 3,0 3. 3,0 S10 3,0 4. 3,0 S13 3,0 5.,0 S14 3,0 6. 3,5 S8 3,5 4,0 S1 3,5 4,0 S3 4,0 3,0 S5 4,0 4,0 S9 4,0 4,0 S11 4,0 3,5 S 4,5 4,5 S4 5,0 4,0 Anna Rajfura 63

Przykład* cd. uporządkowanie wg Zal Id_stu Zal Obliczenia pomocnicze - lp Rangi Zal Egz S1 3,0 1. 3,5 5,0 S6 3,0. 3,5 3,5 S7 3,0 3. 3,5 3,0 S10 3,0 4. 3,5 3,0 S13 3,0 5. 3,5,0 S14 3,0 6. 3,5 3,5 S8 3,5 4,0 S1 3,5 4,0 S3 4,0 3,0 S5 4,0 4,0 S9 4,0 4,0 S11 4,0 3,5 S 4,5 4,5 S4 5,0 4,0 Anna Rajfura 64

Przykład* cd. uporządkowanie wg Zal Id_stu Zal Obliczenia pomocnicze - lp Rangi Zal Egz S1 3,0 1. 3,5 5,0 S6 3,0. 3,5 3,5 S7 3,0 3. 3,5 3,0 S10 3,0 4. 3,5 3,0 S13 3,0 5. 3,5,0 S14 3,0 6. 3,5 3,5 S8 3,5 7. 4,0 S1 3,5 8. 4,0 S3 4,0 3,0 S5 4,0 4,0 S9 4,0 4,0 S11 4,0 3,5 S 4,5 4,5 S4 5,0 4,0 Anna Rajfura 65

Przykład* cd. uporządkowanie wg Zal Id_stu Zal Obliczenia pomocnicze - lp Rangi Zal Egz S1 3,0 1. 3,5 5,0 S6 3,0. 3,5 3,5 S7 3,0 3. 3,5 3,0 S10 3,0 4. 3,5 3,0 S13 3,0 5. 3,5,0 S14 3,0 6. 3,5 3,5 S8 3,5 7. 7,5 4,0 S1 3,5 8. 7,5 4,0 S3 4,0 3,0 S5 4,0 4,0 S9 4,0 4,0 S11 4,0 3,5 S 4,5 4,5 S4 5,0 4,0 Anna Rajfura 66

Przykład* cd. uporządkowanie wg Zal Id_stu Zal Obliczenia pomocnicze - lp Rangi Zal Egz S1 3,0 1. 3,5 5,0 S6 3,0. 3,5 3,5 S7 3,0 3. 3,5 3,0 S10 3,0 4. 3,5 3,0 S13 3,0 5. 3,5,0 S14 3,0 6. 3,5 3,5 S8 3,5 7. 7,5 4,0 S1 3,5 8. 7,5 4,0 S3 4,0 9. 10,5 3,0 S5 4,0 10. 10,5 4,0 S9 4,0 11. 10,5 4,0 S11 4,0 1. 10,5 3,5 S 4,5 4,5 S4 5,0 4,0 Anna Rajfura 67

Przykład* cd. uporządkowanie wg Zal Id_stu Zal Obliczenia pomocnicze - lp Rangi Zal Egz S1 3,0 1. 3,5 5,0 S6 3,0. 3,5 3,5 S7 3,0 3. 3,5 3,0 S10 3,0 4. 3,5 3,0 S13 3,0 5. 3,5,0 S14 3,0 6. 3,5 3,5 S8 3,5 7. 7,5 4,0 S1 3,5 8. 7,5 4,0 S3 4,0 9. 10,5 3,0 S5 4,0 10. 10,5 4,0 S9 4,0 11. 10,5 4,0 S11 4,0 1. 10,5 3,5 S 4,5 13. 13 4,5 S4 5,0 14. 14 4,0 Anna Rajfura 68

Przykład* cd. uporządkowanie wg Egz Id_stu Zal Rangi Zal Egz Obl. pomocnicze - lp Rangi Egz S1 3,0 3,5 5,0 S6 3,0 3,5 3,5 S7 3,0 3,5 3,0 S10 3,0 3,5 3,0 S13 3,0 3,5,0 S14 3,0 3,5 3,5 S8 3,5 7,5 4,0 S1 3,5 7,5 4,0 S3 4,0 10,5 3,0 S5 4,0 10,5 4,0 S9 4,0 10,5 4,0 S11 4,0 10,5 3,5 S 4,5 13 4,5 S4 5,0 14 4,0 Anna Rajfura 69

Przykład* cd. uporządkowanie wg Egz Id_stu Zal Rangi Zal Egz Obl. pomocnicze - lp Rangi Egz S13 3,0 3,5,0 1. S7 3,0 3,5 3,0. S10 3,0 3,5 3,0 3. S3 4,0 10,5 3,0 4. S6 3,0 3,5 3,5 5. S14 3,0 3,5 3,5 6. S11 4,0 10,5 3,5 7. S8 3,5 7,5 4,0 8. S1 3,5 7,5 4,0 9. S5 4,0 10,5 4,0 10. S9 4,0 10,5 4,0 11. S4 5,0 14 4,0 1. S 4,5 13 4,5 13. S1 3,0 3,5 5,0 14. Anna Rajfura 70

Przykład* cd. uporządkowanie wg Egz Id_stu Zal Rangi Zal Egz Obl. pomocnicze - lp Rangi Egz S13 3,0 3,5,0 1. 1 S7 3,0 3,5 3,0. 3 S10 3,0 3,5 3,0 3. 3 S3 4,0 10,5 3,0 4. 3 S6 3,0 3,5 3,5 5. 6 S14 3,0 3,5 3,5 6. 6 S11 4,0 10,5 3,5 7. 6 S8 3,5 7,5 4,0 8. 10 S1 3,5 7,5 4,0 9. 10 S5 4,0 10,5 4,0 10. 10 S9 4,0 10,5 4,0 11. 10 S4 5,0 14 4,0 1. 10 S 4,5 13 4,5 13. 13 S1 3,0 3,5 5,0 14. 14 Anna Rajfura 71

Przykład* cd. obliczanie r s Id_stu Zal Rangi Zal Egz Rangi Egz Różnice rang S13 3,0 3,5,0 1 3,5-1=,5 S7 3,0 3,5 3,0 3 0,5 S10 3,0 3,5 3,0 3 0,5 S3 4,0 10,5 3,0 3 7,5 S6 3,0 3,5 3,5 6 -,5 S14 3,0 3,5 3,5 6 -,5 S11 4,0 10,5 3,5 6 4,5 S8 3,5 7,5 4,0 10 -,5 S1 3,5 7,5 4,0 10 -,5 S5 4,0 10,5 4,0 10 0,5 S9 4,0 10,5 4,0 10 0,5 S4 5,0 14 4,0 10 4 S 4,5 13 4,5 13 0 S1 3,0 3,5 5,0 14-10,5 Anna Rajfura 7

Przykład* cd. obliczanie r s Suma kwadratów różnic: r s 14 14 i= 1 D = i 35 6 Di 6 35 = 1 i= 1 = 1 14 (14 1) 14 (14 1) 0,48 r kryt = r N=14 = 0,46 Anna Rajfura 73

Przykład* cd. testowanie r s H 0 : ocena na egzaminie ze statystyki nie zależy od oceny z ćwiczeń H 1 : ocena na egzaminie ze statystyki zależy od oceny z ćwiczeń poziom istotności α = 0,05 r s emp = 0,48 r s kryt = 0,46 Ponieważ r s emp > r s kryt, to H 0 odrzucamy. Ocena na egzaminie ze statystyki zależy od oceny z ćwiczeń. Anna Rajfura 74