Autor: Dariusz Piwczyński 011-1-01 14:07 Analiza danych jakościowych tsty opart o statystykę χ. Cchy jakościow są to cchy, których jdnoznaczn i oczywist scharaktryzowani za pomocą liczb jst nimożliw lub bardzo utrudnion. Zanim rozpocznimy analizę statystyczną koniczn jst ustalni skali, w jakij wyrażana jst nasza ccha! Skal pomiaru (przypomnini): nominalna porządk właściwi dowolny Forma spędzania wolngo czasu nominalna dychotomiczna, PŁEĆ, CHORY, ZDROWY porządkowa (dokładnijsza), można przypisać rangi intrwałowa (możmy przyporządkować poszczgólnym obiktom wartość mirzoną w ściśl okrślonych jdnostkach) Przykład problmów: 1. Tablic liczbności Wykształcni Liczność Procnt Liczność Procnt Skumulowany Skumulowana Podstawow 13 5,10 13 5,10 Zawodow 111 43,53 14 48,63 Śrdni 91 35,69 15 84,31 Pomaturaln 5 1,96 0 86,7 Wyższ 35 13,73 55 100,00 1
Autor: Dariusz Piwczyński 011-1-01 14:07. Asocjacj, czyli badani zalżności między cchami Czy humor Sza związany jst z pogodą??? Skala nominalna 40 0 15 75 41 80 9 150 10 17 48 75 91 117 9 300 Konkluzja: CHYBA JEST!!! Asocjacja między dwima zminnymi nominalnymi istnij, jżli rozkład jdnj zminnj ulga zmiani, gdy zminia się poziom drugij cchy (lub wartość) ulga zmiani. 4 6 5 75 50 49 51 150 5 5 5 75 89 90 91 300 Konkluzja: Sz jst jak skała!!! Asocjacj ni występują, gdy rozkład pirwszj zminnj ni zalży od rozkładu drugij zminnj! Wryikacja H 0 oraz dobór tstu 1. Tabl liczbności H 0 : Rozkład badanj cchy jst zgodny z tortycznym H 1 : Rozkład badanj cchy ni jst zgodny z tortycznym
Autor: Dariusz Piwczyński 011-1-01 14:07 Tst tst zgodności (Liczbności rzczywist są zgodn z oczkiwanymi!) mp. o o wartość otrzymana; wartość oczkiwana Obliczon mp. porównujmy z tab. odczytanym z tabl statystycznych dla okrślonj liczby stopni swobody (d) i poziomu istotności. Jżli otrzyman mp jst większ lub równ wartości odczytanj z tabl to istniją podstawy do odrzucni hipotzy zrowj. Oznacza to, ż analizowany rozkład ni jst zgodny z rozkładm tortycznym. d liczba stopni swobody (liczba grup 1). Przy 3 grupach d =, poniważ różnic między o i mogą się swobodni kształtować tylko w dwóch grupach, trzcia grupa zdtrminowana jst przz sumę obsrwacji dla wszystkich grup). Założnia i ogranicznia tstu wartość oczkiwana w każdj klasi ni powinna być mnijsza niż 5. Przy większj liczbi klas i tak niskij wartości oczkiwanj, pwn klasy można z sobą połączyć. Dzięki tmu istnij szansa na zwiększni tj wartości. Przy dwóch grupach, d = 1, stosujmy tzw. poprawkę Yats a na niciągłość. Wynika to z tgo, iż rozkład jst rozkładm ciągłym, zaś rkwncj przyjmują liczby naturaln. Przy małych liczbnościach moż to spowodować odrzucni hipotzy zrowj z większym prawdopodobiństwm aniżli założony poziom istotności. mp. o 0,5 Czy struktura płci studiujących osób na Wydzial Hodowli i Biologii Zwirząt jst zgodna z tortycznym rozkładm płci w populacji ludzkij, tj. 1:1? 6 157,5 89 157,5 o mp. 157,5 157,5 (d=1;=0,05) = 3,841 59,89 Obliczona wartość statystyki mp. jst większa niż wartość odczytana z tabl (wartość krytyczna), co pozwala odrzucić hipotzę zrową i stwirdzić, ż rozkład płci studiujących osób ni jst zgodny z rozkładm 1:1. 3
Autor: Dariusz Piwczyński 011-1-01 14:07 Przykład (EXCEL): (Wprowadzni do statystyki dla przyrodników, Adam Łomnicki): Czy istnij związk między wikim ślimaków a skłonnością do przbywania w okrślonym sidlisku? o odkryty grunt Roślinność pni drzw wiku (otrzyman) (G) zilona (R) (D) Młod (M) 5 43 17 11 Dorosł (D) 108 15 74 197 sidlisk 160 58 91 309 mp. o o wartość otrzymana; wartość oczkiwana Co oznaczają wartości rzczywist i oczkiwan? Wartość oczkiwaną ( ) obliczamy z proporcji: suma wirsza, w którym występuj = suma kolumny, w którj znajduj się suma wszystkich obsrwacji W naszym zadaniu wartość oczkiwaną liczby ślimaków młodych na odkrytym grunci obliczamy następująco: 11 = 160 309 zatm = (160 11) / 309 = 57,99 Oczkiwana liczbność osobników na grunci odkrytym wynosi 57,99. W sposób analogiczny obliczamy pozostał wartości oczkiwan. mp = 49,163 Wartość krytyczną statystyki odczytujmy z tabl statystycznych w zalżności od ustalongo poziomu istotności i liczby stopni swobody. Liczba stopni swobody obliczana jst następująco: d = (k 1) (w 1), gdzi: k liczba kolumn (3 odkryty grunt, roślinność zilona, pni drzw) w liczba wirszy ( młod, dorosł). W naszym przykładzi d = ((3 1) ( 1)) 0,05 = 5,991. Z względu na akt, iż obliczona przz nas wartość statystyki mp jst większa niż wartość krytyczna odrzucamy hipotzę zrową. 4
Autor: Dariusz Piwczyński 011-1-01 14:07. Tablic kontyngncji (badani zalżności między cchami jakościowymi) H 0 : Między badanymi cchami ni ma zalżności H 1 : Istnij zalżność między badanymi cchami W clu wryikacji tych hipotz wykorzystujmy na ogół tst, al ni zawsz... Liczbności Rodzaj tstu: N > 40 i wszystki liczbności oczkiwan > 10 N > 40 i którakolwik liczbność oczkiwana < 5 tst z poprawką Yatsa 0 < N =< 40 i wszystki liczbności oczkiwan> 5 tst z poprawką Yatsa 0 < N =< 40 i którakolwik liczbność oczkiwana< 5 dokładny tst Fishra N =< 0 i którakolwik liczbność oczkiwana < 5 dokładny tst Fishra z poprawką Yatsa współczynnik z poprawką Yatsa z względu na niską liczbność w podgrupi. Powyższa poprawka powoduj bardzij ostrożną ocnę. Tst Mantl-Hanszl przznaczony jst do badania zalżności między cchami wyrażonymi skalami porządkowymi. H 0 : Brak porządkowj zalżności między zminnymi wirszy i kolumn H 1 : Istnij porządkowa zalżność między zminnymi wirszy i kolumn Współczynnik Fi () = pirwiastk kwadratowy ( /n). Stosowany w odnisiniu do tabl x. Przyjmuj wartości od 0 do 1. 0 - brak zalżności, 1 całkowita zalżność. Stosowany w odnisiniu do zminnych jakościowych. Statystyka V Cramra jst miarą siły zalżności między badanymi cchami. Jj wartość zawira się w przdzial od -1 do 1 w przypadku tabl dwudzilczych, zaś dla tabl większych przyjmuj wartości od 0 do 1. 0 1 brak zalżności płna zalżność 5
Autor: Dariusz Piwczyński 011-1-01 14:07 Wyniki z SAS, Przykład (SAS EG) ankita.xls: Sprawdź czy istnij zalżność między płcią a udzilonymi w ankici odpowidziami (kwik, papirosy, mijsc). H 0 : ni istnij zalżność między płcią osób a trścią udzilanych odpowidzi H 1 : istnij zalżność między płcią osób a trścią udzilanych odpowidzi Prawdopodobiństwo, jaki wynika z przprowadzongo tstu (0,6558) ni pozwala odrzucić hipotzy zrowj i stwirdzić, ż istnij zalżność istotna między płcią osób a odpowidzią na pytani: czy palisz papirosy? Zstawion w tabli wyniki pozwala stwirdzić, ż wśród kobit udział palących wyniósł 1,546% i był około j. p. niższy niż wśród mężczyzn (19,4%). STATISTICA 6
Autor: Dariusz Piwczyński 011-1-01 14:07 Dokładny tst Fishra (wartości mpiryczn) 1 3 4 0 5 5 1 8 9 Możliw wartości 0 4 4 1 4 5 1 8 9 W ramach tstu Fishra obliczan jst prawdopodobiństwo otrzymania dango rozkładu z tablicy. Rozpatrywan są wszlki możliw kombinacj liczbności komórk w oparciu o liczbności brzgow. Prawdopodobiństwo związan z dokładnym tstm Fishra wykazuj tndncj do przyjmowania wyższych wartości, aniżli asymptotyczny tst, poniważ jst tstm bardzij konsrwatywnym. Czy istnij zalżność wśród osób chorych na trądzik między płcią a ubytkami naskórka? Tabla plc wg ubytki_n plc ubytki_n Liczbność Procnt Proc. wir. Proc. kol. 0 1 Razm kobita 68 68.00 95.77 74.73 mzczyzna 3 3.00 79.31 5.7 Razm 91 91.00 3 3.00 4.3 33.33 6 6.00 0.69 66.67 9 9.00 71 71.00 9 9.00 100 100.00 Statystyka St. sw. Wartość Prawd. Chi-kwadrat 1 6.8149 0.0090 Chi-kw. ilorazu wiarygodn. 1 6.084 0.0137 Poprawka uciągl. chi-kwadrat 1 4.959 0.060 7
Autor: Dariusz Piwczyński 011-1-01 14:07 Statystyka St. sw. Wartość Prawd. Chi-kwadrat Mantla-Hanszla 1 6.7467 0.0094 Współczynnik FI 0.611 Współczynnik kontyngncji 0.56 V Cramra 0.611 OSTRZEŻENIE: 5% komórk ma oczkiwan liczby wyst. mnijsz niż 5. Chi-kwadrat moż ni być właściwym tstm. Pojawiło się ostrzżni z strony programu SAS o niwystarczających liczbnościach oczkiwanych. Dcyzję o odrzucniu hipotzy zrowj odczytujmy zatm w oparciu o tst z poprawką Yats a (Poprawka uciągl. chi-kwadrat), a w skrajnych przypadkach o dokładny tst Fishra. Dokładny tst Fishra Komórka (1,1) liczbność (F) 68 Lwostronn pr. <= F 0.9978 Prawostronn pr. >= F 0.0165 Tabla prawdopodobiństwa (P) 0.0143 Dwustronn pr. <= P 0.0165 Tst McNmary H 0 : p 1 = p H 1 : p 1 p p 1 proporcja pacjntów, którzy wykazują objawy choroby przd lcznim p proporcja pacjntów, którzy wykazują objawy choroby po lcznim ( ) A Liczba osób wśród których doszło do zmiany wyniku z dodatnigo na ujmny D Liczba osób wśród których doszło do zmiany wyniku z ujmngo na dodatni Wykorzystywany do analizy tabl x, gdy doświadczni zorganizowan jst w układzi zalżnym. Przykładm nich będzi wpływ prowadzonj kuracji na stan zdrowia pacjntów pacjntów. 1 pacjnt zdrowy; 0 pacjnt chory. 8
Autor: Dariusz Piwczyński 011-1-01 14:07 9
Autor: Dariusz Piwczyński 011-1-01 14:07 Wyniki 0 pacjnt bz objawów choroby; 1 pacjnt z objawami choroby Przprowadzony tst zgodności McNmara pozwala wnioskować, ż przprowadzona kuracja wpłynęła statystyczni na stan zdrowia pacjntów. 10