Analiza danych jakościowych Ccha ciągła a ccha dyskrtna! Ciągła kg Dyskrtna Cchy jakościow są to cchy, których jdnoznaczn i oczywist scharaktryzowani za pomocą liczb jst nimożliw lub bardzo utrudnion. Zanim rozpocznimy analizę statystyczną koniczn jst ustalni skali, w jakij wyrażana jst nasza ccha! Skal pomiaru: nominalna porządk właściwi dowolny, Rasa zwirzęcia Forma spędzania wolngo czasu nominalna dychotomiczna, PŁEĆ, CHORY, ZDROWY Matriały pomocnicz do przdmiotu Mtody statystyczn i 1informatyka
porządkowa (dokładnijsza), można przypisać rangi intrwałowa (możmy przyporządkować poszczgólnym obiktom wartość mirzoną w ściśl okrślonych jdnostkach) przdziałowa (równomirna), jst to skala, która pozwala uporządkować wartości zminnj, ponadto jdnak zakłada się ż składa się z liczb rzczywistych. Przykład problmów: Tablic liczbności Wykształcni Liczność Procnt Liczność Skumulowana Procnt Skumulowany Podstawow 13 5.10 13 5.10 Pomaturaln 5 1.96 18 7.06 Śrdni 91 35.69 109 4.75 Wyższ 35 13.73 144 56.47 Zawodow 111 43.53 55 100.00 Asocjacj, czyli badani zalżności między cchami Czy humor Szfa związany jst z pogodą??? Skala nominalna 40 0 15 75 41 80 9 150 10 17 48 75 91 117 9 300 Konkluzja: CHYBA JEST!!! Asocjacja między dwima zminnymi nominalnymi istnij, jżli rozkład jdnj zminnj ulga zmiani, gdy zminia się poziom drugij cchy (lub wartość) ulga zmiani. Matriały pomocnicz do przdmiotu Mtody statystyczn i informatyka
4 6 5 75 50 49 51 150 5 5 5 75 89 90 91 300 Konkluzja: Szf jst jak skała!!! Asocjacj ni występują, gdy rozkład pirwszj zminnj ni zalży od rozkładu drugij zminnj! Wryfikacja H 0, dobór tstu Tabl liczbności HIPOTEZA ZEROWA I ALTERNATYWNA H 0 : Rozkład badanj cchy jst zgodny z tortycznym H 1 : Rozkład badanj cchy ni jst zgodny z tortycznym Tst Χ tst zgodności (Liczbności rzczywist są zgodn z oczkiwanymi!) Χ = ( f f ) o f f o wartość otrzymana; f wartość oczkiwana df liczba stopni swobody (liczba grup-1). Przy 3 grupach df=, poniważ różnic między f o i f mogą się swobodni kształtować tylko w dwóch grupach, trzcia grupa zdtrminowana jst przz sumę obsrwacji dla wszystkich grup). Obliczon Χ porównujmy z Χ odczytanym z tabli dla okrślongo df i poziomu istotności. Jżli jst większ lub równ, to istniją podstawy do odrzucni hipotzy zrowj, co znaczy iż analizowany rozkład ni jst zgodny z rozkładm tortycznym. Założnia i ogranicznia tstu Χ - wartość oczkiwana w każdj klasi ni powinna być mnijsza niż 5. Przy większj liczbi klas i tak niskij wartości oczkiwanj, pwn klasy można z sobą połączyć. Dzięki tmu istnij szansa na zwiększni tj wartości. - Przy dwóch grupach, df=1, stosujmy tzw. poprawkę Yatsa na niciągłość. Wynika to z tgo, iż rozkład Χ jst rozkładm ciągłym, zaś frkwncj przyjmują liczby naturaln. Przy małych liczbnościach moż to spowodować odrzucni hipotzy zrowj z większym prawdopodobiństwm aniżli założony poziom istotności. Matriały pomocnicz do przdmiotu Mtody statystyczn i 3informatyka
Χ = ( f f 0, ) o 5 f Przykład procdury ods rtf body='d:\dan\ptz\wyksztalcni.rtf'; proc frq data=ptz.dzici; tabls wykojc/ chisq; run; ods rtf clos; Tablic kontyngncji (badani zalżności między cchami jakościowymi) Liczność Procnt % wirsza H 0 :??????? Tabla astmao na gryzonis astmao gryzonis Razm % kolumny Ni ma w domu Ni stwirdzono 115 45.10 81.56 50.66 Stwirdzono 11 43.9 98.5 49.34 Razm 7 89.0 H 0 : Między badanymi cchami ni ma zalżności H 1 : Istnij zalżność między badanymi cchami Co to znaczy? Wartości, liczbności rzczywist są zgodn z oczkiwanymi! Tst Χ, al ni zawsz! S ą obcn w domu 6 10.0 18.44 9.86 0.78 1.75 7.14 8 10.98 141 55.9 114 44.71 55 100.00 Statystyka DF Warto ć Prawdop. Chi-kwadrat 1 17.9535 <.0001 Poprawka uciągl. Chi-kwadrat 1 16.871 <.0001 Chi-kwadrat Mantla-Hanszla 1 17.8831 <.0001 Współczynnik FI -0.653 V Cramra -0.653 Poprawka ucią gl. Chi-kwadrat współczynnik Χ z poprawką Yatsa z względu na niską liczbność w podgrupi. Powyższa poprawka powoduj bardzij ostrożną ocnę. Matriały pomocnicz do przdmiotu Mtody statystyczn i 4informatyka
Tst Mantl-Hanszl przznaczony jst do badania zalżności między cchami wyrażonymi skalami porządkowymi. Współczynnik Fi (φ) - = pirwiastk kwadratowy (Χ /n). Stosowany w odnisiniu do tabl x. Przyjmuj wartości od 0 do 1. 0 - brak zalżności, 1 całkowita zalżność. Stosowany w odnisiniu do zminnych jakościowych. Statystyka V Cramra jst miarą siły zalżności między badanymi cchami. Jj wartość zawira się w przdzial od -1 do 1 w przypadku tabl dwudzilczych, zaś dla tabl większych przyjmuj wartości od 0 do 1 0 1 brak zalżności płna zalżność Liczbności Rodzaj tstu: N>40 i wszystki liczbności oczkiwan > 10 Χ N>40 i którakolwik liczbność oczkiwana < 10 tst V-kwadrat N>40 i którakolwik liczbność oczkiwana < 5 tst Χ z poprawką Yatsa 0<N=<40 i wszystki liczbności oczkiwan> 5 tst Χ z poprawką Yatsa 0<N=<40 i którakolwik liczbność oczkiwana < 5 dokładny tst Fishra N=<0 i którakolwik liczbność oczkiwana < 5 dokładny tst Fishra Dokładny tst Fishra (wartości mpiryczn) 1 3 4 0 5 5 1 8 9 Możliw wartości 0 4 4 1 4 5 1 8 9 W ramach tstu Fishra obliczan jst prawdopodobiństwo otrzymania dango rozkładu z tablicy. Rozpatrywan są wszlki możliw kombinacj liczbności komórk w oparciu o liczbności brzgow. Prawdopodobiństwo związan z dokładnym tstm Fishra wykazuj tndncj do przyjmowania wyższych wartości, aniżli asymptotyczny tst Χ, poniważ jst tstm bardzij konsrwatywnym. Titl 'Tabl kontyngncji'; proc frq data=ptz.animal; tabls astmao*gryzonis/chisq; run; Matriały pomocnicz do przdmiotu Mtody statystyczn i 5informatyka