Autor: Dariusz Piwczyński :07

Podobne dokumenty
Analiza danych jakościowych

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

ZASTOSOWANIE REGRESJI LOGISTYCZNEJ DO OKREŚLENIA PRAWDOPODOBIEŃSTWA SPRZEDAŻY ZASOBU MIESZKANIOWEGO

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

Funkcja nieciągła. Typy nieciągłości funkcji. Autorzy: Anna Barbaszewska-Wiśniowska

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

2009 ZARZĄDZANIE. LUTY 2009

Elektroniczne systemy bezpieczeństwa mogą występować w trzech rodzajach struktur. Są to struktury typu: - skupionego, - rozproszonego, - mieszanego.

Rachunek Prawdopodobieństwa MAP1151, 2011/12 Wydział Elektroniki Wykładowca: dr hab. Agnieszka Jurlewicz

Uogólnione wektory własne

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Cechy X, Y są dowolnego typu: Test Chi Kwadrat niezależności. Łączny rozkład cech X, Y jest normalny: Test współczynnika korelacji Pearsona

Definicja: Wektor nazywamy uogólnionym wektorem własnym rzędu m macierzy A

Sieci neuronowe - uczenie

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

EKONOMETRIA. Ekonometryczne modele specjalne. Zbigniew.Tarapata zbigniew.tarapata.akcja.pl/p_ekonometria/ tel.

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Pytanie: Kiedy do testowania hipotezy stosujemy rozkład normalny?

Badanie zależności skala nominalna

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Rachunek Prawdopodobieństwa MAP1064, 2008/09

GRUPY NIEZALEŻNE Chi kwadrat Pearsona GRUPY ZALEŻNE (zmienne dwuwartościowe) McNemara Q Cochrana

NIEZALEŻNOŚĆ i ZALEŻNOŚĆ między cechami Test chi-kwadrat, OR, RR

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Badania eksperymentalne

Wykład 3 Hipotezy statystyczne

Testowanie hipotez statystycznych.

Statystyka matematyczna Test χ 2. Wrocław, r

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

Granica funkcji - Lucjan Kowalski GRANICA FUNKCJI

W1. Wprowadzenie. Statystyka opisowa

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

Termodynamika. Część 10. Elementy fizyki statystycznej klasyczny gaz doskonały. Janusz Brzychczyk, Instytut Fizyki UJ

REGULAMIN PSKO I. Kryteria i wymagania dla zawodników Optimist PSKO. II. Mistrzostwa PSKO. III. Puchar Polski PSKO

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

Uświadomienie potrzeby badawczej.

Weryfikacja hipotez statystycznych

Statystyka matematyczna. Wykład IV. Weryfikacja hipotez statystycznych

Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT. Anna Rajfura 1

TABLICE PODSTAWOWYCH ROZKŁADÓW PRAWDOPODOBIEŃSTWA. T4. Tablica kwantyli rozkładu chi-kwadrat (I część - poziomy kwantyli 0,5)

Projektowanie procesu doboru próby

Przykład 1. (A. Łomnicki)

Statystyka w analizie i planowaniu eksperymentu

WPŁYW STÓP PROCENTOWYCH W USA I W STREFIE EURO NA STOPY PROCENTOWE W POLSCE I. STOPY PROCENTOWE W GOSPODARCE OTWARTEJ.

W statystyce stopień zależności między cechami można wyrazić wg następującej skali: n 1

Badanie zależności pomiędzy zmiennymi

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Analiza wariancji. dr Janusz Górczyński

Mirosława Jastrząb-Mrozicka Wskaźnik skolaryzacji

BADANIE POWTARZALNOŚCI PRZYRZĄDU POMIAROWEGO

TECHNIKA DRZWI ZATRZAŚNIĘTE PRZED NOSEM

Wykład VIII: Odkształcenie materiałów - właściwości sprężyste

Rozkłady statystyk z próby. Statystyka

Ekscytony Wanniera Motta

Statystyka. Tematyka wykładów. Przykładowe pytania. dr Tomasz Giętkowski wersja /13:40

Farmakokinetyka furaginy jako przykład procesu pierwszego rzędu w modelu jednokompartmentowym zawierającym sztuczną nerkę jako układ eliminujący lek

STATYSTYKA OPISOWA. Dr Alina Gleska. 12 listopada Instytut Matematyki WE PP

( t) UKŁADY TRÓJFAZOWE

Wykład 8 Dane kategoryczne

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

Temat: BADANIE ZGODNOŚCI ROZKŁADU CECHY (EMPIRYCZNEGO) Z ROZKŁADEM TEORETYCZNYM TEST CHI-KWADRAT. Anna Rajfura 1

Statystyka matematyczna dla leśników

Metodologia badań psychologicznych. Wykład 12. Korelacje

Wydział Matematyki. Testy zgodności. Wykład 03

Wnioskowanie statystyczne. Statystyka w 5

Analiza korespondencji

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Rozkłady dwuwymiarowe. Tablice dwudzielcze. Przykład (wstępny):

Rozkłady statystyk z próby

Statystyka i opracowanie danych - W 4: Wnioskowanie statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

Przedmiot statystyki. Graficzne przedstawienie danych.

dr hab. Dariusz Piwczyński, prof. nadzw. UTP

PROTOKÓŁ POMIAROWY LABORATORIUM OBWODÓW I SYGNAŁÓW ELEKTRYCZNYCH Grupa Podgrupa Numer ćwiczenia

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Załącznik 5.1 Analiza statystyczna wyników badania dotyczącego zarządzania ryzykiem w przedsiębiorstwach

Zawartość. Zawartość

Autor: Dariusz Piwczyński 1 Ćwiczenie: Doświadczenia 2-grupowe w układzie niezależnym i zależnym.

Zadania ze statystyki cz.5 I rok socjologii miary związków między zmiennymi jakościowymi

Katedra Genetyki i Podstaw Hodowli Zwierząt Wydział Hodowli i Biologii Zwierząt, UTP w Bydgoszczy

Ankieta oceniająca satysfakcję klienta zewnętrznego

Zadania ze statystyki cz.8. Zadanie 1.

Cz. II. Metodologia prowadzonych badań. Rozdz. 1. Cele badawcze. Rozdz. 2. Metody i narzędzia badawcze. Celem badawczym niniejszego projektu jest:

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji

lim lim 4) lim lim lim lim lim x 3 e e lim lim x lim lim 2 lim lim lim Zadanie 1 Wyznacz dziedziny następujących funkcji: log x x 6x

Wykład 9 Testy rangowe w problemie dwóch prób

Testy post-hoc. Wrocław, 6 czerwca 2016

Statystyka. Wykład 8. Magdalena Alama-Bućko. 23 kwietnia Magdalena Alama-Bućko Statystyka 23 kwietnia / 38

Pobieranie prób i rozkład z próby

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Statystyka. Wykład 7. Magdalena Alama-Bućko. 3 kwietnia Magdalena Alama-Bućko Statystyka 3 kwietnia / 36

Wykład 12 Testowanie hipotez dla współczynnika korelacji

4) lim. lim. lim. lim. lim. x 3. e e. lim. lim x. lim. lim. lim. lim 2. lim. lim. lim. Zadanie 1 Wyznacz dziedziny następujących funkcji: log x.

Kilka uwag o testowaniu istotności współczynnika korelacji

Transkrypt:

Autor: Dariusz Piwczyński 011-1-01 14:07 Analiza danych jakościowych tsty opart o statystykę χ. Cchy jakościow są to cchy, których jdnoznaczn i oczywist scharaktryzowani za pomocą liczb jst nimożliw lub bardzo utrudnion. Zanim rozpocznimy analizę statystyczną koniczn jst ustalni skali, w jakij wyrażana jst nasza ccha! Skal pomiaru (przypomnini): nominalna porządk właściwi dowolny Forma spędzania wolngo czasu nominalna dychotomiczna, PŁEĆ, CHORY, ZDROWY porządkowa (dokładnijsza), można przypisać rangi intrwałowa (możmy przyporządkować poszczgólnym obiktom wartość mirzoną w ściśl okrślonych jdnostkach) Przykład problmów: 1. Tablic liczbności Wykształcni Liczność Procnt Liczność Procnt Skumulowany Skumulowana Podstawow 13 5,10 13 5,10 Zawodow 111 43,53 14 48,63 Śrdni 91 35,69 15 84,31 Pomaturaln 5 1,96 0 86,7 Wyższ 35 13,73 55 100,00 1

Autor: Dariusz Piwczyński 011-1-01 14:07. Asocjacj, czyli badani zalżności między cchami Czy humor Sza związany jst z pogodą??? Skala nominalna 40 0 15 75 41 80 9 150 10 17 48 75 91 117 9 300 Konkluzja: CHYBA JEST!!! Asocjacja między dwima zminnymi nominalnymi istnij, jżli rozkład jdnj zminnj ulga zmiani, gdy zminia się poziom drugij cchy (lub wartość) ulga zmiani. 4 6 5 75 50 49 51 150 5 5 5 75 89 90 91 300 Konkluzja: Sz jst jak skała!!! Asocjacj ni występują, gdy rozkład pirwszj zminnj ni zalży od rozkładu drugij zminnj! Wryikacja H 0 oraz dobór tstu 1. Tabl liczbności H 0 : Rozkład badanj cchy jst zgodny z tortycznym H 1 : Rozkład badanj cchy ni jst zgodny z tortycznym

Autor: Dariusz Piwczyński 011-1-01 14:07 Tst tst zgodności (Liczbności rzczywist są zgodn z oczkiwanymi!) mp. o o wartość otrzymana; wartość oczkiwana Obliczon mp. porównujmy z tab. odczytanym z tabl statystycznych dla okrślonj liczby stopni swobody (d) i poziomu istotności. Jżli otrzyman mp jst większ lub równ wartości odczytanj z tabl to istniją podstawy do odrzucni hipotzy zrowj. Oznacza to, ż analizowany rozkład ni jst zgodny z rozkładm tortycznym. d liczba stopni swobody (liczba grup 1). Przy 3 grupach d =, poniważ różnic między o i mogą się swobodni kształtować tylko w dwóch grupach, trzcia grupa zdtrminowana jst przz sumę obsrwacji dla wszystkich grup). Założnia i ogranicznia tstu wartość oczkiwana w każdj klasi ni powinna być mnijsza niż 5. Przy większj liczbi klas i tak niskij wartości oczkiwanj, pwn klasy można z sobą połączyć. Dzięki tmu istnij szansa na zwiększni tj wartości. Przy dwóch grupach, d = 1, stosujmy tzw. poprawkę Yats a na niciągłość. Wynika to z tgo, iż rozkład jst rozkładm ciągłym, zaś rkwncj przyjmują liczby naturaln. Przy małych liczbnościach moż to spowodować odrzucni hipotzy zrowj z większym prawdopodobiństwm aniżli założony poziom istotności. mp. o 0,5 Czy struktura płci studiujących osób na Wydzial Hodowli i Biologii Zwirząt jst zgodna z tortycznym rozkładm płci w populacji ludzkij, tj. 1:1? 6 157,5 89 157,5 o mp. 157,5 157,5 (d=1;=0,05) = 3,841 59,89 Obliczona wartość statystyki mp. jst większa niż wartość odczytana z tabl (wartość krytyczna), co pozwala odrzucić hipotzę zrową i stwirdzić, ż rozkład płci studiujących osób ni jst zgodny z rozkładm 1:1. 3

Autor: Dariusz Piwczyński 011-1-01 14:07 Przykład (EXCEL): (Wprowadzni do statystyki dla przyrodników, Adam Łomnicki): Czy istnij związk między wikim ślimaków a skłonnością do przbywania w okrślonym sidlisku? o odkryty grunt Roślinność pni drzw wiku (otrzyman) (G) zilona (R) (D) Młod (M) 5 43 17 11 Dorosł (D) 108 15 74 197 sidlisk 160 58 91 309 mp. o o wartość otrzymana; wartość oczkiwana Co oznaczają wartości rzczywist i oczkiwan? Wartość oczkiwaną ( ) obliczamy z proporcji: suma wirsza, w którym występuj = suma kolumny, w którj znajduj się suma wszystkich obsrwacji W naszym zadaniu wartość oczkiwaną liczby ślimaków młodych na odkrytym grunci obliczamy następująco: 11 = 160 309 zatm = (160 11) / 309 = 57,99 Oczkiwana liczbność osobników na grunci odkrytym wynosi 57,99. W sposób analogiczny obliczamy pozostał wartości oczkiwan. mp = 49,163 Wartość krytyczną statystyki odczytujmy z tabl statystycznych w zalżności od ustalongo poziomu istotności i liczby stopni swobody. Liczba stopni swobody obliczana jst następująco: d = (k 1) (w 1), gdzi: k liczba kolumn (3 odkryty grunt, roślinność zilona, pni drzw) w liczba wirszy ( młod, dorosł). W naszym przykładzi d = ((3 1) ( 1)) 0,05 = 5,991. Z względu na akt, iż obliczona przz nas wartość statystyki mp jst większa niż wartość krytyczna odrzucamy hipotzę zrową. 4

Autor: Dariusz Piwczyński 011-1-01 14:07. Tablic kontyngncji (badani zalżności między cchami jakościowymi) H 0 : Między badanymi cchami ni ma zalżności H 1 : Istnij zalżność między badanymi cchami W clu wryikacji tych hipotz wykorzystujmy na ogół tst, al ni zawsz... Liczbności Rodzaj tstu: N > 40 i wszystki liczbności oczkiwan > 10 N > 40 i którakolwik liczbność oczkiwana < 5 tst z poprawką Yatsa 0 < N =< 40 i wszystki liczbności oczkiwan> 5 tst z poprawką Yatsa 0 < N =< 40 i którakolwik liczbność oczkiwana< 5 dokładny tst Fishra N =< 0 i którakolwik liczbność oczkiwana < 5 dokładny tst Fishra z poprawką Yatsa współczynnik z poprawką Yatsa z względu na niską liczbność w podgrupi. Powyższa poprawka powoduj bardzij ostrożną ocnę. Tst Mantl-Hanszl przznaczony jst do badania zalżności między cchami wyrażonymi skalami porządkowymi. H 0 : Brak porządkowj zalżności między zminnymi wirszy i kolumn H 1 : Istnij porządkowa zalżność między zminnymi wirszy i kolumn Współczynnik Fi () = pirwiastk kwadratowy ( /n). Stosowany w odnisiniu do tabl x. Przyjmuj wartości od 0 do 1. 0 - brak zalżności, 1 całkowita zalżność. Stosowany w odnisiniu do zminnych jakościowych. Statystyka V Cramra jst miarą siły zalżności między badanymi cchami. Jj wartość zawira się w przdzial od -1 do 1 w przypadku tabl dwudzilczych, zaś dla tabl większych przyjmuj wartości od 0 do 1. 0 1 brak zalżności płna zalżność 5

Autor: Dariusz Piwczyński 011-1-01 14:07 Wyniki z SAS, Przykład (SAS EG) ankita.xls: Sprawdź czy istnij zalżność między płcią a udzilonymi w ankici odpowidziami (kwik, papirosy, mijsc). H 0 : ni istnij zalżność między płcią osób a trścią udzilanych odpowidzi H 1 : istnij zalżność między płcią osób a trścią udzilanych odpowidzi Prawdopodobiństwo, jaki wynika z przprowadzongo tstu (0,6558) ni pozwala odrzucić hipotzy zrowj i stwirdzić, ż istnij zalżność istotna między płcią osób a odpowidzią na pytani: czy palisz papirosy? Zstawion w tabli wyniki pozwala stwirdzić, ż wśród kobit udział palących wyniósł 1,546% i był około j. p. niższy niż wśród mężczyzn (19,4%). STATISTICA 6

Autor: Dariusz Piwczyński 011-1-01 14:07 Dokładny tst Fishra (wartości mpiryczn) 1 3 4 0 5 5 1 8 9 Możliw wartości 0 4 4 1 4 5 1 8 9 W ramach tstu Fishra obliczan jst prawdopodobiństwo otrzymania dango rozkładu z tablicy. Rozpatrywan są wszlki możliw kombinacj liczbności komórk w oparciu o liczbności brzgow. Prawdopodobiństwo związan z dokładnym tstm Fishra wykazuj tndncj do przyjmowania wyższych wartości, aniżli asymptotyczny tst, poniważ jst tstm bardzij konsrwatywnym. Czy istnij zalżność wśród osób chorych na trądzik między płcią a ubytkami naskórka? Tabla plc wg ubytki_n plc ubytki_n Liczbność Procnt Proc. wir. Proc. kol. 0 1 Razm kobita 68 68.00 95.77 74.73 mzczyzna 3 3.00 79.31 5.7 Razm 91 91.00 3 3.00 4.3 33.33 6 6.00 0.69 66.67 9 9.00 71 71.00 9 9.00 100 100.00 Statystyka St. sw. Wartość Prawd. Chi-kwadrat 1 6.8149 0.0090 Chi-kw. ilorazu wiarygodn. 1 6.084 0.0137 Poprawka uciągl. chi-kwadrat 1 4.959 0.060 7

Autor: Dariusz Piwczyński 011-1-01 14:07 Statystyka St. sw. Wartość Prawd. Chi-kwadrat Mantla-Hanszla 1 6.7467 0.0094 Współczynnik FI 0.611 Współczynnik kontyngncji 0.56 V Cramra 0.611 OSTRZEŻENIE: 5% komórk ma oczkiwan liczby wyst. mnijsz niż 5. Chi-kwadrat moż ni być właściwym tstm. Pojawiło się ostrzżni z strony programu SAS o niwystarczających liczbnościach oczkiwanych. Dcyzję o odrzucniu hipotzy zrowj odczytujmy zatm w oparciu o tst z poprawką Yats a (Poprawka uciągl. chi-kwadrat), a w skrajnych przypadkach o dokładny tst Fishra. Dokładny tst Fishra Komórka (1,1) liczbność (F) 68 Lwostronn pr. <= F 0.9978 Prawostronn pr. >= F 0.0165 Tabla prawdopodobiństwa (P) 0.0143 Dwustronn pr. <= P 0.0165 Tst McNmary H 0 : p 1 = p H 1 : p 1 p p 1 proporcja pacjntów, którzy wykazują objawy choroby przd lcznim p proporcja pacjntów, którzy wykazują objawy choroby po lcznim ( ) A Liczba osób wśród których doszło do zmiany wyniku z dodatnigo na ujmny D Liczba osób wśród których doszło do zmiany wyniku z ujmngo na dodatni Wykorzystywany do analizy tabl x, gdy doświadczni zorganizowan jst w układzi zalżnym. Przykładm nich będzi wpływ prowadzonj kuracji na stan zdrowia pacjntów pacjntów. 1 pacjnt zdrowy; 0 pacjnt chory. 8

Autor: Dariusz Piwczyński 011-1-01 14:07 9

Autor: Dariusz Piwczyński 011-1-01 14:07 Wyniki 0 pacjnt bz objawów choroby; 1 pacjnt z objawami choroby Przprowadzony tst zgodności McNmara pozwala wnioskować, ż przprowadzona kuracja wpłynęła statystyczni na stan zdrowia pacjntów. 10