Współcznnk korelacj lnowej oraz funkcja regresj lnowej dwóch zmennch
S S r, cov
współcznnk determnacj R r Współcznnk ndetermnacj ϕ r Zarówno współcznnk determnacj jak ndetermnacj po przemnożenu przez 00 można wrazć w procentach. Wówczas współcznnk determnacj nformuje nas, w jakm procence zmenność jednej zmennej X lub Y można wjaśnć zmennoścą drugej zmennej Y lub X. Oblczając współcznnk ndetermnacj dowem sę, w jakm procence zmenność jednej ze zmennch X lub Y ne zależ od zmennośc drugej Y lub X, lecz od nnch cznnków losowch.
Przkład Zbadaj cz stneje zwązek pomędz wzrostem zmenna X w cm a cężarem cała mężczzn zmenna Y w kg dane w tabel ponżej. Wznacz znterpretuj: współcznnk korelacj, współcznnk determnacj ndetermnacj. Opsz badaną zależność za pomocą lnowej funkcj regresj oraz zbadaj dobroć jej dopasowana do danch emprcznch narsuj wkres współzależnośc, znterpretuj parametr funkcj regresj. mężczzna wzrost [cm] cężar [kg] 84 84 76 74 3 74 75 4 80 80 5 78 78 6 76 77
. Oblczane współcznnka korelacj lnowej wzrost w cężar w cm kg 84 84 6 6 36 36 36 76 74 - -4 8 4 6 3 74 75-4 -3 6 9 4 80 80 4 4 4 5 78 78 0 0 0 0 0 6 76 77 - - 4 suma 068 468 0 0 6 64 66 068 78 oraz 468 78 6 6 r 6 6 0,953959 64 66 6 0,95 0,953959 0,90038 R r 9% ϕ r 0,90038 0,08996 9% Pomędz wzrostem cężarem cała stneje slna dodatna współzależność. Cężar cała zależ od wzrost w ok. 9 procentach, natomast w 9 procentach zależ od nnch cznnków losowch ne ujętch w tm badanu
Wkres zależnośc pomedz wzostem cężarem cała 86 84 8 cężar cała w kg 80 78 76 74 7 7 74 76 78 80 8 84 86 wzrost w cm
Aproksmacja funkcj lnowej postac a + b + b a + b a Parametr a b wnoszą odpowedno: S S r a oraz a b Parametr a nazwan jest współcznnkem regresj. Informuje o le średno ulegne zmane wartość zmennej Y, jeżel wartość zmennej X wzrośne o jednostkę. Wraz woln funkcj b odpowada na ptane le teoretczne wnese wartość zmennej Y jeżel X będze równe 0.
Korzstając z nformacj lczbowch w przkładze, oszacować parametr a b lnowej funkcj regresj Y względem X oraz X względem Y. a 0 6 64 0 b a 0,96875 78 0,96875 78-94,4375 Zatem, funkcja regresj Y względem X ma postać: ˆ 0,96875 94,4375, Parametr a, nazwan jest współcznnkem regresj. W analzowanm przkładze parametr ten nformuje nas, że jeżel mężczzna urośne o jednostkę tzn. cm to wówczas pownen przbrać na wadze średno 0,97 kg atomast wraz woln b, wskazuje le będze wnosć średna wartość zmennej Y, jeże zmenna X0. W analzowanm przpadku, parametr ten ne posada logcznej nterpretacj, gdż ne możlw jest wzrost wnosząc 0 cm :
Wkres zależnośc pomedz wzostem cężarem cała wraz z funkcją regresj 86 84 8 cężar cała w kg 80 78 76 ˆ 0,96875 94,4375 74 7 7 74 76 78 80 8 84 86 wzrost w cm
Mar dobroc dopasowana funkcj Warancja resztowa: s ε / ˆ, Odchlene standardowe składnka resztowego: s s ε ε / / ˆ Odchlene standardowe składnka resztowego nformuje badacza, o le średno n plus lub n mnus odchlają sę wartośc emprczne Y od wartośc hpotetcznch określonch na podstawe funkcj regresj.
Współcznnk ndetermnacj ϕ funkcj regresj Y względem X: ϕ Współcznnk determnacj: ˆ, 4 R ϕ ˆ 5 Współcznnk determnacj nformuje nas, jaka część zman wartośc zmenne objaśnanej została wjaśnona, przez oszacowaną funkcję regresj. Im współcznnk determnacj jest blższ jednośc, tm funkcja regresj jest lepej dopasowana do danch emprcznch. Współcznnk ndetermnacj wskazuje natomast, jaka część zmennośc zmennej objaśnanej ne jest wjaśnona przez zmenną objaśnaną zmenne objaśnające wstępujące w funkcj regresj. Im wartość współcznnka jest blższa zeru, tm funkcja regresj jest lepej dopasowana do zmennch emprcznch.
wzrost w cm cężar w kg 84 84 83,85 0,875 0,03556 36 76 74 76,065 -,065 4,53906 6 3 74 75 74,5 0,875 0,76565 9 4 80 80 79,9375 0,065 0,003906 4 5 78 78 78 0 0 0 6 76 77 76,065 0,9375 0,878906 Σ 068 468 5,9375 66 Źródło: Oblczena własne 6 5,9375 / s ε ˆ 0,989583 s, ε / sε / 0,994778 6 Powższ wnk oznacza, że wartośc emprczne cężaru cała odchlają sę od wartośc hpotetcznch średno o ± 0,99 kg. ˆ ˆ 5,9375 5,9375 ϕ 0,08996 9%, R ϕ 0,90038 9% 66 66. Z powższch oblczeń wnka, że w około 9% zmennośc zmennej objaśnanej cężar wnka ze zmennośc zmennej objaśnającej wzrost wstępującej w funkcj regresj, natomast 9% zmennośc zmennej objaśnanej jest uzależnona od nnch cznnków ne objętch badanem.
Przkład W celu zbadana wpłwu spożwanego posłku śnadana na wnk otrzmane ze sprawdzan ze statk, poddano badanu grupę 0 studentów. Perwszą z cech ocenano na skal dwupunktowej w następując sposób 0 gd gd student zjadł śnadane X, student ne zjadł śnadana natomast druga z cech bła ocenana na skal punktowej od 0 do 5 punktów Otrzmano następujące wnk: student śnadane lczba punktów 5,5 0 3 0 3 4 0 5 0 8 6 0 0 7 0,5 8 0 4 9 9 0 8 Cz stneje współzależność pomędz wnkam ze sprawdzanu spożwanm posłkam?
Inne wbrane mar współzależnośc Współcznnk korelacj dwuserjnej Współcznnk skojarzena Yulea Współcznnk korelacj rang Spearmana
Emprczn współcznnk korelacj dwuserjnej 0 r d. S 0 0 średna artmetczna realzacj zmennej losowej Y, skojarzonch z realzacjam zmennej X o wartośc 0, średna artmetczna realzacj zmennej losowej Y, skojarzonch z realzacjam zmennej X o wartośc, 0 lczebność podzboru zer, lczebność podzboru jednek, 0 +, S odchlene standardowe zmennej losowej Y.
student śnadane lczba punktów 5,5 0,5 0,5 0-3 9 3 0 3-4 4 0 5 5 5 0 8-7 49 6 0 0-5 5 7 0,5 5,5 30,5 8 0 4-9 9 4 6 0 8 3 9 suma 5 50 68,5 5 S S r 0 d. 6,85 4,048755,4 8,6 0,94445459
Przkład 3 60 studentów regularne przgotowwało sę do zajęć ze Statstk, a 40 sporadczne. w grupe perwszej egzamn poprawkowe zdarzł sę 0 raz w cągu studów, a w drugej aż 30. Cz stneje zwązek pomędz soldnoścą prac konecznoścą poprawkowch egzamnów? Uzasadnć odpowedź posługując sę odpowednm mernkem
Y Σ 0 X 0 f0;0 f0; f0;0 + f0; f;0 f; f;0 + f; Σ f0;0 + f;0 f0; + f; Współcznnk skojarzena: f 0;0 f ; Q f 0;0 f ; + f f 0; f 0; f ;0 ;0
Przjmjm następujące oznaczena: X 0, jeżel student zdał egzamn w perwszm termne X, jeżel student mał egzamn poprawkow Y 0, jeżel student uczł sę regularne Y, jeżel student uczł sę sporadczne X Σ Y Σ 0 0 50 0 60 0 30 40 60 40 00 Q [5030-00]/ [5030+00]0,875
Współcznnk korelacj rang Spearmana Współcznnk korelacj rang stosuje sę wówczas, gd wartośc cech merzalnch opsanch przez odpowedne zmenne cągłe lub skokowe lub warant cech nemerzalnej, został zastąpone rangam, czl kolejnm lczbam. 6 d rs. gdze d - oznacza różncę pomędz rangam zmennej X Y, lość par obserwacj zmennej X Y.
Przkład 4 Wkorzstując dane z przkładu wznaczć współcznnk korelacj rang Spearmana pomędz wzrostem a cężarem cała mężczzn. wzrost w cm cężar w kg rang zmennej X rang zmennej Y 84 84 6 6 0 0 76 74,5,5.5 3 74 75-4 80 80 5 5 0 0 5 78 78 4 4 0 0 6 76 77,5 3-0,5 0,5 Σ 068 468 XXX XXX XXX 3,5 d d 6 d 6 3,5 6 35 0 s. 0,9. r