Aalza zależośc Rodzaje zależośc mędzy zmeym występujące w praktyce: Fukcyja wraz ze zmaą wartośc jedej zmeej astępuje ścśle określoa zmaa wartośc drugej zmeej (p. w fzyce: spadek swobody gt s ) tochastycza wraz ze zmaą wartośc jedej zmeej astępuje zmaa rozkładu prawdopodobeostwa drugej zmeej (zmaa: rozkładów warukowych, średch waracj) Korelacyja wraz ze zmaą wartośc jedej zmeej astępuje średch drugej zmeej zmaa wartośc
Zmee będą stochastycze ezależe, jeśl rozkłady warukowe jedej zmeej, dla dowolych wartośc drugej, będą detycze. Zmee będą eskorelowae, jeśl średe warukowe będą take same. tąd wdad, że zmee mogą byd eskorelowae, ale stochastycze zależe (p. średe warukowe są take same, ale różą sę waracją)
Aby zbadad ezależośd stochastyczą dwóch cech ależy dae zestawd w tablcy kotygecyjej (krzyżowej, welodzelczej, korelacyjej). Tablca ta ma postad: Y\X x x x s * y s * y s * y r r r r s r * * j * * * s gdze s * j j * j r j 3
Warukem koeczym wystarczającym stochastyczej ezależośc cech jest, aby częstośc w rozkładach łączym brzegowych spełały relację j * * j dla każdej pary wskaźków (, j), gdze =,,, r, j =,,, s. Podstawą do ocey sły zależośc mędzy badaym cecham są różce pomędzy lczeboścam j zaobserwowaym w łączym rozkładze empryczym a teoretyczym lczeboścam, które wystąpłyby, gdyby cechy były ezależe j j j 4
Dokładej, do ocey sły ezależośc służy r s (j j) Z j j Z przyjmuje wartośc z przedzału [;(g-)], gdze g = m(r, s). Z =, gdy cechy są stochastycze ezależe, a Z = (g-), gdy występuje zależośd fukcyja. Na podstawe Z została określoa uormowaa mara sły zależośc cech, zwaa współczykem zbeżośc V Cramera. V Z (g V przyjmuje wartośc z przedzału [;]. ozacza stochastyczą ezależośd, a zależośd fukcyją. 5 )
Omówoa mara dotyczy ocey sły zależośc pomędzy cecham w zborowośc skooczoej. Do woskowaa o stochastyczej ezależośc dwóch zmeych w populacj geeralej a podstawe wyków otrzymaych w próbe moża zweryfkowad odpowedą hpotezę eparametryczą za pomocą testu. Hpoteza zerowa ma zwykle postad zdaa cechy w populacj geeralej są stochastycze ezależe, co w zapse formalym wygląda astępująco: H : gdze: p, j p p,,j, j p, j p, p, j =,,,r, j =,,,s. ozacza łączy rozkład prawdopodobeostwa zmeej (X,Y), ozacza brzegowy rozkład prawdopodobeostwa zmeej Y, ozacza brzegowy rozkład prawdopodobeostwa zmeej X. 6
H : tatystyka - cechy w populacj geeralej są stochastycze zależe. tatystyka sprawdzająca Z daa jest wzorem gdze, j p, j j p, p, j Z j r j s ( j j s j tatystyka Z, przy założeu prawdzwośc H, ma rozkład o (r-)(s-) stopach swobody. Zbór krytyczy określoy jest wzorem P(Z ), gdze α jest pozomem stotośc. Zatem zawsze, gdy Z hpotezę H odrzuca sę. j ) j r j j 7
Korelacja Do pomaru sły korelacj lowej mędzy loścowym cecham X Y (dla próby -elemetowej) służy współczyk korelacj Pearsoa, day wzorem: (x x)(y y) cov(x, Y) XY X Y rxy XY X X Y Y (x x) (y y) gdze: cov(x, Y) XY X Y X, Y odchylee stadardowe x, y wartośc cechy X oraz Y w -tej obserwacj 8 (x x)(y y)
Własośc:. Współczyk korelacj lowej Pearsoa r XY przyjmuje wartośc z przedzału *-;]. r XY = r Y X 3. r -XY = -r XY 4. r XY = ozacza brak korelacj lowej mędzy zmeym X Y 5. r XY = zależośd w postac fukcj lowej 9
W aalzach statystyczych zwykle przyjmuje sę, że: wartośd r XY pożej, brak zwązku lowego wartośd r XY pomędzy,,4 zależośd lowa wyraźa, ale ska wartośd r XY pomędzy,4,7 zależośd lowa umarkowaa wartośd r XY pomędzy,7,9 zależośd lowa zacząca wartośd r XY powyżej,9 zależośd lowa bardzo sla Uwaga: Przy elowej zależośc wartośd lczbowa współczyka korelacj jest ższa, ż wykałoby to z oczywstej sły zwązku mędzy cecham; wtedy odpowedą marą są stosuk korelacyje.
Do woskowaa o zależośc korelacyjej mędzy cecham w populacj geeralej moża zweryfkowad hpotezę o stotośc współczyka korelacj za pomocą astępującego testu, skostruowaego przy założeu, że (X,Y) mają dwuwymarowy rozkład ormaly: H : H : (H : ; H : ) Jeśl H jest prawdzwa, to statystyka t r r ma rozkład t-tudeta z - stopam swobody. r ozacza tu współczyk korelacj z próby, atomast ρ współczyk korelacj w populacj geeralej.
Obszar krytyczy opsay jest wzorem P( t t, ), gdze α ozacza pozom stotośc. Jeśl t t,, to H odrzucamy, w przecwym wypadku stwerdzamy brak podstaw do odrzucea H. Dla testów jedostroych (odpowedo) obszary krytycze:. (t t ) lub. P(t t, ), P, a H odrzucamy, gdy:. t t, lub. t t,.
Do badaa zależośc korelacyjej mędzy cecham jakoścowym (których wartośc moża uporządkowad) lub loścowym moża wykorzystad współczyk korelacj rag pearmaa r, określoy wzorem 6 d r 3 gdze a raga przyporządkowaa -tej obserwacj w perwszym cągu, b raga przyporządkowaa -tej obserwacj w drugm cągu, d = a b. Współczyk korelacj rag pearmaa r s przyjmuje wartośc z przedzału *-;] 3
Regresja O le badae zależośc korelacyjej moża przeprowadzd dla dwóch dowolych cech, to badae regresj przeprowadza sę dla takch cech, dla których zachodzą zwązk przyczyowoskutkowe (p. zależośd mędzy długoścą prawego lewego ramea moża badad zwązek korelacyjy, ale e ma zwązku typu regresja). Parametry fukcj regresj wyzacza sę za pomocą metody ajmejszych kwadratów. Ograczymy sę do przedstawea regresj lowej dwóch zmeych. W tym przypadku fukcje regresj są postac: ŷ x xˆ y 4
Wyzaczymy parametry fukcj regresj. Zmea X jest zmeą ezależą, a zmea Y zależą. Dla fukcj rozumowae jest aalogcze. Tutaj zmea Y jest zmeą ezależą, a zmea X zależą. Dyspoujemy rówoczesym obserwacjam zmeych X Y. Wartośc zmeych X, Y w -tej obserwacj ozaczmy przez x, y (odpowedo), a wartośc teoretycze tych zmeych w -tej obserwacj, wykające z fukcj regresj, ozaczymy odpowedo przez xˆ, ŷ. zukamy takch a oraz a, dla których fukcja F, określoa pożej, osąga mmum, tz. F( xˆ y, ) (y ŷ) (y x ) m 5 ŷ x
Warukem koeczym stea ekstremum jest zerowae sę perwszej pochodej, tz. tąd, po przekształceach otrzymamy układ rówao 6 y x y x x x ) ( F F
Rozwązaem układu jest: tatystyka Rówoważe a moża wyrazd astępująco: ( ) a cov(x, Y) XY X Y Y a r XY X X X X Waruek wystarczający dla mmum jest róweż spełoy (macerz drugej pochodej fukcj F w pukce (a,a ) jest dodato określoa). 7 a (x (x y x)(y a x) x y)
Dla regresj X względem Y aalogcze wzory mają postad: Rówoważe b moża wyrazd astępująco: b b (x (y x x)(y b y) y y) b cov(x, Y) Y XY Y X Y Y r XY X Y 8
Mamy fukcje regresj oraz. Parametr regresj α (β ) formuje as, o le jedostek przecęte zme sę wartośd zmeej zależej Y (X), gdy wartośd zmeej ezależej X (Y) wzrośe o jedą jedostkę; przy czym dodat zak parametru ozacza wzrost wartośc zmeej zależej, a ujemy - zmejszee wartośc tej zmeej. Różce pomędzy zaobserwowaym wartoścam zmeej zależej odpowedm wartoścam azywamy resztam. Ozaczmy je astępująco: u y ŷ ŷ x dla regresj z x dla regresj xˆ xˆ xˆ ŷ y x y 9
Lowe fukcje regresj wyzaczae a podstawe próby losowej metodą ajmejszych kwadratów mają astępujące własośc (sformułujemy je dla ŷ x, gdyż dla drugej regresj są aalogcze):. uma wartośc teoretyczych zmeej zależej jest rówa sume empryczych wartośc tej zmeej, tz.. ŷ. uma reszt wyos zero u (a x (y a ŷ ) ) a y x a ŷ z ( ) w. y
3. Pukt (x, y) ależy do wykresu fukcj regresj, bo po przekształceu drugego rówaa w (**) mamy y x. Do ocey dokładośc dopasowaa prostej regresj do daych empryczych ależy badad reszty. Waracja reszt daa jest wzoram: u u Perwastek kwadratowy z waracj ( ) jest odchyleem u z stadardowym reszt. Iterpretujemy go jako przecęte ( plus lub mus) odchylee zaobserwowaych wartośc zmeej zależej y (x ) od jej wartośc teoretyczych ŷ ( xˆ ). z z
Warację reszt moża wykorzystad do oszacowaa stadardowych błędów ocey parametrów a a (b b ), ozaczaych odpowedo:, (, ) a (x u x) a a b b b (y z y) a u (x x x) b z (y y y)
Wartośd otrzymaa a podstawe kokretej próby jest oceą średego odchylea wartośc współczyków regresj z prób -elemetowych od. Aalogcze terpretujemy,,. Z określea stadardowych błędów szacuku parametrów wdad, że dokładośd estymacj jest wprost proporcjoala do welkośc próby zakresu zmeośc zmeej ezależej, a odwrote proporcjoala do waracj reszt. Marą dopasowaa fukcj regresj do puktów empryczych jest współczyk determacj R. Wyraża sę wzorem: R a (ŷ (y y) y) R (xˆ (x 3 x) x) a b b regresjax wzgledem Y
Wartośd R ależy do przedzału *, + formuje as, jaka częśd obserwowaej w próbe całkowtej zmeośc zmeej zależej została wyjaśoa regresją lową. Ią marą jest współczyk determacj (zbeżośc), określoy wzorem (y (y ŷ ) y) (x (x regresjax wzgledem Y Wartośd ależy do przedzału *, + formuje as, jaka częśd obserwowaej w próbe całkowtej zmeośc zmeej zależej e została wyjaśoa regresją lową. xˆ ) x) 4
Oczywśce zachodz R Dla regresj lowej wartość współczyka determacj jest rówa kwadratow współczyka korelacj, tz. R r XY r YX Fukcja regresj ajczęścej wykorzystywaa jest do progozowaa (przewdywaa) wartośc zmeej zależej przy ustaloym pozome zmeej ezależej. 5