Statstka Katarza Chud Laskowska http://kc.sd.prz.edu.pl/
Aalza korelacj umożlwa stwerdzee wstępowaa zależośc oraz oceę jej atężea ZALEŻNOŚCI pomędz CECHAMI: CECHY: ILOŚCIOWA ILOŚCIOWA CECHY: JAKOŚCIOWA JAKOŚCIOWA CECHY : ILOŚCIOWA JAKOŚCIOWA ANALIZA KORELACJI TEST NIEZALEŻNOŚCI CHI KWADRAT PEARSONA TEST ANOVA TEST Aova Kruskala Wallsa
Korelacja cech loścowe Zależość korelacja charakterzuje sę tm, że określom wartoścom jedej zmeej przporządkowae są ścśle określoe wartośc drugej zmeej. Stopeń zależośc pomędz cecham określa jest za pomocą współczka korelacj r x Współczk korelacj lowej Pearsoa Współczk korelacj Rag Spearmaa Lczo w przpadku cech loścowch, mającch rozkład ormal lub zblżo do ormalego (zbór dach powe bć lcz) Lczo w przpadku : - gd cech są merzale badaa zborowość jest elcza - gd cech mają charakter jakoścow steje możlwość ch uporządkowaa
Współczk korelacj lowej Pearsoa Aalzę zależośc pomędz cecham loścowm ależ rozpocząć od Sporządzea wkresu rozrzutu. Dzęk aalze grafczej moża już a Początku stwerdzć cz steje potecjala zależość pomędz cecham I cz jest ses oblczaa zwązku mędz badam zmem. Y Y korelacja lowa dodata r x > 0 korelacja lowa ujema r x < 0 X X Y brak korelacj lowej r x = 0 Y brak korelacj lowej r x = 0 korelacja elowa X X
Współczk korelacj lowej Pearsoa przjmuje wartośc z przedzału od -1 do 1 Przjmuje sę że: r x < 0, brak zwązku lowego 0,-0,4 zależość wraźa lowa ale ska 0,4 0,7 zależość umarkowaa 0,7 0,9 zależość zacząca powżej 0,9 zależość bardzo sla Jeśl współczk korelacj lowej Pearsoa jest rów 0 to e ma zwązku mędz badam zmem. Natomast jeśl współczk korelacj jest rów 1 lub -1 to wstępuje deal zwązek low.
Współczk korelacj lowej Pearsoa poda jest wzorem: r x 1 x x 1 x x C X, Y s s x Współczk korelacj formuje o sle keruku zwązku: SIŁA od 0 do 1 (0-100%) KIERUNEK + lub Korelacja dodata wstępuje wted gd wraz ze wzrostem jedej cech wzrastają średo wartośc drugej cech (zwązek proporcjoal) Korelacja ujema wstępuje wted gd wraz ze wzrostem jedej cech maleją średo wartośc drugej cech (zwązek proporcjoal)
UWAGI 1. Wartość współczka korelacj blska 0 ozacza tlko brak korelacj lowej Pearsoa (może wstąpć zwązek dlatego tak waże są wkres rozrzutu).. Współczk korelacj podlega wpłwom wartośc odstającch (ekstremalch) 3. Korelacja pozora boca przrost atural
Spalaa (l) Przkład W pewej frme sprawdzoo jak obcążee samochodów dostawczch wpłwa a zużce palwa. Sprawdzć cz steje zależość pomędz badam cecham. Obcążee samochodu Spalae Lp X Y ( x x) ( x x) ( ) ( ) ( x x) ( ) 1 175 5-3 59 -,6 6,76 59,8 181 5,5-17 89 -,1 4,41 35,7 3 185 6-13 169-1,6,56 0,8 4 19 6,5-6 36-1,1 1,1 6,6 5 195 7-3 9-0,6 0,36 1,8 6 0 7,5 4 16-0,1 0,01-0,4 7 05 8 7 49 0,4 0,16,8 8 10 9,5 1 144 1,9 3,61,8 9 15 10 17 89,4 5,76 40,8 10 0 11 484 3,4 11,56 74,8 1980 76 014 36,4 65,5 198 7,6 r x x 65,5 01436,4 65,5 73309,6 65,5 70,76 0,98 1 10 8 6 4 0 170 180 190 00 10 0 30 r x Obcążee samochodu (kg) 1 x x x x Zależość mędz obcążeem a spalaem jest bardzo wsoka. jest to zależość dodata, wprost proporcjoala, wraz ze wzrostem obcążea wzrasta spalae. W 98% obcążee wpłwa a zużce palwa. 1
Zadae: Zbadać zależość pomędz lczbą posadach samochodów przez przedsęborstwa trasportowe a kosztam stałm (ts.). X Y Lczba posadach samochodów Koszt stałe (ts.) 0 5 30 45 40 40 50 35
REGRESJA Pojęce aalz regresj ścśle wąże sę z pojęcem korelacj. Na podstawe korelacj stwerdzć moża, cz mędz dam wstępuje zależość (określć jej welkość) oraz jak keruek oa posada. Aalza regresj pozwala w sposób dokład zterpretować odkrte zależośc. Lę regresj określa sę jako mejsce geometrcze średch wartośc zmeej zależej, prz ustaloch wartoścach zmeej ezależej. Zmea zależa (objaśaa) Y=ax+b wraz wol b współczk kerukow a Zmea ezależa (objaśająca)
Parametr rówaa regresj z prób szacuje sę klasczą metodą ajmejszch kwadratów (MNK), polega oa a takm oszacowau parametrów Fukcj Y=ax+b b dla dach z prób speło bł waruek ˆ axx b 1 1 m Gdze ozaczają wartośc emprcze cech Y a wzaczoe a podstawe rówaa Y=ax+b ŷ wartośc teoretcze Oblczając mejsca zerowe perwszch pochodch cząstkowch względem odpowedch parametrów fukcj otrzmujem: a x x 1 b a x x x x 1 Y= x+b INTERPRETACJA Jeżel zmeą X zwększm o jedostkę, to zmea Y zwększ sę (spade) O współczk kerukow a
Do oce dopasowaa prostej regresj do puktów emprczch wkorzstuje sę reszt czl różcę pomędz wartoścam emprczm a teoretczm fukcj regresj. e t ˆ ˆ wartośc emprcze wartośc teoretcze Fukcja regresj jest poprawe oszacowaa jeżel wartośc reszt są ewelke mają charakter losow. Waracja składka resztowego: ˆ s ( e ) t 1 k - lczba obserwacj k lczba szacowach parametrów Odchlee stadardowe reszt zwae róweż średm błędem szacuku określa o le średo wartośc emprcze odchlają sę od wartośc teoretczch. Wraz ze wzrostem odchlea stadardowego reszt maleje poprawość dopasowaa prostej regresj do dach
Ab sprawdzć w jakm stopu prosta regresj dopasowaa jest do dach Oblcza sę współczk determacj R 1 R 1 1 ˆ Współczk zbeżośc meśc sę w przedzale od 0 do 1 a często terpretowa jest w procetach. Wskazuje stopeń braku dopasowaa Prostej regresj do dach.
Przkład cd. Obcążee samochodu Spalae Lp X Y ( x x) ( x x) ( ) ( ) ( x x) ( ) ŷ e ˆ t ( ) e t ( ) 1 175 5-3 59 -,6 6,76 59,8 4,61 0,39 0,151 6,76 181 5,5-17 89 -,1 4,41 35,7 5,39 0,11 0,011 4,41 3 185 6-13 169-1,6,56 0,8 5,91 0,09 0,0081,56 4 19 6,5-6 36-1,1 1,1 6,6 6,8-0,3 0,104 1,1 5 195 7-3 9-0,6 0,36 1,8 7,1-0,1 0,0441 0,36 6 0 7,5 4 16-0,1 0,01-0,4 8,1-0,6 0,3844 0,01 7 05 8 7 49 0,4 0,16,8 8,51-0,51 0,601 0,16 8 10 9,5 1 144 1,9 3,61,8 9,16 0,34 0,1156 3,61 9 15 10 17 89,4 5,76 40,8 9,81 0,19 0,0361 5,76 10 0 11 484 3,4 11,56 74,8 10,46 0,54 0,916 11,56 1980 76 014 36,4 65,5 1,4066 36,4 198 7,6 a x x 65,5 014 1 x x 1 0,13 b a x x 7,6 0,13198 7,6 5,74 18,14 Y=ax+b Y=0,13x-18,14
Y=ax+b Y=0,13x-18,14 0,4 0,1758 0,1758 8 1,4066 10 1,4066 ˆ ) ( 1 s k e s t 0,04 36,4 1,4066 ˆ 1 1 0,94 0,04 1 1 R
Współczk korelacj rag Spearmaa Współczk te służ do opsu sł korelacj dwóch cech w przpadku gd: -cech są merzale, a badaa zborowość jest małolcza -mają oe charakter jakoścow ale steje możlwość ch uporządkowaa Wzęte do badań cech ależ uporządkować ze względu a wartośc każdej cech oddzele (rosąco lub malejąco). Jedostkom w każdm z porządkowań przpsuje sę umer od 1 do czl ragę. r s 6 1 1 d 1 d ozacza różcę mędz ragam cech x Współczk korelacj rag Spearmaa przjmuje wartośc z przedzału [-1,1]. Im wższa wartość korelacj rag Spearmaa tm wększa zależość mędz cecham.
Przkład Lp Lczba Lczba samochodów ludośc Raga Y Raga X 1 ŁÓDZKIE 1568366 534357 6 6 0 0 6 MAZOWIECKIE 3541044 54911 1 1 0 0 1 3 MAŁOPOLSKIE 1898517 3310094 4 4 0 0 4 4 ŚLĄSKIE 51534 463588 0 0 5 LUBELSKIE 135 151895 7 8-1 1 7,5 6 PODKARPACKIE 1174565 103505 10 9 1 1 9,5 7 PODLASKIE 6978 118839 14 14 0 0 14 8 ŚWIĘTOKRZYSKIE 783698 166014 1 13-1 1 1,5 9 LUBUSKIE 60931 101104 16 16 0 0 16 10 WIELKOPOLSKIE 346895 341946 3 3 0 0 3 11 ZACHODNIOPOMORSKIE 937571 169307 11 11 0 0 11 1 DOLNOŚLĄSKIE 1655833 877840 5 5 0 0 5 13 OPOLSKIE 630900 108585 15 15 0 0 15 14 KUJAWSKO-POMORSKIE 153158 069543 9 10-1 1 9,5 15 POMORSKIE 1313756 40319 8 7 1 1 7,5 16 WARMIŃSKO-MAZURSKIE 78601 14741 13 1 1 1 1,5 d d 6 r s 6 1 1 d 1 r s 66 36 36 1 1 1 1 0,0088 16 16 1 1655 4080 0,991
Zadae Na podstawe dach określć słę zwązku pomędz lczbą emtowach reklam a lczbą sprzedach samochodów. Dokoać terpretacj współczka korelacj rag Spearmaa Lczba emsj reklam samochodu Lczba sprzedach samochodów 3 15 5 33 4 4 5 50 6 48 7 51