STATYSTKA I ANALIZA DANYCH LAB V I VI. Pla laboatoum V VI Koelacja współczk koelacj Peasoa testowae stotośc współczka koelacj Regesja lowa egesja posta, ocea dopasowaa, testowae stotośc współczków egesj Test ch-kwadat badae zgodośc ozkładu z ozkładem zadam ezaleŝośc zme. jakoścowch. Badae koelacj Koelacja stwedzee faktu wstępowaa zaleŝośc mędz zmem oaz zbadae sł keuku tej zaleŝośc Wzó a oblczee współczka koelacj Peasoa: ( ( ( ( gdze oaz to śede atmetczch zmech, S oaz S to ch odchlea stadadowe, C(, to kowaacja C(, ( ( C(, [.0,.0] S S Własośc: maa smetcza; emaowaa uomowaa (moŝa poówwać koelacje dla óŝch zestawów zmech; wskazuje e tlko słę, ale keuek; podata a obsewacje skaje. Zwkle pzjmuje sę: > 0.7 sla koelacja, > 0.9 badzo sla koelacja, < 0.3 bak koelacj Spawdzee stotośc współczka koelacj ρ dla populacj a podstawe współczka Itucja: spawdzam cz oblczo współczk (ocea koelacj w póbe moŝe bć uŝt w odeseu do populacj? Testowa układ hpotez: H0: ρ 0 (badae cech są eskoelowae w populacj geealej H: ρ 0 (badae cech są skoelowae; ajczęścej bada sę hpotezę ρ 0, ale moŝa teŝ ρ > 0 lub ρ < 0 Wbó statstk testowej: test t (gd < 30, uwaga: czasem podaje sę < 50 lub < 00 ozkład t-studeta test z (gd duŝe kozstam z ozkładu omalego gdze to lczość pa zmech X Y. Następe poówuje sę otzmaą watość z watoścą ktczą odcztaą z tablc testu t-studeta dla - stop swobod (lub ozkładu omalego, gd duŝe pzjętego pozomu stotośc α (uwaga: odcztując z tablc watość testu dla α/ w pzpadku testu dwustoego lub α w pzpadku jedostoego. W pzpadku, gd: t oblczeowe > t tablcowe stwedza sę stotość współczka koelacj lowej a pozome stotośc α (odzucam H0 a zecz H. - -
3. Aalza egesj Regesja wjaśee w sposób aaltcz kształtowaa sę watośc jedej zmeej losowej (zmeej zaleŝej lub objaśaej pod wpłwem ej zmeej (ezaleŝej lub objaśającej lub ch (welu zmech. Itucja: poszukujem fukcj matematczej ŷ, któa będze dobze pasowała do empczch pa obsewacj obu zmech: ŷ + ε gdze ŷ f(x jest teoetczm pozomem zmeej odczt. z fukcj egesj (elemet sstematcz, ε jest zmeą losową (po co uwzględa sę ε? Albo w modelu e moŝa uwzględć wszstkch zmech objaśającch albo pzjęta aaltcza postać fukcj egesj e odpowada dokłade zeczwstej fome zaleŝośc mędz badam zmem Lowa egesja posta ajpostsz odzaj egesj, w któch zaleŝość zmech moŝa opsać za pomocą l postej: ŷ + ε a + b + ε gdze zmea zaleŝa (objaśaa zmea ezaleŝa (objaśająca a współczk keukow (slope b waz wol (paamet stuktuale lowej fukcj egesj (tecept ε błąd losow Czasem zamast ŷ a + b uŝwa sę otacj ŷ β + β 0 Metoda ajmejszch kwadatów - MNK Rzeczwste dae (,,,(, Watość teoetcza fukcj egesj: f ( Błąd oszacowaa: - ˆ ŷ to tzw. watość esztowa lub ezduum. Watośc ezduów pow bć jak ajmejsze dla wszstkch,,. Wskaźk ozposzea suma kwadatów ezduów ma bć mmal: ( ˆ ( ( C(, ( S a b a Gd a ma dodatą (ujemą watość, to pod wpłwem wzostu zmeej ezaleŝej o jedostkę, zmea zaleŝa ośe (maleje śedo o a jedostek Gd a 0, to bak wpłwu zmeej ezaleŝej a zaleŝą Waz wol b zadko posada sesową tepetację S S - -
Ocea dopasowaa fukcj egesj do dach empczch Całkowta suma kwadatów óŝc: ( SSR + ( ( ˆ + ( ˆ gdze SSR egesja suma kwadatów odchleń (część wjaśoa pzez zbudowa model, esztowa suma kwadatów odchleń (część ewjaśoa pzez zbudowa model. Współczk detemacj ajwaŝejsza maa dopasowaa fukcj egesj do dach empczch (współczk koelacj podeso do kwadatu Stosuek zmeośc wjaśoej pzez model do zmeośc całkowtej: R SSR Odchlee stadadowe składka esztowego błąd stadadow (pzecęte odchlee watośc empczch od watośc teoetczch: S Test stotośc współczków ówaa egesj lowej test F SłuŜ do wefkacj hpotez o baku zaleŝośc lowej pomędz badam cecham populacj opea sę a współczku achlea postej wlczom dla pób. W ogólośc (gd zmech objaśającch jest węcej Ŝ jeda: test odpowada a ptae, cz steje low zwązek egesj mędz zmeą zaleŝą Y a któąkolwek zmeą objaśającą (ezaleŝą X, jak to sugeuje hpotetcze ówae egesj. Podstawowe wauk stosowaa: Poma a skal pzedzałowej Nomalość ozkładu badach cech Testowa układ hpotez: H0: a 0 (bak zaleŝośc lowej H: a 0 (zaleŝość lowa steje W ogólośc, gd ozwaŝam welu zmech β + + β k k + β 0 : H0: β β β k 0 (gdze k to lczba zmech ezaleŝch X H: e wszstke β są ówe 0 Na dzsejszch zajęcach teesuje as pzpadek k. Oblczee watośc statstk testowej: F( k, ( k+ SSR MSR MS dla k ( F(, SSR / k /( ( k+ Watość ktcza szukaj w tablcach ozkładu F-Sedecoa dla daego α mam dwa stope swobod pewsz odpowada k, dug lczbe zmech pomejszoej o k + ; czl dla jedej zmeej szukam watośc odpowadającej stopom (,- - 3 -
4. Test ch kwadat Aalza zmech jakoścowch (płeć, status, kolo, maka, odzaj, pofl, upodobaa Dae (zmee omale; zmee o watoścach upoządkowach; zmee loścowe mogą bć zdsketzowae (welkość masta, dochodów; zmee skategozowae Wkozstae: test wkozstując statstkę o ozkładze słuŝ do oce zgodośc ozkładu z ozkładem zadam lub oce zaleŝośc mędz zmem jakoścowm Ogaczee: Rozkład ch kwadat moŝa stosować, gd oczekwaa lczość w kaŝdej klase jest ówa pzajmej 5 (w pzecwm aze, tzeba połączć klas, ab otzmać wększą lczość. Tabca welodzelcza (kotgecj; dla pa zmech dwudzelcza ZałoŜea ozaczea: zmea ma k katego kodowach jako,,..., k zmea ma l katego kodowach jako,,..., l póba lcz pa pa (, j jest lczbą wstąpea w póbe pa obsewacj (, j Schemat postępowaa: Sfomułuj pzpuszczee co do populacj pzez okeślee odpowedch hpotez Test zgodośc ch-kwadat: H0 : zgodość z pewm załoŝom ozkłądem (p. takm, Ŝe wszstke watośc są ówo pawdopodobe; H : bak zgodośc (daa populacja ma ozkład ezgod z tm, któ podaa w H0 Test ezaleŝośc ch-kwadat: H0 : bak zaleŝośc zmech jakoścowch (czl zgodość z ozkładem oczekwam; H : zaleŝość Zaotuj zaobsewowae lczośc puktów pomaowch w poszczególch klasach Oblcz częstośc wstępowaa pewch zdazeń pzez załoŝeu pawdzwośc H0 (tzw. lczośc oczekwae w óŝch klasach (kategoach Jak oblczć watość oczekwaą? w pzpadku załoŝoch pawdopodobeństw p (p. wszstke p ówe p N w pzpadku tablc dwudzelczej (z zasad ezaleŝośc pawdopodob. P( A B P( A P( B? skąd sę to wzęło? j (suma zędu -tego (suma kolum j-tej / suma j / N j p j N p p j N /N j /N N j / N - 4 -
Pzjmj pozom ufośc α (zazwczaj badzo mał Stope swobod: Jeśl wkozstuje sę dae do estmacj paametów ozkładu pawdopodobeństwa okeśloego pzez hpotezę zeową, to dla kaŝdego paametu estmowaego a podstawe tch dach tac sę dodatkow stopeń swobod ( zmea (k -; zmee (k -(l -. Sumacza lczość pozwala e zać jedej jakejkolwek lczośc klas; czl edukuje lczbę stop swobod o. Okeśl obsza ktcz: (watość odcztae z tablc testu dla odpowedego α df;. Zbadaj óŝcę mędz watoścam obsewowam oczekwam (wzó a statstkę Watość statstk: k ( O l lub ( Oj k j j j O j obsewowaa lczość w klase oaz klase j od ag. obseved j hpotetcza (oczekwaa pz załoŝeu pawdzwośc H 0 lczość w klase oaz klase j od ag. epected Podejmj deczję a podstawe watośc statstk obszau ktczego: Oblczee watośc statstk dla tablc o postac: a b c d ( ad bc ( a+ b( c+ d( a+ c( b+ d Popawka Yatesa (gd < 40 któakolwek z lczośc oczekwach < 5: ( ad bc / ( a+ b( c+ d( a+ c( b+ d Sama watość statstk pozwala tlko a stwedzee, cz wstępuje współzaleŝość. Potzebe są e ma do badaa sł zwązku Watośc od 0 (bak zwązku do (całkowte powązae Współczk Ф-Yula (tablca Φ Współczk V-Camea (ogólejsz V m( l, k, gdze k oaz l są wmaam tablc welodzelczej. Współczk kotgecj Peasoa C (uwaga: ma(c < : C + - 5 -