Współczynnik korelacji liniowej oraz funkcja regresji liniowej dwóch zmiennych

Podobne dokumenty
Rachunek prawdopodobieństwa i statystyka W 11: Analizy zależnościpomiędzy zmiennymi losowymi Model regresji wielokrotnej

STATYSTYKA MATEMATYCZNA

Natalia Nehrebecka. Zajęcia 3

Stanisław Cichocki. Natalia Nehrebecka Katarzyna Rosiak-Lada. Zajęcia 3

INFORMATYKA W SELEKCJI

Natalia Nehrebecka. Wykład 2

Statystyka i opracowanie danych W 5: Odkrywanie i analiza zależności pomiędzy zmiennymi losowymi (danymi empirycznymi)

CZĘŚĆ 6. MODEL REGRESJI, TREND LINIOWY ESTYMACJA, WNIOSKOWANIE

Egzamin ze statystyki/ Studia Licencjackie Stacjonarne/ Termin I /czerwiec 2010

Weryfikacja hipotez dla wielu populacji

Statystyka Opisowa 2014 część 2. Katarzyna Lubnauer

Zad 2 Dynamika zatrudnienia mierzona indeksami łańcuchowymi w ostatnich pięciu latach kształtowały się następująco: Lata Indeksy ( w %)

( ) ( ) 2. Zadanie 1. są niezależnymi zmiennymi losowymi o. oraz. rozkładach normalnych, przy czym EX. i σ są nieznane. 1 Niech X


) będą niezależnymi zmiennymi losowymi o tym samym rozkładzie normalnym z następującymi parametrami: nieznaną wartością 1 4

Dobór zmiennych objaśniających

Przypomnienie: wykłady i zadania kursu były zaczerpnięte z podręczników: Model statystyczny Format danych

Badanie współzaleŝności dwóch cech ilościowych X i Y. Analiza korelacji prostej. Badanie zaleŝności dwóch cech ilościowych. Analiza regresji prostej

KURS STATYSTYKA. Lekcja 6 Regresja i linie regresji ZADANIE DOMOWE. Strona 1

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Statystyka. Zmienne losowe

Natalia Nehrebecka. Zajęcia 4

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 4

65120/ / / /200

Natalia Nehrebecka. Dariusz Szymański

IID = 2. i i i i. x nx nx nx

Prawdopodobieństwo i statystyka r.

; -1 x 1 spełnia powyższe warunki. Ale

W praktyce często zdarza się, że wyniki obu prób możemy traktować jako. wyniki pomiarów na tym samym elemencie populacji np.

; -1 x 1 spełnia powyższe warunki. Ale

formularzy opisowych, ankiet lub innych dokumentów stanowi nieuporządkowany statystyczny, stanowi on podstawę dalszych

RACHUNEK NIEPEWNOŚCI POMIARU

WPROWADZENIE DO ANALIZY KORELACJI I REGRESJI

Regresja liniowa i nieliniowa

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Badanie współzależności dwóch cech ilościowych X i Y. Analiza korelacji prostej

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Procedura normalizacji

Analiza zależności zmiennych ilościowych korelacja i regresja

EKONOMETRIA Wykład 2: Metoda Najmniejszych Kwadratów

Hipotezy o istotności oszacowao parametrów zmiennych objaśniających ˆ ) ˆ

Stanisław Cichocki. Natalia Nehrebecka. Wykład 6

Analiza struktury zbiorowości statystycznej

Funkcje i charakterystyki zmiennych losowych

Ekonometria I materiały do ćwiczeń data lp wykładu temat Wykład dr Dorota Ciołek Ćwiczenia mgr inż. Marta Chylińska

t t t t T 2 Interpretacja: Przeciętna wartość zmiennej objaśnianej różni się od wartości teoretycznej średnio o

Projekt 6 6. ROZWIĄZYWANIE RÓWNAŃ NIELINIOWYCH CAŁKOWANIE NUMERYCZNE

BADANIA OPERACYJNE. Podejmowanie decyzji w warunkach niepewności. dr Adam Sojda

Analiza korelacji i regresji

t t t t T 2 Interpretacja: Przeciętna wartość zmiennej objaśnianej różni się od wartości teoretycznej średnio o ˆ

Służą opisowi oraz przewidywaniu przyszłego kształtowania się zależności gospodarczych.

Statystyka. Katarzyna Chudy Laskowska

Zjawiska masowe takie, które mogą wystąpid nieograniczoną ilośd razy. Wyrazów Obcych)

Statystyka Inżynierska

Rozkład dwupunktowy. Rozkład dwupunktowy. Rozkład dwupunktowy x i p i 0 1-p 1 p suma 1

STATYSTYKA MATEMATYCZNA WYKŁAD 5 WERYFIKACJA HIPOTEZ NIEPARAMETRYCZNYCH

Statystyka Opisowa 2014 część 1. Katarzyna Lubnauer

ZESTAW ZADAŃ Z INFORMATYKI

Wnioskowanie statystyczne dla korelacji i regresji.

Materiały do wykładu 7 ze Statystyki

BADANIE WSPÓŁZALEśNOŚCI DWÓCH CECH - ANALIZA KORELACJI PROSTEJ

0 0,2 0, p 0,1 0,2 0,5 0, p 0,3 0,1 0,2 0,4

Mikroekonometria 10. Mikołaj Czajkowski Wiktor Budziński

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

25. RÓWNANIA RÓŻNICZKOWE PIERWSZEGO RZĘDU. y +y tgx=sinx

Zaawansowane metody numeryczne

EKONOMETRIA I Spotkanie 1, dn

Macierz prawdopodobieństw przejścia w pojedynczym kroku dla łańcucha Markowa jest postaci

7.8. RUCH ZMIENNY USTALONY W KORYTACH PRYZMATYCZNYCH

Stanisław Cichocki. Natalia Nehrebecka. Wykład 7

METODA UNITARYZACJI ZEROWANEJ Porównanie obiektów przy ocenie wielokryterialnej. Ranking obiektów.

Markowa. ZałoŜenia schematu Gaussa-

WPŁYW AKCESJI POLSKI DO UNII EUROPEJSKIEJ NA ROZWÓJ ROLNICTWA EKOLOGICZNEGO. Lidia Luty

1.1. Uprość opis zdarzeń: 1.2. Uprościć opis zdarzeń: a) A B A Uprościć opis zdarzeń: 1.4. Uprościć opis zdarzeń:

Ć w i c z e n i e K 2 b

Ekonometria ćwiczenia Kolokwium 1 semestr 20/12/08. / 5 pkt. / 5 pkt. / 5 pkt. / 5 pkt. /20 pkt. Regulamin i informacje dodatkowe

Problem nośności granicznej płyt żelbetowych w ujęciu aktualnych przepisów normowych. Prof. dr hab. inż. Piotr Konderla, Politechnika Wrocławska

Zestaw zadań 4: Przestrzenie wektorowe i podprzestrzenie. Liniowa niezależność. Sumy i sumy proste podprzestrzeni.

termodynamika fenomenologiczna p, VT V, teoria kinetyczno-molekularna <v 2 > termodynamika statystyczna n(v) to jest długi czas, zachodzi

L.Kowalski zadania z rachunku prawdopodobieństwa-zestaw 4 ZADANIA - ZESTAW 4

Termodynamika. Wydział Inżynierii Mechanicznej i Robotyki II rok inż. Pomiary temperatury Instrukcja do ćwiczenia

Matematyka ubezpieczeń majątkowych r.

LINIOWA FUNKCJA PRAWDOPODOBIEŃSTWA

Trzecie laboratoria komputerowe ze Staty Testy

Zapis informacji, systemy pozycyjne 1. Literatura Jerzy Grębosz, Symfonia C++ standard. Harvey M. Deitl, Paul J. Deitl, Arkana C++. Programowanie.

Metody badań kamienia naturalnego: Oznaczanie współczynnika nasiąkliwości kapilarnej

1. SPRAWDZENIE WYSTEPOWANIA RYZYKA KONDENSACJI POWIERZCHNIOWEJ ORAZ KONDENSACJI MIĘDZYWARSTWOWEJ W ŚCIANIE ZEWNĘTRZNEJ

Mikroekonometria 10. Mikołaj Czajkowski Wiktor Budziński

EKONOMETRIA Wykład 4: Model ekonometryczny - dodatkowe zagadnienia

f(x, y) = arctg x y. f(u) = arctg(u), u(x, y) = x y. x = 1 1 y = y y = 1 1 +

Parametry zmiennej losowej

Ekonometria egzamin 01/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Sprawozdanie powinno zawierać:

Rozwiązywanie zadań optymalizacji w środowisku programu MATLAB

STATYSTYKA. Zmienna losowa skokowa i jej rozkład

Laboratorium ochrony danych

METODY KOMPUTEROWE 10

Mikroekonometria 13. Mikołaj Czajkowski Wiktor Budziński

Prawo propagacji niepewności. 1

Zaawansowane metody numeryczne Komputerowa analiza zagadnień różniczkowych 1. Układy równań liniowych

Transkrypt:

Współcznnk korelacj lnowej oraz funkcja regresj lnowej dwóch zmennch

S S r, cov

współcznnk determnacj R r Współcznnk ndetermnacj ϕ r Zarówno współcznnk determnacj jak ndetermnacj po przemnożenu przez 00 można wrazć w procentach. Wówczas współcznnk determnacj nformuje nas, w jakm procence zmenność jednej zmennej X lub Y można wjaśnć zmennoścą drugej zmennej Y lub X. Oblczając współcznnk ndetermnacj dowem sę, w jakm procence zmenność jednej ze zmennch X lub Y ne zależ od zmennośc drugej Y lub X, lecz od nnch cznnków losowch.

Przkład Zbadaj cz stneje zwązek pomędz wzrostem zmenna X w cm a cężarem cała mężczzn zmenna Y w kg dane w tabel ponżej. Wznacz znterpretuj: współcznnk korelacj, współcznnk determnacj ndetermnacj. Opsz badaną zależność za pomocą lnowej funkcj regresj oraz zbadaj dobroć jej dopasowana do danch emprcznch narsuj wkres współzależnośc, znterpretuj parametr funkcj regresj. mężczzna wzrost [cm] cężar [kg] 84 84 76 74 3 74 75 4 80 80 5 78 78 6 76 77

. Oblczane współcznnka korelacj lnowej wzrost w cężar w cm kg 84 84 6 6 36 36 36 76 74 - -4 8 4 6 3 74 75-4 -3 6 9 4 80 80 4 4 4 5 78 78 0 0 0 0 0 6 76 77 - - 4 suma 068 468 0 0 6 64 66 068 78 oraz 468 78 6 6 r 6 6 0,953959 64 66 6 0,95 0,953959 0,90038 R r 9% ϕ r 0,90038 0,08996 9% Pomędz wzrostem cężarem cała stneje slna dodatna współzależność. Cężar cała zależ od wzrost w ok. 9 procentach, natomast w 9 procentach zależ od nnch cznnków losowch ne ujętch w tm badanu

Wkres zależnośc pomedz wzostem cężarem cała 86 84 8 cężar cała w kg 80 78 76 74 7 7 74 76 78 80 8 84 86 wzrost w cm

Aproksmacja funkcj lnowej postac a + b + b a + b a Parametr a b wnoszą odpowedno: S S r a oraz a b Parametr a nazwan jest współcznnkem regresj. Informuje o le średno ulegne zmane wartość zmennej Y, jeżel wartość zmennej X wzrośne o jednostkę. Wraz woln funkcj b odpowada na ptane le teoretczne wnese wartość zmennej Y jeżel X będze równe 0.

Korzstając z nformacj lczbowch w przkładze, oszacować parametr a b lnowej funkcj regresj Y względem X oraz X względem Y. a 0 6 64 0 b a 0,96875 78 0,96875 78-94,4375 Zatem, funkcja regresj Y względem X ma postać: ˆ 0,96875 94,4375, Parametr a, nazwan jest współcznnkem regresj. W analzowanm przkładze parametr ten nformuje nas, że jeżel mężczzna urośne o jednostkę tzn. cm to wówczas pownen przbrać na wadze średno 0,97 kg atomast wraz woln b, wskazuje le będze wnosć średna wartość zmennej Y, jeże zmenna X0. W analzowanm przpadku, parametr ten ne posada logcznej nterpretacj, gdż ne możlw jest wzrost wnosząc 0 cm :

Wkres zależnośc pomedz wzostem cężarem cała wraz z funkcją regresj 86 84 8 cężar cała w kg 80 78 76 ˆ 0,96875 94,4375 74 7 7 74 76 78 80 8 84 86 wzrost w cm

Mar dobroc dopasowana funkcj Warancja resztowa: s ε / ˆ, Odchlene standardowe składnka resztowego: s s ε ε / / ˆ Odchlene standardowe składnka resztowego nformuje badacza, o le średno n plus lub n mnus odchlają sę wartośc emprczne Y od wartośc hpotetcznch określonch na podstawe funkcj regresj.

Współcznnk ndetermnacj ϕ funkcj regresj Y względem X: ϕ Współcznnk determnacj: ˆ, 4 R ϕ ˆ 5 Współcznnk determnacj nformuje nas, jaka część zman wartośc zmenne objaśnanej została wjaśnona, przez oszacowaną funkcję regresj. Im współcznnk determnacj jest blższ jednośc, tm funkcja regresj jest lepej dopasowana do danch emprcznch. Współcznnk ndetermnacj wskazuje natomast, jaka część zmennośc zmennej objaśnanej ne jest wjaśnona przez zmenną objaśnaną zmenne objaśnające wstępujące w funkcj regresj. Im wartość współcznnka jest blższa zeru, tm funkcja regresj jest lepej dopasowana do zmennch emprcznch.

wzrost w cm cężar w kg 84 84 83,85 0,875 0,03556 36 76 74 76,065 -,065 4,53906 6 3 74 75 74,5 0,875 0,76565 9 4 80 80 79,9375 0,065 0,003906 4 5 78 78 78 0 0 0 6 76 77 76,065 0,9375 0,878906 Σ 068 468 5,9375 66 Źródło: Oblczena własne 6 5,9375 / s ε ˆ 0,989583 s, ε / sε / 0,994778 6 Powższ wnk oznacza, że wartośc emprczne cężaru cała odchlają sę od wartośc hpotetcznch średno o ± 0,99 kg. ˆ ˆ 5,9375 5,9375 ϕ 0,08996 9%, R ϕ 0,90038 9% 66 66. Z powższch oblczeń wnka, że w około 9% zmennośc zmennej objaśnanej cężar wnka ze zmennośc zmennej objaśnającej wzrost wstępującej w funkcj regresj, natomast 9% zmennośc zmennej objaśnanej jest uzależnona od nnch cznnków ne objętch badanem.

Przkład W celu zbadana wpłwu spożwanego posłku śnadana na wnk otrzmane ze sprawdzan ze statk, poddano badanu grupę 0 studentów. Perwszą z cech ocenano na skal dwupunktowej w następując sposób 0 gd gd student zjadł śnadane X, student ne zjadł śnadana natomast druga z cech bła ocenana na skal punktowej od 0 do 5 punktów Otrzmano następujące wnk: student śnadane lczba punktów 5,5 0 3 0 3 4 0 5 0 8 6 0 0 7 0,5 8 0 4 9 9 0 8 Cz stneje współzależność pomędz wnkam ze sprawdzanu spożwanm posłkam?

Inne wbrane mar współzależnośc Współcznnk korelacj dwuserjnej Współcznnk skojarzena Yulea Współcznnk korelacj rang Spearmana

Emprczn współcznnk korelacj dwuserjnej 0 r d. S 0 0 średna artmetczna realzacj zmennej losowej Y, skojarzonch z realzacjam zmennej X o wartośc 0, średna artmetczna realzacj zmennej losowej Y, skojarzonch z realzacjam zmennej X o wartośc, 0 lczebność podzboru zer, lczebność podzboru jednek, 0 +, S odchlene standardowe zmennej losowej Y.

student śnadane lczba punktów 5,5 0,5 0,5 0-3 9 3 0 3-4 4 0 5 5 5 0 8-7 49 6 0 0-5 5 7 0,5 5,5 30,5 8 0 4-9 9 4 6 0 8 3 9 suma 5 50 68,5 5 S S r 0 d. 6,85 4,048755,4 8,6 0,94445459

Przkład 3 60 studentów regularne przgotowwało sę do zajęć ze Statstk, a 40 sporadczne. w grupe perwszej egzamn poprawkowe zdarzł sę 0 raz w cągu studów, a w drugej aż 30. Cz stneje zwązek pomędz soldnoścą prac konecznoścą poprawkowch egzamnów? Uzasadnć odpowedź posługując sę odpowednm mernkem

Y Σ 0 X 0 f0;0 f0; f0;0 + f0; f;0 f; f;0 + f; Σ f0;0 + f;0 f0; + f; Współcznnk skojarzena: f 0;0 f ; Q f 0;0 f ; + f f 0; f 0; f ;0 ;0

Przjmjm następujące oznaczena: X 0, jeżel student zdał egzamn w perwszm termne X, jeżel student mał egzamn poprawkow Y 0, jeżel student uczł sę regularne Y, jeżel student uczł sę sporadczne X Σ Y Σ 0 0 50 0 60 0 30 40 60 40 00 Q [5030-00]/ [5030+00]0,875

Współcznnk korelacj rang Spearmana Współcznnk korelacj rang stosuje sę wówczas, gd wartośc cech merzalnch opsanch przez odpowedne zmenne cągłe lub skokowe lub warant cech nemerzalnej, został zastąpone rangam, czl kolejnm lczbam. 6 d rs. gdze d - oznacza różncę pomędz rangam zmennej X Y, lość par obserwacj zmennej X Y.

Przkład 4 Wkorzstując dane z przkładu wznaczć współcznnk korelacj rang Spearmana pomędz wzrostem a cężarem cała mężczzn. wzrost w cm cężar w kg rang zmennej X rang zmennej Y 84 84 6 6 0 0 76 74,5,5.5 3 74 75-4 80 80 5 5 0 0 5 78 78 4 4 0 0 6 76 77,5 3-0,5 0,5 Σ 068 468 XXX XXX XXX 3,5 d d 6 d 6 3,5 6 35 0 s. 0,9. r