Wykład 4 Związki i zależności

Podobne dokumenty
Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Rozdział 8. Regresja. Definiowanie modelu

PDF created with FinePrint pdffactory Pro trial version

Wprowadzenie do technik analitycznych Metoda najmniejszych kwadratów

KORELACJE I REGRESJA LINIOWA

Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

MODELE LINIOWE. Dr Wioleta Drobik

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

3. Modele tendencji czasowej w prognozowaniu

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ

Elementy Modelowania Matematycznego Wykład 4 Regresja i dyskryminacja liniowa

WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ANALIZA REGRESJI SPSS

Wprowadzenie do analizy korelacji i regresji

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

Statystyka. Wykład 9. Magdalena Alama-Bućko. 7 maja Magdalena Alama-Bućko Statystyka 7 maja / 40

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Analiza współzależności zjawisk

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Wykład 3. Rozkład normalny

Prognozowanie na podstawie modelu ekonometrycznego

Statystyka matematyczna i ekonometria

Analiza zależności liniowych

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Regresja i Korelacja

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

ANALIZA REGRESJI WIELOKROTNEJ. Zastosowanie statystyki w bioinżynierii Ćwiczenia 8

Analiza współzależności dwóch cech I

Zmienne zależne i niezależne

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Wykład 6. Badanie dynamiki zjawisk

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji

W statystyce stopień zależności między cechami można wyrazić wg następującej skali: n 1

POLITECHNIKA OPOLSKA

X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9

Analiza składowych głównych. Wprowadzenie

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

REGRESJA (postać liniowa funkcji) - ROZWIĄZANIA Komentarze kursywą, rozwiązania oraz treści zadań pismem prostym.

Analiza zależności cech ilościowych regresja liniowa (Wykład 13)

5. Model sezonowości i autoregresji zmiennej prognozowanej

Stanisław Cichocki. Natalia Nehrebecka. Wykład 4

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Wykład 6. Badanie dynamiki zjawisk

STATYSTYKA. Rafał Kucharski. Uniwersytet Ekonomiczny w Katowicach 2015/16 ROND, Finanse i Rachunkowość, rok 2

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version

Załóżmy, że obserwujemy nie jedną lecz dwie cechy, które oznaczymy symbolami X i Y. Wyniki obserwacji obu cech w i-tym obiekcie oznaczymy parą liczb

Wykład 2: Tworzenie danych

Analiza Współzależności

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Stosowana Analiza Regresji

zestaw zadań nr 7 Cel: analiza regresji regresja prosta i wieloraka MODELE

BADANIE EFEKTU HALLA. Instrukcja wykonawcza

Statystyka w analizie i planowaniu eksperymentu

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 11-12

Statystyka. Wykład 13. Magdalena Alama-Bućko. 12 czerwca Magdalena Alama-Bućko Statystyka 12 czerwca / 30

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

3. Analiza własności szeregu czasowego i wybór typu modelu

Spis treści. LaboratoriumV: Podstawy korelacji i regresji. Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

Korelacja, autokorelacja, kowariancja, trendy. Korelacja określa stopień asocjacji między zmiennymi

t y x y'y x'x y'x x-x śr (x-x śr)^2

BADANIE EFEKTU HALLA. Instrukcja wykonawcza

STATYSTYKA MATEMATYCZNA ZESTAW 0 (POWT. RACH. PRAWDOPODOBIEŃSTWA) ZADANIA

Statystyki opisowe i szeregi rozdzielcze

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych

Analiza składowych głównych

Zależność. przyczynowo-skutkowa, symptomatyczna, pozorna (iluzoryczna),

Przedziały ufności i testy parametrów. Przedziały ufności dla średniej odpowiedzi. Interwały prognoz (dla przyszłych obserwacji)

Egzamin z ekonometrii wersja IiE, MSEMAT

ANALIZA KORELACJI Korelacja między zmiennymi X i Y jest miarą siły liniowego związku między tymi zmiennymi.

1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:

Przykład 2. Stopa bezrobocia

Natalia Nehrebecka Stanisław Cichocki. Wykład 13

Statystyczna analiza danych

Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych. Laboratorium VIII: Analiza kanoniczna

Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna

Systemy Wspomagania Decyzji

Funkcja liniowa - podsumowanie

Dopasowanie prostej do wyników pomiarów.

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

Elementy statystyki wielowymiarowej

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

Egzamin z ekonometrii wersja ogolna

WSHiG Karta przedmiotu/sylabus. Podstawy statystyki. Studia niestacjonarne - 8. Podstawy statystyki

Nowoczesne techniki matematyczne, statystyczne i informatyczne

Zagadnienie 1: Prognozowanie za pomocą modeli liniowych i kwadratowych przy wykorzystaniu Analizy regresji wielorakiej w programie STATISTICA

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Jak ciężka jest masa?

ANALIZA WIELOPOZIOMOWA JAKO NARZĘDZIE WSPARCIA POLITYK PUBLICZNYCH

Regresja liniowa, klasyfikacja metodą k-nn. Agnieszka Nowak Brzezińska

Transkrypt:

Wykład 4 Związki i zależności Rozważmy: Dane z dwiema lub więcej zmiennymi Zagadnienia do omówienia: Zmienne objaśniające i zmienne odpowiedzi Wykres punktowy Korelacja Prosta regresji

Słownictwo: Zmienna odpowiedzi jest przedmiotem zainteresowania. Zmienne objaśniające są pomocnicze tłumaczą, a niekiedy powodują zmiany w zmiennej odpowiedzi. Ćwiczenie. W poniższych przykładach określ: Jakie są obserwowane jednostki? Jakie są zmienne?

Przykład 1: Średnia wysokość pewnej grupy dzieci w Kalamie, w Egipcie, badana w wieku od 18 do 29 miesięcy:

Wykres punktowy (scatterplot): punkty (x i, y i ) na płaszczyźnie. Tutaj: x to wiek, a y to wysokość. Omów źródła zmienności w pomiarach wysokości.

Przykład 2: Średnia stanowa SAT i odsetek absolwentów przystępujących do egzaminu

Interakcja i korelacja Zobacz ogólny kształt i odchylenia, np. czy wykres punktowy jest z grubsza liniowy? Zmienne liczbowe są dodatnio skorelowane, jeśli ponadprzeciętne wartości jednej towarzyszą ponadprzeciętnym wartościom drugiego. Skorelowane ujemnie: przeciwna tendencja...

Mamy tutaj... korelację.

Mamy tutaj... korelację.

Przykład 2 cd.: Więcej informacji: e oznacza stany północno-wschodnie, m - stany środkowo-zachodnie.

Współczynnik korelacji Oznaczamy r dla n par obserwacji: r 1 x x y y i i n 1 s s x y Komentarz: -1 r 1. Nie zależy od jednostek miary. Wskazuje liniowe powiązanie, gdy bliski do ± 1. Nieodporny na obserwacje odstające! Nie zależy od tego, która zmienna jest uważana za odpowiedź, a która za objaśnienie.

Linia regresji: pierwsze kroki Prosta, która najlepiej opisuje, w jaki sposób zmienia się zmienna odpowiedzi y, gdy zmienia się zmienna objaśniająca x. Równanie prostej (nachylenie b, przecięcie a): y=a+bx Najlepsze a i b zostaną obliczone z danych. Predykcja liniowa: ŷ i =a+bx i

Przykład 1 cd.: Prosta regresji dla danych z Kalama; predykcja liniowa dla dzieci w wieku 32 miesięcy.

Przykład 3: Regresja dla wskaźnika GA score w funkcji wieku wypowiedzenia pierwszego słowa.

Prosta regresji (najmniejszych kwadratów) X-zmienna objaśniająca, Y-zmienna odpowiedzi Dane: x, y, s, s, r. Calculate: x y s slope b r y and intercept a y bx s x y a bx

Przykład 1 cd. (Kamala) x 23.5 months, y 79.85 cm, s 3.606 months, s 2.302 cm, x r=0.9944 y

Oblicz przewidywaną wysokość dla dzieci w wieku 25 miesięcy. Jaka jest różnica z obserwowaną wysokością? Co powiesz o wieku 250 miesięcy...?

Wartości resztkowe Wartość resztkowa (obserwowane y minus przewidywane y): r i = y i -ŷ i Przykład. Dla danych z Kalama oraz x = 25, wartość resztkowa wynosi:

Wykres resztkowy: Zależność wartości rezydualnych/resztkowych względem zmiennej objaśniającej. Pomaga ocenić dopasowanie linii regresji.

Wykresy resztkowe: 1. Idealna sytuacja: Jednorodne przypadkowe zachowanie reszt. 2. Pozostał trend sezonowy: relacja między X i Y jest w rzeczywistości nieliniowa. 3. Reszty są losowe, ale ich zmienność zależy od X. Problematyczne.

Przykład 1 cd. Jaka część zmienności (średniego) wzrostu tłumaczy się zmiennością wieku? Zinterpretuj nachylenie linii regresji: Czy możemy tu też zinterpretować współczynnik addytywny prostej regresji?

Ta sama linia regresji, ale inne r 2 Z lewej: r = 0,994, r 2 = 98,9% wyjaśnione (1,1% niewyjaśnione) przez regresję Z prawej: r = 0,921, r 2 = 84,9% wyjaśnione (15,1% niewyjaśnione) przez regresję Komentarz: precyzja prognoz opartych na regresji liniowej...

Wskazówki i ostrzeżenia Użyj wykresu resztkowego, by ocenić dopasowanie. Zilustruj zależność od czasu, jeśli to możliwe. Zbadaj skupienia (podpopulacje?). Zbadaj (usuń??) wartości odstające i wpływowe.

Ostrzeżenia cd. Uwaga na ekstrapolację! Korelacja mierzy tylko powiązanie liniowe. W ograniczonym zakresie wartości korelacja będzie mniej widoczna. Interakcja nie oznacza automatycznie związku przyczynowego. Przykład: Czy spożywanie wasabi zwiększa długość życia?

Zmienne ukryte Może być więcej zmiennych X,..., Z wyjaśniających odpowiedź Y. Przykład: waga, dieta i płeć jako predykatory udaru. Zmienna Z, która może wpływać na zmienną odpowiedzi Y, ale nie została uwzględniona jako zmienna objaśniająca, X, nazywana jest zmienną ukrytą.

Poniżej: z jest zmienna ukrytą, y jest zmienną odpowiedzi, x jest zmienną objaśniającą a) Przyczynowość. b) Wspólna odpowiedź może wywoływać fałszywe wrażenie interakcji pomiędzy X i Y. c) Splątanie: wpływy na zmienną odpowiedzi są trudne do ustalenia/rozdzielenia. Przykłady: a) Palenie w ciąży i waga urodzeniowa b) Poziom cywilizacyjny, kultura i zdrowie c) Nawyki a zdrowie

Ukryte zmienne mogą dawać fałszywe wnioski o istnieniu lub nieistnieniu interakcji. Ustalenie związku przyczynowego jest trudne, gdy eksperymenty są niedozwolone, chyba że występują: silne związki w różnych grupach, czasowe związek, dodatkowe dowody (np. eksperymenty na zwierzętach). Przykład: palenie tytoniu w ciąży. Podaj własne przykłady zmiennych ukrytych.