1. Eliminuje się ze zbioru potencjalnych zmiennych te zmienne dla których korelacja ze zmienną objaśnianą jest mniejsza od krytycznej:

Podobne dokumenty
parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Metody Ilościowe w Socjologii

Prognozowanie na podstawie modelu ekonometrycznego

Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007

Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne)

Zawartość. Zawartość

Zmienne zależne i niezależne

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Rozdział 1 PROGRAMOWANIE LINIOWE

Ekonometria. Regresja liniowa, współczynnik zmienności, współczynnik korelacji liniowej, współczynnik korelacji wielorakiej

Rozdział 8. Regresja. Definiowanie modelu

Ekonometria. Regresja liniowa, współczynnik zmienności, współczynnik korelacji, współczynnik korelacji wielorakiej. Paweł Cibis

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji

Analiza składowych głównych. Wprowadzenie

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Analiza autokorelacji

Rozdział 7 ZARZĄDZANIE PROJEKTAMI

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Analiza Statystyczna

Analiza współzależności zjawisk

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Współliniowość zmiennych objaśniających: test Walda i test Studenta w badaniu istotności zmiennych objaśniających - przykłady.

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

JEDNORÓWNANIOWY LINIOWY MODEL EKONOMETRYCZNY

Ekonometria - wykªad 8

Outlier to dana (punkt, obiekt, wartośd w zbiorze) znacznie odstająca od reszty. prezentacji punktów odstających jest rysunek poniżej.

W statystyce stopień zależności między cechami można wyrazić wg następującej skali: n 1

Ekonometria, lista zadań nr 6 Zadanie 5 H X 1, X 2, X 3

Ekonometria. Weryfikacja modelu. Paweł Cibis 12 maja 2007

Badanie zależności skala nominalna

ĆWICZENIE 11 NIEPARAMETRYCZNE TESTY ISTOTNOŚCI

Wprowadzenie do analizy korelacji i regresji

Zadanie niezbilansowane. Gliwice 1

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

EXCEL Prowadzący: dr hab. inż. Marek Jaszczur Poziom: początkujący

STATYSTYKA MATEMATYCZNA

Informatyka w Zarządzaniu

Metoda simpleks. Gliwice

X WYKŁAD STATYSTYKA. 14/05/2014 B8 sala 0.10B Godz. 15:15

Analiza statystyczna trudności tekstu

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

Excel zadania sprawdzające 263

Wielowymiarowa analiza regresji. Regresja wieloraka, wielokrotna

Dobór zmiennych objaśniających do liniowego modelu ekonometrycznego

ZAGADNIENIE TRANSPORTOWE

ĆWICZENIE 11 ANALIZA KORELACJI I REGRESJI

Wymagania edukacyjne z informatyki w klasie VIII

Analiza zależności liniowych

24 cel bdb db dst dop

Rozdział 6 PROGRAMOWANIE WYPUKŁE I KWADRATOWE

Analiza korespondencji

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

FORMUŁY AUTOSUMOWANIE SUMA

TABLICE PODSTAWOWYCH ROZKŁADÓW PRAWDOPODOBIEŃSTWA. T4. Tablica kwantyli rozkładu chi-kwadrat (I część - poziomy kwantyli 0,5)

Ćwiczenia Skopiować do swojego folderu plik cwiczenia-kl.ii.xls, a następnie zmienić jego nazwę na imię i nazwisko ucznia

Rozdział 2 PROGRAMOWANIE LINIOWE CAŁKOWITOLICZBOWE

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Testowanie hipotez statystycznych związanych ą z szacowaniem i oceną ą modelu ekonometrycznego

Układy równań liniowych i metody ich rozwiązywania

DZISIAJ. Jeszcze trochę o PROJEKTACH JAK PREZENTOWAĆ: JAK OBLICZAĆ: PROSTE INFORMACJE O PRÓBIE KORELACJE DWÓCH CECH PODSTAWOWE MIARY

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Badanie normalności rozkładu

Rozdział 3 ZADANIE TRANSPORTOWE I PROBLEM KOMIWOJAŻERA

(x j x)(y j ȳ) r xy =

Obliczanie wartości średniej i odchylenia standardowego średniej w programie Origin

WYKORZYSTANIE NARZĘDZIA Solver DO ROZWIĄZYWANIA ZAGADNIENIA Problem przydziału

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Pracownia Informatyczna Instytut Technologii Mechanicznej Wydział Inżynierii Mechanicznej i Mechatroniki. Podstawy Informatyki i algorytmizacji

Testowanie hipotez statystycznych

Regresja liniowa wprowadzenie

Wprowadzenie do analizy dyskryminacyjnej

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Metodologia badań psychologicznych. Wykład 12. Korelacje

Arkusz kalkulacyjny Excel

x y

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

SCENARIUSZ LEKCJI. Klasa: I liceum profilowane Blok tematyczny: Funkcje

Program Szkolenia. Excel Podstawowy. COGNITY praktyczne, skuteczne szkolenia i konsultacje

Oszacowanie i rozkład t

Kolejny krok iteracji polega na tym, że przechodzimy do następnego wierzchołka, znajdującego się na jednej krawędzi z odnalezionym już punktem, w

Statystyka. Wykład 8. Magdalena Alama-Bućko. 23 kwietnia Magdalena Alama-Bućko Statystyka 23 kwietnia / 38

Zjawisko dopasowania w sytuacji komunikacyjnej. Patrycja Świeczkowska Michał Woźny

Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi

Funkcja liniowa - podsumowanie

EKONOMETRIA. Prof. dr hab. Eugeniusz Gatnar.

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Statystyka matematyczna dla kierunku Rolnictwo w SGGW. BADANIE WSPÓŁZALEśNOŚCI DWÓCH CECH. ANALIZA KORELACJI PROSTEJ.

ZAGADNIENIE TRANSPORTOWE (część 2)

Dodatek Solver Teoria Dodatek Solver jest częścią zestawu poleceń czasami zwaną narzędziami analizy typu co-jśli (analiza typu co, jeśli?

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

Transkrypt:

Metoda analizy macierzy współczynników korelacji Idea metody sprowadza się do wyboru takich zmiennych objaśniających, które są silnie skorelowane ze zmienną objaśnianą i równocześnie słabo skorelowane między sobą. Procedura obejmuje następujące etapy: 1. Eliminuje się ze zbioru potencjalnych zmiennych te zmienne dla których korelacja ze zmienną objaśnianą jest mniejsza od krytycznej: 2. Z pozostałych zmiennych do modelu wybiera się taką (X h ), dla której korelacja ze zmienną objaśnianą jest największa: =max { } 3. Eliminuje się ze zbioru potencjalnych zmiennych te wszystkie zmienne, dla których korelacja ze zmienną X h jest większa od krytycznej: > Procedurę powtarza się do momentu wyczerpania zbioru potencjalnych zmiennych objaśniających (szczególnie punkty 2 oraz 3) Wartość krytyczną można wyznaczyć dla zadanego poziomu istotności α oraz n-2 stopni swobody korzystając ze wzoru:, =, + 2 gdzie, jest wartością odczytaną z tablic testu t Studenta dla poziomu istotności α oraz n-2 stopni swobody. Metoda grafów Procedurę metody można ująć w następujących etapach: 1. Buduje się nową macierz współczynników korelacji przez zastąpienie w macierzy współczynników korelacji zerami wszystkie współczynniki korelacji, które są (ich wartości bezwzględne) mniejsze lub równe wartości krytycznej, 2. Eliminuje się potencjalne zmienne objaśniające, dla których współczynnik korelacji ze zmienną objaśnianą w nowej macierzy jest równy zero 3. Na podstawie macierzy powstałej w punkcie 1. Buduje się graf powiązań między potencjalnymi zmiennymi powiązanie istnieje, jeśli współczynnik korelacji między zmiennymi jest różny od zera, 4. Z każdego z powstałych grafów wybiera się zmienną do modelu, którą cechuje największa liczba powiązań. Jako wartość krytyczną można przyjąć wartość zaproponowaną wcześniej.

1. Otwór plik MIWS_dobor_zmiennych.xls. 2. Dokonaj analizy przedstawionych zmiennych: objaśnianej oraz objaśniających. Czy wszystkie z potencjalnych zmiennych mają być uwzględniane analizie? (dot. zmiennej X6) 3. Dla każdej ze zmiennych oblicz średnią, odchylenie standardowe oraz współczynnik zmienności. Wykorzystaj funkcje arkusza ŚREDNIA(), ODCH.STANDARDOWE(). Wyniki przedstaw w kolejnych wierszach arkusza w obszarze komórek (B30:H32). W pierwszej kolumnie (A) umieść opis. (Dla zmiennej X6 obliczenia nie są konieczne). UWAGA! Formułę na średnią, odchylenie oraz współczynnik korelacji wpisujemy do pierwszej kolumny i kopiujemy do pozostałych komórek. 4. Czy zmienność rozpatrywanych zmiennych jest wystarczająca? Czy wszystkie wartości współczynnika zmienności przekraczają wartość krytyczną? (Wartość krytyczna 10%) 5. Dokonaj analizy wzrokowej wykresów zależności zmiennej objaśnianej od poszczególnych potencjalnych zmiennych, pod kątem ewentualnego zakwestionowania zależności liniowej. Przykładowy wykres zależności przedstawiono poniżej (Y od X1). 6. Zbuduj macierz (tabelę) współczynników korelacji między zmiennymi, wykorzystując narzędzie ANALIZA DANYCH (menu NARZĘDZIA). Wybierz Korelacja.

7. Metody doboru zmiennych na wejściu do modelu wymagają zbudowanej macierzy współczynników korelacji (można ją również zbudować wykorzystując funkcje: PEARSON(), WSP.KORELACJI()). Ponadto rozważane metody wymagają wartości krytycznej, przy obliczaniu której należy skorzystać z funkcji ROZKŁAD.T.ODW(). 8. Metoda analizy macierzy współczynników korelacji. Obliczanie wartości krytycznej przedstawiono na poniższych zrzutach ekranowych.

Następnie kopiujemy utworzoną wcześniej macierz (tabelę) poniżej (początek nowego obszaru od komórki J19) W macierzy tej usuwamy (DELETE) wszystkie wiersze (i kolumny) odpowiadające zmiennym, dla których wartość bezwzględna współczynnika korelacji ze zmienną objaśnianą (w pierwszej kolumnie) jest mniejsza bądź równa wartości krytycznej. Jest to realizacja pierwszego etapu metody.

Następnie w celach porządkowych przesuwamy wartości, tak aby tworzyły spójny obszar w arkuszu. Realizujemy drugi etap metody Do modelu wchodzi zmienna X5t, ponieważ współczynnik korelacji ze zmienną Y jest największy. Ponieważ współczynnik korelacji między zmienną X4t i X5t jest większy od wartości krytycznej (patrz etap trzeci), dlatego ta zmienna zostaje usunięta. Do modelu wchodzi tylko zmienna X5t, czyli 9. Metoda grafów. Etap 1. Buduje się nową macierz współczynników korelacji przez zastąpienie w macierzy współczynników korelacji zerami wszystkie współczynniki korelacji, które są (ich wartości bezwzględne) mniejsze lub równe wartości krytycznej ponownie kopiujemy macierz współczynników korelacji i zamieniamy wartości spełniające podany warunek zerami.

Eliminuje się potencjalne zmienne objaśniające, dla których współczynnik korelacji ze zmienną objaśnianą w nowej macierzy jest równy zero usuwamy wszystkie wiersze i kolumny odpowiadające zmiennym X1t, X2t oraz X3t i porządkujemy (analogicznie jak wcześniej). Na podstawie macierzy powstałej w punkcie 1. Buduje się graf powiązań między potencjalnymi zmiennymi powiązanie istnieje, jeśli współczynnik korelacji między zmiennymi jest różny od zera. X4t X5t Powstał jeden grał, czyli do modelu wchodzi jedna zmienna. Ponieważ wierzchołki grafu cechuje taka sama liczba połączeń, to do modelu wchodzi zmienna silniej związana ze zmienną objaśnianą. Do modelu wchodzi tylko zmienna X5t, czyli