Dobór zmiennych objaśniających do liniowego modelu ekonometrycznego

Podobne dokumenty
Dobór zmiennych do modelu ekonometrycznego

1. Eliminuje się ze zbioru potencjalnych zmiennych te zmienne dla których korelacja ze zmienną objaśnianą jest mniejsza od krytycznej:

Graf skierowany. Graf zależności dla struktur drzewiastych rozgrywających parametrycznie

WYKŁAD 11 OPTYMALIZACJA WIELOKRYTERIALNA

Tradycyjne mierniki ryzyka

Próba określenia miary jakości informacji na gruncie teorii grafów dla potrzeb dydaktyki

Matematyka ubezpieczeń majątkowych r.

Uniwersytet Warszawski Teoria gier dr Olga Kiuila LEKCJA 2

Ocena siły oddziaływania procesów objaśniających dla modeli przestrzennych

Metody optymalizacji. dr inż. Paweł Zalewski Akademia Morska w Szczecinie

Model klasyczny gospodarki otwartej

ANALIZA DANYCH W STATA 8.0

Modelowanie przepływu cieczy przez ośrodki porowate Wykład III

dr inż. Małgorzata Langer Architektura komputerów

Energia kinetyczna i praca. Energia potencjalna

Kognitywistyka II r. Teoria rzetelności wyników testu. Teorie inteligencji i sposoby jej pomiaru (4) Rzetelność czyli dokładność pomiaru

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

ĆWICZENIE 3 REZONANS W OBWODACH ELEKTRYCZNYCH

MIERNICTWO WIELKOŚCI ELEKTRYCZNYCH I NIEELEKTRYCZNYCH

KURS GEOMETRIA ANALITYCZNA

Zawiadomienie o wyborze najkorzystniejszej oferty

KRYTERIA OCENIANIA ODPOWIEDZI Próbna Matura z OPERONEM. Matematyka Poziom rozszerzony

AKADEMIA INWESTORA INDYWIDUALNEGO CZĘŚĆ II. AKCJE.

Wykład 1. Elementy rachunku prawdopodobieństwa. Przestrzeń probabilistyczna.

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Wykład: praca siły, pojęcie energii potencjalnej. Zasada zachowania energii.

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

WYKŁAD 1. W przypadku zbiornika zawierającego gaz, stan układu jako całości jest opisany przez: temperaturę, ciśnienie i objętość.

Zmienne zależne i niezależne

KINEMATYCZNE WŁASNOW PRZEKŁADNI

Ekonometria - wykªad 8

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

Wykład Półprzewodniki

3. Modele tendencji czasowej w prognozowaniu

Opis ćwiczeń na laboratorium obiektów ruchomych

11. DYNAMIKA RUCHU DRGAJĄCEGO

Uwagi: LABORATORIUM WYTRZYMAŁOŚCI MATERIAŁÓW. Ćwiczenie nr 16 MECHANIKA PĘKANIA. ZNORMALIZOWANY POMIAR ODPORNOŚCI MATERIAŁÓW NA PĘKANIE.

Weryfikacja hipotez statystycznych

ROZWIĄZUJEMY PROBLEM RÓWNOWAŻNOŚCI MASY BEZWŁADNEJ I MASY GRAWITACYJNEJ.

PRÓBNY EGZAMIN MATURALNY Z MATEMATYKI

L(x, 0, y, 0) = x 2 + y 2 (3)

ZWIĄZEK FUNKCJI OMEGA Z DOMINACJĄ STOCHASTYCZNĄ

Modelowanie zmienności i dokładność oszacowania jakości węgla brunatnego w złożu Bełchatów (pole Bełchatów)

= ± Ne N - liczba całkowita.

DOLNOŚLĄSKA WOJEWÓDZKA KOMENDA OCHOTNICZYCH HUFCÓW PRACY

00502 Podstawy kinematyki D Część 2 Iloczyn wektorowy i skalarny. Wektorowy opis ruchu. Względność ruchu. Prędkość w ruchu prostoliniowym.

CHARAKTERYSTYKI GEOMETRYCZNE FIGUR PŁASKICH

Wpływ błędów parametrów modelu maszyny indukcyjnej na działanie rozszerzonego obserwatora prędkości

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

1. Ciało sztywne, na które nie działa moment siły pozostaje w spoczynku lub porusza się ruchem obrotowym jednostajnym.

II.6. Wahadło proste.

Testowanie hipotez statystycznych.

Programowanie liniowe

POLE MAGNETYCZNE W PRÓŻNI. W roku 1820 Oersted zaobserwował oddziaływanie przewodnika, w którym płynął

{ 1, 2,, n } Ponadto wówczas mówimy, że formuła: oraz równoważna jej formuła:

JEDNORÓWNANIOWY LINIOWY MODEL EKONOMETRYCZNY

Rodzajowy rachunek kosztów Wycena zuŝycia materiałów

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8

Struktura danych = system relacyjny U, U uniwersum systemu - zbiór relacji (operacji) na strukturze danych

INSTRUKCJA DO ĆWICZENIA

ĆWICZENIE 5. Badanie przekaźnikowych układów sterowania

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

LIST EMISYJNY nr 3 /2014 Ministra Finansów

METEMATYCZNY MODEL OCENY

Estymacja parametrów modeli liniowych oraz ocena jakości dopasowania modeli do danych empirycznych

Statystyka. #5 Testowanie hipotez statystycznych. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2016/ / 28

MECHANIKA OGÓLNA (II)

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

Algebra liniowa. Macierze i układy równań liniowych

SK-7 Wprowadzenie do metody wektorów przestrzennych SK-8 Wektorowy model silnika indukcyjnego, klatkowego

Testowanie hipotez statystycznych

POMIAR PĘTLI HISTEREZY MAGNETYCZNEJ

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Analiza wariancji w analizie regresji - weryfikacja prawdziwości przyjętego układu ograniczeń Problem Przykłady

Arkusze maturalne poziom podstawowy

Układy równań liniowych i metody ich rozwiązywania

Wprowadzenie do analizy korelacji i regresji

PRĄD ELEKTRYCZNY I SIŁA MAGNETYCZNA

Zależność natężenia oświetlenia od odległości

2. Założenie niezależności zakłóceń modelu - autokorelacja składnika losowego - test Durbina - Watsona

5. Rozwiązywanie układów równań liniowych

Wykład 3 Hipotezy statystyczne

ROZKŁAD NORMALNY. 2. Opis układu pomiarowego

Ruch obrotowy. Wykład 6. Wrocław University of Technology

), którą będziemy uważać za prawdziwą jeżeli okaże się, że hipoteza H 0

Testowanie hipotez statystycznych

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

MONITORING STACJI FOTOWOLTAICZNYCH W ŚWIETLE NORM EUROPEJSKICH

XXXVII OLIMPIADA FIZYCZNA ETAP III Zadanie doświadczalne

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

DOLNOŚLĄSKA WOJEWÓDZKA KOMENDA OCHOTNICZYCH HUFCÓW PRACY

1 Zbiory i działania na zbiorach.

GRAWITACJA. przyciągają się wzajemnie siłą proporcjonalną do iloczynu ich mas i odwrotnie proporcjonalną do kwadratu ich odległości r.

EKONOMETRIA prowadzący: Piotr Piwowarski

ROZWIAZANIA ZAGADNIEŃ PRZEPŁYWU FILTRACYJNEGO METODAMI ANALITYCZNYMI.

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

GEOMETRIA PŁASZCZYZNY

SIMR 2017/18, Statystyka, Przykładowe zadania do kolokwium - Rozwiązania

Statystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35

Transkrypt:

Dobó zmiennych objaśniających do liniowego modelu ekonometycznego

Wstępnym zadaniem pzy budowie modelu ekonometycznego jest okeślenie zmiennych objaśniających. Kyteium wybou powinna być meytoyczna znajomość badanego zjawiska. Należy wybieać takie czynniki (zmienne objaśniające) któe mają istotny wpływ na kształtowanie się badanego zjawiska (zmiennej objaśnianej). Tak zebane zmienne będą nazywane zbioem potencjalnych zmiennych objaśniających.

Do najważniejszych kyteiów fomalnostatystycznych stosowanych w metodach wybou zmiennych należą: 1. Zmienne występujące w modelu powinny chaakteyzować się dużą zmiennością; 2. Należy zapewnić maksymalne skoelowanie zmiennej objaśnianej ze zmiennymi objaśniającymi; 3. Zmienne objaśniające nie powinny być istotnie skoelowane między sobą; 4. Należy dążyć do maksymalnego stopnia dopasowania modelu do zeczywistych elacji gospodaczych co wyaża się w maksymalizacji współczynnika deteminacji R 2.

Metoda Hellwiga (nazywana ównież ) jest metodą któa zdobyła sobie największe uznanie wśód ekonometyków powadzących badania empiyczne. Idea tej metody spowadza się do powołania na zmienne objaśniające takich zmiennych któe są mocno skoelowane ze zmienną objaśnianą i jednocześnie słabo skoelowane między sobą. Punktem wyjścia jest zatem oszacowanie maciezy R współczynników koelacji między potencjalnymi zmiennymi objaśniającymi ( kandydatkami ) oaz wektoa R 0 współczynników koelacji między zmienną objaśnianą a potencjalnymi zmiennymi objaśniającymi.

Załóżmy że dysponujemy k-elementowym zbioem kandydatek na zmienne objaśniające {X 1 X 2 X k } dla któych szacujemy maciez R: R 1 21 k1 12 1 k 2 1k 2k 1 gdzie: ij X oaz wekto R 0 : i X i j i j 12... k j R 0 1 2 k gdzie: ij Y X i 12... k i.

Mając wyznaczone maciez R i wekto R 0 pzystępuje się do obliczania tzw. indywidualnych pojemności nośników infomacji X o zmiennej Y wchodzących w skład óżnych kombinacji utwozonych z elementów danego k-elementowego zbiou potencjalnych zmiennych objaśniających. Wiadomo że ogólna liczba tych kombinacji wynosi dokładnie l = 2 k 1. Indywidualne pojemności nośników infomacji dla poszczególnych potencjalnych zmiennych objaśniających w amach każdej kombinacji zdefiniowane są następująco: 2 0 j hkj n k 1 gdzie: h kj wskaźnik indywidualnej pojemności infomacji zmiennej X j w k-tej kombinacji; 0j - współczynnik koelacji zmiennej objaśnianej ze zmienną X j ; ij - współczynnik koelacji miedzy potencjalnymi zmiennymi objaśniającymi X i oaz X j ; n k - liczba potencjalnych zmiennych objaśniających w k tej kombinacji. i i 1 j ij

Następnie oblicza się wskaźniki integalnej pojemności infomacji w amach każdej z n kombinacji według wzou n k H k h kj. Wskaźniki indywidualnej i integalnej pojemności infomacji chaakteyzują się następującymi własnościami: 1. pzyjmują tym większe watości im silniej zmienne objaśniające są skoelowane ze zmienną objaśnianą 2. pzyjmują tym większe watości im słabiej zmienne objaśniające są skoelowane między sobą 3. są unomowane: 0 h kj 1 0 H k 1. 4. są niemianowane. Pzedstawiona metoda postępowania pozwala na wybó optymalnej kombinacji zmiennych objaśniających. Kyteium wybou takiej kombinacji można zapisać jako gdzie: H k max H H k* - oznacza kombinację optymalnych zmiennych. j 1 * k k

Metoda Pawłowskiego to. W metodzie tej mamy pzygotowaną listę m potencjalnych zmiennych objaśniających i z góy ustaloną liczbę k zmiennych któe mają wejść do modelu pzy czym k<m. Ze zbiou m potencjalnych zmiennych objaśniających ozpatujemy wszystkie z możliwych kombinacji zmiennych. Kombinacje te będą twozyć zbió P k kombinacji dopuszczalnych z któych szukamy najlepszą kombinację zmiennych objaśniających tzn. taką w któej zmienne objaśniające są możliwie słabo skoelowane.

W piewszej kolejności wyznaczamy maciez koelacji R. Następnie ozpatujemy wyznaczniki poszczególnych podmaciezy otzymanych z maciezy R w któej zachowano tylko wiesze i kolumny o numeach ównych numeom zmiennych w ozpatywanej kombinacji. Za optymalną kombinację uważa się taką kombinację zmiennych dla któej odpowiedni podwyznacznik jest największy (zmienne X 1 X 2 X k są tym słabiej skoelowane między sobą im większy i bliższy jedności jest odpowiedni wyznacznik maciezy koelacji).

Idea tej metody podobnie jak w metodzie pojemności infomacji opiea się na wyboze takich zmiennych objaśniających do modelu któe są silnie skoelowane ze zmienną objaśnianą oaz słabo skoelowane między sobą. Pocedua metody ozpoczyna się od utwozenia wektoa koelacji R 0 między zmienną objaśnianą a potencjalnymi zmiennymi objaśniającymi oaz maciezy koelacji R paami między potencjalnymi zmiennymi objaśniającymi.

W kolejnym etapie spawdzamy któe elementy maciezy R są tak małe że możemy je uznać za zeowe (nieistotnie óżne od zea). W tym celu poównujemy zeczywiste współczynniki koelacji ij z maciezy R ze współczynnikiem kytycznym któy możemy wyznaczyć dwoma sposobami. Współczynnik ten można wyznaczyć ze wzou 2 * t 2 t n 2 gdzie t jest watością statystyki odczytaną z tablic testu t-studenta dla zadanego poziomu istotności α oaz dla n 2 stopni swobody. Dugi sposób jest opaty na egule minimaksowej takiej że na podstawie maciezy R ustalamy: * min max dla i j. i j * Jeśli zachodzi waunek ij to wszystkie elementy spełniające ten waunek zastępujemy w maciezy R zeami. Maciez tę oznaczamy R. ij

W kolejnym etapie na podstawie maciezy R budujemy gaf w któym wiezchołkami są potencjalne zmienne objaśniające a wiązadłami niezeowe elementy maciezy R. Możemy otzymać gaf spójny lub kilka podgafów a także punkty (zmienne) odosobnione. Z tak powstałych podgafów do modelu wybieamy zmienne odosobnione (nie są one bowiem skoelowane z innymi potencjalnymi zmiennymi objaśniającymi) oaz te zmienne któe mają największą liczbę powiązań (wiązadeł) z innymi potencjalnymi zmiennymi objaśniającymi. Jeżeli takich zmiennych jest więcej niż jedna to wybiea się spośód nich tę któa jest najsilniej skoelowana ze zmienną objaśnianą. Taki wybó jest podyktowany tym że zmienna o największej liczbie wiązadeł w gafie gomadzi w sobie najwięcej infomacji o pozostałych zmiennych (z któymi była powiązana) a więc będzie dobą ich epezentantką.

Waunkiem wstępnym do tego aby dana zmienna mogła być uznana za objaśniającą w modelu jest jej wystaczające zóżnicowanie. Zmienną objaśniającą bowiem nie może być zmienna któej poszczególne obsewacje nie óżnią się między sobą (lub óżnią się w niewielkim stopniu). Nie jest to wtedy zmienna lecz stała (lub quasi-stała). Do miezenia poziomu zóżnicowania najczęściej wykozystuje się klasyczny współczynnik zmienności: s j Vj x j gdzie: s j - odchylenie standadowe zmiennej X j x j - śednia aytmetyczna zmiennej X j.

Zwykle obiea się kytyczną watość współczynnika zmienności V* (np. V* =01). Zmienne spełniające nieówność V j V * uznaje się za mało zóżnicowane i eliminuje ze zbiou potencjalnych zmiennych objaśniających. Zmienne te nie wnoszą istotnych infomacji.

W metodzie tej ustala się tzw. watość kytyczną współczynnika koelacji. Okeśla ona poziom istotności współczynnika koelacji. Watość ta może być zadana pzez badacza albo wyznaczona ze wzou: * t 2 Pocedua dobou zmiennych objaśniających jest następująca. 1. Ze zbiou potencjalnych zmiennych objaśniających eliminuje się wszystkie zmienne dla któych zachodzi nieówność są to bowiem zmienne nieistotnie skoelowane ze zmienną objaśnianą. 2 t n 0 j * 2

2. Spośód pozostałych potencjalnych zmiennych jako zmienną objaśniającą wybiea się taką zmienną X h dla któej h max j j Ponieważ zmienna X h jest nośnikiem największego zasobu infomacji o zmiennej objaśnianej. 3. Ze zbiou pozostałych potencjalnych zmiennych objaśniających eliminuje się te wszystkie zmienne dla któych * hi są to bowiem zmienne zbyt silnie skoelowane ze zmienną objaśniającą X h a więc powielające dostaczone pzez nią infomacje. Jeśli pozostały jeszcze jakieś zmienne to pzechodzi się do punktu 2. Postępowanie kontynuuje się do momentu wyczepania zbiou potencjalnych zmiennych objaśniających.