Analiza danych z użyciem programu Gretl



Podobne dokumenty
1. Wprowadzenie do oprogramowania gretl. Wprowadzanie danych.

5. Model sezonowości i autoregresji zmiennej prognozowanej

Rozdział 2: Metoda największej wiarygodności i nieliniowa metoda najmniejszych kwadratów

Niestacjonarne zmienne czasowe własności i testowanie

4. Średnia i autoregresja zmiennej prognozowanej

Rozdział 8. Regresja. Definiowanie modelu

Ekonometria. Wprowadzenie do modelowania ekonometrycznego Estymator KMNK. Jakub Mućk. Katedra Ekonomii Ilościowej

Testowanie hipotez statystycznych

Ekonometria. wiczenia 1 Regresja liniowa i MNK. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej

Sterowanie wielkością zamówienia w Excelu - cz. 3

Monte Carlo, bootstrap, jacknife

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

STATYSTYKA MATEMATYCZNA

Stochastyczne Metody Analizy Danych. PROJEKT: Analiza kluczowych parametrów turbin wiatrowych

Wprowadzenie do pakietu STATA

Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re

WNIOSKOWANIE W MODELU REGRESJI LINIOWEJ

Obliczanie wartości średniej i odchylenia standardowego średniej w programie Origin

METODY STATYSTYCZNE W BIOLOGII

7.4 Automatyczne stawianie prognoz

Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2

Analiza Statystyczna

INFORMATYKA W SELEKCJI

Testowanie hipotez statystycznych

Proces modelowania zjawiska handlu zagranicznego towarami

Metoda Simplex bez użycia tabel simplex 29 kwietnia 2010

Spis treści Szybki start... 4 Podstawowe informacje opis okien... 6 Tworzenie, zapisywanie oraz otwieranie pliku... 23

Mikroekonometria 3. Mikołaj Czajkowski Wiktor Budziński

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

Wykład 1 Próba i populacja. Estymacja parametrów z wykorzystaniem metody bootstrap

K wartość kapitału zaangażowanego w proces produkcji, w tys. jp.

Zadanie Tworzenie próbki z rozkładu logarytmiczno normalnego LN(5, 2) Plot Probability Distributions

WYDZIAŁ ELEKTROTECHNIKI, AUTOMATYKI I INFORMATYKI INSTYTUT AUTOMATYKI I INFORMATYKI KIERUNEK AUTOMATYKA I ROBOTYKA STUDIA STACJONARNE I STOPNIA

e) Oszacuj parametry modelu za pomocą MNK. Zapisz postać modelu po oszacowaniu wraz z błędami szacunku.

Tadeusz Kufel Uniwersytet Mikołaja Kopernika w Toruniu. Narzędzia ekonometrii dynamicznej w oprogramowaniu GRETL

Księgarnia PWN: Tadeusz Kufel - Ekonometria

2. Wprowadzenie do oprogramowania gretl. Podstawowe operacje na danych.

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

3. Modele tendencji czasowej w prognozowaniu

Metody Ekonometryczne

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński

Stanisław Cichocki Natalia Nehrebecka. Zajęcia 8

S88 Badanie rzutu kostką sześcienną

Kolokwium ze statystyki matematycznej

Projekt zaliczeniowy z przedmiotu Statystyka i eksploracja danych (nr 3) Kamil Krzysztof Derkowski

Testowanie hipotez statystycznych

Ekonometria. Ćwiczenia nr 3. Jakub Mućk. Katedra Ekonomii Ilościowej

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

Ćwiczenie 5 PROGNOZOWANIE

Wprowadzenie do analizy korelacji i regresji

gdzie. Dla funkcja ma własności:

Maple i wykresy. 1.1 Najpierw należy się zalogować. Jak to zrobić zostało opisane w moim poprzednim tutorialu.

Mikroekonometria 6. Mikołaj Czajkowski Wiktor Budziński

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Stacjonarność Integracja. Integracja. Integracja

t y x y'y x'x y'x x-x śr (x-x śr)^2

author: Andrzej Dudek

TURNINGPOINT KROKI DO URUCHOMIENIA TESTU NA PC

Statystyka w analizie i planowaniu eksperymentu

Heteroscedastyczność. Zjawisko heteroscedastyczności Uogólniona Metoda Najmniejszych Kwadratów Stosowalna Metoda Najmniejszych Kwadratów

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Wstęp 7 Rozdział 1. OpenOffice.ux.pl Writer środowisko pracy 9

BIBLIOTEKA LOKALNE CENTRUM WIEDZY PRAKTYCZNEJ PRZEWODNIK PO NARZĘDZIACH WARSZTAT NR 1: ARKUSZE KALKULACYJNE - MINI SKRYPT

PDF created with FinePrint pdffactory Pro trial version

Metodyka wykonania kartogramu z podziałem na klasy wg punktów charakterystycznych wraz z opracowaniem kartogramicznej legendy.

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

7. Estymacja parametrów w modelu normalnym( ) Pojęcie losowej próby prostej

Ekonometria ćwiczenia 3. Prowadzący: Sebastian Czarnota

Wprowadzenie do analizy dyskryminacyjnej

Oszacowanie i rozkład t

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w analizie i planowaniu eksperymentu

Dlaczego stosujemy edytory tekstu?

Jak korzystać z Excela?

Krótka instrukcja opracowania danych w programie SciDAVis v. 1-D013-win

Qtiplot. dr Magdalena Posiadała-Zezula

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Ekonometria. Zajęcia

Własności statystyczne regresji liniowej. Wykład 4

Statystyka w analizie i planowaniu eksperymentu

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

Estymacja punktowa i przedziałowa

INFORMATYKA W SELEKCJI

PAKIETY STATYSTYCZNE

Wykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne

WYTYCZNE JAK UŻYWAĆ ELEKTRONICZNEJ WERSJI WNIOSKU O DOFINANSOWANIE

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Stanisław Cichocki. Natalia Nehrebecka. Zajęcia 15-16

Ekonometria. Regresja liniowa, współczynnik zmienności, współczynnik korelacji liniowej, współczynnik korelacji wielorakiej

Po uruchomieniu programu nasza litera zostanie wyświetlona na ekranie

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

Stosowana Analiza Regresji

POMIARY WIDEO W PROGRAMIE COACH 5

Testowanie hipotez statystycznych.

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

lekcja 8a Gry komputerowe MasterMind

Wykres prędkości. Infolab

Transkrypt:

Analiza danych z użyciem programu Gretl

Gretl Gretl to pakiet ekonometryczny stworzony przez Allina Cottrella z Uniwersytetu Wake Forest w Pó lnocnej Karolinie w Stanach Zjednoczonych Od roku 2000 pakiet jest systematycznie rozwijany Gretl jest programem o swobodnym dostȩpie dla wszystkich użytkowników Nazwa Gretl pochodzi od Gnu Regression, Econometrics and Time-series Library Program i podrȩcznik dostȩpne s a na stronie: http://gretl.sourceforge.net/

Charakterystyka programu W programie Gretl dostȩpne s a nastȩpuj ace estymatory: KMNK, ważonej metody najmniejszych kwadratów, nieliniowej metody najmniejszych kwadratów, metody zmiennych instrumentalnych, a także estymatory metody najwiȩkszej wiarygodności do szacowania parametrów modeli takich jak: probitowy, logitowy, tobitowy, ARIMA lub GARCH Do tworzenia wykresów Gretl wykorzystuje odrȩbny program gnuplot Istnieje możliwość zapisania wyników przeprowadzanej analizy w LaTeX-u

Pos lugiwanie siȩ programem W programie korzystać można z rozwijalnych menu lub samodzielnie wpisywać komendy Spis i informacje o dostȩpnych komendach i funkcjach znaleźć można w Gretl Command Reference i Function Reference (w menu Help) Aby wpisać komendȩ należy otworzyć Tools>Gretl console (lub klikn ać w odpowiedni przycisk z dolnego paska narzȩdzi) Jeśli komend jest wiȩcej można utworzyć z nich program (skrypt) Aby utworzyć skrypt wybrać należy: File>Script files>new script

Pos lugiwanie siȩ programem cd. Każda nowa komenda powinna znajdować siȩ w nowym wierszu Jeśli pojedyncza komenda nie mieści siȩ w linii należy użyć znaku kontynuacji \ Uruchomienie skryptu wykonuje siȩ za pomoc a przycisku Run Skrypt można zapisać i wykonywać ponownie później Programuj ac należy pamiȩtać, iż w programie rozróżniane s a duże i ma le litery, tzn. x oznacza coś innego, niż X

Operacje na danych Gretl umożliwia import danych zapisanych w wielu formatach, takich jak: ASCII, CSV, xls, a także formatach programów Eviews, Stata, SPSS, SAS, czy JMulti Podobnie, dane można eksportować do innego formatu Dane, które wykorzystywane bȩd a na zajȩciach: http://www.learneconometrics.com/gretl.html (Gretl Data Sets for Principles of Econometrics) Demonstracja: wczytywanie danych (plik food), wyświetlanie i edycja danych, dodawanie obserwacji, określanie typu danych (menu Data)

Aby zmienić opis zmiennej należy klikn ać w odpowiedni a linijkȩ prawym przyciskiem myszy i wybrać Edit attributes (lub menu Variable>Edit attributes) Aby zmienić opis np. zmiennej x za pomoc a komendy należy wykorzystać setinfo: np. setinfo x -d (100$) Weekly Income Jak podaje Command Reference po -d należy w cudzys lowie podać opis zmiennej Opis można dodatkowo rozszerzyć o nazwȩ zmiennej, która umieszczana bȩdzie na wykresach: setinfo x -d (100$) Weekly Income -n Income

Wykresy Aby utworzyć wykres należy wybrać: View>Graph specified vars Do wstȩpnej analizy zwi azku pomiȩdzy dwoma zmiennymi wykorzystać można np. wykres punktowy (scatter plot). Na wykresie pojawia si a dodatkowo linia regresji

Model regresji liniowej z jedn a zmienn a objaśniaj ac a Model ma postać: y t = α 0 + α 1 x t + ε t, t = 1, 2,..., T y t to zmienna objaśniana, x t to zmienna objaśniaj aca, ε t to sk ladnik losowy, α 0 oraz α 1 to parametry, których wartość należy oszacować Zak lada siȩ, że dla każdego t: E(ε t ) = 0, var(ε t ) = σ 2 (homoskedastyczność), cov(ε t, ε s ) = 0 (brak autokorelacji) Za lożenia dotycz ace sk ladnika losowego zapisać można jako: ε t iid(0; σ 2 )

iid pochodzi od angielskiego independently and identically distributed i oznacza, że sk ladniki losowe maj a identyczne i niezależne rozk lady Czȩsto zak lada siȩ, iż s a to rozk lady normalne

Analizȩ regresji w programie Gretl wykonać można wybieraj ac: Model>Ordinary Least Squares Alternatywnie skorzystać można z komendy: ols y const x lub wykorzystuj ac ID zmiennych: ols 1 0 2 Wyniki analizy pojawiaj a siȩ w oknie zaopatrzonym w dodatkowe menu pozwalaj ace na wykonywanie operacji na utworzonym modelu (wykresy, testy, itd.) Wyniki s a nastȩpuj ace: ŷ t = 83.4160 (43.410) + 10.2096 (2.0933) x t T = 40 R2 = 0.3688 F (1, 38) = 23.789 ˆσ = 89.517

Za lóżmy, że interesuj a nas dodatkowe rezultaty dotycz ace elastyczności średnich wydatków na żywność wzglȩdem zmian w dochodach Elastyczność to relacja miȩdzy procentow a zmian a jednej zmiennej i procentow a zmian a drugiej zmiennej: W rozważanym przypadku: ɛ = y/y x/x ɛ = E(y)/E(y) x/x = α 1 x E(y) E(y) oraz x zwykle zastȩpuje siȩ średnimi z próby a α 1 ocen a tego parametru

Średnie x i y uzyskać można podświetlaj ac obie te zmienne i wybieraj ac: View>Summary statistics i kontynuuj ac obliczenia samodzielnie Alternatywnie, napisać można skrypt: ols y const x quiet genr elast=$coeff(x)*mean(x)/mean(y) Do ocen MNK parametrów regresji prostej odwo lujemy siȩ pisz ac: $coeff(const) i $coeff(x) Przy wykorzystaniu opcji quiet wyniki analizy regresji nie pojawi a siȩ na ekranie

W podobny sposób program wykorzystać można do prognozowania Wyznaczmy średnie wydatki na żywność gospodarstwa domowego z tygodniowym dochodem wynosz acym 2000$ Wartość prognozy to: y P = 83.42 + 10.21 20 = 287.61 W programie Gretl otrzymujemy j a wpisuj ac: genr yp = $coeff(const) + $coeff(x)*20

W laściwości estymatora MNK Znane s a w laściwości estymatora MNK Estymator MNK jest BLUE (Best Linear Unbisaed Estimator), co oznacza, iż jest on liniowym, nieobci ażonym estymatorem o najmniejszej wariancji Najmniejsza wariancja oznacza, iż otrzymujemy oceny parametrów, które średnio s a bardziej precyzyjne od ocen parametrów, które moglibyśmy uzyskać stosuj ac alternatywne estymatory Nieobci ażoność oznacza, iż E( α 0 ) = α 0 oraz E( α 1 ) = α 1 Wartość oczekiwan a i wariancjȩ estymatora MNK zbadamy symulacyjnie (za pomoc a metody Monte Carlo)

Badanie w laściwości estymatora MNK Na podstawie modelu wydatków na żywność i prawdziwych obserwacji na zmiennej x wygenerujemy 1000 szeregów 40-tu obserwacji na zmiennej y Za lożymy, że prawdziwy model ma postać: y t = 80 + 10x t + ε t, ε t N(0, 88 2 ) Dla każdej próby oszacujemy MNK parametry prawdziwego modelu W laściwości estymatora MNK zbadamy wyznaczaj ac wartości statystyk opisowych (średniej i wariancji) dla 1000 wyników estymacji Wykorzystamy nastȩpuj acy skrypt:

open c:\program Files\gretl\data\poe\food.gdt set seed 3213789 loop 1000 progressive genr u = 88*normal() genr y1 = 80 + 10*x + u ols y1 const x genr b1 = $coeff(const) genr b2 = $coeff(x) print b1 b2 store coeff.gdt b1 b2 endloop

komenda open... otwiera plik z danymi set seed 3213789 ustala wartość zarodka, od którego rozpocznie siȩ generacja liczb pseudolosowych pȩtla loop NMC progressive zakończona endloop oznacza, iż chcemy wykonać NMC powtórzeń komend opisanych w pȩtli (chcemy wykonać NMC replikacji w metodzie Monte Carlo). Opcja progressive powoduje, iż wyniki każdej iteracji nie pojawi a siȩ na ekranie a zostan a zapisane w pliku

Komenda genr u = 88*normal() nakazuje wygenerowanie realizacji zmiennej u o rozk ladzie normalnym z odchyleniem standardowym 88 genr y1 = 80 + 10*x + u powoduje, iż generowane s a wartości zmiennej y ols y1 const x oznacza, iż dla wygenerowanych obserwacji na y i danych o x wyznaczamy oceny parametrów modelu regresji MNK genr b1 = $coeff(const) i genr b2 = $coeff(x) powoduje, iż oceny parametrów zapisywane s a jako b1 i b2 print b1 b2 i store coeff.gdt b1 b2 zapisuje oceny parametrów w zbiorze danych coeff.gdt.

Komenda genr u = 88*normal() nakazuje wygenerowanie realizacji zmiennej u o rozk ladzie normalnym z odchyleniem standardowym 88 genr y1 = 80 + 10*x + u powoduje, iż generowane s a wartości zmiennej y ols y1 const x oznacza, iż dla wygenerowanych obserwacji na y i danych o x wyznaczamy oceny parametrów modelu regresji MNK genr b1 = $coeff(const) i genr b2 = $coeff(x) powoduje, iż oceny parametrów zapisywane s a jako b1 i b2 print b1 b2 i store coeff.gdt b1 b2 zapisuje oceny parametrów w zbiorze danych coeff.gdt.

Eksperyment podsumowany zostaje poprzez wyznaczenie średnich i odchyleń standardowych ocen obydwu parametrów Średnia ocena wyrazu wolnego wynosi 79.3864, parametru przy zmiennej x zaś 10.0303 Odchylenia standardowe równe s a odpowiednio: 42.1597 i 2.03458 Okazuje siȩ, że gdybyśmy mieli możliwość szacowania interesuj acych parametrów na podstawie wielu prób, to średnio oceny te by lyby zbliżone do prawdziwych wartości parametru W praktyce mamy do dyspozycji tylko jedn a próbȩ danych

Wyniki dla pojedynczych prób zobaczyć można otwieraj ac plik coeff.gdt Chociaż średnio wyniki estymacji s a dobre, to znaleźć można próby, dla których wyniki znacznie odbiegaj a od prawdy