Gretl podstawy. Tworzenie baz danych. Bezpośrednio po uruchomieniu programu, pojawia się następujące okno:

Gretl podstawy Bezpośrednio po uruchomieniu programu, pojawia się następujące okno: Póki nie wczytamy jakiejś bazy danych (względnie nie stworzymy własnej), mamy dostęp tylko do dwóch pozycji z Menu: Plik i Narzędzia. Tworzenie baz danych Stwórzmy w takim razie przykładową bazę danych. Załóżmy, że mamy bazę: rok produkt praca 1962 176 301 1963 185 317 1964 188 342 1965 198 356 Wprowadźmy ją do Gretla wykorzystując opcję Menu Plik Nowy zbiór danych. Aby móc wprowadzić zbiór danych, musimy podać Gretlowi typ zmiennych (próba przekrojowa, szereg czasowy, dane panelowe). W pojawiającym się oknie możemy edytować wartości zmiennych, dodać obserwacje, albo dodać nową zmienną. Po zapisaniu zmian oraz po powrocie do głównego okna programu, możemy zawsze wrócić do edytora danych przez Dane Edycja wartości.

Klikając w głównym oknie prawym przyciskiem myszy na zmiennej, mamy dostęp do całego wachlarza opcji. Możemy zobaczyć wartości zmiennej, jej statystyki opisowe itd. Możemy również edytować atrybuty zmiennej, a więc np. opisać ją lub zmienić jej nazwę. Stworzoną bazę danych można zapisać na dysku w formacie Gretla (.gdt) lub eksportować do innego formatu o tym później. Dane syntetyczne. Oczywiście, często nie będziemy tworzyć własnych baz danych, tylko będziemy korzystać z już istniejących, bądź (choć to zdecydowanie rzadziej) będziemy generować dane syntetyczne. Zajmijmy się najpierw tym drugim przypadkiem. W Gretlu wygenerować dane możemy np. korzystając z opcji Plik Nowy zbiór danych, ale w momencie definiowania typu danych, należy ominąć ręczne ich wprowadzanie. Potem korzystając z Dodawanie zmiennych Generowanie zmiennych, możemy wygenerować zmienne z wielu różnych rozkładów. Spróbujmy wygenerować 100 obserwacji zmiennej normal1 z rozkładu standardowego normalnego oraz zmienną normal2 z rozkładu normalnego o średniej 2 i odchyleniu standardowym 9. Korzystanie z istniejących baz danych Aby skorzystać z istniejącej bazy danych, korzystamy z opcji Plik Otwórz dane Pliki użytkowników (alternatywnie można nacisnąć Ctrl+O) oraz podajemy lokalizację pliku z bazą. Istnieje również możliwość wykorzystania jednej z dostępnych w ramach Gretla baz danych. Wybierzemy wtedy Plik Otwórz dane Pliki z przykładami. Wyświetli się okno z zakładkami odpowiadającymi zainstalowanym bazom danych (standardowo są trzy zakładki Ramanathan, Green i Gretl). W każdej zakładce jest od kilkunastu do kilkudziesięciu różnych baz danych. Otwórzmy z zakładki Greene dane greene22_2. Są to dane dotyczące ilości romansów, próba przekrojowa licząca 601 obserwacji (można to sprawdzić wybierając Dane Opis pliku danych). Klikając dwa razy na zmienną, wyświetla się tabela z jej wartościami. Jak zaznaczymy kilka zmiennych jednocześnie (np. z Ctrl), to klikając na nie prawym przyciskiem myszy i wybierając Pokaż wartości, zobaczymy wartości wszystkich wybranych zmiennych jednocześnie. Wykresy rozrzutu (scatter plots) W ramach próby przekrojowej, często stosowanymi wykresami, są wykresy rozrzutu (scatter plots). Pokazują one jak wartości jednej zmiennej rozkładają się wedle wartości innej. W ten sposób można wizualizować relacje między zmiennymi. Interesujące może być, przykładowo, jak ilość romansów zależy od wieku. Aby narysować wykres rozrzutu dla zmiennych Y (ilość romansów) i Z2 ( wiek ), albo zaznaczamy te zmienne jednocześnie i używamy prawego przycisku myszy, albo wybieramy Widok Wykresy zmiennych i interesujący nas wykres. Zróbmy wykres rozrzutu ilość romansów i wieku (wiek na osi OX). Zastanówmy się nad wynikiem co mogło spowodować tak dziwny wykres? Spróbujmy również edytować wykres.

Statystyki opisowe Do statystyk opisowych mamy dostęp albo przez prawy klawisz myszy, albo przez Widok Statystyki opisowe albo Zmienna Statystyki opisowe. Sprawdźmy statystyki dla zmiennej Y. Czy tłumaczą one poprzedni wykres? Częstości Wykres częstości również możemy uzyskać przy pomocy prawego klawisza myszy, albo Zmienna Rozkład częstości (lub Zmienna Wykres częstości gdzie możemy rozkład częstości porównać z rozkładem normalnym lub gamma). Proszę wykonać taki rozkład dla Y. Czy nietypowość pierwszego wykresu jest już lepiej wytłumaczalna? ZADANIE: Czy wraz z wiekiem przeciętnie rośnie ilość lat spędzonych w związku małżeńskim? Odpowiedź oprzyj na odpowiednim wykresie. Tabele częstości (kontyngencji) Ciekawym (bo nasyconym emocjami ) pytaniem może być: kto zdradza częściej mężczyźni, czy kobiety? Spodziewamy się, zapewne, że zrobienie wykresy rozrzutu dla tak postawionego pytania, da marne rezultaty. Spróbujmy jednak to zrobić. Skoro jedna ze zmiennych jest zmienną nominalną, to jednym ze sposobów prezentacji zależności jest tabela częstości (kontyngencji) (cross-table). Gretl nie jest najlepszym pakietem do tego typu analiz, jednak prostą tabelę częstości możemy wykonać wybierając zmienne do tabeli, a potem Widok Tabela krzyżowa (lub Cross tabulation) (opcja dostępna dopiero od wersji Gretla 1.6.1). Na razie możemy zinterpretować jedynie odpowiednie wartości liczbowe i przy ich użyciu porównać badane grupy. Wynik formalnego testu (który jest raportowany przy okazji tabel częstości) zinterpretujemy po tym jak poznamy/przypomnimy sobie ten test. Importowanie i eksportowanie baz danych Gretl ma rozbudowane możliwości stosunkowo łatwego importowania danych z innych formatów oraz eksportowania danych do innych formatów. Jest to jego niewątpliwą zaletą i jeśli nawet czasami praktycy nie wykorzystują Gretla do bardziej zaawansowanych zastosowań (co powoli się zmienia wraz z rozwojem pakietu), to wykorzystują tę jego funkcję. Dane importujemy wybierając Plik Otwórz dane Import z pliku, a następnie format danych, z którego chcemy importować. Przykładowo mamy dane w formacie Excela: transac_us_jap1960_2006.xls. Zobaczmy jak te dane wyglądają w Excelu. Spróbujmy importować te dane do Gretla. Nie udało się to, gdyż dane nie mają oczekiwanego przez Gretla formatu (pierwszy wiersz to nazwa zmiennej, pozostałe wiersze to wartości zmiennej). Zobaczmy, że Arkusz2 pliku Excela ma już wymagany format (jest to kawałek bazy danych z Arkusza1). Spróbujmy go importować. Gretl pyta, czy ma traktować dane jako próbę przekrojową, szereg czasowy, czy też dane panelowe. My wiemy, że jest to szereg czasowy, dane kwartalne, dlatego zgodnie z tym konfigurujemy naszą bazę danych.

Proszę zwrócić uwagę, że Gretl wyświetla komunikat, że dane są datowane, a więc stanowią szereg czasowy. Wykresy szeregów czasowych W przypadku szeregów czasowych, mamy do wyboru kilka nowych możliwości w menu prawego przycisku myszy. Możemy, na przykład, narysować wykres szeregu czasowego. Spróbujmy to zrobić dla zmiennej egs. Możemy, rzecz jasna, przedstawić kształtowanie się w czasie wielu zmiennych na jednym wykresie. Trzeba je wtedy jednocześnie zaznaczyć. W przypadku szeregów czasowych, możemy również rysować funkcje ACF i PACF (korelogram) z wybraną ilością opóźnień, jak również periodogram (estymator funkcji gęstości spektralnej). ZADANIE Wczytaj z pliku cars.dta (format Staty) miesięczne dane dotyczące wydatków na nowe samochody. Dane zaczęły być zbierane w marcu 1975. (Proszę zwrócić uwagę, że jeśli omyłkowo nie zwróciło się uwagi Gretla na fakt, że dane są szeregiem czasowym, to wciąż można to zrobić wybierając: Dane Struktura danych) Oto opis zmiennych: Narysuj na jednym wykresie kształtowanie się tych wydatków oraz kształtowanie się stopy bezrobocia. Wyeksportuj tę bazę danych do formatu PcGive a. Tworzenie zmiennych W Gretlu możemy na wiele różnych sposobów tworzyć nowe zmienne. Sposób generowania sztucznych zmiennych już poznaliśmy (generowanie zmiennych z jakiegoś rozkładu). Częściej będziemy potrzebowali zrekodować zmienną (stworzyć nową zmienną na bazie innej). Żeby stworzyć nową zmienną możemy kliknąć gdziekolwiek w głównym oknie Gretla prawym przyciskiem myszy i wybrać Definiowanie nowej zmiennej, albo alternatywnie Dodawanie zmiennych Definiowanie nowej zmiennej. Stwórzmy, przykładowo, nową zmienną o nazwie lnpce, która będzie logarytmem (często wykorzystywanym w ekonometrii) zmiennej pcecars. Składnia jest i intuicyjna i standardowa: nazwa_zmiennej=funkcja(stara_zmienna), czyli: lnpce=log(pcecars) /* lub lnpce=ln(pcecars) */

Tworzenie zmiennych zero-jedynkowych Zmienne zero-jedynkowe tworzy się w Gretlu w dość wygodny sposób, podobny zresztą, jak w innych, tematycznie podobnych pakietach: nazwa_zmiennej=(wyrażenie) Ten sposób przypisuje nowo-tworzonej zmiennej logiczną wartość wyrażenia z nawiasu jeśli jest ono prawdą, zmienna przyjmie wartość 1, gdy nie jest wartość 0. Przykładowo, jeśli chcemy stworzyć zmienną zero-jedynkową o nazwie bezrob, która przyjmuje wartość 1 kiedy stopa bezrobocia (unemprt) była równa lub wyższa niż średnia stopa bezrobocia i wartość 0 dla stopy niższej. Wiedząc, że średnia stopa bezrobocia wynosiła ok. 7, możemy zmienną stworzyć w sposób następujący: bezrob=(unemprt>=7) alternatywnie (precyzyjniej) możemy to zrobić tak: bezrob2=(unemprt>=mean(unemprt)) Funkcje generujące zmienne, które możemy wykorzystać w oknie definiowania nowej zmiennej są następujące: 1. standardowe matematyczne: np. abs, exp, ln, log2, sqrt; 2. trygonometryczne: np. cos, sin, atan; 3. standardowe statystyczne: min, max, sum, mean, median, var, sd, sst; 4. statystyczne, przyjmujące za argument wektor (macierz) i zwracające wektor (macierz): np. sort, dsort, cum; 5. statystyczne, przyjmujące za argument dwa wektory i zwracające skalar: np. cov, corr; 6. specjalne statystyczne: pvalue, cdf, hpfilt (filtr Hodricka-Prescotta), bkfilt (filtr Baxtera-Kinga); 7. do szeregów czasowych: diff, ldiff (logarytmów), sdiff (sezonowe), x(-p) (p-te opóźnienie, gdzie x nazwa szeregu); 8. bazodanowe: nobs, firstobs, lastobs, misszero; 9. zmienne pseudolosowe: normal(), uniform(), chisq(), student(), binomial(), poisson(). 10. poestymacyjne (z manuala Gretla):

$ess: suma kwadratów reszt $uhat: wektor reszt $yhat: wektor wartości teoretycznych (dopasowanych) Operatory logiczne: - && angielskie and, czyli polskie i ; - angielskie or, czyli polskie lub ; -! negacja; -!= nie równe; - >= większe równe; Stałe (możliwe do wykorzystania): - pi liczba pi; - NA kod braku danych ZADANIE a. Narysuj wykres rozrzutu wydatków na samochody względem dochodu per capita. Następnie narysuj szeregi czasowe dla tych zmiennych (na jednym wykresie). Czy z wykresu wynika, że wydatki były podobne do dochodów per capita? b. Stwórz zmienną grossinc, która zawierała będzie informacje nt. dochodu per capita brutto. Przyjmij stawkę podatku równą 20%. ( disposable dochód do dyspozycji po podatkach). Narysuj na jednym wykresie zmienne grossinc i pcdpy. c. Stwórz zmienną sort_inc, która będzie zawierała posortowane wielkości zmiennej grossinc od największej do najmniejszej.

d. Narysuj na jednym wykresie zmienne pubtrans i unemprt. Stwórz zmienną zm1 przyjmującą wartość 1 gdy indeks cen transportu publicznego będzie mniejszy niż 90%, w porównaniu do lat 82-84, a stopa procentowa będzie poniżej swojej mediany. Ile było okresów spełniających takie warunki? Automatyczne tworzenie nowych zmiennych Niektóre nowo-tworzone zmienne są na tyle standardowe, że w głównym oknie Gretla są na nie gotowe formuły. Podświetlając jakąś zmienną (/jakieś zmienne) i klikając w Menu Dodawanie zmiennych, możemy wygenerować logarytmy i kwadraty tej zmiennej (tych zmiennych), zestawy zmiennych zero-jedynkowych dla zmiennych dyskretnych o więcej niż dwóch kategoriach, zmienne syntetyczne, a dla szeregów czasowych opóźnienia, różnice, ich logarytmy, zmienne sezonowe i czasowe. Dla danych panelowych możemy dodatkowo stworzyć zmienne zero-jedynkowe odpowiedzialne za efekty indywidualne, bądź czasowe. ZADANIE a. Otwórzmy zbiór currency. Są to dane obrazujące kształtowanie się bazy monetarnej M1, a konkretnie jej składowej gotówki. Narysuj wykres szeregu czasowego. Co dominuje ten wykres? Jak odseparować ten wpływ? Stwórz odpowiednią zmienną i narysuj jej wykres. b. Otwórzmy zbiór pszenica. Są to dane obrazujące kształtowanie się skupu pszenicy w Polsce. Narysuj wykres szeregu czasowego. Co dominuje ten wykres? Jak odseparować ten wpływ? Stwórz odpowiednią zmienną i narysuj jej wykres. Tworzenie podprób Często praktyk prowadzi analizę danych tylko w segmentach populacji (dajmy na to: nie interesują go wszystkie osoby pracujące, a jedynie kobiety powyżej 35 roku życia) lub w podokresach (lub w jednym i drugim). W Gretlu podpróby możemy ustanawiać na kilka sposobów, wszystkie zaczynają się od wybrania z Menu opcji Próba, a potem: a. Zmienne 0-1 dla podpróby ta opcja umożliwia tworzenie podpróby za pomocą zmiennej 0-1. Podpróba będzie zbiorem informacji, dla których użyta zmienna przyjmuje wartość 1. b. Restrykcje dla podpróby jak wybierzemy tę opcję, to możemy w pojawiającym się oknie wpisać wyrażenie logiczne, które pozwoli stworzyć Gretlowi podpróbę. c. Losowanie podpróby Gretl sam może dla nas wylosować podpróbę o dowolnej długości (ograniczoną, oczywiście, ilością oryginalnych obserwacji). d. W przypadku szeregów czasowych, można dodatkowo ograniczyć podpróbę wykorzystując do tego czas wybierając opcję Zakres próby możemy wybrać dowolny podokres. Mniej użyteczna jest ta opcja dla prób przekrojowych, tym niemniej pozwala ona również wybrać podzbiór kolejnych obserwacji. Do pełnego zakresu próby wracamy wybierając Próba Przywracanie pełnego zakresu. Otwórzmy zbiór pomoc1. Jest to ten sam zbiór, co cars, rozbudowany o część zmiennych, które w międzyczasie tworzyliśmy. Spróbujmy, przykładowo, stworzyć podpróbę, w której indeks cen transportu publicznego będzie mniejszy niż 90%, w porównaniu do lat 82-84, a stopa procentowa będzie poniżej swojej mediany. W tym celu, do ograniczenia próby powinniśmy użyć zmiennej zm1, która niesie dokładnie taką informację, która nas interesuje.

Wybieramy więc Próba Zmienne 0-1 dla podpróby, a później odpowiednią zmienną i sprawdzamy, czy podpróba została utworzona. /* Alternatywnie, podpróbę tworzymy wybierając bezpośrednio Próba Restrykcje dla podpróby */ ZADANIE (aktualna baza danych; pomoc1 ) Narysuj wykres kształtowania się wydatków na nowe samochody tylko w roku 1990. ZADANIE (dane przykładowe Green green22_2 ) Ile średnio miały romansów najmniej i prawie najmniej religijne kobiety (współczynniki religijności 1 i 2 ), posiadające dzieci, których małżeństwo trwało ponad 5 lat? Ikony w głównym oknie GRETLa Na dole głównego okna Gretla jest zestaw ikon: Służą one w kolejności do: 1. Wywoływania kalkulatora systemowego 2. Wywoływania okna skryptu można w nim napisać własny skrypt (serię komend) 3. Otwieranie konsoli Gretla o tym jeszcze będzie mowa 4. Otwiera okno sesji Gretla 5. Otwiera stronę internetową Gretla 6. Otwiera podręcznik do Gretla w formacie.pdf 7. Otwiera opis poleceń Gretla 8. Tworzy wykresy typu scatter-plot 9. Budowanie modelu do oszacowania MNK 10. Otwiera przykładowe bazy danych. I jeszcze kilka skrótów klawiaturowych (wzięte z manuala Gretla):