Laboratorium z ekonometrii (GRETL) 2. Wprowadzenie do oprogramowania gretl. Podstawowe operacje na danych. 2.1 Zaimportuj dane z pliku zatrudnienie.csv z przecinkiem jako separatorem danych i kropką jako znakiem pozycji dziesiętnej i ustal ich strukturę jako kwartalny szereg czasowy z początkiem 2007:1 (Dane Struktura danych Szeregi czasowe). Obejrzyj wykres szeregu czasowego dla każdej ze zmiennych. Z wykresu odczytaj i zanotuj maksymalną wartość i kwartał, w jakim jest przyjmowana dla zmiennej prac. 2.2 Z zakładki Greene otwórz plik greene7_8.gdt (Plik Otwórz dane Pliki z przykładami). Obejrzyj pełny opis pliku danych (Dane Pokaż pełny opis pliku) oraz wartości i statystyki opisowe wybranych zmiennych. Zanotuj średnią dla zmiennej Pnc. Obejrzyjmy wykres częstości, wykres szeregu czasowego i wykres pudełkowy dla zmiennej G.
Na wykresie częstości mamy zobrazowaną względną częstość, z jaką w latach 1960 1995 poziom całkowitego zużycia benzyny w USA mieścił się w danym przedziale. Wnioskujemy z niego, że poziom ten najczęściej mieścił się w przedziale 225 250, najrzadziej mieścił się w przedziale 175 200. Na wykresie szeregu czasowego mamy zobrazowany rozkład w czasie poziomu całkowitego zużycia benzyny w USA w latach 1960 1995. Wnioskujemy z niego, że w tym okresie poziom ten był najwyższy w roku 1995, lokalne maksimum na poziomie około 260 osiągnął w roku 1978 i że utrzymuje się tendencja wzrostowa. Z wykresu pudełkowego możemy odczytać minimum, maksimum i medianę rozkładu naszej zmiennej, a także pierwszy i trzeci kwartyl (25% obserwacji ma wartości poniżej pierwszego kwartyla, 25% obserwacji ma wartości powyżej trzeciego kwartyla). 2.3 Z zakładki Ramanathan otwórz plik data9-1.gdt (Plik Otwórz dane Pliki z przykładami). Obejrzyj pełny opis pliku danych (Dane Pokaż pełny opis pliku) oraz wartości i statystyki opisowe wszystkich zmiennych. Dla par zmiennych (a), income; (b), price; (c), temp obejrzyj wykres szeregu czasowego w jednym oknie. Z czym najsilniej jest związana ilość spożytych lodów per capita z wysokością zarobków, ceną lodów, czy temperaturą powietrza? Zanotuj odpowiedź.
Obejrzyjmy wykresy zależności podanych w zadaniu par zmiennych od siebie. Zaznaczamy zmienne i income i z menu prawego klawisza myszy wybieramy Wykres rozrzutu XY. Jako zmienną odpowiadającą osi X wybieramy income. Otrzymujemy wykres zależności zmiennej od zmiennej income. Obejrzyjmy wykresy zależności dla dwóch pozostałych par zmiennych:, price i, temp. względem temp (z regresją liniową) Y = 0,207 + 0,00311X 80 85 90 95 income 0.26 0.265 0.27 0.275 0.28 0.285 0.29 price 30 40 50 60 70 temp
Podobnie jak wykresy szeregów czasowych, wykresy zależności zmiennych sugerują, że ilość spożytych lodów per capita zależy od temperatury powietrza niebieska prosta na trzecim wykresie jest liniowym przybliżeniem wykresu tej zależności. 2.4 Pracujemy na danych z pliku data9-1.gdt. Utwórz wykresy zależności zmiennej od zmiennej income, a następnie price i temp. Każdy z wykresów zapisz jako ikonę sesji wykorzystując menu prawego klawisza myszy. W oknie Ikony bieżącej sesji przeciągnij wszystkie trzy wykresy do tabeli wykresów. Obejrzyj te trzy wykresy jednocześnie otwierając tabelę wykresów. 2.5 Wprowadź dane z poniższej tabeli. Utwórz wykresy zależności zmiennych A, B i C od zmiennej punkty (oś x). Każdy wykres zmień na słupkowy wykorzystując menu prawego klawisza myszy (Edycja Linie typ słupki). Każdy z wykresów zapisz jako ikonę sesji i umieść w tabeli wykresów. Obejrzyj te trzy wykresy jednocześnie otwierając tabelę wykresów. punkty A B C 15 10 5 10 25 20 35 25 35 40 25 25 42 20 25 35 55 10 10 5 2.6 Wczytaj dane z pliku punkty.csv. Utwórz wykresy częstości zmiennych A, B i C, zmień typ wykresów na słupkowy. Obejrzyj i zinterpretuj statystyki opisowe tych zmiennych, zwracając szczególną uwagę na skośność i kurtozę. Wykresy częstości w tym zadaniu i zależności od zmiennej punkty w zadaniu poprzednim są takie same. Jak plik punkty.csv powstał z danych z poprzedniego zadania? Zanotuj odpowiedzi. 2.7 Na podstawie danych z poniższej tabeli utwórz plik pomyłki.csv w ten sam sposób, w jaki powstał plik punkty.csv. Utwórz słupkowe wykresy częstości zmiennych A, B i C. Obejrzyj i zinterpretuj statystyki opisowe tych zmiennych, zwracając szczególną uwagę na skośność i kurtozę. Zanotuj średnią, medianę, odchylenie standardowe, skośność i kurtozę dla wszystkich zmiennych. pomylki A B C 1 1 1 3 4 1 2 5 7 2 4 3 10 3 5 2 13 5 2 1 16 3 1 1