ANALIZA DANYCH W STATA 8.0



Podobne dokumenty
ANALIZA DANYCH W STATA 8.0

ANALIZA DANYCH W STATA 8.0

ANALIZA DANYCH W STATA 8.0

ANALIZA DANYCH W STATA 8.0

Diagnostyka w Pakiecie Stata

ANALIZA DANYCH W STATA 8.0

ANALIZA DANYCH W STATA 8.0

Natalia Nehrebecka Stanisław Cichocki. Wykład 6

Diagnostyka w Pakiecie Stata

Metoda najmniejszych kwadratów

ANALIZA DANYCH W STATA 8.0 CZĘŚĆ II

SYSTEMY OPERACYJNE ĆWICZENIE POLECENIA SYSTEMU MSDOS

Stanisław Cichocki. Natalia Nehrebecka

Wprowadzenie Testy własności składnika losowego. Diagnostyka modelu. Część 1. Diagnostyka modelu

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Stanisław Cichocki. Natalia Nehrebecka

Zakład Systemów Rozproszonych

Egzamin z ekonometrii wersja IiE, MSEMAT

Dlaczego stosujemy edytory tekstu?

Czytnik kart pamięci 8w1, Conrad USB 2.0 Instrukcja obsługi

Zmienne sztuczne i jakościowe

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Klawiatura. Klawisze specjalne. Klawisze specjalne. klawisze funkcyjne. Klawisze. klawisze numeryczne. sterowania kursorem. klawisze alfanumeryczne

Wprowadzenie do Ekonometrii z Pakietem Stata

Wprowadzenie do pakietu STATA

Internet wymagania dotyczące konfiguracji

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

ANALIZA DANYCH W STATA 8.0 CZĘŚĆ II

Ekonometria egzamin 02/02/ W trakcie egzaminu wolno używać jedynie długopisu o innym kolorze atramentu niż czerwony oraz kalkulatora.

Stanisław Cichocki. Natalia Nehrebecka. Wykład 14

Natalia Nehrebecka Stanisław Cichocki. Wykład 10

Wymagania edukacyjne z informatyki dla klasy szóstej szkoły podstawowej.

Zadanie Tworzenie próbki z rozkładu logarytmiczno normalnego LN(5, 2) Plot Probability Distributions

Laboratorium - Praca z poleceniami wiersza poleceń w systemie Windows

Testowanie hipotez statystycznych

Instalacja

Egzamin z ekonometrii wersja IiE, MSEMAT

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

INSTRUKCJA OTWIERANIA PLIKU DPT (data point table)

Krótki kurs obsługi środowiska programistycznego Turbo Pascal z 12 Opracował Jan T. Biernat. Wstęp

Zmienne Binarne w Pakiecie Stata

Włączanie/wyłączanie paska menu

Egzamin z ekonometrii wersja ogólna Pytania teoretyczne

Egzamin z ekonometrii - wersja ogólna

Za pomocą niniejszej instrukcji baza programu MAK zostanie przygotowania do eksportu na METALIB.

Wstęp. Skąd pobrać program do obsługi FTP? Logowanie

Ćwiczenie 1. Matlab podstawy (1) Matlab firmy MathWorks to uniwersalny pakiet do obliczeń naukowych i inżynierskich, analiz układów statycznych

Przyczynowość Kointegracja. Kointegracja. Kointegracja

Stanisław Cichocki. Natalia Nehrebecka. Wykład 10

Pliki. Operacje na plikach w Pascalu

Ekonometria Ćwiczenia 19/01/05

Egzamin z ekonometrii wersja IiE, MSEMat Pytania teoretyczne

Ekonometria z pakietem Stata- skrypt

Przypomnienie: Ćwiczenie 1.

Generator CABRILLO program Marka SP7DQR (Instrukcja obsługi)

Dodawanie wzorca graficznego do programów linii InsERT GT

Wiadomości i umiejętności

Instrukcja użytkownika systemu medycznego

Połączenie AutoCad'a z bazą danych

Dodawanie stron do zakładek

Kancelaria rozpoczęcie pracy z programem

Stanisław Cichocki Natalia Nehrebecka. Wykład 1

instrukcja użytkownika terminala ARGOX PA-20 SYSTEMY AUTOMATYCZNEJ IDENTYFIKACJI

Dodawanie stron do zakładek

Jak napisać program obliczający pola powierzchni różnych figur płaskich?

Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki

trainxx tramxx

Działki Przygotowanie organizacyjne

Instrukcja użytkownika aplikacji modernizowanego Systemu Informacji Oświatowej PRACA NA WIELU BAZACH DANYCH

Edytor tekstu OpenOffice Writer Podstawy

OBSŁUGA PRACY DYPLOMOWEJ W APD PRZEZ RECENZENTA

Stanisław Cichocki. Natalia Nehrebecka. Wykład 4

Rozpoczynamy import Kreator uruchamiamy przyciskiem Z tekstu, znajdującym się na karcie Dane, w grupie Dane zewnętrzne.

Budowa modelu i testowanie hipotez

Czasowy wymiar danych

Jak korzystać z przeglądarki danych ESS SoftReport

Windows XP Wiersz polecenia

Wstęp do Informatyki i Programowania Laboratorium: Lista 1 Środowisko programowania

, a reszta dla pominiętej obserwacji wynosi 0, RSS jest stałe, T SS rośnie, więc zarówno R 2 jak i R2 rosną. R 2 = 1 n 1 n. rosnie. n 2 (1 R2 ) = 1 59

Cel: Przypisujemy przyciskom określone funkcje panel górny (Panel1)

Ekonometria dla IiE i MSEMat Z7

Tabele przestawne tabelą przestawną. Sprzedawcy, Kwartały, Wartości. Dane/Raport tabeli przestawnej i wykresu przestawnego.

Matlab, zajęcia 3. Jeszcze jeden przykład metoda eliminacji Gaussa dla macierzy 3 na 3

Test diagnostyczny dla uczniów klas pierwszych Technikum Zawodowego nr 2. Ogólne zasady pracy z komputerem w środowisku Windows

Analiza Szeregów Czasowych. Egzamin

PIERWSZE URUCHOMIENIE PROGRAMU ITNC PROGRAMMING STATION

System kontroli dostępu ACCO NET Instrukcja instalacji

netster instrukcja obsługi

I. Program II. Opis głównych funkcji programu... 19

Ekonometria dla IiE i MSEMat Z12

CAŁOŚĆ OPRACOWANIA POWINNA ZAWIERAĆ MAKSYMALNIE 10 STRON.

WYDZIAŁ ELEKTROTECHNIKI, AUTOMATYKI I INFORMATYKI INSTYTUT AUTOMATYKI I INFORMATYKI KIERUNEK AUTOMATYKA I ROBOTYKA STUDIA STACJONARNE I STOPNIA

Instrukcja połączenia z programem Compas LAN i import konfiguracji

SKRYPTY. Zadanie: Wyznaczyć wartość wyrażenia arytmetycznego

Diagnoza Szkolna Pearsona. Instrukcja obsługi

Instrukcja połączenia z programem Compas LAN i import konfiguracji

Stanisław Cichocki. Natalia Nehrebecka. Wykład 12

Testy własności składnika losowego Testy formy funkcyjnej. Diagnostyka modelu. Część 2. Diagnostyka modelu

Konfiguracja panelu ASTRAADA HMI z sterownikiem ASTRADA ONE

Tworzenie dokumentów oraz prezentacji programu Młodzi Aktywiści Prezydencji przy wykorzystaniu EduTuby

Transkrypt:

ANALIZA DANYCH W STATA 8.0 1. Opis wyglądu programu Stata ZAJĘCIA 1 Menu i ikonki Okna: wpisywania poleceń (command) wynikowe (results) dotychczasowych poleceń (review) zmiennych (variables) viewer danych (data editor) coś a la notatnik gdzie można pisać programy i dłuższe polecenia (do-file editor) Na dole (pasek stanu) znajduje się katalog domyślny skąd są otwierane i dokąd są zapisywane pliki (chyba że w poleceniu wyszczególniona jest jakaś inna lokalizacja). Menu Window 2. Praca z programem Stata Wpisuje się polecenia i wyniki są w oknie wynikowym 3. Rozpoczęcie logowania Komendy, wyniki i komentarze można zapisać do pliku.smcl lub.log Plik.log jest odczytywany np. przez Worda. Plik.smcl jest odczytywany tylko przez Statę. Włączając Statę będziemy musieli za każdym razem zmieniać katalog domyślny na C:/Temp/stata_1, i jednocześnie pamiętać o rozpoczęciu logowania. Ułatwimy sobie to zadanie tworząc plik z rozszerzeniem.do: 1 z 9

(1) Stworzyć w katalogu C:/temp katalog stata_1 (2) Otworzyć do-file editor i wpisać następujące polecenia: cd C:/temp/stata_1 log using stata1a.log, append cmdlog using stata1b.log, append (3) Zapisać ten plik jako start.do w katalogu C:/temp (4) Otworzyć zwykły notatnik i napisać w nim następujące zdanie do C:/temp/start (5) Za każdym razem gdy uruchamiamy Statę trzeba przekopiować to co jest w notatniku do okna poleceń w Stacie i nacisnąć enter Komentarze wpisuje się z gwiazdką: *KOTA KOTA KOT 4. Rozszerzenia plików związanych z programem Stata.dta baza danych.log,.smcl wyniki pracy (logowanie).gph wykres.do plik tekstowy do wpisywania poleceń.ado plik tekstowy z zarejestrowanym programem 5. Pierwsze kroki verinst Stata odróżnia małe i wielkie litery Separator miejsc dziesiętnych to kropka display 2.2 + 3 display 2,2 + 3 Brakujące dane: kropka oraz symbole od.a do.z są traktowane jako liczby nieskończenie duże. Wszystkie liczby <. <.a <.b <... <.z Żeby nie uwzględniać w obliczeniach missing values, trzeba w wyrażeniu warunkowym dać <. Uwzględniając tylko missing values należy dać: >=. 2 z 9

6. Wygląd typowego polecenia {by zmienne:} polecenie {zmienne} {= wyrażenie} {if wyrażenie} {in zakres} {[wagi]} {, opcje} 7. Korzystanie z pomocy Menu: Help >>> Contents Wejść np. do graphics help contents Menu: Help >>> Stata Command... Opis komendy: np. display help display help graph Wejść np. do two-way scatterplot Menu: Help >>> Search... >>> Search documentation and FAQs Znajdywanie czegoś, np.: search variance 8. Typy zmiennych search data type Zmienne liczbowe: Liczby całkowite: byte: -127;100 int: -32767;32740 long: -2 147 483 647; 2 147 483 620 Ułamki: float: ~-10 38 ;10 36 double: ~-10 307 ;10 308 Zmienne tekstowe: str1 str2 str3... str80 Kasowanie bazy danych: clear Uwaga: Polecenia clear nie da się cofnąć Wyjście ze Staty: exit 3 z 9

do C:/temp/start 9. Wprowadzanie danych a) w oknie edycji help edit Tylko przeglądanie: browse Przeglądanie i modyfikowanie: edit Wpisać w oknie edycji 3 zmienne: 1 2.2 a 2 3.3 b 3 4.4 c 4 5.5 d Przed zamknięciem okna edycji nacisnąć preserve (preserve nie zachowuje na dysku!!! zachowuje tylko tymczasowo w pamięci komputera!!!) describe list b) z klawiatury help input input z1 z2 z3 (tak nie da rady wpisać poniższych trzech zmiennych, bo polecenie input w domyśle ustawia zmienne na typ float) z polecenia input wychodzi się wpisując na początku wiersza end 1 2.2 a 2 3.3 b 3 4.4 c 4 5.5 d input int z1 z2 str5 z3 1. 1 2.2 a 2. 2 3.3 b 3. 3 4.4 c 4. 4 5.5 d 5. end 4 z 9

describe list c) z Excela metoda I Otworzyć plik Z1_plik1.xls ze strony: http://akson.sgh.waw.pl/~mproch (plik ten znajduje się pod tekstem Zajęcia 1 plik 1 / 1 1) tyle ile chcemy mieć miejsc dziesiętnych tyle musi być widoczne na ekranie 2) zamienić przecinki na kropki 3) zapisać jako plik tekstowy oddzielony tabulacjami (dać nazwę Z1_plik1.txt) w katalogu C:/temp/stata_1 4) wiersz nagłówka (z nazwami zmiennych) może być ale nie musi help insheet insheet using Z1_plik1.txt Formuła insheet bierze domyślnie pierwszy wiersz jako nazwy zmiennych lub gdy w pierwszym wierszu zaczynają się od razu wartości obserwacji pierwszy wiersz jako pierwszą obserwację dając jednocześnie domyślne nazwy zmiennych jakoś na rozum komputera describe list d) z Excela metoda II Pamiętać o zamianie przecinków na kropki Zaznaczyć obserwacje, skopiować i wkleić do Staty do okna edycji edit Teraz wkleić dane Dać preserve (preserve nie zachowuje jednak danych na dysku) list e) z pliku tekstowego Odbędzie się to może na jakichś innych zajęciach Dla zainteresowanych: polecenia infile lub infix (więcej: help infile help infix 5 z 9

10. Zachowywanie i otwieranie bazy danych insheet using Z1_plik1.txt Zmienione dane trzeba albo przeczyścić, albo zapisać, żeby móc wyjść ze Staty. a) Przeczyszczenie:, clear Można też najpierw clear, a potem exit do C:/temp/start b) Zapisywanie: insheet using Z1_plik1.txt help save save dane.dta Można zamknąć Statę (plik został zachowany w katalogu domyślnym C:/temp/stata_1) do C:/temp/start Otwieranie use dane.dta edit dopisać stan_51 jako wartość zmiennej state dla obserwacji 51 Przed wyjściem z okna edycji dać preserve!!! Nawet po wyjściu z okna edit dane nie są zapisane. Żeby zapisać trzeba koniecznie dać polecenie save. save dane.dta Ponieważ plik o tej nazwie w tym katalogu już istnieje, to trzeba dać opcję replace. Względnie zapisać pod inną nazwą. save dane.dta, replace Można w skrócie użyć polecenia save, replace save, replace do C:/temp/start 11. Przeszukiwanie bazy danych i wybieranie rekordów (a) W oknie wynikowym use dane 6 z 9

help list list state region pop list state - pop list pop* list pop??? Można robić skróty nazw zmiennych list st list d list de Wyrażenia: > >= < <= == + - / ^! ~ &!= ~= search expression Wejść na operators list state pop if pop>=5000000 list state pop if pop>=5000000 & pop <. Trzeba wpisywać <. a nie!=., gdyż missing values mogą być również z literami (od.a do.z) list medage list state pop medage if medage == 27.1 (tak nie da rady, jeśli w takim wyrażeniu przyrównujemy zmienną typu float do jakiegoś ułamka to trzeba koniecznie ułamek wziąć w nawias i przed nawiasem napisać float dotyczy to tylko przyrównywania do ułamków zmiennych o typie float) list state pop medage if medage == float(27.1) list state pop medage if medage == 30 W tym drugim float może być ale nie musi (bo nie ma ułamka) Gdy są inne typy zmiennych: byte, int, long oraz double --- absolutnie funkcja float() nie może występować list state pop if!(death == 39255) list state pop death if death/2 ==22115 list state region medage if region == "N Cntrl" & (state == "Indiana" medage==float(29.9)) list in 1 list in 8 list in -2 list in 3/6 list in -10/-1 list in f list in l (W tym ostatnim to nie jest jedynka tylko mała litera el od angielskiego last) Wszystko można łączyć, np. list state region if region == "NE" region == "West" in 1/40 To wszystko można także zastosować do poleceń edit i browse: 7 z 9

edit state pop in 1/10 browse if region == West Zliczanie rekordów w bazie danych count count if region == West 12. Coś ze statystyki Średnia, odchylenie standardowe, wartość minimalna i maksymalna, percentyle, skośność, kurtosis: help summarize summarize summarize pop, detail summarize in 1/15 if region == N Cntrl list pop in 1/15 if region == N Cntrl Regresja liniowa: Polecenie regress o konstrukcji: regress y x1 x2 x3 xn (pierwsza zmienna to zmienna objaśniana, wszystkie następne są zmiennymi objaśniającymi) help regress regress medage pop popurban divorce if state!= stan_51 predict teoret Polecenie predict teoret po wykonaniu regresji tworzy zmienną o nazwie teoret, która zawiera wartości teoretyczne zmiennej objaśnianej. regress medage pop popurban divorce Source SS df MS Number of obs = 50 -------------+------------------------------ F( 3, 46) = 2.15 Model 17.283667 3 5.76122235 Prob > F = 0.1068 Residual 123.236318 46 2.67905039 R-squared = 0.1230 -------------+------------------------------ Adj R-squared = 0.0658 Total 140.519985 49 2.8677548 Root MSE = 1.6368 ------------------------------------------------------------------------------ medage Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- pop 2.18e-07 3.52e-07 0.62 0.539-4.91e-07 9.27e-07 popurban 2.12e-08 3.98e-07 0.05 0.958-7.79e-07 8.22e-07 divorce -.0000237.0000272-0.87 0.389 -.0000785.0000311 _cons 29.0436.3929523 73.91 0.000 28.25262 29.83457 ------------------------------------------------------------------------------ Interpretacja powyższego okna wynikowego dla studenta/studentki SGH powinna być znana 8 z 9

W katalogu C:/temp/stata_1 powinny być 4 pliki: stata1a.log i stata1b.log zawierające wpisane komendy oraz wyniki dotychczasowej pracy dane.dta z bazą danych obejmującą 51 obserwacji Z1_plik1.txt z danymi w formacie tekstowym oddzielonym tabulacjami W katalogu C:/temp powinien znajdować się także plik start.do, który stworzyliśmy na początku 9 z 9