ANALIZA DANYCH W STATA 8.0 ZAJĘCIA 3 1. Rozpoczęcie 1. Stwozyć w katalogu C:/temp katalog stata_3 2. Ściągnąć z intenetu ze stony http://akson.sgh.waw.pl/~mpoch plik zajecia3.zip (kyje się on pod tekstem Zajęcia 3 plik 1 / 1 ) 3. Zapisać ten plik w katalogu C:/temp/stata_3 4. Wypakować pliki do tego katalogu. Powinny powstać tzy pliki: mp2.dta koelacja.do tend.xls 5. Otwozyć Statę 6. Zmienić katalog domyślny, ozpocząć logowanie i otwozyć bazę danych mp2.dta następującymi poleceniami: cd C:/temp/stata_3 log using stata3a.log cmdlog using stata3b.log use mp2 2. Modyfikacja nazw oaz watości zmiennych Można wszystko w oknie edit: edit Zmienić nazwę jakiejś zmiennej i zmienić watość jakiejś obsewacji Nie zachowywać zmian nawet tymczasowo (pzed wyjściem z okna edycji nacisnąć Restoe ) (A) Zamiana watości list eplace x = -143 if y == 2 eplace z = z/1000 eplace y = 1000000 in l geneate st10 xxl = KIZIAK in 1 eplace xxl = ZWIERZYNIEC NA ROZTOCZU if y == 1 y == 5 (B) Zmiana nazw zmiennych ename x xteg enpfix x polesie clea 1
3. Koelacja posta c.d. use mp2 do koelacja ZADANIE: Rozszezyć plik koelacja.do tak, żeby na końcu była podawana infomacja o minimalnym poziomie istotności pzy któym można odzucić hipotezę zeową o nieskoelowaniu zmiennych x i z doedit Otwozyć plik koelacja.do --------------------------------------------------------koelacja.do--------------------------------- coelate x z display "Statystyka t dla wsp. koelacji zmiennych x i z wynosi ", (ho)*sqt((n)-2)/sqt(1-((ho))^2) display "Watosc kytyczna t dla poziomu istotnosci 10% wynosi ", invttail((n)-2,0.05) ----------------------------------------------------------------------------------------------------- Dopisać następującą linijkę: display "Hipoteze zeowa mozna odzucic juz pzy poziomie istotnosci = ", ttail((n)-2,(ho)*sqt((n)- 2)/sqt(1-((ho))^2))*2 Kozystamy z funkcji ttail. Funkcja ta zwaca dla podanej liczby stopni swobody i dla danego punktu x watość 1 dystybuanta(x), tzn. wielkość pola pod funkcją gęstości ozkładu t- studenta od punktu x do nieskończoności: ttail(n,x) = a n liczba stopni swobody a {= ttail(n,x)} x Infomacje o innych funkcjach statystycznych znajdują się w pomocy: help functions a następnie tzeba nacisnąć myszką na tekst pobfun, któy ukaże się w oknie wynikowym Zapisać plik koelacja.do do koelacja.do un koelacja.do pwco x z 2
4. Koelacja cząstkowa xy. z = xy xz yz 2 2 ( )( 1 ) 1 xz yz xy. z 1;1 Współczynnik koelacji cząstkowej bada skoelowanie dwóch cech, wyłączając wpływ innej cechy. pco x y z pco y z x help pco ZADANIE: Stwozyć pogam, któy będzie samodzielnie liczył watości współczynnika koelacji cząstkowej i dla poównania pokazywał też te obliczane pzez Statę. Pogamy to pliki z ozszezeniem.ado. Stwózmy zatem plik coelacja.ado. sysdi Po wpisaniu polecenia sysdi spawdźcie gdzie znajduje się katalog domyślny zawieający pliki.ado należące do gupy PERSONAL. Powinien to być katalog c:\ado\pesonal\. doedit pogam coelacja cd "C:/temp/stata_3" use mp2 coelate x y geneate xy = (ho) coelate x z geneate xz = (ho) coelate y z geneate yz = (ho) geneate _xy_z = (xy - xz*yz)/sqt((1-xz^2)*(1-yz^2)) display "Wspolczynnik koelacji xy z pominieciem z wynosi " _xy_z geneate _xz_y = (xz - xy*yz)/sqt((1-xy^2)*(1-yz^2)) display "Wspolczynnik koelacji xz z pominieciem y wynosi " _xz_y geneate _yz_x = (yz - xy*xz)/sqt((1-xy^2)*(1-xz^2)) display "Wspolczynnik koelacji yz z pominieciem x wynosi " _yz_x dop xy xz yz _xy_z _xz_y _yz_x pco x y z pco y z x clea end Uwaga!!! Pzykład ten ma na celu pokazać, czym jest pogam, a nie nauczyć nas pogamowania w Stacie. Takiego pogamu nikt w zeczywistości nie napisałby, chociażby dlatego, że liczby powinny być pzechowywane w makach a nie w zmiennych. Zapisać jako coelacja.ado w katalogu C:\ado\pesonal (tam gdzie mieszczą się pliki.ado należące do gupy PERSONAL). exit Uuchomić Statę coelacja 3
Uwaga: Na komputeach SGH może nie być możliwości zapisywania bezpośednio na dysku C. Wówczas tzeba zmienić katalog plików.ado należących do gupy PERSONAL na nasz katalog C:/temp/stata_3: sysdi set PERSONAL C:/temp/stata_3 a następnie plik coelacja.ado zapisać w katalogu C:/temp/stata_3. Po wpisaniu komendy coelacja pogam powinien działać. pliki.do polecenia wykonywane jedno po dugim (uuchamiamy: do nazwapliku.do <wówczas polecenia i wyniki są wyświetlane> lub un nazwapliku.do <wówczas polecenia i wyniki nie są wyświetlane, ale polecenia są wykonywane> pliki.ado pogamy (uuchamiamy: nazwapogamu) 5. Zadanie do wykonania W pliku tend.xls są dane a) Obliczyć ównanie tendu dla spzedaży Big Maców, McChickenów i łącznej spzedaży. b) Podać watość śedniej i odchylenia standadowego dla tych tzech zmiennych c) W celu poównania wahań wystandayzować powyższe zmienne pzekształcając je do postaci: watość minus śednia pzez odchylenie standadowe d) Naysować na wykesie spzedaż Big Maców, McChickenów i łączną spzedaż. Na wykesie umieścić linię tendu dla łącznej spzedaży. e) Taki sam wykes wykonać na zmiennych w postaci wystandayzowanej Plik tend.xls zapisać jako plik tekstowy ozdzielony tabulacjami pod nazwą tend.txt w katalogu C:/temp/stata_3 clea insheet using tend.txt save tend sot towa ok geneate sb = spzedaz[_n] in 1/31 geneate sm = spzedaz[_n+31] in 1/31 dop in 32/l geneate t = _n geneate sl = sb + sm egess sb t egess sm t egess sl t summaize summaize sb etun list geneate sb_s = (sb[_n] (mean))/(sd) summaize sm geneate sm_s = (sm[_n] (mean))/(sd) 4
summaize sl geneate sl_s = (sb[_n] (mean))/(sd) dop spzedaz towa save, eplace Stata 8.0 ofeuje badzo duże możliwości jeśli chodzi o twozenie wykesów. Ponieważ zapamiętanie komend twozących oaz, co jeszcze gosze, fomatujących każdy szczególik wykesu z pewnością pzeasta pzeciętną osobę, poponuję następującą naukę wykesów. W celu twozenia wykesów kozystajmy z menu Gaphics i okienek. Po stwozeniu w ten sposób wykesu zainteesowanych zapaszam do pzeanalizowania kodu opisującego dany wykes i pojawiającego się w oknie wynikowym. Gdy ktoś chce napisać pogam, któy będzie m. in. twozył wykesy, poponuję, żeby wykonał piewszy pzykładowy wykes z menu Gaphics i okienek, a następnie skopiował kod wykesu do twozonego pogamu i zmienił co tylko tzeba. Menu Gaphics: Tutaj kozystamy z dugiej pozycji menu Ovelaid twoway gaphs, Pawidłowe wykesy do tego zadania mogą mieć m. in. następujący kod: twoway (scatte sb ok) (scatte sm ok) (lfit sl ok) (scatte sl ok), ytitle(spzedaz) xtitle(rok) title(wielkość spzedaży w McDonald) legend(on ode(1 "A" 2 "B" 3 "C" 4 "D")) 5
twoway (scatte sb_s ok) (scatte sm_s ok) (lfit sl_s ok) (scatte sl_s ok), ytitle(spzedaz) xtitle(rok) title(wielkość spzedaży w McDonald) legend(on ode(1 "A" 2 "B" 3 "C" 4 "D")) W katalogu C:/temp/stata_3 powinno być 7 lub 8 plików: stata3a.log i stata3b.log zawieające wpisane komendy oaz wyniki dotychczasowej pacy mp2.dta i tend.dta z bazami danych koelacja.do plik zawieający polecenia do wykonania pzez pogam Stata tend.txt i tend.xls coelacja.ado plik zawieający pogam coelacja (jeśli tego pliku nie ma, to znajduje się on w katalogu C:/ado/pesonal) 6