PAKIETY STATYSTYCZNE

1. Wykład wstępny PAKIETY STATYSTYCZNE 2. SAS, wprowadzenie - środowisko Windows, Linux 3. SAS, elementy analizy danych edycja danych 4. SAS, elementy analizy danych regresja liniowa, regresja nieliniowa 5. SAS, elementy analizy danych analiza wariancji 6. SAS, elementy analizy danych symulacje Monte Carlo 7. SAS, elementy wizualizacji danych 8. SAS, tworzenie zaawansowanych programów, manipulowanie dużymi zbiorami danych 9. R, wprowadzenie 10. R, elementy analizy danych edycja danych 11. R, elementy analizy danych regresja liniowa, regresja nieliniowa, analiza wariancji 12. R, elementy analizy danych symulacje Monte Carlo 13. R, elementy wizualizacji danych dystrybucja standardowa 14. R, tworzenie prostych programów w pakiecie R 15. Podsumowanie materiału

WSTĘP 1. Praca z programem w linii komend (Linux OS) 2. Input danych różne formaty 3. Output danych różne formaty 4. Edycja daych

SAS W LINII KOMEND

PRACA W LINII KOMEND /* 15.11.2016 JS read data on alcohol dependence */ options obs=max ls=64 sortsize=max sortname=sort sortpgm=host ; /* obs=max use all records ls=64 use shorter lines in log and lst outputs sortsize=max use maximum available memory of sorting */ %let INPFILE="/home/szyda/PAKIETY/gaw.txt" ; data ALCOHOL ; infile &INPFILE delimiter='09'x firstobs=2 ; input FAMID IID FID MID SEX $ AGE_INTERVIEW ETHNICITY ALCDEPEND AGE_ONSET MAXDRINK MAXCIGAR ; * define missing codes ; if FAMID eq 0 then delete ; if IID eq 0 then delete ; if SEX ne 'F' and SEX ne 'M' then SEX=. ; if AGE_INTERVIEW lt AGE_ONSET then delete ; * modify data ; AGE_INTERVIEW=AGE_INTERVIEW*12 ; if MAXDRINK=-9 then MAXDRINK=. ; /* data summary */ proc means data=alcohol ; proc univariate data=alcohol ; proc freq data=alcohol ; tables SEX ; tables ETHNICITY / chisq ; output out=chieth n nmiss pchi ; title "---------------output of thr CHI2 test for tables eth---------------" ; proc print data=chieth ; proc freq data=alcohol ; tables SEX*ETHNICITY/ chisq ; output out=chisexeth n nmiss pchi ; title "-------------output of thr CHI2 test for tables eth*sex-------------" ; proc print data=chisexeth ;

INPUT data DANE_1 ; length SEQUENCE $101. ; length TMP2 $1. ; informat TMP1 10.5 ; infile "C:\ASIA\CLASS\pakietystatystyczne\lectures\dane.1" ; input SEQUENCE TMP1 TMP2 ; put SEQUENCE TMP1 TMP2 ;

INPUT %let NDATA=1 ; data DANE_1 ; length SEQUENCE $101. ; length TMP2 $1. ; informat TMP1 10.5 ; infile "C:\ASIA\CLASS\pakietystatystyczne\lectures\dane.&NDATA" ; input SEQUENCE TMP1 TMP2 ; put SEQUENCE TMP1 TMP2 ;

INPUT data DANE_2 ; length SEQUENCE $101. ; length TMP2 $1. ; informat TMP1 10.5 ; informat NUM1-NUM4 10.0 ; infile "C:\ASIA\CLASS\pakietystatystyczne\lectures\dane.2" ; input SEQUENCE TMP1 TMP2 NUM1-NUM4 slv $ ; put SEQUENCE TMP1 TMP2 NUM1-NUM4 slv $ ;

INPUT data DANE_2 ; length SEQUENCE $101. ; length TMP2 $1. ; infile "C:\ASIA\CLASS\pakietystatystyczne\lectures\dane.2" ; input @1 SEQUENCE @99 NAME $3. @103 TMP1 10.5 ; put SEQUENCE NAME TMP1 ;

INPUT data DANE_2s ; length SEQUENCE1 SEQUENCE2 $101. ; length TMP2 $1. ; infile "C:\ASIA\CLASS\pakietystatystyczne\lectures\dane.2" ; input @1 SEQUENCE1 TMP1 TMP2 NUM1-NUM4 slv $ @ ; input @1 SEQUENCE2 ; proc print data=dane_3 ;

OUTPUT

OUTPUT data _null_ ; set DANE_1 ; informat TMP1 10.5 ; file "C:\ASIA\CLASS\pakietystatystyczne\lectures\dane.out" ; put TMP1 ;

OUTPUT ata _null_ ; set DANE_1 ; informat TMP1 10.5 ; file "C:\ASIA\CLASS\pakietystatystyczne\lectures\dane.out" mod ; put TMP1 ; data _null_ ; set DANE_1 ; informat TMP1 10.5 ; file "C:\ASIA\CLASS\pakietystatystyczne\lectures\dane.out" ; put TMP1 ;

EDYCJA

OUTPUT data ALL ; set D1 D2 ;

OUTPUT Data D1 ; input X $ Y ; datalines; a 1 b 2 c 3 d 4 e 5 Data D2 ; input X $ Y ; datalines; a 10 b 20 d 30 f 40 g 50 proc sort data=d1 nodupkey ; by X ; proc sort data=d2 nodupkey ; by X ; data ALL ; merge D1 (in=a) D2 (in=b) ; if a and b ; by X ;

1. Praca z programem w linii komend (Linux OS) 2. Input danych różne formaty 3. Output danych różne formaty 4. Edycja daych