PAKIETY STATYSTYCZNE 1. Wykład wstępny 2. Statistica wprowadzenie 3. Statistica elementy analizy danych 4. Statistica wykresy 5. SAS wprowadzenie - środowisko Windows 6. SAS wprowadzenie - środowisko Linux 7. SAS elementy analizy danych 8. SAS wykresy 9. SAS tworzenie zaawansowanych programów 10. R wprowadzenie 11. R elementy analizy danych 12. R wykresy 13. R zaawansowane elementy programowania 14. Manipulowanie dużymi zbiorami danych 15. Podsumowanie materiału
WSTĘP 1. SAS praca z programem 2. Wprowadzanie i edycja danych Copyright 2011, Joanna Szyda
SAS FUNKCJE edycja analiza różnorodne metody statystyczne wizualizacja wykonywanie wykresów bazy danych... PROGRAM KOMERCYJNY roczna licencja ZALETY stale wzbogacany możliwość analizy bardzo dużych zbiorów danych bioinformatyka Copyright 2011, Joanna Szyda
SAS STRUKTURA PAKIETU zbiór "procedur" wykonywanie konkretnych analiz / wykresów modyfikacja procedur opcje tworzenie własnych programów SAS dla WINDOWS interfejs graficzny 3 okna SAS dla LINUX interfejs graficzny + linia komend Copyright 2011, Joanna Szyda
PRACA Z PROGRAMEM Copyright 2011, Joanna Szyda
PRACA Z PROGRAMEM WYKONANIE BRAK BŁĘDÓW PROGRAM EDITOR INSTRUKCJE LOG BŁĘDY OUTPUT INTERPRETACJA Copyright 2011, Joanna Szyda
PRACA Z PROGRAMEM OKNO PROGRAM EDITOR
OKNO PROGRAM EDITOR INSTRUKCJE TWORZENIE INSTRUKCJI, KTÓRE ZOSTANĄ WYKONANE PRZEZ PAKIET SAS INSTRUKCJE MUSZĄ ZAWIERAĆ: specyfikację pliku zawierającego dane format danych w pliku specyfikację metod statystycznych wpisanie instrukcji bezpośrednio w oknie skopiowanie instrukcji z zewnętrznego pliku
OKNO PROGRAM EDITOR INSTRUKCJE WPISANIE INSTRUKCJI
OKNO PROGRAM EDITOR INSTRUKCJE WPROWADZENIE INSTRUKCJI Z PLIKU
OKNO PROGRAM EDITOR INSTRUKCJE WYKONANIE INSTRUKCJI
PRACA Z PROGRAMEM OKNO LOG
OKNO LOG KOMUNIKATY W OKNIE LOG ZAWARTE SĄ INFORMACJE O PRZEBIEGU DZIAŁANIA PROGRAMU, m. in.: nazwa pliku zawierającego dane liczba analizowanych osobników liczba osobników z brakującymi danymi oraz informacje o ewentualnych błędach komunikaty w oknie LOG należy przeanalizować po wykonaniu instrukcji z okna PROGRAM EDITOR, a przed (!!! ) interpretacją wyników
OKNO LOG KOMUNIKATY BRAK BŁĘDU BŁĄD
PRACA Z PROGRAMEM OKNO OUTPUT
OKNO OUTPUT WYNIKI
PRACA Z PROGRAMEM STRUKTURA PROGRAMU
STRUKTURA PROGRAMU ZBIÓR DANYCH definicja zbioru danych wczytanie danych do programu OBLICZENIA edycja wybór procedur statystycznych wybór procedur graficznych + wybór opcji
ZBIÓR DANYCH family ID individual ID ID of Father {0 ID = of not Mother in pedigree} {0 sex = not in pedigree} Age (at interview) Ethnicity {No{0=No Info alcohol = Info;1=American 0} dependence Age of OnsetMaximum {0 Indian;2=Asian;3=Pacific = No Info : number 1 (# = packs "Pure of Unaffected" per drinks Islander;4=B day in for a 24 1 : 2 ye h 10084 10000089 10000526 10000031 F 30 6 5 16 24 17 10084 10000758 10000526 10000031 F 31 6 5 30 12 16 10084 10001094 0 0 M 0 0 0 0-9 -9 10084 10000133 10001094 10000758 M 18 6 3 0 18 0.45 10084 10001039 10000526 10000031 M 28 6 5 16 40 0 10084 10000194 10000526 10000031 F 24 6 3 0 20 8 10084 10000526 0 0 M 60 6 5 38 24 42 10084 10000031 0 0 F 60 6 3 0 7 58.5 10130 10001565 10001436 10001364 F 38 6 5 18 75 30 10130 10000919 10001436 10001364 M 40 6 5 33 48 0 10130 10000299 10001436 10001364 F 32 6 5 17 36 32 10130 10000489 10001436 10001364 M 27 6 3 0 12 0 10130 10001436 0 0 M 62 6 3 0 10 42 10130 10001364 0 0 F 61 6 1 0 5 0.125 10038 10000572 10001250 10001511 F 28 6 5 15 48 12 10038 10000272 10001250 10001511 M 26 6 3 0 10 0 10038 10001295 10001250 10001511 F 25 6 1 0 3 0 10038 10000598 10001250 10001511 M 22 6 5 15 71 12 10038 10001250 0 0 M 68 6 3 0 10 0 10038 10001511 0 0 F 52 6 3 0 14 31 10006 10000264 10000130 10000650 M 34 6 5 16 26 0 10006 10000025 10000130 10000650 M 35 6 5 18 36 13 10006 10000707 10000130 10000650 M 26 6 5 20 15 6 10006 10001405 10000130 10000650 F 28 6 5 23 10 0 10006 10000130 0 0 M 58 6 5 30 24-9 10006 10000650 0 0 F 59 6 1 0 3 0 10027 10000398 0 0 M 58 6 5 24 42 41 N=1 615
PROGRAM EDYCJA DANYCH /* 15.03.2011 JS read data on alcohol dependence */ data ALCOHOL ; infile 'c:/asia/class/pakietystatystycznebioinf/lectures/gaw.txt' delimiter='09'x firstobs=2 ; input FAMID IID FID MID SEX $ AGE_INTERVIEW ETHNICITY ALCDEPEND AGE_ONSET MAXDRINK MAXCIGAR ; * define missing codes ; if FAMID eq 0 then delete ; if IID eq 0 then delete ; if SEX ne 'F' or SEX ne 'M' then SEX=. ; if AGE_INTERVIEW gt AGE_ONSET then delete ; * modify data ; AGE_INTERVIEW=AGE_INTERVIEW*12 ; run ; /* data summary */ proc means data=alcohol ; run ; proc univariate data=alcohol ; run ; proc freq data=alcohol ; tables SEX ; tables ETHNICITY ; run ;
PROGRAM EDYCJA DANYCH /* 15.03.2011 JS read data on alcohol dependence */ komentarz data ALCOHOL ; nazwa zbioru danych infile 'c:/gaw.txt' delimiter='09'x firstobs=2 ; ścieżka do pliku, struktura danych input FAMID IID FID MID SEX $ AGE_INTERVIEW ETHNICITY ALCDEPEND AGE_ONSET MAXDRINK MAXCIGAR ; nazwy zmiennych * define missing codes ; komentarz if FAMID eq 0 then delete ; usuwanie brakujących danych if IID eq 0 then delete ; if SEX ne 'F' or SEX ne 'M' then SEX=. ; kod brakujących danych if AGE_INTERVIEW gt AGE_ONSET then delete ; sprawdzanie poprawności * modify data ; AGE_INTERVIEW=AGE_INTERVIEW*12 ; run ; modyfikacja zmiennych
PROGRAM EDYCJA DANYCH PROCEDURY PODSUMOWANIA DANYCH /* data summary */ proc means data=alcohol ; run ; proc univariate data=alcohol ; run ; proc freq data=alcohol ; tables SEX ; tables ETHNICITY ; run ;
LITERATURA http://support.sas.com/documentation/onlinedoc/91pdf/index.html Copyrigt 2014, Joanna Szyda