1. Wykład wstępny PAKIETY STATYSTYCZNE 2. SAS, wprowadzenie - środowisko Windows, Linux 3. SAS, elementy analizy danych edycja danych 4. SAS, elementy analizy danych regresja liniowa, regresja nieliniowa 5. SAS, elementy analizy danych analiza wariancji 6. SAS, elementy analizy danych symulacje Monte Carlo 7. SAS, elementy wizualizacji danych 8. SAS, tworzenie zaawansowanych programów, manipulowanie dużymi zbiorami danych 9. R, wprowadzenie 10. R, elementy analizy danych edycja danych 11. R, elementy analizy danych regresja liniowa, regresja nieliniowa, analiza wariancji 12. R, elementy analizy danych symulacje Monte Carlo 13. R, elementy wizualizacji danych dystrybucja standardowa 14. R, tworzenie prostych programów w pakiecie R 15. Podsumowanie materiału
WSTĘP 1. Opis zbioru danych 2. SAS praca z programem 3. Wprowadzanie i edycja danych Copyright 2018 Joanna Szyda
ZBIÓR DANYCH Copyright 2017 Joanna Szyda
ZBIÓR DANYCH Copyright 2017 Joanna Szyda
GAW Copyright 2017 Joanna Szyda
ZBIÓR DANYCH family ID individual ID ID of Father {0ID of Mother { sex Age (at interethnicity {0=alcohol dep Age of OnseMaximum n(# packs per day for 1 y 10084 10000089 10000526 10000031 F 30 6 5 16 24 17 10084 10000758 10000526 10000031 F 31 6 5 30 12 16 10084 10001094 0 0 M 0 0 0 0-9 -9 10084 10000133 10001094 10000758 M 18 6 3 0 18 0.45 10084 10001039 10000526 10000031 M 28 6 5 16 40 0 10084 10000194 10000526 10000031 F 24 6 3 0 20 8 10084 10000526 0 0 M 60 6 5 38 24 42 10084 10000031 0 0 F 60 6 3 0 7 58.5 10130 10001565 10001436 10001364 F 38 6 5 18 75 30 10130 10000919 10001436 10001364 M 40 6 5 33 48 0 10130 10000299 10001436 10001364 F 32 6 5 17 36 32 10130 10000489 10001436 10001364 M 27 6 3 0 12 0 10130 10001436 0 0 M 62 6 3 0 10 42 10130 10001364 0 0 F 61 6 1 0 5 0.125 10038 10000572 10001250 10001511 F 28 6 5 15 48 12 10038 10000272 10001250 10001511 M 26 6 3 0 10 0 10038 10001295 10001250 10001511 F 25 6 1 0 3 0 10038 10000598 10001250 10001511 M 22 6 5 15 71 12 10038 10001250 0 0 M 68 6 3 0 10 0 10038 10001511 0 0 F 52 6 3 0 14 31 10006 10000264 10000130 10000650 M 34 6 5 16 26 0 10006 10000025 10000130 10000650 M 35 6 5 18 36 13 10006 10000707 10000130 10000650 M 26 6 5 20 15 6 10006 10001405 10000130 10000650 F 28 6 5 23 10 0 10006 10000130 0 0 M 58 6 5 30 24-9 10006 10000650 0 0 F 59 6 1 0 3 0 10027 10000398 0 0 M 58 6 5 24 42 41 N=1 615 Copyright 2017 Joanna Szyda
SAS FUNKCJE edycja analiza różnorodne metody statystyczne wizualizacja wykonywanie wykresów bazy danych... PROGRAM KOMERCYJNY roczna licencja ZALETY stale wzbogacany możliwość analizy bardzo dużych zbiorów danych bioinformatyka Copyright 20117 Joanna Szyda
SAS STRUKTURA PAKIETU zbiór "procedur" wykonywanie konkretnych analiz / wykresów modyfikacja procedur opcje tworzenie własnych programów SAS dla WINDOWS interfejs graficzny 3 okna SAS dla LINUX interfejs graficzny + linia komend Copyright 20117 Joanna Szyda
PRACA Z PROGRAMEM Copyright 2017 Joanna Szyda
PRACA Z PROGRAMEM WYKONANIE BRAK BŁĘDÓW PROGRAM EDITOR INSTRUKCJE LOG BŁĘDY OUTPUT INTERPRETACJA Copyright 2017, Joanna Szyda
PROGRAM EDITOR
OKNO PROGRAM EDITOR INSTRUKCJE TWORZENIE INSTRUKCJI, KTÓRE ZOSTANĄ WYKONANE PRZEZ PAKIET SAS INSTRUKCJE MUSZĄ ZAWIERAĆ: specyfikację pliku zawierającego dane format danych w pliku specyfikację metod statystycznych wpisanie instrukcji bezpośrednio w oknie skopiowanie instrukcji z zewnętrznego pliku Copyrigt 2017, Joanna Szyda
OKNO PROGRAM EDITOR INSTRUKCJE WPISANIE INSTRUKCJI Copyrigt 2017, Joanna Szyda
OKNO PROGRAM EDITOR INSTRUKCJE WPROWADZENIE INSTRUKCJI Z PLIKU Copyrigt 2017, Joanna Szyda
OKNO PROGRAM EDITOR INSTRUKCJE WYKONANIE INSTRUKCJI Copyrigt 2017 Joanna Szyda
LOG
OKNO LOG KOMUNIKATY W OKNIE LOG ZAWARTE SĄ INFORMACJE O PRZEBIEGU DZIAŁANIA PROGRAMU, m. in.: nazwa pliku zawierającego dane liczba analizowanych osobników liczba osobników z brakującymi danymi oraz informacje o ewentualnych błędach komunikaty w oknie LOG należy przeanalizować po wykonaniu instrukcji z okna PROGRAM EDITOR, a przed (!!! ) interpretacją wyników Copyrigt 2017, Joanna Szyda
OKNO LOG KOMUNIKATY BRAK BŁĘDU BŁĄD Copyrigt 2017, Joanna Szyda
OUTPUT
OKNO OUTPUT WYNIKI Copyrigt 2017, Joanna Szyda
STRUKTURA PROGRAMU
STRUKTURA PROGRAMU ZBIÓR DANYCH definicja zbioru danych wczytanie danych do programu OBLICZENIA edycja wybór procedur statystycznych wybór procedur graficznych + wybór opcji Copyrigt 2017 Joanna Szyda
ZBIÓR DANYCH family ID individual ID ID of Father {0ID of Mother { sex Age (at interethnicity {0=alcohol dep Age of OnseMaximum n(# packs per day for 1 y 10084 10000089 10000526 10000031 F 30 6 5 16 24 17 10084 10000758 10000526 10000031 F 31 6 5 30 12 16 10084 10001094 0 0 M 0 0 0 0-9 -9 10084 10000133 10001094 10000758 M 18 6 3 0 18 0.45 10084 10001039 10000526 10000031 M 28 6 5 16 40 0 10084 10000194 10000526 10000031 F 24 6 3 0 20 8 10084 10000526 0 0 M 60 6 5 38 24 42 10084 10000031 0 0 F 60 6 3 0 7 58.5 10130 10001565 10001436 10001364 F 38 6 5 18 75 30 10130 10000919 10001436 10001364 M 40 6 5 33 48 0 10130 10000299 10001436 10001364 F 32 6 5 17 36 32 10130 10000489 10001436 10001364 M 27 6 3 0 12 0 10130 10001436 0 0 M 62 6 3 0 10 42 10130 10001364 0 0 F 61 6 1 0 5 0.125 10038 10000572 10001250 10001511 F 28 6 5 15 48 12 10038 10000272 10001250 10001511 M 26 6 3 0 10 0 10038 10001295 10001250 10001511 F 25 6 1 0 3 0 10038 10000598 10001250 10001511 M 22 6 5 15 71 12 10038 10001250 0 0 M 68 6 3 0 10 0 10038 10001511 0 0 F 52 6 3 0 14 31 10006 10000264 10000130 10000650 M 34 6 5 16 26 0 10006 10000025 10000130 10000650 M 35 6 5 18 36 13 10006 10000707 10000130 10000650 M 26 6 5 20 15 6 10006 10001405 10000130 10000650 F 28 6 5 23 10 0 10006 10000130 0 0 M 58 6 5 30 24-9 10006 10000650 0 0 F 59 6 1 0 3 0 10027 10000398 0 0 M 58 6 5 24 42 41 N=1 615 Copyrigt 2011, Joanna Szyda
PROGRAM EDYCJA DANYCH /* 15.03.2017 JS read data on alcohol dependence */ data ALCOHOL ; infile 'c:/asia/class/pakietystatystycznebioinf/lectures/gaw.txt' delimiter='09'x firstobs=2 ; input FAMID IID FID MID SEX $ AGE_INTERVIEW ETHNICITY ALCDEPEND AGE_ONSET MAXDRINK MAXCIGAR ; * define missing codes ; if FAMID eq 0 then delete ; if IID eq 0 then delete ; if SEX ne 'F' or SEX ne 'M' then SEX=. ; if AGE_INTERVIEW gt AGE_ONSET then delete ; * modify data ; AGE_INTERVIEW=AGE_INTERVIEW*12 ; run ; /* data summary */ proc means data=alcohol ; run ; proc univariate data=alcohol ; run ; proc freq data=alcohol ; tables SEX ; tables ETHNICITY ; run ; Copyrigt 2017, Joanna Szyda
PROGRAM EDYCJA DANYCH /* 15.03.2011 JS read data on alcohol dependence */ komentarz data ALCOHOL ; nazwa zbioru danych infile 'c:/gaw.txt' delimiter='09'x firstobs=2 ; ścieżka do pliku, struktura danych input FAMID IID FID MID SEX $ AGE_INTERVIEW ETHNICITY ALCDEPEND AGE_ONSET MAXDRINK MAXCIGAR ; nazwy zmiennych * define missing codes ; komentarz if FAMID eq 0 then delete ; usuwanie brakujących danych if IID eq 0 then delete ; if SEX ne 'F' or SEX ne 'M' then SEX=. ; kod brakujących danych if AGE_INTERVIEW gt AGE_ONSET then delete ; sprawdzanie poprawności * modify data ; AGE_INTERVIEW=AGE_INTERVIEW*12 ; run ; modyfikacja zmiennych Copyrigt 2017, Joanna Szyda
PROGRAM EDYCJA DANYCH PROCEDURY PODSUMOWANIA DANYCH /* data summary */ proc means data=alcohol ; run ; proc univariate data=alcohol ; run ; proc freq data=alcohol ; tables SEX ; tables ETHNICITY ; run ; Copyrigt 2017, Joanna Szyda
LITERATURA - PROGRAMY http://support.sas.com/documentation/94/ Copyright 2017 Joanna Szyda
1. Opis zbioru danych 2. SAS praca z programem 3. Wprowadzanie i edycja danych