PAKIETY STATYSTYCZNE

Save this PDF as:
 WORD  PNG  TXT  JPG

Wielkość: px
Rozpocząć pokaz od strony:

Download "PAKIETY STATYSTYCZNE"

Transkrypt

1 1. Wykład wstępny PAKIETY STATYSTYCZNE 2. SAS, wprowadzenie - środowisko Windows, Linux 3. SAS, elementy analizy danych edycja danych 4. SAS, elementy analizy danych regresja liniowa, regresja nieliniowa 5. SAS, elementy analizy danych analiza wariancji 6. SAS, elementy analizy danych symulacje Monte Carlo 7. SAS, elementy wizualizacji danych 8. SAS, tworzenie zaawansowanych programów, manipulowanie dużymi zbiorami danych 9. R, wprowadzenie 10. R, elementy analizy danych edycja danych 11. R, elementy analizy danych regresja liniowa, regresja nieliniowa, analiza wariancji 12. R, elementy analizy danych symulacje Monte Carlo 13. R, elementy wizualizacji danych dystrybucja standardowa 14. R, tworzenie prostych programów w pakiecie R 15. Podsumowanie materiału

2 WSTĘP 1. Opis zbioru danych 2. SAS praca z programem 3. Wprowadzanie i edycja danych Copyright 2018 Joanna Szyda

3 ZBIÓR DANYCH Copyright 2017 Joanna Szyda

4 ZBIÓR DANYCH Copyright 2017 Joanna Szyda

5 GAW Copyright 2017 Joanna Szyda

6 ZBIÓR DANYCH family ID individual ID ID of Father {0ID of Mother { sex Age (at interethnicity {0=alcohol dep Age of OnseMaximum n(# packs per day for 1 y F F M M M F M F F M F M M F F M F M M F M M M F M F M N=1 615 Copyright 2017 Joanna Szyda

7 SAS FUNKCJE edycja analiza różnorodne metody statystyczne wizualizacja wykonywanie wykresów bazy danych... PROGRAM KOMERCYJNY roczna licencja ZALETY stale wzbogacany możliwość analizy bardzo dużych zbiorów danych bioinformatyka Copyright Joanna Szyda

8 SAS STRUKTURA PAKIETU zbiór "procedur" wykonywanie konkretnych analiz / wykresów modyfikacja procedur opcje tworzenie własnych programów SAS dla WINDOWS interfejs graficzny 3 okna SAS dla LINUX interfejs graficzny + linia komend Copyright Joanna Szyda

9 PRACA Z PROGRAMEM Copyright 2017 Joanna Szyda

10 PRACA Z PROGRAMEM WYKONANIE BRAK BŁĘDÓW PROGRAM EDITOR INSTRUKCJE LOG BŁĘDY OUTPUT INTERPRETACJA Copyright 2017, Joanna Szyda

11 PROGRAM EDITOR

12 OKNO PROGRAM EDITOR INSTRUKCJE TWORZENIE INSTRUKCJI, KTÓRE ZOSTANĄ WYKONANE PRZEZ PAKIET SAS INSTRUKCJE MUSZĄ ZAWIERAĆ: specyfikację pliku zawierającego dane format danych w pliku specyfikację metod statystycznych wpisanie instrukcji bezpośrednio w oknie skopiowanie instrukcji z zewnętrznego pliku Copyrigt 2017, Joanna Szyda

13 OKNO PROGRAM EDITOR INSTRUKCJE WPISANIE INSTRUKCJI Copyrigt 2017, Joanna Szyda

14 OKNO PROGRAM EDITOR INSTRUKCJE WPROWADZENIE INSTRUKCJI Z PLIKU Copyrigt 2017, Joanna Szyda

15 OKNO PROGRAM EDITOR INSTRUKCJE WYKONANIE INSTRUKCJI Copyrigt 2017 Joanna Szyda

16 LOG

17 OKNO LOG KOMUNIKATY W OKNIE LOG ZAWARTE SĄ INFORMACJE O PRZEBIEGU DZIAŁANIA PROGRAMU, m. in.: nazwa pliku zawierającego dane liczba analizowanych osobników liczba osobników z brakującymi danymi oraz informacje o ewentualnych błędach komunikaty w oknie LOG należy przeanalizować po wykonaniu instrukcji z okna PROGRAM EDITOR, a przed (!!! ) interpretacją wyników Copyrigt 2017, Joanna Szyda

18 OKNO LOG KOMUNIKATY BRAK BŁĘDU BŁĄD Copyrigt 2017, Joanna Szyda

19 OUTPUT

20 OKNO OUTPUT WYNIKI Copyrigt 2017, Joanna Szyda

21 STRUKTURA PROGRAMU

22 STRUKTURA PROGRAMU ZBIÓR DANYCH definicja zbioru danych wczytanie danych do programu OBLICZENIA edycja wybór procedur statystycznych wybór procedur graficznych + wybór opcji Copyrigt 2017 Joanna Szyda

23 ZBIÓR DANYCH family ID individual ID ID of Father {0ID of Mother { sex Age (at interethnicity {0=alcohol dep Age of OnseMaximum n(# packs per day for 1 y F F M M M F M F F M F M M F F M F M M F M M M F M F M N=1 615 Copyrigt 2011, Joanna Szyda

24 PROGRAM EDYCJA DANYCH /* JS read data on alcohol dependence */ data ALCOHOL ; infile 'c:/asia/class/pakietystatystycznebioinf/lectures/gaw.txt' delimiter='09'x firstobs=2 ; input FAMID IID FID MID SEX $ AGE_INTERVIEW ETHNICITY ALCDEPEND AGE_ONSET MAXDRINK MAXCIGAR ; * define missing codes ; if FAMID eq 0 then delete ; if IID eq 0 then delete ; if SEX ne 'F' or SEX ne 'M' then SEX=. ; if AGE_INTERVIEW gt AGE_ONSET then delete ; * modify data ; AGE_INTERVIEW=AGE_INTERVIEW*12 ; run ; /* data summary */ proc means data=alcohol ; run ; proc univariate data=alcohol ; run ; proc freq data=alcohol ; tables SEX ; tables ETHNICITY ; run ; Copyrigt 2017, Joanna Szyda

25 PROGRAM EDYCJA DANYCH /* JS read data on alcohol dependence */ komentarz data ALCOHOL ; nazwa zbioru danych infile 'c:/gaw.txt' delimiter='09'x firstobs=2 ; ścieżka do pliku, struktura danych input FAMID IID FID MID SEX $ AGE_INTERVIEW ETHNICITY ALCDEPEND AGE_ONSET MAXDRINK MAXCIGAR ; nazwy zmiennych * define missing codes ; komentarz if FAMID eq 0 then delete ; usuwanie brakujących danych if IID eq 0 then delete ; if SEX ne 'F' or SEX ne 'M' then SEX=. ; kod brakujących danych if AGE_INTERVIEW gt AGE_ONSET then delete ; sprawdzanie poprawności * modify data ; AGE_INTERVIEW=AGE_INTERVIEW*12 ; run ; modyfikacja zmiennych Copyrigt 2017, Joanna Szyda

26 PROGRAM EDYCJA DANYCH PROCEDURY PODSUMOWANIA DANYCH /* data summary */ proc means data=alcohol ; run ; proc univariate data=alcohol ; run ; proc freq data=alcohol ; tables SEX ; tables ETHNICITY ; run ; Copyrigt 2017, Joanna Szyda

27 LITERATURA - PROGRAMY Copyright 2017 Joanna Szyda

28 1. Opis zbioru danych 2. SAS praca z programem 3. Wprowadzanie i edycja danych