PAKIETY STATYSTYCZNE

Podobne dokumenty
PAKIETY STATYSTYCZNE

PAKIETY STATYSTYCZNE

PAKIETY STATYSTYCZNE 5. SAS wprowadzenie - środowisko Windows

BIOMETRIA 3. Wprowadzenie do pakietu SAS

PAKIETY STATYSTYCZNE

Informatyka w selekcji - Wykªad 4

PAKIETY STATYSTYCZNE

Oprogramowanie dla GWAS

WSTĘP Oprogramowanie dla GWAS

INFORMATYKA W SELEKCJI

PAKIETY STATYSTYCZNE JOANNA SZYDA TOMASZ SUCHOCKI

SAS 4GL Podsumowanie.

INFORMATYKA W SELEKCJI

Wprowadzenie do SAS. Jak zacząć? Enhanced Editor (1) Uruchamianie programu. Ćwiczenie 3. Definiowanie bibliotek

SAS Podstawowe informacje przed ćwiczeniem 1

Wprowadzenie do Systemu SAS i programowania w SAS 4GL

Wprowadzenie do programowania w SAS-ie oraz estymacji rozkładów

1 Obliczenia na danych

Przetwarzanie danych. Biblioteka. Presentation title. Biblioteka:

Wprowadzenie do Systemu SAS

SAS Podstawowe informacje przed ćwiczeniem 2

Tytuł: PRZETWARZANIE DANYCH W SAS Autor: Wioletta Grzenda, Aneta Ptak-Chmielewska, Karol Przanowski, Urszula Zwierz. Wstęp

ZESTAW 1 SAS 4GL. Język stworzony na potrzeby przetwarzania dużych zbiorów danych. Składają się nań:

METODY STATYSTYCZNE W BIOLOGII

Bash - wprowadzenie. Bash - wprowadzenie 1/39

Wprowadzenie do Systemu SAS

Wykład. Wprowadzenie do systemu SAS (import i transformacje danych)

Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2

OBLICZENIA NA DANYCH

SAS 4GL ODS, przykładowe procedury.

Sas 3 przygotowanie do laboratorium

Laboratorium 10 Temat: Zaawansowane jednostki testowe. Operacje na plikach. Funkcje.

ZALETY NOWSZYCH WERSJI I KIERUNKI ROZWOJU SPDS-A SŁAWOMIR BOKINIEC

SYSTEMY INFORMATYCZNE WSPOMAGAJĄCE HODOWLĘ

Laboratorium Projektowania Systemów VLSI-ASIC Katedra Elektroniki Akademia Górniczo-Hutnicza

SAS Hash Tables w pigułce

Ćwiczenia 2 IBM DB2 Data Studio

ANALIZA DANYCH W STATA 8.0

SAS. Wprowadzenie do Systemu I Języka 4GL. Seweryn Kowalski /9/2006 1

Bazy Danych i Usługi Sieciowe

Krótka instrukcja opracowania danych w programie SciDAVis v. 1-D013-win

Integracja z systemem Nagios

Bazy danych i usługi sieciowe

SAS Macro Language w pigułce

Serwer SAMBA UDOSTĘPNIANIE UDZIAŁÓW SIECIOWYCH PIOTR KANIA

STROJENIE PRZETWARZAŃ SAS

ponad pracowników ponad pracowników ponad pracowników ponad pracowników

Wykład 3 Filtracja i modyfikacja pakietów za pomocą iptables.

Analiza danych pochodzących z sekwencjonowania nowej generacji - przyrównanie do genomu referencyjnego. - część I -

Zaawansowane aplikacje internetowe laboratorium REST

Wprowadzenie do pakietu STATA

Microsoft Visual SourceSafe uproszczona instrukcja użytkowania

Puk, puk! Kto tam? Eeeee... Spadaj!

Wstęp do informatyki. stęp do informatyki Polecenia (cz.2)

Metody Przetwarzania Danych Meteorologicznych Ćwiczenia 14

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA

Algorytmy i struktury danych. Wykład 6 Tablice rozproszone cz. 2

Definicje wyższego poziomu

i pakietu programowego PALASM 4

Ćwiczenia laboratoryjne nr 11 Bazy danych i SQL.

L.p Nazwa przedmiotu Kod przedmiotu Osoba(y) prowadząca(e) WDP PDP WIR DAW BDZ

ADNOTACJE WARIANTÓW GENETYCZNYCH

Zadanie 1. Analiza Analiza rozkładu

SQL SERVER 2016 IN MEMORY

W tej części zajmiemy się ćwiczeniami dotyczącymi modyfikacji rekordów.

Projektowanie systemów baz danych

INSTALACJA I KONFIGURACJA SERWERA PHP.

Stosowanie indeksów ma swoje korzyści, ale bywa również kosztowne.

GRAFICZNA ANALIZA PROGRAMÓW SAS GRAPHICAL ANALYSIS OF SAS PROGRAMS. 1. Wstęp. STUDIA INFORMATICA 2010 Volume 31 Number 3 (91)

iptables/netfilter co to takiego?

ANALIZA DANYCH W STATA 8.0

PLAN STUDIÓW STACJONARNYCH I NIESTACJONARNYCH WIECZOROWYCH II STOPNIA (od roku akademickiego 2015/2016)

Podstawowe techniki optymalizacji pracy z danymi zewnętrznymi na przykładzie współpracy SAS z bazą Oracle

Średni. Mały. Zakres Dół Środek Góra

TTIC 31210: Advanced Natural Language Processing. Kevin Gimpel Spring Lecture 8: Structured PredicCon 2

TTIC 31210: Advanced Natural Language Processing. Kevin Gimpel Spring Lecture 9: Inference in Structured Prediction

INSTRUKCJA DO LABORATORIUM

Pobieranie argumentów wiersza polecenia

Advanced Tax File Edit

Zadanie 1. Plik Nowy Kod. lub naciskając ikonę Nowy kod (jak na rysunku) Tworzymy bibliotekę o nazwie lab wpisując instrukcję

Wykład 6. Drzewa poszukiwań binarnych (BST)

1. Połączenie z bazą danych. W wybranym edytorze tworzymy plik sqltest.py i umieszczamy w nim poniższy kod. #!/usr/bin/python3 import sqlite3

BASH - LINIA POLECEŃ. Bioinformatyka 2018/2019

PRACOWNIA INFORMATYCZNA BASH - PODSTAWOWE INFORMACJE

DB2 XML w relacyjnych bazach danych wstęp do wprowadzenia. Kuba Pochrybniak

STATYSTYKA MATEMATYCZNA

Systemy Operacyjne. Część II Zarządzanie/Administracja Systemem. 5: Skrypty. autor: mgr inż. Andrzej Woźniak

METODY STATYSTYCZNE W BIOLOGII

BIOINFORMATYKA. Copyright 2011, Joanna Szyda

1 Przygotował: mgr inż. Maciej Lasota

Jak zatrudnić słonie do replikacji baz PostgreSQL

METODY STATYSTYCZNE W BIOLOGII

- wszystkie elementy - wszystkie elementy

NS-2. Krzysztof Rusek. 26 kwietnia 2010

Elementy języka Scheme

Oracle PL/SQL. Paweł Rajba.

DBPLUS Data Replicator Subtitle dla Microsoft SQL Server. dbplus.tech

BASH - WPROWADZENIE Bioinformatyka 4

Środowisko programisty. Środowisko programisty 1/35

Transkrypt:

1. Wykład wstępny PAKIETY STATYSTYCZNE 2. SAS, wprowadzenie - środowisko Windows, Linux 3. SAS, elementy analizy danych edycja danych 4. SAS, elementy analizy danych regresja liniowa, regresja nieliniowa 5. SAS, elementy analizy danych analiza wariancji 6. SAS, elementy analizy danych symulacje Monte Carlo 7. SAS, elementy wizualizacji danych 8. SAS, tworzenie zaawansowanych programów, manipulowanie dużymi zbiorami danych 9. R, wprowadzenie 10. R, elementy analizy danych edycja danych 11. R, elementy analizy danych regresja liniowa, regresja nieliniowa, analiza wariancji 12. R, elementy analizy danych symulacje Monte Carlo 13. R, elementy wizualizacji danych dystrybucja standardowa 14. R, tworzenie prostych programów w pakiecie R 15. Podsumowanie materiału

WSTĘP 1. Praca z programem w linii komend (Linux OS) 2. Input danych różne formaty 3. Output danych różne formaty 4. Edycja daych

SAS W LINII KOMEND

PRACA W LINII KOMEND /* 15.11.2016 JS read data on alcohol dependence */ options obs=max ls=64 sortsize=max sortname=sort sortpgm=host ; /* obs=max use all records ls=64 use shorter lines in log and lst outputs sortsize=max use maximum available memory of sorting */ %let INPFILE="/home/szyda/PAKIETY/gaw.txt" ; data ALCOHOL ; infile &INPFILE delimiter='09'x firstobs=2 ; input FAMID IID FID MID SEX $ AGE_INTERVIEW ETHNICITY ALCDEPEND AGE_ONSET MAXDRINK MAXCIGAR ; * define missing codes ; if FAMID eq 0 then delete ; if IID eq 0 then delete ; if SEX ne 'F' and SEX ne 'M' then SEX=. ; if AGE_INTERVIEW lt AGE_ONSET then delete ; * modify data ; AGE_INTERVIEW=AGE_INTERVIEW*12 ; if MAXDRINK=-9 then MAXDRINK=. ; /* data summary */ proc means data=alcohol ; proc univariate data=alcohol ; proc freq data=alcohol ; tables SEX ; tables ETHNICITY / chisq ; output out=chieth n nmiss pchi ; title "---------------output of thr CHI2 test for tables eth---------------" ; proc print data=chieth ; proc freq data=alcohol ; tables SEX*ETHNICITY/ chisq ; output out=chisexeth n nmiss pchi ; title "-------------output of thr CHI2 test for tables eth*sex-------------" ; proc print data=chisexeth ;

INPUT

INPUT data DANE_1 ; length SEQUENCE $101. ; length TMP2 $1. ; informat TMP1 10.5 ; infile "C:\ASIA\CLASS\pakietystatystyczne\lectures\dane.1" ; input SEQUENCE TMP1 TMP2 ; put SEQUENCE TMP1 TMP2 ;

INPUT %let NDATA=1 ; data DANE_1 ; length SEQUENCE $101. ; length TMP2 $1. ; informat TMP1 10.5 ; infile "C:\ASIA\CLASS\pakietystatystyczne\lectures\dane.&NDATA" ; input SEQUENCE TMP1 TMP2 ; put SEQUENCE TMP1 TMP2 ;

INPUT data DANE_2 ; length SEQUENCE $101. ; length TMP2 $1. ; informat TMP1 10.5 ; informat NUM1-NUM4 10.0 ; infile "C:\ASIA\CLASS\pakietystatystyczne\lectures\dane.2" ; input SEQUENCE TMP1 TMP2 NUM1-NUM4 slv $ ; put SEQUENCE TMP1 TMP2 NUM1-NUM4 slv $ ;

INPUT data DANE_2 ; length SEQUENCE $101. ; length TMP2 $1. ; infile "C:\ASIA\CLASS\pakietystatystyczne\lectures\dane.2" ; input @1 SEQUENCE @99 NAME $3. @103 TMP1 10.5 ; put SEQUENCE NAME TMP1 ;

INPUT data DANE_2s ; length SEQUENCE1 SEQUENCE2 $101. ; length TMP2 $1. ; infile "C:\ASIA\CLASS\pakietystatystyczne\lectures\dane.2" ; input @1 SEQUENCE1 TMP1 TMP2 NUM1-NUM4 slv $ @ ; input @1 SEQUENCE2 ; proc print data=dane_3 ;

OUTPUT

OUTPUT data _null_ ; set DANE_1 ; informat TMP1 10.5 ; file "C:\ASIA\CLASS\pakietystatystyczne\lectures\dane.out" ; put TMP1 ;

OUTPUT ata _null_ ; set DANE_1 ; informat TMP1 10.5 ; file "C:\ASIA\CLASS\pakietystatystyczne\lectures\dane.out" mod ; put TMP1 ; data _null_ ; set DANE_1 ; informat TMP1 10.5 ; file "C:\ASIA\CLASS\pakietystatystyczne\lectures\dane.out" ; put TMP1 ;

EDYCJA

OUTPUT data ALL ; set D1 D2 ;

OUTPUT Data D1 ; input X $ Y ; datalines; a 1 b 2 c 3 d 4 e 5 Data D2 ; input X $ Y ; datalines; a 10 b 20 d 30 f 40 g 50 proc sort data=d1 nodupkey ; by X ; proc sort data=d2 nodupkey ; by X ; data ALL ; merge D1 (in=a) D2 (in=b) ; if a and b ; by X ;

1. Praca z programem w linii komend (Linux OS) 2. Input danych różne formaty 3. Output danych różne formaty 4. Edycja daych