PAKIETY STATYSTYCZNE

Podobne dokumenty
PAKIETY STATYSTYCZNE 5. SAS wprowadzenie - środowisko Windows

BIOMETRIA 3. Wprowadzenie do pakietu SAS

PAKIETY STATYSTYCZNE

PAKIETY STATYSTYCZNE

PAKIETY STATYSTYCZNE

INFORMATYKA W SELEKCJI

Informatyka w selekcji - Wykªad 4

PAKIETY STATYSTYCZNE

PAKIETY STATYSTYCZNE JOANNA SZYDA TOMASZ SUCHOCKI

Oprogramowanie dla GWAS

INFORMATYKA W SELEKCJI

METODY STATYSTYCZNE W BIOLOGII

WSTĘP Oprogramowanie dla GWAS

STATYSTYKA MATEMATYCZNA

Wprowadzenie do SAS. Jak zacząć? Enhanced Editor (1) Uruchamianie programu. Ćwiczenie 3. Definiowanie bibliotek

SYSTEMY INFORMATYCZNE WSPOMAGAJĄCE HODOWLĘ

SAS Podstawowe informacje przed ćwiczeniem 1

KOMPLEKSOWA OFERTA SZKOLEŃ MS EXCEL W FINANSACH. z konsultacjami

Wykład. Wprowadzenie do systemu SAS (import i transformacje danych)

Instrukcja korzystania ze skryptu kroswalidacja.py

METODY STATYSTYCZNE W BIOLOGII

METODY STATYSTYCZNE W BIOLOGII

Wprowadzenie do SAS. Wprowadzenie. Historia SAS. Struktura SAS 8. Interfejs: SAS Explorer. Interfejs. Część I: Łagodny wstęp do SAS Rafał Latkowski

ZMODYFIKOWANY Szczegółowy opis przedmiotu zamówienia

Instrukcja importu deklaracji pacjentów. do dreryka

DECLARE VARIABLE zmienna1 typ danych; BEGIN

Profesjonalne szkolenia z MICROSOFT EXCEL DLA FIRM. w Warszawie i w całej Polsce

R dla każdego : zaawansowane analizy i grafika statystyczna / Jared P. Lander. Warszawa, Spis treści

Program szkolenia EXCEL ZAAWANSOWANY Z WPROWADZENIEM DO VBA.

ECDL Advanced Moduł AM4 Arkusze kalkulacyjne Syllabus, wersja 2.0

Ankieta. Informacje o uczestniku. Imię i nazwisko: Stanowisko : Warsztat Innowacyjne metody dydaktyczne (np. learning by doing, design thinking)

Tytuł: PRZETWARZANIE DANYCH W SAS Autor: Wioletta Grzenda, Aneta Ptak-Chmielewska, Karol Przanowski, Urszula Zwierz. Wstęp

STATYSTYKA MATEMATYCZNA

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

TP1 - TABELE PRZESTAWNE od A do Z

TREŚCI NAUCZANIA z przedmiotu pracowania ekonomiczno - informatyczna na podstawie programu nr 341[02]/MEN/ klasa 3 TE

Struktury systemów operacyjnych

Przewodnik użytkownika (instrukcja) AutoMagicTest

S YSTEM O PERACYJNY L INUX W PARCOWNI

ECDL/ICDL Zaawansowane arkusze kalkulacyjne Moduł A2 Sylabus, wersja 2.0

PROGRAM SZKOLENIA. Excel Średniozaawansowany z wprowadzeniem do tabel przestawnych i makr.

System operacyjny Linux

Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2

ANALIZA JPK VAT. INSTRUKCJA OBSŁUGI Przy pierwszym uruchomieniu programu należy wpisać numer licencji.

SIGMA KWADRAT. Wykorzystanie programu MS Excel do opracowań statystycznych CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

ZESTAW 1 SAS 4GL. Język stworzony na potrzeby przetwarzania dużych zbiorów danych. Składają się nań:

ABC 2002/XP PL EXCEL. Autor: Edward C. Willett, Steve Cummings. Rozdział 1. Podstawy pracy z programem (9) Uruchamianie programu (9)

author: Andrzej Dudek

Wykorzystanie programu MS Excel do opracowań statystycznych

BASH - LINIA POLECEŃ. Bioinformatyka 2018/2019

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

BIOINFORMATYKA. Copyright 2011, Joanna Szyda

E-Sprawozdania. Copyright 2019 by AUDITPLUS Sp. z o.o.

Rozdział ten zawiera informacje o sposobie konfiguracji i działania Modułu OPC.

Krótkie wprowadzenie do ModelSim i Quartus2

BASH - WPROWADZENIE Bioinformatyka 4

1 Obliczenia na danych

biegle i poprawnie posługuje się terminologią informatyczną,

1 Przygotował: mgr inż. Maciej Lasota

COMARCH IT AKADEMIA. Programista VBA w Microsoft Excel (microbootcamp)

INSTALACJA I KONFIGURACJA SERWERA PHP.

1. Symulacje komputerowe Idea symulacji Przykład. 2. Metody próbkowania Jackknife Bootstrap. 3. Łańcuchy Markova. 4. Próbkowanie Gibbsa

OpenOfficePL. Zestaw szablonów magazynowych. Instrukcja obsługi

KOMPLEKSOWA OFERTA SZKOLEŃ MS EXCEL. z konsultacjami

Uogólniony model liniowy

Wprowadzenie do projektu QualitySpy

ROZSZERZANIE MOŻLIWOŚCI...

System operacyjny Linux

Analiza regresji - weryfikacja założeń

Informatyka I stopień (I stopień / II stopień) ogólno akademicki (ogólno akademicki / praktyczny) podstawowy (podstawowy / kierunkowy / inny HES)

Opcje Fiery1.3 pomoc (serwer)

Technologia znaku wodnego dla plików dźwiękowych: Legimi Audio Watermark

L.p Nazwa przedmiotu Kod przedmiotu Osoba(y) prowadząca(e) WDP PDP WIR DAW BDZ

PROGRAM SZKOLENIA. Excel w Analizach danych.

Instalacja programu Warsztat 3 w sieci

- wszystkie elementy - wszystkie elementy

Zdalny dostęp do Statystycznych Baz Danych a bezpieczeństwo danych jednostkowych.

Mikroekonometria 6. Mikołaj Czajkowski Wiktor Budziński

ELF. Instrukcja użytkownika. (System wspomagający wypełnianie wniosków elektronicznych)

Joyce Cox Joan Lambert. Microsoft Access Krok po kroku. Przekład: Jakub Niedźwiedź

Podstawy statystyki matematycznej w programie R

SUBIEKT GT IMPORT XLS Dokumenty

Budowa aplikacji wielowarstwowych. Zastosowanie technologii Ajax

QualitySpy moduł reports

Elementy metod numerycznych - zajęcia 9

SYSTEMY INFORMATYCZNE WSPOMAGAJĄCE HODOWLĘ MAGDALENA FRĄSZCZAK

Jak efektywnie wykrywać podatności bezpieczeństwa w aplikacjach? OWASP The OWASP Foundation

Straszyński Kołodziejczyk, Paweł Straszyński. Wszelkie prawa zastrzeżone. FoamPro. Instrukcja obsługi

ANALITYK DANYCH Kto to jest analityk danych? Na czym polega praca analityka danych?

Modelowanie danych hodowlanych

Ministerstwo Finansów Departament Informatyzacji Usług Publicznych

ANALIZA DANYCH W STATA 8.0

Opis zmian w wersji Oprogramowania do Obsługi SR/FA/SW/ST/DM

Program szkolenia EXCEL ŚREDNIOZAAWANSOWANY.

Zadanie 1. Plik Nowy Kod. lub naciskając ikonę Nowy kod (jak na rysunku) Tworzymy bibliotekę o nazwie lab wpisując instrukcję

Transkrypt:

1. Wykład wstępny PAKIETY STATYSTYCZNE 2. SAS, wprowadzenie - środowisko Windows, Linux 3. SAS, elementy analizy danych edycja danych 4. SAS, elementy analizy danych regresja liniowa, regresja nieliniowa 5. SAS, elementy analizy danych analiza wariancji 6. SAS, elementy analizy danych symulacje Monte Carlo 7. SAS, elementy wizualizacji danych 8. SAS, tworzenie zaawansowanych programów, manipulowanie dużymi zbiorami danych 9. R, wprowadzenie 10. R, elementy analizy danych edycja danych 11. R, elementy analizy danych regresja liniowa, regresja nieliniowa, analiza wariancji 12. R, elementy analizy danych symulacje Monte Carlo 13. R, elementy wizualizacji danych dystrybucja standardowa 14. R, tworzenie prostych programów w pakiecie R 15. Podsumowanie materiału

WSTĘP 1. Opis zbioru danych 2. SAS praca z programem 3. Wprowadzanie i edycja danych Copyright 2018 Joanna Szyda

ZBIÓR DANYCH Copyright 2017 Joanna Szyda

ZBIÓR DANYCH Copyright 2017 Joanna Szyda

GAW Copyright 2017 Joanna Szyda

ZBIÓR DANYCH family ID individual ID ID of Father {0ID of Mother { sex Age (at interethnicity {0=alcohol dep Age of OnseMaximum n(# packs per day for 1 y 10084 10000089 10000526 10000031 F 30 6 5 16 24 17 10084 10000758 10000526 10000031 F 31 6 5 30 12 16 10084 10001094 0 0 M 0 0 0 0-9 -9 10084 10000133 10001094 10000758 M 18 6 3 0 18 0.45 10084 10001039 10000526 10000031 M 28 6 5 16 40 0 10084 10000194 10000526 10000031 F 24 6 3 0 20 8 10084 10000526 0 0 M 60 6 5 38 24 42 10084 10000031 0 0 F 60 6 3 0 7 58.5 10130 10001565 10001436 10001364 F 38 6 5 18 75 30 10130 10000919 10001436 10001364 M 40 6 5 33 48 0 10130 10000299 10001436 10001364 F 32 6 5 17 36 32 10130 10000489 10001436 10001364 M 27 6 3 0 12 0 10130 10001436 0 0 M 62 6 3 0 10 42 10130 10001364 0 0 F 61 6 1 0 5 0.125 10038 10000572 10001250 10001511 F 28 6 5 15 48 12 10038 10000272 10001250 10001511 M 26 6 3 0 10 0 10038 10001295 10001250 10001511 F 25 6 1 0 3 0 10038 10000598 10001250 10001511 M 22 6 5 15 71 12 10038 10001250 0 0 M 68 6 3 0 10 0 10038 10001511 0 0 F 52 6 3 0 14 31 10006 10000264 10000130 10000650 M 34 6 5 16 26 0 10006 10000025 10000130 10000650 M 35 6 5 18 36 13 10006 10000707 10000130 10000650 M 26 6 5 20 15 6 10006 10001405 10000130 10000650 F 28 6 5 23 10 0 10006 10000130 0 0 M 58 6 5 30 24-9 10006 10000650 0 0 F 59 6 1 0 3 0 10027 10000398 0 0 M 58 6 5 24 42 41 N=1 615 Copyright 2017 Joanna Szyda

SAS FUNKCJE edycja analiza różnorodne metody statystyczne wizualizacja wykonywanie wykresów bazy danych... PROGRAM KOMERCYJNY roczna licencja ZALETY stale wzbogacany możliwość analizy bardzo dużych zbiorów danych bioinformatyka Copyright 20117 Joanna Szyda

SAS STRUKTURA PAKIETU zbiór "procedur" wykonywanie konkretnych analiz / wykresów modyfikacja procedur opcje tworzenie własnych programów SAS dla WINDOWS interfejs graficzny 3 okna SAS dla LINUX interfejs graficzny + linia komend Copyright 20117 Joanna Szyda

PRACA Z PROGRAMEM Copyright 2017 Joanna Szyda

PRACA Z PROGRAMEM WYKONANIE BRAK BŁĘDÓW PROGRAM EDITOR INSTRUKCJE LOG BŁĘDY OUTPUT INTERPRETACJA Copyright 2017, Joanna Szyda

PROGRAM EDITOR

OKNO PROGRAM EDITOR INSTRUKCJE TWORZENIE INSTRUKCJI, KTÓRE ZOSTANĄ WYKONANE PRZEZ PAKIET SAS INSTRUKCJE MUSZĄ ZAWIERAĆ: specyfikację pliku zawierającego dane format danych w pliku specyfikację metod statystycznych wpisanie instrukcji bezpośrednio w oknie skopiowanie instrukcji z zewnętrznego pliku Copyrigt 2017, Joanna Szyda

OKNO PROGRAM EDITOR INSTRUKCJE WPISANIE INSTRUKCJI Copyrigt 2017, Joanna Szyda

OKNO PROGRAM EDITOR INSTRUKCJE WPROWADZENIE INSTRUKCJI Z PLIKU Copyrigt 2017, Joanna Szyda

OKNO PROGRAM EDITOR INSTRUKCJE WYKONANIE INSTRUKCJI Copyrigt 2017 Joanna Szyda

LOG

OKNO LOG KOMUNIKATY W OKNIE LOG ZAWARTE SĄ INFORMACJE O PRZEBIEGU DZIAŁANIA PROGRAMU, m. in.: nazwa pliku zawierającego dane liczba analizowanych osobników liczba osobników z brakującymi danymi oraz informacje o ewentualnych błędach komunikaty w oknie LOG należy przeanalizować po wykonaniu instrukcji z okna PROGRAM EDITOR, a przed (!!! ) interpretacją wyników Copyrigt 2017, Joanna Szyda

OKNO LOG KOMUNIKATY BRAK BŁĘDU BŁĄD Copyrigt 2017, Joanna Szyda

OUTPUT

OKNO OUTPUT WYNIKI Copyrigt 2017, Joanna Szyda

STRUKTURA PROGRAMU

STRUKTURA PROGRAMU ZBIÓR DANYCH definicja zbioru danych wczytanie danych do programu OBLICZENIA edycja wybór procedur statystycznych wybór procedur graficznych + wybór opcji Copyrigt 2017 Joanna Szyda

ZBIÓR DANYCH family ID individual ID ID of Father {0ID of Mother { sex Age (at interethnicity {0=alcohol dep Age of OnseMaximum n(# packs per day for 1 y 10084 10000089 10000526 10000031 F 30 6 5 16 24 17 10084 10000758 10000526 10000031 F 31 6 5 30 12 16 10084 10001094 0 0 M 0 0 0 0-9 -9 10084 10000133 10001094 10000758 M 18 6 3 0 18 0.45 10084 10001039 10000526 10000031 M 28 6 5 16 40 0 10084 10000194 10000526 10000031 F 24 6 3 0 20 8 10084 10000526 0 0 M 60 6 5 38 24 42 10084 10000031 0 0 F 60 6 3 0 7 58.5 10130 10001565 10001436 10001364 F 38 6 5 18 75 30 10130 10000919 10001436 10001364 M 40 6 5 33 48 0 10130 10000299 10001436 10001364 F 32 6 5 17 36 32 10130 10000489 10001436 10001364 M 27 6 3 0 12 0 10130 10001436 0 0 M 62 6 3 0 10 42 10130 10001364 0 0 F 61 6 1 0 5 0.125 10038 10000572 10001250 10001511 F 28 6 5 15 48 12 10038 10000272 10001250 10001511 M 26 6 3 0 10 0 10038 10001295 10001250 10001511 F 25 6 1 0 3 0 10038 10000598 10001250 10001511 M 22 6 5 15 71 12 10038 10001250 0 0 M 68 6 3 0 10 0 10038 10001511 0 0 F 52 6 3 0 14 31 10006 10000264 10000130 10000650 M 34 6 5 16 26 0 10006 10000025 10000130 10000650 M 35 6 5 18 36 13 10006 10000707 10000130 10000650 M 26 6 5 20 15 6 10006 10001405 10000130 10000650 F 28 6 5 23 10 0 10006 10000130 0 0 M 58 6 5 30 24-9 10006 10000650 0 0 F 59 6 1 0 3 0 10027 10000398 0 0 M 58 6 5 24 42 41 N=1 615 Copyrigt 2011, Joanna Szyda

PROGRAM EDYCJA DANYCH /* 15.03.2017 JS read data on alcohol dependence */ data ALCOHOL ; infile 'c:/asia/class/pakietystatystycznebioinf/lectures/gaw.txt' delimiter='09'x firstobs=2 ; input FAMID IID FID MID SEX $ AGE_INTERVIEW ETHNICITY ALCDEPEND AGE_ONSET MAXDRINK MAXCIGAR ; * define missing codes ; if FAMID eq 0 then delete ; if IID eq 0 then delete ; if SEX ne 'F' or SEX ne 'M' then SEX=. ; if AGE_INTERVIEW gt AGE_ONSET then delete ; * modify data ; AGE_INTERVIEW=AGE_INTERVIEW*12 ; run ; /* data summary */ proc means data=alcohol ; run ; proc univariate data=alcohol ; run ; proc freq data=alcohol ; tables SEX ; tables ETHNICITY ; run ; Copyrigt 2017, Joanna Szyda

PROGRAM EDYCJA DANYCH /* 15.03.2011 JS read data on alcohol dependence */ komentarz data ALCOHOL ; nazwa zbioru danych infile 'c:/gaw.txt' delimiter='09'x firstobs=2 ; ścieżka do pliku, struktura danych input FAMID IID FID MID SEX $ AGE_INTERVIEW ETHNICITY ALCDEPEND AGE_ONSET MAXDRINK MAXCIGAR ; nazwy zmiennych * define missing codes ; komentarz if FAMID eq 0 then delete ; usuwanie brakujących danych if IID eq 0 then delete ; if SEX ne 'F' or SEX ne 'M' then SEX=. ; kod brakujących danych if AGE_INTERVIEW gt AGE_ONSET then delete ; sprawdzanie poprawności * modify data ; AGE_INTERVIEW=AGE_INTERVIEW*12 ; run ; modyfikacja zmiennych Copyrigt 2017, Joanna Szyda

PROGRAM EDYCJA DANYCH PROCEDURY PODSUMOWANIA DANYCH /* data summary */ proc means data=alcohol ; run ; proc univariate data=alcohol ; run ; proc freq data=alcohol ; tables SEX ; tables ETHNICITY ; run ; Copyrigt 2017, Joanna Szyda

LITERATURA - PROGRAMY http://support.sas.com/documentation/94/ Copyright 2017 Joanna Szyda

1. Opis zbioru danych 2. SAS praca z programem 3. Wprowadzanie i edycja danych