1 Obliczenia na danych

Podobne dokumenty
OBLICZENIA NA DANYCH

SAS Podstawowe informacje przed ćwiczeniem 1

SAS 4GL Podsumowanie.

ZAJĘCIA 2. Przed rozpoczęciem zajęć należy wykonać instrukcje z poprzednich laboratoriów bądź z pliku zaj2_prep.sas. FILTROWANIE WIERSZY

ZESTAW 1 SAS 4GL. Język stworzony na potrzeby przetwarzania dużych zbiorów danych. Składają się nań:

Przetwarzanie danych. Biblioteka. Presentation title. Biblioteka:

Wykład. Wprowadzenie do systemu SAS (import i transformacje danych)

PAKIETY STATYSTYCZNE

Tytuł: PRZETWARZANIE DANYCH W SAS Autor: Wioletta Grzenda, Aneta Ptak-Chmielewska, Karol Przanowski, Urszula Zwierz. Wstęp

PAKIETY STATYSTYCZNE

SAS 4GL ODS, przykładowe procedury.

Stosowanie indeksów ma swoje korzyści, ale bywa również kosztowne.

Informatyka w selekcji - Wykªad 4

Zadanie 1. Plik Nowy Kod. lub naciskając ikonę Nowy kod (jak na rysunku) Tworzymy bibliotekę o nazwie lab wpisując instrukcję

140, , ,000 80, ROK

Wprowadzenie do Systemu SAS i programowania w SAS 4GL

Wprowadzenie do programowania w SAS-ie oraz estymacji rozkładów

Wprowadzenie do SAS. Jak zacząć? Enhanced Editor (1) Uruchamianie programu. Ćwiczenie 3. Definiowanie bibliotek

Python. Wprowadzenie. Jolanta Bachan

Autor: Joanna Karwowska

SAS Macro Language w pigułce

Powtórka algorytmów. Wprowadzenie do języka Java.

PAKIETY STATYSTYCZNE

PAKIETY STATYSTYCZNE

Programowanie strukturalne. Opis ogólny programu w Turbo Pascalu

Podstawy JavaScript ćwiczenia

SAS. Wprowadzenie do Systemu I Języka 4GL. Seweryn Kowalski /9/2006 1

Typy danych, cd. Łańcuchy znaków

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Podstawy i języki programowania

PL/SQL. Funkcje wbudowane

L6.1 Systemy liczenia stosowane w informatyce

SQL - Structured Query Language -strukturalny język zapytań SQL SQL SQL SQL

LibreOffice Calc VBA

Autor: Dariusz Piwczyński 1 Ćwiczenie: Doświadczenia 2-grupowe w układzie niezależnym i zależnym.

Administracja i programowanie pod Microsoft SQL Server 2000

Autor: Joanna Karwowska

ORACLE (Wykład 1) aragorn.pb.bialystok.pl/~aonisko. Typy rozproszonych baz danych. Systemy klient-serwer. Klient-serwer: Przykład

Wykład 5. SQL praca z tabelami 2

Podstawy programowania. Wykład 6 Złożone typy danych: struktury, unie. Krzysztof Banaś Podstawy programowania 1

SCHEMAT OCENIANIA poziom rozszerzony arkusz II

SAS Hash Tables w pigułce

- język zapytań służący do zapisywania wyrażeń relacji, modyfikacji relacji, tworzenia relacji

1 P roste e t ypy p d a d n a ych c - c ąg ą g d a d l a szy 2 T y T py p z ł z o ł żo ż ne e d a d n a ych c : T BLICE

Zadanie 1. Analiza Analiza rozkładu

Informatyka I. Typy danych. Operacje arytmetyczne. Konwersje typów. Zmienne. Wczytywanie danych z klawiatury. dr hab. inż. Andrzej Czerepicki

Techniki multimedialne

Rozdział 8. Regresja. Definiowanie modelu

Instrukcja do programu BASIC PR-02

EGZAMIN MATURALNY 2011 INFORMATYKA

Laboratorium nr 5. Temat: Funkcje agregujące, klauzule GROUP BY, HAVING

INFORMATYKA Studia Niestacjonarne Elektrotechnika

Plan. Wyświetlanie n początkowych wartości (TOP n) Użycie funkcji agregujących. Grupowanie danych - klauzula GROUP BY

Ćwiczenia 2 IBM DB2 Data Studio

Bloki anonimowe w PL/SQL

INFORMATYKA W SELEKCJI

Instalacja Pakietu R

Tablice mgr Tomasz Xięski, Instytut Informatyki, Uniwersytet Śląski Katowice, 2011

Wprowadzenie do Pakietu R dla kierunku Zootechnika. Dr Magda Mielczarek Katedra Genetyki Uniwersytet Przyrodniczy we Wrocławiu

ANALIZA DANYCH W STATA 8.0

1.1. Pozycyjne systemy liczbowe

Programowanie obiektowe

Funkcje i instrukcje języka JavaScript

Programowanie, algorytmy i struktury danych

Pakiety Matematyczne - R Zestaw 1.

Powtórka algorytmów. Wprowadzenie do języka Java.

Pozyskiwanie wiedzy z danych

Wstęp do informatyki- wykład 1

CYFROWE PRZETWARZANIE SYGNAŁÓW

Przykład powyżej pokazuje, że w zapytaniu można umieszczać funkcje zarówno zdefiniowane w ramach środowiska, jak również własne.

JAVAScript w dokumentach HTML (1) JavaScript jest to interpretowany, zorientowany obiektowo, skryptowy język programowania.

ZMODYFIKOWANY Szczegółowy opis przedmiotu zamówienia

Sas 3 przygotowanie do laboratorium

SAS Podstawowe informacje przed ćwiczeniem 2

Zadanie 1. a) Przeprowadzono test RESET. Czy model ma poprawną formę funkcyjną? 1

SQL, LIKE, IN, CASE, EXISTS. Marcin Orchel

Opis: Instrukcja warunkowa Składnia: IF [NOT] warunek [AND [NOT] warunek] [OR [NOT] warunek].

INFORMATYKA W SELEKCJI

PAKIETY STATYSTYCZNE 5. SAS wprowadzenie - środowisko Windows

Programowanie MSQL. show databases; - pokazanie jakie bazy danych są dostępne na koncie

Bazy Danych - Instrukcja do Ćwiczenia laboratoryjnego nr 8

Jak napisać program obliczający pola powierzchni różnych figur płaskich?

Podstawowe I/O Liczby

Matematyka i statystyka matematyczna dla rolników w SGGW WYKŁAD 11 DOŚWIADCZENIE JEDNOCZYNNIKOWE W UKŁADZIE CAŁKOWICIE LOSOWYM PORÓWNANIA SZCZEGÓŁOWE

Elżbieta Kula - wprowadzenie do Turbo Pascala i algorytmiki

Kiedy i czy konieczne?

Kolokwium ze statystyki matematycznej

BIOMETRIA 3. Wprowadzenie do pakietu SAS

Język skryptowy: Laboratorium 1. Wprowadzenie do języka Python

Systemy liczenia. 333= 3*100+3*10+3*1

Metody numeryczne Laboratorium 2

a[1] a[2] a[3] a[4] a[5] a[6] a[7] a[8] a[9] a[10]

A Machine Architecture that is Really Intuitive and Easy. Dane: notacja dwójkowa, zapis w kodzie dopełnieniowym

ANALIZA JEDNOZMIENNOWA. podstawowe pojęcia

Podstawy programowania w języku Visual Basic dla Aplikacji (VBA)

Metody Metody, parametry, zwracanie wartości

1 Wprowadzenie do bloków nazwanych 1. 2 Parametry 2. 3 Procedury i funkcje 3. 4 Pakiety 6. 5 Podsumowanie Źródła 10

Wykład 05 Bazy danych

Podstawowe techniki optymalizacji pracy z danymi zewnętrznymi na przykładzie współpracy SAS z bazą Oracle

Transkrypt:

1 Obliczenia na danych 1.1 Wyrażenia w SAS 1. stałe numeryczne, czyli liczby używane w wyrażeniach SAS. Możemy je prezentować (a) w zapisie standardowym np. 5, 6.7, -2.1, (b) w notacji naukowej np. 2e5 (czyli 2 10 5 = 200000), 3.4e 2 (czyli 0.034), (c) w zapisie szesnastkowym np. 3E8x (co oznacza 8 16 0 + 14 16 1 + 3 16 2 = 1000). 2. stałe znakowe - muszą być umieszczone w apostrofach, mogą zawierać od 1 do 32767 znaków. Możemy je prezentować (a) w zapisie standardowym ( Przykładowy napis ), (b) w zapisie szesnastkowym - ciąg heksadecymalnych znaków parzystej długości (np. A=41) umieszczony w POJEDYNCZYCH apostrofach. Pomocna może być ASCIITABLE. data test; c1="jakas stala znakowa w SAS ie"; c2= 4B6F6368616D20534153 x; Ex. 1. Korzystając z heksadecymalnej prezentacji stałej znakowej utworzyć w poprzednim przykładzie zmienną c3, która dla wszystkich obserwacji przyjmuje stałą wartość, np. swoje imię. 3. stałe daty i czasu - wprowadzona data jest jest dla systemu SAS liczbą dni od 1 stycznia 1960r do dnia podanej daty. Czas jest określony jako liczba sekund liczona od północy 1.01.1960r. do podanego momentu. Data i czas sprzed 1.01.1960 traktowane są jako liczby ujemne. data test1; jakas_data="25dec97"d; /*liczba dni od 1.01.1960*/ jakis_czas="10:00"t; /*liczba sekund od polnocy*/ inny_czas="03jan2000:23:15:30"dt; /*liczba sekund od polnocy 1.01.1960*/ 1

data _null_;/* nie tworzymy nowego zbioru danych */ jakis_czas="03:00"t; PUT "od polnocy minelo " jakis_czas "sekund"; Ex. 2. Ile dni minęło: (a) od dnia Twoich narodzin? (b) od dnia rozpoczęcia II wojny światowej? Proszę zapisać te informacje w logu. 4. operatory 2

2 Funkcje dokumentacja Funkcja w SAS to wbudowany algorytm służący do wykonywania obliczeń lub przkształceń na wskazanych argumetach i zwracająca pewne wartości (numeryczne bądź znakowe). Funkcje używane są w DATA stepach, w wyrażeniach z WHERE, w języku makr, w PROC REPORT oraz w SQL u. Również pewne statystyczne procedury używają SASowych funkcji. 2.1 Funkcje daty i czasu 3

DATA test2; data_edycji=today(); rok=year(today()); miesiac=month(today()); dzien=day(today()); dmy=cat(dzien,miesiac,rok);/*konkatenacja*/ /*keep data_edycji dmy; */ RUN; data terminy; input date :date9. item :$1.; datalines; 01APR2019 A 01AUG2011 B 01SEP2019 C 05MAY2018 D 20JUL2017 E ; data dnitygodnia; set terminy; wd=weekday(date); if wd=2 then dt="poniedzialek"; if wd=1 then dt="niedziela"; if wd=3 then dt="wtorek"; if wd=4 then dt="sroda"; if wd=5 then dt="czwartek"; if wd=6 then dt="piatek"; if wd=7 then dt="sobota"; /*przy okazji formatow nauczymy sie to robic bardziej finezyjnie*/ Ex. 3. Jaki dzień tygodnia był 1. w dniu Twoich narodzin? 2. w dniu rozpoczęcia II wojny światowej? Zapisać te informacje w logu. 4

2.2 Funkcje matematyczne, statystyczne, zaokrąglające proc transpose data=sashelp.class out=klasa_stat; var weight age height; data klasa_statystyka; set klasa_stat; suma=sum(of col1-col19); srednia=mean(of col1-col19); wariancja=var (of col1-col19); odch_st=std(of col1-col19); data klasa_statystyka1; set klasa_statystyka; keep _name_ suma srednia wariancja odch_st; 5

6

Ex. 4. Korzystając z tabeli baseball w bibliotece sashelp stworzyć tabelę, w której znajdować się będą: średnia, suma, wartość najmniejsza, wartość największa oraz liczba elementów będących brakami danych dla zmiennych: nouts, nassts, nerror, Salary. Za pomocą PROC MEANS można to zrobić trochę krócej proc print data=klasa_statystyka1; proc means data=sashelp.class (keep=weight age height ) sum var mean std ; 7

2.3 Funkcje znakowe Przeanalizować przykład 8

Ex. 5. Na podstawie zbioru sashelp.baseball stworzyć zbiór, który oprócz istniejących zmiennych będzie zawierał dodatkowe dwie zmienne Imie i Nazwisko powstałe na podstawie zmiennej Name. Wziąć pod uwagę imiona/nazwiska dwuczłonowe (obserwacja 41). 3 Funkcje specjalne LAG/LAGn - wartość zmiennej numerycznej z poprzedniej (ntej) obserwacji data one; input x @@; y=lag1(x); z=lag2(x); datalines; 1 2 3 4 5 6 ; /* a special symbol @@ is used to hold a line of data in the input buffer during multiple iterations of a DATA step.*/ DIF/DIFn - różnice między obs. aktualną, a wcześniejszą data two; input X @@; Z=lag(x); D=dif(x); datalines; 1 2 6 4 7 ; 9

Ex. 6. Posortować zbiór sashelp.class po zmiennej weight, a następnie stworzyć tabelę class diff ze zmienną weightdiff zawierająca różnice wagi między kolejnymi obserwacjami. Znaleźć minimalną oraz maksymalną różnicę. 3.1 PUT i INPUT PUT konwertuje: ˆ zmienną znakową na inną zmienna znakową Anna > Anna ˆ zmienną numeryczną na zmienną znakową o wartości numerycznej 20 > 20 data konwersja; set sashelp.air; nd=put(date,mmddyy10.); /*put(zm_num,format);*/ INPUT konwertuje: ˆ zmienną znakową o wartości numerycznej na zmienną numeryczną 20 > 20 ˆ zmienną znakową o wartości numerycznej na zmienną numeryczną (lub znakową) o podanym informacie 20, 678 > 20678, 20 > 20 data konwersja1; set konwersja; nd_num=input(nd,mmddyy10.); /*input(zm_znakowa,informat);*/. A na koniec 40 najbardziej popularnych instrukcji sasowych 10