Wprowadzenie do SAS 4GL Zapoznanie ze środowiskiem SAS University Edition oraz SAS Studio. Podstawowe pojęcia środowiska SAS. mariusz.dzieciatko@ SAS University Edition Przygotowanie środowiska Instalacja Oracle VirtualBox oraz SAS University Edition vapp https://www.virtualbox.org/wiki/downloads http://www./en_us/software/university-edition/download.html Dodaj SAS University Edition vapp do VirtualBox Utwórz folder na dane i wyniki Uruchom SAS University Edition vapp Otwórz SAS University Edition http://localhost:10080 Page 1
SAS University Edition to świetny zestaw startowy do świata zaawansowanej statystyki. Licencja obejmuje poniższe moduły: Base SAS SAS/STAT SAS/IML SAS/ACCESS SAS/ETS Oraz aplikację: SAS Studio SAS University Edition zawartość SAS University Edition to świetny zestaw startowy do świata zaawansowanej statystyki. Licencja obejmuje poniższe moduły: Base SAS SAS/STAT SAS/IML SAS/ACCESS SAS/ETS Oraz aplikację: SAS Studio SAS University Edition zawartość Page 2
Co to jest? SAS 4GL to język czwartej generacji, nieproceduralny, umożliwiający: Dostęp do danych Przetwarzanie danych (czyszczenie, transformacje, łączenie) Analizę danych Raportowanie Automatyzację - makroprogramowanie Biblioteka wskazanie (referencja) na obszar dyskowy, ma którym znajdują się dane wykorzystywane przy pracy może wskazywać na obszar lokalny (aplikacja SAS i dane na jednym komputerze) może wskazywać na obszar zdalny (aplikacja SAS i dane znajdują się na różnych komputerach) opisuje dane "praktycznie" dowolnego formatu Page 3
Biblioteka Istnieją dwa rodzaje bibliotek: tymczasowa (work) i permanentna. Nazwa biblioteki, czyli libref może mieć długość maksymalnie 8 znaków. libname study "/folders/myfolders/dane01"; libname proj "/folders/myshortcuts/s2"; libname mydblib oracle user=myusr1 password=mypwd1 path=airdb_remote schema=hrdept; LIBNAME WrkBk EXCEL 'My Workbook.xls'; LIBNAME test hadoop USER='hive' SERVER='server.pl' PORT=10000 SUBPROTOCOL=Hive2; 3 środowiska programowania Page 4
DATA STEP wejście wyjście tabela tabela plik plik Zbiory danych Do zbioru odwołujemy się w następujący sposób: <nazwa_biblioteki>.<nazwa_zbioru> Jeśli odwołujemy się do zbioru tylko poprzez nazwę zbioru, wówczas zakładamy iż zbiór ten znajduje się w bibliotece tymczasowej work. Dane zbioru to obserwacje w tabeli, składającej się z: obserwacji (wierszy) zmiennych (kolumn) Page 5
Zbiory danych Nazwa zbioru musi spełniać zasady: długość od 1 do 32 znaków zaczynać się literą, bądź znakiem podkreślenia (_) składać się z liter, liczb, bądź znaków podkreślenia Nazwa zmiennej (kolumny) musi spełniać zasady: długość od 1 do 32 znaków zaczynać się literą, bądź znakiem podkreślenia (_) składać się z liter, liczb, bądź znaków podkreślenia Reprezentacja wartości pustych w zbiorze Reprezentacja wartości pustych w zbiorze typ znakowy: pusta wartość typ numeryczny: kropka (.) Page 6
Formaty i informaty Format danych jest to sposób prezentacji zapisanych danych. Informat danych to sposób czytania danych do zbioru. Różne formy prezentacji liczby 12: 12 twelve 12.0 12,00 0012 1.2e1 XII grudzień 0C $12 12%... Dziękujemy za udział Page 7