Wprowadzenie do Systemu SAS Krzysztof Dembczyński Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska Technologie Wytwarzania Oprogramowania Semestr zimowy 2008/09 Studia uzupełniajace magisterskie
1 Wprowadzenie do Systemu SAS 2 Architektura Systemu 3 Instalacja 4 SAS Base i SAS 4GL 5 Podsumowanie
1 Wprowadzenie do Systemu SAS 2 Architektura Systemu 3 Instalacja 4 SAS Base i SAS 4GL 5 Podsumowanie
System SAS nie jest systemem zarzadzania bazami danych. System SAS jest systemem statystyczno-analizycznym. System SAS jest pakietem wspierajacym typowe zadania zwiazane z hurtowniami danych, analiza i eksploracja danych, a także marketingkiem bezpośrednim, zarzadzaniem finansami i zarzadzaniem klientami.
Możliwości oprogramowania SAS: system statystyczno-analityczny, wsparcie do tworzenia i wykorzystywania hurtowni danych, wspomaganie procesu ekstrakcji, transformacji i ładowania danych, optymalizacja wydajności dostępu do danych, wspomaganie tworzenie wielowymiarowych zbiorów danych, modele analizy i eksploracji danych, modułu zarzadzania finansami, rozwiazania dedykowane.
Komponenty SAS Enterprise Intelligence Platform
Integracja danych: Narzędzia, rozwiazania, techniki i technologie wykorzystywane w szeroko rozumianym procesie przetwarzania danych: budowa i administracja procesami ekstrakcji, transformacji i ładowania danych, kontrola i poprawy jakości danych, dostęp i administracja źrodłami danych, projektowanie procesów przetwarzania danych.
Skalowalny serwer dostępu do danych: Rozwiazanie pozwalajace na szybki dostęp do bardzo dużych zbiorów danych poprzez wielowatkowe jadro realizujace operacje obliczeniowe oraz operacje wejścia/wyjścia. Dane moga być przechowywane w formatach wielowymiarowych i relacyjnych. Możliwy jest wielowatkowy dostęp do danych źródłowych.
Rozwiazanie analityczne: Zintegrowane środowisko do modelowania predykcyjnego i opisowego, prognozowania, optymalizacji, symulacji,......
Inteligencja biznesowa: Architektura oraz narzędzia procesu projektowania i tworzenia modelu obiegu i dystrybucji informacji użytecznej z punktu widzenia analitycznego opartego na spójnych danych korporacyjnych zgromadzonych w hurtowni danych.
1 Wprowadzenie do Systemu SAS 2 Architektura Systemu 3 Instalacja 4 SAS Base i SAS 4GL 5 Podsumowanie
Architektura SAS Intelligence Platform
Przykładowa konfiguracja komponentów serwera aplikacji SAS
Aplikacje klienckie wykorzystywane na laboratorium SAS Management Console SAS Enterprise Guide SAS ETL Studio SAS OLAP Cube Studio SAS Enterprise Miner Będziemy również korzystać bezpośrednio z SAS Base.
Zarzadzenie architektura i procesami w SAS9
1 Wprowadzenie do Systemu SAS 2 Architektura Systemu 3 Instalacja 4 SAS Base i SAS 4GL 5 Podsumowanie
Zawartość katalogu (lub płyty) SAS_INSTALL: depot zawiera pliki i katalogii instalacyjne, enterprise_guide zawiera numer licencyjny dla programu Enterprise Guide, plan zawiera listę sprawdzajac a z opisem czynności przed instalacja oraz tzw. plan instalacji, setinit zawiera pliki z licencja (nazywane setinit lub sid) dla różnych systemów operacyjnych, metadata zawiera program pozwalaj acy na podmianę metadanych (narzędzie dla zaawansowanych).
Katalog Plan: preinstallationchecklist_windows_913.html zawiera opis czynności, jakie należy wykonać przed instalacja oprogramowania: założenie kont użytkownika w systemie Windows: sasadm, sassrv, sastrust, sasdemo, sasguest itp., założenie odpowiednich grup, nadanie odpowiednich praw użytkownikom i grupom, plan.xml zawiera plan instalacji.
W celu instalacji najlepiej wykorzystać SAS Software Navigator (depot\setup.exe). Kolejne ważne kroki sa następujace: wybranie instalacji zaawansowanej, wskazanie pliku z licencja (setinit, sid), wskazanie pliku z planem instalacji, na końcu instalacji uruchomi się oprogramowanie konfiguracyjne.
Wybranie instalacji zaawansowanej
Wskazanie pliku z licencja (setinit, sid)
Wskazanie pliku z planem instalacji
Konfiguracja SAS9: wskazanie katalogu przeznaczonego do składowania metadanych, uruchomienie serwerów w trybie usług, poprawne podanie nazwy komputera (najlepiej podać windowsowa nazwę komputera), poprawne podanie nazw i haseł użytkowników zdefiniowanych w systemie Windows, dodatkowa edycja pliku z własnościami configuration.properties (ważne!!!: warto sprawdzić jeszcze raz ustawiona nazwę komputera i w razie potrzeby poprawić ja) zdefiniowanie metadanych zgodnie z instukcjami zawartymi w instructions.html
Wskazanie katalogu przeznaczonego do składowania metadanych
Poprawne podanie nazwy komputera
Poprawne podanie nazw i haseł użytkowników zdefiniowanych w systemie Windows
Dodatkowa edycja pliku z własnościami configuration.properties
1 Wprowadzenie do Systemu SAS 2 Architektura Systemu 3 Instalacja 4 SAS Base i SAS 4GL 5 Podsumowanie
SAS Base
Biblioteki w SAS ie foldery logiczne
Biblioteki w SAS ie foldery logiczne LIBNAME Moja C:\My SAS Files\Moja ;
SAS 4GL język czwartej generacji, DATA STEP jest procesem przekształcania danych, PROC STEP jest procedura wykonywana na wskazanym zbiorze danych, Wiele specyficznych rozszerzeń, jak możliwość korzystania z SQL, MDX, IML i innych języków programowania oraz języka makropoleceń.
SAS 4GL DATA marine; INPUT Name $ Family $ Length; datalines; beluga whale 15 whale shark 40 basking shark 30 gray whale 50 mako shark 12 sperm whale 60 dwarf shark.5 whale shark 40 humpback. 50 blue whale 50 killer whale 30 ;
SAS 4GL * To jest komentarz; /*To tez jest komentarz*/ /*Pierwszy komentarz zaczyna sie gwiazdka i konczy srednikiem */ /*Drugi komentarz zaczyna sie ukosnikiem i gwiazdka, a konczy sie gwiazdka i ukosnikiem */ *Sortujemy dane; PROC SORT DATA = marine OUT = seasort NODUPKEY; BY Family DESCENDING Length; /*To jest krok danych*/ PROC PRINT Data = seasort; TITLE "Whales and Sharkes"; /* To jest krok procdeduralny*/ /*Przetwarzanie procedur rozpoczyna sie po wyslaniu intrukcji RUN;*/ RUN;
SAS 4GL DATA sales; INPUT CustomerID $ @9 SaleData MMDDYY10. Petunia SnapDragon Marigold; Month = MONTH(SaleData); FORMAT SaleData MMDDYY10.; INFORMAT SaleData MMDDYY10.; datalines; 756-01 05/04/2001 120 80 110 834-01 05/02/2001 90 160 50 901-02 05/18/2001 50 100 75 834-01 06/01/2001 80 60 100 756-01 06/11/2001 100 160 75 ; PROC SORT DATA = sales; BY Month; PROC Means DATA = sales; /*Najpierw trzeba dane posortowac!*/ BY Month; VAR Petunia SnapDragon Marigold; TITLE "Summay of Flower Sales by Month"; RUN;
SAS 4GL DATA orders; INPUT Coffee $ Window $ @@; datalines; esp w cap d cap w kon w ice w kon d esp d kon w ice d esp d cap w esp d cap d Kon d. d kon w esp d cap w ice w kon w ; PROC FREQ DATA = orders; TABLES Window Window * Coffee; RUN;
SAS 4GL DATA boats; INPUT Name $13. Length Locomotion $ @25 Type $9.; Port = "Maalea"; datalines; Silent Lady 64 sail schooner America II 65 sail yacht Ocean Spirit 65 power catamaran Lavengro 52 sail schooner Pride of Maui 110 power catamaran Leilani 45 power yacht Kalakaua 70 power catamaran Blue Dolphin 65 sail catamaran ;
SAS 4GL PROC TABULATE DATA = boats; CLASS Port Locomotion Type; TABLE Port, Locomotion, Type; TITLE "Number of Boats by Port, Locomotion, and Type"; RUN; PROC TABULATE DATA = boats; CLASS Locomotion Type; VAR Length; TABLE Locomotion ALL, MEAN*Length*(Type ALL); TITLE "Number of Boats by Port, Locomotion, and Type"; PROC TABULATE DATA = boats; CLASS Locomotion; VAR Length; TABLE Locomotion ALL, MEAN*Length*(Type ALL); TITLE "Number of Boats by Port, Locomotion, and Type"; RUN;
SAS 4GL DATA bus; INPUT BusType $ OnTimeOrLate $ @@; datalines; E O E L E L R O E O E O E O R L R O R L R O E O R L E O R L E O E O R L R L E L ; PROC FREQ DATA = bus; TABLES BusType * OnTimeOrLate / CHISQ; TITLE; RUN;
SAS 4GL DATA boats_2; INPUT Name $13. Length Locomotion $ @27 Type $ @37 Port $; datalines; Silent Lady 64 sail schooner Maalea America II 65 sail yacht Maalea Ocean Spirit 65 power catamaran Maalea Lavengro 52 sail schooner Maalea Pride of Maui 110 power catamaran Torres Leilani 45 power yacht Torres Kalakaua 70 power catamaran Torres Blue Dolphin 65 sail catamaran Torres ; PROC TABULATE DATA = boats_2; CLASS Port Locomotion Type; TABLE Port, Locomotion, Type; TITLE "Number of Boats by Port, Locomotion, and Type"; RUN;
DATA RANDOM; INPUT SUBJ NAME $20.; GROUP=RANUNI(0); DATALINES; 1 CODY 2 SMITH 3 HELM 4 GREGORY ; SAS 4GL
SAS 4GL PROC SQL; select product, avg(actual) from sashelp.prdsal2 group by product; PROC SORT DATA = sashelp.prdsal2; BY PRODUCT; PROC MEANS DATA = sashelp.prdsal2; BY PRODUCT; VAR ACTUAL; TITLE PIERWSZA SREDNIA ; RUN;
1 Wprowadzenie do Systemu SAS 2 Architektura Systemu 3 Instalacja 4 SAS Base i SAS 4GL 5 Podsumowanie
Jaki SAS jest każdy widzi :) Jest to przede wszystkim system statystyczno-analityczny, SAS pretenduje do miana najlepszego produktu w dziedzinie inteligencji biznesowej, Środowisko dość elitarne... Ma swoje zalety, ale też wady, Jakie? Zobaczymy podczas tego semestru...
Celem laboratorium nie jest szkolenie z oprogramowania SAS!!! Celem jest zapoznanie z zagadnieniemi zwi azanymi z hurtowniami danych i demonstracja oprogramowania jednego z producentów.
Bibliografia: http://www.sas.com http://support.sas.com http://support.sas.com/documentation/ onlinedoc/91pdf/index_913.html Warto przeczytać: SAS Intelligence Platform: Overview SAS Intelligence Platform: Administration Guide SAS Intelligence Platform: Installation Guide Base SAS Procedures Guide SAS ETL Studio: User s Guide SAS Management Console: User s Guide SAS OLAP Server: Administrator s Guide SAS OLAP Server: MDX Guide SAS/ACCESS for Relational Databases: Reference