Tytuł: PRZETWARZANIE DANYCH W SAS Autor: Wioletta Grzenda, Aneta Ptak-Chmielewska, Karol Przanowski, Urszula Zwierz. Wstęp

Podobne dokumenty
ZESTAW 1 SAS 4GL. Język stworzony na potrzeby przetwarzania dużych zbiorów danych. Składają się nań:

Wprowadzenie do SAS. Jak zacząć? Enhanced Editor (1) Uruchamianie programu. Ćwiczenie 3. Definiowanie bibliotek

ZMODYFIKOWANY Szczegółowy opis przedmiotu zamówienia

SAS Podstawowe informacje przed ćwiczeniem 1

Program szkolenia VBA (VISUAL BASIC FOR APPLICATIONS) W EXCELU PRZEKROJOWY.

Program szkolenia VBA (VISUAL BASIC FOR APPLICATIONS) W EXCELU PODSTAWOWY.

SQL Server i T-SQL w mgnieniu oka : opanuj język zapytań w 10 minut dziennie / Ben Forta. Gliwice, Spis treści

SAS 4GL Podsumowanie.

Wstęp 7 Rozdział 1. OpenOffice.ux.pl Writer środowisko pracy 9

INFORMATYKA W SELEKCJI

Oracle11g: Wprowadzenie do SQL

Program szkoleniowy. 24 h dydaktycznych (18 h zegarowych) NAZWA SZCZEGÓŁY CZAS

Program szkoleniowy Efektywni50+ Moduł V Raportowanie dla potrzeb analizy danych

SQL w 24 godziny / Ryan Stephens, Arie D. Jones, Ron Plew. Warszawa, cop Spis treści

Zakres tematyczny dotyczący kursu PHP i MySQL - Podstawy pracy z dynamicznymi stronami internetowymi

5-6. Struktura dokumentu html. 2 Określenie charakteru i tematyki strony. Rodzaje witryn. Projekt graficzny witryny. Opracowanie skryptów

Zakres treści Czas. 2 Określenie charakteru i tematyki strony. Rodzaje witryn. Projekt graficzny witryny. Opracowanie skryptów

Przetwarzanie danych. Biblioteka. Presentation title. Biblioteka:

Programowanie w języku C++ Grażyna Koba

Wprowadzenie do SAS 4GL Zapoznanie ze środowiskiem SAS University Edition oraz SAS Studio. Podstawowe pojęcia środowiska SAS.

COMARCH IT AKADEMIA. Programista VBA w Microsoft Excel (microbootcamp)

Wprowadzenie do SAS. Wprowadzenie. Historia SAS. Struktura SAS 8. Interfejs: SAS Explorer. Interfejs. Część I: Łagodny wstęp do SAS Rafał Latkowski

I. KARTA PRZEDMIOTU CEL PRZEDMIOTU WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI EFEKTY KSZTAŁCENIA

Program szkolenia PODSTAWY VBA (VISUAL BASIC FOR APPLICATIONS) I FORMULARZE.

Wprowadzenie do programowania

Programowanie dla początkujących w 24 godziny / Greg Perry, Dean Miller. Gliwice, cop Spis treści

SAS 4GL ODS, przykładowe procedury.

Microsoft SQL Server Podstawy T-SQL

PRZEWODNIK PO PRZEDMIOCIE

SAS Podstawowe informacje przed ćwiczeniem 2

Jeśli chcesz łatwo i szybko opanować podstawy C++, sięgnij po tę książkę.

Nazwa wariantu modułu (opcjonalnie): Laboratorium programowania w języku C++

Joyce Cox Joan Lambert. Microsoft Access Krok po kroku. Przekład: Jakub Niedźwiedź

ZAJĘCIA 2. Przed rozpoczęciem zajęć należy wykonać instrukcje z poprzednich laboratoriów bądź z pliku zaj2_prep.sas. FILTROWANIE WIERSZY

Plan. Raport. Tworzenie raportu z kreatora (1/3)

Programowanie w języku Python. Grażyna Koba

Uwagi dotyczące notacji kodu! Moduły. Struktura modułu. Procedury. Opcje modułu (niektóre)

Informatyka w selekcji - Wykªad 4

Program szkoleniowy. 16 h dydaktycznych (12 h zegarowych) NAZWA SZCZEGÓŁY CZAS. Skróty do przeglądania arkusza. Skróty dostępu do narzędzi

ECDL Advanced Moduł AM4 Arkusze kalkulacyjne Syllabus, wersja 2.0

Wymagania edukacyjne z informatyki dla klasy szóstej szkoły podstawowej.

Programowanie MorphX Ax

Program szkolenia EXCEL ZAAWANSOWANY Z WPROWADZENIEM DO VBA.

Zapisywanie algorytmów w języku programowania

Makra VBA w Excelu dla początkujących

TECHNOLOGIA KOMPUTEROWA I INFORMACYJNA

1 Obliczenia na danych

Microsoft Office 2016 Krok po kroku

XQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery

Zakres tematyczny dotyczący podstaw programowania Microsoft Office Excel za pomocą VBA

PROGRAM NAUCZANIA DLA ZAWODU TECHNIK INFORMATYK, O STRUKTURZE PRZEDMIOTOWEJ

biegle i poprawnie posługuje się terminologią informatyczną,

Skorzystaj z Worda i stwórz profesjonalnie wyglądające dokumenty.

SZYBKO ZROZUMIEĆ VISUAL BASIC 2012 Artur Niewiarowski -

Program szkoleniowy Efektywni50+ Moduł IV Podstawy relacyjnych baz danych i język SQL

Klasa 2 INFORMATYKA. dla szkół ponadgimnazjalnych zakres rozszerzony. Założone osiągnięcia ucznia wymagania edukacyjne na. poszczególne oceny

PROGRAM SZKOLENIA. Excel Średniozaawansowany z wprowadzeniem do tabel przestawnych i makr.

SAS. Wprowadzenie do Systemu I Języka 4GL. Seweryn Kowalski /9/2006 1

1 Podstawy c++ w pigułce.

Curtis D. Frye. Microsoft Excel Krok po kroku. Przekład: Leszek Biolik

PLAN REALIZACJI MATERIAŁU NAUCZANIA Z INFORMATYKI II. Uczeń umie: Świadomie stosować się do zasad regulaminów (P).

Wprowadzenie (17) Część I. Makra w Excelu - podstawy (23)

1 Podstawy c++ w pigułce.

KATEGORIA OBSZAR WIEDZY

PROGRAM SZKOLENIA. Excel w Analizach danych.

Wykład II - Dane w Systemie SAS

Java w 21 dni / Rogers Cadenhead. Gliwice, cop Spis treści. O autorze 11. Wprowadzenie 13 TYDZIEŃ I JĘZYK JAVA

EXCEL POZIOM EXPERT. Konspekt szczegółowy

1 Przygotował: mgr inż. Maciej Lasota

Excel dla administracji publicznej

PAKIETY STATYSTYCZNE

1. Zaczynamy! (9) 2. Edycja dokumentów (33)

Program szkolenia EXCEL W ANALIZACH DANYCH.

PAMIĘĆ OPERACYJNA...107

Autorski program nauczania

Specjalnościowy Obowiązkowy Polski Semestr V

Tworzenie zapytań do Microsoft SQL Server

Programowanie strukturalne i obiektowe : podręcznik do nauki zawodu technik informatyk / Adam Majczak. Gliwice, cop

Temat 1. Więcej o opracowywaniu tekstu

Wymagania edukacyjne z przedmiotu zajęcia komputerowe dla klasy VI

Funkcje i instrukcje języka JavaScript

Podstawy języka T-SQL : Microsoft SQL Server 2016 i Azure SQL Database / Itzik Ben-Gan. Warszawa, Spis treści

Cel szkolenia. Konspekt. Opis kursu

Microsoft PowerPoint Poziom Zaawansowany PROGRAM SZKOLENIOWY. Plan szkolenia zawiera: Microsoft Excel Poziom Zaawansowany

Spis treści WSTĘP CZĘŚĆ I. PASCAL WPROWADZENIE DO PROGRAMOWANIA STRUKTURALNEGO. Rozdział 1. Wybór i instalacja kompilatora języka Pascal

Uniwersytet Śląski w Katowicach str. 1 Wydział Matematyki Fizyki i Chemii, Instytut Matematyki

T-SQL dla każdego / Alison Balter. Gliwice, cop Spis treści. O autorce 11. Dedykacja 12. Podziękowania 12. Wstęp 15

Program szkolenia EXCEL ŚREDNIOZAAWANSOWANY.

Przetwarzanie i analiza danych w języku Python / Marek Gągolewski, Maciej Bartoszuk, Anna Cena. Warszawa, Spis treści

Programowanie w języku Swift : Big Nerd Ranch guide / Matthew Mathias, John Gallagher. Gliwice, cop Spis treści

Transkrypt:

Tytuł: PRZETWARZANIE DANYCH W SAS Autor: Wioletta Grzenda, Aneta Ptak-Chmielewska, Karol Przanowski, Urszula Zwierz Wstęp Oddajemy do Państwa rak podręcznik do nauki pierwszych kroków przetwarzania danych w języku 4GL. Mamy nadzieje, że będzie on pomocny i zachęci Państwa do czynnej pracy w środowisku SAS. Podręcznik oparty na prostych przykładach pozwoli osobom nieznającym środowiska pracy z pakietem SAS na zapoznanie się z podstawami obsługi programu i obróbki danych. W rozdziale pierwszym czytelnik pozna szczegóły na temat SAS Institute i jego sztandarowego produktu Systemu SAS. Zaprezentowano w nim charakterystykę Systemu SAS, jego elementy składowe i ich możliwości oraz omówiono moduły, ich role w systemie. W rozdziale drugim znalazły się trzy bloki tematyczne: Biblioteka, Dane w Systemie SAS i windowsowy interfejs pracy w Systemie. Czytelnik pozna struktury danych, z głównym elementem, jakim jest Biblioteka i możliwości pracy jakie niesie aplikacja. Rozdział trzeci to wprowadzenie do języka 4GL. W rozdziale tym omówiono podstawowe funkcjonalności ENHANCED EDITOR a następnie dwa podstawowe rodzaje STEP-ów: DATA STEP i PROC STEP. Przy omawianiu zagadnień przetwarzania w postaci STEP-ów wskazano na podstawowa składnie i dostępne opcje, a następnie pokazano na przykładach praktyczne rozwiązania. Ostatnim poruszonym zagadnieniem w tym rozdziale jest pokazanie możliwości wykorzystania z instrukcji SET oraz sposób, w jaki można filtrować wiersze i kolumny lub zmienić nazwę zmiennej. Rozdział czwarty poświecony jest obliczeniom na danych. Na wstępie wprowadzono podstawowe stałe i operatory oraz funkcje, a następnie pokazano ich praktyczne wykorzystanie na przykładach. Konwersje danych z formatu znakowego na numeryczny i z numerycznego na znakowy pokazano za pomocą konwersji jawnej i niejawnej. W końcowej części rozdziału przedstawiono sposób przetwarzania w pętli z wykorzystaniem trzech rodzajów pętli. W rozdziale piątym zdefiniowano tablice oraz tablice tymczasowe, wskazując na ich praktyczne zastosowanie. Kolejnym omówionym tematem jest przetwarzanie w grupach i sortowanie danych według wartości podanej zmiennej. Na zakończenie rozdziału omówiono podstawowe opcje w procedurach służących do komunikacji z innymi aplikacjami. Przygotowanie danych do przetwarzania często wymaga połączenia danych z kilku zbiorów. W rozdziale szóstym omówione zostały podstawowe instrukcje związane z łączeniem zbiorów danych SET i MERGE oraz procedura APPEND. Rozdział siódmy jest ściśle związany z rozdziałem szóstym, ponieważ łącząc zbiory często należy je wcześniej przetransponować w celu uzyskania pożądanych rezultatów. Zatem rozdział ten jest poświęcony procedurze TRANSPOSE. Wykorzystanie różnych instrukcji procedury TRANSPOSE umożliwia wykonanie nawet dość skomplikowanych transpozycji zbiorów.

Kolejny rozdział porusza bardzo ważne zagadnienia związane z prezentacja danych. Zostały w nim przedstawione formaty systemowe oraz omówiona została procedura FORMAT, przy pomocy, której można tworzyć formaty użytkownika. Rozdział dziewiąty dotyczy przetwarzania plików tekstowych. Omówione zostały w nim podstawowe zagadnienia związane z wczytywaniem plików tekstowych oraz z zapisywaniem danych Systemu SAS do plików tekstowych. Problemy związane z sortowaniem danych zostały omówione w rozdziale dziesiątym. Podstawowa procedura służąca do sortowania danych jest PROC SORT. Rozdział następny zawiera ogólne informacje dotyczące indeksów. Prezentuje on metody tworzenia i usuwania indeksów wraz z szeregiem wskazówek, kiedy indeksów należy używać. Zaawansowane opcje i instrukcje odczytu danych przedstawione zostały w rozdziale dwunastym. Rozdział ten zawiera wybrane opcje związane z instrukcja SET oraz instrukcje GOTO i LINK. W rozdziale trzynastym omówione zostały podstawowe procedury agregujące, należą do nich: FREQ, MEANS, SUMMARY. Rozdział czternasty, to rozdział poświęcony tworzeniu raportów z wykorzystaniem programów 4GL. Do tworzenia raportów wykorzystano głównie procedury służące do budowy tablic wielodzielczych oraz procedury służące do budowy wykresów. W zakończeniu rozdziału podano kompleksowy przykład raportu wraz z interpretacja wyników. Rozdział piętnasty wprowadza czytelnika w zaawansowane metody programistyczne, wykorzystujące makrozmienne i makroprogramy - nieocenione narzędzia przyspieszające i automatyzujące przetwarzanie danych w SAS. Rozdział szesnasty podsumowuje poznana wiedze z programowania w SAS 4GL, uporządkowując etapy uruchamiania DATA STEP-u, aby lepiej i z większą świadomością poprawnie pisać programy. Wreszcie ostatni rozdział siedemnasty porusza temat optymalizacji przetwarzania, aby skracać czas obróbki danych i lepiej zarządzać pamięcią. Spis treści Wprowadzenie 1. Wstęp do Systemu SAS 1.1. Dlaczego warto poznać System SAS? 1.2. Co to jest System SAS? 1.2.1. Cechy Systemu SAS

1.2.2. Moduły w Systemie SAS 2. Dane w Systemie SAS 2.1. Biblioteka 2.2. Praca ze zbiorami danych 2.3. Środowisko pracy w Systemie SAS 9 3. Język 4GL 3.1. Enhanced Editor - edytor programisty 3.2. Definiowanie skrótów 3.3. Definiowanie makr 3.4. Skróty klawiszowe 3.5. Wykonanie programu 3.6. Przywołanie uprzednio wykonanego programu 3.7.1. Składnia DATA STEP-u 3.7.2. Instrukcja przypisania 3.7.3. PDV - Program DATA VECTOR 3.7.4. Opcje systemowe 3.8. PROC STEP 3.8.1. Składnia PROC STEP-u 3.8.2. Przykładowe instrukcje 3.9. Instrukcja SET 3.10. Opcje zbioru WHERE 3.11. Filtrowanie wierszy - instrukcje WHERE i IF 3.12. Filtrowanie kolumn - instrukcje KEEP i DROP 3.13. Zmiana nazw zmiennych 3.14. Wejście i wyjście żnullż

4. Obliczenia na danych 4.1. Wyrażenia Systemu SAS 4.1.1. Stałe Systemu SAS 4.1.2. Operatory Systemu SAS 4.2. Funkcje Systemu SAS 4.3. Konwersje typów 4.3.1. Konwersja niejawna 4.3.2. Konwersja jawna 4.3.3. Ograniczenia w warunkach WHERE 4.4. Przechowywanie informacji w pętli głównej 4.4.1. Instrukcja RETAIN 4.4.2. Funkcje LAG i DIF 4.5. Przetwarzanie iteracyjne 4.5.1. Pętle ze zmienna indeksująca 4.5.2. Pętle z warunkiem DO WHILE 4.5.3. Pętle z warunkiem DO UNTIL 4.5.4. Zagnieżdżanie pętli 5. Przetwarzanie w 4GL 5.1. Tablice 5.1.1. Definicja tablicy 5.1.2. Tablice tymczasowe 5.2. Przetwarzanie w grupach - instrukcja BY 5.3. Komunikacja z aplikacjami biurowymi

5.3.1. Procedura EXPORT 5.3.2. Procedura IMPORT 6. Łączenie zbiorów danych 6.1. Konkatenacja zbiorów 6.1.1. Instrukcja SET 6.1.2. Procedura APPEND 6.1.3. Konkatenacja z sortowaniem 6.2. Scalanie zbiorów danych 6.2.1. Instrukcja MERGE 6.2.2. Scalanie zbiorów danych według klucza 6.3. Inne sposoby łączenia zbiorów danych 6.4. Łączenie zbiorów za pomocą języka SQL 7. Transpozycja zbiorów danych 7.1. Procedura TRANSPOSE 7.2. Transpozycja prosta 7.3. Transpozycja według zmiennych 7.4. Nazwy nowo utworzonych zmiennych 7.5. Transpozycja zmiennych tekstowych i numerycznych 7.6. Transpozycja częściowa 8. Formaty 8.1. Prezentacja danych 8.2. Formaty standardowe

8.3. Wykorzystanie formatów 8.4. Tworzenie formatów 9. Przetwarzanie plików tekstowych 9.1. Wczytywanie plików tekstowych 9.1.1. Instrukcja INPUT 9.1.2. Instrukcje DATALINES i CARDS 9.1.3. Instrukcja INFILE 9.2. Zapis danych do plików tekstowych 10. Sortowanie danych 10.1. Procedura SORT 10.1.1. Składnia procedury SORT 10.1.2. Przykłady użycia procedury SORT 10.1.3. Polskie znaki diakrytyczne 10.2. Opcja zbioru SORTEDBY 10.3. Opcja NOTSORTED instrukcji BY 11. Indeksy 11.1. Informacje ogólne 11.2. Tworzenie i usuwanie indeksów 11.2.1. Opcja zbioru INDEX 11.2.2. PROC DATASETS 11.2.3. Procedura SQL 11.3. Wykorzystanie indeksów

12. Specjalne opcje i instrukcje odczytu danych 12.1. Wybrane opcje 12.1.1. Opcje END i NOBS 12.1.2. Opcja POINT 12.1.3. Opcja KEY 12.2. Instrukcje sterujące 12.2.1. Instrukcje GOTO i LINK 12.2.2. Instrukcje LEAVE i CONTINUE 13. Agregowanie danych 13.1. Procedura FREQ 13.2. Procedury MEANS i SUMMARY 14. Raporty w SAS 14.1. Tworzenie raportów w formie tabelarycznej i graficznej 14.2. Polecenie ODS 14.3. Procedura PRINT 14.4. Procedura TABULATE 14.5. Definiowanie etykiet dla kolumn tabeli 14.6. Formatowanie wartości komórek tabeli - opcja FORMAT 14.7. Kontrola wyglądu raportu 14.7.1. Opcje procedury 14.7.2. Opcje w wyrażeniu TABLE 14.7.3. Opcje w wyrażeniu CLASS

14.8. Procedury CHART, GCHART, PLOT, GPLOT 14.9. Przykładowy Raport w SAS 15. Makroprogramowanie 15.1. Makrozmienne 15.2. Różne metody tworzenia makrozmiennych 15.3. Makroprogramy 15.4. Wielokrotne rozwijanie makrozmiennych, poprawne liczenie znaków &, tablica makrozmiennych 15.5. Typowe błędy użycia makroprogramów i makrozmiennych 15.6. Automatyzacja przetwarzania 15.7. Makroprogramy rekurencyjne 15.8. Poprawne pisanie makroprogramów (zasięg makrozmiennych) 15.9. Różne sposoby przekazywania parametrów 15.10. Instrukcja %INCLUDE i autoprogramowanie 16. Kolejność kompilacji DATA STEP-u 16.1. Etap 0. (Rozwijanie makr) 16.2. Etap 1. (Sprawdzenie składni 4GL) 16.3. Etap 2. (PDV) 16.4. Etap 3. (Uruchomienie) 17. Optymalizacja przetwarzania 17.1. Kompresja tabel 17.2. Wykorzystanie widoków 17.3. Tymczasowe pliki

17.4. Instrukcja CLASS kontra BY 17.5. Samodzielne zarządzanie RAM 17.6. Indeksy i instrukcja WHERE 17.7. Zagnieżdżanie IF kontra SELECT 17.8. Indeksy i łączenie 17.9. Lepsze wykorzystanie RAM lub partycjonowania danych 18. Odpowiedzi do ćwiczeń