ZALETY NOWSZYCH WERSJI I KIERUNKI ROZWOJU SPDS-A SŁAWOMIR BOKINIEC

Podobne dokumenty
SAS Access to Hadoop, SAS Data Loader for Hadoop Integracja środowisk SAS i Hadoop. Piotr Borowik

Tuning SQL Server dla serwerów WWW

SQL Server 2016 w świecie Big Data

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

Modelowanie Data Mining na wielką skalę z SAS Factory Miner. Paweł Plewka, SAS

STROJENIE PRZETWARZAŃ SAS

Iwona Milczarek, Małgorzata Marcinkiewicz, Tomasz Staszewski. Poznań,

UPDATE Studenci SET Rok = Rok + 1 WHERE Rodzaj_studiow =' INŻ_ST'; UPDATE Studenci SET Rok = Rok 1 WHERE Nr_albumu IN ( '111345','100678');

SQL SERVER 2016 IN MEMORY

Optymalizacja poleceń SQL Metody dostępu do danych

Zabezpieczanie dostępu do bibliotek w SAS 9.4

Relacyjne bazy danych. Podstawy SQL

Bazy danych. Plan wykładu. Rozproszona baza danych. Fragmetaryzacja. Cechy bazy rozproszonej. Replikacje (zalety) Wykład 15: Rozproszone bazy danych

Wydajność hurtowni danych opartej o Oracle10g Database

SQL SERVER 2012 i nie tylko:

Wprowadzenie do BD Operacje na bazie i tabelach Co poza zapytaniami? Algebra relacji. Bazy Danych i Systemy informacyjne Wykład 2.

Hadoop i Spark. Mariusz Rafało

MeetingHelper. Aplikacja Android ułatwiająca przekazywanie materiałów pomiędzy uczestnikami spotkania. Instrukcja obsługi dla programisty

DB2 with BLU acceleration rozwiązanie in-memory szybsze niż pamięć operacyjna&

Praktyczne wykorzystanie mechanizmów zabezpieczeń w aplikacjach chmurowych na przykładzie MS Azure

Hbase, Hive i BigSQL

Optymalizacja poleceń SQL

Baza danych in-memory. DB2 BLU od środka Artur Wrooski

Bazy danych SQL Server 2005

Metadata-Bound Libraries w SAS 9.3M2

Przypisywanie bibliotek w architekturze SAS

Typy tabel serwera MySQL

Integralność danych Wersje języka SQL Klauzula SELECT i JOIN

Przetwarzanie danych z wykorzystaniem technologii NoSQL na przykładzie serwisu Serp24

Szkolenia SAS Cennik i kalendarz 2017

strukturalny język zapytań używany do tworzenia i modyfikowania baz danych oraz do umieszczania i pobierania danych z baz danych

Stosowanie indeksów ma swoje korzyści, ale bywa również kosztowne.

Nowoczesne technologie bliżej nas 1

Bazy Danych i Usługi Sieciowe

Internetowe bazy danych

ROZSZERZAJĄC FUNKCJONALNOŚCI MEMCACHED

Hurtownie danych - przegląd technologii

Relacyjne bazy danych. Podstawy SQL

Projektowanie i implementacja infrastruktury serwerów

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Bazy danych. Bazy danych. Zapytania SELECT. Dr inż. Paweł Kasprowski.

Wstęp Wprowadzenie do BD Podstawy SQL. Bazy Danych i Systemy informacyjne Wykład 1. Piotr Syga

Projektowanie rozwiązań Big Data z wykorzystaniem Apache Hadoop & Family

Struktura drzewa w MySQL. Michał Tyszczenko

Jarosław Kuchta Administrowanie Systemami Komputerowymi. Internetowe Usługi Informacyjne

Bazy danych i usługi sieciowe

Od czego zacząć przy budowaniu środowisk wysokiej dostępności?

Język SQL, zajęcia nr 2

Zabezpieczanie bibliotek SAS Base

INTERNET - Wrocław Usługi bezpieczeństwa w rozproszonych strukturach obliczeniowych typu grid

PAKIETY STATYSTYCZNE

Modelowanie hierarchicznych struktur w relacyjnych bazach danych

Palo Alto firewall nowej generacji

Projektowanie rozwiązań Big Data z wykorzystaniem Apache Hadoop & Family

Administracja i programowanie pod Microsoft SQL Server 2000

SAS ENTERPRISE MINER JAKO NARZĘDZIE ANALITYKA MARIUSZ DZIECIĄTKO

Bezpieczny dostęp do usług zarządzania danymi w systemie Laboratorium Wirtualnego

Szyfrowanie danych w SZBD

Statystyki (1) Optymalizacja poleceń SQL Część 2. Statystyki (2) Statystyki (3) Informacje, opisujące dane i struktury obiektów bazy danych.

Wykład 8. SQL praca z tabelami 5

CZY TWOJE ŚRODOWISKO PLIKOWE RÓWNIEŻ ROŚNIE SZYBCIEJ NIŻ BAZODANOWE?

Administracja bazami danych

CZĘŚĆ I. WARSTWA PRZETWARZANIA WSADOWEGO

Blaski i cienie wyzwalaczy w relacyjnych bazach danych. Mgr inż. Andrzej Ptasznik

Zadania z SQLa (MS SQL Server)

Wykład 6. SQL praca z tabelami 3

ACESS- zadania z wykorzystaniem poleceń SQL

Tytuł: PRZETWARZANIE DANYCH W SAS Autor: Wioletta Grzenda, Aneta Ptak-Chmielewska, Karol Przanowski, Urszula Zwierz. Wstęp

Optymalizacja poleceń SQL Statystyki

Szkolenie wycofane z oferty. Apache Cassandra - modelowanie, wydajność, analiza danych

Wykład XII. optymalizacja w relacyjnych bazach danych

2 Konfiguracja i utrzymanie bazy danych Przed rozpoczęciem Lekcja 1: Konfigurowanie plików i grup plików Pliki i grupy plików...

Egzamin : administrowanie systemem Windows Server 2012 R2 / Charlie Russel. Warszawa, Spis treści

Administrowanie bazami danych Microsoft. SQL Server Training Kit. Egzamin Orin Thomas Peter Ward bob Taylor. Przekład: Marek Włodarz

Leonard G. Lobel Eric D. Boyd. Azure SQL Database Krok po kroku. Microsoft. Przekład: Marek Włodarz. APN Promise, Warszawa 2014

77. Modelowanie bazy danych rodzaje połączeń relacyjnych, pojęcie klucza obcego.

Jak zatrudnić słonie do replikacji baz PostgreSQL

Bazy danych 10. SQL Widoki

Zarządzanie wieloserwerowym środowiskiem SAS z wykorzystaniem SAS Grid Managera. Katarzyna Wyszomierska

(a) T (b) N (c) N (d) T

Indeksowanie full text search w chmurze

Technologia HD w IBM DB2

Szkolenie Oracle SQL podstawy. Terminy lutego 2010 First Minute! 1100zł!

Hurtownie danych - przegląd technologii

SPECYFIKACJA FUNKCJONALNA OPROGRAMOWANIA 11 marca 2014 XLZEBRAPRINTER

Plan ćwiczenia. Rozdział 16 Uwierzytelnianie i autoryzacja w bazie danych. Użytkownicy i schematy (1) Użytkownicy i schematy (2) baza danych: ZESP99

Marzena Kanclerz. Microsoft Channel Executive. Zachowanie ciągłości procesów biznesowych. z Windows Server 2012R2

Cwiczenie 4. Połączenia, struktury dodatkowe

Bazy danych i usługi sieciowe

Przewidywanie Nieprzewidywalnego Sybase w środowiskach wysokiej dostępności. Jak wykorzystać technologie do budowy centrum zapasowego.

Szkolenie autoryzowane. MS Tworzenie zapytań do Microsoft SQL Server Strona szkolenia Terminy szkolenia Rejestracja na szkolenie Promocje

Szkolenie autoryzowane. MS 6232 Wdrażanie bazy danych Microsoft SQL Server 2008 R2

Zbiór pytań nr 5. 2 Które stwierdzenie opisuje najlepiej zbiór uprawnień dostępny po wykonaniu

Język SQL, zajęcia nr 1

SAS Lineage. zależności między obiektami w środowisku SAS, perspektywa techniczna i biznesowa

Microsoft SQL Server Podstawy T-SQL

SAS ETL Studio Wprowadzenie

MySQL. Æwiczenia praktyczne

Transkrypt:

ZALETY NOWSZYCH WERSJI I KIERUNKI ROZWOJU SPDS-A SŁAWOMIR BOKINIEC

AGENDA Wybrane zalety wersji 5.1 i wcześniejszych SPDS z SAS Gridem Co kształtuje kierunki rozwoju? Nowsze wersje SPDS z Hadoopem

WYBRANE ZALETY SPDS-A WCZEŚNIEJSZYCH WERSJI Skalowalne, partycjonowane I/O Optymalizacje dla warunku where ACL-e Parallel Group by (PGB) Star join Parallel join (też z PGB) Uniwersalny indeks łączący zalety technologii B-Tree i bitmapy

WYBRANE ZALETY SPDS-A WCZEŚNIEJSZYCH WERSJI C.D. Uniwersalność klastrowania/partycjonowania Proc append uniquesave=rep Skuteczne Indeksy proste i nieraz wydajne przetwarzanie bez indeksów Mechanizm dynamic locking pozwalający na równoczesny zapis i modyfikację Podobnie jak Base może przechowywać dane posortowane Dynamic Cluster BY Clause Optimization Dostęp spoza SAS-a Współpraca z SAS Grid

5 SAS SPDS Z SAS GRID EM SAS na węzłach łączy się do lokalnego SPDS-a (localhost) SPD Srv SPD Srv SPD Srv SPD Srv DATA SPD DATA SPD DATA Shared Storage

WYBRANE ZALETY SPDS-A PRZYPOMNIENIE: WERSJA 5.1 Join Planner jointech_pref=<index hash merge seq> Ułatwienia w identyfikowaniu użytkownika proxy (spdsbase) Silny algorytm szyfrowania danych AES-256 Wsparcie dla platformy Windows 64 bit Dynamiczne klastry zarządzane online

PRZYPOMNIENIE ZALET SPDS-A DYNAMICZNY KLASTER?

WERSJA 5.1 DYNAMICZNY KLASTER UŁATWIENIA W ZARZĄDZANIU Zapewnienie dostępności klastra 24/7 nie wymaga rozpięcia: dodawanie membrów zastępowanie membrów usuwanie membrów Ilość slotów w klastrze może wzrastać dynamicznie wraz z dodawanymi membrami klastra Klaster może zostać w całości usunięty wraz ze wszystkimi membrami

WERSJA 5.1 MONITOROWANIE OPTYMALIZATORA JOIN ÓW %let spdssqlr=_method details='what_join$why_join$'; Przykładowy fragment loga: **WHY_JOIN( 1)?: Plan a Inner Join **WHY_JOIN( 1)?: INDEX available on 2 tables **WHY_JOIN( 1)?: Index Join pass 1 **WHY_JOIN( 1)?: Inner table [X0000001].FACT_CLAIM (alias = fct) Index agent_mk **WHY_JOIN( 1)?: Idx dup_ratio(0.00) < indexselectivity(0.70) **WHY_NIDX( 1)?: No 2nd pass, outer table too big **WHY_NIDX( 1)?: No useful index found **WHY_MERG( 1)?: Index join not selected, do merge join **WHY_JOIN( 2)?: Plan a Inner Join **WHY_JOIN( 2)?: INDEX available on 1 tables **WHY_JOIN( 2)?: Index Join pass 1 **WHY_JOIN( 2)?: Inner table [X0000001].DIM_CUSTOMER (alias = c) Index customer_mk **WHY_JOIN( 2)?: Idx dup_ratio(1.00) >= indexselectivity(0.70) **WHY_INDX( 2)?: magic = 104 (jtech_pref=index) and good dup_ratio) SPDS_NOTE: PROC SQL planner chooses indexed join. **WHY_JOIN( 3)?: Plan a Inner Join **WHY_JOIN( 3)?: INDEX available on 1 tables **WHY_JOIN( 3)?: Index Join pass 1 **WHY_JOIN( 3)?: Inner table [X0000001].DIM_INSURANCE_POLICY (alias = p) Index insurance_policy_mk **WHY_JOIN( 3)?: Idx dup_ratio(1.00) >= indexselectivity(0.70) **WHY_INDX( 3)?: magic = 104 (jtech_pref=index) and good dup_ratio) SPDS_NOTE: PROC SQL planner chooses indexed join. **WHY_NHSH( 1)?: Insufficient hash memory, increase buffersize **WHY_NPLL( 1)?: Join does not meet pllj requirements **WHY_MERG( 1)?: no transformation to hash or pllj SPDS_NOTE: PROC SQL planner chooses merge join. vs we wcześniejszych wersjach SPDS_NOTE: SQL execution methods chosen are: sqxslct sqxuniq sqxjndx(3) sqxjndx(2) sqxjm(1) sqxsrc ([X0000001].FACT_CLAIM (alias = fct) ) sqxsort sqxfil sqxsrc ([X0000001].DIM_AGENT (alias = a) ) sqxsrc ([X0000001].DIM_CUSTOMER (alias = c) ) sqxfil sqxsrc ([X0000001].DIM_INSURANCE_POLICY (alias = p) )

KIERUNKI ROZWOJU KTO I CO JE KSZTAŁTUJE? Użytkownicy Ciśnienie na nowe funkcjonalności Wydajność i funkcjonalności lepsze niż BASE w prawie każdej sytuacji (ip=yes) Wydajność ACL-i NLS Łatwość użycia i redukowanie ograniczeń Użytkownik nie zastanawia się nad typem indeksów Administracja i monitorowanie Integracja z SAS-em Trendy w SAS-ie Korzystanie z Hadoopa Bezpieczeństwo

KIERUNKI ROZWOJU INTEGRACJA Z SAS-EM Wsparcie na systemy operacyjne Proces instalacji nie wymaga planu Metadane Scoring Accelerator I inne

SAS SPDS 5.2 PRZEDE WSZYSTKIM Z HADOOP EM Możliwość odczytu, zapisu i modyfikacji tabel przechowywanych również na Hadoop ie Dostęp do Hadoopa przezroczysty dla użytkowników Możliwość uwierzytelniania Kerberosem Aktualne wsparcie dystrybucji Z ostatniego Global Forum: How to Leverage the Hadoop Distributed File System as a Storage Format for the SAS Scalable Performance Data Server... Zrównoleglony odczyt też bez warunku where Optymalizacja WHERE możliwa po stronie Hadoopa (przez MapReduce)

SAS SPDS 5.2 PRZYKŁADOWY KOD %let spdswdeb=yes; 105 +DATA MYSPDS.&source.3; 106 + SET MYSPDS.&source; 107 + WHERE joinvalue < 3; whinit: WHERE (joinvalue<3) whinit: wh-tree presented /-NAME = [joinvalue] --CLT---- \-LITN = [3] WHERE processing Hadoop cluster optimization candidate whinit returns: ALL EVAL6 108 +RUN; WHERE processing is optimized on the Hadoop cluster NOTE: There were 9375485 observations read from the data set SOURCE.TESTDATA. WHERE joinvalue<3;

SAS SPDS 5.2 WYBRANE INNE FUNKCJONALNOŚCI CLUSTER LIST OUT=<data set> Dodatkowe zabezpieczenie przed włamaniami nieznanych klientów Autentykacja przez SAS Metadata Server i LDAP Jedno hasło Współdzielenie procesów proxy (spdsbase) użytkownika w sesji SAS Zmniejszenie liczby procesów spdsbase w systemie operacyjnym

SAS SPDS 5.3 ZAPOWIEDZI Q2 SAS SPDS Zabezpieczenie komunikacji sieciowej z klientami. Szybsze odczyty zawartości biblioteki też przy proc datasets czy z dictionary.tables optymalizacja dla ACL-i Dalszy rozwój współpracy z Hadoop em (rozwój też w SPDE) Wsparcie dla nowszych wersji i dodatkowych dystrybucji Hadoop ów Cloudera: 5.4 Hortonworks: 2.3 dodanie MapR 5.0

SAS SPDS 5.3 I KOLEJNE ZAPOWIEDZI C.D. 5.3 Wsparcie dla Log4Sas Przekazywanie warunku where do klastra na Hadoop ie Przyszłe: Dalsza integracja i wparcie dla następnej wersji SAS-a Realizacja oczekiwań klientów

DZIĘKUJĘ