SQL Server 2016 w świecie Big Data

Podobne dokumenty
Hadoop i Spark. Mariusz Rafało

EMC ViPR Pamięć masowa definiowana programowo

ZALETY NOWSZYCH WERSJI I KIERUNKI ROZWOJU SPDS-A SŁAWOMIR BOKINIEC

INFORMATOR TECHNICZNY WONDERWARE

Iwona Milczarek, Małgorzata Marcinkiewicz, Tomasz Staszewski. Poznań,

Dokument zawiera instrukcję samodzielnej Instalacji Microsoft SQL Server 2008 R2 RTM - Express na potrzeby systemu Sz@rk.

INFORMATOR TECHNICZNY WONDERWARE

Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie. dr inż. Adam Piórkowski. Jakub Osiadacz Marcin Wróbel

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

INFORMATOR TECHNICZNY WONDERWARE

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

Przetwarzanie danych w chmurze

Instrukcja instalacji środowiska testowego na TestingCup wersja 1.0

DB2 with BLU acceleration rozwiązanie in-memory szybsze niż pamięć operacyjna&

INFORMATOR TECHNICZNY WONDERWARE

INFORMATOR TECHNICZNY WONDERWARE

Informatyka I. Standard JDBC Programowanie aplikacji bazodanowych w języku Java

Instalacja SQL Server Konfiguracja SQL Server Logowanie - opcje SQL Server Management Studio. Microsoft Access Oracle Sybase DB2 MySQL

HARMONOGRAM SZKOLEŃ styczeń - marzec 2017

Informatyka I. Programowanie aplikacji bazodanowych w języku Java. Standard JDBC.

Ćwiczenia 2 IBM DB2 Data Studio

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

Dlaczego my? HARMONOGRAM SZKOLEŃ kwiecień - czerwiec ACTION Centrum Edukacyjne. Autoryzowane szkolenia. Promocje RODO / GDPR

Aplikacja przetwarzająca własne funkcje agregujące w kodzie zarządzalnym.

Wprowadzenie do Apache Spark. Jakub Toczek

Architecture Best Practices for Big Data Deployments

Tomasz Grześ. Systemy zarządzania treścią

Instrukcja instalacji Amadeus Selling Platform

Witamy na konferencji SUSE Expert Days Warszawa, 17 kwietnia 2018 r.

Microsoft SQL Server Podstawy T-SQL

HARMONOGRAM SZKOLEŃ. październik - grudzień 2019

Witamy na konferencji SUSE Expert Days Kraków, 16 października 2018 r.

Hbase, Hive i BigSQL

10/28/2015 6:34 PM. Dziękujemy partnerom. Agenda

INFORMATOR TECHNICZNY WONDERWARE. Instalacja oprogramowania IndustrialSQL Server 8.0. Instalacja Microsoft SQL Server 2000 Standard Edition

SAS Access to Hadoop, SAS Data Loader for Hadoop Integracja środowisk SAS i Hadoop. Piotr Borowik

klikamy Next 4. Wybieramy zgodność z systemem Virtual Machine hardware compatibility z listy zaznaczamy Workstation 6 Next 5.

Programowanie obiektów

Optymalizacja poleceń SQL Wprowadzenie

Dlaczego my? HARMONOGRAM SZKOLEŃ lipiec - wrzesień ACTION Centrum Edukacyjne. Autoryzowane szkolenia. Promocje

Dlaczego my? HARMONOGRAM SZKOLEŃ październik - grudzień ACTION Centrum Edukacyjne. Autoryzowane szkolenia. Promocje

Co to jest chmura (Cloud Computing)?

Zalecana instalacja i konfiguracja Microsoft SQL Server 2016 Express Edition dla oprogramowania Wonderware

Czy OMS Log Analytics potrafi mi pomóc?

Zarządzanie strukturą bazy danych Oracle11g

NARZĘDZIA WIZUALIZACJI

Dlaczego my? HARMONOGRAM SZKOLEŃ kwiecień - czerwiec ACTION Centrum Edukacyjne. Autoryzowane szkolenia. Promocje

Tworzenie zapytań do Microsoft SQL Server

Cloud Customers Relationships Wymagania wersja systemu:

Szkolenie autoryzowane. MS Tworzenie zapytań do Microsoft SQL Server Strona szkolenia Terminy szkolenia Rejestracja na szkolenie Promocje

Klastrowanie bazy IBM DB2. Adam Duszeńko

Język UML w modelowaniu systemów informatycznych

IBM PureSystems Czy to naprawdę przełom w branży IT?

Instrukcja instalacji serwera Microsoft SQL Server 2014 Express. Aktualizacja dokumentu:

SAS 9.3 Instalacja SAS Enterprise Miner 7.1 w wersji Workstation

Bazy danych i usługi sieciowe

Język XQuery jako narzędzie do integracji danych Oracle XML Data Synthesis

Podstawy języka T-SQL : Microsoft SQL Server 2016 i Azure SQL Database / Itzik Ben-Gan. Warszawa, Spis treści

Baza danych in-memory. DB2 BLU od środka Artur Wrooski

KATALOG SZKOLEŃ. Windows Server 2016 Liczba dni STYCZEŃ LUTY MARZEC KWIECIEŃ MAJ CZERWIEC

Platforma dostępności Veeam dla rozwiązań Microsoft. Mariusz Rybusiński Senior System Engineer Veeam Microsoft MVP

Instalacja SAS 9.4 Foundation i SAS Enterprise Guide

Bazy Danych i Usługi Sieciowe

Problemy techniczne SQL Server

Aktualizacja środowiska JAVA a SAS

System. Instalacja bazy danych MySQL. Autor : Piotr Zielonka tel Piotrków Tryb., sierpień 2018r.

Paweł Rajba

Bazy danych. Andrzej Grzybowski. Instytut Fizyki, Uniwersytet Śląski

Praktyczne wykorzystanie elementów raportowania Microsoft Project 2010 /Project Server 2010 Sesja 5 PowerPivot & PowerView Bartłomiej Graczyk

Post-relacyjne bazy danych

Tuning SQL Server dla serwerów WWW

AUREA BPM Oracle. TECNA Sp. z o.o. Strona 1 z 7

Szkolenie: Jak mieć więcej czasu na wyciąganie wniosków

Ekspert MS SQL Server Oferta nr 00/08

Politechnika Poznańska TWO

1 Wprowadzenie do J2EE

Wprowadzenie do Hurtowni Danych

Instrukcja instalacji serwera bazy danych Microsoft SQL Server Express 2014

MongoDB. wprowadzenie. dr inż. Paweł Boiński, Politechnika Poznańska

Mateusz Kurleto NEOTERIC. Analiza projektu B2B Kielce, 18 października 2012

Instalacja SAS 9.3 Foundation i SAS Enterprise Guide

Operacja PIVOT w języku SQL w środowisku Oracle

Zadanie1. Wykorzystując serwis internetowy Wikipedii wyjaśnij następujące pojęcia: wirtualizacja, VirtualBox, Vmware, KVM, Virtual PC, Hyper-V.

SAP BASIS Architektura systemu klient Server

Biuletyn techniczny. System CDN OPT!MA i współpraca z SQL Server 2005 Express Edition CDN OPT!MA Copyright 2007 COMARCH SA

Platforma serwerowa Microsoft - do usług. O wdrożeniu Microsoft Cloud Platform w Beyond.pl

Block Change Tracking

Administracja serwerami

Full Text Search. Study Group Tomasz Libera

Projektowanie rozwiązań Big Data z wykorzystaniem Apache Hadoop & Family

NARZĘDZIA WIZUALIZACJI

Blaski i cienie wyzwalaczy w relacyjnych bazach danych. Mgr inż. Andrzej Ptasznik

Egzamin / zaliczenie na ocenę*

Zakup dostępu do usług przetwarzania danych w chmurze (np. Windows Azure lub równoważnej).

Instrukcja instalacji i konfiguracji bazy danych SQL SERVER 2008 EXPRESS R2. Instrukcja tworzenia bazy danych dla programu AUTOSAT 3. wersja 0.0.

Monitoring i archiving w Skype for Business deep dive

Instalacja SQL Server Express. Logowanie na stronie Microsoftu

Transkrypt:

temat prelekcji.. SQL Server 2016 w świecie Big Data prowadzący Bartłomiej Graczyk Data Platform Solution Architect bartlomiej.graczyk@microsoft.com bartek@graczyk.info.pl

Agenda Dane na świecie wczoraj, dzisiaj,jutro Wyzwania oraz zmieniające się potrzeby w zakresie przetwarzania danych SQL Server 2016 w świecie Big Data

Agenda Dane na świecie wczoraj, dzisiaj,jutro

Dane na świecie CYFROWE ANALOGOWE 1985 1990 1995 2000 2005 2010 2015 2020

Dane na świecie CYFROWE ANALOGOWE DATACENTERS (CLOUD) PC / DEVICE DIGITAL TAPE DVD / BLU-RAY CD 1985 1990 1995 2000 2005 2010 2015 2020

Dane na świecie POŁĄCZONE CYFROWE ANALOGOWE DATACENTERS (CLOUD) PC / DEVICE DIGITAL TAPE DVD / BLU-RAY CD 1985 1990 1995 2000 2005 2010 2015 2020

Dane na świecie POŁĄCZONE CYFROWE ANALOGOWE CLOUD / IoT PC / MOBILE 1985 1990 1995 2000 2005 2010 2015 2020

Dane na świecie POŁĄCZONE CYFROWE ANALOGOWE CLOUD / IoT MOBILE 1985 1990 1995 2000 2005 2010 2015 2020

40 ZB 57x ilość wszystkich ziarenek piasku na wszystkich plażach świata 40 ZB = 40 trylionów gigabajtów

Agenda Dane na świecie wczoraj, dzisiaj,jutro Wyzwania oraz zmieniające się potrzeby w zakresie przetwarzania danych

Rosnąca ilość źródeł danych i znaczące ilości danych wymagające przetwarzania i analizy danych w różnych formatach Posiadane dane są zbyt wartościowe, aby je usunąć, jednak ich przechowywanie jest jednocześnie dość kosztowne Znaczący spadek kosztu przestrzeni dyskowej. Wymiana danych pomiędzy systemami, w tym również bazami nierelacyjnymi

Agenda Dane na świecie wczoraj, dzisiaj,jutro Wyzwania oraz zmieniające się potrzeby w zakresie przetwarzania danych SQL Server 2016 w świecie Big Data

Technologia (framework) pozwalającą na integrację danych świata relacyjnego (SQL Server) oraz nierelacyjnego (Hadoop) z wykorzystaniem języka T-SQL

PolyBase w SQL Server 2016 Wykorzystanie T-SQL w dostępie do danych relacyjnych oraz nierelacyjnych przechowywanych on-premise lub Azure T-SQL query SQL Server Hadoop Azure Blob Storage Apps

64-bit SQL Server Enterprise / Developer (Standard only compute node) Microsoft.NET Framework 4.0 Oracle Java SE RunTime Environment (JRE) version 7.51 lub wyższy Pamięć minimalna: 4GB Minimalna przestrzeń dyskowa: 2GB

Instalacja z poziomu SQL Server Installation Center (wymagany nośnik) W oknie usług należy wybrać PolyBase Query Service for External Data. Należy wskazać konto, na którym uruchomione zostaną usługi: PolyBase Engine Service oraz PolyBase Data Movement Service

-- Enter head node details: (head node machine name, head node dms control channel port, head node sql server name) PolyBase Engine PolyBase DMS PolyBase DMS PolyBase DMS PolyBase DMS EXEC sp_polybase_join_group SQL-CMP01', 16450, 'MSSQLSERVER'; Dodatkowe widoki DMV : sys.dm_exec_compute_nodes sys.dm_exec_compute_node_status -- usnięcie węzła z grupy EXEC sp_polybase_leave_group;

Hadoop MapReduce HDFS Baza danych SQL wysyła operację do wykonania przez Hadoop jako zadanie MapReduce Analiza kosztu wykonania zapytania i decyzja o sposobie realizacji (import vs pushdown)

-- select on external table (data in HDFS) SELECT * FROM Person WHERE person_type = 3 and p_account_balance < 0; Potencjalny plan wykonania zapytania: Wykonanie zapytania Import z HDFS Select * from T where person_type = 3 and p_account_balance < 0 HDFS Person file read into T CREATE temp table T Wykonanie operacji na węzłach obliczeniowych

-- select and aggregate on external table (data in HDFS) SELECT AVG(p_account_balance) FROM Person WHERE person_type = 3 and p_account_balance < 0; Plan wykonania: Co dzieje się w tym kroku? Krok 1: Kompilacja predykatu do Java i wygenerowanie zadania MapReduce (MR) Krok 2: Silnik przekazuje zadane MR do klastra Hadoop. Wynik zwracany w postaci hdfstemp MR Job on Hadoop Zastosowanie filtra i wyliczenie agregatu dla osoby

-- select and aggregate on external table (data in HDFS) SELECT AVG(p_account_balance) FROM Person WHERE person_type = 3 and p_account_balance < 0; Plan wykonania: 1. Predykaty I agregacje RETURN OPERATION Select * from T wypychane do klastra Hadoop jako zadania MapReduce IMPORT hdfstemp CREATE temp table T MR Job on Hadoop Read hdfstemp into T On DW compute nodes Zastosowanie filtra i wyliczenie agregatu dla osoby 2. Optymalizator na podstawie kosztu wykonania zapytania decyduje o wypchnięciu zapytania

Azure Azure Storage Volume Azure Storage Volume Azure Storage Volume Hortonworks lub Cloudera Hadoop 2.0 lub wyższa Linux lub Windows On premises lub w Azure Azure Storage Blobs (ASB) PolyBase odczytuje/zapisuje dane na ASB korzystając z Hadoop RecordReaders/Writers Brak wsparcia dla compute push-down

PolyBase DLLs PolyBase DLLs PolyBase DLLs PolyBase DLLs Instalacja jednej lub kilku instancji SQL Server z obsługą PolyBase PolyBase DLLs (Engine oraz DMS) są instalowane i rejestrowane jako usługi Windows Wymagane: JRE (Oracle)

Określenie źródła danych Hadoop sp_configure -- Run sp_configure hadoop connectivity -- and set an appropriate value sp_configure @configname = 'hadoop connectivity', @configvalue = 7; GO RECONFIGURE GO Dostępne wartości -- List the configuration settings for -- one configuration name sp_configure @configname='hadoop connectivity'; GO

Bartłomiej Graczyk Data Platform Solution Architect bagra@microsoft.com bartek@graczyk.info.pl