Wprowadzenie do hurtowni danych

Wielkość: px
Rozpocząć pokaz od strony:

Download "Wprowadzenie do hurtowni danych"

Transkrypt

1 Wprowadzenie do hurtowni danych przygotował: Paweł Kasprowski

2 Informacje ogólne ( ) Wykładowca: Paweł Kasprowski Temat: Wprowadzenie do hurtowni danych Umiejętności wymagane: Znajomość zasady działania relacyjnej bazy danych Znajomość języka SQL i serwera Microsoft SQL Server Umiejętności uzyskiwane: Znajomość podstawowych elementów hurtowni danych Użytkowanie narzędzia SQL Server Business Intelligence Development Studio Tworzenie i konfiguracja hurtowni danych w Microsoft Analysis Services

3 Plan przedmiotu Podstawy hurtowni danych Główne właściwości, architektura Tworzenie hurtowni danych w SSBDS Kostki, miary, wymiary Modyfikacje wymiarów Hierarchie, relacje, obliczenia, grupowanie Rozbudowa hurtowni danych Obliczenia, calculated members, podstawy MDX Przechowywanie hurtowni danych MOLAP, ROLAP, HOLAP

4 Podstawowe wiadomości przygotował:

5 Przykład Baza danych pracująca w hipermarkecie Szybkie aktualizacje Dużo rozdrobnionych danych Praca on-line Ważna dostępność Problemy z analizą danych, raportowaniem

6 Czym jest hurtownia danych? OLTP OnLine Transaction Processing przetwarzanie bieżące ciągłe zmiany w bazie optymalizacja aktualizacji współbieżność małe użytkowanie danych historycznych skomplikowane i wolne zapytania analityczne OLAP OnLine Analytical Processing optymalizacja skomplikowanych zapytań brak (lub rzadkie) aktualizacje użytkowanie danych historycznych

7 Kostka (cube) Kostka to podstawowy element hurtowni danych podlegający analizie W jednej hurtowni może się znajdować więcej kostek Kostką charakteryzują wymiary (dimensions), np. Czas Produkt Klient Sprzedawca Wewnątrz kostki znajdują się miary (measures) ( wartość wartości które interesują analityka (np. ilość,

8 Struktura kostki ( measures ) Tablica faktów zawiera miary ( dimensions ) Tablice wymiarów Wymiary mogą mieć: ( star ) Schemat gwiazdy ( snowflake ) Schemat płatka śniegu Strukturę parent-child

9 Tablica faktów Jeden fakt jeden wiersz Tablica faktów zawiera: ( measures ) wartości mierzone miary klucze obce do tablic wymiarów Dane z tablicy faktów podlegają analizie agregacjom, przeliczeniom

10 Schemat gwiazdy Wymiar w tablicy faktów znajduje się identyfikator dotyczący wymiaru Schemat gwiazdy jedna tablica zawierająca wszystkie informacje na temat wymiaru Przykład pole customer_id jest kluczem obcym w tablicy faktów sales tablica Customer zawiera dane klientów

11 Schemat snowflake Wymiar w tablicy faktów znajduje się identyfikator dotyczący wymiaru Schemat płatka śniegu dane na temat wymiaru zawarte są w większej ilości tabel wzajemnie ze soba powiązanych Przykład pole customer_id jest kluczem obcym w tablicy faktów sales wymiar zawiera tablice product i product_class pole product_class_id jest kluczem obcym w tablicy product

12 Wymiar parent-child Dla pokazania hierarchii obiektów tej samej klasy Struktura parent-child tablica wymiaru zawiera drzewo wzajemnych powiązań między jej rekordami Przykład: pole employee_id jest kluczem obcym w tablicy faktów sales tablica pracowników (employee) zawiera pola employee_id oraz supervisor_id pokazujący zwierzchnika danego pracownika wymiar tworzy na tej podstawie drzewo hierarchiczne Kierownik-Podwładny

13 Wymiar czasowy Na podstawie pojedynczego pola datowego Pozwala na automatyczne tworzenie poziomów Year, Month, Day Year, Quarter, Month, Day Year, Week, Day Year, Month, Day, Hour, Minute itd

14 Wymiary - hierarchie Składniki wymiarów ( levels ) Poziomy ( members ) Elementy Wymiar stanowi drzewo zawierające elementy na poszczególnych poziomach Np. wymiar customer: poziomy: country, state, city, name elementy: USA, Illinois, Chicago, Adamsky

15 Poziomy i elementy level country USA Canada Mexico level state Yucatan Illionois Florida level city Chicago Orlando Richmond

16 Poziomy i elementy USA Oregon Illionois Chicago Florida Orlando Canada British Columbia Richmond Mexico Yucatan Merida

17 Miary (measures) Tablica faktów zawiera: klucze obce do tablic wymiarów ( measures ) wartości mierzone miary Miary numeryczne są agregowane dla poszczególnych elementów wymiarów ( Florydzie (np. sprzedaż w 1998 na jeśli jest ich więcej same tworzą wymiar o nazwie Measures

18 Operacje na kostkach ( wycinek ) Slice wycięcie jednej warstwy dla wartości z jednego wymiaru (np. dane z Oregonu lub dane z 1998 ( roku (? kostkowanie ) Dice wycięcie podkostki po określeniu wartości z kilku wymiarów (np. dane o sprzedaży marchwi na ( roku Florydzie w 2001

19 Operacje na kostkach ( drill-up ) Zwijanie analiza danych bardziej zagregowanych przykład: analiza sprzedaży od poszczególnych osób do sumarycznych danych dla całych stanów ( drill-down ) Rozwijanie analiza danych bardziej szczegółowych przykład: analiza sumarycznej sprzedaży i schodzenie na poziom poszczególnych stanów, miast i na koniec osób

20 Microsoft SQL Server Informacje ogólne

21 Architektura klient-serwer klient SQL Server Results Query Query OLTP OLAP

22 Serwisy Windows MS SQL Server serwer relacyjnych baz danych SQL Server Agent wykonywanie zadań Business Intelligence Analysis Services Reporting Services Integration Services

23 Bazy systemowe Master konfiguracja serwera Model model dla nowych baz Tempdb dla obiektów chwilowych Msdb dla SQL Server Agent'a

24 Narzędzia SQL Server Management Studio SQL Server Business Intelligence Development Studio Narzędzia konfiguracyjne SQL Server Configuration Manager SQL Server Surface Area Configuration Z linii poleceń: sqlcmd

25 Maksymalne... Baz na serwerze Wielkość bazy Plików w bazie Wielkość pliku Obiektów w bazie (tables, views, stored procedures, extended stored procedures, triggers, rules, defaults, and constraints) TB TB Kolumn w tabeli 1024

26 Wersje Podstawowe: SQL Server Express Edition SQL Server Workgroup Edition SQL Server Standard Edition SQL Server Enterprise Edition Inne: SQL Server Developer Edition SQL Server Mobile (Compact) Edition

27 SQL Management Studio Podstawowa aplikacja do obsługi serwera Sparametryzowa wersja Visual Studio 2005 IDE Umożliwia: tworzenie i modyfikację obiektów w formatkach edycję skryptów SQL edycję skryptów MDX

28 SQL Management Studio Wszystkie okienka są niemodalne Drzewa w oknach (np. Registered Servers) rozwijane są asynchroniczne - nie blokuje to narzędzia Możliwość tworzenia projektów solutions podobnie jak w Visual Studio Tworzenie kodu T-SQL, MDX, MX i XMLA "Skryptowanie" automatyczne tworzenie kodu T- SQL na podstawie wprowadzonych w formatce danych Wiele narzędzi zintegrowanych z konsolą (np. Report Designer, DTS Designer)

29 Pakiet Analysis Services przygotował:

30 Pakiet Business Intelligence Analysis Services hurtownie danych Integration Services Procesy ETL (extract transform load) Reporting Services raportowanie Business Intelligence Development Studio użytkowanie elementów pakietu

31 Analysis Services Serwer przechowujący hurtownie danych Przechowuje struktury, agregacje ale nie pojedyncze dane Dane wydobywane są z bazy relacyjnej

32 Business Intelligence Development Studio Oparte na Visual Studio Typy projektów Analysis Services ( SSIS Integration Services (pakiety Reporting Services Narzędzie standardowe w SQL Server do tworzenia projektów nie do administracji!

33 Etapy tworzenia projektu New Analysis Services Project Wybór źródła danych Stworzenie widoku danych Stworzenie kostki Przeglądanie kostki

34 Tworzenie projektu przygotował:

35 Elementy projektu przygotował:

36 Źródło danych przygotował:

37 Widok przygotował:

38 Schemat tabel przygotował:

39 Budowa kostki Wybór widoku Wizard automatycznie analizuje tabele Wybór tabel faktów i wymiarów Określenie pól dla tablicy wymiaru czasowego (Time Dimesion) Wybór miar Order Quantity Unit Price Discount Pct Sales Amount

40 Mapowanie pól czasowych przygotował:

41 Gotowa kostka przygotował:

42 Elementy kostki Zbiór miar: Fact Internet Sales Wymiary czasowe OrderDate ShipDate DueDate Wymiar produktowy Dim Product

43 Zakładki Cube Structure Dimesions Calculations KPIs Actions Partitions Perspectives Translations Browser

44 Zakładka Cube Structure przygotował:

45 Etapy pracy Stworzenie kostki Zbudowanie kostki Umieszczenie na serwerze (deployment) Przeglądanie (browse)

46 Przeglądanie danych przygotował:

47 Przykładowe zadania Wyszukaj ile produktów zamówiono w styczniu 2004 Rozdziel powyższe wg kolorów produktów Każdy kolor rozdziel wg linii produktowych Zmień zestawienie tak, aby prezentowało linie produktowe z podziałem na kolory Porównaj te ilości w kolejnych styczniach

Microsoft SQL ServerTM 2005 Integration Services

Microsoft SQL ServerTM 2005 Integration Services Microsoft SQL ServerTM 2005 Integration Services Krok po kroku Paul Turley, Joe Kasprzak, Scott Cameron, Satoshi Iizuka oraz Pablo Guzman z Hitachi Consulting Microsoft SQL Server 2005 Integration Services

Bardziej szczegółowo

Hurtownie danych czyli jak zapewnić dostęp do wiedzy tkwiącej w danych

Hurtownie danych czyli jak zapewnić dostęp do wiedzy tkwiącej w danych Hurtownie danych czyli jak zapewnić dostęp do wiedzy tkwiącej w danych Rodzaj zajęć: Wszechnica Popołudniowa Tytuł: Hurtownie danych czyli jak zapewnić dostęp do wiedzy tkwiącej w danych Autor: mgr inż.

Bardziej szczegółowo

Hurtownie danych a transakcyjne bazy danych

Hurtownie danych a transakcyjne bazy danych Hurtownie danych a transakcyjne bazy danych Materiały źródłowe do wykładu: [1] Jerzy Surma, Business Intelligence. Systemy wspomagania decyzji, Wydawnictwo Naukowe PWN, Warszawa 2009 [2] Arkadiusz Januszewski,

Bardziej szczegółowo

Business Intelligence (BI) Hurtownie danych, Eksploracja danych. Business Intelligence (BI) Mnogość pojęć z okolic BI

Business Intelligence (BI) Hurtownie danych, Eksploracja danych. Business Intelligence (BI) Mnogość pojęć z okolic BI Business Intelligence (BI) Hurtownie danych, Eksploracja danych Na początek tłumaczenie inteligencja biznesowa (fatalnie!) analityka biznesowa (lepiej?) usługi biznesowe (lepiej?) przetwarzanie analityczne

Bardziej szczegółowo

Znaczenie Business Performance Management w projektach IT

Znaczenie Business Performance Management w projektach IT Znaczenie Business Performance Management w projektach IT Arkadiusz Januszewski Uniwersytet Technologiczno-Przyrodniczy w Bydgoszczy Wydział Zarządzania Katedra Inżynierii Zarządzania Podyplomowe Studia

Bardziej szczegółowo

Realizacja hurtowni danych dla administracji publicznej na przyk³adzie budowy systemu IACS

Realizacja hurtowni danych dla administracji publicznej na przyk³adzie budowy systemu IACS IX Konferencja PLOUG Koœcielisko PaŸdziernik 2003 Realizacja hurtowni danych dla administracji publicznej na przyk³adzie budowy systemu IACS Mariusz Muszyñski Pentacomp Systemy Informatyczne Prace nad

Bardziej szczegółowo

Wersja 9.5. Dokumentacja. Moduł: Business Intelligence. Aktualizacja dokumentu: 2009-12-08. Moduł: Business Intelligence 1 Wersja 9.

Wersja 9.5. Dokumentacja. Moduł: Business Intelligence. Aktualizacja dokumentu: 2009-12-08. Moduł: Business Intelligence 1 Wersja 9. Wersja 9.5 Dokumentacja Moduł: Business Intelligence Aktualizacja dokumentu: 2009-12-08 Moduł: Business Intelligence 1 Wersja 9.0 Copyright 2009 COMARCH Wszelkie prawa zastrzeżone Nieautoryzowane rozpowszechnianie

Bardziej szczegółowo

PROJEKT I REALIZACJA APLIKACJI WSPIERAJĄCEJ ZARZĄDZANIE SKLEPEM INTERNETOWYM ZA POMOCĄ USŁUG ANALIZY DANYCH W SQL SERVERZE

PROJEKT I REALIZACJA APLIKACJI WSPIERAJĄCEJ ZARZĄDZANIE SKLEPEM INTERNETOWYM ZA POMOCĄ USŁUG ANALIZY DANYCH W SQL SERVERZE WYŻSZA SZKOŁA INFORMATYKI I ZARZĄDZANIA COPERNICUS WE WROCŁAWIU KIERUNEK: INFORMATYKA (INF) SPECJALNOŚĆ: SYSTEMY I SIECI KOMPUTEROWE (SSK) PRACA DYPLOMOWA INŻYNIERSKA Grzegorz ŚLIWIŃKI PROJEKT I REALIZACJA

Bardziej szczegółowo

Znak sprawy: ZP-4/DTP/2013. Załącznik Nr 5.1 do SIWZ

Znak sprawy: ZP-4/DTP/2013. Załącznik Nr 5.1 do SIWZ Znak sprawy: ZP-4/DTP/2013 Załącznik Nr 5.1 do SIWZ Dostawa infrastruktury informatycznej i oprogramowania na potrzeby tworzenia i rozwoju nowoczesnych e-usług i aplikacji on-line oraz ich s wiadczenia

Bardziej szczegółowo

ANALIZA DANYCH SYSTEMU ERP WYKORZYSTANIE KONCEPCJI BUSINESS INTELLIGENCE

ANALIZA DANYCH SYSTEMU ERP WYKORZYSTANIE KONCEPCJI BUSINESS INTELLIGENCE ZESZYTY NAUKOWE POLITECHNIKI ŚLĄSKIEJ Seria: ORGANIZACJA I ZARZĄDZANIE z. XX XXXX Nr kol. XXXX Marcin WYSKWARSKI Politechnika Śląska Wydział Organizacji i Zarządzania Instytut Ekonomii i Informatyki ANALIZA

Bardziej szczegółowo

BAZY DANYCH. Informatyka i Technologia Informacyjna Suwałki - 2013

BAZY DANYCH. Informatyka i Technologia Informacyjna Suwałki - 2013 BAZY DANYCH Informatyka i Technologia Informacyjna Suwałki - 2013 Przedmiot: Bazy danych Ćwiczenia: 16 godzin 25 maja 2013 r. sala 300 10:30-17:25 (8 godzin), 8 czerwca 2013 r. sala 300 10:30-17:25 (8

Bardziej szczegółowo

PROGRAM KSZTAŁCENIA Edycja XXIV

PROGRAM KSZTAŁCENIA Edycja XXIV INSTYTUT INFORMATYKI I GOSPODARKI CYFROWEJ SZKOŁY GŁÓWNEJ HANDLOWEJ W WARSZAWIE ORAZ STUDIA PODYPLOMOWE INFORMATYCZNE SYSTEMY ZARZĄDZANIA STRATEGIA, PROJEKTOWANIE, INTEGRACJA PROGRAM KSZTAŁCENIA Edycja

Bardziej szczegółowo

Opis przedmiotu zamówienia

Opis przedmiotu zamówienia Opis przedmiotu zamówienia do postępowania o zamówienie publiczne na: kompleksową dostawę, wdrożenie i utrzymanie Zintegrowanego Informatycznego Systemu Wspomagania Zarządzania Uczelnią klasy ERP wraz

Bardziej szczegółowo

Załącznik nr 9 do swiz

Załącznik nr 9 do swiz Załącznik nr 9 do swiz 1. Opis przedmiotu zamówienia Struktura organizacyjna zamawiającego. Państwową Inspekcję Pracy (PIP) tworzy Główny Inspektorat Pracy (GIP), 16 okręgowych inspektoratów pracy (OIP)

Bardziej szczegółowo

USOS: System raportowania i analiz statystycznych

USOS: System raportowania i analiz statystycznych Uniwersytet Warszawski Wydział Matematyki, Informatyki i Mechaniki Filip Grotkowski Nr albumu: 235984 USOS: System raportowania i analiz statystycznych Praca magisterska na kierunku INFORMATYKA Praca wykonana

Bardziej szczegółowo

Wymagania systemu Typu BI (Business Intelligence, wymagania bazy dany dla BI Załącznik nr 10)

Wymagania systemu Typu BI (Business Intelligence, wymagania bazy dany dla BI Załącznik nr 10) Nr i data umowy o dofinansowanie projektu w ramach RPO WO 2007 2013 w ramach: Osi priorytetowej RPOP.02.02.00 Społeczeństwo informacyjne Działania RPOP.02.02.00 Moduły informacyjne, platformy e-usługi

Bardziej szczegółowo

Szczegółowy opis przedmiotu zamówienia

Szczegółowy opis przedmiotu zamówienia 1. Część 1 CPV: 48000000-8 - Pakiety oprogramowania i systemy informatyczne 48620000-0 - Systemy operacyjne 48214000-1 - Pakiety oprogramowania do sieciowego systemu operacyjnego 48710000-8 - Pakiety oprogramowania

Bardziej szczegółowo

Problematyka hurtowni danych

Problematyka hurtowni danych Plan wykładu Problematyka hurtowni 1. Bibliografia 2. Systemy klasy Business Intelligence 3. Podejścia do integracji 4. Definicja hurtowni 5. Architektury hurtowni Hurtownie, wykład Bartosz Bębel E-mail:

Bardziej szczegółowo

Niniejszy dokument zawiera podstawowe informacje o przeznaczeniu, instalacji oraz użytkowaniu modułu do analiz płac. SPIS TREŚCI

Niniejszy dokument zawiera podstawowe informacje o przeznaczeniu, instalacji oraz użytkowaniu modułu do analiz płac. SPIS TREŚCI Niniejszy dokument zawiera podstawowe informacje o przeznaczeniu, instalacji oraz użytkowaniu modułu do analiz płac. Data ostatniej modyfikacji: 07.07.2009r. Autor oraz kierownik projektu: Piotr Maj SPIS

Bardziej szczegółowo

O autorach... 19 Dedykacje... 20 Podziękowania... 20 Wprowadzenie... 21. Wprowadzenie do Visual Studio 2008... 25

O autorach... 19 Dedykacje... 20 Podziękowania... 20 Wprowadzenie... 21. Wprowadzenie do Visual Studio 2008... 25 Spis treści O autorach... 19 Dedykacje... 20 Podziękowania... 20 Wprowadzenie... 21 Część I Wprowadzenie do Visual Studio 2008... 25 Rozdział 1. Krótki przegląd środowiska Visual Studio 2008... 27 Oczekiwane

Bardziej szczegółowo

Reprezentacja informacji w komputerze

Reprezentacja informacji w komputerze REPREZENTACJA INFORMACJI W KOMPUTERZE... 1 ARCHITEKTURA SYSTEMU KOMPUTEROWEGO... 2 SYSTEMY OPERACYJNE... 4 SIECI KOMPUTEROWE... 7 ARKUSZE KALKULACYJNE... 9 WPROWADZENIE DO BAZY DANYCH... 11 SYSTEMY WSPOMAGAJĄCE

Bardziej szczegółowo

INTEGRACJA ZASOBÓW I USŁUG INFORMACYJNYCH W ORGANIZACJI BIZNESOWEJ

INTEGRACJA ZASOBÓW I USŁUG INFORMACYJNYCH W ORGANIZACJI BIZNESOWEJ Zeszyty Naukowe 203-217 Piotr ZASKÓRSKI 1 INTEGRACJA ZASOBÓW I USŁUG INFORMACYJNYCH W ORGANIZACJI BIZNESOWEJ Streszczenie W artykule podjęto próbę dyskusji na temat integracji rozwiązań standardowych i

Bardziej szczegółowo

Innowacyjność rozwiązań SAP działających w oparciu o. platformę in-memory SAP HANA

Innowacyjność rozwiązań SAP działających w oparciu o. platformę in-memory SAP HANA Innowacyjność rozwiązań SAP działających w oparciu o platformę in-memory SAP HANA OPINIA O NOWEJ TECHNOLOGII Kraków 2013 2/31 Spis treści: 1. Przedmiot opinii... 5 2. Streszczenie opinii dotyczącej innowacyjności...

Bardziej szczegółowo

Konrad Wypchło, Program Manager, ITMAGINATION. Włodzimierz Bielski, Architekt, ITMAGINATION

Konrad Wypchło, Program Manager, ITMAGINATION. Włodzimierz Bielski, Architekt, ITMAGINATION 1. Prelegenci Konrad Wypchło, Program Manager, ITMAGINATION Włodzimierz Bielski, Architekt, ITMAGINATION ITMAGINATION jest partnerem Microsoft od 6 lat, czyli od początku istnienia firmy. Główną działalnością

Bardziej szczegółowo

Asseco WAPRO OPROGRAMOWANIE DLA FIRM PODRĘCZNIK UŻYTKOWNIKA

Asseco WAPRO OPROGRAMOWANIE DLA FIRM PODRĘCZNIK UŻYTKOWNIKA ASSECO BUSINESS SOLUTIONS SA Asseco WAPRO OPROGRAMOWANIE DLA FIRM PODRĘCZNIK UŻYTKOWNIKA WF-Mag dla Windows WF-FaKir dla Windows WF-KaPeR dla Windows WF-GANG dla Windows WF-bEST dla Windows WF-Analizy

Bardziej szczegółowo

Podręcznik użytkownika IBM SPSS Statistics 22 System podstawowy

Podręcznik użytkownika IBM SPSS Statistics 22 System podstawowy Podręcznik użytkownika IBM SPSS Statistics 22 System podstawowy Uwaga Przed skorzystaniem z niniejszych informacji oraz produktu, którego one dotyczą, należy zapoznać się z informacjami zamieszczonymi

Bardziej szczegółowo

Sławomir Pawlikowski (Slawomir.Pawlikowski@pl.ibm.com)

Sławomir Pawlikowski (Slawomir.Pawlikowski@pl.ibm.com) Sławomir Pawlikowski (Slawomir.Pawlikowski@pl.ibm.com) Pomiary wydajności aplikacji dla WebSphere Process Server z użyciem narzędzia Request Metrics Narzędzie Request Metrics (Metryki żądań), wprowadzone

Bardziej szczegółowo

FAQ: 00000055/PL Data: 17/04/2013 WinCC v7 konfiguracja modułu opcjonalnoego WinCC/Downtime Monitor

FAQ: 00000055/PL Data: 17/04/2013 WinCC v7 konfiguracja modułu opcjonalnoego WinCC/Downtime Monitor Zakład produkcyjny jest tworem żywym, nieprzewidywalnie zmiennym, a często bardzo złożonym i zaawansowanym technologicznie. Aby okiełznać procesy oraz zmiany zachodzące na terenie placówki wymagana jest

Bardziej szczegółowo

Infrastruktura. Wymagania ogólne. Obudowa serwerów kasetowych. Załącznik nr 7. Opis przedmiotu zamówienia Pakiet nr 1

Infrastruktura. Wymagania ogólne. Obudowa serwerów kasetowych. Załącznik nr 7. Opis przedmiotu zamówienia Pakiet nr 1 Załącznik nr 7 Opis przedmiotu zamówienia Pakiet nr 1 Infrastruktura Wymaganie Globalne Normy Oznakowanie Wymagania ogólne Parametry minimalne Urządzenia muszą być fabrycznie nowe. Muszą być wyprodukowane

Bardziej szczegółowo

Business Intelligence (BI)

Business Intelligence (BI) Business Intelligence (BI) Business Intelligence (BI) moŝna zdefiniować jako "szeroki wachlarz aplikacji i technologii słuŝących do zbierania, eksploracji, interpretacji i analizy danych po to, który prowadzi

Bardziej szczegółowo