Wprowadzenie do hurtowni danych



Podobne dokumenty
wymiaru DimCustomer czyli wymiaru klienta zamawiającego produkty przez Internet,

Wprowadzenie do hurtowni danych

Kostki OLAP i język MDX

Część I Istota analizy biznesowej a Analysis Services

OnLine Analytical Processing (OLAP) Kostki OLAP i zapytania MDX

Usługi analityczne podstawy budowy kostki analitycznej Część druga - zarządzanie

Spis treści. Część I Wprowadzenie do pakietu oprogramowania Analysis Services

ANALYSIS SERVICES. 1. Tworzymy połączenie ze źródłem danych. 2. Tworzymy nowy widok dla źródła danych

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Laboratorium Technologii Informacyjnych. Projektowanie Baz Danych

Schematy logiczne dla hurtowni danych

Procesowanie i partycjonowanie Analysis Services od podszewki (300) Adrian Chodkowski Adrian.Chodkowski@outlook.com

5. Uruchomienie SQL Server Business Intelligence Development Studio Menu Start -> SQL Server Business Intelligence Development Studio

Rady i porady użytkowe

Hurtownie danych. 31 stycznia 2017

Hurtownia danych. Załącznik Nr 1 do SIWZ. Opis przedmiotu zamówienia. Lp. FUNKCJONALNOŚĆ/PARAMETRY WYMAGANE

Spis tre±ci. Przedmowa... Cz ± I

LABORATORIUM 8,9: BAZA DANYCH MS-ACCESS

SAS OLAP Cube Studio Wprowadzenie

Proces ETL. Katedra Inżynierii Oprogramowania Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska {kris,

ORACLE. System Zarządzania Bazą Danych Oracle. Oracle Advanced SQL

Systemy baz danych Prowadzący: Adam Czyszczoń. Systemy baz danych. 1. Import bazy z MS Access do MS SQL Server 2012:

Bazy analityczne (hurtownie danych, bazy OLAP)

Business Intelligence

TI - Bazy TECHNOLOGIE INFORMACYJNE

Wstęp do Business Intelligence

Pierwsze wdrożenie SAP BW w firmie

Bazy danych TERMINOLOGIA

Baza danych. Modele danych

DOKUMENTY. v Strona 1 z 10

Część 1: OLAP. Raport z zajęć laboratoryjnych w ramach przedmiotu Hurtownie i eksploracja danych

Bazy danych. Bazy danych. Zapytania SELECT. Dr inż. Paweł Kasprowski.

BAZY DANYCH LABORATORIUM. Studia niestacjonarne I stopnia

TOPWEB Microsoft Excel 2013 i PowerBI Przygotowanie danych, analiza i efektowna prezentacja wyników raportów

LK1: Wprowadzenie do MS Access Zakładanie bazy danych i tworzenie interfejsu użytkownika

Modele danych - wykład V. Zagadnienia. 1. Wprowadzenie 2. MOLAP modele danych 3. ROLAP modele danych 4. Podsumowanie 5. Zadanie fajne WPROWADZENIE

Plan. Formularz i jego typy. Tworzenie formularza. Co to jest formularz? Typy formularzy Tworzenie prostego formularza Budowa prostego formularza

SQL Server i T-SQL w mgnieniu oka : opanuj język zapytań w 10 minut dziennie / Ben Forta. Gliwice, Spis treści

Hurtownie danych. Rola hurtowni danych w systemach typu Business Intelligence

Plan. Wprowadzenie. Co to jest APEX? Wprowadzenie. Administracja obszarem roboczym

WPROWADZENIE DO BAZ DANYCH

Język SQL, zajęcia nr 1

Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem. dr Jakub Boratyński. pok. A38

Microsoft Access materiały pomocnicze do ćwiczeń cz. 1

Laboratorium nr 4. Temat: SQL część II. Polecenia DML

Business Intelligence Beans + Oracle JDeveloper

Hurtownie danych. Hurtownie danych. dr hab. Maciej Zakrzewicz Politechnika Poznańska Instytut Informatyki. Maciej Zakrzewicz (1)

Co to jest Baza Danych

Część I Tworzenie baz danych SQL Server na potrzeby przechowywania danych

Wybrane zmiany wprowadzone w pakiecie Oprogramowanie: SyriuszStd

PRZESTRZENNE BAZY DANYCH WYKŁAD 2

Krzysztof Kadowski. PL-E3579, PL-EA0312,

Modele danych - wykład V

Wymagane jest podłączenie serwera do Internetu (konieczne do zdalnego dostępu).

Bazy danych. Zenon Gniazdowski WWSI, ITE Andrzej Ptasznik WWSI

Monitoring procesów z wykorzystaniem systemu ADONIS. Krok po kroku

Dane wejściowe. Oracle Designer Generowanie bazy danych. Wynik. Przebieg procesu

Hurtownie danych. Wstęp. Architektura hurtowni danych. CO TO JEST HURTOWNIA DANYCH

Autor: Joanna Karwowska

Usługi analiz danych: tworzenie i modyfikacja kostki danych

Nowości w wersji 10.2 Comarch CDN XL Business Intelligence

EXCEL TABELE PRZESTAWNE

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE

T-SQL dla każdego / Alison Balter. Gliwice, cop Spis treści. O autorce 11. Dedykacja 12. Podziękowania 12. Wstęp 15

OLAP i hurtownie danych c.d.

Projektowanie bazy danych. Jarosław Kuchta Projektowanie Aplikacji Internetowych

Nowości w 3.1. Andrzej Solski. CONTROLLING SYSTEMS sp. z o.o.

Założenia do ćwiczeń: SQL Server UWM Express Edition: \SQLEXPRESS. Zapoznaj się ze sposobami użycia narzędzia T SQL z wiersza poleceń.

Modelowanie wymiarów

Krzysztof Kluza proste ćwiczenia z baz danych

Microsoft Excel 2013: Budowanie modeli danych przy użyciu PowerPivot

Backend Administratora

Fizyczna struktura bazy danych w SQL Serwerze

HURTOWNIE DANYCH Dzięki uprzejmości Dr. Jakuba Wróblewskiego

MDW. (Moduł Dystrybucji Wysyłek) (Moduł Magento) v Strona 1 z 11

Oferta szkoleniowa Yosi.pl 2012/2013

Podręcznik użytkownika. Użytkownik niezalogowany

DMX DMX DMX DMX: CREATE MINING STRUCTURE. Tadeusz Pankowski

77. Modelowanie bazy danych rodzaje połączeń relacyjnych, pojęcie klucza obcego.

Integralność danych Wersje języka SQL Klauzula SELECT i JOIN

Dokumentacja administratora

Hurtownie danych w praktyce

Część 3 - Konfiguracja

Baza danych. Baza danych to:

Opis spełnienia wymagań (PSBD)

Integracja i Eksploracja Danych

INTENSE PLATFORM Zmiany w wersji Wersja 7.2

SQL Server Analysis Services Model tabelaryczny BISM

Program szkoleniowy Efektywni50+ Moduł IV Podstawy relacyjnych baz danych i język SQL

Migracja XL Business Intelligence do wersji

Podręcznik Użytkownika LSI WRPO

2017/2018 WGGiOS AGH. LibreOffice Base

Tabela wewnętrzna - definicja

koledzy, Jan, Nowak, ul. Niecała 8/23, , Wrocław, , ,

Hurtownie danych. Projektowanie hurtowni: modele wielowymiarowe. Modelowanie punktowe. Operacje OLAP na kostkach.

Wykład 2. Relacyjny model danych

Hurtownie danych wykład 3

Migracja Comarch ERP Altum Business Intelligence do wersji 2019

System imed24 Instrukcja Moduł Analizy i raporty

Transkrypt:

Wprowadzenie do hurtowni danych przygotował: Paweł Kasprowski

Kostka Kostka (cube) to podstawowy element hurtowni Kostka jest wielowymiarowa (od 1 do N wymiarów) Kostka składa się z: faktów wektora wartości mierzonych, miar (measures) wymiarów (dimensions) do każdego faktu przypisać można konkretną wartość w każdym wymiarze Struktura kostki: centralna tablica faktów zawierająca miary i klucze obce do wymiarów tablice wymiarów (0-N tablic dla każdego wymiaru)

Przykładowa kostka przygotował: pawel@kasprowski.pl

Etapy pracy z projektem Stworzenie projektu Zdefiniowanie źródła danych Stworzenie widoku Stworzenie kostek i wymiarów Zbudowanie projektu (build) Wgranie na serwer (deploy)

Struktura projektu Wszystko zapisane jest w plikach XML

Przygotowanie hurtowni Zbudowanie projektu (Build) Instalacja na serwerze (Deploy) Załadowanie danych (Process)

Budowanie projektu Menu: Build/Build... Business Development Studio tworzy zestaw plików XML z opisami wszystkich obiektów Pliki XML używają Analysis Services Scripting Language (ASSL) Pliki umieszczane są w katalogu bin

Przebudowa projektu Kolejne budowanie projektu zajmuje czas Często nie ma potrzeby przebudowywania wszystkiego SSBDS automatycznie tworzy w katalogu obj/development pliki XML z informacją, co się zmieniło od ostatniego budowania Dzięki temu możliwe jest tylko częściowa przebudowa bazy na serwerze (incremental deployment) Jeśli chcemy zacząć od zera: Rebuild All

Deployment Stworzenie bazy danych (hurtowni) dla projektu na serwerze Analysis Services Przygotowanie wszystkich obiektów w bazie Kontrola poprawności Działa inkrementacyjnie (nie tworzy jeszcze raz obiektów, które już są w bazie)

Processing Załadowanie hurtowni danymi ze źródła danych Wszystkie obiekty są wypełniane danymi, agregacje są przeliczane Hurtownia jest gotowa do przeglądania Dostęp do niej możliwy jest także spoza Business Development Studio np z SQL Server Management Studio

Elementy naszej kostki Zbiór miar: Fact Internet Sales Wymiary czasowe OrderDate ShipDate DueDate Wymiar produktowy Dim Product

Zakładki edytora kostki Cube Structure Dimesions Calculations KPIs Actions Partitions Perspectives Translations Browser

Zakładka Cube Structure przygotował: pawel@kasprowski.pl

Przeglądanie danych przygotował: pawel@kasprowski.pl

Wymiary i hierarchie przygotował: pawel@kasprowski.pl

Wymiary Podstawą przetwarzania wymiarów jest określenie elementów dla jakich mają być liczone agregacje Każdy wymiar ma zwykle wiele atrybutów Domyślnie AS wylicza zagregowane wartości miar dla każdego atrybutu osobno używając SELECT DISTINCT dla każdego klienta dla każdego miasta dla każdego wykształcenia dla każdej płci

Hierarchie Atrybuty najczęściej stanowią logiczne hierarchie (np.: kraj-miasto-dzielnica-klient) Atrybuty na wyższych poziomach hierarchii muszą być funkcjonalnie zależne od tych na niższych np. znając dzielnicę znamy miasto W BDS można definiować dowolne hierarchie Przeszukiwanie kostki możliwe jest tylko według hierarchii dlatego dla każdego pojedynczego atrybutu tworzona jest domyślnie jednowymiarowa hierarchia (hierarchia atrybutu)

Źródło wymiarów Jedna tabela star schema Więcej połączonych relacjami tabel snowflake schema Zawsze określony jest atrybut kluczowy (unikalny) primary key z bazy danych logical key stworzony w widoku Klucz łączy element wymiaru z tablicą faktów

Wykorzystanie wymiarów Ten sam wymiar może być wykorzystany wielokrotnie w różnych kostkach w tej samej kostce Przykłady: wymiar Product w kostce InternetSales i StoreSales wymiar Time wykorzystany trzykrotnie w kostce InternetSales (OrderDate, ShipDate, DueDate)

Elementy obiektu dimension Dimension structure Attributes Hierarchies and Levels Data Source View

Parametry hierarchii atrybutów KeyColumns określa, z czego skłąda się klucz atrybutu domyślnie wartość kolumny z bazy przyporządkowanej atrybutowi może być composite składać się z kilku kolumn NameColumn kolumna, której wartość wyświetlana jest jako wartość atrybutu gdy brak wyświetlane jest KeyColumns gdy KeyColumns > 1 musi być okreslona NameColumn ValueColumn dodatkowa wartość atrybutu

Parametry hierarchii atrybutów AttributeHierarchyDisplayFolder określa, czy hierarchia dostępna z zewnątrz AttributeHierarchyEnables określa, czy hierarchia tworzona IsAggregatable określa, czy widoczny jest element (All)

Tworzenie własnej hierarchii Dla wymiaru Product Hierarchia Linia-Kolor-Nazwa Użycie w browserze upraszcza obsługę

Nowy wymiar Customer oparty na tabelach DimCustomer i DimGeography Dodanie tabel do widoku

Modyfikacja widoku przygotował: pawel@kasprowski.pl

Stworzenie wymiaru przygotował: pawel@kasprowski.pl

Stworzenie własnej hierarchii Stworzenie własnej hierarchii Modyfikacje nazw pól Użycie hierarchii w browserze

Użycie własnej hierarchii przygotował: pawel@kasprowski.pl

Dodanie własnego pola Stworzenie Named calculation w database view Użycie tego atrybutu w wymiarze Customer Przykład: pole FullName z połączenia trzech pól w bazie

Named Calculation przygotował: pawel@kasprowski.pl

Zastosowanie atrybutu przygotował: pawel@kasprowski.pl

Grupowanie atrybutów Parametr AttributeHierarchyDisplayFolder Ułatwia wyszukiwanie artybutów w Browserze

Konfiguracja relacji Bezpośrednie relacje pomiędzy atrybutami Province -> Country City -> Province Zdefiniowanie bezpośrednich relacji: przyspiesza tworzenie agregacji pozwala zamieniać sposób sortowania w oparciu o kolumny podrzędne

Przykład Hierarchia klientów miasta posortowane według prowincji Zmiany w hierarchii City KeyColumns = Province, City NameColumn = City Można dodać NamedCalculation [Province] + [City]

Ćwiczenie Modyfikacja wymiaru Time Stworzyć hierarchię: Year/Quarter/Month Stworzyć NamedCalculation QuarterDesc zawierające dane w formacie: Q1/2001 Prawidłowo sortować kwartały Prawidłowo sortować miesiące w kwartałach