Hurtownie danych - przegląd technologii



Podobne dokumenty
Oracle Designer. Oracle Designer jest jednym z głównych komponentów pakietu Oracle Developer Suite. Oracle Designer wspiera :

Wprowadzenie do technologii Business Intelligence i hurtowni danych

Hurtownie danych - przegląd technologii

Plan. Wprowadzenie. Co to jest APEX? Wprowadzenie. Administracja obszarem roboczym

Szkolenie obejmuje zagadnienia związane z tworzeniem i zarządzaniem bazą danych Oracle, jej zasobami i dostępem do danych.

Architektury i technologie integracji danych

Integracja systemów transakcyjnych

Schematy logiczne dla hurtowni danych

GML w praktyce geodezyjnej

Podyplomowe Studium Informatyki w Bizniesie Wydział Matematyki i Informatyki, Uniwersytet Łódzki specjalność: Tworzenie aplikacji w środowisku Oracle

Serwery LDAP w środowisku produktów w Oracle

Ekspert MS SQL Server Oferta nr 00/08

Ramowy plan kursu. Lp. Moduły Wyk. Lab. Przekazywane treści

Wprowadzenie do metodologii modelowania systemów informacyjnych. Strategia (1) Strategia (2) Etapy Ŝycia systemu informacyjnego

Migracja Business Intelligence do wersji

Bazy danych i ich aplikacje

Dane wejściowe. Oracle Designer Generowanie bazy danych. Wynik. Przebieg procesu

Spis treści. Przedmowa

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Programowanie MorphX Ax

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl

Integracja danych ubezpieczeniowych w czasie rzeczywistym. Łukasz Szewczyk Solution Architect

Hurtownie danych - przegląd technologii

1. Zakres modernizacji Active Directory

Proces ETL MS SQL Server Integration Services (SSIS)

Wykaz zmian w programie SysLoger

7. zainstalowane oprogramowanie zarządzane stacje robocze

Bazy danych. Zenon Gniazdowski WWSI, ITE Andrzej Ptasznik WWSI

Oracle Application Express -

Liczba godzin 1,2 Organizacja zajęć Omówienie programu nauczania 2. Tematyka zajęć

Oracle11g: Programowanie w PL/SQL

Baza danych sql. 1. Wprowadzenie

Specjalizacja magisterska Bazy danych

DBPLUS Data Replicator Subtitle dla Microsoft SQL Server. dbplus.tech

Instalacja pakietu SAS 9.3 Audit, Performance and Measurement na platformie Windows

Spis treści. Część I Wprowadzenie do pakietu oprogramowania Analysis Services

ZAŁĄCZNIK NR 3 OPIS PRZEDMIOTU ZAMÓWIENIA DOTYCZĄCY WDROŻENIA PLATFORMY ZAKUPOWEJ

SAS Institute TECHNICAL SUPPORT )

Szkolenie autoryzowane. MS Wdrażanie hurtowni danych w Microsoft SQL Server 2012

Administracja i programowanie pod Microsoft SQL Server 2000

COMARCH DATA WAREHOUSE MANAGER 6.2

Oracle11g: Wprowadzenie do SQL

Warstwa integracji. wg. D.Alur, J.Crupi, D. Malks, Core J2EE. Wzorce projektowe.

Część I Tworzenie baz danych SQL Server na potrzeby przechowywania danych

Usługi analityczne budowa kostki analitycznej Część pierwsza.

platforma informatyczna do gromadzenia danych w procesach logistycznych i produkcyjnych z wykorzystaniem automatycznej identyfikacji

Wdrożenie systemu Microsoft Forefront Client Security, jako przykład osiągnięcia bezpieczeństwa informatycznego.

1 Wprowadzenie do J2EE

Instrukcja instalacji programu IBM SPSS Statistics 22

Migracja Business Intelligence do wersji

Programowanie współbieżne i rozproszone

Migracja Business Intelligence do wersji 11.0

Instrukcja pobrania i instalacji. certyfikatu Microsoft Code Signing. wersja 1.4

Dni: 3. Opis: Adresaci szkolenia

Szczegółowy opis przedmiotu zamówienia

Program szkolenia: Administracja SQL Server

dlibra 3.0 Marcin Heliński

Politechnika Śląska, Instytut Informatyki

Migracja XL Business Intelligence do wersji

I. KARTA PRZEDMIOTU CEL PRZEDMIOTU

Narzędzia i aplikacje Java EE. Usługi sieciowe Paweł Czarnul pczarnul@eti.pg.gda.pl

Instrukcja obsługi Multiconverter 2.0

Ministerstwo Finansów

Podstawowe możliwości programu Spectro Market Faktura

Mechanizm generowania edeklaracji

Grupy pytań na egzamin magisterski na kierunku Informatyka (dla studentów niestacjonarnych studiów II stopnia)

WOJSKOWA AKADEMIA TECHNICZNA

Microsoft SQL Server Podstawy T-SQL

Aplikacja webowa w Javie szybkie programowanie biznesowych aplikacji Spring Boot + Vaadin

Dariusz Brzeziński. Politechnika Poznańska, Instytut Informatyki

Pentaho DI część 1. Paweł Boiński Politechnika Poznańska, Instytut Informatyki

Opis spełnienia wymagań (PSBD)

Grupy pytań na egzamin magisterski na kierunku Informatyka (dla studentów dziennych studiów II stopnia)

Bazy danych 2. Wykład 1

Składowanie i dostęp do danych w rozproszonym systemie ochrony własności intelektualnej ANDRZEJ SOBECKI, POLITECHNIKA GDAŃSKA INFOBAZY 2014

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki

OfficeObjects e-forms

oprogramowania F-Secure

INFORMATYKA Pytania ogólne na egzamin dyplomowy

4 Web Forms i ASP.NET Web Forms Programowanie Web Forms Możliwości Web Forms Przetwarzanie Web Forms...152

PAŃSTWOWA WYŻSZA SZKOŁA ZAWODOWA W NOWYM SĄCZU SYLABUS PRZEDMIOTU. Obowiązuje od roku akademickiego: 2011/2012

Wykaz zmian w programie SysLoger

Spis tre±ci. Przedmowa... Cz ± I

Win Admin Monitor Instrukcja Obsługi

Program kadrowo płacowy - wersja wielodostępna z bazą danych Oracle SQL Server 8 lub 9

Instrukcja instalacji

Spis treści MONITOR PRACY... 4

Wykorzystanie standardów serii ISO oraz OGC dla potrzeb budowy infrastruktury danych przestrzennych

ZMODYFIKOWANY Szczegółowy opis przedmiotu zamówienia

Business Intelligence Beans + Oracle JDeveloper

HomeNetMedia - aplikacja spersonalizowanego dostępu do treści multimedialnych z sieci domowej

SAS ETL Studio Wprowadzenie

ETL darmowe narzędzia

Konfiguracja serwera DNS w systemie Windows Server 2008 /2008 R2

Jarosław Żeliński analityk biznesowy, projektant systemów

Opisy efektów kształcenia dla modułu

2 Konfiguracja i utrzymanie bazy danych Przed rozpoczęciem Lekcja 1: Konfigurowanie plików i grup plików Pliki i grupy plików...

Dokumentacja techniczna

Microsoft System Center Virtual Machine Manager 2012

Transkrypt:

Hurtownie danych - przegląd technologii Problematyka zasilania hurtowni danych - Oracle Data Integrator Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl www.cs.put.poznan.pl/rwrembel Oracle Data Integrator (Sunopsis( Sunopsis) Operator Designer Topology Manager Repozytorium Scheduler Agent Security Manager Metadata Navigator 2/20 1

Repozytoria Repozytorium główne (master repository) def. użytkowników, profili i uprawnień do ODI metadane topologiczne (technologie, def. serwerów danych, def. schematów, kontekstów, języków) wersje obiektów projektu ETL zapis przez Topology Manager i Security Manager Repozytorium robocze (work repository) może ich być kilka składują def. projektu ETL struktury źródeł danych, procedury, pakiety, harmonogramy uruchamiania, logi zapis przez Designer i Operator 3/20 Repozytoria rysunek z: Oracle Data Integrator, Oracle Corp. 4/20 2

Koncepcje Projekt (project) Scenariusz (scenario) Model (model) Topologia (topology) Schemat fizyczny (physical schema) Schemat logiczny (logical schema) Kontekst (context) Interfejs (interface) Agent (agent) 5/20 Projekt Kontener obiektów definiowanych dla jednej dziedziny zastosowania ETL foldery pakiety interfejsy procedury moduły wiedzy (knowledge modules) szablony i sekwencje poleceń dla danej technologii szablon + sekwencja poleceń realizują określone zadanie ETL predefiniowane, dostępne w narzędziu (wymagają zaimportowania) wykorzystywane do generowania kodów run-time znaczniki (markery) opisują stan rozwoju poszczególnych obiektów ETL 6/20 3

Moduł wiedzy Loading KM (LKM) odczyt danych ze źródeł Integration KM (IKM) integracja, wczytywanie danych do obiektów docelowych interfejsu Check KM (CKM) weryfikacja ograniczeń integralnościowych obiektów docelowych interfejsu Reverse engineering KM (RKM) inżynieria zwrotna źródeł danych Journalizing KM (JKM) wykrywanie zmian w źródłach (change data capture) odświeżanie przyrostowe 7/20 Moduł wiedzy LKM File to MSSQL (BULK) wczytywanie danych z pliku do SQL Server LKM SQL to SQL Append zasilanie dowolnego źródła danych SQL-89 na podstawie źródła SQL-89, metodą Append LKM SQL Incremental Update przyrostowe odświeżanie (Update) dowolnego źródła danych wspierającego standard SQL-89 LKM File to Oracle (SQLLDR) wczytywanie danych z pliku do Oracle za pomocą SQL*Loader 8/20 4

Scenariusz Wygenerowany, stabilny kod ETL, gotowy do uruchomienia Wersjowanie kodu uruchomieniowego Uruchomienie scenariusza z interfejsu graficznego z linii komend (polecenie startscen) 9/20 Model Reprezentacja źródeł danych w modelu ODI (relacyjny) Reprezentacja HD w modelu ODI Model nie zawiera danych Budowany na podstawie importu metadanych Możliwość manualnego uzupełnienia rysunek z: Oracle Data Integrator, Oracle Corp. 10/20 5

Topologia Pełna reprezentacja systemu informatycznego Zawiera architekturę fizyczną systemu źródła (serwery) danych schematy fizyczne definicje agentów (programy realizujące zadania ETL) architekturę logiczną schematy logiczne definicje kontekstów (umożliwiają odwzorowanie schematu logicznego w fizyczny) 11/20 Topologia Zawiera technologie (np. Oracle, DB2UDB, XML) - dostępne systemy składowania danych typy danych dostępne w każdej z technologii serwery danych - źródła danych (zawsze powiązane z technologią) schemat fizyczny każdego z serwerów danych - umożliwia podział serwera danych na fragmenty zawartość schematu zależy od technologii, np. zbiór tabel, plik z lokalizacją definicje języka we wskazanej technologii 12/20 6

Schemat fizyczny ODI Serwer danych może mieć wiele schematów fizycznych Schemat danych (data schema) - przechowuje dane Schemat roboczy (work schema) - przechowuje dane tymczasowe niezbędne do pracy ETL Domyślny schemat fizyczny schemat roboczy 13/20 Schemat logiczny ODI Alias dla różnych schematów fizycznych Schematy fizyczne mają taką samą strukturę i wykorzystują taką samą technologię Reprezentuje te same semantycznie dane istniejące w różnych kontekstach schemat logiczny schemat fizyczny rysunek z: Oracle Data Integrator, Oracle Corp. 14/20 7

Schematy Etap projektowania ETL - praca ze schematem logicznym Uruchomienie ETL - dostęp do schematów fizycznych (źródeł danych) 15/20 Kontekst Odwzorowuje zasób logiczny (schemat) w dokładnie jeden zasób fizyczny (schemat) schemat logiczny zestawienia-gus kontekst DziałKształcenia Dziekani Development schemat: dzksztalcenia schemat: dziekani schemat: develgus Oracle10g, CentOS Dział Kształcenia DB2, ver.9.5, CentOS Dziekanat Oracle11g, WinXP Developer 16/20 8

Interfejs Obiekt ODI odpowiedzialny za zasilenie HD pobiera dane ze źródeł transformuje, oczyszcza, uspójnia wczytuje do HD odwzorowanie obiektów źródła danych w obiekty HD filtrowanie danych łączenie weryfikacja ograniczeń integralnościowych wykonanie funkcji użytkownika możliwy do uruchomienia albo na źródle danych albo w ODS albo w HD, w zależności od definicji 17/20 Agent Komponent środowiska uruchomieniowego Realizuje zadanie ETL wysyła polecenia do źródła danych uruchamiany na żądanie lub automatycznie zgodnie z harmonogramem Zdefiniowany w topologii konieczne odwzorowanie: agent logiczny fizyczny agent fizyczny: węzeł na którym zostanie uruchomiony (adres sieciowy, port) 18/20 9

Jakość danych Wymaga Check KM rysunek z: Oracle Data Integrator, Oracle Corp. 19/20 Przepływ zadań ETL rysunek z: Oracle Data Integrator, Oracle Corp. 20/20 10