Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki

Podobne dokumenty
Hurtownie danych - przegląd technologii

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl

Hurtownie danych - przegląd technologii

Architektury i technologie integracji danych

Tematy projektów Edycja 2017

Hurtownie danych - przegląd technologii

Hurtownie danych. Wstęp. Architektura hurtowni danych. CO TO JEST HURTOWNIA DANYCH

Integracja systemów transakcyjnych

OdświeŜanie hurtownie danych - wykład IV. Zagadnienia do omówienia. Wprowadzenie

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Hurtownie danych - przegląd technologii

Prezentacja systemu RTLinux

OLAP i hurtownie danych c.d.

INFORMATYKA W SZKOLE. Podyplomowe Studia Pedagogiczne. Dr inż. Grażyna KRUPIŃSKA. D-10 pokój 227

Informatyka I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) stacjonarne (stacjonarne / niestacjonarne)

Migracja XL Business Intelligence do wersji

Algorytmy równoległe: ocena efektywności prostych algorytmów dla systemów wielokomputerowych

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

INTERNETOWE BAZY DANYCH materiały pomocnicze - wykład X

Tematy projektów Edycja 2014

Informatyka I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) niestacjonarne (stacjonarne / niestacjonarne)

HURTOWNIE DANYCH Dzięki uprzejmości Dr. Jakuba Wróblewskiego

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Migracja Comarch ERP Altum Business Intelligence do wersji 2019

Systemy baz danych i hurtowni danych

Migracja Business Intelligence do wersji

Integracja systemów transakcyjnych

Migracja Business Intelligence do wersji

PROJEKT WSPÓŁFINANSOWANY ZE ŚRODKÓW UNII EUROPEJSKIEJ W RAMACH EUROPEJSKIEGO FUNDUSZU SPOŁECZNEGO OPIS PRZEDMIOTU. Rozproszone Systemy Baz Danych

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2012/2013

Multi-wyszukiwarki. Mediacyjne Systemy Zapytań wprowadzenie. Architektury i technologie integracji danych Systemy Mediacyjne

Spis tre±ci. Przedmowa... Cz ± I

Splunk w akcji. Radosław Żak-Brodalko Solutions Architect Linux Polska Sp. z o.o.

Część I Istota analizy biznesowej a Analysis Services

Oracle11g: Wprowadzenie do SQL

Migracja Business Intelligence do wersji

Integracja danych ubezpieczeniowych w czasie rzeczywistym. Łukasz Szewczyk Solution Architect

Optymalizacja. Przeszukiwanie tabu

Hurtownie danych. 31 stycznia 2017

Szczegółowy opis przedmiotu umowy. 1. Środowisko SharePoint UWMD (wewnętrzne) składa się z następujących grup serwerów:

WYBRANE SPOSOBY ZAPEWNIENIA

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Terminarz rozgrywek Ekstraklasy w sezonie 2016/2017

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

przydziału procesora Przykłady implementacji planowania przydziału procesora Wykład prowadzą: Jerzy Brzeziński Dariusz Wawrzyniak

Przykłady implementacji planowania przydziału procesora

Zarządzanie wieloserwerowym środowiskiem SAS z wykorzystaniem SAS Grid Managera. Katarzyna Wyszomierska

Algorytmy równoległe: ocena efektywności prostych algorytmów dla systemów wielokomputerowych

Migracja Business Intelligence do wersji 11.0

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Bezpieczne miasto. koncepcja i rozwiązania w projekcie Mayday Euro 2012

Migracja Business Intelligence do wersji Aktualizacja dokumentu:

Bazy danych. Plan wykładu. Rodzaje baz. Rodzaje baz. Hurtownie danych. Cechy hurtowni danych. Wykład 14: Hurtownie danych

Problemy optymalizacji, rozbudowy i integracji systemu Edu wspomagającego e-nauczanie i e-uczenie się w PJWSTK

Rozdział 17. Zarządzanie współbieżnością zadania dodatkowe

Wprowadzenie do technologii Business Intelligence i hurtowni danych

Simulator of Operating System

Specjalizacja magisterska Bazy danych

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki

SYSTEM ZARZĄDZANIA PARKIEM MASZYNOWYM

Replikacje. dr inż. Dziwiński Piotr Katedra Inżynierii Komputerowej. Kontakt:

Indeksy w bazach danych. Motywacje. Techniki indeksowania w eksploracji danych. Plan prezentacji. Dotychczasowe prace badawcze skupiały się na

Matlab jako klient OPC. Przykład wysyłania i odbierania danych z PLC za pośrednictwem DA Serwera.

Korzyści z integracji danych klienta. Seminarium PIU Jakość danych w systemach informatycznych ZU Warszawa Przygotowała Ewa Galas

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Spis treści. Przedmowa

Hurtownie danych. Hurtownie danych. dr hab. Maciej Zakrzewicz Politechnika Poznańska Instytut Informatyki. Maciej Zakrzewicz (1)

Opisy efektów kształcenia dla modułu

Hurtownie danych. Ładowanie, integracja i aktualizacja danych. INTEGRACJA DANYCH ETL

Ewolucja systemów baz danych

Uniwersytet Mikołaja Kopernika w Toruniu. Profilowanie ruchu sieciowego w systemie GNU/Linux

Struktura i funkcjonowanie komputera pamięć komputerowa, hierarchia pamięci pamięć podręczna. System operacyjny. Zarządzanie procesami

Wykład 6. Planowanie (szeregowanie) procesów (ang. process scheduling) Wojciech Kwedlo, Wykład z Systemów Operacyjnych -1- Wydział Informatyki PB

LITERATURA. C. J. Date; Wprowadzenie do systemów baz danych WNT Warszawa 2000 ( seria Klasyka Informatyki )

Dokumentacja wstępna TIN. Rozproszone repozytorium oparte o WebDAV

Cel przedmiotu. Wymagania wstępne w zakresie wiedzy, umiejętności i innych kompetencji 1 Język angielski 2 Inżynieria oprogramowania

"Kilka słów" o strojeniu poleceń SQL w kontekście Hurtowni Danych wprowadzenie. Krzysztof Jankiewicz

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Monitorowanie aplikacji i rozwiązywanie problemów

SHAREPOINT SHAREPOINT QM SHAREPOINT DESINGER SHAREPOINT SERWER. Opr. Barbara Gałkowska

Migracja XL Business Intelligence do wersji

KARTA PRZEDMIOTU. Hurtownie i eksploracja danych D1_5

Cele. Definiowanie wyzwalaczy

Migracja Comarch ERP Altum Business Intelligence do wersji

Systemy wbudowane. Uproszczone metody kosyntezy. Wykład 11: Metody kosyntezy systemów wbudowanych

Hurtownie danych. Wprowadzenie do systemów typu Business Intelligence

Hurtownie danych - przegląd technologii

Szkolenie autoryzowane. MS 6232 Wdrażanie bazy danych Microsoft SQL Server 2008 R2

Kompaktowy ciepłomierz ultradźwiękowy

Narzędzia controllingowe dla małych firm

Rachunek prawdopodobieństwa dla informatyków

Bazy danych. Zenon Gniazdowski WWSI, ITE Andrzej Ptasznik WWSI

AUREA BPM Oracle. TECNA Sp. z o.o. Strona 1 z 7

SAS OLAP Cube Studio Wprowadzenie

KARTA PRZEDMIOTU. 1. Informacje ogólne. 2. Ogólna charakterystyka przedmiotu. Protokoły sieciowe D1_7

KOMPUTEROWY SYSTEM WSPOMAGANIA OBSŁUGI JEDNOSTEK SŁUŻBY ZDROWIA KS-SOMED

SYSTEMY CZASU RZECZYWISTEGO - VxWorks

Parametry wydajnościowe systemów internetowych. Tomasz Rak, KIA

Transkrypt:

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl www.cs.put.poznan.pl/rwrembel

Aktywna hurtownia danych AHD [T. Thalhammer, M. Schrefl, and M. K. Mohania. Active data warehouses: complementing OLAP with analysis rules. Data Knowledge Engineering, 9(), ] hurtownia automatycznie reaguje na "zdarzenia" wykrycie anomalii obniżenie sumarycznej wartości sprzedaży poniżej zadanego progu zapytania monitorujące (subscription queries) dane analityczne dostępne również dla pracowników operacyjnych Zastosowania bankowość - analiza wykorzystania kart kredytowych handel R.Wrembel - Politechnika Poznańska, Instytut Informatyki

Architektura systemu AHD aplikacje operacyjne aplikacje analityczne ETL AHD serwer analityczny magistrala komunikacyjna R.Wrembel - Politechnika Poznańska, Instytut Informatyki

AHD - technologia Dużo większa częstotliwość odświeżania danych Jednoczesna praca wielu procesów odświeżających i wielu zapytań analitycznych Implikacje nowe modele transakcji zapewnienie spójności zapytań analitycznych optymalizacja tradycyjnych zapytań OLAP i zapytań monitorujących działających w tym samym czasie optymalizacja struktury hurtowni danych R.Wrembel - Politechnika Poznańska, Instytut Informatyki

HD czasu rzeczywistego Okres propagacji danych ze źródła do HD CzRz minuty Zastosowania bankowość wykrywanie transakcji podejrzanych (skradziona karta) wymaga natychmiastowej reakcji zarządzanie ruchem monitorowanie natężenia ruchu i wykrywanie potencjalnych korków ETL czasu rzeczywistego 5

HD czasu rzeczywistego Wymagania krótki czas odpowiedzi na zapytania analityczne (Quality of Service - QoS) aktualność danych (Quality of Data - QoD) zmiana danych w źródle propaguje się natychmiast (z niewielkim opóźnieniem) do HD liczba niezaaplikowanych modyfikacji jak najniższa źródło wysyła dane (push-based) odpowiednie uszeregowanie operacji odświeżania i zapytań analitycznych Zastosowanie bankowość - analiza operacji kartami płatniczymi i wykrywanie podejrzanych operacji międzynarodowe firmy (brak okresu bezczynności użytkowników) 6

HD czasu rzeczywistego ETL tradycyjna HD użytkownicy odświeżanie analiza odświeżanie analiza ETL HD czasu rzeczywistego użytkownicy 7

MODUŁ ZARZĄDZANIA OBCIĄŻENIEM QoS <? QoD Architektura Qn... Q Q HD CZASU RZECZYWISTEGO ODS Un... U U 8

Architektura Zarządzanie kolejkami zapytań i modyfikacji FIFO FIFO z preferencją zapytań FIFO z preferencją modyfikacji WINE (Work Balancing by Election) 9

WINE () Miary wydajności QoS - średni czas pozostawania zapytania w systemie = czas wykonania czas przybycia rt qi - czas przebywania zapytania qi W q - długość obciążenia QoD - liczba niezrealizowanych odświeżeń dla zapytania (odświeżenia oczekujące w momencie pojawienia się zapytania) uu(pi) - niezrealizowane odświeżenia partycji pi dla całego obciążenia

WINE () Cel optymalizacji minimalizacja czasu przebywania zapytania w systemie maksymalizacja aktualności danych Kolejka zapytań (KQ) i kolejka odświeżeń (KU) każde zadanie w kolejce ma wartość QoD i QoS poziomowe szeregowanie operacji poziom : alokowanie zasobów albo dla KQ albo dla KU (suma preferencji QoS lub QoD dla kolejki) poziom : szeregowanie zapytań w KQ zgodnie z QoS szeregowanie odświeżeń w KU zgodnie z QoD

WINE () Poziom if then wykonuj zadanie z KQ else wykonuj zadanie z KU QoS QoD 5 Q5 : B Q : C Q : B Q : A Q : A Q : D.6..9...6.9..7...8 U : C U : B U : A U : A U : D w w w w w Warunek jest sprawdzany po wykonaniu każdego zadania

WINE () poziom - kolejka zapytań sortowanie zapytań: order by QoS desc, timestamp asc aby zapobiec blokowaniu zapytań z niską wartością QoS zwiększanie wartości QoS zapytań znajdujących się już w kolejce o wartość d, po każdym wykonaniu zapytania z kolejki Q - długość kolejki r max - parametr systemowy

WINE (5) poziom - kolejka odświeżeń Preferowane są odświeżenia, z których będą korzystały zapytania uruchamiane za chwilę (na pocz. KQ) w tym celu wprowadza się wagę odświeżenia Zapytanie i uaktualnienie adresują tę samą partycję danych Na QoD uaktualnienia partycji P i ma wpływ pozycja zapytania w kolejce odwołującego się do P i im zapytanie bliżej początku kolejki tym QoD uaktualnienia otrzymuje wyższą wartość

WINE (6) suma QoS=,7 suma QoD=, 5 A Q5 : B Q : C Q : B Q : A Q : A Q : D.6..9...6.9..7...8 B U : C U : B U : A U : B U : B w w w w w C partycje QoS QoD 5

WINE (7) suma QoS=,7 suma QoD=, sortowanie KQ: order by QoS desc, timestamp asc 5 Q5 : B Q : C Q : B Q : A Q : A Q : D A.6..9...6.9..7...8 B U : C U : B U : A U : B U : B w w w w w C partycje QoS QoD 6

WINE (8) Obliczanie współczynnika w dla zadań z kolejki uaktualnień partycje Q : D 5 Q : B Q5 : B Q : A Q : C Q : A A..8..6.6..7..9..9. B U : C U : B U : A U : B U : B w.5. w w. w.. w C QoS QoD 7

WINE (9) Sortowanie uaktualnień: order by w desc, timestamp asc partycje Q : D 5 Q : B Q5 : B Q : A Q : C Q : A A..8..6.6..7..9..9. B U : C U : B U : A U : B U : B.5.... C QoS QoD 8