Hurtownie danych. 31 stycznia 2017

Podobne dokumenty
Wielowymiarowy model danych

Modele danych - wykład V

Hurtownie danych. Wstęp. Architektura hurtowni danych. CO TO JEST HURTOWNIA DANYCH

Hurtownie danych a transakcyjne bazy danych

Modele danych - wykład V. Zagadnienia. 1. Wprowadzenie 2. MOLAP modele danych 3. ROLAP modele danych 4. Podsumowanie 5. Zadanie fajne WPROWADZENIE

Hurtownie danych. Hurtownie danych. dr hab. Maciej Zakrzewicz Politechnika Poznańska Instytut Informatyki. Maciej Zakrzewicz (1)

Wstęp do Business Intelligence

Ewolucja technik modelowania hurtowni danych

Business Intelligence

Schematy logiczne dla hurtowni danych

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Bazy analityczne (hurtownie danych, bazy OLAP)

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

BD2 BazyDanych2. dr inż. Tomasz Traczyk 14. Systemy przetwarzania analitycznego

Bazy danych. Plan wykładu. Rodzaje baz. Rodzaje baz. Hurtownie danych. Cechy hurtowni danych. Wykład 14: Hurtownie danych

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl

Hurtownie danych - przegląd technologii

Zaawansowane systemy baz danych - ZSBD. Hurtownie danych 1. Problematyka hurtowni danych. Wykład przygotował: Robert Wrembel. ZSBD wykład 12 (1)

Hurtownie danych. Wprowadzenie do systemów typu Business Intelligence

Plan wykładu. Hurtownie danych. Problematyka integracji danych. Cechy systemów informatycznych

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Spis tre±ci. Przedmowa... Cz ± I

Hurtownie danych wykład 3

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE

HURTOWNIE DANYCH Dzięki uprzejmości Dr. Jakuba Wróblewskiego

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Informatyzacja przedsiębiorstw

Hurtownie danych. Rola hurtowni danych w systemach typu Business Intelligence

4. Znaczenie czasu w modelowaniu i strukturalizacji danych

Wprowadzenie do projektowania i wykorzystania baz danych Relacje i elementy projektowania baz

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Wprowadzenie do technologii Business Intelligence i hurtowni danych

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2016/2017

Bazy Danych. Bazy Danych i SQL Podstawowe informacje o bazach danych. Krzysztof Regulski WIMiIP, KISiM,

Model logiczny SZBD. Model fizyczny. Systemy klientserwer. Systemy rozproszone BD. No SQL

Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem. dr Jakub Boratyński. pok. A38

Wprowadzenie do hurtowni danych

Bazy danych. Zenon Gniazdowski WWSI, ITE Andrzej Ptasznik WWSI

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Technologia informacyjna

Baza danych. Modele danych

Pierwsze wdrożenie SAP BW w firmie

Plan. Inteligencja bisnesowa (Bussiness Intelligence) Hurtownia danych OLAP

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Modelowanie hurtowni danych

Hurtownie danych. Projektowanie hurtowni: modele wielowymiarowe. Modelowanie punktowe. Operacje OLAP na kostkach.

Procesowanie i partycjonowanie Analysis Services od podszewki (300) Adrian Chodkowski Adrian.Chodkowski@outlook.com

Informatyka I BAZY DANYCH. dr inż. Andrzej Czerepicki. Politechnika Warszawska Wydział Transportu 2017

Hurtownie danych. Przetwarzanie zapytań. ZAPYTANIA NA ZAPLECZU

Hurtownie danych w praktyce

Projektowanie hurtowni danych

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Baza danych to zbiór wzajemnie powiązanych ze sobą i zintegrowanych danych z pewnej dziedziny.

Część I Istota analizy biznesowej a Analysis Services

Bazy danych i usługi sieciowe

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Wprowadzenie do hurtowni danych

Wprowadzenie do Hurtowni Danych

Cel przedmiotu. Wymagania wstępne w zakresie wiedzy, umiejętności i innych kompetencji 1 Język angielski 2 Inżynieria oprogramowania

Budowa systemu wspomagającego podejmowanie decyzji. Metodyka projektowo wdrożeniowa

Hurtownie danych i systemy wspomagania decyzji. Olaf Morawski Hewlett-Packard Polska Sp. z o.o., ul. Szturmowa 2A, Warszawa

1. Ewolucja systemów opartych na bazach danych 2. Czym się rożni modelowanie od strukturalizacji danych? Model danych Struktury (danych)

HURTOWNIE DANYCH. Krzysztof Goczyła. Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska. kris@eti.pg.gda.pl. K.

Spis treści. Część I Wprowadzenie do pakietu oprogramowania Analysis Services

RELACYJNE BAZY DANYCH

Definicja bazy danych TECHNOLOGIE BAZ DANYCH. System zarządzania bazą danych (SZBD) Oczekiwania wobec SZBD. Oczekiwania wobec SZBD c.d.

Bazy danych i ich aplikacje

Podstawowe pojęcia dotyczące relacyjnych baz danych. mgr inż. Krzysztof Szałajko

Szkolenie autoryzowane. MS Wdrażanie hurtowni danych w Microsoft SQL Server 2012

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2018/2019

PREZENTACJA FUNKCJONALNA SYSTEMU PROPHIX

Porównanie wydajności hurtowni danych ROLAP i MOLAP w Oracle 10g

PROJEKT HURTOWNI DANYCH DLA PRZEDSIĘBIORSTWA PRODUKCYJNO-HANDLOWEGO W ŚRODOWISKU MS SQL SERVER

Usługa archiwizacji danych w systemie Eureca. Marek Jelenik CONTROLLING SYSTEMS sp. z o.o.

LITERATURA. Wprowadzenie do systemów baz danych C.J.Date; WNT Warszawa 2000

INTERNETOWE BAZY DANYCH materiały pomocnicze - wykład X

LITERATURA. C. J. Date; Wprowadzenie do systemów baz danych WNT Warszawa 2000 ( seria Klasyka Informatyki )

Bazy danych Wykład zerowy. P. F. Góra

Normalizacja relacyjnych baz danych. Sebastian Ernst

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Iwona Milczarek, Małgorzata Marcinkiewicz, Tomasz Staszewski. Poznań,

SQL Server i T-SQL w mgnieniu oka : opanuj język zapytań w 10 minut dziennie / Ben Forta. Gliwice, Spis treści

Matematyka kodem nowoczesności. Zaproszenie do składania ofert

Rola analityki danych w transformacji cyfrowej firmy

Co to jest Business Intelligence?

Wykład I. Wprowadzenie do baz danych

Modelowanie koncepcyjne hurtowni danych

Usługi biznesowe w SQL Server Omówienie oraz przykład zastosowania w przemyśle

Proces ETL. Katedra Inżynierii Oprogramowania Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska {kris,

Realizacja hurtowni danych dla administracji publicznej na przyk³adzie budowy systemu IACS

WPROWADZENIE DO BAZ DANYCH

Diagramy związków encji. Laboratorium. Akademia Morska w Gdyni

Kasy Fiskalne Lublin Analityk

Ramowy plan kursu. Lp. Moduły Wyk. Lab. Przekazywane treści

Ewolucja systemów baz danych

Rady i porady użytkowe

Projektowanie hurtowni danych i modelowanie wielowymiarowe

SQL w 24 godziny / Ryan Stephens, Arie D. Jones, Ron Plew. Warszawa, cop Spis treści

SAS OLAP Cube Studio Wprowadzenie

Transkrypt:

31 stycznia 2017

Definicja hurtowni danych Hurtownia danych wg Williama Inmona zbiór danych wyróżniający się następującymi cechami uporządkowany tematycznie zintegrowany zawierający wymiar czasowy nieulotny wspomaga podejmowanie decyzji wspomaga przetwarzanie informacji dla celów strategicznych i analitycznych

Przetwarzanie danych OLTP OnLine Transaction Processing OLAP OnLine Analytical Processing źródło danych dane opercyjne dane historyczne cel aktualizacje raportowanie zastosowania usługi online, klient-serwer inteligencja biznesowa, data mining użytkownicy klienci, personel zarząd, marketing horyzont czasowy dni, tygodnie, miesiące lata, dziesiątki lat model danych relacyjny wielowymiarowy schemat znormalizowany gwiazda, płatek śniegu, konstelacja zapytania proste złożone operacje na danych szybkie transakcje insert oraz update optymalizacja zapisów odczytu czas przetwarzania krótki długi objętość mała wielka cykliczne, długotrwałe importy

Projektowanie hurtowni danych Uwzględniając wymagania jakie są stawiane przed hurtownią danych przy projektowaniu jej schematu należy zwrócić uwagę na dwa aspekty: bardzo duża ilść danych: bieżące + historyczne osiągnięcie zadawalającego poziomu efektywności zapytań analitycznych

Architektura systemu hurtowni danych

Schemat hurtowni danych Schemat gwiazdy (ang. star) Schemat płatka śniegu (ang. snowflake) Schemat konstelacji faktów (ang. fact constellation albo starflake)

Schemat gwiazdy

Schemat gwiazdy: przykład

Schemat gwiazdy: cechy Prosta struktura Duża efektywność zapytań z uwagi na małą liczbę powiązań Długi czas ładowania danych do tabel wymiarów z uwagi na denormalizację i w efekcie na redundancję danych Tabela faktów składa się z dwóch typów kolumn: miary wartości numeryczne opisujące dany fakt klucze obce do tabeli wymiarów Wymiary wartości opisowe danego faktu Klucz główny tabeli faktów składa się z jej wszystkich kluczy obcych Tabela faktów może zawierać informacje o faktach na poziome detalicznym lub zagregowanym

Dlaczego wymiary? Wielowymiarowa kostka OLAP

Schemat płatka śniegu

Schemat płatka śniegu: cechy Spadek wydajności zapytań w porównaniu ze schematem gwiazdy z uwagi na większą liczbę relacji Struktura łatwiejsza do modyfikacji Relatywnie krótszy czas ładowania danych do tabel ze względu na mniejszą redundację dzięki normalizacji Wykorzystywany rzadziej niż schemat gwiazdy, gdyż efektywność zapytań jest ważniejsza niż efektywnosc ładowania danych

Schemat konstelacji faktów

Schemat konstelacji faktów: cechy Rozwiązanie pośrednie między gwiazdą a płatkiem śniegu Zwykle występuje więcej niż jedna tabela faktow Cześć tabel wymiarów jest znormalizowana a część zdenormalizowana Tabele faktów są ze sobą powiązane w relacji 1 : 1 lub 1 : n Tabele faktów mogą współdzielić te same tabele wymiarów

Factless Fact Table Przykład Tabela faktów bez faktów nie zawiera miar Przekrój wymiarów Obecność studentów na zajęciach jako przekrój 3 wymiarów: studenci, czas, zajęcia. Tabela faktów w tym wypadku złożona jest z trzech kolumn zawierących klucze obce. Pozwala łatwo udzielić odpowiedzi na następujące pytania: Ilu studentów było obecnych na danych zajęcich w określonym terminie? Na ile zajęć średnio uczęszczał dany student danego dnia?

Junk Dimension Nader często zdarzają się sytuacje, gdzie miary są jednobitowe (1/0) Przechowywanie danych jednobitowych w tabelach faktów wymaga użycia małych tabel wymiarów Przykład Jednocześnie ilość danych w tabelach faktów gwałtownie rośnie

Silniki hurtowni danych ROLAP Relational OLAP Przetwarzanie dużej ilości danych Naturalne wykorzystanie własności relacyjnych baz danych Niezbyt duża wydajność Ograniczeni narzucone przez model relacyjny IBM DB2 OLAP, Informix MetaCube, MicroStrategy MOLAP Multidimensional OLAP Znakomita wydajność Wylicznia generowane w czasie tworzenia kostki, co pozwala szybko wykonywać skomplikowane operacje Ograniczenia pojemności Oracle Express Server HOLAP Hybrid OLAP Podsumowania w fomie wielowymiarowych kostek Dane szczegółowe w bazie relacyjnej Microsoft SQL Server OLAP Services