Hurtownie danych - przegląd technologii



Podobne dokumenty
Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl

Plan wykładu. Hurtownie danych. Problematyka integracji danych. Cechy systemów informatycznych

Integracja systemów transakcyjnych

Architektury i technologie integracji danych

Hurtownie Danych i Business Intelligence: przegląd technologii

Hurtownie danych - przegląd technologii

Zaawansowane systemy baz danych - ZSBD. Hurtownie danych 1. Problematyka hurtowni danych. Wykład przygotował: Robert Wrembel. ZSBD wykład 12 (1)

Wprowadzenie do technologii Business Intelligence i hurtowni danych

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Spis tre±ci. Przedmowa... Cz ± I

Co to jest Business Intelligence?

Hurtownie danych. 31 stycznia 2017

PROJEKT WSPÓŁFINANSOWANY ZE ŚRODKÓW UNII EUROPEJSKIEJ W RAMACH EUROPEJSKIEGO FUNDUSZU SPOŁECZNEGO OPIS PRZEDMIOTU. Rozproszone Systemy Baz Danych

BD2 BazyDanych2. dr inż. Tomasz Traczyk 14. Systemy przetwarzania analitycznego

Hurtownie danych. Wstęp. Architektura hurtowni danych. CO TO JEST HURTOWNIA DANYCH

Problematyka hurtowni danych

Informatyzacja przedsiębiorstw

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Hurtownie danych a transakcyjne bazy danych

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Ewolucja systemów baz danych

Hurtownie danych. Rola hurtowni danych w systemach typu Business Intelligence

Pierwsze wdrożenie SAP BW w firmie

Hurtownie danych. Hurtownie danych. dr hab. Maciej Zakrzewicz Politechnika Poznańska Instytut Informatyki. Maciej Zakrzewicz (1)

Wstęp do Business Intelligence

HURTOWNIE DANYCH. Krzysztof Goczyła. Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska. kris@eti.pg.gda.pl. K.

Model logiczny SZBD. Model fizyczny. Systemy klientserwer. Systemy rozproszone BD. No SQL

Część I Istota analizy biznesowej a Analysis Services

Modele danych - wykład V

Integracja systemów transakcyjnych

Systemy baz danych i hurtowni danych

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Bazy danych na co dzień

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Hurtownie danych. Wprowadzenie do systemów typu Business Intelligence

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownia danych praktyczne zastosowania

HURTOWNIE DANYCH Dzięki uprzejmości Dr. Jakuba Wróblewskiego

Modele danych - wykład V. Zagadnienia. 1. Wprowadzenie 2. MOLAP modele danych 3. ROLAP modele danych 4. Podsumowanie 5. Zadanie fajne WPROWADZENIE

Systemy OLAP II. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

ORGANIZACJA ZAJĘĆ BAZY DANYCH PLAN WYKŁADU SCHEMAT SYSTEMU INFORMATYCZNEGO

Rola analityki danych w transformacji cyfrowej firmy

Informatyka I BAZY DANYCH. dr inż. Andrzej Czerepicki. Politechnika Warszawska Wydział Transportu 2017

Hurtownie danych w praktyce

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Ewolucja technik modelowania hurtowni danych

Bazy danych. Plan wykładu. Rodzaje baz. Rodzaje baz. Hurtownie danych. Cechy hurtowni danych. Wykład 14: Hurtownie danych

Usługi analityczne budowa kostki analitycznej Część pierwsza.

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE

Wielowymiarowy model danych

Data Warehouses and Business Intelligence: Technology Overview

Szczegółowy opis przedmiotu zamówienia

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Specjalizacja magisterska Bazy danych

Sylabus modułu kształcenia na studiach wyższych. Nazwa Wydziału. Nazwa jednostki prowadzącej moduł Nazwa modułu kształcenia.

Spis treści. Przedmowa

AUREA BPM Oracle. TECNA Sp. z o.o. Strona 1 z 7

Rozumie istotę i znacznie procesów ekstrakcji, transformacji i ładowania danych (ETL), zna wybrany język ETL oraz odpowiednie narzędzia.

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA realizacja w roku akademickim 2016/17

Budowa systemu wspomagającego podejmowanie decyzji. Metodyka projektowo wdrożeniowa

Bazy danych i ich aplikacje

Spis treści. O autorach... 12

Baza danych to zbiór wzajemnie powiązanych ze sobą i zintegrowanych danych z pewnej dziedziny.

Technologia informacyjna (IT - Information Technology) dziedzina wiedzy obejmująca:

LITERATURA. C. J. Date; Wprowadzenie do systemów baz danych WNT Warszawa 2000 ( seria Klasyka Informatyki )

Wprowadzenie do Hurtowni Danych

Hurtownie danych. Projektowanie hurtowni: modele wielowymiarowe. Modelowanie punktowe. Operacje OLAP na kostkach.

Bazy analityczne (hurtownie danych, bazy OLAP)

4. Znaczenie czasu w modelowaniu i strukturalizacji danych

Business Intelligence

Multi-wyszukiwarki. Mediacyjne Systemy Zapytań wprowadzenie. Architektury i technologie integracji danych Systemy Mediacyjne

Jak wiedzieć więcej i szybciej - Analizy in-memory

Ramowy plan kursu. Lp. Moduły Wyk. Lab. Przekazywane treści

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki

VI Kongres BOUG Praktyczne aspekty wykorzystania Business Intelligence w przemyśle wydobywczym węgla kamiennego

Hurtownie danych. Przetwarzanie zapytań. ZAPYTANIA NA ZAPLECZU

Bazy Danych. Bazy Danych i SQL Podstawowe informacje o bazach danych. Krzysztof Regulski WIMiIP, KISiM,

Indeksy w bazach danych. Motywacje. Techniki indeksowania w eksploracji danych. Plan prezentacji. Dotychczasowe prace badawcze skupiały się na

BUSINESS INTELLIGENCE DEVELOPMENT Tego Cię nauczymy:

Hurtownie danych - przegląd technologii

Nowoczesne bazy danych, czyli przetwarzanie in-memory

Informatyka I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) stacjonarne (stacjonarne / niestacjonarne)

Szkolenie autoryzowane. MS Wdrażanie hurtowni danych w Microsoft SQL Server 2012

HARMONOGRAM: DZIEŃ GODZINA MIEJSCE PROWADZĄCY TEMAT OPIS

PREZENTACJA FUNKCJONALNA SYSTEMU PROPHIX

Zaawansowane bazy danych i hurtownie danych Wydział Informatyki Politechnika Białostocka

Samodzielny Business Intelligence in memory duże i małe. Paweł Gajda Business Solution Architect

Prezentacja firmy WYDAJNOŚĆ EFEKTYWNOŚĆ SKUTECZNOŚĆ.

BigData. Czy zawsze oznacza BigProblem? Artur Górnik, SAP Polska Piotr Zacharek, HP Polska 14 kwietnia, 2015

Schematy logiczne dla hurtowni danych

1. Ewolucja systemów opartych na bazach danych 2. Czym się rożni modelowanie od strukturalizacji danych? Model danych Struktury (danych)

JMP Gospodarstwo Ogrodnicze: optymalizacja polityki cenowej klucz do sukcesu rynkowego

Wykład I. Wprowadzenie do baz danych

STUDIA NIESTACJONARNE I STOPNIA Przedmioty kierunkowe

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

Plan. Inteligencja bisnesowa (Bussiness Intelligence) Hurtownia danych OLAP

Technologie efektywnego zarządzania danymi w systemach rejestrowych na przykładzie IRS

System INTEGRYB jako zintegrowane repozytorium danych umożliwiające zaawansowaną analitykę badawczą

Transkrypt:

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl www.cs.put.poznan.pl/rwrembel Plan wykład adów Wprowadzenie - integracja danych Architektury hurtowni danych Modelowanie (ROLAP, MOLAP) Zasilanie i odświeżanie hurtowni Indeksowanie danych Optymalizacja zapytań gwiaździstych Perspektywy zmaterializowane Partycjonowanie danych i indeksów Kompresja danych Przetwarzanie równoległe Wsparcie SQL dla analiz biznesowych Metadane Kierunki badawczo-rozwojowe 2

Architektury integracji danych Wprowadzenie do problematyki integracji danych Architektury integracyjne systemy mediacyjne systemy hurtowni danych HD i OLAP 3 Problematyka integracji danych aplikacje operacyjne FoxPro DB2 Excel Access XML heterogeniczność i rozproszenie źródeł Oracle plik 4

Heterogeniczność źródeł Różni producenci/technologie Różna funkcjonalność bazy danych / nie bazy danych dialekty SQL sposoby dostępu i przetwarzania danych Różne modele danych hierarchiczne, sieciowe relacyjne obiektowe obiektowo-relacyjne wielowymiarowe semistrukturalne Architektury integracyjne system mediacyjny hurtownia (magazyn) danych 5 System mediacyjny Wady czas dostępu do danych niedostępność źródeł konwersja zapytań i danych źródło danych 1 źródło danych 2 źródło danych 3 Zalety brak redundancji danych dostęp do danych aktualnych 6

Architektura 1 (podstawowa) ŹRÓDŁA DANYCH WARSTWA POŚREDNIA HURTOWNIA DANYCH WARSTWA ANALITYCZNA OPROGRAMOWANIE ETL Ekstrakcja Transformacja Czyszczenie Agregacja HURTOWNIA DANYCH model wielowymiarowy dane elementarne i zagregowane Zalety dane zintegrowane (spójna struktura i wartości) szybkość dostępu do danych niezależność od awarii źródeł Wady redundancja danych odświeżanie danych 7 Architektura 2 ŹRÓDŁA DANYCH WARSTWA POŚREDNIA HURTOWNIA DANYCH WARSTWA ANALITYCZNA OPROGRAMOWANIE ETL OPERACYJNA SKŁADNICA DANYCH Ekstrakcja Transformacja Czyszczenie Agregacja HURTOWNIA DANYCH dane znormalizowane (3NF) dane elementarne możliwość przeszukiwania/analizow ania model wielowymiarowy dane elementarne i zagregowane 8

Architektura 3 ŹRÓDŁA DANYCH WARSTWA POŚREDNIA HURTOWNIA DANYCH WARSTWA ANALITYCZNA OPROGRAMOWANIE ETL OPERACYJNA SKŁADNICA DANYCH Hurtownie tematyczne Ekstrakcja Transformacja Czyszczenie Agregacja HURTOWNIA DANYCH dane znormalizowane (3NF) dane elementarne możliwość przeszukiwania/analizow ania model wielowymiarowy dane elementarne i zagregowane 9 Systemy komercyjne Oracle8i, Oracle9i, Oracle10g/11g Oracle Corporation, DB2 UDB IBM, Sybase IQ, Sybase Adaptative Server Enterprise Sybase, Inc., MS SQL Server Microsoft, SAP Business Warehouse SAP, Adabas C i Adabas D Software AG, Teradata NCR Corporation, Hyperion Essbase OLAP Server Hyperion Solutions Corporation Red Brick Warehouse Red Brick Systems 10

DWS Allegro C. Maar, R. Kudliński: Allegro on the way from XLS based controlling to a modern BI environment. Konferencja HD i BI, Warszawa, 2008 11 Cele stosowania MD 1. Zapewnienie jednolitego dostępu do wszystkich danych gromadzonych w ramach przedsiębiorstwa 2. Dostarczenie technologii (platformy) przetwarzania analitycznego - technologii OLAP wykonywanie zaawansowanych analiz, wspomagających zarządzanie przedsiębiorstwem, np. analiza trendów sprzedaży analiza nakładów reklamowych i zysków analiza ruchu telefonicznego eksploracja danych analiza rozwiązań alternatywnych (what-if analysis) symulowanie i przewidywanie przyszłości w MD 12

Technologia OLAP Błyskawicznie rozwijający się rynek badawczy i technologiczny 9.9 *10 9 $ w 2008 (METAGROUP) 13 OLTP a OLAP użytkownik funkcja dane aplikacje dostęp transakcja l. przetwarzanych rek. l. użytkowników DB size metric OLTP "zwykły" bieżące operacje, kluczowe dla działania firmy bieżące, elementarne powtarzalność działań odczyt/zapis krótka kilka, kilkadziesiąt kilkudzies., tysiące, setki tys. setki GB przepustowość (l. transakcji w jednostce czasu) OLAP analityk wspomaganie decyzji elementarne, zagregowane, historyczne ad hoc odczyt długa (godziny) miliony lub więcej kilku, kilkunastu dziesiątki TB czas odpowiedzi 14

Rozmiary HD Polska: HD Era GSM powyżej 30TB Około 80% HD powyżej 1TB (dane z XI 2007 wg. DMReview 17.04.08) Wall-Mart: powyżej 500TB (2005 r) Amazon: powyżej 15TB (2005 r) CERN Hadron Collider: 3TB dziennie (przewidywane) NASA EOSDIS: 1000TB rocznie 15 Projekt Systemu HD (wg.. Metodyki R. Kimball) analiza wymagań architektura techniczna systemu HD modelowanie HD (wymiary, fakty -> schemat) planowanie projektu i zarządzanie nim wymagania użytkownika struktury fizyczne utrzymanie wdrożenie projektowanie aplikacji analitycznych projektowanie ETL 16