Hurtownie danych. Wstęp. Architektura hurtowni danych. http://zajecia.jakubw.pl/hur CO TO JEST HURTOWNIA DANYCH



Podobne dokumenty
Bazy danych. Plan wykładu. Rodzaje baz. Rodzaje baz. Hurtownie danych. Cechy hurtowni danych. Wykład 14: Hurtownie danych

HURTOWNIE DANYCH Dzięki uprzejmości Dr. Jakuba Wróblewskiego

Wstęp do Business Intelligence

Hurtownie danych - opis przedmiotu

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych. 31 stycznia 2017

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych. Wprowadzenie do systemów typu Business Intelligence

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE

Modele danych - wykład V

Hurtownie danych. Projektowanie hurtowni: modele wielowymiarowe. Modelowanie punktowe. Operacje OLAP na kostkach.

Hurtownie danych. Hurtownie danych. dr hab. Maciej Zakrzewicz Politechnika Poznańska Instytut Informatyki. Maciej Zakrzewicz (1)

Hurtownie danych a transakcyjne bazy danych

Wprowadzenie do technologii Business Intelligence i hurtowni danych

Modele danych - wykład V. Zagadnienia. 1. Wprowadzenie 2. MOLAP modele danych 3. ROLAP modele danych 4. Podsumowanie 5. Zadanie fajne WPROWADZENIE

BD2 BazyDanych2. dr inż. Tomasz Traczyk 14. Systemy przetwarzania analitycznego

Hurtownie danych. Przetwarzanie zapytań. ZAPYTANIA NA ZAPLECZU

Systemy baz danych i hurtowni danych

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Hurtownie danych. Rola hurtowni danych w systemach typu Business Intelligence

Problematyka hurtowni danych

Spis tre±ci. Przedmowa... Cz ± I

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl

Hurtownie danych - przegląd technologii

Hurtownie danych czyli jak zapewnić dostęp do wiedzy tkwiącej w danych

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Model logiczny SZBD. Model fizyczny. Systemy klientserwer. Systemy rozproszone BD. No SQL

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Spis treści. Część I Wprowadzenie do pakietu oprogramowania Analysis Services

PROJEKT WSPÓŁFINANSOWANY ZE ŚRODKÓW UNII EUROPEJSKIEJ W RAMACH EUROPEJSKIEGO FUNDUSZU SPOŁECZNEGO OPIS PRZEDMIOTU. Rozproszone Systemy Baz Danych

Hurtownie danych wykład 3

Część I Istota analizy biznesowej a Analysis Services

Usługi analityczne budowa kostki analitycznej Część pierwsza.

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"

Business Intelligence

OdświeŜanie hurtownie danych - wykład IV. Zagadnienia do omówienia. Wprowadzenie

4. Znaczenie czasu w modelowaniu i strukturalizacji danych

Hurtownie danych. Ładowanie, integracja i aktualizacja danych. INTEGRACJA DANYCH ETL

Pierwsze wdrożenie SAP BW w firmie

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2016/2017

Budowa systemu wspomagającego podejmowanie decyzji. Metodyka projektowo wdrożeniowa

Bazy analityczne (hurtownie danych, bazy OLAP)

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Co to jest Business Intelligence?

Cel przedmiotu. Wymagania wstępne w zakresie wiedzy, umiejętności i innych kompetencji 1 Język angielski 2 Inżynieria oprogramowania

Plan. Inteligencja bisnesowa (Bussiness Intelligence) Hurtownia danych OLAP

1. Ewolucja systemów opartych na bazach danych 2. Czym się rożni modelowanie od strukturalizacji danych? Model danych Struktury (danych)

Bazy Danych. Bazy Danych i SQL Podstawowe informacje o bazach danych. Krzysztof Regulski WIMiIP, KISiM,

HURTOWNIE DANYCH. Krzysztof Goczyła. Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska. kris@eti.pg.gda.pl. K.

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2018/2019

Informatyka I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) stacjonarne (stacjonarne / niestacjonarne)

KARTA PRZEDMIOTU. Hurtownie i eksploracja danych D1_5

Informatyka I stopień (I stopień / II stopień) ogólnoakademicki (ogólno akademicki / praktyczny) niestacjonarne (stacjonarne / niestacjonarne)

Ewolucja systemów baz danych

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA realizacja w roku akademickim 2016/17

Karta przedmiotu studiów podyplomowych

Hurtownia danych praktyczne zastosowania

Procesy decyzyjne w oparciu o hurtownie danych

Indeksy w bazach danych. Motywacje. Techniki indeksowania w eksploracji danych. Plan prezentacji. Dotychczasowe prace badawcze skupiały się na

Wielowymiarowy model danych

Hurtownie danych w praktyce

AUREA BPM Oracle. TECNA Sp. z o.o. Strona 1 z 7

Hurtownie Danych. Dariusz Dymek

Usługa archiwizacji danych w systemie Eureca. Marek Jelenik CONTROLLING SYSTEMS sp. z o.o.

OLAP i hurtownie danych c.d.

Rola analityki danych w transformacji cyfrowej firmy

Data warehousing tool for decision making in management

Ewolucja technik modelowania hurtowni danych

Spojrzenie na systemy Business Intelligence

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2012/2013

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Bazy danych i ich aplikacje

PODSTAWOWE POJECIA ZWIAZANE Z HURTOWNIAMI DANYCH Najczęściej decyzja o stworzeniu hurtowni nadchodzi, gdy dana organizacja upora się z informatyzacją

Wprowadzenie do Hurtowni Danych

Paweł Gołębiewski. Softmaks.pl Sp. z o.o. ul. Kraszewskiego Bydgoszcz kontakt@softmaks.pl

Baza danych to zbiór wzajemnie powiązanych ze sobą i zintegrowanych danych z pewnej dziedziny.

Hurtownie danych i systemy wspomagania decyzji. Olaf Morawski Hewlett-Packard Polska Sp. z o.o., ul. Szturmowa 2A, Warszawa

Hurtownie danych. Metadane i czynniki jakości. BAZA METADANYCH. Centralna hurtownia danych. Metadane

Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem. dr Jakub Boratyński. pok. A38

Zaawansowane bazy danych i hurtownie danych Wydział Informatyki Politechnika Białostocka

Tematy projektów Edycja 2014

Plan wykładu. Hurtownie danych. Problematyka integracji danych. Cechy systemów informatycznych

Typy systemów informacyjnych

Informatyzacja przedsiębiorstw

Bazy danych i usługi sieciowe

Automatyzacja Procesów Biznesowych. Systemy Informacyjne Przedsiębiorstw

Matematyka kodem nowoczesności. Zaproszenie do składania ofert

Hurtownie danych - przegląd technologii

ZINTEGROWANE SYSTEMY INFORMATYCZNE ZARZĄDZANIA

KOMPUTEROWE WSPOMAGANIE ZARZĄDZANIA

LITERATURA. C. J. Date; Wprowadzenie do systemów baz danych WNT Warszawa 2000 ( seria Klasyka Informatyki )

Hurtownie danych narzędziem wspomagającym procesy decyzyjne w zarządzaniu Data warehousing tool for decision making in management

Oracle11g: Wprowadzenie do SQL

Szkolenie autoryzowane. MS Wdrażanie hurtowni danych w Microsoft SQL Server 2012

Bazy danych. Zenon Gniazdowski WWSI, ITE Andrzej Ptasznik WWSI

Informatyzacja przedsiębiorstw

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Baza danych. Modele danych

Migracja XL Business Intelligence do wersji

Transkrypt:

Wstęp. Architektura hurtowni. Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/hur CO TO JEST HURTOWNIA DANYCH B. Inmon, 1996: Hurtownia to zbiór zintegrowanych, nieulotnych, ukierunkowanych baz, wykorzystywanych w systemach wspomagania decyzji. Podstawowe cele: przetwarzanie analityczne (OLAP) wspomaganie decyzji (DSS) archiwizacja 1

Pozycje podstawowe: LITERATURA Ch. Todman. Projektowanie hurtowni. WNT, Warszawa 2003. M. Jarke, M. Lenzerini, Y. Vassiliou, P. Vassiliadis.. Podstawa organizacji i funkcjonowania, WSiP, Warszawa 2003. Pozycje dodatkowe: V. Poe, P. Klauer, S. Brobst. Tworzenie hurtowni. WNT, Warszawa 2000. inne... OLTP a OLAP OLTP on-line transaction processing przetwarzanie transakcyjne OLAP on-line analytical processing przetwarzanie analityczne bieżąca działalność przedsiębiorstwa duża liczba prostych zapytań (fakty) dodawanie, usuwanie i modyfikacja natychmiastowy dostęp do aktualnych informacji analizy, raporty niewielka liczba skomplikowanych zapytań (podsumowania) odczytywanie informacji i ich cykliczne uzupełnianie dane mogą być dostępne z opóźnieniem 2

SYSTEMY WSPOMAGANIA DECYZJI DSS (decision support systems) Tworzenie raportów jaka była wielkość sprzedaży w rozbiciu na miesiące? jaka grupa klientów generuje 80% obrotu? jaka jest struktura (histogram) wielkości zakupów? Odkrywanie wiedzy (KDD, data mining) b IF a = fast AND b < 14.7 THEN c = high ( in 85% ) a High Med. Low CRM Customer Relationship Management - zarządzanie kontaktami z klientami Cele biznesowe: pozyskiwanie nowych klientów, zatrzymanie najlepszych klientów, zwiększenie sprzedaży CRM - rozwiązania programowe i organizacyjne mające na celu zmniejszenie ryzyka utraty klientów gromadzenie informacji o klientach usprawnienie kontaktów z klientami wsparcie techniczne akcji marketingowych. 3

ARCHITEKTURA (1) integracja czyszczenie odświeżanie agregacje, propagacja aktualizacji (oddziałowe, data marts) Źródła Wyniki (np. raporty) Magazyny operacyjnych (ODS) ARCHITEKTURA (2) ODS stanowią warstwę pośrednią,w której dane są już zintegrowane. Zwykle ODS są częściej aktualizowane, niż właściwa. 4

KWESTIE TECHNICZNE Typowe operacje (zastosowania) w ch tematycznych: - OLAP: obracanie kostki, zwijanie, rozwijanie... (zestawienia statystyczne) - Eksploracja (opis lub przewidywanie) - GIS (informacje geograficzne/przestrzenne) - Business Intelligence (analiza wariantów: co by było, gdyby...) MODEL WIELOWYMIAROWY Baza zawiera fakty opisane przez wymiary i określające wartość miar. Przykład: produkt Kostka wielowymiarowa Fakt - pojedyncza sprzedaż. Opisana przez czas, klienta, produkt, sklep itp. Miarą może być np. wartość sprzedaży, liczba sztuk itp. Poziom agregacji to poziom szczegółowości opisu wymiarów, np. czas można dzielić na dni lub na kwartały. sklep czas 230$ Zawartość komórki: zagregowana miara (np. suma sprzedaży danego produktu w danym sklepie, danego dnia) 5

SYSTEMY ZARZĄDZAJĄCE Zapytania bieżące ODS SQL ROLAP RDBMS - systemy relacyjne (typu VLDB - very large database drivers) lub superrelacyjne MDDB ROLAP - Relational OLAP, nakładka przesłaniająca relacyjną strukturę na rzecz dostępu wielowymiarowego. MDDB - systemy zarządzające przechowujące dane bezpośrednio w postaci kostek wielowymiarowych. Systemy superrelacyjne - dodatkowe funkcje relacyjnych baz ułatwiające obsługę hurtowni (wsparcie schematu gwiazdy, indeksy, formaty ). RODZAJE IMPLEMENTACJI Architektura scentralizowana: fizyczna centralna (i ew. ODS). Architektura federacyjna: centralna jest wirtualna (perspektywy nie zawsze zmaterializowane), pobiera dane z ODS. Architektura warstwowa: fizyczna centralna, kolejne warstwy fizycznych hurtowni tematycznych. 6

ODS może istnieć materialnie lub nie ARCHITEKTURA SCENTRALIZOWANA ODS jest materialna zwykle są zmaterializowane (ze względów wydajnościowych) ARCHITEKTURA FEDERACYJNA ODSy są zmaterializowane i stanowią faktyczne miejsce przechowywania ODS jest wirtualna (stanowi tylko wspólny model logiczny i pojęciowy ) są zmaterializowane 7

ARCHITEKTURA WARSTWOWA Coraz wyższe stopnie agregacji. Dane z kolejnych warstw są obliczane na podstawie poprzednich. Ze względu na wydajność, wszystkie warstwy są zmaterializowane. PERSPEKTYWA PRAKTYCZNA (1) Typowa ilość : >1 TB Wiele firm dysponuje znacznie większymi danymi archiwalnymi. Nawet bazy produkcyjne osiągają obecnie wielkości >1 TB (ocenia się, że na świecie jest kilka tysięcy takich przedsiębiorstw). Typowe obciążenie zapytaniami: rzędu 10 tys. zapytań OLAP na dobę, do 100 użytkowników (analitycznych). Typowy czas projektów: od 1 do 3 lat. Typowy budżet: 1 mln. USD, z czego 60% na sprzęt, 16% na oprogramowanie bazodanowe. 8

PERSPEKTYWA PRAKTYCZNA (2) Odświeżanie zwykle w cyklu dobowym. Modny kierunek: Real-Time Data Warehousing, czyli połączenie typowej hurtowni z możliwością bieżącego odświeżania (np. w cyklach godzinnych czy minutowych). Hurtownia to przedsięwzięcie nie tylko informatyczne, ale też organizacyjne (ustalenie procedur i instrukcji postępowania, schematów replikacji itp.). 9