Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie



Podobne dokumenty
Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl

Hurtownie danych - przegląd technologii

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Spis tre±ci. Przedmowa... Cz ± I

Procesy ETL - wykład V. Struktura. Wprowadzenie. 1. Wprowadzenie. 2. Ekstrakcja 3. Transformacja 4. Ładowanie 5. Studium przypadków.

Wprowadzenie do technologii Business Intelligence i hurtowni danych

Metadane. Data Maining. - wykład VII. Paweł Skrobanek, C-3 pok. 323 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006

Hurtownie danych. Wstęp. Architektura hurtowni danych. CO TO JEST HURTOWNIA DANYCH

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

OdświeŜanie hurtownie danych - wykład IV. Zagadnienia do omówienia. Wprowadzenie

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Hurtownie danych. 31 stycznia 2017

Co to jest Business Intelligence?

Część I Istota analizy biznesowej a Analysis Services

Rola analityki danych w transformacji cyfrowej firmy

Hurtownie danych - przegląd technologii

Hurtownia danych praktyczne zastosowania

Maciej Kiewra Quality Business Intelligence Consulting

COMARCH DATA WAREHOUSE MANAGER 6.2

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Pierwsze wdrożenie SAP BW w firmie

Instalacja SQL Server Konfiguracja SQL Server Logowanie - opcje SQL Server Management Studio. Microsoft Access Oracle Sybase DB2 MySQL

Ramowy plan kursu. Lp. Moduły Wyk. Lab. Przekazywane treści

Bartłomiej Graczyk MCT,MCITP,MCTS

Praktyczne aspekty pozyskiwania wiedzy z danych z perspektywy matematyka w bankowości (VI zajęcia) Jakub Jurdziak

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE

Specjalizacja magisterska Bazy danych

Analityka danych w środowisku Hadoop. Piotr Czarnas, 27 czerwca 2017

Budowa systemu wspomagającego podejmowanie decyzji. Metodyka projektowo wdrożeniowa

Systemy Business Intelligence w praktyce. Maciej Kiewra

Integracja danych ubezpieczeniowych w czasie rzeczywistym. Łukasz Szewczyk Solution Architect

Instalacja SQL Server Express. Logowanie na stronie Microsoftu

Integracja systemów transakcyjnych

Portale raportowe, a narzędzia raportowe typu self- service

DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE:

Szczegółowy opis przedmiotu zamówienia

Szkolenia SAS Cennik i kalendarz 2017

Hurtownie danych i przetwarzanie analityczne - projekt

Problematyka hurtowni danych

Analityka danych w środowisku Hadoop. Piotr Czarnas, 5 czerwca 2017

Spis treści. Część I Wprowadzenie do pakietu oprogramowania Analysis Services

OLAP i hurtownie danych c.d.

7. zainstalowane oprogramowanie zarządzane stacje robocze

ETL - wykład III. Zagadnienia do omówienia. Identyfikacja wymagań

System INTEGRYB jako zintegrowane repozytorium danych umożliwiające zaawansowaną analitykę badawczą

BD2 BazyDanych2. dr inż. Tomasz Traczyk 14. Systemy przetwarzania analitycznego

Szkolenie autoryzowane. MS Wdrażanie hurtowni danych w Microsoft SQL Server 2012

Business Intelligence

KARTA PRZEDMIOTU. Hurtownie i eksploracja danych D1_5

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"

Modele danych - wykład V

SiR_13 Systemy SCADA: sterowanie nadrzędne; wizualizacja procesów. MES - Manufacturing Execution System System Realizacji Produkcji

Kasy Fiskalne Lublin Analityk

Hurtownie danych - przegląd technologii

OPIS PRZEDMIOTU ZAMÓWIENIA

ZAŁĄCZNIK NR 5 - GRUPA PRODUKTÓW 5: OPROGRAMOWANIE BAZODANOWE

Hurtownie danych. Hurtownie danych. dr hab. Maciej Zakrzewicz Politechnika Poznańska Instytut Informatyki. Maciej Zakrzewicz (1)

Zajęcia prowadzone przez MCT, auditora wiodącego systemów bezpieczeństwa informacji.

Trendy BI z perspektywy. marketingu internetowego

HARMONOGRAM: DZIEŃ GODZINA MIEJSCE PROWADZĄCY TEMAT OPIS

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Wstęp do Business Intelligence

Praktyczne wykorzystanie elementów raportowania Microsoft Project 2010 /Project Server 2010 Sesja 5 PowerPivot & PowerView Bartłomiej Graczyk

Stawiamy na specjalizację. by CSB-System AG, Geilenkirchen Version 1.1

Hurtownie danych a transakcyjne bazy danych

Architektury i technologie integracji danych

Usługa archiwizacji danych w systemie Eureca. Marek Jelenik CONTROLLING SYSTEMS sp. z o.o.

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2016/2017

Bazy danych i ich aplikacje

Szczegółowy opis przedmiotu umowy. 1. Środowisko SharePoint UWMD (wewnętrzne) składa się z następujących grup serwerów:

Bazy danych 2. Wykład 1

Modele danych - wykład V. Zagadnienia. 1. Wprowadzenie 2. MOLAP modele danych 3. ROLAP modele danych 4. Podsumowanie 5. Zadanie fajne WPROWADZENIE

Oferta szkoleniowa Yosi.pl 2012/2013

Migracja XL Business Intelligence do wersji

Procesowanie i partycjonowanie Analysis Services od podszewki (300) Adrian Chodkowski Adrian.Chodkowski@outlook.com

Systemy baz danych i hurtowni danych

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2018/2019

Plan wykładu. Hurtownie danych. Problematyka integracji danych. Cechy systemów informatycznych

PROJEKT WSPÓŁFINANSOWANY ZE ŚRODKÓW UNII EUROPEJSKIEJ W RAMACH EUROPEJSKIEGO FUNDUSZU SPOŁECZNEGO OPIS PRZEDMIOTU. Rozproszone Systemy Baz Danych

HURTOWNIE DANYCH Dzięki uprzejmości Dr. Jakuba Wróblewskiego

Bazy danych. Zenon Gniazdowski WWSI, ITE Andrzej Ptasznik WWSI

AUREA BPM Oracle. TECNA Sp. z o.o. Strona 1 z 7

1 Wprowadzenie do koncepcji Microsoft Office BI 1 Zakres ksiąŝki 2 Cel ksiąŝki 3 Wprowadzenie do tematu 3 Zawartość rozdziałów 4

Hurtownie danych. Ładowanie, integracja i aktualizacja danych. INTEGRACJA DANYCH ETL

MONIT Monitorowanie Stanów w Układzie Pojazd Szynowy - Tor

Metody automatyzacji sprawozdawczości w systemie asist. Agnieszka Hołownia-Niedzielska

Serock warsztaty epuap 28 październik 2009 r. Sławomir Chyliński Andrzej Nowicki WOI-TBD Szczecin

Security Master Class

Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem. dr Jakub Boratyński. pok. A38

Opisy efektów kształcenia dla modułu

BUSINESS INTELLIGENCE DEVELOPMENT Tego Cię nauczymy:

12 czerwca Piotr Kozłowski Dyrektor ds. Rozwoju Sektora Samorządowego

VI Kongres BOUG Praktyczne aspekty wykorzystania Business Intelligence w przemyśle wydobywczym węgla kamiennego

Program szkolenia: Administracja SQL Server

Projektowanie, tworzenie aplikacji mobilnych na platformie Android

Marcin Adamczak Jakub Gruszka MSP. Business Intelligence

Transkrypt:

Hurtownie danych i business intelligence - wykład II Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2005-2012 Zagadnienia do omówienia 1. Miejsce i rola w firmie 2. Przegląd architektury 3. Warsztaty Miejsce i rola w firmie HURTOWNIA DANYCH JAKO SYSTEM WSPOMAGANIA DECYZJI pliki systemowe (np. informacje o logowaniu pracowników, logi systemowe) Narzędzia analityczne i prezentacji danych Narzędzia analityczne, interaktywna konstrukcja analiz Zarząd Analitycy Serwer WWW SYSTEM WSPOMAGANIA DECYZJI 1

Miejsce i rola w firmie Umiejscowienie hurtowni danych ujednolicone, przetworzone struktury danych struktury operacyjne (analiza danych) struktury dla potrzeb prezentacji danych Miejsce i rola w firmie Przykłady problemów: dobór odpowiedniej architektury (np. model relacyjny, wielowymiarowy, struktura scentralizowana, czy też federacyjna) oraz odpowiedni model danych (np. ROLAP, MOLAP), opracowanie sposobu zasilania danymi ze źródeł zewnętrznych (m. in. ujednolicenie, czyszczenie danych, postępowanie z brakującymi danymi, ale także np. optymalizacja czasowa, problem aktualności danych, problem z dostępem do danych) Miejsce i rola w firmie Przykłady problemów cd.: spełnienie wymogów związanych z wymaganiami dla zapytań analitycznych - czas odpowiedzi (np. wymogi na poziomie sekund lub godzin), - aktualność danych (np. problemy przy łączeniu danych z baz umiejscowionych w różnych krajach lub wynikające z opóźnionego wpisu danych przez system operacyjny do plików dyskowych) 2

Miejsce i rola w firmie optymalizacja zapytań analitycznych - zastosowanie agregacji (problem z aktualnością danych, czasem obliczania perspektyw, czasem obliczeń zapytania), - wykorzystanie perspektyw, - inne techniki (o czym później ). dobór narzędzi (m. in. platforma sprzętowa, wparcie ze strony SQL dla, możliwość partycjonowania danych, przetwarzanie rozproszone np. optymalizacja przetwarzania z wykorzystaniem systemów agentowych) Miejsce i rola w firmie dostosowanie całej architektury do struktury firmy oraz możliwości ewolucji przy zmianach zachodzących w przyszłości w firmie (trudne do określenia) łatwość rozszerzania i przebudowy, wsparcie ze strony narzędzia oraz zaprojektowanie zrozumiałej i czytelnej prezentacji wyników dla personelu nietechnicznego, specyfikacja wymagań użytkowników dla potrzeb budowy procesów analitycznych (budowa, to często budowa systemu z niezdefiniowanymi wymaganiami w świecie rzeczywistym należy je dopiero określić wspólnie z personelem firmy), Miejsce i rola w firmie inne aspekty, to np.: sposób zarządzania projektem, koszty projektu, ocena jakości, ocena ryzyka problemy związane z reorganizacją źródeł danych, dobór technologii; nie zawsze sprawdzona technologia implementacyjna w jednym rozwiązaniu daje równie dobre wyniki w innym, zrozumienie biznesu, zabezpieczenie danych zarówno przed utratą, jak i dostępem nieupoważnionych osób. 3

WARSTWA METADANYCH (ang. Metadata Layer) DANE ŹRÓDŁOWE (ang. Source Data Layer) WARSTWA TRANSFORMACJI DANYCH (ang. Data Transformation Layer) WARSTWA HURTOWNI DANYCH (ang. Data Warehouse Layer) WARSTWA OPERACYJNA (ang. Operations Layer) WARSTWA GENEROWANIA RAPORTÓW (ang. Reporting Layer) źródła danych: ORACLE, Informix, database, Teradata, MS SQL Server, arkusze kalkulacyjne, różne pliki, transformacja danych: porównywanie danych z różnych systemów w celu zapewnienia jakości (m. in. uzupełnianie brakujących pola mogą być puste, wyszukiwanie i rozpoznawanie tych samych danych jedna osoba może występować w różnych źródłach, nawet z różnymi atrybutami), transformacja danych cd.: standaryzacja danych (jedne źródła mogą zapisywać WROCŁAW, inne Wroclaw lub Wrocław), integracja danych (jedne źródła pamiętają sprzedaż, inne dane sprzedawcy jako np. parametry konfiguracji muszą one być połączone), i inne. hurtownia danych: odpowiednia organizacja, wspomaganie zapytań analitycznych, itp. 4

raportowanie: narzędzia z obszaru business intelligence, narzędzia dla OLAP/MOLAP tworzenie struktur wielowymiarowych oraz dostarczanie mechanizmów ich prezentacji w czytelnej, graficznej formie, data mining wykrywanie trendów, wzorców itp. z wykorzystaniem różnych metod, np. statystyki, sieci neuronowych ip. inne. metadane: dane o danych, mogą być wykorzystane np. do modyfikacji, w procesach integracji, ładowania i czyszczenia danych (patrz - ksero), operacje: odpowiadają m. in. za procesy ekstrakcji, manipulacji i ładowania danych do (narzędzia ETL) Architektura scentralizowana łatwa skalowalność, brak konieczności przesyłania danych (oprócz ładowania), wspólne metadane. 5

Architektura federacyjna marketing optymalizacja, zaopatrzenie i dystrybucja trudniejsze odświeżanie danych, trudniejsze modyfikacje procesów analitycznych Architektura warstwowa prz.: etapowe gromadzenie danych integracja istniejących struktur, trudniejsza realizacja zapytań analitycznych Wrocław Kraków Centralna możliwość autonomii oddziałów Architektura warstwowa, rozproszona Wrocław Kraków 1 marketing 2 3 optymalizacja przetwarzania, konieczność przesyłania danych trudniejsza aktualizacja danych, trudniejsza modyfikacja procesów 6

Architektura inne pomysły koncepcja Data Hubs (PowerCenter 6 INFORMATICA ),?, przetwarzanie zapytań analitycznych w systemie wieloagentowym (wykorzystanie mocy obliczeniowej różnego sprzętu, równoważenie obciążenia), wykorzystanie metadanych do zapamiętywania zmian w strukturze relacji (zmiana modelu relacyjnego) i inteligentna obsługa zapytań analitycznych. HURTOWNIA DANYCH typowo dodatkowo gromadzenie informacji z różnych źródeł, organizacja danych dla potrzeb analitycznych gromadzenie informacji o procesach w firmie (np. proces przyznania kredytu, proces windykacji należności) przykład kserokopia 1. zbieranie informacji z otoczenia (np. informacje giełdowe, informacje pogodowe, pliki systemowe, odczyty z urządzeń automatyki), inne np. informacje o zmianach w źródle danych, informacje opracowywane przez samą hurtownię, Przykład: propozycja Microsoft u Interfejs dostępu SQL ORACLE DB 2 SYSTEMY ŹRÓDŁOWE Pozyskiwanie danych Replication Services (Replikacja) Integration Services (ETL - Ekstrakcja, Trnasformacja, Ładowanie) Warstwa prezentacji IE, Office lub Business Scorecard Manager, ProClarity Analytics 6 (Performance Point) lub innych firm SQL Server 2005 Enterprise Edition + Office Professional 2003 Enterprise Edition 7

Przykłady: propozycja systemu: MicroStrategy (ksero) raportowanie z wykorzystaniem Business Object XI Connect (CD) koszt poszczególnych elementów budowy (ksero) Zlecenie (dla specjalisty ): zaproponować architekturę bazy OLTP oraz (ma służyć analizie ponoszonych wydatków na ubezpieczenie zdrowotne w kontekście umów zleceń oraz regionu) dokumenty źródłowe w załączeniu. DZIĘKUJĘ ZA UWAGĘ Życzę miłego dnia 8