Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie



Podobne dokumenty
Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Metadane. Data Maining. - wykład VII. Paweł Skrobanek, C-3 pok. 323 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006

OdświeŜanie hurtownie danych - wykład IV. Zagadnienia do omówienia. Wprowadzenie

Procesy ETL - wykład V. Struktura. Wprowadzenie. 1. Wprowadzenie. 2. Ekstrakcja 3. Transformacja 4. Ładowanie 5. Studium przypadków.

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl

Hurtownie danych - przegląd technologii

Spis tre±ci. Przedmowa... Cz ± I

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych. Wstęp. Architektura hurtowni danych. CO TO JEST HURTOWNIA DANYCH

ETL - wykład III. Zagadnienia do omówienia. Identyfikacja wymagań

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Wprowadzenie do technologii Business Intelligence i hurtowni danych

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Integracja systemów transakcyjnych

Część I Istota analizy biznesowej a Analysis Services

Hurtownie danych - przegląd technologii

Hurtownie danych. 31 stycznia 2017

Specjalizacja magisterska Bazy danych

Hurtownia danych praktyczne zastosowania

Co to jest Business Intelligence?

Spis treści. Część I Wprowadzenie do pakietu oprogramowania Analysis Services

Analityka danych w środowisku Hadoop. Piotr Czarnas, 27 czerwca 2017

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE

Budowa modeli wymagań dla Regionalnych Systemów Informacji Medycznej opartych o hurtownie danych

Ramowy plan kursu. Lp. Moduły Wyk. Lab. Przekazywane treści

Budowa systemu wspomagającego podejmowanie decyzji. Metodyka projektowo wdrożeniowa

Szczegółowy opis przedmiotu zamówienia

BD2 BazyDanych2. dr inż. Tomasz Traczyk 14. Systemy przetwarzania analitycznego

Analityka danych w środowisku Hadoop. Piotr Czarnas, 5 czerwca 2017

Zaawansowane systemy baz danych - ZSBD. Hurtownie danych 1. Problematyka hurtowni danych. Wykład przygotował: Robert Wrembel. ZSBD wykład 12 (1)

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Modele danych - wykład V

COMARCH DATA WAREHOUSE MANAGER 6.2

Systemy Business Intelligence w praktyce. Maciej Kiewra

Instalacja SQL Server Konfiguracja SQL Server Logowanie - opcje SQL Server Management Studio. Microsoft Access Oracle Sybase DB2 MySQL

KARTA PRZEDMIOTU. Hurtownie i eksploracja danych D1_5

Pierwsze wdrożenie SAP BW w firmie

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem. dr Jakub Boratyński. pok. A38

Szkolenie autoryzowane. MS Wdrażanie hurtowni danych w Microsoft SQL Server 2012

Praktyczne aspekty pozyskiwania wiedzy z danych z perspektywy matematyka w bankowości (VI zajęcia) Jakub Jurdziak

Integracja danych ubezpieczeniowych w czasie rzeczywistym. Łukasz Szewczyk Solution Architect

1 Wprowadzenie do koncepcji Microsoft Office BI 1 Zakres ksiąŝki 2 Cel ksiąŝki 3 Wprowadzenie do tematu 3 Zawartość rozdziałów 4

Baza danych. Modele danych

Sposoby analizy i interpretacji statystyk strony WWW.

Maciej Kiewra Quality Business Intelligence Consulting

Architektury i technologie integracji danych

Systemy OLAP II. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Wprowadzenie do Hurtowni Danych

Modele danych - wykład V. Zagadnienia. 1. Wprowadzenie 2. MOLAP modele danych 3. ROLAP modele danych 4. Podsumowanie 5. Zadanie fajne WPROWADZENIE

ZAŁĄCZNIK NR 5 - GRUPA PRODUKTÓW 5: OPROGRAMOWANIE BAZODANOWE

Rola analityki danych w transformacji cyfrowej firmy

Spis treści. Przedmowa

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

Problematyka hurtowni danych

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"

Zajęcia prowadzone przez MCT, auditora wiodącego systemów bezpieczeństwa informacji.

Baza danych to zbiór wzajemnie powiązanych ze sobą i zintegrowanych danych z pewnej dziedziny.

OPIS PRZEDMIOTU ZAMÓWIENIA

HURTOWNIE DANYCH Dzięki uprzejmości Dr. Jakuba Wróblewskiego

Szkolenia SAS Cennik i kalendarz 2017

Opisy efektów kształcenia dla modułu

Hurtownie danych - opis przedmiotu

Bazy danych 2. Wykład 1

DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE:

Hurtownie danych. Przetwarzanie zapytań. ZAPYTANIA NA ZAPLECZU

Instalacja SQL Server Express. Logowanie na stronie Microsoftu

Projektowanie, tworzenie aplikacji mobilnych na platformie Android

Plan wykładu. Hurtownie danych. Problematyka integracji danych. Cechy systemów informatycznych

Matematyka kodem nowoczesności. Zaproszenie do składania ofert

Systemy baz danych i hurtowni danych

Portale raportowe, a narzędzia raportowe typu self- service

System INTEGRYB jako zintegrowane repozytorium danych umożliwiające zaawansowaną analitykę badawczą

Hurtownie danych. Ładowanie, integracja i aktualizacja danych. INTEGRACJA DANYCH ETL

ISDP w systemach geoinformatycznych dla Parków Narodowych

Metody automatyzacji sprawozdawczości w systemie asist. Agnieszka Hołownia-Niedzielska

Bazy analityczne (hurtownie danych, bazy OLAP)

Rozwiązania wspomagające przetwarzanie wielkich zbiorów danych (VLDB) we współczesnych systemach zarządzania bazami danych

OLAP i hurtownie danych c.d.

Procesowanie i partycjonowanie Analysis Services od podszewki (300) Adrian Chodkowski Adrian.Chodkowski@outlook.com

Rozumie istotę i znacznie procesów ekstrakcji, transformacji i ładowania danych (ETL), zna wybrany język ETL oraz odpowiednie narzędzia.

Trendy BI z perspektywy. marketingu internetowego

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

HARMONOGRAM: DZIEŃ GODZINA MIEJSCE PROWADZĄCY TEMAT OPIS

Programowanie obiektowe

AUREA BPM Oracle. TECNA Sp. z o.o. Strona 1 z 7

Analiza danych i data mining.

Marcin Adamczak Jakub Gruszka MSP. Business Intelligence

Hurtownie danych. Hurtownie danych. dr hab. Maciej Zakrzewicz Politechnika Poznańska Instytut Informatyki. Maciej Zakrzewicz (1)

Wprowadzenie do Hurtowni Danych

Technologie efektywnego zarządzania danymi w systemach rejestrowych na przykładzie IRS

TOPWEB Microsoft Excel 2013 i PowerBI Przygotowanie danych, analiza i efektowna prezentacja wyników raportów

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA realizacja w roku akademickim 2016/17

Hurtownie danych a transakcyjne bazy danych

Business Intelligence

Wstęp do Business Intelligence

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2012/2013

Transkrypt:

Hurtownie danych i business intelligence - wykład II Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2005-2008 Zagadnienia do omówienia 1. 2. Przegląd architektury HD 3. Warsztaty BD sprzedaŝy Serwer WWW 1

Umiejscowienie hurtowni danych ujednolicone, przetworzone struktury danych struktury operacyjne (analiza danych) struktury dla potrzeb prezentacji danych Przykłady problemów: dobór odpowiedniej architektury HD (np. model relacyjny, wielowymiarowy, struktura scentralizowana, czy teŝ federacyjna) oraz odpowiedni model danych (np. ROLAP, MOLAP), opracowanie sposobu zasilania HD danymi ze źródeł zewnętrznych (m. in. ujednolicenie, czyszczenie danych, postępowanie z brakującymi danymi, ale takŝe np. optymalizacja czasowa, problem aktualności danych, problem z dostępem do danych) Przykłady problemów cd.: spełnienie wymogów związanych z wymaganiami dla zapytań analitycznych - czas odpowiedzi (np. wymogi na poziomie sekund lub godzin), - aktualność danych (np. problemy przy łączeniu danych z baz umiejscowionych w róŝnych krajach lub wynikające z opóźnionego wpisu danych przez system operacyjny do plików dyskowych) 2

optymalizacja zapytań analitycznych - zastosowanie agregacji (problem z aktualnością danych, czasem obliczania perspektyw, czasem obliczeń zapytania), - wykorzystanie perspektyw, - inne techniki (o czym później ). dobór narzędzi (m. in. platforma sprzętowa, wparcie ze strony SQL dla HD, moŝliwość partycjonowania danych, przetwarzanie rozproszone np. optymalizacja przetwarzania z wykorzystaniem systemów agentowych) dostosowanie całej architektury do struktury firmy oraz moŝliwości ewolucji HD przy zmianach zachodzących w przyszłości w firmie (trudne do określenia) łatwość rozszerzania i przebudowy, wsparcie ze strony narzędzia oraz zaprojektowanie zrozumiałej i czytelnej prezentacji wyników dla personelu nietechnicznego, specyfikacja wymagań uŝytkowników dla potrzeb budowy procesów analitycznych (budowa HD, to często budowa systemu z niezdefiniowanymi wymaganiami w świecie rzeczywistym naleŝy je dopiero określić wspólnie z personelem firmy), inne aspekty, to np.: sposób zarządzania projektem, koszty projektu, ocena jakości, problemy związane z reorganizacją źródeł danych, dobór technologii; nie zawsze sprawdzona technologia implementacyjna w jednym rozwiązaniu daje równie dobre wyniki w innym, zrozumienie biznesu, zabezpieczenie danych zarówno przed utratą, jak i dostępem nieupowaŝnionych osób. 3

źródła danych: ORACLE, Informix, database, Teradata, MS SQL Server, arkusze kalkulacyjne, róŝne pliki, transformacja danych: porównywanie danych z róŝnych systemów w celu zapewnienia jakości (m. in. uzupełnianie brakujących pola mogą być puste, wyszukiwanie i rozpoznawanie tych samych danych jedna osoba moŝe występować w róŝnych źródłach, nawet z róŝnymi atrybutami), transformacja danych cd.: standaryzacja danych (jedne źródła mogą zapisywać WROCŁAW, inne Wroclaw lub Wrocław), integracja danych (jedne źródła pamiętają sprzedaŝ, inne dane sprzedawcy jako np. parametry konfiguracji muszą one być połączone), i inne. hurtownia danych: odpowiednia organizacja, wspomaganie zapytań analitycznych, itp. 4

raportowanie: narzędzia z obszaru business intelligence, narzędzia dla OLAP/MOLAP tworzenie struktur wielowymiarowych oraz dostarczanie mechanizmów ich prezentacji w czytelnej, graficznej formie, data mining wykrywanie trendów, wzorców itp. z wykorzystaniem róŝnych metod, np. statystyki, sieci neuronowych ip. inne. metadane: dane o danych, mogą być wykorzystane np. do modyfikacji HD, w procesach integracji, ładowania i czyszczenia danych (patrz - ksero), operacje: odpowiadają m. in. za procesy ekstrakcji, manipulacji i ładowania danych do HD (narzędzia ETL) Architektura scentralizowana łatwa skalowalność, brak konieczności przesyłania danych (oprócz ładowania), wspólne metadane. 5

Architektura federacyjna optymalizacja, trudniejsze odświeŝanie danych, trudniejsze modyfikacje procesów analitycznych Architektura warstwowa prz.: etapowe gromadzenie danych integracja istniejących struktur, trudniejsza realizacja zapytań analitycznych moŝliwość autonomii oddziałów Architektura warstwowa, rozproszona optymalizacja przetwarzania, konieczność przesyłania danych trudniejsza aktualizacja danych, trudniejsza modyfikacja procesów 6

Architektura inne pomysły koncepcja Data Hubs (PowerCenter 6 INFORMATICA ),?, przetwarzanie zapytań analitycznych w systemie wieloagentowym (wykorzystanie mocy obliczeniowej róŝnego sprzętu, równowaŝenie obciąŝenia), wykorzystanie metadanych do zapamiętywania zmian w strukturze relacji (zmiana modelu relacyjnego) i inteligentna obsługa zapytań analitycznych. typowo gromadzenie informacji z róŝnych źródeł, organizacja danych dla potrzeb analitycznych HURTOWNIA DANYCH gromadzenie i odpowiednia organizacja (jak obok), Przykład architektury ksero. gromadzenie informacji o procesach w firmie (np. jak wygląda proces przyznania kredytu od złoŝenia wniosku do wypłaty środków w zaleŝności od tego, jacy pracownicy realizują poszczególne etapy) często wymaga to opracowania metod pozyskiwania takich informacji, umoŝliwia np. wspomaganie decyzji personalnych Przykład: propozycja Microsoft u Warstwa prezentacji IE, Office lub Business Scorecard Manager, ProClarity Analytics 6 (Performance Point) lub innych firm 7

Przykład: materiały ksero: MicroStrategy materiał CD: Business Object XI Connect koszt poszczególnych elemntów budowy HD - materiały pomocnicze DZIĘKUJĘ ZA UWAGĘ śyczę miłego dnia 8