AKADEMIA GÓRNICZO-HUTNICZA



Podobne dokumenty
Usługi analityczne budowa kostki analitycznej Część pierwsza.

Wprowadzenie do technologii Business Intelligence i hurtowni danych

Schematy logiczne dla hurtowni danych

AKADEMIA GÓRNICZO-HUTNICZA. Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki KATEDRA INFORMATYKI. SyncFile

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

AKADEMIA GÓRNICZO-HUTNICZA

Kostki OLAP i język MDX

Część I Istota analizy biznesowej a Analysis Services

Wprowadzenie do hurtowni danych

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE

Hurtownia danych praktyczne zastosowania

Instalacja SQL Server Express. Logowanie na stronie Microsoftu

BD2 BazyDanych2. dr inż. Tomasz Traczyk 14. Systemy przetwarzania analitycznego

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Modele danych - wykład V. Zagadnienia. 1. Wprowadzenie 2. MOLAP modele danych 3. ROLAP modele danych 4. Podsumowanie 5. Zadanie fajne WPROWADZENIE

Migracja Business Intelligence do wersji

Migracja Business Intelligence do wersji

Modele danych - wykład V

Migracja XL Business Intelligence do wersji

Plan. Wprowadzenie. Co to jest APEX? Wprowadzenie. Administracja obszarem roboczym

Hurtownie danych. Przetwarzanie zapytań. ZAPYTANIA NA ZAPLECZU

Spis treści. Przedmowa

Baza danych to zbiór wzajemnie powiązanych ze sobą i zintegrowanych danych z pewnej dziedziny.

Model logiczny SZBD. Model fizyczny. Systemy klientserwer. Systemy rozproszone BD. No SQL

Hurtownie danych. Wstęp. Architektura hurtowni danych. CO TO JEST HURTOWNIA DANYCH

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Migracja Business Intelligence do wersji

Monitoring procesów z wykorzystaniem systemu ADONIS

Hurtownie danych. 31 stycznia 2017

Hurtownie danych - przegląd technologii

COMARCH DATA WAREHOUSE MANAGER 6.2

SQL w 24 godziny / Ryan Stephens, Arie D. Jones, Ron Plew. Warszawa, cop Spis treści

Migracja Business Intelligence do wersji 11.0

E-commerce. Genialnie proste tworzenie serwisów w PHP i MySQL.

Bazy danych 2. Wykład 1

Hurtownie danych. Rola hurtowni danych w systemach typu Business Intelligence

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl

Proces ETL. Katedra Inżynierii Oprogramowania Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika Gdańska {kris,

Program kadrowo płacowy - wersja wielodostępna z bazą danych Oracle SQL Server 8 lub 9

Hurtownie danych - przegląd technologii

Tom 6 Opis oprogramowania

Bazy danych. Zenon Gniazdowski WWSI, ITE Andrzej Ptasznik WWSI

Hurtownie danych. Metadane i czynniki jakości. BAZA METADANYCH. Centralna hurtownia danych. Metadane

PROJEKT WSPÓŁFINANSOWANY ZE ŚRODKÓW UNII EUROPEJSKIEJ W RAMACH EUROPEJSKIEGO FUNDUSZU SPOŁECZNEGO OPIS PRZEDMIOTU. Rozproszone Systemy Baz Danych

Hurtownie danych. Projektowanie hurtowni: modele wielowymiarowe. Modelowanie punktowe. Operacje OLAP na kostkach.

Migracja Comarch ERP Altum Business Intelligence do wersji 2019

Opis spełnienia wymagań (PSBD)

Plan. Aplikacja. Architektura aplikacji. Architektura aplikacji Tworzenie aplikacji Application Builder podstawy

Podyplomowe Studium Informatyki w Bizniesie Wydział Matematyki i Informatyki, Uniwersytet Łódzki specjalność: Tworzenie aplikacji w środowisku Oracle

Replikacja kolejkowa (Q-replication) w IBM DB2

Zintegrowane Systemy Zarządzania Biblioteką SOWA1 i SOWA2 ZAMAWIANIE I REZERWOWANIE

Temat : SBQL 1 obiektowy język zapytań.

CuBe EMAT Ewidencja Materiałowa Wersja

OLAP i hurtownie danych c.d.

Moduł mapowania danych

Bazy analityczne (hurtownie danych, bazy OLAP)

Ramowy plan kursu. Lp. Moduły Wyk. Lab. Przekazywane treści

Migracja XL Business Intelligence do wersji

Silent setup SAS Enterprise Guide (v 3.x)

REFERAT O PRACY DYPLOMOWEJ

SAS OLAP Cube Studio Wprowadzenie

Instalacja Oracle Designera ( )

Architektura systemu e-schola

OpenOfficePL. Zestaw szablonów magazynowych. Instrukcja obsługi

PROJEKT Z BAZ DANYCH

Uniwersytet Warszawski Wydział Matematyki, Informatyki i Mechaniki. Paweł Parys. Nr albumu: Aukcjomat

Tworzenie i obsługa wirtualnego laboratorium komputerowego

ZMODYFIKOWANY Szczegółowy opis przedmiotu zamówienia

Paweł Gołębiewski. Softmaks.pl Sp. z o.o. ul. Kraszewskiego Bydgoszcz kontakt@softmaks.pl

Migracja Comarch ERP Altum Business Intelligence do wersji

Wstęp. Opis ten dotyczy wydziałów orzeczniczych.

REFERAT PRACY DYPLOMOWEJ

Wprowadzenie do projektowania i wykorzystania baz danych Relacje i elementy projektowania baz

Hurtownie danych a transakcyjne bazy danych

E-1EZ s1. Technologie informacyjne. Elektrotechnika I stopień (I stopień / II stopień) Ogólnoakademicki (ogólno akademicki / praktyczny)

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2016/2017

Technologie informacyjne Information technologies

Przypisywanie bibliotek w architekturze SAS

Systemy Rozproszone Technologia ICE

LABORATORIUM 8,9: BAZA DANYCH MS-ACCESS

Spis tre±ci. Przedmowa... Cz ± I

PREZENTACJA FUNKCJONALNA SYSTEMU PROPHIX

ANALYSIS SERVICES. 1. Tworzymy połączenie ze źródłem danych. 2. Tworzymy nowy widok dla źródła danych

Hurtownia danych. Załącznik Nr 1 do SIWZ. Opis przedmiotu zamówienia. Lp. FUNKCJONALNOŚĆ/PARAMETRY WYMAGANE

ABC 2002/XP PL EXCEL. Autor: Edward C. Willett, Steve Cummings. Rozdział 1. Podstawy pracy z programem (9) Uruchamianie programu (9)

Leonard G. Lobel Eric D. Boyd. Azure SQL Database Krok po kroku. Microsoft. Przekład: Marek Włodarz. APN Promise, Warszawa 2014

Struktura prezentacji

Plan. Raport. Tworzenie raportu z kreatora (1/3)

Hurtownie danych. Ładowanie, integracja i aktualizacja danych. INTEGRACJA DANYCH ETL

Rady i porady użytkowe

A posteriori wsparcie w podejmowaniu decyzji biznesowych.

Comarch ERP XL Business Intelligence Start. Zmiany funkcjonalne wprowadzone w wersji 2013

Aplikacja serwerowa Platformy Prezentacyjnej Opis produktu

Opis Architektury Systemu Galileo

Spis treści. Część I Wprowadzenie do pakietu oprogramowania Analysis Services

DOKUMENTACJA BI SOW PFRON. Powykonawcza. dla BI INSIGHT S.A. UL. WŁADYSŁAWA JAGIEŁŁY 4 / U3, WARSZAWA. Strona 1 z 23

OnLine Analytical Processing (OLAP) Kostki OLAP i zapytania MDX

Uruchamianie bazy PostgreSQL

Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem. dr Jakub Boratyński. pok. A38

Transkrypt:

AKADEMIA GÓRNICZO-HUTNICZA Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki KATEDRA INFORMATYKI Hurtownia danych na przykładzie systemu billingowego. Kierunek, rok studiów: Informatyka, IV rok Przedmiot: Bazy danych Wersja 0.1-20 z dnia 06.01.2004 Grupa (projekt): Prowadzący zajęcia: Rok akad: 2003/2004 mgr inż. Bartłomiej Śnieżyński Zespół autorski: Marek Wiącek Paweł Zawada Paweł Trendota mwiacek@student.uci.agh.edu.pl pzawada@student.uci.agh.edu.pl paweltre@student.uci.agh.edu.pl Kraków, styczeń 2004

Niniejsze opracowanie powstało w trakcie i jako rezultat zajęć dydaktycznych z przedmiotu wymienionego na stronie tytułowej, prowadzonych w Akademii Górniczo-Hutniczej w Krakowie (AGH) przez osobę (osoby) wymienioną (wymienione) po słowach "Prowadzący zajęcia" i nie może być wykorzystywane w jakikolwiek sposób i do jakichkolwiek celów, w całości lub części, w szczególności publikowane w jakikolwiek sposób i w jakiejkolwiek formie, bez uzyskania uprzedniej, pisemnej zgody tej osoby (tych osób) lub odpowiednich władz AGH. (AGH) w Krakowie Spis treści 1. Wprowadzenie 3 2. Opis systemu 4 3. Warehouse 6 Wymiary 6 Cube y 6 Mapowania 8 Optymalizacja 9 4. Platforma i narzędzia 10 Oracle Warehouse Builder 10 Oracle Discoverer 10 5. Procedura instalacyjna 13 2

1. Wprowadzenie Hurtownia danych, inaczej nazywana magazynem danych lub data warehouse jest to wydzielona baza danych, której zadanie polega na gromadzeniu danych potrzebnych do zarządzania przedsięwzięciem. Baza to znajduje się w odosobnieniu od baz operacyjnych i powinna być zoptymalizowana pod kątem przetwarzania analitycznego. Fakt, że baza ta znajduje się w odosobnieniu nie oznacza jednak, że hurtownia nie korzysta z danych operacyjnych. Te właśnie dane są punktem wyjścia przetwarzania analitycznego. Okresowo są one zbierane i przetwarzane w celu dalszej analizy. Hurtownia danych różni się od zwykłych baz również pod kątem organizacji danych. Zwykłe bazy mogą być i często są rozproszone (na przykład informacje zbierane z różnych regionów sprzedaży znajdują się lokalnie w centrach sprzedaży) podczas gdy hurtownia z natury jest scentralizowana, łączy ona informację z wielu źródeł, zbiera dane uporządkowane tematycznie. Hurtownie oprócz danych elementarnych przekopiowanych z baz operacyjnych, zawierają one agregaty, czyli obliczone wartości pewnych danych np. średnie lub sumy. 3

2. Opis systemu Zakładamy, że realizowana hurtownia danych ma służyć analizie systemu bilingowego. System ten, gdyby został zrealizowany w wersji operacyjnej, miałby przede wszystkim możliwość rejestrowania prowadzonych rozmów i przesyłanych wiadomości, wraz ze wszystkimi danymi organizacyjnymi, takimi jak szczegółowe dane dotyczące użytkownika, jego wykształcenia, zarobków, miejsca zamieszkania itp. Jednak w naszym przypadku wersja operacyjna jest potrzebna jedynie jako źródło danych do analizy. Poniżej znajduje się graficzna ilustracja modelu danych wykorzystanego w bazie operacyjnej. 4

Obejmuje on następujące tabele: Accounts każde konto odpowiada jednemu numerowi telefonicznemu Calls zbiór wszystkich rozmów zarejestrowanych przez system CityPopulationGrades tabela pomocnicza służąca zaszeregowaniu miast pod względem liczności populacji Messages zbiór wszystkich wiadomości zarejestrowanych przez system Provinces zawiera mniejsze okręgi, które wchodzą w skład regionów Regions zawiera zbiór większych regionów, na które podzielony jest obszar objęty działaniem systemu SalaryGrades tabela pomocnicza służąca zaszeregowaniu zarobków użytkowników TarificationPlans zbiór planów taryfowych dla kont Users zbiór wszystkich użytkowników zarejestrowanych w systemie W celu wypełnienia powyższych tabel został napisany generator w języku Java. Połączenie z bazą danych uzyskuje się za pomocą mechanizmu JDBC. Tabele pomocnicze, takie jak Provinces, Regions czy SalaryGrades mają statycznie zdefiniowany zbiór danych przeznaczonych do wpisania do bazy danych, natomiast tabele, których zawartość ma odpowiadać danym generowanym przez rzeczywisty system jest wypełniana danymi losowymi. Przykłady takich tabel to Users, Messages, Calls. 5

3. Warehouse Wymiary WH_EDUCATION - wykształcenie WH_TARIFICATION_PLAN - plan taryfowy WH_CITY_POP_GRADE - wielkość miasta WH_SALARY_GRADE - wysokość zarobków WH_TIME - czas (hierarchia: rok, kwartał, miesiąc) WH_GENDER - płeć WH_REGION - region (hierarchia: region Polski, województwo) Poniżej przedstawione są dwa wymiary hierarchiczne: czasowy i terytorialny, pozostałe posiadają jeden poziom hierarchii. Cube y WH_INCOME - przychody z połączeń i wiadomości w regionach, taryfach i czasie. Miary przychody z połączeń i przychody z wiadomości. W większości systemów tego typu kostki mają największe znaczenie. Pozwalają łatwo znaleźć elementy generujące największe i najmniejsze przychody w przestrzeni i czasie. 6

WH_USERS - użytkownicy wg wymiarów: region, płeć, wykształcenie, wielkość miasta, wielkość zarobków. Miara liczba użytkowników Ta kostka daje ogólny pogląd o użytkownikach systemu. Ze względu na dużą liczbę wymiarów są tu szerokie możliwości analizy, wyszukiwania zależności pomiędzy grupą społeczną a liczbą użytkowników. WH_NEW_USERS - nowi użytkownicy na przestrzeni czasu w różnych regionach. Miara liczba użytkowników 7

Ta kostka pozwoli zanalizować, które regiony są najbardziej rozwojowe pod względem możliwości pozyskiwania nowych użytkowników. Dodatkowo uwidoczniona zostanie zmienność przyrostu użytkowników na przestrzeni czasu. Taka wiedza może się przydać na przykład, aby stwierdzić które miesiące są najlepsze dla promocji mających na celu zwerbowanie użytkowników. Mapowania Mapowania wyznaczają sposób budowy hurtowni na podstawie bazy operacyjnej. Możliwe mapowania to na przykład mapowanie tabeli do wymiaru lub zapytania do kostki (w naszym przypadku są to mapowania perspektyw zmaterializowanych do kostek). Mapowania wymiarów: WH_CITY_POP_GRADE_MAP WH_EDUCATION_MAP WH_GENDER_MAP WH_REGION_MAP WH_SALARY_GRADE_MAP WH_TARIFICATION_PLAN_MAP Mapowania kostek: WH_USERS_MAP WH_NEW_USERS_MAP WH_INCOME_MAP 8

Optymalizacja W przypadku hurtowni danych optymalizacja ma bardzo duże znaczenie. Nie chodzi tu o samą wygodę użytkowania, lecz o niebezpieczeństwo, że czas obliczania bardziej złożonych zapytań analitycznych może sięgać nawet dni, a więc przekraczać granice akceptowalnego czasu. Aby temu zapobiec, stosuje się techniki optymalizacyjne. Jedną z takich podstawowych technik jest zastosowanie perspektyw zmaterializowanych (materialized views). Umożliwiają one składowanie wyników zapytań w postaci tabel bazy danych. Często zdarza się na przykład, że zapytanie do bazy zawiera czasochłonne wyliczenia wartości zagregowanych. W przypadku użycia perspektywy zmaterializowanej wartości te zostaną fizycznie zapisane w bazie i zostaną użyte przy ponownym odwołaniu się do nich. Jednak wykorzystując mechanizm perspektyw zmaterializowanych należy się wykazać pewną ostrożnością, gdyż może wystąpić problem aktualności danych w nich zawartych. Dostępna jest funkcjonalność odświeżania danych w perspektywach asynchroniczna lub synchroniczna czyli wyzwalana przez przyczynę zewnętrzną lub podczas zmiany danych źródłowych. 9

4. Platforma i narzędzia Do realizacji projektu wykorzystaliśmy bazę danych Oracle 9i. Ta platforma bazodanowa posiada zestaw narzędzi zgrupowanych pod nazwą Oracle Warehouse Builder czyli OWB znacznie ułatwiających tworzenie hurtowni danych i przesuwanie danych z bazy operacyjnej do analitycznej. Korzystaliśmy z OWB w wersji 9.2. Oracle Warehouse Builder Oracle Warehouse Builder służy do projektowania hurtowni danych. Umożliwia definiowanie źródeł danych, projektowania struktur hurtowni a także tworzenie procedur transformacji danych. Procedury transformacji danych tworzy się za pomocą interfejsu graficznego używając operatorów mapowania, przy pomocy których można zdefiniować większość przekształceń. Oracle Warehouse Builder umożliwia zarządzanie zmianami w strukturach wejściowych i docelowych. Różnice występujące pomiędzy aktualnym projektem, a definicją zewnętrznych tabel są wykrywane przez narzędzie i możliwe do automatycznego wprowadzenia do repozytorium. Oracle Discoverer Oracle Discoverer jest rozwiązaniem umożliwiającym definiowanie i wykonywanie analiz przekrojowych na bazie zdefiniowanych struktur. W jego skład wchodzą dwie aplikacje: Oracle Discoverer Administrator i Oracle Discoverer Desktop. Oracle Discoverer Administrator służy do definiowania struktur, które są wykorzystywane do właściwej analizy. 10

Oracle Discoverer Desktop jest przeznaczony dla użytkownika końcowego, służy do przeprowadzania analiz danych. Użytkownik może wybrać interesujące go dane, zanalizować je oraz zobaczyć wyniki w postaci tabelarycznej lub graficznej. Można także prowadzić interaktywną analizę danych, polegającą na drążeniu w górę, w dół oraz do powiązanych elementów, sortowanie danych itp. Narzędzie to jest stosunkowo proste w obsłudze, ale jednocześnie rozbudowane i oferujące sporą funkcjonalność. Poniżej przykładowy widok analizy dane o przychodach z połączeń we wszystkich regionach przedstawione na wykresie kołowym. 11

12

5. Procedura instalacyjna Poniżej zamieszczamy kompletny opis instalacji i uruchomienia hurtowni. Wszystkie potrzebne dane oprócz narzędzi są dostarczone wraz z końcową wersją projektu. 1. Zainstalować serwer Oracle9i. 2. Utworzyc uzytkownika dla bazy OLTP: CREATE USER wh IDENTIFIED BY whpassword; GRANT CONNECT, RESOURCE TO wh; 3. Wykonać skrypt create-db.sql na schemacie wh. 4. Uruchomić generator napisany w Javie. 5. Zainstalować OWB (musi być zarówno po stronie serwera, jak i klienta, chyba że uruchamia się wszystko na jednej maszynie). 6. Uruchomić OWB Repository Assistant i stworzyć repozytorium w schemacie owb. 7. Uruchomic Runtime Assistant i stworzyć Runtime w schemacie owbr oraz użytkownika dostępowego owbra. 8. Stworzyć dla runtime nowy Target Schema w schemacie owbts. 9. Uruchomić skrypt grant.sql jako SYSDBA. 10. Uruchomić OWB Client, zaimportować metadane. 11. W OWB Client zmodyfikować lokacje, aby odwoływały się do właściwej bazy danych. 12. Wykonać deploy na obiektach w takiej kolejnosci: - Funkcje, - Widoki z Warehouse'a - Wymiary, - Cube'y - Procedury - Mapowania dla wymiarów - Mapowania dla cube'ów 13. Wykonać WH_POPULATE_TIME w schemacie owbra. 14. Wykonać mapowania: - Uruchomić mapowania (Deployment manager -> menu kontekstowe -> Execute) dla wymiarów. - Uruchomić mapowania dla cube'ow. 13

14