JAK HURTOWNIA DANYCH MOśE WSPOMAGAĆ MENEDśERA W PRACY? Małgorzata Nycz, Barbara Smok Wprowadzenie Podstawą funkcjonowania przedsiębiorstwa w dzisiejszych warunkach jest posiadanie zasobów informacyjnych. Informacja to taki rodzaj zasobów, który pozwala na zwiększenie naszej wiedzy o nas i otaczającym nas świecie. Informacja dla zarządzania jest szczególnym rodzajem informacji. Pozwala na realizację takich funkcji jak: planowanie, organizowanie, przewodzenie i kontrolowanie. Efektywne zarządzanie jest tylko moŝliwe wtedy, kiedy posiadamy informacje o organizacji i jej otoczeniu [KiSr99, s.13]. KaŜde przedsiębiorstwo wykorzystuje róŝne systemy informatyczne w swojej bieŝącej działalności, które umoŝliwiają tworzenie róŝnego rodzaju raportów, jednak pewnych informacji nie da się z nich uzyskać, gdyŝ potrzebne są dane historyczne, często przechowywane na róŝnych nośnikach i nie udostępniane na bieŝąco. Jedną z nowoczesnych technologii, która moŝe wspomóc menedŝera w pracy jest technologia Business Intelligence (BI) oparta o hurtownię danych (HD), która przekształca duŝe ilości danych w informacje i wiedzę. Hurtowni danych (zw. teŝ magazynem danych) oparta jest na wielowymiarowej strukturze danych, a jej celem jest dostarczenie menedŝerom właściwej informacji, w odpowiednim czasie i po niskiej cenie. Techno-
logia ta nie zaleŝy od platformy sprzętowej, systemu operacyjnego, czy bazy danych. Integruje informacje potrzebne do analiz z róŝnych heterogenicznych źródeł przedsiębiorstwa. HD jest elektronicznym magazynem danych, który oczyszcza i transformuje dane z wielu źródeł i wielu form [InWG97]. Pozwala wykonywać analizy, sprawozdania, zestawienia, raporty, które mogą być pomocne menedŝerom w podejmowaniu decyzji. HD agreguje róŝne tematycznie dane w spójny system oraz pozwala zbudować powiązania biznesowe między danymi. Jej celem jest wspieranie menedŝerów poprzez dostarczenie wiedzy o przedsiębiorstwie w postaci raportów, prognoz, analiz, które umoŝliwią im podejmowania szybszych i lepszych decyzji na dynamicznym rynku. Artykuł prezentuje przykładowy projekt hurtowni danych, który moŝe wspomagać decydenta w podejmowaniu decyzji. Wpływ rewolucji informacyjnej na przedsiębiorstwo Obecnie, gdy wirtualna komunikacja wkracza do wielu przedsiębiorstw działalność ich bez wykorzystania nowych technologii informatycznych nie jest konkurencyjna. Przedsiębiorstwa ulegają ogromnym zmianom, których wyznacznikiem jest Nowa Ekonomia. Zmiany w otoczeniu działalności przedsiębiorstw mają wpływ na zmianę metod i zachowań zmierzających do zwiększenia wydajności i jakości realizowanych procesów. Wg J. Kisielnickiego ([GrHe02], s.154) to coś nowego i rewolucyjnego. Pod wpływem Internetowej i Globalnej pajęczyny dokonały się rewolucyjne zmiany, a powstała na tradycyjnych fundamentach tradycyjnej ekonomii nowa nauka, spowoduje rewizje w zasadach funkcjonowania przyszłego przedsiębiorstwa.
Nowa Ekonomia ukształtowała się w dwóch dziedzinach: informatyce i finansach. Do jej kluczowych czynników moŝna zaliczyć: rewolucję informacyjną, innowacje technologiczne i wzrost znaczenia wiedzy, globalizację oraz czynniki demograficzne [BRST01, s.15]. Rozwój technologii informatycznych wpłynął takŝe na elementy związane z funkcjonowaniem i zarządzaniem przedsiębiorstwem. Współczesne technologie wykorzystywane są do tworzenia właściwej interakcji pomiędzy decydentami, klientami oraz pracownikami, gdyŝ przedsiębiorstwa zainteresowane są realizacją strategii globalnej, polegającej m.in. na orientacji na rynek i klientów (dąŝą do maksymalnego skrócenia czasu wejścia z produktem na rynek, czy realizacji zamówienia), ciągłej obserwacji rynków i trendów (powoduje to potrzebę stałego dostępu do róŝnorodnych baz danych w czasie rzeczywistym). Przedsiębiorstwa mogą dopasować się do otoczenia, zmieniając swoją strukturę, funkcjonowanie, procesy itp. Obserwuje się powstawanie nowego typu społeczeństwa, opartego na wiedzy i informacji i nastawionego na zarządzanie innowacjami. Społeczeństwo to jest związane jest z szybkim rozwojem technologii teleinformatycznych. Środowisko pracy staje się bardziej złoŝone i wpływa m.in. na częste zmiany organizacyjne, przejęcia i połączenia, globalizację, mobilność pracowników. Praca w takim środowisku wymaga odpowiednio przygotowanego kapitału ludzkiego, współdziałania w zakresie specjalizacji stanowisk, rozproszenia kompetencji, czy projektów ad hoc. Bardzo szybki rozwój technologii informatycznych umoŝliwia pozyskiwanie, przesyłanie i analizę wiedzy. M Casey stwierdza, Ŝe społeczeństwo Informacyjne moŝemy zdefiniować jako społeczeństwo, w którym
informacja jest kluczowym elementem społeczno-ekonomicznej działalności i zmian [Case01, s.34]. Dlatego tak waŝnym staje się dostęp do informacji, która nabiera coraz większego znaczenia w gospodarce i w Ŝyciu społecznym. Technologia informacyjna stała się wyróŝnikiem ery informacji i wiedzy i ma wpływ na społeczeństwo. Podstawowym czynnikiem produkcji staje się wiedza i informacja. Ten nowy typ gospodarki określany jest jako gospodarka oparta na wiedzy (GOW). Rozwój systemów informatycznych objął swym zasięgiem równieŝ technologie wspomagające zarządzanie w przedsiębiorstwach. MoŜna zaobserwować przejście od pojęcia przetwarzania danych do pojęcia zarządzania i przetwarzania wiedzy. Wiedza człowieka i zasoby intelektualne są obecnie najbardziej wartościowymi aktywami kaŝdego przedsiębiorstwa [EDMA01, s.10]. Posiadanie przez menedŝera odpowiedniej wiedzy, we właściwym czasie i jej odpowiednie uŝycie skutkować moŝe dobrymi dla przedsiębiorstwa decyzjami. Mając na uwadze lawinowo rosnącą ilość informacji i wiedzy, moŝna, za pomocą nowoczesnych rozwiązań w zakresie technologii informacyjnych, wspomagać menedŝera poprzez dostarczanie mu tychŝe. Czy i na ile z nich skorzysta przy podejmowaniu decyzji, to zale- Ŝy od menedŝera. W zasobach baz danych tworzonych i eksploatowanych latami w przedsiębiorstwie moŝna odkryć sporo ciekawych informacji wcześniej nieznanych bądź niezauwaŝonych, a które mogą przekształcone w wiedzę - znakomicie przyczynić się do podjęcia właściwych decyzji. Hurtownia danych (HD) jako przykład nowoczesnego rozwiązania w zakresie IT, zastosowana w przedsiębiorstwie umoŝliwia integrację
danych pochodzących z róŝnych źródeł tak w przedsiębiorstwie, jak i z otoczenia. Na danych zebranych w HD moŝna przeprowadzać róŝnorakie operacje, jak np. złoŝone analizy wielowymiarowe czy data mining, w wyniku których uzyskać moŝna w krótkim czasie poŝyteczną wiedzę. Uzyskanie takiej wiedzy przy uŝyciu dotychczasowych technologii albo byłoby niemoŝliwe 1, albo czaso- i pracochłonne 2, a wyniki nie zawsze mogą być dostarczane menedŝerowi w Ŝądanym przez niego czasie. Firmy muszą stawić czoła wyzwaniu gwałtownej rozbudowy infrastruktury informatycznej. Nowoczesne systemy pozwalają uprościć środowisko informatyczne zmniejszając liczbę serwerów potrzebnych do uruchomienia aplikacji biznesowych, a zaoszczędzone koszty wykorzystać do rozwoju działalności przedsiębiorstwa. Większość współczesnych przedsiębiorstw zarządza heterogenicznym środowiskiem. Aby wykorzystać zawarte w nim dane, naleŝy je zintegrować wykorzystując np. wzmiankowana juŝ technologię hurtowni danych. HD jako przykład nowoczesnej technologii informacyjnej HD jest modelem opartym na systemie zarządzania wieloma heterogenicznymi bazami danych, który: odwzorowuje świat realny za pomocą bardzo złoŝonych narzędzi technologicznych, udostępnia oprogramowanie uŝytkowe, które umoŝliwia uŝytkownikowi końcowemu posługiwanie najbardziej złoŝoną bazą danych bez pomocy profesjonalistów, operu- 1 np. ze względu na to, Ŝe juŝ nie ma w firmie sprzętu i oprogramowania, które było uŝyte do utworzenia i eksploatacji danej bazy danych, czy teŝ formaty zapisu róŝnych zbiorów danych są ze sobą niekompatybilne i nie moŝna na tych danych łącznie przeprowadzić Ŝadnych operacji 2 np. kaŝdą bazę danych eksploruje się pod jej systemem zarządzania bazą danych (SZBD), a wyniki nie zawsze da się porównać
je nieograniczoną wielkością zbiorów, umoŝliwia dostęp do narzędzi i oprogramowania. HD jest technologią pozwalającą uporządkować dane gromadzone w przedsiębiorstwie. Jest to odrębne środowisko aplikacyjne posiadające dedykowaną bazę danych, która korzysta z róŝnorodnych źródeł danych i zaprojektowana została z myślą o dokonywaniu złoŝonych analiz na zgromadzonych danych. Głównym celem tworzenia HD jest wspomaganie przetwarzania informacji dla celów strategicznych i analitycznych. HD jest dynamiczną infrastrukturą łączącą bazy danych, sprzęt i oprogramowanie w zintegrowaną całość, która moŝe się zmieniać wraz z dynamiką rozwoju przedsiębiorstwa. W przeciwieństwie do tradycyjnych baz danych, naleŝy na nią patrzeć w kategoriach procesu. Hurtownia danych (rys1.) jest technologią, która pozwala uporządkować dane gromadzone w przedsiębiorstwie. Posiada dedykowaną bazę danych, która korzysta z róŝnorodnych źródeł danych i słuŝy do wykonywania złoŝonych analiz na zgromadzonych w niej danych. Dane w hurtowni są trwałe, uporządkowane tematycznie, zintegrowane, zasilane przyrostowo, często redundantne i odpowiednio zagregowane, zawierają wymiar czasowy. Hurtownia danych to centralne źródło informacji dla całego przedsiębiorstwa.
Rys1. Architektura HD Źródło: [InWG97] Dobrze zaprojektowana hurtownia danych jest podstawą dla systemów analitycznych oraz źródłem informacji do podejmowania decyzji w przedsiębiorstwie przez menedŝera. Źródłem danych dla HD mogą być heterogeniczne bazy danych oraz róŝne inne dokumenty, które są związane z działalnością przedsiębiorstwa. Źródła zostają poddane narzędziom ETL. Proces ETL (Extractaction, Transformation, Loading) jednym z etapów projektowania HD zasila ją danymi z systemów źródłowych. Polega na czyszczeniu danych, ich konsolidacji, przekształceniu do wspólnego formatu i ładowaniem do struktur HD. NaleŜy go zaplanować dwu etapowo: po raz pierwszy do załadowania HD, a następnie do ciągłego jej odświeŝania. Hurtownia danych zasilana jest cyklicznie często z wielu, rozproszonych i róŝnorodnych źródeł danych, dlatego niezbędne jest odpowiednie przeformatowanie danych i ich oczyszczenie, gdyŝ wówczas dane zgromadzone w hurtowni będą wiarygodne do wykonywania miarodajnych analiz.
Oracle Warehouse Builder (OWB) jest narzędziem do projektowania HD i zarządzania jej pracą (jest teŝ narzędziem ETL). Na jego strukturę składają się dwa środowiska: Projektowe, składające się z metadanych (informacji wspomagających projektowanie, uŝytkowanie i zasilanie HD), narzędzi projektowych i repozytorium (najwaŝniejszy element HD) wykonawcze, czyli bazy danych - z fizycznymi danymi źródłowymi - w oparciu o które działa HD. Przykład projektowania HD za pomocą Oracle Warehouse Builder W HD moŝemy zaprojektować róŝne obszary działalności menedŝera. MoŜe to być np. SprzedaŜ, Marketing, Kadry, Finanse, czy Zaopatrzenie. KaŜda z tych działalności moŝe tworzyć struktury gwiaździste HD. W naszym przykładzie wykorzystamy SprzedaŜ (rys2.). Przykładową bazę danych moŝemy załoŝyć np. w Accessie i wyeksportować w postaci plików tekstowych do OWB. NaleŜy wczytać wszystkie pliki. Wynik operacji prezentuje rys.3. Rys2.Przykład bazy danych SprzedaŜ Źródło: opracowanie własne
Po załoŝeniu plików tekstowych przechodzimy do zakładania tablic zewnętrznych, które są przechowywane w zwykłych plikach, dzięki czemu moŝna zadeklarować pliki danych jako tabelę, a następnie pobierać z nich dane, tak jakby był zwykła tabelą bazy danych. Tabele zewnętrzne są nowym sposobem importowania danych, umoŝliwiającym wykorzystania moŝliwości języka SQL w procesie importowania danych [AbCA03, s.395-397]. Najczęściej wykorzystuje się trzy modele reprezentacji i przechowywania danych w HD: relacyjny zw. ROLAP (Relational OLAP), wielowymiarowy zw. MOLAP lub MDOLAP (Multidimensional OLAP) oraz hybrydowy HOLAP (Hybrid OLAP). W naszym przykładzie wykorzystamy ROLAP, który fakty i wymiary przechowuje w serwerze relacyjnej bazy danych. ROLAP słuŝy do prowadzania analiz i wielowymiarowej prezentacji wykorzystując dane przechowywane w relacyjnej bazie danych (RDB) o specjalizowanej strukturze, najczęściej gwiazdy (Star schema) lub płatka śniegu (Snowflake schema). Dostęp do danych jest realizowany na poziomie języka zapytań SQL. Dane mogą być wstępnie agregowane lub wyliczane w trakcie ich wyszukiwania.
Rys3. Wynik załoŝenia plików tekstowych i tabel zewnętrznych Źródło: opracowanie własne Struktura gwiazdy składa się z faktu i wymiarów. Fakty reprezentują elementarne komórki danych, które są opisywane atrybutami liczbowymi, tzw. miarami. Zawierają informacje podlegające analizie. W naszym przykładzie faktem jest SprzedaŜ, której miarami są ilość sprzedanego towaru i podatek. Wymiary mogą tworzyć hierarchie. Ustalają one kontekst analizy. W naszym przykładzie wymiary to Klient, Produkt i Sklep. Centralny punkt struktur wielowymiarowych stanowią fakty, powiązane związkami z wymiarami. Struktura danych moŝe przybierać formę gwiazdy, gwiazdapłatek śniegu, płatka śniegu lub być konstelacją faktów. W naszym przykładzie mamy gwiazdę, którą prezentuje rys4.
Rys4. Struktura HD gwiazda Źródło: opracowanie własne Po zaprojektowaniu struktury HD gwiazdy moŝemy przejść do odwzorowań plików źródłowych w docelowe struktury HD. Mapowanie jest obiektem OWB zawierającym wszystkie informacje potrzebne do zdefiniowania procesu ETL (specyfikację źródeł danych i obiektów docelowych). Przystępujemy do mapowania wymiarów Sklep, Produkt i Klient oraz faktu SprzedaŜ. Jeden z przykładów mapowania prezentuje rys5. Rys5. Mapowanie wymiaru Sklep Źródło: opracowanie własne W systemach relacyjnych perspektywa jest strukturą opartą o zapytanie do bazy danych. Nie posiada własnych danych lecz udostępnia tylko te dane, które są wynikiem zapytania je definiującego. Natomiast perspektywa zmaterializowana (materialized view) posiada własne trwałe dane, które są wynikiem zmaterializowania danych wyznaczonych przez zapytanie, które ją definiuje. Wykorzystuje się ją w celu skrócenia czasu
wykonywania skomplikowanych, czasochłonnych zapytań, które zawierają połączenia i grupowania. W naszym przykładzie moŝemy zadać pytanie, jakie ilości produktów sprzedały poszczególne sklepy. Rys.6 prezentuje mapowanie tego zapytania. Wyniki tego zapytania przechowuje tabela zmaterializowana. Rys6. Mapowanie zapytania Źródło: opracowanie własne Tak zaprojektowana hurtownia moŝe słuŝyć menedŝerom do podejmowania decyzji. Aby hurtownia mogła dostarczać aktualnej wiedzy musi być cyklicznie odświeŝana. Dla kaŝdej działalności biznesowej moŝemy zaprojektować strukturę HD. MoŜna takŝe zaprojektować obszary biznesowe, które moŝna wykorzystać do analiz w narzędziach BI jak np. BI Beans i Discoverer, które umoŝliwiają tworzenie raportów w postaci tabel i wykresów graficznych. Z HD mogą korzystać menedŝerowie wykonując róŝnego rodzaju analizy, zapytania i raporty oraz Data Mining. Metody Data Mining umoŝliwiają pełne wykorzystanie informacji ukrytej w bazach danych. Narzędzia i techniki analityczne, które wykorzystują Data Mining pozwalają na
odkrycie wiedzy, którą moŝna wykorzystać do przewagi nad konkurencją, czy odnieść sukces w prowadzonym przez siebie biznesie. Pozwalają przekształcić dane w wiedzę o charakterze strategicznym. Metody Data Mining umoŝliwiają prognozowanie, szukanie powiązań, klasyfikacji, grupowanie i opisywanie przyszłych trendów i zachowań rynku. Prognozowanie (prediction, forecasting) polega na wykorzystaniu znanych wartości interesujących nas pól bazy danych w celu przewidywania wartości tych zmiennych w przyszłości. Podsumowanie Obecnie poszukuje się róŝnych narzędzi, które mogłyby wspomóc procesy podejmowania decyzji dostarczając menedŝerowi wiedzy o działalności przedsiębiorstwa. Tą technologią, moŝe być np. HD oraz narzędzia typu Data Mining. Idea eksploracji danych i odkrywania wiedzy jest prosta, lecz jej praktyczna realizacja jest przedsięwzięciem technologicznie i organizacyjnie złoŝonym, niekiedy bardzo trudnym. Wymaga m.in. odpowiedniego sprzętu i zaawansowanych środków programistycznych. Projektując HD koncentrujemy się na procesie. Z hurtowni moŝe korzystać wiele narzędzi, które mogą wykonywać wiele zadań, w oparciu o które moŝna wykonywać róŝnego rodzaju analizy. Informacje otrzymywane są w czasie rzeczywistym. Literatura [AbCA03] Abbey M., Corey N., Abramson I.: Oracle 9i przewodnik dla początkujących, Helion, Gliwice 2003
[ASAS03] Armstrong-Smith M., Armstrong_Smith D.: Oracle Discoverer. Helion Gliwice 2003 [BrSt01] Bratnicki M., StruŜyna J.: Przedsiębiorczość i kapitał intelektualny. Prace Naukowe AE w Katowicach, Katowice 2001 [Csae01] Casey, M. Europejska polityka informacyjna. Wyzwania I perspektywy dla administracji publicznej, Międzynarodowe Centrum Zarządzania Informacją Uniwersytetu M. Kopernika, Toruń 2001 [EdMa01] Edvinsson L., Malone M.: Kapitał intelektualny. PWN Warszawa 2001 [InWG97] Inmon W.H., Welch J.D., Glasey K.L.: Managing the Data Warehouse, Wiley Comp. Publishing 1997 [GrHe02] Grudzewski W., Hejduk I., (red).: Przedsiębiorstwo przyszłości wizja strategiczna, Difin, Warszawa, 2002 [KiSr99] Kisielnicki J., Sroka H.: Systemy Informacyjne biznesu. Agencaj Wyd. Placet, Warszawa 1999 [Orac06] Oracle Warehouse Builder User s Guide 10g Release 2 (10.2), Oracle 2006 [Wrem04] Wermbel R.: hurtownie danych oparte o Oracle 9i/10g przegląd funkcjonalności. Materiały Konferencyjne PLOUG, Kościelisko 2004 Informacje o autorach Dr inŝ. Małgorzata Nycz Dr Barbara Smok Katedra Systemów Sztucznej Inteligencji Akademia Ekonomiczna ul. Komandorska 118/120 53-345 Wrocław Polska Numer telefonu +48/71/3680507
e-mail: malgorzata.nycz@ae.wroc.pl barbara.smok@ae.wroc.pl