UWARUNKOWANIA WDROśEŃ HURTOWNI DANYCH W ORGANIZACJACH GOSPODARCZYCH Jacek Maślankowski Wprowadzenie Niniejszy artykuł ma na celu przybliŝenie wiedzy na temat wdroŝeń systemów hurtowni danych w polskich organizacjach. Wnioski dotyczące aktualnego poziomu zastosowań hurtowni danych są rezultatem badań przeprowadzonych przez autora artykułu na przełomie 2007 i 2008 roku w polskich przedsiębiorstwach, działających w róŝnych branŝach, w których hurtownia danych jest jednym z podstawowych systemów informatycznych przedsiębiorstwa. Artykuł został podzielony na trzy części. Pierwsza część opisuje istotę hurtowni danych. Kolejne części prezentują wyniki badań w polskich organizacjach gospodarczych, odpowiednio opisując charakter hurtowni danych, cele wdroŝenia oraz kryteria wyboru systemu. Ostatnia część artykułu dotyczy prezentacji wniosków. Praca naukowa jest finansowana ze środków na naukę w roku 2008 jako projekt badawczy promotorski nr rejestracyjny N N111 453234. Hurtownie danych Hurtownię danych przyjęło się definiować jako repozytorium, będące kopią danych pochodzących z systemów transakcyjnych przedsiębiorstwa. W przeciwieństwie do tradycyjnych baz danych hurtownia powinna
posiadać następujące cechy: uporządkowanie tematyczne, zawieranie wymiaru czasowego, nieulotność danych oraz integracja danych [Inmo02]. Uporządkowanie tematyczne oznacza, iŝ dane dotyczą jednego obszaru działalności przedsiębiorstwa, na przykład sprzedaŝy. Zawieranie wymiaru czasowego powoduje, iŝ kaŝde zdarzenie opisane w hurtowni danych, na przykład fakt sprzedaŝy, ma odniesienie w określonej jednostce czasu. Nieulotność danych prowadzi do zapewnienia, Ŝe dane znajdujące się w systemie hurtowni danych nie mogą zostać usunięte. Integracja danych odnosi się do konieczności ujednolicenia wszystkich danych znajdujących się w hurtowni. Oznacza to, iŝ niezaleŝnie w jakim formacie dane były przechowywane w systemie źródłowym, obecnie powinny mieć format spójny z pozostałymi danymi przechowywanymi w hurtowni. Dotyczy to w szczególności takich informacji jak daty, jednostki miary, czy teŝ jednostki pienięŝne [Todm03]. Hurtownia danych jest procesem biznesowym, którego celem jest zwiększanie potencjału pozyskiwania inteligentnych informacji z danych [SuPo07]. Analiza danych dostarcza moŝliwości odkrycia nowych i znaczących informacji na podstawie posiadanych informacji [ArSm03]. Obecnie organizacje budują hurtownie danych przyjmujące strumień bie- Ŝących danych oraz umoŝliwiające za pomocą sprzęŝenia zwrotnego przekazywanie tych danych z powrotem do źródłowych systemów transakcyjnych [SiSh02]. Systemy hurtowni danych mogą przyjmować postać pojedynczych korporacyjnych hurtowni danych lub zbioru wielu tematycznych hurtowni [KiRo02]. Zaletą stosowania korporacyjnych hurtowni danych jest zapewnienie integracji danych oraz elastyczność rozbudowy
hurtowni danych. Z kolei hurtownie tematyczne pozwalają na uzyskanie większej wydajności przetwarzania danych przy jednoczesnym zwiększonym bezpieczeństwie danych. Charakterystyka hurtowni danych w polskich organizacjach W opisywanym w niniejszym artykule badaniu wzięło udział 8 firm. Badanie polegało na przeprowadzeniu wywiadu skategoryzowanego, podzielonego na 9 części, którego celem było zbadanie aktualnego poziomu zastosowań hurtowni danych w polskich organizacjach. Charakter biznesowy badanych organizacji jest róŝny, co wynika z faktu, iŝ branŝa ich działalności jest odmienna. Pomimo tego, praktycznie w kaŝdym przedsiębiorstwie głównym zastosowaniem hurtowni danych jest raportowanie (rysunek 1). Powodem wdroŝenia hurtowni najczęściej była konieczność poprawy wydajności procesu raportowania oraz dostarczenia właściwej informacji osobom do tego uprawnionym. Rys1. Typowy model zastosowań hurtowni danych w badanych organizacjach
Źródło: Opracowanie własne. W badanych organizacjach wdroŝenie hurtowni danych nastąpiło w ciągu ostatnich pięciu lat. Najczęściej wykorzystywanymi systemami są hurtownie korporacyjne, gdyŝ zdaniem respondentów usprawnia to procesy zarządzania oraz utrzymywania systemu hurtowni danych. UŜywane rozwiązania pochodzą najczęściej od dostawcy, którego inne produkty były wcześniej uŝywane w organizacji. MoŜna zauwaŝyć pewną prawidłowość, iŝ wdroŝenie systemu SAP BW najczęściej jest poprzedzone wdroŝeniem systemu SAP R/3. Z kolei stosowanie systemu bazodanowego opartego na rozwiązaniu Microsoft SQL Server najczęściej jest wymuszone przez uŝywane specyficznych narzędzi firmy Microsoft do analiz i raportów. Problem integracji jest równieŝ przyczyną faktu, iŝ częściej w polskich przedsiębiorstwach wykorzystuje się pojedyncze hurtownie korporacyjne niŝ zestaw hurtowni tematycznych. Cele wdroŝenia Podstawowym celem wynikającym z wdroŝenia hurtowni danych w opisywanych przedsiębiorstwach było utworzenie systemu dostarczającego spójnych i wiarygodnych danych do raportów i analiz. Zaledwie w dwóch z opisywanych przypadków dodatkowym załoŝeniem była pełna integracja z istniejącym systemem klasy ERP. W jednym z przedsiębiorstw załoŝeniem była równieŝ integracja z systemem klasy CRM. NaleŜy zauwaŝyć, iŝ w takiej sytuacji repozytorium danych hurtowni posiada nie tylko dane historyczne, ale równieŝ transakcyjne. W takich przypadkach dane w hurtowni są aktualizowane natychmiast, po wystąpieniu zdarzenia. W pozostałych przedsiębiorstwach aktualizacja danych nastę-
puje zwykle codziennie, ewentualnie część danych ma wyŝszy priorytet w aktualizacji, a część jest aktualizowana rzadziej. Przykładem jest przedsiębiorstwo, w którym po zatwierdzeniu faktury w ciągu 15 minut zostaje umieszczony odpowiedni wpis w tabeli faktów hurtowni danych. Natomiast pozostałe dane zapisywane są pod koniec dnia. Najczęściej jednak firmy wykorzystują rozwiązania korzystające z osobnej bazy transakcyjnej, a w hurtowni danych przechowywane są jedynie dane historyczne. W dwóch opisywanych przedsiębiorstwach nie istnieją Ŝadne systemy informatyczne, które nie są zintegrowane z hurtownią danych. Tym samym hurtownia danych jest najbardziej strategicznym systemem przedsiębiorstwa, bez której nie moŝna przeprowadzać operacji typowych dla działalności firmy. Wśród opisywanych przypadków jedynie w dwóch firmach uznano, iŝ pełna integracja hurtowni danych z pozostałymi systemami transakcyjnymi w przedsiębiorstwie jest zbędna. Te osoby równieŝ stwierdziły, iŝ nie ma konieczności posiadania systemów klasy Business Intelligence działających w czasie rzeczywistym (ang. Real-Time Business Intelligence). Hurtownie danych w badanych przedsiębiorstwach były najczęściej wdraŝane metodą zstępującą (ang. top-down). Kryteria wyboru systemu Wszystkie badane firmy jednoznacznie uznały zakres funkcjonalny za waŝny aspekt dotyczący wyboru systemu hurtowni danych (rysunek 2). Przed wdroŝeniem hurtowni danych kaŝda z firm posiadała opracowaną specyfikację wymagań odnośnie oczekiwanej od systemu funkcjonalności. Wielu respondentów podkreśliło, iŝ pomimo niekwestionowanej
waŝności tego kryterium wyboru hurtowni danych, wielu dostawców oferuje podobne rozwiązania funkcjonalne. W rezultacie wymagania dotyczące uŝyteczności oferowanego systemu były spełnione przez większość popularnych rozwiązań oferowanych przez róŝnych dostawców hurtowni. Rys2. Kryteria wyboru systemu hurtowni danych w ocenie respondentów Źródło: Opracowanie własne Rekomendacja z wdroŝeń w innych firmach została uznana jako mało istotny aspekt dotyczący wyboru systemu hurtowni danych. Odpowiedź taka jest rezultatem przyjętej zasady w większości organizacji, która potwierdza regułę, iŝ poziom zaufania do dostawcy systemu hurtowni danych jest waŝniejszy niŝ rekomendacja z wdroŝeń w innych firmach. Przedsiębiorstwa niechętnie wymieniają się informacją o posiadanych systemach, a w szczególności o specyficznych aspektach dotyczących ich funkcjonowania. Dlatego często jedynym źródłem, z którego moŝna było zasięgnąć opinii o innych wdroŝeniach był dostawca systemu hurtowni danych. Powszechnie wiadomo, iŝ dostawcy mówią tylko o dobrych stronach ich działalności i w rezultacie jest to bardzo subiektywna ocena systemu.
W opisywanych firmach najczęściej uŝywany jest system hurtowni danych, który pochodzi od tego samego dostawcy, co większość systemów uŝywanych w przedsiębiorstwie. Tylko w jednym przypadku wybór systemu hurtowni danych nie był uzaleŝniony od innych systemów uŝywanych w przedsiębiorstwie. Jak wspomniano na początku, nie tylko na podstawie tego badania lecz równieŝ wielu innych badań, moŝna zauwa- Ŝyć regułę, iŝ jeŝeli uŝywany jest system hurtowni danych niemal zawsze pochodzi od tego samego dostawcy, co pozostałe systemy informatyczne w przedsiębiorstwie. Wynika to nie tylko z aspektu integracji, ale równieŝ z zaufania do dostawcy. Zaufanie do dostawcy zostało jednoznacznie określone jako waŝne kryterium wyboru systemu hurtowni danych. Jak napisano wyŝej, ten czynnik był znacząco waŝniejszy niŝ rekomendacja z wdroŝeń hurtowni danych w innych przedsiębiorstwach. Zasadniczo jednym z waŝniejszych kryteriów wyboru hurtowni danych była moŝliwość integracji z innymi systemami uŝywanymi w organizacji. W jednym przypadku załoŝeniem była całkowita niezaleŝność systemu hurtowni danych od pozostałych systemów w przedsiębiorstwie. Celem wdroŝenia w tym przypadku było utworzenie systemu analitycznego operującego na kopii danych z pozostałych systemów, które są uaktualniane za pomocą zapytań. NaleŜy podkreślić, iŝ w większości opisywanych firm uwaŝa się, iŝ błędy w integracji z innymi systemami są jednym z głównych problemów w początkowym etapie uŝytkowania hurtowni danych. RównieŜ moŝliwości dostosowania systemu do indywidualnych potrzeb firmy to niezbędne kryterium wyboru systemu hurtowni danych. Zaledwie w jednej organizacji nie miało to większego znaczenia, gdyŝ
został zakupiony gotowy produkt analityczny z funkcjonalnością obejmującą wszystkie niezbędne narzędzia określone w wymaganiach systemu. Polska wersja językowa aplikacji nie miała wpływu na wybór hurtowni danych. Wynika to z faktu, iŝ system hurtowni danych jest uŝywany głównie przez osoby z działów informatycznych. Osoby uŝywające hurtownię w celach eksploracji danych zwykle korzystają z modułów posiadających graficzne interfejsy utworzone przez programistów z ich organizacji, bądź przez dostawcę. Efektem takiego rozwiązania jest moŝliwość całkowitego spolszczenia modułu raportującego bądź analitycznego. Praktycznie kaŝda organizacja stosuje takie rozwiązania. Tylko w jednym z opisywanych przypadków wykorzystywane są moduły w standardowej postaci, bez Ŝadnych zmian. Paradoksalnie cena nie jest powszechnie uwaŝana za waŝny czynnik wyboru systemu hurtowni danych. W jednym z opisywanych przypadków organizacja otrzymała dotację na wdroŝenie nowych technologii, co pozwoliło na wybranie lepszej wersji oprogramowania dla hurtowni danych. Warto zauwaŝyć, iŝ obecnie istnieją nawet systemy bazodanowe udostępniane w ramach licencji otwartej, które umoŝliwiają implementację hurtowni danych. WciąŜ niskie zaufanie do tego typu darmowych rozwiązań sprawia, iŝ firmy wybierają opcję wydania większej sumy pieniędzy za rozwiązanie, które zwykle w cenie zakupu ma wliczone wsparcie techniczne. Zakończenie i wnioski Badanie w postaci wywiadu skategoryzowanego, przeprowadzone w polskich organizacjach pozwoliło na sformułowanie wielu wniosków,
które do tej pory mogły być nieznane. Ze względu na ograniczoną objętość niniejszego artykułu, nie było moŝliwości zaprezentowania pełnych wyników badań. Niemniej jednak przybliŝenie podstawowych kryteriów wyboru systemu hurtowni danych, poprzedzone opisem funkcjonowania tych organizacji oraz postawionymi celami wdroŝenia, pozwala na stwierdzenie, iŝ w bieŝących latach charakter hurtowni danych znacząco uległ zmianie w stosunku do pierwotnych wyobraŝeń na temat funkcjonalności tego systemu. O ile pierwsze definicje hurtowni danych traktowały ten system jako kopię transakcyjnych danych dla celów analitycznych kierownictwa organizacji, o tyle obecnie coraz częściej z hurtowni danych korzystają równieŝ pracownicy średnich oraz niŝszych szczebli w organizacji. Tym samym przeznaczeniem hurtowni jest nie tylko dostarczenie danych do analizy, ale równieŝ umoŝliwienie dostępu do archiwalnych danych w celu sporządzania typowych dla działalności przedsiębiorstwa raportów. Literatura [ArSm03] [Inmo02] [KiRo02] Armstrong-Smith M., Armstrong-Smith D., (2003) Oracle Discoverer. Twórz aktywne zapytania ad hoc i analizuj dane, Helion, Gliwice Inmon W.H., Building the Data Warehouse. Third Edition., John Wiley&Sons, 2002 Kimball R. Ross M., The Data Warehouse Toolkit. Second Edition. The Complete Guide to Dimensional Modeling, John Wiley & Sons, 2002
[SiSh02] [SuPo07] [Todm03] Informacje o autorach Simon A.R., Shaffer S.L., Hurtownie danych i systemy informacji gospodarczej. Zastosowanie w handlu elektronicznym., Oficyna Ekonomiczna, Kraków, 2002 Sundaram D., Portougal V., (2007) Business Processes, [w:] Wang J., Encyclopedia of Data Warehousing and Mining, Idea Group Inc., Hershey USA Todman C., Projektowanie hurtowni danych, zarządzanie kontaktami z klientami (CRM), WNT, Warszawa, 2003 Mgr Jacek Maślankowski Katedra Informatyki Ekonomicznej Uniwersytet Gdański ul. Armii Krajowej 101 81-824 Sopot Numer telefonu (fax) +48/58/5231333 e-mail: jacek@univ.gda.pl