ORACLE 9i DATA MINING NARZĘDZIEM DO EKSTRAKCJI WIEDZY Z BAZ DANYCH

Wielkość: px
Rozpocząć pokaz od strony:

Download "ORACLE 9i DATA MINING NARZĘDZIEM DO EKSTRAKCJI WIEDZY Z BAZ DANYCH"

Transkrypt

1 ORACLE 9i DATA MINING NARZĘDZIEM DO EKSTRAKCJI WIEDZY Z BAZ DANYCH Streszczenie Małgorzata Nycz, Barbara Smok Akademia Ekonomiczna we Wrocławiu Artykuł prezentuje wykorzystanie narzędzie Oracle 9i Data Mining do odkrywania wiedzy z baz danych. Układ artykułu jest następujący. Po krótkim wprowadzeniu scharakteryzowano problematykę odkrywania wiedzy, następnie przedstawiono Oracle Data Mining. W dalszej części zaprezentowano przykład zastosowania tego narzędzia do odkrywania wiedzy z bankowej bazy danych. Artykuł kończy podsumowanie przeprowadzonych rozwaŝań. Słowa kluczowe: odkrywanie wiedzy, data mining, eksploracja Wprowadzenie Dzisiaj przedsiębiorstwa stają wobec problemu posiadania, przetwarzania i zbierania coraz większych ilości danych. Rozwiązania tego problemu oferują metody Data Mining (eksploracja danych), które identyfikują wzorce i zaleŝności w rozległych obszarach danych. Wiele firm oferuje profesjonalne narzędzia analityczne wspomagające podejmowanie decyzji oraz analizy danych (oparte na systemie OLAP). Narzędzia te na podstawie danych zgromadzonych przez przedsiębiorstwo pozwalają zoptymalizować procesy zarządzania, dostarczając niezbędną informację we właściwym czasie. W odpowiedni sposób przetworzone informacje pomagają przedsiębiorstwom rozwijać się i utrzymać się na ciągle zmieniającym się w szybkim tempie rynku. Dostarczają równieŝ wiedzy pozwalającej osiągnąć przewagę nad konkurencją. Odkrywanie wiedzy Eksploracja danych (odkrywanie wiedzy z baz danych) jest procesem efektywnego znajdowania nowych, nieznanych, uŝytecznych wzorców, zaleŝności, czy związków między danymi np. w hurtowni danych. Odkrywanie wiedzy często w literaturze występuje jako synonim data mining i dotyczy zazwyczaj całego procesu pozyskiwania uŝytecznej wiedzy [MORZ99], a proces eksploracji odnosi się do jednego z jego etapów do generowania reguł. Metody eksploracji moŝna podzielić ogólnie na następujące klasy [MoWo99]: odkrywanie asocjacji,

2 324 Zarządzanie wiedzą i rozwiązania Business Intelligence klastrowanie, odkrywanie wzorców sekwencji, odkrywanie klasyfikacji, odkrywanie podobieństw w przebiegach czasowych, wykrywanie zmian i odchyleń. Aby dane mogły być wykorzystane do eksploracji muszą być poddane czyszczeniu, którego celem jest zapewnienie jakości i poprawności danych, szczególnie w przypadku, gdy pochodzą z heterogenicznych źródeł, gdyŝ wówczas mogą zawierać błędy i anomalie jak np.: niespójne długości pól, róŝne formaty, wartości puste, czy naruszone ograniczenia integralności. Następnym etapem jest ładowanie danych, który wymaga dodatkowego przetwarzania jak np. sprawdzenia integralności, sortowania, podsumowania. Do metod eksploracji moŝemy zaliczyć m.in.: analizę skupień świetnie nadaje się do wstępnych analiz, w przypadku gdy niewiele wiemy o naszej bazie danych i trudno nam sprecyzować pytanie; w takich sytuacjach zawsze moŝemy poszukiwać skupień, które mogą być dla nas interesujące i znaczące, sieci neuronowe są algorytmami przetwarzania danych bazującymi na konstruowaniu i rozpoznawaniu wzorców, nie ekstrahują wiedzy, nadają się do klasyfikowania danych i są niemal idealnym narzędziem do prognozowania sekwencji czasowych, drzewa decyzyjne dostarczają zrozumiałej wiedzy o danych, ich algorytmy prowadzą do rozdrobnienia danych, wyłonienia klas i przypadkowych reguł; aby tego uniknąć przycina się drzewa wykorzystując odpowiednie techniki, w przypadku analizy skupień metodę k-uśrednień oraz inne parametry jak ilość skupień, czy współczynnik metryki. Oracle Data Mining Oprogramowanie Oracle pozwala przeszukiwać ogromne bazy danych w celu znajdowania róŝnych wzorców i tendencji, które mogą wspomóc strategię biznesową oraz prezentować róŝne zaleŝności między wieloma zmiennymi. Oracle Data Mining słada się z dwóch głównych komponentów: Oracle 9i Data Mining API (ODM API) jest interfejsem programistycznym, umoŝliwiającym dostęp programom w języku Java do Data Mining Server; bazuje na nowo tworzonym standardzie Java Data Mining, Data Mining Server (DMS) jest elementem składowym wykonującym obliczenia w bazie Oracle 9i; udostępnia repozytorium, w którym są zapisywane m.in. modele oraz wyniki obliczeń. Budowa modelu eksploracji w Oracle 9i Data Mining moŝliwa jest na dwóch poziomach: funkcji i algorytmu. Na poziomie funkcji pozwala pominąć specyfikację wszystkich szczegółów algorytmu i skupić się na eksploracji, gdzie dobierany jest odpowiedni algorytm i wyznaczane są wartości wszystkich parametrów. W przypadku, gdy standardowe procedury odkrywania wzorców są niewystarczające moŝna budować model na poziomie algorytmu dostosowując proces eksploracji do własnych potrzeb. Tak zbudowane modele są przechowywane w repozytorium serwera eksploracji i mogą być wielokrotnie wykorzystywane. Na budowę modelu składa się następujące etapy: tworzenie danych wej-

3 Oracle 9i Data Mining narzędziem do ekstrakcji wiedzy z baz danych 325 ściowych poprzez kojarzenie obiektu reprezentującego dane z rzeczywistym źródłem danych np. relacją w bazie danych, tworzenie obiektu reprezentującego ustawienia wybranej funkcji eksploracji, wiązanie obiektu funkcji eksploracji z obiektami reprezentującymi logiczną strukturę danych i fizyczne wykorzystanie danych, tworzenie modelu wybraną metodą: klasyfikacja lub odkrywanie asocjacji. Model klasyfikacyjny moŝna przetestować w celu oszacowania dokładności klasyfikacji. Model klasyfikatora jest stosowany do zbioru danych testowych, których nie uŝyto do budowania modelu, dla których jest znana wartość klasyfikowanego atrybutu. Testowanie dostarcza macierz pomyłek, która daje nam obraz w ilu przypadkach model poprawnie sklasyfikował dane testowe, a w ilu pomylił się oraz jakiego typu były to pomyłki. Analiza macierzy pozwala na dokładniejsze dostrojenie modelu aŝ do uzyskania zadawalającej jakości klasyfikacji. Model klasyfikatora zastosowany do nowych danych powoduje obliczenie przewidywanej wartości lub klasy wraz z prawdopodobieństwem. Stosując model asocjacji moŝemy wykorzystać stworzony model do danych źródłowych, a w wyniku otrzymamy zbiór reguł asocjacyjnych odkrytych w danych źródłowych, które są składowane w repozytorium serwera eksploracyjnego. Algorytmy Oracle Data Mining moŝna zaklasyfikować do dwóch grup ze względu na sposób nauki: z nauczycielem (supervised) do przewidywania wartości na podstawie wcześniej przetworzonej próbki lub bez nauczyciela (unsupervised) do wyszukiwania struktur, relacji, czy podobieństw zawartych w danych. Na podstawie [ORAC02] moŝemy podzielić algorytmy na: klasyfikacja z nauczycielem; pozwala zaklasyfikować obiekty do kilku klas; posiadając sklasyfikowane obiekty uczymy model, który automatycznie będzie klasyfikował nowe obiekty; kaŝdy obiekt posiada atrybuty oraz jeden dodatkowy, który określa jego przynaleŝność do klasy, analiza skupień - bez nauczyciela umoŝliwia wyszukiwanie nieznanych grup w danych; grupy (skupienia) zawierają obiekty podobne do siebie, reguły kojarzące - bez nauczyciela pozwalają wyszukiwać związki miedzy danymi, przykładem moŝe być analiza koszykowa, stopień waŝności atrybutów - z nauczycielem automatycznie wyszukują atrybuty, które najmocniej wpływają na wynik. Metody klasyfikacyjne pozwalają zaklasyfikować obiekty do kilku lub więcej klas. Odbywa się to dwuetapowo: (1) posiadając sklasyfikowane obiekty uczymy model klasyfikacji, a w (2) nauczony model automatycznie klasyfikuje nowe obiekty. KaŜdy z obiektów posiada pewną liczbę atrybutów opisujących go oraz jeden przewidywalny, którego wartość określi jego przynaleŝność do odpowiedniej klasy. Do tej grupy naleŝą trzy algorytmy: Adaptive Bayes Network, Naive Bayes i Model Seeker.

4 326 Zarządzanie wiedzą i rozwiązania Business Intelligence Przykłady zastosowań klasyfikacji to m.in. rozpoznawanie trendów na rynkach finansowych, automatyczne rozpoznawanie obiektów w duŝych bazach obrazów, wspomaganie decyzji przyznawania kredytów bankowych. Zastosowanie Oracle Data Mining do odkrywania wiedzy Do procesu drąŝenia danych wykorzystano rzeczywisty zbiór danych opisujących klientów banku, oddziały banku oraz wzajemne relacje pomiędzy klientem a bankiem. Baza 1 dotyczy ogólnokrajowego banku prowadzącego swą działalność w Czechach. Państwo to zostało podzielone na 8 regionów oraz 77 okręgów. KaŜdy z okręgów opisany jest przy pomocy 15 atrybutów dotyczących między innymi liczby mieszkańców, miejscowości, płac, bezrobocia a nawet przestępczości w okręgu. Opisano przeszło 4 tysiące klientów przy pomocy 9 tysięcy rekordów w jednej tablicy, składającej się z 67 atrybutów. Większość klientów zamieszkuje ten sam okręg, w którym mieści się oddział banku, a jedynie około 10% ma swój bank w innym okręgu. Celem eksperymentu była analiza kredytów udzielanych przez bank klientom. Atrybut loan_status opisujący stan kredytu klienta i przyjmujący następujące wartości: A umowa zakończona, kredyt spłacony, B umowa zakończona, kredyt nie spłacony, C umowa w trakcie, dotychczas jest OK, D umowa w trakcie, klient w długach, moŝe słuŝyć do klasyfikacji klientów na tych, którym warto było udzielić kredytu i tych, którym udzielenie kredytu zakończyło się niepowodzeniem. Do tablicy dodano atrybut o nazwie UDANY przyjmujący wartość 0 dla wartości B, atrybut D loan_status - dla przypadków zakończonych niepowodzeniem oraz wartość 1 dla przypadków zakończonych powodzeniem. Bazę ograniczono do klientów, którzy zaciągali kredyt. Spośród 751 klientów 76 sklasyfikowano do grupy, w której udzielenie kredytu zakończyło się niepowodzeniem. Chcieliśmy zbadać wpływ poszczególnych atrybutów na powodzenie lub niepowodzenie spłaty kredytu przez klienta. Została wykorzystana tutaj metoda klasyfikacji oparta na Adaptacyjnej Sieci Bayesa, w której przyjęto jako wynikowy atrybut - UDANY. Oprócz zakwalifikowania obiektu do danej klasy, definiuje równieŝ reguły określające - jakie wartości atrybutów obiektów musi dany obiekt posiadać, aby został zakwalifikowany do konkretnej klasy. Przykładową regułą moŝe być: Jeśli dochód miesięczny klienta jest > 2000 zł i wiek 40 to moŝe być zainteresowany kredytem. Algorytm ten przewiduje odpowiedź w postaci binarnej (klient dostanie lub nie dostanie kredytu) lub w postaci wielowartościowej (klient jest w grupie rozwijającej się, stabilnej lub upadającej). KaŜdy z obiektów oprócz określenia 1 Baza danych przygotowana przez P. Berkę i M. Sochorovą dostępna w internecie:

5 Oracle 9i Data Mining narzędziem do ekstrakcji wiedzy z baz danych 327 klasy posiada takŝe zdefiniowane prawdopodobieństwo dopasowujące go do tej klasy. Metoda ta składa się z trzech etapów: (1) budowy modelu na zbiorze danych historycznych, (2) testu modelu na innym zbiorze danych historycznych, (3) zastosowania modelu do danych bieŝących w celu ich klasyfikacji. Budowę modelu kończy wygenerowanie reguł. Otrzymany model (przy wykorzystaniu Oracle 9i Data Mining) został przedstawiony przy pomocy reguł przedstawionych w Tabeli 1. Model drąŝenia danych prezentujący najwaŝniejsze reguły Tabela 1 If LOAN_STATUS in (A, C) then UDANY equal (0) If LOAN_STATUS in (B, D) then UDANY equal (1) If CARD_TYPE in (C, G, J) then UDANY equal (0) If CARD_CARD_ID in (1010, 1087, 1176, 1223, 16, OTHER_CATEGORY) then UDANY equal (0) If CARD_DATE in ( :00:00, :00:00, :00:00, :00:00, :00:00, OTHER_CATEGORY) then UDANY equal (0) If CARD_DISP_ID in (10887, 116, 12502, 13231, 2141, OTHER_CATEGORY) then UDANY equal (0) If TRANS_OPERATION in (B, C, D, E) then UDANY equal (0) If TRANS_BALANCE in ( ) then UDANY equal (0) If TRANS_ACCOUNT_ID in ( ) then UDANY equal (0) If TRANS_TRANS_ID in ( , , , , ) then UDANY equal (0) If TRANS_TYPE in (A, B) then UDANY equal (0) Analiza powyŝszych reguł pozwala stwierdzić, Ŝe baza, która została poddana procesowi drąŝenia danych nie zawiera wiele wiedzy. Reguły w większości przypadków są bezuŝyteczne, gdyŝ najczęściej wskazują pełną dziedzinę atrybutów. Na uwagę zasługuje jedynie fakt, iŝ nie było kłopotów z klientami, którzy na co dzień posługują się kartami kredytowymi, gdyŝ analiza wykazała, Ŝe nie było ani jednego klienta, który posługuje się kartą kredytową i nie spłacił kredytu. Specyfikacja macierzy kosztów budowy modelu nie przyniosła Ŝadnych zmian wyniku. Kolejną metodą było wykorzystanie reguł kojarzących. Metoda ta umoŝliwia wyszukiwanie związków miedzy danymi. Typowym zastosowaniem tego algorytmu jest analiza koszykowa polegająca na wyszukiwaniu powiązań między np. towarami kupowanymi razem. W metodzie tej występuje tu tylko 1 etap, którego wynikiem jest zestaw reguł w postaci: jeśli atrybut A osiąga wartość A to atrybut B przyjmuje wartość B. Reguły kojarzące moŝna definiować w oparciu o pojęcie zbioru częstego. Niech L = {l 1, l 2,..., l n } będzie zbiorem elementów (literałów), a D kolekcją transakcji o dowolnej długości i kaŝda T D i T L. Mówimy, Ŝe transakcja T wspiera element x, gdy x T oraz wspiera zbiór X, gdy T wspiera kaŝdy element x X. Wsparciem zbioru X nazywamy stosunek liczby transakcji wspierających X do liczby wszystkich transakcji.

6 328 Zarządzanie wiedzą i rozwiązania Business Intelligence { T D: T wspiera X} Wsparcie(X,D)= D Problem odkrywania zbiorów częstych polega na znalezieniu w danej bazie danych D wszystkich zbiorów, których wsparcie jest wyŝsze od zdefiniowanej przez uŝytkownika wartości zw. minimalnym wsparciem (minsup). Zbiór, którego wsparcie jest wyŝsze niŝ minsup nazywa się zbiorem częstym (frequent itemset). Reguła kojarząca jest implikacją postaci X Y, gdzie X L, Y L, a X Y =. KaŜda z reguł związana jest z dwoma miarami: Wsparciem (support) mówi o tym jak często wartości atrybutów występują razem, { T D: T wspiera X Y } Wsparcie(X Y,D)= D Zaufanie (confidence) reguły X Y w bazie danych jest stosunkiem liczby transakcji wspierających regułę do liczby transakcji wspierających poprzednik reguły. { T D: T wspiera X Y } Zaufanie(X Y,D)= { T D: T wspiera X} Problem odkrywania reguł asocjacyjnych polega na znalezieniu w bazie danych D wszystkich reguł, których wsparcie i zaufanie (ufność) są wyŝsze od zdefiniowanych przez uŝytkownika wartości minimalnego wsparcia i zaufania (minisup, miniconf). W metodzie tej nie ustawia się atrybutu wynikowego w związku z czym otrzymane reguły dotyczą wszystkich atrybutów. Otrzymane wyniki przedstawia Tabela 2. Analiza otrzymanych wyników nasuwa wniosek, Ŝe jeśli klient mieszka w okręgu, w którym liczba popełnionych przestępstw w 1996 roku była mniejsza niŝ 25532, to w 93 % udzielenie mu kredytu było dobrą decyzją. Wartość tego wniosku podwaŝa jednak fakt, iŝ 89% klientów spośród wszystkich zostało zaklasyfikowanych jako dobrych, więc 93% nie stanowi wielkiego przełomu. Podany przykład świadczy o tym, Ŝe nie z kaŝdej bazy moŝna wyciągnąć wartościową wiedzę. Hipotezy otrzymane w wyniku drąŝenia danych naleŝy zweryfikować. Często moŝe się zdarzyć, ze otrzymana wiedza jest trywialna i nie ma Ŝadnej wartości. Nie zmienia to jednak faktu, Ŝe moŝe się zdarzyć, iŝ koszty związane z weryfikacją bezwartościowych hipotez są niewspółmiernie niskie w stosunku zysków osiągniętych z odkrycia wartościowej wiedzy.

7 Oracle 9i Data Mining narzędziem do ekstrakcji wiedzy z baz danych 329 Reguły będące wynikiem działania metody Association Rules Tabela 2 Rule 28009: If ACCOUNT_DIST_A16= then CLIENT_DIST_A16= [support: , confidence: ] Rule 28010: If CLIENT_DIST_A16= then ACCOUNT_DIST_A16= [support: , confidence: ] Rule 27980: If CLIENT_DIST_A15= then CLIENT_DIST_A16= [support: , confidence: 1.0] Rule 27979: If CLIENT_DIST_A16= then CLIENT_DIST_A15= [support: , confidence: ] Rule 1205: If CLIENT_DIST_A16= then UDANY=.8-1 [support: , confidence: ] Rule 1409: If ACCOUNT_FREQUENCY=A then UDANY=.8-1 [support: , confidence: ] Rule 27980: If CLIENT_DIST_A15= then CLIENT_DIST_A16= [support: , confidence: 1.0] Rule 30318: If ACCOUNT_DIST_A15= then ACCOUNT_DIST_A16= [support: , confidence: 1.0] Rule 15252: If CLIENT_DIST_A4= then CLIENT_DIST_A15= [support: , confidence: 1.0] Rule 15254: If CLIENT_DIST_A4= then CLIENT_DIST_A16= [support: , confidence: 1.0] Rule 15252: If CLIENT_DIST_A4= then CLIENT_DIST_A15= [support: , confidence: 1.0] Rule 15254: If CLIENT_DIST_A4= then CLIENT_DIST_A16= [support: , confidence: 1.0] Podsumowanie Metody eksploracji danych znalazły stosunkowo niewielkie zastosowanie w przedsiębiorstwach. Eksploracja danych ma sens w odniesieniu do duŝych i bardzo duŝych zbiorów baz danych poprzez przeprowadzenie dogłębnej analizy róŝnych baz danych (relacyjnych, obiektowych, wielowymiarowych, przestrzennych, graficznych i innych). W efekcie drąŝenia danych odkrywamy wiedzę uprzednio nieznaną lub nie uświadamianą w postaci schematów, związków, zaleŝności, anomalii, czy struktur. Eksploracja wymaga wiele pracy, gdyŝ zanim dane zostaną poddane analizie muszą być odpowiednio przygotowane. Jednak brak odpowiedniej wiedzy i aktualnej informacji w zmieniającym się otoczeniu ekonomicznym z powodu niewykorzystania tego potencjału danych moŝe często oznaczać poraŝkę firmy.

8 330 Zarządzanie wiedzą i rozwiązania Business Intelligence Literatura [BELI97] [BYRS02] [CHEN96] [HANJ99] [InWG97] [MORZ99] [NySm00] [NySP03] [ORAC02] [MoWo99] Berry M.J.A., Linoff G.: Data Mining Techniques for Marketing, Sales and Customer Support, Wiley Computer Publishing, 1997 Byrski M.: Data Mining w bazie Oracle 9i. Materiały z VIII Konferencji PLOUG. Kościelisko, październik 2002, s Chen M.S. Han J., Yu P.S.: Data Mining: An Overview from a Database Perspective, IEEE Transactions on Knowledge and Data Engineering, 8(6): p , 1996 Han J. Data mining, Kluwer Academic Publishers,1999 Inmon W.H., J.D. Welch, Glassey K.L.: Managing the Data Warehouse, Wiley Comp. Publishing 1997 Morzy T.: Eksploracja danych: problemy i rozwiązania. Materiały z V Konferencji PLOUG. Zakopane, październik 1999 Nycz M., Smok B.: Problemy związane z pozyskiwaniem wiedzy z baz danych. Prace Naukowe nr 850 AE we Wrocławiu, Wrocław 2000 Nycz M., Smok B., Pondel M.: Wykorzystanie Oracle 9i Data Mining do pozyskiwania wiedzy z baz danych, w: Drelichowski L., Januszewski A., DzieŜa G. (red.): Zastosowanie technik informatycznych w gospodarce i zarządzanie wiedzą, Katedra Informatyki w Zarządzaniu, Akademia Techniczno-Rolnicza w Bydgoszczy, Bydgoszcz-Ciechocinek 2003 Oracle: Oracle 9i Data Mining Concepts Release 2(9.2), Oracle 2002 Morzy M., Wojciechowski M.: Integracja technik eksploracji danych z systemem zarządzania bazą danych na przykładzie Oracle 9i Data Mining. Materiały z Konferencji PLOUG, Zakopane październik 1999 ORACLE 9I DATA MINING AS A TOOL FOR KNOWLEDGE EXTRACTION FROM LARGE DATABASES The article presents the exemplary usage of the Oracle 9i Data Mining within knowledge extraction process from databases. It consists of four parts. After short introduction describing knowledge extraction issues, Oracle Data Mining has been presented. The next part presents example of practical exploration realized by this tool. As an example the real bank database has been taken into consideration. The paper ends with the carried out researches summary. Key words: data mining, knowledge discovery, exploration

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu i business intelligence Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl Wrocław 2005-2007 Plan na dziś : 1. Wprowadzenie do przedmiotu (co będzie omawiane oraz jak będę weryfikował zdobytą wiedzę

Bardziej szczegółowo

INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH

INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH 1. Czym jest eksploracja danych Eksploracja danych definiowana jest jako zbiór technik odkrywania nietrywialnych zależności i schematów w dużych

Bardziej szczegółowo

Data Mining w bazie Oracle 9i

Data Mining w bazie Oracle 9i VIII Konferencja PLOUG Koœcielisko PaŸdziernik 2002 Data Mining w bazie Oracle 9i Mariusz Byrski Biuro Matematyki Stosowanej S.C. mb@bms.krakow.pl Abstrakt Szukanie nieoczywistych zwi¹zków w danych jest

Bardziej szczegółowo

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie Hurtownie danych i business intelligence - wykład II Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2005-2008 Zagadnienia do omówienia 1. 2. Przegląd architektury HD 3. Warsztaty

Bardziej szczegółowo

Implementacja metod eksploracji danych - Oracle Data Mining

Implementacja metod eksploracji danych - Oracle Data Mining Implementacja metod eksploracji danych - Oracle Data Mining 395 Plan rozdziału 396 Wprowadzenie do eksploracji danych Architektura Oracle Data Mining Możliwości Oracle Data Mining Etapy procesu eksploracji

Bardziej szczegółowo

Zalew danych skąd się biorą dane? są generowane przez banki, ubezpieczalnie, sieci handlowe, dane eksperymentalne, Web, tekst, e_handel

Zalew danych skąd się biorą dane? są generowane przez banki, ubezpieczalnie, sieci handlowe, dane eksperymentalne, Web, tekst, e_handel według przewidywań internetowego magazynu ZDNET News z 8 lutego 2001 roku eksploracja danych (ang. data mining ) będzie jednym z najbardziej rewolucyjnych osiągnięć następnej dekady. Rzeczywiście MIT Technology

Bardziej szczegółowo

Ewelina Dziura Krzysztof Maryański

Ewelina Dziura Krzysztof Maryański Ewelina Dziura Krzysztof Maryański 1. Wstęp - eksploracja danych 2. Proces Eksploracji danych 3. Reguły asocjacyjne budowa, zastosowanie, pozyskiwanie 4. Algorytm Apriori i jego modyfikacje 5. Przykład

Bardziej szczegółowo

Wprowadzenie do technologii Business Intelligence i hurtowni danych

Wprowadzenie do technologii Business Intelligence i hurtowni danych Wprowadzenie do technologii Business Intelligence i hurtowni danych 1 Plan rozdziału 2 Wprowadzenie do Business Intelligence Hurtownie danych Produkty Oracle dla Business Intelligence Business Intelligence

Bardziej szczegółowo

Mikołaj Morzy, Marek Wojciechowski: "Integracja technik eksploracji danych z systemem zarządzania bazą danych na przykładzie Oracle9i Data Mining"

Mikołaj Morzy, Marek Wojciechowski: Integracja technik eksploracji danych z systemem zarządzania bazą danych na przykładzie Oracle9i Data Mining Mikołaj Morzy, Marek Wojciechowski: "Integracja technik eksploracji danych z systemem zarządzania bazą danych na przykładzie Oracle9i Data Mining" Streszczenie Eksploracja danych znajduje coraz szersze

Bardziej szczegółowo

Integracja technik eksploracji danych ]V\VWHPHP]DU]G]DQLDED]GDQ\FK QDSU]\NáDG]LH2UDFOHi Data Mining

Integracja technik eksploracji danych ]V\VWHPHP]DU]G]DQLDED]GDQ\FK QDSU]\NáDG]LH2UDFOHi Data Mining Integracja technik eksploracji danych ]V\VWHPHP]DU]G]DQLDED]GDQ\FK QDSU]\NáDG]LH2UDFOHi Data Mining 0LNRáDM0RU]\ Marek Wojciechowski Instytut Informatyki PP Eksploracja danych 2GNU\ZDQLHZ]RUFyZZGX*\FK

Bardziej szczegółowo

Wprowadzenie do technologii informacyjnej.

Wprowadzenie do technologii informacyjnej. Wprowadzenie do technologii informacyjnej. Data mining i jego biznesowe zastosowania dr Tomasz Jach Definicje Eksploracja danych polega na torturowaniu danych tak długo, aż zaczną zeznawać. Eksploracja

Bardziej szczegółowo

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu i business intelligence Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl Wrocław 2005-2012 Plan na dziś : 1. Wprowadzenie do przedmiotu (co będzie omawiane oraz jak będę weryfikował zdobytą wiedzę

Bardziej szczegółowo

Krzysztof Kawa. empolis arvato. e mail: krzysztof.kawa@empolis.com

Krzysztof Kawa. empolis arvato. e mail: krzysztof.kawa@empolis.com XI Konferencja PLOUG Kościelisko Październik 2005 Zastosowanie reguł asocjacyjnych, pakietu Oracle Data Mining for Java do analizy koszyka zakupów w aplikacjach e-commerce. Integracja ze środowiskiem Oracle

Bardziej szczegółowo

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów

Bardziej szczegółowo

Technologia informacyjna

Technologia informacyjna Technologia informacyjna Pracownia nr 9 (studia stacjonarne) - 05.12.2008 - Rok akademicki 2008/2009 2/16 Bazy danych - Plan zajęć Podstawowe pojęcia: baza danych, system zarządzania bazą danych tabela,

Bardziej szczegółowo

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu Podstawy baz danych PODSTAWY BAZ DANYCH 19. Perspektywy baz danych 1 Perspektywy baz danych Temporalna baza danych Temporalna baza danych - baza danych posiadająca informację o czasie wprowadzenia lub czasie ważności zawartych

Bardziej szczegółowo

Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów

Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów Eksploracja danych Piotr Lipiński Informacje ogólne Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów UWAGA: prezentacja to nie

Bardziej szczegółowo

bo od managera wymaga się perfekcji

bo od managera wymaga się perfekcji bo od managera wymaga się perfekcji MODELOWANIE PROCESÓW Charakterystyka modułu Modelowanie Procesów Biznesowych (BPM) Modelowanie procesów biznesowych stanowi fundament wdroŝenia systemu zarządzania jakością

Bardziej szczegółowo

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie Hurtownie danych i business intelligence - wykład II Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2005-2012 Zagadnienia do omówienia 1. Miejsce i rola w firmie 2. Przegląd architektury

Bardziej szczegółowo

Hurtownie danych. Wstęp. Architektura hurtowni danych. http://zajecia.jakubw.pl/hur CO TO JEST HURTOWNIA DANYCH

Hurtownie danych. Wstęp. Architektura hurtowni danych. http://zajecia.jakubw.pl/hur CO TO JEST HURTOWNIA DANYCH Wstęp. Architektura hurtowni. Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/hur CO TO JEST HURTOWNIA DANYCH B. Inmon, 1996: Hurtownia to zbiór zintegrowanych, nieulotnych, ukierunkowanych

Bardziej szczegółowo

Metadane. Data Maining. - wykład VII. Paweł Skrobanek, C-3 pok. 323 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006

Metadane. Data Maining. - wykład VII. Paweł Skrobanek, C-3 pok. 323 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006 Metadane. Data Maining. - wykład VII Paweł Skrobanek, C-3 pok. 323 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006 Plan 1. Metadane 2. Jakość danych 3. Eksploracja danych (Data mining) 4. Sprawy róŝne

Bardziej szczegółowo

KURS ACCESS 2003 Wiadomości wstępne

KURS ACCESS 2003 Wiadomości wstępne KURS ACCESS 2003 Wiadomości wstępne Biorąc c udział w kursie uczestnik zapozna się z tematyką baz danych i systemu zarządzania bazami danych jakim jest program Microsoft Access 2003. W trakcie kursu naleŝy

Bardziej szczegółowo

DOBÓR ŚRODKÓW TRANSPORTOWYCH DLA GOSPODARSTWA PRZY POMOCY PROGRAMU AGREGAT - 2

DOBÓR ŚRODKÓW TRANSPORTOWYCH DLA GOSPODARSTWA PRZY POMOCY PROGRAMU AGREGAT - 2 InŜynieria Rolnicza 14/2005 Michał Cupiał, Maciej Kuboń Katedra InŜynierii Rolniczej i Informatyki Akademia Rolnicza im. Hugona Kołłątaja w Krakowie DOBÓR ŚRODKÓW TRANSPORTOWYCH DLA GOSPODARSTWA PRZY POMOCY

Bardziej szczegółowo

Wykład I. Wprowadzenie do baz danych

Wykład I. Wprowadzenie do baz danych Wykład I Wprowadzenie do baz danych Trochę historii Pierwsze znane użycie terminu baza danych miało miejsce w listopadzie w 1963 roku. W latach sześcdziesątych XX wieku został opracowany przez Charles

Bardziej szczegółowo

Bazy danych. wprowadzenie teoretyczne. Piotr Prekurat 1

Bazy danych. wprowadzenie teoretyczne. Piotr Prekurat 1 Bazy danych wprowadzenie teoretyczne Piotr Prekurat 1 Baza danych Jest to zbiór danych lub jakichkolwiek innych materiałów i elementów zgromadzonych według określonej systematyki lub metody. Zatem jest

Bardziej szczegółowo

Automatyczne decyzje kredytowe, siła szybkiego reagowania i optymalizacji kosztów. Roman Tyszkowski ING Bank Śląski S.A. roman.tyszkowski@ingbank.

Automatyczne decyzje kredytowe, siła szybkiego reagowania i optymalizacji kosztów. Roman Tyszkowski ING Bank Śląski S.A. roman.tyszkowski@ingbank. Automatyczne decyzje kredytowe, siła szybkiego reagowania i optymalizacji kosztów. Roman Tyszkowski ING Bank Śląski S.A. roman.tyszkowski@ingbank.pl Obsługa wniosków kredytowych Potrzeba elastyczności

Bardziej szczegółowo

Transformacja wiedzy w budowie i eksploatacji maszyn

Transformacja wiedzy w budowie i eksploatacji maszyn Uniwersytet Technologiczno Przyrodniczy im. Jana i Jędrzeja Śniadeckich w Bydgoszczy Wydział Mechaniczny Transformacja wiedzy w budowie i eksploatacji maszyn Bogdan ŻÓŁTOWSKI W pracy przedstawiono proces

Bardziej szczegółowo

ALGORYTM RANDOM FOREST

ALGORYTM RANDOM FOREST SKRYPT PRZYGOTOWANY NA ZAJĘCIA INDUKOWANYCH REGUŁ DECYZYJNYCH PROWADZONYCH PRZEZ PANA PAWŁA WOJTKIEWICZA ALGORYTM RANDOM FOREST Katarzyna Graboś 56397 Aleksandra Mańko 56699 2015-01-26, Warszawa ALGORYTM

Bardziej szczegółowo

DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE:

DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE: DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE: DATAMINING 1 S t r o n a WSTĘP Czyli jak zastąpić wróżenie z fusów i przysłowiowego nosa, statystyką i modelami ekonometrycznymi. Niniejszy dokument,

Bardziej szczegółowo

OdświeŜanie hurtownie danych - wykład IV. Zagadnienia do omówienia. Wprowadzenie

OdświeŜanie hurtownie danych - wykład IV. Zagadnienia do omówienia. Wprowadzenie OdświeŜanie hurtownie danych - wykład IV Paweł Skrobanek, C-3 pok. 323 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006/2007 Zagadnienia do omówienia 1. Wprowadzenie 2. Klasyfikacja źródeł danych 3. Wymagania

Bardziej szczegółowo

Procesy ETL. 10maja2009. Paweł Szołtysek

Procesy ETL. 10maja2009. Paweł Szołtysek Procesy 10maja2009 Paweł Szołtysek 1/12 w praktyce w praktyce 2/12 Zagadnienie Business Inteligence w praktyce 3/12 Czym jest proces? w praktyce Dane: dowolny zbiór danych ze źródeł zewnętrznych. Szukane:

Bardziej szczegółowo

Odkrywanie asocjacji

Odkrywanie asocjacji Odkrywanie asocjacji Wprowadzenie Sformułowanie problemu Typy reguł asocjacyjnych Odkrywanie asocjacji wykład 1 Wykład jest poświęcony wprowadzeniu i zaznajomieniu się z problemem odkrywania reguł asocjacyjnych.

Bardziej szczegółowo

OLAP i hurtownie danych c.d.

OLAP i hurtownie danych c.d. OLAP i hurtownie danych c.d. Przypomnienie OLAP -narzędzia analizy danych Hurtownie danych -duże bazy danych zorientowane tematycznie, nieulotne, zmienne w czasie, wspierjące procesy podejmowania decyzji

Bardziej szczegółowo

Co to jest Business Intelligence?

Co to jest Business Intelligence? Cykl: Cykl: Czwartki z Business Intelligence Sesja: Co Co to jest Business Intelligence? Bartłomiej Graczyk 2010-05-06 1 Prelegenci cyklu... mariusz@ssas.pl lukasz@ssas.pl grzegorz@ssas.pl bartek@ssas.pl

Bardziej szczegółowo

JAK HURTOWNIA DANYCH MOśE WSPOMAGAĆ MENEDśERA W PRACY?

JAK HURTOWNIA DANYCH MOśE WSPOMAGAĆ MENEDśERA W PRACY? JAK HURTOWNIA DANYCH MOśE WSPOMAGAĆ MENEDśERA W PRACY? Małgorzata Nycz, Barbara Smok Wprowadzenie Podstawą funkcjonowania przedsiębiorstwa w dzisiejszych warunkach jest posiadanie zasobów informacyjnych.

Bardziej szczegółowo

technologii informacyjnych kształtowanie , procesów informacyjnych kreowanie metod dostosowania odpowiednich do tego celu środków technicznych.

technologii informacyjnych kształtowanie , procesów informacyjnych kreowanie metod dostosowania odpowiednich do tego celu środków technicznych. Informatyka Coraz częściej informatykę utoŝsamia się z pojęciem technologii informacyjnych. Za naukową podstawę informatyki uwaŝa się teorię informacji i jej związki z naukami technicznymi, np. elektroniką,

Bardziej szczegółowo

Komunikator internetowy w C#

Komunikator internetowy w C# PAŃSTWOWA WYśSZA SZKOŁA ZAWODOWA W ELBLĄGU INSTYTUT INFORMATYKI STOSOWANEJ Sprawozdanie Komunikator internetowy w C# autor: Artur Domachowski Elbląg, 2009 r. Komunikacja przy uŝyciu poczty internetowej

Bardziej szczegółowo

BUSINESS INTELLIGENCE W ZARZĄDZANIU

BUSINESS INTELLIGENCE W ZARZĄDZANIU BUSINESS INTELLIGENCE W ZARZĄDZANIU Małgorzata Nycz, Barbara Smok Wprowadzenie śyjemy w czasach charakteryzujących się bardzo szybkimi przemianami spowodowanymi rozwojem technik informacyjno - komunikacyjnych,

Bardziej szczegółowo

Systemy Wspomagania Decyzji

Systemy Wspomagania Decyzji Reguły Asocjacyjne Szkoła Główna Służby Pożarniczej Zakład Informatyki i Łączności March 18, 2014 1 Wprowadzenie 2 Definicja 3 Szukanie reguł asocjacyjnych 4 Przykłady użycia 5 Podsumowanie Problem Lista

Bardziej szczegółowo

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie Wykaz tabel Wykaz rysunków Przedmowa 1. Wprowadzenie 1.1. Wprowadzenie do eksploracji danych 1.2. Natura zbiorów danych 1.3. Rodzaje struktur: modele i wzorce 1.4. Zadania eksploracji danych 1.5. Komponenty

Bardziej szczegółowo

Budowa systemu wspomagającego podejmowanie decyzji. Metodyka projektowo wdrożeniowa

Budowa systemu wspomagającego podejmowanie decyzji. Metodyka projektowo wdrożeniowa Budowa systemu wspomagającego podejmowanie decyzji Metodyka projektowo wdrożeniowa Agenda Systemy wspomagające decyzje Business Intelligence (BI) Rodzaje systemów BI Korzyści z wdrożeń BI Zagrożenia dla

Bardziej szczegółowo

Ćwiczenie 3 funkcje agregujące

Ćwiczenie 3 funkcje agregujące Ćwiczenie 3 funkcje agregujące Funkcje agregujące, klauzule GROUP BY, HAVING Ćwiczenie 3 funkcje agregujące Celem ćwiczenia jest zaprezentowanie zagadnień dotyczących stosowania w zapytaniach języka SQL

Bardziej szczegółowo

2. Podstawy programu Microsoft Access

2. Podstawy programu Microsoft Access 8 Wprowadzenie do projektowania baz danych 2. Podstawy programu Microsoft Access Baza danych utworzona w programie Microsoft Access składa się z wielu obiektów róŝnych typów. MoŜna podzielić je na dwie

Bardziej szczegółowo

Opracowanie narzędzi informatycznych dla przetwarzania danych stanowiących bazę wyjściową dla tworzenia map akustycznych

Opracowanie narzędzi informatycznych dla przetwarzania danych stanowiących bazę wyjściową dla tworzenia map akustycznych Opracowanie zasad tworzenia programów ochrony przed hałasem mieszkańców terenów przygranicznych związanych z funkcjonowaniem duŝych przejść granicznych Opracowanie metody szacowania liczebności populacji

Bardziej szczegółowo

Oprogramowanie dla biznesu Numer 11 (69) Listopad 2009 JAK SZYBKO I SKUTECZNIE ZAMKNĄĆ ROK?

Oprogramowanie dla biznesu Numer 11 (69) Listopad 2009 JAK SZYBKO I SKUTECZNIE ZAMKNĄĆ ROK? Oprogramowanie dla biznesu Numer 11 (69) Listopad 2009 JAK SZYBKO I SKUTECZNIE ZAMKNĄĆ ROK? CZY TO MOśLIWE, ABY PRZEZ PROCES ZAMKNIĘCIA ROKU W DUśEJ FIRMIE LEASINGOWEJ PRZEJŚĆ SZYBKO I BEZBOLEŚNIE? MY

Bardziej szczegółowo

Security Master Class

Security Master Class Security Master Class Platforma kompleksowej analizy zdarzeń Linux Polska SIEM Radosław Żak-Brodalko Senior Solutions Architect Linux Polska sp. z o.o. Podstawowe problemy Jak pokryć lukę między technicznym

Bardziej szczegółowo

InŜynieria Rolnicza 14/2005. Streszczenie

InŜynieria Rolnicza 14/2005. Streszczenie Michał Cupiał Katedra InŜynierii Rolniczej i Informatyki Akademia Rolnicza w Krakowie PROGRAM WSPOMAGAJĄCY NAWOśENIE MINERALNE NAWOZY 2 Streszczenie Przedstawiono program Nawozy 2 wspomagający nawoŝenie

Bardziej szczegółowo

INFORMATYKA Pytania ogólne na egzamin dyplomowy

INFORMATYKA Pytania ogólne na egzamin dyplomowy INFORMATYKA Pytania ogólne na egzamin dyplomowy 1. Wyjaśnić pojęcia problem, algorytm. 2. Podać definicję złożoności czasowej. 3. Podać definicję złożoności pamięciowej. 4. Typy danych w języku C. 5. Instrukcja

Bardziej szczegółowo

Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl

Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl 1. Wstęp Aby skorzystać z możliwości RapidMinera w zakresie analizy tekstu, należy zainstalować Text Mining Extension. Wybierz: 1 Po

Bardziej szczegółowo

Procesy aktywne. PoŜyczki Kredyty Pozostałe procesy aktywne

Procesy aktywne. PoŜyczki Kredyty Pozostałe procesy aktywne ZADANIA ĆWICZENIOWE - ADONIS Moduł 1: Struktura obszaru przedsiębiorstwa Pierwszym etapem jest analiza i strukturyzacja badanego obszaru przedsiębiorstwa. W tym celu stosowany jest typ modelu ADONISa mapa

Bardziej szczegółowo

Scoring kredytowy w pigułce

Scoring kredytowy w pigułce Analiza danych Data mining Sterowanie jakością Analityka przez Internet Scoring kredytowy w pigułce Mariola Kapla Biuro Informacji Kredytowej S.A. StatSoft Polska Sp. z o.o. ul. Kraszewskiego 36 30-110

Bardziej szczegółowo

Analiza internetowa czyli Internet jako hurtownia danych

Analiza internetowa czyli Internet jako hurtownia danych Analiza internetowa czyli Internet jako hurtownia danych Agenda 1. Hurtownie danych, eksploracja danych i OLAP 3. Internet 5. Analiza Internetowa 7. Google Analytics 9. Podsumowanie Hurtownie danych (definicja)

Bardziej szczegółowo

System Obsługi Wniosków

System Obsługi Wniosków System Obsługi Wniosków Wersja 2.0 1 System Obsługi Wniosków wersja 2.0 System Obsługi Wniosków to nowoczesne rozwiązanie wspierające proces obsługi wniosków o produkty bankowe. Pozwala na przyjmowanie,

Bardziej szczegółowo

Testowanie modeli predykcyjnych

Testowanie modeli predykcyjnych Testowanie modeli predykcyjnych Wstęp Podczas budowy modelu, którego celem jest przewidywanie pewnych wartości na podstawie zbioru danych uczących poważnym problemem jest ocena jakości uczenia i zdolności

Bardziej szczegółowo

ZAGADNIENIE WYBORU NARZĘDZIA DO DATA MINING. ANALIZA PORÓWNAWCZA WYBRANYCH PRODUKTÓW I TECHNIK

ZAGADNIENIE WYBORU NARZĘDZIA DO DATA MINING. ANALIZA PORÓWNAWCZA WYBRANYCH PRODUKTÓW I TECHNIK ZAGADNIENIE WYBORU NARZĘDZIA DO DATA MINING. ANALIZA PORÓWNAWCZA WYBRANYCH PRODUKTÓW I TECHNIK Streszczenie Paweł Pandzierski Akademia Ekonomiczna im. Oskara Langego we Wrocławiu paweell@op.pl Artykuł

Bardziej szczegółowo

Eksploracja danych. Wielkie bazy danych. Zależności w bazach danych Przykład 1. Zależności w bazach danych Przykład 2

Eksploracja danych. Wielkie bazy danych. Zależności w bazach danych Przykład 1. Zależności w bazach danych Przykład 2 Wielkie bazy danych Eksploracja danych Marek Wojciechowski Instytut Informatyki Politechnika Poznańska Wielkie bazy danych (Very Large Databases) i hurtownie danych (Data Warehouses) Rozmiary współczesnych

Bardziej szczegółowo

Stawiamy na specjalizację. by CSB-System AG, Geilenkirchen Version 1.1

Stawiamy na specjalizację. by CSB-System AG, Geilenkirchen Version 1.1 1 Business Intelligence Jak najlepiej wykorzystać dostępne źródła informacji, czyli Business Intelligence w zarządzaniu III Konferencja i warsztaty dla branży mięsnej Potencjał rynku potencjał firmy 2

Bardziej szczegółowo

TWORZENIE BAZ WIEDZY W SYSTEMACH EKSPERTOWYCH GOSPODAROWANIA MAJĄTKIEM OBROTOWYM PREDSIĘBIORSTWA

TWORZENIE BAZ WIEDZY W SYSTEMACH EKSPERTOWYCH GOSPODAROWANIA MAJĄTKIEM OBROTOWYM PREDSIĘBIORSTWA TWORZENIE BAZ WIEDZY W SYSTEMACH EKSPERTOWYCH GOSPODAROWANIA MAJĄTKIEM OBROTOWYM PREDSIĘBIORSTWA Leszek Kiełtyka, Waldemar Jędrzejczyk Wprowadzenie Systemy ekspertowe (SE) są to komputerowe programy konsultacyjne,

Bardziej szczegółowo

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Usługi analityczne budowa kostki analitycznej Część pierwsza. Usługi analityczne budowa kostki analitycznej Część pierwsza. Wprowadzenie W wielu dziedzinach działalności człowieka analiza zebranych danych jest jednym z najważniejszych mechanizmów podejmowania decyzji.

Bardziej szczegółowo

Business Intelligence jako narzędzie do walki z praniem brudnych pieniędzy

Business Intelligence jako narzędzie do walki z praniem brudnych pieniędzy Business www.comarch.pl Intelligence jako narzędzie do walki z praniem brudnych pieniędzy Business Intelligence jako narzędzie do walki z praniem brudnych pieniędzy Tomasz Matysik Kołobrzeg, 19.11.2009

Bardziej szczegółowo

Szybkość instynktu i rozsądek rozumu$

Szybkość instynktu i rozsądek rozumu$ Szybkość instynktu i rozsądek rozumu$ zastosowania rozwiązań BigData$ Bartosz Dudziński" Architekt IT! Już nie tylko dokumenty Ilość Szybkość Różnorodność 12 terabajtów milionów Tweet-ów tworzonych codziennie

Bardziej szczegółowo

NUK w Banku Spółdzielczym (19) System IT w zarządzaniu ryzykiem kredytowym

NUK w Banku Spółdzielczym (19) System IT w zarządzaniu ryzykiem kredytowym 1 NUK w Banku Spółdzielczym (19) System IT w zarządzaniu ryzykiem kredytowym Przyszedł czas, aby po nowemu spojrzeć na zarządzanie ryzykiem w banku spółdzielczym, zwłaszcza przed wyborem oferty systemu

Bardziej szczegółowo

Relacyjny model baz danych, model związków encji, normalizacje

Relacyjny model baz danych, model związków encji, normalizacje Relacyjny model baz danych, model związków encji, normalizacje Wyklad 3 mgr inż. Maciej Lasota mgr inż. Karol Wieczorek Politechnika Świętokrzyska Katedra Informatyki Kielce, 2009 Definicje Operacje na

Bardziej szczegółowo

Tworzenie przypadków testowych

Tworzenie przypadków testowych Tworzenie przypadków testowych Prowadząca: Katarzyna Pietrzyk Agenda 1. Wprowadzenie 2. Wymagania 3. Przypadek testowy Definicja Schemat Cechy dobrego przypadku testowego 4. Techniki projektowania Czarnej

Bardziej szczegółowo

Hurtownie danych a transakcyjne bazy danych

Hurtownie danych a transakcyjne bazy danych Hurtownie danych a transakcyjne bazy danych Materiały źródłowe do wykładu: [1] Jerzy Surma, Business Intelligence. Systemy wspomagania decyzji, Wydawnictwo Naukowe PWN, Warszawa 2009 [2] Arkadiusz Januszewski,

Bardziej szczegółowo

Warstwa integracji. wg. D.Alur, J.Crupi, D. Malks, Core J2EE. Wzorce projektowe.

Warstwa integracji. wg. D.Alur, J.Crupi, D. Malks, Core J2EE. Wzorce projektowe. Warstwa integracji wg. D.Alur, J.Crupi, D. Malks, Core J2EE. Wzorce projektowe. 1. Ukrycie logiki dostępu do danych w osobnej warstwie 2. Oddzielenie mechanizmów trwałości od modelu obiektowego Pięciowarstwowy

Bardziej szczegółowo

Podstawy programowania III WYKŁAD 4

Podstawy programowania III WYKŁAD 4 Podstawy programowania III WYKŁAD 4 Jan Kazimirski 1 Podstawy UML-a 2 UML UML Unified Modeling Language formalny język modelowania systemu informatycznego. Aktualna wersja 2.3 Stosuje paradygmat obiektowy.

Bardziej szczegółowo

Diagramy ERD. Model struktury danych jest najczęściej tworzony z wykorzystaniem diagramów pojęciowych (konceptualnych). Najpopularniejszym

Diagramy ERD. Model struktury danych jest najczęściej tworzony z wykorzystaniem diagramów pojęciowych (konceptualnych). Najpopularniejszym Diagramy ERD. Model struktury danych jest najczęściej tworzony z wykorzystaniem diagramów pojęciowych (konceptualnych). Najpopularniejszym konceptualnym modelem danych jest tzw. model związków encji (ERM

Bardziej szczegółowo

ETL - wykład III. Zagadnienia do omówienia. Identyfikacja wymagań

ETL - wykład III. Zagadnienia do omówienia. Identyfikacja wymagań ETL - wykład III Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006-2008 Zagadnienia do omówienia 1. na dane 2. Specyfikacja wymagań / systemu 3. Integracja informacji 4. Dyskusja

Bardziej szczegółowo

Sterowanie wielkością zamówienia w Excelu - cz. 3

Sterowanie wielkością zamówienia w Excelu - cz. 3 Sterowanie wielkością zamówienia w Excelu - cz. 3 21.06.2005 r. 4. Planowanie eksperymentów symulacyjnych Podczas tego etapu ważne jest określenie typu rozkładu badanej charakterystyki. Dzięki tej informacji

Bardziej szczegółowo

Plan prezentacji 0 Wprowadzenie 0 Zastosowania 0 Przykładowe metody 0 Zagadnienia poboczne 0 Przyszłość 0 Podsumowanie 7 Jak powstaje wiedza? Dane Informacje Wiedza Zrozumienie 8 Przykład Teleskop Hubble

Bardziej szczegółowo

STUDIA STACJONARNE I STOPNIA Przedmioty kierunkowe

STUDIA STACJONARNE I STOPNIA Przedmioty kierunkowe STUDIA STACJONARNE I STOPNIA Przedmioty kierunkowe Technologie informacyjne Prof. dr hab. Zdzisław Szyjewski 1. Rola i zadania systemu operacyjnego 2. Zarządzanie pamięcią komputera 3. Zarządzanie danymi

Bardziej szczegółowo

Pojęcie systemu informacyjnego i informatycznego

Pojęcie systemu informacyjnego i informatycznego BAZY DANYCH Pojęcie systemu informacyjnego i informatycznego DANE wszelkie liczby, fakty, pojęcia zarejestrowane w celu uzyskania wiedzy o realnym świecie. INFORMACJA - znaczenie przypisywane danym. SYSTEM

Bardziej szczegółowo

Oferta szkoleniowa Yosi.pl 2012/2013

Oferta szkoleniowa Yosi.pl 2012/2013 Oferta szkoleniowa Yosi.pl 2012/2013 "Podróżnik nie posiadający wiedzy, jest jak ptak bez skrzydeł" Sa'Di, Gulistan (1258 rok) Szanowni Państwo, Yosi.pl to dynamicznie rozwijająca się firma z Krakowa.

Bardziej szczegółowo

UWARUNKOWANIA WDROśEŃ HURTOWNI DANYCH W ORGANIZACJACH GOSPODARCZYCH

UWARUNKOWANIA WDROśEŃ HURTOWNI DANYCH W ORGANIZACJACH GOSPODARCZYCH UWARUNKOWANIA WDROśEŃ HURTOWNI DANYCH W ORGANIZACJACH GOSPODARCZYCH Jacek Maślankowski Wprowadzenie Niniejszy artykuł ma na celu przybliŝenie wiedzy na temat wdroŝeń systemów hurtowni danych w polskich

Bardziej szczegółowo

Wykład 1 Inżynieria Oprogramowania

Wykład 1 Inżynieria Oprogramowania Wykład 1 Inżynieria Oprogramowania Wstęp do inżynierii oprogramowania. Cykle rozwoju oprogramowaniaiteracyjno-rozwojowy cykl oprogramowania Autor: Zofia Kruczkiewicz System Informacyjny =Techniczny SI

Bardziej szczegółowo

dr inż. Maciej Kiewra Prezentacja wygłoszona na konferencji BI vs Big Data podczas Kongresu GigaCon Warszawa, 16.04.2014 r.

dr inż. Maciej Kiewra Prezentacja wygłoszona na konferencji BI vs Big Data podczas Kongresu GigaCon Warszawa, 16.04.2014 r. dr inż. Maciej Kiewra Prezentacja wygłoszona na konferencji BI vs Big Data podczas Kongresu GigaCon Warszawa, 16.04.2014 r. Big Data w praktyce, z perspektywy konsultanta Business Intelligence Parę słów

Bardziej szczegółowo

KIERUNKOWE EFEKTY KSZTAŁCENIA

KIERUNKOWE EFEKTY KSZTAŁCENIA WYDZIAŁ INFORMATYKI I ZARZĄDZANIA Kierunek studiów: INFORMATYKA Stopień studiów: STUDIA II STOPNIA Obszar Wiedzy/Kształcenia: OBSZAR NAUK TECHNICZNYCH Obszar nauki: DZIEDZINA NAUK TECHNICZNYCH Dyscyplina

Bardziej szczegółowo

Sprzętowo wspomagane metody klasyfikacji danych

Sprzętowo wspomagane metody klasyfikacji danych Sprzętowo wspomagane metody klasyfikacji danych Jakub Botwicz Politechnika Warszawska, Instytut Telekomunikacji Plan prezentacji 1. Motywacje oraz cele 2. Problemy klasyfikacji danych 3. Weryfikacja integralności

Bardziej szczegółowo

Systemy baz danych w zarządzaniu przedsiębiorstwem. W poszukiwaniu rozwiązania problemu, najbardziej pomocna jest znajomość odpowiedzi

Systemy baz danych w zarządzaniu przedsiębiorstwem. W poszukiwaniu rozwiązania problemu, najbardziej pomocna jest znajomość odpowiedzi Systemy baz danych w zarządzaniu przedsiębiorstwem W poszukiwaniu rozwiązania problemu, najbardziej pomocna jest znajomość odpowiedzi Proces zarządzania danymi Zarządzanie danymi obejmuje czynności: gromadzenie

Bardziej szczegółowo

System do rekrutacji nowej generacji

System do rekrutacji nowej generacji System do rekrutacji nowej generacji PYTON Falcon pozwala usprawnić proces rekrutacji zewnętrznej i wewnętrznej, zarządza całym procesem rekrutacyjnym: wakatami, ofertami pracy, rozmowami kwalifikacyjnymi,

Bardziej szczegółowo

Data Mining Kopalnie Wiedzy

Data Mining Kopalnie Wiedzy Data Mining Kopalnie Wiedzy Janusz z Będzina Instytut Informatyki i Nauki o Materiałach Sosnowiec, 30 listopada 2006 Kopalnie złota XIX Wiek. Odkrycie pokładów złota spowodowało napływ poszukiwaczy. Przeczesywali

Bardziej szczegółowo

Zapewnij sukces swym projektom

Zapewnij sukces swym projektom Zapewnij sukces swym projektom HumanWork PROJECT to aplikacja dla zespołów projektowych, które chcą poprawić swą komunikację, uprościć procesy podejmowania decyzji oraz kończyć projekty na czas i zgodnie

Bardziej szczegółowo

Przypadki bez przypadków. Jak dobierać scenariusze testowe.

Przypadki bez przypadków. Jak dobierać scenariusze testowe. Przypadki bez przypadków. Jak dobierać scenariusze testowe. Konferencja SQAM 2008 Warszawa, 29. kwietnia Wojciech Pająk 29 kwietnia 2008 Warszawa Zagadnienia prezentacji 1. Wprowadzenie 2. Definicje przypadków

Bardziej szczegółowo

Oracle11g: Wprowadzenie do SQL

Oracle11g: Wprowadzenie do SQL Oracle11g: Wprowadzenie do SQL OPIS: Kurs ten oferuje uczestnikom wprowadzenie do technologii bazy Oracle11g, koncepcji bazy relacyjnej i efektywnego języka programowania o nazwie SQL. Kurs dostarczy twórcom

Bardziej szczegółowo

Projektowanie architektury systemu rozproszonego. Jarosław Kuchta Projektowanie Aplikacji Internetowych

Projektowanie architektury systemu rozproszonego. Jarosław Kuchta Projektowanie Aplikacji Internetowych Projektowanie architektury systemu rozproszonego Jarosław Kuchta Zagadnienia Typy architektury systemu Rozproszone przetwarzanie obiektowe Problemy globalizacji Problemy ochrony Projektowanie architektury

Bardziej szczegółowo

Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem. dr Jakub Boratyński. pok. A38

Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem. dr Jakub Boratyński. pok. A38 Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem zajęcia 1 dr Jakub Boratyński pok. A38 Program zajęć Bazy danych jako podstawowy element systemów informatycznych wykorzystywanych

Bardziej szczegółowo

Modernizacja systemu gromadzenia i przetwarzania informacji hydrogeologicznych

Modernizacja systemu gromadzenia i przetwarzania informacji hydrogeologicznych 151 Dział tematyczny VII: Modernizacja systemu gromadzenia i przetwarzania informacji hydrogeologicznych 152 Zadanie 31 System przetwarzania danych PSH - rozbudowa aplikacji do gromadzenia i przetwarzania

Bardziej szczegółowo

StatSoft profesjonalny partner w zakresie analizy danych

StatSoft profesjonalny partner w zakresie analizy danych Analiza danych Data mining Sterowanie jakością Analityka przez Internet StatSoft profesjonalny partner w zakresie analizy danych StatSoft Polska Sp. z o.o. StatSoft Polska Sp. z o.o. ul. Kraszewskiego

Bardziej szczegółowo

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl www.cs.put.poznan.pl/rwrembel Plan wykładów Wprowadzenie - integracja

Bardziej szczegółowo

Grupa kursów: Wykład Ćwiczenia Laboratorium Projekt Seminarium 15 30

Grupa kursów: Wykład Ćwiczenia Laboratorium Projekt Seminarium 15 30 Zał. nr 4 do ZW 33/01 WYDZIAŁ INFORMATYKI I ZĄRZADZANIA KARTA PRZEDMIOTU Nazwa w języku polskim: Wprowadzenie do SQL Nazwa w języku angielskim: Introduction to SQL Kierunek studiów (jeśli dotyczy): Zarządzanie

Bardziej szczegółowo

Instrukcja uŝytkownika narzędzia Skaner SMTP TP. Uruchamianie aplikacji

Instrukcja uŝytkownika narzędzia Skaner SMTP TP. Uruchamianie aplikacji Instrukcja uŝytkownika narzędzia Skaner SMTP TP W związku z wprowadzeniem dodatkowego profilu dla usługi "Bezpieczny Dostęp", który ogranicza komunikację i wpływa na funkcjonowanie poczty elektronicznej,

Bardziej szczegółowo

Hurtownie danych - przegląd technologii

Hurtownie danych - przegląd technologii Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl www.cs.put.poznan.pl/rwrembel Plan wykład adów Wprowadzenie - integracja

Bardziej szczegółowo

Terminologia baz danych

Terminologia baz danych Terminologia baz danych Terminologia Banki danych - bazy danych w których przechowuje si informacj historyczne. Hurtownie danych (data warehouse): zweryfikowane dane z rónych baz, przydatne do analiz i

Bardziej szczegółowo

Intellect. Business Intelligence

Intellect. Business Intelligence Intellect Business Intelligence Intellect to nowoczesne środowisko informatyczne klasy Business Intelligence wspomagające procesy zarządzania w przedsiębiorstwie. Intellect poprzez swobodnie definiowane

Bardziej szczegółowo

CLUSTERING. Metody grupowania danych

CLUSTERING. Metody grupowania danych CLUSTERING Metody grupowania danych Plan wykładu Wprowadzenie Dziedziny zastosowania Co to jest problem klastrowania? Problem wyszukiwania optymalnych klastrów Metody generowania: k centroidów (k - means

Bardziej szczegółowo

Projektowanie systemu sprzedaŝy ubezpieczeń dla T. U. Generali zgodnie z metodyką User-Centered Design

Projektowanie systemu sprzedaŝy ubezpieczeń dla T. U. Generali zgodnie z metodyką User-Centered Design Case Study Projektowanie systemu sprzedaŝy ubezpieczeń dla T. U. Generali zgodnie z metodyką User-Centered Design Zadanie Naszym zadaniem było zaprojektowanie interfejsu aplikacji do sprzedaŝy ubezpieczeń

Bardziej szczegółowo

Hurtownie danych. Projektowanie hurtowni: modele wielowymiarowe. Modelowanie punktowe. Operacje OLAP na kostkach. http://zajecia.jakubw.

Hurtownie danych. Projektowanie hurtowni: modele wielowymiarowe. Modelowanie punktowe. Operacje OLAP na kostkach. http://zajecia.jakubw. Hurtownie danych Projektowanie hurtowni: modele wielowymiarowe. Modelowanie punktowe. Operacje OLAP na kostkach. http://zajecia.jakubw.pl/hur UZASADNIENIE BIZNESOWE Po co nam hurtownia danych? Jakie mogą

Bardziej szczegółowo