ORACLE 9i DATA MINING NARZĘDZIEM DO EKSTRAKCJI WIEDZY Z BAZ DANYCH

Wielkość: px
Rozpocząć pokaz od strony:

Download "ORACLE 9i DATA MINING NARZĘDZIEM DO EKSTRAKCJI WIEDZY Z BAZ DANYCH"

Transkrypt

1 ORACLE 9i DATA MINING NARZĘDZIEM DO EKSTRAKCJI WIEDZY Z BAZ DANYCH Streszczenie Małgorzata Nycz, Barbara Smok Akademia Ekonomiczna we Wrocławiu {malgorzata.nycz,barbara.smok}@ae.wroc.pl Artykuł prezentuje wykorzystanie narzędzie Oracle 9i Data Mining do odkrywania wiedzy z baz danych. Układ artykułu jest następujący. Po krótkim wprowadzeniu scharakteryzowano problematykę odkrywania wiedzy, następnie przedstawiono Oracle Data Mining. W dalszej części zaprezentowano przykład zastosowania tego narzędzia do odkrywania wiedzy z bankowej bazy danych. Artykuł kończy podsumowanie przeprowadzonych rozwaŝań. Słowa kluczowe: odkrywanie wiedzy, data mining, eksploracja Wprowadzenie Dzisiaj przedsiębiorstwa stają wobec problemu posiadania, przetwarzania i zbierania coraz większych ilości danych. Rozwiązania tego problemu oferują metody Data Mining (eksploracja danych), które identyfikują wzorce i zaleŝności w rozległych obszarach danych. Wiele firm oferuje profesjonalne narzędzia analityczne wspomagające podejmowanie decyzji oraz analizy danych (oparte na systemie OLAP). Narzędzia te na podstawie danych zgromadzonych przez przedsiębiorstwo pozwalają zoptymalizować procesy zarządzania, dostarczając niezbędną informację we właściwym czasie. W odpowiedni sposób przetworzone informacje pomagają przedsiębiorstwom rozwijać się i utrzymać się na ciągle zmieniającym się w szybkim tempie rynku. Dostarczają równieŝ wiedzy pozwalającej osiągnąć przewagę nad konkurencją. Odkrywanie wiedzy Eksploracja danych (odkrywanie wiedzy z baz danych) jest procesem efektywnego znajdowania nowych, nieznanych, uŝytecznych wzorców, zaleŝności, czy związków między danymi np. w hurtowni danych. Odkrywanie wiedzy często w literaturze występuje jako synonim data mining i dotyczy zazwyczaj całego procesu pozyskiwania uŝytecznej wiedzy [MORZ99], a proces eksploracji odnosi się do jednego z jego etapów do generowania reguł. Metody eksploracji moŝna podzielić ogólnie na następujące klasy [MoWo99]: odkrywanie asocjacji,

2 324 Zarządzanie wiedzą i rozwiązania Business Intelligence klastrowanie, odkrywanie wzorców sekwencji, odkrywanie klasyfikacji, odkrywanie podobieństw w przebiegach czasowych, wykrywanie zmian i odchyleń. Aby dane mogły być wykorzystane do eksploracji muszą być poddane czyszczeniu, którego celem jest zapewnienie jakości i poprawności danych, szczególnie w przypadku, gdy pochodzą z heterogenicznych źródeł, gdyŝ wówczas mogą zawierać błędy i anomalie jak np.: niespójne długości pól, róŝne formaty, wartości puste, czy naruszone ograniczenia integralności. Następnym etapem jest ładowanie danych, który wymaga dodatkowego przetwarzania jak np. sprawdzenia integralności, sortowania, podsumowania. Do metod eksploracji moŝemy zaliczyć m.in.: analizę skupień świetnie nadaje się do wstępnych analiz, w przypadku gdy niewiele wiemy o naszej bazie danych i trudno nam sprecyzować pytanie; w takich sytuacjach zawsze moŝemy poszukiwać skupień, które mogą być dla nas interesujące i znaczące, sieci neuronowe są algorytmami przetwarzania danych bazującymi na konstruowaniu i rozpoznawaniu wzorców, nie ekstrahują wiedzy, nadają się do klasyfikowania danych i są niemal idealnym narzędziem do prognozowania sekwencji czasowych, drzewa decyzyjne dostarczają zrozumiałej wiedzy o danych, ich algorytmy prowadzą do rozdrobnienia danych, wyłonienia klas i przypadkowych reguł; aby tego uniknąć przycina się drzewa wykorzystując odpowiednie techniki, w przypadku analizy skupień metodę k-uśrednień oraz inne parametry jak ilość skupień, czy współczynnik metryki. Oracle Data Mining Oprogramowanie Oracle pozwala przeszukiwać ogromne bazy danych w celu znajdowania róŝnych wzorców i tendencji, które mogą wspomóc strategię biznesową oraz prezentować róŝne zaleŝności między wieloma zmiennymi. Oracle Data Mining słada się z dwóch głównych komponentów: Oracle 9i Data Mining API (ODM API) jest interfejsem programistycznym, umoŝliwiającym dostęp programom w języku Java do Data Mining Server; bazuje na nowo tworzonym standardzie Java Data Mining, Data Mining Server (DMS) jest elementem składowym wykonującym obliczenia w bazie Oracle 9i; udostępnia repozytorium, w którym są zapisywane m.in. modele oraz wyniki obliczeń. Budowa modelu eksploracji w Oracle 9i Data Mining moŝliwa jest na dwóch poziomach: funkcji i algorytmu. Na poziomie funkcji pozwala pominąć specyfikację wszystkich szczegółów algorytmu i skupić się na eksploracji, gdzie dobierany jest odpowiedni algorytm i wyznaczane są wartości wszystkich parametrów. W przypadku, gdy standardowe procedury odkrywania wzorców są niewystarczające moŝna budować model na poziomie algorytmu dostosowując proces eksploracji do własnych potrzeb. Tak zbudowane modele są przechowywane w repozytorium serwera eksploracji i mogą być wielokrotnie wykorzystywane. Na budowę modelu składa się następujące etapy: tworzenie danych wej-

3 Oracle 9i Data Mining narzędziem do ekstrakcji wiedzy z baz danych 325 ściowych poprzez kojarzenie obiektu reprezentującego dane z rzeczywistym źródłem danych np. relacją w bazie danych, tworzenie obiektu reprezentującego ustawienia wybranej funkcji eksploracji, wiązanie obiektu funkcji eksploracji z obiektami reprezentującymi logiczną strukturę danych i fizyczne wykorzystanie danych, tworzenie modelu wybraną metodą: klasyfikacja lub odkrywanie asocjacji. Model klasyfikacyjny moŝna przetestować w celu oszacowania dokładności klasyfikacji. Model klasyfikatora jest stosowany do zbioru danych testowych, których nie uŝyto do budowania modelu, dla których jest znana wartość klasyfikowanego atrybutu. Testowanie dostarcza macierz pomyłek, która daje nam obraz w ilu przypadkach model poprawnie sklasyfikował dane testowe, a w ilu pomylił się oraz jakiego typu były to pomyłki. Analiza macierzy pozwala na dokładniejsze dostrojenie modelu aŝ do uzyskania zadawalającej jakości klasyfikacji. Model klasyfikatora zastosowany do nowych danych powoduje obliczenie przewidywanej wartości lub klasy wraz z prawdopodobieństwem. Stosując model asocjacji moŝemy wykorzystać stworzony model do danych źródłowych, a w wyniku otrzymamy zbiór reguł asocjacyjnych odkrytych w danych źródłowych, które są składowane w repozytorium serwera eksploracyjnego. Algorytmy Oracle Data Mining moŝna zaklasyfikować do dwóch grup ze względu na sposób nauki: z nauczycielem (supervised) do przewidywania wartości na podstawie wcześniej przetworzonej próbki lub bez nauczyciela (unsupervised) do wyszukiwania struktur, relacji, czy podobieństw zawartych w danych. Na podstawie [ORAC02] moŝemy podzielić algorytmy na: klasyfikacja z nauczycielem; pozwala zaklasyfikować obiekty do kilku klas; posiadając sklasyfikowane obiekty uczymy model, który automatycznie będzie klasyfikował nowe obiekty; kaŝdy obiekt posiada atrybuty oraz jeden dodatkowy, który określa jego przynaleŝność do klasy, analiza skupień - bez nauczyciela umoŝliwia wyszukiwanie nieznanych grup w danych; grupy (skupienia) zawierają obiekty podobne do siebie, reguły kojarzące - bez nauczyciela pozwalają wyszukiwać związki miedzy danymi, przykładem moŝe być analiza koszykowa, stopień waŝności atrybutów - z nauczycielem automatycznie wyszukują atrybuty, które najmocniej wpływają na wynik. Metody klasyfikacyjne pozwalają zaklasyfikować obiekty do kilku lub więcej klas. Odbywa się to dwuetapowo: (1) posiadając sklasyfikowane obiekty uczymy model klasyfikacji, a w (2) nauczony model automatycznie klasyfikuje nowe obiekty. KaŜdy z obiektów posiada pewną liczbę atrybutów opisujących go oraz jeden przewidywalny, którego wartość określi jego przynaleŝność do odpowiedniej klasy. Do tej grupy naleŝą trzy algorytmy: Adaptive Bayes Network, Naive Bayes i Model Seeker.

4 326 Zarządzanie wiedzą i rozwiązania Business Intelligence Przykłady zastosowań klasyfikacji to m.in. rozpoznawanie trendów na rynkach finansowych, automatyczne rozpoznawanie obiektów w duŝych bazach obrazów, wspomaganie decyzji przyznawania kredytów bankowych. Zastosowanie Oracle Data Mining do odkrywania wiedzy Do procesu drąŝenia danych wykorzystano rzeczywisty zbiór danych opisujących klientów banku, oddziały banku oraz wzajemne relacje pomiędzy klientem a bankiem. Baza 1 dotyczy ogólnokrajowego banku prowadzącego swą działalność w Czechach. Państwo to zostało podzielone na 8 regionów oraz 77 okręgów. KaŜdy z okręgów opisany jest przy pomocy 15 atrybutów dotyczących między innymi liczby mieszkańców, miejscowości, płac, bezrobocia a nawet przestępczości w okręgu. Opisano przeszło 4 tysiące klientów przy pomocy 9 tysięcy rekordów w jednej tablicy, składającej się z 67 atrybutów. Większość klientów zamieszkuje ten sam okręg, w którym mieści się oddział banku, a jedynie około 10% ma swój bank w innym okręgu. Celem eksperymentu była analiza kredytów udzielanych przez bank klientom. Atrybut loan_status opisujący stan kredytu klienta i przyjmujący następujące wartości: A umowa zakończona, kredyt spłacony, B umowa zakończona, kredyt nie spłacony, C umowa w trakcie, dotychczas jest OK, D umowa w trakcie, klient w długach, moŝe słuŝyć do klasyfikacji klientów na tych, którym warto było udzielić kredytu i tych, którym udzielenie kredytu zakończyło się niepowodzeniem. Do tablicy dodano atrybut o nazwie UDANY przyjmujący wartość 0 dla wartości B, atrybut D loan_status - dla przypadków zakończonych niepowodzeniem oraz wartość 1 dla przypadków zakończonych powodzeniem. Bazę ograniczono do klientów, którzy zaciągali kredyt. Spośród 751 klientów 76 sklasyfikowano do grupy, w której udzielenie kredytu zakończyło się niepowodzeniem. Chcieliśmy zbadać wpływ poszczególnych atrybutów na powodzenie lub niepowodzenie spłaty kredytu przez klienta. Została wykorzystana tutaj metoda klasyfikacji oparta na Adaptacyjnej Sieci Bayesa, w której przyjęto jako wynikowy atrybut - UDANY. Oprócz zakwalifikowania obiektu do danej klasy, definiuje równieŝ reguły określające - jakie wartości atrybutów obiektów musi dany obiekt posiadać, aby został zakwalifikowany do konkretnej klasy. Przykładową regułą moŝe być: Jeśli dochód miesięczny klienta jest > 2000 zł i wiek 40 to moŝe być zainteresowany kredytem. Algorytm ten przewiduje odpowiedź w postaci binarnej (klient dostanie lub nie dostanie kredytu) lub w postaci wielowartościowej (klient jest w grupie rozwijającej się, stabilnej lub upadającej). KaŜdy z obiektów oprócz określenia 1 Baza danych przygotowana przez P. Berkę i M. Sochorovą dostępna w internecie:

5 Oracle 9i Data Mining narzędziem do ekstrakcji wiedzy z baz danych 327 klasy posiada takŝe zdefiniowane prawdopodobieństwo dopasowujące go do tej klasy. Metoda ta składa się z trzech etapów: (1) budowy modelu na zbiorze danych historycznych, (2) testu modelu na innym zbiorze danych historycznych, (3) zastosowania modelu do danych bieŝących w celu ich klasyfikacji. Budowę modelu kończy wygenerowanie reguł. Otrzymany model (przy wykorzystaniu Oracle 9i Data Mining) został przedstawiony przy pomocy reguł przedstawionych w Tabeli 1. Model drąŝenia danych prezentujący najwaŝniejsze reguły Tabela 1 If LOAN_STATUS in (A, C) then UDANY equal (0) If LOAN_STATUS in (B, D) then UDANY equal (1) If CARD_TYPE in (C, G, J) then UDANY equal (0) If CARD_CARD_ID in (1010, 1087, 1176, 1223, 16, OTHER_CATEGORY) then UDANY equal (0) If CARD_DATE in ( :00:00, :00:00, :00:00, :00:00, :00:00, OTHER_CATEGORY) then UDANY equal (0) If CARD_DISP_ID in (10887, 116, 12502, 13231, 2141, OTHER_CATEGORY) then UDANY equal (0) If TRANS_OPERATION in (B, C, D, E) then UDANY equal (0) If TRANS_BALANCE in ( ) then UDANY equal (0) If TRANS_ACCOUNT_ID in ( ) then UDANY equal (0) If TRANS_TRANS_ID in ( , , , , ) then UDANY equal (0) If TRANS_TYPE in (A, B) then UDANY equal (0) Analiza powyŝszych reguł pozwala stwierdzić, Ŝe baza, która została poddana procesowi drąŝenia danych nie zawiera wiele wiedzy. Reguły w większości przypadków są bezuŝyteczne, gdyŝ najczęściej wskazują pełną dziedzinę atrybutów. Na uwagę zasługuje jedynie fakt, iŝ nie było kłopotów z klientami, którzy na co dzień posługują się kartami kredytowymi, gdyŝ analiza wykazała, Ŝe nie było ani jednego klienta, który posługuje się kartą kredytową i nie spłacił kredytu. Specyfikacja macierzy kosztów budowy modelu nie przyniosła Ŝadnych zmian wyniku. Kolejną metodą było wykorzystanie reguł kojarzących. Metoda ta umoŝliwia wyszukiwanie związków miedzy danymi. Typowym zastosowaniem tego algorytmu jest analiza koszykowa polegająca na wyszukiwaniu powiązań między np. towarami kupowanymi razem. W metodzie tej występuje tu tylko 1 etap, którego wynikiem jest zestaw reguł w postaci: jeśli atrybut A osiąga wartość A to atrybut B przyjmuje wartość B. Reguły kojarzące moŝna definiować w oparciu o pojęcie zbioru częstego. Niech L = {l 1, l 2,..., l n } będzie zbiorem elementów (literałów), a D kolekcją transakcji o dowolnej długości i kaŝda T D i T L. Mówimy, Ŝe transakcja T wspiera element x, gdy x T oraz wspiera zbiór X, gdy T wspiera kaŝdy element x X. Wsparciem zbioru X nazywamy stosunek liczby transakcji wspierających X do liczby wszystkich transakcji.

6 328 Zarządzanie wiedzą i rozwiązania Business Intelligence { T D: T wspiera X} Wsparcie(X,D)= D Problem odkrywania zbiorów częstych polega na znalezieniu w danej bazie danych D wszystkich zbiorów, których wsparcie jest wyŝsze od zdefiniowanej przez uŝytkownika wartości zw. minimalnym wsparciem (minsup). Zbiór, którego wsparcie jest wyŝsze niŝ minsup nazywa się zbiorem częstym (frequent itemset). Reguła kojarząca jest implikacją postaci X Y, gdzie X L, Y L, a X Y =. KaŜda z reguł związana jest z dwoma miarami: Wsparciem (support) mówi o tym jak często wartości atrybutów występują razem, { T D: T wspiera X Y } Wsparcie(X Y,D)= D Zaufanie (confidence) reguły X Y w bazie danych jest stosunkiem liczby transakcji wspierających regułę do liczby transakcji wspierających poprzednik reguły. { T D: T wspiera X Y } Zaufanie(X Y,D)= { T D: T wspiera X} Problem odkrywania reguł asocjacyjnych polega na znalezieniu w bazie danych D wszystkich reguł, których wsparcie i zaufanie (ufność) są wyŝsze od zdefiniowanych przez uŝytkownika wartości minimalnego wsparcia i zaufania (minisup, miniconf). W metodzie tej nie ustawia się atrybutu wynikowego w związku z czym otrzymane reguły dotyczą wszystkich atrybutów. Otrzymane wyniki przedstawia Tabela 2. Analiza otrzymanych wyników nasuwa wniosek, Ŝe jeśli klient mieszka w okręgu, w którym liczba popełnionych przestępstw w 1996 roku była mniejsza niŝ 25532, to w 93 % udzielenie mu kredytu było dobrą decyzją. Wartość tego wniosku podwaŝa jednak fakt, iŝ 89% klientów spośród wszystkich zostało zaklasyfikowanych jako dobrych, więc 93% nie stanowi wielkiego przełomu. Podany przykład świadczy o tym, Ŝe nie z kaŝdej bazy moŝna wyciągnąć wartościową wiedzę. Hipotezy otrzymane w wyniku drąŝenia danych naleŝy zweryfikować. Często moŝe się zdarzyć, ze otrzymana wiedza jest trywialna i nie ma Ŝadnej wartości. Nie zmienia to jednak faktu, Ŝe moŝe się zdarzyć, iŝ koszty związane z weryfikacją bezwartościowych hipotez są niewspółmiernie niskie w stosunku zysków osiągniętych z odkrycia wartościowej wiedzy.

7 Oracle 9i Data Mining narzędziem do ekstrakcji wiedzy z baz danych 329 Reguły będące wynikiem działania metody Association Rules Tabela 2 Rule 28009: If ACCOUNT_DIST_A16= then CLIENT_DIST_A16= [support: , confidence: ] Rule 28010: If CLIENT_DIST_A16= then ACCOUNT_DIST_A16= [support: , confidence: ] Rule 27980: If CLIENT_DIST_A15= then CLIENT_DIST_A16= [support: , confidence: 1.0] Rule 27979: If CLIENT_DIST_A16= then CLIENT_DIST_A15= [support: , confidence: ] Rule 1205: If CLIENT_DIST_A16= then UDANY=.8-1 [support: , confidence: ] Rule 1409: If ACCOUNT_FREQUENCY=A then UDANY=.8-1 [support: , confidence: ] Rule 27980: If CLIENT_DIST_A15= then CLIENT_DIST_A16= [support: , confidence: 1.0] Rule 30318: If ACCOUNT_DIST_A15= then ACCOUNT_DIST_A16= [support: , confidence: 1.0] Rule 15252: If CLIENT_DIST_A4= then CLIENT_DIST_A15= [support: , confidence: 1.0] Rule 15254: If CLIENT_DIST_A4= then CLIENT_DIST_A16= [support: , confidence: 1.0] Rule 15252: If CLIENT_DIST_A4= then CLIENT_DIST_A15= [support: , confidence: 1.0] Rule 15254: If CLIENT_DIST_A4= then CLIENT_DIST_A16= [support: , confidence: 1.0] Podsumowanie Metody eksploracji danych znalazły stosunkowo niewielkie zastosowanie w przedsiębiorstwach. Eksploracja danych ma sens w odniesieniu do duŝych i bardzo duŝych zbiorów baz danych poprzez przeprowadzenie dogłębnej analizy róŝnych baz danych (relacyjnych, obiektowych, wielowymiarowych, przestrzennych, graficznych i innych). W efekcie drąŝenia danych odkrywamy wiedzę uprzednio nieznaną lub nie uświadamianą w postaci schematów, związków, zaleŝności, anomalii, czy struktur. Eksploracja wymaga wiele pracy, gdyŝ zanim dane zostaną poddane analizie muszą być odpowiednio przygotowane. Jednak brak odpowiedniej wiedzy i aktualnej informacji w zmieniającym się otoczeniu ekonomicznym z powodu niewykorzystania tego potencjału danych moŝe często oznaczać poraŝkę firmy.

8 330 Zarządzanie wiedzą i rozwiązania Business Intelligence Literatura [BELI97] [BYRS02] [CHEN96] [HANJ99] [InWG97] [MORZ99] [NySm00] [NySP03] [ORAC02] [MoWo99] Berry M.J.A., Linoff G.: Data Mining Techniques for Marketing, Sales and Customer Support, Wiley Computer Publishing, 1997 Byrski M.: Data Mining w bazie Oracle 9i. Materiały z VIII Konferencji PLOUG. Kościelisko, październik 2002, s Chen M.S. Han J., Yu P.S.: Data Mining: An Overview from a Database Perspective, IEEE Transactions on Knowledge and Data Engineering, 8(6): p , 1996 Han J. Data mining, Kluwer Academic Publishers,1999 Inmon W.H., J.D. Welch, Glassey K.L.: Managing the Data Warehouse, Wiley Comp. Publishing 1997 Morzy T.: Eksploracja danych: problemy i rozwiązania. Materiały z V Konferencji PLOUG. Zakopane, październik 1999 Nycz M., Smok B.: Problemy związane z pozyskiwaniem wiedzy z baz danych. Prace Naukowe nr 850 AE we Wrocławiu, Wrocław 2000 Nycz M., Smok B., Pondel M.: Wykorzystanie Oracle 9i Data Mining do pozyskiwania wiedzy z baz danych, w: Drelichowski L., Januszewski A., DzieŜa G. (red.): Zastosowanie technik informatycznych w gospodarce i zarządzanie wiedzą, Katedra Informatyki w Zarządzaniu, Akademia Techniczno-Rolnicza w Bydgoszczy, Bydgoszcz-Ciechocinek 2003 Oracle: Oracle 9i Data Mining Concepts Release 2(9.2), Oracle 2002 Morzy M., Wojciechowski M.: Integracja technik eksploracji danych z systemem zarządzania bazą danych na przykładzie Oracle 9i Data Mining. Materiały z Konferencji PLOUG, Zakopane październik 1999 ORACLE 9I DATA MINING AS A TOOL FOR KNOWLEDGE EXTRACTION FROM LARGE DATABASES The article presents the exemplary usage of the Oracle 9i Data Mining within knowledge extraction process from databases. It consists of four parts. After short introduction describing knowledge extraction issues, Oracle Data Mining has been presented. The next part presents example of practical exploration realized by this tool. As an example the real bank database has been taken into consideration. The paper ends with the carried out researches summary. Key words: data mining, knowledge discovery, exploration

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu i business intelligence Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl Wrocław 2005-2007 Plan na dziś : 1. Wprowadzenie do przedmiotu (co będzie omawiane oraz jak będę weryfikował zdobytą wiedzę

Bardziej szczegółowo

Wprowadzenie Sformułowanie problemu Typy reguł asocjacyjnych Proces odkrywania reguł asocjacyjnych. Data Mining Wykład 2

Wprowadzenie Sformułowanie problemu Typy reguł asocjacyjnych Proces odkrywania reguł asocjacyjnych. Data Mining Wykład 2 Data Mining Wykład 2 Odkrywanie asocjacji Plan wykładu Wprowadzenie Sformułowanie problemu Typy reguł asocjacyjnych Proces odkrywania reguł asocjacyjnych Geneza problemu Geneza problemu odkrywania reguł

Bardziej szczegółowo

INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH

INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH 1. Czym jest eksploracja danych Eksploracja danych definiowana jest jako zbiór technik odkrywania nietrywialnych zależności i schematów w dużych

Bardziej szczegółowo

Data Mining w bazie Oracle 9i

Data Mining w bazie Oracle 9i VIII Konferencja PLOUG Koœcielisko PaŸdziernik 2002 Data Mining w bazie Oracle 9i Mariusz Byrski Biuro Matematyki Stosowanej S.C. mb@bms.krakow.pl Abstrakt Szukanie nieoczywistych zwi¹zków w danych jest

Bardziej szczegółowo

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie Hurtownie danych i business intelligence - wykład II Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2005-2008 Zagadnienia do omówienia 1. 2. Przegląd architektury HD 3. Warsztaty

Bardziej szczegółowo

Data Mining Wykład 1. Wprowadzenie do Eksploracji Danych. Prowadzący. Dr inż. Jacek Lewandowski

Data Mining Wykład 1. Wprowadzenie do Eksploracji Danych. Prowadzący. Dr inż. Jacek Lewandowski Data Mining Wykład 1 Wprowadzenie do Eksploracji Danych Prowadzący Dr inż. Jacek Lewandowski Katedra Genetyki Wydział Biologii i Hodowli Zwierząt Uniwersytet Przyrodniczy we Wrocławiu ul. Kożuchowska 7,

Bardziej szczegółowo

Implementacja metod eksploracji danych - Oracle Data Mining

Implementacja metod eksploracji danych - Oracle Data Mining Implementacja metod eksploracji danych - Oracle Data Mining 395 Plan rozdziału 396 Wprowadzenie do eksploracji danych Architektura Oracle Data Mining Możliwości Oracle Data Mining Etapy procesu eksploracji

Bardziej szczegółowo

Ewelina Dziura Krzysztof Maryański

Ewelina Dziura Krzysztof Maryański Ewelina Dziura Krzysztof Maryański 1. Wstęp - eksploracja danych 2. Proces Eksploracji danych 3. Reguły asocjacyjne budowa, zastosowanie, pozyskiwanie 4. Algorytm Apriori i jego modyfikacje 5. Przykład

Bardziej szczegółowo

Wprowadzenie do technologii Business Intelligence i hurtowni danych

Wprowadzenie do technologii Business Intelligence i hurtowni danych Wprowadzenie do technologii Business Intelligence i hurtowni danych 1 Plan rozdziału 2 Wprowadzenie do Business Intelligence Hurtownie danych Produkty Oracle dla Business Intelligence Business Intelligence

Bardziej szczegółowo

Zalew danych skąd się biorą dane? są generowane przez banki, ubezpieczalnie, sieci handlowe, dane eksperymentalne, Web, tekst, e_handel

Zalew danych skąd się biorą dane? są generowane przez banki, ubezpieczalnie, sieci handlowe, dane eksperymentalne, Web, tekst, e_handel według przewidywań internetowego magazynu ZDNET News z 8 lutego 2001 roku eksploracja danych (ang. data mining ) będzie jednym z najbardziej rewolucyjnych osiągnięć następnej dekady. Rzeczywiście MIT Technology

Bardziej szczegółowo

Metody eksploracji danych. Reguły asocjacyjne

Metody eksploracji danych. Reguły asocjacyjne Metody eksploracji danych Reguły asocjacyjne Analiza podobieństw i koszyka sklepowego Analiza podobieństw jest badaniem atrybutów lub cech, które są powiązane ze sobą. Metody analizy podobieństw, znane

Bardziej szczegółowo

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE BAZY DANYCH HURTOWNIE DANYCH I BUSINESS INTELLIGENCE Akademia Górniczo-Hutnicza w Krakowie Adrian Horzyk horzyk@agh.edu.pl Google: Horzyk HURTOWNIE DANYCH Hurtownia danych (Data Warehouse) to najczęściej

Bardziej szczegółowo

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu i business intelligence Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl Wrocław 2005-2012 Plan na dziś : 1. Wprowadzenie do przedmiotu (co będzie omawiane oraz jak będę weryfikował zdobytą wiedzę

Bardziej szczegółowo

Integracja technik eksploracji danych ]V\VWHPHP]DU]G]DQLDED]GDQ\FK QDSU]\NáDG]LH2UDFOHi Data Mining

Integracja technik eksploracji danych ]V\VWHPHP]DU]G]DQLDED]GDQ\FK QDSU]\NáDG]LH2UDFOHi Data Mining Integracja technik eksploracji danych ]V\VWHPHP]DU]G]DQLDED]GDQ\FK QDSU]\NáDG]LH2UDFOHi Data Mining 0LNRáDM0RU]\ Marek Wojciechowski Instytut Informatyki PP Eksploracja danych 2GNU\ZDQLHZ]RUFyZZGX*\FK

Bardziej szczegółowo

Mikołaj Morzy, Marek Wojciechowski: "Integracja technik eksploracji danych z systemem zarządzania bazą danych na przykładzie Oracle9i Data Mining"

Mikołaj Morzy, Marek Wojciechowski: Integracja technik eksploracji danych z systemem zarządzania bazą danych na przykładzie Oracle9i Data Mining Mikołaj Morzy, Marek Wojciechowski: "Integracja technik eksploracji danych z systemem zarządzania bazą danych na przykładzie Oracle9i Data Mining" Streszczenie Eksploracja danych znajduje coraz szersze

Bardziej szczegółowo

Analiza danych i data mining.

Analiza danych i data mining. Analiza danych i data mining. mgr Katarzyna Racka Wykładowca WNEI PWSZ w Płocku Przedsiębiorczy student 2016 15 XI 2016 r. Cel warsztatu Przekazanie wiedzy na temat: analizy i zarządzania danymi (data

Bardziej szczegółowo

data mining machine learning data science

data mining machine learning data science data mining machine learning data science deep learning, AI, statistics, IoT, operations research, applied mathematics KISIM, WIMiIP, AGH 1 Machine Learning / Data mining / Data science Uczenie maszynowe

Bardziej szczegółowo

Bazy Danych. Bazy Danych i SQL Podstawowe informacje o bazach danych. Krzysztof Regulski WIMiIP, KISiM,

Bazy Danych. Bazy Danych i SQL Podstawowe informacje o bazach danych. Krzysztof Regulski WIMiIP, KISiM, Bazy Danych Bazy Danych i SQL Podstawowe informacje o bazach danych Krzysztof Regulski WIMiIP, KISiM, regulski@metal.agh.edu.pl Oczekiwania? 2 3 Bazy danych Jak przechowywać informacje? Jak opisać rzeczywistość?

Bardziej szczegółowo

bo od managera wymaga się perfekcji

bo od managera wymaga się perfekcji bo od managera wymaga się perfekcji MODELOWANIE PROCESÓW Charakterystyka modułu Modelowanie Procesów Biznesowych (BPM) Modelowanie procesów biznesowych stanowi fundament wdroŝenia systemu zarządzania jakością

Bardziej szczegółowo

Indeksy w bazach danych. Motywacje. Techniki indeksowania w eksploracji danych. Plan prezentacji. Dotychczasowe prace badawcze skupiały się na

Indeksy w bazach danych. Motywacje. Techniki indeksowania w eksploracji danych. Plan prezentacji. Dotychczasowe prace badawcze skupiały się na Techniki indeksowania w eksploracji danych Maciej Zakrzewicz Instytut Informatyki Politechnika Poznańska Plan prezentacji Zastosowania indeksów w systemach baz danych Wprowadzenie do metod eksploracji

Bardziej szczegółowo

Krzysztof Kawa. empolis arvato. e mail: krzysztof.kawa@empolis.com

Krzysztof Kawa. empolis arvato. e mail: krzysztof.kawa@empolis.com XI Konferencja PLOUG Kościelisko Październik 2005 Zastosowanie reguł asocjacyjnych, pakietu Oracle Data Mining for Java do analizy koszyka zakupów w aplikacjach e-commerce. Integracja ze środowiskiem Oracle

Bardziej szczegółowo

SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006

SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006 SAS wybrane elementy DATA MINING Część III Seweryn Kowalski 2006 Algorytmy eksploracji danych Algorytm eksploracji danych jest dobrze zdefiniowaną procedurą, która na wejściu otrzymuje dane, a na wyjściu

Bardziej szczegółowo

Wprowadzenie do technologii informacyjnej.

Wprowadzenie do technologii informacyjnej. Wprowadzenie do technologii informacyjnej. Data mining i jego biznesowe zastosowania dr Tomasz Jach Definicje Eksploracja danych polega na torturowaniu danych tak długo, aż zaczną zeznawać. Eksploracja

Bardziej szczegółowo

METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING. EKSPLORACJA DANYCH Ćwiczenia. Adrian Horzyk. Akademia Górniczo-Hutnicza

METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING. EKSPLORACJA DANYCH Ćwiczenia. Adrian Horzyk. Akademia Górniczo-Hutnicza METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING EKSPLORACJA DANYCH Ćwiczenia Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej

Bardziej szczegółowo

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów

Bardziej szczegółowo

PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE

PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE UNIWERSYTET WARMIŃSKO-MAZURSKI W OLSZTYNIE PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE http://matman.uwm.edu.pl/psi e-mail: psi@matman.uwm.edu.pl ul. Słoneczna 54 10-561

Bardziej szczegółowo

dr inż. Olga Siedlecka-Lamch 14 listopada 2011 roku Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Eksploracja danych

dr inż. Olga Siedlecka-Lamch 14 listopada 2011 roku Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Eksploracja danych - Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska 14 listopada 2011 roku 1 - - 2 3 4 5 - The purpose of computing is insight, not numbers Richard Hamming Motywacja - Mamy informację,

Bardziej szczegółowo

Eksploracja danych (data mining)

Eksploracja danych (data mining) Eksploracja (data mining) Tadeusz Pankowski www.put.poznan.pl/~pankowsk Czym jest eksploracja? Eksploracja oznacza wydobywanie wiedzy z dużych zbiorów. Eksploracja badanie, przeszukiwanie; np. dziewiczych

Bardziej szczegółowo

Widzenie komputerowe (computer vision)

Widzenie komputerowe (computer vision) Widzenie komputerowe (computer vision) dr inż. Marcin Wilczewski 2018/2019 Organizacja zajęć Tematyka wykładu Cele Python jako narzędzie uczenia maszynowego i widzenia komputerowego. Binaryzacja i segmentacja

Bardziej szczegółowo

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu Podstawy baz danych PODSTAWY BAZ DANYCH 19. Perspektywy baz danych 1 Perspektywy baz danych Temporalna baza danych Temporalna baza danych - baza danych posiadająca informację o czasie wprowadzenia lub czasie ważności zawartych

Bardziej szczegółowo

Hurtownie danych. Wstęp. Architektura hurtowni danych. http://zajecia.jakubw.pl/hur CO TO JEST HURTOWNIA DANYCH

Hurtownie danych. Wstęp. Architektura hurtowni danych. http://zajecia.jakubw.pl/hur CO TO JEST HURTOWNIA DANYCH Wstęp. Architektura hurtowni. Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/hur CO TO JEST HURTOWNIA DANYCH B. Inmon, 1996: Hurtownia to zbiór zintegrowanych, nieulotnych, ukierunkowanych

Bardziej szczegółowo

Technologia informacyjna

Technologia informacyjna Technologia informacyjna Pracownia nr 9 (studia stacjonarne) - 05.12.2008 - Rok akademicki 2008/2009 2/16 Bazy danych - Plan zajęć Podstawowe pojęcia: baza danych, system zarządzania bazą danych tabela,

Bardziej szczegółowo

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie Hurtownie danych i business intelligence - wykład II Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2005-2012 Zagadnienia do omówienia 1. Miejsce i rola w firmie 2. Przegląd architektury

Bardziej szczegółowo

Data mininig i wielowymiarowa analiza danych zgromadzonych w systemach medycznych na potrzeby badań naukowych

Data mininig i wielowymiarowa analiza danych zgromadzonych w systemach medycznych na potrzeby badań naukowych Temat: Data mininig i wielowymiarowa analiza danych zgromadzonych w systemach medycznych na potrzeby badań naukowych Autorzy: Tomasz Małyszko, Edyta Łukasik 1. Definicja eksploracji danych Eksploracja

Bardziej szczegółowo

Inżynieria biomedyczna

Inżynieria biomedyczna Inżynieria biomedyczna Projekt Przygotowanie i realizacja kierunku inżynieria biomedyczna studia międzywydziałowe współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego.

Bardziej szczegółowo

Klasyfikacja obiektów Drzewa decyzyjne (drzewa klasyfikacyjne)

Klasyfikacja obiektów Drzewa decyzyjne (drzewa klasyfikacyjne) Klasyfikacja obiektów Drzewa decyzyjne (drzewa klasyfikacyjne) Tadeusz Pankowski www.put.poznan.pl/~tadeusz.pankowski Klasyfikacja i predykcja. Odkrywaniem reguł klasyfikacji nazywamy proces znajdowania

Bardziej szczegółowo

DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE:

DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE: DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE: DATAMINING 1 S t r o n a WSTĘP Czyli jak zastąpić wróżenie z fusów i przysłowiowego nosa, statystyką i modelami ekonometrycznymi. Niniejszy dokument,

Bardziej szczegółowo

Metadane. Data Maining. - wykład VII. Paweł Skrobanek, C-3 pok. 323 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006

Metadane. Data Maining. - wykład VII. Paweł Skrobanek, C-3 pok. 323 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006 Metadane. Data Maining. - wykład VII Paweł Skrobanek, C-3 pok. 323 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006 Plan 1. Metadane 2. Jakość danych 3. Eksploracja danych (Data mining) 4. Sprawy róŝne

Bardziej szczegółowo

Analiza i eksploracja danych

Analiza i eksploracja danych Krzysztof Dembczyński Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska Inteligentne Systemy Wspomagania Decyzji Studia magisterskie, semestr I Semestr letni

Bardziej szczegółowo

OdświeŜanie hurtownie danych - wykład IV. Zagadnienia do omówienia. Wprowadzenie

OdświeŜanie hurtownie danych - wykład IV. Zagadnienia do omówienia. Wprowadzenie OdświeŜanie hurtownie danych - wykład IV Paweł Skrobanek, C-3 pok. 323 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006/2007 Zagadnienia do omówienia 1. Wprowadzenie 2. Klasyfikacja źródeł danych 3. Wymagania

Bardziej szczegółowo

Transformacja wiedzy w budowie i eksploatacji maszyn

Transformacja wiedzy w budowie i eksploatacji maszyn Uniwersytet Technologiczno Przyrodniczy im. Jana i Jędrzeja Śniadeckich w Bydgoszczy Wydział Mechaniczny Transformacja wiedzy w budowie i eksploatacji maszyn Bogdan ŻÓŁTOWSKI W pracy przedstawiono proces

Bardziej szczegółowo

Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18

Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18 Eksploracja Danych wykład 4 Sebastian Zając WMP.SNŚ UKSW 10 maja 2017 Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja 2017 1 / 18 Klasyfikacja danych Klasyfikacja Najczęściej stosowana (najstarsza)

Bardziej szczegółowo

Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów

Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów Eksploracja danych Piotr Lipiński Informacje ogólne Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów UWAGA: prezentacja to nie

Bardziej szczegółowo

Wykład I. Wprowadzenie do baz danych

Wykład I. Wprowadzenie do baz danych Wykład I Wprowadzenie do baz danych Trochę historii Pierwsze znane użycie terminu baza danych miało miejsce w listopadzie w 1963 roku. W latach sześcdziesątych XX wieku został opracowany przez Charles

Bardziej szczegółowo

Automatyczne decyzje kredytowe, siła szybkiego reagowania i optymalizacji kosztów. Roman Tyszkowski ING Bank Śląski S.A. roman.tyszkowski@ingbank.

Automatyczne decyzje kredytowe, siła szybkiego reagowania i optymalizacji kosztów. Roman Tyszkowski ING Bank Śląski S.A. roman.tyszkowski@ingbank. Automatyczne decyzje kredytowe, siła szybkiego reagowania i optymalizacji kosztów. Roman Tyszkowski ING Bank Śląski S.A. roman.tyszkowski@ingbank.pl Obsługa wniosków kredytowych Potrzeba elastyczności

Bardziej szczegółowo

DOBÓR ŚRODKÓW TRANSPORTOWYCH DLA GOSPODARSTWA PRZY POMOCY PROGRAMU AGREGAT - 2

DOBÓR ŚRODKÓW TRANSPORTOWYCH DLA GOSPODARSTWA PRZY POMOCY PROGRAMU AGREGAT - 2 InŜynieria Rolnicza 14/2005 Michał Cupiał, Maciej Kuboń Katedra InŜynierii Rolniczej i Informatyki Akademia Rolnicza im. Hugona Kołłątaja w Krakowie DOBÓR ŚRODKÓW TRANSPORTOWYCH DLA GOSPODARSTWA PRZY POMOCY

Bardziej szczegółowo

Bazy danych. wprowadzenie teoretyczne. Piotr Prekurat 1

Bazy danych. wprowadzenie teoretyczne. Piotr Prekurat 1 Bazy danych wprowadzenie teoretyczne Piotr Prekurat 1 Baza danych Jest to zbiór danych lub jakichkolwiek innych materiałów i elementów zgromadzonych według określonej systematyki lub metody. Zatem jest

Bardziej szczegółowo

SYLABUS. Dotyczy cyklu kształcenia Realizacja w roku akademickim 2016/2017. Wydział Matematyczno - Przyrodniczy

SYLABUS. Dotyczy cyklu kształcenia Realizacja w roku akademickim 2016/2017. Wydział Matematyczno - Przyrodniczy Załącznik nr 4 do Uchwały Senatu nr 430/01/2015 SYLABUS Dotyczy cyklu kształcenia 2014-2018 Realizacja w roku akademickim 2016/2017 1.1. PODSTAWOWE INFORMACJE O PRZEDMIOCIE/MODULE Nazwa przedmiotu/ modułu

Bardziej szczegółowo

Wprowadzenie do metodologii modelowania systemów informacyjnych. Strategia (1) Strategia (2) Etapy Ŝycia systemu informacyjnego

Wprowadzenie do metodologii modelowania systemów informacyjnych. Strategia (1) Strategia (2) Etapy Ŝycia systemu informacyjnego Etapy Ŝycia systemu informacyjnego Wprowadzenie do metodologii modelowania systemów informacyjnych 1. Strategia 2. Analiza 3. Projektowanie 4. Implementowanie, testowanie i dokumentowanie 5. WdroŜenie

Bardziej szczegółowo

JAK HURTOWNIA DANYCH MOśE WSPOMAGAĆ MENEDśERA W PRACY?

JAK HURTOWNIA DANYCH MOśE WSPOMAGAĆ MENEDśERA W PRACY? JAK HURTOWNIA DANYCH MOśE WSPOMAGAĆ MENEDśERA W PRACY? Małgorzata Nycz, Barbara Smok Wprowadzenie Podstawą funkcjonowania przedsiębiorstwa w dzisiejszych warunkach jest posiadanie zasobów informacyjnych.

Bardziej szczegółowo

KARTA PRZEDMIOTU. Hurtownie i eksploracja danych D1_5

KARTA PRZEDMIOTU. Hurtownie i eksploracja danych D1_5 KARTA PRZEDMIOTU 1. Informacje ogólne Nazwa przedmiotu i kod (wg planu studiów): Nazwa przedmiotu (j. ang.): Kierunek studiów: Specjalność/specjalizacja: Poziom kształcenia: Profil kształcenia: Forma studiów:

Bardziej szczegółowo

Mail: Pokój 214, II piętro

Mail: Pokój 214, II piętro Wykład 2 Mail: agnieszka.nowak@us.edu.pl Pokój 214, II piętro http://zsi.tech.us.edu.pl/~nowak Predykcja zdolność do wykorzystania wiedzy zgromadzonej w systemie do przewidywania wartości dla nowych danych,

Bardziej szczegółowo

Szczegółowy opis przedmiotu zamówienia

Szczegółowy opis przedmiotu zamówienia ZP/ITS/19/2013 SIWZ Załącznik nr 1.1 do Szczegółowy opis przedmiotu zamówienia Przedmiotem zamówienia jest: Przygotowanie zajęć dydaktycznych w postaci kursów e-learningowych przeznaczonych dla studentów

Bardziej szczegółowo

Hurtownie danych - opis przedmiotu

Hurtownie danych - opis przedmiotu Hurtownie danych - opis przedmiotu Informacje ogólne Nazwa przedmiotu Hurtownie danych Kod przedmiotu 11.3-WI-INFD-HD Wydział Kierunek Wydział Informatyki, Elektrotechniki i Automatyki Informatyka / Zintegrowane

Bardziej szczegółowo

ANALIZA HIERARCHICZNA PROBLEMU W SZACOWANIU RYZYKA PROJEKTU INFORMATYCZNEGO METODĄ PUNKTOWĄ. Joanna Bryndza

ANALIZA HIERARCHICZNA PROBLEMU W SZACOWANIU RYZYKA PROJEKTU INFORMATYCZNEGO METODĄ PUNKTOWĄ. Joanna Bryndza ANALIZA HIERARCHICZNA PROBLEMU W SZACOWANIU RYZYKA PROJEKTU INFORMATYCZNEGO METODĄ PUNKTOWĄ Joanna Bryndza Wprowadzenie Jednym z kluczowych problemów w szacowaniu poziomu ryzyka przedsięwzięcia informatycznego

Bardziej szczegółowo

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Wprowadzenie do Hurtowni Danych. Mariusz Rafało Wprowadzenie do Hurtowni Danych Mariusz Rafało mariusz.rafalo@hotmail.com WPROWADZENIE DO HURTOWNI DANYCH Co to jest hurtownia danych? Hurtownia danych jest zbiorem danych zorientowanych tematycznie, zintegrowanych,

Bardziej szczegółowo

KURS ACCESS 2003 Wiadomości wstępne

KURS ACCESS 2003 Wiadomości wstępne KURS ACCESS 2003 Wiadomości wstępne Biorąc c udział w kursie uczestnik zapozna się z tematyką baz danych i systemu zarządzania bazami danych jakim jest program Microsoft Access 2003. W trakcie kursu naleŝy

Bardziej szczegółowo

DrąŜenie danych i inne tematy

DrąŜenie danych i inne tematy DrąŜenie danych i inne tematy Materiały do wykładu Komputerowe Przetwarzanie Wiedzy (opracowane na podstawie materiałów dostępnych w sieci Internet) Tomasz Kubik DrąŜenie danych (data mining) n Proces

Bardziej szczegółowo

Budowa systemu wspomagającego podejmowanie decyzji. Metodyka projektowo wdrożeniowa

Budowa systemu wspomagającego podejmowanie decyzji. Metodyka projektowo wdrożeniowa Budowa systemu wspomagającego podejmowanie decyzji Metodyka projektowo wdrożeniowa Agenda Systemy wspomagające decyzje Business Intelligence (BI) Rodzaje systemów BI Korzyści z wdrożeń BI Zagrożenia dla

Bardziej szczegółowo

Scoring kredytowy w pigułce

Scoring kredytowy w pigułce Analiza danych Data mining Sterowanie jakością Analityka przez Internet Scoring kredytowy w pigułce Mariola Kapla Biuro Informacji Kredytowej S.A. StatSoft Polska Sp. z o.o. ul. Kraszewskiego 36 30-110

Bardziej szczegółowo

System Obsługi Wniosków

System Obsługi Wniosków System Obsługi Wniosków Wersja 2.0 1 System Obsługi Wniosków wersja 2.0 System Obsługi Wniosków to nowoczesne rozwiązanie wspierające proces obsługi wniosków o produkty bankowe. Pozwala na przyjmowanie,

Bardziej szczegółowo

METODY ODKRYWANIA WIEDZY W SYSTEMACH BUSINESS INTELLIGENCE

METODY ODKRYWANIA WIEDZY W SYSTEMACH BUSINESS INTELLIGENCE METODY ODKRYWANIA WIEDZY W SYSTEMACH BUSINESS INTELLIGENCE Streszczenie Wiesław Wolny Akademia Ekonomiczna Katowice wolny@ae.katowice.pl Business Intelligence nie jest pojedyńczym systemem ani produktem.

Bardziej szczegółowo

Procesy ETL. 10maja2009. Paweł Szołtysek

Procesy ETL. 10maja2009. Paweł Szołtysek Procesy 10maja2009 Paweł Szołtysek 1/12 w praktyce w praktyce 2/12 Zagadnienie Business Inteligence w praktyce 3/12 Czym jest proces? w praktyce Dane: dowolny zbiór danych ze źródeł zewnętrznych. Szukane:

Bardziej szczegółowo

InŜynieria Rolnicza 14/2005. Streszczenie

InŜynieria Rolnicza 14/2005. Streszczenie Michał Cupiał Katedra InŜynierii Rolniczej i Informatyki Akademia Rolnicza w Krakowie PROGRAM WSPOMAGAJĄCY NAWOśENIE MINERALNE NAWOZY 2 Streszczenie Przedstawiono program Nawozy 2 wspomagający nawoŝenie

Bardziej szczegółowo

Data Mining Wykład 3. Algorytmy odkrywania binarnych reguł asocjacyjnych. Plan wykładu

Data Mining Wykład 3. Algorytmy odkrywania binarnych reguł asocjacyjnych. Plan wykładu Data Mining Wykład 3 Algorytmy odkrywania binarnych reguł asocjacyjnych Plan wykładu Algorytm Apriori Funkcja apriori_gen(ck) Generacja zbiorów kandydujących Generacja reguł Efektywności działania Własności

Bardziej szczegółowo

Blaski i cienie wyzwalaczy w relacyjnych bazach danych. Mgr inż. Andrzej Ptasznik

Blaski i cienie wyzwalaczy w relacyjnych bazach danych. Mgr inż. Andrzej Ptasznik Blaski i cienie wyzwalaczy w relacyjnych bazach danych. Mgr inż. Andrzej Ptasznik Technologia Przykłady praktycznych zastosowań wyzwalaczy będą omawiane na bazie systemu MS SQL Server 2005 Wprowadzenie

Bardziej szczegółowo

Procesy aktywne. PoŜyczki Kredyty Pozostałe procesy aktywne

Procesy aktywne. PoŜyczki Kredyty Pozostałe procesy aktywne ZADANIA ĆWICZENIOWE - ADONIS Moduł 1: Struktura obszaru przedsiębiorstwa Pierwszym etapem jest analiza i strukturyzacja badanego obszaru przedsiębiorstwa. W tym celu stosowany jest typ modelu ADONISa mapa

Bardziej szczegółowo

Oprogramowanie dla biznesu Numer 11 (69) Listopad 2009 JAK SZYBKO I SKUTECZNIE ZAMKNĄĆ ROK?

Oprogramowanie dla biznesu Numer 11 (69) Listopad 2009 JAK SZYBKO I SKUTECZNIE ZAMKNĄĆ ROK? Oprogramowanie dla biznesu Numer 11 (69) Listopad 2009 JAK SZYBKO I SKUTECZNIE ZAMKNĄĆ ROK? CZY TO MOśLIWE, ABY PRZEZ PROCES ZAMKNIĘCIA ROKU W DUśEJ FIRMIE LEASINGOWEJ PRZEJŚĆ SZYBKO I BEZBOLEŚNIE? MY

Bardziej szczegółowo

OLAP i hurtownie danych c.d.

OLAP i hurtownie danych c.d. OLAP i hurtownie danych c.d. Przypomnienie OLAP -narzędzia analizy danych Hurtownie danych -duże bazy danych zorientowane tematycznie, nieulotne, zmienne w czasie, wspierjące procesy podejmowania decyzji

Bardziej szczegółowo

technologii informacyjnych kształtowanie , procesów informacyjnych kreowanie metod dostosowania odpowiednich do tego celu środków technicznych.

technologii informacyjnych kształtowanie , procesów informacyjnych kreowanie metod dostosowania odpowiednich do tego celu środków technicznych. Informatyka Coraz częściej informatykę utoŝsamia się z pojęciem technologii informacyjnych. Za naukową podstawę informatyki uwaŝa się teorię informacji i jej związki z naukami technicznymi, np. elektroniką,

Bardziej szczegółowo

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Piotr Dalka Przykładowe algorytmy decyzyjne Sztuczne sieci neuronowe Algorytm k najbliższych sąsiadów Kaskada klasyfikatorów AdaBoost Naiwny

Bardziej szczegółowo

Komunikator internetowy w C#

Komunikator internetowy w C# PAŃSTWOWA WYśSZA SZKOŁA ZAWODOWA W ELBLĄGU INSTYTUT INFORMATYKI STOSOWANEJ Sprawozdanie Komunikator internetowy w C# autor: Artur Domachowski Elbląg, 2009 r. Komunikacja przy uŝyciu poczty internetowej

Bardziej szczegółowo

1. Odkrywanie asocjacji

1. Odkrywanie asocjacji 1. 2. Odkrywanie asocjacji...1 Algorytmy...1 1. A priori...1 2. Algorytm FP-Growth...2 3. Wykorzystanie narzędzi Oracle Data Miner i Rapid Miner do odkrywania reguł asocjacyjnych...2 3.1. Odkrywanie reguł

Bardziej szczegółowo

Rola analityki danych w transformacji cyfrowej firmy

Rola analityki danych w transformacji cyfrowej firmy Rola analityki danych w transformacji cyfrowej firmy Piotr Czarnas Querona CEO Analityka biznesowa (ang. Business Intelligence) Proces przekształcania danych w informacje, a informacji w wiedzę, która

Bardziej szczegółowo

PROGNOZOWANIE CENY OGÓRKA SZKLARNIOWEGO ZA POMOCĄ SIECI NEURONOWYCH

PROGNOZOWANIE CENY OGÓRKA SZKLARNIOWEGO ZA POMOCĄ SIECI NEURONOWYCH InŜynieria Rolnicza 14/2005 Sławomir Francik Katedra InŜynierii Mechanicznej i Agrofizyki Akademia Rolnicza w Krakowie PROGNOZOWANIE CENY OGÓRKA SZKLARNIOWEGO ZA POMOCĄ SIECI NEURONOWYCH Streszczenie W

Bardziej szczegółowo

Hurtownie danych. Wprowadzenie do systemów typu Business Intelligence

Hurtownie danych. Wprowadzenie do systemów typu Business Intelligence Hurtownie danych Wprowadzenie do systemów typu Business Intelligence Krzysztof Goczyła Teresa Zawadzka Katedra Inżynierii Oprogramowania Wydział Elektroniki, Telekomunikacji i Informatyki Politechnika

Bardziej szczegółowo

Elementy modelowania matematycznego

Elementy modelowania matematycznego Elementy modelowania matematycznego Modelowanie algorytmów klasyfikujących. Podejście probabilistyczne. Naiwny klasyfikator bayesowski. Modelowanie danych metodą najbliższych sąsiadów. Jakub Wróblewski

Bardziej szczegółowo

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2016/2017

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2016/2017 dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2016/2017 KONTAKT Z PROWADZĄCYM dr inż. Paweł Morawski e-mail: pmorawski@spoleczna.pl www: http://pmorawski.spoleczna.pl

Bardziej szczegółowo

Bazy danych 1. Wykład 5 Metodologia projektowania baz danych. (projektowanie logiczne)

Bazy danych 1. Wykład 5 Metodologia projektowania baz danych. (projektowanie logiczne) Bazy danych 1 Wykład 5 Metodologia projektowania baz danych (projektowanie logiczne) Projektowanie logiczne przegląd krok po kroku 1. Usuń własności niekompatybilne z modelem relacyjnym 2. Wyznacz relacje

Bardziej szczegółowo

Szybkość instynktu i rozsądek rozumu$

Szybkość instynktu i rozsądek rozumu$ Szybkość instynktu i rozsądek rozumu$ zastosowania rozwiązań BigData$ Bartosz Dudziński" Architekt IT! Już nie tylko dokumenty Ilość Szybkość Różnorodność 12 terabajtów milionów Tweet-ów tworzonych codziennie

Bardziej szczegółowo

Systemy Wspomagania Decyzji

Systemy Wspomagania Decyzji Reguły Asocjacyjne Szkoła Główna Służby Pożarniczej Zakład Informatyki i Łączności March 18, 2014 1 Wprowadzenie 2 Definicja 3 Szukanie reguł asocjacyjnych 4 Przykłady użycia 5 Podsumowanie Problem Lista

Bardziej szczegółowo

Opracowanie narzędzi informatycznych dla przetwarzania danych stanowiących bazę wyjściową dla tworzenia map akustycznych

Opracowanie narzędzi informatycznych dla przetwarzania danych stanowiących bazę wyjściową dla tworzenia map akustycznych Opracowanie zasad tworzenia programów ochrony przed hałasem mieszkańców terenów przygranicznych związanych z funkcjonowaniem duŝych przejść granicznych Opracowanie metody szacowania liczebności populacji

Bardziej szczegółowo

BUSINESS INTELLIGENCE W ZARZĄDZANIU

BUSINESS INTELLIGENCE W ZARZĄDZANIU BUSINESS INTELLIGENCE W ZARZĄDZANIU Małgorzata Nycz, Barbara Smok Wprowadzenie śyjemy w czasach charakteryzujących się bardzo szybkimi przemianami spowodowanymi rozwojem technik informacyjno - komunikacyjnych,

Bardziej szczegółowo

Security Master Class

Security Master Class Security Master Class Platforma kompleksowej analizy zdarzeń Linux Polska SIEM Radosław Żak-Brodalko Senior Solutions Architect Linux Polska sp. z o.o. Podstawowe problemy Jak pokryć lukę między technicznym

Bardziej szczegółowo

Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl

Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl 1. Wstęp Aby skorzystać z możliwości RapidMinera w zakresie analizy tekstu, należy zainstalować Text Mining Extension. Wybierz: 1 Po

Bardziej szczegółowo

ALGORYTM RANDOM FOREST

ALGORYTM RANDOM FOREST SKRYPT PRZYGOTOWANY NA ZAJĘCIA INDUKOWANYCH REGUŁ DECYZYJNYCH PROWADZONYCH PRZEZ PANA PAWŁA WOJTKIEWICZA ALGORYTM RANDOM FOREST Katarzyna Graboś 56397 Aleksandra Mańko 56699 2015-01-26, Warszawa ALGORYTM

Bardziej szczegółowo

Systemy baz danych. mgr inż. Sylwia Glińska

Systemy baz danych. mgr inż. Sylwia Glińska Systemy baz danych Wykład 1 mgr inż. Sylwia Glińska Baza danych Baza danych to uporządkowany zbiór danych z określonej dziedziny tematycznej, zorganizowany w sposób ułatwiający do nich dostęp. System zarządzania

Bardziej szczegółowo

Proces odkrywania wiedzy z baz danych

Proces odkrywania wiedzy z baz danych Proces odkrywania wiedzy z baz danych Wydział Informatyki Politechnika Białostocka Marcin Czajkowski email: m.czajkowski@pb.edu.pl Świat pełen danych Świat pełen danych Możliwości analizowania i zrozumienia

Bardziej szczegółowo

ZAGADNIENIE WYBORU NARZĘDZIA DO DATA MINING. ANALIZA PORÓWNAWCZA WYBRANYCH PRODUKTÓW I TECHNIK

ZAGADNIENIE WYBORU NARZĘDZIA DO DATA MINING. ANALIZA PORÓWNAWCZA WYBRANYCH PRODUKTÓW I TECHNIK ZAGADNIENIE WYBORU NARZĘDZIA DO DATA MINING. ANALIZA PORÓWNAWCZA WYBRANYCH PRODUKTÓW I TECHNIK Streszczenie Paweł Pandzierski Akademia Ekonomiczna im. Oskara Langego we Wrocławiu paweell@op.pl Artykuł

Bardziej szczegółowo

Charakterystyka oprogramowania obiektowego

Charakterystyka oprogramowania obiektowego Charakterystyka oprogramowania obiektowego 1. Definicja systemu informatycznego 2. Model procesu wytwarzania oprogramowania - model cyklu Ŝycia oprogramowania 3. Wymagania 4. Problemy z podejściem nieobiektowym

Bardziej szczegółowo

Algorytmy i struktury danych

Algorytmy i struktury danych Algorytmy i struktury danych Proste algorytmy sortowania Witold Marańda maranda@dmcs.p.lodz.pl 1 Pojęcie sortowania Sortowaniem nazywa się proces ustawiania zbioru obiektów w określonym porządku Sortowanie

Bardziej szczegółowo

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA realizacja w roku akademickim 2016/17

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA realizacja w roku akademickim 2016/17 Załącznik nr 4 do Uchwały Senatu nr 430/01/2015 SYLABUS DOTYCZY CYKLU KSZTAŁCENIA 2013-2017 realizacja w roku akademickim 2016/17 1.1. PODSTAWOWE INFORMACJE O PRZEDMIOCIE/MODULE Nazwa przedmiotu/ modułu

Bardziej szczegółowo

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Usługi analityczne budowa kostki analitycznej Część pierwsza. Usługi analityczne budowa kostki analitycznej Część pierwsza. Wprowadzenie W wielu dziedzinach działalności człowieka analiza zebranych danych jest jednym z najważniejszych mechanizmów podejmowania decyzji.

Bardziej szczegółowo

Eksploracja danych - wykład VIII

Eksploracja danych - wykład VIII I Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska 2 grudnia 2016 1/31 1 2 2/31 (ang. affinity analysis) polega na badaniu atrybutów lub cech, które są ze sobą powiązane. Metody

Bardziej szczegółowo

Ćwiczenie 3 funkcje agregujące

Ćwiczenie 3 funkcje agregujące Ćwiczenie 3 funkcje agregujące Funkcje agregujące, klauzule GROUP BY, HAVING Ćwiczenie 3 funkcje agregujące Celem ćwiczenia jest zaprezentowanie zagadnień dotyczących stosowania w zapytaniach języka SQL

Bardziej szczegółowo

Laboratorium 4. Naiwny klasyfikator Bayesa.

Laboratorium 4. Naiwny klasyfikator Bayesa. Laboratorium 4 Naiwny klasyfikator Bayesa. 1. Uruchom narzędzie Oracle Data Miner i połącz się z serwerem bazy danych. 2. Z menu głównego wybierz Activity Build. Na ekranie powitalnym kliknij przycisk

Bardziej szczegółowo

Opracowanie systemu monitorowania zmian cen na rynku nieruchomości

Opracowanie systemu monitorowania zmian cen na rynku nieruchomości Opracowanie systemu monitorowania zmian cen na rynku nieruchomości Ogólne założenia planowanego projektu Firma planuje realizację projektu związanego z uruchomieniem usługi, która będzie polegała na monitorowaniu

Bardziej szczegółowo

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie Wykaz tabel Wykaz rysunków Przedmowa 1. Wprowadzenie 1.1. Wprowadzenie do eksploracji danych 1.2. Natura zbiorów danych 1.3. Rodzaje struktur: modele i wzorce 1.4. Zadania eksploracji danych 1.5. Komponenty

Bardziej szczegółowo

Dane wejściowe. Oracle Designer Generowanie bazy danych. Wynik. Przebieg procesu

Dane wejściowe. Oracle Designer Generowanie bazy danych. Wynik. Przebieg procesu Dane wejściowe Oracle Designer Generowanie bazy danych Diagramy związków encji, a w szczególności: definicje encji wraz z atrybutami definicje związków między encjami definicje dziedzin atrybutów encji

Bardziej szczegółowo

APIO. W7 SPECYFIKACJA (UŻYCIA) DOSTĘPU DO DANYCH I SPOSOBU ICH PRZETWARZANIA 1. METODA CRUD 2. LOGIKA FUNKCJI

APIO. W7 SPECYFIKACJA (UŻYCIA) DOSTĘPU DO DANYCH I SPOSOBU ICH PRZETWARZANIA 1. METODA CRUD 2. LOGIKA FUNKCJI APIO. W7 SPECYFIKACJA (UŻYCIA) DOSTĘPU DO DANYCH I SPOSOBU ICH PRZETWARZANIA 1. METODA CRUD 2. LOGIKA FUNKCJI dr inż. Grażyna Hołodnik-Janczura W8/K4 CO SIĘ MOŻE DZIAĆ PODCZAS WYKONYWANIA BIZNESOWEJ FUNKCJI

Bardziej szczegółowo