Metadane. Data Maining. - wykład VII. Paweł Skrobanek, C-3 pok. 323 oprac. Wrocław 2006

Wielkość: px
Rozpocząć pokaz od strony:

Download "Metadane. Data Maining. - wykład VII. Paweł Skrobanek, C-3 pok. 323 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006"

Transkrypt

1 Metadane. Data Maining. - wykład VII Paweł Skrobanek, C-3 pok. 323 oprac. Wrocław 2006

2 Plan 1. Metadane 2. Jakość danych 3. Eksploracja danych (Data mining) 4. Sprawy róŝne

3 1. Metadane Dane o danych mogą przechowywać informacje: jakie dane i w jakim miejscu się znajdują, słownik/słowniki danych, definicje przepływu danych (kierunek i częstotliwość przepływu danych), definicje dotyczące transformacji danych, informacje o modyfikacja oraz kolejne wersje metadanych (tzw. kroniki), inne (np. statystyki uŝycia danych, uprawnienia uŝytkowników)

4 1 Metadane Przykłady standardów: MSR (Microsoft Repository) przechowywanie danych (mechanizm relacyjny) oraz modelu danych (oparty na COM common object model; standaryzacja poprzez zastosowanie jednego języka (UML firmy Rational) MDIS (Metadata Interchange Specyfication) standard opracowany przez m.in. IBM, Sybase, Informix (przykład kolejny slajd ). Ciekawe informacje o metadanych (rozwiązaniach), np.:

5 1. Metadane

6 1. Metadane Źródło: M.Jarke, M.Lenzerini, Y.Vasiliou, P.Vasiliadis Hurtownie danych, WSiP, Warszawa 2003

7 1. Metadane Źródło: M.Jarke, M.Lenzerini, Y.Vasiliou, P.Vasiliadis Hurtownie danych, WSiP, Warszawa 2003

8 1. Metadane Źródło: M.Jarke, M.Lenzerini, Y.Vasiliou, P.Vasiliadis Hurtownie danych, WSiP, Warszawa 2003

9 2. Jakość danych Podstawowe wymiary: dokładność (accurancy) zgodność wartości przechowywanych z źródłowymi (rzeczywistymi), aktualność (timelines) dane odpowiadają rzeczywistości (nie zdezaktualizowały się), kompletność (completness) Ŝadna informacja nie została zagubiona,

10 2. Jakość danych Podstawowe wymiary cd.: spójność (consistency) jednolita reprezentacja danych, dyspozycyjność (availability) dane są dostępne wtedy, gdy ich potrzebujemy, inne, patrz: materiały ksero.

11 2. Jakość danych Czynniki jakości w problemach optymalizacji projektowania hurtowni danych patrz: materiały ksero.

12 2. Jakość danych Normy: ISO 9000 zarządzanie jakością i zapewnienie jakości (zawiera: pojęcia, definicje, wytyczne wyboru standardów/norm itp.) ISO 9001 model zapewnienia jakości w projektowaniu, pracach rozwojowych, produkcji, instalowaniu, serwisie (m.in. zawiera wymagania związane z planowaniem jakości, wzór kontraktu, parametry) inne: ISO ISO 9004, IEEE

13 3. Ekstrakcja danych Ekstrakcja danych (ang.( data mining) - to odkrywanie, wydobywanie wiedzy ze zgromadzonych danych Business Intelligence (BI) - słuŝy do ekstrapolacji przyszłości i estymacji stanu obecnego (źródło: pl.wikipedia.org/wiki/business_intelligence Business_intelligence); narzędzia BI słuŝą do wspomagania podejmowania decyzji w oparciu o analizę zgromadzonych danych

14 3. Ekstrakcja danych Podstawowe zakresy techniki eksploracji danych: metody statystyczne, sieci neuronowe, algorytmy genetyczny (metody ewolucyjne) logika rozmyta, metody uczenia maszynowego

15 3. Ekstrakcja danych - techniki REGUŁY ASOCJACYJNE: X => Y (wsparcie, ufność) gdzie: X i Y rozłączne zbiory elementów, Przykład: wsparcie występowanie X i Y razem [%], ufność prawdopodobieństwo P(Y X) {chleb, kiełbasa} => {musztarda} (5%,75%) 5% klientów miało chleb, kiełbasę i musztardę, 75% tych co mieli chleb i kiełbasę mieli teŝ musztardę

16 3. Ekstrakcja danych - techniki WZORCE SEKWENCJI -uporządkowane ciągi zbiorów elementów w którym kaŝdy zbiór ma określony znacznik czasowy (np. kolejno wypoŝyczane filmy przez klienta, zakupy ksiąŝek) - w bazie danych najczęściej wyszukujemy wzorce występujące z częstością większą niŝ zadana Przykład: { Ogniem i mieczem } =>{ Potop }=>{ Pan Wołodyjowski } (1,5%) { Powrót króla ksiąŝka } => { Powrót króla film DVD } (?)

17 3. Ekstrakcja danych - techniki INNE - analiza materiałów Internetowych modeling-agency.com/training/series.html pdf

18 4. Sprawy róŝne WDROśENIE i KONSERWACJA 1. SZKOLENIA 2. PROMOCJA HD 3. URUCHAMIANIE

19 4. Sprawy róŝne SZKOLENIA nikt nie lubi zmian mimo istnienia HD pracownicy mogą z niej nie korzystać, trudności z obsługą nie wszyscy są informatykami, nawet proste operacje (wyświetlanie raportów) mogą sprawiać kłopoty, nie wszystko jest przydatne modyfikacje HD implikują konieczność informowania pracowników dodatkowe szkolenia

20 4. Sprawy róŝne PROMOCJA HD wsparcie kierownictwa (np. zgłaszanie przez nich zapotrzebowania na dane z HD do pracowników, system motywacyjny), zamieszczanie informacji o HD na tablicy ogłoszeń, w gazetce), zachęcanie do wymiany informacji pomiędzy uŝytkownikami, i inne

21 4. Sprawy róŝne URUCHOMIENIE dobór właściwej strategii (najczęściej etapowe), testowanie i ocena jakości, walidacja, dokumentacja

22 END OF Dziękuję za uwagę

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu i business intelligence Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl Wrocław 2005-2007 Plan na dziś : 1. Wprowadzenie do przedmiotu (co będzie omawiane oraz jak będę weryfikował zdobytą wiedzę

Bardziej szczegółowo

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie Hurtownie danych i business intelligence - wykład II Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2005-2012 Zagadnienia do omówienia 1. Miejsce i rola w firmie 2. Przegląd architektury

Bardziej szczegółowo

Zarządzanie informacją w przedsiębiorstwach

Zarządzanie informacją w przedsiębiorstwach Zarządzanie informacją w przedsiębiorstwach Współczesne przedsiębiorstwa działając na coraz bardziej konkurencyjnych rynkach coraz większą wagę przykładają do zwiększenia atrakcyjności swojej oferty rynkowej

Bardziej szczegółowo

Hurtownie danych czyli jak zapewnić dostęp do wiedzy tkwiącej w danych

Hurtownie danych czyli jak zapewnić dostęp do wiedzy tkwiącej w danych Hurtownie danych czyli jak zapewnić dostęp do wiedzy tkwiącej w danych Rodzaj zajęć: Wszechnica Popołudniowa Tytuł: Hurtownie danych czyli jak zapewnić dostęp do wiedzy tkwiącej w danych Autor: mgr inż.

Bardziej szczegółowo

Implementacja wybranych algorytmów eksploracji danych na Oracle 10g

Implementacja wybranych algorytmów eksploracji danych na Oracle 10g Implementacja wybranych algorytmów eksploracji danych na Oracle 10g Sławomir Skowyra, Michał Rudowski Instytut Informatyki Wydziału Elektroniki i Technik Informacyjnych, Politechnika Warszawska S.Skowyra@stud.elka.pw.edu.pl,

Bardziej szczegółowo

Helena Dudycz Instytut Informatyki Ekonomicznej Akademia Ekonomiczna we Wrocławiu helena.dudycz@ae.wroc.pl

Helena Dudycz Instytut Informatyki Ekonomicznej Akademia Ekonomiczna we Wrocławiu helena.dudycz@ae.wroc.pl PRZETWARZANIE ANALITYCZNE PODSTAWĄ ROZWIĄZAŃ INFORMATYCZNYCH KLASY BUSINESS INTELLIGENCE Streszczenie Helena Dudycz Instytut Informatyki Ekonomicznej Akademia Ekonomiczna we Wrocławiu helena.dudycz@ae.wroc.pl

Bardziej szczegółowo

O systemach wspomagania decyzji, bazach danych i hurtowniach danych

O systemach wspomagania decyzji, bazach danych i hurtowniach danych O systemach wspomagania decyzji, bazach danych i hurtowniach danych Klasyfikacja decyzji Operacyjne i strategiczne - ze względu na ich wpływ na działalność organizacji. Definiowalne i trudno definiowalne

Bardziej szczegółowo

ZARZĄDZANIE WIEDZĄ Z WYKORZYSTANIEM NARZĘDZI ORACLE

ZARZĄDZANIE WIEDZĄ Z WYKORZYSTANIEM NARZĘDZI ORACLE Małgorzata Nycz, Barbar Smok Akademia Ekonomiczna we Wrocławiu ZARZĄDZANIE WIEDZĄ Z WYKORZYSTANIEM NARZĘDZI ORACLE 1. Wprowadzenie Rozwój technologii informatycznych wpływa m.in takŝe na elementy związane

Bardziej szczegółowo

Business Intelligence (BI)

Business Intelligence (BI) Business Intelligence (BI) Business Intelligence (BI) moŝna zdefiniować jako "szeroki wachlarz aplikacji i technologii słuŝących do zbierania, eksploracji, interpretacji i analizy danych po to, który prowadzi

Bardziej szczegółowo

Spis treści 1. Charakterystyka systemów wspomagających zarządzanie [Klonowski, rozdz. 2]

Spis treści 1. Charakterystyka systemów wspomagających zarządzanie [Klonowski, rozdz. 2] IV.Systemy informatyczne zarządzania 1 Spis treści 1. Charakterystyka systemów wspomagających zarządzanie [Klonowski, rozdz. 2] 2. Systemy zintegrowane [Klonowski, rozdz. 3, 4.1, 4.2] 3. Elektroniczna

Bardziej szczegółowo

KOMPUTEROWE WSPOMAGANIE ZARZĄDZANIA

KOMPUTEROWE WSPOMAGANIE ZARZĄDZANIA KOMPUTEROWE WSPOMAGANIE ZARZĄDZANIA Wykład 8 Narzędzia zarządzania informacją cz. 2 Dr inż. Mariusz Makuchowski Baza wiedzy Baza wiedzy (ang. Knowledgebase) stanowi swoisty rejestr problemów zgłaszanych

Bardziej szczegółowo

System informatyczny zdalnego egzaminowania

System informatyczny zdalnego egzaminowania System informatyczny zdalnego egzaminowania - strategia, logika systemu, architektura, ewaluacja (platforma informatyczna e-matura) redakcja Sławomir Wiak Konrad Szumigaj Redakcja: prof. dr hab. inż. Sławomir

Bardziej szczegółowo

BUDOWA PROCESÓW EKSTRAKCJI, TRANSFORMACJI I ŁADOWANIA DANYCH W SYSTEMACH BUSINESS INTELLIGENCE

BUDOWA PROCESÓW EKSTRAKCJI, TRANSFORMACJI I ŁADOWANIA DANYCH W SYSTEMACH BUSINESS INTELLIGENCE BUDOWA PROCESÓW EKSTRAKCJI, TRANSFORMACJI I ŁADOWANIA DANYCH W SYSTEMACH BUSINESS INTELLIGENCE Streszczenie Aleksander Billewicz Akademia Ekonomiczna w Katowicach Katedra Informatyki abillew@sulu.ae.katowice.pl

Bardziej szczegółowo

B2B, B2C, CMS, ERP, MRP, CRM,

B2B, B2C, CMS, ERP, MRP, CRM, B2B, B2C, CMS, ERP, MRP, CRM, Globalizacja rynku Globalizacja rynku nabiera niespotykanego dotąd rozmachu. Przy wyborze partnera czynnik geograficzny ma już znikome znaczenie. Produkty i usługi są dostępne

Bardziej szczegółowo

OWB, ODI, BI jako komponenty systemu sprawozdawczego w Organizacji

OWB, ODI, BI jako komponenty systemu sprawozdawczego w Organizacji XIV Konferencja PLOUG Szczyrk Październik 2008 OWB, ODI, BI jako komponenty systemu sprawozdawczego w Organizacji Paweł Chomicz Royal Software Sp. z o.o. pawel.chomicz@royalsoftware.pl; pch64@o2.pl Abstrakt.

Bardziej szczegółowo

INŻYNIERIA OPROGRAMOWANIA W PROCESACH INTEGRACJI SYSTEMÓW INFORMATYCZNYCH Pod redakcją J. Górskiego, C. Orłowskiego, 2010 STRESZCZENIA

INŻYNIERIA OPROGRAMOWANIA W PROCESACH INTEGRACJI SYSTEMÓW INFORMATYCZNYCH Pod redakcją J. Górskiego, C. Orłowskiego, 2010 STRESZCZENIA INŻYNIERIA OPROGRAMOWANIA W PROCESACH INTEGRACJI SYSTEMÓW INFORMATYCZNYCH Pod redakcją J. Górskiego, C. Orłowskiego, 2010 PWNT Gdańsk STRESZCZENIA Rozdział 1. Narzędzia wspomagające generowanie aplikacji

Bardziej szczegółowo

Opis, zakres i warunki realizacji przedmiotu zamówienia

Opis, zakres i warunki realizacji przedmiotu zamówienia Spis treści: Opis, zakres i warunki realizacji przedmiotu zamówienia Załącznik nr 1 do SIWZ znak sprawy: 45/DI/PN/2011 Słownik pojęć... 3 Rozdział 1. Wstęp... 5 Rozdział 2. Sytuacja aktualna... 6 2.1.

Bardziej szczegółowo

ANALIZA DANYCH NIE TYLKO DLA SPECJALISTÓW CO OFERUJE STATSOFT POLSKA?

ANALIZA DANYCH NIE TYLKO DLA SPECJALISTÓW CO OFERUJE STATSOFT POLSKA? ANALIZA DANYCH NIE TYLKO DLA SPECJALISTÓW CO OFERUJE STATSOFT POLSKA? Piotr Ocalewicz, StatSoft Polska Sp. z o.o. Wstęp StatSoft Polska jest polskim biurem StatSoft Inc. - jednego z największych na świecie

Bardziej szczegółowo

STATISTICA W ADMINISTRACJI PUBLICZNEJ

STATISTICA W ADMINISTRACJI PUBLICZNEJ STATISTICA W ADMINISTRACJI PUBLICZNEJ Piotr Wójtowicz, StatSoft Polska Sp. z o.o. Administracja publiczna to jeden z obszarów, gdzie odpowiednio zastosowane metody analizy danych mogą przynieść znaczne

Bardziej szczegółowo

Zarządzanie Procesami a Architektura Zorientowana na Usługi (BPM vs. SOA)

Zarządzanie Procesami a Architektura Zorientowana na Usługi (BPM vs. SOA) Zarządzanie procesami dr Mariusz Maciejczak Zarządzanie Procesami a Architektura Zorientowana na Usługi (BPM vs. SOA) www.maciejczak.pl Opracowano na podstawie Prezentacja: Zarządzanie wiedzą w systemach

Bardziej szczegółowo

Zalew danych skąd się biorą dane? są generowane przez banki, ubezpieczalnie, sieci handlowe, dane eksperymentalne, Web, tekst, e_handel

Zalew danych skąd się biorą dane? są generowane przez banki, ubezpieczalnie, sieci handlowe, dane eksperymentalne, Web, tekst, e_handel według przewidywań internetowego magazynu ZDNET News z 8 lutego 2001 roku eksploracja danych (ang. data mining ) będzie jednym z najbardziej rewolucyjnych osiągnięć następnej dekady. Rzeczywiście MIT Technology

Bardziej szczegółowo

Eksploracja danych Jacek Rumiński

Eksploracja danych Jacek Rumiński Eksploracja danych Jacek Rumiński slajd 1 Kontakt: Katedra Inżynierii Biomedycznej, pk. 106, tel.: 3472678, fax: 3461757, e-mail: jwr@eti.pg.gda.pl Źródła, Internet, SQL/MM i inne standardy (dodatkowy

Bardziej szczegółowo

ZAKŁAD INNOWACJI I TECHNOLOGII INFORMACYJNYCH NARZĘDZIA ANALITYKI BIZNESOWEJ W ZASTOSOWANIA MILITARNYCH

ZAKŁAD INNOWACJI I TECHNOLOGII INFORMACYJNYCH NARZĘDZIA ANALITYKI BIZNESOWEJ W ZASTOSOWANIA MILITARNYCH Zeszyty Naukowe NARZĘDZIA AON nr 2(59) ANALITYKI 2005 BIZNESOWEJ W ZASTOSOWANIACH Zeszyty MILITARNYCH Naukowe AON nr 2(91) 2013 ISSN 0867 2245 ISSN 0867 2245 ZAKŁAD INNOWACJI I TECHNOLOGII INFORMACYJNYCH

Bardziej szczegółowo

Informatyzacja przedsiębiorstw

Informatyzacja przedsiębiorstw Informatyzacja przedsiębiorstw Izabela Szczęch Politechnika Poznańska Plan wykładu Elementy Business Intelligence Przetwarzanie OLTP vs OLAP Hurtownie danych podstawowe pojęcia Proces ETL 2 Cele informatyzacji

Bardziej szczegółowo

Tematy prac dyplomowych w roku akademickim 2012/2013 zgłoszone w Zakładzie Systemów Rozproszonych

Tematy prac dyplomowych w roku akademickim 2012/2013 zgłoszone w Zakładzie Systemów Rozproszonych Tematy prac dyplomowych w roku akademickim 2012/2013 zgłoszone w Zakładzie Systemów Rozproszonych L.p. Opiekun pracy Temat Symbol kierunku i specjalności 1. GIS w administracji publicznej 2. GIS w bankowości

Bardziej szczegółowo

Zarządzanie zasobami informacyjnymi w firmie

Zarządzanie zasobami informacyjnymi w firmie BIULETYN WAT VOL. LVII, NR 4, 2008 Zarządzanie zasobami informacyjnymi w firmie PIOTR ZASKÓRSKI Wojskowa Akademia Techniczna, Wydział Cybernetyki, Instytut Organizacji i Zarządzania, 00-908 Warszawa, ul.

Bardziej szczegółowo

Systemy wspomagające zarządzanie

Systemy wspomagające zarządzanie Systemy wspomagające zarządzanie Agenda Praktyczne zastosowanie komputerowych systemów wspomagania decyzji Decyzje menedżerskie na tle struktury organizacji. Podstawowe typy systemów informacyjnych w organizacji

Bardziej szczegółowo

NARZĘDZIA I PROCESY ETL W HURTOWNIACH DANYCH

NARZĘDZIA I PROCESY ETL W HURTOWNIACH DANYCH NARZĘDZIA I PROCESY ETL W HURTOWNIACH DANYCH 1. Narzędzia ETL Narzędzia ETL (ang. extraction-transformation-load, ETL) automatyzują lub ułatwiają następujące rodzaje zadań: ekstrakcja (dostęp do różnorodnych

Bardziej szczegółowo

Rozdział 5. WNIOSKOWANIE STATYSTYCZNE. ESTYMACJA I WERYFIKACJA HIPOTEZ... 97 5.1. Test Z dla wartości oczekiwanej przy znanym odchyleniu

Rozdział 5. WNIOSKOWANIE STATYSTYCZNE. ESTYMACJA I WERYFIKACJA HIPOTEZ... 97 5.1. Test Z dla wartości oczekiwanej przy znanym odchyleniu Spis treści Rozdział 1. WPROWADZENIE. CEL I ZAKRES PRACY...7 Rozdział 2. PODSTAWOWE INFORMACJE O SYSTEMIE SAS...11 2.1. Informacje ogólne...11 2.2. Moduły statystyczne, wybrane produkty SAS...14 2.3. Środowisko

Bardziej szczegółowo

MODELE E-PLANOWANIA W SYSTEMACH DZIAŁANIA

MODELE E-PLANOWANIA W SYSTEMACH DZIAŁANIA ZESZYTY NAUKOWE 61-60 Piotr ZASKÓRSK 1 MODELE E-PLANOWANIA W SYSTEMACH DZIAŁANIA Streszczenie W referacie podjęto próbę identyfikacji procesu wspomagania planowania jako elementu systemu wspomagania podejmowania

Bardziej szczegółowo