Metadane. Data Maining. - wykład VII. Paweł Skrobanek, C-3 pok. 323 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006



Podobne dokumenty
Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Hurtownie danych - przegląd technologii

OdświeŜanie hurtownie danych - wykład IV. Zagadnienia do omówienia. Wprowadzenie

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"

ETL - wykład III. Zagadnienia do omówienia. Identyfikacja wymagań

Hurtownie danych. Metadane i czynniki jakości. BAZA METADANYCH. Centralna hurtownia danych. Metadane

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Szczegółowy opis przedmiotu zamówienia

Analiza danych i data mining.

Co to jest Business Intelligence?

Business Intelligence jako narzędzie do walki z praniem brudnych pieniędzy

Opis przedmiotu zamówienia

Data Mining Wykład 1. Wprowadzenie do Eksploracji Danych. Prowadzący. Dr inż. Jacek Lewandowski

INTERNETOWE BAZY DANYCH materiały pomocnicze - wykład X

Pojęcie bazy danych. Funkcje i możliwości.

Marcin Adamczak Jakub Gruszka MSP. Business Intelligence

Zalew danych skąd się biorą dane? są generowane przez banki, ubezpieczalnie, sieci handlowe, dane eksperymentalne, Web, tekst, e_handel


Procesy ETL - wykład V. Struktura. Wprowadzenie. 1. Wprowadzenie. 2. Ekstrakcja 3. Transformacja 4. Ładowanie 5. Studium przypadków.

Pierwsze wdrożenie SAP BW w firmie

Wykład I. Wprowadzenie do baz danych

Hurtownie danych. 31 stycznia 2017

Wprowadzenie do technologii Business Intelligence i hurtowni danych

Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl

Hurtownie danych - przegląd technologii

Systemy Business Intelligence w praktyce. Maciej Kiewra

Modele danych - wykład V. Zagadnienia. 1. Wprowadzenie 2. MOLAP modele danych 3. ROLAP modele danych 4. Podsumowanie 5. Zadanie fajne WPROWADZENIE

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

data mining machine learning data science

Modele danych - wykład V

Metody i techniki sztucznej inteligencji / Leszek Rutkowski. wyd. 2, 3 dodr. Warszawa, Spis treści

Przepływy danych. Oracle Designer: Modelowanie przepływów danych. Diagramy przepływów danych (1) Diagramy przepływów danych (2)

Sylabus modułu kształcenia na studiach wyższych. Nazwa Wydziału. Nazwa jednostki prowadzącej moduł Nazwa modułu kształcenia.

dr inż. Olga Siedlecka-Lamch 14 listopada 2011 roku Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Eksploracja danych

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2018/2019

Zakres wykładu. Podstawy InŜynierii Oprogramowania

KOMPUTEROWE WSPOMAGANIE ZARZĄDZANIA

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2016/2017

Analiza danych. TEMATYKA PRZEDMIOTU

Bazy danych. Zenon Gniazdowski WWSI, ITE Andrzej Ptasznik WWSI

Transformacja wiedzy w budowie i eksploatacji maszyn

Hurtownia danych praktyczne zastosowania

KARTA PRZEDMIOTU. 1. Informacje ogólne. 2. Ogólna charakterystyka przedmiotu. Metody drążenia danych D1.3

KARTA PRZEDMIOTU. Hurtownie i eksploracja danych D1_5

Hurtownie danych - opis przedmiotu

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2012/2013

PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE

Dopasowanie IT/biznes

Business Intelligence

Kodowanie transformacyjne. Plan 1. Zasada 2. Rodzaje transformacji 3. Standard JPEG

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Algorytmy wspomagania decyzji Czyli co i jak andrzej.rusiecki.staff.iiar.pwr.wroc.pl s. 230/C-3

Budowa systemu wspomagającego podejmowanie decyzji. Metodyka projektowo wdrożeniowa

Wprowadzenie do Hurtowni Danych

Sieci neuronowe i algorytmy uczenia Czyli co i jak andrzej.rusiecki.staff.iiar.pwr.wroc.pl s.

Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2013/2014

Hurtownie danych - przegląd technologii

Szkolenie autoryzowane. MS Wdrażanie hurtowni danych w Microsoft SQL Server 2012

w ekonomii, finansach i towaroznawstwie

POD O EJŚ J CIE I P ROC O ESOW

Bazy danych i ich aplikacje

Bazy danych i usługi sieciowe

Hurtownie danych. Analiza zachowań użytkownika w Internecie. Ewa Kowalczuk, Piotr Śniegowski. Informatyka Wydział Informatyki Politechnika Poznańska

Portale raportowe, a narzędzia raportowe typu self- service

Instalacja SQL Server Konfiguracja SQL Server Logowanie - opcje SQL Server Management Studio. Microsoft Access Oracle Sybase DB2 MySQL

Integracja technik eksploracji danych ]V\VWHPHP]DU]G]DQLDED]GDQ\FK QDSU]\NáDG]LH2UDFOHi Data Mining

GML w praktyce geodezyjnej

Analiza internetowa czyli Internet jako hurtownia danych

4.1. Wprowadzenie Podstawowe definicje Algorytm określania wartości parametrów w regresji logistycznej...74

Testy poziom po poziomie

Od e-materiałów do e-tutorów

Tworzenie przypadków testowych

Tematy prac dyplomowych w roku akademickim 2012/2013 zgłoszone w Zakładzie Systemów Rozproszonych

Zespół Szkół Ponadgimnazjalnych nr 1 im. ks. Stanisława Konarskiego w Jędrzejowie

Dopasowanie IT/biznes

Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2)

Systemy baz danych i hurtowni danych

Algorytm grupowania danych typu kwantyzacji wektorów

Baza danych to zbiór wzajemnie powiązanych ze sobą i zintegrowanych danych z pewnej dziedziny.

Nowoczesne aplikacje mobilne i ich rola w podnoszeniu jakości danych

Część I Istota analizy biznesowej a Analysis Services

Nazwa stanowiska: Inżynier Projektowy Kategorie: Inżynieria/Automatyka/Energetyka konwencjonalna i odnawialna Energetyka/Konwencjonalna

Eksploracja logów procesów. Process mining

IMPLEMENTATION OF WDROŻENIE COMARCHW MINISTERSTWIE FINANSÓW SINDBAD RAPORTY ANALIZY BADANIA PROGNOZY CASE STUDY 1

Spis tre±ci. Przedmowa... Cz ± I

METODY INŻYNIERII WIEDZY ASOCJACYJNA REPREZENTACJA POWIĄZANYCH TABEL I WNIOSKOWANIE IGOR CZAJKOWSKI

SPIS TREŚCI WSTĘP... 10

Technologia informacyjna

Zasady organizacji projektów informatycznych

Wprowadzenie do teorii systemów ekspertowych

kierunkowy (podstawowy / kierunkowy / inny HES) nieobowiązkowy (obowiązkowy / nieobowiązkowy) polski drugi semestr letni (semestr zimowy / letni)

Implementacja wybranych algorytmów eksploracji danych na Oracle 10g

Bazy danych 2. Wykład 1

Transkrypt:

Metadane. Data Maining. - wykład VII Paweł Skrobanek, C-3 pok. 323 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006

Plan 1. Metadane 2. Jakość danych 3. Eksploracja danych (Data mining) 4. Sprawy róŝne

1. Metadane Dane o danych mogą przechowywać informacje: jakie dane i w jakim miejscu się znajdują, słownik/słowniki danych, definicje przepływu danych (kierunek i częstotliwość przepływu danych), definicje dotyczące transformacji danych, informacje o modyfikacja oraz kolejne wersje metadanych (tzw. kroniki), inne (np. statystyki uŝycia danych, uprawnienia uŝytkowników)

1 Metadane Przykłady standardów: MSR (Microsoft Repository) przechowywanie danych (mechanizm relacyjny) oraz modelu danych (oparty na COM common object model; standaryzacja poprzez zastosowanie jednego języka (UML firmy Rational) MDIS (Metadata Interchange Specyfication) standard opracowany przez m.in. IBM, Sybase, Informix (przykład kolejny slajd ). Ciekawe informacje o metadanych (rozwiązaniach), np.: http://www.metadata.org

1. Metadane

1. Metadane Źródło: M.Jarke, M.Lenzerini, Y.Vasiliou, P.Vasiliadis Hurtownie danych, WSiP, Warszawa 2003

1. Metadane Źródło: M.Jarke, M.Lenzerini, Y.Vasiliou, P.Vasiliadis Hurtownie danych, WSiP, Warszawa 2003

1. Metadane Źródło: M.Jarke, M.Lenzerini, Y.Vasiliou, P.Vasiliadis Hurtownie danych, WSiP, Warszawa 2003

2. Jakość danych Podstawowe wymiary: dokładność (accurancy) zgodność wartości przechowywanych z źródłowymi (rzeczywistymi), aktualność (timelines) dane odpowiadają rzeczywistości (nie zdezaktualizowały się), kompletność (completness) Ŝadna informacja nie została zagubiona,

2. Jakość danych Podstawowe wymiary cd.: spójność (consistency) jednolita reprezentacja danych, dyspozycyjność (availability) dane są dostępne wtedy, gdy ich potrzebujemy, inne, patrz: materiały ksero.

2. Jakość danych Czynniki jakości w problemach optymalizacji projektowania hurtowni danych patrz: materiały ksero.

2. Jakość danych Normy: ISO 9000 zarządzanie jakością i zapewnienie jakości (zawiera: pojęcia, definicje, wytyczne wyboru standardów/norm itp.) ISO 9001 model zapewnienia jakości w projektowaniu, pracach rozwojowych, produkcji, instalowaniu, serwisie (m.in. zawiera wymagania związane z planowaniem jakości, wzór kontraktu, parametry) inne: ISO 9002 - ISO 9004, IEEE 730-1989

3. Ekstrakcja danych Ekstrakcja danych (ang.( data mining) - to odkrywanie, wydobywanie wiedzy ze zgromadzonych danych Business Intelligence (BI) - słuŝy do ekstrapolacji przyszłości i estymacji stanu obecnego (źródło: http://pl.wikipedia.org pl.wikipedia.org/wiki/business_intelligence Business_intelligence); narzędzia BI słuŝą do wspomagania podejmowania decyzji w oparciu o analizę zgromadzonych danych

3. Ekstrakcja danych Podstawowe zakresy techniki eksploracji danych: metody statystyczne, sieci neuronowe, algorytmy genetyczny (metody ewolucyjne) logika rozmyta, metody uczenia maszynowego

3. Ekstrakcja danych - techniki REGUŁY ASOCJACYJNE: X => Y (wsparcie, ufność) gdzie: X i Y rozłączne zbiory elementów, Przykład: wsparcie występowanie X i Y razem [%], ufność prawdopodobieństwo P(Y X) {chleb, kiełbasa} => {musztarda} (5%,75%) 5% klientów miało chleb, kiełbasę i musztardę, 75% tych co mieli chleb i kiełbasę mieli teŝ musztardę

3. Ekstrakcja danych - techniki WZORCE SEKWENCJI -uporządkowane ciągi zbiorów elementów w którym kaŝdy zbiór ma określony znacznik czasowy (np. kolejno wypoŝyczane filmy przez klienta, zakupy ksiąŝek) - w bazie danych najczęściej wyszukujemy wzorce występujące z częstością większą niŝ zadana Przykład: { Ogniem i mieczem } =>{ Potop }=>{ Pan Wołodyjowski } (1,5%) { Powrót króla ksiąŝka } => { Powrót króla film DVD } (?)

3. Ekstrakcja danych - techniki INNE - analiza materiałów Internetowych http://www.the-modeling modeling-agency.com/training/series.html http://www.mini.pw.edu.pl/~mandziuk/23-11 11-05.pdf http://www.cs.put.poznan.pl/mmorzy/papers/ploug05.pdf

4. Sprawy róŝne WDROśENIE i KONSERWACJA 1. SZKOLENIA 2. PROMOCJA HD 3. URUCHAMIANIE

4. Sprawy róŝne SZKOLENIA nikt nie lubi zmian mimo istnienia HD pracownicy mogą z niej nie korzystać, trudności z obsługą nie wszyscy są informatykami, nawet proste operacje (wyświetlanie raportów) mogą sprawiać kłopoty, nie wszystko jest przydatne modyfikacje HD implikują konieczność informowania pracowników dodatkowe szkolenia

4. Sprawy róŝne PROMOCJA HD wsparcie kierownictwa (np. zgłaszanie przez nich zapotrzebowania na dane z HD do pracowników, system motywacyjny), zamieszczanie informacji o HD na tablicy ogłoszeń, w gazetce), zachęcanie do wymiany informacji pomiędzy uŝytkownikami, i inne

4. Sprawy róŝne URUCHOMIENIE dobór właściwej strategii (najczęściej etapowe), testowanie i ocena jakości, walidacja, dokumentacja

END OF Dziękuję za uwagę