dr inż. Olga Siedlecka-Lamch 14 listopada 2011 roku Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Eksploracja danych

Podobne dokumenty
Zalew danych skąd się biorą dane? są generowane przez banki, ubezpieczalnie, sieci handlowe, dane eksperymentalne, Web, tekst, e_handel

Analiza danych i data mining.

Data mininig i wielowymiarowa analiza danych zgromadzonych w systemach medycznych na potrzeby badań naukowych

Ewelina Dziura Krzysztof Maryański

Opis efektów kształcenia dla modułu zajęć

Analiza i wizualizacja danych Data analysis and visualization

Eksploracja danych - wykład II

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

Proces odkrywania wiedzy z baz danych

Data Mining Wykład 1. Wprowadzenie do Eksploracji Danych. Prowadzący. Dr inż. Jacek Lewandowski

Hurtownie danych - opis przedmiotu

Sylabus modułu kształcenia na studiach wyższych. Nazwa Wydziału. Nazwa jednostki prowadzącej moduł Nazwa modułu kształcenia.

WYDZIAŁ MATEMATYKI KARTA PRZEDMIOTU

KARTA PRZEDMIOTU. 1. Informacje ogólne. 2. Ogólna charakterystyka przedmiotu. Metody drążenia danych D1.3

Indeksy w bazach danych. Motywacje. Techniki indeksowania w eksploracji danych. Plan prezentacji. Dotychczasowe prace badawcze skupiały się na

Monitorowanie sytuacji drogowej w oparciu o dane z sieci GSM. promotor: dr hab. inż. Andrzej Jaszkiewicz

Szczegółowy opis przedmiotu zamówienia

Eksploracja danych PROCES EKSPLORACJI DANYCH. Wojciech Waloszek. Teresa Zawadzka.

Eksploracja danych - wykład VIII

Transformacja wiedzy w budowie i eksploatacji maszyn

Opis efektów kształcenia dla modułu zajęć

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

STUDIA PODYPLOMOWE. Analiza i Eksploracja Danych Rynkowych i Marketingowych. Podstawa prawna

Algorytmy i bazy danych (wykład obowiązkowy dla wszystkich)

Wprowadzenie do technologii informacyjnej.

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"

STUDIA PODYPLOMOWE. Analiza i Eksploracja Danych Rynkowych i Marketingowych. Podstawa prawna

4.1. Wprowadzenie Podstawowe definicje Algorytm określania wartości parametrów w regresji logistycznej...74

Metody Ilościowe w Socjologii

w ekonomii, finansach i towaroznawstwie

Algorytmy klasyfikacji

Sylabus. Zaawansowana analiza danych eksperymentalnych Advanced analysis of experimental data

5 Moduył do wyboru II *[zobacz opis poniżej] 4 Projektowanie i konfiguracja sieci komputerowych Z

PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE

Prezentacja specjalności studiów II stopnia. Inteligentne Technologie Internetowe

Efekt kształcenia. Wiedza

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Projekt zarządzania jakością wykorzystujący STATISTICA Data Miner przynosi w voestalpine roczne oszczędności w wysokości EUR

Zasady organizacji projektów informatycznych

rodzaj zajęć semestr 1 semestr 2 semestr 3 Razem Lp. Nazwa modułu E/Z Razem W I

Analiza danych. TEMATYKA PRZEDMIOTU

zna metody matematyczne w zakresie niezbędnym do formalnego i ilościowego opisu, zrozumienia i modelowania problemów z różnych

0.2. Dlaczego ta książka jest potrzebna?

Odkrywanie wiedzy. Marcin Szeląg Zakład ISWD, Instytut Informatyki, Politechnika Poznańska


Eksploracja danych - wykład IV

METODY EKSPLORACJI DANYCH I ICH ZASTOSOWANIE

Eksploracja Danych. podstawy

Analiza internetowa czyli Internet jako hurtownia danych

5 Moduył do wyboru II *[zobacz opis poniżej] 4 Projektowanie i konfiguracja sieci komputerowych Z

Rok akademicki: 2017/2018 Kod: JIS AD-s Punkty ECTS: 5. Kierunek: Informatyka Stosowana Specjalność: Modelowanie i analiza danych

Oprogramowanie, usługi i infrastruktura ICT w małych i średnich firmach w Polsce Na podstawie badania 800 firm z sektora MŚP

StatSoft profesjonalny partner w zakresie analizy danych

Metadane. Data Maining. - wykład VII. Paweł Skrobanek, C-3 pok. 323 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006

Widzenie komputerowe (computer vision)

One Size Doesn t Fit All, czyli case study stworzenia BI dostosowanego do strategicznych, operacyjnych oraz analitycznych potrzeb

Opracowanie systemu monitorowania zmian cen na rynku nieruchomości

DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE:

Inteligentne Multimedialne Systemy Uczące

Efekt kształcenia. Ma uporządkowaną, podbudowaną teoretycznie wiedzę ogólną w zakresie algorytmów i ich złożoności obliczeniowej.

PRZEWODNIK PO PRZEDMIOCIE

Narzędzia Informatyki w biznesie

WSTĘP I TAKSONOMIA METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING. Adrian Horzyk. Akademia Górniczo-Hutnicza

PRZEWODNIK PO PRZEDMIOCIE

rodzaj zajęć semestr 1 semestr 2 semestr 3 Razem Lp. Nazwa modułu E/Z Razem W I

SZKOLENIA SAS. ONKO.SYS Kompleksowa infrastruktura inforamtyczna dla badań nad nowotworami CENTRUM ONKOLOGII INSTYTUT im. Marii Skłodowskiej Curie

Kodowanie produktów - cz. 1

Rok akademicki: 2030/2031 Kod: ZZP MK-n Punkty ECTS: 3. Poziom studiów: Studia II stopnia Forma i tryb studiów: Niestacjonarne

Zarządzanie łańcuchem dostaw

Systemy Wspomagania Decyzji

Od Expert Data Scientist do Citizen Data Scientist, czyli jak w praktyce korzystać z zaawansowanej analizy danych

WYKAZ KIERUNKOWYCH EFEKTÓW KSZTAŁCENIA KIERUNEK: MATEMATYKA, SPS WIEDZA

Koło Naukowe "Grupa.NET" Politechniki Częstochowskiej AIESEC Polska Komitet Lokalny Częstochowa.

Knowledge Management jak zdiagnozować czego właściwie potrzebuje nasza firma? Mariusz Sumiński

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

KARTA PRZEDMIOTU. Hurtownie i eksploracja danych D1_5

Wydział Informtyki i Nauki o Materiałach Kierunek Informatyka. kod kierunku (dodaj kod przedmiotu)

Spis treści. Wstęp... 9

Process Analytical Technology (PAT),

PRZEWODNIK PO PRZEDMIOCIE

DAJEMY SATYSFAKCJĘ Z ZARZĄDZANIA FIRMĄ PRODUKCYJNĄ

Inżynieria Oprogramowania w Praktyce

KARTA MODUŁU KSZTAŁCENIA

Semestr letni Ekonometria i prognozowanie Nie

KIERUNKOWE EFEKTY KSZTAŁCENIA

Eksploracja danych a serwisy internetowe Przemysław KAZIENKO

Agencja Interaktywna

<Nazwa firmy> <Nazwa projektu> Specyfikacja wymagań projektu. Wersja <1.0>

Wydział Informtyki i Nauki o Materiałach Kierunek Informatyka. kod kierunku (dodaj kod przedmiotu)

Efekty kształcenia dla kierunku studiów informatyka i agroinżynieria i ich odniesienie do efektów obszarowych

Platforma Cognos. Agata Tyma CMMS Department Marketing & Sales Specialist atyma@aiut.com.pl AIUT Sp. z o. o.

Business Intelligence jako narzędzie do walki z praniem brudnych pieniędzy

Plan. Zakres badań teorii optymalizacji. Teoria optymalizacji. Teoria optymalizacji a badania operacyjne. Badania operacyjne i teoria optymalizacji

Model procesu dydaktycznego

BOC dla KJUF Podsumowanie warsztatów listopada 2011

ThetaΘSolutions. Data Mining Statystyka Web Design Rozwiązania IT

Od papierowych procedur do automatycznych procesów biznesowych w urzędzie dobre praktyki Michał Prusaczyk

EFEKTY KSZTAŁCENIA DLA KIERUNKU STUDIÓW NAUCZANIE MATEMATYKI I INFORMATYKI

Transkrypt:

- Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska 14 listopada 2011 roku

1 - - 2 3 4 5

- The purpose of computing is insight, not numbers Richard Hamming

Motywacja - Mamy informację, a nie mamy... Posiadanie (z informacji) ma przynieść zysk... Posiadanie ma otworzyć nowe możliwości... Posiadanie ma uchronić przed błędami... Wiedza usprawni procesy produkcyjne, zarządzania, obsługi klientów, marketingu... Wiedza pozwoli zmniejszyć nadużycia...

Motywacja - Mamy informację, a nie mamy... Posiadanie (z informacji) ma przynieść zysk... Posiadanie ma otworzyć nowe możliwości... Posiadanie ma uchronić przed błędami... Wiedza usprawni procesy produkcyjne, zarządzania, obsługi klientów, marketingu... Wiedza pozwoli zmniejszyć nadużycia...

Motywacja - Mamy informację, a nie mamy... Posiadanie (z informacji) ma przynieść zysk... Posiadanie ma otworzyć nowe możliwości... Posiadanie ma uchronić przed błędami... Wiedza usprawni procesy produkcyjne, zarządzania, obsługi klientów, marketingu... Wiedza pozwoli zmniejszyć nadużycia...

Motywacja - Mamy informację, a nie mamy... Posiadanie (z informacji) ma przynieść zysk... Posiadanie ma otworzyć nowe możliwości... Posiadanie ma uchronić przed błędami... Wiedza usprawni procesy produkcyjne, zarządzania, obsługi klientów, marketingu... Wiedza pozwoli zmniejszyć nadużycia...

Motywacja - Mamy informację, a nie mamy... Posiadanie (z informacji) ma przynieść zysk... Posiadanie ma otworzyć nowe możliwości... Posiadanie ma uchronić przed błędami... Wiedza usprawni procesy produkcyjne, zarządzania, obsługi klientów, marketingu... Wiedza pozwoli zmniejszyć nadużycia...

Motywacja - Mamy informację, a nie mamy... Posiadanie (z informacji) ma przynieść zysk... Posiadanie ma otworzyć nowe możliwości... Posiadanie ma uchronić przed błędami... Wiedza usprawni procesy produkcyjne, zarządzania, obsługi klientów, marketingu... Wiedza pozwoli zmniejszyć nadużycia...

Sprzyjające warunki - gwałtowny rozrost zbiorów hurtownie zwiększony dostęp do - Internet zwiększenie udziału rynku w globalnej ekonomii gotowe komercyjne oprogramowanie do eksploracji wzrost mocy obliczeniowej i pojemności pamięci

Sprzyjające warunki - gwałtowny rozrost zbiorów hurtownie zwiększony dostęp do - Internet zwiększenie udziału rynku w globalnej ekonomii gotowe komercyjne oprogramowanie do eksploracji wzrost mocy obliczeniowej i pojemności pamięci

Sprzyjające warunki - gwałtowny rozrost zbiorów hurtownie zwiększony dostęp do - Internet zwiększenie udziału rynku w globalnej ekonomii gotowe komercyjne oprogramowanie do eksploracji wzrost mocy obliczeniowej i pojemności pamięci

Sprzyjające warunki - gwałtowny rozrost zbiorów hurtownie zwiększony dostęp do - Internet zwiększenie udziału rynku w globalnej ekonomii gotowe komercyjne oprogramowanie do eksploracji wzrost mocy obliczeniowej i pojemności pamięci

Sprzyjające warunki - gwałtowny rozrost zbiorów hurtownie zwiększony dostęp do - Internet zwiększenie udziału rynku w globalnej ekonomii gotowe komercyjne oprogramowanie do eksploracji wzrost mocy obliczeniowej i pojemności pamięci

Sprzyjające warunki - gwałtowny rozrost zbiorów hurtownie zwiększony dostęp do - Internet zwiększenie udziału rynku w globalnej ekonomii gotowe komercyjne oprogramowanie do eksploracji wzrost mocy obliczeniowej i pojemności pamięci

Definicja - - proces znaczącej, pożytecznej, dotychczas nieznanej i możliwie pełnej zawartej w dużych bazach, ujawniającej ukryte własności badanego przedmiotu. - jest międzydyscyplinarną dziedziną, łączącą techniki uczenia maszyn, rozpoznawania wzorców, statystyki, baz i wizualizacji w celu uzyskiwania informacji z dużych baz.

Na pograniczu dziedzin -

Czym eksploracja nie jest -... odizolowanym, gotowym do użycia przez dział analiz zbiorem narzędzi,... w pełni zautomatyzowanym procesem niewymagającym udziału człowieka

Czym eksploracja nie jest -... odizolowanym, gotowym do użycia przez dział analiz zbiorem narzędzi,... w pełni zautomatyzowanym procesem niewymagającym udziału człowieka

Dalsze mity - Automatyczne narzędzia - na poczekaniu i mechanicznie rozwiązujące zadane problemy. szybko się zwraca. Oprogramowanie do eksploracji jest intuicyjne. wyczyści niechlujną bazę.

Dalsze mity - Automatyczne narzędzia - na poczekaniu i mechanicznie rozwiązujące zadane problemy. szybko się zwraca. Oprogramowanie do eksploracji jest intuicyjne. wyczyści niechlujną bazę.

Dalsze mity - Automatyczne narzędzia - na poczekaniu i mechanicznie rozwiązujące zadane problemy. szybko się zwraca. Oprogramowanie do eksploracji jest intuicyjne. wyczyści niechlujną bazę.

Dalsze mity - Automatyczne narzędzia - na poczekaniu i mechanicznie rozwiązujące zadane problemy. szybko się zwraca. Oprogramowanie do eksploracji jest intuicyjne. wyczyści niechlujną bazę.

jako proces - Discovering Knowledge in Data presents data mining as a well-structured standard process, intimately connected with managers, decision makers, and those involved in deploying the results. Daniel T. Larose

W kontekście -

CRISP-DM - standaryzacja -

Zrozumienie uwarunkowań biznesowych/badawczych - Jasne sformułowanie celów i wymagań projektu w terminologii komórki biznesowej lub badawczej. Wykorzystanie tych celów i ograniczeń do opracowania definicji problemu eksploracji. Stworzenie wstępnego planu działań, zmierzającego do osiągnięcia tych celów.

Zrozumienie - Zebranie. Wstępnej analiza (zaznajomienie się z danymi i odkrycie pierwszych zależności). Ocena jakości. Opcjonalnie, wybranie podzbiorów, które mogą zawierać wzorce.

Przygotowanie - Przygotowanie z surowych zbioru, wykorzystywanego w następnych fazach. Wybór przypadków i zmiennych do analizy. Opcjonalnie, wykonanie przekształceń na zmiennych. Wyczyszczenie surowych dla narzędzi modelujących.

Modelowanie - Wybór i zastosowanie odpowiednich technik modelujących. Skalowanie parametrów modelu w celu optymalizacji wyników. Opcjonalnie, powrót do etapu przygotowania, dla sprostania specyficznym wymogom danej techniki eksploracji.

Ewaluacja - Ocena modelu lub kilku modeli, pod względem jakości i efektywności. Ustalenie, czy model spełnia założenia ustalone w pierwszym etapie. Ocena, czy są cele biznesowe lub badawcze, które nie zostały w należyty sposób uwzględnione. Podjęcie decyzji, co do wykorzystania wyników eksploracji.

Wdrożenie - Wykorzystanie stworzonych modeli: Stworzenie modelu zasadniczo nie stanowi zakończenia projektu. Przykład prostego wdrożenia: sporządzenie raportu. Przykła złożonego wdrożenia: implementacja równoległego procesu eksploracji w innym dziale. W biznesie klienci często realizują wdrożenie na podstawie modelu.

Zadania stawiane przed eksploracją - opis analiza szacowanie (estymacja) przewidywanie (predykcja) klasyfikacja grupowanie odkrywanie wzorców i reguł wyszukiwanie według zawartości

eksploracji - klasyfikacja regresja odkrywanie asocjacji klastrowanie grupowanie odkrywanie wzorców sekwencji odkrywanie charakterystyk dyskryminacja wykrywanie zmian i odchyleń

Nauka poprzez praktykę - Learn data mining by doing data mining. Daniel T. Larose

- W wykładzie wykorzystano materiały: D. T. Larose, Odkrywanie Wiedzy z Danych, Wydawnictwo Naukowe PWN, Warszawa 2006 D. Hand, H. Mannila, P. Smyth,, WNT, Warszawa 2005 www.icie.com.pl/zisi/modul_9(% 20).pdf