Analiza danych i data mining.

Podobne dokumenty
METODY EKSPLORACJI DANYCH I ICH ZASTOSOWANIE

STUDIA PODYPLOMOWE. Analiza i Eksploracja Danych Rynkowych i Marketingowych. Podstawa prawna

dr inż. Olga Siedlecka-Lamch 14 listopada 2011 roku Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Eksploracja danych

STUDIA PODYPLOMOWE. Analiza i Eksploracja Danych Rynkowych i Marketingowych. Podstawa prawna

Zalew danych skąd się biorą dane? są generowane przez banki, ubezpieczalnie, sieci handlowe, dane eksperymentalne, Web, tekst, e_handel

Data Mining Wykład 1. Wprowadzenie do Eksploracji Danych. Prowadzący. Dr inż. Jacek Lewandowski

Wykład 1. Statystyka międzynarodowa - wprowadzenie Rynek pracy w Unii Europejskiej

StatSoft profesjonalny partner w zakresie analizy danych

Wprowadzenie do technologii informacyjnej.

Rok akademicki: 2030/2031 Kod: ZZP MK-n Punkty ECTS: 3. Poziom studiów: Studia II stopnia Forma i tryb studiów: Niestacjonarne

Eksploracja danych (data mining)

Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów


Ewelina Dziura Krzysztof Maryański

PRZEWODNIK PO PRZEDMIOCIE

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

KARTA PRZEDMIOTU. Hurtownie i eksploracja danych D1_5

Hurtownie danych w praktyce

Hurtownie danych - opis przedmiotu

INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH

KARTA PRZEDMIOTU. 1. Informacje ogólne. 2. Ogólna charakterystyka przedmiotu. Metody drążenia danych D1.3

KARTA KURSU. Elementy statystyki matematycznej. Mathematical statistics

Metadane. Data Maining. - wykład VII. Paweł Skrobanek, C-3 pok. 323 pawel.skrobanek@pwr.wroc.pl oprac. Wrocław 2006

Sylabus modułu kształcenia na studiach wyższych. Nazwa Wydziału. Nazwa jednostki prowadzącej moduł Nazwa modułu kształcenia.

Proces odkrywania wiedzy z baz danych

Rola analityki danych w transformacji cyfrowej firmy

Hurtownia danych praktyczne zastosowania

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

ELEKTRONICZNA KSIĄŻKA POCZTOWA Z OBIEGIEM DOKUMENTÓW BY CTI. Opis programu

Szczegółowy opis przedmiotu zamówienia

Analiza internetowa czyli Internet jako hurtownia danych

PROGRAM NAUCZANIA PRZEDMIOTU OBOWIĄZKOWEGO NA WYDZIALE LEKARSKIM I ROK AKADEMICKI 2015/2016 PRZEWODNIK DYDAKTYCZNY dla STUDENTÓW I ROKU STUDIÓW

Od Expert Data Scientist do Citizen Data Scientist, czyli jak w praktyce korzystać z zaawansowanej analizy danych

Każdy system GIS składa się z: - danych - sprzętu komputerowego - oprogramowania - twórców i użytkowników

Opis efektów kształcenia dla modułu zajęć

Praktyczne aspekty pozyskiwania wiedzy z danych z perspektywy matematyka w bankowości (VI zajęcia) Jakub Jurdziak

1 Wprowadzenie do koncepcji Microsoft Office BI 1 Zakres ksiąŝki 2 Cel ksiąŝki 3 Wprowadzenie do tematu 3 Zawartość rozdziałów 4

Business Intelligence jako narzędzie do walki z praniem brudnych pieniędzy

Paweł Gołębiewski. Softmaks.pl Sp. z o.o. ul. Kraszewskiego Bydgoszcz kontakt@softmaks.pl

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE

Widzenie komputerowe (computer vision)

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Załącznik Nr 5 do Zarz. Nr 33/11/12 KARTA PRZEDMIOTU. 2. Kod przedmiotu ZP-Z1-19

Systemy Wspomagania Decyzji

Data mininig i wielowymiarowa analiza danych zgromadzonych w systemach medycznych na potrzeby badań naukowych

Techniki i algorytmy eksploracji danych. Geneza (1) Geneza (2)

Co to jest Business Intelligence?

Wykład 5. Cel wykładu. Korespondencja seryjna. WyŜsza Szkoła MenedŜerska w Legnicy. Informatyka w zarządzaniu Zarządzanie, zaoczne, sem.

data mining machine learning data science

Wprowadzenie do technologii Business Intelligence i hurtowni danych

> funkcjonalność aplikacji

Podstawowe zagadnienia z zakresu baz danych

1. Wprowadzenie do oprogramowania gretl. Wprowadzanie danych.

Hurtownie danych. 31 stycznia 2017

Program szkolenia EXCEL OD PODSTAW POPOŁUDNIOWY (WIECZOROWY)

MOS System wsparcia pracowników mobilnych

Eksploracja danych a serwisy internetowe Przemysław KAZIENKO

Seminarium Zastosowania statystyki i data mining w badaniach naukowych. Warszawa, 15 września 2015

Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu

Security Master Class

TOPWEB Microsoft Excel 2013 i PowerBI Przygotowanie danych, analiza i efektowna prezentacja wyników raportów

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

SIGMA KWADRAT. Wykorzystanie programu MS Excel do opracowań statystycznych CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Raport: bankowość internetowa i mobilna płatności bezgotówkowe. 4 kwartał 2018

Wprowadzenie Sformułowanie problemu Typy reguł asocjacyjnych Proces odkrywania reguł asocjacyjnych. Data Mining Wykład 2

Sylabus. Zaawansowana analiza danych eksperymentalnych Advanced analysis of experimental data

systemy informatyczne SIMPLE.ERP Budżetowanie dla Jednostek Administracji Publicznej

Wykorzystanie programu MS Excel do opracowań statystycznych

Egzamin / zaliczenie na ocenę* 0,5 0,5

Specjalista ds. danych test końcowy

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"

Program szkolenia EXCEL PRZEKROJOWY ZAAWANSOWANY.

MS Excel w dziale personalnym

SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006

WYMAGANIA EDUKACYJNE. Informatyka Szkoła Podstawowa Klasa 4 NA ŚRÓDROCZNĄ I ROCZNĄ OCENĘ KLASYFIKACYJNĄ

Baza danych to zbiór wzajemnie powiązanych ze sobą i zintegrowanych danych z pewnej dziedziny.

PROGRAM AUTORSKI KOŁA INFORMATYCZNEGO UCZNIÓW SZKOŁY PODSTAWOWEJ

Technologie informacyjne w medycynie laboratoryjnej

REGULAMIN. konkursu informatycznego dla uczniów szkół gimnazjalnych w roku szkolnym 2014/2015.

produkować, promować i sprzedawać produkty, zarządzać i rozliczać przedsięwzięcia, oraz komunikować się wewnątrz organizacji.

Curtis D. Frye. Microsoft Excel Krok po kroku. Przekład: Leszek Biolik

dr inż. Maciej Kiewra Prezentacja wygłoszona na konferencji BI vs Big Data podczas Kongresu GigaCon Warszawa, r.

Co to jest klasyfikacja? Klasyfikacja a grupowanie Naiwny klasyfikator Bayesa

Patrycja Stawicka Departament Informacji Finansowej (FIU) Ministerstwo Finansów, Polska

Analiza i wizualizacja danych Data analysis and visualization

Hurtownie danych - przegląd technologii

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl

dr inż. Paweł Morawski Informatyczne wsparcie decyzji logistycznych semestr letni 2016/2017

Zarządzanie wiedzą w opiece zdrowotnej

Hurtownie danych - przegląd technologii

ZMODYFIKOWANY Szczegółowy opis przedmiotu zamówienia

Systemy z bazą wiedzy (spojrzenie bardziej korporacyjne) Baza wiedzy. Baza wiedzy. Baza wiedzy. Baza wiedzy

Cel przedmiotu. Wymagania wstępne w zakresie wiedzy, umiejętności i innych kompetencji 1 Język angielski 2 Inżynieria oprogramowania

Eksploracja Danych. podstawy

Transkrypt:

Analiza danych i data mining. mgr Katarzyna Racka Wykładowca WNEI PWSZ w Płocku Przedsiębiorczy student 2016 15 XI 2016 r.

Cel warsztatu Przekazanie wiedzy na temat: analizy i zarządzania danymi (data mining); praktycznych umiejętności - pozyskania danych, ich obróbki i analizy w programie Statistica.

Wprowadzenie Postępujący rozwój informatyzacji, coraz większy dostęp do sieci komputerowych, powszechne gromadzenie informacji w bazach i hurtowniach danych prowadzi do stałego wzrostu ilości przechowywanych danych.

Wprowadzenie Codziennie sklepy, banki, firmy, agencje marketingowo-reklamowe, portale internetowe, ośrodki medyczne lub naukowo-badawcze wykonują i zapisują tysiące: operacji handlowych, transakcji, raportów opisów.

Wprowadzenie Na rynku finansowym sukces osiągają te firmy, które mając szybki dostęp do danych potrafią odpowiednio je wykorzystać. Przedsiębiorczy student 2016 Analiza danych i data mining. mgr K. Racka

Wprowadzenie We współczesnych bazach i hurtowniach danych gromadzone są ogromne ilości informacji, których człowiek sam nie jest w stanie szybko przeanalizować. Do tego celu używa się metod eksploracji danych (data mining), które umożliwiają odkrywanie nowej wiedzy, w dużych bazach danych.

Wprowadzenie Za pomocą metod data mining zgromadzone dane opisujące działania przedsiębiorstwa i jego klientów pozwalają na: analizę trendów, anomalii rozwoju firmy, ocenę klienta a także przewidywania istotnych zagrożeń finansowych, wspomaganie procesów decyzyjnych.

Definicja Data mining - eksploracja danych definiowane jest jako proces odkrywania: nowych reguł, wzorców, zależności w dużych zbiorach danych (hurtownie danych).

Etapy procesu odkrywania wiedzy Czyszczenie danych (ang. data cleaning); Integracja danych; Wybieranie danych; Transformacja danych; Eksploracja danych; Ocena odkrytych wzorców, reguł, zależności; Prezentacja odkrytej wiedzy;

Eksploracja danych jako jeden z kroków w procesie odkrywania wiedzy.

Metody eksploracji danych Wśród najbardziej znanych metod eksploracji danych możemy wyróżnić: Wyszukiwanie asocjacji Klasyfikacja Grupowanie Wykrywanie zmian i odchyleń Odkrywanie wzorców sekwencji Eksploracja danych tekstowych

Ranking programów do analizy i eksploracji danych oraz Big Data Jakie oprogramowanie do analiz, eksploracji danych, Big Data było przez Ciebie wybrane w ciągu ostatnich 12 miesięcy do prawdziwego projektu? Źródło: www.kdnuggets.com

Przykłady programów do analizy i eksploracji danych

Weka

Rapid Miner

Statistica Data Miner

Zadanie W programie Statistica dokonaj: importu danych z przygotowanego arkusza programu Microsoft Excel, nadaj etykiety dwóm pierwszym zmiennym, dokonaj czyszczenia danych, utwórz wykres 2W skategoryzowany, utwórz wykres rozrzutu, dokonaj analizy opisowej.

Podsumowanie Metody eksploracji danych (data mining) są narzędziem odkrywania nieznanej wiedzy, reguł, wzorców i zależności w bazach danych (hurtowniach danych). Ich zastosowanie można wskazać we wszystkich dziedzinach, w których należy dokonywać analizy i oceny dużej ilości danych, których człowiek sam nie jest w stanie szybko przeanalizować. Przedsiębiorczy student 2016 Analiza danych i data mining. mgr K. Racka

Podsumowanie Pamiętać należy, aby wnioski otrzymane z metod eksploracji danych były formułowane w postaci domniemań, a nie w postaci kategorycznych stwierdzeń. Wiedza pozyskana z analiz i metod eksploracji danych powinna być rozważnie wykorzystywana w procesach decyzyjnych. Nie każda bowiem odkryta reguła czy wzorzec będą przydatne. Człowiek musi dokonać ostatecznej oceny otrzymanej wiedzy.

Koniec