Metody Inżynierii Wiedzy

Podobne dokumenty
Asocjacyjna reprezentacja danych i wnioskowanie

METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING. EKSPLORACJA DANYCH Ćwiczenia. Adrian Horzyk. Akademia Górniczo-Hutnicza

METODY INŻYNIERII WIEDZY ASOCJACYJNA REPREZENTACJA POWIĄZANYCH TABEL I WNIOSKOWANIE IGOR CZAJKOWSKI

1. Historia 2. Podstawy neurobiologii 3. Definicje i inne kłamstwa 4. Sztuczny neuron i zasady działania SSN. Agenda

Adrian Horzyk

METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING

METODY INŻYNIERII WIEDZY

METODY INŻYNIERII WIEDZY

METODY INŻYNIERII WIEDZY

Data Mining Wykład 1. Wprowadzenie do Eksploracji Danych. Prowadzący. Dr inż. Jacek Lewandowski

INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH

Adrian Horzyk

Ewelina Dziura Krzysztof Maryański

WSTĘP I TAKSONOMIA METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING. Adrian Horzyk. Akademia Górniczo-Hutnicza


EKSPLORACJA DANYCH METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING. Adrian Horzyk. Akademia Górniczo-Hutnicza

Systemy Wspomagania Decyzji

SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006

S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor

1. Odkrywanie asocjacji

Eksploracja Danych. podstawy

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

EKSPLORACJA DANYCH METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING. Adrian Horzyk. Akademia Górniczo-Hutnicza

METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING

Metody eksploracji danych. Reguły asocjacyjne

Zakres pytań obowiązujący w roku akad. 2015/2016

SZTUCZNA INTELIGENCJA

Programowanie Obiektowew języku C++ Zadania L2

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE

Reguły asocjacyjne. 1. Uruchom system weka i wybierz aplikację Knowledge Flow.

Inżynieria biomedyczna

Adrian Horzyk

Python : podstawy nauki o danych / Alberto Boschetti, Luca Massaron. Gliwice, cop Spis treści

Tytuł pracy dyplomowej

Systemy uczące się Lab 4

Co to jest grupowanie

data mining machine learning data science

KLASYFIKACJA. Słownik języka polskiego

Podstawy informatyki. Informatyka stosowana - studia niestacjonarne. Grzegorz Smyk. Wydział Inżynierii Metali i Informatyki Przemysłowej

IMPLEMENTACJA SIECI NEURONOWYCH MLP Z WALIDACJĄ KRZYŻOWĄ

Praca dyplomowa magisterska

Wprowadzenie Sformułowanie problemu Typy reguł asocjacyjnych Proces odkrywania reguł asocjacyjnych. Data Mining Wykład 2

Systemy uczące się wykład 1

Odkrywanie asocjacji

Wprowadzenie do technologii informacyjnej.

Sieci Kohonena Grupowanie

Wprowadzenie. SOM jest skrótem od Self Organizing Maps, czyli Samoorganizujące się mapy.

Sprawozdanie z laboratoriów HTK!

PL B1. Układ do lokalizacji elektroakustycznych przetworników pomiarowych w przestrzeni pomieszczenia, zwłaszcza mikrofonów

PL B BUP 14/16

Zalew danych skąd się biorą dane? są generowane przez banki, ubezpieczalnie, sieci handlowe, dane eksperymentalne, Web, tekst, e_handel

Podstawy programowania w języku C++ Zadania

Wpływ jednoznaczności na proces generalizacji obiektów antropogenicznych

W poszukiwaniu sensu w świecie widzialnym

Analiza skupień. Analiza Skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania

Problematyka dostępności sygnałów GNSS na obszarach miejskich Kinga Królikowska, Piotr Banasik


Business Intelligence jako narzędzie do walki z praniem brudnych pieniędzy

Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie Olimpiada O Diamentowy Indeks AGH 2017/18. Informatyka Etap III

Materiał Typy zmiennych Instrukcje warunkowe Pętle Tablice statyczne Wskaźniki Tablice dynamiczne Referencje Funkcje

Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów

AKADEMIA GÓRNICZO-HUTNICZA

Akademia Górniczo-Hutnicza

Analiza i eksploracja danych

Nowoczesne narzędzia obliczeniowe do projektowania i optymalizacji kotłów

Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18

Ćwiczenie 5. Metody eksploracji danych

Analiza danych i data mining.

Porównanie algorytmów wyszukiwania najkrótszych ścieżek międz. grafu. Daniel Golubiewski. 22 listopada Instytut Informatyki

Hurtownia danych. Załącznik Nr 1 do SIWZ. Opis przedmiotu zamówienia. Lp. FUNKCJONALNOŚĆ/PARAMETRY WYMAGANE

Podstawy informatyki. Informatyka stosowana - studia niestacjonarne. Grzegorz Smyk

OPTYMALIZACJA I AUTOMATYZACJA PROCESÓW BIZNESOWYCH AUDYT WEWNĘTRZNY I KONTROLA FINANSOWA

ELEMENTY AUTOMATYKI PRACA W PROGRAMIE SIMULINK 2013

Data Mining Wykład 3. Algorytmy odkrywania binarnych reguł asocjacyjnych. Plan wykładu

Teoretyczne podstawy informatyki

Metody selekcji cech

Analiza danych tekstowych i języka naturalnego

Testowy dokument raz dwa trzy

WPŁYW DENIWELACJI TERENU NA NIEJEDNORODNOŚĆ SKALI ZDJĘCIA LOTNICZEGO (KARTOMETRYCZNOŚĆ ZDJĘCIA)

Proces odkrywania wiedzy z baz danych

Metody eksploracji danych w odkrywaniu wiedzy (MED) projekt, dokumentacja końcowa

Elementy modelowania matematycznego

Projekt i implementacja systemu wspomagania planowania w języku Prolog

Inżynieria Wiedzy i Systemy Ekspertowe. Reguły asocjacyjne

SYSTEMY UCZĄCE SIĘ WYKŁAD 3. DRZEWA DECYZYJNE. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

TABELE PRZESTAWNE W CONTROLLINGU I ANALIZIE SPRZEDAŻY SZKOLENIE OTWARTE KRAKÓW 8 GODZIN DYDAKTYCZNYCH. Controlling Node Próchnicki Wojciech

Od e-materiałów do e-tutorów

Prezydent wszystkich kombinacji czyli rzecz o filtrowaniu systemów Lotto

komputery? Andrzej Skowron, Hung Son Nguyen Instytut Matematyki, Wydział MIM, UW

WIEDZA METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING. Adrian Horzyk. Akademia Górniczo-Hutnicza

Eksploracja danych - wykład VIII

52 NAJLEPSZE TRIKI W EXCELU, CZYLI JAK SZYBCIEJ WYKONAĆ OBLICZENIA

OpenAI Gym. Adam Szczepaniak, Kamil Walkowiak

PROLOG WSTĘP DO INFORMATYKI. Akademia Górniczo-Hutnicza. Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej.

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Data Mining Kopalnie Wiedzy

FP-3000-Raport INSTRUKCJA OBSŁUGI. Wersja: PL

Ćwiczenia z Zaawansowanych Systemów Baz Danych

Programowanie Obiektowew języku C++ Zadania L2

Transkrypt:

Metody Inżynierii Wiedzy Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie AGH University of Science and Technology Mateusz Burcon Kraków, czerwiec 2017

Wykorzystane technologie Python 3.4 PyCharm 2016.3.2

Metoda K Najbliższych Metoda k Najbliższych Sąsiadów wyznacza k sąsiadów do których badany element ma najbliżej dla wybranej metryki, a następnie wyznacza wynik w oparciu o głos większości. Sąsiadów

Metoda K Najbliższych Sąsiadów Wyjście programu Najlepszy rezultat dla K=19: Poprawność niezmodyfikowanej metody Knn - 98% Poprawność zmodyfikowanej metody Knn - 98%

Metoda K Najbliższych Sąsiadów Możliwość zdefiniowania własnego wzorca testowego Zwycięzca: Iris-setosa

Neuronowe mapy samoorganizujące się» Umożliwiają reprezentację wielowymiarowych danych w przestrzeni o mniejszym wymiarze» Przykład sieci neuropodobnych uczony metodą uczenia nienadzorowanego

Neuronowe mapy samoorganizujące się

Neuronowe mapy samoorganizujące się

Eksploracja Danych Proces automatycznego odkrywania nietrywialnych, dotychczas nieznanych, potencjalnie reguł, zależności, wzorców schematów, podobieństw lub trendów w dużych repozytoriach danych. Celem eksploracji danych jest analiza danych i procesów w celu lepszego ich rozumienia.

Eksploracja Danych» Wsparcie s to ilość transakcji zawierających zarówno X jak i Y» Pewność c to prawdopodobieństwo warunkowe, że transakcja zawierająca X zawiera również Y» Wzorzec częsty, to taki, który ma wsparcie większe niż ustalony próg» Wzorzec zamknięty, to taki wzorzec, który jest częsty i nie istnieje żaden nadwzorzec, który miałby takie samo wsparcie» Wzorzec maksymalny, to taki wzorzec, który jest częsty i nie istnieje żaden częsty nadwzorzec

Eksploracja Danych» Przeszukiwanie zbioru Iris

Eksploracja Danych» Przeszukiwanie Baśni Grimm Oznacza to, że 40% zdań w Baśniach Grimm zawiera kombinacje słów takich jak a lub and lub the i and lub to itd.

Eksploracja Danych» Przeszukiwanie zbioru transakcji Oznacza to, że co trzecie zakupy dokonywane w sklepie, zawierają produkty takie jak: Chleb oraz ser Masło Jajka Kawa oraz cukier itd

Eksploracja Danych Ekwiwalentna Transformacja klas ECLAT to algorytm przeszukiwania w głąb wykorzystujący przecięcie zbiorów. Służy do eksploracji częstych wzorców poprzez badanie ich wertykalnego formatu:

Eksploracja Danych Wyszukiwanie reguł asocjacyjnych w zbiorze transakcji: Można wywnioskować, że jeżeli klient zakupi ser, to ze 100 procentową pewnością zakupi także chleb. Jeżeli klient kupi kawę, to z 75 procentową pewnością zakupi także cukier.

AGDS Systemy asocjacyjne umożliwiają zarówno horyzontalne jak i wertykalne powiązanie danych połączone z agregacją duplikatów, co generuje spore oszczędności.

AGDS AGDS zaimplementowano w oparciu o hashmapy (słowniki). Funkcjonalności:» Filtrowanie parametrów po zakresie» Wyszukiwanie minimum, maksimów» Wyszukiwanie n najmniejszych/największych wartości» Filtrowanie po wielu parametrach» Wizualizacja root Parametr 1 Parametr 2 Parametr 3 klasa Wartość 1 Wartość 1 Wartość 1 Klasa 1 Klasa 2 ID 1 ID 2 ID 3

AGDS

Filtrowanie po zakresie parametru zbiór Iris Obiekty z leaf-length w zakresie 3.3.2

Filtrowanie po zakresie kilku parametrów zbiór Wine Alcohol w przedziale (14.21,15.89), Magnesium w przedziale (88,101), Ash w przedziale (2.0, 2.8)

Wyszukiwanie minimów zbiór Iris Najmniejsze wartości petal-witdth, leaf-width, leaf-length

Wyszukiwanie maksimów zbiór Wine Największe wartości Magnesium, Ash, Flavanoids, Alcohol

N największych wartości zbiór Iris 4 największe wartości leaf-length

N najmniejszych wartości zbiór Wine 8 najmniejszych wartości Ash

Wiedza to ciągły, społeczny proces dochodzenia do pewnych wniosków, które są uznawane za prawdziwe przez większość lub chociaż część ludzi.

Dziękuję.