Odkrywanie reguł asocjacyjnych. Rapid Miner

Podobne dokumenty
Odkrywanie asocjacji

Określanie ważności atrybutów. RapidMiner

Eksploracja Danych. podstawy

Metody eksploracji danych. Reguły asocjacyjne

Wprowadzenie do klasyfikacji

Ćwiczenie 5. Metody eksploracji danych

Reguły asocjacyjne. 1. Uruchom system weka i wybierz aplikację Knowledge Flow.

Wprowadzenie Sformułowanie problemu Typy reguł asocjacyjnych Proces odkrywania reguł asocjacyjnych. Data Mining Wykład 2

1. Odkrywanie asocjacji

INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH

Systemy Wspomagania Decyzji

Data Mining Wykład 3. Algorytmy odkrywania binarnych reguł asocjacyjnych. Plan wykładu

Ewelina Dziura Krzysztof Maryański

Odkrywanie asocjacji

Reguły asocjacyjne w programie RapidMiner Michał Bereta

Wielopoziomowe i wielowymiarowe reguły asocjacyjne

METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING. EKSPLORACJA DANYCH Ćwiczenia. Adrian Horzyk. Akademia Górniczo-Hutnicza

Algorytmy odkrywania binarnych reguł asocjacyjnych

Inżynieria biomedyczna

Krzysztof Kawa. empolis arvato. e mail: krzysztof.kawa@empolis.com

Integracja technik eksploracji danych ]V\VWHPHP]DU]G]DQLDED]GDQ\FK QDSU]\NáDG]LH2UDFOHi Data Mining

Odkrywanie asocjacji. Cel. Geneza problemu analiza koszyka zakupów

data mining machine learning data science

Laboratorium 3. Odkrywanie reguł asocjacyjnych.

Zastosowanie metod eksploracji danych Data Mining w badaniach ekonomicznych SAS Enterprise Miner. rok akademicki 2014/2015

TEMP BÓL WYSYPKA GARDŁO DIAGNOZA

Reguły asocjacyjne, wykł. 11

Reguły asocjacyjne. Żródło: LaroseD.T., Discovering Knowledge in Data. An Introduction to Data Minig, John Wiley& Sons, Hoboken, New Jersey, 2005.

Data Mining z wykorzystaniem programu Rapid Miner

Inżynieria Wiedzy i Systemy Ekspertowe. Reguły asocjacyjne

Odkrywanie reguł asocjacyjnych

Nowa odsłona sklepu internetowego

Generowanie zbioru reguł asocjacyjnych i decyzyjnych ze statystycznie reprezentatywnym wsparciem i anty-wsparciem

Machine Learning. KISIM, WIMiIP, AGH

Feedy produktowe Ceneo, Skąpiec, Favi, Domodi, Moneteasy

Określanie ważności atrybutów. OracleData Miner

INSTRUKCJA OBSŁUGI PROGRAMU FOTOSMYK

Porównanie systemów automatycznej generacji reguł działających w oparciu o algorytm sekwencyjnego pokrywania oraz drzewa decyzji

Plan wykładu. Reguły asocjacyjne. Przykłady asocjacji. Reguły asocjacyjne. Jeli warunki to efekty. warunki efekty

Podstawy technologii WWW

Generowania certyfikatu niekwalifikowanego. do podpisu elektronicznego. dla klientów instytucjonalnych

Eksploracja danych - wykład VIII

Moduł Media backup oraz konfiguracja serwera zapasowego

TWORZENIE BLOKÓW I ATRYBUTÓW DLA PODANEGO PRZYKŁADU RYSUNKU ZESTAWIENIOWEGO. SPORZĄDZENIE LISTY ATRYBUTÓW

UPS 1000 VA Digitus Professional DN DN

Sztuczna inteligencja

Analiza asocjacji i reguły asocjacyjne w badaniu wyborów zajęć dydaktycznych dokonywanych przez studentów. Zastosowanie algorytmu Apriori

Grzegorz Harańczyk, StatSoft Polska Sp. z o.o.

Hurtownie danych. Analiza zachowań użytkownika w Internecie. Ewa Kowalczuk, Piotr Śniegowski. Informatyka Wydział Informatyki Politechnika Poznańska

Przed rozpoczęciem pracy otwórz nowy plik (Ctrl +N) wykorzystując szablon acadiso.dwt

Automatyczne wyodrębnianie reguł

Wielkie wolumeny danych są trudne w analizowaniu. system satelitarnej obserwacji EOS zbudowany przez NASA generuje

Drzewa klasyfikacyjne algorytm podstawowy

Temat zajęć: ANALIZA DANYCH ZBIORU EKSPORT. Część I: analiza regresji

Reguły asocjacyjne, algorytm Apriori

Kadry Optivum, Płace Optivum

Raporty dodatkowe nr 1 Ewidencja Wyposażenia PL+

PIERWSZE LOGOWANIE W ING BUSINESSONLINE METODA OPARTA O NOŚNIK CERTYFIKATU (ETOKEN/KARTĘ)

Eksploracja danych. KLASYFIKACJA I REGRESJA cz. 2. Wojciech Waloszek. Teresa Zawadzka.

ikasa instrukcja użytkownika dla Klientów nie posiadających zainstalowanej aplikacji

ikasa instrukcja użytkownika dla Klientów posiadających zainstalowaną aplikację


Instrukcja dla studentów Politechniki Poznańskiej

TWORZENIE ARKUSZY Z PRZEKROJAMI POPRZECZNYMI

Zastosowanie CP-grafów do generacji siatek

Dokumentacja Użytkownika Systemu

Implementacja metod eksploracji danych - Oracle Data Mining

Zadanie 9. Projektowanie stron dokumentu

A C T A UNIVERSITATIS LODZIENSIS FOLIA OECONOMICA 183,2004. Sebastian Szamański, Ryszard Budziński

Bankowość elektroniczna

Instrukcja Użytkownika (Studenta) Systemu Obsługującego Lokalne Archiwum Dokumentów

RILL - przyrostowy klasyfikator regułowy uczący się ze zmiennych środowisk

Certum SSL For Plesk. Instalacja oraz Użycie

Nabór Przedszkola. Tworzenie listy kontynuujących na podstawie przyjętych w ubiegłym roku

Konfiguracja systemów bankowych do współpracy z Systemem Symfonia

Praca z programami SAS poza lokalną siecią komputerową UZ. Zestawienie tunelu SSH oraz konfiguracja serwera proxy w przeglądarce WWW

POCZTA POLSKA. v Strona 1 z 9

Bazy danych Ćwiczenie 1 Instrukcja strona 1 Wersja ogólna

Wstęp do Sztucznej Inteligencji

Instrukcja korzystania z platformy B2B Black Point S.A.

Jak przygotować i wydrukować strony arkuszy ocen z wynikami klasyfikacji końcowej oraz świadectwa ukończenia szkoły?

Aktualizacja. GBOX Assist. Wersja: 1.2

SAS Institute TECHNICAL SUPPORT )

System monitorowania i sterowania produkcją

Jak przygotować i wydrukować legitymacje?

procertum SmartSign 3.2 wersja 1.0.2

SYSTEM EZD v

Microsoft Access materiały pomocnicze do ćwiczeń cz. 1

Analiza danych i data mining.

BANK GOSPODARSTWA KRAJOWEGO. w systemie BGK@24BIZNES

W kolejnym odcinku zajmiemy się umieszczaniem w naszym projekcie zestawu ikon służących szybkiemu korzystaniu z opcji programu.

Rejestr VAT Optivum, Centralny VAT VULCAN

POCZTA POLSKA. v Strona 1 z 9

Metody eksploracji danych 1. Wprowadzenie. Piotr Szwed Katedra Informatyki Stosowanej AGH 2016

Konfiguracja systemów bankowych do współpracy z Systemem Symfonia

ANALIZA ZACHOWAŃ UŻYTKOWNIKÓW PORTALU ONET.PL W UJĘCIU REGUŁ ASOCJACYJNYCH

Aktualizacja. GBOX Assist. Data wydania: r.

Instrukcja odnawiania certyfikatów. przez stronę elektronicznypodpis.pl

Algorytm DIC. Dynamic Itemset Counting. Magdalena Przygórzewska Karolina Stanisławska Aleksander Wieczorek

Plan lekcji Optivum. Jak ułożyć plan dyżurów? Przewodnik

Transkrypt:

Odkrywanie reguł asocjacyjnych Rapid Miner

Zbiory częste TS ID_KLIENTA Koszyk 12:57 1123 {mleko, pieluszki, piwo} 13:12 1412 {mleko, piwo, bułki, masło, pieluszki} 13:55 1425 {piwo, wódka, wino, paracetamol} 14:09 1123 {mleko, pieluszki, bułki, piwo} Minimum support = 0.75 Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 98/633

Zbiory częste TS ID_KLIENTA Koszyk 12:57 1123 {mleko, pieluszki, piwo} 13:12 1412 {mleko, piwo, bułki, masło, pieluszki} 13:55 1425 {piwo, wódka, wino, paracetamol} 14:09 1123 {mleko, pieluszki, bułki, piwo} Minimum support = 0.75 Sup({mleko}= 0.75 Sup({piwo}=1 Sup({pieluszki}= 0.75 Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 99/633

Zbiory częste TS ID_KLIENTA Koszyk 12:57 1123 {mleko, pieluszki, piwo} 13:12 1412 {mleko, piwo, bułki, masło, pieluszki} 13:55 1425 {piwo, wódka, wino, paracetamol} 14:09 1123 {mleko, pieluszki, bułki, piwo} Minimum support = 0.75 Sup({mleko}= 0.75 Sup({piwo}=1 Sup({pieluszki}= 0.75 Sup({mleko,pieluszki}= 0.75 Sup({mleko,piwo}= 0.75 Sup({piwo,pieluszki}= 0.75 Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 100/633

Zbiory częste TS ID_KLIENTA Koszyk 12:57 1123 {mleko, pieluszki, piwo} 13:12 1412 {mleko, piwo, bułki, masło, pieluszki} 13:55 1425 {piwo, wódka, wino, paracetamol} 14:09 1123 {mleko, pieluszki, bułki, piwo} Minimum support = 0.75 Sup({mleko}= 0.75 Sup({piwo}=1 Sup({pieluszki}= 0.75 Sup({mleko,pieluszki}= 0.75 Sup({mleko,piwo}= 0.75 Sup({piwo,pieluszki}= 0.75 Sup({mleko,piwo,pieluszki}= 0.75 Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 101/633

Reguły asocjacyjne poprzednik=>następnik {mleko,piwo,pieluszki} {mleko}=>{piwo, pieluszki} {piwo}=>{mleko, pieluszki} {pieluszki}=>{mleko,piwo} {mleko, piwo}=>{pieluszki} {mleko, pieluszki}=>{piwo} {piwo, pieluszki}=>{mleko} Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 102/633

Ocena reguł asocjacyjnych conf ( X Y = sup( X Y sup( X lift( X Y = sup( X Y sup( X *sup( Y conv( X Y = 1 1 sup( Y conf ( X Y lev( X Y = sup( X Y sup( X *sup( Y Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 103/633

Ocena reguł asocjacyjnych {piwo}=>{mleko, pieluszki} conf=0.75 lift=1 conv=1 lev=0 {mleko,pieluszki}=>{piwo} conf=1 lift=1 conv=0/0?? lev=0 Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 104/633

Weka (1 Minimalne wsparcie Miara oceny reguł Minimalna wartość miary Liczba reguł do wygenerowania Czy zwrócić też zbiory częste Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 105/633

Zadanie Przeczytaj opis zestawu danych zakupy.arff Pobierz plik reguly_asocjacyjne.pdf i postępuj zgodnie z poleceniami. Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 106/633

Rapid Miner Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 107/633

Zadanie Przeprowadź podobną analizę jak w programie WEKA, ale wykorzystując RapidMiner. Wykorzystaj plik zakupy.binominal.arff Obejrzyj wygenerowane reguły w Graph View. Kiedy taki widok może się przydać? Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 108/633

Ilościowe reguły asocjacyjne BÓL WYSYPKA GARDŁO DIAGNOZA T BRAK NORMA NIESTRAWNOŚĆ N MAŁA PRZEKR. ALERGIA N BRAK NORMA PRZECHŁODZENIE T DUŻA PRZEKR. CZARNA OSPA BÓL=T BÓL=N WYSYPKA =BRAK WYSYPKA =MAŁA WYSYPKA =DUŻA GARDŁO =NORM. 1 0 1 0 0 1 0 0 1 0 1 0 0 1 0 1 1 0 0 1 0 1 0 0 0 1 0 1 {ból=t,wysypka=brak,gardło=norma,diagnoza=niestrawność} {ból=n,wysypka=mała,gardło=przekr,diagnoza=alergia} {ból=n,wysypka=brak,gardło=norma,diagnoza=przechłodzenie} {ból=t,wysypka=duża,gardło=przekr,diagnoza=czarna ospa} GARDŁO =PRZEKRW. Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 109/633

Zadanie (WEKA Wczytaj plik flags.arff i wyszukaj ilościowe reguły asocjacyjne. Wygeneruj reguły o wysokiej ufności, ale niskim wsparciu, oraz reguły o wysokim wsparciu, ale niekoniecznie bardzo wysokiej ufności. Spróbuj zwiększyć limit na liczbę generowanych reguł (parametr numrules w Apriori. Przejrzyj uzyskane reguły. Czy potrafisz wyjaśnić niektóre z tych reguł? Którą regułę uważasz za najciekawszą? Wykorzystaj opcję outputitemsets w konfiguracji Apriori, aby wygenerować, prócz reguł asocjacyjnych, zbiory częste. Spróbuj wskazać zbiór częsty dla reguły o najwyższej ufności, oraz zbiór częsty poprzednika tej reguły. Potwierdź swoje przypuszczenia pod adresem: https://www.cia.gov/library/publications/the-worldfactbook/docs/flagsoftheworld.html Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 110/633

Zadanie (Rapid Miner Zbuduj ilościowe reguły asocjacyjne dla zbioru danych weather_nominal.arff Pamiętaj aby każdy atrybut nominalny zmienić w zbiór atrybutów binominalnych. Ustaw minsup=0.3 i minconf=0.5 i zobacz wygenerowane reguły. Jak pewne są wygenerowane reguły? Co zrobić by uzyskać reguły o większym confidence? Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 111/633