Reguły asocjacyjne. Żródło: LaroseD.T., Discovering Knowledge in Data. An Introduction to Data Minig, John Wiley& Sons, Hoboken, New Jersey, 2005.

Podobne dokumenty
Metody eksploracji danych. Reguły asocjacyjne

Eksploracja danych - wykład VIII

Inżynieria Wiedzy i Systemy Ekspertowe. Reguły asocjacyjne

Systemy Wspomagania Decyzji

Ćwiczenie 5. Metody eksploracji danych

INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH

Reguły asocjacyjne w programie RapidMiner Michał Bereta

Zastosowanie metod eksploracji danych Data Mining w badaniach ekonomicznych SAS Enterprise Miner. rok akademicki 2014/2015

Data Mining Wykład 3. Algorytmy odkrywania binarnych reguł asocjacyjnych. Plan wykładu

Odkrywanie asocjacji

Reguły asocjacyjne. 1. Uruchom system weka i wybierz aplikację Knowledge Flow.

Wprowadzenie Sformułowanie problemu Typy reguł asocjacyjnych Proces odkrywania reguł asocjacyjnych. Data Mining Wykład 2

Algorytm DIC. Dynamic Itemset Counting. Magdalena Przygórzewska Karolina Stanisławska Aleksander Wieczorek

Ewelina Dziura Krzysztof Maryański

Algorytmy odkrywania binarnych reguł asocjacyjnych

Inżynieria biomedyczna

METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING. EKSPLORACJA DANYCH Ćwiczenia. Adrian Horzyk. Akademia Górniczo-Hutnicza

1. Odkrywanie asocjacji


Reguły asocjacyjne, wykł. 11

B jest globalnym pokryciem zbioru {d} wtedy i tylko wtedy, gdy {d} zależy od B i nie istnieje B T takie, że {d} zależy od B ;

Reguły decyzyjne, algorytm AQ i CN2. Reguły asocjacyjne, algorytm Apriori.

Plan wykładu. Reguły asocjacyjne. Przykłady asocjacji. Reguły asocjacyjne. Jeli warunki to efekty. warunki efekty

Odkrywanie asocjacji. Cel. Geneza problemu analiza koszyka zakupów

Sztuczna Inteligencja Projekt

Analiza asocjacji i reguły asocjacyjne w badaniu wyborów zajęć dydaktycznych dokonywanych przez studentów. Zastosowanie algorytmu Apriori

STYCZEŃ marchew, pietruszka korzeniowa, buraki, seler, ziemniaki, por, pasternak, jarmuż, topinambur, brukselka, cykoria, brukiew

Laboratorium 3. Odkrywanie reguł asocjacyjnych.

Michał Kukliński, Małgorzata Śniegocka-Łusiewicz

Odkrywanie asocjacji


Odkrywanie reguł asocjacyjnych. Rapid Miner

Sprawozdanie z laboratorium: Hurtownie Danych. Algorytm generowania reguł asocjacyjnych. FP-Growth. 9 czerwca 2011


Wielopoziomowe i wielowymiarowe reguły asocjacyjne

Krzysztof Kawa. empolis arvato. e mail: krzysztof.kawa@empolis.com

Reguły i fakty zapisz za pomocą perceptów. Metodą wnioskowania w tył, sprawdzić czy mój komputer jest wyposażony w procesor PII.

Zagadnienia: 1. Definicje porządku słabego i silnego. 2. Elementy minimalne, maksymalne, kresy, etc.

Katalog produktów dla sektora gastronomicznego

Indukcja matematyczna, zasada minimum i maksimum. 17 lutego 2017

KATALOG GASTRONOMIA MROŻONE OWOCE GWARANCJA ŚWIEŻOŚCI I JAKOŚCI OBSZERNY I ZRÓŻNICOWANY ASORTYMENT MNOGOŚĆ WARIANTÓW ZASTOSOWANIA

A C T A UNIVERSITATIS LODZIENSIS FOLIA OECONOMICA 183,2004. Sebastian Szamański, Ryszard Budziński

Drzewa klasyfikacyjne Lasy losowe. Wprowadzenie

Algorytmy klasyfikacji

Data Mining Kopalnie Wiedzy

II Danie: Kotlet schabowy panierowany70g Ziemniaki 150g Surówka warzywna(kapusta biała, marchew, kukurydza, olej rzepakowy) 100g

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

OWOCE WARZYWA. TRUSKAWKI Skład: truskawki bez szypułek. MIESZANKA KOMPOTOWA Skład: truskawki, aronia, porzeczki czerwone, śliwki PORZECZKI CZARNE

Wnioskowanie z wiedzy niepełnej

Poznań: Dostawa warzyw i owoców Numer ogłoszenia: ; data zamieszczenia: OGŁOSZENIE O UDZIELENIU ZAMÓWIENIA - Dostawy

Indukcja. Materiały pomocnicze do wykładu. wykładowca: dr Magdalena Kacprzak

CO MOZ NA WYCISNA C Z SAMOOBSŁUGI CZYLI SPRZEDAZ W KANAŁACH SELF CARE? Bartosz Szkudlarek

15,00zł 19,00zł 29,00zł 38,00zł 48,00zł 7. CALIFFOser, sos pomidorowy, oregano, szynka, kabanos, papryka, oliwki

Klasyfikacja. Obcinanie drzewa Naiwny klasyfikator Bayes a knn Dokładność klasyfikacji. Eksploracja danych. Klasyfikacja wykład 3

Sztuczna Inteligencja Projekt

Dania serwujemy naszym Gościom codziennie Od godziny 12:00 do godziny 22:00

Sztuczna inteligencja

Reguły asocjacyjne na giełdzie

Adres strony internetowej, na której Zamawiający udostępnia Specyfikację Istotnych Warunków Zamówienia:

Adres strony internetowej, na której Zamawiający udostępnia Specyfikację Istotnych Warunków Zamówienia:

Odkrywanie wzorców sekwencji

Matematyka dyskretna - wykład - część Podstawowe algorytmy kombinatoryczne

Odkrywanie reguł asocjacyjnych

ZAPROSZENIE DO SKŁADANIA OFERT

ANALIZA ZACHOWAŃ UŻYTKOWNIKÓW PORTALU ONET.PL W UJĘCIU REGUŁ ASOCJACYJNYCH

EKSPLORACJA DANYCH METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING. Adrian Horzyk. Akademia Górniczo-Hutnicza

Nazwa produktu Masa kcal Białko Tłuszcz jednonienasyc wielonienasy Cholesterol Sacharoza Laktoza

Nowe narzędzia zarządzania jakością

WYKŁAD 6. Reguły decyzyjne

EKSPLORACJA DANYCH METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING. Adrian Horzyk. Akademia Górniczo-Hutnicza

Logika Stosowana. Wykład 10 - Wnioskowanie indukcyjne Część 3 Indukcja reguł i ILP. Marcin Szczuka. Instytut Informatyki UW

Wstęp do programowania INP001213Wcl rok akademicki 2017/18 semestr zimowy. Wykład 9. Karol Tarnowski A-1 p.

Logika. Michał Lipnicki. 15 stycznia Zakład Logiki Stosowanej UAM. Michał Lipnicki () Logika 15 stycznia / 37

8. Drzewa decyzyjne, bagging, boosting i lasy losowe

Wybrane zadania przygotowujące do egzaminu z ISO- cz. 2. dr Piotr Wąsiewicz

Lista zadań - Relacje

Przekąski. Przekąski. Party Mix. Raut. Kukurydza. Kapary. Niepowtarzalny śródziemnomorski smak i aromat. Pokusa zamknięta w słoiczku OLE!

Menu dla Zespół Szkół nr 43

SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006

1. Wstęp do logiki. Matematyka jest nauką dedukcyjną. Nowe pojęcia definiujemy za pomocą pojęć pierwotnych lub pojęć uprzednio wprowadzonych.

Sortowanie topologiczne skierowanych grafów acyklicznych

Generowanie zbioru reguł asocjacyjnych i decyzyjnych ze statystycznie reprezentatywnym wsparciem i anty-wsparciem

ODKRYWANIE WZORCÓW ZACHOWAŃ KONSUMENTÓW ZA POMOCĄ ANALIZY KOSZYKOWEJ DANYCH TRANSAKCYJNYCH

A i. i=1. i=1. i=1. i=1. W dalszej części skryptu będziemy mieli najczęściej do czynienia z miarami określonymi na rodzinach, które są σ - algebrami.

Analiza danych. TEMATYKA PRZEDMIOTU

OFERTA. Owoce mrożone. Asortyment Opakowanie Cena za 1 kg netto

Adres strony internetowej, na której Zamawiający udostępnia Specyfikację Istotnych Warunków Zamówienia:

BOGDAN ZARĘBSKI ZASTOSOWANIE ZASADY ABSTRAKCJI DO KONSTRUKCJI LICZB CAŁKOWITYCH

ZAPYTANIE OFERTOWE. 2. Zamawiający: Specjalny Ośrodek Szkolno-Wychowawczy im. Jerzego Rudlickiego w Olbięcinie, Olbięcin 139, Trzydnik Duży

1 Działania na zbiorach

Pizzeria Awangarda Pełczyce Zapraszamy Codziennie w godz. od do Tel

9. Praktyczna ocena jakości klasyfikacji

Matematyka dyskretna. Andrzej Łachwa, UJ, /10

6. Formularze tabelaryczne, obiekty nawigacji - rozgałęzienia

Prawdopodobieństwo i statystyka

Metody Inżynierii Wiedzy

Przekąski. Doskonałe przekąski oraz dodatek do wielu dań. Cebulka. marynowana srebrna 305, 800 ml. Pieczarkowy Hit:

GASTROHOUSE NAJLEPSZY KATERING DLA PRZEDSZKOLI

Technologie baz danych

Menu marzec 2018 r. Filet z piersi kurczaka w sezamie, ziemniaki, marchewka mini, surówka z warzyw mieszanych, kompot

Transkrypt:

Reguły asocjacyjne Żródło: LaroseD.T., Discovering Knowledge in Data. An Introduction to Data Minig, John Wiley& Sons, Hoboken, New Jersey, 2005.

Stragan warzywny -transakcje zakupów Transakcja Produkty 1 brokuły, zielona papryka, kukurydza 2 szparagi, cukinia, kukurydza 3 kukurydza, pomidory, groszek, cukinia 4 zielona papryka, szparagi, brokuły 5 groszek, szparagi, brokuły 6 cukinia, szparagi, groszek, pomidory

Dane tabelaryczne o transakcjach Transakcja szparagi groszek brokuły kukurydza Zielona papryka 1 1 1 1 2 1 1 1 cukinia 3 1 1 1 1 4 1 1 1 1 5 1 1 1 6 1 1 1 1 7 1 1 8 1 1 1 9 1 1 1 10 1 1 11 1 1 1 1 12 1 1 1 13 1 1 1 1 14 1 1 1 1 1 pomidory

Kryteria ( A B) wsparcie = liczba transakcji z sumaryczna liczba produktami transakcji A i B P ufnosc = = ( A B) = P( B / A) ( A B) liczba transakcji z produktami A i B P( A) sumaryczna liczba transakcji z produktem A

Odkrywanie reguł asocjacyjnych Analityk może preferować reguły o dużym wsparciu lub o dużej ufności lub też może brać pod uwagę obie miary: wsparcie i ufność

Mocne reguły Mocne reguły to reguły o dużym wsparciu i dużej ufności

Szukanie reguł asocjacyjnych 1. znajdź częste zbiory zdarzeń=znajdź wszystkie zdarzenia, których częstość występowania Φ 2. Na podstawie częstych zbiorów zdarzeń utwórz reguły asocjacyjne, które spełniają kryterium minimalnej ufności i minimalnego wsparcia.

Własność A PRIORI Jeżeli zbiór zdarzeń Z nie jest zbiorem częstym, to dla dowolnego zbioru zdarzeń A: Z UA nie jest zbiorem częstym.

przyjmij Φ = 4

Możliwe zbiory 1-elementowe (C1) Transakcja szparagi groszek brokuły kukurydza Zielona papryka cukinia pomidory 1 1 1 1 2 1 1 1 3 1 1 1 1 4 1 1 1 1 5 1 1 1 6 1 1 1 1 7 1 1 8 1 1 1 9 1 1 1 10 1 1 11 1 1 1 1 12 1 1 1 13 1 1 1 1 14 1 1 1 1 1 Φ 6 10 5 8 5 7 6

1-elementowe zbiory częste F1={szparagi, groszek, brokuły, kukurydza, zielona papryka, cukinia, pomidory }

Tworzenie zbiorów F k Aby utworzyć zbiór F k, algorytm A PRIORI najpierw konstruuje zbiór C k kandydatów k-elementowych poprzez łączenie zbiorów F k-1 Zbiory F k-1 są łączone jeśli mają wspólnych pierwszych k-1 elementów Następnie algorytm przycina zbiór C k za pomocą właściwości A PRIORI. Zbiory zdarzeń, które przetrwały krok przycinania tworzą zbiór F k.

Możliwe zbiory 2-elementowe(C2) Zbiór Liczność Zbiór Liczność szparagi, groszek 5 brokuły, kukurydza 2 szparagi, brokuły 1 brokuły, zielona papryka 4 szparagi, kukurydza 2 brokuły, cukinia 1 szparagi, green pappers 0 brokuły, pomidory 2 szparagi, cukinia 5 kukurydza, zielona papryka 3 szparagi, pomidory 1 kukurydza, cukinia 3 groszek, brokuły 3 kukurydza, pomidory 4 groszek, kukurydza 5 zielona papryka, cukinia 1 groszek, zielona papryka 3 zielona papryka, pomidory 3 groszek, cukinia 6 cukinia, pomidory 2 groszek,pomidory 4

2-elementowe zbiory częste F2={{szparagi, groszek} {szparagi, cukinia}, {groszek, kukurydza}, {groszek, cukinia}, {groszek, pomidory}, {brokuły, zielona papryka}, {kukurydza, pomidory }}

Generowanie reguł asocjacyjnych Krok 1. Utwórz wszystkie zbiory s. Krok 2. Niech ss będzie niepustym podzbiorem s. Rozważ regułę asocjacyjną R: ss => (s-ss), gdzie (s-ss) oznacza zbiór s bez podzbioru ss. Stwórz i zwróć R jeśli R spełnia minimalne wymagania ufności. Wykonaj krok 2 dla każdego podzbioru sszbiorus. Dla prostoty często pożądany jest 1-elementowy następnik.

Możliwe reguły asocjacyjne Jeżeli poprzednik, to następnik Wsparcie Ufność Jeżeli kupuje szparagi, to kupuje groszek 5/14=35,7% 5/6=83.3% Jeżeli kupuje szparagi, to kupuje groszek 5/14=35,7% 5/10=50% Jeżeli kupuje szparagi, to kupuje cukinię 5/14=35,7% 5/6=83.3% Jeżeli kupuje cukinię, to kupuje szparagi 5/14=35,7% 5/7=71.4% Jeżeli kupuje groszek, to kupuje kukurydzę 5/14=35,7% 5/10=50% Jeżeli kupuje kukurydzę, to kupuje groszek 5/14=35,7% 5/8=62.5% Jeżeli kupuje groszek, to kupuje cukinię 6/14=42,9% 6/10=60% Jeżeli kupuje cukinię, to kupuje groszek 6/14=42,9% 6/7=85.7% Jeżeli kupuje groszek, to kupuje pomidory 4/14=28,6% 4/10=40% Jeżeli kupuje pomidory, to kupuje groszek 4/14=28,6% 4/6=66.7% Jeżeli kupuje brokuły, to kupuje zieloną paprykę 4/14=28,6% 4/5=80% Jeżeli kupuje zieloną paprykę, to kupuje brokuły 4/14=28,6% 4/5=80% Jeżeli kupuje kukurydzę, to kupuje pomidory 4/14=28,6% 4/8=50% Jeżeli kupuje pomidory, to kupuje kukurydzę 4/14=28,6% 4/6=66.7%

Przyjmij minimalną ufność = 80%

Reguły asocjacyjne (ufność >=80%) Jeżeli poprzednik, to następnik Wsparcie Ufność Jeżeli kupuje szparagi, to kupuje groszek 5/14=35,7% 5/6=83.3% Jeżeli kupuje szparagi, to kupuje cukinia 5/14=35,7% 5/6=83.3% Jeżeli kupuje cukinia, to kupuje groszek 6/14=42,9% 6/7=85.7% Jeżeli kupuje brokuły, to kupuje zielona papryka 4/14=28,6% 4/5=80% Jeżeli kupuje zielona papryka, to kupuje brokuły 4/14=28,6% 4/5=80%

Możliwe zbiory 3-elementowe(C3) Zbiór szparagi, groszek, cukinia groszek, kukurydza, cukinia groszek, kukurydza, pomidory groszek, cukinia, pomidory

Możliwe reguły asocjacyjne Jeżeli poprzednik, to następnik Wsparcie Ufność Jeżeli kupuje szparagi and groszek, to kupuje cukinię 4/14=28.6,7% 4/5=80% Jeżeli kupuje szparagi and cukinię, to kupuje groszek 4/14=28.6,7% 4/5=80% Jeżeli kupuje groszek and cukinię, to kupuje szparagi 4/14=28.6,7% 4/6=66.7%

Reguły asocjacyjne (ufność >=80%) Jeżeli poprzednik, to następnik Wsparcie Ufność Jeżeli kupuje szparagi, to kupuje groszek 5/14=35,7% 5/6=83.3% Jeżeli kupuje szparagi, to kupuje cukinię 5/14=35,7% 5/6=83.3% Jeżeli kupuje cukinię, to kupuje groszek 6/14=42,9% 6/7=85.7% Jeżeli kupuje brokuły, to kupuje zieloną paprykę 4/14=28,6% 4/5=80% Jeżeli kupuje zieloną paprykę, to kupuje brokuły 4/14=28,6% 4/5=80% Jeżeli kupuje szparagi and groszek, to kupuje cukinia 4/14=28.6,7% 4/5=80% Jeżeli kupuje szparagi and cukinię, to kupuje groszek 4/14=28.6,7% 4/5=80%

Reguły asocjacyjne Jeżeli poprzednik, to następnik Wsparcie Ufność Wsparcie x ufność Jeżeli kupuje szparagi, to kupuje groszek 5/14=35,7% 5/6=83.3% 0.37 Jeżeli kupuje szparagi, to kupuje cukinię 5/14=35,7% 5/6=83.3% 0.30 Jeżeli kupuje cukinię, to kupuje groszek 6/14=42,9% 6/7=85.7% 0.30 Jeżeli kupuje brokuły, to kupuje zieloną paprykę 4/14=28,6% 4/5=80% 0.23 Jeżeli kupuje zieloną paprykę, to kupuje brokuły 4/14=28,6% 4/5=80% 0.23 Jeżeli kupuje szparagi i groszek, to kupuje cukinię 4/14=28.6,7% 4/5=80% 0.23 Jeżeli kupuje szparagi i cukinię,to kupuje groszek 4/14=28.6,7% 4/5=80% 0.23