Reguły asocjacyjne Żródło: LaroseD.T., Discovering Knowledge in Data. An Introduction to Data Minig, John Wiley& Sons, Hoboken, New Jersey, 2005.
Stragan warzywny -transakcje zakupów Transakcja Produkty 1 brokuły, zielona papryka, kukurydza 2 szparagi, cukinia, kukurydza 3 kukurydza, pomidory, groszek, cukinia 4 zielona papryka, szparagi, brokuły 5 groszek, szparagi, brokuły 6 cukinia, szparagi, groszek, pomidory
Dane tabelaryczne o transakcjach Transakcja szparagi groszek brokuły kukurydza Zielona papryka 1 1 1 1 2 1 1 1 cukinia 3 1 1 1 1 4 1 1 1 1 5 1 1 1 6 1 1 1 1 7 1 1 8 1 1 1 9 1 1 1 10 1 1 11 1 1 1 1 12 1 1 1 13 1 1 1 1 14 1 1 1 1 1 pomidory
Kryteria ( A B) wsparcie = liczba transakcji z sumaryczna liczba produktami transakcji A i B P ufnosc = = ( A B) = P( B / A) ( A B) liczba transakcji z produktami A i B P( A) sumaryczna liczba transakcji z produktem A
Odkrywanie reguł asocjacyjnych Analityk może preferować reguły o dużym wsparciu lub o dużej ufności lub też może brać pod uwagę obie miary: wsparcie i ufność
Mocne reguły Mocne reguły to reguły o dużym wsparciu i dużej ufności
Szukanie reguł asocjacyjnych 1. znajdź częste zbiory zdarzeń=znajdź wszystkie zdarzenia, których częstość występowania Φ 2. Na podstawie częstych zbiorów zdarzeń utwórz reguły asocjacyjne, które spełniają kryterium minimalnej ufności i minimalnego wsparcia.
Własność A PRIORI Jeżeli zbiór zdarzeń Z nie jest zbiorem częstym, to dla dowolnego zbioru zdarzeń A: Z UA nie jest zbiorem częstym.
przyjmij Φ = 4
Możliwe zbiory 1-elementowe (C1) Transakcja szparagi groszek brokuły kukurydza Zielona papryka cukinia pomidory 1 1 1 1 2 1 1 1 3 1 1 1 1 4 1 1 1 1 5 1 1 1 6 1 1 1 1 7 1 1 8 1 1 1 9 1 1 1 10 1 1 11 1 1 1 1 12 1 1 1 13 1 1 1 1 14 1 1 1 1 1 Φ 6 10 5 8 5 7 6
1-elementowe zbiory częste F1={szparagi, groszek, brokuły, kukurydza, zielona papryka, cukinia, pomidory }
Tworzenie zbiorów F k Aby utworzyć zbiór F k, algorytm A PRIORI najpierw konstruuje zbiór C k kandydatów k-elementowych poprzez łączenie zbiorów F k-1 Zbiory F k-1 są łączone jeśli mają wspólnych pierwszych k-1 elementów Następnie algorytm przycina zbiór C k za pomocą właściwości A PRIORI. Zbiory zdarzeń, które przetrwały krok przycinania tworzą zbiór F k.
Możliwe zbiory 2-elementowe(C2) Zbiór Liczność Zbiór Liczność szparagi, groszek 5 brokuły, kukurydza 2 szparagi, brokuły 1 brokuły, zielona papryka 4 szparagi, kukurydza 2 brokuły, cukinia 1 szparagi, green pappers 0 brokuły, pomidory 2 szparagi, cukinia 5 kukurydza, zielona papryka 3 szparagi, pomidory 1 kukurydza, cukinia 3 groszek, brokuły 3 kukurydza, pomidory 4 groszek, kukurydza 5 zielona papryka, cukinia 1 groszek, zielona papryka 3 zielona papryka, pomidory 3 groszek, cukinia 6 cukinia, pomidory 2 groszek,pomidory 4
2-elementowe zbiory częste F2={{szparagi, groszek} {szparagi, cukinia}, {groszek, kukurydza}, {groszek, cukinia}, {groszek, pomidory}, {brokuły, zielona papryka}, {kukurydza, pomidory }}
Generowanie reguł asocjacyjnych Krok 1. Utwórz wszystkie zbiory s. Krok 2. Niech ss będzie niepustym podzbiorem s. Rozważ regułę asocjacyjną R: ss => (s-ss), gdzie (s-ss) oznacza zbiór s bez podzbioru ss. Stwórz i zwróć R jeśli R spełnia minimalne wymagania ufności. Wykonaj krok 2 dla każdego podzbioru sszbiorus. Dla prostoty często pożądany jest 1-elementowy następnik.
Możliwe reguły asocjacyjne Jeżeli poprzednik, to następnik Wsparcie Ufność Jeżeli kupuje szparagi, to kupuje groszek 5/14=35,7% 5/6=83.3% Jeżeli kupuje szparagi, to kupuje groszek 5/14=35,7% 5/10=50% Jeżeli kupuje szparagi, to kupuje cukinię 5/14=35,7% 5/6=83.3% Jeżeli kupuje cukinię, to kupuje szparagi 5/14=35,7% 5/7=71.4% Jeżeli kupuje groszek, to kupuje kukurydzę 5/14=35,7% 5/10=50% Jeżeli kupuje kukurydzę, to kupuje groszek 5/14=35,7% 5/8=62.5% Jeżeli kupuje groszek, to kupuje cukinię 6/14=42,9% 6/10=60% Jeżeli kupuje cukinię, to kupuje groszek 6/14=42,9% 6/7=85.7% Jeżeli kupuje groszek, to kupuje pomidory 4/14=28,6% 4/10=40% Jeżeli kupuje pomidory, to kupuje groszek 4/14=28,6% 4/6=66.7% Jeżeli kupuje brokuły, to kupuje zieloną paprykę 4/14=28,6% 4/5=80% Jeżeli kupuje zieloną paprykę, to kupuje brokuły 4/14=28,6% 4/5=80% Jeżeli kupuje kukurydzę, to kupuje pomidory 4/14=28,6% 4/8=50% Jeżeli kupuje pomidory, to kupuje kukurydzę 4/14=28,6% 4/6=66.7%
Przyjmij minimalną ufność = 80%
Reguły asocjacyjne (ufność >=80%) Jeżeli poprzednik, to następnik Wsparcie Ufność Jeżeli kupuje szparagi, to kupuje groszek 5/14=35,7% 5/6=83.3% Jeżeli kupuje szparagi, to kupuje cukinia 5/14=35,7% 5/6=83.3% Jeżeli kupuje cukinia, to kupuje groszek 6/14=42,9% 6/7=85.7% Jeżeli kupuje brokuły, to kupuje zielona papryka 4/14=28,6% 4/5=80% Jeżeli kupuje zielona papryka, to kupuje brokuły 4/14=28,6% 4/5=80%
Możliwe zbiory 3-elementowe(C3) Zbiór szparagi, groszek, cukinia groszek, kukurydza, cukinia groszek, kukurydza, pomidory groszek, cukinia, pomidory
Możliwe reguły asocjacyjne Jeżeli poprzednik, to następnik Wsparcie Ufność Jeżeli kupuje szparagi and groszek, to kupuje cukinię 4/14=28.6,7% 4/5=80% Jeżeli kupuje szparagi and cukinię, to kupuje groszek 4/14=28.6,7% 4/5=80% Jeżeli kupuje groszek and cukinię, to kupuje szparagi 4/14=28.6,7% 4/6=66.7%
Reguły asocjacyjne (ufność >=80%) Jeżeli poprzednik, to następnik Wsparcie Ufność Jeżeli kupuje szparagi, to kupuje groszek 5/14=35,7% 5/6=83.3% Jeżeli kupuje szparagi, to kupuje cukinię 5/14=35,7% 5/6=83.3% Jeżeli kupuje cukinię, to kupuje groszek 6/14=42,9% 6/7=85.7% Jeżeli kupuje brokuły, to kupuje zieloną paprykę 4/14=28,6% 4/5=80% Jeżeli kupuje zieloną paprykę, to kupuje brokuły 4/14=28,6% 4/5=80% Jeżeli kupuje szparagi and groszek, to kupuje cukinia 4/14=28.6,7% 4/5=80% Jeżeli kupuje szparagi and cukinię, to kupuje groszek 4/14=28.6,7% 4/5=80%
Reguły asocjacyjne Jeżeli poprzednik, to następnik Wsparcie Ufność Wsparcie x ufność Jeżeli kupuje szparagi, to kupuje groszek 5/14=35,7% 5/6=83.3% 0.37 Jeżeli kupuje szparagi, to kupuje cukinię 5/14=35,7% 5/6=83.3% 0.30 Jeżeli kupuje cukinię, to kupuje groszek 6/14=42,9% 6/7=85.7% 0.30 Jeżeli kupuje brokuły, to kupuje zieloną paprykę 4/14=28,6% 4/5=80% 0.23 Jeżeli kupuje zieloną paprykę, to kupuje brokuły 4/14=28,6% 4/5=80% 0.23 Jeżeli kupuje szparagi i groszek, to kupuje cukinię 4/14=28.6,7% 4/5=80% 0.23 Jeżeli kupuje szparagi i cukinię,to kupuje groszek 4/14=28.6,7% 4/5=80% 0.23