Reguły Asocjacyjne Szkoła Główna Służby Pożarniczej Zakład Informatyki i Łączności March 18, 2014
1 Wprowadzenie 2 Definicja 3 Szukanie reguł asocjacyjnych 4 Przykłady użycia 5 Podsumowanie
Problem Lista produktów M Muminki R Reksio B Bolek i Lolek S Smerfy T Teletubisie Transakcje TID Zakupy 10 M R S T 20 R B T 30 M R S T 40 M R B T 50 M R B S T 60 R B S Co jest często kupowane? Które produkty kupowane są razem? Co robić aby zwiększyć sprzedaż?
W jakiej formie wyrazić wzorzec macierz kolokacji: M R B S T M 4 4 2 3 4 R 4 6 4 4 5 B 2 4 4 2 2 S 3 4 2 4 3 T 4 5 3 3 5 reguły: M R T R R B S T
Problem pożarniczy ID data # GBA pożar obiekt piętro powierzchnia 1 10.02.2012 3 tak blok IV 40 2 12.12.2012 1 tak dom I 120 3 12.10.2010 1 nie samochód - 4 4 15.02.2011 5 tak fabryka 0 1200 5 13.12.2013 2 nie śmietnik - 0,4 6 12.11.2012 4 tak mieszkanie VII 38 7 17.12.2002 1 tak hala 0 1210 8 21.02.2001 5 tak garaż 0 1250 obiekt # GBA obiekt powierzchnia
Reguły asocjacyjne Definicja Reguła asocjacyjna to każda implikacja typu X Y gdzie X, Y są atrybutami. Jakość reguł mierzymy za pomocą funkcji: wsparcie (support) - liczba wierszy w których wystąpiły wspólnie atrybuty X i Y. wiarygodność (confidence) - liczba wierszy w których wystąpiły wspólnie atrybuty X i Y przez liczbę wystąpień X.
Problem obliczeniowy Liczba wszystkich reguł asocjacyjnych wynosi 3 n, gdzie n jest liczbą wierszy. Sprawdzanie wszystkich reguł jest niewykonywalne! Proponowano różne metody szukania z użyciem różnych technik obliczeń: sekwencyjne, równoległe.
Schemat wyszukiwania reguł Większość istniejących algorytmów działa w dwóch krokach: znajdź częste zbiory znajdź zbiory wierszy i atrybutów o wsparciu większym niż min sup. podziel częste zbiory dla każdego częstego zbioru, znajdź podziały tego zbioru na 2 podzbiory w taki sposób aby powstały reguły o wiarygodności większej niż min conf.
Przykład Transakcje TID Zakupy 10 M R S T 20 R B T 30 M R S T 40 M R B T 50 M R B S T 60 R B S Częste zbiory Wsparcie Zbiór 100% (6) R 83% (5) RT 67% (4) M,B,S, MR,MT,RB, RS,MRT min. wsparcie = 67% (7) min. wiarygodność = 75% reguły dla MR: M R (wiarygodność 100%) R M (wiarygodność 66%)
Wyszukiwanie częstych zbiorów Obserwacje: jeżeli {A, B} są częstymi zbiorami to {A} i {B} też muszą być częstymi zbiorami. Idea: znajdź wszystkie 1-elementowe częste zbiory, generuj 2-elementowe częste zbiory z 1-elementowych częstych zbiorów.... generuj k-elementowe częste zbiory poprzez łączenie (k-1)-elementowych częstych zbiorów.
Przykład min. wsparcie = 67% (4) min. wiarygodność = 80% Transakcje TID Zakupy 10 M R S T 20 R B T 30 M R S T 40 M R B T 50 M R B S T 60 R B S Częste zbiory F 1 C 2 F 2 C 3 F 3 Zbiór M,R,B,S,T MR,MB,MS,MT... MR,MT,RB,RS,RT MRS,MRT,MST,RBT,RST MRT
Zagrożenia akcje
Podsumowanie Zaprezentowano metodę wyszukiwania wzorców w danych. Metoda polega na wyszukaniu zależności pomiędzy atrybutami i reprezentowaniu ich w formie reguł. Jakość reguł jest mierzona za pomocą wsparcia oraz wiarygodności.